Escolar Documentos
Profissional Documentos
Cultura Documentos
BIOMETRIA
FLORESTAL
Niro Higuchi
Joaquim dos Santos
Adriano Jos Nogueira Lima
Manaus AM
Maro, 2008
PARTE 1
Captulo 1
Introduo - Conceitos gerais
A estatstica uma ferramenta importante para o manejo florestal, seja pra quem est
interessado em trabalhar em pesquisas ou pra quem tem a responsabilidade de planejar,
executar e acompanhar um projeto. Difcil separar a estatstica pra essas duas frentes. O
objetivo desta Parte da apostila aprofundar em conceitos dos indicadores estatsticos mais
freqentemente utilizados pelos florestais e ajudar na interpretao dos resultados.
Estatstica um ramo do conhecimento cientfico que consta de conjunto de processos
que tm por objeto a observao, a classificao formal e a anlise dos fenmenos coletivos
ou de massa (finalidade descritiva) e, por fim, investigar a possibilidade de fazer inferncias
indutivas vlidas a partir dos dados observados e buscar mtodos capazes de permitir esta
inferncia (finalidade indutiva). Durante uma defesa de tese no CENA-USP, surgiu um novo
conceito para estatstica que, segundo Edgard, "a arte de torturar os nmeros at que eles
confessem aquilo que voc quer ouvir."
Em inventrio florestal, produto sem estatstica no produto. Em inventrios, o
principal produto o intervalo de confiana para a mdia estimada. Na pesquisa cientfica, a
estatstica pode ser vista como um instrumento de comunicao e, embora o seu uso seja
absolutamente opcional, ela fornece os modelos que so necessrios para estudar as situaes
que envolvem incertezas, mas a palavra final sua.
O exerccio, a anlise e a interpretao do pensamento cientfico normalmente so
feitos por meio da linguagem operacional dos conceitos e hipteses cientficas. Isso implica
na formulao de hipteses estatsticas e estabelecimento dos procedimentos de observaes
diretas ou de medies.
Linguagem terica: quanto mais grossa a rvore, mais madeira ser oferecida
indstria de transformao. Neste caso, dois conceitos so envolvidos: espessura e madeira.
Com definir esses dois conceitos? Espessura pode ser o dimetro de uma rvore. Madeira
pode ser a quantidade de material lenhoso disponvel para a indstria.
E da? Que fazemos agora? Temos que operacionalizar as observaes e medies de
espessura e madeira. Espessura pode ser traduzida operacionalmente, por exemplo, em
centmetros de dimetro altura do peito (DAP), medido a 1,3 m do solo. E a madeira, por
sua vez, pode ser traduzida como volume cbico da rvore.
Agora, a hiptese cientfica pode ser enunciada, em termos de hiptese estatstica, da
seguinte maneira: Quanto maior o DAP, maior ser o volume da rvore. Dessa forma, o
pica-pau fica mais vontade.
Depois de formulada a hiptese, o passo seguinte consiste em test-la. Para se testar as
hipteses sero precisos: planejar a coleta de dados, coletar os dados, tratar os dados,
processar os dados, analisar os resultados e, finalmente, tomar decises para rejeitar ou no a
hiptese estatstica formulada (Ver figura 1.1).
O papel da estatstica na pesquisa cientfica ajudar o pesquisador pica-pau a
formular as hipteses e a fixar as regras de deciso.
Um pouco de filosofia.
- Aristteles escreveu: A verdade um alvo to grande que dificilmente algum
deixar de toc-lo, mas, ao mesmo tempo, ningum ser capaz de acert-lo em cheio, num s
tiro.
- A meta da cincia a organizao sistemtica do conhecimento sobre o universo,
baseado nos princpios explanatrios que so genuinamente testveis.
- O pesquisador tem os dons da instituio e criatividade para saber que o problema
importante e quais questes devem ser levantadas; a estatstica, por sua vez, o assistir por
meio da maximizao de output no ambguos enquanto minimiza os inputs.
- O pesquisador tem que ter em mente que a pesquisa freqentemente levanta mais
questes do que respostas. Os resultados quase sempre so meramente uma demonstrao de
nossa ignorncia e uma declarao mais clara do que no sabemos.
- O pesquisador tem que manter os olhos abertos, sua mente flexvel e estar preparado
para surpresas.
- A pesquisa est na cabea do pesquisador; o laboratrio ou o campo meramente
confirma ou rejeita o que a sua mente concebeu. A sabedoria consiste em conhecer mais as
questes certas para fazer e no nas certas respostas.
- A aplicao indiscriminada dos mtodos quantitativos sobre inesgotveis
quantidades de dados no significa que o entendimento cientfico vai emergir s por causa
disso.
tirado do Quadro 1.1. Os resultados do IBOPE, do ltimo dia de pesquisa (com margem de
erro igual a 1,8%), so praticamente iguais aos oficiais do TSE. A informao do TSE sobre
votos vlidos enquanto que os da pesquisa de opinio so de inteno de votos. Na pesquisa
de opinio do 1 turno difcil identificar o voto nulo.
Exemplo 2: Pesquisas de opinio sobre o 2 turno da eleio presidencial 2002,
realizadas pelo Datafolha. Neste caso, foi possvel estimar os percentuais sobre os votos
vlidos. No ltimo dia da pesquisa (26/10/02), o Datafolha estimou 64% dos votos vlidos
para o Lula e 36% para o Serra. A Figura 1.6 mostra a dinmica de opinio de eleitores para
o2 turno da eleio de 2002. O resultado do TSE (oficial) foi de 61,2% para o Lula e 38,7%
para o Serra Quadro 1.1. Considerando a margem de erro de 2% (para mais e para menos),
as estimativas do ltimo dia seriam 62% (para menos) para o Lula e 38% (para mais) para o
Serra.
Esta parte da estatstica de inferncia evoluiu muito no Brasil. A prova disso so os
resultados finais do primeiro e do segundo turno da eleio presidencial de 2002 que tem
muito a ver com as previses feitas pelas pesquisas de opinio dos vrios institutos. O sucesso
tem que ser creditado principalmente pela escolha correta do tipo de amostragem, coleta de
dados e processamento & anlise dos resultados A evoluo da informtica tambm
contribuiu muito para o sucesso das pesquisas; o rpido processamento e, conseqente,
anlise dos resultados, permitiu a repetio em intervalos de tempo menores isso
fundamental para a validao dos mtodos utilizados que, por sua vez, d a robustez
necessria para a pesquisa e a sociedade ganha com a maior preciso e confiabilidade das
pesquisas de opinio.
Exemplo 3: Previso da rea desmatada para 2006 (agosto 2005 a julho 2006) com
base no intervalo de confiana (95%) da srie histrica de 1978 a 2005 Figura 1.7. Apesar
da confuso das estatsticas e de sua interpretao, com boa vontade e profissionalismo, as
causas do desmatamento poderiam ser identificadas. O desafio entender a direo que o
desmatamento pode tomar no futuro. Sem entender as causas, a direo s pode ser
estocstica. A Figura 1.7 ilustra o uso do intervalo de confiana IC (nvel de probabilidade
de 95%) para a mdia do perodo 1978-2005. De acordo com dinmica do desmatamento at
2005, as chances do desmatamento durante 2005-2006 (agosto 2005 a julho 2006) so: 29%
de ficar acima da estimativa mxima provvel (maior do que 20.983 km2), 29% abaixo da
estimativa mnima provvel (menor do que 16.296 km2) e 42 % de ficar dentro do intervalo de
confiana (entre 16.296 a 20.983 km2) com 95% de chance de acertar.
Exemplo 4: Todos os trabalhos de equaes de volume que utilizam os modelos
destrutivos (na maioria das vezes) para ajustar os dados de volume real observado em
modelos matemticos que sero utilizados, posteriormente, para estimar o volume da rvore
em p.
Para concluir a discusso, em torno da natureza da estatstica, importante no perder
de vista que a opo por uma das duas estatsticas pode ser pessoal. Entretanto, se a escolha
recair sobre a de inferncia, o pesquisador deve se sujeitar as suas regras e condicionantes. A
estatstica de inferncia, por sua vez, deve ficar sob as condicionantes da teoria da
probabilidade, da normalidade e da independncia; a violao de uma dessas condicionantes
implica em um comprometimento muito srio de todo o seu trabalho.
dos instrumentos, treinamento adequado para o pessoal que usa os instrumentos e cuidado
com eles.
Tendncia devido o mtodo de amostragem ocorre quando certas unidades ganham
maior ou menor representao na amostra do que na populao. Ex.: se voc excluir 20
metros de bordadura do lado oeste da Reserva Ducke por causa de um igarap. Neste caso,
voc est introduzindo tendncia em sua avaliao simplesmente porque voc no deu a
mesma oportunidade, para as rvores que ocorrem naquela faixa, em aparecer no seu trabalho.
Outro exemplo: quando a equipe econmica faz uma pesquisa nos supermercados do centrosul e extrapola o custo de vida para todo o Brasil; isso uma medida tendenciosa que no
reflete o que se passa em Manaus.
Tendncia na forma de estimar determinado parmetro pode ser introduzida quando
voc, por exemplo, toma o volume mdio da Reserva Ducke e junta com o volume mdio do
Distrito Agropecurio da SUFRAMA (600.000 hectares), para avaliar o potencial madeireiro
da regio de Manaus. Um volume mdio no tendencioso seria uma mdia ponderada
considerando os diferentes tamanhos de cada rea, em vez de usar a mdia aritmtica simples
(tendenciosa, neste caso).
Importante: A tendncia a me do erro no-amostral, por esta razo, evit-la sinal
de prudncia e sensatez.
PRECISO E EXATIDO uma estimativa tendenciosa pode ser PRECISA, mas
nunca EXATA. Ainda que o Aurlio (dicionrio) pense diferente, para os estatsticos,
EXATIDO refere-se ao sucesso em estimar o valor verdadeiro de uma quantidade;
PRECISO refere-se distribuio dos valores amostrais em torno de sua prpria mdia que,
se for tendenciosa, no pode ser o valor verdadeiro Ver figura 1.8. Exatido ou estreiteza ao
valor verdadeiro pode estar ausente por causa da tendncia, falta de preciso ou por causa de
ambas.
PENSAMENTO
OPERACIONALIZAR
HIPOTETIZAR
planejar
coletar
co
letar
tratar
processar
rejeitaa ?
rejeit
sim, concluir!
analisar
no, concluir!
Nmero
13
45
40
23
16
29
Candidato
Lula
Jos Serra
Garotinho
Ciro Gomes
Z Maria
Rui Pimenta
total votos
39.454.692
19.705.061
15.179.879
10.170.666
402.232
38.619
% vlidos
46,44
23,20
17,87
11,97
0,47
0,05
total votos
52.793.364
33.370.739
% vlidos
61,27
38,73
Nmero
13
45
Candidato
Lula
Jos Serra
18.900
04/05
27.200
24597
23.266
03/04
02/03
01/02
18.165
18.226
17.269
17.383
ano ou perodo
00/01
99/00
98/99
97/98
96/97
13.227
18.161
95/96
29.059
94/95
92/94
91/92
90/91
89/90
87-89
78/87
14.896
13.786
11.030
13.730
17.770
21.050
45
40
35
30
25
20
15
10
5
0
2.500
2.000
1.500
1.000
500
0
3.000
A:D (%)
sem origem
63%
d autorizado
20%
PMFS
17%
50
45
40
41
39
43
41
39
46
45
35
30
25
23,2
19
19
19
15
12
13
14
10
15
20
12
14
18
15
19
16
12
11
20
17,9
15
12
9
0
6 a 9/9
TSE
perodo da pesquisa
Lula
Serra
Garotinho
Ciro
Figura 1.5: Pesquisas de opinio realizadas pelo IBOPE para o 1 turno da eleio
presidencial de 2002.
70
60
61
58
59
58
31
32
23/out
26/out
50
40
32
32
30
20
10
11 out
18/out
data
Lula
Serra
indecisos
nulos/brancos
Figura 1.6: Pesquisas de opinio realizadas pelo Datafolha para o 2 turno da eleio
presidencial de 2002.
rea
mdia
mnima
mxima
30.000
28.000
26.000
24.000
22.000
21.060
20.000
18.689
18.000
16.317
16.000
Acima = 29%
14.000
2005/06?
Dentro = 42%
12.000
05/06
04/05
03/04
02/03
00/01
99/00
98/99
97/98
96/97
95/96
94/95
92/94
91/92
90/91
89/90
87-89
78/87
01/02
Abaixo = 29%
10.000
ano ou perodo
Figura 1.7: Previso da rea desmatada para 2006 (agosto 2005 a julho 2006) com base no
intervalo de confiana (95%) da srie histrica de 1978 a 2005.
impreciso
preciso
preciso
exato
Captulo 2
Organizao dos dados
2.1. Dados:
A informao coletada e analisada pelo estatstico chamada de DADOS. H vrios
tipos de dados e a escolha da metodologia, pelo estatstico , parcialmente, determinada pelo
tipo de dados que ele tem em mos.
Exemplo 1: No exame de seleo para turma 90/91 do Manejo Florestal, tivemos 15
candidatos, 13 homens e 2 mulheres. Do total, apenas 7 fizeram o exame. Foram aprovados 6
candidatos, 5 homens e 1 mulher. Joo da Silva tirou o primeiro lugar com nota 6,7 e Joaquim
Moreira tirou o ltimo lugar com a nota 5,0.
No exemplo acima, ns podemos destacar os seguintes tipos de dados:
QUALITATIVO o tipo mais simples de dados, a informao que coloca cada
candidato em uma das duas categorias homem ou mulher ou tipo florestal I ou tipo II ou
estocada ou no estocada etc. Esses dados do informaes sobre um indivduo ou um item.
ORDINAL A informao sobre classificao, dados que colocam os indivduos ou
objetos em ordem, rankeados. No exemplo, as classificaes de Joo e Joaquim so dados
ordinais.
MTRICO O termo mtrico se refere aos dados mensurveis e no deve ser
confundido com os dados em unidades mtricas. No exemplo, as notas dos candidatos (6,7 e
5,0 e outras notas) so dados mtricos.
Resumindo:
Dados qualitativos: dados que se referem qualidade no numricas ou atributos, tais
como: tipo florestal, gnero ou espcie florestal, cor de alguma coisa etc.
Dados ordinais: dados sobre classificao, ordem ou rank, tais como: classificao
de toras, ordem de chegada etc.
Dados mtricos: dados obtidos de medies de certas quantidades como: tempo,
altura, DAP, volume, peso etc.
Um outro importante tipo de dados o chamado DADOS CONTVEIS. A contagem
do numero de indivduos ou itens que caem em vrias categorias, tais como homem e
mulher fornece os dados contveis. Por exemplo, a informao dada no exemplo anterior
que foram aprovados 5 homens e 1 mulher, so dados contveis.
DADOS CONTVEIS so dados sobre o nmero de indivduos ou itens que caem
em certas categorias ou classes, que podem ser obtidos de quaisquer tipos de dados
(qualitativo, ordinal ou mtrico).
Os dados QUALITATIVO e ORDINAL so referidos pelos estatsticos como dados
DISCRETOS porque eles classificam coisas em classes separadas e discretas. Na
classificao dos candidatos ao mestrado no h como colocar ningum entre o primeiro lugar
e o segundo. Tambm no h como classificar ningum entre homem e mulher. So
exemplos tpicos de dados discretos, porque no h como dizer que algum ficou em
primeiro lugar e meio ou o que fulano homem e meio. No caso de ordem de chegada ou
rank h possibilidade de empate, mas isso outra coisa e ser discutido na estatstica noparamtrica.
Por outro lado, a maioria dos dados mtricos considerada DADOS CONTNUOS
porque eles envolvem medies sobre uma escala contnua. A escala fica por conta da
preciso do aparelho de medio: na suta ou na fita diamtrica, o mximo que podemos
chegar dcimo de centmetros, ou seja, entre os DAPs 20 e 21 cm ns podemos ter DAPs
com 20.1, 20.2, ... , 20.9; nos cronmetros da Frmula 1, no entanto, o nvel de preciso
impensvel para os nossos relgios de pulso.
DAP
25.0
27.0
45.0
36.0
39.0
36.0
33.0
47.0
34.0
53.0
rv. n
11
12
13
14
15
16
17
18
19
20
DAP
33.0
38.5
31.8
52.0
37.0
27.7
35.0
33.0
47.0
33.0
rv. N
21
22
23
24
25
26
27
28
29
30
DAP
32.0
63.0
34.0
30.0
29.0
32.0
27.0
28.0
27.0
40.0
rv. n
31
32
33
34
35
36
37
38
39
40
DAP
37.0
41.0
40.0
32.0
58.0
28.0
77.0
58.0
43.0
30.0
Contagem
IIIII III
IIIII IIIII IIIII IIII
IIIII II
IIII
I
I
n de rvores (f)
8
19
7
4
1
1
40
freqncia absoluta
18
16
14
12
10
8
6
4
2
0
Freq
pt mdio
25
35
45
55
65
75
Freq
8
19
7
4
1
1
freq rel
0,200
0,475
0,175
0,100
0,025
0,025
freq acum
8
27
34
38
39
40
Algumas terminologias:
Classe uma categoria para o grupamento de dados.
Freqncia o nmero de indivduos ou objetos numa classe. Por exemplo, a
freqncia da classe 30-39.9 19.
Freqncia relativa a porcentagem, expressa como um decimal, do nmero total de
indivduos de uma determinada classe. A freqncia relativa da classe 50-59.9 0.1 ou 10%.
Freqncia acumulada a soma das freqncias dos valores inferiores ou iguais a
valor dado.
Distribuio de Freqncia a listagem das classes com suas freqncias.
Limite inferior da classe o menor valor que pode ir dentro de uma classe. Na classe
20-29.9 o limite inferior 20.
Limite superior da classe o maior valor que pode ir dentro de uma classe. Na classe
20-29.9 o limite superior 29.9. Se a preciso fosse de duas casas decimais, o limite superior
poderia ser 29.99 e assim por diante.
Intervalo de classe a diferena entre o limite superior e o limite inferior de uma
dada classe. No nosso exemplo, o intervalo 10, ou seja, 30 20 =10.
Ponto mdio da classe a mdia aritmtica entre o limite superior e limite inferior
da classe. Assim, se a classe for: (20+30)/2 = 25. Da classe 30-40 o ponto mdio 35 e assim
por diante.
Captulo 3
Medidas descritivas
H muitos critrios, por sinal, bem avanados, para a descrio sucinta dos fenmenos
naturais. Apesar disso, a maioria das caractersticas usadas na estatstica, para descrever as
variveis aleatrias, em populaes particulares, caem em uma das trs categorias: (1)
medidas da tendncia central (alocao de um valor ordinrio); (2) medidas de disperso
(distncia relativa de valores extremos de um valor central); (3) medidas de relacionamento
entre as variveis (grau de similaridade ou dissimilaridade em magnitude).
Em geral, o volume de dados de uma pesquisa muito grande. Os mtodos de grficos
e grupamento de dados so teis no manuseio de um grande conjunto de dados. Uma outra
forma de sumarizar os dados por meio da computao de um nmero, tal como a mdia, a
qual substitui um grande volume de dados por um simples nmero.
( x 1 + x 2 + .... + x 40 )
40
x = 38,225
Mediana do quadro 2.1, primeiro preciso ordenar em ordem crescente,
(1)
(2)
(3)
(4)
(5)
25
27
27
27
27.7
(11)
(12)
(13)
(14)
31.8
32
32
(21)
(22)
35
(6)
(7)
(8)
(9)
(10)
28
28
29
30
30
(15)
(16)
(17)
(18)
(19)
(20)
32
33
33
33
33
34
34
(23)
(24)
(25)
(26)
(27)
(28)
(29)
(30)
36
36
37
37
38.5
39
40
40
41
(31)
(32)
(33)
(34)
(35)
(36)
(37)
(38)
(39)
(40)
43
45
47
47
52
53
58
58
63
77
Neste caso, o nmero total de observaes, n, par, a mediana ser a mdia aritmtica
dos vigsimo e vigsimo-primeiro valores, ou seja, (34 + 35)/2 = 34.5.
Moda simplesmente o ponto mdio da classe que tem a maior freqncia, que no
nosso caso, quadro 2.2, 35, que tem a freqncia = 19.
Resumo das estimativas das medidas:
Mdia
= 38,225
Mediana = 34,5
Moda
35,0
Interpretao: um conjunto de dados pode ter mais de uma moda, mas sempre ter
somente uma mdia ou mediana. Como voc pode ver, de um mesmo conjunto de dados, voc
tem diferentes medidas de tendncia central. Qual delas a melhor? A deciso vai depender,
principalmente, do objetivo de sua informao. Quando a gente vende madeira em volume,
normalmente truncada a um determinado dimetro mnimo, a mdia deve prevalecer tendo em
vista a maior facilidade para os clculos posteriores. Se a rvore vendida em p, a moda
pode ser mais interessante, porque ela d uma noo tambm da distribuio de freqncia. A
utilizao da mediana mais prtica na tomada de decises quanto a tratamentos
silviculturais, desbastes etc., quando voc precisa priorizar o tamanho que precisa sofrer
intervenes.
Ecologia
aluno
idade
1
22
2
30
3
28
4
21
5
39
mdia
28
As mdias dos dois grupos so iguais. No entanto, claro que estamos nos referindo a
dois grupos diferentes em idade. D para perceber que o grupo do Manejo mais uniforme
em termos de idade. Neste caso, para ver a variao que h dentro de cada conjunto de dados,
podemos usar a amplitude total ou o desvio padro, as duas medidas de disperso mais
comuns.
AMPLITUDE TOTAL a medida da variao olhando apenas a diferena entre o
maior e o menor valor. Esta medida de fcil computao porque depende apenas do maior e
do menor valor, mas, em compensao ela no diz o que acontece entre esses dois valores.
Alm disso, considerada muito limita, sendo uma medida que depende apenas dos valores
externos, instvel, no sendo afetada pela disperso dos valores internos.
Do quadro 3.1, as amplitudes so:
-
Manejo: 30 25 = 5
Ecologia: 39 21 = 18
DESVIO PADRO nos d a disperso dos indivduos em relao mdia. Ele nos
d uma idia se os dados esto prximos da mdia ou muito longe. O desvio padro dos
indivduos de uma populao freqentemente simbolizado pela letra grega minscula ().
Dificilmente a gente trabalha com o parmetro. Entretanto, dado uma amostra de valores
individuais de uma populao, podemos fazer uma estimativa de que comumente
simbolizada por s.
n
Frmula : s =
2
(x i - x)
i =1
n -1
n
x
i =1
2
i
- (( x i ) 2 ) / n
i =1
n -1
x e os ( n-1 ) valores de xi, ento o valor do ltimo xi fixo; isto , uma informao
_
redundante. Por esta razo, ao usar a mdia amostral x em vez da mdia da populao
como um ponto central no clculo de s, voc perde um grau de liberdade (gl) e a estimativa de
dita ter ( n 1 ) gl associados com ela. O uso de (n 1) em vez de (n) no clculo de s
tambm fornece uma estimativa no-tendenciosa; isto , em uma srie infinita de amostras
aleatrias, o valor mdio do estimador igual a .
Os desvios padres dos dados do quadro 3.1 so:
-
Manejo: s = 1.87
Ecologia: s = 7.25
x = ( xi * fi ) / n
onde: xi = ponto mdio da classe, fi = freqncia de cada classe e n = nmero de classes
E o desvio padro segue o mesmo princpio da mdia em relao s classes.
Do quadro 2.2, essas medidas sero:
_
x = 38,5 e s = 11,45
3.4 Percentil:
Ns j vimos um exemplo de percentil. A mediana divide um conjunto de dados em
duas partes, 50% de um lado e 50% de outro, depois de coloc-los em ordem crescente. Por
esta razo ela se refere ao qinquagsimo percentil de um conjunto de dados. Alm dos
percentils, que pode dividir os dados de acordo com qualquer valor percentual, o pesquisador
pode tambm querer encontrar o quartil e o decil.
Quartil a separatriz que divide a rea de uma distribuio de freqncia em
domnios de rea igual a mltiplos inteiros de um quarto da rea total.
Decil a separatriz correspondente ao valor do argumento que divide a distribuio
numa razo decimal.
Primeiro quarto
25
27
27
27
27.7
28
28
29
30
30
32
33
33
33
33
34
34
37
37
38.5
39
40
40
41
47
52
53
58
63
77
Segundo quarto
31.8 32
32
Terceiro quarto
35
36
36
Quarto quarto
43
45
47
58
Computaes:
Primeiro quartil = (30 + 31.8) / 2 = 30.9
Segundo quartil = (34 + 35) / 2 = 34.5
Terceiro quartil = (41 + 43) / 2 = 42.0
Do quadro 3.1, estimamos as mdias (28 para manejo e 28 para Ecologia) e os desvios
padres (1.87 e 7.25). Agora temos os coeficientes de variao (CV):
CV = 1.87/28 = 0.0668 ou 6.68 %
- Manejo
Do nosso exemplo do quadro 2.1, temos uma populao de rvores, com as seguintes
estimativas: mdia = 38,225 e desvio = 11,28
CV = 11,28/38,225 = 0.2951 ou 29,51 % - floresta ZF-2
Mesmo se tratando de populaes diferentes podemos concluir com base nos CVs: A
populao Manejo mais homognea e a mais heterognea a floresta da ZF-2. Isto
possvel porque o CV uma medida relativa, que independente da unidade de medida
utilizada.
VARINCIA - Varincia uma medida da disperso dos valores unitrios
individuais em torno de sua mdia. A varincia no s parece com o desvio padro, como o
prprio, apenas ao quadrado . Se voc tirar da frmula do desvio, a raiz quadrada, voc tem
a frmula da varincia. Por que ao quadrado? Simplesmente porque a soma de todos os
desvios tem que se anular, tendendo a zero e, da, voc no teria condies de ver a amplitude
de variao dos seus dados em relao mdia.
As frmulas so:
Varincia, s2 = SQCx /(n-1)
Covarincia, sxy = SPCxy / (n-1)
Sendo:
SQC = Soma dos Quadrados Corrigidos
SPC = Soma dos Produtos Corrigidos
Frmulas teis
Mdia Aritmtica
Varincia
n
(x
x=
x
i =1
s2 =
Desvio padro
x)
n 1
Erro padro
s= s
sx = s / n
n
xi
n
2
i =1
SQC x = xi
n
i =1
SPC xy = xi y i
i
n
2
i =1
SQC y = y i
n
i =1
( x )( y )
i =1
Coeficiente de correlao
r=
i =1
SPCxy
SQC X SQCY
Captulo 4
Probabilidade
No captulo 1 ns distinguimos dois tipos de estatsticas: descritiva e de inferncia. A
estatstica descritiva envolve a organizao e a sumarizao dos dados. A estatstica de
inferncia lida com inferncias (predies educadas) sobre uma populao baseada em uma
amostra da populao.
Desde que a estatstica de inferncia envolve predies (educadas), sempre possvel
fazer uma inferncia incorreta. preciso saber o quanto a nossa inferncia est correta. Para
medir a chance de estar certo na nossa inferncia estatstica, precisamos entender a teoria de
probabilidade, que a fundamentao matemtica para a estatstica de inferncia.
Para entender os princpios da teoria de probabilidade no h como fugir dos exemplos
clssicos de cara & coroa, dos dados e do jogo de baralho. A propsito, a teoria foi
desenvolvida por causa de jogos de azar. O objetivo deste captulo dar uma base geral para
facilitar o entendimento da aplicao de testes de hipteses, paramtrica e no-paramtrica.
O processo de computao (clculo) de probabilidades depende de sua capacidade de
contar, 1, 2, 3 e assim por diante. A seguir vamos discutir alguns mtodos de contagem.
4.1. Contagem:
Primeiro vamos estabelecer as seguintes definies dentro da teoria de probabilidade.
Resultado - no caso de cara ou coroa, 2 resultados so possveis e no caso do jogo de
dados, 6 resultados.
Teste - (ou tentativa) - a ao de jogar a moeda e ver se ela cai com a cara ou
coroa.
Experimento - o conjunto de testes (tentativas); se a moeda jogada uma vez, ou
duas, ou n vezes, no interessa o procedimento deve ser considerado um experimento.
Eventos - so os possveis resultados de um teste, vrios testes ou de todo o
experimento. Exemplo de evento: uma coroa em 4 jogadas ou pelo menos um cara.
REGRA 1: Se um experimento consiste de n testes, onde cada teste pode resultar em um dos
k possveis resultados, afirmamos que h kn possveis resultados de todo o experimento.
Exemplo 1: no jogo da moeda voc tem dois resultados, cara (C) ou coroa (c), k=2.
Se voc jogar apenas uma vez, n=1, voc ter 21 = 2 possveis resultados, C ou c. Se voc
jogar duas vezes, n = 2, voc ter 22 = 4 possveis resultados, CC cc Cc cC.
REGRA 2: H n! (fatorial) maneiras de arranjar n objetos distinguveis em uma seqncia.
Exemplo 2: considere o nmero de maneiras de arranjar as letras A, B e C numa
seqncia. A primeira letra pode ser qualquer uma das trs, a segunda pode ser escolhida de
duas maneiras diferentes uma vez que a primeira j foi escolhida, e a letra remanescente se
torna a ltima letra escolhida, para um total (3) (2) (1) = 6 ou 3! Arranjos diferentes. Os 6
possveis arranjos so: ABC ACB BAC BCA CAB e CBA.
Exemplo 3: suponha uma corrida de cavalos com 8 cavalos. H 8 maneiras de
qualquer um deles chegar em primeiro lugar, tendo nas outras colocaes qualquer outro. Se
voc quiser saber quantos arranjos so possveis tendo, no primeiro e segundo lugar, qualquer
um deles e, as demais colocaes, de qualquer jeito, voc far (8) (7) = 56 arranjos. Se voc,
no entanto, quiser saber todos os possveis arranjos do primeiro ao oitavo lugar voc far 8! =
40320 arranjos.
REGRA 3: se um grupo de n objetos composto de k objetos idnticos de um tipo e o
restante (n-k) so objetos idnticos de um segundo tipo, o nmero de arranjos distinguveis
dos n objetos numa seqncia, denotado por meio de
n
dado por
k
n
n!
=
k! (n - k)!
k
n
n!
=
n1! n2! ... nr!
ni
3
(3) (2) (1)
3!
=
=
= 3
2! 1!
(2) (1) (1)
2
Exemplo 4: no exemplo 2 listamos as 6 maneiras de arranjar as letras A, B e C numa
seqncia. Suponha agora que as letras A e B so idnticas e chame-as de X. Assim, os
arranjos ABC e BAC se tornam indistintos, XXC para os dois. Tambm ACB e BCA se
tornam XCX. O arranjo original reduzido para arranjos distintos, que so XXC, XCX e
CXX.
Cada experimento tem o seu prprio espao amostral, que consiste essencialmente de
uma lista de diferentes resultados possveis de um experimento. O espao subdividido e
cada subdiviso um ponto. Cada possvel resultado representado por um ponto e somente
um ponto.
Exemplo 1: se um experimento consiste em jogar duas vezes a moeda, o espao
amostral consiste de 4 pontos CC cc Cc cC.
Exemplo 2: uma prova consistindo de 10 questes falsa ou verdadeira passada
a um aluno como um experimento. H 210 = 1024 pontos no espao amostral, onde cada ponto
consiste da seqncia das possveis respostas para as 10 questes sucessivas, tais como:
FFFFVVFFVV.
Agora, ento, possvel definir evento, em termos dos pontos do espao amostral.
(iii) Evento - um evento qualquer conjunto de pontos no espao amostral.
Dois diferentes eventos podem ter pontos comuns e ambos. Os eventos pelo menos
uma cara e pelo menos uma coroa tem os pontos Cc e cC em comum. Se dois eventos no
tm pontos em comuns eles so chamados de eventos mutuamente exclusivos porque a
ocorrncia de um evento automaticamente exclui a possibilidade de ocorrer outro evento ao
mesmo tempo.
Para cada ponto no espao amostral h um nmero correspondente chamado de
probabilidade do ponto ou probabilidade do resultado. Estas probabilidades podem ser
quaisquer nmeros entre 0 a 1. A definio da probabilidade de um evento inclui a definio
da probabilidade de um resultado como um caso especial, desde que o evento possa ser
considerado como que se consistisse de um resultado simples.
Na prtica, o conjunto de probabilidades associadas com um particular espao
amostral raramente conhecido, mas as probabilidades so atribudas de acordo com as
noes pr-concebidas do pesquisador, isto , o pesquisador formula um modelo como uma
verso ideal do experimento. Ento, o espao amostral do modelo experimental examinado e
as probabilidades so atribudas aos vrios pontos do espao amostral de alguma maneira que
o pesquisador sinta que pode ser justificada.
Exemplo 3: Num experimento consistindo de uma nica jogada de uma moeda no
viciada, razovel assumir que o resultado cara (C) tem metade da chance de ocorrer.
Assim, podemos atribuir a probabilidade de para o resultado C e o mesmo para c. Isso pode
ser escrito da seguinte maneira: P (C) =1/2 e P (c) = 1/2 .
Exemplo 4: Num experimento consistindo de 3 jogadas (testes), razovel assumir
que cada um dos 23 = 8 resultados CCC CCc CcC Ccc cCC ccC cCc ccc tem a mesma
chance de ocorrer. Assim, a probabilidade de cada resultado 1/8. Tambm P (3 caras) = 1/8,
P (pelo menos 1 cara) = 7/8, P (pelo menos 2 caras) = 4/8 = .
(iv) Funo de Probabilidade: uma funo que atribui probabilidades aos vrios
eventos no espao amostral.
P (A | B) = [ P (AB) ] / [ P (B) ]
onde P (B) > 0, caso contrrio, indefinido.
Exemplo 5: Considere o jogo de dados, tal que cada um dos 6 possveis resultados
tem a probabilidade de 1/6 de ocorrer. Como antes, deixe A ser o evento a ocorrncia de 4, 5
ou 6 e B o evento a ocorrncia de um nmero par . Ento P (AB) = P (4 ou 6) = 2/6 = 1/3.
Tambm, P (B) = 3/6 = . Ento, a probabilidade condicional P (A|B) dada por
P (A | B) =
1/ 3
= 2/3
1/ 2
(1)
n de famlias
18
8
7
4
3
40
%
45,0
20,0
17,5
10,0
7,5
100,0
freq. relativa
0,450
0,200
0,175
0,100
0,075
1,000
O quadro 4.1 mostra, por ex., que 17,5% (0.175) das 40 famlias possuem 2 crianas.
Agora, suponha que uma das famlias tenha sido selecionada aleatoriamente, ou seja,
cada famlia teve igual chance de ser escolhida. Qual a probabilidade que a famlia
selecionada tenha 3 crianas? A resposta 4/40, que a mesma frequncia relativa.
Suponha que h N resultados possveis num experimento. A probabilidade que um
evento ocorra o nmero de vezes, f, que o evento pode ocorrer, dividido pelo nmero total,
N, de possveis resultados.
P(X = x | Y = y) =
P (X = x, Y = y)
se P(Y = y) > 0
P(Y = y)
Exemplo 4: Deixe X ser o nmero de meninas que se comunicam bem com suas
mes, das 6 meninas entrevistadas, como no exemplo 2 e deixe Y ser o nmero total de
crianas que se comunicam bem com suas mes. Por convenincia, deixe Z=Y-X, tal que Z
igual ao de meninos, dos 8 entrevistados, que se comunicam bem com suas mes. Assuma que
as respostas dadas pelas crianas so independentes de cada outra e que cada criana tem a
mesma probabilidade p (desconhecida) de dizer que se comunica bem com a sua me.
Encontre a probabilidade condicional P ( X=3 | Y=7).
6
= p 3 (1 - p) 3
3
8 4
p (1 - p) 4
4
14
P(Y = 7) = p 7 (1 - p) 7
7
6 8
3 4
P(X = 3 | Y = 7) =
14
7
(4)
6!
8!
3! (6 - 3)! 4! (8 - 4)!
=
= 0.408
14!
7! (14 - 7)!
P(X = x)
a < x <b
P (X = x)
x par
onde o somatrio se aplica a todos os valores de x que so pares. Por causa dessa similaridade
entre o conjunto de valores possveis de X e um espao amostral, a descrio do conjunto de
probabilidades associadas com os vrios valores que X pode assumir, freqentemente
chamado de funo de probabilidade da varivel aleatria X, assim como um espao amostral
tem uma funo de probabilidade. Entretanto, a funo de probabilidade de uma varivel
aleatria no uma atribuio arbitrria de probabilidades, como a funo de probabilidade
para um espao amostral. Isto porque uma vez que as probabilidades so atribudas aos pontos
num espao amostral e uma vez que a varivel aleatria X definida no espao amostral, as
probabilidades associadas com os vrios valores de X so conhecidas e a funo de
probabilidade de X , dessa maneira, j determinada.
Definio 3: A funo de probabilidade da varivel aleatria X, usualmente
representada por f(x) ou de outra maneira qualquer, a funo que d a probabilidade de X
assumir o valor x, para qualquer nmero real x, ou seja,
(5)
f(x) = P(X = x)
(6)
F(x) = P (X x) =
f(t)
t x
(7)
n
f(x) = P(X = x) = p x q n -x para x = 0,1, .., n
x
F(x) = P(X x) =
i p i q n-i
i x
n
P (X = x) = p x q n -x
x
para x inteiro de 0 a n. Desta maneira, o experimento tem a distribuio binominal.
Definio 6: Deixe X ser uma varivel aleatria. A distribuio discreta uniforme a
distribuio de probabilidade representada pela funo de probabilidade.
(9)
(10)
(11)
(12)
6
f(3, 7) = P (X = 3, Y = 7) =
3
(13)
F(3, 7) = P (X 3, Y 7) =
8 7
p (1 - p) 7
4
f(x, y)
0 x 3
x y7
onde
6
f(x, y) = p x (1 - p) 6 - x
x
8 y- x
p (1 - p) 8 - (y - x)
y
x
(14)
f(x | y) = P(X = x | Y = y)
f(x | y) = P(X = x | Y = y) =
P(X = x, Y = y)
P(Y = y)
f(x, y)
f(y)
Para encontrar a frmula geral para f(x | y) (isto , para qualquer valor de x e y),
primeiro deixe f(x, y) ser a funo de probabilidade conjunta de X e Y. Isto dado no
exemplo 7 como
6
f(x, y) = p x (1 - p) 6 - x
x
8 y- x
p (1 - p) 8 - (y - x)
y - x
que originalmente era uma forma geral da equao (2). Tambm, deixe f(y) ser a funo de
probabilidade de Y. Do exemplo 4, novamente, podemos generalizar da seguinte maneira
14
f(y) = P(Y = y) = p y (1 - p)14 - y
y
Pela definio 9 podemos agora escrever a funo de probabilidade condicional de X dado Y
=y
(16)
6 8
f(x, y)
x y - x
f(x y) =
=
f(y)
14
y
para
0x6
0 y-x 8
6
f1 (x) = P (X = x) = p x (1 - p ) 6 - x
x
e a funo de probabilidade de Y dada por
(18)
(19)
Desde que:
14
f 2 (y) = P (Y = y) = p y (1 - p)14 - y
y
f(x, y) =
6
x
y - x
14
y
14 y
p (1 - p)14 - y
y
6 8 y
p (1 - p)14 - y
=
x y - x
desde que:
6
f 1 (x) f 2 (y) =
x
14 x + y
p (1 - p) 20 - x + y
y
vemos que:
f(x, y) diferente de f1(x) f2(y)
e, por esta razo, X e Y no so independentes.
CAPTULO 5
DISTRIBUIO NORMAL
Uma funo de distribuio mostra, para uma populao, a freqncia relativa
(probabilidade) com que diferentes valores (nmeros reais) de uma varivel aleatria
ocorrem. Em geral, cada populao tende a ter a sua prpria distribuio. No entanto, a
distribuio normal a mais popular de todas por causa de sua grande aplicabilidade na
aproximao do comportamento de um grande nmero de variveis aleatrias naturais que so
contnuas. Ela conhecida como distribuio de Gauss (difusor) ou distribuio com a forma
de sino V. Figura 5.1. abaixo.
Funo:
n( x; , ) =
Para:
0.5
(( x ) )
2
< x < +
-3
-2
-1
68,27%
95,45%
99,73%
seus resultados podem perder toda a confiabilidade. Entretanto, nem sempre as variveis
aleatrias distribuem-se na forma perfeita de um sino ( = 0 e = 1). H vrias maneiras
de superar este tipo de obstculo, como aumentar o nmero de amostras e fazer
transformaes. S no pode ignorar o detalhe da normalidade.
10
idade
23
25
26
28
26
24
25
27
30
26
x = ( xi ) / n
para: n = 10 e i = 1, 2, ... n
_
x = 26 anos
Se voc utilizou uma amostra representativa da populao, voc estar afirmando que
a mdia verdadeira da populao dos 200 estudantes, , deve ser em torno de 26 anos.
Diante disso, surgem algumas questes:
_
mdia amostral, x , estar dentro de um intervalo (vamos dizer, 1 ano) da mdia da populao,
?
(iii) Qual a necessria intensidade de amostragem para assegurar uma certa
preciso com grande confiana? No exemplo 1, quo grande deveria ser uma amostragem
_
(10? 20 estudantes?) para assegurar que 95% de todos os possveis x cassem dentro de um
intervalo de 1 ano da mdia da populao, ?
Vamos responder todas estas questes nesta apostila. A primeira ser respondida,
parcialmente, neste captulo e completada no captulo 6. As outras duas (ii e iii) sero
respondidas nos captulos 6 e 7, respectivamente.
_
A lei dos grandes nmeros a nossa justificativa matemtica para usar x para
estimar ...justifica, mas no explica. Da mesma forma, ela no particularmente til para
responder questes prticas envolvendo a preciso de tais estimativas. Esta lei, por exemplo,
_
. As
probabilidades para x podem ser obtidas aproximadamente usando reas sob certas curvas
em forma de sino.
H vrias curvas normais, que variam de acordo com a mdia e desvio padro, e .
No entanto, a curva que norteia todas as outras curvas, a curva normal padro (Figura 5.1).
Tanto a forma como as propriedades da CNP podem ser vistas nesta figura. S existe uma
nica curva normal padro, com = 0 e = 1. Quando voc tem pela frente situaes com
mdias e desvios diferentes de 0 e 1, respectivamente ... no entre em pnico! Tudo que tem
que ser feito padronizar a sua varivel aleatria e, em seguida, usar a CNP para obteno
das probabilidades (ou reas).
A curva apresentada na Figura 5.1. foi desenhada depois de integrar a funo de
distribuio, de z = 0 a z = 3,9 para a primeira metade da curva direita de 0. Como a parte da
curva esquerda de 0 espelho da parte direita, as probabilidades da esquerda foram
calculadas de z = -3,9 a z = 0. Portanto, o trabalho braal j est feito. A Tabela 1 (anexo da
apostila) tem todas as probabilidades (reas sob a CNP) calculadas com preciso de dois
dgitos.
Vamos ver como funciona a Tabela 1 (anexo da apostila) usando alguns exemplos. As
figuras que ilustram o uso da Tabela 1 esto no anexo deste captulo.
Exemplo 2: Achar a rea sob a curva normal padro (CNP) esquerda de z = -0,97.
9 A soluo grfica est na Figura 5.2-a.
9 Voc vai direto tabela 1 e procure z = -0,9 (sentido vertical), depois o centsimo
(7) (sentido horizontal) e no encontro dos dois nmeros (0,97), voc tem a rea (que a
probabilidade) sob a CNP.
9 Neste caso, a rea igual a 0,1660. Isto quer dizer que 16,6% da rea est
esquerda de z = -0,97 ou que 83,4% est direita de z = -0,97.
9 No esquecer que a rea total sob a CNP igual a 1.
Exemplo 3: Achar a rea sob a CNP direita de z = 2,5.
9 Veja a soluo grfica na Figura 5.2-b.
9 De novo, voc vai tabela 1 e procure z = 2,5, depois o centsimo 0 e no encontro
dos dois nmeros (2,50), voc tem a rea (que a probabilidade) sob a CNP.
9 Neste caso, voc est calculando a rea sob a CNP de - at 2,5, que d 0,9938 ...
esquerda de z = 2,5.
9 Como voc quer saber a rea direita de z = 2,5, voc tem que subtrair de 1 (rea
total da CNP) e a sim voc ter a rea direita de z = 2,5. Assim, a rea direita ser 1
0,9938 = 0,0062, ou seja, 0,62% da rea est direita da CNP.
Exemplo 4: Achar a rea sob a CNP entre z = -1,04 e z = 2,06.
9 Veja a soluo grfica na Figura 5.2-c.
9 Neste caso, so necessrios os seguintes passos: (1) achar a rea esquerda de z =
-1,04, que igual a 0,1492; (2) achar a rea direita de z = 2,06, que igual a 0,9803; (3)
calcular a rea entre z = -1,04 e z = 2,06, que dada pela diferena (0,9803 0,1492), que
igual a 0,8311.
9 Portanto, a resposta : a rea sob a CNP entre z = -1,04 e z = 2,06 0,8311, ou seja,
83,11% da rea da CNP est entre os dois pontos de z.
x (o principal objetivo), precisamos ser capazes de encontrar as reas sob qualquer curva
normal.
Cada curva normal pode ser identificada por 2 nmeros chamados parmetros. Estes
dois parmetros so usualmente representados por mdia e desvio padro . O parmetro
nos diz onde a curva est centrada e indica a disperso da curva normal. Como vimos na
Figura 5.1, quando = 0 e = 1, temos a curva normal padro.
No entanto, no mundo real esta condio de = 0 e = 1 praticamente impossvel
de ser verificada. Os parmetros e variam entre populaes diferentes. Igual CNP, a
curva normal (ou curvas normais) centrada na e quanto maior for , mais dispersa
(achatada ou esparramada) ser a curva. A curva normal tem as mesmas propriedades da
CNP. A nica diferena que o eixo horizontal da CNP z e das outras curvas normais, o
eixo x.
As curvas normais podem assumir diferentes formas. As figuras 5.3-a, 5.3-b e 5.3-c
ilustram as diferentes formas, as quais podem ser consideradas, respectivamente, como
platicrtica, mesocrtica e leptocrtica. bvio que existe um limite de achatamento para que
a curva seja considerada normal. Este limite pode ser determinado usando o teste de
achatamento ou curtose. Da mesma maneira, a curva normal pode ser simtrica ou
assimtrica. A assimtrica pode ser negativa (maior freqncia dos dados tendendo direita
do eixo horizontal) e positiva (maior freqncia tendendo esquerda do eixo) V. Figura 5.4.
Tambm neste caso, h limite para a assimetria, que pode ser definido usando o teste de
assimetria.
69
70
71
72
73
74
75
76
77
78
79
freqncia (f)
13
17
20
18
12
,01
,02
,06
,13
,17
,20
,18
,12
,07
,03
,01
f relativa (prob)
z=
antes de usar a curva normal padro (CNP). Vamos ver o significado de z e seus
desdobramentos com exemplos.
Exemplo 9: Considere o DAP de uma rvore selecionada ao acaso. Ento, DAP uma
varivel aleatria x com mdia = 100 cm e desvio padro = 10. Por meio da padronizao
da varivel x teremos
z=
x 100
10
e se pegarmos, aleatoriamente, uma rvore qualquer da ZF-2, com 120 cm de DAP, por
exemplo, o que acontece?
z = (120 100) / 10 = 2
ou seja, nesta populao, uma rvore para estar 1,5 vez do desvio, tem que ter DAP igual a
115 cm.
Agora, vamos ao principal ponto desta seo. Considere x uma varivel aleatria
normalmente distribuda com mdia e desvio padro . Ento, a varivel aleatria, que pode
ser padronizada da seguinte maneira:
z=
z=
x 35
5
tem a distribuio normal padro. Isto quer dizer que, de acordo com as propriedades da CNP
temos
rea = 0,1660
z
-3
-2
-1
=0
Z = -0,97
rea = 0,9938
z
-3
-2
-1
=0
Z = 2,5
rea = 0,9803
rea = 0,1492
z
-3
-2
-1
-3
-2
=0
-1
=0
Z = -1,04
Z = 2,06
z
-3
-2
-1
=0
Z = -1,04
Z = 2,06
= -2
=1
x
-5
-4
-3
-2
-1
=3
=2
x
-3
-1
=6
=3
-3
12
15
ASSIMETRIA
POSITIVA
NEGATIVA
-5
-4
-3
-2
-3
-1
-2
-1
3
z=3
z=1
7 - (3)
z = ------------ = 2,0
2
2 (3)
z = ------------ = -0,5
2
x
-3
-1
-3
-2
-1
z
z = - 0,5
z=2
12 - (6)
z = ------------ = 2,0
3
x
-3
12
15
-3
-2
-1
z = -2,0
z = 2,0
0,25
20
0,2
15
0,15
10
0,1
0,05
freq absoluta
25
0
69
70
71
72
73
74
75
76
77
78
79
peso (kg)
encontrar a mdia e o desvio padro da varivel aleatria x . Isto necessrio para usar os
_
xi p
xi
e
i =1
(x )
xi
n 1
p
xi
Vamos ver isso por meio de um exemplo meio irreal. Vamos considerar as idades
(congelada em 2003) de cada membro de minha famlia (eu, mulher e 3 filhos) como uma
populao, ou seja, N = 5. Esta situao nunca ser encontrada na vida real porque para saber
a idade mdia dessa famlia basta somar as 5 idades e dividir por 5 ... ningum vai utilizar os
recursos da amostragem. No entanto, se voc entender o significado da estimativa da mdia
da populao e o comportamento do erro padro da mdia conforme se aumenta intensidade
de amostragem, para uma pequena populao (N = 5), fica mais fcil entender essas duas
variveis aleatrias quando for trabalhar com uma populao grande ou infinita (nmero de
eleitores do Brasil, N = 115 milhes, floresta da ZF-2 etc.).
Temos 3 situaes ilustrando a utilizao de 3 intensidades diferentes de amostragem
anexos 1, 2 e 3. A situao 1 se refere a uma amostragem considerando n = 2, ou seja,
escolha aleatria de 2 pessoas para estimar a mdia da populao. Primeiro voc tem que
saber quantas combinaes so possveis ao sortear 2 (n) de um conjunto de 5 (N) pessoas. S
para lembrar: fatorial de zero (0!) igual a 1 e fatorial de nmeros negativos ou no inteiros
no existe. Isto mostrado na pgina que ilustra a situao 1. Depois disso, voc tem que
_
estimar a mdia de cada combinao possvel. Aplicando a frmula de x voc vai encontrar
a mdia da mdia de todas as possveis combinaes. Voc vai notar que a mdia da mdia
exatamente igual mdia verdadeira da populao.
Repetindo as mesmas operaes para as situaes 2 e 3, respectivamente, amostragens
de n = 3 e n = 4, voc vai notar que a mdia da mdia ser sempre igual mdia da
populao, mudando apenas o desvio padro da mdia. Resumindo: a mdia da amostra ser
sempre muito parecida com a da populao e conforme voc aumenta o n, o desvio padro da
mdia (ou erro ou incerteza) diminui. Voc se convenceu desta afirmativa? Se no, melhor
tentar a vida em outra praia.
Se sim, vamos pensar agora em termos de populao de verdade. Vamos falar de
eleitores brasileiros. Em geral, os institutos utilizam aproximadamente 4.000 eleitores para
inferir sobre a populao de 115 milhes de eleitores brasileiros. Quantas possveis
combinaes so possveis quando a gente utiliza n = 4000 de N = 115 milhes? s fazer as
contas ... mas no as faa.
115.000.000
4.000
115.000.000 !
= ------------------------------------possveis combinaes
4.000 ! (115.000.000-4.000) !
bvio que ningum vai fazer todas as possveis combinaes. Se fizesse, a mdia da
mdia seria exatamente igual mdia da populao. Ento, o que feito? As empresas tomam
apenas uma nica combinao de 4000 eleitores para inferir sobre a populao de eleitores
pressupondo que a mdia estimada na pesquisa ser igual da populao e que n = 4000
produzir uma incerteza (erro) menor que n = 3.999.
Em uma floresta de porte mdio como a da ZF-2, por exemplo, com 21.000 hectares,
temos N = 84.000 (21000 x 4) amostras possveis de ha cada. Se a gente usar n = 50,
quantas possveis combinaes seriam possveis? Vrias. Quantas combinaes a gente faria
no caso de um inventrio florestal? Certamente, apenas uma. A nossa expectativa ter uma
mdia (volume ou outra varivel) representativa da populao com uma margem de erro
aceitvel.
A mdia importante porque sem ela no h planejamento. No entanto, mais
importante mesmo saber com que margem de erro (incerteza) a gente est trabalhando.
importante tambm no perder de vista que a intensidade de amostragem est diretamente
relacionada com os custos. No caso de inventrios, voc tem duas alternativas: (1) fixa a
incerteza e libera os custos ou (2) fixa os custos e libera a incerteza. Em geral, a segunda
alternativa a mais freqente. H meios para se prevenir de incertezas indesejadas.
Em inventrios florestais, voc pode se prevenir utilizando boas imagens, bons mapas,
bons equipamentos e mtodos adequados de amostragem, em combinao com planejamento
de coleta e processamento dos dados. Estamos falando de erros de amostragem (o erro que
voc comete por medir apenas parte da populao). No confundir com erros no-amostrais
(humanos, principalmente), que no so tratados aqui. No esquecer tambm que n
denominador.
x .
Isto quer dizer que: independentemente da forma que a distribuio de sua varivel
aleatria assumir, voc pode calcular as probabilidades usando a tabela-z, desde que n 30.
Significa tambm que para as amostras aleatrias de qualquer distribuio com mdia e
_
Anexo 1
Situao 1
Tomando uma amostragem com n = 2 de uma populao com N = 5
Quantas combinaes so possveis?
N!
5!
120
N
=
=
= 10 combinaes
=
n n!( N n )! 2!(5 2)! 12
Populao
Amostragem
nome
idade
comb.
NH
MIGH
IGH
FGH
GGH
mdia
desvio
51
46
22
20
12
30,2
17,21
1
2
3
4
5
6
7
8
9
10
idade1 idade2
51
51
51
51
46
46
46
22
22
20
46
22
20
12
22
20
12
20
12
12
x*p
Desvio
48,5
36,5
35,5
31,5
34,0
33,0
29,0
21,0
17,0
16,0
0,1
0,1
0,1
0,1
0,1
0,1
0,1
0,1
0,1
0,1
4,85
3,65
3,55
3,15
3,40
3,30
2,90
2,10
1,70
1,60
33,49
3,97
2,81
0,17
1,44
0,78
0,14
8,46
17,42
20,16
30,2
88,86
x
_
= 30,2
_
x = 30,2
Coincidncia? No!
9,43
Anexo 2
Situao 2
Amostragem de n = 3 da populao com N = 5
Quantas combinaes so possveis?
N!
5!
120
N
=
=
= 10 combinaes
=
n n!(N n )! 3!(5 3)! 12
Populao
Amostragem
nome
idade
comb.
idade1
NH
51
51
46
MIGH
46
51
IGH
22
FGH
20
GGH
idade2 idade3
x*p
Desvio
22
39,67
3,97
8,96
46
20
39,00
3,90
7,74
51
46
12
36,33
3,63
3,76
51
22
20
31,00
3,10
0,06
12
51
22
12
28,33
2,83
0,35
mdia
30,2
51
20
12
27,67
2,77
0,64
desvio
17,21
46
22
20
29,33
2,93
0,08
46
22
12
26,67
2,67
1,25
46
20
12
26,00
2,60
1,76
10
22
20
12
18,00
1,80
14,88
30,20
39,49
x
_
= 30,2
_
x = 30,2
Coincidncia de novo? No!
6,28
Anexo 3
Situao 3
Amostragem de n = 4 da populao de N = 5
Quantas combinaes so possveis?
5!
120
N!
N
=
=
= 5 combinaes
=
n n!( N n )! 4!(5 4 )! 24
Populao
Amostragem
idade3 idade4
x*p
desvio
34,75
32,75
32,25
26,25
25
0,2
0,2
0,2
0,2
0,2
6,95
6,55
6,45
5,25
5
4,141
1,301
0,841
3,121
5,408
30,2
14,812
idade
idade1
idade2
NH
MIGH
IGH
FGH
GGH
51
46
22
20
12
51
51
51
51
46
46
46
46
22
22
mdia
30,2
desvio
17,21
22
22
20
20
20
20
12
12
12
12
nome
3,85
= 30,2
_
x = 30,2
Coincidncia? No! Por que no?
_
1) Se voc usar todas as possveis combinaes, a mdia da mdia x ser sempre igual
a mdia da populao , independentemente do tamanho da amostragem.
2) O que muda o desvio padro da mdia ou erro padro, ou seja, conforme aumenta a
intensidade de amostragem, diminui o erro, aumenta a preciso e diminui a incerteza
da sua estimativa.
CAPTULO 7
Estimando a mdia da populao
7.1. Intervalos de confiana:
_
Vimos no captulo 5 que razovel usar uma mdia amostral x para estimar a mdia
da populao ( ). A Lei dos Grandes Nmeros diz que: se uma grande amostragem
_
n.
E AGORA??
_
Estamos falando do Intervalo de Confiana (IC), que ser definido com exemplos.
Exemplo 1: Um estatstico est interessado em obter informaes sobre a mdia em
altura de uma populao, , de todos os adultos masculinos de uma grande cidade.
Com base em experincia anterior ele sabe que o igual a 2,5. Se ele tomar uma
_
encontrar as probabilidades para x usando as reas sob a curva normal com parmetros
(que no conhecemos) e / n = 2,5 / 30 = 0,46.
_
z = x 0,46
O valor de z para x = - 1
z = [ ( - 1) - ] / 0,46 = -1 / 0,46 = -2,17
_
E o valor de z para x = + 1
z = [ ( + 1) - ] / 0,46 = 1 / 0,46 = 2,17
que o mesmo que dizer que est entre 1 de x . Isto pode ser re-escrito da seguinte
maneira:
_
Suponha agora, por exemplo, que quando o pesquisador tomar uma amostragem
_
x - 1 = 66 e x + 1 = 68
Ele sabe que, 97% destes intervalos contero e, por esta razo, ele pode estar 97% certo de
que a estar entre 66 e 68. Desta forma, o intervalo de 66 a 68 chamado de IC 97% para
.
Soluo: Encontrar o valor-z, para o qual a rea sob a CNP (curva normal padro)
direita deste z, 0,025 (rea/2) e esquerda de z. Note que a rea total sob a CNP 1, ento
estamos falando de uma rea equivalente a [1 - 0,025 ] = 0,975 e 0,025. Dessa maneira, para
resolver este problema precisamos encontrar o valor-z que tem uma rea entre 0,975 e 0,025
sua esquerda.
Na tabela 1, o valor-z que tem uma rea de 0,975 sua esquerda 1,96 - no encontro
da linha 1,9 com a coluna 6, voc tem uma rea de 0,9750. Neste caso, voc tem o valor
exato de 0,9750 (1 - 0,025) na tabela. Se o valor exato no for encontrado, faa interpolaes.
O valor-z que tem uma rea de 0,025 sua esquerda -1,96.
Agora, voltando companhia telefnica: sabemos que n = 100 e, em funo podemos
_
n = 4,4
100 = 0,44
z = ( x ) 0,44
e ter aproximadamente uma distribuio normal padro.
Como queremos o IC 95% para , podemos coloc-lo da seguinte maneira:
P ( -1,96 < z < 1,96 ) = 0,95
_
x -z
/2
*(/
n ) para x + z
/2
*(/
n )
_
Ele encontrou uma mdia amostral das 30 rvores, x = 40 cm. Baseado nestas informaes,
vamos encontrar o IC 90% para a .
Soluo: Checando primeiro: n 30 - OK!; e conhecido. Podemos, ento,
aplicar os passos necessrios:
/2
= z 0,05 = 1,64
_
/2
_
x - z
/2* /
a x + z
/2*
30 a
40 + 1,64 * 10 /
30
37 a 43
Concluindo: o empresrio pode ter 90% de confiana que o dimetro mdio, , de sua
floresta est entre 37 a 43 cm.
At agora assumimos que o conhecido. Entretanto, na maioria dos casos, isto
no possvel. Uma maneira de lidar com isto fazer um levantamento piloto para estimar
o . Quer dizer: podemos usar o desvio padro amostral s no lugar do . Isto aceitvel
porque, para grandes amostras ( n 30 ), o valor de s extremamente parecido a ser uma
boa aproximao de . A conseqncia matemtica disso a seguinte (recorrendo tambm
aoTLC):
x
s
em vez de
plat =>
encosta =>
baixio =>
O segundo termo aps o sinal () pode ser considerado como incerteza ou margem
de erro. Assim, as incertezas para plat, encosta e baixio so, respectivamente: 0,0799,
0,0808 e 0,0785, ou seja, as incertezas (em %) so de 7,99%, 8,08% e 7,85%.
Se n < 30, no podemos usar a CNP para encontrar as probabilidades para o IC.
Entretanto, um pesquisador chamado W.S. Gosset desenvolveu curvas de probabilidade que
podem ser usadas, em vez da CNP. Estas curvas so conhecidas como curvas-t de student ou
simplesmente curvas-t. A forma de uma curva-t depende do tamanho da amostra. Se a
amostra de tamanho n, ns identificamos a curva-t em questo dizendo que a curva-t com
(n-1) graus de liberdade.
Se tomamos uma amostra aleatria de tamanho n de uma populao que
aproximadamente normalmente distribuda com mdia , a varivel aleatria
t = (x ) s
9
A rea total sob qualquer curva-t igual a 1.
9
As curvas-t so simtricas em torno de zero.
9
As curvas-t se estendem indefinidamente em ambas as direes.
9
Conforme aumenta o nmero de graus de liberdade, as curvas-t ficam
mais parecidas com a CNP.
A maneira de encontrar a rea sob a curva-t a mesma usada na CNP.
x -t
/2
*(s/
n ) para x + t
/2
*(s/
n )
_
Para isto, ele decide tomar uma amostragem aleatria de 16 pneus e conferiu a
milhagem de cada um.Os resultados deste teste o seguinte:
Pneu
1
2
3
4
5
6
7
8
milhagem
43.725
40.652
37.732
41.868
44.473
43.097
37.396
42.200
Pneu
9
10
11
12
13
14
15
16
Milhagem
39.783
44.652
38.740
39.385
39.686
44.019
40.220
40.742
Soluo: Vamos usar o procedimento definido anteriormente; neste caso com n = 16.
1. O nvel de confiana desejado 0.95, isto , = 0,05. Usando a tabela 2 para (16-1)
= 15 graus de liberdade.
t /2 = t 0,025 = 2,13
2. O IC 95% :
_
x - 2,13*( s /
n ) para x + 2,13*( s /
n )
x = 41.148,13
e
s = 2.360, 32
Conseqentemente
_
x - 2,13*( s /
_
x + 2,13*( s /
Isto quer dizer que o vendedor pode ter 95% de confiana que a (durabilidade mdia
da nova marca) est entre 39.891 a 42.405 milhas. Desta forma, o fabricante est correto em
afirmar que a nova marca tem = 40.000 milhas.
Quadro 7.1: Dados de rea basal (m2/ha) em dois transectos na ZF-2 distribudos em classes
topogrficas (plat, encosta e baixio).
transecto
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
mdia
desvio
IC(95%)
ua
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
plat
41,4
43,7
26,1
33,8
33,3
37,2
31,0
18,6
33,2
32,4
26,2
41,3
19,6
34,8
27,3
39,5
30,1
24,6
36,6
34,7
60,7
44,7
26,3
24,5
26,6
22,2
35,7
19,4
17,0
52,6
26,6
36,7
33,3
20,6
57,7
38,8
43,2
23,6
28,4
17,6
18,9
27,6
47,7
23,9
21,1
22,3
19,7
27,4
39,2
27,7
28,5
18,0
39,0
28,1
34,0
25,3
26,4
40,6
21,3
31,1
31,2
9,8
2,5
encosta
21,8
28,2
22,1
14,9
21,9
27,5
30,9
36,5
21,9
28,5
28,4
31,5
32,7
30,8
29,9
23,5
18,4
18,4
24,0
16,3
15,9
35,0
19,9
31,3
18,4
31,1
11,3
24,3
47,0
24,8
27,0
30,9
23,8
27,9
28,2
36,6
17,6
33,5
30,2
39,9
38,0
26,6
32,7
56,0
59,8
34,7
29,8
28,5
25,3
9,4
32,3
31,2
28,1
28,1
39,7
21,5
38,7
29,4
25,5
34,0
28,5
9,1
2,3
baixio
28,2
22,1
29,6
39,3
43,2
39,7
40,7
22,6
12,4
15,8
25,6
40,6
26,4
21,8
35,8
34,6
20,6
21,1
24,3
41,6
29,6
41,9
36,7
23,5
27,4
28,1
12,3
23,5
29,6
23,4
6,4
26,9
21,1
17,2
25,2
23,7
14,5
27,7
28,6
37,5
26,1
25,7
18,6
24,2
19,2
15,2
42,3
20,4
26,1
27,0
35,6
24,9
25,2
20,8
23,1
24,9
23,1
23,5
21,3
30,7
26,5
8,2
2,1
Curva normal
-3
-2
-1
0 1
Curva-t com 12 gl
-3 -2 -1 0 1
Curva-t com 3 gl
-3 -2 -1 0 1
Captulo 8
Testes de hipteses para mdias
8.1. Introduo:
No Captulo 7 aprendemos como fazer uma predio educada1 (inferncia) sobre
_
levantar uma hiptese sobre a e ento vamos usar a x para fazer inferncia concernente a
_
nossa hiptese. Em outras palavras, usaremos x para decidir se a nossa hiptese concernente
correta.
Exemplo 1: O DAP mdio da floresta do Distrito Agropecurio da SUFRAMA (rea
de 600.000 ha) = 38 cm. Vamos ver neste captulo como usar o DAP mdio tomado de
_
uma amostragem aleatria (por ex., n = 30, correspondente a 30 hectares), x , para decidir se
aquilo que hipotetizamos ( = 38 cm) est correto ou no.
Dizemos ento que = 38 cm a hiptese nula (h0), que pode ser escrita da seguinte
maneira:
Hiptese nula: = 38
Que pode ser testada contra a hiptese de que a no igual a 38 cm, conhecida como
hiptese alternativa (h1), que pode ser escrita da seguinte maneira:
Hiptese alternativa: 38
(que pode ser tambm < 38 ou > 38)
_
(assumindo que h0 verdadeira), podemos esperar que a x (o DAP estimado) seja mais ou
menos igual a 38 cm. E agora? O quo prximo de 38 precisa estar o DAP mdio para ser
considerado estatisticamente igual a ? Se a gente olhar para h1, precisamos responder: o
quo distante de 38 precisa estar o DAP mdio para ser considerado diferente da ? Ou ento:
o quo menor ou o quo maior para testar as hipteses alternativas ( < 38 ou > 38)?
Matematicamente falando, precisamos encontrar um ponto para tomada de deciso, d,
_
Em geral a escolha das hipteses nula (h0) e alternativa (h1) bastante subjetiva.
Como regra bsica podemos dizer que h0 leva sempre o sinal de ( = ); exemplos: = 38, 1 =
2 (mdia da populao 1 igual a mdia da populao 2) e assim por diante.
1
predio educada pode ser traduzida como um chute certeiro de um Romrio por exemplo.
H dois tipos de erros quando aceitamos a hiptese que no verdadeira, Tipo I e Tipo
II, que ilustramos no quadro abaixo:
hiptese que
Aceita
H0
h1
h0
OK!
erro Tipo II
h1
erro Tipo I
OK!
z=
(x )
s
8.2.1. Testes de Hipteses para uma mdia simples: teste unicaudal para
grandes amostras.
(i) Olhando apenas o lado esquerdo da curva:
Procedimentos:
1. Hiptese nula: = 0
2. Hiptese alternativa: < 0
3. Condicionante: tamanho da amostragem n 30
4. Escolher o nvel de significncia2 . Normalmente = 0,01, 0,05 ou 0,10
5. O valor crtico d = - z. Usar Tabela 1 para encontrar o valor de z.
2
6. Calcular o valor de
z=
(x 0 )
(s n )
Procedimentos:
1. Hiptese nula: = 0
2. Hiptese alternativa: > 0
3. Condicionante: tamanho da amostragem n 30
4. Escolher o nvel de significncia . Normalmente = 0,01, 0,05 ou 0,10
5. O valor crtico d = z. Usar Tabela 1 para encontrar o valor de z.
6. Calcular o valor de
z=
(x 0 )
(s n )
8.2.2. Testes de Hipteses para uma mdia simples: teste bi-caudal para
grandes amostras.
Neste caso vamos olhar esquerda e direita da curva e, por esta razo, temos dois
nveis crticos ou pontos de deciso d.
Procedimentos:
1. Hiptese nula: = 0
2. Hiptese alternativa: 0
3. Condicionante: tamanho da amostragem n 30
4. Escolher o nvel de significncia . Normalmente = 0,01, 0,05 ou 0,10
5. Os valores crticos so d = - z/2 e d = z/2. Usar Tabela I para encontrar os valores
de z/2.
6. Calcular o valor de
z=
(x 0 )
(s n )
Agora, vamos usar a x de cada populao para fazer inferncia concernente a nossa
_
x1 x 2 (1 2 )
z=
s12 n1 + s 22 n 2
) (
x1 x 2 (1 2 )
z=
2
s1 n1 + s 22 n 2
) (
z=
x1 x 2
2
s1 n1 + s 22 n 2
) (
t=
x
s n
t=
x 0
s
sp =
n1 + n 2 2
t=
(x1 x2 ) (1 2 )
s p (1 n1 ) + (1 n2 )
t=
sp
(x1 x2 )
(1 n1 ) + (1 n2 )
Procedimentos:
1. Hiptese nula: 1 = 2
2, Hiptese alternativa: 1 < 2
3. Condicionantes: (i) amostras independentes; (ii) populaes normais; (iii) varincias
das populaes iguais.
4. Escolher o nvel de significncia . Normalmente = 0,01, 0,05 ou 0,10
gl.
5. O valor crtico d = - t. Usar Tabela II para encontrar o valor de t com (n1 + n2 -2)
6. Calcular o valor de
t=
sp
(x1 x2 )
(1 n1 ) + (1 n2 )
sendo:
sp =
Sum
umrio dos Procedimentos para Testar as Hipteses Discutidas neste Captulo
Tipo
Mdia Simples
(grandes amostras)
Condicionantes
Duas Mdias
(grandes amostras)
(1) n1 30, n2 30
(2) amostras independentes
Mdia Simples
(Pequenas
Amostras)
populao
normal
Duas Mdias
(Pequenas
Amostras)
n 30
h0
= 0
1 = 2
= 0
1 = 2
h1
> 0
< 0
0
teste estatstico
_
[ x - 0 ]
z = ------------[s / n ]
1 > 2
1 < 2
1 2
> 0
< 0
0
[x 1- x 2]
z = ------------------------ [ s12 / n1 ] + [ s22 / n2 ]
1 > 2
1 < 2
1 2
[x 1- x 2]
t = --------------------------sp (1 / n1) + (1 / n2 )
[ x - 0]
t = -----------[s / n ]
_
rea de rejeio
rejeio
z > z
z < -z
z > z/2 ou z < -z/2
z > z
z < -z
z > z/2 ou z < -z/2
t > t
t < -t
t > t/2 ou t < -z/2
t > t
t < -t
t > t/2 ou t < -t/2
Captulo 9
Inferncias sobre as varincias
9.1. Introduo:
Neste captulo vamos ver os mtodos usados para os testes de hipteses e intervalos de
confiana para a varincia. No confundir com anlise de varincia (ANOVA), que utilizada
para teste (comparao) de mdias e ser vista no captulo 11. Vamos apresentar o teste quiquadrado (2) e o teste-F.
Na rea florestal, ainda no comum fazer este tipo de inferncia. Em qu situao
podemos estar interessados em controlar a variao? J vimos que a mdia muito mais
popular que a varincia; por essa razo, a maioria das inferncias feita com base nesta
varivel.
No caso de uma indstria de carro, por exemplo, temos um grande nmero de
diferentes fornecedores (parafusos, porcas, rodas, espelhos etc.). Neste caso, podemos ter um
fornecedor de rodas diferente de um fornecedor de parafuso. O encaixe da roda ao carro, no
justo e tem sempre uma certa margem de segurana tanto no comprimento como na
espessura do parafuso. Aquele que fabrica o parafuso fornece para vrios outros fabricantes e
nem sempre consegue fazer os parafusos exatamente iguais. Neste caso, o controle de
qualidade pode ser feito usando a inferncia sobre a varincia, seja do comprimento ou da
espessura.
O fabricante avisa que a margem de segurana de 0,1 mm, ou seja, parafusos com
dimetros variando de 9,9 e 10,1 mm passam pelo controle de qualidade. Chama-se uma
estatstica e ela faz uma amostragem aleatria nas duas linhas de produo concluindo que o
dimetro mdio em torno de 10 mm, mas alerta que um ou outro parafuso pode estar fora da
especificao (da margem de segurana). Sendo assim, preciso testar as varincias antes de
apresentar o relatrio de controle de qualidade das linhas de produo. Foram coletados 20
parafusos de cada linha de produo e tomadas as medidas de dimetro de cada um (Quadro
9.1).
Aqui, duas questes precisam ser respondidas: (1) qual a varincia apropriada? (2) se
as duas linhas de produo tm a mesma varincia, igualmente apropriada?
Margem de segurana igual a 0,1 mm o mesmo que dizer que o desvio de 0,1
mm e varincia de 0,01 mm. Ento, para responder a questo 1, formulamos as seguintes
hipteses para a linha de produo 2:
Hiptese nula:
2 = 0,01
2 =
(n 1) s 2
2
podem ser encontradas usando as reas sob curvas especiais conhecidas como curvas de 2.
Os valores de 2 podem ser obtidos diretamente na Tabela III. A Figura 9.1 apresenta
trs diferentes curvas para diferentes graus de liberdade (GL).
2 =
(n 1) s 2
2
2 =
(n 1) s 2
02
onde 02 o valor de 2 hipotetizada (neste caso, 02 = 0,01). Queremos saber se esta s2 est
muito longe da 02 hipotetizada ou no, ou seja, se 0,058 igual a 0,01, do ponto de vista
estatstico. Precisamos tambm escolher o nvel de significncia ().
Para 19 (20 - 1) GL, 20,05 = 30,14 (Tabela III)
2 = 0,01
Hiptese nula:
2 =
0,01
Desde 2 > 30,14, temos que rejeitar a hiptese nula e concluir que 2 > 0,01 para a
linha de produo 2.
O procedimento geral para montar o teste de hiptese para uma nica varincia o
seguinte:
1. Definir as hipteses:
- Hiptese nula:
2 = 02
2 =
(n 1) s 2
02
mdia da populao, , baseado em uma mdia amostral, x . Neste seo vamos ver como
encontrar o IC para a varincia da populao, 2, baseado em uma varincia amostral, s2. Para
montar o IC, vamos usar o fato que, se uma amostra aleatria de tamanho n tomada de uma
populao que normalmente distribuda com varincia 2, ento a varivel aleatria
2 =
(n 1) s 2
02
(n 1)s 2
2 2
para
(n 1)s 2
2
1 2
19 x (0,058)
----------------- a
-------------------
30,14
10,12
9 no so simtricas;
9 a rea total sob a curva-F igual a 1.
12 = varincia da populao 1
e n2, s22 e 22 so os valores correspondentes para a populao 2. Se 12 = 22, ento, a varivel
aleatria
F = s12 / s22
tem a distribuio-F com (n1-1, n2 - 1) GL; ou seja, as probabilidades para a varivel aleatria
F pode ser determinada usando as reas sob a curva-F com (n1-1, n2 - 1) GL.
O procedimento geral para montar um teste de hiptese usando o F o seguinte:
1. Definir as hipteses:
- Hiptese nula, H0: 12 = 22
- Hiptese alternativa, H1: 12 > 22
2. Pressupostos: (1) amostras independentes e (2) populaes normais
3. Escolher o nvel de significncia
4. O valor crtico c = F com (n1 - 1, n2 - 1) GL, onde n1 e n2 so os tamanhos
das amostragens.
5. Calcular o valor de
F = s12 / s22;
Para (19, 19) GL, o valor crtico F (ou c) aproximadamente 2,16. Quando s12 > s22
recomenda-se a inverso da frmula de F-estatstico, mantendo os mesmos GL. E o Festatstico
F = s22 / s12 = 0,058 / 0,008 = 7,25
Produo 1
9,91
9,97
9,84
9,97
10,18
10,08
10,03
10,02
9,88
10,03
10,05
10,18
10,06
9,98
9,91
10,07
9,98
10,1
9,99
9,97
10,01
0,008
Produo 2
10,48
10,07
9,89
10,38
9,5
9,95
9,81
9,87
10,13
10,03
10,26
9,73
10,29
9,97
10,38
9,94
10,14
10,17
10,17
10,09
10,06
0,058
F
0
Figura 9.1: Curva-F com (3,20) gl
2
0
10
15
20
25
30
Captulo 10
Teste de Qui-quadrado ( 2 )
10.1. Introduo:
Neste captulo vamos ver um teste estatstico baseado na distribuio de Qui-quadrado
( 2 ), conhecido como teste de qui-quadrado. Este teste pode ser usado tanto na estatstica
paramtrica como na no paramtrica. O teste estatstico 2 e a curva 2 j foram descritos no
captulo anterior (Captulo 9). Aqui, vamos enfatizar a aplicao deste teste para:
(i) Ajuste de curvas ou de distribuies:
Exemplos:
4) Usando o exemplo (3): se voc quiser comparar uma toposseqncia da ZF-2 com
uma da Reserva Ducke pra saber se essas toposseqncias so homogneas em relao a
distribuio de nmero de espcies por classe topogrfica. Imagine que na ZF-2, a
distribuio seja 40% no plat, 30% na encosta e 30% no baixio. A, voc faz o levantamento
na Ducke e descobre que a distribuio 36% no plat, 32% na encosta e 32% no baixio.
Aplica o teste qui-quadrado pra checar se a distribuio da ZF-2 igual a da Ducke. Se der
no significante, isso quer dizer as toposseqncias so homogneas.
=
2
(O E )2
E
Agora, vamos exemplificar com nmeros. Imagine uma populao de rvores com 120
indivduos tendo a seguinte distribuio de dimetro.
classes DAP
25
35
45
55
> 65
Total
freqncia
24
48
24
12
12
120
probabilidade
0,2
0,4
0,2
0,1
0,1
1
Em seguida, voc faz um levantamento usando apenas parte da populao (neste caso
40 rvores) e quer saber se a amostra representativa. A distribuio de dimetro dessa
amostragem apresentada abaixo incluindo a freqncia de acordo com a distribuio da
populao (n = 120) e o 2.
classes DAP
25
35
45
55
>65
(OE)
(8-10) = -2
(20-20) = 0
(13-10) = 3
(5-5) = 0
(4-5) = -1
(O-E)2 / E
0,4
0,0
0,9
0,0
0,2
1,5
Deciso => c (9,49) maior do que 2calculado (1,5); portanto, no rejeitar H0. Concluir que a
distribuio da amostragem , estatisticamente, igual a da populao e, por essa razo, a
amostragem representativa da populao.
10.2.2. Qui-quadrado ( 2 ) para teste de independncia ou tabela de contingncia.
Neste caso, vamos trabalhar com linhas (L) e colunas (C). O valor esperado de cada
clula calculado da seguinte maneira:
(total da linha) x (total da coluna)
E = -----------------------------------------total de observaes
Passos necessrios:
Passo 1: formular as hipteses cientficas:
=
2
(O E )2
E
Exemplificando com nmeros: Pesquisa com acidentes em relao ao sexo das pessoas
envolvidas. Veja quadro abaixo com 2 colunas e 3 linhas.
local acidente
no trabalho
em casa
Outros
Total
homem
40
49
18
107
mulher
5
58
13
76
total
45
107
31
183
no trabalho
em casa
outros
total
homem
O
E
40
26,3
49
62,6
18
18,1
107
mulher
O
E
5
18,7
58
44,4
13
12,9
76
total
45
107
31
183
Valor crtico c (tabela III com GL=2) igual a 9,21. GL = 2 => (L-1)(C-1) = (3-1)(2-1) = 2
Calcular 2 = (40-26,3)2/26,3 + ...... + (13-12,9)2/12,9 = 24,30
Deciso: 2 > c; logo, rejeitamos a H0.
10.2.3. Qui-quadrado ( 2 ) para teste de homogeneidade
Como para o teste de independncia, vamos trabalhar com linhas (L) e colunas (C). O
valor esperado de cada clula calculado da seguinte maneira:
(total da linha) x (total da coluna)
E = -----------------------------------------total de observaes
Passos necessrios:
Passo 1: formular as hipteses cientficas:
=
2
(O E )2
E
Exemplificando: Comparando duas cidades estratificadas por cor da pele. Duas amostragens
(n = 100 para as duas) so consideradas e o resultado apresentado no quadro abaixo.
amostragem
brancos
negros
Outros
total
cidade 1
83
12
100
cidade 2
87
100
total
170
11
19
200
brancos
85
85
170
negros
5,5
5,5
11
Outros
9,5
9,5
19
total
100
100
200
Hipteses:
H0: Cidade 1 e cidade 2 tm a mesma % para cada cor de pele
H1: Cidade 1 e cidade 2 no tm a mesma % para cada cor de pele
Checando: nenhum E menor do que 1 e no tem E < 5 => OK
= 0,05
Valor crtico c (tabela III com GL=2) igual a 5,99. GL = 2 => (L-1)(C-1) = (2-1)(3-1) = 2
Calcular 2 = (83-85)2/85 + ...... + (7-9,5)2/9,5 = 1,52
Deciso: 2 < c; logo, no rejeitamos a H0, ou seja, cidade 1 e cidade 2 tm a mesma
distribuio de cor de pele.
Captulo 11
Anlise de Varincia ANOVA
11.1. Introduo:
Apesar do nome, a anlise de varincia (ANOVA) usada para comparao de
mdias. Vimos, anteriormente, que h vrios testes usados na comparao de mdia (teste t,
Tukey, Bonferroni, Duncan etc). Por que usar a ANOVA? Usamos a ANOVA quando
queremos compreender melhor a natureza da variao natural das diferentes fontes, alm de
comparar as mdias. No fundo, ANOVA a partio (ou desdobramento) da variao total de
acordo com as fontes de variao.
A ANOVA aplicada para testar hipteses quando a pesquisa envolve mais de duas
mdias. Trata-se de uma ferramenta estatstica amplamente utilizada e com um grau de
sofisticao muito alto. Podemos, de forma muito simplista, definir os seguintes tipos de
ANOVA:
a) ANOVA de simples entrada => fontes de variao ou grupos classificados por um
simples critrio como ENTRE os transectos e DENTRO (ou resduo ou erro) dos
transectos => aplicado em experimentos inteiramente casualizados.
b) ANOVA de dupla entrada => aplicao clssica em experimentos blocos
casualizados => fontes de variao: BLOCO, TRATAMENTO e RESDUO (ou
erro).
c) ANOVA de tripla ou mltiplas entradas => aplicao clssica em experimentos
fatoriais incluindo as interaes como fontes de variao.
d) ANOVA aninhada (nested): aplicao em experimentos com parcelas subdivididas
tipo Split Plot (clssico) ou quando o adapta para anlise de parcelas repetidas.
e) ANOVA para regresso: tanto para as regresses lineares (simples e mltiplas) e
no lineares (simples e mltiplas) => para explicar o quanto da variao dos dados
explicado pelo modelo utilizado.
f) MANOVA => anlise de varincia de vrias variveis, simultaneamente.
Na verdade, voc arma a ANOVA de acordo com as fontes de variao estabelecidas,
ou seja, desmembrando a variao total; o teste aplicado para testar as suas hipteses o testeF (Captulo 9, item 9.5). Em seguida, apresentamos os quadros auxiliares usados para
ANOVA de simples entrada e para ANOVA de dupla entrada.
ANOVA de simples entrada:
Fontes de Variao
Entre
Dentro (Resduo)
Total
GL = graus de liberdade
SQ = soma dos quadrados
MQ = mdia quadrtica
F = calculado
GL
SQ
MQ
GL
SQ
MQ
No primeiro caso (de simples entrada), voc determina o valor de F dividindo MQentre
pela MQdentro. Antigamente, muito antigamente mesmo, voc pegava o Fcalculado e comparava
com o Ftabela (funo dos GLs ENTRE e DENTRO e nvel de significncia ). Atualmente, os
softwares estatsticos vo te dar o valor exato da probabilidade para inferncia => ento, em
vez do valor de F no quadro auxiliar, o software vai te fornecer a probabilidade.
No segundo caso (de dupla entrada), voc quer ver, separadamente, os efeitos dos
blocos e dos tratamentos. Para isso, voc aplica o teste-F para blocos e para os tratamentos,
separadamente. O valor de F para blocos voc consegue dividindo MQblocos pela MQresduos e
para os tratamentos dividindo MQtratamentos pela MQresduos.
Passos necessrios:
(i) Formular as hipteses
H0 => 1 = 2 ...... = n
H1 => nem todas as so iguais ou, pelo menos, uma diferente.
(ii) Definir os tipos de dados que voc vai utilizar => dados mtricos
(iii) Condies => as k populaes so normais com a mesma varincia.
(iv) Definir o nvel crtico
(v) Determinar o valor crtico c => c = F com (k-1) GL no numerador e (n-k) GL no
denominador.
(vi) Calcular F
MQentre
F = -------------MQdentro
(vii) Deciso => Se F > c, rejeitar H0
x ij
2
n
( xij )2
i =1 i =1
SQE = ( x media ) ou
g
n
i =1
k
xij
i =1
i =1
g
k
SQD = xij
i =1
empreg
1
2
3
4
5
subtot
CIA1
46
53
54
29
27
209
CIA2
65
59
17
18
37
196
CIA3
37
13
65
42
33
190
CIA4
11
35
57
56
40
199
subtot
159
160
193
145
137
794
Quadro auxiliar
Fontes de Variao
Entre
Dentro (Resduo)
Total
GL
3
16
19
SQ
37,8
5486,6
5524,4
MQ
12,6
342,9
F
0,04
GL
2
177
179
SQ
659,83
14582,04
MQ
329,92
82,38
F
4,005
p
0,02
Captulo 12
Regresso e correlao
12.1 Introduo:
O objetivo da regresso obter uma expresso da dependncia de uma varivel Y
sobre uma ou mais variveis independentes X. Tal expresso , matematicamente, conhecida
como funo, logo, Y uma funo de X. Funo um relacionamento matemtico que nos
capacita predizer quais valores de uma varivel Y, para dados valores de uma varivel X.
Resumindo: Y = f (X).
A regresso define o relacionamento estatstico entre as variveis tomadas e, a
correlao, a estreiteza deste relacionamento. Na regresso estima-se o relacionamento de
uma varivel com uma outra, expressando-se em termos de uma funo linear (ou uma outra
mais complexa), enquanto que na anlise de correlao, s vezes, confundida com regresso,
estima-se o grau para o qual duas ou mais variveis variam juntas.
Os mtodos de regresso so de grande utilidade na derivao das relaes empricas
entre vrios fenmenos, sendo aplicveis para: (i) encontrar uma funo estatstica que possa
ser utilizada para descrever o relacionamento entre uma varivel dependente e uma ou mais
variveis independentes e (ii) testar hipteses sobre a relao entre uma varivel dependente e
uma ou mais variveis independentes. No manejo florestal, o uso da regresso fundamental
na derivao de modelos matemticos: (i) para explicar o comportamento de uma espcie ou
povoamento submetido a um determinado tipo de interveno; (ii) para desenvolver modelos
de crescimento; (iii) desenvolvimento de equaes de volume e de biomassa; (iv)
desenvolvimento de relaes hipsomtricas; (v) para alguns estudos da estrutura da floresta
(distribuio em dimetro, por exemplo) etc.
Ao olhar um povoamento florestal, voc pode achar que quanto maiores forem o
dimetro e altura, maior ser o volume ou peso da rvore. Entretanto, voc no poder afirmar
nada alm disso. Com o auxlio da regresso, voc ser capaz de expressar o relacionamento
entre as variveis independentes dimetro e altura e o volume (ou peso) da rvore na forma de
um modelo estatstico. Desta maneira, voc ser capaz de predizer o volume (ou peso) de uma
rvore em p tendo apenas as medies de dimetro e altura.
Dependendo do nmero de variveis independentes, a regresso pode ser simples (uma
varivel) ou mltipla (mais de duas variveis) e, dependendo da natureza da equao bsica, a
regresso pode ser linear ou no linear.
Todas as equaes bsicas podem ser linearizadas e, deste modo, as estimativas dos
coeficientes de regresso podem ser obtidos usando procedimento tradicional de regresso
linear. Este truque utilizado para facilitar o processamento dos dados. Entretanto, quando
se tem recurso da informtica que permite trabalhar com processos iterativos para
convergncia das estimativas dos coeficientes, o truque perde o sentido.
Neste captulo, vamos demonstrar como so estimados os coeficientes de regresso e
de correlao para a regresso linear simples. Sabendo como estimar os coeficientes de
regresso e correlao da simples, voc poder, por analogia, estimar os coeficientes da
regresso mltipla. No caso de regresso no linear, h duas alternativas: (i) linearizar a
equao original e adotar os procedimentos das regresses simples ou mltipla e (ii) manter a
equao original e estimar os coeficientes de regresso e correlao utilizando um dos
seguintes mtodos: Gauss-Newton, Quasi-Newton e Simplex opes do software Systat.
Y = 0 + 1 X + i
o que quer dizer: para um dado X, um valor correspondente de Y consiste do valor 0 + 1 X
mais uma quantidade i, o incremento pelo qual algum indivduo Y pode desviar-se da linha
de regresso.
Os coeficientes 0 e 1 so desconhecidos. O erro i muito difcil de ser encontrado
porque ele varia para cada observao Y. Entretanto, 0 e 1 permanecem fixos e, apesar de
no poder encontr-los exatamente sem o exame de todas as possveis ocorrncias de Y e X,
pode-se utilizar as informaes disponveis para obter as estimativas a e b de 0 e 1,
respectivamente. Desta maneira, podemos escrever o modelo acima, como um modelo
estatstico da seguinte maneira
Ye = a + bX
onde Ye o valor estimado de Y para um dado X, quando a e b so conhecidos.
A questo, agora, saber como determinar os coeficientes a e b. Como falamos
anteriormente, ser utilizado o MMQ para a determinao dos coeficientes. Vamos fazer esta
demonstrao a partir da figura 12.1.:
Vamos considerar
Yi = valor observado
Yei = valor estimado
Nesta figura temos 6 valores de X. A equao da reta ajustada passa exatamente entre
os pontos (X) observados. O desvio () a diferena entre o valor observado (Y) e o valor
estimado (Ye) pela equao da reta para o mesmo valor de X.
Vamos comear a demonstrao adiantando que vamos chamar a soma dos desvios ao
quadrado de S e S tem que ser mnimo (zero), assim
(i)2 = S = 0 => i variando de 1 a n
sem esquecer que
i = Yi - Yei
sendo:
Yei = a + b Xi
logo
i = Yi (a + b Xi)
Continuando o desenvolvimento do MMQ.
(1)2 + (2)2 + (3)2 + ... (n)2 tem que ser mnimo
logo
S = (i)2 = (Yi Yei)2 tem que ser mnimo
e
S = (Yi (a + b Xi))2
an
+ b Xi = Yi
a Xi + b Xi2 = XiYi
Pelo mtodo de substituio, os coeficientes sero:
a = ( Yi b X i ) n
b = (SPC xy ) (SQC x )
Ento, para estimar os coeficientes de regresso a e b, voc tem que saber os seguintes
somatrios: Yi, Xi, XiYi e Xi2. Para facilitar os clculos manuais, monte a seguinte
quadro auxiliar. As frmulas de SPC e SQC so encontradas no Captulo 3.
Quadro 12.1: Quadro auxiliar para estimar os coeficientes de regresso.
obs
Y2
X2
XY
(Y-Ye)2
Y2
X2
XY
(Y-Ye)2
1
2
.
.
.
N
Comentrios:
i)
ii)
A reta dos MMQ passa pelo ponto (Xmdio, Ymdio), isto , quando X = Xmdio temse Ye = Ymdio
iii)
r=
SPCxy
SQC X SQCY
SQRES
SQREG
GL
SQ
MQ
Devido regresso
c1
b * (SPCxy)
SQREG/(c-1)
nc
por subtrao
SQRES/(n-c)
Total (corrigido)
n-1
SQCY
Captulo 13
Estatstica no Paramtrica
13.1. Introduo:
At o captulo 12, vimos vrias situaes da estatstica paramtrica. Basicamente, a
estatstica paramtrica foi desenvolvida sob a teoria da distribuio normal. No entanto, os
fenmenos naturais tendem a no seguir a distribuio normal padro ( = 0 e 2 = 1) e,
muitas vezes, no h nem como normalizar os dados da populao uso da padronizao da
varivel aleatria. Quando os seus dados teimam em no seguir a distribuio normal, temos
ainda o recurso do uso do teorema do limite central para driblar a condio
normalidade da maioria dos testes estatsticos.
Se voc achou que acabaram os recursos estatsticos para analisar os seus resultados,
restou o ltimo e derradeiro recurso que o uso da estatstica no paramtrica. A estatstica
no paramtrica usada quando as condies impostas ao uso da estatstica paramtrica so
muito violadas. Alm disso, quando no d para repetir a pesquisa de campo ou de
laboratrio e voc tem que analisar o material que voc em suas mos. Para alvio de sua
conscincia, existe a estatstica no paramtrica que a estatstica de distribuio livre e os
seus testes podem ser aplicados s populaes com qualquer distribuio.
Qual o preo que voc paga por usar a estatstica no paramtrica? O preo a
limitao de sua comunicao. No d pra voc ir muito longe com as decises tomadas com
base nos testes no paramtricos, alm do significante ou no significante. No entanto, a
estatstica no paramtrica requer poucos dados (portanto, a pesquisa mais barata), os
clculos so simples e voc pode trabalhar diretamente (sem transformaes) com dados
ordinais e qualitativos.
A estatstica no paramtrica assim conhecida porque no trabalha com parmetros
( e ). Este conceito, no entanto, ganhou uma certa flexibilidade com o passar do tempo.
Hoje, quando viola as condies impostas pela estatstica paramtrica, voc corre atrs de um
teste similar na no paramtrica e usa at para comparao de mdias.
2
Neste captulo vamos ver alguns testes no paramtricos, principalmente aqueles que
tm contrapartidas (correspondentes) na estatstica paramtrica.
n k
n p
P( x = k ) = p (1 p )
k
Numa pesquisa incluindo n experimentos independentes do tipo sucesso e
insucesso, teremos:
p = probabilidade de sucesso
x = o nmero de sucessos
(1 - p) = probabilidade de insucesso
Exemplo 1 => Uma pessoa em uma sala tem cartes numerados de 1 a 10. Ela pega
um carto ao acaso e uma outra pessoa (em outra sala) tenta adivinhar o nmero que foi
pego. Este experimento repetido 3 vezes. A pergunta : qual a probabilidade de acertar 2
vezes.
Resolvendo => sabemos que:
n=3
p = probabilidade de sucesso = 1/10 = 0,1
q = (1 p) = probabilidade de insucesso = 9/10 = 0,9
P (x = 2) = ? => probabilidade de acertar 2 vezes
Portanto:
3
P (x = 2) =
2
ou seja, a probabilidade de outra pessoa acertar 2 vezes em 3 tentativas 0,027 ou
2,7%.
A Tabela VIII d direto essas probabilidades, desde que haja coincidncia em termos
de n, k e p. Pra se garantir, melhor saber como calcular a probabilidade exata da
distribuio binomial.
Voc obtm a probabilidade usando a Tabela VIII => n = 3, k = 2 e p = 0,1
na primeira coluna tem o n (nmero de tentativas ou experimentos)
na segunda coluna tem o k (nmero de sucessos)
para n = 3, temos k = 0, k = 1, k = 2 e k =3
para cada k, temos uma probabilidade de acordo com a probabilidade de
sucesso, p, pr-estabelecida =>
o
o
o
o
10,4 6,2
< 14.000
Neste caso, temos tambm que fixar (aproximadamente) o nvel crtico para
estabelecer a rea de rejeio de nossa hiptese nula.
Ento, vamos a tabela VIII
temos que olhar na primeira coluna com n = 12 (temos 12 rendas familiares,
terceira pgina, o k est na segunda coluna e como p = 0,5 (sucesso) temos que ver
as probabilidades de cada k na oitava coluna.
como o nosso = 0,05 (aproximadamente), temos que, num processo inverso,
determinar a nossa rea de rejeio e seu correspondente k que seria, ento, o
nosso valor crtico a ser usado na tomada de deciso.
60,0 25,7 22,4 20,1 17,3 16,1 15,3 14,8 14,3 14,1
+
+
+
+
+
+
+
+
+
+
10,4 6,2
-
Quantos sinais (+) temos? Temos 10, ou seja, o nosso ponto de deciso 10 =>
Considerando = 0,0192, temos que rejeitar H0 porque k 10. Como o k s pode
ser inteiro, o nosso valor crtico estaria entre 0,0192 e 0,0729.
Concluso: Rejeitamos H0, a nossa mediana no igual a R$ 14.000,00 com =
0,0192.
H0: MD = M
H1: MD < M (MD > M)
Em uma amostra de tamanho n, usar a Tabela IX para encontrar e o valor crtico
d.
Tomar uma amostra de tamanho n e montar o seguinte quadro:
dif (x M)
|D|
rank de |D|
xn
Calcular:
rank c/ sinal R
Decises:
dif (x M)
+ 0,2
+ 0,1
- 0,4
- 0,5
- 0,8
- 1,0
- 1,6
- 3,0
|D|
0,2
0,1
0,4
0,5
0,8
1,0
1,6
3,0
rank de |D|
2
1
3
4
5
6
7
8
rank c/ sinal R
+2
+1
-3
-4
-5
-6
-7
-8
Soluo:
Da tabela IX, para n = 8, tiramos que o mais prximo de 0,05 0,055; portanto o
valor crtico d igual a 6 para = 0,055.
Calculamos, ento, o R+ somando os ranks com sinais positivos (+) => na ltima
coluna tem apenas 2 ranks (+), que so 2 e 1, logo R+ = 2 + 1 = 3
Deciso: Como d = 6 e R+ = 3, rejeitamos H0
Exemplificando:
diferenciados:
Considere
duas
populaes
de
escolas
com
tratamentos
n = 8 da populao 1
k = 7 da populao 2
Da tabela 13.11, para = 0,05, n = 8 e k = 7, o valor crtico d igual a 13.
Populao 2
tempo
rank
2,31
10
1,96
7
2,73
14
2,51
13
3,04
15
2,34
12
2,24
9
PARTE 2
Captulo 14
Algumas variveis aleatrias utilizadas em manejo florestal
14.1 Dimetro altura do peito (DAP)
14.1.1 Notas preliminares
Na engenharia florestal, o dimetro da rvore DAP e ponto final. DAP se mede a 1,3
m acima do nvel do solo. O objetivo desta seo no ensinar como medir o DAP porque
isto est muito bem explicado nos livros de Machado & Figueiredo Filho (2003)3 e Campos &
Leite (2002)4. Em plantios de eucalipto, o DAP tende a ser medido quase sempre a 1,3 m do
solo. Na Amaznia, a situao um pouco diferente porque h sapopemas e outras
irregularidades no tronco que nem sempre a parte a 1,3 m do solo est disponvel para medir.
Em inventrios em uma nica ocasio, esta situao pode ser superada utilizando
equipamentos especiais ou a projeo do dimetro altura do DAP. Por compensao de
erros, o resultado final no ser afetado. Em inventrios contnuos, a subjetividade na
medio de um mesmo indivduo em ocasies sucessivas, no bem-vinda. Neste caso,
necessrio medir sempre no mesmo local (altura em relao ao solo) e a o recurso medir
aonde possvel e marcar (com tinta) este ponto da medio. Dessa forma, ser possvel
estimar as mudanas ocorridas entre duas ou mais ocasies.
Como a pronncia correta desta varivel to importante para a engenharia florestal;
D-A-P ou Dape ou Dapi? Segundo o Manual de Estilos da Abril, temos os seguintes
conceitos:
Sigla a reunio das iniciais de um nome prprio composto de vrias palavras e deve
ir, quase sempre, em caixa alta: CNBB, CPI, CPMF, IBGE, BNDS, CBF etc. Certas siglas
silabveis, mesmo estrangeira, so escritas em caixa alta e baixa: Vasp, Ibope, Inpa, Incra,
Aids etc.
Diante disso, o nosso dimetro altura do peito tem que ser pronunciado como Dape
ou Dapi. Certos esto os bilogos, eclogos e outros no florestais e errados esto os
engenheiros florestais. Por conta disso, quero dedicar esta seo queles que pronunciam
errado esta varivel, D-A-P. No critiquem (e nem tripudiem) queles que falam Dape ou
Dapi porque eles esto certos, mas continuem pronunciando D-A-P., que uma tradio
florestal de mais de 40 anos no Brasil.
Acrnimo a reunio de elementos (iniciais, primeiras letras e slabas) dos
componentes de um nome, com a inteno de formar uma palavra silabvel e, deve ir, sempre,
em caixa alta e baixa: Ibama, Cacex, Varig etc. Chichu um acrnimo.
14.1.2 DAP usado na estrutura da floresta
3
4
Tanto para volume e biomassa os seguintes modelos logartmicos podem ser utilizados
para descrever a relao entre volume e DAP e ou H e biomassa e DAP e ou HT:
1) ln V = a + b ln (DAP ) ou ln PF = a + b ln (DAP )
2) ln V = a + b ln (DAP ) + c ln (H ) ou ln PF = a + b ln (DAP ) + c ln (HT )
onde: V = volume do tronco em m3
D = DAP em cm
H = altura comercial ou comprimento do tronco em m
PF = peso fresco da parte area em kg
HT = altura total da rvore em m
ln = logaritmo natural
Todo o desenvolvimento desses modelos ser detalhado na prxima seo. Aqui,
queremos apenas mostrar os indicadores usados na escolha do melhor modelo, como erro
padro da estimativa syx, coeficiente de correlao (r) e coeficiente de determinao (r2), para
advogar em favor do uso do DAP apenas. Vamos considerar modelo 1 como aquele que tem
apenas o DAP como varivel independente e modelo 2 o que tem DAP e altura (comercial ou
total), separadamente para volume e biomassa.
Volume (n = 959):
r = 0,971
r2 = 0,943
r = 0,988
r2 = 0,977
r = 0,984
r2 = 0,967
r = 0,989
r2 = 0,978
Biomassa (n = 498):
que medir as alturas da rvore em p. Mesmo com equipamentos sofisticados, muito difcil,
seno impossvel, medir precisamente a altura total. A altura comercial pode at ser medida
precisamente com equipamentos, mas diferentes medidores podem apresentar diferentes
medidas para a mesma rvore por causa da subjetividade em definir o que "altura
comercial". Nunca, mas nunca mesmo, "chutar" a altura para utilizar o modelo 2.
Nos exemplos com equaes de volume e de biomassa, temos o seguinte: (i)
acrescentar a altura comercial (H) ao modelo 1, significa melhorar a preciso em 0,42% (1,46
1,04) e (ii) acrescentar altura total (HT) ao modelo, significa melhorar a preciso em 1,22%
(6,54 5,32). Vale a pena acrescentar a altura? Pense nisso, sobretudo, nos custos de coleta de
dados para o inventrio florestal.
Na rea experimental de manejo florestal da ZF-2, a rea basal mdia est em torno de
30 m /ha. Isso quer dizer que se projetarmos todos os DAPs 10 cm sobre uma rea de
10.000 m2 (um hectare), as rvores ocuparo 30 m2. Algumas estimativas (m2/ha) para
diferentes stios na Amaznia: UHE de Santa Izabel (regio do Araguaia) = 15,2; Projeto Rio
Arinos (norte de MT) = 1,6; Floresta Estadual do Antimary (Acre) = 15,2, Trombetas (Par) =
24,8; PIC Altamira (Par) = 22, Sul de Roraima = 20,9 e Alto Solimes (Fonte Boa e Juta no
AM) = 27 m2/ha.
2
Com esses poucos exemplos, podemos dizer que a floresta da ZF-2 mais densa do
que as outras florestas. A estimativa de rea basal, de forma isolada, diz muito pouco sobre
uma determinada floresta. Com esses poucos exemplos, difcil afirmar que a floresta da ZF2, por exemplo, muito densa ou pouco ou mdio, porque deve haver florestas mais densas
do que esta. De qualquer modo, no custa nada estimar a rea basal da rea inventariada j
que as medies de DAP so obrigatrias em inventrios florestais.
Antigamente (at incio dos anos 90), era comum ver inventrios florestais com
volumes estimados a partir da rea basal, ou seja, AB x altura x fator de forma. O fator de
forma utilizado era igual a 0,7 proposto por peritos da FAO (Food and Agriculture
Organization) que realizaram os primeiros inventrios na Amaznia nas dcadas de 50 e 60. A
altura era, invariavelmente, "chutada". O engenheiro florestal deve utilizar-se de equaes
prprias para estimar o volume de madeira.
14.3. Volume
No setor florestal, as decises so tomadas baseadas no volume de madeira. Isto to
forte que, muitas vezes, o engenheiro florestal at se esquece que numa floresta h muitas
outras coisas alm da madeira. Aqui, o objetivo mostrar como se estima o volume de
madeira nos inventrios florestais. Para isto, voc precisa ter equaes confiveis e us-las
para estimar o volume de rvores em p medidas em parcelas fixas do inventrio florestal.
Volume real
Para desenvolver equaes de volume, voc precisa ter o volume real de vrios
indivduos. Este volume pode ser obtido por meio do mtodo destrutivo (aproveitando reas
exploradas ou desmatadas, autorizadas pelo Ibama) ou utilizando o relascpio de Bitterlich
(por exemplo). O mais comum o mtodo destrutivo. Antes de derrubar a rvore, o DAP
medido. Com a rvore no cho, as alturas ou comprimentos (comercial e total) so
determinados e o tronco dividido em pequenas toras, tentando se aproximar forma do
cilindro.
Em geral, o tronco dividido em 10 toras (ou sees) e duas medidas so tomadas em
cada tora, na base e no topo. Com estas duas medidas, voc tem condies de calcular as reas
transversais da base e do topo; a, voc estima a mdia (g da base + g do topo dividido por 2)
e multiplica pelo comprimento da tora [lembrando que m2 de g vezes m do comprimento,
voc ter m3] para ter o volume da tora ou seo. A soma dos volumes das 10 toras
considerada "volume real" da rvore. Melhores explicaes voc vai encontrar nos livros de
Machado & Figueiredo Filho (2003) e Campos & Leite (2002).
Quantas rvores so necessrias para desenvolver os modelos estatsticos para
volume ou equaes de volume ou modelos alomtricos?
Alometria => (do grego: allos outra e metron medida) => o estudo das variaes
das formas e dos processos dos organismos e tem dois significados: (i) o crescimento de uma
parte do organismo em relao ao crescimento do organismo inteiro ou de parte dele e (ii) o
estudo das conseqncias do tamanho sobre as formas e os processos.
Voc pode usar uma funo conhecida de distribuio em dimetro (Weibull, por
exemplo) e ver se os dados j coletados se ajustam a esta funo. Teste simples como o quiquadrado (confrontao entre freqncia esperada e freqncia observada) d conta disso. Se
o teste for significante, colete mais dados das classes que esto faltando e refaa o teste quiquadrado. Se o resultado for no significante, voc tem, em mos, uma amostra representativa
de sua populao de interesse. H tambm a possibilidade de utilizar-se do recurso do
inventrio florestal quanto intensidade de amostragem; neste caso, cada indivduo uma
amostra. A frmula a seguinte:
n = t 2s2 2
sendo: t = valor obtido na tabela-t ( p = 0,05 ou outro e n-1 graus de liberdade)
s2 = estimativa da varincia
2 = expectativa do erro = (LE x mdia)2. Em geral, o LE (limite de erro) igual a
0,10 ou 10%.
Observaes: use z em vez de t. Como vimos anteriormente, os valores de z para os nveis
crticos mais freqentes, = 0,10, = 0,05 e = 0,01 so, respectivamente, 1,64, 1,96 e
2,57. Outra coisa: h tambm o fator de correo para populaes finitas, ou seja, neste caso
ao denominador da frmula (2) deve ser acrescentado ( 1 n/N ). A populao considerada
finita quando a frao n/N menor do que 0,05, segundo Freese (1962)5.
5
Freese, F. 1962. Elementary forest sampling. Agriculture Handbook n 232. USDA-Forest Service.
91p.
O passo seguinte testar modelos matemticos. Antigamente (fim dos anos 70), o
grande desafio era encontrar o melhor modelo para descrever a funo V = f (DAP, H).
Depois de vrias dissertaes e artigos cientficos, verificou-se que qualquer modelo, seja de
simples entrada (apenas DAP como varivel independente) ou de dupla entrada (DAP e H
como variveis independentes, combinadas ou no) produzem bons ajustes. A deciso para
escolher o melhor modelo ficou nos detalhes.
Hoje em dia, qualquer modelo que voc venha a testar, utilizando DAP e H, voc vai
conseguir uma alta e significativa correlao, um modelo que explica mais de 75% da
variao de seus dados (r2) e um erro padro de estimativa aceitvel. O padro de hoje o
modelo que apresenta r > 0,90, r2 > 0,90 e syx (%) < 10. Alm disso, o modelo tem que ter
uma boa distribuio de resduos, que : as diferenas entre os valores estimados e
observados, positivos e negativos, tm que se distribuir uniformemente ao longo da curva (ou
reta) estimada, ou seja, estas diferenas no podem aumentar (ou diminuir) conforme aumenta
o tamanho da rvore. Por exemplo: se o seu modelo produzir uma diferena de 0,5 m3 para
uma rvore com DAP = 10 cm, esta mesma diferena (mais ou menos) tem que ser verificada
para outra rvore com DAP = 70 cm ou DAP = 150 m.
Os modelos que apresentam as melhores distribuies de resduos so os modelos
logartmicos. Os mais usados so os seguintes, do item 1.1.3:
1) ln V = a + b ln (DAP )
2) ln V = a + b ln (DAP ) + c ln (H )
A abordagem para estimar os coeficientes de regresso a do mtodo dos mnimos
quadrticos (MMQ) e depois da obteno das equaes normais, os coeficientes podem ser
estimados usando o mtodo da substituio ou por meio do clculo matricial. As explicaes
sobre as operaes necessrias para se chegar aos coeficientes podem ser encontradas em
qualquer livro de estatstica bsica. No computador, basta entrar com as variveis ln V, ln D e
ln H e voc ter, alm dos coeficientes de regresso, erro padro de estimativa, coeficiente de
correlao, coeficiente de determinao e distribuio de resduos.
Regresso => descreve apenas o relacionamento linear entre uma varivel dependente
(Y) e uma ou mais variveis independentes (X1 = DAP, X2 = altura etc.).
+ b X1 = Y
a X1 + b X12 = X1Y
Pelo mtodo de substituio, os coeficientes sero:
a = [ Y - b X1 ] / n
b = [ SPCX1Y ] / [ SQCX1 ]
Para o modelo 2, as equaes normais so
an
+ b X1
a X1 + b X12
+ c X2
= Y
+ c X1 X2 = X1 Y
a X2 + b X1 X2 + b X22
= X2 Y
Com o melhor modelo em mos, voc vai aplic-lo em inventrios florestais. Num
inventrio na Amaznia, para rvores com DAP 10 cm, voc deve utilizar uma parcela de,
no mnimo, 2.500 m2 (10 x 250 m ou 20 x 125 m). Numa parcela deste tamanho, voc deve
encontrar entre 100 e 150 indivduos. Lembre-se que, de acordo com o conceito de intervalo
de confiana (IC), em 95 vezes (se o seu p = 0,05, por exemplo) a sua estimativa estar dentro
do seu IC e em 5 vezes, a estimativa estar fora do IC. Portanto, no se surpreenda e confie na
estatstica (na incerteza que o seu modelo declarou). No esquecer que os seus modelos so
logartmicos e, por esta razo, ao estimar o volume de madeira voc tem que usar o inverso do
logaritmo natural que a exponencial.
14.4. Biomassa
Estimar a biomassa importante para compreender a produo primria de um
ecossistema e avaliar o potencial de uma floresta para produo de energia. No manejo
florestal sustentvel na Amaznia, a biomassa usada para estimar a quantidade de nutrientes
que exportada do sistema via explorao de madeira e que devolvida via inputs
atmosfricos. No entanto, depois da Rio-92, a biomassa ganhou uma nova dimenso. O
carbono da vegetao passou a ser um elemento importante nas mudanas climticas globais.
O eng florestal sabe (ou deveria saber) que aproximadamente 50% da madeira secada (em
estufa) carbono e que os compostos de carbono so: celulose (45%), hemicelulose (28%) e
lignina (25%).
De acordo com o IPCC (Painel Intergovernamental de Mudanas Climticas), os
componentes de biomassa e carbono da vegetao so: (i) biomassa ou C na matria viva
acima do nvel do solo (tronco, galhos, folhas, frutos e flores); (ii) biomassa ou C na matria
viva abaixo do nvel do solo (razes) e (iii) biomassa ou C na matria morta em p ou no cho.
Quem foi treinado para estimar o volume de madeira tem todas as condies para
estimar a biomassa tambm. O anexo 5 um artigo (manuscrito) sobre biomassa que j foi
publicado na Acta Amazonica6. Este artigo cobre o componente 1 do IPCC.
O componente 2 envolve razes e isto est sendo realizado pelo LMF (laboratrio de
manejo florestal do INPA) e ser includo em uma tese de doutorado. O trabalho de campo
para obteno do peso de razes muito trabalhoso, mas nada que assuste o verdadeiro eng
florestal. Como o solo da Amaznia muito pobre em nutrientes, as rvores tendem a
desenvolver razes superficiais raramente ultrapassam 50 cm de profundidade. Mesmo na
Amaznia, em regies que tm as estaes do ano (chuvosa e seca) bem definidas, as rvores
tendem a desenvolver razes mais profundas para procurar gua, o que no o caso da
Amaznia Central.
O componente 3 pode ser estimado com preciso combinando as taxas de mortalidade
com os modelos usados no componente 1.
Coleta de dados => verdade de campo => mtodo destrutivo
Higuchi, N., Santos, J. dos, Ribeiro, R.J., Minette, L. e Biot, Y. 1998. Biomassa da parte area da
vegetao da floresta tropical mida de terra-firme da Amaznia brasileira. Acta Amazonica,
28(2):152-166.
Captulo 15
Distribuio de dimetro: Weibull versus Exponencial
15.1. Introduo:
Como a altura da rvore difcil de ser medida, com preciso, o dimetro passa a ser a
varivel mais importante e mais segura para estimar o volume e a biomassa de florestas
tropicais de uma regio como a Amaznia. Alm disso, o dimetro consagrou-se como uma
varivel importante na descrio da estrutura florestal, como tambm na comercializao de
madeira. Assim, a quantificao de distribuies de dimetro fundamental para o
entendimento da estrutura da floresta e do estoque da floresta, que so pr-requisitos nas
decises do manejo florestal.
Bailey and Dell (1973), Clutter et al. (1983) e Higuchi (1987) apresentam revises
compreensivas sobre distribuies de dimetro. De acordo com Clutter et al. (1983) e
Lawrence e Shier (1981), entre as vrias distribuies estatsticas, a distribuio Weibull tem
sido a mais usada pelo setor florestal, depois da distribuio exponencial.
A introduo da funo de distribuio Weibull aos problemas relacionados com
silvicultura e manejo florestal, atribuda Bailey e Dell em 1973 (Zarnoch et al., 1982;
Little, 1983; Clutter et al., 1983 e Zarnoch e Dell, 1985). Desde ento, esta distribuio tem
sido extensivamente utilizada para descrever a distribuio de dimetro, tanto em
povoamentos equianos como multianos, especialmente nos Estados Unidos.
No Brasil, especialmente na floresta amaznica, a Weibull foi utilizada por Higuchi
(1987), Umaa (1998), mas segundo Barros et al. (1979) e Hosokawa (1981), a distribuio
mais popular a exponencial.
f ( x ) = (c b )x c 1 exp ( x ) / b
c
= 0, em outras circunstncias
(2)
(4)
(5)
Dessa forma, o coeficiente c pode ser estimado por meio de qualquer processo
iterativo ou via tentativa-e-erro para igualar os dois lados da equao (5). O coeficiente b
pode ser estimado pela equao (4), depois de estimado o c.
A freqncia esperada pode ser determinada atravs da seguinte funo de distribuio
cumulativa de Weibul, F(x), que, por sua vez, pode ser encontrada integrando a sua funo de
densidade probabilstica, f(x), do DAP mnimo at o mximo (Zarnoch et al., 1982)
{[
F (x ) = 1 exp (x a ) b]
a = x1 x n x 22
) (x
+ x n 2x 2 )
b = a + x(0,63n )
c=
ln[ln(1 p k )] [ln(1 pi )]
ln(x npk a ) (x npi a )
onde:
x i ( i = 1, 2, ... n) = o i-simo DAP em ordem crescente
x 1 = o menor DAP e x n = o ltimo DAP, ou seja, o maior DAP.
x (0,63n) = o DAP rankeado em ( 0,63 * nmero total de DAP observados). Exemplo: num
conjunto de dados de 100 DAPs, x (0,63n) o 63 DAP.
p i = 0,16731 e p k = 0,97366
A freqncia esperada pode ser determinada por meio da seguinte funo de
distribuio cumulativa de Weibul, F(x), que, por sua vez, pode ser encontrada integrando a
sua funo de densidade probabilstica, f(x), do DAP mnimo at o mximo (Zarnoch et al.,
1982).
{[
F (x ) = 1 exp (x a ) b]
(iii) Exponencial:
Y = ae bx
podem ser obtidos pela linearizao (srie de Taylor) ou por meio do mtodo iterativo
(Marquardt, por exemplo), segundo Draper e Smith (1981). O software Systat pode calcular
os coeficientes pelos dois mtodos.
3. Clculo das probabilidades (freqncia esperada): caso Weibull percentis para DAP10
cm
P (x < 10) =
P ( 10 x < 20 ) =
P ( 20 x < 30 ) =
P ( 30 x < 40 ) =
3. Bibliografia:
Bailey, R.L. e T.R. Dell. 1973. Quantifying Diameter Distributions with the Weibull
Function. Forest Science 19:97-104.
Barros, P.L.C., S.A. Machado, D. Burger e J.D.P. Siqueira. 1979. Comparao de Modelos
Descritivos da Distribuio Diamtrica em uma Floresta Tropical. Floresta 10(2):19-31.
Clutter, J.L., J.C. Fortson, L.V. Pienaar, G.H. Brister e R.L. Bailey. 1983. Timber
Management: A Quantitative Approach. John Wiley and Sons, Inc. New York. 333p.
Cohen, A.C. 1965. Maximum Likelihood Estimation in the Weibull Distribution Based on
Complete and on Censored Samples. Technometrics 7(4):579-588.
Draper, N.R. e H. Smith. 1981. Applied Regression Analysis. John Wiley and Sons, Inc. New
York. Segunda edio. 709p.
Einsesmith, S.P. 1985. PLOTIT: Users Guide.
Higuchi, N. 1987. Short-term Growth of an Undisturbed Tropical Moist Forest in the
Brazilian Amazon. Tese de Doutor, Michigan State University. 129p.
Hosokawa, R.T. 1981. Manejo de Florestas Tropicais midas em Regime de Rendimento
Sustentado. UFPr, Relatrio Tcnico.
Lawrence, K.D. e D.R. Shier. 1981. A Comparison of Least Squares and Least Absolute
Deviation Regression Models for Estimating Weibull Parameters. Commun. Statist.
Simula Computa. B10(3):315-326.
Little, S.N. 1983. Weibull Diameter Distribution for Mixed Stands of Western Confiers.
Can.J.For.Res. 1:85-88.
Umana, C.L.A. e Alencar, J.C. 1998. Distribuies Diamtricas da Floresta Tropical mida
em uma rea no Municpio de Itacoatiara AM. Acta Amazonica 28(2):167-190.
Zarnoch, S.J. e T.R. Dell. 1973. An Evaluation of Percentile and Maximum Likelihood
Estimators of Weibull Parameters.
Zarnoch, S.J., C.W. Ramm, V.J. Rudolph e MW. Day. 1982. The effects of Red Pine
Thinning Regimes on Diameter Distribution Fitterd to Weibull Function. MSU
Agricultural Experiment Station East Lansing. RI-423. 11p.
Captulo 16
Biomassa da Parte Area da Vegetao da Floresta Tropical
mida de Terra-Firme da Amaznia Brasileira.
Niro Higuchi1 , Joaquim dos Santos1 , Ralfh Joo Ribeiro1,
Luciano Minette1 e Yvan Biot2
Resumo
Usando um banco de dados com 315 rvores, com DAP5 cm, foram testados quatro
modelos estatsticos - linear, no linear e dois logartmicos - para estimar a biomassa de
rvores em p. Os dados foram coletados, de forma destrutiva, na regio de Manaus, Estado
do Amazonas, em um stio coberto por floresta de terra-firme sobre plats de latossolo
amarelo. Em diferentes simulaes com diferentes intensidades de amostragem, os quatro
modelos estimam precisamente a biomassa, sendo que o afastamento entre a mdia observada
e a estimada, em nenhuma ocasio ultrapassou 5%. As equaes para estimar a biomassa de
rvores individuais em uma parcela fixa, distintamente para rvores com 5DAP<20 cm e
com DAP20 cm, so mais consistentes do que o uso de uma nica equao para estimar,
genericamente, todas as rvores com DAP5 cm. O modelo logartmico com apenas uma
varivel independente, o DAP, apresenta resultados to consistentes e precisos quanto os
modelos que se utilizam tambm da varivel altura total da rvore. Alm do modelo
estatstico para estimar o peso da massa fresca total de uma rvore, outras informaes so
apresentadas, estratificadas nos diferentes compartimentos (tronco, galho grosso, galho fino,
folhas e, eventualmente, flores e frutos) de uma rvore, como: concentrao de gua para
estimar o peso da massa seca, concentrao carbono e a contribuio do peso de cada
compartimento no peso total.
palavras-chaves: Carbono, manejo florestal, modelo estatstico.
Aboveground Biomass of the Brazilian Amazon Rainforest
Abstract
Data set with 315 trees with diameter at breast height (dbh) greater than 5 cm was used to
test four statistical models - linear, non-linear and two logarithmics - to estimate aboveground
biomass of standing trees. The data were collected destructively in Manaus region, Central
Amazonia, in a site covered by a typical dense terra-firme moist forest on plateaus
dominated by yellow latosols. The difference between observed and estimated biomass was
always below 5%. The logarithmic model using a single independent variable (dbh) produced
results as consistent and precise as those with double-entry (dbh and total height). Besides
statistical models to estimate aboveground biomass, the following information are also
presented in this paper: the contribution of each tree compartment (stem, branch, twigs, leaves
and flowers or fruits) to the total weight of a standing tree, water concentration to estimate the
dry weight and carbon concentration of each tree compartment.
Key words: Carbon, forest management, statistical model
Introduo:
o que foi posto anteriormente. Esta tabela foi parcialmente reproduzida de FEARNSIDE et al.
(1993), considerando apenas a biomassa viva acima do nvel do solo. So produzidas
estimativas diferentes, com o passar do tempo, pelos mesmos autores e para o mesmo banco
de dados (montado nos anos 70). Alm disso, Foster Brown et al. (1995) criticam estes
bancos de dados, afirmando que as alturas das rvores foram obtidas sem aparelhos de
medio e que, estes erros no amostrais no so mencionados.
O consenso existente entre os pesquisadores que trabalham com biomassa de que
praticamente impossvel determinar a biomassa de cada rvore, pelo mtodo direto, ao
executar um inventrio florestal. Por esta razo, os recursos da anlise de regresso para o
desenvolvimento de modelos estatsticos, para estimar a biomassa de rvores em p, devem
ser empregados para superar este problema. Salomo et al. (1996) citam apenas dois modelos
estatsticos utilizados na Amaznia; um proposto por Sandra Brown e colaboradores e, outro,
proposto por Christopher Uhl e colaboradores. O primeiro requer o conhecimento da
densidade da madeira de cada indivduo, que praticamente impossvel obte-la durante o
inventrio; e o segundo, recomendado para florestas secundrias. Alm destes, h o modelo
de Overman et al. (1994), para a floresta amaznica colombiana, desenvolvido principalmente
para rvores de pequenos dimetros.
Materiais e Mtodos
(i) Coleta de Dados:
- Trata-se de um modelo com apenas o DAP como varivel independente, que uma
varivel fcil de ser medida no campo, sem erros no amostrais. O nico problema deste
modelo que o peso ser sempre o mesmo, para um determinado dimetro,
independentemente da altura da rvore, da espcie e de outros atributos da rvore.
(ii) Modelo 2:
estimar a biomassa das duas classes de dimetro, o desempenho anterior no repetido, com
desvio de -7,3%.
- Este modelo (equaes a e b) demonstra a mesma consistncia nas simulaes com n
= 300, n = 200, n = 100 e n = 50, respectivamente, com desvios de -4,3% (3,4 e 5,1, menor e
maior desvio, em valores absolutos), +0,3% (0,6 e 3,7), -4,0% (1,2 e 7,6) e -7,7% (4,2 e 16,1).
O uso de uma s equao tem um desempenho inferior a todos os outros modelos testados e,
por esta razo, no uma alternativa para as duas equaes. Neste caso, a opo tem que ser
pelas duas equaes, 4 a para rvores com 5DAP<20 cm e 4b para DAP20 cm.
- De todos os modelos testados, este modelo o que apresenta as menores amplitudes
de variao, demonstrando uma boa consistncia na estimativa da biomassa. um modelo
bastante conservador e que apresenta poucas surpresas na estimativa da biomassa das
diferentes classes de dimetro.
Consideraes finais:
e
(a) P = 0,0336 * D2,171*H1,038; para 5DAP<20 cm
(b) P = 0,0009 * D1,585*H2,651; para DAP20 cm
local
Amaznia
biomassa (t)
fonte
268
Brown & Lugo (1992a) ) cf.
fonte*
Densa (FAO)
Amaznia
162
Brown & Lugo (1992a) - cf.
fonte*
Densa (RADAMBRASIL)
Amaznia
289
Brown & Lugo (1992b) - cf.
fonte*
Densa (FAO)
Amaznia
227
Brown & Lugo (1992b) - cf.
fonte*
Densa (presente)
Amaznia
12.3
Fearnside (1992a) - cf. fonte*
Densa (presente)
Amaznia
319.9
Fearnside (unpub. 1993) - cf.
fonte*
(*) Fonte: parcialmente reproduzida de Fearnside et al. (1993)
Tabela 2: Banco de Dados de Biomassa, do INPA (n = 315).
(a) Distribuio de Freqncia dos Dados Observados (n = 315).
Limites de classe
5 < 10
10 < 20
20< 30
30< 40
40< 50
50< 60
60< 70
70< 80
80< 90
90< 100
100< 110
110< 120
120
total
Freq.
154
90
28
18
9
8
3
3
0
1
0
0
1
315
%
48,89
28,57
8,89
5,71
2,86
2,54
0,95
0,95
0,32
0,32
100
mdia
16,0
17,0
10,7
476,3
306,4
782,7
31
desvio
15,3
7,7
5,2
1299,3
1031,5
2271,1
1
CV(%)
96
45
49
273
337
290
45
Mnimo
5,0
5,6
2,4
4,5
0,6
9,1
2
mximo
120,0
41,4
26,1
12736,5
12897,9
25634,4
70
(c) Estatstica Descritiva dos Dados Observados, Divididos em Algumas Classes de Dimetro:
Classes de
dimetro
5 < 10
10 < 15
15 < 20
20 < 30
30 < 50
>= 50
nmero
casos
154
62
28
28
27
16
DAP
mdia
CV(%)
7,0
20
12,0
12
17,5
9
23,6
11
37,2
1
65,9
29
altura Total
mdia
CV(%)
11,4
27
16,4
20
20,8
18
23,7
1
29,3
11
34,1
10
Peso Total
mdia
CV(%)
35,7
68
15,0
42
407,5
34
852,0
43
2449,2
35
8205,4
72
mdia
39,9
28,8
17,3
217,4
1595,3
3742,6
34
desvio
20,3
6,0
3,7
2449,1
2429,5
3005,4
1
CV(%)
51
56
22
11
152
128
22
Mnimo
9,5
11,4
7,5
48,7
15,2
63,9
9
mximo
98,0
41,4
25,0
12736,5
12898,3
25634,4
63
(b) Contribuio de cada compartimento (tronco, galho grosso, galho fino, folhas e flor/frutos)
no peso total de uma rvore e % do PF de cada um que transformado em PS:
PESOS
tronco
g.grosso
g.fino
folhas
flor/frutos
TOTAL
m
217,36 1109,68
434,24
50,30
1,07
3742,61
VERDE
s
2449,1 1985,66
432,65
48,87
5,41
4793,77
n
38
38(34)
38
38
38(8)
38
m
65,60
17,83
1,52
2,03
0,01
% total
s
1,19
1,43
7,21
1,28
0,03
n
38
38(34)
38
38
38(8)
m
101,65
665,63
246,64
23,58
0,80
2238,30
SECO
s
1552,45 1243,55
253,6
23,01
4,60
3005,38
n
38
38(34)
38
38
38(8)
38
m
61,11
60,56
57,22
47,56
36,73
60,28
% PF
s
8,27
7,98
5,75
7,21
20,62
7,41
n
38
34
38
38
8
38
m = mdia aritmtica; s = desvio padro amostral; n = nmero de observaes.
% total = contribuio do peso de cada compartimento da rvore em relao ao seu peso total.
% PF = % do Peso Fresco da rvore ou do compartimento que corresponde ao Peso Seco.
0%
0,856
0,696
0,879
0,536
0,681
0,818
0,725
1,027
0,891
0,571
1,077
0,891
0,804
0,167
0,536
1,077
25%
0,790
0,697
0,903
0,521
0,678
0,807
0,707
0,990
0,870
0,533
1,033
0,870
0,783
0,163
0,521
1,033
50%
0,757
0,683
0,866
0,509
0,640
0,806
0,711
0,946
0,862
0,485
1,000
0,807
0,756
0,159
0,485
1,000
75%
0,753
0,650
0,741
0,499
0,640
0,653
0,693
0,929
0,862
0,445
0,987
0,716
0,71
0,159
0,445
0,987
100%
0,718
0,684
0,724
0,471
0,615
0,704
0,704
0,961
0,846
0,367
1,056
0,846
0,725
0,191
0,367
1,056
mdia
0,775
0,682
0,823
0,507
0,651
0,758
0,708
0,971
0,866
0,480
1,031
0,826
0,756
0,165
0,480
1,031
DAP
0,824
0,706
0,91
0,546
0,700
0,838
0,717
1,015
0,896
0,528
1,059
0,896
0,803
0,168
0,528
1,059
sy.x
1729
43
2035
812
35
197
716
34
1508
540
31
1159
- modelo 1: ln Pi = b0 + b1 ln Di; sendo (1) para DAP5 cm e i = 1,..., 315; (1a) para
5DAP<20 cm e i = 1,..., 244; e (1b) para DAP20 cm e i = 1,..., 71.
- modelo 2: ln Pi = b0 + b1 ln Di + b2 ln Hi; sendo (2) para DAP5 cm e i = 1,..., 315; (2a) para
5DAP<20 cm e i = 1,..., 244; e (2b) para DAP20 cm e i = 1,..., 71.
- modelo 3: Pi = b0 + b1 Di2Hi; sendo (3) para DAP0,05 m e i = 1,..., 315; (3a) para
0,05DAP<0,20 m e i = 1,..., 244; e (3b) para DAP 0,20 m e i = 1,..., 71.
- modelo 4: Pi = b0 D b1 H b2; sendo (1) para DAP5 cm e i = 1,..., 315; (1a) para 5DAP<20
cm e i = 1,..., 244; e (1b) para DAP20 cm e i = 1,..., 71.
Observada
equaes a & b
equao nica
782,7
768,2 [ -1,9 ]
907,7 [+16,0 ]
754,6 [ -3,6 ]
805,2 [ +2,9 ]
792,1 [ +1,2 ]
783,3 [ +0,1 ]
746,9 [ -4,6 ]
725,3 [ -7,3 ]
794,1
779,1 [ -1,9 ]
924,1 [ +16,4 ]
765,5 [ -3,6 ]
817,0 [ +2,9 ]
803,3 [ +1,2 ]
794,7 [ +0,1 ]
760,2 [ -4,3 ]
738,9 [ -7,0 ]
784,2
788,3 [ +0,5 ]
944,2 [ +20,4 ]
770,0 [ -1,8 ]
826,4 [ +5,4 ]
808,1 [ +3,1 ]
801,3 [ +2,2 ]
786,3 [ +0,3 ]
740,2 [ -5,6 ]
844,8
866,9 [ +2,6 ]
1052,4 [ +24,6 ]
835,4 [ -1,1 ]
900,5 [ +6,6 ]
876,6 [+3,8 ]
865,1 [ +2,4 ]
811,3 [ -4,0 ]
790,8 [ -6,4 ]
836,2
750,8 [ -10,2 ]
859,3 [ +2,8 ]
757,2 [ -9,4 ]
799,8 [ -4,4 ]
795,8 [ -4,8 ]
779,1 [ -6,8 ]
771,8 [ -7,7 ]
750,8 [ -10,2 ]
Bibliografia
Arajo, T.M. 1995. Investigao das Taxas de Dixido de Carbono Gerado em Queimadas na
Regio Amaznica. Tese de Doutorado, Universidade Estadual Paulista, Faculdade de
Engenharia de Guaratinguet, 212 p..
Brown, S., A.J.R. Gillespie e A.E. Lugo. 1989. Biomass Estimation Methods for Tropical
Forests with Applications to Forest Inventory Data. Forest Science, 35(4):881-902.
Carvalho Jr., J.A., J.M. Santos, J.C. Santos, M.M. Leito e N. Higuchi. 1995. A Tropical
Rainforest Clearing Experiment by Biomass Burning in the Manaus Region. Atmospheric
Environment 29(17):2301-2309.
Fearnside, P.M., N. Leal Filho e F.M Fernandes. 1993. Rainforest Burning and the Global
Budget: Biomass, Combustion Efficiency, and Charcoal Formation in the Brazilian
Amazon. J. of Geophysical Research, 98(D9):16733-16743.
Fearnside, P.M. 1996. Amazonian Deforestation and Global Warming: Carbon Stocks in
Vegetation Replacing Brazils Amazon Forest. Forest Ecology and Management 80:2134.
Foster Brown, I., D.C. Nepstad, I.O. Pires, L.M. Luz e A.S. Alechandre. 1992. Carbon
Storage and Land-use in Extractive Reserves, Acre, Brazil. Environmental Conservation
19(4):307-315.
Foster Brown, I., L.A. Martinelli, W. Wayt Thomas, M.Z. Moreira, C.A. Cid Ferreira e R.A.
Victoria. 1995. Uncertainty in the Biomass of Amazonian Forests: an Example from
Rondnia, Brazil. Forest Ecology and Management, 75:175-189.
Higuchi, N. e J.A. Carvalho Jr. 1994. Fitomassa e Contedo de Carbono de Espcies Arbreas
da Amaznia. Em: Anais do Seminrio Emisso x Seqestro de CO2 - Uma Nova
Oportunidade de Negcios para o Brasil:127-153.
Higuchi, N., J.M. dos Santos, M. Imanaga e S. Yoshida. 1994. Aboveground Biomass
Estimate for Amazonian Dense Tropical Moist Forests. Memoirs of the Faculty of
Agriculture, Kagoshima, 30(39):43-54.
Overman, J.P.M., H.J.L. Witte e J.G. Saldarriaga. 1994. Evaluation of Regression Models for
Above-ground Biomass Determination in Amazonia Rainforest. Forest Ecology and
Management, 10:207-218.
Saldarriaga, J.G., D.C. West, M.L. Tharp e C. Uhl. 1988. Long-term Chronosequence of
Forest Sucession in the Upper Rio Negro of Colombia and Venezuela. Journal of Ecology
76:938-958.
Salomo, R.P., D.C. Nepstad e I.C.G. Vieira. 1996. Como a Biomassa de Florestas Tropicais
Influi no Efeito Estufa. Cincia Hoje, 21(122):38-47.
Santos, J. dos. 1996. Anlise de Modelos de Regresso para Estimar a Fitomassa da Floresta
Tropical mida de Terra-firme da Amaznia Brasileira. Tese de Doutorado,
Universidade Federal de Viosa, 121 p..
Schroeder, P.E. e J.K. Winjum. 1995. Assessing Brazils Carbon Budget: II. Biotic Fluxes
and Net Carbon Balance. Forest Ecology and Management, 75(87-99).
Skole, D.L., W.H. Chomentowski, W.A. Salas e A.D. Nobre. 1994. Physical and Human
Dimensions of Deforestation in Amazonia. BioScience, 44(5):31-321.
Captulo 17
Cadeia de Markov para predizer a dinmica da floresta amaznica
17.1. Introduo:
Estudar a dinmica da floresta tropical mida amaznica, manejada ou no, um
grande desafio para os florestais. Os modelos clssicos de produo florestal foram
desenvolvidos para florestas temperadas e tm como principais variveis, o ndice de stio e
idade da rvore ou do povoamento (Sullivan e Clutter, 1972; Ferguson e Leech, 1978; Alder,
1980; Smith, 1983 e Clutter et al., 1983). Essas duas variveis so limitantes para o
desenvolvimento de modelos de produo para as florestas da Amaznia porque so
praticamente indisponveis para o setor florestal, num curto prazo. Apesar de inmeras
tentativas, por meio da dendrocronologia ou da datao com 1C, a determinao das idades
das inmeras espcies que ocorrem numa determinada rea, continua sendo um grande
obstculo para a cincia florestal.
Sem a idade da rvore ou do povoamento ou com muita dificuldade para obte-la, a
alternativa prognosticar a dinmica da floresta com o uso de parcelas permanentes. Na
Amaznia, entretanto, as parcelas instaladas e devidamente monitoradas so poucas, mal
distribudas e recentes (as mais antigas esto na Flona de Tapajs, desde 1978). Considerando
que as idades de rvores com DAP > 50 cm, na regio de Manaus, podem variar de 200 a 100
anos, segundo Chambers et al. (1998), 20-30 anos de observaes podem parecer insuficientes
para descrever, com confiana, a dinmica de uma floresta da Amaznia.
Apesar de todas essas dificuldades, aproximadamente 1 milho de hectares de floresta
amaznica so manejados, anualmente, para produo madeireira sob algum tipo de manejo
em regime de rendimento sustentvel. difcil imaginar como os empresrios florestais vo
planejar os ciclos de corte subseqentes, sem um modelo de produo. Se nada for feito, o
manejo florestal tomar a mesma forma da agricultura itinerante. A melhor sada para esta
situao usar modelos de curto prazo que dependem exclusivamente da situao
imediatamente anterior ao atual, tendo como objetivo a projeo apenas para uma situao
imediatamente posterior. Dentre os vrios modelos disponveis, o que melhor se ajusta s
caractersticas das florestas da Amaznia, a cadeia de Markov.
P = (p ij) =
i=1
i=2
i =3
.
.
i=m
j=1
p11
p21
p31
.
.
pm1
ij
j=2
p12
p22
p32
.
.
pm2
j=3
p1
p23
p33
.
.
pm3
......
......
......
......
.
.
......
j=m
p1m
p2m
p3m
.
.
pmm
No caso dos dados da parcela permanente do exemplo, vamos considerar 17 estados (i,
j = 1, 2, ...17), onde:
estado 1 = recrutamento (R)
estados de 2 a 16 = classes de dimetro. As classes de DAP so de 5-5 cm e vo de 10,
passando pela classe truncada DAP 75 at classe prxima depois de DAP 75. A
movimentao de uma classe para outra, no caso da classe DAP 75, pode ser uma rvore
com DAP = 78, em 2000, que passou para a classe seguinte (podendo ser DAP = 80 ou DAP
= 81), em 2004 ou tambm uma com DAP = 119, em 2000, que passou para a classe seguinte,
em 2004.
estado 17 = mortalidade (M)
1. Matriz A (Quadro 1) => transio entre a 1 ocasio (2000) e 2 ocasio (2004) => tabelas
dinmicas do Excel (V. Box). Daqui uns 10 anos, bem provvel que algum no veja
nenhuma importncia nas instrues contidas no Box por achar completamente obsoleta.
Hoje, em 2007, apesar deste recurso ser pouco conhecido pelos florestais, um poderoso e
prtico instrumento para organizar os dados. Quando se trabalha com parcelas permanentes,
re-medidas em vrias ocasies sucessivas, a tabela dinmica serve tambm para conferir o
arquivo de dados. A matriz A simtrica; portanto, h 19 colunas e 19 linhas.
1.1. => total 1 ocasio = (total, freqncia da linha 19 e coluna 19 ou f19,19 =6251)
menos recrutas (R, linha 3 e coluna 19 ou f3,19 = 396) = 5623
1.2. => total 2 ocasio = (total, f19,19 = 6251) menos mortas (M, f19,18 = 264) = 5987
2. Matriz B1 e B2 (Quadro 2) => probabilidades de mudanas de um estado (i) para outro (j).
A matriz de probabilidade repetida pra facilitar a multiplicao de matrizes no Excel.
Portanto B1 = B2.
2.1. Recrutas (R) => das 396 rvores recrutadas em 2004 => 385, 7 e 4,
respectivamente, foram recrutadas para a 1 classe (10<15), 2 (15<20) e 3 (20<25).
2.2. Probabilidades de 2.1. => 385/396, 7/396 e 4/396.
2.3. 1 classe (10<15) => das 2167 rvores que estavam na 1 classe na 1 ocasio
(2000) => na 2 ocasio (2004), 1869 permaneceram na 1 classe, 205 mudaram para a
2 classe, 2 passaram para a 3 classe e 91 morreram.
2.4. Probabilidades de 2.3. => 1869/2167, 205/2167, 2/2167 e 91/2167.
2.5. 2 classe (15<20) => das 1319 rvores que estavam na 2 classe na 1 ocasio
(2000) => na 2 ocasio (2004), 1126 permaneceram na 2 classe, 144 mudaram para a
3 classe, 1 passou para a 4 classe e 48 morreram.
2.6. Probabilidades de 2.5. => 1126/1319, 144/1319, 1/1319 e 48/1319.
3. Matriz de probabilidade 2 passos adiante (at 2004) => matriz de transio probabilstica
(Matriz B) elevada ao quadrado que resultar na Matriz C (Quadro 3). Se quiser 3 passos
adiante, a matriz de transio probabilstica ser elevada ao cubo.
3.1. Multiplicao de matrizes (B1*B2) => No Excel:
- blocar (passando o cursor em toda a sua extenso) um espao igual matriz
que ser multiplicada (Matriz B), ou seja, mesmo nmero de linhas e mesmo nmero
de colunas;
- ir ao menu Inserir, selecionar a opo Funo e escolher Matriz.Mult;
- definir matriz 1 (B1), blocando a matriz B;
- definir matriz 2 (B2), blocando novamente a matriz B e OK;
- truque pra ver o resultado (matriz C) => segurar juntos Ctrl, Shift e Enter
mantendo o cursor dentro da barra de funo (fx) que fica acima da planilha.
- Obs.: a matriz B no deve estar como frmula e sim como Somente Valores.
4. Projeo para 2008 => Matriz D (Quadro 4) =>
4.1. A multiplicao de matrizes (B1 e B2) no inclui a coluna TOTAL, portanto,
necessrio copi-la da Matriz A e col-la na Matriz C para facilitar o clculo da
freqncia esperada por classe (Matriz D);
4.2. A Matriz D calculada multiplicando a probabilidade de ocorrncia de rvores
em uma classe dois passos a diante (Matriz C) pelo nmero total de rvores daquela
classe. Ex.:
- classe 10<15 => C2*T2 = 0,8395 * 396 = 332,05
C3*T3 = 0,7439 * 2167 = 1612
- classe 15 < 20 => D2*T2 = 0,1071 * 396 = 42,39
D3*T3 = 0,1624 * 2167 = 351,81
D4*T4 = 0,7288 * 1319 = 961,24
e assim por diante para todas as classes.
4.3. O total da freqncia esperada por classe ou estado (que a projeo para 2008)
calculado da seguinte forma (dados da Matriz D):
- classe 10<15 => C2 + C3 = 332,05 + 1612 = 1944.
- classe 15<20 => D2 + D3 + D4 = 42,39 + 351,81 + 961,24 = 1355,5
e assim por diante para todas as classes.
4.4. Classe PRX. => esta classe criada apenas para descrever a dinmica das
rvores truncadas ao DAP 75 cm. No quadro com as freqncias esperadas (E) (5b)
a freqncia da classe PRX deve ser acrescentada classe DAP 75 cm. Portanto,
a freqncia esperada da classe DAP 75 cm deve ser somada da classe PROX:
- classe DAP 75 cm => Q19 + R19 = 11,56 + 4,407 = 15,963 (Quadro 5a)
5. Ajustes necessrios => a cadeia de Markov no faz projees do recrutamento. Portanto, h
necessidade de fazer ajustes para que a probabilidade de recrutamento das rvores em 2004
possa ser includa na projeo de 2008. Enquanto no tiver uma srie histrica de
recrutamento, o nico recurso usar o n de indivduos recrutados de uma ocasio para outra.
5.1. O ajuste feito com os dados do Quadro 5a: (prob do n de arv da 1 classe
prob da mortalidade da 1 classe) + (Total de recrutas de 2004 * projeo da 1 classe
para 2008). Ex.:
- classe 10<15 => (1944 86) + (396 * 0,9722) 2242,3
- classe 15<20 => (1355,5 47) + (396 * 0,0177) 1316
- classe 20<25 => (865,8 33) + (396 * 0,0101) 837
5.2. Para as classes onde no houve recrutamento em 2004, basta diminuir a prob do n
de arv da classe sem recrutamento prob da mortalidade dessa mesma classe. Ex.:
- classe 25<30 => 543,4 24 519
...
- classe DAP 75 cm => 15,96 - 3 13
6. Se 3 ocasies esto disponveis, o certo usar a mdia [ R = (R1+R2)/2 ], sendo que R1 o
n indivduos recrutados entre a 1 e 2 ocasio e R2 o n entre a 2 e 3 ocasio, ou seja,
seriam necessrios 3 inventrios.
7. Comparao entre freqncias esperadas (E), para 2008, fornecida pela Cadeia de Markov
e as freqncias observadas de fato em 2004 (Quadro 6) => teste qui-quadrado ( 2 ).
Neste exemplo, como o 2 tabelado com 13 graus de liberdade e p = 0,05 igual a
22,36, isso significa dizer que h fracas evidncias para afirmar que E seja diferente de O.
Usando p = 0,01, o valor de 2 igual a 27,69 e, do ponto de vista de estatstica, pode-se
afirmar que o teste no significante.
O certo seria usar um intervalo de tempo maior para fazer projees para um perodo
imediatamente posterior, para confirmar a eficincia de Markov. O exemplo foi usado para
comprovar que Markov eficiente para fazer projees da dinmica de uma floresta
manejada. Essa comprovao j tinha sido realizada em florestas no perturbadas (Rocha,
2001).
Bibliografia:
Acevedo, M.F. 1981. On Horns Markovian Model of Forest Dynamics with Particular Reference to
Tropical Forests. Theoretical Population Biology 19:230-250.
Alder, D. 1980. Forest Volume Estimation and Yield Prediction. V.2 Yield Prediction.
FAO Forestry Paper 22/2. 194 p.
Anderson, T.W. e L.A. Goodman. 1957. Statistical Inference about Markov Chains. Annals
of Mathematical Statistics 28:89-110.
Bierzychudek, P. 1982. The Demography of Jack-in-the-pulpit, a Forest Perennial that
Changes Sex. Ecol. Monographs 52(4):333-351.
Bruner, H.D. e J.W. Moser Jr.. 1973. A Markov Chain Approach to the Prediction of
Diameter Distributions in Uneven-aged Forest Stands. Can.J.For.Res. 3:409-417.
Buogiorno, J. e B.C. Michie. 1980. A Matrix Model of Unever-aged Forest Management.
Forest Science 26:609-625.
Chambers, J.Q., N. Higuchi e J.P. Schimel. 1998. Ancient Trees in Amazonia. Nature,
391:15-16.
Chiang, C.L. 1980. An Introduction to Stochastic Processes and their Applications. Robert E.
Krieger Publ. Co., Huntington, New York.
Clutter, J.L., J.C. Fortson, L.V. Pienaar, G.H. Brister e R.L. Bailey. 1983. Timber
Management: A Quantitative Approach. John Wiley and Sons, Inc. New York. 333p.
Enright, N. e J. Ogden. 1979. Applications of Transition Matrix Models in Forest Dynamics:
Araucaria in Papua New Guinea and Nothofagus in New Zealand. Australian J. of
Ecology 4:3-23.
Ferguson, I.S. e J.W. Leech. 1978. Generalized Least Squares Estimation of Yield Functions.
Forest Science 24:27-42.
Grossman, S.I. e J.E. Turner. 1974. Mathematics for the Biological Sciences. Macmillan Publ.
Co., Inc. New York. 512p.
Higuchi. N. 1987. Short-term Growth of an Undisturbed Tropical Moist Forest in the
Brazilian Amazon. Tese de Doutor. MSU. 129p.
Horn, H.S. 1975. Markovian Properties of Forest Succession. In: Ecology and Evolution of
Communities (M. Cody e J. Diamond, editores), pp.196-211. Harvard University Press.
Cambridge, Mass.
Morrison, D.F. 1976. Multivariate Statistical Methods. McGraw-Hill Inc.. 415p.
Peden, L.M., J.S. Williams e W.E. Frayer. 1973. A Markov Model for Stand Projection.
Forest Science 19:303-31.
Rocha, R.M. 2001. Taxas de recrutamento e mortalidade da floresta de terra-firme da bacia do
rio Cueiras na regio de Manaus-AM. Dissertao de mestrado CFT-INPA. 49p.
Shugart, H.H. 1984. A Theory of Forest Dynamics: The Ecological Forest Succession
Models. Springer-Verlag Inc. New York. 278p.
Shugart, H.H. e D.C. West. 1981. Long-term Dynamics of Forest Ecosystems. Am. Scientist
69:647-652.
Smith, V.G. 1983. Compatible Basal Area Growth and Yield Models Consistent with Forest
Growth Theory. Forest Science 29:279-288.
Sullivan, A.D. e J.L. Clutter. 1972. A Simultaneous Growth and Yield Model for Loblolly
Pine. Forest Science 18:76-86.
Usher, M.B. 1966. A Matrix Approach to the Management of Renewable Resources, with
Special Reference to Selection Forests. J. of Applied Ecology 3(2):355-367.
Usher, M.B. 1969. A Matrix Model for Forest Management. Biometrics, June:309-315.
Usher, M.B. 1979. Markovian Approaches to Ecological Succession. J. of Animal Ecology
48:41-426.
Box 1
1. Neste arquivo h as seguintes colunas: nome comum da espcie, DAP90, DAP97 e DAP04
2. Inserir trs novas colunas entre DAP90 e DAP97, entre DAP97 e DAP04 e depois de
DAP04 e nomear como CD1, CD2 e CD3, respectivamente.
3. Clicar em DADOS => FILTRAR => AUTO-FILTRO => apenas para a transio entre
1990 e 1997. Para a transio entre 1997e 2004, o procedimento o mesmo.
4. Identificar as recrutas => so clulas que aparecem em branco ou zero na coluna do
DAP90 em DAPs registrados na coluna DAP97 => clicar em DAP90 e procurar branco e
zero e nomear com R na prpria coluna DAP90 e na coluna CD1 atribuir o cdigo 1 =>
para todas as rvores nessas condies.
5. Calcular as freqncias das classes 10<15, 15<20 ... at 65 => continuar com o
FILTRAR nas colunas DAP90 e DAP97. Comear com 1990 clicando em DAP90 e ir para
PERSONALIZAR. Lembrar que a primeira classe (10<15) o segundo estado. Em
PERSONALIZAR, a primeira condio maior ou igual a 10 (digitando) e a segunda
menor do que 15 (digitando). Depois de OK, digitar em CD1 o nmero da classe (2, neste
caso). Repetir isso at a ltima classe ( 65), que ser a classe nmero 1.
6. Identificar as mortas => so clulas que aparecem em branco ou zero na coluna do
DAP97 e tinham DAPs na coluna DAP90 => clicar em DAP97 e nomear com M na prpria
coluna DAP97 e na coluna CD2 atribuir o cdigo 15 => para todas as rvores nessas
condies.
7. Repetir passo 5 para DAP97. Em DAP97 tem que incluir a classe 1 (PRX). Neste caso, o
trabalho tem que ser feito manualmente (no olho), ou seja, tem que olhar para as colunas
DAP90 e DAP97 e verificar quais rvores que estavam na classe 1 em 1990 e mudaram de
classe em 1997.
8. Ir pra DADOS, clicar em FILTRAR e retirar o AUTO-FILTRO.
9. Em DADOS, clicar em RELATRIOS DE TABELA E GRFICOS DINMICOS e
seguir as instrues lgicas.
10. Pra ter a tabela dinmica:
- arrastar CD1 at a coluna onde est escrito solte campos de linha aqui
- arrastar CD2 at a linha onde est escrito solte campos de coluna aqui
- arrastar DAP97 em cima de solte itens de dados aqui
Quadro 1: Matriz (A) => transio do estado i para o estado j durante o perodo de 2000 a 2004.
A
estados
10 < 15
15 < 20
20 < 25
25 < 30
30 < 35
35 < 40
40 < 45
45 < 50
50 < 55
55 < 60
60 < 65
65 < 70
70 < 75
>=75
PROX
Total
385
396
10 < 15
1869
205
91
2167
15 < 20
1126
144
48
1319
20 < 25
711
104
33
853
25 < 30
419
59
24
502
30 < 35
276
59
26
361
35 < 40
195
23
10
228
40 < 45
119
27
155
10
45 < 50
72
14
93
11
50 < 55
36
46
12
55 < 60
28
41
13
60 < 65
19
28
14
65 < 70
12
17
15
70 < 75
15
18
16
>=75
15
27
17
PROX
18
19
Total
2254
1338
861
524
339
254
143
99
51
35
25
21
19
17
264
6251
Quadro 2: Matriz B (B1 e B2) transio probabilstica do estado i para o estado j durante o perodo de 2000 a 2004.
A
1
estados
T
Total
10 < 15
15 < 20
20 < 25
25 < 30
30 < 35
35 < 40
40 < 45
45 < 50
50 < 55
55 < 60
60 < 65
65 < 70
70 < 75
>=75
PROX
0,9722
0,0177
0,0101
10 < 15
0,8625
0,0946
0,0009
15 < 20
0,8537
0,1092
0,0008
20 < 25
0,8335
0,1219
0,0047
0,0012
25 < 30
0,8347
0,1175
30 < 35
0,7645
0,1634
0,1
35 < 40
0,8553
0,1009
40 < 45
0,7677
0,1742
0,0065
0,1
10
45 < 50
0,7742
0,1505
0,1
11
50 < 55
0,7826
0,1522
0,1
12
55 < 60
0,6829
0,1463
0,0244
0,1
13
60 < 65
0,6786
0,2857
14
65 < 70
0,7059
0,2353
0,1
15
70 < 75
0,8333
0,11
0,1
16
>=75
0,56
0,259
0,2
17
PROX
18
19
Total
Quadro 3: Matriz C ou [B]2 - Matriz de transio probabilstica dois passos adiante (at 2008)
A
1
estados
T
Total
10<15
15<20
20<25
25<30
30<35
35<40
40<45
45<50
50<55
55<60
60<65
65<70
70<75
>=75
PROX
0,0000
0,8385
0,1071
0,0112
0,0012
5E-05
1E-05
0,042
396
10<15
0,0000
0,7439
0,1624
0,0119
0,0002
4E-06
1E-06
0,0000
0,04
2167
15<20
0,0000
0,7288
0,1842
0,0146
0,0006
0,0001
0,0000
0,035
1319
20<25
0,0000
0,6948
0,2034
0,0218
0,0008
0,0019
0,0002
8E-06
0,0000
0,038
853
25<30
0,0000
0,6967
0,188
0,0192
0,0000
0,048
502
30<35
0,0000
0,5845
0,2647
0,0165
0,0000
0,062
361
35<40
0,0000
0,7315
0,1637
0,0176
0,0007
0,0000
0,043
228
40<45
0,0000
0,5894
0,2686
0,0362
0,001
0,0000
0,053
155
10
45<50
0,0000
0,5994
0,2344
0,0229
0,0000
0,068
93
11
50<55
0,0000
0,6125
0,223
0,0223
0,0037
0,0000
0,073
46
12
55<60
0,0000
0,4664
0,1992
0,0757
0,0057
0,0000
0,107
41
13
60<65
0,0000
0,4605
0,3956
0,0672
0,0000
0,041
28
14
65<70
0,0000
0,4983
0,3622
0,026
0,0000
0,055
17
15
70<75
0,0000
0,6944
0,154
0,0288
0,067
18
16
>=75
0,0000
0,3086
0,1440
0,103
27
17
PROX
18
19
Total
estados
10 < 15
15 < 20
20 < 25
25 < 30
30 < 35
35 < 40
40 < 45
45 < 50
0,000
332,056
42,397
4,454
0,493
0,019
0,005
16,577
10 < 15
0,000
1611,980
351,813
25,773
0,399
0,009
0,002
0,000
86,023
15 < 20
0,000
961,240
242,958
19,245
0,793
0,169
0,000
46,595
20 < 25
0,000
592,639
173,492
18,615
0,654
1,601
0,174
0,006
0,000
32,818
25 < 30
0,000
349,723
94,353
9,643
0,000
24,281
30 < 35
0,000
211,014
95,569
5,952
0,000
22,466
35 < 40
0,000
166,776
37,329
4,006
0,148
0,000
9,740
8,239
L
50 <
55
M
55 <
60
N
60 <
65
O
65 <
70
P
70 <
75
>=75
PROX
Total
40 < 45
0,000
91,361
41,632
5,615
0,152
0,000
10
45 < 50
0,000
55,742
21,795
2,130
0,000
6,332
11
50 < 55
0,000
28,174
10,259
1,024
0,171
0,000
3,372
12
55 < 60
0,000
19,122
8,169
3,103
0,235
0,000
4,371
13
60 < 65
0,000
12,893
11,076
1,882
0,000
1,149
14
65 < 70
0,000
8,471
6,157
0,444
0,000
0,928
15
70 < 75
0,000
12,500
2,778
0,519
1,204
16
>=75
0,000
8,333
3,889
2,778
17
PROX
18
19
Total
1944,036
1355,450
865,823
543,352
324,803
272,641
136,419
101,555
55,739
31,663
22,086
22,820
20,775
11,556
4,407
266,874
Prob
Arv
1944,04
1355,45
865,82
543,35
324,80
272,64
136,42
101,55
55,74
31,66
22,09
22,82
20,77
15,96
Prob
Mort
86,02
46,60
32,82
24,28
22,47
9,74
8,24
6,33
3,37
4,37
1,15
0,93
1,20
2,78
proj
0,97
0,02
0,01
Quadro 5b: Freqncias esperadas (E) para 2008 incluindo ajustes feitos para o recrutamento
(R)
Estado
CD
10 < 15
15 < 20
20 < 25
25 < 30
30 < 35
35 < 40
40 < 45
45 < 50
50 < 55
55 < 60
60 < 65
65 < 70
70 < 75
>=75
Prxima
Total
rvores
2000
2167
1319
853
502
361
228
155
93
46
41
28
17
18
27
5855
2004 (O)
2254
1338
861
524
339
254
143
99
51
35
25
21
19
17
7
5987
2008 (E)
2243,0
1315,9
837,0
519,1
302,3
262,9
128,2
95,2
52,4
27,3
20,9
21,9
19,6
13,2
5857,6
Mortalidade
2004
2008
(O)
(E)
91
86,02
48
46,60
33
32,82
24
24,28
26
22,47
10
9,74
8
8,24
7
6,33
3
3,37
6
4,37
1
1,15
1
0,93
1
1,20
5
2,78
264
250
estado
10 < 15
15 < 20
20 < 25
25 < 30
30 < 35
35 < 40
40 < 45
45 < 50
50 < 55
55 < 60
60 < 65
65 < 70
70 < 75
>=75
Total
O
2254
1338
861
524
339
254
143
99
51
35
25
21
19
24
5987
E
2243
1316
837
519
302
263
128
95
52
27
21
22
20
13
5859
2
0,05
0,37
0,69
0,05
4,45
0,30
1,71
0,15
0,04
2,18
0,79
0,04
0,02
2,08
20,13
P