Você está na página 1de 442

Amostragem em Inventário

Florestal

Waldenei Travassos de Queiroz

BELÉM
2012
Ministério da Educação
Ministro: Fernando Haddad

Universidade Federal Rural da Amazônia


Reitor: Sueo Numazawa
Vice-Reitor: Paulo de Jesus Santos

Editoração
Marly Maklouf dos Santos Sampaio

CoMISSÃo Editorial
Gracialda Costa Ferreira
Israel Hidenburgo Aniceto Cintra
Maria Cristina Manno
Moacir Cerqueira da Silva
Sérgio Antonio Lopes de Gusmão

Equipe Editorial
Inácia Faro Libonati
Adriana Amaro
Roseneli Lima

Capa
Waldenei Travassos de Queiroz
Oberdan Müller Moraes das Flores

ENDEREÇO
Av. Tancredo Neves, 2501, CEP: 66077-830- Montese
E-mail: editora@ufra.edu.br

Queiroz, Waldenei Travassos de


Amostragem em inventário florestal / Waldenei
Travassos de Queiroz. -- Belém: Universidade
Federal Rural da Amazônia, 2012.

441 p.: il.

ISBN 978-85-7295-070-1

1. Inventário florestal. I. Título.

CDD - 634.928
À Izabel, minha esposa.
Aos meus filhos Anderson e Alex,
às minhas noras Lorena e Alessandra.
Aos meus pais Wagner e Erecina (in memoriam)
Agradecimentos

À Marly Maklouf dos Santos Sampaio, Editora Executiva da


UFRA, pelo empenho na publicação deste livro, assim como à
Sra. Inácia Faro Libonati e às Srtas. Adriana Amaro e Roseneli
Lima pela cuidadosa revisão do texto final.
Ao Serviço Florestal Brasileiro, na pessoa do Engenheiro
Florestal Joberto de Freitas Veloso, pelo convite para participar
dos eventos que culminaram na construção do Projeto do
Inventário Florestal Nacional do Brasil.
Agradecemos ao Professor Sylvio Péllico Netto da UFPR
e aos professores da ESALQ/USP: Cassio Roberto de Melo
Godoi, Humberto de Campos e Frederico Pimental Gomes (in
memoriam), pelos conhecimentos que recebemos na área da
teoria da amostragem, em nossa formação pós-graduada.
Somos gratos aos revisores deste trabalho: Ao Estatístico
Edson Marcos Leal Soares Ramos, Doutor em Estatística e
Professor da Faculdade de Estatística da Universidade Federal
do Pará, e ao Engenheiro Florestal Fernando Cristóvam da Silva
Jardim, Doutor em Ciências Florestais e Professor Associado da
UFRA. Agradecemos aos Estatísticos: João Guimarães Pinheiro
e Mário Diego Valente da Rocha, bem como ao Engenheiro
Florestal Oberdan Müller Moraes das Flores, pelas sugestões e
críticas; e a todos que nos incentivaram na tarefa de oferecer aos
usuários da teoria da amostragem aplicada ao planejamento de
inventários florestais uma obra que reúne algumas experiências
condizentes, principalmente, com as condições impostas pelos
tipos florestais ocorrentes no Brasil.
Agradecemos, de forma especial, ao Professor Lúcio
Salgado Vieira (in memoriam), mestre na arte real que fundamenta
as bases das relações humanas, que pelos seus exemplos nos
ensinou a descobrir os segredos da nossa missão de vida.
Se a matemática é o pincel com que Deus desenhou o
universo, então, a estatística é a ferramenta humana criada para
tentar entendê-lo!

Waldenei Travassos de Queiroz


Sumário

Prefácio...............................................................................13

APRESENTAÇÃO....................................................................15

Capítulo 1 - Introdução ao inventário


florestal ...................................................................................17

Capítulo 2 - Inventário e manejo florestal......... 23

Capítulo 3 - Fundamentos de estatística............... 29


3.1 Definições.....................................................................31
3.2 Ponto amostral e espaço amostral................... 31
3.3 Variável aleatória......................................................32
3.4 Esperança matemática.............................................32
3.5 Distribuição de probabilidade..............................33
3.5.1 Função de probabilidade de variáveis discretas....... 33
3.5.2 Função densidade de probabilidade
de variáveis contínuas..................................................34
3.5.3 Função de distribuição acumulada ou
função de distribuição..................................................34
3.5.4 Distribuição binomial....................................................35
3.5.5 Distribuição de Poisson...............................................37
3.5.6 Distribuição normal.......................................................39
3.5.7 Distribuição de c2..........................................................43
3.5.8 Distribuição “t” de Student .........................................46
3.5.9 Distribuição “F” de Snedecor......................................50

Capítulo 4 - Amostragem simples ao acaso.......... 53


4.1 Valores populacionais e estimadores.............. 57
4.2 Amostragem simples ao acaso para
proporções e porcentagens...............................71
4.2.1 Valores populacionais, estimadores e
dimensionamento da amostra..............................................73

Capítulo 5 - Amostragem estratificada................. 79


5.1 Valores populacionais e estimadores
por estrato..................................................................83
5.2 Valores populacionais e estimadores
considerando todos os estratos...................... 87
5.3 Precisão da amostra estratificada em
relação à amostra simples ao acaso................ 95
5.4 Inventário florestal apresentando
subpopulações com diferentes
intensidades de amostragem.............................. 112

Capítulo 6 - Amostragem sistemática................... 117


6.1 Variância da média.....................................................122
6.2 Precisão da amostra sistemática
comparada à amostra simples ao acaso......... 124

Capítulo 7 - EstimativaS por razão.........................137


7.1 EstimativaS por razão com
igual probabilidade..................................................139
7.2 EstimativaS por razão considerando
probabilidade proporcional (AAP) à
variável auxiliar (x)..................................................149
7.3 EstimativaS por razão: amostragem
inversa com probabilidade proporcional
à variável auxiliar x (Aipp) ....................................156
7.4 Estimativas por razão considerando a
amostragem estratificada . ................................157
7.5 Dupla amostragem: fases dependentes......... 170
7.6 Comparação de dois índices
ou duas razões.........................................................175
Capítulo 8 - EstimativaS por regressão.............. 181
8.1 Parâmetros populacionais e estimadores.... 183
8.2 Estimativas por regressão considerando
a amostra estratificada ao acaso..................... 202

Capítulo 9 - Amostragem por conglomerado.... 231


9.1 Amostragem por conglomerados
em estágio único.......................................................235
9.1.1 Parâmetros populacionais e estimadores................ 235
9.2 Amostragem por conglomerados em
estágio único com unidades de
grandezas desiguais..............................................241
9.2.1 Parâmetros populacionais e estimadores................ 241
9.3 Amostragem por conglomerados em
estágio único pelas proporções......................254
9.3.1 Valores populacionais e estimadores.......................255
9.4 Amostragem por conglomerados
em dois estágios.......................................................261
9.4.1 Componentes de variâncias no modelo
inteiramente ao acaso . ..............................................261
9.4.2 Parâmetros populacionais e estimadores................ 267
9.4.3 Ocorrência de estimativa negativa do componente
de variância entre conglomerados Vˆe ( y ).)................... 280
9.5 Amostragem por conglomerados em dois
estágios com grandezas desiguais.................. 295
9.5.1 Valores populacionais e estimadores.......................295
9.6 Conglomerados em dois estágios: análise
estatística considerando a ocorrência de
tipologias diferentes na subparcela............. 300
9.6.1 Valores populacionais e estimadores.......................301
9.7 Amostragem por conglomerados em dois
estágios: análise estatística considerando
a ocorrência de uma variável auxiliar............ 305
9.7.1 Valores populacionais e estimadores.......................306
9.8 Amostragem por conglomerados em dois
estágios pelas proporções.................................322
9.8.1 Valores populacionais e estimadores.......................322
9.9 Amostragem por conglomerados em dois
estágios pelas proporções com grandezas
desiguais (Mi )..............................................................326
9.9.1 Valores populacionais e estimadores.......................326
9.10 Estruturas de conglomerados em
inventários florestais........................................329
9.11 Amostragem por conglomerados em
três estágios............................................................339
9.11.1 Valores populacionais e estimadores..................... 341
9.11.2 Parâmetros populacionais e seus estimadores
através da análise de variância................................343

Capítulo 10 - Inventário florestal contínuo.... 363


10.1 Método de análise de parcelas subdivididas....367
10.2 Modelo de amostragem com
substituição parcial.............................................384
10.2.1 Estimador ASP de µ x e sua variância V ( µˆ x ) ...........385
10.2.2 Estimador ASP de µ y e sua variância V ( µˆ y ) .......... 389
10.2.3 Covariância entre os estimadores ASP µ̂ x e µ̂ y .... 390
10.2.4 Estimador ASP de µ d e sua variância V ( µˆ d ).......... 391

Capítulo 11 - Forma e tamanho das


unidades de amostra....................................................403
11.1 Métodos para obter o tamanho ideal............ 408

Considerações Finais...................................................413

Referências......................................................................419

Glossário..........................................................................425

Anexo...................................................................................435
Prefácio

O livro Amostragem em Inventário Florestal foi elaborado


para servir como um guia prático para profissionais e estudantes
de graduação e pós-graduação que necessitam dos conhecimen-
tos e da teoria de estatística. Sua forma de abordagem apresenta
uma grande revisão dos conhecimentos básicos de probabilidade
e estatística, podendo, desta forma, ser utilizado como texto em
diversos cursos de graduação e pós-graduação, como por exem-
plo, cursos de Engenharia Florestal, Agronomia e Estatística.
De fato, o livro serve como instrumento para o aprimora-
mento das análises dos levantamentos florestais. Em seus ca-
pítulos são abordadas as mais importantes técnicas de amos-
tragem: Simples ao acaso, Estratificada, Sistemática e por Con-
glomerados. Cursos de Amostragem são cada vez mais comuns
em empresas e instituições de pesquisa. Assim, pensando na
diversidade de aplicações dos conhecimentos advindos dessas
técnicas, esta obra mostra-se como uma contribuição ao assun-
to com a profundidade e o rigor técnico necessários.
Além disso, como o Inventário Nacional do Brasil come-
çará a ser executado neste início de década, utilizando o proce-
dimento por Conglomerados, a obra Amostragem em Inventá-
rio Florestal configura-se como um importante suporte técnico
àqueles que irão executar esta tarefa, pois é evidente que o In-
ventário Nacional do Brasil não será tratado por meio de uma
simples análise, visto a grande diversidade florística e extensão
territorial brasileira. Desta forma, as técnicas abordadas no livro,
como por exemplo, as análises associadas de estimativas por
razão e por regressão, poderão ser melhores compreendidas.
A partir da experiência do autor em procedimentos envol-
vendo a Amostragem em Inventário Florestal é possível ob-
servar, no texto, a boa qualidade dos exemplos e dos exercícios
resolvidos, além disso, o livro apresenta uma coleção de técni-
cas e metodologias estatísticas reunidas numa só obra. Desta
forma, professores, pesquisadores e usuários podem, então,
a partir deste livro compreender e implementar cada uma das
técnicas e ferramentas abordadas facilmente. Finalmente, esta
obra pode ser destinada a todos aqueles que utilizam e estudam
as técnicas de amostragem e seus benefícios nas diversas áre-
as de conhecimento.

Prof. Dr. Edson Marcos Leal Soares Ramos


Apresentação

O objetivo deste livro é contribuir com conhecimentos no


ensino de teoria de amostragem e no planejamento estatístico
de inventários florestais. É importante que, além de servir como
livro texto para os estudantes, seja também um instrumento para
o aprimoramento das análises dos levantamentos florestais.
O Inventário Nacional do Brasil, que começará a ser execu-
tado neste início de década, utilizará o processo de amostragem
por conglomerados. É evidente que não se trata de uma análi-
se simples, pois ocorrerão inúmeras situações a serem enfren-
tadas, visto a grande diversidade florística, extensão territorial,
entre outros. Assim sendo, análises associadas de estimativas
por razão e por regressão podem ser empregadas quando os
conglomerados possuírem tamanhos ou números diferentes de
subparcelas.
O uso de variáveis auxiliares no processamento estatís-
tico, além de permitir ganho de precisão, facilita a análise da
variável resposta de interesse por tipologia florestal, onde a área
de ocorrência da vegetação pode ser considerada como uma
covariável.
A análise de dados proveniente do uso do processo de
amostragem por conglomerados, por meio da subparcela, preci-
sa ser mais discutida, visto a possibilidade da existência de de-
pendência entre as subparcelas. Um procedimento alternativo é
efetuar a análise considerando o conglomerado como uma uni-
dade de observação, ou seja, obter as estimativas dos parâme-
tros a partir da quantidade correspondente à soma dos valores
observados nas subparcelas dentro de cada conglomerado.
Para os estudantes terem um melhor entendimento da
amostra por conglomerados, no sentido de aferir a sua eficácia,
foi apresentada a dedução teórica do processo de obtenção dos
componentes de variância entre os conglomerados e entre as
subparcelas dentro de cada conglomerado.
Os componentes de variância são importantes no cálcu-
lo do coeficiente de correlação intraconglomerado. Este coefi-
ciente, além de medir o grau de dependência das subparcelas
dentro dos conglomerados, avalia a precisão desse processo de
amostragem em relação à amostra simples ao acaso. É mostra-
do exercício sobre as diversas fórmulas do coeficiente de corre-
lação e do cálculo dos componentes de variância, visando facili-
tar as suas interpretações.
Do ponto de vista matemático, é indispensável ter algumas
noções de álgebra linear e cálculo diferencial e o conhecimento
de determinação de máximos e mínimos condicionados, usando,
quando necessário, o método dos multiplicadores de Lagrange.
Em relação à experiência em métodos estatísticos, o livro pressu-
põe o conhecimento prévio de esperança matemática, de medi-
das de tendência central, de medidas de dispersão e as distribui-
ções: normal, “t” de Student, c 2 , “F” de Snedecor, além de limites
de confiança, regressão linear simples e análise de variância.
O autor, no sentido de buscar o aperfeiçoamento do livro
“Amostragem em Inventário Florestal” e, assim, atender às de-
mandas acadêmicas, coloca-se à disposição para o recebimen-
to de críticas e sugestões.
Capítulo 1

INTRODUÇÃO AO INVENTÁRIO FLORESTAL

Define inventário florestal, mostrando a sua importância


para a formulação de planos de utilização dos produtos flores-
tais, manejo sustentado integrado da floresta, bem como para
alicerçar propostas de planos de desenvolvimento e política flo-
restal de caráter regional ou nacional. Apresenta um histórico
resumido sobre o inventário florestal no Brasil, destacando a re-
alização e os principais objetivos do Inventário Florestal Nacio-
nal Brasileiro.
Introdução ao inventário florestal

Inventário florestal é o ramo da ciência florestal que visa


avaliar as variáveis qualitativas e quantitativas da floresta e suas
inter-relações, assim como dinâmicas de crescimento e suces-
são florestal, servindo de base para a formulação de planos de
utilização dos produtos florestais, manejo sustentado integrado
da floresta, bem como para alicerçar propostas de planos de de-
senvolvimento e política florestal de caráter regional ou nacional.
No sentido mais amplo, o inventário florestal pode, tam-
bém, até ser planejado para avaliar outras funções da floresta
como, por exemplo, as recreativas, a exploração de bacias hi-
drográficas, da vida silvestre e outras possibilidades de uso do
ecossistema florestal. Péllico Netto e Brena (1997) apresentam
uma classificação dos inventários florestais em diversos tipos
de acordo com seus objetivos, abrangência, forma de obtenção
dos dados, abordagem da população no tempo e grau de deta-
lhamento dos resultados.
O inventário florestal para fins de manejo florestal deve
ser planejado tal que possa obter e interpretar os diversos pa-
râmetros estruturais da floresta e suas inter-relações, objetivan-
do subsidiar a definição dos tratamentos silviculturais e outras
operações a serem executadas para obter a utilização ecológica
e econômica, através da produção sustentável e contínua dos
benefícios diretos e indiretos da floresta em prol da sociedade
regional.
Na Amazônia brasileira, segundo SUDAM (1974), os pri-
meiros trabalhos técnicos sobre inventário florestal tiveram início
na década de 50 por meio dos levantamentos realizados pela
missão FAO, que servia junto à Superintendência do Plano de
Valorização Econômica da Amazônia - SPVEA, antecessora da
atual Superintendência do Desenvolvimento da Amazônia - SU-
DAM. Infelizmente, esses trabalhos não foram suficientemente

19
Amostragem em inventário florestal Waldenei Travassos de Queiroz

divulgados, e os artigos que chegaram a ser publicados foram


em número reduzido de volumes e rapidamente esgotados.
Em termos de levantamentos de recursos naturais, no
campo de inventário florestal de reconhecimento, a Amazônia
ocupa uma posição relevante, visto os inúmeros programas exe-
cutados na Amazônia brasileira, tendo-se entre os principais as
pesquisas do Projeto RADAMBRASIL, os trabalhos desenvol-
vidos pelo programa Polamazônia, os inventários executados
para aprovação e instalação de projetos industriais, através da
política de incentivos fiscais coordenada pela SUDAM, assim
como os diversos levantamentos florestais realizados pelos ór-
gãos públicos estaduais e federais.
Para Rollet e Queiroz (1978), os dois maiores inventários
florestais de reconhecimento realizados na Amazônia brasileira
são os da FAO (1956 – 1961) e os do Projeto RADAMBRASIL
(1968 – 1977). O programa FAO foi dedicado, principalmente, ao
estudo de uma região situada ao sul do rio Amazonas, entre os
rios Madeira e Capim, em uma faixa de 150 km de largura por
1.500 km de comprimento, em direção oeste-leste, tendo sido
estudadas 1.388 unidades de amostra de 1ha, abertura de 4.225
km de transectos, abrangendo a enumeração de 155.001 árvo-
res, resultando em média 112 árvores por hectare, considerando
os diâmetros à altura do peito (DAP) acima de 25 cm. O Proje-
to RADAMBRASIL abrangeu toda a bacia amazônica brasileira
com mais de 2.000 ha (amostra) levantados.
Nos anos de 1980 a 1982, no Brasil, foi realizado o inven-
tário nacional dos reflorestamentos e nos anos de 1981 a 1984 o
inventário das florestas naturais, mas não abrangendo a região
Amazônica. Mais recentemente, os estados do Rio Grande do
Sul, Minas Gerais e Santa Catarina realizaram os seus inventá-
rios estaduais.

20
Introdução ao inventário florestal

O território brasileiro possui uma área aproximada de 526


milhões de hectares de florestas naturais, com ocorrência de
49% na Amazônia (350.861 km2), 10 % de Caatinga (52.269 km2),
24% de Cerrado (91.019 km2), 13% Mata Atlântica (30.167 km2),
2% Pantanal (2.679 km2), 2% Pampa (2.679 km2) e 6,6 milhões
de florestas plantadas. O Brasil não pode prescindir de estabe-
lecer um sistema de Inventário Florestal Nacional (IFN), visando
estabelecer as condições técnicas e científicas necessárias para
adoção de políticas públicas que resultem simultaneamente no
desenvolvimento econômico, social e na conservação ambiental.
O Serviço Florestal Brasileiro (SFB) elaborou, com a partici-
pação das comunidades técnicas, científicas em geral, o projeto
do Inventário Florestal Nacional (IFN), o qual utilizará o processo
de amostragem por conglomerado e deverá iniciar a sua opera-
cionalização em 2011. E dentre os objetivos do IFN, destacam-se:

1) periodicamente, determinar e monitorar a cobertura flo-


restal brasileira;
2) caracterizar e monitorar a diversidade da vegetação ar-
bórea dos diferentes biomas brasileiros;
3) quantificar e qualificar os recursos madeiráveis, pros-
pectar os recursos não madeiráveis e a qualidade dos
ecossistemas por meio de indicadores;
4) determinar as mudanças da cobertura florestal ao longo
do tempo;
5) gerar informações sobre o uso e importância da floresta
para as populações de seu entorno;
6) gerar informações sobre áreas de preservação perma-
nente e fragmentos de vegetação naturais;
7) gerar informações sobre uso e a conservação das flores-
tas por meio de indicadores anuais;

21
Amostragem em inventário florestal Waldenei Travassos de Queiroz

8) fornecer informações periodicamente sobre as florestas


brasileiras, agrupadas em diferentes unidades políticas,
administrativas e de mapeamento, tais como: biomas,
regiões fitoecológicas, Unidades da Federação e regi-
ões geográficas, para subsidiar planos de desenvolvi-
mento e de uso racional das florestas e seus serviços
ambientais, bem como programas de revitalização de
áreas degradadas e silvicultura com espécies nativas.

É importante frisar que os objetivos do IFN exigem a aplica-


ção de modelagem estatística de larga amplitude metodológica
e, na conjuntura atual de desenvolvimento do setor florestal bra-
sileiro, é importante investir na formação de recursos humanos
para a pesquisa, objetivando delinear sistemas de inventários flo-
restais para apoiar as demandas do IFN e produzir delineamen-
tos para alicerçar a elaboração de planos de manejo integrado de
rendimento sustentável para os recursos florestais do país.

22
Capítulo 2

INVENTÁRIO E MANEJO FLORESTAL

Mostra uma visão da aplicação do inventário florestal nas


áreas de silvicultura e manejo florestal considerando a comple-
xidade da diversidade florística das florestas tropicais amazôni-
cas, bem como outros elementos importantes que fazem parte
da estrutura de um inventário florestal direcionado à elaboração
de planos de manejo para florestas naturais, assim como apre-
senta alguns componentes que, obrigatoriamente, devem ser
considerados no planejamento de inventários para atender tal
fim.
Inventário e manejo florestal

Manejo florestal e Silvicultura são segmentos da ciência


que estudam os princípios, técnicas e normas que visam organi-
zar as ações necessárias para delinear e ordenar os fatores da
produção florestal, maximizando a produtividade e a eficiência.
Produção contínua e sustentável também significa admitir
que a floresta produz outros benefícios, além da madeira, depre-
endendo-se que o manejo florestal deve ter como objetivo princi-
pal o atendimento da demanda de madeira e de outros produtos
e serviços florestais, maximizando a renda sem comprometer a
cobertura florestal necessária à proteção dos solos, mananciais,
biodiversidade e outras funções reguladoras da floresta.
Manejar significa administrar os recursos florestais, sendo
necessário, para atingir uma boa administração, coletar, analisar
e interpretar os diversos parâmetros dendrométricos, sociais,
ecológicos e econômicos; estabelecer metas, programar ações
e, assim, atingir os resultados esperados. Dessa forma, compete
ao inventário florestal o suporte técnico e científico necessário
ao silvicultor, para que sejam atingidos os objetivos propostos.
Por outro lado, deve-se considerar que, além da complexi-
dade da diversidade florística das florestas tropicais amazônicas,
existem outros elementos importantes que devem fazer parte
da estrutura de um inventário florestal direcionado à elaboração
de planos de manejo de florestas naturais. Alguns componentes
que, obrigatoriamente, devem ser considerados no planejamen-
to de inventários para atender tal fim, podem ser:

a) componentes ecológicos

Essas informações referem-se às associações inter e intra-


específicas, que são as responsáveis pela dinâmica de cresci-
mento e sucessão da floresta, as quais podem ser detectadas e

25
Amostragem em inventário florestal Waldenei Travassos de Queiroz

analisadas no inventário florestal através da análise dos vários


índices de associações fitossociológicos existentes na literatura
florestal. Esses índices são aqueles relacionados com a impor-
tância ecológica das espécies na área em estudo.
A análise dos componentes ecológicos, atualmente nos in-
ventários florestais regionais, basicamente é interpretada pelo
Índice do Valor de Importância das Espécies, o qual agrega os
seguintes fatores:

a1) abundância por espécie: número de árvores amostrado


por espécie dividido pelo número total de árvores ocor-
rentes;
a2) frequência relativa: número de unidades de amostra
que contém a espécie dividido pelo número total de uni-
dades de amostra;
a3) dominância: a área basal de uma espécie dividida pela
área basal da floresta amostrada;

b) componentes florísticos

Referem-se à composição botânica da área em estudo. O


inventário florestal deverá ser dimensionado tal que assimile a
ocorrência de todas as espécies existentes na área. As informa-
ções sobre a composição florística, geralmente, são computa-
das através da relação entre o número de espécies encontradas
em função do tamanho da área amostral. O tamanho da amostra
ideal a ser levantada no inventário florestal, para definir a estru-
tura florística, deve ser aquele em que, aumentando-se a área
amostrada, a probabilidade de ocorrer novas espécies é pratica-
mente nula.

26
Inventário e manejo florestal

c) componentes dasométricos

São aqueles que explicam as relações existentes entre as


diversas variáveis dendrométricas das quais, através da teoria
de regressão, são obtidas diversas equações, principalmente as
específicas para cubagem das árvores; relações hipsométricas
e distribuições diamétricas.

d) componentes de estocagem

Os inventários florestais, em função da estrutura diamé-


trica, estimam a existência de estocagem suficiente de mudas,
varas e arvoretas das espécies. Essas informações visam veri-
ficar se, com a retirada de árvores com dimensões comerciais,
o estoque de árvores com dimensões menores será suficien-
te para garantir a perpetuação das espécies em quantidade e
qualidade. A distribuição diamétrica por espécie fornecerá essas
informações.
Dizem respeito também à determinação da estocagem de
árvores porta-sementes na floresta, para que no projeto de ma-
nejo florestal, haja a possibilidade de definir as árvores que de-
verão permanecer na área, de modo a garantir a perpetuação de
espécies de interesse.

e) componentes qualitativos

Caracterizam a configuração qualitativa dos fustes das ár-


vores com relação à sua forma, aspecto de tortuosidade e sani-
dade, entre outras.

27
Capítulo 3

FUNDAMENTOS DE ESTATÍSTICA

Contempla definições, conceitos e aplicações práticas im-


portantes no campo da estatística visando dar suporte ao enten-
dimento da teoria de amostragem. Aborda os seguintes temas:
ponto amostral e espaço amostral; variáveis aleatórias discretas
e contínuas; esperança matemática; função de probabilidade de
variáveis discretas e contínuas. Apresenta as distribuições: bino-
mial, Poisson, normal, c2, “t” de Student e “F” de Snedecor.
Fundamentos de estatística

3.1 Definições

Estatística é a matemática aplicada que estuda dados ori-


ginados de observações.
A Estatística estuda métodos científicos para o planeja-
mento de coleta, organização, resumo, apresentação e análise
de dados, gerando conclusões para subsidiar a tomada de de-
cisões.
A parte da Estatística referente à coleta, organização, re-
sumo e apresentação de dados é conhecida como Estatística
Descritiva ou Estatística Dedutiva.
A parte referente à análise e conclusão de dados denomi-
na-se Inferência Estatística ou Estatística Indutiva.

3.2 Ponto amostral e espaço amostral

Em qualquer experimento, cada acontecimento que possa


ocorrer é denominado ponto amostral. A totalidade dos pontos
amostrais constitui o espaço amostral ou universo. Sejam os se-
guintes exemplos:
a) semeadas 100 sementes para verificar a percentagem
de germinação, têm-se 101 pontos amostrais, consti-
tuindo o espaço amostral;
b) a produção de madeira de uma floresta está entre 100
m3/ ha e 200 m3/ ha, assim, diz-se que o espaço amos-
tral é constituído por infinitos pontos contidos no interva-
lo [100 a 200].

Os espaços amostrais podem ser classificados em discre-


tos e contínuos. O espaço amostral é discreto quando é consti-
tuído por um número finito de pontos ou por um número infinito

31
Amostragem em inventário florestal Waldenei Travassos de Queiroz

desde que enumeráveis. O espaço amostral é contínuo quando


é constituído por um conjunto infinito contínuo de pontos amos-
trais.

3.3 Variável aleatória

Uma variável, definida como o símbolo representativo dos


elementos de um conjunto, é dita aleatória quando associada a
uma probabilidade de ocorrência. A variável aleatória pode ser
classificada em discreta e contínua. A variável é discreta quando
assume somente um número finito de valores ou quando varia
num conjunto infinito enumerável. A variável é contínua quando
assume valores que variam de acordo com um conjunto infinito
não enumerável (intervalo contínuo).

3.4 Esperança matemática

Seja y uma variável aleatória discreta, assumindo os va-


lores y1, y2,..., yn com as probabilidades p1, p2,..., pn, respectiva-
mente. Define-se esperança matemática ou valor médio de y,
como sendo:
n n
E ( y ) = ∑ y i p i para ∑p i =1
i =1 i =1

Para as variáveis aleatórias contínuas, tem-se:


∞ ∞
E ( y) = ∫ yy ff((y)
−∞
y )dydy dado que ∫ dPP ==11. Sendo f(y) a função
−∞
densidade.
Propriedades da esperança matemática:

E(c) = c, sendo c uma constante;

32
Fundamentos de estatística

E(cy) = c E(y);
E(x + y) = E(x) + E(y);
E(xy) = [E(x)][E(y)], se x e y forem independentes.

Definições de variância e de covariância.


V(y) = E[y - E(y)]2;
V(ay) = c2 V(y);
Cov(x,y) = E{[(x - E(x)][(y - E(y)]}= E(xy) – [E(x)][E(y)], sen-
do Cov(x,y) = 0, então x e y são independentes;
V(x+y) = V(x) + V(y) + 2 Cov(x,y);
V(x-y) = V(x) + V(y) - 2 Cov(x,y);
V(ax+by) = a2V(x) + b2V(y) + 2ab Cov(x,y), dado que a e b
são constantes;
V(ax-by) = a2V(x) + b2V(y) – 2ab Cov(x,y).

3.5 Distribuição de probabilidade

Denomina-se distribuição de probabilidade ao conjunto de


duas variáveis: uma, é a própria variável aleatória, e a outra, as
suas respectivas probabilidades de ocorrência. De conformida-
de com a natureza da variável aleatória, a distribuição pode ser
classificada em discreta ou contínua.

3.5.1 Função de probabilidade de variáveis discretas

Para as variáveis aleatórias discretas, uma função f(y) é de


probabilidade, se:

a) f(y) 0 para qualquer y;

b) ∑ f ( y ) = 1.
y

33
Amostragem em inventário florestal Waldenei Travassos de Queiroz

3.5.2 Função densidade de probabilidade de variáveis con-


tínuas

Para as variáveis aleatórias contínuas, uma função f(y) é


de densidade, se:

a) f (y) 0 para qualquer y real;


∞ ∞
E ( y )b)= ∫ yy f ((y)
−∞
y )dydy = ∫ dPP ==11
−∞

O termo f (y) dy representa a probabilidade de ocorrência


de valores entre y e y + dy, denominado diferencial de probabi-
lidade (dP).

3.5.3 Função de distribuição acumulada ou função de distri-


buição

A função de distribuição acumulada é obtida a partir da f(y),


que é representada, para um determinado valor de Y, pela fun-
ção f(y) = P(y Y). Assim, têm-se:

a) para variáveis discretas F ( y ) =


y ≤Y
f ( y ); ∑

y

b) para variáveis contínuas F ( y ) = ∫ ff ((y)


−∞
y )dydy..

Toda distribuição é definida através de uma função de pro-


babilidade se a variável é discreta, ou por uma função de densi-
dade se a variável é contínua.

34
Fundamentos de estatística

3.5.4 Distribuição binomial

É uma distribuição discreta, cuja função de probabilidade é:


y
f ( y ) = C p y q n − y , sendo:
n

p = probabilidade de realização do acontecimento favorável;


q = probabilidade de realização do acontecimento contrário;
y = número de vezes que se realiza o acontecimento favo-
rável;
n = número de tentativas;
y
C = número de combinações de n elementos, tomados y a y.
n

Exercício 3.1

Em uma amostra de cinco árvores (n = 5) verificou-se a


ocorrência de duas árvores (y = 2) com qualidade de fuste tipo 1
(fuste reto, cilíndrico, bem configurado e sem deterioração apa-
rente). A aplicação de um teste de aderência comprovou que
a variável “número de árvores” com qualidade de fuste tipo 1
segue a distribuição binomial. Obter as probabilidades de ocor-
rência para y = 0, 1, 2, 3, 4, 5.

y 2 3
Dado que p = = , então q = 1 − p =
n 5 5
y
n− y
a) se f ( y ) = C p q
y
, então a probabilidade de não ocor-
n
rer árvores com qualidade de fuste tipo 1 é obtida por:
2 3 243
f (0) = C 50 ( ) 0 ( ) 5 = = 0,0778
5 5 3125

Conclui-se que a probabilidade de não ocorrer árvores com


qualidade de fuste tipo 1 é igual a 7,78%.

35
Amostragem em inventário florestal Waldenei Travassos de Queiroz

b) a probabilidade de ocorrer apenas uma árvore com qua-


lidade de fuste tipo 1 é obtida por:

2 3 810
f (1) = C 51 ( ) 1 ( ) 4 = = 0,2592
5 5 3125

Conclui-se que a probabilidade de ocorrer uma árvore ape-


nas com qualidade de fuste tipo 1 é igual a 25,92%.

c) a probabilidade de ocorrer duas árvores com qualidade


de fuste tipo 1 é dada por:

2 3 1080
f (2) = C 52 ( ) 2 ( ) 3 = = 0,3456
5 5 3125

Conclui-se que a probabilidade de ocorrer duas árvores


com qualidade de fuste tipo 1 é igual a 34,56%.

d) a probabilidade de ocorrer três árvores com qualidade


de fuste tipo 1 é dada por:

2 3 720
f (3) = C 53 ( ) 3 ( ) 2 = = 0,2304
5 5 3125

Conclui-se que a probabilidade de ocorrer três árvores com


qualidade de fuste tipo 1 é igual a 23,04%.

e) a probabilidade de ocorrer quatro árvores com qualidade


de fuste tipo 1 é dada por:

2 3 240
f (4) = C 54 ( ) 4 ( )1 = = 0,0768
5 5 3125

Conclui-se que a probabilidade de ocorrer quatro árvores


com qualidade de fuste tipo 1 é igual a 7,68%.

36
Fundamentos de estatística

f) a probabilidade de ocorrer cinco árvores com qualidade


de fuste tipo 1 é dada por:
2 3 32
f ( 5)  C 55 ( ) 5 ( ) 0   0,0102
5 5 3125
Conclui-se que a probabilidade de ocorrer cinco árvores
com qualidade de fuste tipo 1 é igual a 1,02 %.

Note-se que:
n
( p + q ) 5 = ∑ C in ( p ) i (q ) n −i
i =0

Verificação:

f (0) + f (1) + f (2) + f (3) + f (4) + f (5) = 0,0778 + 0,2592 + 0,3456 + 0,2304 + 0,0768 + 0,0102 = 1

3.5.5 Distribuição de Poisson

É uma distribuição discreta cuja função de probabilidade é:


e −m m y
f ( x) =
y!

Tal que y pode assumir valores y = 1,...,∞.

y = número de vezes que se realiza o acontecimento;


m = média de ocorrência;
e = base do logaritmo natural ou neperiano.

Exercício 3.2

Usando-se parcelas de tamanho igual a 0,25 ha em um in-


ventário florestal verificou-se, em média, 20 árvores, considerando

37
Amostragem em inventário florestal Waldenei Travassos de Queiroz

todas as espécies. A pesquisa cita que a probabilidade de ocorrer


uma árvore da família meliaceae é 10%. Um teste de aderência
comprovou que a variável resposta número de árvores ocorrentes
dessa família segue a distribuição de Poisson. Calcular as proba-
bilidades de ocorrência de: nenhuma árvore, apenas uma árvore,
três árvores e cinco árvores da família meliaceae.

e −m m y
Dado que: f ( x) = e m = p = 0,10 x 20 = 2
y!
a) a probabilidade de ocorrer nenhuma árvore da família
meliaceae é dada por:

e −2 × 20 1
f (0) = = 2 = 0,1353
0! e

Conclui-se que a probabilidade de ocorrer nenhuma árvore


da família meliaceae é de 13,53%.

b) a probabilidade de ocorrer apenas uma árvore da família


meliaceae é dada por:

e −2 × 21 2
f (1) = = 2 = 0,2707
1! e
Conclui-se que a probabilidade de ocorrer apenas uma ár-
vore da família meliaceae é de 27,07%.

c) a probabilidade de ocorrer três árvores da família melia-


ceae é dada por:

e −2 × 2 3 8
f (3) = = 2 = 0,1804
3! 6e

38
Fundamentos de estatística

A probabilidade de ocorrer três árvores da família meliace-


ae é de 18,04%.

d) a probabilidade de ocorrer cinco árvores da família me-


liaceae é dada por:

e −2 × 2 5 32
32
f (5) = = = 0,0361
5! 120e 2

A probabilidade de ocorrer cinco árvores da família melia-


ceae é de 3,61%.

3.5.6 Distribuição normal

Quando os valores das observações de uma variável res-


posta, originados de uma amostra, são agrupados em tabelas
de frequências, objetiva-se conhecer a variação e como se pro-
cessa a distribuição dos dados.
Existem inúmeros tipos de curvas que podem representar as
distribuições. Na maioria das pesquisas biológicas, as observa-
ções variam em torno da distribuição normal, a qual é uma distri-
buição contínua, também conhecida como distribuição de Gauss,
Laplace ou Laplace-Gauss. É a mais importante distribuição no
campo da Estatística e tem a seguinte função de densidade:
1 y −Y 2
1 − [ ]
f ( y) = e 2 S ( y) (3.1)
S ( y ) 2p
Sendo:
S ( y ) = V ( y ) é o desvio padrão da distribuição;
e = base do logaritmo neperiano (e = 2,7183);
p = constante geométrica (p = 3,1416).
A notação usada é N [Y , V ( y )])], lê-se que a variável aleató-

39
Amostragem em inventário florestal Waldenei Travassos de Queiroz

ria contínua y tem distribuição normal com média Y e variância


V(y).
A equação normal tem como representação gráfica uma
curva unimodal em forma de sino, contínua, simétrica em rela-
ção à origem, onde os valores da variável resposta variam (−∞ <de y <- ∞)
(−∞ < ay +< ∞), possuindo um ponto de máxima frequência. A Figura 3.1
apresenta três formas gráficas de distribuições normais apre-
sentando variâncias diferentes, tal que: V1 ( y ) < V2 ( y ) < V3 ( y ) .

Figura 3.1 - Formas gráficas da distribuição ∞(∞<)< yy < ∞).


(−∞ normal
< y(−
<

Para determinar a área compreendida pela curva e duas


ordenadas quaisquer, integra-se a equação da curva entre as
ordenadas. A integração da equação normal (−∞entre
< (y−∞<- ∞<)ey +< ∞)im-
plicará na obtenção da frequência total ou probabilidade integral,
igual à unidade, abrangendo a área que fica sob a curva.

∫ f (y)
−∞
dy ==11
( y )dy

Por outro lado, em relação ao cálculo das probabilidades,


no que concerne à integração de f(y), apresentada na forma
analítica da Equação 3.1, resultam dois problemas:

40
Fundamentos de estatística

1) Para o cálculo da integral de f(y) é necessário o desen-


volvimento em séries.
2) A elaboração de tabelas de probabilidade torna-se com-
plicada, pois f(y) depende de dois parâmetros: Y e V ( y ) , acar-
retando a necessidade de obter uma tabela para cada combina-
ção de Y e V ( y ) .
Esses problemas são solucionados através de uma trans-
formação de variável, surgindo, assim, a distribuição normal pa-
dronizada ou reduzida de média zero e variância igual à unidade:
z = ( y − Y ) S ( y)
Na construção da variável z, y é uma variável normal de
média Y e variância V ( y ) . A variável aleatória contínua z tem
distribuição normal, denominada de padronizada ou reduzida de
média zero e variância igual a 1, pois:

y −Y
E ( z ) = E[ Sy(−yY) ] = 0 e V ( y ) = V [ S ( y ) ] = 1

Então, a função densidade será:



− 1 z2
f ( z ) = 12p e 2 (−∞, onde
< y <- ∞ )< z< <y +< ∞)
(−∞

As probabilidades estão apresentadas na Tabela 1 do Anexo.


A distribuição normal apresenta as seguintes propriedades:
a) a função f(y) é simétrica em relação à origem y = Y ou a
função f(z) é simétrica em relação à origem z = 0;
b) a função f(y) possui um ponto de máximo em y = Y com
ordenada igual a 0,3989/S(y) ou a função f(z) possui um ponto
de máximo no ponto z = 0 com ordenada 1 2p = 0,3989 ;
c) a função f(y) tende a zero quando y tende (−∞para
< y ±< ∞)ou
f(z) tende a zero quando z tende (−∞para
< y ±< ∞);
d) a função f(y) tem dois pontos de inflexão cujas abscissas

41
Amostragem em inventário florestal Waldenei Travassos de Queiroz

valem Y + S(y) e Y - S(y), e as ordenadas são iguais a 0,24/S(y).


A função f(z) tem dois pontos de inflexão cujas abscissas valem
+ 1 e – 1, e as ordenadas valem 0,24.
Mood, Graybill e Boes (1964) apresentam informações
mais detalhadas sobre a teoria e as aplicações acerca das di-
versas funções de probabilidade.

Exercício 3.3

Seja um viveiro com 1.000.000 de mudas de uma deter-


minada espécie florestal e que um empresário florestal deseja
adquirir plantas com alturas no intervalo de 15 cm altura 27
cm. Suponha a medição de uma amostra selecionada de forma
inteiramente ao acaso de 1000 plantas. O resultado de um tes-
te estatístico de aderência comprovou que a variável resposta
altura (y) distribui-se normalmente com média Y = 20 cm e V(y)
= 25 cm2. Calcular o número de plantas esperado que atenda o
intervalo estipulado pelo empresário cliente.

yi  Y 15  20
Z1    1,00
S( y ) 5
yj Y 27  20
Z2    1,4
S( y ) 5

Consultando a Tabela 1 do anexo, tem-se:


0 1, 40

 f ( z)dz  0,3413 e  f ( z)dz  0,4192


1 , 00 0

1, 40 0 1, 40

 f ( z )dz   f ( z) dz   f (z )dz  0,3413  0,4192  0,7605


1,00 1, 00 0

42
Fundamentos de estatística

Conclui-se que a probabilidade de ocorrência de plantas


no intervalo de 15 cm altura 27 cm é de 76,05 %. Então, o
empresário florestal deve esperar, no intervalo estipulado, apro-
ximadamente a disponibilidade de 760.500 plantas no viveiro.

3.5.7 Distribuição de c2

A variável aleatória c2, denominada qui-quadrado com k


graus de liberdade, é definida como a soma de k quadrados de
normais padronizadas e independentes.
k k
yi − Y 2
Então, c 2 = ∑ z i2 = ∑ [ ] , para z = N (0,1) .
i =1 i =1 S ( y)
A função densidade da variável c2 é dada pela Expressão
3.2. As probabilidades estão apresentadas na Tabela 2 do Ane-
xo.

1 1 k2 2 ( k2 −1) −( 12 ) c 2
f (c 2 ) = ( ) (c ) e (3.2)
Γ( k2 ) 2
A função do tipo Γ(k 2) é denominada de função gama e
foi introduzida pelo matemático Leonardo Euler. Analiticamente
é definida pela Fórmula:

Γ(a + 1) = ∫ y a e − y dy
dy
0

Demonstra-se que essa integral converge para a + 1 > 1 .


Informações teóricas e aplicações ver em Gomes e Nogueira
(1980) e Piskounov (1978).
A distribuição c2 tem diversas e importantes aplicações,
destacando-se entre elas as seguintes:
a) a distribuição c2 é utilizada como teste de aderência,

43
Amostragem em inventário florestal Waldenei Travassos de Queiroz

verificando se as distribuições empíricas, obtidas por meio dos


dados amostrais, ajustam-se aproximadamente às distribuições
teóricas;
b) outra aplicação importante é verificar a medida de dis-
crepância entre as frequências observadas e as esperadas, ou
seja, o objetivo é verificar se as frequências observadas diferem
significativamente das esperadas. A estatística utilizada para ve-
rificar essas hipóteses é:
k
( foi  fei ) 2
 2p   ;
i 1 fei

c) verificar a hipótese H 0 : V1 ( y ) = V2 ( y ) = L = Vk ( y ) , que


significa testar se existe igualdade de variâncias. De acordo com
Steel e Torrie (1960), referida hipótese pode ser verificada pelo
teste de Bartlett, por meio da estatística:

k k
 p2  2,3026{[ (ni  1) log10 Vˆ ( y )]   (ni  1) log10 Vˆi ( y )}
i 1 i1

Vˆ ( y ) = variância amostral k

∑ n Vˆ ( y) i i
Vˆ ( y ) = variância amostral média ( Vˆ ( y ) = i =1 );
k

∑n
i =1
i

d) verificar a hipótese H 0 : V ( y ) = V0 ( y ) que significa testar


a igualdade da variância populacional quando comparada com
um valor padrão V0 ( y ) .
De acordo com Fonseca e Martins (1982), essa hipótese
pode ser testada através do teorema de Fisher:

(n − 1)Vˆ ( y )
c p2 =
V0 ( y )

44
Fundamentos de estatística

Sendo n o tamanho da amostra; V0 ( y ) é o valor sob a hipó-


tese nula; Vˆ ( y ) é a variância amostral;

e) obtenção do intervalo de confiança para a variância ver-


dadeira de uma população normal. Se a variável y tem distri-
buição normal com média Y e variância V(y), tem-se que, pelo
teorema de Fisher, o intervalo de confiança para V(y) é:

(n − 1)Vˆ ( y ) (n − 1)Vˆ ( y )
P( ≤ V ( y) ≤ ) = 1−a .
c 2
sup c inf
2

O número de graus de liberdade a ser utilizado, neste caso,


para obter o valor crítico é p = n-1.
Quando se utiliza a distribuição de c 2p para obter o número
de graus de liberdade (p), e assim ter os valores críticos para os
diversos testes, considera-se as seguintes regras de decisão:
i) usar p = k-1, se as frequências esperadas no experimen-
to são obtidas sem efetuar estimativas de parâmetros populacio-
nais a partir de estatísticas amostrais;
ii) usar p=k-1-m, se as frequências esperadas são obtidas
a partir da estimação de m parâmetros.

Exercício 3.4

Um empresário do setor florestal está interessado em im-


plantar em sua área uma indústria madeireira baseada no bene-
ficiamento de apenas seis espécies. As informações disponíveis
nos levantamentos realizados na região amazônica, pelas insti-
tuições de pesquisa, indicam que as porcentagens de ocorrên-
cias dessas espécies atendem às necessidades do projeto. O
empresário, para obter as frequências observadas, efetuou na
área um levantamento correspondente a 100.000 árvores. Con-
siderando um nível de significância de a = 0,05, pergunta-se:

45
Amostragem em inventário florestal Waldenei Travassos de Queiroz

as frequências observadas divergem das esperadas? A Tabela


3.1 apresenta os dados sobre as frequências esperadas e as
observadas.

Tabela 3.1 - Frequências esperadas (fei) e frequências observadas (foi).

Porcentagem de ocorrência
Espécies fei = pi x 100.000 (árvores) foi (árvores)
(Amazônia) (pi)
1 2,5 2500 2536
2 2,0 2000 1950
3 1,8 1800 1790
4 1,5 1500 1580
5 1,1 1100 1080
6 0,8 800 820

(2536 − 2500) 2 (1950 − 2000) 2 (1790 − 1800) 2 (1580 − 1500) 2 (1080 − 1100) 2 (820 − 800) 2
c 52 = + + + + +
2500 2000 1800 1500 1100 800

x52 = 6,95

Conclui-se pela não rejeição da hipótese da nulidade, visto


que o valor calculado (x52 = 6,94) é menor que o valor tabelar
(x52 = 11,1), obtido na Tabela 2 do Anexo para a = 0,05. Pode-se,
então, afirmar que a ocorrência das espécies na área do empre-
sário é semelhante à ocorrência na região amazônica.

3.5.8 Distribuição “t” de Student

Seja a variável aleatória:


y −Y
t=
s( y)
n

Esta variável é conhecida como distribuição “t” de Student,


com k = n-1 graus de liberdade, podendo também ser escrita na
forma:

46
Fundamentos de estatística

N (0,1)
t=
c n2−1
n −1

s (y) é o desvio padrão estimado.

O gráfico da função densidade da variável “t” de Student é


simétrico e tem uma forma parecida com a da distribuição nor-
mal, entretanto, menos achatada, com média zero e variância
igual a k (k − 2) , em que k > 2 (graus de liberdade). A função
densidade da variável “t” é dada pela Expressão 3.3. As probabi-
lidades estão apresentadas na Tabela 3 do Anexo.
k +1
Γ( ) − ( k +1)
t2 ∞, onde <-∞<)<yt < ∞) (3.3)
f (t) = 2 (1 + ) 2 (− < y(−∞
k k
Γ( ). pk
2

A distribuição “t” de Student possui importantes aplicações,


destacando-se entre elas as seguintes:
a) testa a hipótese H 0 : Y = Y0 . Verifica se há igualdade en-
tre o valor médio de uma população versus um valor padrão,
sendo essa hipótese testada através da estatística:

y − Y0
t= , que sob H 0 apresenta n-1 graus de liberdade;
s( y)
n
b) testa a hipótese H 0 : Y1 = Y2 . Verifica se há igualdade en-
tre os valores médios de duas populações independentes, sen-
do testada através da estatística:
y1  y 2 ˆ ˆ
t
, tal que: Vˆ ( y ) = (n1 − 1)V1 ( y ) + (n2 − 1)V2 ( y )
1 1
Vˆ ( y )(  ) n +n −2
1 2
n1 n2

47
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Com n1 + n2 − 2 graus de liberdade sob H 0 , sendo Vˆ ( y ) a


variância comum;

c) testa a hipótese H 0 : Y1 = Y2 . Verifica se há igualdade en-


tre os valores médios de duas populações dependentes (teste “t”
pareado), sendo testada por meio da estatística:

y1 − y 2
t= , com n-1 graus de liberdade sob H 0 .
sd ( y)
n
Sendo: s d ( y ) = Vˆ (d ) , tal que:
n

n
(∑ d i ) 2
∑d i
2
− i =1

n
Vˆ (d ) = i =1
, para d i = y1i − y 2i .
n −1
Desde que a variável resposta seja normal, a distribuição
“t” de Student é muito importante em termos de inventários flo-
restais, pois permite obter os intervalos de confiança para os
valores médio e total para os produtos florestais de uma popula-
ção. É aplicada também para dimensionar o tamanho da amos-
tra quando fixada à precisão. Informações mais detalhadas so-
bre esses aspectos serão vistas quando da apresentação dos
processos de amostragem nos capítulos seguintes.

Exercício 3.5

Estudos científicos indicam que uma determinada espécie


florestal com excelentes características tecnológicas, em uma
determinada região tropical úmida em outro país, produz no fim
de sua rotação, aos sete anos, um volume de madeira em tor-

48
Fundamentos de estatística

no de 100 m3/ha. Um empresário brasileiro tem interesse em


introduzir a referida espécie para verificar se o comportamento
é o mesmo em sua propriedade, e, para atingir seu objetivo, re-
alizou um experimento com 20 unidades de amostra de 0,1 ha.
A Tabela 3.2 apresenta os volumes medidos após sete anos da
implantação do experimento.

Tabela 3.2 - Volumes (m3) de madeira por unidade de 0,1 ha.

UA yi UA yi UA yi UA yi
1 8,5 6 9,6 11 7,9 16 8,8
2 10,3 7 10,9 12 12 17 8,7
3 9,8 8 8,9 13 8,8 18 12,3
4 7,8 9 9,8 14 9,5 18 7,7
5 11,0 10 11,5 15 10,8 20 8,9

A hipótese a ser formulada para atender o objetivo do em-


presário é a seguinte: H 0 : Y = Y0 . A hipótese a ser testada é
ha e o teste deverá ser realizado por meio da
H 0 : Y = 100 m 3 / ha,
estatística:
y − Y0
t=
s( y)
n

Sejam os valores estimados para a média e para a variância:

y  9,675 m3 / 0,1ha
y  10  9,675  96,75 m 3 / ha
Vˆ ( y )  1,9072 (m 3 / 0,1ha) 2
Vˆ ( y )  10 2  1,9072  190,7237 (m3 / ha) 2
s ( y)  13,8103 m 3 / ha

49
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Então:
96,75  100  3,25
t   1,0524
13,8103 3,0881
20

Dado que t19;0,05 = 2,0930, não há razão para rejeitar H0.


Conclui-se, então, que o comportamento da espécie confirmou
as informações oriundas das pesquisas, ou seja, o empresário
pode esperar, com uma probabilidade de acerto de 95% que, se
a espécie for plantada em sua propriedade, a mesma deverá pro-
duzir em média um volume de 100 m3 de madeira por hectare.

3.5.9 Distribuição “F” de Snedecor

A estatística “F de Snedecor” é definida como a razão de


duas variáveis independentes com distribuição c 2 , ou seja:
c k2 k
F( k , p ) = 2
cp p

O valor k é o número de graus de liberdade do numerador


e p é o número de graus de liberdade do denominador. A função
densidade da distribuição F de Snedecor é dada pela Equação
3.4. As probabilidades estão apresentadas nas Tabelas 4 e 5 do
Anexo.
k2
k ( )
 [(k  p) / 2] k F 2
f ( F)  ( ) { 2
kp
}I (0 ,) ( F ) (3.4)
k p p k ( )
 ( ) ( ) [1  ( ) F ] 2
2 2 p
A distribuição F de Snedecor possui diversas aplicações
no campo da estatística, entre elas destacam-se as seguintes:
a) testar a hipótese H0 : Ve (y) = 0 . Verificar se o componen-

50
Fundamentos de estatística

te de variância entre populações é igual a zero. Esta hipótese é


muito utilizada na genética e, em termos de inventário florestal,
pode ser utilizada para testar se o componente de variância en-
tre os conglomerados é igual a zero. Este problema será visto
com mais detalhes no capítulo sobre a Amostragem por Conglo-
merados;
b) testar a hipótese H0 : t1 = t2 = • • • = tk = o . Verificar se os
efeitos de k tratamentos são todos iguais a zero. O modelo ma-
temático considera que os efeitos, devidos aos tratamentos, são
fixos. A hipótese da nulidade H0 : t1 = t2 = • • • = tk = 0 é similar à
hipótese H 0 : Y1 = Y2 = L = Yk ;
c) testar a hipótese H0 : V1(y) = V2(y). Verificar se há igual-
dade entre duas variâncias, sendo testada através da estatística:

F = Vˆ1 ( y ) Vˆ2 ( y )

Que sob H0 possui n1 - 1 graus de liberdade no numerador


e n2 - 1 graus de liberdade no denominador.

É importante observar que a hipótese H0 : V1(y) = V2(y) = • • • = Vk(y)


pode ser verificada pelo teste de Hartley ou teste da Razão Máxi-
ma Hc . Ver a Tabela 6 do Anexo que, segundo Banzato e Kronka
(1989), é específica para esse teste.

Vˆmáx ( y )
Hc = , tal que:
Vˆ ( y )
min

Vˆmax ( y ) = maior variância

Vˆmin = menor variância

51
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Exercício 3.6

Seja um inventário florestal realizado através de uma amos-


tra estratificada apresentando três estratos. A Tabela 3.3 mostra os
dados de volumes de madeira de 39 parcelas de superfície de 0,25
ha, tendo a seguinte alocação por estrato: estrato 1 = 13 parcelas,
estrato 2 = 15 parcelas e estrato 3 = 11 parcelas. Pede-se: testar a
hipótese H 0 : Y1 = Y2 = Y3 , que significa verificar se todas as médias
são iguais. A Tabela 3.4 apresenta a análise de variância dos dados.

Tabela 3.3 - Volumes (m3) por parcela de 0,25 ha.

ESTRATO I ESTRATO II ESTRATO III

21,10 22,12 12,90 22,12 8,10 6,50


34,00 25,00 17,00 12,00 12,00 12,50
18,00 31,20 9,50 16,50 9,50 5,20
20,00 17,05 20,00 17,05 14,50
55,00 24,10 30,10 24,10 18,17
23,42 23,42 16,71 21,10
40,50 21,10 21,80 10,80
17,44 17,44 7,50

Tabela 3.4 - Análise de variância para os três estratos.

Fontes de variação GL SQ QM F

Entre estratos 2 1421,9621 710,9811


12,37**
Dentro dos estratos 36 2069,6326 57,4898
Total 38 3491,5947

Sendo o valor de F calculado (12,37) maior que o valor


tabelar (F2;36;0,01), conclui-se pela rejeição de H 0 : Y1 = Y2 = Y3 , ou
seja, existe pelo menos um contraste significativo entre as mé-
dias. Caso haja necessidade em testar contrastes de interesse
entre os valores médios dos estratos, é recomendável aplicar
testes de comparações múltiplas.

52
Capítulo 4

AMOSTRAGEM SIMPLES AO ACASO

Do ponto de vista estatístico define população e, para fins


de aplicação em inventários florestais, caracteriza as finitas e as
infinitas. Caracteriza os objetivos quando da realização de um
levantamento por amostragem. Descreve os parâmetros popula-
cionais e os seus estimadores. Mostra a teoria para obtenção de
intervalos de confiança e dimensionamento da amostra simples
ao acaso. Aborda a amostragem simples ao acaso para propor-
ções e porcentagens. Contempla com exemplos todos os temas
citados.
Amostragem simples ao acaso

Do ponto de vista estatístico, uma população é o conjunto


de todos os indivíduos, elementos ou unidades sobre os quais
se deseja desenvolver estudos, visando conhecer determinadas
características. Quando somente uma parte dos elementos ou
unidades é selecionada para o procedimento das análises, tem-
se o que se denomina de amostra.
Existem populações finitas e infinitas. Para fins de amostra-
gem, determinadas populações finitas podem ser consideradas
como infinitas, desde que o tamanho da amostra corresponda a,
no máximo, 5 % das unidades da população.
O método da amostra simples ao acaso ou amostra inteira-
mente casualizada é o mais tradicional procedimento de amos-
tragem.
A amostra simples ao acaso baseia-se num processo estri-
tamente aleatório, na qual as unidades amostrais são seleciona-
das com igual probabilidade (1/N), em que N é o número total de
unidades que compõem o espaço amostral, ou seja, a população
amostrada. Na amostra simples ao acaso sem reposição, as unida-
des são selecionadas independentemente entre si, e o número de
amostras possíveis (nap) de tamanho igual a n é dado pela relação:
n
N!
nap  C  n!( N n )!
N

Não obstante, apenas uma das possíveis combinações é
selecionada para a amostragem, de tal forma que as unidades
que comporão a amostra são sorteadas independentemente en-
tre si.
Scolforo (1993) cita que, como nem sempre é possível fa-
zer uma enumeração completa de todos os indivíduos de uma
população florestal, os levantamentos são realizados tendo
como base a teoria estatística da amostragem, que é definida

55
Amostragem em inventário florestal Waldenei Travassos de Queiroz

como a observação de uma amostra da população para obter


estimativas representativas para o todo, sendo constituída de
indivíduos que apresentam características comuns que repre-
sentem a população a qual pertencem. A amostra é formada por
um grupo de unidades amostrais.
No que concerne ao inventário florestal, a amostra simples
ao acaso é geralmente conduzida a partir de um sorteio sem
reposição, assumindo-se, evidentemente, o pressuposto da per-
manência de igual probabilidade para as unidades remanescen-
tes em cada sorteio, respaldando-se no fato de que, geralmente,
as populações florestais são consideradas estatisticamente infi-
nitas, assim como a inclusão de uma unidade amostral mais de
uma vez na amostra refletirá uma homogeneização da variância
entre as unidades da amostra.
A amostra simples ao acaso, que é um processo congruen-
te, ou seja, quando n = N, as estimativas coincidem com os valo-
res populacionais, é recomendada para pequenas áreas flores-
tais não superiores a 10.000 ha, com características homogêne-
as com respeito às variáveis de interesse e com fácil estrutura
de acessibilidade.
Quando da realização de um levantamento por amostra-
gem, geralmente, têm-se os seguintes objetivos:

a) estimar o valor médio para a variável resposta;


b) estimar o valor total para a variável resposta;
c) estimar a porcentagem ou a proporção sobre a ocorrên-
cia de um certo atributo;
d) estimar a variância da variável resposta;
e) obter os intervalos de confiança do valor médio e do va-
lor total para a variável resposta.

56
Amostragem simples ao acaso

4.1 Valores populacionais e estimadores

Para formular os valores populacionais e estimadores,


será usada a seguinte notação:
N = número total de unidades em que a população foi divi-
dida, função direta do tamanho da unidade de amostra;
n = número de unidades de amostra;
yi = valor observado da variável resposta concernente à i-
ésima unidade de amostra.

a) valor médio
a1) valor médio populacional
N

∑y i
Y = i =1
N

a2) valor médio estimado
n

∑y i
y= i =1

Este estimador é não tendencioso (“unbiased”), pois, tem-se:


n

∑y i
E ( y ) = E ( i =1 ) = Y
n
b) valor total
b1) valor total populacional
Y = NY

b2) valor total estimado
Yˆ = N y

57
Amostragem em inventário florestal Waldenei Travassos de Queiroz

c) variância
c1) variância populacional
N
(∑ y i ) 2
N N

∑ ( yi − Y ) 2 ∑y 2
i − i =1

N
V ( y) = i =1
= i =1

N −1 N −1

c2) variância estimada


n

n n
(∑ y i ) 2

∑ ( y i − y ) 2 ∑ y i2 − i =1
n
Vˆ ( y ) = i =1 = i =1
n −1 n −1

d) desvio padrão
d1) desvio padrão populacional
S ( y) = V ( y)

d2) desvio padrão estimado

s ( y ) = Vˆ ( y )

e) variância da média
e1) variância da média populacional
V ( y) N − n
V ( y) = ( )
n N

e2) variância da média estimada


Vˆ ( y ) N − n
Vˆ ( y ) = ( )
n N

58
Amostragem simples ao acaso

O valor ( N − n) N é denominado fator de correção para


população finita. Quando a população for definida como infinita,
ou seja, n < 0,05N, não há necessidade de aplicá-lo.

f) erro padrão
f1) erro padrão populacional
S ( y) = V ( y)

f2) erro padrão estimado


s ( y ) = Vˆ ( y )

g) coeficiente de variação

O coeficiente de variação permite interpretar mais facil-


mente a variabilidade das observações, viabilizando uma com-
paração relativa entre o desvio padrão e a média.

g1) coeficiente de variação populacional


Ss ((yy))
VVˆ % =
C ××100
100
Yy
g2) coeficiente de variação estimado
s( y)
CVˆ % = × 100
y

h) intervalo de confiança

A estimação consiste em processar os resultados extraídos


por amostragem e fazer inferências sobre a população da qual
foi extraída aleatoriamente a amostra. Pode-se fazer a estima-
ção de parâmetros de duas formas:

59
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Estimação por ponto: quando a partir da amostra obtém-se


um único valor para estimar um determinado parâmetro popula-
cional;
Estimação por intervalo: quando a partir da amostra calcu-
la-se um intervalo da forma θ 1 ≤ θ ≤ θ 2 , admitindo certa proba-
bilidade 1 - a (nível de confiança) de que o intervalo contenha o
verdadeiro valor do parâmetro populacional θ . Dessa maneira,
a será o nível de significância, isto é, o erro que se comete ao
afirmar que, por exemplo, 95 % das vezes o intervalo θ 1 ≤ θ ≤ θ 2
contém θ será de 5%.

h1) cálculo do intervalo de confiança para a média popula-


cional (Y ) se conhecida a variância populacional V ( y ) :

Seja y uma variável aleatória distribuída normalmente com


média Y e variância V ( y ) , ou seja, y ~ N[Y , V ( y ) ]. Então, a mé-
dia amostral y também terá distribuição normal com média Y e
variância V( y ) = V(y)/n, ou seja, y ~ N[Y ,V (y)/n].

y −Y
Seja a variável padronizada z = .
S ( y)
y
A variável z é denominada normal reduzida com média
zero e variância igual a 1. A Figura 4.1 mostra a forma gráfica
dessa distribuição padrão z e, na Tabela 1 do Anexo, as proba-
bilidades.

60
Amostragem simples ao acaso

Figura 4.1 - Forma gráfica da distribuição normal reduzida.

Da construção gráfica ilustrativa da distribuição normal,


pode-se escrever que:
P(− Z a ≤ Z ≤ Z a ) = 1 − a
2 2

y −Y
P(− Z a 2 ≤ ≤ Za 2 ) = 1 − a
S ( y)
n
Portanto:

P ( y − za 2 S ( y ) / n ≤ Y ≤ y + za 2 S ( y ) / n ) = 1 − a

h2) cálculo do intervalo de confiança para média populacio-


nal (Y ) se desconhecida a variância populacional V(y).

No caso do desconhecimento da variância populacional, de-


ve-se calcular a estimativa do desvio padrão através da amostra.
Seja o gráfico da função densidade da variável “t” de Stu-
dent, que é simétrico e tem uma forma parecida com a da dis-
tribuição normal (Figura 4.2), entretanto, menos achatada, com
média zero e variância igual a k (k − 2) , em que k > 2 (graus de
liberdade).

61
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Figura 4.2 - Forma gráfica da distribuição “t” de Student.

Da construção gráfica ilustrativa da distribuição “t” de Stu-


dent, tem-se:

P(− t a 2 ≤ t ≤ t a 2 ) = 1 − a , resultando:

s( y) s( y)
P( y − t a ≤ Y ≤ y + ta ) = 1−a

2
n
2
n
A estrutura matemática para o cálculo do intervalo de con-
fiança pode ser apresentada de uma forma mais simples:

IIC
C = y ± t × s( y )

Assim, tem-se:
N − n s( y)
IC
IC = y ± t ( )× , para populações finitas;
N n
s( y)
IC
IC = y ± t , para populações infinitas;
n
IC = N ( y ± t × s ( y ) , para o valor total.
IC

62
Amostragem simples ao acaso

i) dimensionamento da amostra simples ao acaso.

Dados, respectivamente, os estimadores da variância da


média e do intervalo de confiança como anteriormente definidos:

Vˆ ( y ) N − n
Vˆ ( y ) = ( ) e IC
IC = y ± t × s ( y )
n N

SejaE E=E=L
E=t t××yss ( y ) a semiamplitude do intervalo de confian-
ça, conhecida no jargão da engenharia florestal brasileira como
expectância do erro, valor normalmente fixado de acordo com o
grau de precisão desejado. Essa semiamplitude pode ser fixada
como um valor percentual da média, ou seja, EE== LE E × y . Neste
L
caso, LE é denominado limite de erro.
A fórmula para conseguir o número de unidades de amos-
tra (n), atendendo um limite de erro predefinido, é obtida da se-
guinte forma:

E = t × s( y )
Vˆ ( y ) N − n
E 2 = t 2Vˆ ( y ) = t 2 ( )
n N
Vˆ ( y ) n
E2 = t2 (1 − )
n N
Vˆ ( y ) Vˆ ( y)
E2 = t2 −t2
n N

Resultando para o caso de populações finitas:


t 2Vˆ ( y )
n=
t 2Vˆ ( y )
E2 +
N
No caso de populações infinitas, tem-se:

Vˆ ( y )
E =t , resultando:
n

63
Amostragem em inventário florestal Waldenei Travassos de Queiroz

t 2Vˆ ( y )
n=
E2

Por outro lado, é factível ocorrer que os recursos financeiros


disponíveis sejam um fator limitante. Neste caso, Husch, Miller
e Beers (1972) recomendam que a intensidade de amostragem
seja estabelecida através da seguinte equação linear de custo:

c = c0 + nc1

c = custo total do inventário (medição de campo);


c0 = custos fixos (planejamento e trabalhos de escritório);
c1 = custo médio por unidade de amostra;
n = número de unidades de amostra.

O componente nc1 corresponde ao custo total da coleta de


dados de campo.

Exercício 4.1

Seja uma área florestal de 3.574 ha, localizada na região


de Marajó, onde, a partir de uma amostra simples ao acaso, fo-
ram enumeradas 27 unidades. A unidade amostral de 2.500 m2
apresentou uma forma retangular de 10 m de largura e 250 m
de comprimento, onde foram mensuradas todas as árvores com
DAP 45 cm, enquanto que para as árvores com 15 cm DAP <
45 cm foi estabelecida uma subamostra de 1.000 m2, compreen-
dendo 10 m de largura por 100 m de comprimento. A Tabela 4.1
apresenta os resultados dos volumes para as árvores contidas
em 15 cm DAP < 45 cm; e a Tabela 4.2, os volumes para as
árvores com DAP 45 cm. O cálculo do volume por árvore foi

64
Amostragem simples ao acaso

obtido através da equação de volume VVˆSC SC = 0,0775 + 0,5179 DAP H


2
,
desenvolvida por Queiroz (1984), sendo:
VSC = volume sem casca por árvore;
DAP = diâmetro a altura do peito com casca;
H = altura comercial.
Efetuar a análise considerando os seguintes casos:
1) Análise estatística da variável volume no intervalo 15 cm
DAP < 45 cm.
2) Análise estatística da variável volume para DAP 45 cm.

Tabela 4.1 - Volume (m3/0,1 ha) para 15 cm DAP < 45 cm.

UA Yi UA Yi UA Yi UA Yi UA Yi
1 6,45 7 9,289 13 6,208 19 11,700 25 9,642
2 17,00 8 9,915 14 14,21 20 10,080 26 7,549
3 4,31 9 10,540 15 6,356 21 8,765 27 2,937
4 7,53 10 6,597 16 9,975 22 5,508
5 7,21 11 7,193 17 9,953 23 4,292
6 4,19 12 13,92 18 9,731 24 7,173

Tabela 4.2 - Volume (m3/0,25 ha) para DAP 45 cm.

UA Yi UA Yi UA Yi UA Yi UA Yi
1 12,9914 7 21,9215 13 17,5972 19 14,5159 25 18,3705
2 16,1036 8 17,4466 14 24,0426 20 29,7010 26 25,3622
3 9,6805 9 22,1176 15 16,7197 21 30,4842 27 18,5761
4 20,0752 10 12,8449 16 21,8991 22 14,6925
5 29,6375 11 16,5398 17 10,4113 23 18,9567
6 23,4207 12 17,0837 18 10,0260 24 19,6981

65
Amostragem em inventário florestal Waldenei Travassos de Queiroz

1) Análise estatística da variável volume no intervalo 15


cm DAP < 45 cm

a) valor médio estimado


n

y
i 1
i
227 ,898
y   8,4407 m3 / 0,1 ha
n 27
y = 84,41m3/ ha

b) valor total estimado

Yˆ = N × y = 35.740 × 8,4406667 = 301.669,43 m3, para:

N = Área/T.U.A = 3574 ha/0,1 ha = 35.740

T.U.A = Tamanho da Unidade de Amostra

c) variância estimada
n

n
(  yi ) 2
227 ,89802
y 2
i
 i 1

n
2201,5079 
27
Vˆ ( y)  i 1
  10,6883 ( m 3 / 0,1 ha) 2
n 1 26

Vˆ ( y)  102  10,6883  1068,8342 (m3 / ha) 2

d) desvio Padrão estimado


s( y )  Vˆ ( y ) / ha  32,6930 m / ha
3

66
Amostragem simples ao acaso

e) variância da média estimada


Vˆ ( y) / ha N  n 1068 ,8342 35740  27
Vˆ ( y )  ( ) ( )  39,5565(m 3 / ha ) 2
n N 27 35740

f) erro padrão estimado

s( y )  Vˆ ( y ) / ha  6,29 m 3 / ha

g) coeficiente de variação estimado


s( y ) 32,69303
C Vˆ %   100   100  38,73 %
y 84,406667

h) intervalo de confiança (IC)

Na Tabela 3 do Anexo, tem-se o valor tabelar para a= 0,05


e n - 1 = 26:
ta = 2,0555
, n −1
2

Limite inferior para o valor médio


y − t × s ( y ) =84,406667-2,0555x6,289399= 71,48 m3/ ha

Limite superior para o valor médio


y + t × s ( y ) = 84,406667 + 2,0555 x 6,2893995 = 97,33 m3/ ha

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor médio real para o volume das árvores com 15 cm DAP
< 45 cm encontra-se no intervalo de 71,48 m3/ ha a 97,33 m3/ ha.
Limite inferior para o valor total
Área [ y − t × s ( y ) ]=3574 x 71,478806 =225.465,25 m3

Limite superior para o valor total


Área [ y  t  s( y )] = 3574 × 97,334528= 347.873,60 m3

67
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o volume total real para a população florestal de 3.574 ha
encontra-se no intervalo de 225.465,25 m3 a 347.873,60 m3.
i) limite de erro

E = t × s ( y ) = 2,0555 × 6,2893995 = 12,927861 m3/ha


E 12,927861
LE %   100   100  15,32 %
y 84,406667

j) dimensionamento da amostra

Considerando que o limite de erro requerido para o inven-


tário florestal seja de LE = 0,1 (10 %). O resultado do limite de
erro obtido para a variável resposta volume (15 cm DAP 45
cm) foi de 15,32 % para 27 unidades de amostra. Então, deve-
se calcular o número de unidades de amostra, visando atender
ao limite de erro desejado de LE = 0,1 e, finalmente, calcular o
número de unidades faltantes.

t 2Vˆ ( y ) 2,05552 1068,8342


n   63,27
2 t 2Vˆ ( y ) 2 2,05552 1068,8342
E  8,4406667 
N 35740
n = 64 unidades de amostra

Para:

E × y = 0,10 x 84,406667 = 8,4406667 m3/ha


EE == LE
L

Concluindo que se deve voltar ao campo e medir mais 37


unidades de amostra para atender ao limite de erro fixado em
LE = 0,1.

68
Amostragem simples ao acaso

2) Análise estatística da variável volume para DAP 45 cm

a) valor médio estimado


n

y i
501,9161
y i 1
  18,9228 m 3 / 0,25ha , onde: y = 75,69 m3/ha
n 27
b) valor total estimado

Yˆ = N × y = 14296 x 18,922819 = 270.520,61 m3, onde:

N = Área/T.U.A. = 3574 ha/0,25 ha = 14.296

c) variância estimada
n

n
( y i ) 2
510,91612
y 2
i  i 1

n
10523,191 
27
Vˆ ( y )  i 1
  32,8930 ( m 3 / 0,25 ha) 2
n 1 26

Vˆ ( y )  4 2  32,89303  526,2885 (m 3 / ha) 2

d) desvio padrão estimado

s ( y )  Vˆ ( y ) / ha  526,2885  22,94 (m 3 / ha )

e) variância da média estimada


Vˆ ( y ) / ha N  n 526,28847 14296  27
Vˆ ( y )  ( ) ( )  19,4553 (m 3 / ha ) 2
n N 27 14296

f) erro padrão estimado

s ( y )  Vˆ ( y ) / ha  19,4553  4.41 m3/ ha

69
Amostragem em inventário florestal Waldenei Travassos de Queiroz

g) coeficiente de variação estimado


s ( y) 22,94
CVˆ %   100   100  30,31%
y 75,69

h) intervalo de confiança (IC)

Limite inferior para o valor médio


y − t × s ( y ) =75,691276-2,0555 x 4,4108221= 66,62 m3/ ha

Limite superior para o valor médio


y + t × s ( y ) = 75,691276 + 2,0555 x 4,4108221= 84,76 m3/ ha

Há razão para afirmar, com uma probabilidade de acerto de


95%, que o valor médio real da floresta para o volume das árvo-
res com DAP 45 cm encontra-se no intervalo de 66,62 m3/ ha a
84,76 m3/ ha.

Limite inferior para o valor total
Área[ y − t × s ( y ) ] = 3574 x 66,624831= 238.117,15 m3

Limite superior para o valor total


Área[ y + t × s ( y ) ] = 3574 x 84,757721= 302.924,09 m3

Dado t a = 2,0555 para a = 0,05 e n - 1 = 26.


, n −1
2

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor total populacional real da floresta para o volume das
árvores considerando DAP 45 cm encontra-se no intervalo de
238.117,15 m3 a 302.924,09 m3.

70
Amostragem simples ao acaso

i) limite de erro

E = t × s ( y ) = 2,0555 x 4,4108221 = 9,0664448 m3/ ha


t 2Vˆ ( y ) 2,05552  526,2885
n   38,71
2 t 2Vˆ ( y ) 2 2,05552  526,2885
E  7,5691276 
N 14296

j) dimensionamento da amostra

Supondo-se que o limite de erro requerido para o inventário


florestal seja de LE = 0,1 (10 %). O resultado do limite de erro obtido
para a variável resposta volume com DAP 45 cm foi de 11,98 %
para 27 unidades de amostra. Então, deve-se calcular o número de
unidades de amostra, visando atender ao limite de erro desejado de
LE = 0,1 e, finalmente, calcular o número de unidades faltantes.
t 2Vˆ ( y ) 2,05552  526,2885
n   38,71
2 t 2Vˆ ( y ) 2 2,05552  526,2885
E  7,5691276 
N 14296

n = 39 unidades de amostra
E = t × s ( y ) = 0,1 x 75,691276 = 7,5691276 m3

Conclui-se que se deve voltar ao campo e medir mais 12


unidades de amostra, para totalizar 39 unidades e assim atender
ao limite de erro fixado de LE = 0,10, visto que foram medidas
apenas 27 unidades.

4.2 Amostragem simples ao acaso para propor-


ções e porcentagens

Em inventários florestais, frequentemente, deseja-se esti-


mar o número total, a proporção ou a porcentagem de unida-

71
Amostragem em inventário florestal Waldenei Travassos de Queiroz

des da população que apresenta certa característica ou atributo.


Alguns resultados como número de árvores mortas, a porcen-
tagem de ocorrência de uma determinada espécie, número de
árvores que estão produzindo sementes são informações muitas
vezes requeridas em alguns inventários.
A classificação do atributo, na maioria dos levantamen-
tos, pode ser incluída na ficha de campo sob forma de pergunta
construída para ser respondida com um simples “sim” ou “não”.
Seja uma população com N unidades, tal que qualquer uni-
dade pertença a uma das duas categorias C1 e C0, sendo que C1
corresponde às unidades que possuem o atributo desejado e C0
define as unidades que não o possuem. Então, pode-se definir:
A = número de unidades da população que pertence à ca-
tegoria C1;
a = número de unidades da amostra classificado na cate-
goria C1;
N = tamanho da população;
n = tamanho da amostra;
P = A / N é a proporção de unidades da categoria C1 na
população;
p = a / n é a proporção de unidades da categoria C1 na
amostra.
Tem-se que p é uma estimativa de P e Np é uma estimativa
de A.
Em inventários florestais, a distribuição binomial é a mais
usada para obter as estimativas de a e p, pois, frequentemente,
as populações são infinitas. Para populações finitas, a distribui-
ção binomial constitui uma boa aproximação, embora a distribui-
ção correta, neste caso, seja a hipergeométrica.

72
Amostragem simples ao acaso

4.2.1 Valores populacionais, estimadores e dimensiona-


mento da amostra

Para quantificar os resultados, seja a seguinte regra para


qualquer unidade y i da amostra ou da população:

y i = 1 , se y i estiver contido em C1;


y i = 0 , se y i estiver contido em C0;

Para a população de valores y i , resulta que:


N
Y = ∑ yi = A
i =1
N

∑y i
A
Y = i =1
= =P
N N

Para a amostra de valores y i , tem-se:


n

∑y
i =1
i =a

∑y i
a
y= i =1
= =p
n n

a
Dado que Yˆ = N y , então Yˆ = N × = N
pNp.
n
A estimação de A e P consiste em obter os valores médio
e total de uma população, onde todos os y i têm valor 1 ou 0.
Então:

73
Amostragem em inventário florestal Waldenei Travassos de Queiroz

y
i 1
2
i  A  Np
n

y
i 1
2
i  a  np

Por conseguinte:
N N

(y
i 1
i  Y )2 y
i 1
2
i  NY 2
NP  NP 2 NP (1  P) NPQ
V ( y)     
N 1 N 1 N 1 N 1 N 1

Para: Q = 1 − P

Destarte:
n

∑(y i − y) 2
npq
Vˆ ( y ) = i =1
=
n −1 n −1

Então:
N  n V ( y) N  n NPQ N  n PQ
V ( y )  V ( p)  ( ) ( ) ( )
N n Nn N  1 N 1 n

Por conseguinte:
N  n Vˆ ( y ) N  n npq ( N  n)
Vˆ ( y )  Vˆ ( p )  ( ) ( )  pq
N n Nn n  1 N (n  1)

Para o valor total populacional e seu estimador:

V (Yˆ ) = V ((Np)
p )=
N =N
N22V(p)
V ( p)

Vˆ (Yˆ ) = Vˆ ( Np
p ) = N 2Vˆ ( p )
N

74
Amostragem simples ao acaso

Para obter o intervalo de confiança para P, considera-se


que os dados seguem uma distribuição aproximadamente nor-
mal, resultando:
1
IC  p  [t 1  f ] , onde f = n / N e o termo
pq /(n  1) 
2n
1 / 2n é uma correção de continuidade.

Para o valor total Y , virá:


1
IC  Yˆ  N [t 1  f pq /(n  1)  ]
2n

O dimensionamento da amostra é o mesmo discutido ante-


riormente, onde conhecendo: t , Vˆ ( y ) e E , têm-se:

npq
Vˆ ( y ) =
n −1
EE == LE
E ×y
L
n

∑y i
a
y= i =1
= = p.
n n
Dado que:

N − n V ( y)
E = t × s ( y ) e Vˆ ( y ) = Vˆ ( p ) = ( ) .
N n
Então:

N − n 1 npq N − n ppq
q
Vˆ ( y ) = Vˆ ( p) = ( ) × =( )
N n n −1 N n −1
Portanto:

75
Amostragem em inventário florestal Waldenei Travassos de Queiroz

N  n pq n pq t 2 pq t 2 npq
E2  t2 ( )  t 2 (1  )  
N n 1 N n  1 n  1 N (n  1)
2 2 2 npq
(n  1) E  t pq  t
N
npq
nE 2  E 2  t 2 pq  t 2
N
2 2 npq 2 2
nE  t  E  t pq
N

t 2 pq  E 2
n
t 2 pq
E2 
N

Exercício 4.2

Seja uma pesquisa sobre a ocorrência de uma determinada


doença em um povoamento florestal com 100.000 árvores, onde foi
tomada uma amostra simples ao acaso de 800. Verificou-se que 90
plantas da amostra apresentaram os sintomas da doença. Estimar
a proporção e o número total de plantas doentes do povoamento.
Dado que:
N  100.000 ; n  800; a  90; . Tem-se:
N  100.000 ; n  800; a  90; . Tem-se:
Têm-se:
f 
800
 0,008; p  a / n  90 / 800  0,1125;
100800
.000
f   0,008; p  a / n  90 / 800  0,1125;
q  1100
 p.000
 1  0 ,1125  0,8875.
q  1  p  1  0( N ,1125
 n ) 0,8875 . .000  800 )
(100
Vˆ ( y )  Vˆ ( p )  pq   0,1125  0,8875
N( N
( nn1)) 100
(100..000
000  799
800 )
Vˆ ( y )  Vˆ ( p )  pq   0,1125  0,8875
(NN(nn1)) 100.000  799
Vˆ ( y )  Vˆ ( p )  pq  0,0001239612015
N( N
( nn1))
Vˆ ( y )  Vˆ ( p )  pq  0,0001239612015
ˆ N (n  1)
s( p)  V ( p )  0,011133786
s( p)  Vˆ ( p )  0,011133786

76
Amostragem simples ao acaso

Resultando o seguinte intervalo de confiança para P usan-


do t = 2,0 ( a = 00,05):
,05
1
IC  p  [t 1  f pq /(n  1)  ]
2n
1
IC  0,1125  [ 2,0 1  0,008 0,1125  0,8875 / 799  ]
2  800
1
IC  0,1125  [ 2,0  0 ,9960  0,01117859  ]  0,1125  0,022892752
2  800
0,0896  P  0 ,1354

Conclui-se que, com 95% de probabilidade de acerto, a


proporção de plantas doentes situa-se no intervalo de 0,0889 a
0,1354.

Dado que Yˆ = N y ou Yˆ  N  Np  100.000  0,1125  11.250 .


a
n
Então, o intervalo de confiança para o total, será:

Conclui-se que, com 95% de probabilidade de acerto, o


número esperado de plantas doentes situa-se no intervalo de
8.890 a 13.540, que corresponde a um limite de erro de 19,79%.

77
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Supondo que o limite de erro requerido para o levanta-


mento seja de LE = 0,1 (10 %). O resultado do limite de erro
obtido para a variável resposta (ocorrência da doença) foi de
19,79 para 800 unidades de amostra. Então, deve-se calcular o
número de unidades de amostra, visando atender ao limite de
erro desejado de LE = 0,10 e, finalmente, calcular o número de
unidades faltantes.
Dado:
n

∑y i
a
y= i =1
= =p
n n
npq 800 × 0,1125 × 0,8875
Vˆ ( y ) = = = 0,09996871
n −1 799
Então:
t 2 pq  E 2 22  0,1125 0,8875  (0,10  0,1125) 2
n   3.060
2 t 2 pq 2 22  0,1125  0,8875
E  (0,10 0,1125) 
N 100.000

Conclui-se que é necessário retornar ao campo e medir


mais 2.260 plantas, para totalizar 3.060 unidades e assim aten-
der ao limite de erro fixado de LE = 0,10, visto que foram medi-
das apenas 800 unidades.

78
Capítulo 5

AMOSTRAGEM ESTRATIFICADA

Define a amostragem estratificada e apresenta recomen-


dações de quando aplicá-la em inventário florestal. Descreve
os critérios para se proceder à estratificação. Descreve os pa-
râmetros populacionais e os seus estimadores. Mostra a teoria
para obtenção de intervalos de confiança e dimensionamento
da amostra, assim como compara a precisão desta em relação
à amostra simples ao acaso. Descreve um estudo de caso para
inventário florestal de áreas extensas apresentando subpopula-
ções com diferentes intensidades de amostragem, o que poderá
ocorrer no Inventário Florestal Nacional (IFN) do Brasil quando
da realização do levantamento na Amazônia. Mostra exemplos
sobre todos os temas citados.
Amostragem estratificada

A amostragem estratificada consiste em dividir uma po-


pulação de tamanho N em L subpopulações constituídas de
N 1 , N 2 , L , N L unidades, tal que não haja superposição e, juntas,
totalizem a população de tamanho N, ou seja:

L
N = ∑ N h , tal que h = 1, L , L.
h =1

As subpopulações, denominadas estratos, devem ter os


valores Nh conhecidos, pois dentro de cada estrato, separada-
mente, seleciona-se uma amostra de tamanho nh. A grandeza
amostral para a população será igual a n = n1 + n2 + L + n L .
Em inventários florestais, a amostragem estratificada é re-
comendável para o estudo de populações florestais que apre-
sentem heterogeneidade entre as subpopulações com referên-
cia à variável de interesse. Nesse caso, a estratificação pode
propiciar um aumento no grau de precisão do inventário, pois,
torna possível subdividir uma população heterogênea em estra-
tos que, individualmente, sejam homogêneos, resultando ganho
em eficiência e diminuição dos custos.
A determinação dos estratos é feita em função das carac-
terísticas peculiares da população florestal, onde, em muitos ca-
sos, os estratos já estão fisicamente definidos, como no caso
de povoamentos florestais plantados com talhões de diferentes
idades. Por outro lado, existem casos em que a delimitação dos
estratos (tipos florestais) só é possível através de levantamentos
aerofotogramétricos. O processo para obter os estratos denomi-
na-se estratificação e a amostra é dita estratificada.
Denomina-se amostra acidental estratificada quando são
selecionadas amostras inteiramente ao acaso nos estratos.
De acordo com Cochran (1965), há diversos critérios para
se proceder à estratificação. Os principais são os seguintes:

81
Amostragem em inventário florestal Waldenei Travassos de Queiroz

a) a estratificação ideal é aquela realizada segundo a magni-


tude do valor da variável de interesse, obtendo-se ganho de preci-
são quando houver variação sensível entre os estratos definidos;
b) a estratificação de conformidade com a variação da ve-
getação pode ser de interesse para o inventário florestal; entre-
tanto, não é assegurado, com relação às variáveis respostas,
existir variabilidade entre os estratos. Por outro lado, se houver
correlação entre o tipo de vegetação e os valores das variáveis
respostas, então a estratificação com base na florística resultará
na estratificação das variáveis respostas; nesse caso, há ganho
de precisão;
c) razões administrativas podem direcionar para a utiliza-
ção da estratificação, visando principalmente caracterizar pecu-
liaridades locais ou regionais.
Existem casos em que, por falta de informações prelimina-
res ou mesmo ausência de instrumentos que possam viabilizar a
estratificação da floresta, pode-se, depois de tomada a amostra,
proceder a uma pós-estratificação com respeito às variáveis res-
postas mensuradas.
Inventários florestais delineados a atender a planificação
de técnicas de manejo de florestas naturais, obrigatoriamente,
devem abranger e explicar as principais variáveis que compõem
a estrutura do povoamento. Nesse caso, verifica-se que são re-
queridas diversas variáveis, as quais estão inter-relacionadas, e,
para tornar possível caracterizar a estrutura desses tipos flores-
tais, é necessário analisá-las estatisticamente através de técni-
cas de análise multivariada. Para proceder à análise estatística
dessas informações multidimensionais, Queiroz (1984) apresen-
ta uma metodologia de pós-estratificação multidimensional fun-
damentada na análise de fatores, através do método da máxima
verossimilhança, para um conjunto de variáveis respostas, vi-

82
Amostragem estratificada

sando obter mapas tipológicos para um povoamento florestal lo-


calizado na região do planalto da Floresta Nacional do Tapajós.

5.1 Valores populacionais e estimadores por es-


trato

Para formular os valores populacionais e estimadores, será


usada a seguinte notação:
N = número total de unidades em que a população foi di-
vidida;
N h = número de unidades em que o h-ésimo estrato foi
dividido;
n = número de unidades de amostra a serem medidas
considerando todos os estratos;
n h = número de unidades de amostra a serem medidas no
h-ésimo estrato;
yhi = valor observado da variável resposta referente à i-
ésima unidade de amostra no h-ésimo estrato;
Nh
Wh = = peso do h-ésimo estrato;
N
nh
= fator de amostragem no h-ésimo estrato;
Nh
Nh
= fator de expansão no h-ésimo estrato;
nh
L= número de estratos.
A formulação da análise estatística a ser apresentada refe-
re-se à aplicação em cada estrato da amostra simples ao acaso.

a) valor médio por estrato

83
Amostragem em inventário florestal Waldenei Travassos de Queiroz

a1) valor médio populacional por estrato


Nh

y
i 1
hi
Yh 
Nh

a2) estimador do valor médio por estrato


nh

y
i 1
hi
yh 
nh

b) valor total por estrato


b1) valor total populacional por estrato

Yh = N h Yh

b2) estimador do valor total por estrato

Yˆh = N h y h

c) variância por estrato


c1) variância populacional por estrato
Nh
2
Nh Nh ( y hi )
(y hi  Yh ) 2 y 2
hi  i 1
Nh
i 1 i 1
Vh ( y )  
Nh  1 N h 1

c2) estimador da variância por estrato


nh
2
nh nh ( y hi )
 (y hi  yh ) 2 y 2
hi  i 1

nh
Vˆ ( y )  i 1
 i 1

n h 1 nh  1

84
Amostragem estratificada

d) desvio padrão por estrato


d1) desvio padrão populacional por estrato

S h ( y ) = Vh ( y )

d2) estimador do desvio padrão por estrato

s h ( y ) = Vˆh ( y )

e) variância da média por estrato


e1) variância da média populacional por estrato
Vh ( y ) N h − n h
V ( yh ) = ( )
nh Nh

e2) estimador da variância da média por estrato

Vˆ ( y ) N h − n h
Vˆ ( y ) = ( )
nh Nh
Em relação à aplicação da amostragem, uma população
pode ser classificada como finita ou infinita. Determinadas po-
pulações finitas podem ser consideradas infinitas desde que o
tamanho da amostra seja no máximo 5% da área, ou seja:
Nhh −−nnhh))( N
1) Se ((N NNhhh≥≥− 0n00,95,
,h,9595) ,,N ha≥população
0,95 , é denominada in-
finita;
2) Para ( N h − nh ) ( N Nh h < − 0n,h95) ,Nah população
<0,95, ≥ 0,95 , é definida como
finita.
O termo ( N h − nh ) ( N Nh h − h ) N h ≥ 0,9
é ndenominado 5 correção
, para popu-
lação finita.

85
Amostragem em inventário florestal Waldenei Travassos de Queiroz

f) erro padrão por estrato


f1) erro padrão populacional por estrato
S ( yh ) = V ( yh )

f2) estimador do erro padrão por estrato


s ( y h ) = Vˆ ( y h )

g) coeficiente de variação por estrato


g1) coeficiente de variação populacional por estrato
S ( y)
CVh %  h  100
Yh

g2) estimador do coeficiente de variação por estrato


s ( y)
CVˆh % = h × 100
yh

h) intervalo de confiança por estrato


h1) intervalo de confiança para a média populacional por es-
trato ( Yh ), se conhecida a variância populacional por estrato Vh(y).
S ( y) S ( y)
P( y h − Za / 2 h ≤ Yh ≤ y h + Z a / 2 h ) = 1 − a
nh nh

h2) intervalo de confiança para a média populacional por


estrato ( Yh ), se desconhecida a variância populacional por es-
trato Vh(y).
s h ( y) s h ( y)
P( y h −ta / 2 ≤ Yh ≤ y h + t a / 2 ) =1−a
nh nh

Ou, simplesmente,

IIC
C = y h ± t × s( y h )

86
Amostragem estratificada

N h − nh s h ( y )
IC
IC = y h ± t × (populações finitas)
Nh nh
s h ( y)
IC
IC = y h ± t (populações infinitas)
nh

5.2 Valores populacionais e estimadores conside-


rando todos os estratos

a) valor médio global (média estratificada)


a1) média estratificada populacional
L L
Nh
Yest = ∑ Yh = ∑WhYh
h =1 N h =1

a2) estimador da média estratificada


L
N L
y est = ∑ h y h = ∑ Wh y h
h =1 N
h =1

A estimativa da média estratificada ( y est ), geralmente, não


apresenta o mesmo valor da média amostral ( y ).
nh

∑n
h =1
h yh
y=
n

A média estratificada ( y est ) e a média amostral ( y ) somen-


te são coincidentes quando a fração amostral é a mesma para
todos os estratos. Neste caso, a estratificação é definida com
alocação ou partilha proporcional, fornecendo uma amostra au-
toponderada, tendo-se:

87
Amostragem em inventário florestal Waldenei Travassos de Queiroz

nh n
=
Nh N

b) valor total global


b1) valor total global populacional
Y = NYest

b2) estimador do valor total global

Yˆ = Ny est

c) variância da média estratificada


c1) variância da média estratificada populacional
L
N
V ( y est ) = V (∑ h y h ) . Então:
N
L h =1 L
V ( y) N h − nh
V ( y est ) = ∑ Wh2V ( y h ) = ∑ Wh2 h ( )
h =1 h =1 nh Nh
c2) estimador da variância da média estratificada
L
Vˆ ( y ) N h − nh
Vˆ ( y est ) = ∑Wh2 ( )
h =1 nh Nh
Desenvolvendo, tem-se:
L
W 2Vˆ ( y ) L WhVˆh ( y )
Vˆ ( y est ) = ∑ h −∑
h =1 nh h =1 N

d) erro padrão da média estratificada


d1) erro padrão da média estratificada populacional
L
Wh2Vh ( y ) L WhV ( y )
S ( y est ) = ∑
h =1 nh
−∑
h =1 N

88
Amostragem estratificada

d2) estimador do erro padrão da média estratificada


L

Wh2Vˆ ( y ) ∑
L
WhVˆh ( y )
s ( y est ) = ∑ − h =1
h =1 nh N

e) intervalo de confiança para o valor médio global

IC
IC = y est ± t × s ( y est )

Para a obtenção do valor “t” tabelar, recomenda-se proce-


der da seguinte forma:

e1) tomar t = 2 se a amostra é grande;

e2) se a amostra é pequena e se os estratos possuem ba-


sicamente a mesma variância, toma-se como número final de
graus de liberdade a soma dos graus de todos os estratos:
L
nGL   (nh  1);
h 1

e3) se a amostra é pequena e as variâncias dos estratos


são diferentes (heterogêneas), calcula-se o número de graus de
liberdade pelo método de Satterthwaite (1946), ou seja:
L
[  g h V h ( y) ]2
N h ( N h − nh )
nGl  h 1 , onde g h = .
L
g h2V h2 ( y ) nh

h 1 nh  1

89
Amostragem em inventário florestal Waldenei Travassos de Queiroz

f) intervalo de confiança para o valor total global

IC  Yˆ  t  s(Yˆ )  N [ y est  t  s( y est )]

g) dimensionamento da amostra acidental estratificada

Na amostragem estratificada, a definição do tamanho da


amostra se faz, fundamentalmente, através de duas formas de
alocação ou partilha nos estratos.

1) Alocação ou partilha proporcional.

2) Alocação ou partilha ótima.

1) Alocação ou partilha proporcional

Na alocação proporcional, a definição do número de uni-


dades n da amostra é obtida atendendo-se à proporcionalidade
dos estratos:

n h N h , para n = nW
= h h
n N
Dada a fórmula da variância da média estratificada estima-
da: L
W 2Vˆ ( y ) L WhVˆ ( y )
Vˆ ( y est ) = ∑ h h −∑
h =1 nh h =1 N
Substituindo n h por nh = nWh , tem-se:

ˆ
L
Wh2 Vˆh ( y) L
W Vˆ ( y )
V ( y est )    h h
nWh N

h 1 h 1

Seja E = t × s ( y est ) a semiamplitude do intervalo de confian-


ça ou expectância do erro. Então:

90
Amostragem estratificada

E 2  t 2 [s( y est )]2  t 2Vˆ ( y est )


L
W h2 Vˆ ( y ) 1 L
E 2  t 2 [
h 1 nW h

N W Vˆ ( y) ]
h 1
h

t2 L ˆ t2 L

W Vˆ ( y )
2
E   W V
n h 1 h h
( y) 
N h 1
h h

t2 L
t2 L

W Vˆ ( y )  E W Vˆ ( y)
2
h  h
n h 1 N h 1

L
t2 L
t
2
 W Vˆ ( y)  n[ E
h
2
 W Vˆ ( y )]
N h1 h
h 1

L
t 2  WhVˆh ( y )
h 1
n 2 L
t
E 2

N
W Vˆ ( y )
h
h 1


A partilha dentro dos estratos é feita de tal forma que nh = nWh.

2) Alocação ou partilha ótima

Na alocação ótima, a definição da intensidade de amostra-


gem n e as grandezas amostrais nos estratos nh são definidas
tendo em vista tornar mínimo o valor da variância da média es-
tratificada V ( y est ) dentro de determinado limite de custo ou tor-
nar mínimo o custo para um valor fixado de V( y est ).
Seja a função custo linear mais simples a ser utilizada na
dedução:
L
C = C 0 + C1 n1 + C 2 n 2 + ... + C L n L = C 0 + ∑ C h n h
h =1

91
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Sendo:

C = custo total do inventário florestal;


C0 = despesas gerais (fixas);
Ch = custo médio de medição por unidade medida no h-
ésimo estrato.

Para atender a condição de tornar mínimo o custo para um


valor especificado da variância da média estratificada, ou torná-
la mínima para um determinado limite de custo, resulta em um
problema de estudo de mínimo condicionado. Neste caso, usar
o processo de cálculo dos coeficientes de Lagrange, para tornar
mínimo o valor de V ( y est ) , respeitando a seguinte restrição:

C1n 1 + C 2 n 2 + ... + C L n L = C − C 0
.

Dado que:
L
Wh2Vh ( y ) 1 L
V ( y est ) = ∑ − ∑W V h h ( y)
h =1 nh N h =1

E a função de Lagrange Z:
L
Z = V ( y est ) + l (∑ C h n h − C + C 0 )
h =1

Então, calcula-se n h e o coeficiente l tal que o valor de Z


seja mínimo.
L
Wh2Vh ( y ) 1 L
Z =∑ − ∑W V h h ( y ) + l (C1 n1 + C 2 n 2 + ... + C L n L − C + C 0 )
h =1 nh N h =1

Diferenciando em relação a n h (h = 1,...,L), tem-se:

92
Amostragem estratificada

W12V1 ( y )
dZ  (    C1 )dn1
n12
W22V 2 ( y )
dZ  (    C 2 ) dn2
n22
...
Wh2V h ( y )
dZ  (    C h ) dnh
nh2
...

W L2V L ( y )
dZ  (    C L )dn L
n L2

Igualando as derivadas parciais a zero, têm-se:



W S ( y)
l n1 = 1 1
... C1

Wh S h ( y )
l nh = (5.1)
... Ch

WL S L ( y)
l nL =
CL

Efetuando-se o somatório para todos os estratos, tem-se:


L
Wh S h ( y )
n l =∑ (5.2)
h =1 Ch
Finalmente, dividindo membro a membro as expressões
5.1 e 5.2, obtém-se:

93
Amostragem em inventário florestal Waldenei Travassos de Queiroz

nh Wh S h ( y ) / C h
= L
n
∑ (W S
h =1
h h ( y) / C h )

Wh S h ( y ) / C h
nh = n L
(5.3)
∑ (W S
h =1
h h ( y) / C h )

A Expressão 5.3 recomenda dimensionar uma amostra


maior no estrato, se:
a) o estrato é maior;
b) o estrato possui maior variância;
c) a medição de campo é mais barata no estrato.
Para obter a fórmula para o número definitivo de unidades
de amostra (n) através das estimativas de Vh ( y ) , deve-se fixar a
semiamplitude do intervalo de confiança ou expectância do erro
E = t × s ( y est ). . Logo:

E 2 = t 2 s ( y est ) 2 = t 2Vˆ ( y est )

Por conseguinte:
L
W 2Vˆ ( y ) 1 L
E 2 = t 2 [∑ h − ∑ WhVˆ ( y )]
nh N h =1
h =1

Substituindo nh dado pela Expressão 5.3, tem-se:


L
Wh2Vˆh ( y ) 1 L
E  t [
2 2

Wh sh ( y ) / C h

N W Vˆ ( y)]
h
h 1 h 1
n L

W s h h ( y) / C h
h 1

94
Amostragem estratificada

L L
Wh2Vˆh ( y ) t2 L
E 2  t 2 [Wh sh ( y ) / C h )(
h1 h 1 nWh s h ( y ) / Ch
]
N
W Vˆ ( y )
h 1
h h

L W s ( y) C
t2 L L
E2 +
N

h =1
W h Vˆ ( y ) = t 2
[ ∑
h =1
W s
h h ( y ) / C h ) ( ∑
h =1
h h

n
h
]

t2 L L L
n[ E 2 + ∑
N h =1
WhVˆh ( y )] = t 2 [∑Wh s h ( y ) / C h )(∑Wh s h ( y ) C h ]
h =1 h =1

Resultando:
L L
t 2 [ Wh sh ( y ) / C h )(Wh s h ( y) C h ]
n h 1
2
h 1
(5.4)
L
t
E2 
N
 W Vˆ ( y )
h h
h 1

Se forem admitidos custos iguais para medição das unida-


des de amostra nos estratos, tem-se a denominada Partilha de
Neyman e as Equações 5.4 e 5.3 passam a ser escritas respec-
tivamente por:
L
t 2 [ ∑ Wh s h ( y ) ] 2
Wh s h ( y )
n= h =1
L
, sendo n h = n L
.
∑W Vˆ ( y)
h ∑W s h h ( y)
E +t
2 2 h =1 h =1
N
5.3 Precisão da amostra estratificada em relação
à amostra simples ao acaso

Quando a estratificação é empregada de forma eficien-


te, resulta para os valores da média e do total estimados uma
menor variância que a amostra simples ao acaso de grandeza

95
Amostragem em inventário florestal Waldenei Travassos de Queiroz

similar. Por outro lado, não é verdadeiro afirmar que qualquer


amostra estratificada seja mais precisa que uma amostra sim-
ples ao acaso, considerando-se uma mesma fração amostral.
Por exemplo, se em uma amostra estratificada os valores de nh
estiverem muito diferentes do ótimo, obviamente a amostragem
estratificada poderá ser menos precisa.
Do exposto, pode-se dizer que a finalidade principal da es-
tratificação é diminuir a variância da média e a variância do total,
quando comparadas com suas similares da amostra simples ao
acaso.
Considerando as populações infinitas e para uma mesma
grandeza amostral n, sejam as variâncias das médias nos se-
guintes casos:

a) variância da média da amostra simples ao acaso

V ( y)
V Asa ( y ) =
n
b) variância da média (alocação proporcional)
L
Wh2V h ( y) L
W 2V ( y) L W hV h ( y ) L N h Vh ( y )
VPrProp
V op ( y )    h h  
h 1 nh h 1 nWh h 1 n h 1 nN

c) variância da média (alocação ótima)


L
2
[ N h Sh ( y )]
L
W 2V ( y ) L Wh2Vh ( y )
VOti ( y )   h h   h 1
2
h 1 nh h 1
Wh S h ( y ) nN
n L

W S
h 1
h h ( y)

L Nh

 (y hi Y )
2

Dado que V ( y )  h 1 i1


.
N 1

96
Amostragem estratificada

L Nh
Então, ( N − 1)V ( y ) = ∑∑ ( y hi − Y ) 2 .
h =1 i =1

Efetuando-se a partição da variação total nos componen-


tes de variância entre e dentro dos estratos:
L L
( N − 1)V ( y ) = ∑ ( N h − 1)Vh ( y ) + ∑ N h (Yh − Y ) 2
h =1 h =1

Então:
L L
1 1
N (1 − )Vh ( y ) = ∑ N h (1 − )Vh ( y ) + ∑ N h (Yh − Y ) 2
N h =1 Nh h =1

Desprezando-se as frações 1/N e 1/Nh:


L L
N
V y ) = ∑ N hVh ( y ) + ∑ N h (Yh − Y ) 2
NVhh((y)
h =1 h =1

Dividindo-se por nN, tem-se:


L L

V ( y) N V h h ( y) N h (Yh  Y ) 2
h 1 h 1
 
n nN nN

Pelas definições de V Asa ( y ) e VVProp


Pr op ( y ) :

∑W h (Yh − Y ) 2
Pr opop ((yy)) +
V Asa ( y ) = VVPrProp h =1

n
Pelo exposto, conclui-se que a variância da média da
amostra simples ao acaso será maior que a variância da média
da amostra estratificada com alocação proporcional, quando as
médias entre os estratos forem diferentes entre si, ou seja, a
estratificação somente será eficiente se existirem diferenças sig-
nificativas entre as médias dos estratos.

97
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Deduz-se, facilmente, que a amostra simples ao acaso terá


a mesma precisão da amostra estratificada se houver uma igual-
dade completa entre as médias dos estratos. Considerando ser
uma afirmação verdadeira que a alocação ótima adiciona preci-
são na amostragem estratificada, então:
L L

 N V ( y ) [ N
h h h Sh ( y )]2
h 1 h 1
VPr op ( y )  VOti ( y )  
nN nN 2
L
[ N h S h ( y )]
2

1 L
VProp ( y )  V Oti ( y )  { N hV h ( y )  h 1
}
nN h 1 N
L L

L
2[ N h S h ( y )] 2 [  N h S h ( y )] 2
1
nN 
h 1 h1
VPr op ( y )  VOti ( y )  { N hV h ( y )   }
h1 N N
L L L

L
2[ N h S h ( y )][ N h S h ( y )] N [  N h S h ( y )] 2
1
{  N hV h ( y ) 
h 1 h 1 h 1
VProp ( y )  VOti ( y )   2 }
nN h1 N N
L L

L
2 S h ( y)[  N h S h ( y)] [  N h S h ( y )] 2
1 h 1 h 1
VProp ( y )  VOti ( y )  { N h [Vh ( y)   ]}
nN h 1 N N2
L

1 L
N h S h ( y)
VProp ( y )  VOti ( y )  { N h [S h ( y)  h 1
]2 }
nN h 1 N

∑N h S h ( y) L
Denominando-se S ( y ) = h =1
= ∑ Wh S h ( y ) :
N h =1
l
2

1 L W [ S h h ( y )  S ( y )]
VPr op ( y )  V oti ( y )  
nN h 1
N h [ S h ( y )  S ( y)] 2  h 1

n
Finalmente:
l
2
 W [S
h 1
h h ( y)  S ( y)]
VPr op ( y )  Voti ( y ) 
n

98
Amostragem estratificada

O resultado acima revela que, quando existir heterogenei-


dade de variâncias entre os estratos, a alocação ótima é mais
precisa que a alocação proporcional.

Exercício 5.1

Seja uma área florestal de 10.000 ha, onde, através de téc-


nicas de interpretação de imagens fotográficas, foram detecta-
dos três estratos:
Estrato I (floresta alta sem babaçu) = 2.000 ha.
Estrato II (floresta alta com babaçu) = 5.000 ha.
Estrato III (floresta baixa cipoálica) = 3.000 ha.

Foram selecionadas nos estratos, através da amostra sim-


ples ao acaso, as seguintes quantidades de unidades de amos-
tra: n1 = 13; n2 = 15 e n3 = 12.
A estrutura da unidade amostral apresentou uma forma
retangular de 10 m de largura e 250 m de comprimento, onde
foram mensuradas todas as árvores com DAP 45 cm. Na Ta-
bela 5.1, encontram-se os dados (simulados) por estrato para os
volumes por parcela de 0,25 ha.

Tabela 5.1 - Volumes em m3 por parcela de 0,25 ha.

ESTRATO I ESTRATO II ESTRATO III

21,10 22,12 12,90 22,12 8,10 6,50


34,00 25,00 17,00 12,00 12,00 12,50
18,00 31,20 9,50 16,50 9,50 5,20
20,00 17,05 20,00 17,05 14,50 5,10
55,00 24,10 30,10 24,10 18,17
23,42 23,42 16,71 21,10
40,50 21,10 21,80 10,80
17,44 17,44 7,50

99
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Análise estatística relativa ao estrato I

a) valor médio estimado


n1
 y i1
348,93
y1  i 1
  26,840769 m 3 / 0,25 ha
n1 13

y1  107,36 m3 / ha

b) valor total estimado

Yˆ1 = N 1 y1 = 88.000
.000 × x26 26,840769 = 214.726,15
,840769 = 214 .726,15 m 3 m3

Sendo: N1 = Área/T.U.A = 2.000 ha/0,25 ha = 8.000

T.U.A = Tamanho da Unidade de Amostra

c) variância estimada
n1

n1
( y1i ) 2
y 2
1i
 i 1

n1 10802 ,3569  348,93 2 / 13


Vˆ1 ( y) 
i 1
  119,73394(m 3 / 0,25ha )2
n1  1 12
Vˆ1 ( y)  1915 ,7431(m 3 / ha ) 2

d) desvio padrão estimado

s1 ( y )  Vˆ1 ( y)  43,77 m 3 / ha

e) variância da média estimada

Vˆ ( y 1 ) / ha N 1  n1 1915,7431 8. 000  13
Vˆ ( y 1 )  ( ) ( )  147,12539 ( m 3 / ha ) 2
n1 N1 13 8 .000

100
Amostragem estratificada

f) erro padrão estimado

s ( y1 )  Vˆ ( y 1 ) / ha  147 ,12539  12 ,13 m 3 / ha

g) coeficiente de variação estimado

s( y1 ) 43,769203
C Vˆ1 %   100   100  40,77 %
y1 107,36308

h) intervalo de confiança

Limite inferior para o valor médio


y1 − t1 × s ( y1 ) =107,36308-2,1788 x 12,129525 = 80,94 m3/ ha

Na Tabela 3 do Anexo, tem-se o valor tabelar, ta/2, n –1 = 2,1788,


1

para a = 0,05 e n1 -1=12.

Limite superior para o valor médio


y1 + t1 × s ( y1 ) = 107,36308+2,1788x12,129525=133,79 m3/ ha

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor médio populacional do estrato I encontra-se no inter-
valo de 80,94 m3/ ha a 133,79 m3/ ha.

Limite inferior para o valor total


Área[ y1 − t1 × s ( y1 ) ]= 2.000 x 80,935271= 161.870,54 m3

Limite superior para o valor total


Área [ y1 + t1 × s ( y1 )]
)] = 2.000 x 133,79089 = 267.581,78 m3

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor total populacional do estrato I encontra-se no interva-
lo de 161.870,54 m3 a 267.581,78 m3.

101
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Análise estatística relativa ao estrato II

a) valor médio estimado


n2


i 1
y i2
281,74
y2    18,782667 m 3 / 0 ,25 ha
n2 15

y 2 = 75,13 m3/ ha

b) valor total estimado

Yˆ2 = N 2 y 2 = 20.000 x 18,782667 = 375.653,33 m3

Onde N2 = Área/T.U.A = 5.000 ha/0,25 ha = 20.000

c) variância estimada
n2

n2
(  y 2i ) 2
281,74 2
y 2
2i  i 1

n2
5 .681,051 
Vˆ2 ( y)  i 1
 15  27,801607 (m3 / 0,25 ha )2
n2  1 14
Vˆ2 ( y )  444,8257 (m / ha) 3 2

d) desvio padrão estimado

s 2 ( y)  Vˆ 2 ( y) / ha  21,09 m 3 / ha

e) variância da média estimada

Vˆ ( y) / ha N 2  n 2 444 ,8257 20.000  15


Vˆ ( y2 )  2 ( ) ( )  29,632805 ( m3 / ha) 2
n2 N2 15 20.000

102
Amostragem estratificada

f) erro padrão estimado


s ( y 2 )  Vˆ ( y 2 ) / ha  5,44 m 3 / ha

g) coeficiente de variação estimado


s (y) 21,09
C Vˆ2 %  2  100   100  28 ,07 %
y2 75 ,13

h) intervalo de confiança

Limite inferior para o valor médio


y 2 − t 2 × s ( y 2 ) = 75,130667 - 2,1448 x 5,4436022 = 63,46 m3/ ha

Na Tabela 3 do Anexo, tem-se o valor tabelar ta/2, n –1 = 2,1448


2

para a = 0,05 e n2 - 1 = 14.

Limite superior para o valor médio


y 2 + t 2 × s 2 ( y 2 ) =75,130667+2,1448 x 5,4436022=86,81 m3/ ha

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor médio populacional do estrato II encontra-se no in-
tervalo de 63,46 m3/ ha a 86,81 m3/ ha.

Limite inferior para o valor total


Área [ y 2 − t 2 × s ( y 2 ) ]= 5.000 x 63,45523= 317.276,150 m3

Limite superior para o valor total


Área [ y 2 + t 2 × s ( y 2 ) ] = 5.000 x 86,806105= 434.030,53 m3

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor total populacional do estrato II encontra-se no inter-
valo de 317.276,150 m3 a 434.030,53 m3.

103
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Análise estatística relativa ao estrato III

a) valor médio estimado


n3


i 1
y i3
130,97
y3    10 ,914267 m3 / 0,25 ha
n3 12

y 3 = 43,66 m3/ ha

b) valor total estimado

Yˆ3 = N 3 y 3 = 12.000 x 10,914267 = 130.971,204 m3


Para N3 = Área/T.U.A = 3.000 ha/0,25 ha = 12.000

c) variância estimada
n3

n3
(  y 3i ) 2
2 139 ,97 2
y 3i
 i 1
n3 1709,9089 
12
Vˆ3 ( y )  i 1
  25,498227 ( m3 / 0,25 ha ) 2
n3  1 11
Vˆ3 ( y)  407,9716 (m / ha)
3 2

d) desvio padrão estimado


s3 ( y)  Vˆ3 ( y) / ha  407,9716  20,20 m3 / ha

e) variância da média estimada


Vˆ ( y) / ha N 3  n 3 407,97162 12 .000  12
Vˆ ( y3 )  3 ( ) ( )  33,963637(m 3 / ha) 2
n3 N3 12 12.000

f) erro padrão estimado


s( y3 )  Vˆ ( y3 ) / ha  33,963637  5,83 m3 / ha

104
Amostragem estratificada

g) coeficiente de variação estimado


s3 ( y) 20,198307
C Vˆ3 %  100   100  46,27 %
y3 43,656667

h) intervalo de confiança

Limite inferior para o valor médio


y 3 − t 3 × s ( y 3 ) = 43,656667 - 2,2010 x 5,827833=30,83 m3/ ha

Na Tabela 3 do Anexo, tem-se o valor tabelar,


ta/2, n –1 = 2,2010, para a = 0,05 e n3-1 = 11.
3

Limite superior para o valor médio


y 3 + t 3 × s ( y 3 ) = 43,656667 + 2,2010 x 5,827833=56,48 m3/ ha

Há razão para afirmar, com uma probabilidade de acerto de


95%, que o valor médio populacional do estrato III encontra-se
no intervalo de 30,83 m3/ ha a 56,48 m3/ ha.

Limite inferior para o valor total


Área [ y 3 − t 3 × s ( y 3 ) ]= 3.000 x 30,829607= 92.488,82 m3

Limite superior para o valor total


Área [ y 3 + t 3 × s ( y 3 ) ]= 3.000 x 56,483727= 169.451,18 m3

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor total populacional do estrato III encontra-se no inter-
valo de 92.488,82 m3 a 169.451,18 m3.

105
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Análise estatística global

a) média estratificada estimada


L
8.000 20.000 12.000
yest  Wh yh   26,8408 18,7827 10,91
h1 40.000 40.000 40.000

yest  18,0338 m 3 / 0,25 ha , onde:

yest  72 ,14 m 3 / ha

b) variância da média estratificada

Sejam os seguintes cálculos auxiliares:


L
Wh2Vˆh ( y ) N Vˆ ( y ) N Vˆ ( y ) N Vˆ ( y )

h =1 nh
= ( 1 )2 1
N n1
+ ( 2 )2 2
N n2
+ ( 3 )2 3
N n3
= 1,0230089

L
N1 ˆ N N
W Vˆ ( y ) 
h 1
h h
N
V1 ( y)  2 Vˆ2 ( y )  3 Vˆ3 ( y)  45 ,49706
N N

Então:
L
W 2Vˆ ( y) L WhVˆh ( y) 1
Vˆ ( yest )   h h   1,02300   45 ,49706
h 1 nh h 1 N 40.000

Vˆ ( y est )  1,021872 ( m3 / 0,25 ha ) 2

Vˆ ( y est )  16,3499(m 3 / ha) 2

c) erro padrão da média estratificada


s ( yest )  Vˆ ( yest ) / ha  4 ,04 m 3 / ha

106
Amostragem estratificada

d) intervalo de confiança para a média estratificada

Considerando que a amostra é pequena e que há heteroge-


neidade entre as variâncias, deve-se proceder ao cálculo do número
de graus de liberdade (ngl) pelo método de Satterthwaite (1946). A
Tabela 5.2 apresenta os cálculos a serem utilizados neste método.
L
[  g h Vˆh ( y )] 2
Nh ( N h  n h ) h 1
gh  n gl 
nh L
g 2h Vˆh2 ( y )

h 1 nh  1

Tabela 5.2 - Número de graus de liberdade – Método de Satterthwaite (1946).

N h − nh
EST Nh nh g h = N h ( ) Vˆh ( y ) g hVˆh ( y ) g h2 Vˆh2 ( y ) /(nh
/( n h –− 11))
nh
I 8.000 13 4.915.076,92 119,7339 588.501.328,40 288,6115016x1014
II 20.000 15 26.646.666,67 27,8016 740.819.968,10 392,0101498x1014
III 12.000 12 11.988.000,00 25,4982 305.672.421,0 84,94148005x1014

Total 40.000 40 1.634.993.718,0 765,5631319x1014

1634993718 2
n gl   34,92
765,5631319 10 14
ngl = 35 graus de liberdade

Na Tabela 3 do Anexo, tem-se o valor tabelar ta/2, n = 2,0317 gl

para a = 0,05 e ngl = 35.

Limite inferior para o valor médio


y est − t×s ( y est ) = 72,13507 - 2,0317 x 4,0435063=63,92 m3/ ha

Limite superior para o valor médio


y est + t ×s ( y est ) = 72,13507 + 2,0317 x 4,0435063=80,35 m3/ ha

107
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Há razão para afirmar, com uma probabilidade de acerto de


95%, que o valor médio populacional encontra-se no intervalo de
63,92 m3/ ha a 80,35 m3/ ha.

Limite inferior para o valor total


Área [ y est –− t x×s (([yyestest)])]− =t ×10.000
s ( y est )] x 63,919878 = 639.198,78 m3

Limite superior para o valor total


Área [ y est –− t x×s (([yyestest)])]− =t ×10.000
s ( y est )] x 80,350262 = 803.502,62 m3

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor total populacional encontra-se no intervalo de
639.198,78 m3 a 803.502,62 m3.

e) limite de erro para o inventário florestal


E = t×s ( y est ) = 2,0317× 4,0435063 = 8,2151917 m3/ ha
E 8,211917
LE %   100   100  11,39 %
y es t 72 .13507

f) dimensionamento da amostra estratificada

Considerar o limite de erro para o inventário florestal de


10%. Na análise, o resultado obtido para a variável resposta vo-
lume para as árvores com DAP 45 cm foi de 11,39 %, para as
40 unidades de amostra. Então, deve-se calcular o número de
unidades de amostra, visando atender ao limite de erro estipula-
do de LE = 0,10 e alocar as unidades por estrato, e, finalmente,
calcular o número de unidades faltantes por estrato, o que será
feito a seguir, utilizando-se os métodos de alocação proporcional
e alocação ótima.

108
Amostragem estratificada

f1) alocação proporcional

E = LE × y est = 0,10× 18,033767 = 1,8033767 m3


L
N1 ˆ N N
 W hVˆh ( y )  V1 ( y)  2 Vˆ2 ( y )  3 Vˆ3 ( y )  45,49706
h1 N N N
L
t 2 WhVˆh ( y )
h 1 2,03172  45,49706
n L
  57,66
2,0317 2  45,49706
t 2  Wh Vˆh ( y ) 2
1,8033767 
40.000
E2  h 1
N
n = 58 unidades de amostra

Logo, pelo critério da proporcionalidade, tem-se:


8 .000
ESTRATO I: n1  nW1  57 ,66   11,53
40 .000
n 1  12 unidades

ESTRATO II: n2  nW2  57,66  20.000  28,83


40.000
n 2  29 unidades

12 .000
ESTRATO III: n3  nW3  57,66   17 ,30
40.000
n 3 = 18 unidades

f2) alocação ótima

Dado que:
L
N1 N2 N3

h 1
Wh s h ( y) 
N
s 1( y ) 
N
s2 ( y ) 
N
s 3 ( y)

L
8.000 20. 000 12 .0 00
W h sh ( y ) 
4. 000
 119, 73394 
40. 000
 27 ,801 61 
40. 000
 25, 49 8227
h1

W s
h 1
h h ( y)  6,3396948

109
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Então:
L
t 2 [  Wh s h ( y) ] 2
h 1 2,031 2  6 ,3396948 2
n L
  50,9046526
2,031 2  45,49706
t 2  WhVˆh ( y) 2
1,8033767 
E2  h 1 40 .000
N

n = 51 unidades de amostra.

Logo, pelo critério de otimização, têm-se:


Estrato I:

W1 s1 ( y ) 2,1885
n1  n L
 50,90   17,57
6,3397
W h sh ( y)
h 1

n1 = 18 unidades de amostra.

Estrato II:

W 2s 2 ( y ) 2 ,6364
n2  n L
 50,90   21,17
6 ,3397
 Wh s h ( y)
h1

n 2 = 22 unidades de amostra

Estrato III:

W 3 s3 ( y ) 1,5149
n3  n L
 50,90   12 ,16
6 ,3397

h 1
Wh sh ( y)

n 3 = 13 unidades de amostra

g) discussão sobre a eficiência entre as alocações propor-


cional e ótima

110
Amostragem estratificada

A seguir, far-se-á uma discussão sobre a eficiência entre as


alocações ótima e proporcional. Para facilitar a análise, a Tabela
5.3 apresenta os resultados do dimensionamento dessas aloca-
ções para o limite de erro de 10%, assim como uma coluna com
os números de unidades medidas no inventário florestal referen-
te ao limite de erro de 11,39%. A Tabela 5.4 mostra os valores
das médias e das variâncias por estrato.

Tabela 5.3 - Dimensionamento das alocações ótima e proporcional.

ALOCAÇÃO ALOCAÇÃO Nº. UNID. MEDIDAS


ESTRATO
ÓTIMA (LE=10%) PROPORCIONAL (LE=10%) (LE=11,39%)
I 18 12 13
II 22 29 15
III 13 18 12
TOTAL 53 59 40

Tabela 5.4 - Médias e variâncias por estrato.

ESTRATO y h (m /ha)
3 Vˆh ( y ) /ha
I 107,36 1915,7431
II 75,13 444,8257
III 43,66 407,9716

Considerando os resultados expostos, obtêm-se as se-


guintes conclusões:
a) os resultados mostram que as médias dos estratos são
muito diferentes entre si. Pode-se, então, concluir que a estrati-
ficação foi eficiente, mesmo utilizando a alocação proporcional;
b) os resultados demonstram que há diferenças entre as
variâncias dos estratos II e III em relação à variância do estrato I.
Conclui-se, dada a existência de heterogeneidade de variâncias
entre os estratos, que o emprego da alocação ótima resultará
numa maior precisão em relação à utilização da alocação pro-
porcional;

111
Amostragem em inventário florestal Waldenei Travassos de Queiroz

c) o exemplo ilustrativo acima exposto evidencia a maior


precisão da alocação ótima, visto necessitar, para atender um
limite de erro de LE = 0,10, de menos unidades de amostra que
a alocação proporcional. Para atender ao limite de erro de LE =
0,10 e um nível de confiança de 0,95, deve-se, através da aloca-
ção ótima, retornar ao campo e medir nos estratos I, II e III, res-
pectivamente, mais 5, 7 e 1 unidades de amostra e, assim, totali-
zar 53 unidades. Entretanto, se a opção fosse utilizar a alocação
proporcional, haveria a necessidade de voltar ao campo e medir
nos estratos II e III, respectivamente, mais 14 e 6 unidades de
amostra e, assim, totalizar 60 unidades, visto que o estrato I foi
superdimensionado em 1 unidade.

5.4 Inventário florestal apresentando subpopula-


ções com diferentes intensidades de amostragem

Em levantamentos florestais, principalmente de áreas exten-


sas, muitas vezes é necessário classificar subáreas de acordo com
a sua importância tipológica ou estratégica, tal que determinados
estratos sejam medidos com intensidades amostrais diferenciadas.
Seja o caso do Inventário Florestal Nacional (IFN) do Brasil
que foi planejado para um grid de 20 km x 20 km. O processo
de implantação dessa rede amostral na região Amazônica, pelas
suas características diferenciadas, pode ser objeto de uma abor-
dagem específica devido às condições naturais de acesso e de
extensão territorial e, principalmente, em relação ao alto custo
do levantamento.
A Amazônia Legal Brasileira abrange uma área de aproxi-
madamente 5.217.423 km2 e estima-se que a floresta Amazô-
nica ocorra em cerca de 3.300.000 km2. Então, considerando
uma rede de unidades com distribuição sistemática segundo a

112
Amostragem estratificada

definição de um grid de 20 km x 20 km, pode-se obter aproxima-


damente 8.250 pontos amostrais.
Havendo limitação de recursos financeiros para promover
a medição de todos os 8.250 pontos da rede estabelecida, é
imprescindível promover um estudo através de sensoriamento
remoto, visando selecionar as áreas de acordo com suas prio-
ridades em termos de grau de precisão. Por outro lado, uma
variável importante, obviamente, será o custo médio por unidade
de amostra por estrato. Este custo médio, evidentemente, está
intimamente relacionado às dificuldades de acesso aos estratos.
Através de técnicas de sensoriamento remoto pode ser
construído um mapa, o qual pode apresentar as estradas, rios
navegáveis, pistas de pouso, organizações de apoio civis e mi-
litares e outros. Este mapa deverá servir de base para delimitar
as áreas (estratos) de acordo com o seu grau de dificuldade
(acessibilidade ou outros atributos estratégicos), assim como em
função dos custos. Havendo estratos com diferentes intensida-
des de amostragem, o dimensionamento amostral e a análise
estatística poderão ser realizados através da Amostra Estratifi-
cada com Partilha Ótima.
A estratificação da floresta com o objetivo de estabelecer
estratos com diferentes intensidades de amostragem pode ser
considerada como uma estratificação por razão administrativa,
visto que não objetiva diretamente ganhar precisão ou tirar con-
clusões sobre as características tipológicas.

Exercício 5.2

Seja o exemplo em que os estudos sobre a acessibilidade


e os custos médios de medição por estrato resultaram nas se-
guintes decisões:

113
Amostragem em inventário florestal Waldenei Travassos de Queiroz

1) 40 % dos pontos da floresta Amazônica (estrato I) serão


medidos segundo o grid definido de 20 km x 20 km;
2) os 60 % restantes serão classificados em três estratos
(II, III, IV) e diferenciados em relação ao nível de acessibilidade
e custos na medição das parcelas.
A partir de estudos de campo e bibliográfico, foram obtidas
as seguintes informações acerca dos três estratos (II, III, IV). Ver
Tabela 5.5.

Tabela 5.5 - Dados por estrato: definição da intensidade de amostragem.

Estratos Wh sh (y) : (m3/ha) Ch Wh s h ( y ) / C h


II 0,5 11 1000 0,173925
III 0,3 9 3000 0,049295
IV 0,2 6 5000 0,016971
Total 1,0 0,240191

Wh é o peso do h-ésimo estrato;


sh(y) é o desvio padrão do h-ésimo estrato;
Ch é o custo médio de medição das parcelas no i-ésimo
estrato.
Seja C= c1n1+c2n2+c3n3+c4n4 o custo total de medição, tal
que o componente c1n1 refere-se ao custo dos 40 % da floresta
medido segundo o grid definido de 20 km x 20 km; o componente
c2n2+c3n3+c4n4 refere-se à medição dos três estratos referentes
aos 60 % da floresta que serão dimensionados a partir de graus
de precisão diferentes.

Dado C= C’+ C’’.


Tal que:
C’ = c1n1; C”= c2n2+c3n3+c4n4.

114
Amostragem estratificada

Então, estabelecer o procedimento para definir os grid para


os estratos II, III e IV, considerando os seguintes tamanhos de
amostra n2, n3, e n4. O valor para n1 do estrato I já está definido
em função do grid 20 km x 20 km.

Dado que:

nh = n ''
Wh s h ( y ) / C h , sendo n '' = n 2 + n3 + n 4 .
L

∑ (W s
h=2
h h ( y) / Ch )

Pela partilha da alocação ótima, têm-se:

W2 s 2 ( y ) / C 2 0,173925 ''
n 2 = n '' L
= n = 0,724111 n ''
0,240191
∑ (W s
h=2
h h ( y) / C h )

W3 s3 ( y ) / C3 0,049295 ''
n 3 = n '' L
= n = 0,205233 n ''
0,240191
∑ (W s
h=2
h h ( y) / Ch )

W4 s 4 ( y ) / C 4 0,016971 ''
n 4 = n '' L
= n = 0,070654 n ''
0,240191
∑ (W s
h=2
h h ( y) / Ch )

Fixando-se o custo C’’, pode-se obter o valor de n’’ da se-


guinte forma:
Substituindo, n2 = 0,724111n’’, n3 = 0,205233n’’ e n4 = 0,070654n’’,
em C”= c2n2+c3n3+c4n4.

Tem-se:
C '' = 1000 × 0,724111 × n '' + 3000 × 0,205233 × n '' + 5000 × 0,070654 × n ''

Portanto:
C ''
n '' 
1 .693,08

115
Amostragem em inventário florestal Waldenei Travassos de Queiroz

A partir do conhecimento do valor de n”, calcular n2, n3 e n4:

n2 = 0,724111× n '' ; n3 = 0,205233× n '' ; n 4 = 0,070654 × n '' .

Então, conhecendo-se as áreas dos estratos II, III, IV e os


valores de n2, n3 e n4, é possível dimensionar os grid correspon-
dentes aos estratos II, III e IV.
Outro procedimento para obter n’’ seria usar a fórmula 5.4
para h = 2, 3, 4; estabelecendo uma determinada semiamplitude
de intervalo de confiança ( E E==LLE × y est ) .
E
4 4
t 2 ( Wh sh Ch )( (Wh s h / Ch )
h 2 h 2
n' '  2 4
t
E2 
N
W s
h 2
h
2
h

116
Capítulo 6

AMOSTRAGEM SISTEMÁTICA

Define a amostragem sistemática mostrando as diferen-


ças, vantagens e desvantagens com relação à amostragem sim-
ples ao acaso na aplicação em inventários florestais. Apresenta
recomendações para obter a variância da média através de uma
única amostra sistemática. Compara a precisão da amostragem
sistemática em relação à amostra simples ao acaso. Mostra um
exercício completo comparando várias alternativas para análise
de um inventário florestal com amostragem sistemática.
Amostragem sistemática

A amostragem sistemática consiste em sortear uma uni-


dade da população e, a partir dela, para constituir uma amostra
de tamanho n, selecionar as unidades que ocupam de forma
sequencial as posições múltiplas de um determinado valor K =
N/n pré-estabelecido, onde N é o número de unidades total da
população.
A amostragem sistemática apresenta uma diferença mar-
cante com relação à amostragem simples ao acaso, no que tan-
ge ao número de amostras possíveis.
Seja uma população composta por N unidades e n repre-
sente o tamanho da amostra, sendo N = Kn. Se a amostragem for
sistemática, o número de amostras possíveis é igual a K = N/n,
enquanto que, em se tratando de uma amostra simples ao acaso
sem reposição, o número de amostras possíveis (nap) será:
n
N!
nap  C 
N n! ( N  n)!

Então, teoricamente, uma amostra sistemática não pode


ser analisada como se fosse uma amostra simples ao acaso.
A amostragem sistemática, quando comparada com a
amostra simples ao acaso, apresenta algumas vantagens, entre
as quais:
a) a seleção das unidades amostrais, na amostragem sis-
temática, é mais fácil e mais rápida;
b) a organização, a supervisão e a checagem (remedição)
de algumas unidades da amostra se tornam operacionalmente
mais fáceis;
c) o tamanho da população não precisa, necessariamente,
ser conhecido;
d) as unidades da amostra sistemática se distribuem mais
uniformemente na população, originando uma maior representa-

119
Amostragem em inventário florestal Waldenei Travassos de Queiroz

tividade, tornando-se eficiente quando existe qualquer tendência


ou concentração de certas características;
e) a amostragem sistemática é mais eficiente quando se
deseja mapear a floresta com relação à sua tipologia.
A grande desvantagem da amostra sistemática ocorre
quando a população apresenta dados com características cícli-
cas ou periódicas, pois, corre-se o risco da amostragem refletir
homogeneidade numa condição sabidamente heterogênea.
A amostragem sistemática, considerando uma mesma
grandeza amostral, poderá ter uma precisão maior que a amos-
tra simples ao acaso, desde que haja grande heterogeneidade
entre as unidades dentro das amostras sistemáticas possíveis.
Sob o ponto de vista teórico, a variância da média da
amostra sistemática somente poderá ser obtida desde que se
disponha dos valores médios de todas as amostras sistemáticas
possíveis ou, então, sejam conhecidos os valores verdadeiros
da variância da população V(y) e da variância entre as unidades
dentro das amostras sistemáticas Vd (y), o que corresponde a ter
que enumerar ou levantar a população totalmente, não sendo
factível em termos de inventários florestais.
Havendo a impossibilidade de se obter a variância da mé-
dia através de uma única amostra sistemática, pode-se, em rela-
ção a levantamentos florestais, contornar o problema utilizando
uma das seguintes recomendações:
a) de acordo com Campos (1981), quando as observações
inerentes à variável resposta estão distribuídas aleatoriamente
por algum critério objetivo ou mesmo ocorrem na floresta segun-
do leis naturais, pode-se analisar uma amostra sistemática como
inteiramente ao acaso;
b) pode-se, em vez de retirar uma única amostra de ta-
manho n, número de unidades a serem medidas no inventário,

120
Amostragem sistemática

selecionar um determinado número k’ de amostras de tamanho


n’, de tal forma que implique em n = k’ n’ e, através delas, obter
uma estimativa para a variância da média;
c) a amostragem sistemática pode ser associada à amos-
tragem por conglomerados, pois quando se subdivide uma po-
pulação de tamanho N em K amostras sistemáticas de tamanho
n, na verdade obtêm-se K grandes unidades conglomeradas.
Assim, cada amostra sistemática pode ser considerada uma
unidade conglomerada inteiramente casualizada, selecionada
de uma população composta por K conglomerados. Portanto,
havendo a seleção de uma amostra sistemática, pode-se esti-
mar a variância V ( y ) através de Vˆ ( y ) , obtida da maneira usual,
através da análise de uma amostra consistindo de apenas um
conglomerado selecionado aleatoriamente. A amostragem por
conglomerado está apresentada no capítulo 9.
Por outro lado, de acordo com as considerações contidas
no item b, e adicionando-se o exposto no item c, pode-se con-
cluir que há uma amostra consistindo de k’ conglomerados se-
lecionados aleatoriamente, podendo-se estimar a variância da
média utilizando a estrutura de análise específica por conglome-
rados.
Em termos de inventários florestais, existe a concepção da
amostragem com múltiplos inícios aleatórios, onde a estrutura
amostral é uma amostragem sistemática em dois estágios, con-
vergindo para um procedimento aleatório. Neste caso, a estru-
tura estatística é similar à da amostragem por conglomerados,
podendo-se proceder a uma análise de variância para se esti-
mar os componentes de variância entre e dentro das faixas.

121
Amostragem em inventário florestal Waldenei Travassos de Queiroz

6.1 Variância da média

Para formular os parâmetros da amostragem sistemática,


utilizar-se-á a seguinte notação:
N = número total de unidades da população;
K = número de amostras sistemáticas possíveis;
n = número de unidades pertencentes a cada amostra sis-
temática;
yij = Valor da variável resposta correspondente à j-ésima
observação da i-ésima amostra sistemática.
Seja a expressão da variância da média da amostra siste-
mática: K

∑ ( yi − Y ) 2
V Sist ( y ) = i =1
K
y i = média da i-ésima amostra sistemática.

Y = média das médias das possíveis amostras sistemáti-


cas.
Seja a fórmula da variância populacional:
K n

∑∑ ( y
i =1 j =1
ij − Y )2
V ( y) =
N −1
Então:
K n
( N − 1) V ( y ) = ∑∑ ( y ij + y i − y i − Y ) 2
i =1 j =1

K n K
( N − 1) V ( y ) = ∑∑ ( y ij − y i ) 2 + n∑ ( y i − Y ) 2 , pois,
i =1 j =1 i =1
K n

 ( y
i1 j 1
ij  yi )( y i  Y )  0.

122
Amostragem sistemática

Portanto:
K
( N − 1) V ( y ) = (n − 1)∑ Vi ( y ) + nKV Sist ( y )
i =1
K

∑ V ( y)
i =1
i
( N − 1)V ( y ) = K (n − 1) + nKV Sist ( y )
K
Por conseguinte:

NN−−11 KK((nn−−11))
Sist((yy))==((
VVSist )V)V((yy))+–+ VVdd((yy)) (6.1)
NN NN
Sendo:
Vi ( y ) = variância das observações dentro da i-ésima amos-
tra sistemática;
Vd ( y ) = média das variâncias de todas as amostras siste-
máticas possíveis.
A Fórmula 6.1 é similar às Fórmulas 6.2 e 6.3. A Expressão
6.2 é baseada na variância das médias de todas as amostras
sistemáticas possíveis, enquanto a 6.3 está escrita em função
do coeficiente de correlação ( d Sist ) entre pares de unidades que
pertencem à mesma amostra sistemática.
K

N −n
∑(y i − Y )2
V Sist ( y ) = ( ) i =1
(6.2)
N K −1

N − 1 V ( y)
V Sist ( y ) = ( ) [1 + (n − 1)d Sist ] (6.3)
N n
Tal que:
E ( yij  Y )( y iu  Y ) (K  1)nQM Entre  (Kn  1)V ( y)
 Sist  2

E( yij  Y ) ( Kn  1)(n  1)V ( y)

123
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Na expressão do d Sist , o numerador representa a média de


todos os Kn(n-1) / 2 pares diferentes de unidades e o denomina-
dor é a média de todos os Kn valores de yij. No capítulo sobre
amostragem por conglomerados há mais informações sobre o
coeficiente de correlação d Sist .
Como anteriormente observado, o grande inconveniente das
Fórmulas 6.1, 6.2 e 6.3 é que se deve conhecer a variância ver-
dadeira da população e a variância verdadeira entre as unidades
dentro das amostras sistemáticas possíveis ou os valores médios
verdadeiros. Entretanto, pode-se, com referência aos inventários
florestais, utilizar os argumentos expostos no início deste capítulo.

6.2 Precisão da amostra sistemática comparada à


amostra simples ao acaso

Sejam as fórmulas:
a) variância da média da amostra simples ao acaso

N − n V ( y)
V Asa ( y ) = ( )
N n
b) variância da média da amostra sistemática

N −1 K (n − 1)
VSist ( y ) = ( )V ( y ) − Vd ( y )
N N
A amostra sistemática será mais precisa que a amostra
simples ao acaso, se:
V Sist ( y ) < V Asa ( y )

Logo:
N −1 K (n − 1) N − n V ( y)
( )V ( y ) − Vd ( y ) < ( )
N N N n

124
Amostragem sistemática

Desenvolvendo, onde N = nK, tem-se:


1 K (n  1) n V ( y)
(1  )V ( y )  Vd ( y )  (1  )
N nK N n
V ( y ) (n − 1) V ( y) V ( y)
V ( y) − − Vd ( y ) < −
N n n N
V ( y) (n − 1)
V ( y) − <( )Vd ( y )
n n
n −1 n −1
V (y)(
( y )( )<( )Vd ( y )
n n
Sendo:
Vd ( y ) > V ( y )

Concluindo-se que a maior heterogeneidade entre as uni-


dades dentro das amostras sistemáticas resulta numa maior pre-
cisão em relação às amostras simples ao acaso.

Exercício 6.1

Seja uma área florestal com 250 ha, dividida em 1.000 uni-
dades de 0,25 ha. Os dados amostrais foram retirados de uma
população, simulada computacionalmente, com média e variân-
cias conhecidas:
A Tabela 6.1 apresenta a análise de variância populacional.

Tabela 6.1 - Análise de variância populacional.

CV GL SQ QM
Amostras (K) 19 1503,0 79,1053
Erro 980 136.158,0 138,9367
Total 999 137.661,0 137,7988

125
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Y  38,106 (m 3 / 0,25 ha )

V ( y )  137,7988 (m 3 / 0, 25 ha ) 2

Vd ( y )  138,9367 (m 3 / 0,25 ha ) 2

1) Retirar uma amostra sistemática de 50 unidades e obter


a variância da média pelas seguintes expressões:

N −1 K (n − 1)
VSist ( y ) = ( )V ( y ) − Vd ( y )
N N
K

N − n i =1
∑(y i − Y )2
V ( y Sist ) = ( )
N K −1
N − 1 V ( y)
V ( y Sist ) = ( ) [1 + (n − 1)d Sist ]
N n

2) Considerar os dados do item anterior (amostra sistemá-


tica de 50 unidades) e obter a variância da média como se fosse
inteiramente ao acaso (ASA).

N − n Vˆ ( y )
Vˆsist ( y 2 ) = ( )
N n
3) Retirar da população cinco amostras sistemáticas com
10 unidades cada e obter a variância da média por meio da ex-
pressão da amostragem por conglomerados. Ver capítulo 9.
Vˆ ( y ) Vˆ ( y)
Vˆ ( y 3 )  (1  f 1 ) 1  f 1 (1  f 2 ) 2
n mn

4) Dividir a população em vinte subpopulações com 50 uni-


dades cada, sortear sistematicamente cinco delas e, em cada

126
Amostragem sistemática

uma, selecionar uma amostra sistemática de 10 unidades. Obter


a variância da média pela expressão da Amostragem por Con-
glomerados. Ver capítulo 9.
Vˆ ( y ) Vˆ ( y)
Vˆ ( y 3 )  (1  f 1 ) 1  f 1 (1  f 2 ) 2
n mn

5) Retirar da população uma amostra aleatória de 50 uni-


dades e obter a variância da média.

N − n Vˆ ( y )
VˆAsa ( y 4 ) = ( )
N n

6) Discutir e concluir sobre os resultados

1) Variância da média da amostra sistemática de 50 uni-


dades pelas expressões (variâncias conhecidas)

N −1 K (n − 1)
VSist ( y1 ) = ( )V ( y ) − Vd ( y )
N N
Tabela 6.2 - Dados da amostra sistemática de tamanho n = 50.

26,4 68,1 17,4 35,7 47,1 33,6 43,2 43,4 44,7 31,0
32,4 37,6 35,4 18,0 42,0 15,7 36,3 36,5 34,7 42,3
43,0 32,5 34,7 48,0 34,4 55,6 37,1 39,7 42,5 45,8
32,3 57,0 29,9 30,7 54,5 32,1 41,8 48,3 19,3 56,6
51,2 40,4 41,0 36,1 31,4 37,5 31,9 38,5 41,7 29,3

Dado que:
N 1.000
K   20
n 50
n

∑y
i =1
i =1916

V ( y)  137,7988( m / 0,25 ha)


3 2

127
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Então:
n

y
i 1
i
1916
y1    38,32 m3 / ha
n 50
1 .000  1 20 (50  1) 3
VSist ( y1 )  137 ,7988  138,9367  1,503 m / 0 ,25 ha
1 .000 1.000
K

K K
(  yi ) 2
2
Nn
 (yi  Y ) ( N  n)
 yi2  i 1
K
i 1 i 1
VSist ( y1 )  ( ) 
N K 1 N K 1

Tabela 6.3 - Médias das K = 20 amostras sistemáticas.

35,690 37,042 38,140 39,274 38,266 37,22 37,596 38,134 38,844 39,144
40,464 38,828 38,448 35,342 37,648 39,66 39,196 38,244 37,99 36,946

Da Tabela 6.3 pode-se obter:


K

y
i 1
i 762,116

K
2
y
i 1
i i 29 .071,09696

Então:
K
2
K
( yi )
2 7 62,116 2
N n
y i  i 1
K 1.00 0  50
29.0 71,09 696 
20
i 1
VSist ( y 1 )  ( ) ( )  1, 503
N K 1 1 .000 19
N 1 V ( y)
VSist ( y1 )  ( ) [1  ( n  1) Sis t ]
N n
( K  1) nQM Entre  ( Kn  1)V ( y )
 Sist 
( Kn  1)( n  1)V ( y)

128
Amostragem sistemática

Da Tabela 6.1 pode-se obter:

(20  1)50  79,1053  ( 20  50  1)137, 7988  62. 510, 9662


 Sist  
( 20  50  1)(50  1)137,7988 6.745.3 89, 059

 62.510,9662
 Sis t   0,009267214338
6 .745 .389,059
1 .000  1 137 ,7988
VSist ( y1 )  ( ) [1  (50  1)( 0,0092672143 8]
1 .000 50

VSist ( y1 )  1,5030 m 3 / 0 ,25 ha ) 2

Conclui-se que os resultados comprovam a semelhança


das três fórmulas.

2) Variância da média da amostra sistemática de 50 uni-


dades, analisada como inteiramente ao acaso (ASA)

N − n Vˆ ( y )
VˆSist ( y 2 ) = ( )
N n
Pode-se obter da Tabela 6.2:
n

y i
1916
y2  i 1
  38,32 m 3 / ha
n 50
n

n
(  yi ) 2
1916,32
y 2
i  i 1
n
78.719,91 
50  107,6693 (m 3 / 0,25 ha ) 2
Vˆ ( y )  i 1

n 1 49

Então:
N  n Vˆ ( y ) 1.000  50 107,6693
VˆSist ( y 2 )  ( ) ( )  2,0457 (m 3 / 0,25 ha ) 2
N n 1.000 50

129
Amostragem em inventário florestal Waldenei Travassos de Queiroz

3) Variância da média para as cinco amostras sistemá-


ticas com 10 unidades (Amostragem por conglomerados)

Da população de N = 1.000 foram selecionadas sistemati-


camente cinco amostras com 10 unidades. Neste caso K = 100.

Tabela 6.4 - Dados das cinco amostras sistemáticas.

A1 A2 A3 A4 A5
1 47,1 37,6 26,6 36,7 48,9
2 31,0 46,0 52,6 38,8 72,2
3 42,0 48,1 39,9 24,3 34,3
4 42,3 21,4 34,9 34,8 50,6
5 34,4 48,3 40,5 58,2 35,7
6 45,8 47,2 24,7 28,1 37,2
7 54,5 44,1 46,1 51,4 58,1
8 56,6 13,5 35,0 30,4 35,8
9 31,4 27,3 69,6 55,3 46,5
10 29,3 38,6 33,9 48,7 53,0
yi 41,44 37,21 40,38 40,67 47,23

Vˆi ( y ) 95,47 153,17 174,76 142,90 146,78

Vˆ ( y ) Vˆ ( y )
Vˆ ( y3 )  (1  f1 ) 1  f1 (1  f 2 ) 2
k km

Sendo: m = 10 e k = 5.
k

y
i 1
i
206,93
y3    41,386 m 3 / ha
k 5

130
Amostragem sistemática

Tabela 6.5 - Análise de variância estimada por conglomerados.

CV GL SQ QM
Entre 4 531,1892 132,7973
Dentro 45 6417,6910 142,6154
Total 49 6948,8802 141,8139

k k
(∑ y i ) 2
∑(y i − y) 2 ∑y i
2
− i =1

k
Vˆ1 ( y ) = i =1
= i =1

k −1 k −1
206,93 2
8.617,1239 
Vˆ1 ( y )  5  13,27973 (m 3 / 0,25 ha) 2
4

Note-se que:
QMˆ Entre 132,7973
Vˆ1 ( y)    13,27973 ( m 3 / 0,25 ha ) 2
m 10
k m

  ( y ij  y i ) 2
i1 j 1
Vˆ 2 ( y)   142 ,616 (m 3 / 0 ,25 ha ) 2
k ( m  1)
n

Vˆ ( y ) i
1
Vˆ2 ( y )  i 1
 (95, 47  153,17  17 4, 76  142, 90  146,78)  142, 616
k 5

Dado:

M  50; K  20; f1  k  5  0 ,25; f 2  m  10  0,5


K 20 M 50

131
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Então:

13,27973 142,6154
Vˆ ( y 3 )  (1  0,25)  0,25(1  0,5)  2,3485 (m 3 / 0,25 ha ) 2
5 10  5

4) Variância da média para as cinco subpopulações


com 10 subparcelas (Amostragem por conglomerados)

A população de N = 1.000 foi dividida em K = 20 subpopu-


lações de 50 unidades e numeradas de 1 a 20. Foram seleciona-
das as subpopulações: 2, 6, 10, 14 e 18 e dentro de cada foram
retiradas sistematicamente 10 unidades.
Vˆ ( y ) Vˆ ( y )
Vˆ ( y4 )  (1  f1 ) 1  f1 (1  f 2 ) 2
k km

Tabela 6.6 - Dados considerando cinco subpopulações.

A1 A2 A3 A4 A5
1 24,5 23,8 40,6 34,0 39,6
2 17,4 35,4 34,7 29,9 41,0
3 22,6 46,2 44,3 38,1 49,5
4 31,5 49,6 32,1 28,9 16,5
5 50,0 60,3 44,4 28,4 51,4
6 35,7 18,0 48,0 30,7 36,1
7 43,9 42,8 33,8 21,8 29,3
8 41,7 28,8 30,3 26,7 48,7
9 20,3 40,0 28,4 38,7 42,5
10 47,1 42,0 34,4 54,5 31,4

yi 33,47 38,69 37,10 33,17 38,6

Vˆi ( y ) 141,63 158,93 45,23 82,16 115,51

132
Amostragem sistemática

Tabela 6.7 - Análise de variância estimada por conglomerados.

CV GL SQ QM
Entre 4 294,04 73,531
Dentro 45 4891,25 108,690
Total 49 5185,29 105,820

Dado: k = 5 e m = 10.

Da Tabela 6.6, tem-se:


n

y i
1810 ,3
i 1
y4    36,206 m 3 / ha
km 50
k

k k
(  yi ) 2
i1
(y i  y) 2
y 2
i 
k
Vˆ1 ( y )  i 1
 i 1
k 1 k 1

181, 03 2
6. 583, 7759 
Vˆ1 ( y )  5  7,3509 ( m 3 / 0, 25 ha) 2
4

Observar, considerando as aproximações, que:


Q Mˆ Entre 73, 531
Vˆ1 ( y )    7,3531 (m 3 / 0, 25 ha ) 2
m 10
k m

  ( yij  y i ) 2
i1 j 1
Vˆ2 ( y )   108,69 ( m 3 / 0 ,25 ha ) 2
k (m  1)
n

 Vˆ ( y) i
1
Vˆ2 ( y)  i 1
 (141,63  158,93  45,23  82,16  115,51)  108,69
k 5

133
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Dado:
M  50 , K  20
k 5 m 10
f1    0,25 e f 2    0 ,5 . Então:
K 20 M 50
7,3531 108 ,692
Vˆ ( y4 )  (1  0 ,25)  0 ,25 (1  0,5 )  1,3747 ( m 3 / 0, 25 ha ) 2
5 10  5

5) Variância da média da amostra aleatória de 50 uni-


dades
N − n Vˆ ( y )
VˆAsa ( y 4 ) = ( )
N n

Tabela 6.8 - Dados da amostra aleatória de tamanho n = 50.

28,2 38,5 25,7 23,8 32,7 21,1 41,1 54,5 24,9 24,2
32,3 22,4 47,6 38,8 26,7 36,9 26,7 36,2 30,9 15,9
26,7 37,2 21,4 43,0 23,8 38,2 50,5 26,2 27,3 16,6
45,5 36,3 39,3 30,1 64,2 34,2 61,0 47,6 32,5 46,5
38,2 38,4 34,8 51,0 37,6 23,4 24,0 30,7 19,3 54,5

Considerando os dados da Tabela 6.8, tem-se:


1729,1
y Asa   34,582 m 3 / ha
50
n

n
( y i ) 2
1729,12
y i
2
 i 1

n
66.096,01 
50  128,5770
Vˆ ( y)  i 1

n 1 49

Portanto:
N  n Vˆ ( y ) 1000  50 128,5770
VˆAsa ( y 4 )  ( )    2,4430 (m 3 / ha ) 2
N n 1000 50

134
Amostragem sistemática

6) Discutir e concluir sobre os resultados

Tabela 6.9 - Médias e variâncias da média considerando os cinco casos.

Casos Procedimentos Médias Variâncias da média


1 Variâncias conhecidas 38,32 1,5030
2 Análise como ASA 38,32 2,0457
3 Conglomerados 41,39 2,3485
4 Conglomerados (Subpopulações) 36,21 1,3747
5 Amostra aleatória 34,58 2,4430

Este exemplo foi planejado a partir de uma população co-


nhecida, para:
Y  38,11 m 3 / 0 ,25 ha

V ( y)  137,7988 (m3 / ha)2


Vd ( y )  138 ,9367 (m 3 / ha )2

Sendo a variância da média populacional para a amostra


de 50 unidades igual a 1,5030, verifica-se que a análise por con-
glomerados apresentou o valor mais próximo (1,3747). A amos-
tra aleatória apresentou o maior valor (2,4430), sendo 62,54 %
maior que 1,5030. Este resultado é devido existir maior hetero-
geneidade entre as unidades dentro das amostras sistemáticas,
o que denota uma maior precisão em relação à amostra simples
ao acaso, ou seja: Vd ( y ) > V ( y ) .
Conclui-se, neste caso, que o uso da amostragem sistemá-
tica é mais recomendável.

135
Capítulo 7

ESTIMATIVAS POR RAZÃO

Define a estimativa por razão descrevendo os parâmetros


populacionais e os seus estimadores, assim como mostra sua
importância na aplicação em inventários florestais apresentan-
do casos em que é comum obter a estimativa de uma variável
resposta associada a uma variável auxiliar. Apresenta as meto-
dologias para obter as estimativas por razão com igual probabi-
lidade; com probabilidade proporcional à variável auxiliar; com
amostragem inversa com probabilidade proporcional à variável
auxiliar. Aborda a estimativa por razão considerando a amostra-
gem estratificada. Trata do uso da dupla amostragem com fases
dependentes para melhorar a precisão da estimativa. Aborda
como comparar dois índices ou duas razões. Mostra vários exer-
cícios aplicativos comparando várias alternativas de análise em
inventários florestais.
Estimativa por razão

Nos levantamentos por amostragem, geralmente, ocorrem


casos em que há a necessidade de se obter a estimativa da
relação entre duas variáveis aleatórias y e x, normalmente cor-
relacionadas para cada unidade de amostra. Pode-se, também,
obter a estimativa de uma variável y associada à variável x, po-
dendo acontecer que x seja a mesma característica y medida
em uma ocasião anterior. O interesse da aplicação da estimativa
por razão é obter as informações seguintes:
a) a estimativa da razão R̂ entre as variáveis y e x;
b) a estimativa da média por razão ( y R ), obtida através de
uma variável auxiliar x;
c) a estimativa do valor total da população por razão ( ŶR ),
obtida através de uma variável auxiliar x.
O objetivo mais importante do emprego da estimativa por
razão é obter maior precisão no cálculo das estimativas dos pa-
râmetros utilizando o grau de correlação existente entre y e x,
principalmente quando os valores de yi e xi não sofrem grandes
variações entre as unidades de amostra, e o tamanho da amos-
tra é superior a 30 unidades.

7.1 EstimativaS por razão com igual probabilidade

a) estimativa da variância de

Para formular os parâmetros e estimadores, utilizar-se-á a


seguinte notação:
Y = valor médio populacional da variável de interesse y;
y = valor médio amostral da variável de interesse y;
Y = valor total populacional da variável de interesse y;
Yˆ = valor total amostral da variável de interesse y;
X = valor médio populacional da variável auxiliar x;

139
Amostragem em inventário florestal Waldenei Travassos de Queiroz

x = valor médio amostral da variável auxiliar x;


X = valor total populacional da variável auxiliar x;
X̂ = valor total amostral da variável auxiliar x;
y R = estimativa da média por razão da variável de interes-
se y;
ŶR = estimativa do valor total da população por razão da
variável de interesse y.

Seja a fórmula do valor populacional da razão entre as va-


riáveis y e x e do seu estimador, respectivamente:
Y Y Xˆ x
R = = ; Rˆ = = .
X X Yˆ y
Sob o ponto de vista teórico, o método da estimativa por
razão apresenta o inconveniente de que a estimativa R̂ é um
quociente entre duas variáveis aleatórias, tornando a sua distri-
buição desconhecida e complexa.
Não obstante, Cochran (1977) cita que para pequenas amos-
tras a distribuição de R̂ é assimétrica, onde R̂ é uma estimativa
tendenciosa de R. Entretanto, para grandes amostras (n >30), a
distribuição de R̂ tende à distribuição normal, tornando a ten-
dência estatística praticamente desprezível. O ideal é que o va-
lor médio populacional X da variável auxiliar seja conhecido.
y y−Rx
Seja o desvio Rˆ − R . Então: Rˆ − R = − R = .
x x
Considerando para fins aplicativos que x = X . Então:
y−Rx
Rˆ − R ≅
X
Queiroz (1998) citou que, geralmente, em inventários de
florestas naturais se desconhece o valor médio X populacio-
nal da variável auxiliar, sendo mais provável conhecê-lo para
florestas plantadas, recomendando, então, para fins aplicativos,

140
Estimativa por razão

tomar X = x para grandes amostras (n >30), desde que não haja


heterogeneidade entre os valores dos coeficientes de variação
Xde= x e y R(<10%).
Da definição de variância V ( Rˆ ) = E ( Rˆ − R) 2 , portanto:

y − Rx 2 1
V ( Rˆ ) ≅ E ( ) = 2 E ( y − Rx ) 2
X X
Dado que:
n n n n

∑ y i − R∑ xi ∑ ( y i − R xi ) ∑d i
y−Rx = i =1 i =1
= i
= i =1
= d , para d i = yi − R xi
n n n

Se d i = y i − R xi , logo:
N

∑ (d
i =1
i − D) 2
V (d i ) =
N −1

Como E (d ) = E ( y − R x ) = Y − RX = D = 0,. então:


N N

∑ d i2
i =1
∑(y i =1
i − R xi ) 2
V (d i ) = =
N −1 N −1
n

∑d i
Se d = i =1
, então:
n
N
2
N  n V (d i ) N  n 
( yi  R xi )
i1
V( d )  ( ) ( )
N n Nn N 1

)] 22, mas como:


Dado que V (d ) = E [d − E (d )]

E (d ) = E ( x − R y ) = Y − RX = 0 , tem-se:

141
Amostragem em inventário florestal Waldenei Travassos de Queiroz

V (d ) = E (d ) 2 = E ( y − Rx ) 2

1
Dado que V ( Rˆ ) ≅ 2
E ( y − Rx ) 2 , então:
X
N
2
Nn 
( yi  R xi )
ˆ 1 i 1
V ( R)  2 V (d )  ( )
X nNX 2 N 1
Sendo sua estimativa dada por:
n n n

 yi  2 Rˆ  x i yi  Rˆ  xi
2 2 2
N n
Vˆ ( Rˆ )  ( ) i 1 i 1 i 1
nNX 2 n 1

Esta expressão também pode ser escrita da seguinte forma:


Nn ˆ
Vˆ (Rˆ )  ( 2
)[V ( y )  Rˆ 2 Vˆ (x )  2Rˆ Vˆ ( x, y )]
nNX

Tal que: n n

n
(  xi ) 2 n
( yi ) 2
2 2
 xi  i1

n
y i  i 1

n
Vˆ ( x)  i1
; Vˆ ( y )  i 1
;
n 1 n 1
n n

n
(  xi )( y i )
x y i i  i 1

n
i 1

Vˆ ( x, y )  i 1
.
n 1

Vˆ ( x, y) é a covariância entre x e y.

b) intervalo de confiança para a razão (R)

Para o caso de grandes amostras (n > 30) e admitindo-se que


R̂ tem distribuição normal, o intervalo de confiança é dado por:

142
Estimativa por razão

IC  [ Rˆ  t  s( Rˆ )] , onde s (Rˆ )  Vˆ ( Rˆ ) .
2

c) estimadores da média, do total e suas variâncias

Conhecida a média populacional X da variável auxiliar é


possível, através da estimativa por razão, obter a estimativa do
valor total e do valor da média da população para a variável res-
posta de interesse y.

Yˆ y
Dado que Rˆ = = , então y R = Rˆ X e Vˆ ( y R ) = X 2Vˆ ( Rˆ )).
.
Xˆ x
Assim como:

YˆR = Rˆ X = Rˆ NX e Vˆ (YˆR ) = N 2 X 2Vˆ ( Rˆ )

d) intervalo de confiança para a média Y e para o valor


total Y

Considerando grandes amostras (n > 30) e admitindo-se


que R̂ tem distribuição normal, têm-se:
IC  y R  t  s( y R )  X [Rˆ  t  s( Rˆ )]
2 2

IC  YˆR  t  s (YˆR )  N [ y R  t  s ( y R )]  N X [ Rˆ  t  s( Rˆ )]
2 2 2

Exercício 7.1

Seja o inventário florestal de uma área de 3.574,00 ha per-


tencente à Fazenda Santa Lúcia, localizada no município de Pau
D’arco, estado do Pará, realizado por Borges (1990) e analisado

143
Amostragem em inventário florestal Waldenei Travassos de Queiroz

por Queiroz (1998). Os dados foram obtidos através da medição


de 30 unidades de uma amostra simples ao acaso e mostrados
na Tabela 7.1. A estrutura da unidade de amostra apresentou uma
forma retangular de 10 m de largura e 250 m de comprimento,
onde foram mensuradas todas as árvores com DAP ≥ 45 45 cm. Ana-
lisar os dados através da amostragem por razão com igual proba-
bilidade (AIP).

Tabela 7.1 - Estimativa por razão com igual probabilidade (AIP).

UA xi yi UA xi yi UA xi yi
1 6 13,0 11 5 16,5 21 10 30,5
2 4 16,1 12 4 17,1 22 7 14,7
3 4 9,7 13 6 17,6 23 8 19,0
4 5 20,1 14 9 24,0 24 6 19,7
5 9 29,6 15 5 16,7 25 6 18,4
6 8 23,4 16 5 21,9 26 8 25,4
7 5 21,9 17 3 10,4 27 8 18,6
8 4 17,5 18 5 10,0 28 6 18,9
9 8 22,1 19 4 14,5 29 9 28,3
10 5 12,8 20 7 29,7 30 7 22,0

a) informações iniciais sobre volume e número de árvores


na amostra

yi = volume em m3/0,25 ha
xi = número de árvores/0,25 ha
30 30

y i  580,10 m3; x i
 186 árvores
i 1 i 1

a1) valor médio para a variável auxiliar número de árvores


30


i1
xi
186
x   6 ,2 árvores / 0 ,25 ha
30 30

144
Estimativa por razão

a2) valor médio para a variável de interesse (volume)


30


i1
yi
580,10
y   19,3367 m3 / 0, 25 ha
30 30

Portanto:
y  77,3467 m 3 / ha

b) estimativa da razão
y 580,10
Rˆ    3,1188 m 3 / árvore
x 186

c) cálculo da estimativa da variância de R̂


Dado que:
N = 3574 / 0,25 = 14.296
n

n
( yi ) 2
yi2  i 1 580,10 2
 n
12.164,77 
30  32,6748
Vˆ ( y)  i 1

n 1 29
n

n
(  xi ) 2 2
i1 186
 x 2i  n
1 .254 ,0 
30  3,4759
Vˆ ( x)  i 1

n 1 29
n n

n
( x i )( yi )
186  580 ,10
 xi yi  i 1
n
i1
3 .830,8 
30
Vˆ ( x, y )  i 1
  8,0752
n 1 29

Então:
Nn ˆ
Vˆ (Rˆ )  ( )[V ( y )  Rˆ Vˆ (x )  2Rˆ Vˆ ( x, y )]
2
2
nNX
  14.296  30
V ( R)  ( )(32,6748  3,1188 2  3,4759  2  3,1188  8,0752)
30  14.296  6,2 2
145
 
V ( R)  0,01394458 ( m3 / árvore) 2
Amostragem em inventário
N florestal
n Waldenei Travassos de Queiroz
Vˆ (Rˆ )  ( )[Vˆ ( y )  Rˆ Vˆ (x )  2Rˆ Vˆ ( x, y )]
2
2
nNX
  14.296  30
V ( R)  ( )(32,6748  3,1188 2  3,4759  2  3,1188  8,0752)
30  14.296  6,2 2
 
V ( R)  0,01394458 ( m3 / árvore) 2

Considerando o desconhecimento do valor populacional


do número de árvores X , utilizou-se X = x = 6,2 árvores / 0,25
0,25 haha.

d) estimativa do erro padrão de R̂


s ( Rˆ ) = Vˆ ( Rˆ ) = 0,013944584 = 0,1181 m 3 / árvore

e) intervalo de confiança para R

Seja “t = 2,0452” o valor da distribuição de “Student” com 29


graus de liberdade para o nível de significância a=0,05. Então:

Limite inferior
Rˆ − t × s ( Rˆ ) = 3,1188 − 2,0452 × 0,1181 = 2,8773 m 3 / árvore

Limite superior
Rˆ + t × s ( Rˆ ) = 3,1188 + 2,0452 × 0,1181 = 3,3603 m 3 / árvore

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor verdadeiro ou paramétrico da razão encontra-se no
intervalo de 2,8773 a 3,3603.

f) estimativa da média do volume y R e sua variância Vˆ ( y R )

y R  Rˆ X  3,1188  6,2  19 ,34 m 3 / 0 ,25 ha , tal que: y R  77,35 m 3 / ha

Vˆ ( y R )  X 2 Vˆ ( Rˆ )  6,2 2  0,01394458  0,536029655 (m3 / 0,25 ha ) 2

Vˆ ( yR )  42  0,5014  8,576474 (m3 / ha) 2

146
Estimativa por razão

Adotou-se:
186
X x   6 ,2 árvores / ha
30

g) erro padrão da média


s( y R )  Vˆ( y R ) / ha  2,928562 m 3 / ha

h) estimativas do total ŶR e sua variância Vˆ (YˆR )


YˆR  Rˆ NX  3,1188  14.296  6, 2  276 .435, 4618 m
3

Vˆ (YˆR )  N 2 X 2 Vˆ (Rˆ)  14 .296 2  6 ,2 2  0,01394458  109 .551 .391,0 ( m 3 )2

i) erro padrão do total


s(YˆR )  Vˆ (YˆR )  10. 466,68 m 3

j) intervalo de confiança para o valor médio Y

Limite inferior/ha
yR  t  s (y R )  77,35  2,0452 2,928562  71,36 m3 / ha

Limite superior/ha
y R  t  s ( y R )  77,35  2,0452  2,928562  83,34 m 3 / ha

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor médio populacional encontra-se no intervalo de 71,36
m3/ ha a 83,34 m3/ ha.

k) intervalo de confiança para o valor total Y

Limite inferior
YˆR  t  s (YˆR )  276.435, 46  2,0452  10.466,68  255 .029,01 m 3

147
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Limite superior
YˆR  t  s (YˆR )  276 .435 , 46  2 ,0452  10 .466 ,68  297 .841,91 m 3

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor total populacional encontra-se no intervalo de
255.029,01 m3/ ha a 297.841,91 m3/ ha.

l) limite de erro para a estimativa por razão


t  s( y R ) 2 ,0452  2,928562
LE R   100   100  7,74 %
yR 77,35

m) cálculo da variância da média sem considerar a variável


auxiliar (número de árvores)
Vˆ ( y ) N  n 32 ,6748 14 .296  30
Vˆ ( y )  ( ) ( )  1,0869 (m3 / 0,25 ha ) 2
n N 30 14 .296

Vˆ ( y )  17,39 (m 3 / ha ) 2

s ( y) / ha  Vˆ ( y ) / ha  17,39  4 ,1701 m 3 / ha

n) limite de erro sem considerar a variável auxiliar (número


de árvores)
t s( y ) 2,0452  4,1701
LE SV   100   100  11,03 %
y 77 ,35

o) estimativa da eficiência da estimativa por razão

Considerando a definição de eficiência como o quociente


entre o limite de erro sem considerar a variável auxiliar número de
árvores e o limite de erro estimado pelo método da razão, tem-se:
LESV 11,03%
Ef    1,42 46
LER 7 ,74 %

148
Estimativa por razão

Os resultados mostram um limite de erro de 11,03 %, não


considerando na análise a variável auxiliar número de árvores
por parcela. Este limite de erro corresponde a um valor 42,46 %
maior que o estimado pelo método por razão (7,74 %), demons-
trando que esta estimativa apresenta uma eficiência superior
àquela.
Dado que:

LE ( yR )  LESV ( y ) , ou seja, LE SV ( y )
LE ( y R ) 
1, 4246

7.2 EstimativaS por razão considerando probabi-


lidade proporcional (aap) à variável auxiliar (x)

Considera-se na seleção de uma amostra, normalmente,


que todos os elementos da população sejam igualmente prová-
veis de serem escolhidos. Na estimativa por razão, em alguns
casos, é usual selecionar a amostra com probabilidade propor-
cional aos valores da variável auxiliar x. Neste método, o peso
de cada elemento é considerado na seleção, visto que a ocor-
rência dos mesmos não é igualmente provável.
Este procedimento produz estimativas não tendenciosas
para média, valor total e suas respectivas variâncias. Não há
correção para população finita por tratar-se de uma amostragem
com reposição.
n N

∑ Ri ∑R i
Seja Rˆ = i =1 o estimador não tendencioso de R = I =1
.
n N

Convém salientar que a razão média R̂ , que é uma média


ponderada dos Ri = yi xi , difere da média das razões Rˆ . Ou
seja:

149
Amostragem em inventário florestal Waldenei Travassos de Queiroz

∑x R i i
Rˆ = I =1
n
≠ Rˆ
∑x
i =1
i
n

n n
(∑ Ri ) 2
∑ (R i − Rˆ ) 2 ∑R i
2
− i =1

Dado que Vˆ ( Ri ) = I =1
= i =1 n . Então:
n −1 n −1
Vˆ ( Ri )
Vˆ ( Rˆ ) =
n n

∑R i
A partir da estimativa Rˆ = i =1 , pode-se obter:
n

y R = X Rˆ ; YˆR = N y R = NRˆ X e suas respectivas variâncias:

2 2 2 ˆ
Vˆ ( y R ) = X 2Vˆ ( Rˆ ); Vˆ (Yˆ ) = N Vˆ ( y R ) = N X Vˆ ( R )

Exercício 7.2

Seja uma área florestal populacional de 100 ha com ocor-


rências de 405 árvores matrizes. O objetivo é monitorar a produ-
ção de sementes de uma determinada espécie florestal. A área
está subdividida em 100 subáreas (Unid) de 1 ha. As 405 matri-
zes da espécie em estudo estão perfeitamente localizadas em
um mapa logístico. A Tabela 7.2 apresenta os dados: número
de árvores por unidade de 1 ha (x) e a numeração sequencial
para as 405 árvores. A Tabela 7.3 apresenta os dados sobre a
produção de semente em kg por Unid para uma amostra de 50
árvores. Analisar os dados através da amostragem com Proba-
bilidade Proporcional à x (APP).

150
Estimativa por razão

Tabela 7.2 - Número de árvores para as 100 unidades de 1 ha (Unid).

Unid x Num Unid x Num Unid x Num


1 4 1a4 34 2 133 a 134 67 4 267 a 270
2 4 5a8 35 3 135 a 137 68 5 271 a 275
3 3 9 a 11 36 4 138 a 141 69 4 276 a 279
4 3 12 a 14 37 4 142 a 145 70 3 280 a 282
5 7 15 a 21 38 4 146 a 149 71 6 283 a 288
6 5 22 a 26 39 7 150 a 156 72 5 289 a 293
7 3 27 a 29 40 4 157 a 160 73 2 294 a 295
8 4 30 a 33 41 3 161 a 163 74 5 296 a 300
9 3 34 a 36 42 4 164 a 167 75 3 301 a 303
10 4 37 a 40 43 5 168 a 172 76 4 304 a 307
11 4 41 a 44 44 4 173 a 176 77 4 308 a 311
12 3 45 a 47 45 7 177 a 183 78 5 312 a 316
13 5 48 a 52 46 4 184 a 187 79 2 317 a 318
14 6 53 a 58 47 4 188 a 191 80 4 319 a 322
15 2 59 a 60 48 3 192 a 194 81 3 323 a 325
16 5 61 a 65 49 2 195 a 196 82 3 326 a 328
17 4 66 a 69 50 3 197 a 199 83 5 329 a 333
18 4 70 a 73 51 4 200 a 203 84 5 334 a 338
19 5 74 a 78 52 5 204 a 208 85 5 339 a 343
20 3 79 a 81 53 4 209 a 212 86 3 344 a 346
21 4 82 a 85 54 5 213 a 217 87 3 347 a 349
22 4 86 a 89 55 4 218 a 221 88 4 350 a 353
23 3 90 a 92 56 4 222 a 225 89 4 354 a 357
24 5 93 a 97 57 5 226 a 230 90 6 358 a 363
25 3 98 a 100 58 6 231 a 236 91 6 364 a 369
26 5 101 a 105 59 4 237 a 240 92 2 370 a 371
27 4 106 a 09 60 3 241 a 243 93 7 372 a 378
28 4 110 a 113 61 1 244 94 2 379 a 380
29 3 114 a 116 62 6 245 a 250 95 5 381 a 385
30 4 117 a 120 63 5 251 a 255 96 3 386 a 388
31 4 212 a 124 64 4 256 a 259 97 4 389 a 392
32 5 125 a 129 65 4 260 a 263 98 6 393 a 398
33 3 130 a 132 66 3 264 a 266 99 3 399 a 401
100 4 402 a 405

151
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Tabela 7.3 - Produção em kg de sementes (yi) por Unid amostrada.

yi yi
Árvore Ri = Árvore Ri =
Unid xi yi xi Unid xi yi xi
24 6 5 16,15 3,23000 254 63 5 12,20 2,44000
36 9 3 10,53 3,51000 261 65 4 12,58 3,14500
37 10 4 8,50 2,12500 262 65 4 12,58 3,14500
39 10 4 8,50 2,12500 276 69 4 13,13 3,28250
49 13 5 11,90 2,38000 278 69 4 13,13 3,28250
91 23 3 9,07 3,02333 279 69 4 13,13 3,28250
111 28 4 13,23 3,30750 285 71 6 14,39 2,39833
120 30 4 11,48 2,87000 288 71 6 14,39 2,39833
127 32 5 14,71 2,94200 291 72 5 14,58 2,91600
128 32 5 14,71 2,94200 293 72 5 14,58 2,91600
136 35 3 10,95 3,65000 297 74 5 14,14 2,82800
138 36 4 15,31 3,82750 303 75 3 11,94 3,98000
144 37 4 11,26 2,81500 312 78 5 12,37 2,47400
148 38 4 11,73 2,93250 323 81 3 11,03 3,67667
153 39 7 16,42 2,34571 325 81 3 11,03 3,67667
165 42 4 12,57 3,14250 334 84 5 12,71 2,54200
175 44 4 10,88 2,72000 336 84 5 12,71 2,54200
189 47 4 13,03 3,25750 349 87 3 8,93 2,97667
199 50 3 11,11 3,70333 362 90 6 15,75 2,62500
200 51 4 10,28 2,57000 371 92 2 10,71 5,35500
203 51 4 10,28 2,57000 372 93 7 15,01 2,14429
208 52 5 13,14 2,62800 376 93 7 15,01 2,14429
229 57 5 13,44 2,68800 394 98 6 13,76 2,29333
233 58 6 14,14 2,35667 398 98 6 13,76 2,29333
240 59 4 15,40 3,85000 400 99 3 8,19 2,73000
Total 223 630,46 146,9990

a) média das razões ( Rˆ )


n

 Ri
146,9990
Rˆ  i1
  2,94 kg / árvore
n 50

152
Estimativa por razão

b) variância de Rˆ
n

n
( Ri )2
146,999 2
 Ri2  n
i 1
450,4753 
50
Vˆ ( Ri )  i 1
  0,3735 ( kg / árvore )2
n 1 49
Vˆ (Ri ) 0,3735
Vˆ ( Rˆ )    0,00746987 (kg / árvore)2
n 50
N

∑R i
c) intervalo de confiança para R = I =1

s( Rˆ )  Vˆ (Rˆ )  0,0864 kg / árvore

IC  Rˆ  t s (Rˆ )  2 ,94  2,01  0 ,0864


2,7663 kg / árvore  R  3,1137 kg / árvore

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que a razão populacional (R) encontra-se no intervalo de 2,7663
kg/árvore a 3,1137 kg/árvore.

d) valor médio para a produção de semente por ha


yRAPP  X R  4,05  2,94  11,907 kg / ha

Sendo:
N

x
i 1
i
405
X    4, 05 árvores
N 100

e) variância do valor médio para a produção de semente


por ha
Vˆ ( y RAPP )  X Vˆ ( R )  4, 05  0, 00746987  0,12252454 ( kg / ha )
2 2 2

153
Amostragem em inventário florestal Waldenei Travassos de Queiroz

f) intervalo de confiança para o valor médio para a produ-


ção de sementes
s( y RAPP )  Vˆ ( y RAPP )  0,1225  0,3500 kg / ha

IC  y RAPP  t s ( y RAPP )  11,907  2,01  0 ,3500

11,2035 kg / ha  Y  12 ,6105 kg / ha

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor médio populacional de produção de sementes en-
contra-se no intervalo de 11,2035 kg / ha a 12,6111 kg / ha.

g) estimativa para o total da produção total de sementes

YˆR APP  N yR APP  N X R  100  4 ,05  2,94  1 .190 ,7 kg

h) variância para o valor total da produção total de sementes


Vˆ (YˆRAPP )  N 2 X 2 Vˆ ( R )  N 2V ( y RAPP )  100 2  4,05 2  0,00746987

Vˆ (YˆRAPP )  1.225,2339 kg 2

s( YˆRAPP )  Vˆ (YˆRAPP )  1.225,2339  35,00 kg

i) intervalo de confiança para o valor total da produção total


de sementes
IC  YˆRAPP  t s(YˆRAPP )  1 .190,7  2,01  35

1 .120,35 kg  Y  1.261,05 kg

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor total populacional de produção de sementes encon-
tra-se no intervalo de 1.120,35 kg a 1.261,05 kg.

154
Estimativa por razão

j) discussão e conclusão

Verifica-se, através da Tabela 7.3, que as 50 árvores sor-


teadas estão inseridas em 38 unidades (Unid), o que significa
redução nos deslocamentos e diminuição nos custos do levan-
tamento.
A amostra estudada de 38 Unid (50 árvores) foi retirada de
uma população simulada com vetor de médias Yv e matriz de
covariâncias ∑ .

Resultando a matriz de correlações correspondente (Corr)

 1 0,7094
C orr = 
0,7094 1 
Considerando a amostra de 50 árvores, sejam os resulta-
dos amostrais para o vetor de médias, matrizes de covariâncias
e de correlações:

Verifica-se que o valor médio verdadeiro Y = 12 12,081 ,081 está


contido no intervalo de confiança(1(11,2035
,2035 kgkg/ha ,6105 kg/ha).
/ ha ≤ Y ≤ 1212,6105 kg / ha ).

155
Amostragem em inventário florestal Waldenei Travassos de Queiroz

7.3 EstimativaS por razão: amostragem inversa


com probabilidade proporcional à variável auxi-
liar x (aipp).

O processo da estimativa por razão com amostragem in-


versa com probabilidade proporcional à variável auxiliar x é uma
variação metodológica da estimativa por razão com probabilida-
de proporcional à variável auxiliar (AAP).
No processo da estimativa por razão com probabilidade
proporcional à variável auxiliar (AAP) quando o tamanho da
amostra n é relativamente grande em relação ao tamanho da
população N, na seleção da amostra, pode não ocorrer n unida-
des distintas. No exercício 7.2, tal que N = 100, verificou-se 38
unidades distintas para 50 árvores. Obviamente, a repetição de
unidades na amostra diminuirá o custo do levantamento.
Entretanto, para o caso de n ser relativamente grande em
relação a N, pode-se, dentro dessa concepção estrutural, sortear
tantas unidades necessárias, até atingir n+1 unidades distintas.
A amostra será constituída pelas n unidades distintas, despre-
zando-se a última unidade sorteada. Este processo é denomi-
nado de Amostragem Inversa com Probabilidade Proporcional à
variável auxiliar x (AIPP).
No exemplo aplicativo anterior, supondo que o desejo do
planejador é ter n = 40, então seria necessário continuar o sor-
teio até conseguir mais três unidades distintas das 38 já sortea-
das. A última seria descartada.
Estabelecidas as n unidades distintas, a análise estatística
da AIPP será análoga à APP, já abordada anteriormente.

156
Estimativa por razão

7.4 Estimativas por razão considerando a amos-


tragem estratificada

Na amostragem estratificada, considerando que os estra-


tos são independentes, existem dois procedimentos distintos
para estimar a média e o valor total através da estimativa por
razão.
1) Efetuar as estimativas dentro de cada estrato.
2) Efetuar a estimativa considerando todos os estratos glo-
balmente.

1) Efetuar as estimativas dentro de cada estrato

Seja L o número de estratos, então:


y
Rˆ h = h , onde h = 1, L , L .
xh
Sejam as estimativas do valor médio e do total:

y R h  X h Rˆ h e YˆR h  N h yR h  N h X h Rˆ h  X h Rˆ h

Sendo:
X h  Nh Xh

Consequentemente:
L
y Re st   Wh y R h
h 1
L L L
Nh

YˆRe st  N y Re st  N  N h h  h h  Yˆh
X ˆ
R  X ˆ
R 
h 1 h 1 h 1

157
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Considerando que a amostra dentro de cada estrato seja


relativamente grande, tem-se:
nh nh nh

N  nh  yhi2  2 Rˆ h  xhi yhi  Rˆ h2  xhi2


Vˆ ( Rˆ h )  ( h ) i 1 i 1 i 1
nh N h X h2 nh  1

Tal que:
L
Vˆ ( yR h )  X h2 Vˆ ( Rˆ h ) e Vˆ ( yRe st )  W h2 Vˆ ( y Rh )
h 1

Assim como:
Vˆ (YˆR h )  N h2 Vˆ ( y Rh )
L
Daí, como os estratos são independentes: Vˆ (YˆR )   Vˆ (YˆRh ).
h 1

2) Efetuar a estimativa considerando todos os estratos


globalmente

Dado que:
L L
y est = ∑Wh y h ; xest = ∑Wh xh
h =1 h =1

Determina-se a “razão combinada ou índice combinado”


que é o quociente entre a média estratificada da variável res-
posta de interesse y e média estratificada da variável resposta
auxiliar x (covariável):

y
Rˆ C = est
xest
Resultando: y RC  X Rˆ RC

158
Estimativa por razão

Para grandes amostras, tem-se:


nh nh nh

L
N  nh  y  2 Rˆ RC  x hi y hi  Rˆ RC2  xhi2
2
hi
Vˆ (Rˆ RC )   ( h 2
) i 1 i 1 i 1

h  1 nh N h X h nh  1

Sendo:
Vˆ ( yRC )  X 2 Vˆ ( Rˆ RC )

YˆRC  N X Rˆ C  XRˆ C ; X  NX

Vˆ (YˆRC )  X 2 Vˆ (Rˆ RC )

Exercício 7.3

Seja uma área florestal de 10.000 ha, onde, através de téc-


nicas de interpretação de imagens fotográficas, foram detecta-
dos três estratos, a saber:
Estrato I (floresta alta sem babaçu) = 2.000 ha;
Estrato II (floresta alta com babaçu) = 5.000 ha;
Estrato III (floresta baixa cipoálica) = 3.000 ha.

Através da amostra simples ao acaso, foram selecionadas


nos estratos as seguintes quantidades de unidades de amostra:
n1 = 13; n 2 = 15 e n3 = 11.

A estrutura da unidade amostral apresentou uma forma


retangular de 10 m de largura e 250 m de comprimento, onde
foram mensuradas todas as árvores com DAP 45 cm. A Tabela
7.4 apresenta os dados (simulados) por estrato para os volumes
e número de árvores por parcela de 0,25 ha.
Analisar os dados considerando:
1) as estimativas dentro de cada estrato;

159
Amostragem em inventário florestal Waldenei Travassos de Queiroz

2) as estimativas considerando todos os estratos global-


mente;
3) estimativas desconsiderando a variável auxiliar x (nú-
mero de árvores);
4) discutir e concluir sobre os resultados.

Tabela 7.4 - Amostra estratificada por razão: m3 / 0,25 ha.

EST I EST II EST III


y x y x y x
21,10 8 12,90 5 8,10 3
34,00 15 17,00 6 12,00 3
18,00 8 9,50 4 9,50 4
20,00 8 20,00 5 14,50 5
55,00 22 30,10 11 18,17 6
23,42 9 23,42 6 21,10 7
40,50 15 21,10 8 10,80 3
17,44 8 17,44 6 7,50 3
22,12 10 22,12 8 6,50 2
25,00 10 12,00 4 12,50 4
31,20 13 16,50 6 5,20 2
17,05 6 17,05 6
24,10 9 24,10 9
16,71 6
21,80 7

1) Efetuar as estimativas dentro de cada estrato

a) informações gerais sobre os dados


2 .000 ha 5 .000 ha 3.000 ha
W1   0,2 ; W2   0 ,5 ; W3   0,3;
10.000 ha 10.000 ha 10 .000 ha

160
Estimativa por razão

2.000 ha 5.000 3 .000 ha


N1   8 .000 ; N 2   20.000 ; N 3   12.000;
0 ,25 ha 0,25 ha 0,25 ha
n1

y i1
348,93
i 1
y1    26,8408 m3 / 0,25 ha
n1 13
n2

y i2
281,74
i 1
y2    18,7827 m 3 / 0,25 ha
n2 15
n3

y
i 1
i3
125,87
y3    11,4427m 3 / 0,25 ha
n3 11
n1

x
i 1
i1
141
x1    10,8462 árvores / 0, 25 ha
n1 13
n2

x
i 1
i2
97
x2    6,4667 árvores / 0,25 ha
n2 15
n3

x i3
42
i 1
x3    3,8182 árvores / 0,25 ha
n3 11

b) estimativa da razão R̂ por estrato

y 26,8408
Rˆ1  1   2,4747
x1 10,8462
y 18 ,7827
Rˆ 2  2   2 ,9045
x2 6,4667
y 11,4427
Rˆ 3  3   2,9969
x3 3,8182

161
Amostragem em inventário florestal Waldenei Travassos de Queiroz

c) estimativas para os valores médios por razão por estrato

y R1  X 1 Rˆ1  10,8462  2,4747  26,8411 m3 / 0,25 ha

y R2  X 2 Rˆ 2  6,4667  2,9045  18,7825m3 / 0,25 ha

y R3  X 3 Rˆ3  3,8182  2,9969  11,4428 m3 / 0,25 ha

Devido ao desconhecimento dos valores populacionais,


considerou-se: x1 = X 1 ; x2 = X 2 ; x3 = X 3 .

d) estimativas para os valores totais por razão por estrato

YˆR1  N 1 y R1  8.000  26,841091  214.728 ,73 m3

YˆR2  N 2 y R2  20.000 18,782530  375.650,60 m3

YˆR3  N 3 yR 3  12 .000 11,442764  137 .313 ,16 m3

e) média estratificada por razão


L
y Rest  W h y Rh
h 1

y Rest  0, 2  26,841091  0, 5  18, 782530  0,3  11, 442764  18,1923 m 3 / 0,25 ha

YˆRest  N y Rest  40.00 0  18,192 312  727 .692, 48 m 3

f) variância dos R̂h

Considerando: X 1 = x1 ; X 2 = x2 ; X 3 = x3 , têm-se:
n1 n1 n1

N n  y12i  2 Rˆ1  x1i y1i  Rˆ12  x12i


Vˆ (Rˆ1 )  ( 1 12 ) i 1 i 1 i 1
n1 N1 X 1 n1 1

162
Estimativa por razão

8 .000  13 10 .802 ,36  2  2,4 747  4346, 6  2, 4747 2  1757


Vˆ ( Rˆ 1 )  ( 2)
13  8 .000  10,8462 12
Vˆ (Rˆ1 )  0 ,0026881108 71
n2 n2 n2

y 2
2i  2Rˆ 2  x 2 i y 2 i  Rˆ 22  x22i
N  n2
Vˆ (Rˆ 2 )  ( 2 2
) i1 i 1 i 1

n2 N 2 X 2 n2  1
20 .000  15 5 .681,05  2  2,9045  1.945,6  2 ,9045 2  677
Vˆ (Rˆ2 )  ( 2
)
15  20 .000  6,4667 14
Vˆ ( Rˆ )  0 ,01027637
2

n3 n3 n3

 y 32i  2 Rˆ 3  x 3 i y 3 i  Rˆ 32  x 32i
N  n3
Vˆ ( Rˆ 3 )  ( 3 ) i 1 i 1 i 1
n 3 N 3 X 32 n3  1
12 .000  11 1.683,90  2  2,9969  55 5, 8  2, 9969 2  18 6
Vˆ ( Rˆ 3 )  ( 2
)
11  12.000  3, 8182 10
Vˆ ( Rˆ 3 )  0 ,014384036

g) variância da média por estrato


Vˆ ( y R1 )  X 12 Vˆ (Rˆ1 )  10 ,8462 2  0,0026881108 71  0 ,316229509 ( m 3 / 0,25 ha ) 2

Vˆ ( yR2 )  X 22 Vˆ (Rˆ 2 )  6,4667 2  0 ,01027637  0,429739402 (m3 / 0,25 ha) 2

Vˆ ( yR 3 )  X 32 Vˆ (Rˆ3 )  3,8182 2  0,014384036  0 ,209699848 ( m 3 / 0,25 ha ) 2

h) variância da média estratificada


L
Vˆ ( y Rest )   Wh2 Vˆ ( y Rh )
h 1

Vˆ ( y Rest )  0 ,2 2  0 ,316229509  0 ,5 2  0 ,429739402  0,3 2  0,209699844


Vˆ ( yRest )  0,138957016 (m 3 / 0,25 ha ) 2

i) limite de erro (LEDest) considerando as estimativas dentro


de cada estrato

163
Amostragem em inventário florestal Waldenei Travassos de Queiroz

t  s ( yR e st ) 2,0296  0,13895701
LE Des t    4 ,16 %
y Re st 18,192312

j) variância do total por estrato

Vˆ (Yˆ R1 )  N 12 Vˆ ( y R1 )  8.000 2  0 ,316229509  20 .238 .688 ,58 m 3

Vˆ (YˆR2 )  N 22 Vˆ ( yR 2 )  20.000 2  0,429739402 171.895.760,8 m3

Vˆ (YˆR 3 )  N 32 Vˆ ( y R 3 )  12 .000 2  0 ,209699848  30 .196 .778,11 m 3

k) estimativa da variância do total da população


L

Vˆ (YˆR )   Vˆ(YˆRh )  20 .238.688,58  171.895 .760,8  30 .196.778,11


h 1

L
Vˆ (YˆR )   Vˆ (YˆRh )  222 .331.227 ,5 m 3
h1

2) Efetuar a estimativa considerando todos os estratos


globalmente

a) informações gerais sobre os dados

164
Estimativa por razão

b) estimativa da razão R̂C

Considerando: X  x est  6,54805 árvores / 0 , 25 ha

y
Tem-se: Rˆ C  es t  18,19232  2,778281
xest 6,54805

c) estimativa do valor médio y RC


y RC  X Rˆ RC  6,54805  2,778281  18,192323 m 3 / 0,25 ha nh nh

L
N  nh  y hi2  2 Rˆ RC  x
d) cálculo da estimativa da variância Vˆ (Rˆ RC )   ( h 2
) i 1 i 1

h  1 nh N h X nh 
nh nh nh
ˆ ˆ2
L
N  n  hi RC  hi hi RC  xhi2
y
2
 2 R x y  R
Vˆ (Rˆ RC )   ( h h
2
) i 1 i 1 i 1

h  1 nh N h X nh  1

Dado que:
Vˆ ( Rˆ RC )  V1  V 2  V3

Então:
n1 n1 n1

y 2
1i  2Rˆ RC  x1i y1i  Rˆ R2 C  x12i
N 1  n1 i 1 i1 i 1
V1  ( 2
)
n1 N1 X n1  1
(8. 000  13) 10. 802, 36  2  2, 778281 4.346, 6  2, 7782812  1. 757
V1  ( )
13  8. 000  6, 548052 12

V1  0,031675905
n2 n2 n2

N 2  n2  y 22i  2 Rˆ RC  x 2i y 2i  Rˆ RC2  x22i


i 1 i 1 i 1
V2  ( 2
)
n2 N 2 X 2 n2  1
2
20. 000  15 5.681,05  2  2,778281  1. 945,6  2,778281  677
V2  2

15  20. 000  6,54805 14

V2  0,010638342 165
n3 n3 n3

y 2
3i  2 Rˆ RC  x3i y3 i  Rˆ RC
2
 x32i
N 3  n3 i 1 i 1 i 1
V3  ( 2
)
n3 N 3 X 3 n3  1
13  8. 000  6, 54805 12

V1  0,031675905
n2 n2 n2

N 2 florestal
Amostragem em inventário n2 i  1  y 22i  2 Rˆ RC  x 2i y 2i  Rˆ RC2  x22i
i 1 i 1 Waldenei Travassos de Queiroz
V2  ( 2
)
n2 N 2 X 2
n2  1
2
20. 000  15 5.681,05  2  2,778281  1. 945,6  2,778281  677
V2  2

15  20. 000  6,54805 14

V2  0,010638342
n3 n3 n3

N 3  n3  y32i  2 Rˆ RC  x3i y3i  Rˆ RC2  x32i


i 1 i 1 i 1
V3  ( 2
)
n3 N 3 X 3 n3  1
2
12.000  11 1. 683,90  2  2, 778281 555,8  2, 778281  186
V3  2

11  12.000  6,54805 10

V3  0, 006623478279

Finalmente:
Vˆ ( Rˆ RC )  V1  V 2  V3

Vˆ ( Rˆ RC )  0,031675905  0,010638342  0 ,0066234782 79  0,048937725

e) cálculo da estimativa da variância Vˆ ( y RC )  X 2 Vˆ ( Rˆ RC )  6,54805 2  0, 048937725 


Vˆ ( y RC )  X Vˆ ( Rˆ RC )  6,54805  0, 048937725  2,098300819 (m / 0, 25 ha )
2 2 3 2

f) cálculo da estimativa do valor total YˆRC  N X Rˆ C  40 .000  6,54805  2,778281


YˆRC  N X Rˆ C  40 .000  6,54805  2,778281X727
N x.692
est m3 6,54805  261.922,0 árv
40.000
,9161

X  N xest  40.000  6,54805  261.922,0 árvores

g) cálculo da variância do valor total Vˆ (YˆRC )  X 2 Vˆ (Rˆ RC )  261 .922 2  0 ,04893772


Vˆ (YˆRC )  X 2 Vˆ ( Rˆ RC )  261 .922 2  0 ,048937725  3 .357 .281 .310,0

h) limite de erro (LERC) considerando todos os estratos glo-


balmente
t  s( y Re st ) 2, 0296  2, 09830081
LE RC    16,16 %
y Re st 18,192312

166
Estimativa por razão

3) Estimativas desconsiderando a variável auxiliar x


(número de árvores). Análise convencional (Metodologia da
ASA)

Objetivando promover comparações em termos de preci-


são, obter as estimativas desconsiderando a variável auxiliar x
(número de árvores).
a) média estratificada da variável de interesse
L
8.000 20.000 12.000
yes t  Wh yh   26,8408  18,7827  11,4427
h 1 40.000 40.000 40.000

ye st  18,19232m3 / 0,25ha

b) variância da média estratificada da variável de interesse


W Vˆ ( y ) L W hVˆh ( y )
L 2
1
Vˆ ( y est )   h h   1, 0310813   45,1555915
h 1 nh h1 N 40000

Vˆ ( y est )  1,0299524 (m3 / 0,25 ha) 2

Pois:
L W h2Vˆh ( y)

h1 nh
1,0310813
L

 W Vˆ ( y )  45,1555915
h1
h h

c) limite de erro (LESV) desconsiderando a variável auxiliar


x (número de árvores)
t  s ( yest ) 2,0296  1,0299524
LE SV    11,32 %
y est 18,19232

167
Amostragem em inventário florestal Waldenei Travassos de Queiroz

4) Discutir e concluir sobre os resultados

Na Tabela 7.5 estão os resultados a partir das análises re-


alizadas.

Tabela 7.5 - Resultados das análises da amostra estratificada.

Média Variância da média


Método LE %
(m3/0,25 ha) (m3/0,25 ha)
Convencional (ASA) 18,192320 1,029952400 11,32
Razão (estratos) 18,192312 0,138957016 4,16
Razão (combinada) 18,192323 2,098300810 16,16

Usando a definição de eficiência como o quociente entre o


limite de erro sem considerar a variável auxiliar número de árvo-
res e o limite de erro estimado pelo método da razão dentro de
cada estrato, tem-se:
LESV 11,32 %
Ef    2 ,7212
LEDest 4,16%

A partir da definição de eficiência como o quociente entre


o limite de erro estimado pelo método da razão, considerando
todos os estratos globalmente, e o limite de erro sem usar a va-
riável auxiliar número de árvores, resulta:

LE R C 16,16%
Ef    1,4276
LE SV 11,32%
Dada a definição de eficiência como o quociente entre o
limite de erro pelo método da razão analisando os estratos de
forma global e o limite de erro estimado pelo método da razão
considerando os estratos separadamente, tem-se:

168
Estimativa por razão

LES V 16 ,16
Ef    3,8846
LED est 4,16

Os resultados mostram um limite de erro de 11,32% não


usando na análise a variável auxiliar número de árvores por par-
cela. Este limite de erro corresponde a um valor 172,12% maior
que o estimado pelo método por razão com as estimativas den-
tro de cada estrato (4,16%). Conclui-se que esta estimativa (ra-
zão) é mais eficiente.
Dado que:
LE SV
LE De st  LESV , ou seja, LE Dest 
2,7212

Os resultados mostram um limite de erro de 16,16% pelo


método por razão a partir das estimativas para todos os estratos
globalmente. Este limite de erro corresponde a um valor 42,76
% maior que o limite de erro estimado pelo método quando não
considerado na análise a variável auxiliar número de árvores
(4,16 %), demonstrando que este método apresenta uma efici-
ência superior àquele.
Dado que:
LERC
LE SV  LE RC , ou seja, LE SV 
1,4276

Os resultados apresentam um limite de erro de 16,16%


pelo método por razão considerando as estimativas para todos
os estratos globalmente. Este limite de erro corresponde a um
valor 288,46% maior que o limite de erro estimado pelo método
por razão quando as estimativas forem obtidas dentro de cada
estrato (4,16%), demonstrando que o método de análise por ra-
zão a partir das estimativas dentro de cada estrato apresenta

169
Amostragem em inventário florestal Waldenei Travassos de Queiroz

uma eficiência superior ao método por razão usando as estima-


tivas para todos os estratos globalmente.
Dado que:
LE De st  LE RC , ou seja, LE dest  LERC
3,8846

7.5 Dupla amostragem: fases dependentes

Para a aplicação do método de estimativa por razão é im-


prescindível o conhecimento prévio do valor médio populacional
da variável auxiliar x. Queiroz (1993a) cita que, geralmente, em
inventários de florestas naturais é impossível conhecer o valor
médio populacional ( X ) da variável auxiliar x. O referido autor
recomenda proceder à dupla amostragem para tomar X = x ,
acrescentando que se X é desconhecido pode-se, desde que
não implique em grande aumento de custo, medir uma amostra
maior para a variável x, principalmente se x for uma variável de
fácil medição, como exemplo a contagem de árvores.
Seja n1 uma amostra maior de N onde será medida a vari-
ável auxiliar (x). Estima-se, através da amostra de tamanho n1 ,
a média X . Seja n 2 uma subamostra de n1 , onde será medida
a variável de interesse (y). Observar que em n 2 são medidas as
variáveis x e y. A estrutura metodológica da estimativa por razão
é aplicada dentro da subamostra de tamanho n2 , caracterizando
duas fases dependentes.
Admitindo que a amostragem nas duas fases seja simples
ao acaso, então:
y
Rˆ = 2
x2
Considerando x1 = X 1 , tem-se:

170
Estimativa por razão

y R1 = X 1 Rˆ e YˆR1 = N y R1

É evidente que a média y1RR1 é uma estimativa da média Y1


das n1 unidades de amostra da primeira fase. No entanto, Y1 é
uma estimativa de Y , logo se pode afirmar que y 1R
R1 é uma “esti-
mativa de uma estimativa de média”.
Daí, a sua variância:
n2 n2 n2

n − n2 ∑ yi2 − 2 Rˆ ∑ xi yi + Rˆ 2 ∑ xi2 N − n1 Vˆ ( y )
Vˆ ( y R1 ) = ( 1 ) i =1 i =1 i =1
+( ) (7.1)
n1 n2 n2 − 1 N n1

A primeira parte corresponde à variância de y R1R1 e a segun-


da parte é a variância de y1 .

A Expressão 7.1 pode ser apresentada nas formas 7.2 e 7.3.

n n N  n1 Vˆ ( y) (7.2)
Vˆ ( y1R )  ( 1 2 )[Vˆ ( y )  2Rˆ Vˆ ( x, y )  Rˆ 2 Vˆ ( x )] ( )
n1 n2 N n1

Vˆ ( y ) + Rˆ 2V ( x) − 2 Rˆ Vˆ ( x, y ) 2 Rˆ Vˆ ( x, y ) − Rˆ 2Vˆ ( x) Vˆ ( y )
Vˆ ( y1R ) = + − (7.3)
n2 n1 N

Sendo: n2 n2

n2
( yi )2 n2 ( xi )2
 y i2  n2
i1
 xi2  i 1

n2
Vˆ ( y )  i 1
; Vˆ ( x)  i1
;
n2  1 n2  1
n2 n2

n2
(  x i ) y i )
x y i i  i 1 i 1

n2
Vˆ ( x , y )  i 1
.
n 2 1

171
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Se Vˆ ( y R1 ) , tem-se: Vˆ (YˆR1 ) = N 2 Vˆ ( y R1).


).

Vries (1986) sugere usar Vˆ1 ( x) que é um estimador mais


preciso do que Vˆ ( x) , sendo:
n1

n1 ( ∑ xi ) 2
∑x 2
i − i =1

n1
Vˆ1 ( x) = i =1

n1 − 1

Exercício 7.4

Considerar as observações contidas na Tabela 7.6 como


uma subamostra n2 = 30 de uma amostra maior de n1 = 50 uni-
dades e que nas n1 - n2 = 20 unidades foi apenas quantificado o
número de árvores.

Tabela 7.6 - Estimativa por razão com igual probabilidade (AIP) com dupla
amostragem.

UA xi yi UA xi yi UA xi yi UA xi UA xi
1 6 13,0 11 5 16,5 21 10 30,5 31 8 41 8
2 4 16,1 12 4 17,1 22 7 14,7 32 5 42 5
3 4 9,7 13 6 17,6 23 8 19,0 33 8 43 5
4 5 20,1 14 9 24,0 24 6 19,7 34 4 44 5
5 9 29,6 15 5 16,7 25 6 18,4 35 2 45 7
6 8 23,4 16 5 21,9 26 8 25,4 36 6 46 8
7 5 21,9 17 3 10,4 27 8 18,6 37 5 47 6
8 4 17,5 18 5 10,0 28 6 18,9 38 5 48 5
9 8 22,1 19 4 14,5 29 9 28,3 39 5 49 6
10 5 12,8 20 7 29,7 30 7 22,0 40 7 50 5

172
Estimativa por razão

a) informações amostrais preliminares sobre as variáveis


yex

yi = volume em m3/0,25 ha
xi = número de árvores/0,25 ha
n1  50 ; n 2  30; N  14.216
n2 n2


i 1
y i   y i  580,10 m3
i 1
n2 n2

 xi   186 árvores
i 1 i 1
n2

x
i 1
i
186
x2    6,2 árvores / 0,25 ha
30 30
n2


i 1
yi
580 ,10
y2    19 ,3367 m 3 / 0,25 ha
30 30
n1 50

x i x i
301
i 1 i 1
x1     6,02
n1 50 50
n2

n2
(  yi ) 2
580,10 2
 y i2 
n2
i1
12 .164,77 
Vˆ ( y ) 
i 1
 30  32 ,6748
n2  1 29
n2

n2 (  xi ) 2
186 2
x i
2

n2
i 1
1.254,0 
Vˆ ( x) 
i 1
 30  3 ,4759
n2  1 29
n2 n2

n2 (  xi )(  yi )
186  580 ,10
 xi yi  i 1
n2
i 1
3 .830,8 
Vˆ ( x, y)  i1
 30  8,0752
n2  1 29

173
Amostragem em inventário florestal Waldenei Travassos de Queiroz

b) estimativa da razão
y 19 ,3367
Rˆ  2   3,1188 m 3 / árvore
x2 6 ,2

c) estimativa por razão do valor médio

,02 , tem-se:
Considerando x1 = X = 66,02
y1R  X 1 Rˆ  6,02  3,1188  18, 7752 m 3 / 0, 25 ha

d) estimativa por razão do valor total


Yˆ1R  N y1R  14 .296  18,7752  268.410,26 m 3

e) variância do valor médio por razão


n2 n2 n2

y 2
 2Rˆ  xi y i  Rˆ 2  x i2
n n i
N  n1 Vˆ ( y )
Vˆ ( y1R)  ( 1 2 ) i 1 i1 i 1
( )
n1 n 2 n 2 1 N n1
2
50  30 12. 164, 77  2  3,1188  3. 830 ,8  3,1188  1.254 14. 296  50 32, 6748
Vˆ ( y 1R)  ( ) ( )
50  30 29 14. 296 50
Vˆ ( y1R)  0,013333333 16,11453013  0,651210409  0,86607081

Usando as Expressões 7.2 e 7.3, têm-se os mesmos resul-


tados:
n  n2 ˆ N  n1 Vˆ ( y)
Vˆ ( y1R )  ( 1 )[V ( y )  2 RˆVˆ ( x, y)  Rˆ 2Vˆ ( x)]  ( )
n1 n 2 N n1
50  30 14. 296  50 32, 6748
Vˆ ( y1R)  ( )[32, 6748  2  3,1188  8,0752  3,1188 2  3, 4759]  ( )
50  30 14. 296 50
Vˆ ( y1R)  0,214862812  0 ,651210409  0,86607322

Vˆ ( y)  Rˆ 2V ( x)  2 Rˆ Vˆ (x, y) 2 Rˆ Vˆ ( x, y)  Rˆ 2 Vˆ (x) Vˆ ( y)
Vˆ ( y1R )   
n2 n1 N
32,67 48  3,11 88 2  3, 4759  2  3,118 8  8,0752 2  3,1188  8,0752  3.1188 2  3,475 9 32, 6748
Vˆ ( y1R )   
30 50 14.296 ,0
Vˆ ( y1R)  0, 5371 5703  0 ,331201781  0 ,0022855903 75  0, 8660 77322

174
Estimativa por razão

Cálculo de Vˆ ( y1R ) segundo Vries (1986).


Vˆ ( y)  Rˆ 2V1 ( x)  2 RˆVˆ( x, y) 2 Rˆ Vˆ ( x, y)  Rˆ 2Vˆ1 ( x) Vˆ ( y)
Vˆ ( y1R )   
n2 n1 N
n1

n1 ( xi ) 2
3012
x i
2
 i 1

n1
1961 
Vˆ1 ( x)  i 1
 50  3,0404
n1 1 49

Então:
3 2,6748  3,1188 2  3,0 404  2  3,11 88  8,0 752 2  3,1188  8,0752  3. 1188 2  3,040 4 32,6748
Vˆ ( y1 R )   
30 50 14. 296,0

Vˆ ( y 1R )  0 ,39595467  0 ,415923197  0 ,0022855903 75  0 ,809592276

Os cálculos referentes aos intervalos de confiança, limite


de erro e outros, seguem conforme já visto.

7.6 Comparação de dois índices ou duas razões

Pode ser de interesse em um inventário comparar duas ra-


zões ou índices ( R1 e R2 ) entre dois tipos florestais. De acordo
com o procedimento amostral, existem as seguintes situações:
1) Os índices são independentes.
2) Os índices são calculados para a mesma variável auxi-
liar (x).
3) Os dois índices são correlacionados.

1) Os índices são independentes


y y
Sejam Rˆ1 = 1 e Rˆ 2 = 2 .
x1 x2

175
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Neste caso, a variância estimada do contraste entre R1 e R2


é dada por:
Vˆ ( Rˆ1 − Rˆ 2 ) = Vˆ ( Rˆ1 ) + Vˆ ( Rˆ 2 )

A partir dessas informações é possível estruturar as análi-


ses estatísticas de interesse, como por exemplo: testar a hipóte-
se H 0 : R1 = R2 através da estatística “t” de Student e calcular o
intervalo de confiança.

2) Os índices são calculados para a mesma variável au-


xiliar ( x )

y y
Sejam Rˆ1 = 1 e Rˆ 2 = 2 .
x x
y y y − y2 d
Então: Rˆ1 − Rˆ 2 = 1 − 2 = 1 =
x x x x
Sendo:
n

∑d i
d= i =1
para d i = y1i − y 2i
n
Neste caso, a variância estimada do contraste entre R1 e R2
é dada por:
n
1
Vˆ ( Rˆ1 − Rˆ 2 ) =
n(n − 1) x 2
∑ [d
i =1
i − ( Rˆ1 − Rˆ 2 ) xi ] 2

Dado que:
n n

∑ [d
i =1
i − ( Rˆ1 − Rˆ 2 ) xi ] 2 = ∑ [d i2 − 2( Rˆ1 − Rˆ 2 )d i xi + ( Rˆ1 − Rˆ 2 ) 2 xi2 ]
i =1

176
Estimativa por razão

Então: n n n

1
∑d i
2
− 2( Rˆ1 − Rˆ 2 )∑ d i y i + ( Rˆ1 − Rˆ 2 ) 2 ∑ xi2
Vˆ ( Rˆ1 − Rˆ 2 ) = i =1 i =1 i =1

nx2 n −1
3) Os índices são correlacionados
y y
Sejam Rˆ1 = 1 e Rˆ 2 = 2 .
x1 x2
Neste caso, a variância estimada do contraste entre R1 e
R2 é:
Vˆ ( Rˆ1 − Rˆ 2 ) = Vˆ ( Rˆ1 ) + Vˆ ( Rˆ 2 ) − 2COˆ V ( Rˆ1 , Rˆ 2 )

Tal que:
n n n n

1 ∑y 1i y 2 i − R1 ∑ x1i y 2 i − R2 ∑ x 2 i y1i + R1 R2 ∑ x1i x 2 i


ˆ ˆ ˆ
COˆ V ( Rˆ1 , Rˆ 2 ) = ( ) i =1 i =1 i =1 i =1

n x1 x2 n −1

Exercício 7.5

Seja uma amostra de 20 famílias de uma população de


produtores rurais. Os dados coletados estão apresentados na
Tabela 7.7, onde x é o número de componentes por família; y1 é
a renda líquida obtida por hectare (número de salários mínimo);
y 2 é a despesa por hectare (número de salários mínimo) do
manejo dos recursos florestais. Confrontar os dois índices ou as
duas razões pelo teste “t”.
Neste caso os índices serão calculados a partir da mesma
variável auxiliar (x).

177
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Tabela 7.7 - Dados por família: comparação de dois índices ou duas razões.

Família xi y1 y2 d i = y1i − y 2i d i xi
1 6 3,92 5,22 -1,30 -7,80
2 4 4,96 2,33 2,63 10,52
3 5 4,06 4,47 -0,41 -2,05
4 4 2,30 2,83 -0,53 -2,12
5 7 4,68 4,27 0,41 2,87
6 5 4,22 3,43 0,79 3,95
7 4 3,70 2,82 0,88 3,52
8 6 3,62 4,66 -1,04 -6,24
9 6 2,65 5,62 -2,97 -17,82
10 4 3,31 3,15 0,16 0,64
11 5 6,38 3,88 2,50 12,50
12 4 6,90 2,89 4,01 16,04
13 5 6,10 4,06 2,04 10,20
14 5 3,50 3,70 -0,20 -1,00
15 4 1,61 3,82 -2,21 -8,84
16 5 3,74 3,97 -0,23 -1,15
17 6 3,89 5,08 -1,19 -7,14
18 4 3,93 2,95 0,98 3,92
19 6 3,77 4,45 -0,68 -4,08
20 4 4,52 2,32 2,20 8,80

a) cálculo dos índices ou razões

y 4,088 y 3,796
Rˆ1 = 1 = = 0,825859 , Rˆ 2 = 2 = = 0,766869
x 4,950 x 4,950

b) estimativa da variância do contraste entre R1 e R2


A variância estimada do contraste entre R1 e R2 é:
n n n

1 ∑ d i2 − 2( Rˆ1 − Rˆ 2 )∑ d i xi + ( Rˆ1 − Rˆ 2 ) 2 ∑ xi2


Vˆ ( Rˆ1 − Rˆ 2 ) = ( 2 ) i =1 i =1 i =1

nx n −1

178
Estimativa por razão

1 59 ,698  2  (0,825859  0 ,766869 )  14 ,72  ( 0,825859  0 ,766869 ) 2  507


Vˆ (Rˆ 1  Rˆ 2 )  ( 1 2
) 59 ,698  2  (0,825859  0 ,766869 )  14 ,72  ( 0,825859  0 ,766869 ) 2  507
Vˆ (Rˆ 1  Rˆ 2 )  (20  4 ,95 2 ) 19
ˆ ˆ ˆ 20  4 ,95 19
V ( R1  R 2 )  0 ,0064145552
Vˆ ( Rˆ  Rˆ )  0 ,0064145552
1 2

Logo:

s ( Rˆ1 − Rˆ 2 ) = Vˆ ( Rˆ1 − Rˆ 2 ) = 0,0800909

c) testar H 0 : R1 = R2
Rˆ1  Rˆ2 0,825859  0 ,766869
t   0 ,7365 ns
s ( Rˆ1  Rˆ 2 ) 0 ,0800909

Não há razão para rejeitar H0 : R1 = R2, visto que t19 ; 0,025 = 2,09.
Conclui-se que os dois índices são estatisticamente iguais, tal
que R̂1 é o índice referente à renda líquida por hectare e R̂2 é o
índice referente às despesas por hectare.

179
Capítulo 8

ESTIMATIVAS POR REGRESSÃO

Define a estimativa por regressão, descrevendo os parâ-


metros populacionais e os seus estimadores. Mostra teorica-
mente quando usar as estimativas por razão e por regressão.
Apresenta a metodologia para obter estimativas por regressão
considerando a amostragem estratificada ao acaso. Mostra
exercícios aplicativos considerando várias alternativas de aná-
lise, principalmente comparando as estimativas por razão e por
regressão.
Estimativa por regressão

Em levantamentos por amostragem, como descrito no capí-


tulo referente ao estudo das estimativas por razão, pode ocorrer
caso em que há a necessidade de se obter estimativa da relação
entre duas variáveis aleatórias x e y, normalmente correlaciona-
das para cada unidade de amostra. O uso das estimativas por
razão e por regressão objetiva obter maior precisão na análise
dos dados, através da utilização de uma variável auxiliar xi que
se correlaciona com a variável resposta de interesse yi.
A utilização da estimativa por razão é recomendada quando
existir uma relação linear entre as variáveis x e y e que a reta de
regressão passe pela origem do sistema de eixos coordenados.
Entretanto, pode acontecer que mesmo havendo tendência
linear entre x e y a reta de regressão de y em x pode não passar
pela origem do sistema de eixos coordenados. Neste caso, é
recomendável e mais preciso o uso da estimativa por regressão.

8.1 PARÂMETROS POPULACIONAIS E ESTIMADORES

Dado que:
X = média populacional para a variável auxiliar x;
Y = média populacional para a variável de interesse y;
x = média amostral para a variável auxiliar x;
y = média amostral para a variável de interesse y;
L = média estimada por regressão para a variável de in-
y RRL
teresse y;
b = coeficiente de inclinação estimado da reta de regres-
são;
B = coeficiente de inclinação populacional da reta de re-
gressão;
YˆRRL
L = valor amostral por regressão para o valor populacio-
nal da variável de interesse y;

183
Amostragem em inventário florestal Waldenei Travassos de Queiroz

N = número total de unidades da população;


n = número de unidades de amostra do inventário florestal.

a) estimativa do valor médio por regressão y RL

Sejam xi e yi as observações realizadas em uma amostra


de tamanho n, em que o valor médio verdadeiro X da variável x
é conhecido.
Da teoria de regressão, a média estimada por regressão y RL
RL
para a variável de interesse y é obtida pela fórmula:

LL = y + b( X − x )
y RRL
R (8.1)

Tal que: E (b) = B


Pode ser verificado pela fórmula de estimação da média
por regressão 8.1 que y RL RL é um estimador consistente da média
populacional, pois se n = N , então, x = X e y = Y , logo:
RL = y + b( X − x ) = Y
y RL

Pode-se obter a estimativa do valor de total YˆRRL


L pela
= fórmu-
ˆ
la: YRLRL = N y RL
L .
R

O coeficiente de inclinação ou angular b da reta de regres-


são pode em alguns levantamentos ser fixado, mas, geralmente,
no caso de inventários florestais deverá ser obtido através da
amostra.
No caso do coeficiente angular ser fixado como zero (b = 0),
verifica-se que o resultado da estimativa por regressão é o mes-
mo da Amostra Simples ao Acaso (ASA).

Se b = 0 , então: y RRL
LL = y , pois yyRLRL
R RL = y + b( X − x ) .

184
Estimativa por regressão

No caso do coeficiente angular ser b = y x , a estimativa


por regressão coincide com a estimativa por razão.

Se b = y x , então, y RRL
LL = y R .
R

b) variância da média do valor médio por regressão y RL


RL

Sob o ponto de vista teórico, o método da estimativa por


regressão, no caso de pequenas amostras, apresenta o inconve-
niente de não estar devidamente solucionado o problema da defi-
nição da fórmula para a obtenção da variância da média, mas no
caso de grandes amostras, o que ocorre em inventários florestais,
é possível obter a expressão para calcular uma boa estimativa.
A fórmula da variância da média nas estimativas por re-
gressão pode ser obtida considerando as seguintes condições:

1) Variância da média com o coeficiente angular prefi-


xado

No caso de inventários florestais não é usual prefixar o va-


lor do coeficiente angular, mas admitindo que b = b0 :
y RL  y  b0 ( X  x )

Se b0 é fixado, pode-se comprovar tratar-se de um estima-


dor não tendencioso, pois E ( y RL )  Y . . Visto que:
E ( y RL )  E [ y  b0 ( X  x )]  Y

Seja o desvio considerando cada unidade da população:


ei  y RLi  Y  yi  b0 ( X  x i )  Y  y i  Y  b0 ( x i  X )

185
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Pela definição de variância da média:


N  n V ( y RL )
V ( y RL )  ( )
N n

Por conseguinte:

Resultando:
Nn
V ( y RL )  ( )[V ( y )  2b0V ( x, y)  b02V ( x)]
Nn

Sendo:
Nn ˆ
Vˆ ( y RL )  ( )[V ( y )  2b0Vˆ ( x, y)  b02Vˆ ( x)]
Nn

Seja o questionamento: Qual o valor ideal para b0? A res-


posta seria o valor de b0 que torna mínimo o valor de V ( y RL
RL ).
)
Seja 8.2 a Expressão para obter o valor do coeficiente an-
gular populacional B, o qual também é denominado coeficiente
de regressão linear de y sobre x.
N N

N
( xi )( yi )

i 1
xi y i  i1
N
i 1
V ( x, y ) (8.2)
B N

V (x )
N
(  xi ) 2
2

i 1
xi  i1
N

186
Estimativa por regressão

Como b0 é um valor prefixado, seja b0 = B + k, onde B é o


valor verdadeiro e k o desvio de b0 em relação a B.
Daí:
N N N

N n ( y
i 1
i  Y ) 2  2(B  k)  ( yi  Y ) ( xi  X )  ( B  k) 2  ( xi  X )2
I 1 i 1
V ( yRL )  ( )
Nn N 1

Tomando-se a primeira e a segunda derivadas dessa ex-


pressão em relação à variável k, verifica-se que V RL )) torna-se
V ( y RL
mínima quando k = 0. Concluindo-se que o valor de b0 que torna
mínima a variância da estimativa da média é b0 = B.
Logo:
N N N

 (y i
 Y ) 2  2 B ( y i  Y )( xi  X )  B 2  ( xi  X ) 2
N n i 1 I 1 i 1
Vmin ( y RL )  ( )
Nn N 1

Portanto:
N n
Vmin ( y RL )  ( )[V ( y )  2 B V ( x, y)  B2V ( x)]
Nn
N n V ( x, y) V ( x, y) 2
Vmin ( y RL )  ( ){V ( y )  2 V ( x, y )  [ ] V ( x )}
Nn V (x ) V (x )
N n V 2 ( x, y)
Vmin ( y RL )  ( )[V ( y)  ]
Nn V ( x)

Dado que d 2 = V 2 ( x, y ) [V ( x) × V ( y )] , onde d 2 é o coefi-


ciente de correlação ao quadrado, então:
Nn
Vmin ( y RL )  ( )[V ( y )   2V ( y) ]
Nn

Resultando:
Nn
Vmin ( y RL )  ( )[V ( y )(1   2 )]
Nn

187
Amostragem em inventário florestal Waldenei Travassos de Queiroz

2) Variância da média com o coeficiente angular esti-


mado através da amostra

Seja uma amostra de n pares de valores xi e yi. Da teoria


de Regressão Linear Simples, pelo método dos quadrados mí-
nimos, tem-se que a estimativa do coeficiente angular B da reta,
denominado também de coeficiente de regressão, é dada pela
fórmula:
n n

n
( x i )(  y i )
x y
i 1
i i  i 1
n
i1

b n

n
( x i ) 2
x
i 1
i
2
 i 1
n

Então: y RL  y  b( X  x )

Em termos populacionais, sendo E(b) = B, pode-se escrever:


ei = y i − Y − B ( x i − X )

Seja:
N N

 ei2   [y i  Y  B ( xi  X )]2
i 1 i 1

Da definição de variância da média:


N

N  n i1
e i
2

V ( y RL )  ( )
Nn N  1

188
Estimativa por regressão

N n
 [( y
i 1
i  Y )  B( x i  X )]2
V ( y RL )  ( )
Nn N 1
N

N n 
[( yi  Y )2  2 B( xi  X )( yi  Y )  B2 (xi  X )2 ]
V ( y RL )  ( ) i1
Nn N 1

Como:
N

(x
i1
i  X )( yi  Y )
B N

 (x i  X )2
i1

Então:
N N

 ( xi  X )( y i  Y )  B  ( xi  X ) 2
i 1 i 1

Logo:
N N N

N n  ( yi  Y )2  2B 2  (xi  X ) 2 B 2  (xi  X ) 2
i 1 i 1 i 1
V ( y RL )  ( )
Nn N 1
N N

N n  ( yi  Y ) 2  B 2  ( xi  X ) 2
i 1 i1
V ( y RL )  ( )
Nn N 1

Dado que:
N

[  ( xi  X )( yi  Y ) ]2
2  N
i 1
N

[ ( xi  X )2 ][ ( yi  Y ) 2 ]
i 1 i 1

189
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Então:
N
B 2
∑ (x i − X )2
d2 = N
i =1

∑(y
i =1
i − Y )2

Portanto:
N
d 2
∑(y i − Y )2
B2 = N
i =1

∑ (x
i =1
i − X )2

Por conseguinte:
N N

N  n i1
 (y i
i 1
 Y ) 2   2  ( y i  Y )2
V ( y RL )  ( )
Nn N 1
N n
V ( y RL )  ( )V ( y)(1   2 )
Nn

Finalmente, a fórmula da estimativa da variância da esti-


mativa da média por regressão, tal que o coeficiente angular é
estimado através da amostra, é:
N n ˆ
Vˆ ( y RL )  ( )V ( y )(1  ˆ 2 )
Nn

A estimativa da variância da estimativa da média pela re-


gressão também pode ser obtida usando-se a teoria da análise
de regressão simples.

N n SQˆ Re s
Vˆ ( y R L )  ( )Q Mˆ Re s , tal que Q Mˆ Re s  .
Nn n2

190
Estimativa por regressão

O termo SQˆ Res


e sé a soma estimada de quadrados do resíduo
R
da regressão linear simples. O divisor n - 2 produz uma estima-
tiva sem tendência de V (y) quando a população é infinita e a
regressão é linear.
Dado y RL
RL e V ( y RL
RL ), pode-se obter:

YˆRL  N y RL e V (YˆRL )  N 2Vˆ ( y RL )

Pode-se comparar a precisão considerando a metodologia


da amostra simples ao acaso em relação à estimativa por re-
gressão.
Sejam as respectivas variâncias da média:
Variância da média para a amostra simples ao acaso:

N −n
V ( y) = ( )V ( y )
Nn
Variância da média para a estimativa por regressão:
Nn
V ( y RL )  ( )V ( y )(1   2 )
Nn

Da comparação dessas expressões, conclui-se que se


d = 0 implica que V ( y RL
RL ) = V ( y).RL Então, a amostra simples ao
acaso tem a mesma precisão da estimativa por regressão.
Se d 2 > 0 implica que V ( y RL RL então a amostra sim-
RL ) < V ( y),
ples ao acaso é menos precisa que a estimativa por regressão.

c) intervalo de confiança para a média Y e para o valor total Y

191
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Exercício 8.1

Seja uma área florestal populacional de 100 ha com ocor-


rências de 405 árvores matrizes (dados simulados). O objetivo é
monitorar a produção de sementes de uma determinada espécie
florestal. A área está subdividida em 100 subáreas de 1 ha. As
405 matrizes da espécie em estudo estão perfeitamente locali-
zadas em um mapa logístico. A Tabela 8.1 apresenta os dados
de produção de sementes e o número de árvores referentes a
uma amostra de n = 38 unidades (38 ha), obter:
1) a estimativa por razão;
2) a estimativa sem considerar a variável auxiliar (número
de árvores);
3) a estimativa por regressão;
4) concluir sobre os resultados.

Dado:
yi = Peso de sementes por ha
xi = Número de árvores por ha

Tabela 8.1 - Produção em kg de sementes (yi) e número de árvores (xi).

Unid xi yi Unid xi yi Unid xi yi


1 5 16,15 14 4 12,57 27 5 14,58
2 3 10,53 15 4 10,88 28 5 14,14
3 4 8,50 16 4 13,03 29 3 11,94
4 5 11,90 17 3 11,11 30 5 12,37
5 3 9,07 18 4 10,28 31 3 11,03
6 4 13,23 19 5 13,14 32 5 12,71
7 4 11,48 20 5 13,44 33 3 8,93
8 5 14,71 21 6 14,14 34 6 15,75
9 3 10,95 22 4 15,40 35 2 10,71
10 4 15,31 23 5 12,20 36 7 15,01
11 4 11,26 24 4 12,58 37 6 13,76
12 4 11,73 25 4 13,13 38 3 8,19
13 7 16,42 26 6 14,39
Total 166 476,65

192
Estimativa por regressão

1) Estimativa por razão

a) cálculo da estimativa da razão

Peso de sementes total e número total de árvores na amostra:


n

y
i1
i  476,65 kg
n

x i  166 árvores
i1
n

y i
476,65
Rˆ  i 1
n   2,871386
166
x i
i 1

b) estimativa da variância de R̂
Nn ˆ
Vˆ ( Rˆ )  ˆ2 ˆ ˆ ˆ
2 [V ( y)  R V ( x )  2 RV ( x, y )]
nN X

Dado que:
405
X   4,05 árvores / ha
100

Vˆ ( y)  4,5477 (kg / ha )2

Vˆ ( x)  1,3741 (árvores / ha) 2 e Vˆ ( x , y )  1,8090 , tem-se:


100  38
Vˆ (Rˆ )  2
(4,5477  2,8713862 1,3741  2  2,871386 1,8090)
38 100  4,05

Vˆ ( Rˆ )  0 ,005459271

c) estimativa do desvio padrão de R̂



s ( Rˆ ) = V ( R) = 0,0054592708 1280327 = 0,073887

193
Amostragem em inventário florestal Waldenei Travassos de Queiroz

d) intervalo de confiança para R

Seja t = 2,0278 o valor da distribuição de Student com 37


graus de liberdade para o nível de significância a = 0,05, têm-se:

Limite inferior
Rˆ − t × s ( Rˆ ) = 2,871386 − 2,0278 × 0,073887 = 2,721558

Limite superior
Rˆ + t × s ( Rˆ ) = 2,871386 + 2,0278 × 0,073887 = 3,021214

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor verdadeiro ou paramétrico da razão encontra-se no
intervalo de 2,721558 a 3,021214.

e) estimativa da média da produção de sementes y R e sua


variância Vˆ ( y R )
y R  Rˆ X  2,871386  4,05  11, 6291 kg / ha

Vˆ ( y R )  X 2Vˆ (Rˆ )  4 ,05 2  0,0054592708  0 ,08954569 (kg / ha )2

s( y R ) / ha  Vˆ ( yR )  0,299242 kg / ha

f) estimativa do total YˆR e sua variância Vˆ ( y R )


YˆR  Rˆ NX  2,871386  100  4, 05  1. 162, 91133 kg

Vˆ (YˆR )  N 2 X 2 Vˆ (Rˆ )  100 2  4 ,05 2  0,0054592708  895,456893 kg 2

s(YˆR )  Vˆ(YˆR )  29,92418575 kg

g) intervalo de confiança para o valor médio Y

Limite inferior
yR  t  s( yR )  11,6291  2,0278  0,299242  11,02229707 kg / ha

194
Estimativa por regressão

Limite superior
y R  t  s ( y R )  11, 6291  2, 0278  0, 299242  12, 235903 kg / ha

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor médio populacional encontra-se no intervalo
de 11,022297 kg/ ha a 12,235903 kg/ ha.

h) intervalo de confiança para o valor total Y

Limite inferior
Yˆ R  t  s( YˆR )  1162 , 91133  2 ,0278  29 , 92418575  1102 , 231066 kg

Limite superior
YˆR  t  s (YˆR )  1162,91133  2,0278  29 ,92418575  1223,591594 kg

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor total populacional encontra-se no intervalo de
1.102,231066 kg a 1223,591594 kg.

i) limite de erro da estimativa por razão


2,0278  0,299242
LE ( yR )   5, 217970 %
11,6291

2) Estimativa sem considerar a variável auxiliar (núme-


ro de árvores)

a) valor médio sem considerar a variável auxiliar


n

y i
476,65
i 1
y   12,5434 kg / ha
n 38

195
Amostragem em inventário florestal Waldenei Travassos de Queiroz

b) variância da média sem considerar a variável auxiliar


Vˆ ( y ) N  n 4,54770960 100  38
Vˆ ( y )  ( ) ( )  0,074199472 (kg / ha) 2
n N 38 100
s ( y )  Vˆ ( y)  0,074199472  0,274199472 kg / ha

Sendo:
n
( yi )
2
n
2
y i  i 1
n
Vˆ ( y )  i 1
 4,54770960 (kg / ha )2
n 1

c) limite de erro da estimativa sem considerar a variável


auxiliar
2,0278  0, 2723958
LE SV ( y )   4,4036 %
12,5434

d) eficiência da estimativa da média por razão versus a da


média sem considerar a variável auxiliar.

A eficiência é definida como o quociente entre o limite de


erro da média sem considerar a variável auxiliar versus o valor
obtido pelo método da razão.
LE SV ( y ) 4,403624
Ef    0,8439
L( y R ) 5,217970

O resultado mostra que o limite de erro correspondente à


análise sem considerar a variável auxiliar apresenta um valor
correspondente a 84,39% do valor do limite de erro pelo método
por razão. O método sem considerar a variável auxiliar é 18,49%
mais eficiente que o por razão, visto que:

196
Estimativa por regressão

LE ( y R ) 5,217970
Ef    1,1849
L( y ) 4,403624

O banco de dados do exemplo apresentado não é adequa-


do para o uso da estimativa por razão, visto que, se realizada
uma análise de regressão simples, ter-se-á os seguintes resul-
tados:
Reta de regressão linear simples: Y = 6,7925+1,3165X

Tabela 8.2 - Análise de variância da regressão.

CV GL SQ QM F
Regressão 1 88,114 88,114 39,58
Resíduo 36 80,151 2,226
Total 37 168,265

Teste para verificar a hipótese se o parâmetro linear a é


diferente de zero, tal que Yi  a  bX i  ei :
1 x2
Vˆ (aˆ )  [  n
]QMˆ Re s
n
n
( x i ) 2

2
x
i 1
i  i 1
n

QMˆ Resíduo
e síduo = Quadrado médio do resíduo estimado
R

166 2
(
)
1 38 1 19 ,08310249
Vˆ ( aˆ )  (  2
)  2,226  (  )  2,226
38 166 38 50,84210526
776 
38

Vˆ ( aˆ )  0,894086956

197
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Dado que:

aˆ 6,7925
t= = = 7,1836
Vˆ (aˆ ) 0,894086956

Conclui-se pela rejeição de H 0 : a = 0.

A estimativa por razão não é recomendável quando o coe-


ficiente linear ( a ) é diferente de zero.

3) Estimativa por regressão

a) produção média de sementes por regressão

Dado:
n n n

 y i  476,65 ;
i 1
 xi  166;
i 1
x y
i 1
i i  2149,14;

n n
405
 y i2  6147,0869;
i 1
x
i 1
i
2
 776,00; X 
100
 4,05

Então:
n n

n
( x i )( y i )
166  476,65
 xi y i  i1
n
i 1
2149,14 
38
i 1
b n
 2
 1,316469979
( xi ) 2 166
n 776 
2 i 1 38

i 1
x
i 
n

Destarte:
476,65 166
yR L  y  b( X  x )   1,316469979(4,05  )
38 38

198
Estimativa por regressão

yRL  y  b( X  x )  12,1242293 kg / ha

b) estimativa da variância de y RRL


L

Dado que:
n n

n
(  xi )(  y i )
[ x i y i  i 1 i 1
]2 166  476, 65 2
(2149,14 
)
n 38
ˆ 2  i 1
n n
 2 2
( x i ) 2 n ( y i ) 2 166 476,65
n
( 776  )(6147,0869  )
[  x i2  i 1 ][  y i2  i 1 ] 38 38
i 1 n i 1 n

4 .479 ,906715
ˆ2   0,523661923
8554,959825
n

n
( y i ) 2
476,65 2
y i
2
 i 1

n
6147 ,0869 
38  4 ,547709602 ( kg / ha )2
Vˆ ( y)  i 1

n 1 37

Então:
N n ˆ 100  38
Vˆ ( yRL )  ( )V ( y)(1  ˆ 2 )   4,54770902  (1  0,523661923)
Nn 100  38

Vˆ ( yRL )  0,035344029 ( kg / ha ) 2

s ( yR L ) / ha  Vˆ ( yRL )  0 ,1880 kg / ha

Para grandes amostras, como neste exemplo, a variância


da média pode ser obtida da seguinte forma:
Da análise de variância apresentada na Tabela 8.2, tem-se:
QMˆ Re s  2,226
N n 100  38
Vˆ ( y RL )  ( )QMˆ Re s  ( )  2,226  (0,0363189 kg / ha) 2
Nn 100  38

199
Amostragem em inventário florestal Waldenei Travassos de Queiroz

c) estimativa do total YˆRLRL e sua variância Vˆ (YYˆˆRLRLRL))

YˆRL  N y RL  100  12,1242293  1.212 ,42293 kg

Vˆ (YˆRL )  N 2Vˆ ( y RL )  100 2  0,035344029  353 ,44029 kg 2

s(YˆRL )  Vˆ (YˆRL )  18,80 kg

d) intervalo de confiança para o valor médioY

Limite inferior

Limite superior

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor médio populacional encontra-se no intervalo
de 11,7430 kg/ ha a 12,5055 kg/ ha.

e) intervalo de confiança para o valor total Y

Limite inferior
y RL  t  s( y RL )  1212, 42293  2,0278 18,80  1.174,3003 kg

Limite superior

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor total populacional encontra-se no intervalo de
1.174,3003 kg a 1.250,5456 kg.

200
Estimativa por regressão

f) limite de erro da estimativa por regressão


2,0278 0,1880
LE( y RL )   3,144335 %
12,1242293

g) eficiência da estimativa por regressão versus a média


sem considerar a variável auxiliar.

A eficiência é definida como o quociente entre o valor do


limite de erro da média sem considerar a variável auxiliar versus
o obtido pelo método da regressão.
LE ( y ) 4,403624
Ef    1,4005
LE ( y RL ) 3,144335

O resultado mostra que o limite de erro correspondente à aná-


lise sem considerar a variável auxiliar apresenta um valor 40,05%
maior que o obtido pelo método por regressão, demonstrando que
este método possui uma eficiência superior que aquele.

h) eficiência da estimativa por regressão versus a da média


por razão

A eficiência é definida como o quociente entre o limite de


erro da média por razão versus ao da média estimada pelo mé-
todo da regressão.
LE ( yR ) 5,217970
Ef    1,6595
LE ( y RL ) 3,144335

O resultado mostra que o limite de erro correspondente à


média por razão apresenta um valor 65,95 % superior ao obti-
do pelo método por regressão, demonstrando que este método
possui uma eficiência superior que aquele.
Como a hipótese da nulidade ( H 0 : a = 0 ) foi rejeitada e a
correlação entre a variável de interesse e variável auxiliar é de

201
Amostragem em inventário florestal Waldenei Travassos de Queiroz

72,36%, fica evidente que o processo de estimativa por regres-


são é mais eficiente que os demais.

8.2 Estimativas por regressão considerando a


amostra estratificada ao acaso

As estimativas por regressão na amostragem estratificada


podem ser obtidas pelos seguintes procedimentos:
1) as estimativas por regressão são obtidas na forma usual
da amostragem estratificada considerando cada estrato separa-
damente;
2) as estimativas por regressão são obtidas a partir das
médias estratificadas das variáveis y e x, considerando os estra-
tos conjuntamente, ou seja, usando y est e xest .

1) Estimativas por regressão considerando os estratos


separadamente

Este procedimento deve ser adotado quando os verdadeiros


valores dos coeficientes angulares Bh variam entre os estratos.

a) valor médio por regressão considerando os estratos se-


paradamente
y RL  yh  bh ( X h  x h )
h

b) valor total por regressão considerando os estratos sepa-


radamente
YˆRL  N h yRL
h h

202
Estimativa por regressão

c) valor médio global por regressão considerando separa-


damente os estratos
L
y RL S  W
i 1
h y RLh

d) valor total global por regressão considerando separada-


mente os estratos

Da teoria da amostragem estratificada:


L L L
YˆRLS  N y RL S  N  Wh y RL h   N h y RL h   Yˆ RL h
h1 h 1 h 1

e) variância do valor médio global por regressão conside-


rando os estratos separadamente

A variância da média estratificada da estimativa por regres-


L
Wh2 ( N h  n h )
são considerando os estratos separadamente V ( yR L ) ,com  os [Vh ( y)  2b
nh N h S

coeficientes angulares por estrato prefixados ( b0 h ), é dada pela


h 1

expressão: 2 L
Wh ( N h  n h )
V ( yR L )   [Vh ( y)  2b0 h Vh ( x, y)  b02hVh ( x)]
S
h 1 nh N h

Como, geralmente, em inventários florestais, o tamanho


das amostras por estratos ( nh ) não é pequeno, os coeficientes
angulares podem ser estimados pela expressão:
n n

nh ( xhi )( y hi )
x
i 1
hi y hi  i 1
nh
i 1

bh  n

n
(  x hi ) 2
x 2
hi  i1

nh
i 1

203
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Por conseguinte:
y RL  yh  b h ( X h  xh )
h

Então, a expressão da variância da média estratificada


da estimativa por regressão considerando os estratos separa-
L
Wh2 ( N h  n h )
damente V ( yR L ) ,com
 os coeficientes [Vh ( y) angulares
2b0 h Vh ( x, y)estimados
 b02hVh ( x)] por
S
n N
estrato ( bh ), é: h 1 h h

L
Vˆ ( y RLS )   Wh2Vˆ ( y RLh )
I !

Dado que:
N h  nh
V ( y RL h )  ( )Vh ( y )(1   h2 )
N h nh

E a sua estimativa:
N  nh ˆ
Vˆ ( y RL h )  ( h )V h ( y )(1  ˆh2 ) ou Vˆ ( y RL )  ( N h  nh )Qˆ M Re s
N hn h h
N h nh

2) Estimativas por regressão a partir das médias es-


tratificadas das variáveis y e x, considerando os estratos
conjuntamente, ou seja, usando y est e xest .

Este procedimento deve ser adotado quando não houver


grande variação entre os verdadeiros valores dos coeficientes
angulares Bh entre os estratos.

a) valor médio por regressão considerando conjuntamente


os estratos LL LL
Dado que: xEsEstt   Whh xhh ee y Est
Est  Whh y hh , então:
II !! II !!

y RLC  y Est  bc ( X  xEst )

204
Estimativa por regressão

O coeficiente da regressão bc é obtido considerando o


conjunto total dos dados: n n h h

nh ( xhi )( yih )


L
Wh2 (1  f h )
 { n (n [ xhi yhi  i 1 i 1
]}
h 1 h h  1) i 1 nh
bc  nh
( xhi ) 2
L
Wh2 (1  f h ) ni 2
 { [ xhi 
h 1 nh ( nh  1) i 1
i 1
nh
]}

Se a alocação for proporcional e no caso de grandes amos-


tras, substituir (nh − 1) por nh ,nhresultará:
nh
nh nh
( xhi )( y )
L nh
nh
(
i 1 hi 
x )( i1 y ihih )


[ x
L
[ x
h1 i1
hi
hi
yhi 
yhi  i 1
nh
i1 ]
]
bc''  h1 i1 nh
bc  nh
nh
( x hi )22
L ni
ni ( x )
i 1 hi

 [
L
[ x
x
h1 i 1
2
2
hi
hi

 i 1
nh
]
]
h1 i 1 nh
N n
Pois: Nhh  nhh
Pois: N  n
N n
b) valor total por regressão considerando conjuntamente
os estratos
YˆRLC  N  y RLC

c) variância do valor médio global por regressão conside-


rando conjuntamente os estratos

A fórmula da variância da média estratificada da estimativa


L
Wh2 ( N h  n h )
por regressão V ( yR L ) ,considerando
 [os
Vh (coeficientes
y)  2b0 h Vh ( x, yangulares
)  b02hVh ( x)]
n N S

por estrato b0 h prefixados,h 1


é: h h

205
Amostragem em inventário florestal Waldenei Travassos de Queiroz

L
W 2 (N  n )
Vˆ ( y RLC )   h h h [Vˆh ( y )  2b0 hVˆh ( x, y )  boh Vˆh ( x)]
2

h 1 nh N h

Quando o valor do coeficiente angular é obtido através da


amostra, tem-se:
2
L
WL 2 (WN  n )
Vˆ ( yVRL(Cy)RLC )  h ( h h )[[Vˆh ( y ) 
 2b0cV ˆ , ,yy))bbc2Vh2V
h h( (xx
hV oh
(ˆxh )(]x)]
h 1 h 1 nhN
Nhhnh

E sua estimativa:
L
W 2 (1  f h ) ˆ
Vˆ ( y RLC )   h [Vh ( y )  2bcVˆh ( x, y )  bc2Vˆh ( x)]
h 1 n h

Exercício 8.2

Um produtor florestal possui uma área de 1200 ha. A área


apresenta três tipos florestais (três estratos) com ocorrência de
castanha do brasil. As árvores de castanha do brasil estão iden-
tificadas e plotadas em um mapa logístico, o que permite co-
nhecer o número total populacional de árvores por estrato. Os
estratos estão subdivididos em unidades de 1 ha.
Os dados foram simulados considerando uma amostra sim-
ples ao acaso de uma população binormal por estrato ( n1 = 40,
n 2 = 39 e n3 = 38). A Tabela 8.3 apresenta os vetores de médias
e matrizes de covariâncias por estrato considerando a produ-
ção de sementes de castanha (y) e o número de árvores (x) por
parcela de 1 ha. A Tabela 8.4 apresenta os dados das amostras
simples ao acaso por estrato ( n1 = 40, n 2 = 39 e n3 = 38). A Tabe-
la 8.5 apresenta as informações populacionais sobre a variável
auxiliar (número de árvores).

206
Estimativa por regressão

1) Obter as estimativas por regressão por estrato e compa-


rar os resultados sem considerar a variável auxiliar número de
árvores.

2) Efetuar a análise global para as estimativas por regres-


são considerando os estratos separadamente e comparar os re-
sultados sem considerar a variável auxiliar número de árvores.

3) Obter a análise global para as estimativas por regressão


considerando os estratos conjuntamente, ou seja, a partir de y Est
e xEst , e comparar os resultados sem considerar a variável auxi-
liar número de árvores.

4) Comparar os resultados das estimativas por regressão


considerando os estratos separadamente versus os estratos
conjuntamente ( y Est e xEst ).

5) Discutir e concluir sobre os resultados principalmente


sem usar a variável auxiliar número de árvores.

Tabela 8.3 - Vetores das médias e as matrizes de covariâncias da população.

Est Vetor de médias Matriz de covariância

I 203002 1602 7,2


20 
 10  7,2   
 88   8   48 

II 202002  902 5,7


20 
 18   85,7  85 
 88    
III 202102  402 2,3
20 
 858   82,3  82 
    

207
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Tabela 8.4 - Dados das amostras simples ao acaso por estrato.

Estrato I Estrato II Estrato III


UA
y x y x y x
1 28,37 10 21,8 6 15,47 6
2 26,69 9 21,0 9 15,14 8
3 40,84 16 23,5 11 12,90 4
4 34,03 11 19,6 8 14,24 3
5 23,61 8 22,6 9 15,37 6
6 28,03 9 17,3 5 12,71 5
7 25,43 9 18,3 8 9,66 3
8 33,16 11 21,9 10 11,29 3
9 37,17 14 21,5 7 7,89 6
10 38,26 14 25,5 12 8,71 4
11 28,12 9 16,7 8 14,04 6
12 23,10 8 19,3 8 11,55 5
13 32,21 8 21,5 10 13,79 3
14 26,30 10 18,0 6 13,25 6
15 29,39 8 21,4 9 13,29 7
16 27,28 8 27,4 12 14,91 8
17 29,08 9 21,3 3 14,33 6
18 29,33 11 19,2 11 11,18 5
19 29,91 12 18,5 7 15,37 6
20 36,48 11 17,9 7 11,12 4
21 33,42 12 25,6 11 14,36 7
22 29,52 11 23,4 10 13,91 8
23 34,08 13 25,2 12 11,33 5
24 22,18 7 23,8 10 12,79 4
25 29,03 11 23,1 9 10,11 7
26 28,43 9 18,9 6 12,79 4
27 32,69 12 25,5 12 15,87 7
28 24,76 8 20,9 8 11,88 4
29 34,00 11 22,1 10 12,38 5
30 26,66 9 16,8 5 12,95 4
31 31,66 10 19,3 7 11,55 7
32 34,26 13 18,1 8 13,58 6
33 30,45 11 16,8 6 12,03 6
34 32,93 11 20,6 13 14,02 6
35 25,86 9 21,6 8 9,37 4
36 29,59 10 20,5 9 14,15 5
37 30,32 10 19,3 6 12,38 5
38 29,91 10 13,3 3 11,57 5
39 28,33 10 20,2 8
40 27,59 9

208
Estimativa por regressão

Tabela 8.5 - Número de árvores por estrato (População).

Estrato Área em ha N0 de árvores por estrato N0 de árvores/ha


I 600 6.240,0 10,40
II 360 3.060,0 8,50
III 240 1.248,0 5,20

1) Estimativas por regressão por estrato e comparação


dos resultados sem considerar a variável auxiliar número
de árvores

Sabe-se que:
600 ha 360 ha 240 ha
W1   0,5; W2   0,3; W3   0,2
1.200 ha 1.200 ha 1.200 ha

N 1  600; N 2  360 ; N 3  240

a) estimativa por regressão para o estrato I


a1) produção média de sementes por regressão

Dado:
n1 n1 n1

 y1i  1.202,460 ;
i 1
 x1i  411;
i 1
x
i 1
1i y1i  12.624,2;
n1 n1 N1
2 2
 y1i  36.821,649;
i 1
 x1i  4.369
i 1
xi 1
1i  6.240; N 1  600;
N1

x 1i
6.240
i 1
X1    10,4 árvores / ha
N1 600

209
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Então:
n1 n1

n1 (  x1 i )(  y1i ) n1 n1

x 1i yi  i 1 i 1
n1 (  x1 i )(  y1i )
i 1 n1
b1  n1
2
x 1i yi  i 1
n1
i 1

n1 (  x1 i ) b1  i 1
n1
x
i 1
2
1i  i1
n1 n1 (  x1 i ) 2
411  1 .202,46 i 1 n1 x 2
1i  i1

12 .624,2 
b1  40  1,842257236
4112 411  1 .202,46
4 .369  12 .624,2 
40
b1  40  1,842257236
1.202,46 4112
411
y RL1  y1  b1 ( X 1  x1 )  4 . 369 
 1,842257236 (10,4  40)
40 40
yR L  30, 29178215 kg / ha 1.202,46
1 y RL1  y1  b1 ( X 1  x1 )   1,842257236 (1
40
a2) estimativa da variância de yR L1  30, 29178215 kg / ha

Dado:
n1 n1

n1 ( x1i )( y1i )


[ x1i y1 i  i 1 i 1
]2
n1
ˆ12  i 1
n1 n1
( x1i ) ( y1i )
2 2
n1 n1
[ x1i  ][  y1i 
2 i1 2 i 1
]
i 1 n1 i1 n1
411 1.202,46 2
[12.624,2  ]
ˆ12  40  0,735165376
411 2 1.202,46 2
(4.369  )(36.821,649  )
40 40
n1

n1 ( y1 i ) 2
y12i  1 .202 ,46 2
 i1
n1
36821,649 
Vˆ ( y1 ) 
i1
 40  17 ,27942846 (kg / ha ) 2
n1  1 39

210
n1 (  x1 i )(  y1i )
xi 1
1i yi  i 1
n1
i 1

b1  n1
2
n1 (  x1 i ) Estimativa por regressão
x
i 1
2
1i  i1
n1
Então:
N n 600  40 411  1 .202,46
Vˆ ( yRL1 )  ( 1 1 )Vˆ ( y1 )(1  ˆ12 ) 12 .624,2 17,27942846  (1  0 ,735165376)
N 1n1 b  600  40 40  1,842257236
1
4112
Vˆ ( y RL1 )  0,106777788 (kg / ha)
2 4 .369 
40

s( yR L1 ) / ha  Vˆ ( y RL1 )  0,y326768708 kg / ha 1.202,46 4


RL1  y1  b1 ( X 1  x1 )Y
ˆ  N y 1,600
842257236 (10,4  
 30,29178215
RL1 40 R L1 4
a3) estimativa do total yR L1 e sua variânciakg
30, 29178215 Vˆ /(Yha
ˆ )  N 2Vˆ ( y )  6002  0,1067
RL1 RL1

YˆRL1  N y R L1  600  30,29178215  18.175,06929ˆ kg


s(YRL1 )  Vˆ ( yˆ RL1 )  196,0612243 kg
Vˆ (Yˆ )  N 2Vˆ ( y )  6002  0,106777788  38.440,00368 kg 2
RL1 RL1

s(YˆRL1 )  Vˆ ( yˆ RL1 )  196,0612243 kg

a4) intervalo de confiança do valor médio populacional Y1

Limite inferior
yRL1  t  s( y RL1 )  30,29178215  2 ,0223  0,326768708  29,630958 kg / ha

Limite superior

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor médio populacional do estrato I encontra-se no in-
tervalo de 29,630958 kg de sementes/ ha a 30,61855 kg de se-
mentes/ ha.

a5) intervalo de confiança para o valor total Y1

Limite inferior
Yˆ RL  t  s (YˆRL )  18 .175 ,06929  2 ,0223  196 ,061224  17 .778 ,57468 kg
1 1

211
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Limite superior
YˆRL1  t  s(YˆRL1 )  18
18.175,06929
. 175,0 6929 2+,0223
2,0223
196x, 061224
196,0612243
3 18.571=,56
18.571,5639
39 kg kg

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor total populacional do estrato I encontra-se no intervalo
de 17.778,57468 kg de sementes a 18.571,5639 kg de sementes.

a6) limite de erro da estimativa por regressão


t  s( y RL1 ) 2, 0223  0,326768708
LE ( y RL1 )    100  2,1815 %
y RL1 30, 29178215

a7) limite de erro da estimativa sem considerar a variável


auxiliar número de árvores

Dado:
n1

y
i 1
1i
1.202,46
y1    30,0615 kg / ha
n1 40
Vˆ ( y1 ) N 1  n1 17 ,27942846 600  40
Vˆ ( y1 )  ( ) ( )  0,403186664 (kg / ha ) 2
n1 N1 40 600

s( y1 )  Vˆ ( y1 )  0,403186664  0,634970 (kg / ha )

Então,
t  s( y 1 ) 2,0223  0,634970
LE SV ( y1 )   100   100  4 ,2716 %
y1 30 ,0615

a8) eficiência da estimativa da média por regressão versus


a da média sem considerar a variável auxiliar número de árvores

A eficiência é definida como o quociente entre o limite de


erro sem considerar a variável auxiliar versus o valor obtido pelo
método da regressão.

212
Estimativa por regressão

LE SV ( y1 ) 4 ,2716
Ef    1,9581
LE ( yRL ) 2,1815 1

O resultado do estrato I mostra que o limite de erro corres-


pondente à análise sem considerar a variável auxiliar apresenta
um valor 95,81% superior ao encontrado pelo método por regres-
são, demonstrando ser este método mais eficiente que aquele.

b) estimativa por regressão para o estrato II

Dado:
n2 n2 n2 N2

 y 2 i  809,2;  y 2
2i  17.124,9; x 2i  327; x 2i  3. 060;
i1 i 1 i 1 i1
n2 n2
2
 x2i  2.969;
i 1
x
i 1
2i y2 i  6.987,8; N 2  360;
N2

xi 1
2i
3.060
X2    8,5 árvores / ha
N2 360

b1) produção média de sementes por regressão


n2 n2

n2
(  x2 i )( y 2i )
327  809 ,2
x 1i y2 i  i 1

n2
i 1
6 .987 ,8 
bˆ 2  i 1
 39  0,893229519
n2
2 327 2
n2 (  x 2i ) 2 .969 
2 39
x 2i
 i 1

n2
i 1

809,2 327
y RL2  y 2  b2 ( X 2  x 2 )   0,893229519 (8,5  )
39 39
y RL2  y 2  b 2 ( X 2  x 2 )  20,85178289 kg / ha

213
b1  40  1,842257236
4112
4 .369 
40
1.202,46
Amostragem em inventário florestal y RL1  y1  bWaldenei
1 ( X1  x1 )  de Queiroz  1,842257236 (
Travassos
40
b2) estimativa da variância de yR L1  30, 29178215 kg / ha

Dado que: n2 n2

n2 ( x 2i )( y2 i )
[ x 2i y2 i  i1 i 1 2
]
n2
ˆ 22 
i1
n2 n2

n2 ( x 2 )2 n2 (  y 2i ) 2
[  x22i  i1
][  y22i  i1
]
i 1 n2 i 1 n2
327  809 ,2 2
[ 6 .987,8  ]
ˆ 22  39  0 ,541127912
327 2 809,2 2
( 2 .969  )(17 .124 ,9  )
39 39
n2

n2 (  y 2 i )2
809,2 2
y 2
2i  i 1

n2
17.124,9 
Vˆ ( y 2 )  i1
 39  8,816774629 (kg / ha )2
n 2 1 38

Então:
N  n2 ˆ 360  39
Vˆ ( y RL2 )  ( 2 )V ( y 2 )(1  ˆ22 )   8,816774629  (1  0 ,541127912)
N 2 n2 360  39

N  n2 ˆ
Vˆ ( yRL )  ( 2 )V ( y2 )(1  ˆ22 )  0,092499483 ( kg / ha )2
2
N 2 n2

s( yR L2 ) / ha  Vˆ ( y RL2 )  0,304137276 kg / ha

b3) estimativa do total YˆRL2 e sua variância


N 2 y RL  360 V20 ,ˆ85178289
ˆ (YY ˆ ) ) N y  7.506
360,64184
 20,8517828
kg
2 RlRL
22 2 RL2

YˆRL2  N 2 y RL2  360  20,85178289  7.506,64184 ˆkg2ˆ


Vˆ (YˆRL2 )  N 22Vˆ ( y RL2 )  360
V (YRL  N 22Vˆ ( y RL2 ) 11
20),092499483 .9872 ,933
 360 0,0k
Vˆ (YˆRL2 )  N 22Vˆ ( y RL2 )  360 2ˆ 0,092499483
ˆ ˆ  11.987ˆ,933 kg 2 ˆ ˆ
s(YRL2 )  V (YRL2 )  109s,4894196
(YRL2 )  kg
V (YRL2 )  109,4894196
s(Yˆ )  Vˆ (Yˆ )  109,4894196 kg
RL2 RL2

214
Estimativa por regressão

b4) intervalo de confiança do valor médio populacional Y2

Limite inferior
y RL  t  s( y RL )  20, 85178289  2, 0253  0,304137276  20, 23581368 kg / ha
2 2

Limite superior
y RL 2  t  s ( y RL 2 )  20 ,85178289  2 ,0253  0 ,304137276  21, 46775212 k g / ha

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor médio populacional do estrato II encontra-se no in-
tervalo de 20,23581368 kg de sementes/ ha a 21,46775212 kg
de sementes/ ha.

b5) intervalo de confiança do valor total populacional Y2

Limite inferior
YˆR L  t  s (YˆR L )  7 .506 ,64184  2,0253  109 ,4894196  7.284 ,892918 kg
2 2

Limite superior
YˆRL  t  s(YˆRL )  7.506, 64184  2, 0253109,489 4196  7. 728,3 90762 kg
2 2

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor total populacional do estrato II encontra-se no intervalo
de 7.284,892918 kg de sementes a 7.728,390762 kg de sementes.

b6) limite de erro da estimativa por regressão


t  s ( y RL 2 ) 2 ,0253  0 ,304137276
LE( y RL 2 )   100   100  2,9540 %
y RL 2 20 ,85178289

b7) limite de erro da estimativa sem considerar a variável


auxiliar número de árvores

215
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Dado:
n2

y 2i
809,2
i 1
y2    20 ,748718 kg / ha
n2 39

Vˆ ( y 2 ) N 2  n 2 8,8167746296 360  39
Vˆ ( y2 )  ( ) ( )  0 ,201580 (kg / ha )2
n2 N2 39 360

s( y 2 )  Vˆ( y2 )  0 ,201580  0,448977 ( kg / ha )

Então:
t  s( y 2 ) 2,0253  0 ,448977
LES V ( y2 )    100  4,3608 %
y2 20,851783

b8) eficiência da estimativa da média por regressão versus


a da média sem considerar a variável auxiliar número de árvores

A eficiência é definida como o quociente entre o limite de


erro sem considerar a variável auxiliar versus o valor obtido pelo
método da regressão.
LE SV ( y 2 ) 4,3608
Ef    1,4762
LE ( y RL2 ) 2,9540

O resultado do estrato II mostra que o limite de erro cor-


respondente à análise sem considerar a variável auxiliar apre-
senta um valor 47,62% superior ao encontrado pelo método por
regressão, demonstrando ser este método mais eficiente que
aquele.

c) estimativa por regressão para o estrato III

c1) produção média de sementes por regressão

216
Estimativa por regressão

Dado:
n3 n3 n3

 y 3i  483,23 ;  x3i  203,0; x 3i y 3i  2. 623,27;


i 1 i 1 i 1

n3 n3 N3
2 2
 y  6.285,475;
i 1
3i  x3i  1.161,0;
i 1
x
i 1
3i  1.248; N 3  240;

N3

x 3i
1.248
i1
X3    5,2 árvores / ha
N3 240

Então:
n3 n3

n3 ( x3 i )( y 3i ) n3 n3
203  483,23
x
i 1
3i y 3i  i 1
n3
i1
2.623,27. n3
38
( x3 i )(  y 3i )
b3  
n3
(  x 3i )
2
1.161 

3 i y 3i 
x203 2
i 1
n3
i1
2.623,27. 
n3
b3  i1 38 
x 2
3i  i 1 n 3
2
i 1 n3
n3 (  x 3i ) 1.161
b 3  0,546088002 x 2
3i  i 1
n3
i 1
483,23 203
yRL  y3  b3 ( X 3  x3 )   0,546088002 (5,2  )  12,63897697 kg / ha
3
38 38
b 3  0,546088002
483,23
c2) estimativa da variância de yRL  y3  b3 ( X 3  x3 )   0,546088002 (5
3
38
Dado:
n3 n3

n3 ( x3i )( y 3i )
[ x3 i y3i  i1 i 1
]2
n3
ˆ32 
i1
n3 n3

n3 (  x3 ) 2 n3 (  y3 i ) 2
[ x32i  i 1
][  y32i  i1
]
i 1 n3 i1 n3
203  483,23 2
[ 2.623,27 
]
ˆ 2
3  38  0,162549887
203 2 483,23 2
(1 .161  )(6 .285,475  )
38 217 38
n3

n3 (  y3 i )2
y32i  i 1 483,232
 n3 6.285,475 
Vˆ ( y 3 )  i1
 38  3,795744737 (kg / ha) 2
n3 n3

n3 ( x3i )( y 3i )
[ x3 i y3i  i1 i 1
]2
n3
ˆ32 
i1
n3 n3

Amostragem em inventário
n3 (
florestal  x3 ) 2 n3 (  y3 i ) 2 Waldenei Travassos de Queiroz
[ x32i  i 1
][  y32i  i1
]
i 1 n3 i1 n3
203  483,23 2
[ 2.623,27  ]
ˆ 32  38  0,162549887
203 2 483,23 2
(1 .161  )(6 .285,475  )
38 38
n3

n3 (  y3 i )2
y32i  i 1 483,232
 n3
6.285,475 
Vˆ ( y 3 )  i1
 38  3,795744737 (kg / ha) 2
n3  1 37

Então:
N  n3 ˆ 240  38
Vˆ ( y RL3 )  ( 3 )V ( y3 )(1  ˆ32 )   3,795744737  (1  0,162549887)
N 3n3 240  38
N  n3 ˆ
Vˆ ( yRL )  ( 3 )V ( y3 )(1  ˆ32 )  0 ,070406454 (kg / ha ) 2
3
N 3 n3

s( y RL 3 ) / ha  V ( y RL3 )  0,265342146 kg / ha
YˆRL3  N 3 y RL 3  240  12,63897697

c3) estimativa do total YˆRL3 e


 sua variância
N 3 y RL 3
ˆ (Y,ˆ63897697
 240 V12 2 ˆ
RL3 )  N3 V ( y3RL
.033
3
2402  0kg
) ,354473 ,070

YˆRL3  N 3 y RL 3  240  12,V


63897697
ˆ (Yˆ )  N2V3ˆ.(033
y RL,3354473 2kg
RL3 3 (YˆRL3 )0,070406454
) s240 Vˆ (YˆRL3 )  63
,47083786
.058,75750
kg
Vˆ (YˆRL3 )  N32Vˆ ( y RL3 )  2402ˆ 0,070406454  4.058,757504 kg 2
s(YRL3 )  Vˆ (YˆRL3 )  63,7083786 kg
s(YˆRL3 )  Vˆ (YˆRL3 )  63,7083786 kg

c4) intervalo de confiança do valor médio populacional Y3

Limite inferior
y RL  t  s( y RL )  12, 63897697 2, 0275  0, 265342146  12,10099577 kg / ha
3 3

Limite superior
12,63897697
yRL3  t  s( yRL3 )  12,63897697+22,0275
,0275x0,0,265342146
265342146 ,17695817kgkg/ha
=1313,17695817 / ha

218
Estimativa por regressão

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor médio populacional do estrato III encontra-se no in-
tervalo de 12,10099577 kg/ ha a 13,17695817 kg/ ha.

c5) intervalo de confiança do valor total populacional Y3

Limite inferior
YˆRL3  t  s (YˆRL3 )  33.033,354473
. 033,354473 2–, 0275
2,0275 x,7083786
 63 63,7083786 ,185735 kg kg
= 2.904,185735
 2. 904

Limite superior
YˆRL3  t  s(YˆRL3 )  3.033,354473
3.033,354473+22,0275
,0275x6363,7083786
,7083786 3=.162,523211kgkg
3.162,523211

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o valor total populacional do estrato III encontra-se no inter-
valo de 2.904,185735 kg a 3.162,523211 kg.

c6) limite de erro da estimativa por regressão


t  s (y RL3 ) 2,0275  0,265342146
LE( y RL3 )   100   100  4,2565 %
y RL3 12,63897697

c7) limite de erro da estimativa sem considerar a variável


auxiliar número de árvores

Dado:
n3

y 3i
483,23
i 1
y3    12,716579 kg / ha
n3 38

Vˆ( y3 ) N 3  n 3 3,795744737 240  38


Vˆ ( y3 )  ( ) ( )  0,084072416 ( kg / ha ) 2
n3 N3 38 240

s( y3 )  Vˆ ( y3 )  0,084072416  0,289952 (kg / ha )

219
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Então:

c8) eficiência da estimativa da média por regressão versus


a da média sem considerar a variável auxiliar número de árvores

A eficiência é definida como o quociente entre o limite de


erro sem considerar a variável auxiliar versus o valor obtido pelo
método da regressão.
LE SV ( y 3 ) 4,6229
Ef    1,0861
LE ( y RL3 ) 4, 2565

O resultado do estrato III mostra que o limite de erro corres-


pondente à análise sem considerar a variável auxiliar apresenta
um valor 8,61 % superior ao encontrado pelo método por regres-
são, demonstrando ser este método mais eficiente que aquele.

2) Efetuar a análise global para as estimativas por re-


gressão considerando os estratos separadamente e compa-
rar os resultados sem considerar a variável auxiliar número
de árvores

a) valor médio global por regressão considerando separa-


damente os estratos

Dado:
yR L  yh  bh ( X h  xh )
h

Então:
y RL  y1  b1( X 1  x1 )  30 ,291782
y RL  y1  b1( X 1  x1 )  30 ,291782
1
1

y R L2  y 2  b2 ( X 2  x2 )  20,851783
y R L2  y 2  b2 ( X 2  x2 )  20,851783
yR L  y3  b3 ( X 3  x3 )  12,638977
yR L  y3  b3 ( X 3  x3 ) 220
3
3
12,638977
y RL  y1  b1( X 1  x1 )  30 ,291782
1

Estimativa por regressão


y R L2  y 2  b2 ( X 2  x2 )  20,851783

yR L  y3  b3 ( X 3  x3 )  12,638977
3

Portanto:
L
y RLS   Wh y RLh
i 1

600 360 240


yR LS   30 ,291782   20 ,851783   12 ,638977
1.200 1 .200 1.200
yRL S  23,929222 kg / ha

b) valor total global por regressão considerando separada-


mente os estratos
L
YˆRL S   YˆRLh  18.175,06929  7 .506,64184  3 .033,354473
h1

YˆRLS  28. 715, 0656 kg

c) variância do valor médio global por regressão conside-


rando os estratos separadamente
L
Vˆ ( yRL S )   Wh2Vˆ( y RLh )
I !

600 2 360 2 240 2


Vˆ ( y RL )  ( )  0,1067777 88  ( )  0,09 249948 3  ( )  0, 07040 6454
S
1.200 1 .200 1. 200

Vˆ ( y RL )  0, 0378356 6 ( kg / ha) 2
S

s( y RL )  Vˆ ( yRL )  0,03783566  0,194514 (kg / ha )


S S

d) limite de erro considerando os estratos separadamente


t  s ( y RL ) 2,00  0,194514
LE S  S
 100   100  1, 6257 %
y RL S
23,929222

221
Amostragem em inventário florestal Waldenei Travassos de Queiroz

e) limite de erro sem usar a variável auxiliar número de árvores

Dado:
L
60 0 1202, 46 360 809, 2 240 483, 23
y Est  W
h1
h yh 
1.200

40

1.200

39

1. 200

38
 23,79 868 1

W h Vˆh ( y )
L 2

 nh
 0,1323 36
h1

 WhVˆ ( y h )  12, 0438


h1

L
W 2Vˆ ( y) 1 L
1
Vˆ ( y Est )   h h   W Vˆ ( y )  0,132336  1200  12 ,0438
h h
h 1 nh N h 1

Vˆ ( yEst )  0,122299 ( kg / ha ) 2

s ( y Est )  Vˆ( yE st )  0 ,122299  0,349713 kg / ha

Então:
t  s( y RLEst ) 2,00  0 ,349713
LE SV  100   100  2 ,9389 %
yR LEst 23,798681

f) eficiência
Ef 
LE SV da
( y Estestimativa
) 2,9389 da média por regressão com es-
  1,8078
tratos separadosLE S ( yRLS )versus a calculada sem considerar a vari-
1,6257
ável auxiliar número de árvores LE SV ( y Est .) 2,9389
Ef    1,8078
LE S ( yRLS ) 1,6257
A eficiência é definida como o quociente entre o limite de
erro da estimativa da média sem considerar a variável auxiliar
número de árvores versus o calculado com estratos separados.
LE SV ( y Est ) 2,9389
Ef    1,8078
LE S ( yRLS ) 1,6257

O resultado mostra que a análise com os estratos sepa-


rados apresenta uma eficiência de 80,78% ao encontrado sem
considerar a variável auxiliar número de árvores.

222
Estimativa por regressão

3) Análise global para as estimativas por regressão


considerando os estratos conjuntamente, ou seja, a partir
de y Est e xEst . Comparar os resultados sem considerar a va-
riável auxiliar número de árvores

a) coeficiente de regressão estimado considerando os es-


tratos conjuntamente

Sabe-se que:
nh nh
( xhi )(  y hi )
LWh2 (1  f h ) n h


h1
{
n ( n  1)
[  xhi yhi 
i 1
i 1
nh
i 1
]}
h h
bc  nh

L 2 nh (  x hi ) 2
W (1  f h )
{ n (n h
 1 )
[  xhi2  i1
nh
]}
h1 h h i 1

Dado que:
n1 n1 n1

 y1i  1.202,460 ;
i 1
 x1i  411;
i 1

i 1
x1i y1i  12 .624,2;

n1 n1
2 2
y
i 1
1i  36.821,649; x
i 1
1i  4.369

Seja:
A1 + A2 + A3
bc =
C1 + C 2 + C3

Tal que:
n1 n1
(  x1i )( y1 i )
W12 (1  f1 ) n1
n1 (n1  1) 
i 1 i 1
A1  [ x1 i y1i  ]
i 1 n1

223
Amostragem em inventário florestal Waldenei Travassos de Queiroz

40
0,5 2 (1  )
A1  600 (12 .624 ,2  411  1 .202 ,46 )  0,0402236
40  39 40
n1
( x1i ) 2
W12 (1  f 1 ) n1 2
C1  [ x1 i  i 1
]
n1 (n1  1) i1 n1
40
0,52 (1  ) 2
C1  600 (4.369  411 )  0,0218339
40  39 40
n2 n2 n2

y
i 1
2i  809,2 ; x i 1
2i  327; x
i 1
2i y 2i  6.987,8;

n2 n2

 y 22i  17.124,9; x 2
2i  2.969;
i 1 i 1

n2 n2

(  x 2 i )(  y 2 i )
W22 (1  f 2 ) n 2
A2  [ x2 i y 2 i  i 1 i 1
]
n2 ( n2  1) i 1 n2
39
0,3 2 (1  )
A2  360 ( 6.987,8  327  809,2 ))  0 ,0109907
39  38 39
n2

2 n2
( x2 i ) 2
W (1  f 2 )
[  x 2i 
2 2 i1
C2  ]
n2 (n 2  1) i 1 n2
39
0,32 (1  ) 2
C2  360 (2.969  327 )  0,0123045
39  38 39
n3 n3 n3

 y 3i  483,23;  x3i  203,0; x 3i y 3 i  2 .623,27;


i 1 i 1 i 1

n3 n3


i 1
y 32i  6.285,475;  x 2
3i
 1 .161,0;
i 1

224
Estimativa por regressão

n3 n3
( x 3i )( y3 i )
W32 (1  f 3 ) n3
A3  [  x3 y3  i 1 i 1
]
n3 ( n3  1) i1 i i n3
38
0,2 2 (1  )
A3  240 ( 2.623,27  203  483,23) )  0,001001008
38  37 38
n3

2 ( x3 i ) 2
W 3 (1  f 3 ) n3 2
C3  [ x3 i  i 1
]
n3 ( n3  1) i 1 n3
38
0,2 2 (1  ) 2
C3  240 (1.161  203 )  0,00183305
38  37 38
A1  A2  A3
bc 
C1  C2  C3
0 ,0402236  0 ,0109907  0,001001008
bc   1,4515764
0 ,0218339  0 ,0123045  0 ,00183305
N

x
i 1
i
6 .240  3.060  1 .248
X   8,79 árvores / ha
N 600  360  240

b) valor médio global por regressão considerando os estra-


tos conjuntamente

Sabe-se que:
L
600 411 360 327 240 203
x Est  W h xh        8,721306
h 1 1.200 40 1.200 39 1 .200 38
L
600 1202,46 360 809,2 240 483,23
yEst   Wh yh        23,798681
h 1 1.200 40 1.200 39 1.200 38

225
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Então:
y R LC  y Est  bc ( X  x E st )

y RLC  23,798681  1,451576403(8,79  8,721306 )

y R LC  23,898396 kg / ha

c) valor total global por regressão considerando os estratos


conjuntamente
YˆRLC  N  y RLC  1 . 200  23,898396  28 .678 ,0747 kg

d) variância do valor médio global por regressão conside-


rando os estratos conjuntamente
L
W 2 (1  f h ) ˆ
Vˆ ( y RLC )   h [Vh ( y)  2bcVˆh ( x, y )  bc2Vˆ h ( x) ]
h 1 nh

Dado que:
Vˆ ( y RL )  K1  K 2  K 3
C

Sendo:
W1 2 (1  f1 ) ˆ
K1  [V1 ( y )  2bcVˆ1 ( x, y)  bc2Vˆ1 (x )]
n1
40
0,5 2 (1  )
K1  600 (17,27942  2  1,4515764  6,89599  1,45157642  3,74295)
40
K1  0,03001822
W22 (1  f 2 ) ˆ
[V 2 ( y )  2bcVˆ2 ( x, y )  bc Vˆ2 ( x )]
2
K2 
n2
39
0,3 2 (1  )
K2  360 (8 ,81677  2  1,4515764  5 ,34130  1,4515764 2  5 ,97976 )
39 226
K 2  0, 01216087
W32 (1  f 3 ) ˆ
[V3 ( y )  2bcVˆ3 ( x , y )  bc Vˆ3 ( x )]
2
K3 
n3
K1  600 (17,27942  2  1,4515764  6,89599  1,45157642  3,74295)
40
K1  0,03001822
W22 (1  f 2 ) ˆ
[V 2 ( y )  2bcVˆ2 ( x, y )  bc Vˆ2 ( x )] Estimativa por regressão
2
K2 
n2
39
0,3 2 (1  )
K2  360 (8 ,81677  2  1,4515764  5 ,34130  1,4515764 2  5 ,97976 )
39
K 2  0, 01216087
W32 (1  f 3 ) ˆ
[V3 ( y )  2bcVˆ3 ( x , y )  bc Vˆ3 ( x )]
2
K3 
n3
2 38
0, 2 (1  )
K3  240 (3,79573  2  1, 45157 64  1,12985  1, 451 5764 2  2, 068 99)
38
K 3  0,0043191834

Vˆ ( y RL )  K 1  K 2  K 3  0,046498273 ( kg / ha ) 2
C

s ( y RLC )  Vˆ ( y RLC )  0 ,046498273  0 ,215635 kg / ha

e) limite de erro considerando os estratos conjuntamente


t  s( y RLC ) 2,00  0,215635
LEC   100   100  1,8046 %
y RLC 23,898396

f) eficiência da estimativa da média por regressão conside-


rando os estratos conjuntamente ( y R LC )versus
y Est  bac (calculada
X  x E st ) sem
considerar a variável auxiliar
y RLC  23,798681  1,451576403(8,79  8,721306 )

A eficiência é definida como oy quociente entre o limite de


R LC  23,898396 kg / ha
erro da estimativa da média sem considerar a variável auxiliar
número de árvores versus o calculado considerando os estratos
conjuntamente.
LE SV ( y Est ) 2 ,9389
Ef    1,6286
LE( y RLC ) 1,8046

227
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Sendo:
t  s( y RLEst ) 2,00  0 ,349713
LE SV  100   100  2 ,9389 %
yR LEst 23,798681

O resultado mostra que a análise considerando os estratos


conjuntamente (função de y Est e xEst ) apresenta uma eficiência
de 62,86% ao encontrado sem considerar a variável auxiliar nú-
mero de árvores.

4) Comparar os resultados das estimativas por regres-


são considerando os estratos separadamente ( y R LC )versus y Est  bc ( X  x E st )
usando os estratos conjuntamente ( y R LC ) y Est  bc ( X  x E st )
y RLC  23,798681  1,451576403(
y  23,798681  1,451576403(8,79  8,72130
A eficiência é definida como o quociente RLC
entrey o limite de
R LC  23,898396 kg / ha
erro da estimativa da média por regressão y R LC obtida com os
 23,898396 kgestra-
/ ha
tos conjuntamente y R LC  y Est  boc (calculado
versus X  x E st ) com estratos sepa-
rados y R LC .  y Est  bc ( X  x E st )
y RLC  23,798681  1,451576403(8,79  8,721306 )
LE ( y ) 1,8046
Efy RLC  23,798681   1,451576403 (8,79  8,721306 )
 1,0861
C RLC
y  23
LE S ( y RLS ) R L1C,6257 ,898396 kg / ha
y R LC  23,898396 kg / ha
O resultado mostra que a análise com os estratos sepa-
rados apresenta uma eficiência 8,61% superior ao encontrado
pelo método por regressão que considera os estratos conjunta-
mente (função de y Est e xEst ).
É importante ressaltar que os resultados deste exemplo
revelaram uma grande vantagem quanto ao uso da estimativa
por regressão em relação à análise sem considerar a variável
auxiliar número de árvores.
Por outro lado, o uso da estimativa pela regressão na amos-
tragem estratificada com os estratos separados é recomendado
quando existe variação entre os verdadeiros coeficientes de re-

228
Estimativa por regressão

gressão, enquanto que a análise em função de y Est e xEst deve


ser aplicada quando esses coeficientes forem homogêneos.
Os valores encontrados para os coeficientes de regres-
são para os três estratos apresentaram certa variabilidade
( bˆ1 = 1,842257; bˆ2 = 0,893230; bˆ3 = 0,546088 ), o que resultou em
uma eficiência de 8,61 % para o método de regressão com os
estratos separados em relação ao obtido com a análise conjunta
dos estratos (função de y Est e x Est ).

229
Capítulo 9

AMOSTRAGEM POR CONGLOMERADO

Define a amostragem por conglomerados, descrevendo os


parâmetros populacionais e os seus estimadores. Apresenta as
metodologias referentes aos conglomerados em estágio único,
em dois estágios e também em três estágios. Apresenta a teoria
sobre a amostragem por conglomerados em estágio único e em
dois estágios com unidades de grandezas iguais e desiguais,
estendendo esta concepção quando ocorrer proporções. Mostra
a obtenção dos componentes de variâncias no modelo inteira-
mente ao acaso através do método dos momentos ou da análise
de variância. Discorre sobre a ocorrência de estimativa negativa
do componente de variância entre conglomerados. Apresenta
a análise de conglomerados em dois estágios considerando a
ocorrência de tipologias diferentes na subparcela, assim como
quando ocorrer uma variável auxiliar. Mostra exemplos aplicati-
vos sobre todos os temas abordados.
Amostragem por conglomerado

A amostragem por conglomerados ou grupos é uma va-


riação de qualquer processo de amostragem que, em vez de
utilizar unidades de amostra individuais, usa um grupo ou con-
glomerado de pequenas subparcelas. As subparcelas também
são denominadas subunidades ou unidades secundárias.
Quando os conglomerados são selecionados aleatoria-
mente na floresta, pode-se definir que a amostragem consiste
em reunir em grupos as subparcelas que em uma amostra intei-
ramente aleatória se dispersariam na floresta. Dessa forma, as
subparcelas se restringem a uma área específica denominada
subpopulação. Esse procedimento torna o trabalho de campo
mais flexível, sem deixar de permitir a determinação da estimati-
va da variância da média para o inventário florestal.
A amostragem por conglomerados apresenta uma impor-
tante vantagem que é a sensível redução dos custos, visto que
custa mais efetuar a medição de unidades amostrais distribuí-
das esparsamente na floresta que medir o equivalente quando
as unidades estão reunidas em subpopulações.
Por outro lado, nos inventários nos trópicos, quando as
subparcelas do conglomerado são definidas sistematicamente e
dimensionadas de tal forma que um conglomerado seja medido
em um dia de trabalho, o custo de medição de campo será sen-
sivelmente reduzido. Entretanto, o cálculo do erro de amostra-
gem sofre uma pequena tendência, pois, apesar dos conglome-
rados serem selecionados inteiramente ao acaso, tem-se que as
subparcelas são tomadas sistematicamente.
A tendência no cálculo da variância da média pode ser
considerada desprezível no caso de inventários florestais, pois,
normalmente, os valores das variáveis respostas são ordenados
aleatoriamente por algum critério objetivo ou mesmo se suce-
dem numa ordem natural, podendo-se, assim, através da análi-

233
Amostragem em inventário florestal Waldenei Travassos de Queiroz

se de variância, ter uma aproximação satisfatória da estimativa


da variância da população.
A amostragem por conglomerados, no que se refere à apli-
cação em levantamentos florestais, apresenta as seguintes van-
tagens:
a) oferece melhor controle no trabalho de campo, pois as
unidades de registro – subparcelas do conglomerado - são me-
nores;
b) percepção de maior quantidade de variabilidade da va-
riável resposta em questão, pois o conglomerado é formado por
uma série de subparcelas, as quais explicam a variabilidade
dentro do conglomerado;
c) em florestas tropicais, onde a acessibilidade é difícil, é
vantajosa a aplicação da amostragem por conglomerados, prin-
cipalmente quando apresenta uma forma estrutural para ser
completamente mensurada no expediente de um dia de trabalho.
Freese (1962) cita que em inventários realizados em áre-
as de difícil acesso, onde o custo de localização da unidade de
amostra é alto, o uso da amostragem por conglomerados em dois
estágios possibilita a redução do custo do levantamento, pois em
cada conglomerado amostrado são medidas várias subparcelas.
Loetsch e Haller (1964) citam que, em razão da concentra-
ção das subparcelas na amostra por conglomerado apresentar
uma diminuição das distâncias a serem percorridas em relação
à amostra aleatória, haverá uma substancial vantagem opera-
cional e financeira.
A amostragem por conglomerados é classificada, de acor-
do com a tomada das subparcelas, em:

a) amostragem por conglomerados em estágio único: quan-


do são levantadas todas as subparcelas;

234
Amostragem por conglomerado

b) amostragem por conglomerados em dois estágios: quan-


do ocorre subamostragem para seleção das subparcelas;
c) amostragem por conglomerados em três estágios: quan-
do ocorre subamostragem de conglomerados e também suba-
mostragem de subparcelas. A amostragem por conglomerados
pode evoluir para mais estágios.

9.1 AMOSTRAGEM POR CONGLOMERADOS EM ESTÁGIO


ÚNICO

A amostragem por conglomerados em estágio único é de-


finida quando em cada unidade primária selecionada são medi-
das todas as M subparcelas. As subparcelas também podem ser
denominadas como unidades secundárias ou subunidades.

9.1.1 Parâmetros populacionais e estimadores

Para formulação dos parâmetros populacionais e seus es-


timadores, será considerado que a área total da população é
dividida em N unidades primárias ou conglomerados, das quais
serão selecionadas n primárias. Será considerado que cada uni-
dade primária contém o mesmo número M de subparcelas.

a) valor médio por conglomerado e por subparcela

A notação que será usada é uma extensão natural daquela


que já vem sendo utilizada. O índice inferior i indica o conglo-
merado e o j a subparcela dentro do conglomerado.
yij = valor da variável resposta correspondente à j-ésima
subparcela correspondente ao i-ésimo conglomerado;
yi. = valor total das subparcelas para o i-ésimo conglome-
rado;

235
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Y = valor médio populacional considerando os conglome-


rados;
Yi = valor médio populacional por subparcela para o i-ési-
mo conglomerado;
Y = valor médio populacional considerando todas as
subparcelas;
y i = valor médio estimado por subparcela para o i-ésimo
conglomerado;
y = valor médio estimado considerando todas as subparcelas;
Y = valor total populacional;
Yˆ = valor total estimado.

Daí:
N n n
N
y
i 1
i.  yi. Y
y
i 1
i. y
i 1
i.
y
Y  ; Y  i 1
 ; y ; y 
N NM M n nM M

b) valor total Y e seu estimador Yˆ


Y  NY  NMY ; Yˆ  N y  NM y

c) variância populacional e seus estimadores

V1 ( y ) = variância populacional para os valores totais dos


conglomerados;
V ( y ) = variância populacional considerando os valores das
subparcelas;
Vb ( y ) = V1 ( y ) M é variância dos conglomerados com base
nas subparcelas;
Vw ( y ) = variância média das subparcelas dentro dos con-
glomerados;

236
Amostragem por conglomerado

V ( y ) = variância populacional da média dos conglomerados;


V ( y ) = variância populacional da média das subparcelas;
Vˆ1 ( y ) = variância estimada dos conglomerados;
Vˆ ( y ) = variância estimada das subparcelas;
Vˆb ( y ) = Vˆ1 ( y ) M é a variância estimada dos conglomera-
dos com base nas subparcelas ou unidades secundárias;
Vˆw ( y ) = variância média estimada considerando as subpar-
celas dentro dos conglomerados;
Vˆ ( y ) = variância estimada da média dos conglomerados;
Vˆ ( y ) = variância estimada da média das subparcelas.

A Tabela 9.1 apresenta a análise de variância com base


nas subparcelas, admitindo que os conglomerados foram sele-
cionados através de uma amostra simples ao acaso:

237
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Tabela 9.1 - Análise de variância com base nas subparcelas.

CAUSAS DE VARIAÇÃO GL QM
Entre Conglomerados N-1 QM ntre  Vb (y )
QM EEntre  Vb (y )
QM De ntro  V w ( y )
Dentro dos Conglomerados N(M-1) QM De ntro  V w ( y )

( N 1)Vb ( y)  N( M 1)Vw( y)
TOTAL NM-1 QMT otal 
N.M 1

Sendo:
( n  1) Vˆb ( y )  n(M  1)Vˆw ( y) (9.1)
Vˆ ( y ) 
nM  1

A estimativa da variância a partir das subparcelas, Expres-


são 9.1, tem uma pequena tendência porque as subparcelas
não fazem parte de uma amostra simples ao acaso dentro das
unidades primárias ou conglomerados. As subparcelas são sele-
cionadas em grupos contíguos. Essa tendência é praticamente
desprezível se o número de conglomerados for maior que 50.

A Expressão 9.1 pode ser escrita na forma simplificada 9.2.

Vˆ ( y ) + ( M − 1)Vˆw ( y )
Vˆ ( y ) = b (9.2)
M
A partir da teoria da análise de variância, tem-se:
N  n V1 ( y ) N  n MVb ( y )
V ( y)  ( ) ( )
N n N n

Tal que:
N − n Vˆ1 ( y ) N − n MVˆb ( y )
Vˆ ( y ) = ( ) =( )
N n N n

238
Amostragem por conglomerado

Portanto:
y 1
V ( y) = V ( ) = 2 V ( y)
M M

Então:
y 1
Vˆ ( y ) = Vˆ ( ) = 2 Vˆ ( y )
M M

Expandindo-se para o total da população, resulta:

Vˆ (Yˆ ) = Vˆ ( N y ) = N 2Vˆ ( y )

A variância do valor médio por subparcela V ( y ) também


pode ser expressa em função do coeficiente de correlação intra-
conglomerado (d). Este coeficiente mede o grau de dependência
entre as subparcelas dentro do conglomerado, sendo definido
pela fórmula de Pearson:
E ( yij  y )( yik  y )

E ( yij  y ) 2

Desenvolvendo-se, resulta:
N M
2 ( yij Y )( yik  Y )
E ( yij  y )( yik  y )
 2

i 1 j  k
(9.3)
E ( yij  y ) ( M  1)( NM  1)V ( y )

Conforme Cochran (1977), a Expressão 9.3 pode ser escri-


ta na forma 9.4:

( N  1) M  QM Entre  ( NM  1)V ( y )
 (9.4)
( NM  1)( M  1)V ( y )

239
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Que sob a condição ( N  1) M  ( NM  1) , tem-se:


QM Entre  V ( y )

( M  1)V ( y )

Quanto maior o coeficiente de correlação intraconglome-


rado mais homogêneas são as subparcelas dentro dos conglo-
merados e menos eficiente é a aplicação da amostragem por
conglomerados.
Seja uma amostra inteiramente ao acaso de n de conglo-
merados de uma população de tamanho N, cada um dos quais
possuindo M subparcelas. O valor médio amostral por subpar-
cela ( y ) é uma estimativa sem tendência de Y e sua variância é
dada pela expressão:

1 f ( NM  1) V ( y )
V ( y)  ( ) [1   ( M  1)] (9.5)
n M 2 ( N  1)

Sendo:
N M

 ( y
i 1 j 1
ij  Y )2
V ( y) 
NM  1

Tomando-se NM-1 = NM e N-1 = N, a Expressão 9.5 pode


ser simplificada para:
1 f
V ( y)  ( )  V ( y )[1   ( M  1)]
nM

Destarte:
1 f
Vˆ ( y )  ( )  Vˆ ( y )[1  ˆ( M  1)]
nM

240
Amostragem por conglomerado

9.2 Amostragem por conglomerados em estágio


único com unidades de grandezas desiguais

Seja uma amostra por conglomerado em estágio único,


para o caso mais geral, onde cada conglomerado seja constituí-
do por Mi unidades secundárias.

9.2.1 Parâmetros populacionais e estimadores

O valor médio populacional por subparcelas é dado, por:


N N

∑ y i. ∑M i yi
Y = i =1
N
= i =1

M0
∑M
i =1
i

Dado que:
N
M0 = ∑Mi
i =1

Para estimar o valor médio por subparcela ( Y ) existem


três procedimentos:

1) Ignorando a variação de tamanho entre os conglo-


merados

a) valor médio estimado


n

∑y
i =1
i
y1 =
n
b) variância da média estimada
N N

y
i 1
i. M y
i 1
i i
Y  N

M0
M
i 1
i

241
Amostragem em inventário florestal Waldenei Travassos de Queiroz

c) valor total estimado e sua variância

O valor total estimado é Yˆ1 = M 0 y1 e sua variância será


igual a Vˆ (Yˆ1 ) = M 02Vˆ ( y1 ) .

Este procedimento gera uma estimativa tendenciosa e de


pequena precisão, principalmente quando os valores de Mi va-
riam muito e as médias dos conglomerados y i apresentam pe-
quena variação.

2) Proceder a uma estimativa por razão, onde os Mi consti-


tuem a variável auxiliar

a) valor médio por razão estimado por subparcela


n

∑y
i =1
i.
yn
yR = n
=
Mn
∑M
i =1
i

Tendo-se:
n

∑y
n
i. ∑M i
yn = i =1
; Mn = i =1
.
n n

b) variância da média estimada por razão por subparcela

Da teoria da estimativa por razão, tem-se:


n n n

∑M i yi ∑M i ( yi − Y ) ∑M i ( yi − Y )
V ( y R ) = E ( i =1n − Y ) 2 = E[ i =1 n
] 2 ≅ E ( i =1 )2
nM N
∑M
i =1
i ∑M
I =1
i

242
Amostragem por conglomerado

Então: n n n

1 N  n i 1  (M y )i i
2
 2 y R  M yi  y
i
2 2
R M i
2

Vˆ ( y R )  2 ( )( i 1 i 1
)
M N nN n 1

Tal que:
N
1
MN =
N
∑M
i =1
i

c) valor total estimado por razão e sua variância

O valor total estimado é YˆR = M 0 y R , então sua variância


será igual a Vˆ (YˆR ) = M 02Vˆ ( y R ) .

3) Obter as estimativas se conhecidos os tamanhos


dos conglomerados da população

a) valor médio estimado


n

∑y i.
y3 = i =1
f × M0
N
n
Sendo: M 0 = ∑ M i ; f =
i =1 N

b) variância da média estimada


1 N − n Vˆ1 ( y )
Vˆ ( y3 ) = 2 ( ) , tal que:
MN N n
n

n
(∑ yi. ) 2
∑y 2
i. − i =1
n
Vˆ1 ( y ) = i =1
n −1

243
Amostragem em inventário florestal Waldenei Travassos de Queiroz

c) valor total estimado e sua variância

O valor total estimado é Yˆ3 = M 0 y3 , então sua variância


será igual a Vˆ (Yˆ3 ) = M 02Vˆ ( y3 ).
).
Dentre os procedimentos apresentados, destaca-se que o
segundo procedimento, estimativa por razão, é o melhor sob o
ponto de vista teórico.

Exercício 9.1

Seja uma floresta de 1.000 ha dividida em 100 áreas de


observações fenológicas de dez hectares (unidades primárias
ou conglomerados). Cada uma subdividida em cinco unidades
secundárias ou subparcelas de dois hectares. Considerar uma
amostra de dez conglomerados (C) e efetuar a análise estatísti-
ca. A Tabela 9.2 apresenta a produção de sementes por subpar-
cela (kg / 2 ha) para uma determinada espécie (dados fictícios).

Tabela 9.2 - Produção de sementes por subparcela (dados fictícios) kg/2 ha.

C S1 S2 S3 S4 S5 Totais ( y i. ) Vˆwi ( y )
1 11,0 12,7 12,0 11,1 10,7 57,5 0,685
2 9,6 10,5 8,0 9,8 8,0 45,9 1,272
3 14,1 11,6 12,6 13,2 12,5 64,0 0,855
4 15,4 12,8 14,1 13,0 14,0 69,3 1,078
5 10,0 11,0 10,9 12,6 12,1 56,6 1,067
6 13,0 14,0 12,9 13,9 12,8 66,6 0,337
7 12,1 10,8 12,0 12,6 12,9 60,4 0,647
8 13,5 14,4 15,1 16,0 15,9 74,9 1,107
9 12,3 14,0 13,2 12,3 11,5 63,3 0,923
10 14,4 15,5 17,0 15,3 15,0 78,2 1,163
Total 636,7 9,134

Tem-se que:
n n n M
y i.
 636 ,7;  y i2.  41 .330,97 ;  y ij2 8302,73
i 1 i1 i 1 j 1

244
Amostragem por conglomerado

a) valor médio estimado por subparcela


n M

 y
i 1 j 1
ij
636,7
y   12,734 kg / 2 ha
nM 10  5

b) variância da média estimada

Dado que:
n
2
n
( yi. )
636,7 2
 yi2.  i1
n
41.330,97 
10  88,031222 (kg / 10 ha)2
Vˆ1 ( y)  i1

n 1 9
n M

n M
(  y ij
)2
i 1 j 1 636,7 2
 y 2
ij

nM
8302,73 
50
Vˆ ( y )  i 1 i 1
  3, 979432653 ( kg / 2 ha ) 2
nM  1 49
M y2i.
1 n y 2
ij
M 1 n ˆ

9,134
Vˆw ( y)  
j 1
  Vwi ( y)   0,9134 ( kg / 2 ha) 2
n i1 M 1 n i1 10

Então:
N  n Vˆ1 ( y ) 100  10 88,032222
Vˆ ( y )  ( ) ( )  7,9227 (kg / 10 ha) 2
N n 100 10

Ou, pela fórmula:


N  n MVˆb ( y ) 100  10 5  17,606
Vˆ ( y )  ( ) ( )  7,9227 (kg / 10 ha ) 2
N n 100 10

Por conseguinte:

245
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Outra maneira de obter a variância do valor médio por


subparcela ou subunidade Vˆ ( y ) é em função do coeficiente de
correlação intraconglomerado. A estimativa do coeficiente de
correlação intraconglomerado ( dˆ ) entre as subparcelas de um
mesmo conglomerado é dada pela fórmula:
(n  1) M (QMˆ Entre )  (nM  1)Vˆ ( y )
ˆ 
(nM  1)( M  1)Vˆ ( y )

Seja, Tabela 9.3, a análise de variância dos dados:


Tabela 9.3 - Análise de variância.

CV GL SQ QM
Entre 9 158,4562 17,6062444
Dentro 40 36,536 0,9134
Total 49 194,9922 3,979432653

Então:

Logo:

246
Amostragem por conglomerado

c) intervalo de confiança do valor médio populacional por


subparcela ( Y )
n M

  yij 636,7
i 1 j1
y   12,734 kg / 2 ha
nM 10  5

IC : y  t  s( y)  12,734  2,0211 0,562949

IC : 11,5962 / 2 ha  Y  13,8718 kg / 2 ha

IC : 5,7981 kg / ha  Y  6,935889 kg / ha

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor médio populacional encontra-se no intervalo
de 5,7981 kg/ ha a 6,935889 kg/ ha.

d) intervalo de confiança para o valor total populacional (Y)


Yˆ  N  M  y / 2 ha  100  5 12,734  6.367 kg
Vˆ (Yˆ )  N 2  M 2  Vˆ ( y / 2ha)  1002  52  0,316915999  79.228,99975kg 2

s(Yˆ )  281, 4764639 kg

IC : Yˆ  t  s (Yˆ )  6367  2,0211  281,4764639

IC : 5 .798,11 kg  Y  6 .935,89 kg

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor total populacional encontra-se no intervalo de
5.798,11 kg a 6.935,89 kg.

e) limite de erro da estimativa do valor médio por subparcela


t  s( y ) 2 ,0211  0,564942466 / 2 ha
LE %  100  100  8,97 %
y 12,734 / 2 ha

247
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Exercício 9.2

Seja uma área florestal de 1.000 ha dividida em N = 80 áreas


de observações fenológicas com grandezas desiguais (unidades
primárias ou conglomerados). Cada uma subdividida em unida-
des secundárias ou subparcelas de um hectare. Considerar uma
amostra de dez conglomerados (C) e efetuar a análise estatística.
A Tabela 9.4 apresenta a produção de sementes por conglomera-
do (kg/ha) para uma determinada espécie (dados fictícios).

Tabela 9.4 - Produção de sementes (kg/ha).

C Mi Totais ( y i. ) yi
1 17 479,4 28,2
2 11 256,3 23,3
3 10 328,0 32,8
4 14 464,8 33,2
5 15 495,0 33,0
6 13 413,4 31,8
7 10 308,0 30,8
8 13 372,6 28,7
9 9 294,3 32,7
10 8 311,2 38,9
Total 120 3723,0 313,4

1) Ignorando a variação de tamanho entre os conglo-


merados

Sabe-se que:

248
Amostragem por conglomerado

a) valor médio estimado


n

y
i 1
i
313,4
y1    31,34 kg / ha
n 10

b) variância da média estimada


n

n
(  yi ) 2
313,4 2
N n y i
2
 i 1

n 80  10
9 .971,28 
10
Vˆ ( y1 )  ( ) i 1
( )
Nn n 1 80  10 9

Vˆ ( y1 )  1,451761111(kg / ha )2

s( y1 )  1,204890 kg / ha

c) valor total estimado

Yˆ1  M 0 y1  1000  31,34  31340,0 kg

d) variância estimada do valor total

Vˆ (Yˆ1 )  M 02Vˆ( y R )  1000 2  1,451761111  1451761,1111 kg 2

s(Yˆ1 )  3 .775,1505 kg

e) intervalo de confiança do valor médio populacional por


subparcela ( Y )
IC : y1  t  s ( y1 )  31,34  1,96  1,204890

IC : 28,9784 kg / ha  Y  33,7016 kg / ha

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor médio populacional encontra-se no intervalo
de 28,9784 kg/ ha a 33,7016 kg/ ha.

249
Amostragem em inventário florestal Waldenei Travassos de Queiroz

f) intervalo de confiança do valor total populacional ( Y )


IC : Yˆ1  t  s (Yˆ1 )  31.340,0  1,96  3775,1505
IC : 23 .940 ,7050 kg  Y  38 .739 ,2950 kg

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor total populacional encontra-se no intervalo de
23.940,7050 kg a 38.739,2950 kg.

g) limite de erro da estimativa do valor médio por subparcela


t  s ( y1 ) 1,96  1,204890
LE %   100   100  7,54%
y1 31,34

Este procedimento gera uma estimativa tendenciosa e de


pequena precisão, principalmente quando os valores de Mi va-
riam muito e as médias dos conglomerados y i apresentam pe-
quena variação.

2) Proceder a estimativa por razão, onde os M i consti-


tuem a variável auxiliar

a) valor médio estimado por razão


n

y
i 1
i.
3723,0
yR  n
  31,025 kg / ha
120
M
i 1
i

b) variância do valor médio por razão estimado


n n n

 ( M i yi ) 2  2 y R  M i2 y i  y R2  M i2
1 Nn
Vˆ ( y R )  2 ( )( i 1 i 1 i 1
)
M N nN n 1
2
1 80  10 1. 452 . 587 ,2  2  31,025  46. 624 ,0  31, 025  1514
Vˆ ( y R )  2
( )( 250 )
12, 5 10  80 9

Vˆ ( y R )  1,049667 (kg / ha ) 2

s ( y R )  1, 024533 kg / ha
n n n

1 N  n i 1
 ( M i yi ) 2  2 y R  M i2 y i  y R2  M i2
Amostragem
i 1 por conglomerado
Vˆ ( y R )  2 ( )( i 1
)
M N nN n 1
2
1 80  10 1. 452 . 587 ,2  2  31,025  46. 624 ,0  31, 025  1514
Vˆ ( y R )  ( )( )
12, 5 2 10  80 9

Vˆ ( y R )  1,049667 (kg / ha ) 2

s ( y R )  1, 024533 kg / ha

Tendo:
N
1 1000
MN 
N

i 1
Mi 
80
 12,5

c) valor total estimado por razão


YˆR  1000  31,025  31.025,0 kg

d) variância estimada do valor total por razão


Vˆ (YˆR )  10002 1,049667  1.049.667,0 kg 2

Destarte:
s(YˆR )  1024,532576 kg

e) intervalo de confiança do valor médio populacional por


subparcela ( Y )

IC : y R  t  s( y R )  31,025  1,96  1,024533

IC : 29 ,016915 kg / ha  Y  33 ,033085 kg / ha

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor médio populacional encontra-se no intervalo
de 29,016915 kg/ ha a 33,033085 kg/ ha.

251
Amostragem em inventário florestal Waldenei Travassos de Queiroz

f) intervalo de confiança do valor total populacional ( Y )


IC : YˆR  t  s (YˆR )  31 .025,0  1,96  1024 ,532576
IC : 29.016,915 kg  Y  33.033,085 kg

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor total populacional encontra-se no intervalo de
29.016,915 kg a 33.033,085 kg.

g) limite de erro da estimativa do valor médio por razão

t  s ( yR ) 1,96  1,024533
LE %   100   100  6 ,47 %
yR 31,025

3) Obter as estimativas se conhecidos os tamanhos


dos conglomerados da população

a) valor médio estimado

n 10
Dado que f    0,125 , então:
N 80
n

y
i 1
i.
3723,0
y3    29,784 kg / ha
f .M 0 0,125 1000

b) variância estimada do valor médio

Dado que:
n

n
(y ) i.
2

3 723,0 2
y 2
i.  i 1

n
1. 452. 214, 3 
10
Vˆ1 ( y )  i 1 2
  73 49,0 4444 4 ( kg / ha )
n 1 9

252
Amostragem por conglomerado

Então:

1 N  n Vˆ1 ( y) 1 80  10 7349 ,0444444


Vˆ ( y3 )  2 ( )  ( )
MN N n 12,52 80 10

Vˆ ( y 3 )  4 ,115464889 ( kg / ha ) 2

s ( y3 )  2,028660861 kg / ha

c) valor total estimado

Yˆ3  M 0 y3  1000  29,784  29.784,0 k g

d) variância estimada do valor total

Vˆ ( Yˆ3 )  M 02 Vˆ ( y 3 )  1000 2  4,115464889  4 .115 .464 ,889 kg 2

s(Yˆ3 )  2.028,660861 kg

e) intervalo de confiança para o valor médio por subparcela


(Y )
IC : y3  t  s ( y 3 )  29,784  1,96  2 ,028661

IC : 25,807824 kg / ha  Y  33,760176 kg / ha

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor médio populacional encontra-se no intervalo
de 25,807824 kg/ ha a 33,760176 kg/ ha.

f) intervalo de confiança para o valor total ( Y )

IC : Yˆ3  t  s (Yˆ3 )  29784,0  1,96 2028,660861


IC : 25.807,82471 kg  Y  33.760,17529 kg

253
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor total populacional encontra-se no intervalo de
25.807,82471 kg a 33.760,17529 kg.

g) limite de erro da estimativa do valor médio por unidade


secundária
t  s ( y3 ) 1,96  2 ,028661
LE%  100   100  13,35 %
y3 29,784

Dentre os procedimentos apresentados, destaca-se que o


segundo, estimativa por razão, é o melhor sob o ponto de vista
teórico da estatística.

9.3 Amostragem por conglomerados em estágio


único pelas proporções

Seja um inventário florestal composto por n conglomerados


estruturados com m subparcelas, as quais podem ser classi-
ficadas em duas categorias: C1 e C0. Admitindo que qualquer
subparcela do conglomerado pertença a uma das duas catego-
rias, C1 e C0, onde C1 corresponde às subparcelas que possuem
o atributo desejado e C0 definem os dados que não o possuem.

Seja a seguinte notação:


a i = número de subparcelas pertencente à categoria C1 no
conglomerado de ordem i ;
N = número total de conglomerados da população;
n = número de conglomerados amostrado;
M = número de subparcelas por conglomerado;
pi = ai / M é proporção de subparcelas pertencentes à cate-
goria C1 no conglomerado de ordem i.

254
Amostragem por conglomerado

9.3.1 Valores populacionais e estimadores

a) proporção estimada

Para quantificar os resultados, seja a seguinte regra para


qualquer subparcela yij da amostra ou da população:

yij = 1, se yij estiver contido em C1;


yij = 0, se yij estiver contido em C0.

Para a amostra de valores yij , resulta que:


M

∑ yy
j =1
ijij = aii

Daí, para o conglomerado de ordem i, tem-se:


yi ai
pi = =
M M

pi : é a proporção de subparcelas do conglomerado i per-


tencente à categoria C1.

b) variância da proporção

Considerando uma amostra aleatória de n conglomerados,


define-se como valor de p, a média das observações pi obtidas
na amostra, tal que p é uma estimativa da proporção P popula-
cional. Então: n

1 n  ai
Dado que p i = a i / M , logo: p   pi  i 1
. Então:
n i 1 nM
N

N N
(∑ p i ) 2

N − n V ( y) ∑(p i − P) 2 ∑p 2
i − I =1

N
V ( p) = ( ) , para V ( y ) = i =1
= I =1

N n N −1 N −1

255
Amostragem em inventário florestal Waldenei Travassos de Queiroz

N
1
P=
N
∑p
i =1
i

Resultando: n

n n
( ∑ pi ) 2
N − n Vˆ ( y) ∑ ( pi − p ) 2 ∑ pi2 − I =1
Vˆ ( p ) = ( ) , para Vˆ ( y ) = i =1 = I =1
n
.
N n n −1 n −1

No caso de ocorrer variação no tamanho do conglomerado,


então p é uma estimativa por razão, ou seja:
n n

∑ ai ∑M i pi
p i = a i / M i , logo: p = i =1
= i =1
n n

∑Mi
i =1
∑M
I =1
i

Por conseguinte, a estimativa da variância é dada pela ex-


pressão: n n n

1 Nn
a 2
i  2 p  a i M i  p 2  M i2
Vˆ ( p )  2 ( ) i 1 i 1 i 1

M N nN n1

Sendo:
n

∑Mi =1
i
MN =
N

Exercício 9.3

Seja um inventário florestal com 40 conglomerados selecio-


nados em uma área de 7.200 ha. O objetivo é conhecer a ocorrên-
cia de cipós. A estrutura conglomerada usada é constituída por oito
subparcelas de 1 ha. Os dados estão apresentados na Tabela 9.5.
Sabe-se que:

256
Amostragem por conglomerado

Área = 7.200 ha.


Área do conglomerado ou unidade primária = 8 ha.
Número de conglomerados amostrados ( n =40).
Número de total de conglomerados ( N = 7.200 / 8 = 900 ).
Número de subparcelas por conglomerados ( M = 8 ).

Tabela 9.5 - Número de subparcelas (ai) por conglomerado (C) com ocor-
rência de cipós.

C ai pi = ai /8 C ai pi = ai /8 C ai pi = ai /8 C ai pi = ai /8
1 0 0,000 11 0 0,000 21 1 0,125 31 0 0,000
2 3 0,375 12 1 0,125 22 2 0,250 32 1 0,125
3 1 0,125 13 5 0,625 23 1 0,125 33 2 0,250
4 3 0,375 14 3 0,375 24 2 0,250 34 0 0,000
5 2 0,250 15 2 0,250 25 4 0,500 35 0 0,000
6 1 0,125 16 1 0,125 26 2 0,250 36 4 0,500
7 2 0,250 17 3 0,375 27 3 0,375 37 1 0,125
8 4 0,500 18 0 0,000 28 2 0,250 38 1 0,125
9 1 0,125 19 3 0,375 29 4 0,500 39 0 0,000
10 0 0,000 20 0 0,000 30 0 0,000 40 2 0,250

a) proporção estimada

Sendo:
n n


i1
p i  8 ,3750 ;  a i
67 ,0
i 1

Então:
n

p
i 1
i
8, 3750
p   0,209375
n 40

Ou,
n

a
i 1
i
6 7, 0
p   0, 2 0937 5
nM 40  8
257
Amostragem em inventário florestal Waldenei Travassos de Queiroz

b) variância da proporção estimada

Dado que:
n

n
( p i ) 2
8 ,3750 2
p 2
i
 I 1
n
2,9531 
Vˆ ( y )  I 1
 40  0 ,030759
n 1 39

Então:
N  n Vˆ ( y) 2000  40 0,030759
Vˆ ( p )  ( )    0,0007535955
N n 2000 40

s( p )  Vˆ ( p)  0, 027452

c) intervalo de confiança para a proporção


IC  0,209375  2,0211 0,027452

0 ,153892  P  0,264858

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que a porcentagem populacional de ocorrência de cipós encon-
tra-se no intervalo de 15,39% a 26,49%.

d) ocorrência e intervalo de confiança para o total de


subparcelas

d1) total estimado de subparcelas com ocorrência de cipós


Aˆ  MNp  8  900  0,209375 = 1507,5 subparcelas

d2) intervalo de confiança para o total de subparcelas com


ocorrência de cipós
IC  7.200 (0,153892  A  0,264858)
IC  1.108,0224 subparcelas  A  1.906,9776 subparcelas

258
Amostragem por conglomerado

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o total populacional de subparcelas com ocorrência de ci-
pós encontra-se no intervalo de 1.108,024 a 1.906,9776.

Exercício 9.4

Seja uma população constituída de 200 comunidades (CO) e


localizada em uma área florestal com vocação para produção de
castanha do brasil, tal que foram selecionadas 30 delas. Em cada
comunidade foi determinado o número (ai) de famílias que traba-
lham na coleta. Estimar a proporção e o número médio de famílias
por comunidade envolvidas nessa atividade. O número total de fa-
mílias na população é 4.200. Considerar cada comunidade como
um conglomerado. Os dados estão apresentados na Tabela 9.6.
Neste exercício, é importante observar que há variação no tamanho
do conglomerado, então será uma estimativa por razão para p.

Tabela 9.6 - Número de famílias, por comunidade, envolvidas na coleta ( ai ) .

CO M ai pi CO Mi ai pi CO Mi ai pi
1 24i 11 0,474190 11 20 11 0,526656 21 18 9 0,502941
2 20 9 0,438285 12 30 15 0,498580 22 20 11 0,528746
3 18 9 0,482603 13 22 10 0,468295 23 22 10 0,449358
4 21 10 0,458886 14 20 10 0,520994 24 21 11 0,507773
5 20 10 0,494757 15 21 11 0,509420 25 22 10 0,443184
6 16 8 0,509868 16 23 12 0,500911 26 22 10 0,483288
7 21 10 0,465188 17 29 16 0,538024 27 17 9 0,519164
8 26 13 0,513292 18 14 7 0,486561 28 17 8 0,483169
9 15 6 0,392642 19 18 8 0,440110 29 24 12 0,486588
10 19 10 0,508764 20 25 13 0,512418 30 15 7 0,500293

Tem-se que:
Número total de famílias entrevistadas
30

M i
= 620
i 1

259
Amostragem em inventário florestal Waldenei Travassos de Queiroz

30
Número total de famílias que fazem coleta a i = 306
i 1

a) proporção estimada
30

i1
ai
306
p 30   0 ,493548
620

i 1
Mi

b) variância da proporção estimada


30 30 30
Dado que  a i2  3262;  M i
2
 13236; aM i i
 6555 , tem-se:
i 1 i 1 i 1

n n n

1 N n
 ai2  2 p  ai M i  p 2  M i2
Vˆ ( p )  i 1 i 1 i 1

M N nN n 1

1 200  30 3262  2  0,493548  6555  0,493548 2 13236


Vˆ ( p )  2  
21 30  200 29
30

M
i 1
i
4200
MN    21,0
N 200

Vˆ ( p )  0 ,0000348667 7143

s( p )  0,005904809178

c) intervalo de confiança para a proporção


IC  0,493548  2,0452  0,005904809178
0,481471484 P  0,505624515

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que a porcentagem populacional de famílias envolvidas na cole-
ta de castanha está no intervalo de 48,15% a 50,56%.

260
Amostragem por conglomerado

d) número médio estimado de famílias por comunidade en-


volvidas na coleta de castanha
yR  M N  p  21  0,493548  10,364508

e) variância estimada do número médio de famílias por co-


munidade envolvidas na coleta de castanha
Vˆ ( yR )  M N2 Vˆ ( p)  212  0,00003486677143  0,015376246

s ( y R )  0 ,1240

f) intervalo de confiança para o número médio de famílias


por comunidade envolvidas na coleta de castanha
IC  10,364508  2,0452 0,1240

10,1109  Y  10,6181

Pode-se afirmar, com uma probabilidade de acerto de 95%,


que o número médio populacional de famílias por comunidade
envolvidas na coleta de castanha está no intervalo de 10,1109
famílias a 10,6181 famílias.

9.4 Amostragem por conglomerados em dois es-


tágios

Para o melhor entendimento das fórmulas de variâncias


utilizadas na amostragem por conglomerados, é necessário ob-
ter os componentes de variância considerando o modelo mate-
mático utilizado.

261
Amostragem em inventário florestal Waldenei Travassos de Queiroz

9.4.1 Componentes de variâncias no modelo inteiramente


ao acaso

Existem vários métodos para obter estimativas de compo-


nentes de variâncias, sendo o mais usado é o método dos mo-
mentos ou da análise de variância. Barbin (1993) cita a existên-
cia dos seguintes métodos:

a) métodos da Máxima Verossimilhança, onde os métodos


de Herderson I, II e III são de análise de variância para dados
não balanceados;

b) método da Máxima Verossimilhança Restrita;

c) método de RAO denominado de MINQUE (Minimum


Norm Quadratic Unbiased Estimative);

d) método de RAO denominado de MIVQUE (Minimum Va-


riance Quadratic Unbiased Estimative);

e) os métodos de Bayes.

Considerando a disposição dos dados conforme a Tabela


9.7 e a análise de variância para a população com base nas
subparcelas de acordo com a Tabela 9.8, para obter os com-
ponentes de variâncias para a amostragem por conglomerados
em dois estágios, modelo inteiramente ao acaso, usar-se-á o
método dos momentos ou da análise de variância para calcular
os componentes de variâncias que consiste em obter a espe-
rança matemática dos quadrados médios (QM) da análise de
variância, onde as estimativas dos QM são igualadas às suas
respectivas esperanças matemáticas.

262
Amostragem por conglomerado

Tabela 9.7 - Dados populacionais.

Conglomerados
Subparcelas
1 2 .... N

1 y11 y21 ••• yN1

2 y12 y22 ••• yN2


... ••• ••• ••• •••

M y1M y2M ••• yNM

Totais y1 • y2• ••• yN•

Tabela 9.8 - Análise de variância para população com base nas subparcelas.

Causas de variação G.L. SQ QM


Conglomerados N-1  1Cong
SQCong /( N SQ ) /( N  1)
Resíduo N(M-1) SQ Dentro /[ NSQ  1)]/[ N (M  1)]
(MDentro

Total NM-1 SQ Total /( NMSQ 1) /( NM  1)


 Total

Considerando os conglomerados aleatórios, então os com-


ponentes de variância são obtidos segundo o modelo matemáti-
co do delineamento inteiramente ao acaso, portanto:
y ij  Y  c i  e ij

Y = média geral, sendo E( Y ) = Y e E( Y 2 ) = Y 2

ci = efeito de conglomerados ( i = 1,L, N ) considerado alea-


tório, normal e independentemente distribuído com média zero e
2
variância Ve(y), ou seja, ci~N [0,Ve(y)], para E(ci ) = 0 e E( c i ) = Ve(y).
Ve ( y ) = componente de variância entre os conglomerados.
eij = erro suposto aleatório com j = 1, L , M , normal e inde-

263
Amostragem em inventário florestal Waldenei Travassos de Queiroz

pendentemente distribuído com média zero e variância Vd (y), ou


seja, eij ~ N[(0 , V d ( y ) ], dado que E( eij )= 0 e E( eij ) = Vd (y).
2

V d ( y ) é definido como o componente de variância entre as


subparcelas dentro dos conglomerados.

Supondo que os efeitos aleatórios do modelo são não cor-


relacionados, logo:
Cov (c i , e ij )  0 ,  i,j

Cov ( c i , c i ' )  0 para i  i '

Cov ( e ij , e i ' j ' )  0 para i  i ' e j  j '

Sejam as expressões das Somas de Quadrados (SQ) do


modelo para obter as esperanças matemáticas dos quadrados
médios.
N M

N M (  y ij ) 2
SQT otal   yij2  C , onde C  i 1 j1

i 1 j 1 NM
N
1
SQ Cong 
M
y
i 1
2
i. C

N M N
1
SQRe s  SQTotal  SQCong    y ij2  y 2
i.
i 1 j 1 M i 1

N M N M
E (   y ij2 )    E (Y  c i  e ij ) 2
i 1 j  1 i 1 j1

N M N M
E (  yij2 )   E (Y 2  ci2  eij2  2Y ci  2Yeij  2ci eij )
i 1 j1 i1 j 1

N M N M
E(  y 2
ij
)  [Y 2
 V e ( y )  V d ( y )]  NM Y 2  NMV e ( y )  NMV d ( y ) (9.6)
i 1 j 1 i 1 j 1

N M
(   y ij ) 2
i 1 j 1 1 264N M
E[  (Y  c i  eij )] 2
NM 
E (C)  E( )
NM i 1 j 1

N N M
1
E (C )  E [ N 2 M 2 Y 2  M 2 ( ci ) 2  (  e ij ) 2  dp ]
NM i 1 i1 j 1
N M N M
E (  yij2 )   E (Y 2  ci2  eij2  2Y ci  2Yeij  2ci eij )
i 1 j1 i1 j 1

N M N M
E(  y 2
ij
)  [Y 2 Amostragem
 V e ( y )  V d ( y )]  NM Y 2  NMV e
por conglomerado
( y )  NMV d
( y ) (9.6)
i 1 j 1 i 1 j 1

N M
(   y ij ) 2 N M
i 1 j 1 1
E (C)  E( ) E[  (Y  c i  eij )] 2
NM NM i 1 j 1

N N M
1
E (C )  E [ N 2 M 2 Y 2  M 2 ( ci ) 2  (  e ij ) 2  dp ]
NM i 1 i1 j 1

dp = duplos produtos
1
E (C)  [ N 2 M 2 Y 2  NM 2Ve ( y )  NMVd ( y )]  NMY 2  MV e ( y )  V d ( y ) (9.7)
NM

Dado que:
N
E ( ci ) 2  E (c1  c2    cN ) 2  NVe ( y)
i 1

N M
E (  e ij ) 2  E (e11  e12    e NM ) 2  NMV d ( y )
i1 j 1

Das Expressões 9.6 e 9.7, têm-se:


E (SQTotal )  NMY 2  NMVe ( y)  NMVd ( y)  [ NMY 2  MVe ( y )  Vd ( y )]

E (SQTotal )  Ve ( y )(NM  M )  Vd ( y)( NM  1)

Então:
Ve ( y )( NM  M )  V d ( y )( NM  1)
E (QM T otal ) 
NM  1
N M

 ( y ij )2 N N
i 1 j 1 1 1
E[ ] E (  y 2i . )   E( y 2
i. )
M M i 1 M i 1

y
j 1
ij  yi .

N N M
1 2 1
 E( y )  E ( M Y  Mc   e )2
265 j1
i. i ij
M i 1 M i 1

N N M
1 1
M
 E ( yi2. ) 
i 1 M
 E[(M 2Y 2  M 2ci2  ( eij ) 2  dp]
i1 j 1

N N
1 1
E( y 2 )  [ M 2Y 2  M 2V ( y)  MV ( y)  0 ]
 ( y ij )2 N N
i 1 j 1 1 1
E[ ] E (  y 2i . )   E( y 2
i. )
M M i 1 M i 1

y
Amostragem em inventário florestal
j 1
ij y i.
Waldenei Travassos de Queiroz

N N M
1 1
M
 E ( y i2. )  M
 E ( M Y  Mci   e ij ) 2
i 1 i 1 j 1

N N M
1 1
 E ( yi2. )   E[(M 2Y 2  M 2 ci2  ( eij ) 2  dp ]
M i 1 M i1 j 1

N N
1 1
M
 E( y 2
i.
)
M
 [M 2
Y 2  M 2Ve ( y)  MVd ( y)  0 ]
i 1 i 1

N
1
 E( y 2
i.
)  NM 2  NMVe ( y )  NVd ( y) (9.8)
(9.8)
M i 1

Das Expressões 9.8 e 9.7, têm-se:


2
E ( SQ Cong )  NM Y  NMV e ( y)  NV d ( y )  [ NM Y 2  MV e ( y)  V d ( y)]

E ( SQ Cong )  NMV e ( y )  NV d ( y )  MV e ( y )  V d ( y )  M ( N  1)V e ( y )  ( N  1)V d ( y )

SQCong 1
E (QM Cong )  E ( ) [ M ( N  1)V e ( y )  ( N  1)V d ( y )]
N 1 N 1
E( QM Cong )  MVe ( y )  Vd ( y )

E ( SQ D entro )  E ( SQT otal  SQ Cong )  E (SQTotal )  E ( SQ Cong )


E( SQD entro )  [ M ( N  1)Ve ( y)  ( NM  1)Vd ( y)]  [ M ( N  1)Ve ( y )  ( N  1)Vd ( y )]

E (SQ D en tr o )  ( NM  1)Vd ( y)]  ( N  1)Vd ( y )]  N ( M  1)Vd ( y )

Sendo:
SQ Dentro 1
E( QM Dentro )  E[ ] [ N( M  1)V d ( y )]  Vd ( y)
N (M  1) N (M  1)

Na Tabela 9.9, considerando o delineamento inteiramen-


te ao acaso, é apresentado o esquema de análise de variância
com os componentes de variância.

266
Amostragem por conglomerado

Tabela 9.9 - Modelo inteiramente ao acaso com os componentes de vari-


ância.

Causas de Variação G.L. SQ QM E(QM)


Entre cong. N-1  1Cong
SQCong /( NSQ ) /( NV y))  MVe ( y)
d (1

Dentro cong. N(M-1) SQ Dentro /[ NSQ  1)]/[ NV(dM(y


(MDentro ) 1)]
Total NM-1 Ve (
SQ Total /( NM y)(1NM
)  M ) V d (y )(NM  1)
NM  1

Pode-se, então, obter os seguintes estimadores:


ˆ ˆ
Vˆd ( y )  QMˆ De ntro e Vˆe ( y )  Q M Con g Q M D entr o

m

9.4.2 Parâmetros populacionais e estimadores

Neste processo, em cada unidade primária (conglomera-


do) selecionada é medida uma subamostra de unidades secun-
dárias ou subparcelas.
Será considerado, para formulação dos parâmetros popu-
lacionais e seus estimadores, que os n conglomerados selecio-
nados contêm o mesmo número m de subparcelas.
Seja a seguinte notação:
yij = valor da variável resposta da j-ésima subparcela cor-
respondente ao i-ésimo conglomerado;
yi. = valor total das subparcelas do i-ésimo conglomerado;
Y = valor médio populacional dos conglomerados;
Y = valor médio populacional das subparcelas;
y = valor médio estimado dos conglomerados;
y = valor médio estimado das subparcelas;
Y = valor total populacional;
Yˆ = valor total estimado.

267
Amostragem em inventário florestal Waldenei Travassos de Queiroz

a) valor médio por conglomerado e por subparcela


N n n

 yi .
N

y i.
 yi . y i.
y
Y  i 1
; Y  i1  Y ; y  i 1
; y i 1

N NM M n nm m

b) valor total Y e seu estimador Yˆ

Y  NY  NMY ; Yˆ  N y  NM y

c) variâncias populacionais e seus estimadores

Dado que:
V1 ( y ) = variância populacional entre os valores médios dos
conglomerados;
V2 ( y ) = média das variâncias populacionais das subparce-
las dentro dos conglomerados;
Vˆ1 ( y ) = variância estimada entre os valores médios dos
conglomerados;
Vˆ2 ( y ) = média das variâncias estimadas das subparcelas
dentro dos conglomerados;
V ( y ) = variância populacional da média dos conglomerados;
V ( y ) = variância populacional da média das subparcelas;
Vˆ ( y ) = variância estimada da média dos conglomerados;
Vˆ ( y ) = variância estimada da média das subparcelas.

Então: N

N N
( Yi ) 2
i 1
 (Y i  Y ) 2
i 1

i 1
Yi 
N
V1 ( y )  
N 1 N 1
N
1
V2 ( y) 
N V
i 1
2i ( y ) , sendo:

M
(  yij ) 2
M M 268 j 1
 ( yij  Yi ) 2  yij2  M
j1 j 1
V2 i ( y )  
M 1 M 1
N N
i 1
 (Y i  Y ) 2  Yi 
i 1 i 1 N
V1 ( y )  
N 1 N 1
N
1 Amostragem por conglomerado
V2 ( y) 
N V
i 1
2i ( y ) , sendo:

M
(  yij ) 2
M M
j 1
 ( yij  Yi ) 2  yij2  M
j1 j 1
V2 i ( y )  
M 1 M 1
Resultando os estimadores:
n

n
( yi ) 2
y i
2
 i 1

n
Vˆ1 ( y)  i 1

n 1
n
1
Vˆ2 ( y )   Vˆ2i ( y) , tal que:
n i 1
m

m m
( yij ) 2
j 1
 (y ij
 yi ) 2 y 2
ij

m
Vˆ 2i ( y) 
j 1 j 1

m 1 m1

Se os n conglomerados e as m subparcelas forem sele-


cionados por amostragem simples ao acaso, conclui-se, como
demonstrado em Vries (1986), que y é uma estimativa sem ten-
dência de Y e sua variância é:
N  n V1 ( y) M  m V2 ( y )
V ( y)  ( ) ( )
N n M mn

Sendo as frações amostrais do primeiro e do segundo es-


tágios:
f 1  n e f 2  m ,, pode-se usara Fórmula
a Fórmula
9.9.9.9.
n m
pode-se usar
f 1  N e f 2  M , pode-se usar a Fórmula 9.9.
N M
V (y) V (y)
V ( y )  (1  f 1 ) V11 ( y )  (1  f 2 ) V22 ( y )
V ( y )  (1  f 1 ) n  (1  f 2 ) mn (9.9)
n mn

269
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Sendo sua estimativa sem tendência dada pela Fórmula


9.10.
Vˆ ( y) Vˆ ( y) (9.10)
Vˆ ( y )  (1  f 1 ) 1  f 1 (1  f 2 ) 2
n mn

Sendo: n m

∑∑ ( y
n

∑(y i − y) 2
ij − yi ) 2
Vˆ1 ( y ) = i =1
; Vˆ2 ( y ) = i =1 j =1

n −1 n(m − 1)
A Fórmula 9.10 pode ser escrita na forma 9.11 em função
dos componentes de variância.

Vˆ ( y ) Vˆd ( y ) Vˆe ( y) Vˆd ( y) (9.11)


Vˆ ( y )  e   
n nm N NM
Verificação:
Seja:
Vˆ ( y) Vˆ ( y)
Vˆ ( y)  (1  f 1 ) 1  f1 (1  f 2 ) 2
n mn

Então:
n Vˆ ( y) n m Vˆ ( y)
Vˆ ( y)  (1  ) 1  (1  ) 2
N n N M mn

Logo:
Vˆ ( y) Vˆ1 ( y) Vˆ 2 ( y) Vˆ2 ( y)
Vˆ ( y )  1   
n N Nm NM

Dado que:
n

 (y  y)2
i
QMˆ Entre Vˆd ( y )  mVˆe ( y) ˆ Vˆ ( y )
Vˆ1 ( y)  i 1
   V e ( y)  d
n 1 m m m

Vˆ2 ( y )  Vˆd ( y )

270
Amostragem por conglomerado

Portanto:
Vˆ ( y) ˆ Vˆ ( y )
Vˆe ( y )  d V e ( y)  d ˆ ˆ
Vˆ ( y )  m  m  V d ( y)  V d ( y )
n N Nm NM
Vˆ ( y ) Vˆd ( y) Vˆe ( y) Vˆd ( y) Vˆd ( y) Vˆd ( y )
Vˆ ( y )  e     
n nm N Nm Nm NM

Resultando:
Vˆ ( y ) Vˆd ( y ) Vˆe ( y ) Vˆd ( y )
Vˆ ( y )  e   
n nm N NM

Expandindo-se para o total da população, tem-se:

Vˆ (Yˆ )  Vˆ ( NMy )  N 2 M 2Vˆ ( y )

d) intensidade de amostragem para população finita


Vˆ ( y ) Vˆ1 ( y ) Vˆ2 ( y ) Vˆ2 ( y )
E 2  t 2Vˆ ( y )  t 2 [ 1    ]
n N Nm NM
2 2 Vˆ1( y ) 2 Vˆ1( y ) Vˆ2 ( y ) Vˆ2 ( y )
E t t [   ]
n N Nm NM

t 2Vˆ1 ( y)
n
t2 Vˆ ( y) Vˆ 2 ( y )
E 2  [Vˆ1 ( y)  2  ]
N m M

e) intensidade de amostragem para população finita em


função dos componentes de variância
Vˆe ( y) Vˆd ( y) Vˆe ( y) Vˆd ( y)
E 2  t 2Vˆ ( y)  t 2 [    ]
n nm N NM
t2 ˆ Vˆ ( y) t 2 ˆ Vˆ ( y)
E2  [Ve ( y)  d ]  [Ve (y)  d ]
n m N M

Vˆd ( y )
t 2 [Vˆe ( y )  ]
n
m 271
t2 Vˆd ( y )
E  [Vˆe ( y ) 
2
]
N M
Vˆ ( y) Vˆd ( y) Vˆe ( y) Vˆd ( y)
E 2  t 2Vˆ ( y)  t 2 [ e    ]
n nm N NM

Amostragem em t ˆ florestal Vˆd


2
2 inventário ( y) t 2 ˆ Vˆ ( y) Waldenei Travassos de Queiroz
E  [Ve ( y)  ]  [Ve (y)  d ]
n m N M

Vˆd ( y )
t 2 [Vˆe ( y )  ]
m
n
t2 Vˆd ( y )
E  [Vˆe ( y ) 
2
]
N M

f) número ótimo de subparcelas para população finita

A fórmula para obter o número ideal de subparcelas é obti-


da minimizando a função custo dada pela expressão C = nc1 + nmc2
que é muito usada em inventários florestais.
C = c1n + c2nm

C = custo total de medição de campo;


c1 = custo médio de deslocamento entre conglomerados;
c2 = custo médio de medição das subparcelas.

Então:
C  c1 n  c 2 nm  n( c1  mc2 )

Para:
Vˆ ( y )
t 2 [Vˆe ( y ) + d ]
n= m
t2 Vˆ ( y )
E 2 + [Vˆe ( y ) + d ]
N M

Por conseguinte:
Vˆ ( y)
t 2[Vˆe ( y )  d ]( c1  mc2 )
C m
t2 Vˆ ( y)
E 2 [Vˆe ( y)  d ]
N M
t2 ˆ
C [Vˆ ( y)c  c1Vd ( y)  mc Vˆ ( y)  c Vˆ ( y)]
Vˆd ( y)
e 1 2 e 2 d
2 t2 ˆ m
E  [Ve ( y)  ]
N M
272
Amostragem por conglomerado

Tomando-se a primeira derivada em relação a m e anulan-


do, tem-se:
C t2 c1Vˆd ( y)
 [  c 2Vˆe ( y)]
dm t2 ˆ Vˆ ( y ) m2
E2  [Ve ( y)  d ]
N M
C
0
dm
c1Vˆd ( y )
[ 2
 c 2Vˆe ( y )]  0
mOti

2 c1Vˆd ( y )
mOti 
c 2Vˆe ( y )

Logo:
c1Vˆd ( y )
mOti =
c2Vˆe ( y )

De acordo com Péllico Netto e Brena (1997), os estima-


dores das variâncias podem ser obtidos segundo o critério da
análise de variância para o modelo aleatório. Não obstante,
considerando m (n  1)  nm  1 e atendendo à condição de que
a amostra por conglomerados, geralmente, é aplicada às popu-
lações extensas, o estimador da variância entre as subunidades
considerando todos os conglomerados é: Vˆ ( y ) = Vˆe ( y ) + Vˆd ( y ) ,
onde: Vˆe ( y ) é o componente de variância entre conglomerados
e Vˆd ( y ) é o componente de variância entre subparcelas dentro
dos conglomerados.
Cochran (1977), Vries (1986) e Sanquetta et al. (2009)
expõem teoricamente os estimadores da amostragem em con-
glomerados como sendo uma estrutura monolítica, ou seja, os

273
Amostragem em inventário florestal Waldenei Travassos de Queiroz

conglomerados são previamente definidos e os parâmetros são


conceitualmente apresentados para a modelagem matemática
usando a análise de variância, daí ter-se a fórmula para o coefi-
ciente de correlação intraconglomerados ( d ), a partir dos com-
ponentes de variância entre e dentro dos conglomerados.
Considerando os fatores de correção para o primeiro e se-
gundo estágios desprezíveis, a expressão para o estimador da
variância da média por subparcela, em função do coeficiente de
correlação intraconglomerado, é:
Vˆ ( y)
Vˆ ( y)  [1  ˆ ( m  1)]
nm

O estimador dˆ é definido como o coeficiente de correlação


intraconglomerado, o qual explica o grau de dependência entre
as subparcelas dentro dos conglomerados. Este coeficiente é
importante para delinear a estrutura amostral do conglomerado.
O valor dˆ(m − 1) mede a eficiência da amostragem por conglome-
rados em relação à amostra simples ao acaso.

Dado que:
(n  1)m (QMˆ En tr e )  (nm  1)Vˆ ( y )
ˆ 
( nm  1)( m  1)Vˆ ( y )

Sob a condição (n  1)m  (nm  1), resulta:


Vˆ ( y ) Vˆe ( y )
dˆ = e =
Vˆ ( y ) Vˆe ( y ) + Vˆd ( y )

Para obtenção da expressão:


Vˆ ( y)
Vˆ ( y)  [1  ˆ ( m  1)]
nm

Pode-se adotar o seguinte procedimento:

274
Amostragem por conglomerado

Seja a equação:
N  n V1 ( y ) M  m V 2 (y)
V (y )  ( ) ( )
N n M mn

Esta fórmula pode ser escrita da seguinte forma:


V1 ( y) V1 ( y) V2 ( y ) V 2 ( y )
V ( y)    
n N mn Mn

Destarte:
1 V ( y) 1 1
V ( y )  [V1 ( y )  2 ] V 2 ( y )  V1 ( y)
n M nm N

O valor [V1 ( y ) − V2 ( y ) M ] é o componente de variância entre


os valores médios dos conglomerados Ve(y), assim como V2 ( y ) é
o componente de variância entre os valores médios das subpar-
celas dentro dos conglomerados Vd(y). Considerando que o valor
N seja grande, tal que V1 ( y ) N seja desprezível, tem-se:
1 V (y) 1
V ( y )  [V1 ( y)  2 ] V2 ( y )
n M nm

Consequentemente:
1 1
V ( y)  V e ( y)  Vd ( y )
n nm

Dado que Ve ( y ) = d V ( y ) e V ( y ) = Ve ( y ) + Vd ( y ) , então:


1 1
V ( y )   V ( y)  [(V ( y )  V ( y )]
n nm
V ( y) 1
V ( y) = [d + (1 − d )]
n m
V ( y ) md + 1 − d
V ( y) = ( )
n m

275
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Finalmente:
V ( y)
V ( y)  [1   ( m  1)]
nm

Destarte:
Vˆ ( y)
Vˆ ( y )  [1  ˆ(m 1)]
nm
Ve ( y) Vd ( y) V1 ( y)
É importante verificar que: V ( y)   
n nm n

Se f 1 é desprezível, a fórmula Vˆ ( y )  (1  Vˆ1 ( y) Vˆ ( y )


f1 )  f 1 (1  f 2 ) 2
n mn
será simplificada para:
Vˆ ( y )
Vˆ ( y ) = 1
n
Vˆ ( y )
Como Vˆ1 ( y ) = Vˆe ( y ) + d , então:
m
1 Vˆ ( y) Vˆ ( y) Vˆd ( y)
Vˆ ( y)  (Vˆe ( y )  d ) e 
n m n nm

Dado que:

Vˆe ( y ) Vˆ ( y )
dˆ = = e , pois Vˆ ( y ) = Vˆe ( y ) + Vˆd ( y )
ˆ ˆ ˆ
Ve ( y ) + V d ( y ) V ( y )

Então:
ˆVˆ ( y ) Vˆ ( y )  ˆVˆ ( y )
Vˆ ( y )  
n nm
mˆVˆ ( y )  Vˆ ( y )  ˆVˆ ( y )
Vˆ ( y ) 
nm

276
Amostragem por conglomerado

Logo:
m ˆVˆ ( y )  Vˆ ( y )  ˆ Vˆ ( y ) Vˆ ( y )
Vˆ ( y )   (m ˆ  1  ˆ)
nm nm

Finalmente:
Vˆ ( y )
Vˆ ( y )  [(1  mˆ( m  1)]
nm

Para efeitos práticos em inventários florestais, Péllico Netto e


Brena (1997) recomendam que o limite aceitável do valor do coefi-
ciente de correlação intraconglomerado seja de d ≤ 0,4 , pois, para
d > 0,4 a população estará mais apropriada para estratificação.

g) intensidade de amostragem para populações infinitas

A fórmula para obter o número de conglomerado (n) é ob-


tida fixando-se a semiamplitude do intervalo de confiança (E).
O valor E é definido como uma porcentagem da média. A por-
centagem estabelecida é denominada de Limite de Erro (LE) ou
margem de erro, originando a expressão EE == LE
E ×y.
L

E × y , então EE== LE
Dado que EE==LE
L E × y = t × s ( y ) e E 2 = t 2Vˆ ( y ),
L
logo:
t 2 Vˆ ( y)
E 2  t 2Vˆ ( y )  [1  ˆ (m  1)]
nm

Resultando:

t t22VˆVˆ((yy))
E 2  t 2Vˆ( ny )= 2 [[11+dˆˆ((mm−
11)])]
Enm m

h) número ótimo de subparcelas para populações infinitas

277
Amostragem em inventário florestal Waldenei Travassos de Queiroz

A fórmula para obter o número ideal de subparcelas é obtida


minimizando a função custo dada pela expressão C = nc1 + nmc2
C = custo total de medição no campo;
c1 = custo médio de deslocamento entre conglomerados;
c2 = custo médio de medição das subparcelas.
t 2Vˆ ( y )
Como C = nc1 + nmc2 e n = [1 + dˆ(m − 1)] , então:
E 2m
t 2Vˆ ( y ) t 2Vˆ ( y )
C 2
[1  ˆ ( m  1)]c1  [1  ˆ ( m  1)]mc 2
E m E 2m

t 2Vˆ ( y)
C [1  ˆ(m  1)](c1  mc 2 )
E 2m
t 2Vˆ ( y ) t 2Vˆ ( y ) t 2Vˆ ( y )ˆ t 2Vˆ ( y )ˆ t 2Vˆ ( y )ˆ t 2Vˆ ( y)ˆ
C c1  c2  c1  mc 2  2
c1  c2
2
E m E 2
E 2
E 2
E m E2

t 2Vˆ ( y) 1 ˆ
ˆ c  ˆ mc   c  ˆ c )
C ( c 1  c 2   1 2 1 2
E2 m m

Tomando-se a primeira derivada, tem-se:


dC t 2Vˆ ( y ) 1 1
 2
( 2 c1  ˆ c 2  2 ˆ c1 )
dm E m m
dC
Dada a condição  0 , então:
dm
t 2Vˆ ( y ) 1 1
2
(− 2 c1 + dˆ c2 + 2 dˆ c1 ) = 0 , logo:
E mOti mOti
1 1
(− 2
c1 + dˆ c2 + 2 dˆ c1 ) = 0
mOti mOti
c1
(−1 + dˆ ) + dˆ c 2 = 0 ⇒ c1 (−1 + dˆ) + mOti dˆ c 2 = 0
2
2
mOti

Então:
2 ˆ
mOtid c2 = c1 (1 − dˆ)
278
Amostragem por conglomerado

Finalmente:
c1 1 − dˆ
mOti = ( )
c2 dˆ

Esta fórmula também pode ser escrita da seguinte forma:


c1 Vˆd ( y )
mOti =
c 2 Vˆe ( y )

Verificação:
Dado que:
Vˆe ( y ) Vˆ ( y )
dˆ = = e
Vˆe ( y ) + Vˆd ( y ) Vˆ ( y )

Então:
Vˆe ( y ) Vˆ ( y ) − Vˆe ( y )
1−
c1 Vˆ ( y )
c Vˆ ( y )
mOti = [ ]= 1 [ ]
ˆ
c 2 Ve ( y ) c2 Vˆe ( y )
ˆ
V ( y) Vˆ ( y )

c1 Vˆd ( y )
mOti = (9.12)
c2 Vˆ ( y )
e

Tomando-se a segunda derivada para verificar a natureza


do ponto crítico, tem-se:

dC t 2Vˆ ( y ) 2 2 ˆ 2 c1t 2Vˆ ( y)


 ( c1   c1 )  (1  ˆ )
dm 2 E 2 m3 m3 E 2 m3

Dado que [2c1 t 2Vˆ ( y )])] /((E m32) é um termo sempre positivo,
E 22m

279
Amostragem em inventário florestal Waldenei Travassos de Queiroz

logo mOti obtido pela Fórmula 9.12 torna mínimo o custo do in-
ventário quando dˆ ≠ 1 , pois dC / dm2 > 0.
É importante sublinhar que a expressão para obter o nú-
mero ótimo de subparcelas do conglomerado é a mesma tanto
para população finita como para infinita.

9.4.3 Ocorrência de estimativa negativa do componente de


variância entre conglomerados Vˆe ( y )

O valor dˆ(m − 1) mede a eficiência da amostragem por con-


glomerados em relação à amostra simples ao acaso. Quando
dˆ > 0 a amostra simples ao acaso (ASA) é mais precisa que a
amostra por conglomerados. Se dˆ < 0 a ASA é menos precisa
que a amostra por conglomerados. Quando dˆ = 0 a precisão é a
mesma entre a ASA e a amostra por conglomerados.
A fórmula do coeficiente de correlação intraconglomerado
dada por dˆ = Vˆe ( y ) [Vˆe ( y ) + Vˆd ( y ))]
] , sendo Vˆe ( y ) = (QMˆ Entre − QMˆ Dentro ) m e
ˆ ˆ
Vd ( y ) = QM Dentro , denota que se dˆ < 0 implica que Vˆe ( y ) < 0 , ou
seja, o componente de variância estimado entre os conglome-
rados é negativo. Neste caso, tem-se que: QMˆ Entre < QMˆ Dentro e,
consequentemente, F = QMˆ Entre QMˆ Dentro < 1.

Searle (1971) recomenda considerar os seguintes procedi-


mentos quando Vˆe ( y ) < 0 :

a) considerar a estimativa como negativa admitindo que o


parâmetro Ve ( y ) seja nulo. Este procedimento pode trazer pro-
blema na aplicação de determinadas fórmulas.
No caso da expressão:

t 2Vˆ ( y )
n= [1 + dˆ(m − 1)])]
E 2m

280
Amostragem por conglomerado

Não haverá dificuldade de operar matematicamente.

ˆ
Por outro lado, para obter m = c1 (1 − d ) , deverá ocorrer
c 2 dˆ
dˆ > 0.

b) admitir o valor do parâmetro Ve ( y ) = 0 e considerar a es-


timativa negativa como nula. Neste caso é recomendável testar
a hipótese H 0 : Ve ( y ) = 0 , aplicando o teste F bilateral;

c) considerar o valor do parâmetro como zero e retirá-lo do


modelo de análise de variância;

d) o uso de modelo matemático inadequado pode resultar na


presença de estimativas de componentes de variância negativas;

e) o método utilizado para obter as estimativas de compo-


nentes de variância pode não ser adequado. Neste caso usar
outros procedimentos;

f) a presença de estimativas de componentes de variância


negativas pode estar relacionada ao problema do tamanho da
amostra. Neste caso é importante medir mais conglomerados.

Exercício 9.5

Seja o exemplo, apresentado em Queiroz (1998), de um


inventário florestal com amostragem em dois estágios de uma
área com 49.000 ha, onde foram mensurados 20 conglomera-
dos. A estrutura espacial do conglomerado apresentou a forma
cruz de malta, composta por quatro subparcelas retangulares de
10 m de largura por 250 m de comprimento. A distância de cada
subunidade ao ponto central foi de 100 m. Os dados da variável

281
Amostragem em inventário florestal Waldenei Travassos de Queiroz

resposta volume total de madeira considerando todas as espé-


cies com DAP 45 cm estão apresentados na Tabela 9.10. A
resolução deste exemplo será realizada de três formas:

1) Analisar a partir das subparcelas considerando a popu-


lação infinita.
2) Analisar por meio das subparcelas considerando a po-
pulação finita.
3) Análise considerando o conglomerado como unidade
amostral, usando a metodologia da amostra simples ao acaso.
4) Comparar os resultados dos referidos procedimentos de
análise.

Tabela 9.10 - Conglomerado (C) em dois estágios (m3/ 0,25 ha).

C S1 S2 S3 S4 Total Média Variância


1 43,75 42,50 32,75 57,10 176,10 44,0250 100,1608
2 62,75 47,25 34,50 66,01 210,51 52,6275 213,0267
3 77,65 73,50 69,25 39,50 259,90 64,9750 300,1942
4 57,20 67,50 37,50 38,02 200,22 50,0550 219,2828
5 51,10 43,50 58,25 58,25 211,10 52,7750 49,5942
6 68,00 75,50 37,28 64,33 245,11 61,2775 277,5564
7 45,76 34,80 57,30 63,17 201,03 50,2575 158,4971
8 60,10 78,70 58,33 37,27 234,40 58,6000 287,1006
9 63,75 79,90 75,13 42,23 261,01 65,2525 281,4691
10 49,88 55,17 35,37 44,24 184,66 46,1650 71,7096
11 88,17 67,30 65,28 37,13 257,88 64,4700 439,2769
12 27,18 34,89 64,30 58,17 184,54 46,1350 320,1835
13 37,80 48,24 49,15 58,89 194,08 48,5200 74,3102
14 55,71 58,29 43,16 37,12 194,28 48,5700 101,9429
15 45,11 43,12 55,83 54,17 198,23 49,5575 40,6137
16 35,35 63,23 70,90 85,14 254,62 63,6550 438,4830
17 48,15 38,90 61,37 55,33 203,75 50,9375 93,6009
18 38,75 45,17 40,44 39,89 164,25 41,0625 7,9938
19 49,10 55,13 63,17 37,14 204,54 51,1350 120,2675
20 50,10 52,70 37,37 57,13 197,30 49,3250 71,9438
Total 1055,36 1105,29 1046,63 1030,23 4237,51 3667,2077

282
Amostragem por conglomerado

1) Analisar a partir das subparcelas considerando a po-


pulação infinita

a) valor médio estimado por conglomerado


n

 yi . 4237,51
y i 1
  211,8755 m3 / ha
n 20

b) valor médio estimado por subparcela


n

y i.
y 211,8755
y i 1
   52,9689 m 3 / 0,25 ha ; y  m 3 / ha
nm m 4

c) análise de variância e obtenção dos componentes de


variância

Tabela 9.11- Conglomerado em dois estágios: análise de variância.

CAUSAS DE VARIAÇÃO GL SQ QM
Entre conglomerados 19 4.178,1575 219,9030
Dentro dos conglomerados 60 11.001,6220 183,3604

TOTAL 79 15.179,7790 192,1491

QMˆ Entre  QMˆ Dentro 219,9030  183,3604


Vˆe ( y)    9,1357 ( m3/ 0,25 ha )2
m 4

Vˆd ( y )  QM
ˆ 3 2
Dentro  183,3604 (m / 0,25 ha)

3 2
Vˆ ( y )  Vˆe ( y )  Vˆd ( y )  192 ,4961 (m / 0 ,25 ha )

d) coeficiente de correlação intraconglomerado estimado


Vˆe ( y) 9 ,1357
ˆ    0,047459143
ˆ ˆ
Ve ( y)  V d ( y) 9,1357 183,3604

283
Amostragem em inventário florestal Waldenei Travassos de Queiroz

e) variância da média população infinita


Vˆ ( y) 192,4961
Vˆ ( y)  [1  ˆ( m  1)]  [1  0,047459143 (4 1)]
nm 20  4
Vˆ ( y)
Vˆ( y)  [1  ˆ( m 1)]  2,74878 (m3 / 0,25 ha) 2
nm

Vˆ ( y )  42  2,74878  43,98048(m3 / ha)2

s( y)  6,631778 (m3 / ha)

Usando a fórmula:
Vˆ ( y) 54 ,975763
Vˆ ( y )  1   2,748788 ( m3 / 0,25 ha )
n 20

Verifica-se que este resultado é o mesmo obtido pela fórmula:


Vˆ ( y)
Vˆ ( y)  [1  ˆ( m  1)]
nm

O resultado idêntico confirma tratar-se de fórmulas seme-


lhantes.

f) intervalo de confiança para o valor médio

A metodologia para a obtenção do intervalo de confiança é


a mesma para os procedimentos expostos, com exceção para o
número de graus de liberdade da estatística “t” de Student que
no caso da aplicação da amostragem simples ao acaso será n -1.
O número de graus de liberdade na amostra por conglomerados,
quando analisada por meio das subparcelas, é n(m – 1).

Limite inferior para o valor médio


y  t 60 ;0 .025  s ( y ) = 211,8755 - 2,0003  6,631778 = 198,61 m 3/ ha
s( y )  Vˆ ( y )  43,98048  6 ,631778

284
Amostragem por conglomerado

Limite superior para o valor médio


y  t 60; 0.025  s ( y ) = 211,8755 + 2,0003  6,631778 = 225,14 m 3/ ha

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor médio populacional encontra-se no intervalo
de 198,61 m3/ ha a 225,14 m3/ ha.

g) intervalo de confiança para o valor total

Limite inferior para o valor total


Área[ y  t 60 ;0 ,025  s( y ) ] = 49.000  198,60922 = 9.731.887,77 m3

Limite superior para o valor total


Área [ y  t6 0;0 , 025  s ( y)] = 49.000  225,141046 = 11.031.911,23 m3

Pode-se afirmar, com uma probabilidade de acerto de


95%, que o valor total populacional encontra-se no intervalo de
9.731.887,77 m3 a 11.031.911,23 m3.

h) limite de erro ou margem de erro (LE) do inventário flo-


restal
Seja E a semiamplitude de intervalo de confiança e LE o
limite de erro:

E = t × s( y )
E = t × s6,631778
E = 2,0003 ( y) = 13,265546 m3/ ha
E 13,265546
LE %   100  100  6 ,26 %
y 211,8755

285
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Pode-se afirmar que o limite de erro ou margem de erro,


com uma probabilidade de acerto de 95%, para os valores da
média e total populacional encontrados nos intervalos de con-
fiança obtidos é de 6,26%.

i) dimensionamento da amostra por conglomerados

Suponha que o limite de erro estipulado seja de 5%


(LE=0,05). O resultado da análise mostrou que para 20 conglo-
merados o limite de erro foi de 6,26%. Então, deve-se calcular
o número de conglomerados para atender o limite de erro (LE)
igual a 0,05 e calcular, posteriormente, o número de conglome-
rados faltantes.

Dado que E = LE x y = 0,05 x 211,8755 = 10, 593775, tem-se:


t 2Vˆ ( y) 2
2 ,0003  3079,9368
n 2
[1  ˆ ( m  1)]  [1  0,0475  3]  31,36
E m 10 ,593775 2  4

n = 32 conglomerados

Considerando que são necessários 32 conglomerados


para atender ao limite de erro escolhido de 5%, deve-se retornar
à floresta e medir mais 12 conglomerados, visto que já foram
medidos 20 conglomerados.

j) número de subparcelas ideal

c1 1 − dˆ 1 − 0,0475
m Oti = ( ) = 3( ) = 7,76
c 2 dˆ 0,0475
m Oti = 8 subunidades

O resultado demonstra que o ideal seria estruturar um con-


glomerado com oito subparcelas, o que diminuiria o número de

286
Amostragem por conglomerado

conglomerados a medir, entretanto, deve-se ressaltar que os da-


dos usados no exemplo são simulados. Neste exemplo utilizou-
se c1 / c 2 = 3 , considerando as experiências existentes em inven-
tários florestais nos trópicos.

2) Analisar por meio das subparcelas considerando a


população finita

a) variância da média de população finita

Dado que:
n

 ( yi  y) 2
Vˆ1 ( y)  i 1
 54,9758 (m3 / 0,25 ha)2
n 1
n m

 (y ij
 yi ) 2
Vˆ 2 ( y) 
i 1 j  1
 183,3604 ( m 3 / 0,25 ha ) 2
n ( m  1)

Sabe-se que:
49 ha 49 .000 ha n 20
M  196; N   1.000; f 1    0,02;
0,25 ha 49 ha N 1 .000

m 4
f2    0 ,0204
M 196

Então:
Vˆ ( y ) Vˆ ( y)
Vˆ ( y )  (1  f 1 ) 1  f1 (1  f 2 ) 2
n mn
54 ,975763 183,3604
Vˆ ( y )  (1  0,02 )  0 ,02 (1  0 ,0204 )
20 4  20

Vˆ ( y)  2 ,7387 ( m3 / 0,25 ha ) 2

s( y )  Vˆ ( y )  2,7387  1,6549 (m / 0,25 ha)


3

287
Vˆ ( y )  4 2  2,738717  43,8195 ( m3 / ha ) 2
V (y) V ( y)
Vˆ ( y )  (1  f 1 ) 1  f1 (1  f 2 ) 2
n mn
54 ,975763 183,3604
Vˆ ( y )  (1  0,02 )  0 ,02 (1  0 ,0204 )
20 4  20
Amostragem em inventário florestal Waldenei Travassos de Queiroz
Vˆ ( y)  2 ,7387 ( m3 / 0,25 ha ) 2

s( y )  Vˆ ( y )  2,7387  1,6549 (m / 0,25 ha)


3

Vˆ ( y )  4 2  2,738717  43,8195 ( m3 / ha ) 2

b) limite de erro considerando a população finita


t  s (y ) 2,0003  1,6549
LE  100  100  6,25 %
y 52,97

c) intensidade de amostragem de população finita


t 2Vˆ1 ( y)
n 2
t ˆ Vˆ ( y) Vˆ2 ( y )
E  [V1 ( y)  2
2
 ]
N m M
2,00032  54,9758
n
2,00032 183,3604 183,3604
(0 ,05  52,97 )2  (54 ,9758   )
1000 4 196
219 ,9691759
n  31,17985518
7,054849185

Usando a fórmula expressa em função dos componentes


de variância:
Vˆ ( y)
t 2 [Vˆe ( y)  d ]
n m
t2 Vˆ ( y )
E 2  [Vˆe ( y)  d ]
N M
183,3604
2,0003 2 [ 9,1357  ]
n 4  31,17985518
2 2,0003 2 183,3604 )
(0,05  52,97 )  [ 9,1357  ]
1000 196
Os demais cálculos são obtidos como mostrado no item
anterior (intervalo de confiança, dimensionamento, etc.)

288
Amostragem por conglomerado

3) Considerando o conglomerado como unidade de ob-


servação. Obter a média e a variância da média a partir da
aplicação da metodologia da amostra simples ao acaso

a) valor médio estimado por conglomerado


n

y i.
4237,51
i 1
y   211,8755 m3 / ha
n 20
yi. = valor total das subparcelas do i-ésimo conglomerado

b) variância da média por conglomerado


n

n
(  y i. ) 2
 yi2.  i1
n
Vˆ ( yi .)  i 1
 879,612205 (m3 / ha )2
n 1
N  n Vˆ( y i. ) 1 .000  20 879 ,612205
Vˆ ( y )  ( ) ( )  43,1010 (m3 / ha ) 2
N n 1.000 20

4) Comparação dos resultados considerando a variân-


cia da média para os três procedimentos de análise:

Tabela 9.12 - Variância da média por conglomerados em dois estágios.

Estimadores Variância da média (m3/ ha)2


Vries (1986) e Cochran (1977): População Finita 43,8195
Péllico Netto e Brena (1997): População Infinita 43,9805
Metodologia: Amostra simples ao acaso 43,1010

Os resultados da Tabela 9.12 mostram que as estimativas


da variância da média foram praticamente idênticas, demons-
trando, neste exemplo, que os resultados independem da me-
todologia usada. No entanto, ressalta-se que se trata de uma

289
Amostragem em inventário florestal Waldenei Travassos de Queiroz

população infinita com um coeficiente de correlação intraconglo-


merado (0,047459143) próximo de zero.

Exercício 9.6

Este exemplo objetiva mostrar a aplicação das fórmulas


para obtenção do coeficiente de correlação intraglomerado, as-
sim como algumas maneiras de obter os componentes de vari-
ância, visando facilitar a interpretação desses parâmetros. A Ta-
bela 9.13 apresenta os dados. Obter o coeficiente de correlação
intraconglomerado usando as seguintes expressões:

a)

b)

c)

d)

e)

290
Amostragem por conglomerado

Tabela 9.13 - Dados considerando cinco conglomerados (C).

C S1 S2 S3 S4 Total Médias Variâncias


C1 43,75 42,50 32,75 57,10 176,10 44,025 100,160833
C2 62,75 47,25 34,50 66,01 210,51 52,6275 213,026692
C3 77,65 73,50 69,25 39,50 259,90 64,975 300,194167
C4 57,20 67,50 37,50 38,02 200,22 50,055 219,282767
C5 51,10 43,50 58,25 58,25 211,10 52,775 49,594167

Tabela 9.14 - Cálculos: coeficiente de correlação intraconglomerado.

NPC yij y yik (yij – y )(yik – y )


1 43,75 52,8915 42,50 94,99389725
2 43,75 52,8915 32,75 184,12352225
3 43,75 52,8915 57,10 -38,47200275
4 42,50 52,8915 32,75 209,30039725
5 42,50 52,8915 57,10 -43,73262775
6 32,75 52,8915 57,10 -84,76550275
7 62,75 52,8915 47,25 -55,61672775
8 62,75 52,8915 34,50 -181,31260275
9 62,75 52,8915 66,01 129,32873225
10 47,25 52,8915 34,50 103,75564725
11 47,25 52,8915 66,01 -74,00801775
12 34,50 52,8915 66,01 -241,26889275
13 77,65 52,8915 73,50 510,23554725
14 77,65 52,8915 69,25 405,01192225
15 77,65 52,8915 39,50 -331,55345275
16 73,50 52,8915 69,25 337,12414725
17 73,50 52,8915 39,50 -275,97872775
18 69,25 52,8915 39,50 -219,06485275
19 57,20 52,8915 67,50 62,94072225
20 57,20 52,8915 37,50 -66,31427775
21 57,20 52,8915 38,02 -64,07385775
22 67,50 52,8915 37,50 -224,84672775
23 67,50 52,8915 38,02 -217,25030775
24 37,50 52,8915 38,02 228,89469225
25 51,10 52,8915 43,50 16,82487225
26 51,10 52,8915 58,25 -9,59975275
27 51,10 52,8915 58,25 -9,59975275
28 43,50 52,8915 58,25 -50,32435275
29 43,50 52,8915 58,25 -50,32435275
30 58,250 52,8915 58,25 28,71352225
Total 73,14083250

291
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Da Tabela 9.14, tem-se:


n m

 ( y ij y )( y ik  y )  73,14083250
i 1 j k

Então:
n m
n m
2( y( y ij yy)()(yy ik  yy))
2
a)ˆˆ  i1 jk ij ik 22 73
73,14083250
,14083250
  i1 jk
(m  1)(nm  1)Vˆ ( y )  ( 4  1)(5  4  1)  188,3050029  0,001362866
,01362866
(m  1)(nm  1)Vˆ ( y ) ( 4  1)(5  4  1)  188,3050029
(n  1)m  QMˆ ˆ
ˆ ˆ Entre  (nm  1)Vˆ ( y )
b)b)b)ˆ  (n  1)m(nmQM Entre  ( nm  1)V ( y )
 1)( m  1)Vˆ ( y)
(nm  1)( m  1)Vˆ ( y)

Tabela 9.15 - Análise de variância para conglomerados.

C.Variação GL SQ QM
Entre cong 4 931,01918 232,754795
Dentro cong 15 2646,775875 176,451725
Total 19 3.577,795055 188,3050029

Da Tabela 9.15, tem-se:

(5 − 1) × 4 × 232,754795 − (5 × 4 − 1) × 188,3050029
dˆ = = 0,01362866
(5 × 4 − 1) × (4 − 1) × 188,3050029

QMˆ Entre − Vˆ ( y )
c) dˆ =
(m − 1)Vˆ ( y )

Da Tabela 9.15, tem-se:

QMˆ Entre = 232,754795

QMˆ Dentro = 176,451725

Vˆ ( y ) = QMˆ Total = 188,3050029

292
Amostragem por conglomerado

Então:

QMˆ Entre − Vˆ ( y ) 232,754795 − 188,3050029


dˆ = = = 0,078684034
(m − 1)Vˆ ( y ) (4 − 1) × 188,3050029
Vˆe ( y )
d) dˆ =
Vˆe ( y ) + Vˆd ( y )

Da Tabela 9.15, tem-se:


ˆ Entre  QMˆ Dentro 232,754795  176, 451725
QM
Vˆe ( y )    14,0757675
m 4

Vˆd ( y )  QMˆ Dentro  176 ,451725

Vˆ e ( y ) 14, 0757675
ˆ    0 ,073877881
Vˆe ( y )  Vˆ d ( y ) 14 , 0757675  176 , 451725

É importante mencionar que ao empregar no quesi-


to c a expressão ˆ  [QMˆ Entre  Vˆ ( y )] [( m  1)Vˆ ( y )] utilizou-
se o valor Vˆ ( y ) = Qˆ M Total , pois se fosse usada a fórmula
Vˆ ( y ) = Vˆe ( y ) + Vˆd ( y ) o resultado seria o mesmo da expressão
usada no quesito d.
As expressões dos quesitos a e b apresentaram os mes-
mos resultados, pois são semelhantes. As expressões dos que-
sitos c e d apresentaram valores aproximadamente cinco vezes
maiores que os resultados das expressões dos itens a e b, de-
monstrando que aquelas (c e d) só são recomendadas para
inventários com áreas extensas e com grande intensidade de
amostragem.
Para uma visão mais interpretativa dos componentes de
variância Vˆe ( y ) e Vˆd ( y ) , seja o seguinte procedimento para ob-
tê-los:

293
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Vˆd ( y ) é a média das variâncias dentro dos conglomerados

Confirmação: Vˆd ( y ) = QMˆ Dentro = 176,451725

Da Tabela 9.13, tem-se:


5

∑y
i =1
i = 264,4575

y
i 1
i
2
 14.220 ,30866

Então:

Seja a variância da média dentro do i-ésimo conglomerado:


Vˆ ( y )
Vˆ ( y i ) = i
m
Então:
n

∑ Vˆ ( y ) i
1 n Vˆi ( y ) 1 Vˆ1 ( y ) Vˆ2 ( y ) Vˆ3 ( y ) Vˆ4 ( y ) Vˆ5 ( y )
i =1

n
= ∑
n i =1 m
= [
5 4
+
4
+
4
+
4
+
4
]

294
Amostragem por conglomerado

 Vˆ ( y i ) 1 882,258626
i 1
 ( )  44,1129313
n 5 4
Seja então:
n

Vˆ ( y i )
Vˆe ( y)  Vˆ ( y )  i 1
 58,18869968  44 ,1129313  14 ,075768
n
Confirmando que:
n

 Vˆ ( y i )
QMˆ Entre  QMˆ Dentro 232 ,754795  176, 451725
Vˆe ( y )  Vˆ ( y )  i 1
   14,075768
n m 4

Conclui-se que o componente de variância entre Vˆe ( y ) é a


diferença entre a variância da média das médias Vˆ ( y ) e a média
das variâncias das médias dentro de cada conglomerado Vˆ ( yi ). ).

9.5 Amostragem por conglomerados em dois es-


tágios com grandezas desiguais

Dada uma amostragem por conglomerados em dois está-


gios, onde cada unidade primária seja constituída por Mi uni-
dades secundárias ou subparcelas, tal que cada conglomerado
possua mi subparcelas.

9.5.1 Valores populacionais e estimadores

a) valor médio estimado

Seja yi = yi. mi o valor médio estimado por subparcela,


onde y i . é o total considerando as mi subparcelas enumeradas
no i-ésimo conglomerado.
Para estimar o valor médio populacional por subparcela Y
existem, como no caso do conglomerado em estágio único, três
295
Amostragem em inventário florestal Waldenei Travassos de Queiroz

procedimentos que resultam nas seguintes estimativas das mé-


dias: n

∑ yi
a1) y1 =
i =1
n
n

∑M i yi
a 2) y R = i =1
n

∑M i =1
i

∑M i yi
a3) y3 = i =1

nM N
b) variância da média por razão

Considerando que a estimativa é por razão ( y R ), tem-se:


n n n

∑ M i yi ∑ M i ( yi − Y ) ∑ M (y −Y )
i i
V ( yR ) = E ( i =1
n
− Y ) = E(
2 i =1
n
) ≅ E ( i =1
2
)2
nM N
∑Mi =1
i ∑M
I =1
i

Sendo:
N

∑M
i =1
i
MN =
N

Da teoria da estimativa por razão, segundo Cochran (1977),


considerando uma amostra por conglomerados em dois está-
gios, tem-se que a estimativa da variância para y R é:

296
Amostragem por conglomerado

Dado: mi

mi (∑ yij ) 2

mi
∑y 2
ij − i =1

mi
n
; Vˆ2i ( y ) =
j =1
f1 = ; f 2i =
N M i mi − 1

Vˆ2i ( y ) é a variância das subparcelas dentro do i-ésimo


conglomerado.

Exercício 9.7

Seja um inventário florestal com 20 conglomerados (C) em


dois estágios. A estrutura espacial do conglomerado apresenta
uma forma cruz de malta, composta por subparcelas retangula-
res de 10 m de largura por 250 m de comprimento. A distância
de cada subparcela ao ponto central foi de 100 m. Considerar
que algumas subparcelas não foram medidas e que também
houve variação no tamanho da unidade primária (variação do
grid/grandezas desiguais). Os dados para a variável resposta
definida como o volume total de madeira considerando todas as
espécies com DAP 45 cm estão apresentados na Tabela 9.16.
A Tabela 9.17 mostra os cálculos auxiliares usados para obter as
estimativas.

297
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Tabela 9.16 - Conglomerados em dois estágios ( m3/ 0,25 ha) com grandezas
desiguais.

C Mi mi S1 S2 S3 S4
1 196 4 43,75 42,50 32,75 57,10
2 200 3 62,75 **** 34,50 66,01
3 196 4 77,65 73,50 69,25 39,50
4 200 4 57,20 67,50 37,50 38,02
5 200 4 51,10 43,50 58,25 58,25
6 210 4 68,00 75,50 37,28 64,33
7 196 4 45,76 34,80 57,30 63,17
8 196 4 60,10 78,70 58,33 37,27
9 196 4 63,75 79,90 75,13 42,23
10 230 2 49,88 55,17 ***** *****
11 196 4 88,17 67,30 65,28 37,13
12 210 4 27,18 34,89 64,30 58,17
13 196 2 37,80 ***** **** 58,89
14 196 4 55,71 58,29 43,16 37,12
15 196 4 45,11 43,12 55,83 54,17
16 196 4 35,35 63,23 70,90 85,14
17 140 2 ***** ***** 61,37 55,33
18 196 4 38,75 45,17 40,44 39,89
19 196 4 49,10 55,13 63,17 37,14
20 180 3 50,10 52,70 37,37 *****
1055,36 1105,29 1046,63 1030,23

298
Amostragem por conglomerado

Tabela 9.17 - Cálculos auxiliares: conglomerados (C) em dois estágios com


grandezas desiguais.

C Mi mi yi . yi Vˆ2i ( y ) M i yi M i2 yi f 2 i = mi M i
1 196 4 176,10 44,0250 100,161 8628,9 1691264 0,020408
2 200 3 163,26 54,4200 300,262 10884,0 2176800 0,015000
3 196 4 259,90 64,9750 300,194 12735,1 2496080 0,020408
4 200 4 200,22 50,0550 219,283 10011,0 2002200 0,020000
5 200 4 211,10 52,7750 49,594 10555,0 2111000 0,020000
6 210 4 245,11 61,2775 277,556 12868,3 2702338 0,019048
7 196 4 201,03 50,2575 158,497 9850,5 1930692 0,020408
8 196 4 234,40 58,6000 287,101 11485,6 2251178 0,020408
9 196 4 261,01 65,2525 281,469 12789,5 2506740 0,020408
10 230 2 105,05 52,5250 13,992 12080,8 2778573 0,008696
11 196 4 257,88 64,4700 439,277 12636,1 2476680 0,020408
12 210 4 184,54 46,1350 320,184 9688,4 2034554 0,019048
13 196 2 96,69 48,3450 222, 394 9475,6 1857222 0,010204
14 196 4 194,28 48,5700 101,943 9519,7 1865865 0,020408
15 196 4 198,23 49,5575 40,614 9713,3 1903801 0,020408
16 196 4 254,62 63,6550 438,483 12476,4 2445370 0,020408
17 140 2 116,70 58,3500 18,241 8169,0 1143660 0,014286
18 196 4 164,25 41,0625 7,994 8048,3 1577457 0,020408
19 196 4 204,54 51,1350 120,268 10022,5 1964402 0,020408
20 180 3 140,17 46,7233 67,304 8410,2 1513835 0,016667
Total 3922 3869,08 210.048

De acordo com os resultados contidos na Tabela 9.17, tem-se:

299
Amostragem em inventário florestal Waldenei Travassos de Queiroz

a) valor médio estimado por razão


n

M
i 1
i yi
210.048
yR  n
  53,5563 (m3 / 0,25 ha )
3.922
M
i 1
i

b) variância do valor médio estimado por razão

Utilizou-se M n devido ao desconhecimento de M N . A partir


da variância da média Vˆ ( y R ) , os cálculos do intervalo de con-
fiança e do limite de erro seguem a metodologia já vista ante-
riormente.

9.6 Conglomerados em dois estágios: análise es-


tatística considerando a ocorrência de tipolo-
gias diferentes na subparcela

Seja uma amostra por conglomerado em dois estágios,


onde cada conglomerado é constituído por m subparcelas, nas
quais foram registradas a ocorrência de uma determinada tipolo-
gia. A ocorrência pode acontecer completamente na parcela ou
em parte da mesma.

300
Amostragem por conglomerado

9.6.1 Valores populacionais e estimadores

Para estimar o valor médio populacional por subparcela Y , o


procedimento mais vantajoso é a estimativa por razão. A estimati-
va por razão tem uma pequena tendência, mas torna-se despre-
zível quando o número de conglomerados é grande (n ≥ 30).30 )

a) valor médio estimado por razão

Seja Ai a área de ocorrência dentro do i-ésimo conglomera-


do da tipologia de interesse. Pode-se escrever a estimativa por
razão do volume
n
médio por subparcela:

i =1
Ai y i
yR = n
∑ Ai
i =1

Ai = área do i-ésimo conglomerado correspondente à ocor-


rência da variável resposta da tipologia considerada;
y ij = valor da variável resposta da tipologia de interesse
correspondente a j-ésima subparcela do i-ésimo conglomerado;
y
yi = i. é o valor médio estimado do i-ésimo conglomerado;
m
y i. = valor total referente ao i-ésimo conglomerado.

b) variância estimada do valor médio por razão

Da teoria da estimativa por razão, considerando-se uma


amostra por conglomerados em dois estágios, tem-se que a es-
timativa da variância de y R é:

301
Amostragem em inventário florestal Waldenei Travassos de Queiroz

n n n

∑A y i i ∑ A (y i i −Y ) ∑ A (y i i −Y )
V ( y R ) = E ( i =1n − Y ) 2 = E ( i =1 n
) 2 ≅ E ( i =1 )2
nAN
∑A
i =1
i ∑A
I =1
i

∑A
N

∑A i
i
Utilizou-se AN = i =1 no lugar de An = i =1
.
N n
De acordo com Cochran (1977), desenvolvendo tem-se:
n n n
2
( A y ) i i
 2 yR  Ai2 yi  y R2  Ai2
1 N  n i 1 f1 n
Ai2 (1  f 2i ) ˆ
Vˆ ( y R )  2 ( ) i 1 i 1
  V2 i ( y)
AN nN n 1 n 2 AN2 i 1 mi
mi

mi mi ( yij ) 2

n mi  yij y 2
ij 
mi
i 1

f1  ; f 2 i  ; yi  i 1
; Vˆ2i ( y )  j 1

N Mi mi mi  1

Vˆ2i ( y ) é a variância da ocorrência tipológica das subpar-


celas dentro do i-ésimo conglomerado.
No caso de ocorrer:
f 2i = f 2 ; m1 = m2 = L = mn:

Então:
n n n

1 N n  (A y ) i i
2
 2 y R  Ai2 yi  yR2  Ai2
f 1 (1  f 2 ) n 2 ˆ
Vˆ ( yR )  2 ( ) i 1 i 1 i 1
  Ai V 2i ( y)
AN nN n1 n 2 AN2 m i  1

Exercício 9.8

Seja um inventário florestal em dois estágios com 20 con-


glomerados mensurados. A estrutura espacial do conglomera-
do apresenta uma forma cruz de malta, composta por quatro

302
Amostragem por conglomerado

subparcelas retangulares de 10 m de largura por 250 m de com-


primento. A distância de cada subunidade ao ponto central foi
de 100 m. Os dados para a variável volume de madeira corres-
pondente à tipologia de interesse estão apresentados na Tabe-
la 9.18. Os cálculos auxiliares para obter as estimativas estão
apresentados na Tabela 9.19.
Ai = variável auxiliar que corresponde à área de ocorrência
da tipologia de interesse no conglomerado de 1 ha;
yi = valor médio da variável resposta da tipologia ocorren-
te de interesse por subparcela (m3 / 0,25 ha) do i-ésimo conglo-
merado;
Vˆ2i ( y ) é a variância entre as subparcelas do i-ésimo con-
glomerado.

Tabela 9.18 - Conglomerados (C) em dois estágios por tipologia florestal.

C S1 S2 S3 S4 TOTAL Ai (ha)
1 43,7500 42,5000 32,7500 57,1000 176,100 1,00000
2 53,9200 33,0750 24,1500 46,2070 157,352 0,74748
3 62,1200 58,8000 55,4000 31,6000 207,920 0,80000
4 58,6200 57,3750 31,8750 32,3170 180,187 0,89995
5 51,1000 43,5000 58,2500 68,2500 221,100 1,00000
6 68,0000 75,5000 37,2800 64,3300 245,110 1,00000
7 32,0320 24,3600 40,1100 54,2100 150,712 0,74970
8 60,1000 78,7000 58,3300 37,2700 234,400 1,00000
9 63,7500 79,9000 75,1300 42,2300 261,010 1,00000
10 42,3980 46,8945 30,0645 57,6000 176,957 0,95829
11 88,1700 67,3000 65,2800 37,1300 257,880 1,00000
12 24,4620 31,4010 57,8700 52,3530 166,086 0,90000
13 58,9000 24,1200 24,5750 29,4450 137,040 0,70610
14 62,9200 55,3755 41,0020 35,2640 194,562 1,00000
15 60,5900 38,8080 50,2470 38,7500 188,395 0,95039
16 35,3500 63,2300 70,9000 85,1400 254,620 1,00000
17 36,1125 29,1750 46,0275 51,4900 162,805 0,79904
18 38,7500 45,1700 40,4400 39,8900 164,250 1,00000
19 23,2000 48,5144 55,5896 32,6832 159,987 0,78218
20 59,0700 36,8900 26,1590 39,9910 162,110 0,82164

303
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Tabela 9.19 - Cálculos auxiliares: conglomerados (C) em dois estágios por


tipologia.

C Ai yi Vˆ2i ( y ) Ai y i ( Ai yi ) 2 Ai2 y i Ai2 Ai2Vˆ2i ( y )


1 1,00000 44,0250 100,161 44,0250 1938,20 44,0250 1,00000 100,161
2 0,74748 39,3380 176,573 29,4044 864,62 21,9792 0,55873 98,656
3 0,80000 51,9800 192,124 41,5840 1729,23 33,2672 0,64000 122,960
4 0,89995 45,0468 223,920 40,5396 1643,46 36,4834 0,80990 181,353
5 1,00000 55,2750 111,094 55,2750 3055,33 55,2750 1,00000 111,094
6 1,00000 61,2775 277,556 61,2775 3754,93 61,2775 1,00000 277,556
7 0,74970 37,6780 162,823 28,2472 797,90 21,1769 0,56205 91,5140
8 1,00000 58,6000 287,101 58,6000 3433,96 58,6000 1,00000 287,101
9 1,00000 65,2525 281,469 65,2525 4257,89 65,2525 1,00000 281,469
10 0,95829 44,2393 129,958 42,3938 1797,24 40,6254 0,91831 119,342
11 1,00000 64,4700 439,277 64,4700 4156,38 64,4700 1,00000 439,277
12 0,90000 41,5215 259,349 37,3694 1396,47 33,6324 0,81000 210,072
13 0,70610 34,2600 275,644 24,1910 585,20 17,0813 0,49858 137,430
14 1,00000 48,6404 162,181 48,6404 2365,89 48,6404 1,00000 162,181
15 0,95039 47,0988 110,121 44,7620 2003,64 42,5412 0,90323 99,465
16 1,00000 63,6550 438,483 63,6550 4051,96 63,6550 1,00000 438,483
17 0,79904 40,7013 99,5590 32,5220 1057,68 25,9865 0,63847 63,565
18 1,00000 41,0625 7,9940 41,0625 1686,13 41,0625 1,00000 7,994
19 0,78218 39,9968 217,102 31,2847 978,73 24,4703 0,61181 132,824
20 0,82164 40,5275 187,932 33,2991 1108,83 27,3599 0,67510 126,872
Total 18,1148 887,860 42.664 826,860 16,6262 3489,4

a) valor médio por razão estimado


n

Ay
i 1
i i
887,86
yR  n
  4 9, 0130 m 3 / 0, 25ha
18,1148
A
i 1
i

b) variância da média por razão estimada

Dado que:
n n n

1 N n
 (A y )
i i
2
 2 y R  Ai 2 yi  yR2  Ai2
f1 n
Ai2 (1  f 2 i ) ˆ
Vˆ ( yR )  2 ( ) i 1 i 1 i 1
  V 2i ( y )
A N nN n 1 n AN2
2
i 1 mi

304
Amostragem por conglomerado

Como f 2i = f 2 e m1 = m2 = L = mn:
n 20 m m 4 4
f1   ; f 2i  i  f 2   ; f2i  f2 
N 1000 Mi M 196 196

Então: n n n

1 N n  (A y ) i i
2
 2 y R  Ai2 yi  y R2  Ai2
f 1 (1  f 2 ) n 2 ˆ
Vˆ ( yR )  2 ( ) i 1 i 1 i 1
  Ai V2i ( y )
AN nN n1 n 2 AN2 m i 1

Portanto:
2
1 1 000  2 0 42. 664,0  2  49,01 3  8 26,86  49, 013  1 6,626 2
Vˆ ( y R )  ( )( )
0,9 0572 20  1000 19
20 4
(1  )
1000
 2 196  348 9,4
2
20  0,9 057  4

Vˆ ( y R )  0,05 973 479  81, 626 969 93  0,0 5208 794 1 4,9 2805 784 8(m 3 / 0, 25 ha) 2

∑A i
Utilizou-se An = i =1
devido ao desconhecimento de AN .
n
Os cálculos para obtenção dos intervalos de confiança e
dimensionamento da amostra seguem a metodogia já vista an-
teriormente.

9.7 Amostragem por conglomerados em dois es-


tágios: análise estatística considerando a ocor-
rência de uma variável auxiliar

Seja uma amostra por conglomerado em dois estágios,


com cada conglomerado constituído por m subparcelas onde em
cada subparcela foi registrado o valor da variável de interesse y
e medido também a variável auxiliar (x) que geralmente é corre-
lacionada com y.

305
Amostragem em inventário florestal Waldenei Travassos de Queiroz

9.7.1 Valores populacionais e estimadores

Seja yij a variável de interesse correspondente à j-ésima


subparcela do i-ésimo conglomerado e xij a variável auxiliar (co-
variável). Da teoria da estimativa por razão, como visto ante-
riormente, pode-se escrever o valor médio e sua variância por
subparcela, respectivamente:

a) estimativa da razão
n m

∑∑ y ij

Rˆ =
i =1 j =1
n m

∑∑ x
i =1 j =1
ij

b) valor médio estimado por razão


y R = Rˆ × X

c) variância estimada do valor médio por razão


n n n

1 Nn
 y 2i.  2 Rˆ  xi . yi .  Rˆ 2  x i2. f1 n
xi2. (1  f 2 i ) ˆ
Vˆ ( yR )  2 ( )( i 1 i1 i 1
) 2 2  V 2 i ( y)
X N nN n1 n X N i 1 mi

y i. = valor total da variável de interesse referente ao i-ési-


mo conglomerado;
x i. = valor total da variável auxiliar referente ao i-ésimo
conglomerado.
Em uma amostra por conglomerados em dois estágios,
quando m1 = m 2 = L = m n e f 2i = f 2 , tem-se que a estimativa da
variância de y R é:

306
Amostragem por conglomerado

n n n

y 2
i.  2 Rˆ  x i. y i.  Rˆ 2  xi2.
1 N  n i 1 f 1 (1  f 2 ) n 2 ˆ
Vˆ ( y R )  2 ( )( i 1 i 1
)  xi .V2i ( y )
X N nN n 1 n 2 mX N2 i1

Dado que: m

m
(∑ y ij ) 2

n m
∑y 2
ij − i =1

m
f1 = ; f 2 = ; Vˆ2i ( y ) = j =1

N M m −1
Vˆ2i ( y ) é a variância da variável de interesse das subparce-
las dentro do i-ésimo conglomerado.

Os cálculos para obtenção dos intervalos de confiança e


dimensionamento da amostra seguem a metodogia já vista an-
teriormente.

Exercício 9.9

Seja um censo realizado pela Empresa Florestal CIKEL de


uma área de 1.392 ha de Floresta Ombrófila Densa consideran-
do todas as árvores com DAP ≥ 30 cm, localizada no município
de Portel, estado do Pará. Os dados foram georeferenciados.
Desta população foram selecionados aleatoriamente 30 conglo-
merados com formato cruzado e cada um foi constituído de 8
subparcelas retangulares de 20 m de largura por 50 m de com-
primento (0,10 ha) ( ver a forma d de conglomerado no item
9.10). A estrutura espacial de cada conglomerado abrange uma
de área de 16 ha (unidade primária). A Tabela 9.20 mostra os
dados observados para o volume de madeira (y) e número de ár-
vores (x) por parcela. A Tabela 9.21 mostra os cálculos auxiliares
para obter as estimativas.

307
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Sejam os valores populacionais obtidos no censo:


O valor médio populacional do volume de madeira consideran-
do todas as árvores com DAP ≥ 30 cm é igual a Y = 57,6968 m3/ha e
a variância igual a V ( y ) = 1189,6930 ((m
m 33/ha)
/ ha 2).2 .
O valor médio populacional do número de árvores consi-
derando todas as árvores com DAP ≥ 30 cm é igual a X N =
20,59571 árvores / ha.
Usando t = 2,00. Calcular:

1) Variância da média a partir da subparcela sem conside-


rar a variável auxiliar Vˆ1 ( y ) .

2) Variância da média concernente à subparcela conside-


rando a estimativa por razão Vˆ2 ( y R ) .

3) Variância da média considerando o conglomerado como


unidade de observação (metodologia da amostra simples ao
acaso) Vˆ3 ( y ) .

4) Variância da média por razão considerando o conglo-


merado como unidade de observação (metodologia da mostra
simples por razão) V4 ( y R ) .

5) Discutir a eficiência dos procedimentos.

308
Amostragem por conglomerado

Tabela 9.20 - Dados observados no inventário florestal.

C S VT x C S VT x C S VT x C S VT x C S VT x C S VT x
1 1 6,054 1 6 1 9,696 1 11 1 0,000 0 16 1 10,193 6 21 1 0,000 0 26 1 1,958 1
1 2 3,622 2 6 2 0,000 0 11 2 0,000 0 16 2 23,242 6 21 2 0,000 0 26 2 4,857 2
1 3 6,037 2 6 3 1,251 1 11 3 7,835 2 16 3 3,468 2 21 3 0,000 0 26 3 17,002 3
1 4 7,297 4 6 4 1,047 1 11 4 10,236 4 16 4 1,280 1 21 4 0,000 0 26 4 2,423 1
1 5 5,671 3 6 5 1,844 1 11 5 1,064 1 16 5 9,039 4 21 5 1,850 1 26 5 0,000 0
1 6 21,827 8 6 6 0,000 0 11 6 9,725 3 16 6 5,893 3 21 6 0,000 0 26 6 0,000 0
1 7 4,503 3 6 7 1,425 1 11 7 6,152 1 16 7 13,539 6 21 7 0,000 0 26 7 2,136 1
1 8 8,712 3 6 8 0,000 0 11 8 0,000 0 16 8 2,683 2 21 8 0,000 0 26 8 2,813 2
2 1 11,744 2 7 1 21,803 5 12 1 4,007 2 17 1 10,226 4 22 1 5,176 3 27 1 11,481 5
2 2 13,607 5 7 2 4,304 2 12 2 0,000 0 17 2 0,000 0 22 2 0,000 0 27 2 4,064 2
2 3 11,768 4 7 3 0,000 0 12 3 12,233 4 17 3 11,902 6 22 3 0,000 0 27 3 11,862 4
2 4 0,776 1 7 4 3,995 2 12 4 1,534 1 17 4 0,000 0 22 4 0,000 0 27 4 7,130 3
2 5 13,153 5 7 5 2,263 1 12 5 3,887 1 17 5 20,868 6 22 5 0,000 0 27 5 6,004 2
2 6 2,423 1 7 6 3,799 2 12 6 14,262 3 17 6 2,470 2 22 6 0,000 0 27 6 8,876 4
2 7 4,051 2 7 7 0,000 0 12 7 3,637 2 17 7 3,010 2 22 7 7,778 3 27 7 13,413 6
2 8 0,000 0 7 8 13,284 3 12 8 6,142 3 17 8 2,689 2 22 8 13,118 3 27 8 0,000 0
3 1 1,706 1 8 1 5,718 3 13 1 0,000 0 18 1 1,234 1 23 1 15,844 5 28 1 12,175 5
3 2 0,000 0 8 2 4,566 3 13 2 0,000 0 18 2 4,982 3 23 2 8,277 4 28 2 37,932 4
3 3 0,000 0 8 3 6,427 3 13 3 0,000 0 18 3 4,964 2 23 3 2,878 2 28 3 3,045 1
3 4 3,190 1 8 4 0,000 0 13 4 0,000 0 18 4 0,000 0 23 4 2,265 2 28 4 0,000 0
3 5 2,290 2 8 5 5,974 5 13 5 0,000 0 18 5 13,317 3 23 5 7,575 3 28 5 6,828 3
3 6 3,178 1 8 6 7,603 5 13 6 0,000 0 18 6 4,763 3 23 6 4,320 1 28 6 2,244 1
3 7 0,000 0 8 7 1,759 2 13 7 2,030 1 18 7 0,000 0 23 7 1,689 1 28 7 5,942 3
3 8 5,120 2 8 8 0,000 0 13 8 0,000 0 18 8 1,037 1 23 8 5,735 2 28 8 8,929 3
4 1 13,136 2 9 1 15,739 4 14 1 0,000 0 19 1 8,788 3 24 1 0,000 0 29 1 7,143 3
4 2 11,752 5 9 2 1,224 1 14 2 0,000 0 19 2 8,346 4 24 2 0,000 0 29 2 3,898 2
4 3 0,000 0 9 3 10,721 3 14 3 0,000 0 19 3 1,715 1 24 3 8,206 2 29 3 1,320 1
4 4 7,206 2 9 4 8,803 3 14 4 1,601 1 19 4 0,000 0 24 4 6,258 2 29 4 7,600 3
4 5 7,791 3 9 5 10,691 3 14 5 0,000 0 19 5 0,000 0 24 5 4,497 2 29 5 4,647 2
4 6 0,000 0 9 6 7,896 5 14 6 0,000 0 19 6 5,865 1 24 6 4,965 3 29 6 10,880 4
4 7 20,017 6 9 7 33,005 5 14 7 0,000 0 19 7 11,144 4 24 7 4,005 2 29 7 3,638 1
4 8 17,326 7 9 8 6,130 1 14 8 6,020 3 19 8 2,350 1 24 8 7,649 4 29 8 7,760 4
5 1 11,067 4 10 1 0,000 0 15 1 0,000 0 20 1 3,101 2 25 1 6,510 2 30 1 2,092 1
5 2 5,222 1 10 2 0,000 0 15 2 11,043 3 20 2 0,000 0 25 2 6,791 3 30 2 4,856 1
5 3 0,000 0 10 3 4,213 2 15 3 6,283 2 20 3 6,770 2 25 3 4,262 2 30 3 16,119 4
5 4 1,763 1 10 4 0,000 0 15 4 4,458 2 20 4 14,389 5 25 4 2,887 1 30 4 38,281 7
5 5 7,518 3 10 5 5,696 3 15 5 4,657 2 20 5 0,000 0 25 5 7,666 3 30 5 10,716 2
5 6 3,645 2 10 6 10,314 3 15 6 11,317 4 20 6 13,093 3 25 6 14,333 3 30 6 8,586 3
5 7 1,695 1 10 7 11,751 5 15 7 9,003 2 20 7 8,604 5 25 7 13,384 4 30 7 6,944 2
5 8 0,000 0 10 8 5,967 3 15 8 4,096 1 20 8 0,000 0 25 8 10,346 2 30 8 0,000 0

309
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Tabela 9.21 - Cálculos auxiliares: ocorrência de uma variável auxiliar.

C x i. yi. x i. y i. y i2. xi2. Vˆ2i ( y ) xi2Vˆ2i ( y )


1 26 63,720 1656,72 4060,24 676 33,810 22855,6
2 20 57,520 1150,40 3308,55 400 34,840 13936,0
3 7 15,484 108,39 239,75 49 3,525 172,7
4 25 77,230 1930,75 5964,47 625 54,090 33806,3
5 12 30,910 370,92 955,43 144 15,160 2183,0
6 5 15,260 76,30 232,87 25 10,430 260,8
7 15 49,450 741,75 2445,30 225 57,180 12865,5
8 21 32,050 673,05 1027,20 441 9,010 3973,4
9 25 94,210 2355,25 8875,52 625 90,830 56768,8
10 16 37,940 607,04 1439,44 256 21,470 5496,3
11 11 35,010 385,11 1225,70 121 20,930 2532,5
12 16 45,700 731,20 2088,49 256 25,210 6453,8
13 1 2,030 2,03 4,12 1 0,515 0,5
14 4 7,621 30,48 58,08 16 4,506 72,1
15 16 50,860 813,76 2586,74 256 15,080 3860,5
16 30 69,340 2080,20 4808,04 900 51,960 46764,0
17 22 51,170 1125,74 2618,37 484 53,840 26058,6
18 13 30,300 393,90 918,09 169 19,620 3315,8
19 14 38,210 534,94 1460,00 196 18,780 3680,9
20 17 45,960 781,32 2112,32 289 34,850 10071,7
21 1 1,850 1,85 3,42 1 0,428 0,4
22 9 26,070 234,63 679,64 81 24,910 2017,7
23 20 48,580 971,60 2360,02 400 21,390 8556,0
24 15 35,580 533,70 1265,94 225 9,670 2175,8
25 20 66,180 1323,60 4379,79 400 16,840 6736,0
26 10 31,190 311,90 972,82 100 30,460 3046,0
27 26 62,830 1633,58 3947,61 676 20,170 13634,9
28 20 77,100 1542,00 5944,41 400 145,730 58292,0
29 20 46,890 937,80 2198,67 400 9,190 3676,0
30 20 87,590 1751,80 7672,01 400 147,270 58908,0
Total 477 1333,84 25.792,0 75.853,0 9237,0 412.171,0

310
Amostragem por conglomerado

Sejam as seguintes informações preliminares:


16 ha 1392 ha n 30
M  160; N   87; m  8; f 1    0,3448;
0,10 ha 16 ha N 87

m 8
f2    0,05;
M 160
X N  20,59571 árvores/ ha ;

X N  16 ,476568 árvores / 0,8 ha ; X N  2,059571 árvores / 0 ,10 ha


n

n 
i 1
xi .
477

i 1
x i .  477; Xn 
n

30
 15,9 árvores / 0,8 ha;

n n
X n  19,875 árvores / ha; y
i 1
i.  1 .333,84; y 2
i.
 75.853,06;
i 1

n n n

x 2
i.  9237,0; x i. y i .  25 .792,0;  x Vˆ 2
i. 2i
( y)  412.171,0
i 1 i 1 i 1

Tabela 9.22 - Análise de variância da variável de intersse (y).

CV GL SQ QM
Entre 29 2068,594106 71,330831
Dentro 210 7011,720746 33,389146
Total 239 9080,314852 37,992949

De acordo com as informações da Tabela 9.22 da análise


de variância tem-se o valor do coeficiente de correlação intra-
conglomerado.

(n  1)m  QMˆ Entre  (nm  1)Vˆ ( y)


ˆ 
(nm  1)(m  1)Vˆ ( y)
(30  1)  8  71,330831  (30  8  1)  37 ,992949
ˆ   0,117498097
(8  30  1)  (8  1)  37 ,992949

311
Amostragem em inventário florestal Waldenei Travassos de Queiroz

1) Variância da média a partir da subparcela sem consi-


derar a variável auxiliar Vˆ1 ( y )

a) valor médio estimado por subparcela


n m


i 1 j1
y ij
1 .333,84
y   5,557666667 m 3 / 0,10 ha
nm 30  8
3
y  55,5767 m / ha

b) variância sem considerar a variável auxiliar Vˆ1 ( y )

Sabe-se que:
n

 ( yi  y) 2
Vˆ1 ( y)  i 1
 8,916353875 (m3 / 0,10 ha) 2
n 1
n m
  ( y ij  yi ) 2
i1 j1
Vˆ 2 ( y)   33,389146 (m 3 / 0 ,10 ha ) 2
n ( m  1)

É importante notar que (ver Tabela 9.22):


n

 (y  y) 2
i
QMˆ Entre 71,330831
Vˆ1 ( y)  i 1
   8,916353875 (m 3 / 0,10 ha )2
n 1 m 8
n m

 ( y ij
 yi ) 2
Vˆ2 ( y)   QMˆ D en tr o  33,389146 ( m 3 / 0,10 ha ) 2
i 1 j 1

n(m  1)
Logo:
Vˆ ( y ) Vˆ ( y )
Vˆ ( y )  (1  f 1 ) 1  f1 (1  f 2 ) 2
n mn
8,916353875 33,389146
Vˆ1 ( y )  (1  0,3448)  0,3448  (1  0 ,05)
30 8  30
Vˆ ( y )  0,240303788 (m / 0 ,10 ha )
1
3 2

s1 ( y )  Vˆ ( y )  0 ,240303788  0 ,490207902 m 3 / 0 ,10 ha

312
Amostragem por conglomerado

c) intervalo de confiança para o valor médio sem conside-


rar a variável auxiliar número de árvores

Limite inferior
IC : y  t  s1 ( y )  55,5767  2,00  4,9021  45,7725 m3 / ha

Limite superior

d) limite de erro a partir da subparcela desconsiderando a


variável auxiliar (LE1).
t  s1 ( y) 2,00  0,490207902
LE1  100   100  17,64%
y 5,55766667

2) Variância da média por meio da subparcela conside-


rando a estimativa por razão Vˆ2 ( y R )

a) estimativa da razão
n m

 y
i 1 j 1
ij
1. 333,84
Rˆ  n m
  2,7 96310
4 77
x
i 1 j 1
ij

b) estimativa do valor médio por razão


yR  RˆX N  2,796310  2,059571  5,75919898 m3/ 0,10 ha
yR  57,591990 m3 / ha

c) estimativa da variância do valor médio por razão

Dado que m1 = m 2 = L = m n e f 2i = f 2 , tem-se a estimativa


da variância de y R :

313
Amostragem em inventário florestal Waldenei Travassos de Queiroz

n n n

y 2
i.
 2 Rˆ  xi. y i.  Rˆ 2  xi2.
1 N n f 1 (1  f 2 ) n 2 ˆ
Vˆ ( y R )  2 ( )( i 1 i 1 i 1
)  xi.V2i ( y)
X N nN n 1 n 2 mX 2N i1

Usando os cálculos contidos na Tabela 9.21:


2
1 87  30 75. 853,06  2  2, 796310  25. 792,0  2, 796310  9237,0
Vˆ2 ( y R )  ( )
16,4765682 30  87 29

30 8
(1  )
 2 87 160  412. 171,0
30  8  16,4765682

Vˆ2 ( y R )  0,079717259 ( m 3 / 0,10 ha ) 2

s 2 ( y R )  0,079717259  0,282342449 m3 / 0,10 ha


Vˆ2 ( y R )  7,9717259 (m 3 / ha ) 2 ; s 2 ( y R )  m 3 / ha

d) intervalo de confiança para o valor médio a partir da


subparcela considerando a estimativa por razão

Limite inferior
IC : yR  t  s2 ( yR )  57,59199  2,00  2,8234  51,94519 m3 / ha

Limite superior
IC : yR  t  s 2 ( yR )  57,59199  2,00  2,8234  63,23879 m3 / ha

e) limite de erro para o valor médio por meio da subparcela


considerando a estimativa por razão (LE2)
t  s (yR ) 2, 00  0, 282342 449
LE2   10 0   1 00  9, 80 %
yR 5, 75919 898

Se considerado desconhecido o valor de X N e utilizando


Xn = X N , ter-se-á:

314
Amostragem por conglomerado


i 1
xi
477
Xn    15, 9
n 30
87  30 75. 853, 06  2  2, 796310  25. 792, 0  2,7963102  9237,0
1
Vˆ2 ( y R )  2 (
)
15, 9 30  87 29
30 8
(1  )
 872 160  412. 171, 0
30  8  15, 92
Vˆ 2 ( y R )  0, 085603518 ( m / 0 ,10 ha )
3 2

Vˆ 2 ( y R )  8, 5603518 ( m / ha )
3 2

s 2 ( y R )  Vˆ ( yR )  0,085603518  0,292580789 m / 0,10 ha


3

Seja o limite de erro para o valor médio por razão a partir


da subparcela usando X n = X N .

Sendo:

3) Variância da média considerando o conglomerado


como unidade de observação (metodologia da amostra sim-
ples ao acaso) Vˆ3 ( y )

a) estimativa do valor médio


n m

 y ij 1 .333 ,84
i 1 j1
y  44 ,4613 m 3 / 0,8 ha

n 30
y  55,5767 m3 / ha

315
Amostragem em inventário florestal Waldenei Travassos de Queiroz

b) variância do valor médio estimado

Sabe-se que:
n

n
( yi . ) 2 2
yi2.  i 1 1333,84

i 1 n
75 .853 
30
V ( y i. )    570,6447 (m 3 / 0,8 ha ) 2
n 1 29
V ( y i. )  891,6323 (m 3 / ha )2

Então:
N  n Vˆ ( yi. ) 87  30 570,6447
Vˆ 3 ( y )  ( ) ( )  12,46235552 (m 3 / 0 ,8 ha ) 2
N n 87 30
Vˆ3 ( y )  1 9, 4724305 ( m 3 / ha ) 2
3
s3 ( y)  3,5302 (m 3 / 0,8 ha) ; s3 ( y)  m / ha

c) intervalo de confiança para a média considerando o con-


glomerado como unidade de observação (metodologia da amos-
tra simples ao acaso)

Limite inferior
IC : y  t  s3 ( y )  55 , 5767  2, 00  4, 4128  46 , 7511 m 3 / ha

Limite superior
IC : y  t  s3 ( y )  55 , 5767  2 ,00  4 ,4128  64 , 4023 m 3/ ha

d) intervalo de confiança para a variância


(n  1)Vˆ ( y ) (n  1)Vˆ ( y )
P[ 2
 V ( y )  2
]  0 ,95
 Sup  Inf
( 30  1)891,6323 (30  1)891, 6323
P[  V ( y)  ]  0, 95
 02, 025  02, 975

316
Amostragem por conglomerado

Sendo:
2
 29 ; 0, 975  16, 0
 292 ; 0 , 025  45 ,7
( 30  1)891,6323 ( 30  1)891,6323
P[  V(y)  ]  0,95
45,7 16 ,0
P [565 ,8061 (m 3 / ha )  V ( y)  1.616 ,0835 (m 3 / ha )2 ]  0 ,95

Conforme informado no presente exercício, a variância po-


(m33 //haha)
pulacional é V ( y ) = 1189,6930 (m ) 2 .2. Verifica-se que este valor
está contido no intervalo de confiança.

e) limite de erro para o valor médio estimado considerando


o conglomerado como unidade de observação. Metodologia da
amostra simples ao acaso ( LE3).
t  s ( y) 2,00  3,5302
LE3   100  100  15,88 %
y 44,4613

4) Variância da média por razão considerando o con-


glomerado como unidade de observação. Metodologia da
amostra simples por razão ( V4 ( y R ) )

a) estimativa do valor médio por razão


yR  RˆX n  2 ,796310 16,476568  46,07359186 m3/ 0,8 ha
yR  57 ,59198983 m3 / ha

b) estimativa da variância da razão


n n n

y 2
i.  2Rˆ  xi . y i.  Rˆ 2  xi2.
1 N  n i 1
Vˆ (Rˆ )  2 ( )( i 1 i 1
)
X N nN n 1
1 87  30 75. 853  2  2,796310  25. 792  2, 796310 2  9.237
Vˆ4 ( Rˆ )  2 ( )( )
16, 476568 30  87 29
Vˆ 4 ( Rˆ )  0 ,0093329172 02

317
Amostragem em inventário florestal Waldenei Travassos de Queiroz

c) estimativa da variância do valor médio por razão


Vˆ 4 ( y R )  X N2  Vˆ (Rˆ )  16,476568 2  0 ,09332917202  2,533675098 (m 3 / 0,8 ha ) 2
s 4 ( yR )  2 ,533675098  1,59175221 m 3 / 0,8 ha
Vˆ4 ( yR )  3,958867341 (m 3/ ha ) 2 ; s 4 ( yR )  m 3/ ha

d) intervalo de confiança para o valor médio considerando


o conglomerado como unidade de observação. Metodologia da
amostra simples ao acaso por razão: V4 ( y R )

Limite inferior
IC : yR  t  s4 ( yR )  57,59199  2,00  1,9897  53,6124 m 3 / ha

Limite superior
IC : yR  t  s 4 ( yR )  57 ,59199  2 ,00  1,9897  561,5714 m3 / ha

e) limite de erro da média por razão considerando o conglo-


merado como unidade de observação. Metodologia da amostra
simples por razão (LE4)
t  s 4 ( y) 2,00  1,59175221
LE4   100  100  6,91 %
y 46,0735591

Se considerado desconhecido o valor de X N e utilizando


X n = X N , ter-se-á:
n

x
i 1
i
477
Xn    15,9
n 30
yR  RˆX n  2,796310 15,9  44,461329 m3/ 0,8 ha
n n n

 y i2.  2 Rˆ  x i. y i.  Rˆ 2  xi2.
1 N n
Vˆ ( Rˆ )  2 ( )( i 1 i 1 i 1
)
X n nN n 1
1 87  30 75. 853  2  2, 796310  25. 792  2,796310 2  9 .237
Vˆ4 ( Rˆ )  2 ( )( )
15, 9 30  87 29
Vˆ4 ( Rˆ )  0, 011425139

Vˆ4 ( yR )  X n2  Vˆ (Rˆ )  15,9 2  318


0,011425139  2,888389391 (m3 / 0 ,8 ha )2
Vˆ 4 ( y R )  4 ,513108423 (m 3 / ha ) 2
s4 ( yR )  2,888389391  1,699526225 m3 / 0,8 ha
R n
n n n

 y i2.  2 Rˆ  x i. y i.  Rˆ 2  xi2.
1 N n
Vˆ ( Rˆ )  2 ( )( i 1 i 1 i 1
)
X n nN n 1
1 87  30 75. 853  2  2, 796310  25. 792Amostragem por conglomerado
 2,796310 2
 9 .237
Vˆ4 ( Rˆ )  2 ( )( )
15, 9 30  87 29
Vˆ4 ( Rˆ )  0, 011425139

Vˆ4 ( yR )  X n2  Vˆ (Rˆ )  15,9 2  0,011425139  2,888389391 (m3 / 0 ,8 ha )2


Vˆ 4 ( y R )  4 ,513108423 (m 3 / ha ) 2
s4 ( yR )  2,888389391  1,699526225 m3 / 0,8 ha

Seja o limite de erro para o valor médio por razão conside-


rando o conglomerado como unidade de observação, mas usan-
do X n = X N . Metodologia da amostra simples ao acaso por razão.
t  s( y R ) 2, 00  1,6 995262 25
LE4   100   100  6,12 %
yR 55,5 76666

Tal que:
477
Xn   15,9 árvores / 0,8 ha
30
yR  Rˆ X n  2 ,796310  15 ,9  44,461329 m3 / 0,8 ha
yR  55,57666 m 3/ ha

5) Discutir a eficiência dos procedimentos

Tabela 9.23 - Resultados das estimativas.

Estimativas LE(%) Média (ha) Variância da média (ha)


1 ASA(subp) 17,64 55,5767 24,0303788
2 Razão (subp) 9,80 57,5920 7,9717259
3 ASA (cong) 15,88 55,5767 19,4724305
4 Razão (cong) 6,91 57,5920 3,958867341

A partir dos resultados apresentados na Tabela 9.23, sejam


as eficiências calculadas como o quociente entre os limites de
erro:

319
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Os resultados denotam que:

a) a estimativa da média por razão por meio da subparcela


é 80% mais eficiente que a análise a partir da subparcela sem
considerar a variável auxiliar, pois: EF12 = 1,8000;

b) a estimativa da média quando se considera o conglome-


rado como unidade de observação (metodologia da amostra sim-
ples ao acaso) é 11,08% mais eficiente que a análise a partir da
subparcela sem considerar a variável auxiliar, pois: EF13 = 1,1118;

c) a estimativa da média por razão quando se considera


o conglomerado como unidade de observação (metodologia da
amostra simples ao acaso) é 155,28% mais eficiente que a esti-
mativa da média a partir da subparcela sem considerar a variá-
vel auxiliar, pois: EF14 = 2,5528;

d) a estimativa da média por razão por meio da subparcela


é 62,04% mais eficiente que a estimativa da média quando se
considera o conglomerado como unidade de observação sem
considerar a variável auxiliar (metodologia da amostra simples),
pois: EF32 = 1,6204;

320
Amostragem por conglomerado

e) a estimativa da média por razão quando se considera


o conglomerado como unidade de observação (metodologia da
amostra simples por razão) é 41,82 % mais eficiente que a esti-
mativa por razão a partir da subparcela, pois: EF24 = 1,4182;

f) a estimativa da média por razão quando se considera


o conglomerado como unidade de observação (metodologia da
amostra simples por razão) é 129,81 % mais eficiente que a es-
timativa a partir do conglomerado como unidade de observação
sem considerar a variável auxiliar, pois: EF34 = 2,2981;

Considerando todos os procedimentos, verifica-se que a


análise por razão considerando o conglomerado como unida-
de de observação (metodologia da amostra simples por razão)
apresentou maior precisão.
A maior precisão das estimativas por razão pode ser expli-
cada pelo alto valor do coeficiente de correlação entre xi. e yi. ,
que é de 0,876463.
Pode ser verificado que o valor médio populacional
(57,6968 m3/ha) está dentro dos intervalos de confiança dos
quatro métodos utilizados. Observa-se (ver Tabela 9.23) que a
estimativa do valor médio por razão (57,5920) está mais próxima
do parâmetro populacional que a estimativa sem considerar a
variável auxiliar número de árvores (55,5767).
Como em alguns casos o valor médio da variável auxiliar é
desconhecido, então, se a amostra é grande pode-se usar a sua
estimativa ou proceder a uma dupla amostragem. Neste exercí-
cio, o limite de erro da média por razão apresentou o valor 10,53%
quando usada a média estimada X n  1,9875 árvores / 0 ,10 ha . Este
limite de erro é 7,44 % maior que o valor de 9,80 % que corres-
ponde ao uso de X N .

321
Amostragem em inventário florestal Waldenei Travassos de Queiroz

O limite de erro por razão considerando o conglomerado


como unidade de observação (metodologia da amostra simples
por razão) usando X n = 1515,9
,9 árvores/ha apresentou o valor de
6,12%. Este resultado corresponde a 88,57% do valor de 6,91%
que se refere ao uso de X N .
O valor do coeficiente de correlação intraconglomerado
ˆ
foi d = 0,117498097 que, sob H o : d = 0 , resultou não significativo
(t = 1,7146), recomendando o uso da amostragem por conglo-
merados.

9.8 Amostragem por conglomerados em dois es-


tágios pelas proporções

Seja um inventário florestal composto de n conglomerados


estruturados com m subparcelas, as quais podem ser classi-
ficadas em duas categorias, C1 e C0. Admitindo que qualquer
subparcela do conglomerado pertença a uma das duas catego-
rias, C1 e C0, onde C1 corresponde às subparcelas que possuem
o atributo desejado e C0 define os dados que não o possuem.
Seja a seguinte notação:
ai = número de subparcelas pertencente à categoria C1 no
conglomerado de ordem i;
N = número total de conglomerados da população;
n = número de conglomerados amostrado;
m = número de subparcelas por conglomerado;
p i = a i / m é proporção de subparcelas pertencentes à ca-
tegoria C1 no conglomerado de ordem i.

9.8.1 Valores populacionais e estimadores

a) valor estimado da proporção

322
Amostragem por conglomerado

Para quantificar os resultados, seja a seguinte regra para


qualquer subparcela yij da amostra ou da população:
yij = 1, se yij estiver contido em C1;
yij = 0, se yij estiver contido em C0;
Para a amostra de valores yij , resulta que:
m

∑y
j =1
ij = ai

Daí, para o conglomerado de ordem i , tem-se:


y i ai
pi = =
m m

pi é a proporção de subparcelas do conglomerado i , per-


tencente à categoria C1.

b) variância estimada da proporção

Considerando uma amostra aleatória de n conglomerados,


define-se como valor de p a média das observações obtidas de
pi na amostra, onde p é uma estimativa da proporção P popula-
cional. n

1 n
 ai
Dado que p i = a i / m , logo: p   p i  i 1
.
n i 1 nm

Então:
n

n
(∑ p i ) 2
∑p 2
i − I =1

n
Vˆ1 ( y ) = I =1

n −1

323
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Dado que:
n n
m∑ p i q i m∑ p i q i
Vˆ2i ( y ) = I =1 , sendo Vˆ ( y ) = I =1
2
(m − 1) n(m − 1)

Então:
1  f1 ˆ f (1  f 2 ) ˆ
Vˆ ( p)  ( )V1 ( y )  1 V2 ( y )
n nm

Os cálculos para obtenção dos intervalos de confiança e


dimensionamento da amostra seguem a metodogia já vista an-
teriormente.

Exercício 9.10

Seja uma área plantada com uma espécie florestal no es-


paçamento de 5 m x 5 m e constituída por 100 talhões de formato
quadrado de 1 ha, donde foi retirada uma amostra de 10 talhões
e verificado em cada um deles, por meio de um conglomerado
composto por 40 árvores (subparcelas), o número de árvores
que apresentavam os sintomas de uma determinada doença.
As subparcelas dentro dos conglomerados foram implantadas
considerando uma estrutura sistemática com uma equidistância
K = 400 / 40 = 10. O objetivo é conhecer a ocorrência dessa ca-
racterística. Os dados estão apresentados na Tabela 9.24.
Sabe-se:
Área = 100 ha;
Área do conglomerado ou unidade primária = 1 ha;
Número total de conglomerados ( N = 100 );
Número de conglomerados amostrado (n =10);

324
Amostragem por conglomerado

Número de subparcelas por conglomerado (m = 40).

Tabela 9.24 - Número de árvores por conglomerado (ai ) com sintomas da


doença.

C ai pi = ai / 40 qi piqi
1 0 0,000 1,000 0,000000
2 3 0,075 0,925 0,069375
3 2 0,050 0,950 0,047500
4 4 0,100 0,900 0,090000
5 2 0,050 0,950 0,047500
6 1 0,025 0,975 0,024375
7 2 0,050 0,950 0,047500
8 6 0,150 0,850 0,127500
9 3 0,075 0,925 0,069375
10 1 0,025 0,975 0,024375
Total 24 0,600 0,547500

a) valor estimado da proporção


n n n n

 pi  0,600 ;
i 1
 pi qi  0,5475;
i1
2
 pi  0,0525;  ai 24;
i 1 i 1
n n
p i
0,600  i 24
a
i 1
p   0,06 ou p  i1   0 ,06
n 10 nm 10  40

b) variância estimada da proporção

Dado que: n

n
( p i )2
0,6 2
p i
2
 I 1

n
0,0525 
10  0,00183333
Vˆ1 ( y )  I 1

n 1 9
n
m  pi qi
40  0,5475
Vˆ 2 ( y )  I 1
  0,243333
n ( m  1)
325
10  (10  1)
n 10
f1    0,1
N 100
m 20
f2    0 ,05
M 400
n

n
( p i )2
0,6 2
p 
Amostragem em inventário florestal i
2 I 1

n
0,0525  Waldenei Travassos de Queiroz
10  0,00183333
Vˆ1 ( y )  I 1

n 1 9
n
m  pi qi
40  0,5475
Vˆ 2 ( y )  I 1
  0,243333
n ( m  1) 10  (10  1)
n 10
f1    0,1
N 100
m 20
f2    0 ,05
M 400
Então:
1  f1 ˆ f (1  f 2 ) ˆ
Vˆ ( p )  ( )V1 ( y)  1 V2 ( y )
n nm
1  0,1 0 ,1(1  0 ,05)
Vˆ ( p )  ( )  0,00183333   0 ,243333
10 10  40
Vˆ ( p )  0 ,0001649997  0,0000577915 875  0 ,0002227912 875
s ( p )  0 ,014926194

O intervalo de confiança e o dimensionamento do inventá-


rio definitivo são calculados como já visto anteriormente.

9.9 Amostragem por conglomerados em dois está-


gios pelas proporções com grandezas desiguais (mi)

Dada uma amostragem por conglomerados em dois está-


gios, onde cada unidade primária seja constituída por Mi uni-
dades secundárias ou subparcelas, tal que cada conglomerado
possua mi subparcelas. Admitindo-se que qualquer subparcela
do conglomerado, como visto no item 9.8, pertença a uma das
duas categorias C1 ou C0.

9.9.1 Valores populacionais e estimadores

a) valor estimado da proporção

326
Amostragem por conglomerado

No caso de ocorrer variação no tamanho do conglomerado


(unidade primária), então p é uma estimativa por razão, ou seja:
n

∑M i pi
p i = a i / M i , logo: p R = i =1
n

∑M
i =1
i

b) variância estimada da proporção

Dado que:
n

∑M i pi
pR = i =1
n

∑M
i =1
i

Por conseguinte, a estimativa da variância é dada pela ex-


pressão:
n n n
 (M i
pi ) 2  2 pR  M i2 pi  pR2  M i2
1 N  n i 1 f1 n
M i2 (1  f 2i ) ˆ
Vˆ ( y R )  2 ( )[ i 1 i 1
] 2
2  V2i ( y )
M N nN n 1 n MN i 1 mi

Tal que:
n

∑M m pq
MN = i =1
i
;
Vˆ2i ( y ) = i i i
N (mi − 1)

Considerando:
f 2i = f 2 e m1 = m2 = L = mn = m :
n n n

1 N  n i 1
(M i pi )  2 pR M i
2
p i  p 2R M i
2
f1 (1  f 2 ) n
Vˆ ( y R )  2
( )[ i 1 i 1
] 2 2 M i
2
Vˆ2i ( y )
M N nN n 1 mn M N i 1

Os cálculos para obtenção dos intervalos de confiança e


dimensionamento da amostra seguem a metodogia já vista an-
teriormente.

327
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Exercício 9.11

Seja uma adaptação do exercício 9.10 considerando variação


no tamanho das unidades primárias e também no número de árvo-
res (subparcelas). Os dados estão apresentados na Tabela 9.25.
Dado que:
Área total = 100 ha;
Número total de conglomerados (N = 100);
Número de conglomerados amostrado (n = 10).

Tabela 9.25 - Número de árvores (ai ) por conglomerado (C) com sintomas
da doença.

C Área Mi mi ai p i = a i / mi qi Vˆ2i = mi pi qi (mi − 1)


1 0,9 360 37 0 0,000000 1,00000 0,000000
2 0,8 320 35 3 0,085714 0,91429 0,080672
3 1,1 440 41 2 0,048780 0,95122 0,047561
4 1,2 480 43 4 0,093023 0,90698 0,086379
5 0,7 280 33 2 0,060606 0,93939 0,058712
6 0,8 320 35 1 0,028571 0,97143 0,028571
7 0,9 360 37 2 0,054054 0,94595 0,052553
8 1,0 400 40 6 0,150000 0,85000 0,130769
9 1,0 400 40 3 0,075000 0,92500 0,071154
10 1,4 560 47 1 0,021277 0,978723 0,021277
Total 9,8 3920 24

M i  3920
i1
n

M
i 1
i
2
 1 .600 .000,0
n


i 1
M i p i  241,03
N


i 1
Mi
40.000
MN    400
N 100
n

M
i 1
i
2
pi  97.009,0

328
n

 (M
i 1
i
p i ) 2  8 .598,93
n
M i2 (1  f 2 i ) ˆ
 mi
V 2i ( y )  2. 054, 9
i 1
i 1
N


i 1
Mi
40.000
MN    400
N 100
n Amostragem por conglomerado
M
i 1
i
2
pi  97.009,0
n

 (M
i 1
i
p i ) 2  8 .598,93
n
M i2 (1  f 2 i ) ˆ
 mi
V 2i ( y )  2. 054, 9
i 1

a) valor médio estimado por razão de P


n

M
i 1
i
pi
241,92
pR  n
  0,061714
3920
M i 1
i

b) variância estimada por razão de pR


n n n

1 N n
 (M i p i ) 2  2 p R  M i2 p i  p 2R  M i2
f1 n
M i2 (1  f 2 i ) ˆ
Vˆ( yR )  2 ( )[ i 1 i 1 i 1
]  V 2i ( y)
M N nN n 1 n 2 M N2 i 1 mi
1 100  10 8.598,93  2  0,061487  97.009  0,0614872  1.600.000
Vˆ ( p)  ( )( )
400 2 10 100 9
0,1
 2  2.054,9
10  400 2
1 100  10
Vˆ ( p )  ( )( 302,043012)  0,0000128431 25  0 ,0001827423 193
400 2 10  100
s ( p )  0 ,013518

Os cálculos para obtenção dos intervalos de confiança e


dimensionamento da amostra seguem a metodogia já vista an-
teriormente.

9.10 Estruturas de conglomerados em inventá-


rios florestais

A configuração estrutural dos conglomerados pode ser or-


ganizada de diversas formas, tamanhos e distribuições espa-
ciais na floresta. Entretanto, para se definir a forma estrutural

329
Amostragem em inventário florestal Waldenei Travassos de Queiroz

amostral (conglomerado) em inventários de florestas naturais,


as seguintes informações são importantes, como subsídios para
se aproximar da estrutura conglomerada ideal:

a) a razão entre os custos de penetração e medição das


subparcelas e o custo de reconhecimento e penetração nos con-
glomerados;

b) previsão aproximada do valor esperado do coeficiente


de correlação intraconglomerado;
c) a área da subunidade.

A diversidade de formas ou estruturas de conglomerados


com aplicação na área florestal é bastante ampla. A Figura 9.1
apresenta algumas formas (a, b, c, d) que podem ser utilizadas:

(a) (b) (c) (d)

Figura 9.1 - Formas estruturais de conglomerados (a, b, c, d).

Péllico Netto (1971) realizou um inventário florestal em uma


área de 160.980 ha, localizada na região do Alto Turi, município
de Santa Helena, no estado do Maranhão. A unidade amostral
apresentou uma forma conglomerada, denominada cruz de mal-
ta (forma a), onde cada subparcela tinha uma área de 0,25 ha.
A distância de cada subparcela em relação ao ponto central do
conglomerado foi de 10 m.
Bolfarine e Bussab (2005) citam que uma inconveniência
no uso da amostragem em conglomerados é que as subparcelas

330
Amostragem por conglomerado

dentro do conglomerado tendem a ter valores mais homogêneos


para as variáveis medidas. Queiroz (1998) explica que o uso de
pequenas distâncias entre as subparcelas aumenta o grau de
dependência entre as mesmas, pois o coeficiente de correlação
intraconglomerado tende a crescer.
Queiroz (1977) estudou a forma estrutural do conglomera-
do cruz de malta com o objetivo de pesquisar 25 tamanhos di-
ferentes de subparcelas, pelo Método da Curvatura Máxima, vi-
sando definir o tamanho ideal. A seguir uma apresentação mais
detalhada deste trabalho.
Para estudar o tamanho ótimo da subparcela e a distância
ideal dessa ao centro do conglomerado foram consideradas as
seguintes variáveis respostas: Vt: Volume de madeira sem cas-
ca das árvores com DAP ≥ 25 cm considerando as 167 espécies
ocorrentes na área; V1: Volume de madeira sem casca congre-
gando somente as espécies pertencentes à classe I que são
as espécies com mercado internacional garantido que, segundo
Queiroz (1977), no ano de 1977 correspondia a um total de 14
espécies, e Vm: Volume de madeira sem casca somente para a
espécie maçaranduba (Manilkara huberi (Ducke). Standl).
O método utilizado para obter o tamanho ideal da subpar-
cela, denominado de curvatura máxima, foi proposto por Federer
(1955), consistindo em obter um índice que estime a variabilida-
de, como a variância ou coeficiente de variação para cada tama-
nho de subparcela. Segundo Chacin Lugo (1977), o método da
curvatura máxima foi o primeiro a ser utilizado na obtenção do
tamanho ideal de parcelas experimentais. Este método consiste
em utilizar ensaios de uniformidade compreendendo um conjun-
to de unidades básicas.
A partir dos coeficientes de variação (CV) obtidos para
cada tamanho de parcela, uma curva é então traçada através

331
Amostragem em inventário florestal Waldenei Travassos de Queiroz

das coordenadas resultantes, onde o tamanho ótimo da parcela


localiza-se na região de máxima curvatura. Este tamanho é de-
terminado de forma visual, adotando-se como tamanho ideal o
valor correspondente à abscissa do ponto naquela região.
O tamanho ideal escolhido, localizado na região de máxi-
ma curvatura, foi de 0,32 ha. Definido o tamanho da subparcela
em 0,32 ha, foram analisados os efeitos na precisão do inven-
tário, quando as mesmas estiverem afastadas do ponto central,
para 17 distâncias diferentes. Os resultados mostraram que a
distância das subparcelas ao ponto central não deve ser inferior
a 50 metros para um tamanho de subparcela de 0,32 ha, entre-
tanto, os resultados obtidos recomendam que uma distância de
100 m seria melhor.
Os resultados demonstraram que o número de subparcelas
aumenta com a diminuição do seu tamanho, o que pode ser per-
cebido quando o tamanho é igual a 0,12 ha, onde os coeficientes
de correlação intraconglomerado, para as três variáveis respos-
tas estudadas, variaram entre os valores de 0,055 a 0,087; e,
consequentemente, o número de subparcelas variou de 5,596
a 7,193; denotando ser eficiente uma formatação conglomerada
na forma cruzada, mas apresentando oito subparcelas.
Analisando-se a Figura 9.2, com base nas três variáveis
respostas referentes aos volumes das espécies em estudo, veri-
fica-se que existe uma relação inversamente proporcional da va-
riabilidade dos valores do coeficiente de variação em função do
tamanho das subparcelas, ou seja, à medida que se aumenta o
tamanho da subparcela diminui o valor do coeficiente de variação.
Nesse caso, o tamanho da subparcela considerado ideal foi ob-
tido por meio de análise visual, com localização centralizada na
região de máxima curvatura, correspondendo à soma do total de
oito unidades básicas (subsubparcelas), perfazendo uma magni-

332
Amostragem por conglomerado

tude de 0,32 ha. Todavia, verifica-se uma tendência de estabili-


zação da curva a partir do tamanho de 0,2 ha, e que o tamanho
correspondente a 0,25 ha também pode ser uma boa escolha.

500
450
Coeficiente de variação

400
350
300
250
200
150
100
50
0
0,00 0,20 0,40 0,60 0,80 1,00 1,20
Área da subparcela (ha)

Vt: Volume das 167 espécies V1: Volume das espécies da classe I Vm: Volume da Maçaranduba

Figura 9.2 - Gráfico de dispersão do coeficiente de variação em função do


tamanho das subparcelas para o inventário florestal do Tapajós, município de
Santarém-PA, em 1977.

De acordo com as três variáveis respostas referentes aos


volumes das espécies em estudo, observou-se que existe uma
relação diretamente proporcional da variabilidade do coeficien-
te de correlação intraconglomerado em função do tamanho das
subparcelas, ou seja, à medida que aumenta o tamanho da
subparcela cresce o seu valor, conforme mostra a Figura 9.3.
Os valores dos coeficientes de correlação intraconglomerado,
considerando um tamanho de subparcela ideal de 0,32 ha, para
as três variáveis: Vt (Volume das 167 espécies), dˆ = 0,213; V1
(Volume das espécies da classe I), dˆ = 0,276 e Vm (Volume da
espécie Maçaranduba), dˆ = 0,214, ficaram bem abaixo de 0,4,
indicando ser um tamanho de subparcela adequado.

333
Amostragem em inventário florestal Waldenei Travassos de Queiroz

0,5

0,4
Correlação intraconglomerado

0,3

0,2

0,1

0,0
0,00 0,20 0,40 0,60 0,80 1,00 1,20
-0,1
Área da subparcela (ha)

Vt: Volume das 167 espécies V1: Volume das espécies da classe I Vm: Volume da Maçaranduba

Figura 9.3 - Gráfico de dispersão para os valores do coeficiente de correla-


ção intraconglomerado em função do tamanho das subparcelas para o inven-
tário florestal do Tapajós, município de Santarém-PA, em 1977.

Considerando as três variáveis respostas referentes aos


volumes das espécies em estudo, constatou-se que existe uma
relação inversamente proporcional da variabilidade do número
de subparcelas em função do seu tamanho, ou seja, à medida
que este aumenta a sua quantidade diminui, estabilizando-se
em torno de quatro para 0,32 ha, como apresenta a Figura 9.4.
Os resultados mostram que os números de subparcelas corres-
pondente ao tamanho de 0,32 ha, para as variáveis em estudo,
foram: Vt (Volume das 167 espécies), m = 3,324; V1(Volume
das espécies da classe I), m = 2,801; e Vm (Volume da espécie
Maçaranduba), m = 3,314.

334
Amostragem por conglomerado

25
Número de subparcelas

20

15

10

0
0,00 0,20 0,40 0,60 0,80 1,00 1,20
Área da subparcela (ha)

Vt: Volume das 167 espécies V1: Volume das espécies da classe I Vm: Volume da Maçaranduba

Figura 9.4 - Gráfico de dispersão da variação do número de subparcelas em


função do tamanho das subparcelas para o inventário florestal do Tapajós,
município de Santarém-PA, em 1977.

A Figura 9.5 apresenta, para as três variáveis respostas, a


variabilidade do coeficiente de correlação intraconglomerado em
função da distância das subparcelas ao centro do conglomera-
do. Os valores do coeficiente de correlação intraconglomerado
considerando uma distância de 50 m das subparcelas ao centro
do conglomerado e com um tamanho 0,32 ha apresentaram os
seguintes resultados: Vt = 0,130; V1 = 0,215 e Vm = 0,169. Es-
tes valores denotam que o uso de subparcelas com tamanho
de 0,32 ha e distantes 50 m do centro do conglomerado cruz de
malta estão dentro do limite aceitável por atenderem à condição
d ≤ 0,4 .

335
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Correlação intraconglomerado 0,35


0,3
0,25
0,2
0,15
0,1
0,05
0
0 50 100 150 200 250 300 350 400
Distância (m)

Vt: Volume das 167 espécies V1: Volume das espécies da classe I Vm: Volume da Maçaranduba

Figura 9.5 - Gráfico de dispersão da variação do coeficiente de correlação


intraconglomerado em função da distância para o inventário florestal do Ta-
pajós, município de Santarém, em 1977.

A Figura 9.6 apresenta, para as três variáveis respostas,


a variabilidade do número de subparcelas ideal em função da
distância das subparcelas ao centro do conglomerado. Os va-
lores do coeficiente de correlação intraconglomerado para uma
distância de 110 m das subparcelas ao centro do conglomerado,
para o tamanho de subparcela de 0,32 ha, apresentaram os se-
guintes resultados: Vt = 3,611; V1 = 2,933; e Vm = 2,905. Estes
valores denotam que é aceitável estruturar um conglomerado
cruz de malta com subparcelas com tamanho de 0,32 ha e dis-
tantes 110 m do centro, pois d ≤ 0,4 .

336
Amostragem por conglomerado

20
18
Número de subunidades

16
14
12 Vt
10 V1
8 Vm
6
4
2
0
0 100 200 300 400
distância

Figura 9.6 - Variação do número de subparcelas em função da distância ao


centro do conglomerado.

Os resultados apresentados demonstram que o uso do for-


mato conglomerado cruz de malta com subparcelas com tama-
nhos de 0,25 ha ou 0,32 ha em Inventários Florestais na Amazô-
nia é recomendável, por outro lado, se a área da subparcela for
dimensionada para 0,10 ha, o conglomerado deverá ser estrutu-
rado com oito subparcelas.
As experiências na realização de Inventários Florestais na
Amazônia recomendam que a distância das subparcelas ao cen-
tro do conglomerado cruz de malta não deve ser inferior a 50 m,
mas, ressalta-se que a distância recomendada é 100 m para um
tamanho de subparcela de 0,25 ha. Os resultados demonstram
também que se houver a diminuição do tamanho da subparcela,
o seu número deverá ser aumentado, o que pode ser percebido
quando o tamanho da subparcela é igual a 0,12 ha, onde os
valores da correlação intraconglomerado, para as três variáveis
respostas, variaram de 0,055 a 0,087 e, consequentemente, o
número de subparcelas ideal ficou no intervalo de 5,596 a 7,193;
concluindo-se ser eficiente estruturar, para inventários florestais

337
Amostragem em inventário florestal Waldenei Travassos de Queiroz

na Amazônia, uma formatação conglomerada cruzada ampliada,


ou seja, apresentando uma composição com oito subparcelas
de 0,10 ha (Figura 9.7).

Figura 9.7 - Representação esquemática da unidade conglomerada cruz de


malta e da unidade cruzada com oito subparcelas do inventário florestal da
Flona Tapajós, município de Santarém, em 1977.

Flores (2010) estudou na área de manejo florestal susten-


tável de 1400 ha, pertencente à empresa madeireira Cikel Brasil
Verde Madeiras Ltda., em região de floresta ombrófila densa,
localizada no Alto Pacajá, município de Portel, estado do Pará,
a forma estrutural conglomerada cruzada com oito subparcelas
(Forma expressa na Figura 9.7) com o objetivo de pesquisar
cinco tamanhos diferentes de subparcela, pelo Método da Cur-
vatura Máxima, visando definir o tamanho ideal. A seguir uma
apresentação mais detalhada deste trabalho.
Para estudar o tamanho ótimo da subparcela e a distância
ideal desta ao centro do conglomerado foram consideradas as
seguintes variáveis respostas: VT: Volume de madeira com cas-
ca das árvores com DAP ≥ 30 cm considerando as 77 espécies
ocorrentes na área; VO: Volume de madeira com casca congre-

338
Amostragem por conglomerado

gando somente as 10 espécies de maior ocorrência; VC: Volume


de madeira com casca das dez espécies com mercado interna-
cional garantido pela Empresa Cikel Brasil Verde Madeiras Ltda.
O tamanho ideal escolhido, localizado próximo à região de
máxima curvatura, foi de 0,10 ha. Definido o tamanho da subpar-
cela em 0,10 ha, foram analisados os efeitos na precisão do
inventário para cinco diferentes distâncias entre as subparcelas,
os resultados mostraram que a distância entre as subparcelas
deve ser de 50 m, ou seja, o autor confirmou que a formatação
conglomerada cruzada com oito subparcelas de 0,10 ha é reco-
mendável (Figura 9.7).
Pinheiro (2011) aplicou a estrutura conglomerada cruzada
com oito subparcelas de 0,8 ha, formato apresentado na Figura
9.7, em um inventário florestal localizado no município de Portel,
estado do Pará, considerando a variável resposta volume com
DAP ≥ 30 cm para todas as espécies ocorrentes. Referido autor
obteve para o coeficiente de correlação intraconglomerado o va-
lor de 0,1770; o qual está dentro do limite aceitável por atender
a condição d ≤ 0,4 .

9.11 Amostragem por conglomerados em três es-


tágios

Seja uma população florestal dividida em N unidades de


área denominadas primárias ou conglomerados de conglome-
rados, tal que cada unidade primária ou conglomerado de con-
glomerados é subdividida em M unidades denominadas secun-
dárias ou conglomerados e cada unidade secundária ou con-
glomerados é divida em U unidades denominadas terciárias ou
subparcelas. Denomina-se amostragem em três estágios por-
que a amostra é selecionada em três etapas. A primeira etapa

339
Amostragem em inventário florestal Waldenei Travassos de Queiroz

consiste em selecionar n unidades primárias dentre as N unida-


des primárias. A segunda consiste em selecionar m unidades
secundárias dentre as M unidades secundárias. Na terceira eta-
pa selecionam-se u unidades terciárias dentre as U unidades
terciárias existentes.
Em florestas tropicais, quando a acessibilidade é difícil, é
vantajosa a aplicação da amostragem por conglomerados. Em in-
ventários realizados em áreas de difícil acesso, em que o custo de
localização da unidade de amostra é alto, o uso da amostragem
em três estágios possibilita a redução do custo do levantamento.
As n unidades primárias serão denominadas de conglome-
rados de conglomerados, pois em cada unidade primária ter-se-
á m conglomerados. As m unidades secundárias serão denomi-
nadas de conglomerado, pois ter-se-á apenas um conglomerado
em cada unidade secundária. As u unidades terciárias serão de-
nominadas de subparcelas dentro de cada conglomerado.
O confronto das variações entre os conglomerados de con-
glomerados, entre conglomerados dentro dos conglomerados de
conglomerados e entre subparcelas dentro dos conglomerados
é que revelará a eficiência, em termos de precisão estatística, da
aplicação da amostragem por conglomerados em três estágios.
A amostra por conglomerados em três estágios será tanto mais
precisa quanto maior for o componente de variância entre os
conglomerados dentro dos conglomerados de conglomerados e
entre as subparcelas dentro dos conglomerados e menor for o
componente entre os conglomerados de conglomerados.
Considerando que os conglomerados de conglomerados
(unidades primárias), os conglomerados (unidades secundárias)
dentro dos conglomerados de conglomerados e as subparcelas
(unidades terciárias) dentro dos conglomerados estão dispostas
sistematicamente, a tendência no cálculo do erro padrão pode

340
Amostragem por conglomerado

ser considerada desprezível no caso de inventários florestais,


pois, normalmente, os valores das variáveis respostas são orde-
nados por algum critério objetivo, ou seja, sucedem-se em uma
ordem obedecendo às leis da natureza florestal, podendo-se
através da análise de variância ter uma aproximação satisfatória
da estimativa da variância da população.

9.11.1 Valores populacionais e estimadores

Sem perda de generalidade, será apresentado o caso mais


simples, quando uma amostra de n conglomerados de conglo-
merados selecionados de um total de N contém o mesmo nú-
mero m de conglomerados, assim como todos m conglomera-
dos selecionados de um total de M terão o mesmo número u de
subparcelas de um total U.
Para formular os parâmetros populacionais e os respecti-
vos estimadores, utilizar-se-á a seguinte notação.
N = número total de conglomerados de conglomerados ou
unidades primárias, possível de ser alocado na área florestal a
ser inventariada, respeitando-se a sua forma estrutural;
M = número total de unidades secundárias ou conglome-
rados, possível de ser alocado dentro de cada unidade primária
ou conglomerados de conglomerados;
U = número total de unidades terciárias ou subparcelas do
conglomerado, possível de ser alocado dentro de cada unidade
secundária ou conglomerado;
n = número de unidades primárias ou conglomerados de
conglomerados amostrado;
m = número de unidades secundárias ou conglomerados
amostrado dentro de cada unidade primária ou conglomerados
de conglomerados;

341
Amostragem em inventário florestal Waldenei Travassos de Queiroz

u = número de unidades terciárias ou subparcelas amos-


trado dentro de cada conglomerado;
y ijk = valor da variável resposta correspondente à k-ésima
subparcela do j-ésimo conglomerado, o qual pertence ao i-ésimo
conglomerado de conglomerados.

a) valores médios por unidade terciária ou subparcela

a1) valores médios populacionais por unidade terciária ou


subparcela
N M U M U U

  yijk  y ijk y ijk


i 1 j1 k 1 j 1 k  1 k 1
Y  ; Yi  ; Yij 
NMU MU U

a2) valores médios amostrais por subparcela ou unidade de


terceiro estágio
n m u m u u

 y ijk  yijk


j 1 k 1
y ijk
i 1 j 1 k 1 k 1
y ; yi  ; y ij 
nmu mu u

b) valor total
b1) valor total populacional

Y = NMUY

b2) valor total estimado

Yˆ = NMU y

342
Amostragem por conglomerado

c) variância populacional por subparcela e seu estimador


N M U n m u

∑∑∑ ( y ijk − Y )2 ∑ ∑ ∑(y


i =1 j =1 k =1
ijk − y) 2
; Vˆ ( y ) =
i =1 j =1 k =1
V ( y) =
NMU − 1 nmu − 1

9.11.2 Parâmetros populacionais e seus estimadores atra-


vés da análise de variância

a) variância a partir dos componentes de variância

A variância populacional e seu estimador, a partir dos com-


ponentes de variância, são obtidos respectivamente pelas ex-
pressões:
U ( NM  1)VC ( y)  MU( N 1)VC C ( y)
V ( y)  V d d ( y) 
NMU 1
u(nm  1)VˆC ( y)  mu(n  1)VˆCC ( y )
Vˆ ( y )  Vˆdd ( y) 
nmu  1

Seja a verificação pela análise de variância considerando


o esquema para ensaios em classificação hierárquica (Tabelas
9.26 e 9.27):
yijk  Y  cci  c ij  eijk

Y é a média geral fixa, onde E (Y ) = Y e E (Y 2 ) = Y 2


yijk é o valor da variável resposta correspondente à k-
ésima subparcela dentro do j-ésimo conglomerado dentro do i-
ésimo conglomerados de conglomerados;
cci: com i = 1,2,L, n é o efeito dos conglomerados dos conglo-
merados (unidades primárias), tal que E(cci) = 0 e E(cci2) = Vcc (y);
cij: com j = 1,2,L, m é o efeito do conglomerado j dentro do
conglomerado de conglomerado i, quando E(cij) = 0 e E(cij2) = Vc (y);
eijk : k = 1,2, L, u é o efeito da subunidade k dentro do con-

343
Amostragem em inventário florestal Waldenei Travassos de Queiroz

glomerado j, dentro do conglomerado de conglomerados i, ou


erro aleatório para E (eijk ) = 0 e E(e2 ) = Vdd (y).

Tabela 9.26 - Análise de variância em classificação hierárquica.

Causas de Variação G.L. SQ QM


Entre conglomerados de n −1 n
2 SQCC
conglomerados um ( y i  y) V1 
i 1
n 1
Entre conglomerados n(m − 1) n m SQC d .CC
dentro dos conglomerados u ( yij  yi )2 V2 
de conglomerados n (m  1)
i 1 j 1

Entre subunidades dentro nm (u  1) n m u


dos conglomerados dentro
dos conglomerados de
∑∑∑ ( y
i =1 j =1 k =1
ijk − yij ) 2
conglomerados
Total nmu − 1 n m u
SQTotal
∑∑∑ ( y
i =1 j =1 k =1
ijk − y)2 V4 
nmu  1

n m u

n m u
(  yijk ) 2
SQTotal   yijk2  C C i1 j 1 k 1

i 1 j1 k 1 nmu
1 n 2
SQCC   yi..  C
ju i1
1 n 2 1 n 2
SQC d .CC   yij .   yi..
u i 1 ju i
n m u
1 n m 2
SQSub d .C d .CC    y ijk
2
  y ij.
i1 j 1 k 1 u i j 1

344
Amostragem por conglomerado

Tabela 9.27 - Componentes de variância.

Causas de Variação G.L. QM E(QM) F


Entre conglomerados de N −1 V1 Vdd ( y) UVC ( y)  MUVCC( y) V1
conglomerados
V2
Entre conglomerados N ( M − 1) V2 Vdd ( y )  UVC ( y) V2
dentro dos conglomerados
de conglomerados V3
Entre subunidades NM (U  1) V3 Vdd (y )
dentro dos conglomerados
dentro dos conglomerados
de conglomerados
Total NMU − 1 V4 U ( NM  1)V C ( y )  MU (N  1)VC C ( y)
Vd d ( y) 
NMU  1

O termo E(QM) significa esperança do quadrado médio.


Tem-se:
VCC (y) é o componente de variância entre os conglomera-
dos de conglomerados;
VC (y) é o componente de variância entre os conglomerados
dentro dos conglomerados de conglomerados;
Vdd (y) é o componente de variância entre subparcelas den-
tro dos conglomerados dentro dos conglomerados de conglome-
rados.
Não obstante, considerando que a amostra por conglome-
rados, geralmente, é aplicada às populações extensas, pode-se
considerar que:
MU ( N  1 )  U ( NM  1)  NMU  1

Então, se V (y) = QMTotal , tem-se que:

V ( y )  VCC ( y )  VC ( y )  Vdd ( y )

345
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Dado que:
n m u

∑∑∑ ( y ijk − y)2


Vˆ ( y ) =
i =1 j =1 k =1

nmu − 1

Então a variância estimada através da análise de variância,


será:
(n  1)Q Mˆ CC  n (m  1)Q Mˆ C d .CC  nm (u  1)Q Mˆ Sub d .C d .CC
Vˆ ( y ) 
nmu  1

Substituindo-se os componentes de variância correspon-


dentes e considerando a população infinita.
mu (n  1)  u( nm  1)  nmu  1

Tem-se:
Vˆ( y)  VˆCC ( y )  VˆC ( y )  Vˆdd ( y)

Tal que:
Vˆ  Vˆ2
Vˆ  Vˆ
VˆC C ( y)  1 , VˆC ( y)  2 3 , Vˆdd ( y )  QM Sub d .C d .CC
mu u

b) desvio padrão a partir dos componentes de variância

b1) desvio padrão populacional a partir dos componentes


de variância
S ( y )  V CC ( y )  V C ( y )  Vdd ( y )

b2) desvio padrão estimado considerando os componentes


de variância
s( y)  VˆCC ( y)  VˆC ( y)  Vˆdd ( y)

346
Amostragem por conglomerado

c) coeficiente de variação

c1) coeficiente de variação populacional


S ( y)
CV %   100
Y

c2) coeficiente de variação estimado

s( y)
CVˆ % = × 100
y
d) variância da média por subparcela (unidade terciária)

d1) variância da média populacional por subparcela (unida-


de terciária)

Do modelo matemático de um levantamento em três está-


gios y i jk  Y  cci  c ij  eij k , tem-se:
n m u

 y
1 j1 k 1
ijk
1  f1 1 f 2 1  f3
V ( y)  V ( i ) V1 ( y )  V2 ( y )  V ( y)
nmu n nm nmu 2

Sendo:
N

( y
i 1
i  y) 2
V1 ( y) 
N 1
N M

 ( y ij  yi ) 2
i 1 j1
V2 ( y ) 
N (M  1)
N M U

( y
i 1 j1 k 1
ijk  yij ) 2
V3 ( y ) 
NM (U  1)

347
Amostragem em inventário florestal Waldenei Travassos de Queiroz

d2) variância da média estimada por subparcela unidade y

Se n conglomerados de conglomerados são selecionados


ao acaso e se m conglomerados são também retirados aleato-
riamente dentro dos conglomerados de conglomerados e u su-
bunidades também são selecionadas aleatoriamente dentro dos
conglomerados, tem-se que y é uma estimativa sem tendência
de Y e sua variância é:
n m u

∑∑∑ y ijk
1 − f1 ˆ f (1 − f 2 ) ˆ f f (1 − f 3 ) ˆ
Vˆ ( y ) = V (
i =1 j =1 k =1
)= V1 ( y ) + 1 V2 ( y ) + 1 2 V3 ( y )
nmu n nm nmu

Sendo:
n n m

∑ ( yi − y ) 2 ∑∑ ( y ij − yi ) 2
Vˆ1 ( y ) = i =1
; Vˆ2 ( y ) = i =1 j =1
;
n mn −u 1 n(m − 1)
 ( y ijk
 yij ) 2
Vˆ3 ( y ) 
i1 j 1 k 1

nm(u 1)

Para populações infinitas, usando-se os componentes de


variância, tem-se:
Vˆ ( y) VˆC ( y) Vˆdd ( y)
Vˆ ( y )  CC  
n nm nmu
e) erro padrão

e1) erro padrão populacional


S ( y) = V ( y)

348
Amostragem por conglomerado

e2) erro padrão estimado

s ( y ) = Vˆ ( y )

f) intervalo de confiança

f1) intervalo de confiança para a média populacional ( Y )

P[ y − t a 2 s( y ) ≤ Y ≤ y + t a 2 s( y )] =1-a

f2) intervalo de confiança para o valor total populacional (Y)

P[Yˆ − NMUta 2 s ( y ) ≤ Y ≤ Yˆ + NMUta 2 s ( y )] =1-a

s ( y ) : valor na unidade de área da subparcela do conglo-


merado

g) intensidade de amostragem e limite de erro

Seja E = t × s ( y ) a semiamplitude do intervalo de confiança.


Definindo a semiamplitude do intervalo de confiança em percen-
tagem da média, tem-se: EE == LE E × y , tal que LE é denominado
L
Limite de Erro ou Margem de Erro.

Dado que E  t  s ( y )  LE  y , conclui-se que:


t  s( y )
LE % 
y

De E = t × s ( y ) , tem-se: E 2 = t 2 × Vˆ ( y ). . Logo:
Vˆ ( y ) VˆC ( y) Vˆd d ( y)
E 2  t 2Vˆ ( y )  t 2 [ CC   ]
n nm nmu
2 1 2 ˆ Vˆ ( y ) Vˆdd ( y )
E  t [VCC ( y )  C  ]
n m mu
t2 ˆ Vˆ ( y ) Vˆdd ( y)
n  2 [V CC ( y )  C  ]
E m 349 mu
t2 ˆ ˆ
n [Vˆ ( y )  V C ( y )  V dd ( y ) ]
CC
( LE  y ) 2 m mu

2 t2 ˆ VˆC ( y) Vˆdd ( y)
Vˆ ( y ) VˆC ( y) Vˆd d ( y)
E 2  t 2Vˆ ( y )  t 2 [ CC   ]
n nm nmu
Amostragem
1 VˆC ( y ) Vˆdd ( y )
E eminventário
2 2 florestal
ˆ ( y)  Waldenei Travassos de Queiroz
t [VCC  ]
n m mu
t2 ˆ Vˆ ( y ) Vˆdd ( y)
n  2 [V CC ( y )  C  ]
E m mu
2 ˆ ˆ
n
t
[Vˆ ( y )  V C ( y )  V dd ( y ) ]
CC
( LE  y ) 2 m mu
t2 ˆ VˆC ( y) Vˆdd ( y)
LE 2  (V CC ( y )   )
ny 2 m mu
t 1 Vˆ ( y ) Vˆdd ( y)
LE %  ( ) [VˆCC ( y )  C  ]  100
y n m mu

h) dimensionamento da amostra considerando os custos

Seja C = c1n + c2nm + c3nmu a função custo linear mais


simples, sendo:
C = custo de medição de campo do inventário florestal;
c1 n = custo de penetração e implantação dos conglomera-
dos de conglomerados;
c2nm = custo de penetração e implantação dos conglome-
rados;
c3 nmu = custo de medição das subunidades.

Considerando grandes áreas (populações infinitas) pode-


se tornar mínimo o custo, para:
t
2
Vˆ ( y ) Vˆdd ( y )
n  2 [VˆCC ( y )  C  ]
E m mu

Seja C = c1n + c2nm + c3nmu


t2 ˆ ˆ
Se K = , então n  K [Vˆ ( y)  VC ( y)  V dd ( y) ], logo:
CC
E2 m mu
Vˆ ( y ) Vˆdd ( y )
C  K [VˆCC ( y )  C  ](c1  c 2 m  c 3 mu )
m mu

350
Amostragem por conglomerado

Obter mOti e u Oti que torne mínimo C * = C K


Vˆ ( y ) Vˆdd ( y )
C *  [VˆCC ( y )  C  ](c 1  c 2 m  c 3 mu)
m mu
Vˆ C ( y ) Vˆ dd ( y ) Vˆ C ( y ) Vˆ dd ( y ) VˆC ( y ) Vˆ dd ( y )
C  c 1 [VˆCC ( y )  ]  c 2 m [VˆCC ( y )  ]  c 3 mu [VˆC C ( y ) 
*
   ]
m mu m mu m mu
Vˆ ( y) Vˆdd ( y) Vˆ ( y)
C *  c1 [VˆCC ( y)  C  ]  c2 [mVˆCC ( y)  VˆC ( y)  d d ]  c3 [muVˆC C (y )  uVˆC ( y)  Vˆd d ( y)]
m mu u
C* Vˆ ( y ) Vˆ ( y )
 c1 ( C 2  dd 2 )  c 2 VˆCC ( y )  c3 u VˆCC ( y )
m m um

C*
Para = 0 , implica: c1 ˆ
ˆ ( y )  Vd d ( y ) ]  Vˆ ( y )(c  c u )
∂m 2
[V C CC 2 3
moti u
Finalmente:
Vˆ ( y )
c1 [VˆC ( y)  dd ]
moti  u
VˆCC ( y )(c 2  c 3 u)

Como:
VˆC ( y) Vˆdd ( y ) Vˆ ( y )
C *  c1 [VCC ( y )   ]  c 2 [ m Vˆ CC ( y )  VˆC ( y )  dd ]  c 3 [ muVˆCC ( y )  uVˆC ( y )  Vˆ dd ( y )]
m mu u

Então:
C* Vˆ ( y ) Vˆ ( y )
 c1 [ dd 2 )  c 2 ( dd 2 ]  c 3 [ mVˆCC ( y )  V C ( y )]
u mu u

C*
Para = 0 , implica:
∂u
1 c1Vˆdd ( y)
2
[  c2 Vˆdd ( y )]  c3 [ mVˆCC ( y)  VˆC ( y)]
u oti m
c
Vˆdd ( y)( 1  c2 )
u oti  m
c3 [ mVCC ( y)  VˆC ( y )]
ˆ

351
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Tomando-se as diferenciais de segunda ordem em relação


a m e u, verifica-se por meio da matriz Hessiana que u oti e moti
tornam mínima a variância V ( y ).).

Exercício 9.12

Seja uma área florestal de 648.000 ha. Esta área foi dividi-
da em N = 120 unidades primárias (UP) de 5.400 ha cada, das
quais foram sorteados n = 9 conglomerados de conglomerados.
Em cada unidade primária sorteada foram alocados m = 5 conglo-
merados. A estrutura espacial de cada conglomerado apresenta
uma forma cruzada, composta por quatro subparcelas retangu-
lares de 10 m de largura por 250 m de comprimento. A distância
de cada subunidade ao ponto central foi de 50 m. A variável res-
posta definida é o volume total de madeira considerando todas
as espécies com DAP ≥ 30 cm. Os dados correspondentes às
180 subparcelas ou unidades terciárias de 0,25 ha foram trans-
formados por hectare e estão apresentados na Tabela 9.28.

352
Amostragem por conglomerado

Tabela 9.28 - Dados aplicativos: amostragem em três estágios.


SUBPARCELAS
CC C TOTAIS
1 2 3 4
1 1 183,0 141,5 153,8 162,8 641,1
1 2 186,3 78,3 134,8 164,8 564,2
1 3 188,4 200,6 157,4 137,0 683,4
1 4 234,5 184,4 183,3 206,9 809,1
1 5 167,9 189,1 177,7 238,1 772,8
TOTAIS 960,1 793,9 807,0 909,6 3470,6
2 1 198,3 167,0 172,2 137,1 674,6
2 2 112,5 69,9 98,3 126,1 406,8
2 3 170,3 181,4 352,1 230,8 934,6
2 4 257,2 379,7 198,0 132,4 967,3
2 5 116,8 67,5 67,9 106,8 359,0
TOTAIS 855,1 865,5 888,5 733,2 3342,3
3 1 255,2 226,8 229,1 304,2 1015,3
3 2 230,6 257,2 224,1 231,3 943,2
3 3 293,1 217,1 288,0 202,2 1000,4
3 4 155,6 143,4 222,8 195,1 716,9
3 5 229,1 417,5 237,3 227,9 1111,8
TOTAIS 1163,6 1262,0 1201,3 1160,7 4787,6
4 1 218,8 104,5 154,8 226,6 704,7
4 2 199,7 195,3 256,9 255,2 907,1
4 3 118,7 186,8 217,6 152,5 675,6
4 4 175,5 86,4 151,8 201,4 615,1
4 5 143,2 217,2 197,6 199,1 757,1
TOTAIS 855,9 790,2 978,7 1034,8 3659,6
5 1 208,0 186,2 160,9 305,5 860,6
5 2 244,1 183,9 205,9 232,0 865,9
5 3 195,6 329,3 230,2 194,4 949,5
5 4 205,9 225,4 230,0 221,9 883,2
5 5 184,6 207,6 201,8 195,9 789,9
TOTAIS 1038,2 1132,4 1028,8 1149,7 4349,1
6 1 275,5 133,3 190,1 200,6 799,5
6 2 236,0 257,6 234,5 275,0 1003,1
6 3 120,6 164,1 173,4 151,1 609,2
6 4 232,3 173,2 176,2 227,0 808,7
6 5 247,0 223,7 162,6 127,2 760,5
TOTAIS 1111,4 951,9 936,8 980,9 3981,0
7 1 139,6 147,5 78,8 111,5 477,4
7 2 172,2 177,8 136,9 201,4 688,3
7 3 138,5 88,6 46,4 55,3 328,8
7 4 164,6 149,5 165,5 144,6 624,2
7 5 62,9 81,8 118,8 97,1 360,6
TOTAIS 677,8 645,2 546,4 609,9 2479,30
8 1 132,8 167,9 173,8 167,6 642,1
8 2 170,3 171,8 138,8 126,9 607,8
8 3 151,6 225,1 165,1 174,0 715,8
8 4 165,7 188,4 87,5 167,0 608,6
8 5 173,6 166,5 190,0 221,3 751,4
TOTAIS 794,0 919,7 755,2 856,8 3325,70
9 1 177,4 233,6 274,4 228,7 914,1
9 2 203,4 286,5 253,8 214,9 958,6
9 3 210,6 311,8 256,1 140,3 918,8
9 4 87,9 243,6 142,7 197,0 671,2
9 5 234,1 259,3 158,4 170,8 822,6
TOTAIS 913,4 1334,8 1085,4 951,7 4285,30
Total Geral 8369,50 8695,60 8228,10 8387,30 33680,50

353
Amostragem em inventário florestal Waldenei Travassos de Queiroz

a) informações preliminares sobre a área inventariada

Área florestal = 648.000 ha;


Área de cada de unidade primária é igual a:
Área florestal 648 .000 ha
  5.400 ha
N 120

Número total de unidades primárias:


Área florestal 648.000 ha
N   120
Área da UP 5.400 ha

N = número de unidades primárias sorteado é igual a 9,


que será denominado de número de conglomerados de conglo-
merados. Então:
n 9
f1 = =
N 120

Considerando que cada conglomerado apresenta uma for-


ma cruzada cruz de malta, composto por quatro subunidades
retangulares de 10 m de largura por 250 m de comprimento e
uma distância de cada subunidade ao ponto central de 50 m,
conclui-se que cada conglomerado ocupa um quadrado de 600m
de lado, ou seja, uma área de 36 ha.
Aréa da UP 5 .400 ha
Número total de unidades secundárias: M    150
Área da US 36 ha

m = 5 é o número de unidades secundárias amostrado e


que será denominado de número de conglomerados. Então:
m 5
f2 = =
M 150
Aréa da US 36 ha
Número total de unidades terciárias: U    144
Área da UT 0,25 ha

354
Amostragem por conglomerado

u = 4 é o número de unidades terciárias amostrado e que


será denominado de número de subparcelas do conglomerado.
Então:
u 4
f3 = =
U 144

b) valor médio amostral considerando todas as unidades


terciárias ou subparcelas
n m u

 y ijk
33680,5
i1 j 1 k 1
y   187,1139 m 3 / ha
nmu 9  5 4

c) valores médios amostrais por unidade terciária (subpar-


cela) dentro dos conglomerados (unidades secundárias) (Tabela
9.29)

Tabela 9.29 - Médias estimadas por subparcela dentro dos conglomerados.

u
MÉDIAS ESTIMADAS ( yij = ∑ yijk u )
k =1

CC (UP) CONGLOMERADOS ( j = 1,L, m )


i = 1,L, n 1 2 3 4 5
1 160,28 141,05 170,85 202,28 193,20
2 168,65 101,70 233,65 241,83 89,75
3 253,83 235,80 250,10 179,22 277,95
4 176,18 226,78 168,90 153,78 189,28
5 215,15 216,48 237,38 220,80 197,48
6 199,88 250,78 152,30 202,18 190,13
7 119,35 172,08 82,00 156,05 90,15
8 160,53 151,95 178,95 152,15 187,85
9 228,53 239,65 229,70 167,80 205,65

355
Amostragem em inventário florestal Waldenei Travassos de Queiroz

d) valores médios amostrais por unidade terciária (subpar-


cela) dentro dos conglomerados de conglomerados (unidades
primárias) (Tabela 9.30)

Tabela 9.30 - Valores médios por unidade terciária dentro dos conglomerados
de conglomerados.

CC 1 2 3 4 5
173,53 167,12 239,38 182,98 217,46
m u
yi   yijk mu 6 7 8 9
j 1 k1
199,05 123,97 166,29 214,27

e) valor total estimado


Yˆ  Área em ha  y / ha  648 .000  187,1139  121.249.807, 2 m
3

f) variância estimada por subparcela


n m u

n m u n m u
(  yijk ) 2
i 1 j 1 k 1
  ( y ijk  y) 2
  y 2
ijk 
nmu
Vˆ ( y) 
i 1 j 1 k 1 i1 j 1 k 1

nmu  1 nmu  1
2
( 33 .680,5)
6 .951.531,95 
Vˆ ( y )  180  3628,1710
179

356
Amostragem por conglomerado

g) variância estimada por meio da análise de variância do


ensaio com classificação hierárquica

A partir dos resultados obtidos da análise de variância do


ensaio com classificação hierárquica (Tabela 9.31) é calculado o
valor da variância estimada do valor médio.

357
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Tabela 9.31 - Análise de variância: ensaios com classificação hierárquica.

Causas de Variação G.L. SQ QM F


Entre conglomerados de 8 191.103,4875 23.887,9359 4,51
conglomerados

Entre conglomerados dentro 36 190.499,6750 5.291,6576 2,67


dos conglomerados de
conglomerados

Entre subunidades dentro de 135 267.839,45 1983,9959


conglomerados dentro de
conglomerados de
conglomerados
Total 179 649.442,6153 3.628,1710

ˆ CC  n( m  1) QMˆ Cd . CC  nm(u  1) QMˆ Sub d . C d . CC


(n  1) QM
Vˆ( y) 
nm  1
(9  1)  23 .887,9359  9( 5  1)  5291,6576  9  5 ( 4  1)  1983,9959
Vˆ ( y) 
9  5  4 1
Vˆ ( y)  3 .628,1710 (m3 / ha )2

Componentes de variância:

h) desvio padrão estimado


s( y )  VˆCC ( y )  VˆC ( y )  Vˆdd ( y )  3740 ,7252  61,1615 m 3 / ha

358
Amostragem por conglomerado

i) coeficiente de variação estimado


s ( y) 61,1615
C Vˆ%  100   100  32 ,69 %
y 187 ,1139

j) variância da média de y (população infinita usando os


componentes de variância)
VˆCC ( y ) VˆC ( y ) Vˆdd ( y )
Vˆ ( y )   
n nm nmu
929,8139 826,9154 1983,9959
Vˆ ( y )     132,7107
9 9 5 9 5 4

k) erro padrão estimado


s ( y )  Vˆ ( y )  124 ,912517  11,17642684 m 3 / ha

l) intervalo de confiança para a média populacional ( Y )


PP[ y − t × s ( y ) ≤ Y ≤ y + t × s ( y )])] =1-a

Limite inferior para o valor médio


163,3057311
y  t  s( y)  163,3057311–1,1,96
9611x 11,17642684 = 141,3999345
,17642684  141 m3 / ha
,3999345m3/ ha

Limite superior para o valor médio


y  t  s( y )  163,3057311  1,96  11,17642684  185,2115277m3 / ha
t nm (u 1 ); 2  t135;0 ,025  1,96

m) intervalo de confiança para o valor total populacional (Y)


Limite inferior para o valor total
Área em ha  LI ( y / ha )  648.000  141,3999345  91.627.157,56 m3 / 648.000 ha

Limite superior para o valor total


Área em ha  LS ( y / ha )  648.000  185,2115277  120.017.070 m3 / 648.000 ha

359
Amostragem em inventário florestal Waldenei Travassos de Queiroz

n) limite de erro para inventário florestal


E  t  s(y )

E  1,96  11,17642684  21,9057966 m 3 / ha

LE %= t  s ( y )  100  21,90579661  13,41397908%


y 163,3057311

o) variância da média de y (população finita)

Se n conglomerados de conglomerados são selecionados


ao acaso e se m conglomerados são também retirados alea-
toriamente de dentro dos conglomerados de conglomerados
selecionados e u subunidades também são selecionadas ale-
atoriamente dentro dos conglomerados, tem-se que y é uma
estimativa sem tendência de Y e sua variância é:
n m u

∑∑∑ y ijk
1 − f1 ˆ f (1 − f 2 ) ˆ f f (1 − f 3 ) ˆ
Vˆ ( y ) = V (
i =1 j =1 k =1
)= V1 ( y ) + 1 V2 ( y ) + 1 2 V3 ( y )
nmu n nm nmu

Sendo:

360
Amostragem por conglomerado

n 9 m 5 u 4
Dado que f1 = = ; f2 = = ; f3 = = :
N 120 M 150 U 144

9 9 5 9 5 4
1 (1  )  (1  )
Vˆ ( y)  120 Vˆ1 ( y)  120 150 Vˆ2 ( y)  120 150 144 Vˆ3 ( y)
9 9 5 9 5 4
0 ,925 ˆ 0 ,0725 ˆ 0 ,002430555556) ˆ
Vˆ ( y )  V1 ( y )  V2 ( y )  V3 ( y )
9 9 5 9 5 4
0,925 0 ,0725 0 ,0024305555 56)
Vˆ ( y)  1194,3387   1322,2144  1983,9959
9 9 5 9 5  4
Vˆ ( y )  122 ,7515  2,1302  0 ,0268
Vˆ ( y )  124,9085 (m / ha)
3

p) dimensionamento da amostra considerando os conglo-


merados de conglomerados

Suponha que o limite de erro estipulado seja de 10% (LE =


0,10). O resultado da análise mostrou que para nove conglome-
rados de conglomerados o limite de erro foi de 13,41%. Então,
deve-se calcular o número de conglomerados de conglomerados
para atender ao limite de erro (LE) igual a 0,10 e, posteriormente,
o número de conglomerados de conglomerados faltantes.

Dado queEE = E × y , então E = 0,10 x 163,3057311 = 16,33057311


= LE
L

Considerando que são necessários 18 conglomerados de


conglomerados para atender ao limite de erro de 10%, deve-se
retornar à floresta e medir mais nove, visto que já foram medidos
nove.

361
Amostragem em inventário florestal Waldenei Travassos de Queiroz

q) números de conglomerados e de subparcelas ideais

Supondo:
C1 = R$12.000,00, C2 = R$1500,00 e C3 = R$250,00. Então:

C1 / C2 = 8 e C2 / C3 = 6

Considerando a população como infinita:

Vˆdd ( y ) 1. 983 ,9959


c1 [VˆC ( y)  ] 8 C 2 ( 826 ,9154  )
moti  u  4
VˆCC ( y )(c2  c3 u ) C
929 ,8139 (C 2  2  4 )
6
Vˆ ( y)
c1 [VˆC ( y)  dd ]
u 10.581,3232
moti    2,61
VˆCC ( y)(c2  c 3u ) 1549,689833
c 8C 2
Vˆ dd ( y )( 1  c2 ) 1.983,9959(  C2 )
u oti  m  5
c 3[mVCC ( y)  VˆC ( y)]
ˆ C2
(5  929,8139  826,9154)
6
c
Vˆdd ( y)( 1  c 2 )
m 5.158,38934
u o ti    2,38
c3 [mVC C ( y )  VˆC ( y )]
ˆ 912,66415

Esses resultados recomendam que a estrutura ótima deva


ter a unidade primária ou conglomerados de conglomerados
composta por três conglomerados e cada conglomerado con-
gregando três subparcelas.

362
Capítulo 10

INVENTÁRIO FLORESTAL CONTÍNUO

Apresenta metodologias sobre a aplicação das técnicas de


análise univariada com parcelas subdivididas (Split-Plot) e de
amostragem com substituição parcial (Sampling with Partial Re-
placement), em levantamentos com medidas repetidas no tempo
visando avaliar o caráter dinâmico do crescimento de uma flo-
resta. Mostra como analisar as tendências de crescimento pelo
método dos polinômios ortogonais explicando a decomposição
da soma de quadrados dos correspondentes efeitos polinomiais
ortogonais em: efeito linear, quadrático, etc. Mostra exemplos
aplicativos sobre todos os temas abordados.
Inventário florestal contínuo

Para avaliar o caráter dinâmico do crescimento de uma


floresta, por exemplo, após uma intervenção exploratória dos
recursos madeireiros, faz-se necessário proceder ao monitora-
mento, o qual é definido como o instrumento de avaliação do
processo de evolução e de recomposição das características
qualitativas e quantitativas da floresta. Na ciência florestal, este
procedimento é conhecido como Inventário Florestal Contínuo,
que corresponde a efetuar medições repetidas vezes no tempo,
ou seja, medições em várias ocasiões. Os sucessivos inventá-
rios florestais permitirão definir os intervalos ideais de colheita
dos produtos da floresta sob manejo sustentável.
Por outro lado, quando se procede às medições nas mes-
mas unidades de amostra, sucessivamente, em várias ocasiões,
evidentemente existirão correlações entre as ocasiões, as quais
devem ser consideradas nas análises estatísticas.
De acordo com o tipo de alocação das unidades de amos-
tra na população, a amostragem em múltiplas ocasiões pode ser
classificada em três maneiras distintas:

a) amostras independentes (parcelas temporárias)

Neste caso, as amostras mensuradas nas diversas ocasi-


ões são analisadas independentemente umas das outras, sendo
as unidades das amostras medidas definidas como temporárias;

b) amostras dependentes (parcelas permanentes)

Constitui-se em um problema de população multivariada,


onde as variáveis aleatórias, por exemplo, volume de madeira em
p-ocasiões, seguem uma distribuição de probabilidade com vetor
de médias Yv' = [Y1 , Y2 , L , Y p ] e matriz de covariâncias ∑ . A matriz

365
Amostragem em inventário florestal Waldenei Travassos de Queiroz

de covariâncias é uma matriz simétrica que contém na diagonal


principal as variâncias para cada uma das ocasiões e as covariân-
cias das ocasiões combinadas aos pares fora da diagonal.

V11 ( y) V12 ( y )  V1p ( y) 


V ( y) V ( y)  V2 p ( y) 

21 22

     
 
V p1 ( y) Vp 2 ( y )  V pp ( y) 

O inventário florestal contínuo com parcelas permanentes,


em termos da análise estatística, enquadra-se no grupo de expe-
rimentos com medidas repetidas, mais precisamente na classe
dos levantamentos longitudinais. Neste livro, considera-se que
cada unidade de amostra recebe um único tratamento e sucessi-
vamente no tempo mensuram-se as respostas correspondentes,
tendo-se como objetivo o estudo de curvas de crescimento e
análise de perfil.
Existem dois métodos com o propósito de testar as hipó-
teses sobre o efeito dos tratamentos e a correspondente varia-
ção ao longo do tempo. O primeiro adota um procedimento uni-
variado, tratando as observações medidas no tempo como se
fossem originadas de subdivisões das unidades experimentais
(split-plot), sendo estudado através do delineamento em parce-
las subdivididas ou divididas. O segundo método, denominado
de análise de perfil “profile analysis”, adota um procedimento
multivariado, ou seja, considera as observações repetidas sobre
cada unidade experimental como um vetor de respostas.
A aplicação da análise univariada (método de parcelas sub-
divididas), em experimentos de medidas repetidas no tempo, so-
mente é válida sob a pressuposição de uniformidade da matriz
de covariâncias. A matriz uniforme ocorre quando as ocasiões

366
Inventário florestal contínuo

apresentarem homogeneidade de variâncias e forem igualmente


correlacionadas ( ρ ).
1 ρ L ρ
ρ 1 L ρ 
∑ = V ( y)
L L L L
 
ρ ρ L 1

V ( y ) é a variância comum entre as unidades dentro das


ocasiões e ρ é a correlação comum entre as ocasiões combi-
nadas aos pares.
O procedimento adotado é selecionar e medir a amostra
na primeira ocasião, tornando as unidades de amostra perma-
nentes, sendo remedidas nas ocasiões restantes. Neste proce-
dimento, ocorrerão correlações entre as medições nas diversas
ocasiões, e que em termos da ciência florestal são importantes
para a interpretação do comportamento dos parâmetros envolvi-
dos na recomposição da floresta;

c) amostras mistas

Neste caso a amostra do inventário contínuo consiste em


estabelecer, conjuntamente, parcelas permanentes e temporá-
rias. No item 10.2 será visto o procedimento com amostra mista
denominado de Amostragem com Substituição Parcial (ASP), o
qual apresenta uma grande importância na área de inventário
florestal.

10.1 Método de análise de parcelas subdivididas

Seja um experimento com o delineamento inteiramente


ao acaso, em que m métodos silviculturais são aplicados em

367
Amostragem em inventário florestal Waldenei Travassos de Queiroz

n unidades experimentais, de modo que n j seja o número de


parcelas submetidas ao j-ésimo tratamento ( j = 1,2,L, m ) e as
observações sejam feitas, periodicamente, em p ocasiões dis-
tintas ( k = 1,2, L , p ).
m
n = ∑nj
j =1

Seja y ijk    t j  o k  to jk  e ijk o modelo matemático,


onde y ijk é a medida efetuada na i-ésima unidade de amostra
de tamanho n j ( i = 1,2, L , n j ), submetida ao j-ésimo tratamento,
e correspondente à k-ésima ocasião ( k = 1,2, L , p ); t j é o efeito
de tratamentos, ok é o efeito y ijk de
 ocasiões,
 t j  o k  to jk  é eoijkefeito de inte-
ração entre tratamentos e ocasiões.
São considerados fixos os efeitos dos tratamentos, das oca-
siões e da interação entre ocasiões e tratamentos e que a va-
riável eijk seja normalmente distribuída. O modelo em parcelas
subdivididas pressupõe que o desvio aleatório eijk é decomposto
em duas fontes independentes y ijk    t j de
ai (erros: a j ) jke bik ( j ) , sendo ai ( j )
j )  ok i (to
o componente referente à diferença individual da i-ésima unidade
dentro
y ijk do j-ésimo
 t j  ai (tratamento e
j )  ok  to jk  bik ( j )
o componente do erro refe-
rente à medida efetuada sobre a unidade i submetida ao trata-
mento j na ocasião k. Assim, o modelo apresenta a equação:
y ijk    t j  ai ( j )  ok  to jk  bik ( j )

Verifica-se que os tratamentos são aplicados sobre cada


unidade experimental, enquanto que as ocasiões são considera-
das como subdivisões dessas unidades. Nesse caso, os efeitos
principais de tratamentos são calculados sobre os totais de uni-
dades, e os efeitos da interação tratamentos × ocasiões a partir
das diferenças entre observações dentro das unidades.
As somas de quadrados, pressupondo normalidade dos

368
Inventário florestal contínuo

erros, apresentam distribuição c 2 e são mutuamente indepen-


dentes.
A Tabela 10.1 apresenta a análise de variância usual para
experimentos inteiramente ao acaso com tratamentos em parce-
las subdivididas. A presença ou ausência de interação entre trata-
mentos e ocasiões definirá o procedimento adequado para esta-
belecer os testes de comparações múltiplas. O procedimento de
ajustamento de curvas depende da ausência ou presença de inte-
ração tratamento x ocasião. No caso da interação ser significativa,
implica que os tratamentos se comportam de forma diferente em
relação às ocasiões. Porém, se não existir interação significa que
os tratamentos, no tempo, apresentam a mesma tendência.
Seja uma área florestal submetida a m tratamentos de
manejo, onde foi realizado um inventário florestal contínuo com
uma amostragem simples ao acaso de n unidades de amostra
considerando p ocasiões distintas, tal que n = n1 + n2 + L + nm .

Tabela 10.1 - Análise de variância: delineamento inteiramente ao acaso de


parcelas divididas.

C. variação G.L. S.Q. Q.M.


m 2
Tratamentos 1 1 2 y ... SQ1
p
m 1 SQ1  y . j.  QM 1 
(Trat) n np m 1
j 1 j
n
1 m j 2 1 m 1 2 SQ2
Erro (a) n m SQ2    yij.  p  n Y. j .
p j 1 i1
QM 2 
j 1 j nm
Ocasiões 1 p 2 y...2 SQ3
(Oca)
p 1 SQ3   ..
y 
n k1 k np
QM3 
p 1
m p
1 2 y2 SQ 4
Trat  Oca ( p  1)( m  1) SQ4   y. jk  ...  SQ1  SQ3 QM 4 
nj np ( p 1)( m 1)
j 1 k 1

SQ 5
Erro(b) ( p  1)(n  m) SQ5  SQ6  SQ1  SQ2  SQ3  SQ4 QM 5 
( p 1)( n  m)
nj p
m
2 y...2
Total
np  1 SQ6   yijk 
i 1 j 1 k 1 np

369
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Normalmente, em experimentos com parcelas divididas, o


interesse é testar as seguintes hipóteses:

H01: Não existência de efeito diferencial de tratamentos


H01: tj = 0 (j = l, , m) •••

QM 1
F1 
QM 2

H02: Não existência de efeito diferencial de ocasiões


H02: ok = 0 (k = l, , p) •••

QM 3
F2 
QM 5

H03: Não existência de efeito de interação entre tratamen-


tos e ocasiões
H03: tojk = 0 [( j = l, , m); (k = 1, , p)]
••• •••

QM 4
F3 
QM 5

Se H03 denota que o efeito da interação é não significativo,


resulta que todos os tratamentos apresentam a mesma tendên-
cia de crescimento. No entanto, se o efeito da interação é signifi-
cativo verifica-se que pelo menos um tratamento apresenta uma
tendência diferente.
A natureza da tendência é estudada através de curvas
apropriadas. Tratar-se-á, no exemplo a seguir, do ajustamento
de curvas polinomiais.

370
Inventário florestal contínuo

Exercício 10.1

Seja o ensaio instalado em 1980 por Yared (1983), na Esta-


ção Experimental do Centro de Pesquisas Agroflorestal da Ama-
zônia Oriental - CPATU, da Empresa Brasileira de Pesquisas
Agropecuária - EMBRAPA, no município de Belterra, estado do
Pará, e apresentado em Queiroz (1993b). Os dados da Tabe-
la 10.2 referem-se aos incrementos em altura (metros) de qua-
tro procedências de Cordia alliodora: (9/77: Honduras), (10/77:
Guatemala), (20/77: San Francisco – Honduras) e (19/77: Finca-
la Fortuna – Honduras). No ensaio foi usado o delineamento em
blocos ao acaso com 5 repetições e mensurado aos 6, 12, 18,
24 e 30 meses. A Tabela 10.3 apresenta a estrutura da análise
de variância de parcelas divididas em blocos ao acaso. A Tabela
10.4 mostra os valores totais das combinações Proc × Oca.

371
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Tabela 10.2 - Incrementos em altura (metros) das quatro procedências (Proc).

Meses Blocos
Proc. Média
(Oca) I II III IV V Total
9/77 6 0,59 0,37 0,52 0,52 0,44 2,44 0,49
12 0,51 0,49 0,42 0,37 0,40 2,19 0,44
18 0,24 0,78 0,45 0,41 0,31 2,19 0,44
24 0,54 0,69 0,31 0,50 0,36 2,40 0,48
30 0,35 0,44 0,18 0,11 0,21 1,29 0,26

Total - 2,23 2,77 1,88 1,91 1,72 10,51 -

10/77 6 0,68 0,55 0,59 0,58 0,60 3,00 0,60


12 0,74 0,36 0,46 0,42 0,43 2,41 0,48
18 0,65 0,51 0,63 0,31 0,52 2,62 0,52
24 0,38 0,39 0,31 0,24 0,40 1,72 0,34
30 0,48 0,20 0,06 0,21 0,19 1,14 0,23

Total - 2,93 2,01 2,05 1,76 2,14 10,89 -

20/77 6 0,63 0,58 0,69 0,50 0,49 2,89 0,58


12 0,90 1,05 0,87 0,71 0,78 4,31 0,86
18 1,11 1,14 1,12 0,98 1,04 5,39 1,00
24 0,96 0,85 1,02 0,65 0,91 4,39 0,88
30 0,60 0,40 0,59 0,62 0,40 2,61 0,52
Total - 4,20 4,02 4,29 3,46 3,62 19,59 -

19/77 6 0,65 0,58 0,44 0,54 0,26 2,47 0,49


12 0,79 0,69 0,77 0,81 0,23 3,29 0,66
18 0,79 0,87 0,73 0,72 0,54 3,65 0,73
24 0,79 0,77 0,69 0,35 0,53 3,13 0,63
30 0,61 0,51 0,25 0,41 0,49 2,27 0,45
Total - 3,63 3,42 2,88 2,83 2,05 14,81 -

Total - 12,88 12,22 11,10 9,96 9,53 55,80 -


geral

372
Inventário florestal contínuo

Tabela 10.3 - A análise de variância de parcelas divididas em blocos ao aca-


so.

Variação G.L. S.Q. Q.M.


Blocos r-1 r
SQBlo co s
y y2
2
i .. QM Blo cos 
SQBlo cos  i 1  ... r 1
mp rmp
Procedências m-1 m
SQ Proc
y 2
. j.
y2
QM Proc 
SQPr oc 
j 1
 ... m 1
rp rmp

Erro (a) (r - 1)(m - 1) r m


SQErro( a )
 y 2
ij.
y 2 QM Erro ( a) 
( r  1)(m  1)
i1 j 1 ...
SQ Er ro(a )  
p rmp
 SQBlo cos  SQ Pr oc

Ocasiões p-1 p
SQOca

k 1
y..2k
y 2
...
QM Oca 
p 1
SQOca  
rm rmp

Proc × Oca (m - 1)(p - 1) m p


Proc
 yj 1 k 1
2
. jk
y 2 Proc
...
SQProcOca  
r rmp
 SQPr oc  SQOca

Erro (b) m(r - 1)(p - 1) SQErr o(b )  SQTotal  SQBlo co s  SQPr oc SQErro (b )
 SQErr o( a)  SQOca  SQPr o c Oca QM Erro( b) 
m ( r  1( p  1)

Total rmp - 1 nj p
2
m y...2
SQTotal    yijk 
i1 j 1 k 1 rmp

373
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Tabela 10.4 - Valores totais das combinações: Proc × Oca.

Ocasiões Procedências Total


(meses)
9/77 10/77 20/77 19/77
6 2,44 3,00 2,89 2,47 10,80
12 2,19 2,41 4,31 3,29 12,20
18 2,19 2,62 5,39 3,65 13,85
24 2,40 1,72 4,39 3,13 11,64
30 1,29 1,14 2,61 2,27 7,31
Total 10,51 10,89 19,59 14,81 55,80

m = 4; r = 5; p = 5

a) análise de variância preliminar


r m p

 y
i 1 j  1 k  1
ij k  y...  55,80

r m p
2
 y
i1 j 1 k 1
ijk  36,7378

y ...2 55,80 2
C   31,1364
rmp 4  5 5
r

y
i1
2
i..  12,992  12,222  11,102  9,962  9,532  631,3010

y
j 1
2
. j.  10,512  10,89 2  19,59 2  14,812  832,1564

m r

 y 2
ij.  2,232  2,77 2    2,832  2,052  169,951
j 1 i 1
p

y
k 1
2
.. k 10,82  12,22  13,852  11,642  7,312  646, 2282

m p

 y 2
. jk  2, 44 2  2,19 2   3,13 2  2, 27 2  176,162
j 1 k 1

374
Inventário florestal contínuo

Portanto:
r m p
SQTotal   yijk  C  36,7378  31,1364  5,6014
2

i 1 j 1 k 1

1 r 2 1
SQBlo cos  
mp i 1
y i..  C 
4 5
 631,3010  31,1364  0,42865

1 m 2 1
SQPr oc  
rp j1
y . j.  C 
5 5
 832,1564  31,1364  2,149856

1 n m 2 169,951
SQErro( a)   yij  C  SQBlo cos  SQPr oc  5  31,1364  0, 42865  2,149856
p i 1 j 1 .
SQErro( a )  0,275294
1 p 2 1
SQO ca  
rm k 1
y.. k  C 
54
 646,2282  31,1364  1,17501
p
1m 1
SQPr oc Oca  Y 2jk  C  SQPr oc  SQOca  5  176,162  31,1364  2,149856  1,17501
r j 1 k 1 .
SQPr ocOca  0,771134
SQ Err o(b)  SQTotal  SQblo cos  SQProc  SQErro( a)  SQ Oca  SQ Pr ocOca
SQ Erro( b)  5,6014  0,42865  2 ,149856  0,275294  1,17501  0 ,771134
SQ Erro( b )  0 ,801456

Na Tabela 10.5 estão apresentados os resultados da análi-


se de variância preliminar.

Tabela 10.5 - Resultados da análise de variância preliminar.

Causas de variação GL SQ QM F
Blocos 4 0,4287 0,1072
Procedências 3 2,1499 0,7166 31,29 **
Resíduo (a) 12 0,2753 0,0229
Ocasiões 4 1,1750 0,2937 23,50 **
Procedência x Ocasião 12 0,7711 0,0643 5,14 **
Resíduo (b) 64 0,8015 0,0125
Total 99 5,6015 - -

F3;12 ;0 ,01  5,95; F4 ;64 ;0 ,01  3,65; F12 ; 64 ;0 ,01  2,50

375
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Se o efeito da interação fosse não significativo, então as


procedências apresentariam a mesma tendência de crescimen-
to em relação às ocasiões. No entanto, a análise de variância
mostra que a interação procedência x ocasião é altamente sig-
nificativa, o que demonstra que as procedências se comportam
de maneira diferente em relação às ocasiões. Neste caso, se
analisa as tendências através do ajustamento de curvas poli-
nomiais às médias ou totais de observações para cada ocasião
sobre cada procedência. O grau do polinômio para cada proce-
dência é obtido pela decomposição da soma de quadrados dos
correspondentes efeitos polinomiais ortogonais em: efeito linear,
quadrático, etc., até o grau p − 1.
Analisando-se as tendências através de curvas polino-
miais, deve-se desdobrar a variação de ocasiões e a interação
procedência x ocasião, nos componentes: ocasiões dentro da
procedência 9/77, ocasiões dentro da procedência 10/77, oca-
siões dentro da procedência 20/77, ocasiões dentro da proce-
dência 19/77, onde cada componente terá 4 graus de liberdade,
sendo então desdobrados nos efeitos: linear, quadrático, cúbico
e quarto grau. Neste exemplo, de acordo com Gomes (2000),
como se têm cinco ocasiões igualmente espaçadas, os coefi-
cientes dos polinômios ortogonais são os mostrados na Tabela
10.6. A Tabela 7 do Anexo apresenta os coeficientes para inter-
polação de polinômios ortogonais até onze ocasiões.

376
Inventário florestal contínuo

Tabela 10.6 - Coeficientes dos polinômios ortogonais.

Ocasiões (p = 5)
Total Tratamento
1° Grau (c1) 2° Grau (c2) 3° Grau (c3) 4° Grau (c4)
-2 +2 -1 +1 10,80
-1 -1 +2 -4 12,20
0 -2 0 +6 13,85
+1 -1 -2 -4 11,64
+2 +2 +1 +1 7,31

Da teoria dos polinômios ortogonais, têm-se as seguintes fór-


mulas para calcular a soma de quadrados para cada componente:
p p
( C1iTi ) 2 ( C2i Ti ) 2
i 1
SQ Linear  ; SQQuadrático  i 1
;
rK1 rK 2
p
( C4i Ti )2
p
( C3iTi ) 2
i1
SQCúbico  i 1
; SQ 40 grau 
rK 3 rK 4

C1, C2, C3, C4 representam os coeficientes dos polinômios


ortogonais;
Ti = reporta os totais dos tratamentos nas p ocasiões;
K1, K2, K3, K4 são as somas de quadrados dos coeficientes
dos polinômios ortogonais.

b) análise de variância final

Para estudar o comportamento das ocasiões dentro de


cada procedência é necessário desdobrar interação Proc x Oca.
De acordo com a Tabela 10.4, tem-se:

( 2,44 2  2,19 2  2,192  2,40 2  1,29 2 ) 10,512


1) SQ. Oca . d . 9 / 77    0,175576
5 5 5

377
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Desdobrando SQ . Oca.d.9/77 nos efeitos: linear, quadrático,


cúbico e quarto grau:
O termo SQ . Oca.d.9/77 significa soma de quadrados do
fator ocasião dentro do tratamento 9/77.

Note que:

SQ. Oca. d . 9 / 77  SQ1  SQ2  SQ3  SQ4


0 0 0 0

SQ1  SQ 2  SQ 3  SQ 4  0,087362  0, 032572857  0, 049298  0,0063431428 57


0 0 0 0

SQ10  SQ2 0  SQ30  SQ4 0  0,175575999

378
Inventário florestal contínuo

(3,002  2 ,412  2,62 2  1,72 2  1,14 2 ) 10,892


2) SQ. Oca. d .10 / 77    0,442416
5 5 5

Desdobrando SQ . Oca.d.10/77 nos efeitos: linear, quadráti-


co, cúbico e quarto grau:

Note que:
SQ Oca d . 10 / 77  SQ1  SQ 2  SQ 3  SQ 4
0 0 0 0

SQ1  SQ 2  SQ 3  SQ 4  0,388962  0,016 972857  0, 00460 8  0,031 873142


0 0 0 0

SQ. Oca. d .10 / 77  0,442415999

379
Amostragem em inventário florestal Waldenei Travassos de Queiroz

(2,89 2  4,312  5,392  4,392  2,612 ) 19,59 2


3) SQ. Oca. d . 20 / 77    1,062176
5 5 5

Desdobrando SQ . Oca.d.20/77 nos efeitos: linear, quadráti-


co, cúbico e quarto grau:

Note que:
SQ. Oca. d .20 / 77  SQ10  SQ20  SQ30  SQ4 0
SQ1  SQ2  SQ3  SQ4  0 ,004608  1,027291429  0,003872  0,026404571
0 0 0 0

SQ. Oca. d .20 / 77  SQ10  SQ20  SQ30  SQ4 0  1,062176

380
Inventário florestal contínuo

4)

Desdobrando SQ . Oca.d.19/77 nos efeitos: linear, quadráti-


co, cúbico e quarto grau:

Note que:
SQ. Oca . d .19 / 77  SQ1 0  SQ 20  SQ30  SQ4 0
SQ1  SQ2  SQ3  SQ 4  0,006272  0,256822857  0,000288  0,002633142857
0 0 0 0

SQ10  SQ 20  SQ30  SQ4 0  0,266015999

381
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Observando que:
SQ
SQ .. Oca
Oc a d.9 77+SQ
d . 9/ /77 SQ..Oca
Oca.. dd 10 77 +SQ
10 // 77 SQ.. Oca
Oca.. dd.. 20
20 // 77 + SQ
77  Oca
SQ .. Oc a. .dd.19
. 19/ 77 SQOca+SQ
/ 77=SQ SQProc x Oca
Oca Pr o c Oc a

SQ. Oca d .9 / 77  SQ.Oca. d 10 / 77  SQ. Oca. d .20 / 77  SQ.Oca. d .19 / 77 


0 ,175576  0,442416  1,062176  0,266016  1,9461

Sendo:
SQOca + SQProc x Oca = 1,1750 + 0,7711 = 1,9461

A Tabela 10.7 apresenta o resultado da análise de variân-


cia final.
Tabela 10.7 - Análise de variância final.

Causas de variação GL SQ QM F
Blocos 4 0,4286 0,1071 -
Procedências 3 2,1400 0,7166 31,29 **
Resíduo (a) 12 0,2754 0,0229 -
Ocasiões d. Procedências (16) (1,9462) - -
Ocasiões d. Procedência 9/77 (4) 0,0439 -
Efeito linear 1 (0,1756) 0,0874 6,99 *
Efeito quadrático 1 0,0874 0,0326 2,61
Efeito cúbico 1 0,0326 0,0493 3,94
Efeito de 40 grau 1 0,0493 0,0063 0,50
0,0063 -
Ocasiões d. Procedência 10/77 (4) (0,4424) 0,1106 8,85
Efeito linear 1 0,3890 0,3890 31,12 **
Efeito quadrático 1 0,0170 0,0170 1,36
Efeito cúbico 1 0,0046 0,0046 0,37
Efeito de 40 grau 1 0,0319 0,0319 2,55
Ocasiões d. Procedência 20/77 (4) (1,0622) 0,2655 21,24
Efeito linear 1 0,0046 0,0046 0,37
Efeito quadrático 1 1,0273 1,0273 82,18 **
Efeito cúbico 1 0,0039 0,0039 0,31
Efeito de 40 grau 1 0,0264 0,0264 2,11
Ocasiões d. Procedência 19/77 (4) (0,2660) 0,0665 5,32
Efeito linear 1 0,0063 0,0063 0,50
Efeito quadrático 1 0,2568 0,2568 20,64 **
Efeito cúbico 1 0,0003 0,0003 0,02
Efeito de 40 grau 1 0,0026 0,0026 0,21
Resíduo (b) 64 0,8014 0,0125 -
Total 99 5,6014 - -
* significativo ao nível de 95% de confiança
** significativo ao nível de 99% de confiança

382
Inventário florestal contínuo

Os resultados da análise de variância mostrados na Ta-


bela 10.7, demonstram que as procedências 9/77 e 10/77
possuem tendências lineares de crescimento do incremento
(Yi  a  bX i  ei ) ; enquanto as tendências de crescimento do
incremento das procedências 20/77 e 19/77 são descritas pelo
modelo quadrático Yi  a  bX  cX 2  e i . A Figura 10.1 confirma
esses resultados.

6
INCREMENTO EM ALTURA (m)

5
4 T9/77
3 T10/77
T20/77
2
T19/77
1
0
6 12 18 24 30
OCASIÕES (meses)

Figura 10.1 - Tendências do crescimento do incremento em altura.

A Tabela 10.8 mostra as comparações dos valores médios


dentro de cada ocasião, para as procedências que apresenta-
ram as mesmas tendências, através do teste de “t” de Student,
para tratamentos independentes (procedências).

383
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Tabela 10.8 - Comparação dos incrementos dentro de cada ocasião (Teste


“t”).

Ocasiões Procedência 9/77 Procedência 10/77 Valor “t”


Médias Variâncias Médias Variâncias
6 0,4880 0,00717 0,6000 0,00235 -2,5668 *
12 0,4380 0,00357 0,4820 0,02210 -0,6141 ns
18 0,4380 0,0434 0,5240 0,01830 -0,7742 ns
24 0,4800 0,0229 0,3440 0,00463 1,8328 ns
30 0,2580 0,0180 0,2280 0,02360
Ocasiões Procedência 20/77 Procedência 19/77 Valor “t”
Médias Variâncias Médias Variâncias
6 0,5780 0,00727 0,4940 0,0229 1,0814 ns
12 0,8620 0,01670 0,6580 0,0593 1,6547 ns
18 1,0780 0,00442 0,7300 0,0149 5,5984 **
24 0,8780 0,02020 0,6260 0,0343 2,4137 *
30 0,5220 0,01250 0,4540 0,0181 0,8692 ns

t 8;0 ,05 2 ,3060


t8 ;0 ,013,3554
Os resultados mostram diferença somente na primeira oca-
sião (6 meses) entre os incrementos das procedências 9/77 e
10/77, concluindo-se pela não existência de coincidência nos
perfis de crescimento.
Denota-se diferença entre as procedências 20/77 e 19/77
nas ocasiões 18 meses e 24 meses, concluindo-se pela não
existência de coincidência nos perfis de crescimento.

10.2 Modelo de amostragem com substituição par-


cial

A Amostragem com Substituição Parcial – ASP (“Sampling


with Partial Replacement”) reporta-se ao problema da amostra-
gem de uma população multidimensional. Para melhor enten-
dimento, seja o caso de uma população bivariada, tal que as

384
Inventário florestal contínuo

variáveis aleatórias x e y possuem distribuição de probabilidade


com vetor de médias Yv desconhecido e matriz de covariâncias
 conhecida.
Visando apresentar o desenvolvimento teórico da ASP,
sejam três subamostras aleatórias com as dimensões k, m e n
e estatisticamente independentes. O método consiste na me-
dição da característica x, que representa o volume de madeira
na primeira ocasião, somente nas unidades da subamostra de
tamanho k. Na subamostra de tamanho m são medidas as ca-
racterísticas x e y, sendo y o volume de madeira na segunda
ocasião. Nas unidades da subamostra de dimensão n somente
a característica y é medida.
Verifica-se que a subamostra de tamanho n, na verdade, pode
ser interpretada como substitutiva da subamostra k e, por essa
razão, essas subamostras são interpretadas como uma Amostra-
gem com Substituição Parcial (ASP). Obviamente, o procedimento
pode evoluir para três ou mais ocasiões. Informações mais deta-
lhadas sobre a amostragem com substituição parcial podem ser
encontradas em Cunia (1974) e em Cunia e Chevrou (1969).

10.2.1 Estimador ASP de µ x e sua variância V ( µˆ x )

Seja um levantamento florestal contínuo onde se deseja esti-


mar os volumes médios de madeira em uma determinada ocasião
( x ) e em outra ocasião subsequente ( y ), bem como estimar o
incremento médio em volume entre essas duas ocasiões ( y − x ).
Sejam as observações concernentes às subamostras de
dimensões k, m e n, selecionadas inteiramente ao acaso e men-
suradas para as características x e y, conforme o critério ASP.
x1 , x 2 ,..., x k , x k +1 , x k + 2 ,..., x k + m , y k +1 , y k + 2 ,..., y k + m , y k + m +1 , y k + m + 2 ,..., y k + m + n

385
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Seja µ̂ x a forma geral do estimador linear e não tendencio-


so da média aritmética µ x:
µ̂ x = a1 x1 + L + a k x k + a k +1 x k +1 + L + a k + m x k + m + c k +1 y k +1 + L + c k + m y k + m
+ c k + m +1 y k + m +1 + L + c k + m + n y k + m + n

Sob o argumento de que x e y estão na mesma amostra


e caracterizados pelo mesmo tratamento, pode-se formular µˆ x ,
como:
µ̂ x = a k x k + a m x m + c m y m + c n y n (10.1)

Por conseguinte:
E ( µˆ x ) = a k E ( x k ) + a m E ( x m ) + c m E ( y m ) + c n E ( y n )
E ( µˆ x ) = a k µ k + a m µ k + c m µ y + c n µ y
E ( µˆ x ) = (a k + a m ) µ x + (c m + c n ) µ y

Para que E ( µˆ x ) = µ x , então a k = 1 − a m e c m = −c n , tal que


efetuando as substituições na Equação 10.1, obtém-se:

µˆ x = x k − a m ( x k − x m ) + c n ( y n − y m ) (10.2)

V ( x) V ( x)
Dado que V ( x k ) = e V ( xm ) = , então:
k m
V ( x) V ( x)
V ( xk − xm ) = +
k m
Pois os estimadores x k e x m são estatisticamente inde-
pendentes.
Dado que y n e y m são estatisticamente independentes,
tem-se:
V ( y) V ( y)
V ( yn − ym ) = +
n m

386
Inventário florestal contínuo

Pois:
V ( x)
cov( x k , x k − x m ) = ; cov( xk , y n − y m ) = 0;
k
V ( x, y )
cov( x k − x m , y n − y m ) = .
m
Então a variância de µ̂ x é dada pela expressão:
V ( x) 1 1 1 1 V ( x) V ( x, y )
V (ˆ x ) 
k
 a m2V (x)(  )  c2nV ( y)(  )  2a m
k m m n k
 2a m cn
m
(10.3)

Diferenciando-se a Expressão 10.3 em relação aos coefi-


cientes a m e c n e anulando as derivadas parciais, obtém-se o
ponto crítico dado em 10.4 e 10.5.

1 1 V ( x, y) V ( x) V ( x, y) 1 1
dV ( ˆ x )  [ 2amV ( x)(  )  2cn 2 ]dam  [2am  2c nV ( y )(  )]dcn  0
k m m k m m n

Logo:
 1 1 V ( x, y) V (x )
 2a mV ( x )( k  m )  2c n m  2 k  0

  2 a V ( x, y)  2 c V ( y)( 1  1 )  0
 m
m
n
m n

Concluindo que:
m(m  n)
am  (10.4)
(k  m)(m  n)  kn 2
mnBx y
cn  (10.5)
(k  m)(m  n)  kn 2
Dado que:
V ( x, y ) V ( x, y) 2
B xy  ; B yx  ;   B xy B yx
V ( y) V ( x)

387
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Para verificar a natureza do ponto crítico pela matriz Hes-


siana, seja a diferencial de segunda ordem de V ( µˆ x ) :

Escrevendo na forma matricial, resulta:

A expressão d 2V ( µˆ x ) é uma função homogênea do tipo


QQ(x x v' , tal que x v' = ( x1 , x 2 ,..., x n ) ∈ R n e A == ((a
( x vv) == xxvvAx
A aijij) n×n é uma
matriz real. A função Q( x v ) é denominada forma quadrática e A
é chamada de matriz da forma quadrática e denominada de ma-
triz Hessiana, a qual possui seus elementos calculados no ponto
crítico.
Uma forma quadrática é dita positiva definida somente se
Q( x v ) > 0 , tal que ∀x v ∈ R n e Q( x v ) = 0 ⇔ x v = 0 v . Esta mesma
definição vale para a matriz da forma quadrática A , devido à
correspondência biunívoca entre a forma quadrática e a matriz
da forma quadrática.
O próximo passo é verificar se a matriz Hessiana é positiva
definida, e, assim, comprovar que am e c n , obtidos, respectiva-
mente, pelas Equações 10.4 e 10.5, tornam mínima V ( µˆ x ). ),

V ( x) 1 1 1 1 V ( x) V ( x, y )
V (ˆ x )   am2 V ( x)(  )  c n2V ( y )(  )  2am  2 am cn
k k m m n k m

388
Inventário florestal contínuo

Seja H a matriz Hesssiana:


 1 1 V ( x, y) 
 2V ( x)( k  m ) 2
m 
H
V ( x, y) 1 1 
 2 2V ( y )(  )
 m m n 

De acordo com Searle (1971) e Ware e Cunia (1962), den-


tre outros autores, para que uma matriz 2 × 2 seja definida posi-
tiva, o determinante e os elementos da diagonal principal devem
ser positivos. Neste caso, resulta:
1 1 1 1
2V ( x )(  )  0 e 2V ( y )(  )  0 , faltando verificar se
k m m n
det[H ] é positivo.

Multiplicando pela quantidade sempre positiva


(km n) [4V ( x)V ( y)], o sinal do det[H ] não se altera:
2

km 2 n
[ ]detH  m 2  mn  km  kn  kn 2  0
4V ( x )V ( y )

Como det[H ] > 0 , conclui-se que a matriz Hessiana é defi-


nida positiva, logo, V ( µˆ x ) é mínima para os coeficientes a m e c n
dados em 10.4 e 10.5.

Finalmente, substituindo a m e c n na equação de V ( µˆ x).),


Tem-se:
V ( x) mn 2
V (ˆ x )  [1  ]
k m (k  m)(m  n)  kn 2

10.2.2 Estimador ASP de µ y e sua variância V ( µˆ y )

O estimador ASP pode ser deduzido diretamente da fórmu-

389
Amostragem em inventário florestal Waldenei Travassos de Queiroz

la correspondente ao estimador µ̂ x , pois o modelo matemático


é simétrico com respeito às variáveis x e y, resultando:
' '
ˆ y  y  a m ( x k  x m )  c n ( y n  y m )

Utilizando os mesmos procedimentos usados para obter


µ̂ x , têm-se:
 kmB y x
am'  2
(k  m)(m  n)  kn
 m(k  m)
cn'  2
( k  m)( m  n)  kn
V ( y) km 2
V (ˆ y )  [1  ]
m n ( k  m)(m  n)  kn 2

10.2.3 Covariância entre os estimadores ASP µ̂ x e µ̂ y

Dado:

µˆ x = x k − a m ( x k − x m ) + c n ( y n − y m )

µˆ y = y n − a m' ( x k − x m ) + c n' ( y n − y m )

Então, pela definição de covariância:


Cov ( ˆ x , ˆ y )  E {[ ˆ x  E (ˆ x )][ˆ y  E (ˆ y )]}

Desenvolvendo, resulta que:

mV ( x, y )
Cov ( ˆ x , ˆ y )  2
(k  m )( m  n)  kn

390
Inventário florestal contínuo

10.2.4 Estimador ASP de µ d e sua variância V ( µˆ d )

Dado que:
k +m

∑x i
kx k + mx m
xk +m = i =1
=
k+m k+m
k +m+n

∑y
i = k +1
i
my m + ny n
y m+n = =
m+n m+n
Como E ( x k ) = E ( x n ) = E ( x ) = µ x e E ( y m ) = E ( y n ) = E ( y ) = µ y :
my m + ny n kx k + mx m
d = y m+n − xk +m = −
m+n k+m
Resultando:
V ( x) V ( y) 2 mV ( x , y)
V (d )   
k  m m  n (k  m )( m  n)

Shiver e Border (1996), utilizando as definições e os ar-


gumentos apresentados anteriormente para obter µ̂ x e µ̂ y , de-
monstram que:
ˆ d  ad ym  (1  a d ) y n  bd x m  (1  bd ) x k
m(k  m)  mnB xy
ad  2
(k  m)(m  n )  kn
 m(m  n )  kmB yx
bd  2
(k  m)(m  n)  kn
2 V ( y) 2 V ( y) V (x) 2 V (x) V (x, y)
V ( ˆ d )  a d  (1  ad )  bd  (1  bd )  2a d bd
m n m k m

391
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Exercício 10.2

Seja o exemplo citado em Queiroz (1983) de um inventário


florestal realizado em duas ocasiões, através da amostragem com
substituição parcial, tal que a medição da primeira ocasião ocor-
reu em k + m = 40 unidades de amostra (Ua), enquanto a medição
da segunda ocasião ocorreu em m + n = 30 unidades de amostra,
sendo m = 20 o número de parcelas permanentes medidas nas
duas ocasiões. A Tabela 10.9 apresenta os valores volumétricos.
Neste exemplo, utilizar o valor t = 2,00 (Estatística “t” de Student).

Tabela 10.9 - Volume (m3/ ha).

Ua x y UA x y
1 5,66 - 26 6,04 13,85
2 16,26 - 27 9,30 15,07
3 12,40 - 28 18,20 19,73
4 7,56 - 29 12,42 16,64
5 11,88 - 30 11,38 16,10
6 11,48 - 31 13,92 17,16
7 9,86 - 32 9,40 15,23
8 12,74 - 33 15,66 19,05
9 9,18 - 34 8,20 14,82
10 12,14 - 35 10,30 15,68
11 9,64 - 36 12,04 16,82
12 11,08 - 37 12,08 16,44
13 7,68 - 38 13,70 17,30
14 16,00 - 39 8,90 15,11
15 5,74 - 40 8,72 15,24
16 2,52 - 41 - 14,45
17 11,04 - 42 - 15,60
18 8,90 - 43 - 15,50
19 9,18 - 44 - 18,54
20 17,88 - 45 - 13,32
21 10,06 15,55 46 - 15,50
22 10,82 15,91 47 - 18,41
23 10,56 15,81 48 - 15,52
24 7,48 14,42 49 - 14,26
25 8,94 14,99 50 - 16,50

Fonte: Queiroz (1983)

392
Inventário florestal contínuo

a) estimativas das médias e das variâncias não conside-


rando a ASP

a1) estimativas para a primeira ocasião da subamostra de


tamanho k
k

x i
208,82
i 1
xk    10,441 m 3 / ha
k 20
k

k
(  xi ) 2
x i2  i 1 208 ,82 2
 k
2446,4756 
20
Vˆk ( x)  i1
  14 ,009788 (m 3 / ha ) 2
k 1 19
Vˆ ( x ) 14,009788
Vˆ ( xk )  k   0,7004894 ( m3 / ha) 2
k 20

a2) estimativas para a primeira ocasião da subamostra de


tamanho m
k m

 xi
i k  1 218,12
xm    10,906 m 3 / ha
m 20
k m

km
(  xi ) 2
218,12 2
x i
2
 i k  1

m
2538,1544 
20
Vˆm ( x )  i k  1
  8,3861937 ( m3 / ha ) 2
m 1 19
Vˆm (x ) 8,3861937
Vˆ ( x m ) 
3 2
  0,4193096 (m / ha )
m 20

a3) estimativas para a primeira ocasião da amostra de ta-


manho k + m
k m


i 1
xi
426,94
x k m    10 ,6735 m 3 / ha
k m 40
k m

k m
(  xi ) 2
426,94 2
x 2
 i 1
4984,6300 
 393
i
k m 40  10,966305 (m 3 / ha ) 2
Vˆk  m ( x)  i 1

k  m 1 39
Vˆ ( x ) 10 ,9663
Vˆ ( x k m )  k m   0 ,2741576 ( m 3 / ha ) 2
k m 40
s( x k m )  Vˆ ( x k m )  0, 2741576  0,523601 m3 / ha
k m


i 1
x
Amostragem em inventário florestal
i
426,94 Waldenei Travassos de Queiroz
x k m    10 ,6735 m 3 / ha
k m 40
k m

k m
(  xi ) 2
426,94 2
x i
k m
2
 i 1
4984,6300 
40  10,966305 (m 3 / ha ) 2
Vˆk  m ( x)  i 1

k  m 1 39
Vˆ ( x ) 10 ,9663
Vˆ ( x k m )  k m   0 ,2741576 ( m 3 / ha ) 2
k m 40
s( x k m )  Vˆ ( x k m )  0, 2741576  0,523601 m3 / ha

a4) limite de erro para a estimativa x k + m (primeira ocasião)


t  s( xk  m ) 2  0 ,523601
LE ( xk  m )   100   100  9,81 %
xk  m 10, 6735

a5) estimativas para a segunda ocasião da subamostra de


tamanho m
k m

 yi
i k 1 320,92
ym    16,046 m 3 / ha
m 20
k m

k m
(  yi ) 2
320,92 2
 y i2 
m
i k 1
5189,6846 
Vˆm ( y)  ik 1  20  2,1159095 (m3 / ha) 2
m 1 19
ˆ
V ( y ) 2,1159095
Vˆ ( y m )  m   0,1057954 ( m3 / ha) 2
m 20

a6) estimativas para a segunda ocasião da subamostra de


tamanho n
k m n

y i
157,60
ik m 1
yn    15,76 m3 / ha
n 10
k  mn

k  mn
( y ) i
2

157,602
 y i2  i k  m1

n
2509,213 
10
Vˆn ( y )  i k m 1   2,8263 (m3 / ha )2
n 1 9
ˆ
V n ( y ) 2,8263
Vˆ ( y n ) 
3 2
  0, 2826 ( m / ha)
n 10
394
y i
157,60
ik m 1
yn    15,76 m3 / ha
n 10
k  mn

k  mn
( y ) i
2

157,602
 y i2 
n
i k  m1
2509,213 
10
Inventário florestal contínuo
Vˆn ( y )  i k m 1   2,8263 (m3 / ha )2
n 1 9
Vˆn ( y ) 2,8263
Vˆ ( y n ) 
3 2
  0, 2826 ( m / ha)
n 10

a7) estimativas para a segunda ocasião da amostra de ta-


manho m + n
k m n

y i
478,52
i k 1
y m n    15,9507 m 3 / ha
m n 30
mn
2
k  m n ( yi ) 2
2 i 1 478,52
 yi 
m n
7698,897 
30
Vˆm n ( y)  i k 1 3 2
  2, 2822064 (m / ha)
m  n 1 29
Vˆ ( y ) 2,2822064
Vˆ ( y mn )  mn   0,076073546 (m3 / ha) 2
m n 30
s( y )  Vˆ ( y )  0,076073546  0,275814 m / ha
3
m n mn

a8) limite de erro para a estimativa y m + n (segunda ocasião)


t  s ( y m n ) 2  0,275814
LE ( y m n )  100  100  3, 46 %
y m n 15,9507

a9) estimativas do incremento para a subamostra de tamanho m

395
Amostragem em inventário florestal Waldenei Travassos de Queiroz

a10) limite de erro da estimativa do incremento consideran-


do a subamostra m (parcelas permanentes)
t  s(d m ) 2  0,329826
LE (d m )  100  100  12,83 %
dm 5,14

a11) estimativas do incremento para as subamostras de


tamanhos n e k

d nk  y n  xk  15,76  10,441  5,319 m 3 / ha


Vˆ ( y) Vˆk ( x ) 2 ,8263 14,009788
Vˆ ( d nk )  n     0 ,983119 ( m 3 / ha ) 2
n k 10 20

a12) estimativas do incremento considerando as subamos-


tras m + n e k + m
d (m n)(k  m)  y m n  xk  m  15,9507  10, 6735  5,2772 m 3/ ha
Vˆ ( y ) Vˆk m ( x) 2mVˆm ( x, y )
Vˆ (d )  mn  
m n k  m (k  m)(m  n)
2,2822 10 ,9663 4,16312
Vˆ ( d )    2  20   0,211460 ( m 3 / ha ) 2
30 40 40  30
s( d )  Vˆ ( d )  0, 211460  0,4598478 m 3 / ha

a13) limite de erro da estimativa do incremento consideran-


do as subamostras m + n e k + m
t  s (d ) 2  0, 4598478
LE (d )   100   100  17,43 %
d 5,2772

b) estimativas ASP para a primeira ocasião

b1) estimativa da média µ̂ x

396
Inventário florestal contínuo

Dado que:

Tal que:
Vˆ ( x , y ) 4 ,16312
Bˆ xy  m   1,9675322
Vˆm ( y ) 2,1159095
[Vˆm ( x, y)] 2 4 ,16312 2
ˆ 2    0 ,976733
Vˆm ( x)  Vˆm ( y) 8,3861937  2,1159095

Então:
ˆ x  xk  aˆ m ( xk  xm )  cˆ n ( yn  ym )
ˆ x  10,441  0,5972208 (10,441  10,906 )  0,39168337 (15,76  16,046)
3
ˆ x  10,606686 m / ha

b2) estimativa da variância Vˆ ( µˆ x )


Vˆ ( x ) mnˆ 2
Vˆ ( ˆ x )  k m [1  ]
k m ( k  m )(m  n )  kn ˆ 2
10,9663 20  10  0, 976733
Vˆ ( ˆ x )  (1  )  0, 22084983 (m 3 / ha) 2
40 40  30  20  10  0, 976733

Sendo:
s(ˆ x )  Vˆ ( ˆ x )  0,22084983  0,469947 m3 / ha

397
Amostragem em inventário florestal Waldenei Travassos de Queiroz

b3) limite de erro da estimativa ASP µ̂ x (primeira ocasião)


t  s( ˆ x ) 2  0 ,469947
LE ( ˆ x )   100   100  8,86 %
ˆ x 10 ,606686

c) estimativas ASP para a segunda ocasião

c1) estimativa da média µ̂ y


kmBˆ yx 20 20 0,4964254
aˆ 'm    0,1976504
( k  m)(m  n)  kn ˆ 2 ( 20  20)(20 10)  2010 0,976733
m( k  m) 20 ( 20  20 )
cˆ n'  2
  0 ,7962945
( k  m)( m  n )  knˆ 1004,6534

Dado que:
Vˆ ( x , y) 4,16312
Bˆ yx  m   0, 4964254
ˆ
Vm ( x) 8,3861937

Então:
ˆ y  y n  aˆ'm ( xk  xm )  cˆn' ( yn  ym )
ˆ y  15 , 76  [  0,1976504 (10 ,441  10 , 906 )]  0, 7962945 (15, 76  16 , 046 )
ˆ y  15 ,89583279 m 3 / ha

c2) estimativa da variância Vˆ ( µˆ y )

Vˆ ( y) kmˆ 2
Vˆ (ˆ y )  m n [1  ]
m n (k  m)(m  n)  kn ˆ 2
2 ,2822 20  20  0 ,976733
Vˆ ( ˆ y )  (1  )  0 ,04648966 ( m 3 / ha )2
30 1004 ,6534

398
Inventário florestal contínuo

Resultando:
s ( ˆ y )  Vˆ ( ˆ )  0,04648966  0,215614609 m 3 / ha

c3) limite de erro da estimativa ASP µ̂ y (segunda ocasião)


t  s ( ˆ y ) 2  0, 215614609
LE ( ˆ y )   100   100  2,71 %
ˆ y 15 ,89583279

d) estimativas ASP para o incremento

d1) estimativa da média ( µ̂ d )

Dado:

Então:

A estimativa do incremento µ̂ d também pode ser obtida


pela expressão:
ˆ d  ˆ y  ˆ x  15,89583279  10,606686  5,2891466 m3 / ha

399
Amostragem em inventário florestal Waldenei Travassos de Queiroz

d2) estimativa da variância Vˆ ( µˆ d )

Vˆ ( y ) Vˆ ( y ) ˆ 2 Vˆm ( x) Vˆ ( x) Vˆ ( x, y )
Vˆ ( µˆ d ) = aˆ d m + (1 − aˆ d ) 2 n + bd + (1 + bˆd ) 2 k + 2aˆ d bˆd m
m n m k m

Tal que:
Vˆ (ˆ d )  V1  V 2
Vˆm ( y) Vˆ ( y) ˆ 2 Vˆm ( x)
V1  aˆ d  (1  aˆ d ) 2 n  bd
m n m
Vˆk ( x) Vˆ ( x, y )
V2  (1  bˆd ) 2  2 aˆ d bˆd m
k m
2 2,116 2 2,8 26 2 8,386
V1  1,1879 78262   (1  1,18797826 2)   ( 0, 79487114 6) 
20 10 20
V1  0,424222818
14,01 4,16312
V2  (1  0,794871146 ) 2   2  1,187978262  ( 0,794871146 ) 
20 20
V 2   0,363643578
Vˆ ( ˆ d )  V1  V 2  0,06057924 ( m / ha )
3 2

Sendo:
s( ˆ d )  Vˆ ( ˆ d )  0 ,06057924  0, 246128503 m 3 / ha

d3) limite de erro da estimativa ASP da média do incremen-


to ( µ̂ d )
t  s (ˆ d ) 2  0,246128503
LE ( ˆ d )   100   100  9,31%
ˆ d 5,2891466

f) discussão dos resultados e conclusões

Os resultados, apresentados na Tabela 10.10, demonstram


que os procedimentos com substituição parcial são mais eficien-

400
Inventário florestal contínuo

tes que os seus correspondentes não SPR, pois apresentam va-


lores menores para os limites de erro.

Tabela 10.10 - Limites de erro das principais estimativas.

Estimadores Estimativas Limites de erro

xk +m 10,6735 9,81

y m+n 15,9507 3,46

d = y m+n − xk +m 5,2772 17,43

dm 5,1400 12,83

µ̂ x 10,6067 8,86

µ̂ y 15,8958 2,71

µ̂ d 5,2891 9,31

Definindo-se eficiência como a razão entre os limites de


erro, têm-se:

f1) estimador µ̂ x versus x k + m


LE ( x k  m ) 9 ,81 %
Ef   100   1,1072
LE ( ˆ x ) 8,86 %

O estimador da primeira ocasião µ̂ x é 10,72% mais eficien-


te que o estimador x k + m .

f2) estimador µ̂ y versus y m + n


LE ( y m n ) 3 ,46 %
Ef   100   1,2768
LE ( ˆ y ) 2 ,71 %

O estimador da segunda ocasião µ̂ y é 27,68% mais efi-


ciente que o estimador y m + n .

401
Amostragem em inventário florestal Waldenei Travassos de Queiroz

f3) estimador µ̂ d versus d = y m + n − x k + m


LE ( d ) 17 ,43 %
Ef   100   1,8722
ˆ
LE (  d ) 9 ,31 %

O estimador para o incremento médio entre as duas ocasi-


ões µ̂ d é 87,22 % mais eficiente que o estimador d = y m + n − x k + m .

f4) estimador µ̂ d versus d m = y m − xm


LE ( d m ) 12 ,83 %
Ef   100   1,3781
LE ( ˆ d ) 9 ,31 %

O estimador para o incremento médio entre as duas ocasi-


ões µ̂ d é 37,81 % mais eficiente que d m = y m − xm (parcelas per-
manentes).

402
Capítulo 11

FORMA E TAMANHO DAS UNIDADES


DE AMOSTRA

Mostra a importância em utilizar um tamanho adequado de


unidade de amostra em inventário florestal, explanando ser ló-
gico existir um intervalo ideal de tamanhos, onde a eficiência é
máxima e o custo é mínimo. Aborda os principais fatores que
influenciam o tamanho e a forma das parcelas. Apresenta pes-
quisas comparando a eficiência em relação ao nível de precisão
de inventários florestais, considerando diversos tamanhos de
unidades de amostra. Discorre sobre vários métodos para obter
o tamanho ideal da parcela quando a precisão estatística é o
critério utilizado.
Forma e tamanho das unidades de amostra

Inicialmente, pode-se afirmar não existir empecilho de or-


dem teórica em utilizar qualquer tamanho de parcela para obter
estimativa não-tendenciosa do volume de madeira de uma flo-
resta, obviamente, desde que a sua localização seja não-ten-
denciosa. Por outro lado, é lógico supor a existência de um in-
tervalo ideal de tamanhos, onde a eficiência é máxima e o custo
é mínimo.
Dentre os principais fatores que influenciam o tamanho e
a forma das parcelas, destacam-se: o objetivo do inventário flo-
restal, o grau de precisão desejado e a variabilidade da variável
resposta.
As pesquisas têm demonstrado que comparando a efici-
ência em relação ao nível de precisão de inventários florestais,
considerando a mesma fração amostral, a precisão aumenta
à medida que os tamanhos das unidades se tornam menores.
Obviamente, os custos aumentam, pois, as parcelas tornam-se
mais numerosas. As pesquisas recomendam o uso de parcelas
que contenham um número de árvores representativo, que não
seja demasiadamente grande face ao tempo requerido para me-
dição. Husch (1971) recomenda um tamanho que englobe em
torno de um número básico de 20 árvores.
Queiroz (1977), pesquisando na Amazônia os efeitos da va-
riação estrutural das unidades de amostra no processo de amos-
tragem por conglomerado, para o volume de madeira para árvo-
res com DAP ≥ 30 cm, verificou que o coeficiente de variação
decresceu exponencialmente com o tamanho da subunidade de
amostra, estabilizando-se levemente quando o tamanho atingiu
em torno de 0,25 ha a 0,32 ha, tamanho considerado ideal.
Silva (1980), também pesquisando na Amazônia e consi-
derando a variável resposta volume de madeira para todas as
árvores com 15 15 cm
cm ≤ DAP ≤ 45 cm,, verificou o tamanho ideal de
45 cm

405
Amostragem em inventário florestal Waldenei Travassos de Queiroz

0,09 ha, e para o volume de árvores com DAP ≥ 45 cm encon-


trou o tamanho ideal de 0,25 ha.
Higuchi et al. (1982), com base em 32 diferentes tamanhos
de parcelas, em floresta de terra firme com DAP ≥ 25 cm lo-
calizada no Distrito Agropecuário da Superintendência da Zona
Franca de Manaus-SUFRAMA, no estado do Amazonas, estu-
daram o tamanho ideal para inventários florestais, concluindo
pelo tamanho ideal de 37,5 m x 150 m (0,5625 ha). O critério
utilizado por esses autores para a seleção foi a Eficiência Relati-
va (ER %), segundo Husch, Miller e Beers (1972), que relaciona
o custo de medição e a precisão desejada, através da fórmula
 100 , sendo:
SE1  C1
ER% 
SE 2  C 2
SE1 = desvio padrão considerando a parcela padrão de ta-
manho 5 m x 200 m;
SE2 =desvio padrão do tamanho da parcela a ser compa-
rada;
C1 = custo de medição da parcela básica;
C 2 = custo de medição da parcela a ser comparada.
Péllico Netto (1979) introduziu o conceito de eficiência por
dia de trabalho (EDT), objetivando considerar alguns fatores re-
levantes na definição do tamanho da unidade de amostra, como:
o tamanho da área a ser inventariada, os tempos de desloca-
mento, os tempos de medição, o número de horas a trabalhar
por dia, as condições de acesso à área e dentro dela, assim
como as adversidades que dificultam a penetração na floresta.

Af
(nd  1)
n An d
EDT   , tal que:
v1 v2

406
Forma e tamanho das unidades de amostra

Af = tamanho da área a ser inventariada;


n = tamanho da amostra;
nd = número de unidades medidas por dia de trabalho;
A = área da unidade de amostra;
v1 = velocidade de caminhamento entre unidades de amostra;
v 2 = velocidade de medição das unidades de amostra.
Substituindo EDT = 8 horas, carga horária por dia, na equa-
ção desenvolvida, o autor achou a seguinte fórmula para a ob-
tenção do tamanho ótimo para a unidade de amostra:
af
8v1  (nd  1)
A[ n
]v 2
v1 nd

No que concerne à forma de parcela em inventários flores-


tais, as pesquisas mostram que a forma da unidade de amostra
não influencia na precisão e na exatidão nos diversos métodos
de amostragem, e que os principais fatores que influenciam a
definição da forma são o perímetro e a facilidade do estabele-
cimento em campo. Sob o ponto de vista teórico, as unidades
circulares são as mais eficientes, devido possuírem a maior rela-
ção entre a área e o perímetro, resultando na redução da proba-
bilidade de ocorrência de árvores limítrofes, tornando mais exato
o cálculo do volume na parcela.
Em inventários de florestas naturais na Amazônia, parcela
grande com forma circular apresenta dificuldades na implanta-
ção e medição devido o controle das árvores limítrofes, assim
como tornam difícil a operacionalização do trabalho de campo,
por causa da grande densidade de árvores no sub-bosque.
As parcelas retangulares, com largura de 20 m no máximo,
são muito utilizadas em inventários de florestas tropicais natu-
rais, principalmente devido à facilidade de implantação e me-

407
Amostragem em inventário florestal Waldenei Travassos de Queiroz

dição. Entretanto, apresentam a desvantagem de maximizar a


ocorrência de árvores na bordadura. Uma vantagem importante
das parcelas retangulares de comprimento longo em relação à
largura é a possibilidade de estudar a variação da tipologia e,
através de um processo de pós-estratificação, tornar possível a
elaboração de mapas florestais, que são importantes para pla-
nejar o manejo de uma floresta.

11.1 Métodos para obter o tamanho ideal

Existem vários métodos para obter o tamanho ideal da par-


cela quando a precisão estatística é o critério utilizado, desta-
cando-se entre eles:

a) método da curvatura máxima

É o método mais antigo, proposto por Federer (1955), o


qual consiste na obtenção dos dados inerentes às unidades
básicas, combinadas de forma a se ter valores para vários ta-
manhos de parcela. Calcula-se, para os vários tamanhos, um
parâmetro ou índice que estime variabilidade, como variância,
coeficiente de variação ou erro padrão. Os valores do índice de
variação e os diversos tamanhos de parcela são plotados em
um sistema de eixos coordenados e, a partir do gráfico, é obtido
o ponto de curvatura máxima, o qual é definido como o ponto a
partir do qual os valores do índice de variabilidade utilizado co-
meçam a estabilizar. Esse ponto determina o tamanho ideal da
unidade de amostra.
Este método possui duas desvantagens:
1) Não considera os custos dos inventários considerando
os diferentes tamanhos de parcelas.

408
Forma e tamanho das unidades de amostra

2) O ponto de curvatura máxima depende do menor tama-


nho de parcela usada, como também da escala utilizada.
Objetivando dar uma ideia acerca da variabilidade do coefi-
ciente de variação em função do tamanho da unidade de amos-
tra, seja o experimento apresentado por Queiroz (1977), o qual
considerou 25 unidades básicas de 400 m2 em um inventário de
uma área de 5.324,04 ha, localizada na Floresta Nacional do Ta-
pajós, no município de Santarém - estado do Pará. A Tabela 11.1
apresenta os valores dos coeficientes de variação considerando
os 25 tamanhos de parcelas e a Figura 11.1 mostra o gráfico
construído a partir destes dados.

Tabela 11.1 - Valores dos coeficientes de variação por tamanho de parcela.

Parcelas (m2) CV% Parcelas (m2) CV% Parcelas (m2) CV%


400 101,08 4000 40,15 7600 27,79
800 75,04 4400 39,16 8000 29,51
1200 67,86 4800 37,51 8400 29,33
1600 58,51 5200 35,94 8800 28,27
2000 53,56 5600 34,92 9200 28,23
2400 48,78 6000 34,88 9600 27,96
2800 44,45 6400 33,47 10000 27,95
3200 41,62 6800 31,87
3600 39,74 7200 30,51

409
Amostragem em inventário florestal Waldenei Travassos de Queiroz

Coeficiente de
variação (%)

Figura 11.1- Comportamento do coeficiente de variação em função do tama-


nho da parcela.

O modelo matemático CV  a1 A 2 , ajustado sob a transfor-


a

mação logarítmica log10 CV  log10 a1  a2 log 10 A, apresentou os


seguintes resultados:
log10 Cv  3,077164  0,410743 log10 A
F=3097,43
raj2  0,9923

De acordo com Hoffmann e Vieira (1977), o coeficiente de


determinação ajustado para os graus de liberdade é dado pela
expressão:
1
raj2  r 2  (1  r 2 )
n2

Tal que:
SQREGRESSÃO
r2 
SQTO TAL
n = número de observações

410
Forma e tamanho das unidades de amostra

b) método modificado da máxima curvatura

Considerando que o ponto de curvatura máxima é geral-


mente determinado por inspeção visual e que é possível ajustar
uma curva para o parâmetro índice de variabilidade em função
do tamanho da parcela, define-se que o tamanho ótimo corres-
ponderá à abscissa, tal que a derivada da função seja igual a – 1.
Isso significa dizer que, depois deste ponto, o incremento de
uma nova unidade básica resultará numa redução da variável
dependente - o coeficiente de variação - menor que a unidade,
denotando ser inviável promover aumentos adicionais na parce-
la a ser eleita.

c) método do índice de heterogeneidade

Ferreira (1996) cita que esse método foi proposto por Smi-
th (1938) e baseia-se numa relação empírica entre o tamanho da
parcela e a variância, estabelecendo uma dependência negativa
V
expressa pelo modelo matemático Vk = ab , tal que quando o ta-
k
manho relativo da parcela aumenta, a variância relativa diminui.
Neste modelo matemático, têm-se:
Vk = variância por unidade de área entre as parcelas de
tamanho correspondente a k unidades básicas;
Va = variância considerando as parcelas correspondentes
em tamanho à unidade básica;
k = número de unidades básicas utilizado por parcela;
b = índice de heterogeneidade medido pela correlação en-
tre unidades básicas adjacentes.
Então, tem-se o modelo log Vk = log Va − b log k , depreen-
dendo que o índice de heterogeneidade b é o coeficiente de

411
Amostragem em inventário florestal Waldenei Travassos de Queiroz

regressão, de modo que a variável dependente é o logaritmo


da variância entre as parcelas de tamanho correspondente a k
unidades básicas e a variável independente é o logaritmo do nú-
mero de unidades básicas correspondentes da parcela.
De acordo com Smith (1938), a fórmula para obter o valor
de k, tornando mínimo o custo por unidade de informação é:
bc1
k
(1  b)c 2

Tal que:
c1 = custo associado somente ao número de parcelas;
c 2 = custo por unidade de área.

412
CONSIDERAÇÕES FINAIS

Aborda sobre as dificuldades no uso de análise estatísti-


ca em inventários florestais, citando que é notória a dificuldade
enfrentada pelos estudantes e profissionais devido à falta de ex-
periência no contexto de aplicações dos métodos estatísticos,
principalmente na aplicação de técnicas estatísticas multidimen-
sionais. Discorre sobre inventário para subsidiar a operacionali-
zação de um projeto de manejo florestal que, obrigatoriamente,
define, distingue e delimita as comunidades com características
fitossociológicas semelhantes, ressaltando que os métodos es-
tatísticos univariados não oferecem o suporte suficiente para
atender a essas análises. Descreve que as soluções para es-
ses questionamentos só podem ser obtidas pelo uso de análise
multivariada. Discute sobre a adequacidade do uso de algumas
técnicas multivariadas em inventários florestais.
O objetivo principal deste livro é orientar o aprendizado no
campo da análise estatística univariada, visando ao planejamen-
to de inventário florestal, no qual é notória a dificuldade enfren-
tada pelos estudantes e profissionais, principalmente, devido à
falta de livros didáticos escritos em português, em linguagem
adequada ao contexto dos métodos estatísticos.
Por outro lado, este livro é uma pequena contribuição na
difícil tarefa de resolver os problemas da análise de inventários
florestais, principalmente de florestas naturais, destarte não ob-
jetiva apresentar todos os métodos estatísticos, com vista a sub-
sidiar a análise de inventário para o manejo florestal sustentável,
visto a complexidade requerida para se atender tal fim. A seguir
algumas considerações para aguçar a discussão sobre o pro-
blema.
O inventário para subsidiar a operacionalização de um
projeto de manejo florestal, obrigatoriamente, define, distingue
e delimita as comunidades com características fitossociológicas
semelhantes; e, obviamente, os métodos estatísticos univaria-
dos não oferecem o suporte suficiente de análise para atender
esse objetivo.
As experiências na Amazônia demonstram que estratifica-
ções estabelecidas mediante a interpretação de fotocoberturas,
apesar de importante e informativa, não são capazes de expli-
car, com o detalhamento requerido, as inter-relações das vari-
áveis envolvidas, principalmente, nas vegetações localizadas
nos sub-bosques da floresta. O direcionamento indicado seria
compatibilizar os recursos de sensoriamento remoto e de plane-
jamento de amostragem – recomenda-se o uso da amostragem
sistemática - a uma análise estatística multivariada.
A análise multivariada apresenta algumas complexidades
com relação à compreensão de sua teoria estatística e à compu-

415
tação das análises dos dados. Entretanto, sob o ponto de vista
prático da explicação dos efeitos das características fitossocio-
lógicas, é inegável ser um instrumento poderoso para interpretar
as correlações inter e intra dos tipos florestais, o que os recursos
disponíveis através dos diversos índices fitossociológicos unidi-
mensionais existentes na literatura deixam a desejar, principal-
mente, por não apresentarem estruturas de lógica matemática e
de método estatístico.
O problema mais complexo em termos de inventário para
o manejo de florestas naturais é a análise do inventário contínuo
com parcelas permanentes, o qual tem o objetivo de explicar a
tendência de crescimento da floresta. Para subsidiar a estrutura-
ção dos tratos silviculturais a serem aplicados na recomposição
da floresta tropical, destaca-se que, obrigatoriamente, a análise
estatística deverá ter em mira detectar e classificar os agrupa-
mentos de espécies que possuam as mesmas tendências de
desenvovimento (perfis de crescimento).
As soluções para os questionamentos acima descritos só
podem ser obtidas pelo uso de análise multivariada e, em alguns
problemas, até recomenda-se a aplicação conjunta de vários
métodos multivariados.
As técnicas multivariadas de componentes principais e
análise de fatores podem ser utilizadas para diminuir a dimen-
sionalidade dos dados, o que possibilitará, a partir de um número
menor de variáveis, explicar mais facilmente suas inter-relações.
A análise de componente principal e a análise de fatores são im-
portantes para construir índices fitossociológicos e a partir deles
produzir mapas delimitando as comunidades florestais.
As técnicas de análises de agrupamento, de discriminante
e de análise de variância multivariada, podem ser usadas con-
juntamente para delimitar, classificar e comparar – discriminar

416
– tipos florestais e, assim, obter mapas de vegetação baseados
nas variáveis mais importantes na explicação das estruturas flo-
rística e ecológica da vegetação.
É importante no manejo florestal estudar as inter-relações
entre grupos de variáveis. Por exemplo, um grupo pode ser for-
mado por variáveis florísticas e o outro pelas variáveis que refle-
tem a fertilidade de solo. A análise de correlação canônica pode-
rá explicar essas correlações, fornecendo inclusive mapas mos-
trando a estratificação das diversas relações solo-vegetação.
Em relação à análise de inventário florestal contínuo com
parcelas permanentes, a análise multivariada denominada de
medidas repetidas, através das técnicas de análises de levanta-
mentos longitudinais, podem atender ao objetivo de obter grupos
formados por espécies com a mesma tendência de crescimento.

417
Referências

BANZATTO, D. A.; KRONKA, S. N. Experimentação agronômi-


ca. Jaboticabal: FUNEP, 1989. 247 p.
BARBIN, D. Componentes de variância: teoria e aplicação. 2.
ed. Piracicaba: FEALQ, 1993. 120 p.
BOLFARINE, H.; BUSSAB, W. O. Elementos de amostragem.
São Paulo: Edgard Blücher, 2005. 269 p.
BORGES, B. H. Projeto de manejo florestal da Fazenda San-
ta Lúcia: serraria marajoara. Belém: IBAMA, 1990.
CAMPOS, H. Amostragem. Piracicaba: ESALQ, 1981. Apostila.
CHACIN LUGO, F. Tamaño de parcela experimental y su forma.
Revista de la Facultad de Agronomia, Maracay, v. 9, n. 3, p.
55-74, 1977.
COCHRAN, W. G. Sampling techniques. 3. ed. New York: J.
Wiley, 1977. 428 p.
______. Técnicas de amostragem. Rio de Janeiro: Fundo de
Cultura, 1965. 555 p.
CUNIA, T. Two successive measurements: the SPR model no
auxiliary variables. Syracuse: [s. n.], 1974.
CUNIA, T.; CHEVROU, R. B. Sampling with partial replacement
on three or more occasions. Forest Science, Lawrence, v. 15, p.
204-224, 1969.
FEDERER, W. T. Experimental design, theory and applica-
tion. New York: Macmillan, 1955. 593 p.

419
FERREIRA, P. V. Estatística experimental aplicada à agrono-
mia. 2. ed. Maceió: EDUFAL, 1996. 606 p.
FLORES, O. M. M. Estudo comparativo de tamanhos e dis-
tâncias em processo de amostragem por conglomerado.
2010. 67 f. Dissertação (Mestrado em Ciências Florestais) – Uni-
versidade Federal Rural da Amazônia, Belém, 2010.
FONSECA, J. S.; MARTINS, G. A. Curso de estatística. 3. ed.
São Paulo: Atlas, 1982. 286 p.
FREESE, F. Elementary forest sampling. Washington: USDA,
1962, 91 p. (Handbook, 232).
GOMES, F. P. Curso de estatística experimental. 14. ed. Pira-
cicaba: ESALQ, 2000. 477 p.
GOMES, F. P.; NOGUEIRA, I. R. Análise matemática. 2. ed.
Piracicaba: Augegraf, 1980. 371 p.
HOFFMANN, R.; VIEIRA, S. Análise de regressão: uma intro-
dução à econometria. São Paulo: HUCITEC; EDUSP, 1977. 339
p.
HIGUCHI, N. et al. Tamanho de parcela amostral para inventá-
rios florestais. Acta Amazônica, Manaus, v. 12, n. 1, p. 91-103,
1982.
HUSCH, B. Planificacion de un inventario florestal. Roma:
FAO, 1971. 135 p.
HUSCH, B.; MILLER, C. L.; BEERS, T. W. Forest mensuration.
3. ed. New York: J. Wiley, 1972. 402 p.
LOETSCH, F.; HALLER, K. E. Forest inventory. Minchin: BLV
Verlagsgesellschaft, 1964.
MOOD, A. M.; GRAYBILL, F. A.; BOES, D. C. Introduction to the
theory of statistics. 3. ed. New York: Mc Graw-Hill, 1964. 564 p.
PÉLLICO NETTO, S.; BRENA, D. A. Inventário florestal. Curi-
tiba, 1997. 316 p.

420
PÉLLICO NETTO, S. Plano de colonização do Alto Turi. In-
ventário Florestal. Curitiba: Centro de Pesquisas Florestais da
UFPR, 1971. 238 p.
PÉLLICO NETTO, S. Die Forstinventuren in Brasilien- Neue
Entwicklungen und ihr Beitrag für eine geregelte Forstwirts-
chaft. 1979. 232 f. Tese (Doutorado em Engenharia Florestal)
- Mitteilungen aus dem Arbeitskreis für Forstliche Biometrie, Frei-
burg,1979.
PINHEIRO, J. G. Análise da eficiência das estimativas por
razão em conglomerados em inventário florestal na Amazô-
nia. 2011. 46 f. Dissertação (Mestrado em Ciências Florestais)
– Universidade Federal Rural da Amazônia, Belém, 2011.
PISKOUNOV, N. Cálculo diferencial e integral. 4. ed. Porto:
Lopes da Silva, 1978. v. 2.
QUEIROZ, W. T. Análise de fatores (“Factor analysis”) pelo
método de máxima verossimilhança: aplicação ao estudo de
estrutura de florestas tropicais. 1984. 112 f. Tese (Doutorado em
Engenharia Florestal) – Escola Superior de Agricultura Luiz de
Queiroz, Piracicaba, 1984.
______. Análise univariada de inventários florestais contínuos:
parcelas permanentes. Boletim da FCAP, Belém, n. 21, p. 33-
49, dez. 1993a.
______. Estimativa por razão: aplicação em levantamentos flo-
restais. Boletim da FCAP, Belém, n. 21, p. 51-63, dez. 1993b.
______. Efeitos da variação estrutural em unidades amos-
trais na aplicação do processo de amostragem por conglo-
merados nas florestas do Planalto do Tapajós. 1977. 109 f.
Dissertação (Mestrado em Engenharia Florestal) – Universidade
Federal do Paraná, Curitiba, 1977.
______. O modelo de amostragem com substituição parcial
(SPR) para duas mensurações sucessivas. Trabalho apre-

421
sentado no Seminário da Pós-Graduação. Piracicaba: ESALQ,
1983.
______. Técnicas de amostragem em inventário florestal
nos trópicos. Belém: FCAP. Serviço de Documentação e Infor-
mação, 1998. 147 p.
ROLLET, B.; QUEIROZ, W. T. Observações e contribuições aos
inventários florestais na Amazônia. In: CONGRESSO FLORES-
TAL BRASILEIRO, 3., 1978, Manaus. Anais... São Paulo: So-
ciedade Brasileira de Silvicultura, 1978. v. 2, p. 405-408. (Edição
especial da revista Silvicultura, n. 14).
SANQUETTA, C. R. et al. Inventários florestais: planejamento
e execução. 2. ed. Curitiba: Multi-Graphic, 2009. 316 p.
SHIVER, B. D. BORDER, B. E. Sampling techniques for forest
resource inventory. New York: Jhon Wiley e Sons, 1996. 356 p.
SATTERTHWAITE, F. E. An approximate distribution of estima-
tes of variance components. Biometrics, Washington, n. 2, p.
110-114, 1946.
SCOLFORO, J. R. Inventário florestal. Lavras: ESAL - FAEPE,
1993.
SEARLE, S. R. Linear models. New York: J. Wiley, 1971. 532 p.
SILVA, J. N. M. Eficiência de diversos tamanhos e formas de
unidades de amostras aplicadas em inventário florestal na
região do Baixo Tapajós. 1980. 83 f. Dissertação (Mestrado em
Engenharia Florestal) – Universidade Federal do Paraná, Curiti-
ba, 1980.
SMITH, H. F. An empirical law describing heterogeneity in the
yields of agricultural crops. Journal of Agricultural Science,
Cambridge, n. 28, p. 1-23, 1938.
SUPERINTENDÊNCIA DO DESENVOLVIMENTO DA AMA-
ZÔNIA. Levantamentos florestais realizados pela missão FAO

422
na Amazônia (1956-1961). Belém: Divisão de Documentação,
1974. v. 1.
STEEL, R. G. D.; TORRIE, J. H. Principles and procedures
of statistics with special biological sciences. New York: Mc
Grall-Hill, 1960. 481 p.
YARED, J. A. G. Comportamento e viabilidade de procedi-
mento de cordia alliodora (Ruiz e pav.) Okem, no Planalto do
Tapajós – Belterra, PA. 1983. 108 f. Dissertação (Mestrado em
Engenharia Florestal) – Escola Superior de Agricultura Luiz de
Queiroz, Piracicaba, 1983.
WARE, K. D.; CUNIA, T. Continuos forest inventory with partial
replacemente of samples. Forest Science Monograph, Wa-
shington, n. 3, 1962.
VRIES, P. G. Sampling theory for inventory: a teach-yourself
course. New York: Springer-Verlag, 1986. 399 p.

423
GLOSSÁRIO

Acurácia: é o grau de precisão de uma quantidade medida ou


calculada em relação ao seu verdadeiro valor.
Ajustamento de curvas: procedimento matemático destinado
a obter o modelo mais ajustado entre duas ou mais variáveis –
uma dependente (Y) e outra(s) independente(s).
Aleatório: ao acaso, randômico. Seja uma população composta
por N indivíduos e deseja-se retirar uma amostra de tamanho
n. A amostra será aleatória se a chance de cada indivíduo ser
selecionado for igual a n ..
N
Alfa ( a ): denominado como erro tipo I, constitui a probabilidade
de aceitação de H 0 (hipótese de nulidade) quando ela for falsa,
ou seja, quando ela não deveria ser aceita.
Amostra: é uma parte da população selecionada para represen-
tar a mesma.
Amostragem: quando trabalhamos com uma parte da popula-
ção (amostra).
Amostra probabilística: toda amostra que permite fazer infe-
rência sobre a população.
Amostragem com reposição: método de amostragem no qual
cada unidade da população selecionada para compor a amostra
é reposta à população antes da retirada da próxima unidade.
Amostragem estratificada: é o processo que consiste em divi-
dir a população de tamanho igual a N unidades, em subpopula-
ções ou estratos constituídos de N i unidades, respectivamente,
tal que não haja superposições e, juntas, totalizem a população
de tamanho ∑ N i = N .
i

425
Amostragem por conglomerados ou grupos: é uma variação
de qualquer processo de amostragem que, em vez de utilizar
unidades de amostra individuais, a unidade de amostra é forma-
da por grupo de pequenas subparcelas.
Amostragem sem reposição: método de amostragem no qual
a unidade de amostra selecionada para compor a amostra não
é reposta na população antes da retirada da próxima unidade.
Amostragem simples ao acaso: é uma amostragem probabi-
lística em que todos os indivíduos têm a mesma probabilidade
de serem sorteados.
Amostragem sistemática: consiste em sortear uma unidade da
população e, a partir dela, para constituir uma amostra de tama-
nho n, selecionar as unidades que ocupam pela ordem sequen-
cial as posições múltiplas do valor da razão entre o número total
N de unidades e o número n de unidades da amostra.
Amostras independentes: os conjuntos amostrais de valores
não estão relacionados entre si.
Biometria ou Bioestatística: estatística aplicada às ciências
biológicas.
Censo: mensuração de todos os indivíduos da população.
Coeficiente de correlação intraconglomerado: é o coeficiente
que explica o grau de homogeneidade entre subparcelas dentro
do conglomerado. Quando maior que zero, a amostragem por con-
glomerados é menos precisa que a simples ao acaso, e quando
menor que zero, a amostra por conglomerado é mais precisa que
a simples ao acaso. Essas amostragens possuem a mesma pre-
cisão se o coeficiente de correlação intraconglomerado for zero.
Coeficiente de variação: é a estatística que permite avaliar a
variabilidade das observações, buscando-se uma comparação
relativa entre o desvio padrão e a média.

426
Correlação: é a estatística que mede a magnitude e o sentido
do grau de associação entre duas variáveis aleatórias.
Correlação linear: é a estatística que mede a magnitude e o
sentido (positivo ou negativo) do grau de associação linear entre
duas variáveis aleatórias.
Covariância: é a estatística que mede a tendência à variação si-
multânea, em grandeza e sinal, das observações inerentes a duas
variáveis aleatórias. É a média (ou esperança matemática) do pro-
duto dos afastamentos de cada variável em relação à respectiva
média (ou esperança matemática): Cov(x,y) = E[x – E(x) (y – E(y)].
Curva “t” de Student: distribuição de probabilidade que apre-
senta as seguintes características: distribuição simétrica; curva
mesocúrtica; platicúrtica ou leptocúrtica, dependendo dos graus
de liberdade. Quando a forma é mesocúrtica se assemelha à
distribuição normal.
Delineamento experimental: é o plano estabelecido na mon-
tagem do experimento e implica na forma como os tratamentos
serão designados às unidades amostrais. Há um entendimento
sobre as análises estatísticas a serem efetuadas quando todos
os dados estiverem disponíveis.
Desvio padrão: é a medida de dispersão que determina a varia-
bilidade entre cada escore e a sua respectiva média da popula-
ção ou da amostra. É a raiz quadrada da variância.
Dimensionamento da amostra: é obter o tamanho da amostra
considerando um determinado nível de significância e um limite
de erro ou margem de erro.
Distribuição amostral: distribuição de probabilidade de uma
estatística induzida pelo plano amostral.
Distribuição normal: modelo de distribuição de probabilidades
de variáveis aleatórias contínuas. A curva apresenta as seguin-

427
tes características: distribuição simétrica; forma de sino; dois
pontos de inflexão; é assintótica.
Distribuição probabilística: é o conjunto de duas variáveis;
uma que é aleatória (abscissa) e outra que representa as res-
pectivas probabilidades (ordenada).
Eixo das abscissas: eixo horizontal dos valores, por exemplo,
de X i do plano cartesiano.
Eixo das ordenadas: eixo vertical dos valores, por exemplo, de
Yi do plano cartesiano.
Erro ou Viés ou Bias: erro casual observado nas amostras ale-
atórias, decorrente da variabilidade dos elementos constituintes
do universo estudado, pelo fato de que nem todos os indivíduos
da população participam da amostra. É um erro que pode levar à
conclusão equivocada sobre a população, podendo ocorrer: na
seleção da amostra; na coleta dos dados; na análise dos dados;
nas conclusões.
Erro padrão: estatística que mede a variabilidade das médias
amostrais. É o desvio padrão de uma população de médias
amostrais, o qual corresponde ao quociente do desvio padrão
pela raiz quadrada do tamanho da amostra.
Erro tipo I ou Erro alfa ( a ): é um erro que pode ser cometido
na inferência estatística que consiste em rejeitar a hipótese de
nulidade quando ela é verdadeira.

Erro tipo II ou Erro beta ( β ): é um erro que pode ser cometido


na inferência estatística que consiste em aceitar a hipótese de
nulidade quando ela é falsa.
Espaço amostral ou universo: é o conjunto dos pontos amos-
trais.

428
Esperança matemática de uma variável contínua E(y):
seja y uma variável aleatória contínua; definimos como

E ( y )   yf ( y )dy, tal que f ( y ) é a função de densidade.


Esperança matemática de uma variável discreta E ( y ) :


seja y uma variável aleatória discreta que assume os valores
y1 , y 2 , L , y n com as respectivas probabilidades p1 , p 2 , L , p n ,
então E ( y ) = ∑ y i p i .
i
Estatística: é a parte da matemática aplicada que estuda dados
originados de observações.
Estatísticas: são valores numéricos que descrevem as amos-
tras como a média, a mediana, a variância, etc.
Estimação por intervalo: quando a partir da amostra constrói-
se um intervalo com certa probabilidade de conter o verdadeiro
valor do parâmetro populacional.
Estimação: quando se usa os resultados extraídos da amostra
para produzir inferências sobre a população da qual foi extraída
aleatoriamente a amostra.
Estimador: denomina-se estimador de um parâmetro de uma
população a função de elementos de uma amostra oriunda des-
sa população, que mantém com o mesmo uma relação.
Estimativa por razão: quando se estima o valor de uma variá-
vel associada à outra variável; normalmente essas variáveis são
correlacionadas.
Estimativa: é um valor específico de um estimador como, por
exemplo, a média aritmética da altura de uma amostra de árvores.
Estratificação com repartimento ótima: quando o dimensio-
namento da amostra tem em vista tornar mínimo o valor da va-
riância da média estratificada dentro de um limite de custo para
medição da amostra, ou tornar mínimo o custo para um valor
estipulado da variância da média estratificada.
429
Estratificação com repartimento, partilha ou alocação pro-
porcional: quando o dimensionamento da amostra é feito consi-
derando a mesma fração amostral para todos os estratos.
Experimento ou Ensaio: é um trabalho que segue determina-
dos princípios básicos e no qual se faz a comparação dos efeitos
dos tratamentos ou populações.
Fator de expansão ou crescimento: é o fator que transforma
os resultados da amostra para a população. É o quociente entre
o número de unidades da população pelo número de unidades
da amostra.
Fração amostral na população: é a razão entre o número de
unidades medidas na amostra e o número de unidades total da
população.
Fração amostral no estrato: é a razão entre o número de unida-
des medidas no estrato e o número de unidades total do estrato.
Função de probabilidade: uma função f (y) de variável discreta,
y ) ≥ 00 e ∑ ff ((y)
tal que, ff((y) = 11.
y) =
x

Função densidade: uma função f (y) de variável contínua, tal


y ) ≥ 00 e f ((y)
que ff ((y) x
dy = 1.
y )dy 1
Geoestatística: é um conjunto de técnicas usadas para inferir
valores para uma determinada variável. Produz estimativas de
variáveis com base na probabilidade e na espacialidade das ob-
servações.
Graus de liberdade: são os indexadores estatísticos correspon-
dentes ao número de observações independentes.
Heterogeneidade de variâncias ou heterocedasticidade: é
quando ocorre desigualdade de variâncias, o que pode ser veri-
ficado através de vários testes.

430
Hipótese Alternativa ( HA ): é a hipótese que é aceita quando a
hipótese de nulidade é rejeitada, no sentido de afirmar que há
diferenças ou associações entre os grupos objetos da pesquisa,
as quais não podem ser explicadas pelo acaso.
Hipótese da nulidade ( H0 ): é a hipótese que se testa conside-
rando que as possíveis diferenças ou associações encontradas
entre grupos objetos do estudo são devido ao acaso.
Hipótese estatística: é a especificação de um dos parâmetros
de uma população ou da relação entre os parâmetros de duas
ou mais populações.
Inferência estatística: é o procedimento de efetuar conclusões
acerca de uma população baseado em uma amostra desse uni-
verso.
Intervalo de confiança: quando a partir da amostra constrói-
se um intervalo com certa probabilidade de conter o verdadeiro
valor do parâmetro populacional para um determinado nível de
confiança (1 – a), tal que a é o nível de significância do teste.
Krigagem: dentro da geoestatística é um conjunto de técnicas
usadas para inferir valores para uma variável distribuída no es-
paço em locais não amostrados.
Limite de erro ou margem de erro: é a semiamplitude do inter-
valo de confiança expresso em porcentagem da média.
Média estratificada estimada: é o valor médio não tendencioso
que estima o valor médio populacional. É uma média ponderada
pelo peso representativo de cada estrato.
Parâmetro: é uma função do conjunto de valores (uma caracte-
rística) de uma população.
Peso do estrato: é razão entre o número de unidades total do
estrato e o número total de unidades da população.

431
Plano amostral: documento de registro descrevendo os méto-
dos e medidas para obtenção da amostragem.
Ponto amostral: cada acontecimento que possa ocorrer em um
experimento.
População: é o conjunto de todos os indivíduos ou unidades
sobre os quais se deseja estabelecer determinados estudos.
População amostrada: população da qual foi retirada a amos-
tra.
População finita: quando a amostra se constitui no mínimo de
5% dos indivíduos da população.
População infinita: quando a amostra se constitui no máximo
de 5% dos indivíduos da população.
População objetivo: população que se pretende atingir.
Probabilidade: é a mensuração matemática usada para des-
crever a chance de ocorrência de um valor específico de uma
variável aleatória ou de eventos amostrais.
p-valor ou p(valor): é a probabilidade, na inferência estatística,
de se cometer um erro de conclusão - Erro tipo I -, rejeitando-se
a Hipótese de nulidade se ela for verdadeira.
Razão: é o quociente entre os valores de duas variáveis.
Repetições: é o mesmo tratamento aplicado a mais de uma uni-
dade de amostra da mesma população.
Semivariograma: estuda e descreve a variabilidade espacial do
fenômeno. Denominada também de análise estrutural ou mode-
lagem do variograma.
Seleção não probabilística: qualquer processo intencional de
escolher as unidades de amostra ou quando não seja possível
estabelecer as probabilidades de inclusão das mesmas.

432
Seleção probabilística: processo de selecionar as unidades de
amostra que permite estabelecer as probabilidades das mesmas
pertencer à amostra.
Teste de hipótese: quando a partir dos resultados obtidos da
amostra, deseja-se testar certos parâmetros da população ou
mesmo testar a natureza da população.
Tratamento: é o método ou a população cujo efeito deseja-se
medir ou comparar em um experimento ou em um levantamento.
Variância: é um momento de dispersão, calculado por um quo-
ciente do somatório dos quadrados da diferença entre cada es-
core e a respectiva média, e o denominador representado pelo
número de graus de liberdade correspondente.
Variável aleatória contínua: quando varia num conjunto infinito
não enumerável.
Variável aleatória discreta: quando assume somente um nú-
mero finito de valores ou quando varia num conjunto infinito enu-
merável.
Variável aleatória “F” de Snedecor: variável aleatória definida
como a razão de duas variáveis independentes com distribuição
qui-quadrado, com k graus de liberdade correspondente ao nu-
merador e p graus de liberdade inerente ao denominador. Pos-
suindo a sua função densidade denominada “F” de Snedecor.
Variável de interesse: característica das unidades da popula-
ção que se pretende conhecer.
Variável aleatória qui-quadrado: variável aleatória com k graus
de liberdade; é definida como a soma de k quadrados de nor-
mais padronizadas e independentes. Possui a sua função densi-
dade denominado de qui-quadrado.

433
Variável aleatória “t” de Student: variável aleatória com n-1,
tamanho da amostra menos um, graus de liberdade. É definida
como o quociente entre a diferença da média estimada e a mé-
dia populacional pelo erro padrão. Possui a sua função densida-
de denominada “t” de Student.
Variável aleatória: é aquela que ocorre com certa probabilidade.
Viés ou vício: de um estimador de um parâmetro é a diferença
entre o seu valor esperado e o valor do parâmetro.

434
Anexo

Tabela 1- Áreas da distribuição normal padrão.

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990

435
c a2 ,k

Tabela 2 - Distribuição de c2.


α
0,995 0,990 0,975 0,95 0,90 0,75 0,50 0,50 0,10 0,05 0,025 0,01 0,005
k
1 0,000 0,0002 0,0010 0,0039 0,0158 0,102 0,455 1,32 2,71 3,84 5,02 6,63 7,88
2 0,010 0,0001 0,0506 0,103 0,211 0,575 1,39 2,77 4,61 5,99 7,38 9,21 10,6
3 0,0717 0,115 0,216 0,352 0,584 1,021 2,37 4,11 6,25 7,81 9,25 11,3 12,8
4 0,207 0,297 0,484 0,711 1,06 1,92 3,36 5,39 7,78 9,49 11,1 13,3 14,9
5 0,412 0,554 0,831 1,15 1,61 2,67 4,35 6,63 9,24 11,1 12,8 15,1 16,7
6 0,676 0,872 1,24 1,64 2,20 3,45 5,35 7,84 10,6 12,6 14,4 16,8 18,5
7 0,989 1,24 1,69 2,17 2,83 4,25 6,35 9,04 12,0 14,1 16,0 18,5 20,3
8 1,34 1,65 2,18 2,73 3,49 5,07 7,34 10,2 13,4 15,5 17,5 20,1 22,0
9 1,73 2,09 2,70 3,33 4,17 5,90 8,34 11,4 14,7 16,9 19,0 21,7 23,6
10 2,16 2,56 3,25 3,94 4,87 6,74 9,34 12,5 16,0 18,3 20,5 23,2 25,2
11 2,60 3,05 3,82 4,57 5,58 7,58 10,3 13,7 17,3 19,7 21,9 24,7 26,8
12 3,07 3,57 4,40 5,23 6,30 8,44 11,3 14,8 18,5 21,0 23,3 26,2 28,3
13 3,57 4,11 5,01 5,89 7,04 9,30 12,3 16,0 19,8 22,4 24,7 27,7 29,8
14 4,07 4,66 5,63 6,57 7,79 10,2 13,3 17,1 21,1 23,7 26,1 29,1 31,3
15 4,60 5,23 6,23 7,26 8,55 11,0 14,3 18,2 22,3 25,0 27,5 30,6 32,8
16 5,14 5,80 6,91 7,96 8,31 11,9 15,3 19,4 23,5 26,3 28,4 32,0 34,3
17 5,70 6,41 7,56 8,67 10,1 12,8 16,3 20,5 24,8 27,6 30,2 53,4 35,7
18 6,26 7,01 8,23 9,39 10,9 13,7 17,3 21,6 26,0 28,9 31,5 34,8 37,2
19 6,84 7,63 8,91 10,1 11,7 14,6 18,3 22,7 27,2 30,1 32,9 36,2 38,6
20 7,43 8,26 9,59 10,9 12,4 15,5 19,3 23,8 28,4 31,4 34,2 37,6 40,0
21 8,03 8,90 10,3 11,6 13,2 16,3 20,3 24,9 29,6 32,7 35,5 38,9 41,4
22 8,64 9,54 11,0 12,3 14,0 17,2 21,3 26,0 30,8 33,9 36,8 40,5 42,8
23 9,26 10,2 11,7 13,1 14,8 18,1 22,3 27,1 32,0 35,2 38,1 41,6 44,2
24 9,89 10,9 12,4 13,8 15,7 19,0 23,3 28,2 33,1 36,4 39,4 43,0 45,6
25 10,5 11,5 13,1 14,6 16,5 19,9 24,3 29,3 34,4 37,7 40,6 44,3 46,9
26 11,2 12,2 13,8 15,4 17,3 20,8 25,3 30,4 35,6 38,9 41,9 45,6 48,3
27 11,8 12,9 14,6 16,2 18,1 21,7 26,3 31,5 36,7 40,1 43,2 47,0 49,6
28 12,5 13,6 15,3 16,9 18,9 22,7 27,3 32,6 37,9 41,3 44,5 48,3 51,0
29 13,1 14,3 16,0 17,7 19,8 23,6 28,3 33,7 39,1 42,6 45,7 49,6 52,5
30 13,8 15,0 16,8 18,5 20,6 24,5 29,3 34,8 40,3 43,8 47,0 50,9 53,7

436
Tabela 3 - Distribuição “t” de Student.

a
0,50 0,25 0,10 0,05 0,025 0,01 0,005
k
1 1,00000 2,4142 6,3138 12,706 25,542 63,657 127,32
2 0,81650 1,6036 2,9200 4,3127 6,2053 9,9248 14,089
3 0,76489 1,4226 2,3534 3,1825 4,1765 5,8409 7,4533
4 0,74070 1,3444 2,1318 2,7764 3,4954 4,6041 5,5976
5 0,72669 1,3009 2,0150 2,5706 3,1634 4,0321 4,7733
6 0,71756 1,2733 1,9432 2,4469 2,9687 3,7074 4,3168
7 0,71114 1,2543 1,8946 2,3646 2,8412 3,4995 4,0293
8 0,70639 1,2403 1,8595 2,3060 2,7515 3,3554 3,8325
9 0,70272 1,2297 1,8331 2,2622 2,6850 3,2498 3,6897
10 0,69981 1,2213 1,8125 2,2281 2,6338 3,1693 3,5814
11 0,69745 1,2145 1,7959 2,2010 2,5931 3,1058 3,4966
12 0,69548 1,2089 1,7823 2,1788 2,5600 3,9545 3,4284
13 0,69384 1,2041 1,7709 2,1604 2,5326 3,0123 3,3725
14 0,69200 1,2001 1,7613 2,1448 2,5096 5,9768 3,3257
15 0,69120 1,1967 1,7530 2,1315 2,4899 2,9467 3,2860
16 0,69013 1,1937 1,7459 2,1199 2,4729 2,9208 3,2520
17 0,68919 1,1910 1,7396 2,1098 2,4581 2,8982 3,2225
18 0,68837 1,1887 1,7341 2,1009 2,4450 2,8784 3,1966
19 0,68763 1,1866 1,7291 2,0930 2,4334 2,8609 3,1737
20 0,68696 1,1848 1,7247 2,0860 2,4231 2,8453 3,1534
21 0,68635 1,1831 1,7207 2,0796 2,4138 2,8314 3,1352
22 0,68580 1,1816 1,7171 2,0739 2,4055 2,8188 3,1188
23 0,68531 1,1802 1,7139 2,0687 2,3979 2,8073 3,1040
24 0,68485 1,1789 1,7109 2,0639 2,3910 2,7969 3,0905
25 0,68443 1,1777 1,7081 2,0595 2,3846 2,7874 3,0782
26 0,68405 1,1766 1,7056 2,0555 2,3788 2,7787 3,0669
27 0,68370 1,1757 1,7033 2,0518 2,3734 2,7707 3,0565
28 0,68335 1,1748 1,7011 2,0484 2,3685 2,7633 3,0469
29 0,68304 1,1739 1,6991 2,0452 2,3638 2,7564 3,0380
30 0,68276 1,1731 1,6973 2,0423 2,3596 2,7500 3,0298
40 0,68066 1,1673 1,6839 2,0211 2,3289 2,7045 2,9712
60 0,67862 1,1616 1,6707 2,0003 2,2991 2,6603 2,9146
120 0,67656 1,1559 1,6577 1,9799 2,2699 2,6174 2,8599
∞ 0,67449 1,1503 1,6449 1,9600 2,2414 2,5758 2,8070

437
Fk , p ,a

Tabela 4 - Distribuição “F” de Snedecor para a = 5%.

k
1 2 3 4 5 6 7 8 9 10 20 30 120
p
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 248,0 250,1 253,3
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,45 19,46 19,49
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,66 8,62 8,55
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,80 5,75 5,66
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,56 4,50 4,40
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 3,87 3,81 3,70
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,44 3,38 3,27
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,15 3,08 2,97
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 2,94 2,86 2,75
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 4,07 3,02 2,98 2,77 2,70 2,58
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,65 2,57 2,45
12 4,75 3,89 3,49 3,26 3,11 3,00 2,90 2,85 2,80 2,75 2,54 2,47 2,34
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,46 2,38 2,25
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,39 3,31 2,18
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,33 2,25 2,11
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,28 2,19 2,06
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,23 2,15 2,01
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,19 2,11 1,97
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,16 2,07 1,93
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,12 2,04 1,90
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,10 2,01 1,87
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,07 1,98 1,84
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,05 1,96 1,81
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,03 1,94 1,79
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 1,93 1,84 1,68
40 4,08 3,23 2,84 2,61 2,45 2,34 2,21 2,18 2,12 2,08 1,84 1,74 1,58
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,75 1,65 1,47
120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91 1,66 1,55 1,35
∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,57 1,46 1,22

438
Fk , p ,a

Tabela 5 - Distribuição “F” de Snedecor para a = 1%.

k
1 2 3 4 5 6 7 8 9 10 20 30 120
p
1 4052 4999 5403 5625 5764 5859 5928 5982 6022 6056 6209 6261 6339
2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,45 99,47 99,49
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 26,69 26,50 26,22
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,02 13,84 13,56
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,55 9,38 9,11
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,40 7,23 6,97
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,16 5,99 5,74
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,36 5,20 4,95
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 4,81 4,65 4,40
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,41 4,25 4,00
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,10 3,94 3,69
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 3,86 3,70 3,45
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,66 3,51 3,25
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,51 3,35 3,09
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,37 3,21 2,96
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,26 3,10 2,84
17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,16 3,00 2,75
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,08 2,92 2,66
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,00 2,84 2,58
20 8,10 5,35 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 2,94 2,78 2,52
21 8,02 5,78 4,82 4,37 4,04 3,81 3,64 3,51 3,40 3,31 2,88 2,72 2,46
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 2,78 2,67 2,40
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 2,74 2,62 2,35
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 2,70 2,58 2,31
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 2,66 2,54 2,27
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 2,63 2,50 2,23
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,60 2,47 2,20
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,57 2,44 2,17
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,55 2,41 2,14
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,37 2,39 2,11
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,37 2,20 1,92
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,20 2,03 1,73
120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,03 1,86 1,53
∞ 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 1,88 1,70 1,32

439
Tabela 6 - Valores críticos do teste de Hartley aos níveis de 1% e 5% de
probabilidade.

g: número de grupos
n1 = n-1 número de graus de liberdade de cada grupo
a = 5%.

g
2 3 4 5 6 7 8 9 10 11 12
n1
2 39,00 87,50 142,00 202,00 266,00 333,00 403,00 475,00 550,00 626,00 704,00
3 15,40 27,80 39,20 50,70 62,00 72,90 83,50 93,90 104,00 114,00 124,00
4 9,60 15,50 20,60 25,20 29,50 33,60 37,50 41,10 44,60 48,00 51,40
5 7,15 10,80 13,70 16,30 18,70 20,80 22,90 24,70 26,50 28,20 29,90
6 5,82 8,38 10,40 12,10 13,70 15,00 16,30 17,50 18,60 19,70 20,70
7 4,99 6,94 8,44 9,70 10,80 11,80 12,70 13,50 14,30 15,10 15,80
8 4,43 6,00 7,18 8,12 9,03 9,78 10,50 11,10 11,70 12,20 12,70
9 4,03 5,34 6,31 7,11 7,80 8,41 8,95 9,45 9,91 10,30 10,70
10 3,72 4,85 5,67 6,34 6,92 7,42 7,87 8,28 8,66 9,01 9,34
12 3,28 4,16 4,79 5,30 5,72 6,09 6,42 6,72 7,00 7,25 7,48
15 2,86 3,54 4,01 4,37 4,68 4,95 5,19 5,40 5,59 5,77 5,93
20 2,46 2,95 3,29 3,54 3,76 3,94 4,10 4,24 4,37 4,49 4,59
30 2,07 2,40 2,61 2,78 2,91 3,02 3,12 3,21 3,29 3,36 3,39
60 1,67 1,85 1,96 2,04 2,11 2,17 2,22 2,26 2,30 2,33 2,36
∞ 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00

a = 1%
g
2 3 4 5 6 7 8 9 10 11 12
n1
2 199,00 448,0 729,0 1036,0 1362,0 1705,0 2063,0 2432,0 2813,0 3204,0 3605,0
3 47,50 85,0 120,0 151,0 184,0 216,0 249,0 281,0 310,0 337,0 361,0
4 23,20 37,0 49,0 59,0 69,0 79,0 89,0 97,0 106,0 113,0 120,0
5 14,90 22,0 28,0 33,0 38,0 42,0 46,0 50,0 54,0 57,0 60,0
6 11,10 15,5 19,1 22,0 25,0 27,0 30,0 32,0 34,0 36,0 37,0
7 8,89 12,1 14,5 16,5 18,4 20,0 22,0 23,0 24,0 26,0 27,0
8 7,50 9,9 11,7 13,2 14,5 15,8 16,9 17,9 18,9 19,8 21,0
9 6,54 8,5 9,9 11,1 12,1 13,1 13,9 14,7 15,3 16,0 16,6
10 5,85 7,4 8,6 9,6 10,4 11,1 11,8 12,4 12,9 13,4 13,9
12 4,91 6,1 6,9 7,6 8,2 8,7 9,1 9,5 9,9 10,2 10,6
15 4,07 4,9 5,5 6,0 6,4 6,7 7,1 7,3 7,5 7,8 8,0
20 3,32 3,8 4,3 4,6 4,9 5,1 5,3 5,5 5,6 5,8 5,9
30 2,63 3,0 3,3 3,4 3,6 3,7 3,8 3,9 4,0 4,1 4,2
60 1,96 2,2 2,3 2,4 2,4 2,5 2,5 2,6 2,6 2,7 2,7
∞ 1,00 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0

440
Tabela 7 - Coeficientes para interpolação de polinômios ortogonais.

3 Ocasiões 4 Ocasiões 5 Ocasiões 6 Ocasiões


10 20 10 20 30 10 20 30 40 10 20 30 40 50
-1 +1 -3 +1 -1 -2 +2 -1 +1 -5 +5 -5 +1 -1
0 -2 -1 -1 +3 -1 -1 +2 -4 -3 -1 +7 -3 +5
+1 +1 +1 -1 -3 0 -2 0 +6 -1 -4 +4 +2 -10
+3 +1 +1 +1 -1 -2 -4 +1 -4 -4 +2 +10
+2 +1 +1 +1 +3 -1 -7 -3 -5
+5 +5 +5 +1 +1

7 Ocasiões 8 Ocasiões 9 Ocasiões


10 20 30 40 50 10 20 30 40 50 10 20 30 40 50
-3 +5 -1 +3 -1 -7 +7 -7 +7 -7 -4 +28 -14 +14 -4
-2 0 +1 -7 +4 -5 +1 +5 -13 +23 -3 +7 +7 -21 +11
-1 -3 +1 +1 -5 -3 -3 +7 -3 -17 -2 -8 +13 -11 -4
0 -4 0 +6 0 -1 -5 +3 +9 -15 -1 -17 +9 +9 -9
+1 -3 -1 +1 +5 +1 -5 -3 +9 +15 0 -20 0 +18 0
+2 0 -1 -7 -4 +3 -3 -7 -3 +17 +1 -17 -9 +9 +9
+3 +5 +1 +3 +1 +5 +1 -5 -13 -23 +2 -8 -13 -11 +4
+7 +7 +7 +7 +7 +3 +7 -7 -21 -11
+4 +28 +14 +14 +4

10 Ocasiões 11 Ocasiões
10 20 30 40 50 10 20 30 40 50
-9 +6 -42 +18 -6 -5 +15 -30 +6 -3
-7 +2 +14 -22 +14 -4 +6 +6 -6 +6
-5 -1 +35 -17 -1 -3 -1 +22 -6 +1
-3 -3 +31 +3 -11 -2 -6 +23 -1 -4
-1 -4 +12 +18 -6 -1 -9 +14 +4 -4
+1 -4 -12 +18 +6 0 -10 0 +6 0
+3 -3 -31 +3 +11 +1 -9 -14 +4 +4
+5 -1 -35 -17 +1 +2 -6 -23 -1 +4
+7 +2 -14 -22 -14 +3 -1 -22 -6 -1
+9 +6 +42 +18 +6 +4 +6 -6 -6 -6
+5 +15 +30 +6 +3

441

Você também pode gostar