Você está na página 1de 62

Processos de amostragem

Os processos de amostragem referem-se à abordagem da população sobre o conjunto de


unidades de amostra, podendo ser de forma aleatória, sistemática e mista. Dentro destes
arranjos situam-se os processos mais utilizados em inventários florestais, que são:

• Amostragem aleatória simples;


• Amostragem estratificada;
• Amostragem sistemática;
• Amostragem em dois estágios;
• Amostragem em conglomerados; e
• Amostragem com múltiplos inícios aleatórios.

Estimativas

Utilizam-se amostras para fazer estimativas sobre a população. Desta forma as amostras
devem ser representativas da população, gerando estimativas precisas e sem
tendenciosidade dos parâmetros populacionais.

A estimativa diz respeito às informações, geradas para a variável de interesse, oriundas


da amostragem e o parâmetro diz respeito às grandezas geradas através da medição total
da população.

Assim, antes de tratar especificamente de cada Processo de amostragem convêm


conceituar as principais grandezas estatísticas que envolvem os cálculos necessários em
inventários florestais.

- Média aritmética

É uma medida de tendência central, sendo o valor que melhor representa a característica
de interesse dentro da população.

- Variância

É uma medida que expressa a variação de uma determinada característica entre os


indivíduos de uma população em relação a média.

- Desvio padrão

Assim como a variância, o desvio padrão também é uma medida de variabilidade, que
indica o quanto, em termos médios, os valores observados veriam em relação a sua
média. Então, quanto maior for o desvio padrão mais heterogênea será a população.

- Variância da média

Determina a precisão da média estimada e representa a variação teórica das médias das
diversas amostras que hipoteticamente poderiam ser tomadas da população.

- Erro padrão
O erro padrão da média expressa a precisão do inventário de forma análoga à variância
da média, porém em termos lineares, na mesma medida da média. É o erro existente
devido a variação das médias.

- Coeficiente de variação

O coeficiente de variação é uma medida de variabilidade relativa, que compara a


variabilidade de duas ou mais populações em relação a suas médias em termos
percentuais.

- Erro de amostragem

É o erro que se comete por não medir toda a população, ou seja, pelo emprego da
amostragem. Não se trata de um engano, de uma falha, de algo mal feito, mas sim
expressa a diferença entre a média paramétrica e a média estimada pela amostragem.
Para diminuir este erro é necessário aumentar a intensidade amostral até o ponto que se
torna zero, e isso só ocorre quando a amostragem for a 100%, ou seja, um censo.

O erro de amostragem pode ser absoluto ou relativo. O erro absoluto é uma diferença na
mesma unidade da média, enquanto o erro relativo expressa essa diferença em termos
percentuais da média.

- Total da população

É o montante total existente da variável de interesse na população. É uma das


informações mais importantes no inventário, porque em função da sua magnitude é que
muitas decisões serão tomadas. Para o caso da variável volume é o quanto que existe de
madeira em toda área alvo do inventário.

- Intervalo de confiança para a média

Determina o limite inferior e superior, dentro do qual se espera encontrar,


probabilisticamente, o valor real da variável de interesse em termos de sua média.

- Intervalo de confiança para o total

Para obter o intervalo de confiança para o total, multiplica-se a média e o erro padrão
pelo número total de unidades amostrais da população (N), expandindo-os assim, para
toda a população. Explica o quanto o total pode oscilar para mais ou para menos,
considerando as variações identificadas no inventário em termos da variável de
interesse.

- Intensidade amostral

O número ideal de unidades amostrais a serem instaladas na floresta depende do grau de


variabilidade da população. A intensidade amostral deve ser definida de um inventário
piloto, de um inventário anterior realizado na área, de um inventário realizado em uma
população com características similares ou ainda, a partir de estimativas aproximadas
com base na experiência do executor. É importante sempre aferir a intensidade amostral
com base no limite de erro especificado e numa probabilidade definida, geralmente
utiliza-se 10% e 95%, respectivamente.

Para fazer o cálculo do número ideal de unidades amostrais é necessário saber se a


população é finita ou infinita. A definição ou diferença estatística de população finita e
infinita é feita pelo fator de correção (1-f) aplicado sobre algumas estimativas. Desse
modo, se:

(1-f) ≥ 0,98 è a população é considerada infinita.

(1-f) < 0,98 è a população é considerada finita.

Onde f é a fração de amostragem calculada a partir do quociente entre o número de


parcelas amostradas (n) e o número total de parcelas na população (N) ou número
potencial de unidades amostrais:

Sendo que:

Onde:

A = área total da população (m²);

a = área da unidade amostral ou parcela (m²).

Quando a população é considerada infinita, o fator de correção pode ser desprezado,


tanto no cálculo da intensidade amostral, como no cálculo de algumas estimativas, que
levam em consideração o fator de correção.

Amostragem Aleatória Simples


Neste processo, a seleção das unidades amostrais parte do pressuposto de que todas as
combinações possíveis de unidades amostrais têm igual chance de serem selecionadas
para compor o conjunto de amostras do inventário florestal.

Figura 1 – Representação da distribuição das unidades


amostrais na amostragem aleatória simples.
É utilizado em florestas plantadas ou naturais pequenas, homogêneas e de fácil acesso.
Permite diminuir a intensidade amostral e desta forma reduzir os custos com o
deslocamento e estabelecimento de parcelas.

1.2.1. Cálculos das estimativas


As principais estimativas da amostragem aleatória simples são as seguintes:

1.2.1.1. Média Aritmética


n

 (x ) i
x= i =1
n

1.2.1.2. Variância
n

 (x − x ) i
2

S x2 = i =1
n −1

1.2.1.3. Desvio Padrão


n

 (x − x ) i
2

Sx = i =1
n −1

1.2.1.4. Coeficiente de Variação


Sx
CV = *100
x

1.2.1.5. Intensidade amostral


A intensidade amostral pode ser calculada em função da variância ou do coeficiente de
variação:
Em função da variância
• Populações finitas

Nt 2 S x2
n=
NE 2 + t 2 S x2

Onde:
E = ( LE * x ) ;
LE = limite de erro admitido no inventário.

• Populações infinitas

t 2 S x2
n= 2
E
Em função do coeficiente de variação
• Populações finitas

Nt 2 (CV %)2
n=
N ( LE%)2 + t 2 (CV %)2

• Populações infinitas

t 2 (CV %)2
n=
( LE%)2

1.2.1.6. Variância da Média


S x2  N − n 
S x2 = * 
n  N 

 N −n
Onde   é o fator de correção para população finita. Quando a população for
 N 
definida como infinita, não há necessidade de aplicá-lo.

1.2.1.7. Erro Padrão

* (1 − f )
Sx
Sx = 
n

1.2.1.8. Erro de Amostragem


• Absoluto
Ea = t * S x
• Relativo
t * Sx
Er =  *100
x
1.2.1.9. Intervalo de Confiança para a Média
ICx − (t * S x )  X  x + (t * S x ) = P

1.2.1.10. Total da População


Yˆ = N * x

1.2.1.11. Intervalo de Confiança para o Total



IC Yˆ − N (t * S x )  Y  Yˆ + N (t * S x ) = P 
Exemplo de Aplicação – Amostragem Aleatória Simples
Em uma população de Pinus taeda, plantada em uma área de 40 ha, foi realizado um
inventário, cujo objetivo é estimar o volume de madeira da população. Para realização do
inventário foi utilizado o processo de amostragem aleatória simples, onde se deseja saber
quantas parcelas de 600 m² devem ser usadas para atingir a precisão desejada. Para isto
foi realizado um inventário piloto, onde foram medidas 16 parcelas (tabela a seguir), com
a finalidade de obter a variância da população e assim estimar a intensidade amostral para
o inventário definitivo.
Parcela Volume (m³/parcela)
1 20,85
2 19,47
3 24,13
4 24,34
5 25,13
6 22,37
7 22,51
8 19,78
9 25,05
10 28,84
11 23,70
12 24,78
13 22,58
14 23,70
15 36,16
16 17,83
Para os cálculos das estimativas foi considerado um o erro máximo admissível de 10% e
um nível de probabilidade é de 95%.
Os cálculos das estimativas estão apresentados a seguir:
Média aritmética dos volumes
20,85 + 19,47 + ... + 17,83
x= = 23,83m3 / parcela
16

Variância dos volumes


S 2
=
(20,85 − 23,83) + (19,47 − 23,83) + ... + (17,83 − 23,83)
2 2 2
=
267 ,37
= 17,82(m³ / parcela )
2

16 − 1
x
15
Desvio padrão dos volumes
S x = 17,82 = 4,222 m3 / parcela

Coeficiente de variação dos volumes


4,222
CV = *100 = 17,72%
23,83
Intensidade amostral
Para calcular a intensidade amostral, é necessário obter algumas informações, como:
• O valor de E
E = ( LE * x ) = 0,1* 23,83 = 2,383m3 / parcela

• O número total de unidades amostrais na população (N)


Segundo o exemplo, a área total da população é de 400.000 m² (40 ha) e a área das
parcelas é de 600 m², logo:
400.000
N= = 667 parcelas
600

• Se a população é finita ou infinita


(1-f) ≥ 0,98 ➔ a população é considerada infinita.
(1-f) < 0,98 ➔ a população é considerada finita.
16
f = = 0,024
667
1 – 0,024 = 0,976 < 0,98 ➔ então, a população é finita.

Com esses valores é possível calcular a intensidade amostral ideal, usando a fórmula em
função da variância, para população finita. O valor de t é obtido em função do grau de
liberdade (n-1) e do nível de probabilidade admitido, na tabela de distribuição de
Student.
Para o exemplo, o grau de liberdade é 15 e o nível de probabilidade é de 95%, sendo
assim, o valor de t segundo a tabela é 2,131. Então:

667 * (2,131) *17,82


2
n= = 13,9 = 14 parcelas
667 * (2,383 ) + (2,131) *17,82
2 2

Os cálculos realizados acima indicam que 14 parcelas amostram bem a população.


Sendo assim, o inventário piloto foi convertido em inventário definitivo. No contrário,
dever-se-ia acrescentar mais parcelas para a realização do inventário definitivo.
A seguir segue os demais cálculos para obter todas as estimativas do inventário
definitivo.
Variância da média
17,82  667 − 16 
S x2 = *  = 1,087 m³ / parcela
16  667 

Erro Padrão

Sx = 
4,222
* (0,976 ) = 1,043m³ / parcela
16

Erro de Amostragem Absoluto


Ea = 2,131 *1,043 = 2,223m³ / parcela

Erro de Amostragem Relativo


2,223
Er =  *100 = 9,33%
23,83
Intervalo de Confiança para a Média
IC 23,83 − (2,131 *1,043 )  X  23,83 + (2,131 *1,043 ) = 95%

IC 21,61m³ / parcela  X  26,05m³ / parcela = 95%

Total da População
Yˆ = 667 * 23,83 = 15.895m³

Intervalo de Confiança para o Total


IC15.895 − 667(2,131 *1,043)  Y  15.895 + 667(2,131 *1,043) = 95%

IC14.413m³  Y  17.377 m³ = 95%

Exercício: Amostragem aleatória simples


Em uma população de Pinus taeda, plantada em uma área de 100 ha, foi realizado um
inventário, cujo objetivo é estimar o volume de madeira da população. Para realização
do inventário foi utilizado o processo de amostragem aleatória simples, onde se deseja
saber quantas parcelas de 600m² devem ser usadas para atingir a precisão desejada. Para
isto foi realizado um inventário piloto, onde foram medidas 26 parcelas (tabela a seguir),
com a finalidade de obter a variância da população e assim estimar a intensidade
amostral para o inventário definitivo.
Parcela Volume (m³/parc.) Parcela Volume (m³/parc.)
1 6,80 14 3,24
2 5,65 15 4,40
3 6,32 16 6,00
4 6,40 17 6,20
5 5,70 18 6,00
6 5,40 19 6,30
7 5,60 20 5,90
8 5,40 21 5,48
9 5,80 22 4,95
10 5,90 23 6,28
11 4,75 24 4,24
12 5,00 25 6,00
13 7,53 26 5,90
Para os cálculos das estimativas foi considerado um o erro máximo admissível de 10%
e um nível de probabilidade de 95%. Calcule as estatísticas do inventário.

Amostragem Estratificada

1. Introdução

A intensidade de amostragem depende da variabilidade da população. Se a


variabilidade for grande, a intensidade será grande, bem como os custos da amostragem.
Assim, sendo possível dividir uma população heterogênea em subpopulações ou
estratos homogêneos, de tal forma que os valores da variável de interesse variem pouco
de uma unidade para a outra, pode-se obter uma estimativa precisa da média de um
estrato qualquer, através de uma pequena amostra desse estrato.
As estimativas dos estratos podem ser combinadas, resultando estimativas
precisas para toda a população.
Em inventários florestais os objetivos da estratificação são, reduzir a variância
dentro dos estratos e o custo de amostragem, bem como aumentar a precisão das
estimativas.
A amostragem estratificada é recomendada para população heterogênea, de fácil
acesso, ou mesmo homogênea onde haja necessidade de informações separadas por
estrato ou unidade administrativa.

2. Critérios para a estratificação

A população pode ser estratificada, tomando-se como base várias características,


tais como:
• Topografia do terreno;
• Sítio natural;
• Tipologia florestal;
• Altura;
• Idade;
• Densidade;
• Volume;
• Etc...

Porém sempre que possível, a base para a estratificação deve ser a variável
principal que será estimada no inventário.
A área de cada estrato deve ser conhecida ou razoavelmente estimada.
Devem ser tomadas unidades amostrais em cada estrato.

3. Tipos de estratificação

• Estratificação da variável de interesse ➔ geralmente do volume, principal


variável de um inventário.
• Estratificação administrativa ➔ por setor ou área de interesse.
• Estratificação tipológica ➔ por tipo florestal, comum em nativas, coincide com
a estratificação em volume.
• Pré-estratificação ➔ realizada antes da coleta de dados.
• Pós-estratificação ➔ realizada após a coleta dos dados. Decorre da identificação
da variabilidade da população.

4. Notação

L = número de estratos.
Nh = número potencial de unidades do estrato (h).
L
N =  Nh = número total potencial de unidades da população.
h =1

nh = número de unidades amostradas no estrato (h).


L
n=  nh = número total de unidades amostradas na população.
h =1

Nh Ah
Wh = = = proporção do estrato (h) na população.
N A
nh
wh = = proporção do estrato (h) na amostra total.
n
Ah = área do estrato (h).
L
A=  Ah = área total da população.
h =1
nh
fh = = fração amostral do estrato (h).
Nn
n
f= = fração amostral da população.
N
Xih = variável de interesse.

5. Tipos de Alocação

a) Alocação Proporcional

As unidades amostrais são distribuídas nos estratos proporcionalmente ao


tamanho dos mesmos, conforme:
Nh
nh = *n
N
Estratos maiores recebem mais parcelas, independente da variação da
característica de interesse.
b) Alocação ótima com custos iguais

As unidades amostrais são distribuídas nos estratos de forma proporcional à


variabilidade dos mesmos, conforme:
Wh * Sh
nh = L
*n
Wh * Sh
h =1

Estratos com maior variabilidade recebem mais parcelas que os estratos mais
homogêneos.

6. Número efetivo de graus de liberdade

O número de graus de liberdade que determina o valor de (t) que é usado no


cálculo do Intervalo de Confiança e do Erro de Amostragem é obtido com a seguinte
fórmula:
2
 L 
  gh * S h2 
ne =  Lh=1 2 4
 gh * Sh 
 
h =1  nh − 1 

Nh * ( Nh − nh)
Onde: gh =
nh

7. Cálculos das estimativas

As principais estimativas da amostragem estratificada são as seguintes:

7.1. Média por estrato


nh

 (x ) ih
xh = i =1
nh

7.2. Média estratificada


L
 Nh * x h L
xst = h =1
=  Wh * x h
N h =1

Ou
L
 nh * x h L
x= h =1
=  wh * x h
n h =1

Em geral, esta média ( x ) é menos precisa que ( xst ), porém quando a


distribuição das amostras for efetuada através da alocação proporcional, estas duas
médias são iguais, ou seja:

nh Nh nh n
= ou =
n N Nh N

então,

fh = f

e portanto,

x = xst

Está média é usada quando não se conhecem os valores de (Wh) ou a


delimitação previa dos estratos, como ocorre na pós-estratificação.

7.3. Variância por estrato


nh

 (x − xh)
2
ih
S h2 = i =1

nh − 1
7.4. Intensidade amostral
A intensidade de amostragem é calculada em função do tipo de alocação das
unidades amostrais nos estratos:
a) Por alocação proporcional
• População finita
L
t 2 Wh * S h2
n= h =1
L
Wh * S h2
E2 + t2
h =1 N

Lembrando: E² = (LE * x )²

xst

• População infinita
L
t 2 Wh * S h2
n= h =1

E2

b) Por alocação ótima com custos iguais


• População finita
2
 L 
t 2   Wh * Sh 
n=  h=1 
L
Wh * S h2
E2 + t2
h =1 N

• População infinita
2
 L 
t  Wh * Sh 
2

n =  h=1 2 
E

7.5. Variância Estratificada


L
S st2 = Wh * S h2
h =1

7.6. Variância da Média estratificada


A variância da média é dada por:
L
S h2 L
WhSh2
S x2( st ) = Wh 2 * −
h =1 nh h =1 N
Está fórmula pode ser simplificada, dependendo da intensidade de amostragem,
do tipo de alocação das unidades e da homogeneidade das variâncias dos estratos.
a) Se (fh = nh/Nh) for desprezível em todos os estratos, a variância da média
resulta:
L
S h2
S x2( st ) = Wh2 *
h =1 nh
b) Se a distribuição das unidades sobre os estratos for feita segundo a alocação
proporcional, onde a intensidade de amostragem é distribuída proporcionalmente
a área de cada estrato, tem-se:
1− f L
S x2( st ) =  Wh * S h2
n h=1
c) Se a amostragem for realizada com seleção proporcional e as variâncias forem
iguais em todos os estratos, através da analise de variância da amostra, tem se a
seguinte expressão.
S w2
S x2( st ) = (1 − f )
n

Onde:
L nh 2

  (x ih − xh )
S =
2 h =1 i =1
n−L
w

7.7. Erro Padrão


S x ( st ) =  S x2( st )

7.8. Erro de Amostragem


• Absoluto
Ea = t * S x ( st )
• Relativo
t * S x ( st )
Er =  * 100
xst

7.9. Intervalo de Confiança para a Média



IC xst − (t * S x ( st ) )  X  xst + (t * S x ( st ) ) = P 
7.10. Total por estrato e para a população
a) Total por estrato

Yˆh = Nh * xh
b) Total para a população
L
Yˆ =  Yˆh = Nxst
h =1

7.11. Intervalo de Confiança para o Total


IC Yˆ − N (t * S x(st) ) Y Yˆ + N (t * S x(st) ) = P
8. Análise de variância da estratificação

Ao se estratificar uma população florestal pela primeira vez, pode-se avaliar seu
efeito nas estimativas dos estratos através de uma análise de variância, mostrando se
existe ou não diferença significativa entre a média dos estratos. Havendo diferença, há
vantagem em se estratificar no que se refere à precisão e custos do inventário,
comparada com a amostragem aleatória simples com a mesma intensidade de
amostragem. Se não houver diferença entre as médias dos estratos, precisão e custos da
amostragem estratificada e da aleatória simples serão equivalentes.
Análise da variância da Estratificação:

Fontes de Variação GL SQ QM F
Entre Estratos L-1 SQe SQe / L-1 QMe / QMd
Dentro dos Estratos n-L SQd SQd / n-L
Total n-1 SQt

Onde:
L 2

SQe =  nh (xh - x )
h =1

L nh 2

SQd = 
h =1
 (x
i =1
ih - xh )

L nh 2

SQt = 
h =1
 (x ih - x )
i =1

Na primeira estratificação, a intensidade de amostragem calculada é distribuída


nos estratos através da alocação proporcional, porque a variância dos estratos é
desconhecida.
A partir da segunda ocasião do inventário, pode-se verificar se existe, além de
diferenças entre médias, também diferença entre variâncias dos estratos. Essa
verificação é feita através de um teste de homogeneidade de variâncias.
Havendo diferença significativa entre as variâncias dos estratos, a repartição da
intensidade amostral sobre os estratos deve ser feita através da alocação ótima com
custos iguais.
9. Exemplo de Aplicação

Inventariou-se uma população com 45 ha de Pinus sp através da amostragem


aleatória estratificada, admitiu-se um erro de amostragem máximo de 10% da média
estimada, com 95% de probabilidade de confiança. Definiu-se 3 estratos na população e
como não havia informações previas sobre a população, realizou-se um inventário piloto
para obter as estimativas básicas necessárias para o cálculo da intensidade amostral.
Neste caso, o número de unidades do inventário piloto foi arbitrado em 5% do
total de unidades de cada estrato (E1 = 144; E2 = 164; E3 = 142). Assim, foram tomadas
7 unidades no estrato E1, 8 no estrato E2 e 7 no estrato E3, totalizando 22 unidades, como
mostra o quadro abaixo:

Volume (m³/0,1ha)
Unidade (n)
E1 E2 E3
1 15,8 20,4 21,3
2 7,6 30,5 24,3
3 8,8 26,8 29,2
4 12,5 27,2 21,8
5 11,1 28,4 33,1
6 16,2 19,7 35,8
7 12,2 20,4 26,7
8 23,1

Quadro Auxiliar:

Estrato Nh Wh xh Sh2 Sh Wh x h WhSh Wh Sh


2
(Wh Sh2 )/N
1 144 0,320 12,029 10,462 3,235 3,8491 1,035 3,348 0,007
2 164 0,364 24,563 17,483 4,181 8,9517 1,524 6,371 0,014
3 142 0,316 27,457 30,823 5,552 8,6643 1,752 9,726 0,022
Total 450 1,000 - - - 21,465 4,311 19,446 0,043

Cálculo das estatísticas:

9.1. Média por estrato


nh

 (x ) ih
xh = i =1

nh

x1 = 12,029 m³/0,1ha
x 2 = 24,563 m³/0,1ha
x3 = 27,457 m³/0,1ha
9.2. Média estratificada
L
 Nh * x h L
xst = h =1
=  Wh * x h
N h =1

xst = 21,465 m³/0,1ha

9.3. Variância por estrato


nh

 (x − xh)
2
ih
S h2 = i =1

nh − 1
S = 10,462 (m²/0,1 ha)²
1
2

S 22 = 17,483 (m²/0,1 ha)²


S 32 = 30,823 (m²/0,1 ha)²

9.4. Intensidade amostral


Para o cálculo do número de unidades amostrais a serem amostradas é
necessário determinar se a população é finita ou infinita e o tipo de alocação nas
unidades nos estratos.
A fração de amostragem determinada pelo inventário piloto é dada por:
n 22
f= = = 0,0489
N 450
1-f = 1-0,0489 = 0,9511 < 0,98 ➔ população finita.
O tipo de alocação das unidades nos estratos pode ser definido com base na
analise de variância da estratificação, como mostram os quadros abaixo.
Formulação:
Fontes de Variação GL SQ QM F
Entre Estratos L-1 SQe SQe / L-1 QMe / QMd
Dentro dos Estratos n-L SQd SQd / n-L
Total n-1 SQt

Cálculos:
Fonte da variação GL SQ MQ F
Entre Estratos 2 951,355 475,678 24,421
Dentro dos estratos 19 370,090 19,478
Total 21 1.321,489

L 2

SQe =  nh (xh - x st )
h =1

SQe = 7 * (12,029 − 21,465 ) + 8 * (24,563 − 21,465 ) + 7 * (27,457 − 21,465 )
2 2 2

SQe = 951,355

L nh 2

SQd = 
h =1
 (x
i =1
ih - xh )


SQd = { (15,8 − 12,029 ) + (7,6 − 12,029 ) + ... + (12,2 − 12,029 ) +
2 2 2

 (20,4 − 24,563 )2
+ (30,5 − 24,563 ) + ... + (23,1 − 24,563 ) +
2
 2

 (21,3 − 27,457 ) 2
+ (24,3 − 27,457 )
2
+ ... + (26,7 − 27,457 ) }
2

SQd = 62.777 + 122,379 + 184,937


SQd = 370,090
L nh 2

SQt = 
h =1
 (x
i =1
ih - x st )


SQt = (15,8 − 21,495 ) + (7,6 − 21,495 ) + ... + (26,7 − 21,495 )
2 2 2

SQt = 1.321,490

Fcal. = 24,422 > Ftab. (0,05;2;19) = 3,52


O teste (F) indica que existe diferença significativa entre as médias dos estratos
e, portanto, a estratificação trará vantagem ao inventário.
Em se tratando da primeira estratificação da população, a repartição da
intensidade de amostragem será realizada através da alocação proporcional. Assim, a
intensidade de amostragem deve ser calculada pela fórmula de alocação proporcional e
população finita.
L
t 2 Wh * S h2
n= h =1
L
Wh * S h2
E2 + t2
h =1 N

Sendo:
E = (10%)*(21,465) = 2,1465
t (0,05;21) = 2,08
Com base no quadro auxiliar dos cálculos, substitui-se os valores na fórmula:

n=
(2,08) (19,446 )
2
= 17,64  18
(2,1465 )2 + (2,08)2 (0,043)
Tomando-se novo valor de (t) para 17 graus de liberdade e recalculando-se (n)
tem-se:

t (0,05;17) = 2,11

n=
(2,11)2 (19,446 ) = 18,75  18
(2,1465 )2 + (2,11)2 (0,043 )

Como (n) tornou-se constante, o número de unidades necessário para estimar os


parâmetros da população com a precisão e confiabilidade fixadas é de 18 unidades
amostrais.
Tendo em vista que no inventário piloto foram coletadas 22 unidades, a princípio, o
inventário piloto passa a ser o definitivo, no entanto, é necessário verificar se a
distribuição das unidades nos estratos foi contemplada no inventário piloto.

Nh
nh = * n = Wh * n
N
n1 = (0,320)*18 = 5,76 ≈ 6
n2 = (0,364)*18 = 6,54 ≈ 7
n3 = (0,316)*18 = 5,69 ≈ 6

Observa-se que a distribuição das unidades nos estratos foi contemplada no


inventário piloto e, portanto, este passa a ser o inventário definitivo. Como a intensidade
amostral foi maior que a necessária, haverá um aumento na precisão das estimativas, o
que é sempre desejável e, portanto, as unidades excedentes do inventário piloto não
serão eliminadas.

Término do cálculo do inventário definitivo:

9.5. Variância Estratificada


L
S st2 = Wh * S h2
h =1

S st2 = 19,452 (m³/0,1ha) ²

9.6. Variância da Média estratificada


L
S h2 L
WhSh2
S 2
x ( st ) = Wh * 2
−
h =1 nh h =1 N

S x2( st ) = 0,8823 − 0,0432


S x2( st ) = 0,8391 (m²/0,1ha) ²
9.7. Erro Padrão

S x ( st ) = S x2( st )
S x ( st ) = 0,839
S x ( st ) = 0,9160 m³ / 0,1ha

9.8. Número efetivo de graus de liberdade


2
 L 
  gh * S h2 
Nh * ( Nh − nh)
ne =  h =1 2  , sendo: gh =
L
 gh * Sh 
4
nh
 
h =1  nh − 1 


144 * (144 − 7)
g1 = = 2.818,29
7
164 * (144 − 8)
g2 = = 3.198,00
8
142 * (142 − 7)
g3 = = 2.738,57
7

2
 L 
  gh * S h2  =  (2.818,29 * 10,462 ) + (3.198,00 * 17,483 ) + (2.738,57 * 30,823 ) 2
 h =1 
2
 L 
  gh * S h2  =  (29.484,95 ) + (55.910,63 ) + (84.410,94 ) 2 = 169.806,182 = 28.834.256 .642,37
 h =1 
L
 g h2 * S h4   2818,29 2 * 10,462 2   3198,00 2 * 17,483 2   2738,57 2 * 30,823 2 
 
h =1  nh − 1
 = 
7 −1
 + 
8 −1
 + 
7 −1

      
L
 g h2 * S h4 
   = (144 .903 .824,06 + 446 .554 .864,44 + 1.778.983. 472,38 ) = 1.778 .983 .472,88
h =1  nh − 1 

28.834.256 .642,37
ne = = 16,21 → Arredondado para 17 graus de liberdade
1.778.983.472,88

9.9. Erro de Amostragem


• Absoluto
Ea = t * S x ( st )
Ea = (2,11) * (0,9160 ) = 1,9328 m³/0,1ha

• Relativo
t * S x ( st )
Er =  * 100
xst
1,9328
Er =  *100 =  9,0 %
21,465

1.1.Intervalo de Confiança para a Média


 
IC x st − (t * S x ( st ) )  X  x st + (t * S x ( st ) ) = P

IC 21,465 − 1,9328  X  21,465 + 1,9328  = 95%

IC 19,53 m³ / 0,1ha  X  23,40 m³ / 0,1ha = 95%

1.2.Total por estrato e para a população


a) Total por estrato

Yˆh = Nh * xh

Yˆ1 = (144 )(12,029 ) = 1.732 m³


Yˆ 2 = (164 )( 24,563) = 4.028 m³
Yˆ 3 = (142 )( 27,457 ) = 3.899 m³

b) Total para a população


L
Yˆ =  Yˆh = Nxst
h =1

Yˆ = (450)(21,465) = 9.659 m³

1.3.Intervalo de Confiança para o Total


IC Yˆ − N (t * S x(st) ) Y Yˆ + N (t * S x(st) ) = P
IC  9.659 − 450 (1,9328 ) Y  9.659 + 450 (1,9328 )  = 95%
IC  8.789 m³ Y 10.529 m³  = 95%
Nome: _________________________________________________________ Data:
__/__/____

Exercício - Amostragem Aleatória Estratificada


Em uma população de Araucária, plantada em uma área de 200 ha, através da idade dos
plantios, foram definidos três estratos: E1 = 75 ha; E2 = 65 ha e E3 = 60 ha. Desta
forma, foi realizado um inventário utilizado o processo de amostragem aleatória
estratificado, cujo objetivo é estimar o volume de madeira da população. Para isto foi
realizado um inventário piloto, onde foram medidas 20 parcelas de 600 m² nos três
estratos (tabela a seguir), com a finalidade de obter a variância da população e assim
estimar a intensidade amostral para o inventário definitivo.
Volume (m³/parcela)
Parcela
E1 E2 E3
1 21,85 18,79 36,16
2 19,47 24,05 17,83
3 24,13 28,84 18,45
4 24,34 23,70 23,11
5 25,13 24,78 21,22
6 20,37 22,58 20,19
7 22,51 23,70
Para os cálculos das estimativas o erro máximo admissível é de 10% e o nível de
probabilidade é de 95%.
Com base nos dados volumétricos da tabela, calcule as estimativas.

Amostragem Sistemática

10. Introdução

A amostragem sistemática situa-se entre os processos probabilísticos não aleatórios, em


que o critério de probabilidade se estabelece através da aleatorização da primeira
unidade amostral.
Segundo LOETSCH & HALLER (1973), em um processo sistemático, as unidades
amostrais são selecionadas a partir de um esquema rígido e preestabelecido de
sistematização, com o propósito de cobrir a população, em toda a sua extensão, e obter
um modelo sistemático simples e uniforme.
A localização das unidades amostrais são, em geral, mais fácil em uma amostra
sistemática do que em uma aleatória, uma vez que as unidades são distribuídas segundo
a mesma orientação. Em decorrência disso, o tempo gasto em deslocamento para
localizar as unidades amostrais é menor e o custo de amostragem é menor.
Em inventário florestal, a amostragem sistemática tem sido usada em todo o mundo e,
em muitos casos, é o processo de amostragem preferido.

11. Vantagens da amostragem sistemática

Os inventários florestais realizados através da amostragem sistemática apresentam as


seguintes vantagens conforme HUSCH, MILLER &BEERS (1972);
a) A sistematização proporciona boa estimativa da média e total, devido a
distribuição uniforme da amostra em toda população;
b) Uma amostra sistemática é executada com maior rapidez e menor custo que uma
aleatória, desde que a escolha das unidades amostrais seja mecânica e uniforme;

c) O deslocamento entre unidades é mais fácil pelo fato de seguir uma direção fixa
e preestabelecida, resultando um tempo gasto menor e, por conseqüência, um
menor custo de amostragem;

d) O tamanho da população não precisa ser conhecido uma vez que cada unidade
que ocorre dentro do intervalo de amostragem fixado, é selecionada
seqüencialmente, após ser definida a unidade inicial.

COCHRAN (1963) acrescenta que a amostragem sistemática, em geral, resulta mais


precisa que a aleatória simples, porque a população em (n) estratos de (k) unidades. Por
conseqüência, é de se esperar que a amostra sistemática seja quase tão precisa quanto a
correspondente amostra estratificada com uma unidade por estrato. A diferença é que,
na amostragem sistemática, as unidades são tomadas na mesma posição relativa dentro
do estrato, enquanto na amostragem estratificada, a posição das unidades é
independente e aleatória.

12. Intervalo de amostragem

Em inventários florestais, a distribuição sistemática das unidades amostrais pode ser


feita com parcelas de área fixa, ou faixas e também parcelas de área variável, quando
forem usados pontos amostrais ou linhas.
Considerando-se que as unidades de uma amostra sistemática são fixadas através de um
intervalo regular, haverá um conjunto fixo de amostras possíveis na população. Se um
intervalo de amostragem (k) for escolhido, haverá (k) amostras possíveis. Para que a
média de uma amostra sistemática seja uma estimativa sem tendência da média da
população, alguma forma de seleção aleatória deve ser incorporada no processo de
amostragem. Porém, a única possibilidade de aleatorização é a seleção da primeira
unidade da amostra sistemática.

13. Seleção da primeira unidade amostral

A primeira unidade da amostra pode ser aleatorizada entre o conjunto total de unidades,
ou entre as (k) primeiras unidades da população. Em qualquer dos casos, escolhida a
primeira unidade, todas as demais serão selecionadas em intervalos constantes de (k)
unidades.
Muitos inventários florestais usam outro procedimento inicial que se mostra mais
simples, com a expectativa de que eventual desvio na estimativa resultante da média
seja insignificante. Portanto o inicio de uma combinação de unidades amostrais,
sistematicamente distribuídas, é freqüentemente estabelecida a partir de algum ponto
facilmente acessível e arbitrariamente escolhido na floresta.

14. O problema estatístico


Uma amostra sistemática seria equivalente a uma aleatória, se todas as unidades da
população fossem aleatoriamente distribuídas e independentes da tendência de qualquer
agrupamento na distribuição espacial. Neste caso, as fórmulas da amostragem aleatória
seriam aplicáveis para estimar o erro de amostragem. A dificuldade em atender a
exigência de aleatorização em uma amostra sistemática, aumenta quando se trabalha
com populações biológicas, como é o caso de inventários florestais. Nestas populações,
raramente os indivíduos são arranjados completamente independentes e tendem a
mostrar as variações sistemáticas e periódicas características desse local. Desse modo, a
variação nos valores observados de uma amostra sistemática pode não ser totalmente
atribuída ao acaso, se o intervalo entre as unidades coincidir com o padrão de variação
da própria população.
De acordo com COCHRAN (1963), se a população tiver um desenvolvimento
periódico, como a curva dos senos naturais, a eficiência da amostragem sistemática
depende do valor de (k). Isto pode ser visto na figura 1, onde os pontos amostrais (X)
representam a situação menos favorável para a amostra sistemática. Essa situação ocorre
sempre que (k) é igual ao múltiplo perfeito do período da curva senoidal. Todas as
observações são rigorosamente iguais, de modo que a amostra não é mais precisa que
uma única observação feita ao acaso na população.
Em populações biológicas, esta situação é praticamente impossível de ocorrer, pois
como se pode depreender este se torna um caso de experimento determinístico, onde a
variação entre unidades amostrais é nula, razão pela qual a precisão independe da
intensidade amostral.

+ = Amostra X ; O = Amostra Y
Figura 1: Curva dos senos naturais.
A amostra (Y) é a situação mais favorável, e ocorre quando (k) é um múltiplo
incompleto do semiperíodo. A amostra sistemática tem valor médio exatamente igual ao
da população.
Na maioria das áreas florestais, por maior que seja a variação, é maior a probabilidade
de que uma amostra sistemática forneça uma melhor estimativa da média do que uma
completamente aleatória, com igual intensidade de amostragem.
Para uma população estratificada, uma amostra sistemática provavelmente produzirá a
melhor estimativa da média se o estrato for grande e com considerável variação. Porém,
à medida que diminui a variação dentro dos estratos, as estimativas de uma amostra
aleatória estratificada e de uma sistemática tendem a se igualar.
Fundamentalmente, a razão porque uma amostra sistemática não produz uma estimativa
válida do erro de amostragem é que o cálculo da variância exige, no mínimo, duas
unidades amostrais obtidas aleatóriamente na população.
Vários métodos têm sido propostos para determinar a melhor aproximação do erro de
amostragem de uma amostra sistemática. Uma amostra sistemática constituída de
unidades eqüidistantes entre si, pode ser considerada como uma amostra aleatória
simples, ou estratificada, e o erro de amostragem calculado como uma amostra
aleatória. OSBORNE (1942) mostra que o erro calculado desse modo, estima o erro
máximo provável, o qual pode superestimar o erro real. Um procedimento simples e útil
para obter a maior aproximação do erro verdadeiro é o método das diferenças
sucessivas. Outros procedimentos são referidos por YATES (1946, 1948 e 1949),
FINNEY (1947, 1948,1950 e 1953) e MAYER (1956). Contudo, nenhum dos métodos é
satisfatório e válido para estimar o erro de amostragem de uma amostra sistemática.
SHIUE (1960) propôs um processo de amostragem sistemática que mantém a vantagem
da sistematização e dispõe de um artifício válido para estimar o erro experimental.

15. Amostragem sistemática em estágio único

O estágio único é caracterizado pela seleção da amostra, mediante uma única etapa ou
fase de amostragem. A amostragem sistemática em único estágio pode ser realizada
através de faixas ou parcelas.

15.1. Amostragem sistemática em faixas


A amostragem sistemática em faixas é, em geral, estruturada dividindo-se a área
florestal em (N) faixas de igual largura, das quais toma-se uma amostra de (n) faixas,
com um intervalo de (k) faixas.
A figura 2 mostra uma área florestal dividida em 26 faixas (N) de igual comprimento,
das quais foram amostradas 5 faixas (n) com um intervalo de amostragem (k) igual a 5
faixas.
A seleção de (n) faixas com um intervalo (k) de amostragem pode ser realizada de duas
maneiras principais (HUSCH, MILLER & BEERS, 1982):

15.1.1. Sorteio da primeira faixa entre (1) e (N)


Neste procedimento, a primeira faixa é selecionada mediante a aleatorização de um
número entre (1) a (N). As demais unidades da amostra são selecionadas estendendo-se
o intervalo (k), em ambas as direções, a partir dessa faixa inicial.
Um método prático utilizado para se obter uma amostra sistemática em faixas pode ser
ilustrado com base nos dados da figura 2, ou seja, (N=26) e (k=5).
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

Figura 2: Área florestal dividida em 26 faixas, das quais 5 foram amostradas.

a) Seleciona-se um número aleatório entre (1) e (N) – por exemplo, 14;

b) Divide-se este número por (k), e obtém-se o restante da divisão;

14 4
= 2,8 = 2 +
5 5
O numerador da fração residual da divisão (4/5) está situado entre (1) e (k). Assim, a
faixa (4) é eleita como primeira unidade da amostra e todas as faixas subseqüentes, em
intervalos constantes de (k) unidades, são automaticamente selecionadas. Portanto, a
amostra selecionada é composta pelas faixas: 4, 9, 14, 19 e 24.

15.1.2. Sorteio da primeira faixa entre (1) e (k)


a) Seleciona-se um número aleatório entre (1) e (k), para definir a primeira faixa –
por exemplo, 2;

b) As demais faixas da amostra são selecionadas, somando-se o intervalo (k) ao


número da faixa anterior escolhida. Portanto a amostra resultante é composta
pelas faixas: 2, 8, 14, 20 e 26.

Ambos os procedimentos produzem o mesmo número de amostras sistemáticas


prováveis. O primeiro procedimento produzirá uma estimativa sem tendência da média,
enquanto que o segundo pode dar um resultado levemente tendencioso, se o valor de
(N) não for um múltiplo perfeito de (k). O primeiro processo deve ser preferido, quando
possível. O segundo pode ser usado se o tamanho da população não for conhecido,
como ocorre nos inventários em que não se dispõe do mapa da floresta.
Ocorrem, com freqüência, casos em que a área florestal apresenta forma irregular. Ao se
dividir a área em faixas de igual largura, resultam faixas com comprimentos diferentes
e, conseqüentemente, áreas diferentes. Assim, as amostras sistemáticas possíveis de
serem obtidas, tomando cada k-ésima faixa, podem diferir em tamanho. ZENGER
(1964) descreve um método que extrai uma amostra sistemática de tal modo, que a
probabilidade de seleção da faixa é proporcional ao seu comprimento.

15.2. Amostragem sistemática com parcelas


Quando usam-se parcelas ou pontos amostrais como unidade amostral, a amostra é
sistemática em duas dimensões, ou seja, as unidades são dispostas, segundo o intervalo
de amostragem (k) em duas direções perpendiculares (HUSCH, MILLER & BEERS,
1982).
A figura 3 ilustra uma distribuição sistemática de parcelas sobre uma área retangular
composta de 21 linhas e 26 colunas, formando uma população de 546 unidades de área
fixa.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
1
2
1 2 3 4 5
3
2
4 3
5 4
6 5
7 6
8 7
8
9
9
10 10
11 11
12 12
13 13
14 14
15
15
16
16 17
17 18
18 19
19 20
21
20
21
Figura 3: Distribuição sistemática de parcelas.
Supondo-se um intervalo de amostragem (k) em cada direção, haverão (k.k) amostras
independentes possíveis. A seleção das parcelas amostrais, com intervalo de
amostragem (k), pode ser feita de maneira análoga à descrita para amostragem
sistemática em faixas, diferindo apenas pelo fato de haver duas dimensões (linha e
coluna). Comumente, são usados dois procedimentos para a seleção da primeira unidade
ou ponto amostral: por coordenadas ou a partir de um vértice da área.
15.2.1. Definição da unidade inicial por coordenadas
Considerando-se a estruturação da figura 3, onde tem-se (N=26) colunas, (M=21)
linhas, intervalo de amostragem (k=4) em ambas as direções, a definição da unidade
inicial por coordenadas pode ser feita como segue:
a) Sorteia-se uma linha entre (1) e (M) – por exemplo, 19;

b) Sorteia-se uma coluna entre (1) e (N) – por exemplo, 24;

c) Dividem-se os números sorteados por (k.k = 16);

19 3 24 8
= 1,1875 = 1 + e = 1,5 = 1 +
16 16 16 16
d) Os números das frações residuais indicam as coordenadas da unidade inicial do
modelo sistemático (Um.n ➔ U3,8), identificando linha e coluna,
respectivamente. A partir dessa unidade inicial, estendendo-se o intervalo (k) em
ambas as direções, selecionam-se as 30 unidades amostrais indicadas em
hachuras na figura 3.

15.2.2. Ponto inicial a partir de um vértice da área


Tomando-se o canto inferior esquerdo da figura 3 e marcando-se um quadrado de 4
linhas por 4 colunas (k.k = 16) amostras independentes possíveis, define-se a primeira
unidade da amostra como segue:
a) Sorteia-se um número de (1) a (16) – considere sorteado o número 10.;

b) A partir dessa unidade inicial, estende-se o intervalo (k = 4) em ambas as


direções, obtendo-se as 35 unidades indicadas em negrito na figura 3.

Em inventários florestais é comum a área apresentar forma irregular. O primeiro método


de seleção requer a alocação de um limite imaginário, que enquadre totalmente a área. A
unidade inicial pode ser escolhida de modo similar ao usado na figura 3.
O tamanho da amostra será variável, quando o número de linhas e colunas não for
múltiplo exato do intervalo de amostragem. Além disso, depende do ponto inicial eleito
e da forma da área.
Usando o segundo método de seleção, pode-se escolher arbitrariamente o canto inferior
esquerdo da área e obter, do quadrado de 4 linhas por 4 colunas, uma unidade
aleatoriamente. Todas as unidades subseqüentes serão selecionadas a cada (k) unidades,
em ambas as direções.
Quando as unidades amostrais são obtidas através de modelos eqüidistantes, o cálculo
da média, total e seus erros padrões é, geralmente realizado como se as unidades fossem
selecionadas aleatoriamente. LOETSCH & HALLER (1964) demonstram que,
tomando-se a soma dos quadrados das diferenças entre sucessivas unidades amostrais de
um dos eixos da grade sistemática, obtém-se uma boa aproximação do erro padrão
verdadeiro.
16. Amostragem sistemática em dois estágios

Na amostragem sistemática em dois estágios as unidades amostrais são selecionadas


através de duas etapas ou fases de amostragem (entre linhas e entre unidades na linha),
cada uma delas com um intervalo de amostragem.
Por razões práticas, a distribuição eqüidistante das unidades amostrais é freqüentemente
alterada, de modo que o intervalo entre linhas (k1) seja maior do que o intervalo entre
unidades na linha (k2).
A amostragem sistemática em dois estágios é utilizada com maior freqüência nos
inventários florestais, especialmente em florestas nativas, onde fatores topográficos e
sítios naturais determinam sentidos definidos de variação. Nesta estrutura, representada
pela figura 4, a orientação das linhas (primeiro estágio) e o intervalo (k2) entre as
unidades da linha (segundo estágio) são definidos durante a fase de reconhecimento da
população, visando abranger a maior gama de variações e otimizar o esquema de
amostragem.

Figura 4: Amostra sistemática em dois estágios.


Após o cálculo da intensidade de amostragem determina-se o número de linhas e o
intervalo (k1) entre elas, com base no número médio de subunidades que cabem em uma
linha.
Uma linha de parcelas planejada pode ser alterada, usando-se as seguintes relações
apresentadas por (HUSCH, MILLER & BEERS, 1972).
Aa = fA (1)
Aa
n= (2)
a
a
D= (3)
fd
Onde:
A = área total da floresta em hectares;
Aa = área amostrada em hectares;
f = intensidade de amostragem, com uma decimal;
a = área da subunidade, em metros quadrados;
n = número de parcelas;
d = distância na linha, entre o início de uma subunidade e o início da subunidade
seguinte, em metros;
D = distância entre linhas, em metros.

Inúmeras distribuições possíveis de linhas de parcelas podem ser planejadas


dependendo do tamanho da parcela, da distância entre parcelas na linha e da distância
entre linhas.
Para elucidar a estruturação da amostragem sistemática em dois estágios, tomou-se
como exemplo um inventário de uma floresta de Araucária. O cálculo da intensidade de
amostragem determinou a necessidade de 73 unidades amostrais de 10 x 100m
(1000m²), para um erro de amostragem máximo de 10% da média com 95% de
probabilidade de confiança.
Durante o reconhecimento da floresta, definiu-se que as linhas seriam orientadas na
direção Leste-Oeste (sentido de maior movimentação do relevo) e que a distância entre
as subunidades seria de 200m.
Do exposto tem-se que:
A = área total da floresta = 750 ha
a = área da subunidade = 1000 m²
n = número total de subunidades = 73
Aa = área amostrada = (73)*(0,1ha) = 7,3 ha
f = intensidade de amostragem = Aa/A = 7,3ha/750ha = 0,0097
d = distância entre o início de uma subunidade e o início da subunidade seguinte na
linha = 300m
D = distância entre linhas = a/fd = 1000m²/(0,0097)*(300m) = 342,64 m

Portanto para distribuir sistematicamente as 73 unidades de 1000m², com intervalo de


200m no segundo estágio, nos 750 ha da floresta, as unidades do primeiro estágio
(linhas) deverão guardar entre si uma distância de 342,64 m.

17. Cálculos das estimativas

As principais estimativas da amostragem sistemática são as seguintes:


17.1. Média Aritmética – estágio único
n

 (x ) i
x= i =1
n

17.2. Média Aritmética – dois estágios


m nj
_   xij
j =1 i =1
x=
m * nj
Onde:
m = número de linhas ou faixas;
nj = número de subunidades dentro da linha ou faixa j.

17.3. Variância
n

 (x − x ) i
2

S x2 = i =1
n −1

17.4. Desvio Padrão


S x = S x2

17.5. Coeficiente de Variação


Sx
CV = *100
x

17.6. Intensidade amostral


A intensidade amostral é calculada utilizando-se os mesmos procedimentos da
amostragem aleatória simples, destacando que o inventário piloto deve apresentar a sua
estrutura de amostragem de forma sistemática, e de preferência que seja a mesma usada
no inventário definitivo.

17.7. Variância da Média – estágio único


n

 (x − x)
2
i
S x2
S x2 = i =1
(1 − f ) ou S x2 = (1 − f )
n(n − 1) n

17.8. Variância da Média – dois estágios


m

m nj m nj  ( x12j + xnj2 )
j =1
  xij2 −   xij * x( i +1) j −
j =1 i =1 j =1 i =1 2
S =
2
(1 − f )
x
n * ( n − m)
Onde:
m
n= n
j =1
j = número total de unidades amostradas.

17.9. Erro Padrão

S x = S x2

17.10. Erro de Amostragem


• Absoluto
Ea = t * S x
• Relativo
t * Sx
Er =  *100
x

17.11. Intervalo de Confiança para a Média


ICx − (t * S x )  X  x + (t * S x ) = P

17.12. Total da População


Yˆ = N * x

17.13. Intervalo de Confiança para o Total


 
IC Yˆ − N (t * S x )  Y  Yˆ + N (t * S x ) = P

18. Exemplo de Aplicação

18.1. Amostragem em dois estágios


Uma empresa florestal realizou um inventário em uma floresta na Amazônia com área
de 25.000 ha, empregando o processo de amostragem sistemática com parcelas.
Primeiro foi realizado o inventário piloto na população, onde foram estabelecidas 10
faixas de amostragem com 6 unidades de amostra em cada, com área de 1 hectare. Após
as medições de diâmetro à altura do peito, a empresa processou os dados do inventário e
obteve os seguintes volumes por hectare apresentados na tabela a seguir:
Unidade Faixa de amostragem
de
amostra 1 2 3 4 5 6 7 8 9 10
1 51,5 48,0 36,9 65,9 36,7 43,9 67,6 49,2 51,6 57,2
2 55,7 52,9 32,0 67,0 29,0 40,0 56,0 55,0 47,8 46,8
3 45,3 44,7 40,0 82,0 40,3 28,9 49,7 57,8 46,5 45,0
4 48,1 46,4 29,7 75,0 35,0 44,0 48,9 60,0 53,4 55,8
5 56,3 25,2 44,3 47,4 37,6 48,0 23,8 40,0 43,5 27,9
6 55,0 29,0 38,7 59,0 23,8 45,9 37,9 37,8 29,0 32,1
Para o cálculo das estimativas foi considerado um limite de erro de amostragem
máximo de 10% da média estimada e 95% de probabilidade de confiança.
Média Aritmética
m nj

_   xij _ _
j =1 i =1 2749,4
x= x=  x = 45,82m³ / ha
m * nj 10 * 6

Variância
n

 (x − x)
2

S x2 = i =1
i
=
(51,5 − 45,82 )2 + ... + (32,1 − 45,82 )2 = 154,408(m³ / ha)
2

n −1 60 − 1
Desvio Padrão

S x = S x2 = 154,408 = 12,43m³ / ha

Coeficiente de Variação
Sx 12,43
CV = *100 = *100 = 27,11%
x 45,82

Intensidade amostral
- Cálculo das informações adicionais.
• O valor de E
E = ( LE * x ) = 0,1 * 45,82 = 4,582 m 3

• O número total de unidades amostrais na população (N)


Segundo o exemplo, a área total da população é de 25.000 ha e a área das parcelas é de
1000 m², logo:
25.000 ha
N= = 25.000 parcelas
1ha

• Se a população é finita ou infinita


(1-f) ≥ 0,98 ➔ a população é considerada infinita.
(1-f) < 0,98 ➔ a população é considerada finita.
60
f = = 0,0024
25.000
1 – 0,0024 = 0,9976 > 0,98 ➔ então, a população é infinita.

Com esses valores é possível calcular a intensidade amostral ideal, usando a fórmula em
função da variância, para população infinita. O valor de t é obtido em função do grau de
liberdade (n-1) e do nível de probabilidade admitido, na tabela de distribuição de
Student.
Para o exemplo, o grau de liberdade é 59 e o nível de probabilidade é de 95%, sendo
assim, o valor de t segundo a tabela é 2,001. Então:
n=
(2,001) *154,408
2
= 29,443 = 29 unidades amostrais
(4,582 )2
No inventário piloto foram amostradas 60 parcelas, com um intervalo de amostragem
(k) de 416 unidades, então este foi convertido em inventário definitivo.
N 25.000
k= = = 416,67 = 416 unidades amostrais
n 60
A seguir segue os demais cálculos para obter todas as estimativas do inventário
definitivo.
Variância da Média
m
m nj m nj  ( X 2 ij + X nj2 )
j =1
  X ij2 −   X ij * X ( i +1) j −
j =1 i =1 j =1 i =1 2
S X2 =
n * (n − M )

[(51,5 2 + 55 2 ) + ... + (57,2 2 + 32,12 )]


(51,5 2 + 55,7 2 + ... + 32,12 ) − [(51,5 * 55,7) + ... + (27,9 * 32,1)] −
S X2 = 2
60 * (60 − 10)

Veja no anexo, tabela com exemplos de cálculos no Excel.


43.114,17
135 .096,72 − 110 .529,23 −
S X2 = 2 = 1,0035 (m 3 /ha) 2
60 * (60 − 10)

Erro Padrão

S x =  1,0035 = 1,0017 m³/ha

Erro de Amostragem
Absoluto
Ea = t * S x = 2,001 * 1,0017 = 2,0045 m³ / ha

Relativo
t * Sx 2,0045
Er =  *100 = *100 = 4,37%
x 45,82

Intervalo de Confiança para a Média

ICx − (t * S x )  X  x + (t * S x ) = P
IC 45,82 − (2,0045 )  X  45,82 + (2,0045 ) = 95%

IC 43,82m 3 / ha  X  47,83m 3 / ha = 95% 

Total da População
Yˆ = N * x = 25.000 * 45,82 = 1.145.583m³

Intervalo de Confiança para o Total

 
IC Yˆ − N (t * S x )  Y  Yˆ + N (t * S x ) = P
IC1.145.583 − 50.112  Y  1.145.583 + 50.112 = 95%
IC1.095.472m³  Y  1.195.695m³ = 95%
Anexo:
Cálculos dos termos da fórmula da variância média.

Faixa de Unidade de
V (m³) Xij^2 Xij*X(i+1)j X1j^2+Xnj^2
amostragem amostra
1 1 51,5 2652,3 2868,55
1 2 55,7 3102,5 2523,21
1 3 45,3 2052,1 2178,93
5677,3
1 4 48,1 2313,6 2708,03
1 5 56,3 3169,7 3096,5
1 6 55,0 3025,0 0
2 1 48,0 2304,0 2539,2
2 2 52,9 2798,4 2364,63
2 3 44,7 1998,1 2074,08
3145,0
2 4 46,4 2153,0 1169,28
2 5 25,2 635,0 730,8
2 6 29,0 841,0 0
3 1 36,9 1361,6 1180,8
3 2 32,0 1024,0 1280
3 3 40,0 1600,0 1188
2859,3
3 4 29,7 882,1 1315,71
3 5 44,3 1962,5 1714,41
3 6 38,7 1497,7 0
4 1 65,9 4342,8 4415,3
4 2 67,0 4489,0 5494
4 3 82,0 6724,0 6150
7823,8
4 4 75,0 5625,0 3555
4 5 47,4 2246,8 2796,6
4 6 59,0 3481,0 0
5 1 36,7 1346,9 1064,3
5 2 29,0 841,0 1168,7
5 3 40,3 1624,1 1410,5
1913,3
5 4 35,0 1225,0 1316
5 5 37,6 1413,8 894,88
5 6 23,8 566,4 0
6 1 43,9 1927,2 1756
4034,0
6 2 40,0 1600,0 1156
6 3 28,9 835,2 1271,6
6 4 44,0 1936,0 2112
6 5 48,0 2304,0 2203,2
6 6 45,9 2106,8 0

7 1 67,6 4569,8 3785,6


7 2 56,0 3136,0 2783,2
7 3 49,7 2470,1 2430,33
6006,2
7 4 48,9 2391,2 1163,82
7 5 23,8 566,4 902,02
7 6 37,9 1436,4 0
8 1 49,2 2420,6 2706
8 2 55,0 3025,0 3179
8 3 57,8 3340,8 3468
3849,5
8 4 60,0 3600,0 2400
8 5 40,0 1600,0 1512
8 6 37,8 1428,8 0
9 1 51,6 2662,6 2466,48
9 2 47,8 2284,8 2222,7
9 3 46,5 2162,3 2483,1
3503,6
9 4 53,4 2851,6 2322,9
9 5 43,5 1892,3 1261,5
9 6 29,0 841,0 0
10 1 57,2 3271,8 2676,96
10 2 46,8 2190,2 2106
10 3 45,0 2025,0 2511
4302,3
10 4 55,8 3113,6 1556,82
10 5 27,9 778,4 895,59
10 6 32,1 1030,4 0
Soma 135.096,7 110.529,2 43.114,2

Exercício Prático:
Inventariou-se uma população com 45 ha de Pinus sp., enumerada totalmente, através da
divisão em 450 unidades amostrais de forma retangular, com 20m de largura por 50m de
comprimento, ou seja, 1000m² (0,1 ha) de superfície.
Nesta amostragem, aplicou-se o processo de amostragem sistemática em dois estágios,
admitiu-se um erro de amostragem máximo de 10% da média estimada, com 95% de
probabilidade de confiança, calculou-se uma intensidade de amostragem de 70 parcelas,
calculada segundo a metodologia da amostragem aleatória simples, necessárias para
estimar os parâmetros da população com a precisão e confiabilidade desejadas.
Para se obter uma amostra sistemática de 70 unidades entre 450 unidades totais da
população, a princípio determina-se um intervalo de amostragem (k) dado por:
N 450
k= = = 6,43
n 70
Como (k) não é múltiplo perfeito de (N), deve-se arredondar o intervalo de amostragem
para (6) ou (7).
Qualquer das alternativas resultará um número de unidades para a amostra diferente da
requerida, ou seja, considerando (k=6) obtém-se 75 unidades; para (k=7) obtém-se 64
unidades amostrais. Porém, é preferível arredondar para (k=6) que, embora resultando
uma amostra maior que a desejada, garante a precisão requerida para as estimativas.
O intervalo (k=6) indica que a cada grupo de 6 unidades da população, uma unidade
será amostrada, a qual ocupa a mesma posição em cada grupo.
A estrutura sistemática em dois estágios, para amostrar uma unidade em cada grupo de
6, necessita de dois intervalos de amostragem, isto é: um intervalo entre colunas (k1= 3)
e um intervalo entre linhas (K2 = 2).
A eleição da primeira unidade amostral foi feita através do sorteio de uma coluna (1 a
15) e de uma linha (1 a 30). Foram sorteadas a coluna (7) e a linha (21). Dividindo-se os
números sorteados pelos intervalos de amostragem correspondentes obtém-se:
7 1 21 1
= 2,333 = 2 + = 10,5 = 10 +
3 3 2 2
Os numeradores das frações (1) para coluna e (1) para linha, são as coordenadas da
primeira unidade da amostra, ou seja (I1,1), que corresponde a (1ª). A partir desta
unidade obteve-se a amostra apresentada no quadro abaixo.

Linha ou Coluna - i = 1, ..., nj


j=1, ..., m
Faixa 1 4 7 10 13
1 1 8,0 9,4 7,3 10,1 8,7
2 3 8,6 12,7 9,8 11,6 8,8
3 5 13,1 7,6 9,5 8,5 10,4
4 7 16,6 19,0 18,6 10,8 22,9
5 9 21,6 15,1 15,8 18,0 16,2
6 11 23,6 23,7 23,3 23,0 24,0
7 13 19,7 18,4 22,8 27,1 19,5
8 15 30,6 29,4 27,8 28,7 30,5
9 17 20,4 24,6 19,2 28,2 19,9
10 19 28,0 38,6 28,3 34,9 22,9
11 21 30,1 27,6 23,1 28,4 21,4
12 23 22,6 24,7 26,7 31,7 28,7
13 25 26,7 24,8 26,9 31,8 21,8
14 27 31,8 28,7 33,9 28,3 30,7
15 29 25,5 33,1 35,1 30,1 28,3
Calcule as estatísticas do inventário.

Amostragem em Dois Estágios

1. Introdução

A amostragem em dois estágios tem uma grande variedade de aplicações, que vão
muito além do âmbito imediato dos levantamentos por amostragem. Sempre que um
processo qualquer envolva verificações químicas, físicas ou biológicas, que possam ser
realizadas em uma pequena quantidade de material, é provável que essa quantidade seja
retirada como uma subamostra de uma quantidade maior, que seja em si mesma, uma
amostra.
No inventário de uma floresta, consiste em dividir uma população florestal em
unidades amostrais primárias (N) e em um segundo momento estas unidades são
subdivididas em unidades secundárias (M), representando assim o primeiro e o segundo
estágio da amostragem, respectivamente. Na figura 1 está apresentada a distribuição das
unidades amostrais utilizando o processo de amostragem em dois estágios.

Figura 1 – Representação da distribuição das unidades amostrais na amostragem em dois


estágios.
É a situação mais simples da amostragem em múltiplos estágios, segundo a qual
a amostra é obtida por meio de diversos estágios na abordagem da população.
Conforme Husch, Miller & Beers (1982), podem ser empregadas tanto unidades
amostrais de área fixa, como de área variável (Bitterlich por exemplo) na amostragem em
dois estágios.
O emprego deste processo de amostragem geralmente se dá em populações
extensas, que possuam difícil acesso as unidades amostrais e que a população seja mais
ou menos homogênea em relação a variável de interesse, ou seja, não existam estratos
diferenciados.
É um processo recomendável para florestas naturais em áreas extensas ou então
inventários em geral de nível regional ou nacional.

2. Notação

Para a realização dos cálculos das estimativas é necessário conhecer algumas


notações.
N = número total de unidades primárias da população;
n = número de unidades primárias amostradas;
M = número total de unidades secundárias por unidade primária;
m = número de unidades secundárias amostradas por unidade primária;
Xij = variável de interesse na amostragem em dois estágios.

3. Cálculos das estimativas

As principais estimativas da amostragem em dois estágios são as seguintes:

3.1. Média da população por subunidade


n m
_   xij
i =1 j =1
x=
n*m
3.2. Média das subunidades por unidade primária
m
 xij
j =1
xi =
m
3.3. Variância por subunidade
2

(xij − x )
n m
1
S =
2
x 
n * m − 1 i =1 j =1

Neste processo, a estrutura de amostragem prevê a repartição da variância total


em dois componentes de variação, ou seja: entre as unidades primárias e dentro das
unidades primárias. Esta situação permite obter as estimativas isoladas desses dois
componentes de variância.
Através da análise de variância pode se dizer que:

S x2 = Se2 + S d2

Sendo:

Se2 = Variância entre unidades primárias;


S d2 = Variância dentro das unidades primárias ou entre as subunidades.
Da análise de variância, temos os seguintes estimadores:

 (x − xi )
n m
2
ij
i =1 j =1
QM dentro = = S d2 ➔ que é uma estimativa sem tendência de S d2 ;
n(m − 1)
n

 m( x − x)
2
i
QM entre = i =1

n −1
A variância entre unidades primárias é dada por;
QM entre − QM dentro
Se2 = ➔ que é uma estimativa sem tendência de Se2 ;
m
A estimativa da variância total resulta:
QM entre + (m − 1)QM dentro
S x2 = S e2 + S d2 =
m

3.4. Variância da média


 N − n  Se  M − m  Sd
2 2
S x2 =   + 
 N  n  M  n*m
Esta equação é aplicada à populações finitas, quando os fatores de correção para
o primeiro e segundo estágios não são desprezíveis.
Se o fator de correção para unidades primárias for desprezível a fórmula reduz-se
para:

S e2  M − m  S d2
S x2 = + 
n  M  n*m

Se, além disso, o fator de correção para unidades secundárias também for
desprezível a expressão é simplificada para:

S e2 S2
S x2 = + d ➔ esta expressão é aplicada às populações infinitas.
n n*m

3.5. Erro Padrão


S x = S x2

3.6. Erro de Amostragem


• Absoluto
Ea = t * S x
• Relativo
t * Sx
Er =  *100
x

3.7. Intervalo de Confiança para a Média

IC x − (t * S x )  X  x + (t * S x ) = P

3.8. Total da População


Yˆ = N * M * x

3.9. Intervalo de Confiança para o Total


 
IC Yˆ − N * M (t * S x )  Y  Yˆ + N * M (t * S x ) = P

3.10. Intensidade Amostral


O número de unidades amostrais no processo de amostragem em dois estágios é
definido a partir de duas equações, devido à existência de duas variáveis na expressão da
variância da média (n) e (m), sendo que a segunda equação é a dos custos.

3.10.1. Função dos custos


A função dos custos é expressa pela equação:
C = C 0 + Ca
Sendo que,
Ca = C1n + C2nm
De modo que,
C = C0 + C1n + C2nm
Onde:
C0 = custos fixos;
C1 = custo médio de deslocamento;
C2 = custo médio de medição.

A figura 2 mostra o comportamento da função de custos e da variância da média


em relação a intensidade de amostragem, onde pode-se observar que a função de custos
é diretamente proporcional a intensidade de amostragem, enquanto a variância da média
é inversamente proporcional à mesma.
Figura 2 – Comportamento das funções de custo e precisão, em relação a intensidade
de amostragem.

3.10.2. Intensidade de Amostragem Para as Unidades Primárias


A intensidade de amostragem para as unidades primárias foi derivada da
estimativa da variância por subunidade, desconsiderando-se o fator de correção para
população finita, obtendo as seguintes formulações:
- População Infinita

 S2 
t 2  S e2 + d 
n= 
m
2
E
- População finita

 S2 
t 2  S e2 + d 
n=  m
1  S2 
E 2 + t 2  S e2 + d 
N  M

3.10.3. Intensidade de Amostragem Para as Unidades Secundárias


A intensidade de amostragem para as unidades secundárias é obtida,
substituindo-se a expressão de (n) na equação de custos e derivando-a parcialmente em
relação a (m), resulta:

C1 S d2
m= *
C2 S e2

Pela expressão de (m) constata-se que, quanto maior for a variância entre unidades
primárias ( Se2 ), menor será o número de unidades secundárias dentro de cada unidade
primária e por conseqüência, maior o número de unidades primárias a serem amostradas.
A relação de custos também afeta o cálculo de (m) do seguinte modo: quanto maior o
custo médio de deslocamento (C1), maior o número de subunidades por unidade primária
e vice-versa.
Finalmente, convém salientar que o cálculo da intensidade de amostragem é
realizado, primeiro para as unidades secundárias (m) e após para as unidades primárias
(n), utilizando-se o resultado obtido para (m).

4. Exemplo

Para exemplificar a amostragem em dois estágios, tomou-se o Inventário de


Altamira, realizado em 1976, nas margens da Rodovia Transamazônica, numa extensão
de 500 km por 20 de largura, ou seja, 10 km em cada margem da estrada, cobrindo uma
área de 1.000.000 de hectares.
Esta área foi dividida em 100 unidades primárias de 10 km de comprimento por
10 Km de largura (10.000 ha).
As unidades secundárias usadas foram faixas de 10 m de largura por 250 m de
comprimento (2.500 m²).
A eleição das unidades primárias participantes da amostra foi feita por
amostragem aleatória simples, enquanto que as unidades secundárias foram selecionadas
através da amostragem sistemática.
No inventário piloto foram amostradas 18 unidades primárias, com 6 unidades
secundárias por unidade primária, como mostra a tabela 1, a seguir.
A razão de custos (C1/C2) foi igual a 0,45, ou seja, o custo médio de deslocamento
representa 45% do custo médio de medição.

Tabela 1 – Volumes das amostras obtidos no inventário piloto, em dois estágios.


Unidade Primária Unidades Secundárias (m³/0,25ha) Média
Bloco I II III IV V VI ̅𝒊
𝒙
1 29,07 72,37 96,03 55,9 106,91 54,51 69,132
2 113,55 53,14 63,08 125,64 113,1 27,21 82,620
3 37,26 58,57 40,27 58,81 57,3 72,97 54,197
4 52,66 58,97 37,86 74,61 69,56 70,67 60,722
5 60,81 37,76 63,43 75,4 46,24 44,19 54,638
6 72,98 65 94,62 55,52 57,81 48,97 65,817
7 120,71 73,83 108,75 47,76 101,33 98,52 91,817
8 62,48 70,3 41,59 49,85 65,64 65,05 59,152
9 73,35 38,46 138,26 106,78 154,13 145,69 109,445
10 56,35 19,51 20,25 23,54 38,34 25,06 30,508
11 73,65 51,87 62,15 43,96 30,82 41,77 50,703
12 65,58 36,48 38,76 26,37 83,33 47,14 49,610
13 34,31 29,64 30,69 23,87 23,63 37,5 29,940
14 45,98 50,52 44,55 72,07 42,39 86,99 57,083
15 55,58 67,72 44,15 107,9 51,05 101,61 71,335
16 26,79 27,88 69,14 36,53 41,43 55,25 42,837
17 52,11 47,06 80,57 20,37 166,67 118,35 80,855
18 44,4 117,04 82,26 130,69 123,53 131,59 104,918
Soma 1077,62 976,12 1156,41 1135,57 1373,21 1273,04
Soma Geral 6991,97
4.1. Cálculos das estimativas

Média da população por subunidade


n m
_   xij
i =1 j =1 6991,97
x= = = 64,74 m ³. 0,25ha−1
n*m 18 * 6
Média das subunidades por unidade primária
m
 xij
j =1
xi =  Veja os resultados na tabela 1
m
Variância por subunidade

S x2 = Se2 + S d2

2
- A variância dentro das subunidades ( Sd ) é dada por:

 (x − xi )
n m
2
ij
i =1 j =1 62750 ,83
Sd2 = QM dentro = = = 697 ,231 (m³. 0,25ha−1 )²
n(m − 1) 18(6 − 1)

Sendo: (xij − xi ) ➔cada valor menos a média da unidade primária. Faz isso por unidade
primária!!!
S2
- A variância entre as subunidades ( e ) é dada por:

 m(x − x)
2
i
51582,38
QM entre = i =1
= = 3034,258
n −1 17

QM entre − QM dentro 3034,258 − 697,231


Se2 = = = 389,505 (m³.0,25ha −1 )²
m 6

- A estimativa da variância total das subunidades ( S x2 ) resulta:

S x2 = 389,505 + 697,231 = 1086,736 (m³.0,25ha −1 )


Intensidade de amostragem

No cálculo da intensidade de amostragem utilizou-se uma razão de custos


(C1/C2) igual a 0,45, ou seja, ao custo médio de deslocamento representa 45% do custo
médio de medição.

- Unidades secundárias

𝐶1 𝑆𝑑2 697,321
𝑚=√ 2
= √0,45 ∗ = 0,891 = 1
𝐶2 𝑆𝑒 389,505

Portanto, o número ótimo de unidades secundárias por unidade primária seria 1.


Todavia, como no inventário piloto tomou-se 6 unidades secundárias por unidade
primária. Decidiu-se calcular o número de unidades primárias necessárias com 6
unidades secundárias cada.

- Unidades primárias

Para o cálculo de unidades primárias é necessário definir se a população é finita


ou infinita. Para isso se calcula o fator de correção para população finita.

𝑛 18
(1 − 𝑁) = 1 − 100 = 1 − 0,18 = 0,82 < 0,98 ➔ população finita.

Sendo 𝑡(0,05;17) = 2,11 e a população finita, o cálculo de n se dá da seguinte forma:

 S2 
t 2  S e2 + d 
n=  m
1  S2 
E 2 + t 2  S e2 + d 
N  M

 697 ,231 
(2,11) 2  389,505 + 
n1 =  6  =
2251,472
= 37,996  38
1 2 697 ,231  59,255
(6,474 ) +
2
(2,11)  389,505 + 
100  40000 

Calcula-se novamente para 𝑡(0,05;37) = 2,027

 697 ,231 
(2,027 ) 2  389,505 + 
n2 =  6 
=
2077 ,826
= 35,876  36
1 2 697 ,231  57,917
(6,474) +
2
(2,027 )  389,505 + 
100  40000 
Calcula-se novamente para 𝑡(0,05;35) = 2,032
 697 ,231 
(2,032 ) 2  389,505 + 
n3 =  6 
=
2088,089
= 36,004  36
1 2 697 ,231  57,996
(6,474 ) +
2
(2,032 )  389,505 + 
100  40000 

O cálculo do valor de n estabilizou-se em 36 unidades, portanto, são necessárias


36 unidades primárias, com 6 unidades secundárias cada, para estimar os parâmetros da
população com a precisão fixada, totalizando 216 unidades secundárias ou subunidades.
Para completar a intensidade de amostragem calculada, amostrou-se
aleatoriamente mais 18 unidades primárias com 6 subunidades, como mostra a tabela 2.

Tabela 2 – Volumes das amostras obtidos no inventário definitivo, em dois estágios.


Unidade
Unidades Secundárias (m³/0,25ha)
Primária Média
Bloco I II III IV V VI xi
1 29,07 72,37 96,03 55,9 106,91 54,51 69,132
2 113,55 53,14 63,08 125,64 113,1 27,21 82,620
3 37,26 58,57 40,27 58,81 57,3 72,97 54,197
4 52,66 58,97 37,86 74,61 69,56 70,67 60,722
5 60,81 37,76 63,43 75,4 46,24 44,19 54,638
6 72,98 65 94,62 55,52 57,81 48,97 65,817
7 120,71 73,83 108,75 47,76 101,33 98,52 91,817
8 62,48 70,3 41,59 49,85 65,64 65,05 59,152
9 73,35 38,46 138,26 106,78 154,13 145,69 109,445
10 56,35 19,51 20,25 23,54 38,34 25,06 30,508
11 73,65 51,87 62,15 43,96 30,82 41,77 50,703
12 65,58 36,48 38,76 26,37 83,33 47,14 49,610
13 34,31 29,64 30,69 23,87 23,63 37,5 29,940
14 45,98 50,52 44,55 72,07 42,39 86,99 57,083
15 55,58 67,72 44,15 107,9 51,05 101,61 71,335
16 26,79 27,88 69,14 36,53 41,43 55,25 42,837
17 52,11 47,06 80,57 20,37 166,67 118,35 80,855
18 44,4 117,04 82,26 130,69 123,53 131,59 104,918
19 41,48 90,94 60,43 47,6 58,71 44,05 57,202
20 59,69 65,41 72,89 55,52 41,42 76,9 61,972
21 50,27 52,25 31,06 79,5 88,1 60,19 60,228
22 62,24 27,18 69,97 72,08 60,97 46,94 56,563
23 36,71 31,28 34,94 37,25 64,99 40,83 41,000
24 63,36 26,13 25,89 33,8 25,12 60,89 39,198
25 43,08 41,36 30,66 32,78 28,1 30,42 34,400
26 38,29 37,51 29,58 62,67 56,4 73,09 49,590
27 32,34 57,92 89,36 16,09 52,05 54,4 50,360
28 75,36 59,68 36,97 22,02 40,25 69,87 50,692
29 53,63 21,01 46,76 84 88,49 45,35 56,540
30 48,85 45,06 30,19 30,51 27,35 48,72 38,447
31 21,05 79,97 20,08 62,15 16,2 56,69 42,690
32 29,13 27,72 35,92 80,5 98,08 25,65 49,500
33 24,77 20,32 62,24 27,18 69,97 72,08 46,093
34 47,21 43,56 25,74 23,53 28,29 50,16 36,415
35 43,11 40,8 53,1 28,08 54,64 19,82 39,925
36 40,25 33,02 32,24 23,87 64,41 18,85 35,440
Soma 1888,44 1777,24 1944,43 1954,7 2336,75 2167,94
Soma Geral 12069,5

Cálculos das estimativas do inventário definitivo

Média da população por subunidade


n m
_   xij
i =1 j =1 12069,5
x= = = 55,877 m ³. 0,25ha−1
n*m 36 * 6
Média das subunidades por unidade primária
m
 xij
j =1
xi =  Veja os resultados na tabela 1
m
Variância por subunidade

S x2 = Se2 + S d2

2
- A variância dentro das subunidades ( Sd ) é dada por:

  (x − xi )
n m
2
ij
i =1 j =1 96414 ,660
S d2 = QM dentro = = = 535,637 (m³. 0,25ha −1 )²
n(m − 1) 36(6 − 1)

S2
- A variância entre as subunidades ( e ) é dada por:

 m(x − x)
2
i
76755,167
QM entre = i =1
= = 2193,005
n −1 36 - 1

QM entre − QM dentro 2193,005 − 535,637


S e2 = = = 276,228 (m³.0,25ha −1 )²
m 6

- A estimativa da variância total das subunidades ( S x2 ) resulta:


S x2 = 276,228 + 535,637 = 811,865 (m³.0,25ha −1 )

Variância da média
Como se trata de uma população finita, os fatores de correção para o primeiro e
segundo estágios não são desprezíveis. Assim, utiliza-se a seguinte formulação:

 N − n  Se  M − m  Sd
2 2
S x2 =   + 
 N  n  M  n*m

 100 − 36  276,228  40000 − 6  535,637


S x2 =   +  = 7,390 m³.0,25ha −1
 100  36  40000  36 * 6

Erro Padrão
S x = S x2 = 7,390 = 2,719 m³.0,25ha −1

Erro de Amostragem
• Absoluto
Ea =  t * S x =  2,030 * 2,719 =  5,519 m³.0,25ha -1

• Relativo
t * Sx 5,519
Er =  *100 =  *100 =  9,88%
x 55,877

Intervalo de Confiança para a Média

IC x − (t * S x )  X  x + (t * S x ) = P
IC 55,877 − 5,519  X  55,877 + 5,519  = 95%

IC 50,359 m³.0,25ha -1  X  61,396 m³.0,25ha -1 = P 
Total da População
Yˆ = N * M * x
Yˆ = 100 * 40000 * 55,877
Yˆ = 223.509.259,26 m³

Intervalo de Confiança para o Total


 
IC Yˆ − N * M (t * S x )  Y  Yˆ + N * M (t * S x ) = P
IC 223.509.259,26 − 100 * 40.000 * 5,519  Y  223.509.259,26 + 100 * 40.000 * 5,519  = 95%
IC 201 .434 .006,19 m³  Y  245 .584.512,33 m³ = 95%
Exercício Prático:
Uma propriedade com 1700 ha plantados com Eucalyptus grandis foi subdividida
em 170 compartimentos de 10 ha, dos quais 17 foram selecionados para compor a
amostra. Em cada um destes foram lançadas 4 parcelas de 420m² cada (20x21m). A razão
de custos (C1/C2) foi igual a 0,6, ou seja, o custo médio de deslocamento representa 60%
do custo médio de medição. Na tabela a seguir estão demonstrados os volumes obtidos
em cada parcela. Calcule as estatísticas do inventário considerando um erro máximo de
10% com 95% de probabilidade.
Unidades Unidades Secundárias (m³/420m²)
Primárias 1 2 3 4
1 5,97 6,45 7,69 7,07
2 6,02 6,50 7,71 7,18
3 6,03 6,66 7,77 7,21
4 6,13 6,69 7,80 7,37
5 6,24 6,77 7,87 7,38
6 6,25 6,80 7,95 7,45
7 6,47 6,98 7,97 8,35
8 6,36 7,00 7,99 8,15
9 6,47 7,00 8,00 8,30
10 6,48 7,11 8,11 8,40
11 6,58 7,32 8,12 8,48
12 6,67 7,34 8,28 8,50
13 6,83 7,41 8,35 8,65
14 7,03 7,45 8,44 8,73
15 7,14 7,56 8,46 8,75
16 7,20 7,56 8,50 8,90
17 7,23 7,57 8,55 9,05

Amostragem por Conglomerados

5. Introdução

A amostragem por conglomerados é uma variação da amostragem em dois


estágios, onde o segundo estágio é sistematicamente organizado dentro do primeiro
estágio de amostragem, por isso, esse processo pode ser classificado como amostragem
mista quanto a estrutura organizacional na população amostrada. Nesse caso, as unidades
secundárias são, previamente, definidas em forma, tamanho e arranjo espacial,
caracterizando assim a fixação estrutural do segundo estágio da amostragem. (PÉLLICO
NETTO e BRENA, 1997).
Por conta da sistematização das subparcelas, Queiroz (2012), afirmou que na
amostragem em conglomerados o cálculo do erro de amostragem sofre uma pequena
tendência, mesmo sabendo que as unidades primárias são selecionadas inteiramente ao
acaso. Ele considera ainda que a tendência no cálculo da variância da média pode ser
desprezível no caso de inventários florestais, pois, normalmente, os valores das variáveis
respostas são ordenados aleatoriamente por algum critério objetivo ou mesmo se sucedem
numa ordem natural, podendo-se, assim, através da análise de variância, ter uma
aproximação satisfatória da estimativa da variância da população.
Segundo Péllico Netto e Brena (1997), este é um processo que pode oferecer
vantagem substancial em precisão e custos, quando comparado com a amostragem
aleatória simples, quando a população inventariada for extensa e a variável de interesse
apresentar grande ou até razoável homogeneidade. Ele considera que a sistematização das
unidades secundárias dentro das unidades primárias produz maior redução dos custos de
amostragem, devido a flexibilidade e facilidade operativa da localização, instalação e
medição.
Queiroz (2012), afirma que quando as subparcelas do conglomerado são
definidas sistematicamente e dimensionadas de tal forma que um conglomerado seja
medido em um dia de trabalho, o custo de medição de campo é sensivelmente reduzido.
Freese (1962) cita que em inventários realizados em áreas de difícil acesso, onde
o custo de localização da unidade de amostra é alto, o uso da amostragem por
conglomerados em dois estágios possibilita a redução do custo do levantamento, pois em
cada conglomerado amostrado são medidas várias subparcelas.
Loetsch e Haller (1964) citam que, em razão da concentração das subparcelas na
amostra por conglomerado apresentar uma diminuição das distâncias a serem percorridas
em relação à amostra aleatória, haverá uma substancial vantagem operacional e
financeira.
Segundo Queiroz (2012), a amostragem por conglomerados, no que se refere à
aplicação em levantamentos florestais, apresenta as seguintes vantagens:
a) oferece melhor controle no trabalho de campo, pois as unidades de registro –
subparcelas do conglomerado - são menores;
b) percepção de maior quantidade de variabilidade da variável resposta em
questão, pois o conglomerado é formado por uma série de subparcelas, as quais explicam
a variabilidade dentro do conglomerado;
c) em florestas tropicais, onde a acessibilidade é difícil, é vantajosa a aplicação
da amostragem por conglomerados, principalmente quando apresenta uma forma
estrutural para ser completamente mensurada no expediente de um dia de trabalho.
Os conglomerados são organizados das mais diversas formas, tamanhos e
arranjos espaciais. A figura 1 mostra exemplos de conglomerados usados em inventários
florestais.
Figura 1: Exemplos de conglomerados.

6. Notação

N = número total potencial de conglomerados da população;


n = número de conglomerados amostrados;
M = número de subunidades do conglomerado;
Xij = variável de interesse na amostragem em conglomerado.

7. Cálculos das estimativas

7.1. Média da população por subunidade


n M
_   xij
i =1 j = 1
x=
n*M
7.2. Média das subunidades por unidade primária
M
 xij
j =1
xi =
M
7.3. Variância por subunidade
2

 (xij − x )
n M
1
S = 2

n * M − 1 i =1 j =1
x

Considerando-se que na amostragem em conglomerado também é possível dividir


a variância total em dois componentes de variação, ou seja, entre e dentro dos
conglomerados, pode-se realizar uma análise de variância para obter estimativas isoladas
desses dois componentes da variância.
Através da análise de variância pode se dizer que:

S x2 = Se2 + S d2

Sendo:
Se2 = Variância entre os conglomerados;
S d2 = Variância dentro dos conglomerados, ou entre as subunidades.

Da análise de variância, temos os seguintes estimadores:

  (x − xi )
n M
2
ij
i =1 j =1
QM dentro = = S d2 ➔ que é uma estimativa sem tendência de S d2 ;
n(M − 1)
n

 M (x − x)
2
i
QM entre = i =1

n −1
A variância entre unidades primárias é dada por;
QM entre − QM dentro
S e2 = ➔ que é uma estimativa sem tendência de Se2 ;
M
A estimativa da variância total resulta:
QM entre + (M − 1)QM dentro
S x2 = S e2 + S d2 =
M

7.4. Coeficiente de correlação intraconglomerado


Esta estimativa avalia o grau de homogeneidade da variável de interesse na
floresta. É dado pela seguinte expressão:
𝑆𝑒2
𝑟= 2
𝑆𝑒 + 𝑆𝑑2
O coeficiente de correlação intraconglomerados pode assumir valores entre
(0≤r≤1). Será igual a zero quando não existir variância entre os conglomerados (𝑆𝑒2 = 0)
e será igual a 1 quando a variância dentro dos conglomerados for nula (𝑆𝑑2 = 0). Assim,
quanto menor o valor de (r) , mais homogênea será a floresta. Para efeito prático, é
determinado um limite para o valor de (r), onde (0≤r≤0,4), o qual enquadra populações
absolutamente homogêneas com (r=0) e as razoavelmente homogêneas (r=0,4). Quando
o coeficiente de correlação for maior que o limite aceitável, a amostragem estratificada
será mais eficiente que a amostragem em conglomerados Péllico Netto e Brena (1997).

7.5. Variância da média

 N − n  Se
2 2
S
S =
2
 + d
 N  n n*M
x

Na maioria das vezes, o fator de correção para conglomerados é insignificante,


devido a grande extensão das populações, e por isso pode ser desprezado. Assim, a
variância da média é simplificada para:
S e2 S2
S x2 = + d ➔ esta expressão é aplicada às populações infinitas.
n n*M

Esta expressão também é dada em função do coeficiente de correlação


intraconglomerados, resultando na fórmula seguinte:

S x2
S x2 = 1 + r (M − 1)
n*M
Esta expressão que permite verificar que a variância da média é afetada pelo
coeficiente de correlação intraconglomerados. A parte da fórmula [ r (M − 1) ]
corresponde à inflação da variância da média.

7.6. Erro Padrão


S x = S x2

7.7. Erro de Amostragem


• Absoluto

Ea = t * S x

• Relativo

t * Sx
Er =  *100
x

7.8. Intervalo de Confiança para a Média

IC x − (t * S x )  X  x + (t * S x ) = P

7.9. Total da População


Yˆ = N * M * x

7.10. Intervalo de Confiança para o Total


 
IC Yˆ − N * M (t * S x )  Y  Yˆ + N * M (t * S x ) = P

7.11. Intensidade Amostral


O número de unidades amostrais neste processo é obtido a partir das mesmas
justificativas apresentadas na amostragem em dois estágios, ou seja, a existência de duas
variáveis (n) e (M) exige duas equações e, portanto, a função de custos é utilizada para
compor, juntamente com a variância da média, as duas equações do sistema. Nota-se que
tanto o valor de (n) quanto o valor de (M) são afetados pelo coeficiente de correlação
intraconglomerados, resultando nas seguintes formulações:
- Número ótimo de subunidades do conglomerado

C1 1 − r
M = *
C2 r

- Número ótimo de conglomerados

t 2 S x2
n= 2 1 + r (M − 1)
E *M
Exercício Prático:
No inventário de uma área de floresta tropical com 4000 ha localizada no Amapá,
realizou-se inicialmente um inventário piloto por meio de amostragem em conglomerados
(tipo cruz de malta), cujos volumes comerciais obtidos com casca acima de 30cm de DAP
são apresentados na tabela abaixo. Considere um erro máximo admissível de 10% da
média, com 95% de probabilidade de confiança e calcule as estatísticas desse inventário.

Unidade Unidade Secundária (m³/0,25ha)


Média
Primária I II III IV
1 84,7 78,2 63,0 88,5 78,60
2 70,1 65,4 59,6 58,1 63,30
3 75,6 77,7 66,1 43,5 65,73
4 81,3 38,7 62,8 31,1 53,48
5 99,5 47,0 82,1 77,4 76,50
6 97,3 66,1 57,4 113,9 83,68
7 70,2 43,5 48,3 69,3 57,83
8 81,7 68,8 22,6 78,2 62,83
9 60,9 71,4 75,2 81,1 72,15
10 67,3 90,5 72,6 67,1 74,38
11 75,4 88,5 104,6 105,5 93,50
12 71,0 57,0 79,3 71,8 69,78
13 61,8 100,9 69,4 61,0 73,28
14 116,9 91,0 36,9 57,3 75,53
15 56,0 22,9 94,8 130,2 75,98
16 68,2 32,5 68,2 58,6 56,88
17 55,4 61,3 76,3 40,0 58,25
18 55,0 63,0 56,8 36,8 52,90
19 78,8 59,6 68,1 46,8 63,33
20 33,6 44,4 34,1 79,6 47,93
21 48,8 26,6 67,5 51,0 48,48
22 82,4 61,8 23,4 60,2 56,95
23 69,8 49,5 53,9 0,0 43,30
24 58,4 61,5 45,5 50,2 53,90
25 27,4 63,6 69,4 60,8 55,30

Cálculos das estimativas


Média da população por subunidade
n M
  xij
_
x= i =1 j =1
=
(84,7 + ... + 60,8) = 6454 ,8 = 64,548 m³/0,25ha
n*M 25 * 4 100
Média das subunidades por unidade primária
M
 xij
j =1
xi =
M

x1 =
(84,7 + 78,2 + 63 + 88,5) = 314,4 = 78,6 m³/0,25ha
4 4
As demais médias estão na tabela!!!

Variância por subunidade


2

 (xij − x ) = 477,43 (m³/0,25ha )²


n M
1
S = 2

n * M − 1 i =1 j =1
x

Ou através da análise de variância ➔ S x2 = Se2 + S d2

  (x − xi )
n M
2
ij
i =1 j =1
S d2 = QM dentro =
n(M − 1)

S d2 =
(84,7 − 78,6)² + ... + (88,5 − 78,6)² + ... + (27,4 − 55,3)² + ... + (60,8 − 55,3)²
25(4 − 1)

32.443,86
S d2 = = 432,58 (m³/0,25ha )²
25(4 − 1)

 M (x − x)
2

QM entre = i =1
i
=
4 * (78,6 − 64,55)² + ... + 4 * (55,3 − 64,55)² = 14.821,98 = 617,58
n −1 (25 − 1) 24

QM entre − QM dentro 617,58 − 432,58


S e2 = = = 46,25 (m³/0,25ha )²
M 4

S x2 = S e2 + S d2 = 46,25 + 432,58 = 478,83 (m³/0,25ha )²


Coeficiente de correlação intraconglomerado
𝑒 𝑆2 46,25
𝑟 = 𝑆2 +𝑆 2 = = 0,0966 < 0,4 ➔ População homogênea (amostragem em
𝑒 𝑑 478,83
conglomerado é mais eficiente)

Intensidade Amostral

- Número ótimo de conglomerados

t 2 S x2
n= 2 1 + r (M − 1)
E *M
Sendo:
E = (0,1*64,548) = 6,4548
t(0,05;24) = 2,064

(2,064 ) 2 * 478,83
n= 1 + 0,0966 (4 − 1) = 15,79  16
(6,4548 ) 2 * 4

Variância da média
Esta população é finita ou infinita?

𝑛 25
(1 − 𝑁) = 1 − 4000 = 0,9938 > 0,98 ➔ população infinita.

S e2 S d2 46,25 432,58
S x2 = + = + = 6,1758 (m³/0,25ha )²
n n*M 25 25 * 4

Em função do coeficiente de correlação intraconglomerados:

S x2
S x2 = 1 + r (M − 1) = 478,83 1 + 0,0966 * (4 − 1) = 6,1758 (m³/0,25ha )²
n*M 25 * 4

Erro Padrão
S x = S x2 = 6,1758 = 2,4851 m³/0,25ha

Erro de Amostragem
• Absoluto
Ea = t * S x = 2,046 * 2,4851 = 5,129 m³/0,25ha

• Relativo

t * Sx 5,129
Er =  * 100 =  * 100 = 7,95%
x 64,548

Intervalo de Confiança para a Média

IC x − (t * S x )  X  x + (t * S x ) = P

IC 64,548 − 5,129  X  64,548 + 4,129  = 95%

IC 59,42 m³/0,25ha  X  69,68 m³/0,25ha  = 95%

Total da População
Yˆ = N * M * x

Yˆ = 4000 * 4 * 64,548 = 1.032.768 m³

Intervalo de Confiança para o Total


 
IC Yˆ − N * M (t * S x )  Y  Yˆ + N * M (t * S x ) = P

IC 1.032.768 − 4000 * 4 * 5,129  Y  1.032.768 + 4000 * 4 * 5,129  = 95%

IC 950 .703,42 m³  Y  1.114.832, 58 m³ = 95%

Amostragem em Múltiplos Inícios Aleatórios

8. Introdução

A amostragem com múltiplos inícios aleatórios assemelha-se ao processo de


amostragem sistemática, porém, ao invés de um início aleatório, são tomados múltiplos
inícios aleatórios, o que representa uma estrutura em conglomerados com várias unidades.
Péllico Netto e Brena (1997), afirmaram que este processo é uma convergência da
amostragem sistemática em dois estágios para a amostragem aleatória simples, na qual se
mantém a abordagem das unidades sobre a mesma orientação da amostragem sistemática,
mudando apenas a localização das linhas ou faixas.
De acordo com Péllico Netto e Brena (1997), este processo foi proposto por
Shiue (1960) e consiste na seleção aleatória de todas as faixas ou linhas de unidades
amostrais, ou seja, é feita a divisão da população florestal em (n) partes de (k) unidades
cada, sendo escolhida aleatoriamente, em cada uma dessas partes, a posição em que será
colocada a faixa ou linha.

Figura 1: Esquema da amostragem sistemática com múltiplos inícios aleatórios.


A estrutura desse tipo de amostragem assemelha-se à amostragem em
conglomerados, desta forma, no cálculo das estimativas da média e variância amostral,
cada início aleatório é tratado como um conglomerado, e as fórmulas convencionais para
amostragem em conglomerados podem ser usadas (PÉLLICO NETTO e BRENA, 1997).
Este processo tem como vantagem a orientação da amostragem visando minimizar
a variância entre linhas ou faixas. Naturalmente, a máxima variância entre linhas é obtida
quando estas são tomadas no sentido perpendicular à pendente ou inclinação do terreno e
a mínima variância, quando tomadas paralelo à inclinação do terreno. Outra vantagem, é
a obtenção de estimativa válida do erro de amostragem, uma vez que são selecionadas (n)
unidades aleatórias (PÉLLICO NETTO e BRENA, 1997).

9. Notação

N = número total potencial de inícios aleatórios (conglomerados) da população;


n = número de inícios aleatórios (conglomerados) amostrados;
M = número de subunidades;
Xij = variável de interesse na amostragem.

10. Cálculos das estimativas

10.1. Média da população por subunidade


n M
_   xij
i =1 j = 1
x=
n*M
10.2. Média das subunidades por unidade primária
M
 xij
j =1
xi =
M
10.3. Variância por subunidade
2

(xij − x )
n M
1
S = 2

n * M − 1 i =1 j =1
x

A variância total é dividida em dois componentes de variação, ou seja, entre e


dentro dos conglomerados, pode-se realizar uma análise de variância para obter
estimativas isoladas desses dois componentes da variância.
Através da análise de variância pode se dizer que:

S x2 = Se2 + S d2

Sendo:

Se2 = Variância entre os conglomerados;


S d2 = Variância dentro dos conglomerados, ou entre as subunidades.

Da análise de variância, temos os seguintes estimadores:

  (x − xi )
n M
2
ij
i =1 j =1
QM dentro = = S d2 ➔ que é uma estimativa sem tendência de S d2 ;
n(M − 1)
n

 M (x − x)
2
i
QM entre = i =1

n −1
A variância entre conglomerados é dada por;
QM entre − QM dentro
S e2 = ➔ que é uma estimativa sem tendência de Se2 ;
M
A estimativa da variância total resulta:
QM entre + (M − 1)QM dentro
S x2 = S e2 + S d2 =
M

10.4. Coeficiente de correlação intraconglomerado


Esta estimativa avalia o grau de homogeneidade da variável de interesse na
floresta. É dado pela seguinte expressão:
𝑆𝑒2
𝑟=
𝑆𝑒2 + 𝑆𝑑2
O coeficiente de correlação intraconglomerados pode assumir valores entre
(0≤r≤1). Será igual a zero quando não existir variância entre os conglomerados (𝑆𝑒2 = 0)
e será igual a 1 quando a variância dentro dos conglomerados for nula (𝑆𝑑2 = 0). Assim,
quanto menor o valor de (r) , mais homogênea será a floresta. Para efeito prático, é
determinado um limite para o valor de (r), onde (0≤r≤0,4), o qual enquadra populações
absolutamente homogêneas com (r=0) e as razoavelmente homogêneas (r=0,4). Quando
o coeficiente de correlação for maior que o limite aceitável, a amostragem estratificada
será mais eficiente que a amostragem em conglomerados Péllico Netto e Brena (1997).

10.5. Variância da média

 N − n  Se
2 2
S
S x2 =   + d
 N  n n*M
Na maioria das vezes, o fator de correção para conglomerados é insignificante,
devido a grande extensão das populações, e por isso pode ser desprezado. Assim, a
variância da média é simplificada para:

S e2 S2
S x2 = + d ➔ esta expressão é aplicada às populações infinitas.
n n*M

Esta expressão também é dada em função do coeficiente de correlação


intraconglomerados, resultando na fórmula seguinte:

S x2
S =
2
x
1 + r (M − 1)
n*M
Esta expressão que permite verificar que a variância da média é afetada pelo
coeficiente de correlação intraconglomerados. A parte da fórmula [ r (M − 1) ]
corresponde à inflação da variância da média.
10.6. Erro Padrão
S x = S x2

10.7. Erro de Amostragem


• Absoluto

Ea = t * S x

• Relativo

t * Sx
Er =  *100
x

10.8. Intervalo de Confiança para a Média

IC x − (t * S x )  X  x + (t * S x ) = P

10.9. Total da População


Yˆ = N * M * x

10.10. Intervalo de Confiança para o Total


 
IC Yˆ − N * M (t * S x )  Y  Yˆ + N * M (t * S x ) = P

10.11. Intensidade Amostral


O número de unidades amostrais neste processo é obtido a partir das mesmas
justificativas apresentadas na amostragem em dois estágios, ou seja, a existência de duas
variáveis (n) e (M) exige duas equações e, portanto, a função de custos é utilizada para
compor, juntamente com a variância da média, as duas equações do sistema. Nota-se que
tanto o valor de (n) quanto o valor de (M) são afetados pelo coeficiente de correlação
intraconglomerados, resultando nas seguintes formulações:
- Número ótimo de subunidades do conglomerado

C1 1 − r
M = *
C2 r
- Número ótimo de conglomerados

t 2 S x2
n= 1 + r (M − 1)
E2 * M

Exercício Prático:
Em uma floresta tropical pluvial em Rondônia, em uma área de 13000 ha,
realizou-se um inventário por meio de amostragem em múltiplos inícios aleatórios. A área
inventariada tinha a forma retangular, com 20 km de comprimento por 6,5km de largura,
a qual foi dividida em 9 blocos de 2,22 km por 6,5 km. Em cada bloco, instalou-se um
conglomerado linear composto por 8 subunidades de 10m de largura por 250 m de
comprimento (2500m²) distantes 500 metros entre elas. Os múltiplos inícios aleatórios
foram obtidos sorteando-se a posição do conglomerado linear em cada bloco. Os
conglomerados correspondentes a cada início aleatório, com os respectivos volumes
comerciais com casca das subunidades, estão apresentados na tabela a seguir. Considere
um erro máximo admissível de 10% da média, com 95% de probabilidade de confiança e
calcule as estatísticas desse inventário.
Unidade Unidade Secundária (m³/0,25ha)
Primária I II III IV V VI VII VIII
1 25,97 34,62 25,97 60,27 49,75 81,64 85,90 72,43
2 54,02 56,77 63,78 61,94 61,28 38,93 44,68 48,30
3 66,43 50,46 43,81 39,63 42,47 38,84 37,13 35,93
4 59,33 56,18 39,01 32,93 95,67 32,82 65,09 46,29
5 62,69 68,88 65,84 85,93 48,13 55,98 70,91 37,90
6 47,85 69,66 78,11 36,71 28,09 53,57 40,34 56,22
7 36,64 39,23 42,81 35,51 27,54 54,78 42,56 88,45
8 34,72 41,21 41,79 34,97 41,47 29,11 25,60 21,99
9 43,13 59,13 92,98 49,14 46,68 42,60 26,17 30,14

Você também pode gostar