BIANCHINI, Z.M. (2003) - Técnicas de Amostragem (Parte 2)

Técnicas de Amostragem (parte 2)
(2aversão)
Zélia Magalhães Bianchini
Agosto/2003
2
Conteúdo
1 Estimadores Especiais 1
1.1 Informações auxiliares em amostragem . . . . . . . . . . . . . 1
1.2 Estimação de uma razão . . . . . . . . . . . . . . . . . . . . . 1
1.2.1 Propriedades do estimador de uma razão . . . . . . . . 3
1.2.2 Variância do estimador de uma razão . . . . . . . . . . 9
1.2.3 Estimação da variância do estimador de uma razão . . 14
1.2.4 Precisão do estimador de uma razão . . . . . . . . . . . 14
1.3 Estimadores de razão para o total e a média . . . . . . . . . . 16
1.3.1 Variâncias dos estimadores de razão para o total e a
média . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3.2 Estimação das variâncias dos estimadores de razão para
o total e a média . . . . . . . . . . . . . . . . . . . . . 19
1.3.3 Comparação da precisão do estimador de razão com a
do estimador simples em amostragem aleatória simples 19
1.4 Estimadores de razão em amostragem estratificada . . . . . . 20
1.4.1 Estimador de razão combinada . . . . . . . . . . . . . 20
1.4.2 Estimador de razão separada . . . . . . . . . . . . . . . 26
1.4.3 Comparação dos estimadores de razão separada e com-
binada . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.4.4 O uso de estimadores de razão . . . . . . . . . . . . . . 32
1.5 Estimadores de Regressão . . . . . . . . . . . . . . . . . . . . 33
1.5.1 Comparação dos estimadores de regressão, razão e sim-
ples da média sob amostragem aleatória simples . . . . 36
1.5.2 O uso de estimadores de regressão . . . . . . . . . . . . 37
1.6 Pós-estratificação . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.6.1 Estimação do total e da média . . . . . . . . . . . . . . 39
1.6.2 Precisão dos estimadores com pós-estratificação . . . . 40
1.7 O uso de informações auxiliares na estimação . . . . . . . . . . 43
1.8 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3
4 CONTEÚDO
2 Amostragem de Conglomerados 53
2.1 Conceituação Básica . . . . . . . . . . . . . . . . . . . . . . . 53
2.2 Amostragem de Áreas . . . . . . . . . . . . . . . . . . . . . . 55
2.3 Conglomerados em 1 estágio . . . . . . . . . . . . . . . . . . 56
2.3.1 Probabilidades iguais de seleção . . . . . . . . . . . . . 56
2.3.2 Estimação de proporções na Ac1 . . . . . . . . . . . . 65
2.3.3 Coeficiente de Correlação Intraclasse . . . . . . . . . . 69
2.3.4 Estimação do coeficiente de correlação intraclasse . . . 75
2.3.5 Eficiência da Ac1 em relação à AAS com conglomera-
dos de tamanhos iguais . . . . . . . . . . . . . . . . . . 77
2.4 Controle na variação de tamanho . . . . . . . . . . . . . . . . 82
2.5 Probabilidades desiguais de seleção . . . . . . . . . . . . . . . 83
2.5.1 Seleção dos conglomerados com probabilidades desiguais
e com reposição . . . . . . . . . . . . . . . . . . . . . . 83
2.6 Estratificação de conglomerados . . . . . . . . . . . . . . . . . 93
2.6.1 Estimadores e respectivas precisões . . . . . . . . . . . 94
2.7 Estimador de razão . . . . . . . . . . . . . . . . . . . . . . . . 97
2.7.1 Estimador de razão baseado no tamanho dos conglom-
erados . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
2.7.2 Estimador de razão baseado em uma característica que
não seja o tamanho do conglomerado . . . . . . . . . . 101
2.8 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
3 Conglomerados em 2 estágios 109

3.1 Probabilidades iguais de seleção . . . . . . . . . . . . . . . . . 109
3.1.1 Introdução e definições básicas . . . . . . . . . . . . . . 109
3.1.2 Parâmetros da característica y . . . . . . . . . . . . . . 112
3.1.3 Estatísticas da amostra em cada estágio . . . . . . . . 113
3.1.4 Estimadores de total e médias e respectivas variâncias . 114
3.1.5 Estimadores das variâncias dos estimadores de total e
médias . . . . . . . . . . . . . . . . . . . . . . . . . . 119
3.1.6 Amostra autoponderada . . . . . . . . . . . . . . . . . 123
3.1.7 Dimensionamento da amostra de conglomerados em 2
estágios . . . . . . . . . . . . . . . . . . . . . . . . . . 127
3.1.8 Efeito de conglomeração . . . . . . . . . . . . . . . . . 135
3.2 Controle de variação de tamanho das UPAs . . . . . . . . . . 137
3.2.1 Probabilidades desiguais de seleção das unidades primárias138
3.2.2 Estratificação das unidades primárias e seleção com
probabilidades desiguais de seleção . . . . . . . . . . . 147
3.2.3 Estimador de razão . . . . . . . . . . . . . . . . . . . . 149
3.3 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
CONTEÚDO i
4 Conglomerados em 3 estágios 161

4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
4.2 Seleção com probabilidades desiguais . . . . . . . . . . . . . . 161
4.2.1 Estimador não viciado de Y . . . . . . . . . . . . . . . 162
4.3 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
5 Estimação de variâncias 165

5.1 Porque é importante estimar variâncias? . . . . . . . . . . . . 165
5.2 Problemas para estimar variâncias . . . . . . . . . . . . . . . 165
5.3 Métodos para estimar variâncias . . . . . . . . . . . . . . . . . 166
5.3.1 Método de Linearização de Taylor ou δ-método . . . . 166
5.3.2 Método do Conglomerado Primário (Ultimate Cluster
- Hansen et al, 1953) . . . . . . . . . . . . . . . . . . . 168
5.3.3 Métodos de Replicação . . . . . . . . . . . . . . . . . . 170
5.4 Sistemas para estimação de variâncias . . . . . . . . . . . . . . 172
6 Dupla amostragem 175

6.1 Descrição da técnica . . . . . . . . . . . . . . . . . . . . . . . 175
6.2 Considerações sobre o custo . . . . . . . . . . . . . . . . . . . 176
6.3 Dupla amostragem para estratificação¡. . . ¢. . . . . . . . . . . 177
6.3.1 Estimador não viciado para V y d,est . . . . . . . . . . 180
6.3.2 Estimação de uma proporção na dupla amostragem
para estratificação . . . . . . . . . . . . . . . . . . . . 180
6.4 Dupla amostragem para estimadores de razão . . . . . . . . . 181
6.5 Dupla amostragem para probabilidades desiguais . . . . . . . 183
Prefácio
Estas notas de aula vêm sendo ministradas na disciplina de Tecnologia da
Amostragem II do Curso de Graduação em Estatística da Escola Nacional
de Ciências Estatísticas - ENCE. Trata-se da apresentação da teoria e apli-
cação de estimadores especiais e das técnicas de seleção e de estimação em
amostras de conglomerados em um ou mais estágios e de dupla amostragem.
As notas de aula preparadas por Pedro Luis do Nascimento Silva quando
de sua atuação como professor no referido curso, bem como as referências
bibilográficas básicas, serviram como base para a elaboração deste material.
ii CONTEÚDO
Cabe esclarecer que é intenção incorporar num mesmo volume o conteúdo

da disciplina de Tecnologia de Amostragem I, que corresponde aos funda-
mentos e técnicas básicas para selecionar amostras e realizar estimação em
pesquisas por amostragem: conceitos básicos de amostragem, amostragem
aleatória simples com e sem reposição, distribuições amostrais e erro amostral,
estimação de proporções e domínios, cálculo de tamanhos de amostra, amostra-
gem sistemática, amostragem estratificada e amostragem com probabilidades
desiguais.
A realização deste trabalho deve-se em grande parte ao incentivo de Pedro
Luis do Nascimento Silva para a preparação de um livro de amostragem em
português com o objetivo de facilitar o aprendizado dos alunos de graduação
em Estatística na aplicação de técnicas para selecionar amostras e realizar
estimação em pesquisas por amostragem.
Uma primeira versão dessas notas vinha sendo utilizada no curso de Gra-
duação da ENCE no 6o período, desde o 2o semestre de 1999. Agradeço aos
alunos pelas indicações de correções efetuadas, em especial a Adrian Heringer
Pizzinga, Ralph dos Santos Silva e Rodrigo Lage de Sousa, do 6o período do
2o semestre de 1999.
Agradeço a Waldecir Bianchini pela colaboração no aprendizado para a
utilização do processador de texto Scientific Workplace e pela sua compreen-
são e de nossos filhos (Renata, Fernanda e Henrique) das inúmeras horas
extraordinárias de trabalho desviadas do convívio familiar para a realização
desta empreitada para a primeira versão.
Esta versão ainda passará por outras revisões e quaisquer sugestões sobre
eventuais falhas e omissões e sobre a incorporação de novos temas são bem
vindas em busca do aprimoramento do texto, do uso adequado da teoria e
aplicações em amostragem e da prepararação do profissional de Estatística
para os desafios que a carreira certamente lhe proporcionará.
Zélia Magalhães Bianchini
Rio de Janeiro, agosto de 2003.

Capítulo 1
Estimadores Especiais
1.1 Informações auxiliares em amostragem

Além da variável de interesse yi , uma ou mais variáveis xi podem estar
associadas com a i-ésima unidade da população. Por exemplo, se a variável
de interesse é o número de cabeças de gado em uma determinada fazenda,
variáveis auxiliares pode incluir a área da fazenda, o tipo de vegetação, etc.
Em algumas situações, os valores para a característica x são conhecidos
para toda a população, enquanto que em outras situações os valores de x são
conhecidos só para as unidades da amostra. Em muitas pesquisas, o valor
da variável de interesse de um censo anterior pode servir como uma variável
auxiliar.
Informações auxiliares podem ser usadas no desenho amostral ou na es-
timação. Variáveis usadas na estratificação, ou como medidas de tamanho
para a seleção com probabilidades proporcional ao tamanho, representam o
uso de informações auxiliares no desenho amostral.
Na estimação de total ou de média de uma característica y, a relação entre
yi e xi pode muitas vezes ser aproveitada para produzir estimativas mais
precisas do que estimativas que utilizam apenas as informações dos dados da
característica y. Estimadores de razão, de regressão e de pós-estratificação
são exemplos do uso de informações auxiliares na estimação.
1.2 Estimação de uma razão

Freqüentemente na prática de pesquisas por amostragem, o valor a ser esti-
mado com a amostra é uma razão entre duas variáveis que varia de unidade
para unidade da população.
Um exemplo, que pode ser citado, é a necessidade de se estimar a razão
1
2 CAPÍTULO 1. ESTIMADORES ESPECIAIS
entre os gastos das famílias com alimentação e a renda das famílias. Outro
exemplo seria a razão entre a quantidade colhida de certo produto pela área
plantada, medindo a produtividade da lavoura. Ainda outro exemplo se-
ria a razão entre o salário dos trabalhadores da indústria e o número de
trabalhadores da indústria, medindo o salário médio dos trabalhadores da
indústria.
Em todos estes exemplos, o que se procura conhecer é o valor de uma
Y
razão R onde R = .
X
Considere-se a população PN = {U1 , U2 , · · · , UN }, onde serão investigadas
duas características, x e y, gerando uma população-matriz bivariada
PN (x, y) = {(X1 , Y1 ), (X2 , Y2 ), · · · , (XN , YN )} ,
onde: 
 XI = x(UI )
I ∈ {1, 2, · · · , N}

YI = y(UI )
Pode-se então definir o parâmetro razão na população, R, de forma
que:
P
N
YI
Y I=1 Y
R= = N =
X P X
XI
I=1
Ponha-se então, o problema de estimar a razão R a partir de uma amostra
aleatória simples sem reposição de n unidades de PN ,{u1 , u2 , · · · , un }, onde
serão investigadas as características x e y, fornecendo
{(x1 , y1 ), (x2 , y2 ), · · · , (xn , yn )} .
Note-se que:
1
∀ i ∈ {1, 2, · · · , n} e ∀ I ∈ {1, 2, · · · , N} .
P [(xi , yi ) = (XI , YI )] =
N
Conclui-se que os vetores (xi , yi ), i ∈ {1, 2, · · · , n}, são identicamente
distribuídos e que não são independentes, devido se tratar de amostragem
sem reposição.
Como R = Y / X = Y / X , um estimador intuitivamente razoável para
R é dado por:
1X 1X
n n
b= y
R onde y= yi e x = xi .
x n i=1 n i=1
1.2. ESTIMAÇÃO DE UMA RAZÃO 3
1.2.1 Propriedades do estimador de uma razão

Como verificar se R b é um estimador razoável? Em primeiro lugar, nota-
se que Rb deve ser um estimador viciado de R, porém se pode mostrar que
b
R é assintoticamente não viciado; pode-se mostrar também que R b é um
estimador consistente de R.
Para provar que R b é um estimador consistente de R, é necessário intro-
duzir a definição de consistência.
Diz-se que um estimador b θn é baseado numa amostra sem reposição de
tamanho n da população
h é consistente
i para o parâmetro θ se e somente se
b
θN = θ, isto é, se P bθN = θ = 1.
Assim, a prova de que R b é consistente para R é imediata devido x se
igualar a X e y a Y quando a amostra cobrir todas as unidades da população.
Além disto,
1X 1 X¡ 1X
n n n
¢
y= yi = Y + ξi = Y + ξ =Y +ξ
n i=1 n i=1 n i=1 i
onde:
1X
n
ξ = ξ
n i=1 i
De modo análogo se tem que:
1X
n
x = X + φ onde φ = φ.
n i=1 i
Sabe-se ainda que:
N − n Sy2 2 ¡ ¢2 2
= V ( y ) = V (Y + ξ ) = V (ξ ) = E(ξ ) − E(ξ) = E(ξ )
N n
pois, E(ξ) = 0.
Analogamente,
2 N − n Sx2
E(φ ) = V (φ ) =
N n
Note-se que:
1 X¡ 1 X¡
N N
¢2 ¢2
Sx2 = XI − X e Sy2 = YI − Y .
N − 1 I=1 N − 1 I=1
Desta forma, se pode escrever:

µ ¶
ξ
Y 1+ µ ¶µ ¶−1
b= y Y + ξ Y ξ φ
R = = µ ¶ =R 1+ 1+
x X +φ φ Y X
X 1+
X
¯ ¯
¯φ¯
Suponha-se que Y 6= 0 e X 6= 0. Suponha-se, ainda que ¯¯ ¯¯ < 1, isto é,
X ¯ ¯
que¯ a amostra foi dimensionada de forma que se pode esperar que ¯φ¯ < X
¯
ou ¯x − X ¯ < X.
µ ¶−1
φ
Então, desenvolvendo-se o fator 1 + como série de potências de
X
φ, vem:
µ ¶µ ¶−1 µ ¶Ã 2 3
!
b = R 1+ ξ φ ξ φ φ φ
R 1+ =R 1+ 1− + − + ···
Y X Y X X2 X3
(Ã 2 3
! Ã 2
!)
b = R φ φ φ ξ ξ φ ξ φ
R 1− + − +··· + − + − ···
X X2 X3 Y Y X Y X2
Desprezando-se na expressão entre parênteses todos os termos com grau
b
superior a 2, obtém-se uma aproximação para o valor de R.
Ã 2
!
b∼ φ φ ξ ξ φ
R =R 1− + + −
X X2 Y Y X
b vem:
Agora calculando-se o valor esperado de R
Ã Ã 2
!!
b ∼ φ ξ φ ξ φ
E(R) = E R 1− + + 2−
X Y X Y X
Ã Ã 2
!!
φ ξ φ ξ φ
= R E 1− + + 2−
X Y X Y X
Ã µ ¶ µ ¶ Ã 2! µ ¶!
φ ξ φ ξ φ
= R 1−E +E +E 2 −E
X Y X Y X
µ ³ 2´ ¶
1 1 ¡ ¢
= R 1 + 2E φ − E ξ φ
X Y X
No entanto: ³ 2´ N − n Sx2
E φ = V (φ ) =
N n
Por outro lado:
¡ ¢ ¡ ¢¡ ¢ N − n Sxy
E ξ φ = E y − Y x − X = COV ( x, y) =
N n
onde:
1 X¡
N
¢¡ ¢
Sxy = XI − X YI − Y
N − 1 I=1
b é dada aproximada-
De qualquer forma, a tendenciosidade do estimador R
mente por:
µ ³ 2´ ¶
1 1 ¡ ¢
b b ∼
T (R) = E(R) − R = R 1 + 2 E φ − E ξ φ −R
X Y X
µ ¶
1 ¡ ¢ 1
= R 2V φ − COV ( x, y)
X Y X
ou ainda:
µ ¶
b ∼ 1 N − n Sx2 1 N − n Sxy
T (R) = R 2 −
X N n Y X N n
µ 2 ¶
N − n 1 Sx Sxy
= R 2 −
N n X Y X
Agora note-se que a correlação entre x e y na população, ρ (x, y), é

definida por:
¡ ¢¡ ¢
E xi − X yi − Y
ρ (x, y) = p =
V (xi ) V (yi )
1 PN ¡ ¢¡ ¢
XI − X YI − Y
N I=1
ρ (x, y) = sµ ¶
1 PN ¡ ¢2 1 PN ¡ ¢2
XI − X YI − Y
N I=1 N I=1
N ¡
P ¢¡ ¢
XI − X YI − Y
I=1
= sµ ¶µ ¶
N ¡
P ¢2 N ¡
P ¢2
XI − X YI − Y
I=1 I=1
1 ¡ ¢¡
P
N ¢
XI − X YI − Y
N − 1 I=1
= sµ ¶µ ¶
1 P N ¡ ¢2 1 P N ¡ ¢2
XI − X YI − Y
N − 1 I=1 N − 1 I=1
Sxy Sxy
ρ (x, y) = p 2 2 =
Sx Sy Sx Sy
Denotando-se então ρ (x, y) simplesmente por ρ , vem:
Sxy = ρ Sx Sy
Então:
µ ¶
b ∼ N −n 1 Sx2 1
T (R) = R − ρ Sx Sy
N n X2 Y X
N −n 1 ¡ 2 ¢
= R Cx − ρ Cx Cy
N n
onde Cx2 é a variância relativa de característica x na população.

Agora, é imediato provar que lim T (R) b =0
n→N
b nos mostra que T (R)
No entanto, uma análise de expressão de T (R) b se
anula exatamente quando:
Cx2 − ρ Cx Cy = 0
Isto é, quando:
Sx2 Sx Sy
2 =ρ
X X Y
Ou melhor, quando:
Sx Sy
ρ
Y = X = ρ Sy X
Sx2 Sx
2
X
Assim, a condição para que R b seja um estimador não viciado de R é que
Y = ρ ( Sy /Sx ) X, que é a condição para a reta de regressão entre y e x
passar pela origem, com coeficiente angular ρ ( Sy /Sx ) .
Foi verificado que, quando a condição anterior não é satisfeita, R b é um
estimador tendencioso, embora com tendência que tende a se anular quando
o tamanho n da amostra for grande.
Com o objetivo de calcular uma medida da precisão do estimador R, b será
estabelecida uma cota superior a tendenciosidade de R b que permitirá também
a determinação do tamanho de amostra necessário para tomar desprezível a
tendenciosidade.
Inicialmente, quando se trata de um estimador viciado, a medida de sua
precisão deve ser o seu erro quadrático médio, dado por:
µ³ ´2 ¶
b b
EQM(R) = E(R − R) = E 2 b b b
R − E(R) + E(R) − R
µ³ ´2 ¶ ³ ³ ´´2
= E b − E(R)
R b + E R b−R
³ ´ ³ ´
b b
−2 E(R) − R E R − E(R) b
h i2
b b
= V (R) + T (R) .
Note-se que se a tendenciosidade se anula, isto é, se o estimador for não

viciado, então o erro quadrático médio é igual à variância do estimador.
Note-se, ainda, que a expressão de EQM pode ser escrita como:
 h i2 
h i2 T ( b
R)
EQM(R) b = V (R)b + T (R)b b 
= V (R) 1 +


b
V (R)
Analisando-se a expressão acima, note-se que:

b ∼
V (R) b
= EQM(R)
quando: h i2
b
T (R)
∼
=0
b
V (R)
Um critério prático para avaliar quão próximos estão V (R) b e EQM(R)

b
consiste em verificar se: h i2
b
T (R)
≤ 0, 01
b
V (R)
Ora. isto eqüivale a verificar se:
¯ ¯ ¯ ¯
¯ b¯ ¯ b ¯
¯T (R)¯ ¯E(R) − R¯
q ≤ 0, 10 ou q ≤ 0, 10
b
V (R) b
V (R)
Por outro lado, note-se que:

b x) = E(R
COV (R, b x) − E(R
b ) E(x)
= E( y) − E(Rb)X
b)X
= Y − E(R
Donde:
b x)
COV (R, Y
= b)
− E(R
X X
ou seja:
Y b x)
COV (R, b x)
COV (R,
b) =
E(R − =R−
X X X
ou ainda:
b
b ) = E(R
T (R b ) − R = − COV (R, x)
X
b ∗
Seja ρ (R, x) = ρ o coeficiente de correlação entre Rb e x. Logo:
q p
b
COV (R, x) = ρ ∗ b
V (R) V (x)
Substituindo na expressão anterior, segue-se que:

q p
b ) = −ρ∗ V (R) b V (x)
T (R
X
p
b)
T (R V (x)
q = −ρ∗
b
V (R) X
ou ainda: ¯ ¯
¯ ¯
b) ¯
¯ T (R
¯q ¯ = |ρ∗ | CV (x)
¯ ¯
¯ V (R)b ¯
Lembrando a condição de |ρ∗ | ≤ 1 segue-se que:

¯ ¯
¯ ¯
¯ T (Rb) ¯
¯q ¯ ≤ CV (x).
¯ ¯
¯ V (R)b ¯
Considere a expressão do tamanho de uma amostra aleatória simples

dada por:
2 Sx2
N zα/2 2
N zα/2 Cx2
X
2 Cx2
n= = =
Sx2 2
N zα/2 (CV (x))2 + zα/2
2
Cx2 Cx2
2
N d2r + zα/2 2 (CV (x))2 +
X N
já que a precisão relativa da média amostral pode ser escrita como:

2
dr = zα/2 CV (x) e Cx2 = Sx2 /X é a variância relativa da característica x
na população (ou coeficiente de variação da população ao quadrado da car-
acterística x).
b
Assim, para se ter tendenciosidade desprezível no estimador de razão R,
deve-se ter:
CV (x) ≤ 0, 10
Sendo assim, basta tomar n tal que:
Cx2
n≥
Cx2
0, 01 +
N
Por exemplo, se Cx = 0, 4 e N = 5.000, então n ≥ 16 bastaria para tornar
b
desprezível a tendenciosidade do estimador de razão R.
1.2.2 Variância do estimador de uma razão

Agora o objetivo é obter uma expressão para a variância do estimador de
b que seja adequada para medir sua precisão. De fato, isto só tem
razão R, q
b b < 0, 10, isto é , quando
sentido quando se puder admitir que T (R) / V (R)
b for pequeno.
o vício de R
Ora, já foi visto na demonstração anterior que:
µ ¶ Ã 2 !
b∼ ξ φ φ ξ φ
R = R +R − +R 2 −
Y X X Y X
e que: Ã !
2
b ∼ φ ξ φ
E(R) = R +R E 2 −
X Y X
logo,
µ ¶ Ã 2
! Ã 2
!
b − E(R)
b ∼ ξ φ φ ξ φ φ ξ φ
R =R − +R 2 − −R E 2 −
Y X X Y X X Y X
b é dada por:
Daí, a variância de R
³ ´2
b = E R
V (R) b − E(R)
b
" µ ¶ Ã 2 ! Ã 2 !#2
∼ ξ φ φ ξ φ φ ξ φ
= E R − +R 2 − −RE 2 −
Y X X Y X X Y X
Nesta última expressão, desprezar todos os termos com grau superior a

2. Então:
Ãµ ¶2 !
b ∼ ξ φ
V (R) = R2 E −
Y X
Ã Ã 2! Ã 2! µ ¶!
ξ φ ξ φ
= R2 E 2 +E 2 − 2E
Y X Y X
µ ¶
2 1 1 2
= R 2 V (y) + 2 V (x) − Cov(x, y)
Y X Y X
µ 2 ¶
2 N −n1
Sy Sx2 Sxy
= R + −2
N n Y 2 X2 Y X
µ 2 2
¶
N −n1 S
2 y 2 Sx 2 Sxy
= R 2 + R 2 − 2R
N n Y X Y X
N −n 1 ¡ 2 2 2
¢
= 2 Sy + R Sx − 2 R Sxy
N nX
ou ainda:
b ∼ N −n 1 ¡ 2 2 2
¢
V (R) = Sy + R Sx − 2 R ρ Sx Sy
N n X2
Há outra maneira de escrever a expressão da variância de R,b certas vezes
mais conveniente para fins de cálculo que as expressões já apresentadas:
1 X
N
b ∼ N −n 1
V (R) = (YI − R XI )2
N n X 2 N − 1 I=1
Exemplo 1.1
O vício e erro quadrático médio do estimador de uma razão, sob amostragem
aleatória simples, pode ser ilustrado imaginando a aplicação de amostragem
em uma população muito pequena e examinando o espaço amostral, isto é,
o conjunto de todas as possíveis amostras. Suponha que os valores de duas
variáveis x e y nas 4 unidades da população são:
Ui Yi Xi
U1 1 1
U2 2 3
U3 3 4
U4 4 6
Y
(a) Calcule o valor da razão populacional X , obtenha todas as possíveis
amostras de tamanho 2, a serem selecionadas aleatoriamente e sem
reposição e estime essa razão para cada possível amostra.
(b) Calcule os valores exatos do vício, do erro quadrático médio e da var-

iância desse estimador.
(c) Calcule os valores aproximados do vício e da variância desse estimador.
(d) Compare os resultados obtidos em (b) com os resultados obtidos em

(c).
Solução:
a) A razão populacional é dada por:
P
N
Yi
Y 10 5
R= = i=1 = =
X PN 14 7
Xi
i=1
O número de possíveis amostras é dado por:

µ ¶ µ ¶
N 4 4!
= = =6
n 2 2!(4 − 2)!
P
n P
n
b= y
Amostras possíveis Probabilidades y = yi x= xi R
i=1 i=1 x
1 3
U 1 U2 6
3 4 4
1 4
U1 U3 6
4 5 5
1 5
U1 U4 6
5 7 7
1 5
U2 U3 6
5 7 7
1 6
U2 U4 6
6 9 9
1 7
U3 U4 6
7 10 10
b) Os valores exatos do vício e do erro quadrático médio deste estimador

podem ser obtidos a partir da distribuição de todas as possíveis amostras:
µ ¶
b 1 3 4 5 5 6 7 365
E(R) = + + + + + =
6 4 5 7 7 9 10 504
b é dado por:
o valor exato do vício de R
b − R = 365 − 5 = 5 = 0, 0099
b = E(R)
T (R)
504 7 504
O erro quadrático médio é dado por:
µ ¶
b 2 1 3 5 2 4 5 2 6 5 2 7 5 2
E(R − R) = ( − ) + ( − ) + ( − ) + ( − ) = 0, 00185
6 4 7 5 7 9 7 10 7
e a variância dada por:
h i2
b = E(R
V (R) b − R)2 − T (R)
b = 0, 00185 − 0, 0000009 = 0, 0018491
c) O vício aproximado é dado por:
µ ¶
b ∼ N −n 1 Sx2 Sxy 1−f ¡ ¢
T (R) =R 2 − = 2 R Sx2 − Sxy
N n X Y X nX
1 7
sendo: f = n=2 X=
2 2
P
N 2
Xi2 − N X
I=1 62 − 49 13
Sx2 = = =
N −1 3 3
P
N
Xi Yi − N X Y
I=1 43 − 35 8
Sxy = = =
N −1 3 3
1 µ µ ¶ ¶
b ∼ 1−f ¡ ¢ 2 5 13 8 3
T (R) = 2 R Sx2 − Sxy = µ ¶2 − = = 0, 0087
nX 7 7 3 3 343
2
2
com respeito à variância aproximada tem-se:
b ∼ N −n 1 ¡ 2 2 2
¢
V (R) = 2 Sy + R Sx − 2 R Sxy
N nX
1−f ¡ 2 2 2
¢
= 2 Sy + R Sx − 2 R Sxy
nX
sendo:
P
N 2
Yi2 − N Y
I=1 30 − 25 5
Sy2 = = =
N −1 3 3
portanto:
b ∼ 1−f ¡ 2 2 2
¢
V (R) = 2 Sy + R Sx − 2 R Sxy
nX
1 Ã µ ¶2 µ ¶ µ ¶ µ ¶!
2 5 5 13 5 8
= µ ¶2 + −2 = 0, 00139
7 3 7 3 7 3
2
2
d) Observe que o vício aproximado subestima ligeiramente o valor ver-

dadeiro do vício e a variância aproximada subestima ligeiramente o valor
verdadeiro da variância.
1.2.3 Estimação da variância do estimador de uma razão

b quando X for conhecido, é dado por:
Um estimador consistente para V (R),
³ ´
b = N −n 1
v1 (R) s2
+ b
R 2 2
s − 2 b
R sxy
N n X2 y x
onde:
1 X
n
s2y = (yi − y)2
n − 1 i=1
1 X
n
s2x = (xi − x)2
n − 1 i=1
1 X
n
sxy = (xi − x)(yi − y)
n − 1 i=1
que são estimadores não viciados de Sy2 , Sx2 e Sxy , respectivamente.

Um estimador para V (R),b quando X for conhecido, expresso de outra
forma é dado por:
1 X
n
b = N −n 1 b xi )2
v1 (R) 2 (yi − R
N n X n − 1 i=1
b
Quando X não for conhecido, um estimador alternativo para V (R)
é dado por:
³ ´
b = N − n 1 s2y + R
v2 (R) b2 s2x − 2 R
b sxy
N n x2
ou
1 X
n
b = N −n 1
v2 (R) b xi )2 .
(yi − R
N n x2 n − 1 i=1
1.2.4 Precisão do estimador de uma razão

A precisão do estimador de uma razão depende da distribuição de probabil-
idades do estimador R,b que se verificou ser bastante intratável e intrincada,
devido ao fato de tanto os xi como os yi variarem de amostra para amostra.
Os resultados teóricos conhecidos se distanciam muito do que seria desejável
e necessário possuir nas aplicações práticas.
Assim, os principais resultados serão aqui apresentados sem demonstração.
Inicialmente, já foi demonstrado que o estimador de razão é consistente.

Além disso, se viu também que ele é viciado, exceto para certos tipos especiais
de população, embora o vício seja desprezível para amostras grandes.
Outro aspecto é que a distribuição assintótica do estimador de razão é
normal para amostras bastantes grandes, sujeito apenas a restrições muito
fracas quanto ao tipo de população de que se esteja selecionando a amostra.
Em amostras de tamanhos moderados, a distribuição de R b mostra certa
tendência a uma assimetria positiva para os tipos de população para as quais
o método é comumente usado.
Estes resultados indicam que não há problemas para calcular a precisão
ou a precisão relativa do estimador de razão quando:
a) a distribuição de Rb for aproximadamente normal;
b) a fórmula para estimação da variância de R b possa ser utilizada.
Em termos práticos, as hipóteses a) e b) podem ser assumidas sem risco
apreciável para amostras de no mínimo 30 unidades, suficientemente grandes
para que se tenha CV (x) < 0, 10 e CV (y) < 0, 10, isto é, o tamanho n da
amostra deve ser tal que:
 

 

 Cx2 Cy2 
n ≥ max 30; ;

 C2 C2 
 0, 01 + x 0, 01 + y  
N N
Nestas condições, se pode afirmar que:
b−R
R
q ∼
= N(0, 1)
b
V (R)
Daí segue-se que:
¯ ¯ 
¯ ¯ µ¯ ¯ q ¶
¯Rb−R ¯ ¯ ¯
P ¯¯ q ¯ ≤ zα/2  = 1 − α =⇒ P ¯R
¯
∼ b − R¯ ≤ zα/2 V (R)
b ∼ = 1−α
¯ V (R)
b ¯
onde:
zα/2 é a abscissa da distribuição Normal padrão tal que
 
b
R−R α
P q > zα/2  =
b 2
V (R)
e α é o nível de significância.
Portanto, q
D(R)b = zα/2 V (R) b e
b é a precisão do estimador R;
√
e
b = zα/2 V (R)
Dr (R) b é a precisão relativa do estimador R;
= zα/2 CV (R) b
R
Pode-se utilizar como estimador da precisão do estimador de R, b o valor
b
d(R) tal que:
q
b = zα/2 v(R)
d(R) b
b dado por v1 (R)

com v(R) b ou v2 (R)
b conforme a conveniência.
b o valor dr (R)
O estimador da precisão relativa do estimador de R, b tal
que:
q
b
v(R)
b
dr (R) = zα/2 b
= zα/2 cv(R)
b
R
Estas informações podem ser utilizadas para a construção de intervalos
de confiança para R.
A esse respeito, consultar Fieller (1932) e Paulson (1942), caso as condições
para aproximação pela normal não sejam satisfeitas.
1.3 Estimadores de razão para o total e a mé-

dia
Uma forma usualmente eficaz de aproveitar o conhecimento de informações
existentes sobre a população, com o objetivo de melhorar a qualidade das
estimativas de uma amostra, é a utilização de estimadores de razão.
Se para determinada característica x, correlacionada com a característica
de interesse y são conhecidos:
i) o valor verdadeiro da média ou total da população; e
ii) os valores observados na amostra.
Então é possível construir estimadores cuja precisão deve ser melhor que
a dos estimadores simples ou naturais já apresentados. A ídéia básica é
aproveitar a interdependência de x e y e a existência de informações sobre x
livres de erro de amostragem para conseguir estimativas mais precisas.
Muitas vezes, é desejável incorporar informação de fontes externas in-
dependentes para aumentar a confiabilidade das estimativas da pesquisa e
também para promover consistência nos resultados publicados por diferentes
pesquisas.
1.3. ESTIMADORES DE RAZÃO PARA O TOTAL E A MÉDIA 17
As técnicas que foram apresentadas para estimação de uma razão podem

ser adaptadas e utilizadas para melhorar as estimativas da média e total
de uma dada característica y, bastando que seja conhecido o total popula-
cional (X) ou a média (X) da característica x na população, sem erro de
amostragem.
Ora, se X for conhecido, tem-se:
Y b= y
R = e R
X x
Y
Y = X = R X =⇒ YbR = R
bX
X
Y b
Y = b X = YR
X = R X =⇒ y R = R
X N
sendo:
YbR o estimador de razão para estimar o total da característica y; e
y R o estimador de razão para estimar a média da característica y.
Em pesquisas domiciliares, por exemplo, é prática corrente no IBGE o uso
de estimadores de razão para estimar o total, utilizando como variável auxil-
iar a estimativa da população residente, obtida pela projeção de população.
Neste caso é feito um ajuste das estimativas provenientes da amostra de tal
modo que os totais da população estimados coincidam com os resultados da
população projetada que o IBGE elabora e divulga. O estimador do total
de uma característica y qualquer, para uma determinada área da Pesquisa
Nacional por Amostra de Domicílios (PNAD) pode ser escrito genericamente
como um estimador de razão da forma:
P
n
wi yi Xn Xn Xn
b b Yb i=1
YP NAD = R Xp = X = n Xp = α wi yi = (α wi ) yi = δ i yi
Xb p P
wi xi i=1 i=1 i=1
i=1
onde:
YbP NAD é o estimador de razão para o total da característica y ajustado
pela projeção de população, utilizado na PNAD, para a área em questão;
Yb é o estimador de total da característica y, obtido considerando os pesos
simples da amostra;
Xb é o estimador de total da população residente, obtido considerando os
pesos simples da amostra;
Xp é a estimativa da população residente, obtida pela projeção de popu-
lação.
wi é o peso amostral associado ao i-ésimo domicílio da amostra, obtido

considerando os pesos simples da amostra;
n é o número de domicílios na amostra da PNAD, para a área em questão;
yi é o valor da característica y associado ao i-ésimo domicílio da amostra,
para a área em questão;
xi é o total de pessoas associado ao i-ésimo domicílio da amostra, para a
área em questão;
Xp
α= é o fator de ajuste dos pesos simples wi ;
Xb
δ i = α ω i é o peso final ajustado associado ao i-ésimo domicílio da
amostra.
A título de ilustração, o valor do fator de ajuste dos pesos da PNAD
95 para Sergipe é de α = 1, 05, que corresponde à razão entre a população
residente projetada para a data da pesquisa (1.611.711) e o valor da estima-
tiva do total da população residente obtida considerando os pesos simples da
amostra para a área em questão (1.535.111).
1.3.1 Variâncias dos estimadores de razão para o total

e a média
Todas as técnicas para estimação da precisão anteriormente apresentadas
foram feitas supondo que o desenho da amostra era com seleção aleatória
simples sem reposição. Para esse mesmo desenho amostral, as expressões são
adaptadas e utilizadas, bastando notar que YbR é igual a R
b vezes a constante
X.
Dessa forma, tem-se:
³ ´
b b b
E(YR ) − YR = X E(R) − R b
N −n 1 ¡ 2 ¢
V (YbR ) = X 2 V (R)
b ∼= X2 Sy + R 2 2
Sx − 2 R Sxy
N n X2
N −n¡ 2 ¢
= N Sy + R2 Sx2 − 2 R Sxy
n
ou
N −n 1 X
N
V (YbR ) = N (YI − R XI )2
n N − 1 I=1
De modo análogo, para a média y R tem-se:
³ ´
E(y R ) − y R = X E(R)b −R
b
1.3. ESTIMADORES DE RAZÃO PARA O TOTAL E A MÉDIA 19
YbR ∼ N − n 1 ¡ 2 ¢
V (y R ) = V ( )= Sy + R2 Sx2 − 2 R Sxy
N N n
ou
N −n1 1 X
N
V (y R ) ∼
= (YI − R XI )2
N n N − 1 I=1
1.3.2 Estimação das variâncias dos estimadores de razão

para o total e a média
Um estimador para V (YbR ) é dado por:
b 2 b N − n h 2 b2 2 b
i
v(YR ) = X v(R) = N sy + R sx − 2 R sxy
n
ou
N −n 1 X
n
v(YbR ) = X 2 v(R)
b =N b xi )2
(yi − R
n n − 1 i=1
e um estimador para V (y R ) é dado por:
2
b = N − n 1 h 2 b2 2 b sxy
i
v(y R ) = X v(R) sy + R sx − 2 R
N n
ou
N −n1 1 X
n
v(y R ) = b xi )2
(yi − R
N n n − 1 i=1
1.3.3 Comparação da precisão do estimador de razão

com a do estimador simples em amostragem aleatória
simples
A partir de uma amostra aleatória simples sem reposição de n unidades se
conhece expressões para as variâncias do estimador simples e do estimador
de razão para estimar o total (ou a média). Portanto, é possível comparar a
precisão alcançada com cada um através da comparação entre suas variâncias.
Sendo assim, para o caso do estimador de total, sabe-se que:
N − n Sy2
V (Yb ) = N 2
N n
N − n 1 ¡ 2 ¢
V (YbR ) = X 2 2 2
2 Sy + R Sx − 2 R Sxy
N nX
N −n 1 ¡ 2 ¢
= N2 Sy + R2 Sx2 − 2 R Sxy
N n
Note-se que:
V (YbR ) < V (Yb ) ⇐⇒ Sy2 + R2 Sx2 − 2 R ρ Sx Sy < Sy2

R Sx
⇐⇒ R2 Sx2 < 2 R ρ Sx Sy ⇐⇒ ρ > ⇐⇒
2 Sy
Y Sx Sx /X 1 Cx
⇐⇒ ρ > ⇐⇒ ρ > =⇒ ρ >
2 X Sy 2 Sy /Y 2 Cy
Na prática, esta relação pode ser utilizada para verificar, quando é conve-
niente o uso do estimador de razão ao invés do estimador simples do total ou
da média, já que muitas vezes é possível conhecer aproximadamente o valor
de ρ = ρ (x, y) e também a relação entre Cx e Cy .
1.4 Estimadores de razão em amostragem es-

tratificada
Nas seção 1.3 foi tratado o caso de utilização do estimador de razão para
estimar o total populacional (Y ) a partir de uma amostra aleatória simples
sem reposição de tamanho n. No caso de uma amostra estratificada, há dois
estimadores de razão para estimar o total populacional (Y ):
• estimador de razão combinada; e
• estimador de razão separada.
1.4.1 Estimador de razão combinada

Considere então, o problema de estimar o total Y a partir de uma amostra
aleatória estratificada selecionada de uma população com L estratos de tamanho
Nh (h = 1, 2, · · · , L), tendo sido selecionadas nh unidades e investigadas as
características x e y em cada unidade da amostra de cada estrato. Suponha
que seja também conhecido o total populacional para a característica x. O
estimador de razão combinada YbRC para estimar o total populacional (Y ) é
definido por:
Ybest y
YbRC = X = est X
Xbest xest
onde:
P
L
Ybest = Nh y h é o estimador simples do total da característica y na
h=1
amostra estratificada;
1.4. ESTIMADORES DE RAZÃO EM AMOSTRAGEM ESTRATIFICADA21
best = P Nh xh é o estimador simples do total da característica x na

L
X
h=1
amostra estratificada;
X é o total da característica x, conhecido de alguma fonte externa a
amostra, livre de erros de amostragem;1
Ybest
y est = é o estimador simples da média da característica y na amostra
N
estratificada; e
Xbest
xest = é o estimador simples da média da característica x na amostra
N
estratificada.
O estimador de razão combinada YbRC é consistente para o total Y .

Isto é,
YbRC |n=N = Y
Prova: se n = N com nh = Nh ∀h = 1, 2, · · · , L vem:
X
L X
L
Ybest = Nh y h = Nh Y h = Y
h=1 h=1
X
L X
L
best =
X Nh xh = Nh X h = X
h=1 h=1
donde:
Y
YbRC |n=N = X=Y
X
É sabido que os estimadores de razão são viciados exceto se a população
for de um tipo muito especial em termos de relação entre x e y.
Apesar disso, tem—se afirmado que em muitos casos o estimador de razão é
preferível ao estimador natural (simples) por que dá melhor precisão. Entre-
tanto, esta afirmação só é verdadeira, quando se consegue tornar desprezível
o vício ou tendenciosidade do estimador de razão.
Acontece que, como ŶRC é um estimador de razão se pode demonstrar
que:
| E(YbRC − Y | best ) = CV (xest )
q ≤ CV (X
V (YbRC )
1
O estimador YbRC depende apenas do conhecimento do total X, e não dos totais Xh
dos estratos.
é usual considerar a tendensiosidade desprezível quando

best ) = CV (xest ) ≤ 0, 10.
CV (X
Assim ao dimensionar a amostra para estimar Y é indispensável garantir
um tamanho mínimo tal que se tenha CV (xest ) ≤ 0, 10
Isto significa em:
Ã L !
V (xest ) 1 X 2 2
Nh Sh (x) XL 2 2
Nh Sh (x)
2 ≤ 0, 01 ⇒ 2 2
− ≤ 0, 01
X X h=1
N n αh h=1
N 2 Nh
X
L
N 2 S 2 (x) 2 X
L
N 2 Sh (x)
h h h
⇒ ≤ 0, 01 X +
h=1
N2 n αh h=1
N 2 Nh
PL S 2 (x) N 2
h h
2
h=1 αh N
⇒n≥
2 P L N 2 S 2 (x)
h h
0, 01 X + 2 N
h=1 N h
onde:
nh
αh = depende do critério de alocação da amostra em cada estrato;
n
1 Nh ¡
P ¢2
Sh2 (x) = Xhj − X h
Nh − 1 j=1
Xhj é o valor da característica x associada à unidade j do estrato h.
Esta condição quanto à precisão na estimação de X será também usada no
estabelecimento de uma expressão aproximada para a variância do estimador
de razão combinada.
Além disto, há que notar a equivalência de fixar um coeficiente de variação
de 10% para x̄est e de admitir um erro máximo de 20% na estimação de X
com 95% de confiança.
Não se dispõe de uma expressão exata para a variância do estimador de
razão combinada. Porém, se a amostra é de tamanho suficientemente grande
para tornar desprezível a tendenciosidade do estimador, pode—se obter uma
expressão aproximada para a variância:
Ãµ ¶2 !
³ ´2 y
V (YbRC ) ∼ = E YbRC − Y = E est
X −Y
xest
Ãµ ¶2 ! µ 2 ¶
y est Y X X 2
= E X− xest =E (y − R xest )
xest X xest x2est est
Ã 2 !
X
= N 2E (y − R xest )2
x2est est
supondo—se n grande, tem se
X ∼
=1
xest
Daí
¡ ¢
V (YbRC ) ∼ 2
= N 2 E (y est − R xest ) = N 2 E y 2est + R2 x2est − 2R y est xest
Porém:
2
E(y 2est ) = V (y est ) + [E(y est )]2 = V (y est ) + Y
2
E(x2est ) = V (xest ) + X
E(xest y est ) = COV (xest , y est ) + E(xest )E(y est ) = COV (xest , y est ) + X Y
Daí
V (YbRC ) ∼
= N 2 [V (y est ) + R2 V (xest ) − 2 R COV (xest , y est )]
2 2
+N 2 [Y + R2 X − 2RX Y ]
como:
2 2
Y + R2 X − 2RX Y = (Y − RX)2 = 02 = 0
V (YbRC ) ∼
= N 2 [V (y est ) + R2 V (xest ) − 2R COV (xest , y est )]
agora:
X
L
N 2 Nh − nh S 2 (y)
h h
V (y est ) =
h=1
N2 Nh nh
X
L
N 2 Nh − nh S 2 (x)
h h
V (xest ) =
h=1
Nh Nh nh
onde:
N
1 X h
Sh2 (y) = (Yhj − Y h )2

Nh − 1 j=1
N
1 X h
Sh2 (x) = (Xhj − X h )2

Nh − 1 j=1
e finalmente:
COV (xest , y est ) = E[xest − X)(y est − Y )]

"Ã L !Ã L !#
X Nh XL
Nh X Nh XL
Nh
= E xh − Xh y − Yh
h=1
N h=1
N h=1
N h h=1 N
(" L #" L #)
X Nh X Nh
= E (xh − X h ) (y − Y h )
h=1
N h=1
N h
" L #
X N2
h
= E 2
(xh − X h )(y h − Y h )
h=1
N
 
X L X L
Nh Nk 

+E  (xh − X h )(y k − Y k )
N N 
h=1 k=1
k6=h
X
L
Nh2
= E(xh − X h )(y h − Y h ) + 0
h=1
N2
XL
Nh2
= COV (xh , y h )
h=1
N2
Lembrando—se que a amostra dentro de cada estrato é aleatória simples,

vem:
Nh − nh Sh (x, y)
COV (xh , y h ) =
Nh nh
onde
N
1 X h
Sh (x, y) = (Xhj − X h )(Yhj − Y h )

Nh − 1 j=1
Então finalmente:
X
L
N 2 Nh − nh Sh (x, y)
h
COV (xest , y est ) =
h=1
N2 Nh nh
Daí, obtém-se:
XL
Nh2 Nh − nh 1 2
V (YbRC ) ∼
= N2 2
[Sh (y) + R2 Sh2 (x) − 2 R Sh (x, y)]
h=1
N N h n h
Substituindo-se nesta expressão os valores de Sh2 (y), Sh2 (x) e Sh (x, y) vem:
X
L
Nh2 Nh − nh 1
V (YbRC ) ∼
=
h=1
Nh − 1 Nh nh
"N #
Xh
(Yhj − Y h )2 + R2 (Xhj − X h )2 − 2R(Xhj − X h )(Yhj − Y h )

j=1
(N )
X
L
Nh Nh − nh Xh
⇒ V (YbRC ) ∼
= [(Yhj − Y h ) − R(Xhj − X h )]2
h=1
Nh − 1 nh j=1
Um estimador de V (YbRC ) é dado por:
X (Nh − nh ) h 2 i
L
v(YbRC ) = Nh b 2 2 b
sh (y) + Rest sh (x) − 2 Rest sh (x, y)
h=1
nh
onde:
best = y est
R
xest
e sh (y), sh (x) e sh (x, y) são estimadores não viciados de Sh2 (y), Sh2 (x) e
2 2
Sh (x, y), respectivamente, ou seja:

n
1 X h
s2h (y) = (yhj − y h )2

nh − 1 j=1
n
1 X h
s2h (x) = (xhj − xh )2

nh − 1 j=1
n
1 X h
sh (x, y) = (xhj − xh )(yhj − y h )

nh − 1 j=1
O estimador de razão combinada para estimar a média Y é dado por:
YbRC
y RC =
N
Neste caso a variância V (y RC ) é dada por:
1
V (y RC ) = 2 V (YbRC )
N
e um estimador de V (y RC ) é dado por:
1
v(y RC ) = 2 v(YbRC )
N
1.4.2 Estimador de razão separada

Uma outra forma de utilizar estimadores de razão para conseguir maior pre-
cisão na amostragem estratificada é o chamado estimador de razão separada.
X
L
yh X
L
y X
L
YbRS = Xh = h
Xh = b h Xh
R
h=1
xh h=1
xh h=1
Note—se que é necessário conhecer os totais por estrato Xh da característica

auxiliar x.
A principal diferença do estimador de razão separada para o estimador
de razão combinada está no nível em que se faz uso da estimação por razão:
no estimador de razão separada são feitas razões em cada um dos estratos,
enquanto que no estimador de razão combinada uma única razão é feita para
os estimadores de total disponíveis.
O estimador de razão separada YbRS é consistente para o total Y . Isto
é:
ŶRS |n=N = Y
Prova: se n = N com nh = Nh =⇒ y h = Y h
X
L
y XL
Yh XL
YbRS |n=N = h
Xh = Xh = Nh Y h = Y
h=1
xh h=1
X h h=1
Quanto à tendendiosidade, este estimador precisa ser analisado com

maior cuidado, porque depende de razões constuídas em cada um dos es-
tratos.
y
Definindo YbhR = h Xh
xh
Vem:
XL
b
YRS = YbhR
h=1
Em cada estrato, sabe—se que:
| E(YbhR ) − Yh |
q ≤ CV (xh ) ∀h = 1, 2, · · · , L
b
V (YhR )
Se os nh forem todos suficientemente grandes, pode—se admitir que o

vício de YbRS é desprezível. Caso isto não aconteça o uso deste estimador
não é aconselhável, pois o vício do estimador pode ser significativo impedindo
mesmo o cálculo de uma estimativa da precisão como será visto mais adiante
Para ver porque isto ocorre, basta um raciocínio intuitivo:
Suponha que o vício tenha o mesmo nível em todos os estratos, como

pode ocorrer, e então o vício de YbRS será aproximadamente L vezes √o
vício em YbhR . Porém, o erro padrão de ŶRS é apenas da ordem de L
b
vezes o erro padrão de YhR . Logo:
| E(YbRS ) − Y |
q
V AR(YbRS )
√
poderia ser tão grande quanto L CV (xh )
Exemplo: Se tivermos 50 estratos com CV (xh ) = 0, 1 em cada estrato,
o vício de YbRS poderia ser da ordem de 0,7 vezes seu erro padrão.
Uma regra prática a√adotar contra-indica o uso do estimador de razão
separada a menos que: L(CV (xh ) < 0, 20 ∀L = 1, 2, · · · , L.
Talvez esta regra seja conservadora demais pois o vício pode ser bem
menor que o limite superior conhecido; mas a menos que haja forte evidência
disso não se deve usar o estimador de razão separada.
Também não existe uma expressão exata para a variância de YbRS . Será
obtida uma expressão aproximada no caso em que os nh são suficientemente
grandes para tornar desprezível o vício em cada um dos estratos. Caso esta
condição não se verifique, a expressão obtida para a variância não é confiável,
e o estimador de razão separada não deve ser usado.
Supondo os nh suficientemente grandes, vem:
Ã !2 
XL X
L
V (YbRS ) ∼
= E[(YbRS − Y )2 ] = E  YbhR − Yh 
h=1 h=1
Ã !2 
XL
y
= E ( h Xh − Yh ) 
h=1
xh
"µ ¶2 #
XL
yh
= E Xh − Yh +
h=1
xh
X L XL µ ¶µ ¶
yh yk
+ E Xh − Yh Xk − Yk
h=1 k=1
xh xk
k6=h
X
L
∼
= V (YbhR ) + 0
h=1
X
L
Nh − nh 1 £ 2 ¤
= Nh2 Sh (y) + Rh2 Sh2 (x) − 2Rh Sh (x, y)
h=1
Nh nh
Yh
onde: Rh = e Sh2 (y), Sh2 (x) e Sh (x, y) são como definidos anteriormente.
Xh
Esta variância pode ainda ser escrita:
(N )
X L
N 2
N − n 1 X h
V (YbRS ) ∼ h h h
= [(Yhj − Y h ) − Rh (Xhj − X h )]2
h=1
Nh−1 N h nh j=1
Um estimador de V (YbRS ) é dado por:
X (Nh − nh ) h 2 i
L
v(YbRS ) = Nh b 2 2 b
sh (y) + Rh sh (x) − 2 Rh sh (x, y)
h=1
nh
onde: Rbh = y h = yh e s2 (y), s2 (x) e sh (x, y) são como definidos anterior-

h h
xh xh
mente.
O estimador de razão separada para estimar a média Y é dado por:
YbRS
y RS =
N
Neste caso a variância V (y RS ) é dada por:

1
V (y RS ) = V (YbRS )
N2
e um estimador de V (y RS ) é dado por:
1 b
v(y RS ) = v(YRS )
N2
X Nh (Nh − nh )
v(y RS ) = bh2 s2h (x) − 2R
[s2h (y) + R bh sh (x, y)]
N2 nh
1.4.3 Comparação dos estimadores de razão separada

e combinada
Em geral, para amostras de tamanho idêntico, o estimador de razão combi-
nada deve ter vício bem menor que o estimador de razão separada.
No uso do estimador de razão separada, há que verificar sempre se
√
LCV (xh ) ≤ 0, 20 ∀h
Em ambos os casos, os tamanhos de amostra que garantem uma tendenciosi-

dade desprezível podem ser determinados.
Através da comparação das variâncias é feita a avaliação da melhor pre-
cisão alcançada entre os estimadores de razão em amostragem estratificada:
X
L
Nh − nh 1 2
V (YbRC ) − V (YbRS ) ∼
= Nh2 [Sh (y) + R2 Sh2 (x) − 2R Sh (x, y)]
h=1
Nh nh
X
L
Nh − nh 1 2
− Nh2 [Sh (y) + Rh2 Sh2 (x) − 2Rh Sh (x, y)]
h=1
Nh nh
X
L
Nh − nh
∼
= Nh [(R2 − Rh2 )Sh2 (x) − 2(R − Rh )Sh (x, y)]
h=1
nh
Os dois estimadores serão igualmente precisos se Rh = R ou Yh /Xh =

Y /X para todos os estratos.
A medida que os Rh sejam mais distantes de R, o estimador da razão
separada tende a dar maior precisão, inclusive por se basear num conheci-
mento mais detalhado dos dados do universo da característica x.
Exemplo 1.2 (Cochran (1977), pág.167)

Os dados são provenientes do Censo Agropecuário de todas as fazendas
do município de Jefferson em Iowa. A variável y investigada em cada fazenda
é a área (em acres) com plantação de milho e a variável x a área de cada
fazenda. A população é dividida em 2 estratos, sendo que o primeiro contém
as fazenda com menos de 160 acres. Suponha que se deseja selecionar uma
amostra de 100 fazendas, sendo que 70 serão selecionadas do estrato 1 e 30
do estrato 2. A idéia é comparar a precisão de estimadores alternativos para
estimar a média da área com plantação de milho por fazenda.
Calcule a variância do estimador da média segundo cada uma das 5 es-
tratégias:
1 - estimador simples, supondo que a amostra será aleatória simples sem
considerar a estratificação;
2 - estimador de razão, supondo que a amostra será aleatória simples sem
considerar a estratificação;
3 - estimador simples da amostragem estratificada, supondo que em cada
estrato a amostra será aleatória simples;
4 - estimador de razão combinada da amostragem estratificada, supondo
que em cada estrato a amostra será aleatória simples;
5 - estimador de razão separada da amostragem estratificada, supondo
que em cada estrato a amostra será aleatória simples;.
Os dados são apresentados na tabela a seguir:
T amanho
Estratos (acres)
Nh Yh Xh Sh2 (y) Sh2 (x) Sh (x, y) Rh
1 ≤ 160 1580 19,40 82,56 312 2055 494 0,2350
2 > 160 430 51,63 244,85 922 7357 858 0,2109
Total - 2010 26,30 117,28 620 7619 1453 0,2242
Os fatores de correção de população finita podem ser ignorados, ou seja,

N −n ∼ Nh − nh ∼
considerar =1e = 1, h = 1 e 2.
N Nh
Nh2 1
Considere Qh = 2 e que Q1 = 0,008828 e Q2 =0,001525.
N nh
Compare os resultados e comente.
Solução:
1P n
1 - Amostra aleatória simples (AAS): y = yi é o estimador simples
n i=1
da média da área com plantação de milho por fazenda
N − n Sy2 ∼ Sy2 620
V (y) = = = = 6, 20
N n n 100
y
2 - Amostra aleatória simples (AAS): y R = X é o estimador de razão
x
da média da área com plantação de milho por fazenda
N −n1 £ 2 ¤ 1£ 2 ¤
V (y R ) ∼
= Sy + R2 Sx2 − 2 R Sxy ∼= Sy + R2 Sx2 − 2 R Sxy
N n n
1
= [620 + (0, 2242)2 (7619) − 2(0, 2242)(1453)] = 3, 51
100
PL N
h
3 - Amostra aleatória estratificada (AAE): y est = y h é o estimador
h=1 N
simples da média da área com plantação de milho por fazenda
X
L
N 2 Nh − nh S 2 (Y ) X
L
N 2 S 2 (y)
V (y est ) = h h ∼
= h h
h=1
N2 Nh nh h=1
N 2 nh
X
L
= Qh Sh2 (y) = (0, 008828)(312) + (0, 001525)(922) = 4, 16
h=1
y est
4 - Amostra aleatória estratificada (AAE): y RC = X é o estimador
xest
de razão combinada da média da área com plantação de milho por fazenda
XL
Nh2 Nh − nh 1 £ 2 ¤
V ( y RC ) ∼
= 2
Sh (y) + R2 Sh2 (x) − 2R Sh (x, y)
h=1
N Nh nh
X
L
£ ¤
∼
= Qh Sh2 (y) + R2 Sh2 (x) − 2R Sh (x, y)
h=1
= (0, 008828)(312) + (0, 001525)(922) + (0, 008828)(0, 2242)2 (2055) +
+(0, 001525)(0, 2242)2 (7357) − 2(0, 008828)(0, 2242)(494) +
−2(0, 001525)(0, 2242)(858)
= 3, 10
1 PL y
h
5 - Amostra aleatória estratificada (AAE): y RS = Xh é o es-
N h=1 xh
timador de razão separada da média da área com plantação de milho por
fazenda
XL
Nh2 Nh − nh 1 £ 2 ¤
V ( y RS ) ∼
= 2
Sh (y) + Rh2 Sh2 (x) − 2Rh Sh (x, y)
h=1
N Nh nh
X
L
£ ¤
∼
= Qh Sh2 (y) + Rh2 Sh2 (x) − 2Rh Sh (x, y)
h=1
= (0, 008828)(312) + (0, 001525)(922) + (0, 008828)(0, 2350)2 (2055) +
+(0, 001525)(0, 2109)2 (7357) − 2(0, 008828)(0, 2350)(494) +
−2(0, 001525)(0, 2109)(858)
= 3, 06
Resumo e comentários:
Desenho M étodo de Ganhos de
Estratégia amostral estimaão
V ariâncias precisão
1 AAS simples V (y) = 6, 20 -

V (y)
2 AAS razão V (y R ) = 3, 51 V (y R )
= 1, 77
V (y)
3 AAE simples V (y est ) = 4, 16 V (y est )
= 1, 49
V (y)
4 AAE razão combinada V ( y RC ) = 3, 10 V ( y RC )
= 2, 00
V (y)
5 AAE razão separada V ( y RS ) = 3, 06 V ( y RS )
= 2, 03
Os resultados mostram que há ganhos de precisão com as estratégias 2 a

5 quando comparadas com a estratégia 1. Verifica-se que o ganho de precisão
quando utilizar o estimador de razão com amostragem aleatória simples é de
77%, enquanto que ao utilizar o estimador de razão separada em relação ao
estimador simples da amostragem aleatória simples é de 103%. Porém, pode-
se verificar que ao se adotar amostragem estratificada, o ganho de precisão
ao utilizar o estimador de razão separada em relação ao estimador simples
da amostragem estratificada é de apenas 36%, pois: V (y est ) / V ( y RS ) =
4, 16 / 3, 06 = 1, 36. Isto ocorre porque a variável de estratificação (tamanho
da área) é a mesma variável auxiliar utilizada no estimador de razão.
1.4.4 O uso de estimadores de razão

No planejamento das pesquisas a decisão entre utilizar uma determinada
variável na estratificação ou na estimação depende de uma série de circuns-
tâncias. Alguns pontos relevantes são:
• Fatores como localização geográfica, são mais fáceis de serem introduzi-

dos na estratificação do que no método de estimação.
• A decisão depende da natureza da relação entre x e y.Todos os métodos
de estimação de razão estudados dependem da efetividade da propor-
cionalidade da relação entre os xi e yi . Com relações complexas ou
discontínuas, a estratificação pode ser mais eficiente.
• Se para algumas variáveis da pesquisa existir uma relação proporcional
com a variável xi e para outras variáveis existir uma relaçãp propor-
cional a uma outra variável zi , então, é melhor utilizar xi e zi como
1.5. ESTIMADORES DE REGRESSÃO 33
variáveis auxiliares em estimadores de razão do que estratificar por uma

delas.
Algumas restrições devem ser consideradas ao tomar a decisão de usar

estimadores de razão:
• Os tamanhos de amostra devem satisfazer às condições para tornar

desprezível o vício do estimador empregado.
• Quanto maior a associação entre a caracterítica auxiliar x e a car-

acterística de interresse y maior o ganho de precisão no uso de esti-
madores de razão.
• Não existem fórmulas exatas para o vício nem para a variância dos es-
timadores, embora as aproximações da variância existentes sejam sat-
isfatórias para amostras cujo tamanho satisfaz a condição de tornar
desprezível o vício.
1.5 Estimadores de Regressão

O estimador de regressão tem sua definição baseada num modelo de regressão
usado para representar a distribuição condicional da variável de interesse y
dada a variável auxiliar x.
Assim como o estimador de razão, o estimador de regressão é utilizado
para melhorar a precisão através do uso de uma variável auxiliar x que é
correlacionada com y. Quando a relação entre y e x é examinada, pode ser
notado que embora haja uma relação linear, a reta não necessariamente passa
pela origem. Neste caso sugere-se a utilização de um estimador baseado na
regressão linear de y e x.
O papel do modelo é o de descrever a dispersão condicional da variável
de interesse y dada a variável auxiliar x na população finita. Espera-se que
o modelo represente bem a relação de y e x. A idéia é pensar que os valores
populacionais poderiam ter sido gerados pelo modelo. Entretanto, não é
necessário supor que os valores populacionais foram de fato gerados pelo
modelo.
Suponha que seja selecionada uma amostra aleatória simples de tamanho
n, que sejam investigados os valores da característica de interesse y e da
característica x, cuja média populacional (X) seja conhecida. O estimador
de regressão linear de Y é definido por:
y reg = y + b(X − x)
onde:
b é o estimador usual de mínimos quadrados baseado na amostra.
P
n
(yi − y)(xi − x)
sxy i=1
b= 2 = P
n
sx
(xi − x)2
i=1
O papel desempenhado pelo modelo será essencialmente de sugerir um

estimador adequado b para usar no estimador de regressão.
É possível demonstrar que o estimador de regressão y reg é consistente e
1
tem vício de ordem .
n
Sua variância pode ser aproximada por:
N −n1 2
V (y reg ) ∼
= S (1 − ρ2xy )
N n y
onde: ρxy = ρ(x, y) é a correlação entre as variáveis x e y na população.
Esta variância pode ser estimada usando:
N −n 1 n−1£ 2 ¤
v(y reg ) = sy + b2 s2x − 2bsxy
N n n−2
1 1 X
n
N −n
= [(yi − y) − b(xi − x)]2
N n n − 2 i=1
Outros estimadores de variância podem ser usados, oferecendo melhor

desempenho.
O estimador de regressão para estimar o total Y é dado por:
Ybreg = N y reg
Neste caso, a variância é aproximada por:

N −n1 2
V (Ybreg ) ∼
= N2 S (1 − ρ2xy )
N n y
e a variância pode ser estimada por:
N −n1 1 X
n
v(Ybreg ) = N 2 [(yi − y) − b(xi − x)]2
N n n − 2 i=1
Exemplo 1.3 (Thompson (1992), pág. 80)

Para estimar a produção total de uma plantação numa região com N =

100 áreas, foram selecionadas aleatoriamente 4 áreas e medida a quantidade
yi da produção de cada área da amostra. A produção de uma área depende
da quantidade xi de fertilizante aplicada na área, que é conhecida para cada
área da região, resultando numa média populacional 100.
Os 4 pares de valores (xi , yi ) da amostra são: (50, 1410), (100, 1690),
(150, 1680) e (200, 1850).
As médias amostrais são: y = 1657, 5 e x = 125 e
b o estimador usual de mínimos quadrados baseado na amostra:
P
n
(yi − y)(xi − x)
i=1
b = P
n
(xi − x)2
i=1
(50 − 125)(1410 − 1657, 5) + · · · + (200 − 125)(1850 − 1657, 5)
=
(50 − 125)2 + · · · + (2200 − 125)2
32750
= = 2, 62
12500
A estimativa da produção total da referida plantação, obtida através do
estimador de regressão, é dada por:
¡ ¢
Ybreg = N y reg = N y + b(X − x)
= 100 (1657, 5 + 2, 62 (100 − 125))
= 100 (1592) = 159 200
Para obter a estimativa da variância, vamos considerar o valor da linha

de regressão ajustada para a i-ésima unidade da amostra estimada por:
ybi = a + bxi
onde: a = y − bx = 1675, 5 − 2, 62 (125) = 1330.
Neste caso, tem-se:
yb1 = 1330 + 2, 62 (50) = 1461
yb2 = 1330 + 2, 62 (100) = 1592

yb3 = 1330 + 2, 62 (150) = 1723
yb4 = 1330 + 2, 62 (200) = 1854
N (N − n) 1 X
n
v(Ybreg ) = N 2 v(y reg ) = [(yi − y) − b(xi − x)]2
n n − 2 i=1
N (N − n) X
n
= (yi − ybi )2
n (n − 2) i=1
100 (100 − 4) £ ¤
= (1410 − 1461)2 + · · · + (1850 − 1854)2
4 (4 − 2)
100 (96)
= (7035) = 16 884 000
4
q
cujo desvio padrão é estimado por: v(Ybreg ) = 4 109.
Por outro lado, a estimativa da produção total da referida plantação,

obtida através do estimador simples da amostragem aleatória simples, é dada
por:
Yb = N y = 100 (1657, 5) = 165 750

e a respectiva estimativa da variância é dada por:
N (N − n) X
4
v(Yb ) = N 2 v(y) = (yi − y)2
n i=1
100 (96)
= (33292) = 79 900 000
4
q
cujo desvio padrão é estimado por: v(Yb ) = 8 939.
Portanto, o estimador de regressão é mais preciso que o estimador simples

no exemplo com essa pequena amostra. Isto ocorre em função da pequena
variação dos resíduos sobre a reta de regressão ajustada.
1.5.1 Comparação dos estimadores de regressão, razão

e simples da média sob amostragem aleatória
simples
N −n1 2
V (y reg ) ∼
= Sy (1 − ρ2xy )
N n
N −n1 £ 2 ¤
V (y R ) ∼
= Sy + R2 Sx2 − 2 R Sxy
N n
N −n1 2
V (y) = S
N n y
Examinando as expressões acima, é imediato notar que o estimador de
regressão é mais preciso que o estimador simples da média a não ser ρxy = 0,
caso em que os estimadores são igualmente precisos.
O estimador de regressão é preferível ao estimador de razão quando:
−ρ2xy Sy2 < R2 Sx2 − 2 R Sxy
ou, equivalentemente quando:
−ρ2xy Sy2 < R2 Sx2 − 2 R ρxy Sy Sx

µ ¶2
¡ ¢2 ρxy Sy Sx
ρxy Sy − R Sx > 0 =⇒ −R >0
Sx2
isto é, quando: µ ¶2
Sxy
−R > 0 =⇒ (B − R)2 > 0
Sx2
B corresponde ao ajuste populacional (hipotético) do modelo aos dados da
população.
Logo, o estimador de regressão é mais preciso que o estimador de razão
a menos que B = R, o que ocorre somente quando a regressão entre y e x é
linear passando pela origem.
1.5.2 O uso de estimadores de regressão

O estimador de regressão é útil por pelo menos três motivos:
• oferece calibração na variável auxiliar, isto é, se aplicado a variável

auxiliar replica exatamente seu total conhecido na população;
• oferece ganhos de eficiência em relação ao estimador simples;
• tem grande flexibilidade, podendo ser utilizado com um vetor de var-

iáveis auxiliares e ser facilmente generalizado para o uso em desenhos
amostrais complexos.
Algumas desvantagens e problemas devem ser consideradas ao tomar a

decisão de usar estimadores de regressão:
• o vício pode ser não desprezível com pequenas amostras;

• os pesos podem ser negativos ou menores que 1, o que é indesejável.
• a precisão pode não ser boa caso o modelo linear não se ajuste bem.
• maior complicação na estimação da variância.
• quando há mais de uma variável auxiliar, é necessário usar método

para escolha das que vão ser incorporadas na estimação. Acrescentar
variáveis auxiliares nem sempre traz bom resultado.
• usar pesos diferentes para diferentes variáveis de interesse da pesquisa é

uma tentação, mas aumenta a complexidade e cria dificuldades práticas.
1.6 Pós-estratificação
É muito comum na prática a ocorrência de situações onde a técnica de estrat-
ificação poderia ser aplicada para melhorar a qualidade da amostra, porém
não se dispõe de uma lista completa das unidades da população com os re-
spectivos valores da característica a ser usada na estratificação, ou seja, o
estrato para o qual a unidade pertence não é conhecido até que os dados da
amostra sejam coletados. Características de pessoas, tais como: idade, sexo,
raça e nível educacional são exemplos práticos dessa aplicação.
Nestes casos, quando forem conhecidos os limites dos estratos, e os seus
respectivos tamanhos (através de um censo anterior, por exemplo), é possível
fazer uso da estratificação para melhorar a qualidade das estimativas, através
da técnica de pós-estratificação que consiste no seguinte:
i) seleciona—se uma amostra aleatória simples sem reposição de tamanho
n da população π N (sem considerar a estratificação);
ii) observa—se para cada unidade selecionada o valor da característica de
estratificação x;
iii) de acordo com os valores observados de x, distribui-se a amostra em
L estratos previamente delimitados;
iv) considera-se a parte da amostra em cada um dos estratos como uma
amostra aleatória simples sem reposição do estrato (vide estimação em sub-
populações), de tal forma que n1 + n2 + · · · + nL = n
Neste caso n1 , n2 , · · · nL são variáveis aleatórias. A amostra em cada
estrato é considerada como uma amostra aleatória simples sem reposição da
subpopulação formada pelas unidades pertencentes ao estrato.
Assim sendo, a maneira de estimar será derivada da teoria apresentada
para estimação em subpopulações.
1.6. PÓS-ESTRATIFICAÇÃO 39
1.6.1 Estimação do total e da média

De acordo com o que foi visto no estudo de estimação em subpopulações um
estimador não tendencioso para o total y da população com pós-estratificação
é dado por:
X X nh
Nh X
L L
b
Ypós = Nh y h = yhj
h=1 h=1
nh j=1
Note que em termos de expressão, o estimador Ybpós é idêntico ao esti-

mador Ybest . A diferença existente entre ambos é que no caso de Ybest as
médias amostrais nos estratos (y h ) são calculadas com amostras de taman-
hos nh conhecidos a priori, enquanto que no caso de Ybpós estes tamanhos
são variáveis aleatórias dependendo da particular amostra selecionada.
A seguir, será demonstrada a afirmação de que Ybpós é estimador não
viciado para Y .
Inicialmente, deve—se recordar que, se Z e T são variáveis aleatórias,
então:
E(Z) = ET [E(Z/T )]
Neste caso é conveniente considerar internamente a esperança condi-
cionada quando se fixa uma dada seleção de amostra de tamanhos n1 , n2 , · · · , nL ,
e depois a esperança sobre todas as possíveis seleções de amostra. Verifica—se
que:
Ã nh
!
1 X
E(y h ) = E yhj
nh j=1
nh
1 X
= En1 ,n2 ,··· ,nL [E yhj | n1 , n2 , · · · , nL ]
nh j=1
= En1 ,n2 ,··· ,nL [Y h ] = Y h ∀h = 1, 2, · · · , L
Seguindo—se imediatamente que:

" L #
X X
L X
L
E(Ybpós ) = E Nh y h = Nh E(y h ) = Nh Y h = Y
h=1 h=1 h=1
Uma consequência imediata disto é que um estimador não tendencioso da

média y é dado por :
1 b X Nh
L
y pós = Ypós = yh
N h=1
N
Na pós—estratificação, conclui—se então que, os estimadores do total e da

média são obtidos da mesma forma que na estratificação comum, uma vez
selecionada a amostra. O que será diferente é a precisão resultante deste
processo de estimação, como será visto adiante.
1.6.2 Precisão dos estimadores com pós-estratificação

Nosso objetivo aqui é o cálculo das medidas da precisão dos estimadores com
pós—estratificação, e a comparação dessa precisão com aquela resultante da
aplicação convencional da estratificação.
Inicialmente vale notar que não se dispõe de expressão exata para a var-
iância de Ybpós ou de y pós . Isto se deve ao fato de ambas dependerem da
razão n1h onde agora nh é variável aleatória. Mas vamos ao problema,
calculando uma aproximação para V (y pós ).
Variância aproximada de y pós .
Se Z e T são variáveis aleatórias pode se escrever:
V (Z) = ET (V (Z/T )) + VT [E(Z/T )]
Então:
£ ¤
V (y pós ) = En1 ,n2 ,··· ,nL V (y pós | n1 , n2 , · · · , nL +
+Vn1 ,n2 ,··· ,nL [E(y pós | n1 , n2 , · · · , nL ]
Mas:
E(y pós | n1 , n2 , · · · , nL ) = Y
Donde:
Vn1 ,n2 ,··· ,nL [E(y pós | n1 , n2 , · · · , nL ] = Vn1 ,n2 ,··· ,nL (Y ) = 0
Logo:
£ ¤
V (y pós ) = En1 ,n2 ,··· ,nL V (y pós | n1 , n2 , · · · , nL
Ã L !
X N2 1 1 2
h
= En1 ,n2 ,··· ,nL ( − )S
h=1
N 2 nh Nh h
Daí:
X
L
N2 1 XL
Nh2 Sh2
h
V (y pós ) = 2
E( )Sh2 −
h=1
N nh h=1
N 2 Nh
1.6. PÓS-ESTRATIFICAÇÃO 41
Para calcular E( n1h ) vamos usar a aproximação em série de Taylor em

torno do ponto E(nh ) da função n1h . Esta função pode ser escrita como:
1 1 E(nh ) 1 1 1 1
= = nh = E(n )
nh E(nh ) nh E(nh ) h nh − E(nh )
E(nh ) 1+
E(nh )
agora sabe—se que:

1 .
= 1 − ∆ + ∆2 − · · · = 1 − ∆ + ∆2
1+∆
Para
nh − E(nh )
∆=
E(nh )
vem: µ ¶2
1 ∼ nh − E(nh ) nh − E(nh )
=1− +
nh − E(nh ) E(nh ) E(nh )
1+
E(nh )
Donde: " µ ¶2 #
1 ∼ 1 nh − E(nh ) nh − E(nh )
= 1− +
nh E(nh ) E(nh ) E(nh )
Tomando expectâncias nos 2 membros vem:
µ 2
¶
1 1 E(n h − E(nh )) E[(nh − E(n h )) ]
E( ) ∼ = 1− +
nh E(nh ) E(nh ) [E(nh )]2
µ ¶
1 V (nh )
= 1+
E(nh ) [E(nh )]2
Agora nh /n é um estimador não viciado da proporção Nh /N de unidades

pertencentes ao estrato h.
Logo:
³n ´ µ µ ¶¶
h N −n1 N Nh Nh
V = 1−
n N n N −1 N N
µ µ ¶¶
∼ N − n 1 Nh Nh
= 1−
N n N N
Também: hn i
h Nh
E =
n N
Logo:
Nh
E(nh ) = n
N µ µ ¶¶
2N − n 1 Nh Nh
V (nh ) = n 1−
N n N N
Isto é:
Nh
E(nh ) = n
N µ µ ¶¶
(N − n) Nh Nh
V (nh ) = n 1−
N N N
1
Levando na expressão de E( ) vem:
nh
 µ ¶
(N − n) Nh Nh
n 1−
1 ∼ 1  N N N  
E( ) = 1+ 2 
nh Nh N
n n2 h2
N
 N 
1  (N − n) 1  1 
=
Nh 
1+  N − 1
N n h
n
N µ µ N ¶¶
1 (N − n) 1 Nh
= 1+ −1
Nh N n N
n
N
Substituindo, finalmente, na expressão de V (y pós ), vem:
XL µ µ ¶¶ XL
Nh2 N N −n1 N Nh2 Sh2
V (y pós ) ∼
= 1 + − 1 Sh
2
−
h=1
N 2 n Nh N n Nh h=1
N 2 Nh
XL µ ¶ XL µ ¶
Nh2 N 1 2 Nh2 N N − n 1 N
= 2
− Sh + 2
− 1 Sh2
h=1
N nNh Nh h=1
N n Nh N n Nh
N − n 1 X Nh 2 N − n 1 X
L L
Nh 2
= Sh + (1 − )S
N n h=1 N 2
N n h=1 N h
Daí:
N −n 1 X
L
Nh 2
V (y pós ) ∼
(p)
= V (y est ) + (1 − )S
2
N n h=1 N h
1.7. O USO DE INFORMAÇÕES AUXILIARES NA ESTIMAÇÃO 43
(p)
onde: V (y est ) é a variância do estimador da média no desenho de amostragem
estratificada com alocação proporcional.
À medida que n cresce, a segunda parcela de V (y pós ) tende a zero.
(p)
V (y pós ) → V (y est )
Segue—se que, para amostras grandes, a eficiência da pós-estratificação em

relação à amostragem aleatória simples equivale à alocação proporcional. Um
critério habitualmente empregado na prática para ter uma pós estratificação
efeciente é tornar cada nh ≥ 20, este pode ser obtido de 2 maneiras, a saber:
i) dimensionar a amostra aleatória simples de tal sorte que esta condição
ocorra com elevada probabilidade;
ii) utilizar um esquema de amostragem por cotas, onde os tamanhos de
amostra em cada um dos estratos seriam previamente fixados por alocação
proporcional e as unidades de população iriam sendo selecionadas por AAS
e alocadas nos estratos respectivos, até preencher a “cota” de cada estrato;
cada nova unidade selecionada um estrato já com a cota preenchida seria re-
jeitada, e uma nova unidade deveria ser selecionada, repetindo—se o processo
até satisfazer as cotas fixadas para todos os estratos.
A desvantagem deste esquema de amostragem por cotas é o aumento do
custo da pesquisa, em função da seleção, investigação e posterior rejeição de
unidades pertencentes a estratos já completos.
Deve—se enfatizar que a adoção deste esquema só é válida se o proced-
imento da seleção das unidades da amostra for realmente o de uma AAS
sem reposição.
1.7 O uso de informações auxiliares na esti-

mação
Silva (1996a) nos aponta que o aproveitamento de informações populacionais
auxiliares para estimação em pesquisas por amostragem é uma das partes
da teoria de amostragem que mais progrediu desde os anos 70. O livro que
representava o ”estado da arte” da amostragem até então (Cochran (1977))
contempla o uso de informações auxiliares através de estimadores de razão
ou de regressão simples (ambos incorporando apenas uma variável auxiliar)
ou de pós-estratificação. Entretanto, essas técnicas eram apresentadas como
ferramentas separadas, sem uma ligação comum.
O livro que corresponde ao ”estado da arte” da amostragem no início
dos anos 90 (Särndal, Swensson e Wretman (1992)) apresenta as técnicas de
pós-estratificação, estimação de razão e de regressão como casos particulares
do estimador de regressão generalizado, o qual fornece uma estrutura flexível

e eficiente para incorporar informações auxiliares na etapa de estimação.
Neste livro é enfatizada uma abordagem ”model assisted”, em que o modelo
de regressão é usado para motivar o estimador, mas em que as propriedades
do mesmo são avaliadas com respeito à distribuição gerada por repetidas
aplicações do processo de seleção da amostra.
Também recentemente, Deville e Särndal (1992) identificaram o estimador
de regressão como um dos membros de uma famílias de estimadores de cali-
bração, em que os pesos são ajustados, cujos os fatores de ajuste são obtidos
de forma a minimizar uma função de distância sujeita a restrições que são
funções das variáveis auxiliares. Empregando-se distintas funções de dis-
tância se gera uma ampla família de estimadores que inclui ”raking ratio
estimators, estimadores de regressão, de razão, de pós-estratificação e out-
ros.
O IBGE já adquiriu larga experiência e tem feito uso efetivo dos desen-
volvimentos recentes da teoria. Para corroborar essa afirmação é apresentada
a aplicação de estimadores especiais para a obtenção dos fatores de expansão
das amostras utilizadas na coleta de Censos Demográficos brasileiros.
O IBGE, desde 1960, tem usado dois modelos de questinários na coleta
das informações dos Censos Demográficos: um questionário básico, que con-
tém os quesitos necessários ao conhecimento de certas características bási-
cas da população e dos domicílios, referentes a 100% da população, e um
questionário de amostra (ampliado) que contém, além dos quesitos básicos
que também constam do questionário básico, outos quesitos mais detalhados
sobre características dos domicílios e das pessoas, tais como religião, cor,
migração, escolaridade, fecundidade, mão-de-obra, rendimento, etc.
O conhecimento de totais da população para um subconjunto de car-
acterísticas investigadas (as quais são pesquisadas a 100%) torna viável a
aplicação de estimadores especiais.
Nos censos demográficos de 1960 e 1970 foram utilizados estimadores
de pós-estratificação, com 46 pós-estratos em 1970, aplicado separadamente
para cada município. Cada pós-estrato era formado por combinações de
valores das variáveis auxiliares, as quais foram investigadas a 100% através
do questionário básico.
Na expansão da amostra do Censo Demográfico de 1980 foi adotado raking
ratio estimator aqui denominado Processo Iterativo de Estimação por Totais
Marginais - PIETOM (IBGE (1983)) aplicado separadamente para cada uma
das 4219 áreas de ponderação.2 Esse método consistia em definir uma tabela
2
Área de ponderação é a menor área para a qual se calculava estimativas, e coincidia
na maior parte das vezes com um município, podendo ser subdivisão deste nos de maior
1.7. O USO DE INFORMAÇÕES AUXILIARES NA ESTIMAÇÃO 45
(ou matriz) de pós-estratificação de dupla entrada, cujas linhas e colunas

eram dadas por combinações de valores das variáveis auxiliares, as quais
foram investigadas a 100% através do questionário básico. Eram portanto
conhecidos os totais populacionais das celas, linhas e colunas dessa tabela.
Os pesos amostrais para unidades em cada cela eram calculados por um
processo iterativo de ajuste dos pesos iniciais, de tal forma que as estimativas
amostrais eram sucessivamente calibradas nos totais das linhas e depois das
colunas, até que fosse observada convergência dos pesos.
O uso dese método permitiu ampliar bastante o número de variáveis aux-
iliares consideradas para a calibração das estimativas amostrais: a tabela de
pós-estratificação empregada no censo de 1980 tinha 720 celas, em compara-
ção com os 46 pós-estratos adotados no Censo de 70.
A metodologia adotada para a expansão da amostra do Censo de 1991 foi
baseada no ajuste de um modelo linear generalizado sujeito a restrições, en-
tendidas como condições que buscam igualar estimativas dos valores conheci-
dos do universo para um conjunto de variáveis auxiliares comuns à amostra
e toda população de cada área de ponderação. Essa metodologia é baseada
num dos membros da família de estimadores de calibração identificada por
Deville e Särndal (1992), identificada por estimação de mínimos quadrados
generalizados em duas etapas - MQG2 (Silva, Bianchini e Albieri (1993);
Albieri e Dias (1994)).
Essa metodologia foi desenvolvida por técnicos do Statistics Canada e
aplicada na expansão da amostra do Censo de População canadense de 91e 96,
que é parecido com o Censo Demográfico brasileiro. Foi possível contar com
programas cedidos ao IBGE pelo Statistics Canada para a implementação do
método para uso no censo brasileiro.
A metodologia MQG2 adotada para expandir a amostra do Censo De-
mográfico de 1991 permite incorporar grande número de variáveis auxiliares,
mas não oferece uma teoria para a escolha ótima das mesmas. Esse é um dos
aspectos do emprego de estimadores de regressão que tem merecido atenção
da comunidade de pesquisa recentemente. Em particular, Silva e Skinner
(1996) apresentam um método para seleção de variáveis auxiliares quando se
utiliza estimadores de regressão cuja eficiência para estimar a média de uma
variável resposta especificada foi maior que a de vários competidores. Silva
e Skinner (1996) apontam ainda uma perda de precisão deo estimador de
regressão quando o número de variáveis auxiliares cresce demasiadamente,
alertando para a necessidade de establecer um compromisso entre a cali-
bração no maior número possível de variáveis auxiliares sem impor grande
perda de eficiência no estimador.
população.
Na área de estimação em amostragem há hoje em dia várias opções de

sistemas genéricos: SUDAAN - SUrvey DAta ANalysis (Shah et al. (1992)),
GES - Generalized Estimation System (Estevao, Hidiroglou e Särndal (1995)),
CLAN (Andersson e Nordberg (1994)), WESVARPC (Westat (1995)). Todos
esses sistemas são capazes de calcular estimativas de totais e médias, e re-
spectivas medidas de precisão para uma ampla gama de desenhos amostrais
e tipos de estimadores. Em particular, o sistema GES desenvolvido pelo
Statistics Canada implementa a metodologia de estimadores de regressão
generalizados tal como descrita no livro de Särndal, Swensson e Wretman
(1992).
1.8. EXERCÍCIOS 47
1.8 Exercícios
1.8.1 (Thompson (1992), pág. 76) Numa cidade com 75.000 habitantes,
uma amostra aleatória simples de 4 domicílios é selecionada dos 25.000
domicílios da cidade para estimar o custo médio de alimentação por
domicílio em uma semana. O primeiro domicílio selecionado tinha 4
pessoas e gastou R$150,00 com alimentação naquela semana. O se-
gundo domicílio tinha 2 pessoas e gastou R$100,00. O terceiro, com 4
pessoas, gastou R$200,00. O quarto, com 3 pessoas, gastou R$140,00.
N −n ∼
Considere: =1 s2y = 1691, 70 s2x = 0, 9166 sxy = 37, 5
N
a) Identifique as unidades de amostragem, a variável de interesse, e

alguma informação auxiliar associada com as unidades.
b) Descreva dois tipos de estimadores para estimar a despesa mé-
dia por domicílio para a alimentação por uma semana na cidade.
Sumarize algumas propriedades de cada estimador.
c) Estime a despesa média por domicílio usando o primeiro estimador
e estime a variância do estimador.
d) Estime a despesa média por domicílio usando o segundo estimador
e estime a variância do estimador.
e) Baseado nos dados, qual estimador é preferível nesta situação?
1.8.2 Seja {u1 , u2 , · · · , un }uma amostra aleatória simples sem reposição da

população π N , onde são observadas as características x e y. Mostre
que a covariância amostral
1 X
n
sxy = (xi − x)2
n − 1 i=2
é um estimador não viciado para a covariância populacional
1 X
N
Sxy = (XI − X)(YI − Y )
N − 1 I=1
1.8.3 De uma população com 40 domicílios foi selecionada uma amostra

aleatória simples sem reposição de tamanho n = 4 que proporciona
os seguintes valores semanais expressos em reais.
Gastos com alimentação Gastos total

(yi ) (xi )
125 250
135 300
70 200
158 350
P
4 P
4
yi = 488 xi = 1.100
i=1 i=1
P
4 P
4 P
4
yi2 = 63.714 x2i = 315.000 xi yi = 141.050
i=1 i=1 i=1
Estime a porcentagem de gasto com alimentação e o respectivo erro

amostral medido pelo coeficiente de variação.
1.8.4 O objetivo é estimar o total de despesa com gastos sociais das prefeituras
de uma região que abrange 281 municípios. Foi selecionada uma amostra
aleatória sem reposição de 50 municípios. Sabe-se que a população to-
tal da região é de 6.818 (em milhares). Calcule a estimativa de total
da característica y, que representa a despesa com gastos sociais, e o re-
spectivo intervalo com 95% de confiança para essa estimativa de total
baseada em cada um dos seguintes estimadores:
a) Estimador simples.
b) Estimador de razão, utilizando como variável auxiliar a população,

representada pela característica x.
c) Comente os resultados.
São dadas as seguintes informações provenientes da amostra:
P
50 P
50
yi = 128.080 xi = 1.067
i=1 i=1
s2y = 6.244.516 s2x = 454, 51 sxy = 45.399

Obs: Tanto os valores de x com de y estão representados em milhares.
1.8. EXERCÍCIOS 49
1.8.5 Defina estimadores consistentes e suas respectivas variâncias aproxi-

madas para a média de Y baseados em:
a) estimador de razão simples;

b) estimador de razão combinada;
c) estimador de razão separada.
Quando é razoável a utilização de estimadores de razão, à luz das re-

strições existentes para esse tipo de estimador? e
A partir das fórmulas aproximadas para as variâncias dos estimadores

de (a), (b) e (c), obtenha estimadores consistentes que possam ser cal-
culados a partir da amostra.
1.8.6 Uma pesquisa piloto, onde foram selecionados aleatoriamente 21 domi-

cílios (di i = 1, 2, · · · , 21), forneceu os seguintes dados para o número
de pessoas no domicílio (x), número de crianças (y1 ), número de carros
(y2 ) e número de televisores (y3 ).
di x y1 y2 y3 di x y1 y2 y3 di x y1 y2 y3
d1 5 3 1 3 d8 2 0 0 1 d15 6 3 2 0
d2 2 0 1 1 d9 3 1 1 1 d16 4 2 1 1
d3 4 1 2 0 d10 2 0 2 0 d17 4 2 1 1
d4 4 2 1 1 d11 6 4 2 1 d18 3 1 0 1
d5 6 4 1 1 d12 3 1 0 0 d19 2 0 2 1
d6 3 1 1 2 d13 4 2 1 1 d20 4 2 1 1
d7 5 3 1 1 d14 5 3 1 1 d21 3 1 1 1
Assumindo que a população total X é conhecida, você recomendaria

que os estimadores de razão fossem utilizados ao invés do estimador
simples para estimar o total de crianças, carros e televisores?
1.8.7 Em uma determinada localidade de 500 famílias se deseja fazer um

estudo sobre o hábito de fumar entre as pessoas maiores de 16 anos.
A população foi estratificada em 2 estratos: famílias com renda alta
(estrato 1), onde foram classificadas 200 famílias; e famílias com renda
mais baixa (estrato 2), onde foram classificadas as outras 300 famílias.
É conhecido que o número de pessoas com mais de 16 anos no estrato 1 é
520 e no estrato 2 é 1230. De cada um dos estratos foi selecionada uma
amostra aleatória de 5 famílias, apresentando os seguintes resultados:
Estrato 1
Famílias na amostra 1 2 4 4 5
Pessoas com mais de 16 anos 4 3 2 1 2
Fumantes com mais de 16 anos 1 1 0 1 1
Estrato 2
Famílias na amostra 1 2 4 4 5
Pessoas com mais de 16 anos 5 6 4 4 3
Fumantes com mais de 16 anos 3 3 1 2 2
Estimar o total de fumantes entre as pessoas maiores de 16 anos na
localidade, utilizando:
a) o estimador simples da amostragem estratificada;

b) o estimador de razão combinada; e
c) o estimador de razão separada.
Calcule os intervalos com 95% de confiança para estimar os totais de fu-

mantes entre as pessoas maiores de 16 anos na localidade, considerando
os estimadores utilizados em (a), (b) e (c).
Comente os resultados.
1.8.8 Considere uma população de pomares de plantio de pêssegos. A var-

iável y é a produção de pêssegos e a variável auxiliar x o número de
pés de pêssego do pomar.
A idéia é comparar a precisão dos estimadores alternativos da produção
total de pêssegos na população, que tem 256 pomares, com base numa
amostra aleatória de 100 pomares.
Os dados básicos obtidos de um censo anterior são:
Sy2 = 6.409 Sx2 = 3.898 Sxy = 3.898 e R = 1, 270
Calcule a variância do estimador de total segundo cada uma das es-

tratégias: estimador simples, razão e regressão. Comente o resultado.
1.8.9 De um Censo Agropecuário foram obtidas 1 200 000 fazendas e a área
(x) de cada fazenda foi investigada fornecendo uma média de 31,25
acres por fazenda. Uma amostra aleatória simples de 2 055 fazendas foi
selecionda e foram obtidas as seguintes informações sobre o número de
cabeças de gado (y) em cada fazenda e a área de cada fazenda.
1.8. EXERCÍCIOS 51
P
2.055 P
2.055
yi = 25. 751 xi = 62. 989
i=1 i=1
s2y =
1.334, 470 s2x = 490, 4300 b = 0, 354585
N −n ∼
(Considere = 1)
N
a) Calcule as estimativas do total de cabeças de gado utilizando o

estimador simples, de razão e de regressão.
b) Calcule a estimativa da variância de cada estimativa obtida em
(a).
c) Obtenha o intervalo com 95% de confiança para cada uma das
estimativas obtida em (a).
d) Comente os resultados.
1.8.10 Para estimar o total de cabeças de gado em uma determinada região, foi
selecionada aleatoriamente uma amostra de 24 fazendas dentre as 1.238
fazendas daquela região. O número de cabeças de gado de cada fazenda
da amostra foi coletado (característica y) e além disso dispunha-se do
correspondente número de cabeças de gado obtido no último Censo
Agropecuário. Usando como variável auxiliar (x) a informação do
número de cabeças de gado coletado no último censo e sabendo-se que:
P
24 P
24
yi = 13.646 xi = 13.638 s2y = 256.154, 86
i=1 i=1
s2x = 278.836, 89 sxy = 256.262, 02
a) Compare a eficiência do estimador de regressão em relação ao

estimador simples.
b) Compare a eficiência do estimador de regressão em relação ao

estimador de razão.
1.8.11 Uma amostra aleatória simples de 546 domicílios foi selecionada de

uma área que continha 2 097 domicílios. As características tamanho
do domicílio e idade do chefe foram investigadas em todo universo e
a variável sexo do chefe do domicílio foi investigada apenas através da
amostra, fornecendo os seguintes resultados.
Número de domicílios no universo

Tamanho do Idade do chefe
domicílio 0 a 39 anos 40 e mais Total
1 a 3 moradores 303 464 767
4 e 5 moradores 426 339 765
6 e mais moradores 171 394 565
Total 900 1197 2097
Número de domicílios na amostra

1 a 3 moradores 103 154 257
4 e 5 moradores 120 80 200
Total 255 291 546
Número de domicílios na amostra, cujo chefe é mulher

1 a 3 moradores 1 8 9
4 e 5 moradores 1 3 4
Total 2 14 16
Estimar o número de domicílios cujo chefe é mulher
a) usando o estimador simples.

b) usando o estimador de pós-estratificação, considerando como pós-
estrato a variável idade do chefe.
c) usando o estimador de pós-estratificação, considerando como pós-
estrato o tamanho do domicílio.
d) usando o estimador de pós-estratificação, considerando como pós-
estrato a variável idade do chefe cruzada com o tamanho do domicílio.
Capítulo 2
Amostragem de Conglomerados
2.1 Conceituação Básica

O objetivo pretendido com a aplicação da técnica de amostragem é a obtenção
de estimativas para certos parâmetros da população a partir de uma amostra
de unidades dessa população, cuja precisão seja conhecida e satisfatória.
As unidades dessa amostra podem ser obtidas selecionando-se direta-
mente unidades na população com probabilidades conhecidas. Elas podem
ainda ser obtidas por um outro esquema de amostragem onde grupos de
unidades são selecionados com probabilidades conhecidas.
A amostragem de conglomerados (cluster sampling) consiste num es-
quema de amostragem em estágios, sendo que em cada estágio a unidade
amostral, para a qual é atribuída a probabilidade de seleção, é grupada em
um subconjunto (CONGLOMERADO) de unidades populacionais.
O termo unidade populacional é usado para denotar um membro de uma
particular população para a qual as análises dos resultados do levantamento
são feitas.1
A formação dos conglomerados pode ser:
- natural (exemplos: um cacho de uvas, uma turma de alunos, um edifício,
um quarteirão, um município); ou
- artificial, construído pelo estatístico de acordo com o objetivo da pesquisa
(exemplos: conglomerados de seis pessoas, de dez peças industriais do mesmo
tipo, de cinco domicílios do mesmo edifício).
1
Nos esquemas de amostragem até então apresentados (amostragem aleatória simp-
ples, amostragem estratificada e amostragem sistemática) a unidade amostral era igual a
unidade de análise.
53
54 CAPÍTULO 2. AMOSTRAGEM DE CONGLOMERADOS
A unidade populacional depende da análise que está sendo feita e é de-

terminada pelo propósito do levantamento e não pelo plano amostral. Pode
acontecer de mais de uma unidade populacional estar envolvida no levanta-
mento, quando por exemplo, características de domicílios e de pessoas são
investigadas no mesmo levantamento.
Não há uma única definição possível para os conglomerados. Por exemplo,
a turma tanto pode ser uma unidade populacional (se estivermos interessados
em investigar o número de alunos por turma), como pode ser um conglom-
erado de alunos (se estivermos interessados em investigar o aproveitamento
dos alunos).
A fim de exemplificar, seguem-se algumas ilustrações de possíveis con-
glomerados associados com a população, a variável de interesse e a unidade
de referência para análise.
População Variáveis de Unidade de Conglome-

Interesse Referência rados
Turmas de Alunos por turma Turma Escolas

alunos
Estudantes de Aproveitamento Estudante Turmas

escolas de 2o grau dos estudantes
Visitantes de Facilidades do Visitante de Veículos que

parques parque parque entram no
nacionais nacional parque
Passageiros Propósito da Passageiro de Lotações de

de avião Viagem avião passageiros
Domicílios Características Domicílio Setores

de domicílios
Moradores Características Morador de Domicílios

em favelas de pessoas favela em favelas
do Rio do Rio do Rio
Cabe lembrar que os vários esquemas de amostragem: amostragem aleató-
ria simples (AAS), amostragem estratificada e amostragem sistemática dis-
cutidos anteriormente podem ser aplicados a amostragem de conglomerados,
onde os conglomerados são as unidades amostrais.
2.2. AMOSTRAGEM DE ÁREAS 55
2.2 Amostragem de Áreas

O cadastro ou marco de referência é a fonte de materiais que serve de guia e
permite identificar a população a ser coberta para a seleção de amostras.
Os esquemas probabilísticos propostos para seleção de amostras pres-
supõem a existência de uma lista completa das unidades da população a ser
pesquisada. Porém, uma lista pode não estar disponível, ou estar desatual-
izada, ou o custo de preparar uma lista atualizada pode ser proibitivo. Além
disso, uma amostra selecionada de uma população dispersa geograficamente
provavelmente será muito dispersa também.
Para reduzir custos é muito freqüente o uso de amostragem de conglom-
erados definidos por áreas geográficas com limites naturais ou artificiais bem
definidos, Neste caso a amostra resultante pode ser concentrada dentro de
um número de áreas geográficas.
Portanto, a utilização de amostras de áreas se dá quando não existe um
cadastro de boa qualidade disponível e/ou quando a população for muito
dispersa e o fator custo de deslocamento for preponderante. Neste caso a
necessidade de uma lista atualizada das unidades para as quais se requer a
informação é restrita às áreas que forem selecionadas para a amostra.
A grande vantagem da amostra de conglomerados é a sua conveniência
operacional vinculada a possíveis reduções no custo.
Num levantamento de população, por exemplo, é operacionalmente mais
conveniente pesquisar todas as pessoas numa amostra de domicílios do que
selecionar o mesmo número de pessoas espalhadas por toda a população ou
mesmo pesquisar todos os domicílios de uma amostra de áreas (por exemplo,
setores) do que selecionar uma amostra do mesmo número de domicílios
selecionados aleatoriamente de uma lista de todos os domicílios. Tal lista
nem sempre é disponível e o seu preparo torna a pesquisa bem mais cara.
Suponha-se que uma AAS de n=400 domicílios deva ser selecionada de
uma população de N=10.000 domicílios de uma cidade. Como não dispomos
de uma lista atualizada com todos os domicílios, optamos por uma amostra
de domicílios localizados dentro de uma amostra de quarteirões. Isto pode
ser feito dividindo a área toda da cidade em quarteirões e selecionando 1/25
quarteirões. A probabilidade de selecionar um domicílio na cidade é a prob-
abilidade de selecionar um quarteirão, ou seja, 1/25=400/10.000.
Portanto, as unidades amostrais são quarteirões selecionados de uma lista
completa. A seleção da amostra de quarteirões determina a seleção dos
domicílios que estão localizados nos quarteirões.
Mesmo se a lista de todos os domicílios fosse disponível, considerações na
redução do custo pode ser observada na amostra de conglomerados. Pois a
localização e identificação dos 400 domicílios espalhados aumentaria o custo

com gastos com transporte, bem como um maior tempo para a coleta em
comparação com a localização dos quarteirões e visita a todos os domicílios
nestes quarteirões.
Mas para um dado tamanho de amostra, uma unidade menor em geral
dá resultados mais precisos do que uma unidade maior.
Portanto, se compararmos uma amostra de conglomerados com uma amostra
de unidades elementares compreendida do mesmo número de elementos, em
geral na amostra de conglomerados tem-se:
- o custo por unidade elementar é mais baixo, devido ao mais baixo custo
da listagem ou da localização, ou de ambos;
- a variância amostral é mais alta dependendo da homogeneidade dos
elementos nos conglomerados.
Entretanto, levando em conta os aspectos operacionais e a redução de
custos (devido ao possível ganho no tempo de coleta, identificação, contato,
etc.) que a amostragem de conglomerados proporciona, em muitas situações
práticas a perda na eficiência amostral é balanceada com essas vantagens.
2.3 Conglomerados em 1 estágio

2.3.1 Probabilidades iguais de seleção
Definições básicas e notação
Seja πN a população, com suas N unidades grupadas em M conglomerados
disjuntos. Seleciona-se uma amostra aleatória simples sem reposição de m
desses M conglomerados. As unidades de π N pertencentes aos m conglom-
erados selecionados formam a amostra de conglomerados em 1 estágio de
π N (Ac1).
Se a característica y observada nas unidades da amostra, tem-se uma
amostra de conglomerados em 1 estágio de y.
Pode-se representar esquematicamente a população por:
C1 C2 CM
U11 → Y11 U21 → Y21 ... UM1 → YM1
U12 → Y12 U22 → Y22 ... UM2 → YM2
.. .. .. .. .. ..
. . . . . .
U1N1 → Y1N1 U2N2 → Y2N2 . . . UMNM → YMNM
onde:
2.3. CONGLOMERADOS EM 1 ESTÁGIO 57
Uij é a j-ésima unidade de π N no i-ésimo conglomerado Ci ;

i ∈ {1, 2, ..., M } e j ∈ {1, 2, ..., Ni } ;
Yij é o valor da característica y associada a Uij ;
PM
Ni é o tamanho do conglomerado Ci ; Ni = N
i=1
Selecionando-se através de amostragem aleatória simples sem reposição
m conglomerados dentre os M existentes, pode-se representar esquematica-
mente a amostra por:
C10 C20 0
Cm
0
U11 → Y110 0
U21 → Y210 ... 0
Um1 → 0
Ym1
0
U12 → Y120 0
U22 → Y220 ... 0
Um2 → 0
Ym2
.. .. .. .. .. ..
. . . . . .
0 0 0 0 0 0
U1N 0 → Y1N 0 U2N 0 → Y2N 0 . . . UmNm
0 → YmNm
0
1 1 2 2
Note-se que como os conglomerados são selecionados por amostragem

aleatória simples:
Ci0 pode ser qualquer um dos conglomerados C1 , C2 , · · · , CM .
Ni0 é o tamanho do conglomerado selecionado Ci0 e pode ser qualquer um
dos valores N1 , N2 , · · · , NM .
Consequentemente os Yij0 (i = 1, 2, ..., m e j = 1, 2, ..., Ni0 ) e os Ni0
(i = 1, 2, ..., m) são variáveis aleatórias.
A amostra é constituída pelas unidades:
n o
0 0 0 0
U11 , ..., U1N1
0 ; ...; Um1 , ..., UmN 0
m
e os valores da característica y associados às unidades da amostra são:

n o
0 0 0 0
Y11 , ..., Y1N10 ; ...; Ym1 , ..., YmNm0
P
m
O tamanho total da amostra é: n = Ni0 que é uma variável aleatória,
i=1
cujos valores dependem dos conglomerados selecionados.
Pode-se calcular o valor esperado de n, n que será dado por:
Ãm ! P
M
X X
m Ni
i=1
n = E Ni0 = E(Ni0 ) =m
i=1 i=1
M
N m
= m = N = f1 N
M M
m
sendo: f1 = , a fração de amostragem do primeiro estágio.
M
A figura 2.1 apresenta uma ilustração da seleção das unidades de uma
amostra de conglomerados em 1 estágio.
Figura 2.1: Ilustração da seleção das unidades de uma Ac1
A amostragem de conglomerados em 1 estágio é caracterizada pelos seguintes

fatos:
• Pertencem à amostra todas as unidades dos conglomerados seleciona-

dos.
• Só é necessário listar as unidades da população nos m conglomera-

dos selecionados para a amostra. Isto acarreta evicente economia de
tempo e custo quando comparado à amostragem aleatória simples ou à
amostragem estratificada, nas quais são listadas todas as unidades da
população.
• O tamanho da amostra não pode ser exatamente prefixado, pois de-

penderá dos conglomerados selecionados.
• Cada unidade da população tem a mesma probabilidade de participar

da amostra, e esta probabilidade é igual à fração de amostragem no
m
primeiro estágio .
M
• Mais adiante se verá que em muitas ocasiões, a precisão da amostragem
de conglomerados é inferior à precisão da amostragem aleatória simples.
Entretanto, a vantagem do menor custo e tempo pode compensar a

perda de precisão.
Parâmetros da característica y
Total da característica y no conglomerado Ci :
Ni
X
Yi = Yij
j=1
Média da característica y no conglomerado Ci :
Yi
Yi =
Ni
Variância da característica y em Ci :
N
1 X i
Si2 = (Yij − Y i )2
Ni − 1 j=1
Total da característica y em toda população:
X
M
Y = Yi
i=1
Média da característica y por unidade da população:
Y
Y =
N
Média da característica y por conglomerado:
Y
Y =
M
Variância da característica y em toda população:
N
1 XX
M i
S2 = (Yij − Y )2
N − 1 i=1 j=1
Estatísticas da amostra em cada conglomerado selecionado

Como resultado da amostragem de conglomerados tem-se as seguintes es-
tatísticas:
Total da característica y no i-ésimo conglomerado selecionado Ci0 :
0
Ni
X
Yi0 = Yij0
j=1
Média da característica y no conglomerado Ci0 :

0 Yi0
Yi =
Ni0
Variância da característica y em Ci0 :
N0
02 1 X i
0
Si = 0 (Yij0 − Y i )2
Ni − 1 j=1
Estimadores do total e da média na Ac1

Quando os conglomerados são selecionados por amostragem aleatória simples
sem reposição, um estimador não viciado do total Y é dado por:
MX 0
m
b
YAc1 = Y
m i=1 i
Prova:
MX MX
m m
b
E(YAc1 ) = 0
E(Yi ) = E(Yi0 )
m i=1 m i=1
ÃM ! ÃM !
MX 1 X Mm X
m
= Yk = Yk
m i=1 M k=1 m M k=1
X
M
= Yk = Y
k=1
Conseqüentemente, um estimador não viciado de Y , média por unidade

da população, é dado por:
1MX 0 1 X 0
m m
YbAc1
y Ac1 = = Yi = Yi
N N m i=1 m N i=1
N
onde: N = é o tamanho médio por conglomerado.
M
Ã !
¡ ¢ YbAc1 1 ³b ´ 1
E y Ac1 = E = E YAc1 = Y =Y
N N N
E um estimador não viciado de Y , média por conglomerado é dado por:
1 X 0
m
YbAc1
y Ac1 = = Y
M m i=1 i
Ã !
YbAc1 1 ³b ´ Y
E (y Ac1 ) = E = E YAc1 = =Y
M M M
Variâncias dos estimadores do total e da média na Ac1
Ã ! Ã !2
M X
m
M X
m
V (YbAc1 ) = V Y0 =E Y0−Y
m i=1 i m i=1 i
 2
Pm
0  Ãm !2 
 M i=1 Yi − mY  2 X
= E   = E  M Yi0 − mY 
 m  m2
i=1
Ã !2  Ã !2 
M 2 X m
M 2 X m
¡ 0 ¢
= 2
E Yi0 − mY  = 2 E  Yi − Y 
m i=1
m i=1
 
M2  Xm
¡ 0 ¢2 X m X m
¡ 0 ¢¡ 0 ¢
= E  Y − Y + Y − Y Y − Y 
m2  i=1 i
i=1 k=1
i k 
i6=k
 
M2 Xm
¡ 0 ¢2 X
m X
m
£¡ ¢¡ ¢¤
=  E Yi − Y + E Yi0 − Y Yk0 − Y 
m2  
i=1 i=1 k=1
i6=k
 
m X¡ m(m − 1) X X £¡ 0
M M M
M2 

¢2 ¢¡ 0 ¢¤

= Y − Y + Y − Y Y − Y
m2  M i=1 
i i k
M(M − 1) i=1 k=1
i6=k
 
MXM
¡ ¢2 (m − 1) XM X M
£¡ 0 ¢¡ ¢¤
=  Yi − Y + Yi − Y Yk0 − Y 

m i=1 (M − 1) i=1 k=1 
i6=k
fazendo:
1 X¡
M
¢2
Se2 = Yi − Y
M − 1 i=1
e notando que:
ÃM !2
X
M
¡ ¢ X¡ ¢
0 = Yi − Y = Yi − Y
i=1 i=1
XM
¡ ¢2 XX
M M
¡ ¢¡ ¢
= Yi − Y + Yi − Y Yk − Y
i=1 i=1 k=1
i6=k
X
M X
M
¡ ¢¡ ¢ X
M
¡ ¢2
=⇒ Yi − Y Yk − Y = − Yi − Y
i=1 k=1 i=1
i6=k
Segue-se que:
" #
M (m − 1) X M
¡ ¢2
V (YbAc1 ) = 2
(M − 1) Se − Yi − Y
m (M − 1) i=1
M£ ¤
= (M − 1) Se2 − (m − 1) Se2
m
M(M − m) 2 M 2 (M − m) Se2
= Se =
m M m
Observe que a variância do estimador YbAc1 depende somente da fração

de amostragem do primeiro estágio e da variabilidade entre os totais dos
conglomerados. Em termos de expressão, a variância de YbAc1 é idêntica à
variância do estimador de total com amostragem aleatória simples.
Estimador da variância do estimador de total na Ac1
Agora que se conhece a expressão da variância do estimador YbAc1 , trata-se da

obtenção de um estimador para essa variância. Isto é feito usando a teoria já
conhecida da amostragem aleatória simples e supondo que os conglomerados
são as unidades investigadas.
Assim,
1 X 0
m
2 2
se = (Yi − y Ac1 )
m − 1 i=1
deve ser um estimador não viciado de Se2 .

Para verificar este fato, note-se que:

1 X 0
m
2
s2e = (Y − y Ac1 )
m − 1 i=1 i
1 X £¡ 0
m
¢¤2
= Yi − Y ) − (y Ac1 − Y
m − 1 i=1
1 X £¡ 0
m
¢ ¤
= Yi − Y )2 − 2(y Ac1 − Y (Yi0 − Y ) + (y Ac1 − Y )2
m − 1 i=1
" m #
1 X Xm Xm
0 2 2 0
= (Y − Y ) + (y Ac1 − Y ) − 2(y Ac1 − Y ) (Yi − Y )
m − 1 i=1 i i=1 i=1
" m #
1 X
s2e = 0 2 2
(Y − Y ) + m(y Ac1 − Y ) − 2m(y Ac1 − Y ) 2
m − 1 i=1 i
" m #
1 X
0 2 2
= (Y − Y ) − m(y Ac1 − Y )
m − 1 i=1 i
daí pode-se obter:
( " m #)
1 X
E(s2e ) = E (Y 0 − Y )2 − m(y Ac1 − Y )2
m − 1 i=1 i
(m )
1 X
= E(Yi0 − Y )2 − mE(y Ac1 − Y )2
m − 1 i=1
( )
mX
M
1
= (Yi − Y )2 − mV (y Ac1 )
m − 1 M i=1
½ ¾
1 m 2 (M − m) Se2
= (M − 1) Se − m
m−1 M M m
½ 2
¾
m 1 S
= M Se2 − Se2 − (M − m) e
M m−1 m
m 1 1
= M(1 − ) Se2
M m−1 m
m 1 m−1 2
= M( ) Se = Se2
M m−1 m
Conseqüentemente, um estimador não viciado para V (YbAc1 ) é dado por:
b M 2 (M − m) s2e
v(YAc1 ) =
M m
2.3.2 Estimação de proporções na Ac1

Considere-se a população dividida em 2 classes A e A e (não A), de acordo
com algum atributo associado às unidades da população π N .
Então, se a população é grupada em M conglomerados disjuntos, cada
conglomerado pode ser dividido nas classes A e A. e
Definindo
 uma característica y tal que:
 1 se Uij ∈ A
Yij = i = 1, 2, · · · , M e j = 1, 2, · · · , Ni

0 se Uij ∈ A
Sejam Ai e Aei o número de unidades de π N em A e A, e respectivamente,

no conglomerado i.
Ai pode assumir os valores 0, 1, 2, · · · , Ni e se tem:
ei = Ni
Ai + A
Segue-se que:
P
Ni
Ai = Yi = Yij é o número de unidades em A, do conglomerado i;
j=1
Ai Yi
PA i = = = Y i é a proporção de unidades em A, do conglomerado
Ni Ni
i.
Assim, a proporção global de unidades em A na população π N é dada
por:
P
M P
M
Ai Yi
i=1 i=1 Y
PA = = = =Y
PM P
M N
Ni Ni
i=1 i=1
ou ainda,
P
M
Ai X
M
i=1 Ni
PA = = PA i
N i=1
N
Em vista dessas expressões, e considerando a teoria já apresentada para
obtenção dos parâmetros de π N , é imediata a obtenção de estimadores não
viciados para a proporção PA :
M X Ni0 0 1 X 0 0 1 X 0
m m m
pAc1 = PA i = Ni PA i = Ai
m i=1 N mN i=1 mN i=1
onde: 0
Ni
P
A0i = Yi0 = Yij0 é o número de unidades em A, do i-ésimo conglomerado
i=1
selecionado;
A0 Y0 0
PA0 i = i0 = i0 = Y i é a proporção de unidades em A, do i-ésimo
Ni Ni
conglomerado selecionado.
Além disto, a variância de pAc1 é dada por:

2
M − m Se 1 M − m Se2
V (pAc1 ) = = 2
M m N M m
onde:
M µ ¶2
1 X Yi 1 X 1 ¡
M
2 ¢2
Se = − PA = 2 Ni PA i − N PA
M − 1 i=1 N M − 1 i=1 N
1 X³ 2 2 ´
M
1 2 2
= Ni PA i − 2NNi PA i PA + N PA
M − 1 N 2 i=1
(M )
1 1 X XM XM
2 2
2 2
= 2 Ni PA i − 2NPA Ni PA i + N PA
N M − 1 i=1 i=1 i=1
(M )
1 1 X 2
= 2 Ni2 PA2 i − 2NPA NPA + MN PA2
N M − 1 i=1
(M )
1 1 X 2
= 2 Ni2 PA2 i − MN PA2
N M − 1 i=1
(M ) (M )
1 1 X N 2
1 1 X Y 2
= 2 Yi2 − M 2 PA2 = 2 Yi2 − M 2
N M − 1 i=1
M N M − 1 i=1
M
(M )
1 1 X 2 1 1 X¡
M
¢2 1
2
= 2 Y i − MY = 2 Yi − Y = 2 Se2
N M − 1 i=1 N M − 1 i=1 N
Esta variância pode ser estimada por:
M − m s2e 1 M − m s2e
v(pAc1 ) = = 2
M m N M m
com:
m µ ¶2
1 X Yi0
s2e = − pAc1
m − 1 i=1 N
e
Ã !2
1 Xm
1 Xm
s2e = Yi0 − Y0
m − 1 i=1 m i=1 i
mas:
1 X
m
¡ 0 ¢2
s2e = 2 Yi − N pAc1
N (m − 1) i=1
Ã !2
1 X
m
N Xm
= 2 Yi0 − Yi0
N (m − 1) i=1 mN i=1
Ã !2
1 Xm
1 X 0
m
0
= Yi − Y
2
N (m − 1) i=1 m i=1 i
 Ãm !2 
1 Xm
1 X 1
=  Yi02 − Yi0  = 2 s2e
2
N (m − 1) i=1 m i=1 N
conseqüentemente:
 Ã m !2 
1 M −m 1 1 Xm
1 X
v(pAc1 ) = 2  Yi02 − Yi0 
N M m (m − 1) i=1 m i=1
Exemplo 2.1
Com o objetivo de avaliar a proporção de fumantes, entre os alunos da 3a
série do 2o grau da rede de ensino publico de certa localidade, foram formados
conglomerados a partir de uma relação de 3500 turmas existentes, grupando-
se cada 5 turmas em aproximadamente 150 alunos, supondo uma base de 30
alunos por turma.
Uma amostra de 10 conglomerados foi selecionada, observando-se:
Conglomerados Número de Número de alunos

da amostra alunos (Ni0 ) fumantes (A0i )
1 162 50
2 170 63
3 145 47
4 151 48
5 166 68
6 162 59
7 145 36
8 148 45
9 171 71
10 178 75
Soma 1592 562
M = 700, N = 150 e m = 10
Uma estimativa da proporção de alunos fumantes é dada por:
1 X 0
m
1
pAc1 = Ai = 562 = 0, 375 ou 37, 5%
mN i=1 10 (150)
Uma estimativa da variância é dada por:

1 M − m s2e
v(pAc1 ) = 2
N M m
sendo:
 Ãm !2 
1  X m
1 X
s2e = A02
i − A0 
m − 1 i=1 m i=1 i
Ã !
1 (562)2
= 33074 − = 165, 51
9 10
então:
1 M − m s2e 1 700 − 10 165, 51
v(pAc1 ) = 2 =
N M m (150)2 700 10
= 0, 000725
Uma estimativa do erro padrão é dada por:

p p
v(pAc1 ) = 0, 000725 = 0, 0269 = 2, 69%
e uma estimativa do coeficiente de variação pode ser obtida através da ex-

pressão: p
v(pAc1 )
cv(pAc1 ) =
pAc1
√
0, 000725
cv(pAc1 ) = = 0, 0717 = 7, 17%
0, 375
2.3.3 Coeficiente de Correlação Intraclasse

O objetivo neste item é comparar a eficiência da amostragem por conglo-
merados com a da amostragem aleatória simples. Inicialmente, será estudado
o caso em que os conglomerados são de tamanhos iguais. Ocorre que para
comparar a precisão da amostragem de conglomerados em 1 estágio com a
amostrgem aleatória simples é muito útil a introdução do coeficiente de
correlação intraclasse.
Seja a população πN distribuída em M conglomerados de tamanho N =
N
cada um.
M
Imagine o seguinte experimento aleatório:
• Seleciona-se aleatoriamente 1 entre os M conglomerados.
• Seleciona-se aleatoriamente sem reposição 2 unidades dentro deste con-

glomerado.
Sejam Yij0 e Yik0 as variáveis aleatórias resultantes da observação nas 2

unidades selecionadas da característica y.
É possível calcular a correlação entre essas 2 variáveis aleatórias:
£¡ ¢ ¤
0 0
E Yij0 − E(Yij0 ) (Yik0 − E(Yik0 ))
ρ(Yij , Yik ) = r h
¡ 0 ¢2 i £ 0 ¤
E Yij − E(Yij ) E (Yik − E(Yik0 ))2
0
Agora, notando que:
XM
1 X 1
N
1 XX
M N
E(Yij0 ) = Yij = Yij = Y
i=1
M j=1 N M N i=1 j=1
E(Yik0 ) = Y
h¡ ¢2 i XM X
N
1 ³ ´2 MN − 1
0 0
E Yij − E(Yij ) = Yij − Y = S2
i=1 j=1
MN MN
1 XX³
M N ´2
S2 = Yij − Y
MN − 1 i=1 j=1
Donde também:
h i MN − 1
2
E (Yik0 − E(Yik0 )) = S2
MN
Finalmente:
³ ´³ ´
£¡ ¢ ¤ XM X N X N Y ij − Y Yik − Y
E Yij0 − E(Yij0 ) (Yik0 − E(Yik0 )) = ¡ ¢
i=1 j=1 k=1
MN N −1
j6=k
Logo, esta correlação será:
1 P
M P N P N ³ ´³ ´
¡ ¢ Yij − Y Yik − Y
M N N − 1 i=1 j=1 k=1
j6=k
ρ(Yij0 , Yik0 ) =
MN − 1 2
S
MN
Esta correlação expressa uma medida de homogeneidade dentro dos con-
glomerados da população, e será denominada coeficiente de correlação
intraclasse e é denotada por δ:
1 P
M P N P N ³ ´³ ´
M N N − 1 i=1 j=1 k=1
j6=k
δ = ρ(Yij0 , Yik0 ) =
MN − 1 2
S
MN
Agora será tratado o problema de obter uma expressão adequada para o

coeficiente de correlação intraclasse, que permita visualizar este coeficiente
como uma medida de homogeneidade dentro dos conglomerasdos.
Note-se que:
1 P
M P N P N ³ ´³ ´
M N N − 1 i=1 j=1 k=1
j6=k
δ=
MN − 1 2
S
MN
Então pode-se escrever:
X
M X N ³
N X ´³ ´
Yij − Y Yik − Y =
i=1 j=1 k=1
j6=k
X
M X N ³
N X ´³ ´
= Yij − Y i + Y i − Y Yik − Y i + Y i − Y
i=1 j=1 k=1
j6=k
X
M X N µ
N X ³ ´2 ¶
¡ ¢
= Yij − Y i (Y ik − Y i ) + Y i − Y
i=1 j=1 k=1
j6=k
X
M X
N X
N M ³
X ´2
¡ ¢
= Yij − Y i (Y ik − Y i ) + N(N − 1) Yi−Y
i=1 j=1 k=1 i=1
j6=k
 2
X
M XN X
M X
N M ³
X ´2
¡ ¢ ¡ ¢2
=  Yij − Y i  − Yij − Y i + N(N − 1) Yi−Y
i=1 j=1 i=1 j=1 i=1
Note que:
X
N
¡ ¢
Yij − Y i = 0
j=1
Lembrando que:
1 X¡
N
¢2
Si2 = Yij − Y i
N − 1 j=1
e fazendo:
1 X 2
M
Sd2 = S
M i=1 i
Segue-se que:
X
M X N ³
N X ´³ ´ X
M M ³
X ´2
¡ ¢ 2
Yij − Y Yik − Y = − N − 1 Si +N(N −1) Yi−Y
i=1 j=1 k=1 i=1 i=1
j6=k
Como também:
1 X³ ´2
M
2
Se = Yi−Y
M − 1 i=1
vem:
X
M X N ³
N X ´³ ´ ¡ ¢ 2
Yij − Y Yik − Y = − N − 1 M Sd2 +N(N −1) (M − 1) S e
i=1 j=1 k=1
j6=k
Assim pode-se escrever:

1 h 2 ¡ ¢ i
¡ ¢ N(N − 1) (M − 1) S e − N − 1 M Sd2
MN N −1
δ=
MN − 1 2
S
MN
2
(M − 1) S e 1 2
− Sd
δ= M N
MN − 1 2
S
MN
Se o número de conglomerados M for grande, vem:
2 1 2
Se − Sd
∼
δ= N
S2
Para compreender melhor o significado desta expressão, deve-se notar que:
X N ³
M X ´2
¡ ¢ 2
MN − 1 S = Yij − Y
i=1 j=1
X N ³
M X ´2
= Yij − Y i + Y i − Y
i=1 j=1
X N h
M X i
¡ ¢ 2
MN − 1 S = (Yij − Y i )2 + 2(Yij − Y i )(Y i − Y ) + (Y i − Y )2
i=1 j=1
X
M X
N X
M X
N X
M
2
= (Yij − Y i ) + 2 (Y i − Y ) (Yij − Y i ) + N (Y i − Y )2
i=1 j=1 i=1 j=1 i=1
X
M X
M
= (N − 1)Si2 + N (Y i − Y )2
i=1 i=1
2
= (N − 1) M Sd2 + N (M − 1) S e
ou seja:
2
2 (N − 1) M Sd2 + N (M − 1) S e
S = ¡ ¢
MN − 1
Assim estamos agora em posição para analisar melhor a influência na
variação de δ da maior homogeneidade dos conglomerados.
Supondo que os conglomerados fossem homogêneos devemos ter:
Sd2 = 0
portanto:
2 2
(M − 1) S e 1 2 (M − 1) S e
− Sd
δ= M N = M
2 = 1
MN − 1 2 N (M − 1) S e
S
MN MN
Logo, quando há homogeneidade máxima dentro dos conglomerados =⇒
δ = 1.
Por outro lado, se há heterogeneidade dentro dos conglomerados com
homogeneidade entre eles, o valor de δ deve diminuir. Se admitirmos que
2
S e = 0 vem:
¡ ¢
MN − 1 S 2 = (N − 1) M Sd2
donde:
1 2
− Sd 1
δ= N =−
2
(N − 1) M Sd (N − 1)
MN
Logo, conclui-se que:
· ¸
1
δ∈ − ;1
(N − 1)
Assim δ é uma medida de homogeneidade ou heterogeneidade dentro dos

conglomerados.
Exemplo 2.2
Seja uma população com exatamente 6 unidades.
U1 U2 U3 U4 U5 U6
↓ ↓ ↓ ↓ ↓ ↓
Y1 Y2 Y3 Y4 Y5 Y6
q q q q q q
3 5 3 7 2 8
Essas unidades serão grupadas em 2 conglomerados para o cálculo do co-

eficiente de correlação intraclasse. A conglomeração será feita de de 2 modos
diferentes a fim de medir a variação do coeficiente de correlação intraclasse
em função da maior ou menor homogeneidade dos conglomerados.
1a tentativa: conglomerados homogêneos
C1 C2
U1 → 3 U2 → 5
U3 → 3 U4 → 7
U5 → 2 U6 → 8
M =2 N = 3 Y 1 = 2, 66667 Y 2 = 6, 66667 Y = 4, 66667

1 2
Sd2 = (0, 3333 + 2, 3333) = 1, 3333 Se = 4+4=8
2
2
(M − 1) S e 1 2
− Sd 3, 5556
δ= M N = = 0, 7273
2
M(N − 1) Sd2 + N (M − 1) S e 4, 8889
MN
a
2 tentativa: conglomerados heterogêneos
C1 C2
U2 → 5 U1 → 3
U5 → 2 U3 → 3
U6 → 8 U4 → 7
M =2 N =3 Y 1 = 5, 0000 Y 2 = 4, 3333 Y = 4, 66667

1 2
Sd2 = (9 + 5, 3333) = 7, 16667 S e = 0, 1111 + 0, 1111 = 0, 2222
2
2
(M − 1) S e 1 2
− Sd 2, 2778
δ= M N =− = −0, 4659
2
M(N − 1) Sd2 + N (M − 1) S e 4, 8889
MN
1 1
Note-se que: − = − = −0, 50
N −1 2
Portanto, δ está bem próximo do valor mínimo que pode assumir, indi-
cando alto grau de heterogeneidade.
2.3.4 Estimação do coeficiente de correlação intraclasse

Um problema que falta solucionar é o da estimação do coeficiente de corre-
lação intraclasse através de uma amostra de conglomerados.
Para tanto, basta considerar a expressão de δ:
2
(M − 1) S e 1 2
− Sd
δ= M N
2
M(N − 1) Sd2 + N (M − 1) S e
MN
Agora, lembrando que:
1 X³ 0 ´2
m
s2e = Y i − y Ac1
m − 1 i=1
2
é um estimador não viciado para S e , e notando que:
1 X 02
m
s2d = S
m i=1 i
é um estimador não viciado para Sd2 , basta substituir estes estimadores na
expressão de δ para obter um estimador consistente para δ.
(M − 1) s2e 1 2
− sd
bδ= M N
M(N − 1) s2d + N (M − 1) s2e
MN
Além disso, notando-se que:
2
MN − 1 2 M(N − 1) Sd2 + N (M − 1) S e
S =
MN MN
Segue-se que um estimador não viciado para S 2 é dado por:
2 M(N − 1) s2d + N (M − 1) s2e

s =
MN − 1
e conseqüentemente, que b
δ pode ser escrito:
(M − 1) s2e 1 2
− sd
b
δ= M N
MN − 1 2
s
MN
ou ainda, para M muito grande:
1 2
s2e − sd
b
δ∼= N
s2
Exemplo 2.3 (Nascimento (1981), pág.32)
Tem-se um fichário de 20.000 segurados de uma Companhia de Seguros,
em um plano A. As 20.000 fichas estão dispostas em 400 gavetas, com 50
fichas cada.
Considerando as gavetas como conglomerados, tem-se:
M = 400 e N = 50
Selecionou-se uma amostra aleatória sem reposição de 10 gavetas, correspon-
dendo a 500 fichas. Nas gavetas selecionadas foram calculadas as reservas
técnicas de todas as fichas, obtendo-se:
Gavetas da Reserva Variância das

amostra total (Yi0 ) reservas (Si02 )
1 321 25
2 170 17
3 610 30
4 405 32
5 350 35
6 155 20
7 254 40
8 328 18
9 652 25
10 269 35
Soma 3.514 277
O objetivo é estimar a média por ficha da reserva técnica do plano A e o
coeficiente de correlação intraclasse.
Estimativa de Y
1 X 0
m
3.514
y Ac1 = Yi = = 7, 028
mN i=1 10 (50)
Estimativa de Sd2
1 X 0 2 277
m
s2d = S = = 27, 7
m i=1 i 10
2
Estimativa de S e
1 X 0
m
1 2
s2e = (Y − y Ac1 )
m − 1 N 2 i=1 i
 µ m ¶2 
P 0
 Xm Yi 
1 1  02 i=1 
= 2  Yi − 
m − 1 N  i=1 m 
" #
2
1 (3.514)
= 2 1.484.156 − = 11, 082
9 (50) 10
Estimativa de S 2
M(N − 1) s2d + N (M − 1) s2e
s2 =
MN −1
400(50 − 1) (27, 7) + 50 (399) (11, 082)
= = 38, 20
20.000 − 1
Estimativa do coeficiente de correlação intraclasse
1 2
s2e − sd 11, 0832 − 0, 554
b
δ∼= N = = 0, 276
s2 38, 20
2.3.5 Eficiência da Ac1 em relação à AAS com con-

glomerados de tamanhos iguais
Para comparar a precisão de um estimador, obtido através de um plano
amostral proveniente de uma amostra de conglomerados em 1 estágio (Ac1),
com a de outro estimador, obtido através de uma amostra aleatória simples
(AAS), vamos definir uma medida de eficiência baseada nas variâncias dos
estimadores de Y com os dois desenhos. Assim:
V (y AAS )
Ef =
V (y Ac1 )
onde:
y é o estimador de Y na AAS; e
y Ac1 é o estimador de Y na Ac1.
A eficiência Ef > 1 se V (y Ac1 ) < V (y AAS ).
Mas:
M − m 1 Se2
V (y Ac1 ) =
M N2 m
e:
N − n S2
V (y AAS ) = aqui N = MN
N n
onde:
1 X¡
M
¢2
Se2 = Yi − Y
M − 1 i=1
1 XX³ M N ´2
S2 = Yij − Y
M N − 1 i=1 j=1
sob a hipótese de conglomerados de tamanhos iguais.

Supondo que todos os conglomerados tenham o mesmo tamanho N, o
tamanho n da AAS equivalente à Ac1 com m conglomerados na amostra é
dado por : n = mN.
Assim, pode-se escrever:
MN − mN S 2 M − m S2
V (y AAS ) = =
MN mN M mN
logo, tem-se:
M − m S2
2
Ef = M mN = N S
M − m 1 Se2 Se2
M N2 m
Agora, notando que:

 2
X
M
¡ ¢2 X
M XN
Yi − Y =  Yij − N Y 
i=1 i=1 j=1
X N ³
M X ´2 X
M X N ³
N X ´³ ´
= Yij − Y + Yij − Y Yik − Y
i=1 j=1 i=1 j=1 k=1
j6=k
¡ ¢ ¡ ¢¡ ¢
= M N − 1 S 2 + N − 1 MN − 1 S 2 δ
como:
X
M
¡ ¢2
Yi − Y = (M − 1) Se2
i=1
vem:
MN −1 2 MN −1¡ ¢
Se2 = S + N − 1 S2 δ
M −1 M −1
MN −1 2 £ ¡ ¢ ¤
= S 1+ N −1 δ
M −1
Daí segue-se que:
N S2
Ef =
MN −1 2£ ¡ ¢ ¤
S 1+ N −1 δ
M −1
= M e MN − 1 ∼
supondo: M − 1 ∼ = MN vem:
1
Ef ∼
= ¡ ¢
1+ N −1 δ
¡ ¢ ¡ ¢
Ef > 1 ⇐⇒ 1 + N − 1 δ < 1 ⇐⇒ N − 1 δ < 0 ⇐⇒ δ < 0
£ ¡ ¢ ¤
O termo 1 + N − 1 δ mostra quanto a variância é afetada pelo uso
de conglomerado ao invés de um elemento como unidade amostral. Kish
(1965) define este fator como o efeito de desenho de uma amostra de
conglomerados de tamanho N ou efeito de conglomeração. Este fator
mede a influência da conglomeração na precisão do estimador.
Portanto:
Se δ > 0 ⇒ Ef < 1 então V (y Ac1 ) > V (y AAS ), a amostra de conglomerados

é menos eficiente que a AAS.
Se δ = 0 ⇒ Ef = 1 então V (y Ac1 ) = V (y AAS ), a amostra de conglomerados

é equivalente a AAS.
Se δ < 0 ⇒ Ef > 1 então V (y Ac1 ) < V (y AAS ), a amostra de conglomerados

é mais eficiente que a AAS.
· ¸
1
Como δ ∈ − ; 1 , isto indica que os valores negativos de δ são
(N − 1) µ ¶
1
raros, uma vez que limN −→+∞ − = 0, isto é, à medida que o
(N − 1)
tamanho N cresce, diminui a eficiência da Ac1 em relação à AAS.
Lembrando que:
V (y AAS ) ∼ 1
Ef = = ¡ ¢
V (y Ac1 ) 1+ N −1 δ
vem: · ¸
1
Ef ∈ ; +∞
N
e £ ¡ ¢ ¤
V (y Ac1 ) ∼
= V (y AAS ) 1 + N − 1 δ
isto é, a variância do estimador da £ média
¡ na¢Ac1
¤ é a variância do estimador
da média na AAS vezes o fator 1 + N − 1 δ .
Para o caso de conglomerados de mesmo tamanho, se estivermos inte-
ressados na mesma precisão, qual deverá ser o tamanho da amostra de con-
glomerados?
V (y Ac1 ) equivale a V (y AAS ) quando:
V (y Ac1 )
£ ¡ ¢ ¤∼
= V (y AAS )
1+ N −1 δ
ou seja, quando:
1 Se2 S2
2
£ ¡ ¢ ¤ =
N m 1+ N −1 δ mN
2
S S2
£ ¡ e ¢ ¤ =
m 1+ N −1 δ mN
o que implica que o número de conglomerados na amostra equivale a

£ ¡ ¢ ¤
m 1+ N −1 δ
£ ¡ ¢ ¤
e, portanto, haverá um acréscimo de m N − 1 δ conglomerados na amostra.
Conseqüentemente, o número de unidades populacionais na amostra equivale
a: £ ¡ ¢ ¤ ¡ ¢
m 1 + N − 1 δ N = mN + mN N − 1 δ
£ ¡ ¢ ¤
ou seja, haverá um acréscimo de mN N − 1 δ unidades em relação a
AAS sem reposição.
Exemplo 2.4 (Nascimento (1981), pág. 34)
Considere as informações do exemplo 2.3 e calcule o número de conglom-
erados necessários na amostra, para dar a mesma precisão de uma amostra
aleatória simples ao estimar a média por ficha da reserva técnica do plano A.
Nesste caso, o efeito de conglomeração é:
¡ ¢
1 + N − 1 δ = 1 + 49 (0, 276) = 14, 524
O tamanho da amostra de conglomerados para dar a mesma precisão de
uma amostra aleatória simples é:
£ ¡ ¢ ¤
m 1 + N − 1 δ = 10 (14, 524) ∼= 145 conglomerados
O elevado efeito de conglomeração, mostra que o desenho amostral de
conglomerados em 1 estágio que considera a gaveta com 50 fichas como con-
glomerado é pouco eficiente.
Ilustrações
A seguir, são apresentadas algumas ilustrações para mostrar que δ mede
homogeneidade e como afeta a variância por unidades amostrais elementares
ou por conglomerados.
a) Suponha que se deseja analisar a composição da população em relação
a renda e que o conglomerado seja o setor censitário. Suponha que a
maioria das pessoas em certos setores têm uma renda alta e a maioria
das pessoas em outros setores têm renda baixa. Neste caso a variância
entre as médias dos setores será relativamente grande e a correlação en-
tre as pessoas dentro do setor será alta e positiva. Assim uma amostra
aleatória simples de setores consistindo de todas pessoas dos setores
dará pouca informação com relação à composição da renda da popu-
lação.
b) Agora, um caso extremo onde a composição da renda é exatamente
a mesma em cada setor. Neste caso, a variância entre as médias dos
setores será zero e a correlação entre as pessoas de mesmo setor será
negativa. Neste caso, uma amostra aleatoria simples de setores con-
sistindo de todas as pessoas no setor daria uma completa informação
com relação à composição da renda da população.
c) Finalmente, suponha que a composição da renda difira de setor para

setor e que a variância entre as médias dos setores seja aproximada-
mente a variância entre as médias amostrais baseada numa amostra
aleatória simples. A correlação entre as pessoas de um mesmo setor
será nula. Uma amostra aleatória de setores consistindo de todas as
pessoas no setor daria informações com respeito à composição da renda
da população da mesma forma que uma amostra aleatória simples de
mesmo tamanho selecionada sem considerar o conglomerado setor.
Em geral, os conglomerados são definidos por populações geográficas con-
tiguas.
O coeficiente de correlação em geral é positivo e diminui com o aumento
do tamanho do conglomerado, pois se as unidades incluídas na amostra são
poucas e imediatamente contiguas, haverá uma correlação mais alta entre as
unidades dentro de um conglomerado do que quando os conglomerados são
maiores e há portanto, um maior espalhamento entre as unidades dentro do
conglomerado.
2.4 Controle na variação de tamanho

M 2 (M − m) Se2 N S2
Observe que a V (YbAc1 ) = aumenta e a Ef = diminui
M m Se2
quando Se2 aumenta. Mas de acordo com a expressão:
1 X¡
M
¢2
Se2 = Yi − Y
M − 1 i=1
o aumento de Se2 é tanto maior quanto mais diferentes forem os totais dos
conglomerados. Em geral, os totais de uma característica y tendem a crescer
quando os tamanhos dos conglomerados crescem. Então, é usual controlar a
variação de tamanho dos conglomerados na expectativa de redução da variân-
cia e de aumento da eficiência com o uso da amostragem de conglomerados.
Os processos usuais de controle do tamanho dos conglomerados são:
a) selecionar os conglomerados com probabilidades proporcionais ao tamanho
dos conglomerados;
b) estratificar os conglomerados, de modo que a característica de estrati-
ficação seja o tamanho; e
c) usar um estimador de razão, com característica auxiliar definida pelo
tamanho do conglomerado.
2.5. PROBABILIDADES DESIGUAIS DE SELEÇÃO 83
2.5 Probabilidades desiguais de seleção

Como vimos anteriormente, a ocorrência de variabilidade nos tamanhos dos
conglomerados causa acentuada perda de precisão nos estimadores até agora
abordados com amostragem de conglomerados em 1 estágio.
Na prática, a formação de conglomerados com tamanhos iguais para con-
trolar a variação de tamanho na variância do estimador, e também na vari-
ação do tamanho final da amostra nem sempre é possível, sendo que a ocor-
rência de conglomerados de tamanhos iguais é pouco comum.
Assim, ao invés de tentar controlar artificialmente os tamanhos dos con-
glomerados, procura-se uma saída diferente: mantendo os conglomerados
com os tamanhos desiguais, estuda-se uma forma de seleção da amostra de
conglomerados com probabilidades desiguais (Probabilidades Proporcionais
a uma medida de Tamanho - PPT).
Com o objetivo de manter a simplicidade da exposição será tratada primei-
ramente a seleção da amostra de conglomerados com probabilidades desiguais
e com reposição.
2.5.1 Seleção dos conglomerados com probabilidades

desiguais e com reposição
As unidades de π N são grupadas em M conglomerados, que podem ter taman-
hos desiguais.
Ci
Ui1 → Yi1
Ui2 → Yi2
.. ..
. .
UiNi → YiNi
i = 1, 2, · · · , M.
P
M
Seja Pi a probabilidade de seleção do conglomerado i com Pi = 1.
i=1
Seleciona-se uma amostra com reposição de m conglomerados de acordo
com as probabilidades Pi .
0
Ci
0 0
Ui1 → Yi1
0 0
Ui2 → Yi2
.. ..
. .
0 0
UiN 0 → YiN 0
i i
i = 1, 2, · · · , m.
A partir dos conglomerados selecionados pode-se calcular as seguintes
estatísticas:
0
Ni
X
Yi0 = Yij0
j=1
Média da característica y no conglomerado Ci0 :
0 Yi0
Yi =
Ni0
Variância da característica y em Ci0 :
N0
02 1 X i
0
Si = 0 (Yij0 − Y i )2
Ni − 1 j=1
Agora, para obter um estimador não viciado do total Y da população

basta tomar:
1 X Yi0
m
b P
YAc1 =
m i=1 Pi0
onde: Pi0 é a probabilidade de seleção associada ao i-ésimo conglomerado

selecionado. Pi0 é igual a algum dos Pk (k = 1, 2, · · · , M).
Para mostrar que YbAc1
P
é não viciado, basta mostrar que:
Ã ! µ 0¶
³ ´ 1 X Yi0
m
1 X
m
Yi
E YbAc1
P
= E 0
= E
m i=1 Pi m i=1 Pi0
"M #
1 Xm X Yk XM
= Pk = Yk = Y
m i=1 k=1 Pk k=1
Assim, um estimador não viciado da média Y é dado por:
1 X Yi0
m
P
y Ac1 =
m N i=1 Pi0
Variância do estimador de total

³ ´ µ³ ´2 ¶
V YbAc1 = E
P
YbAc1
P
−Y2
Ã !2 
1 X m 0
Yi 
= E 0
−Y2
m i=1 Pi
 
Xm µ 0 ¶2 Xm X m
1   Yi Yi0 Yk0 
−Y2
= E +
m2  i=1 Pi0 P 0
i=1 k=1 i k
P 0
i6=k
X
m µ ¶
0 2 XX
m m µ ¶
1 Yi 1 Yi0 Yk0
= E + 2 E −Y2
m2 i=1
Pi0 m i=1 k=1
Pi0 Pk0
i6=k
M µ ¶2 µ 0¶ µ 0¶
1 X Yi 1 Yi Yk
= 2
m Pi + 2 m(m − 1)E 0
E 0
−Y2
m i=1
Pi m Pi Pk
1 X Yi2 (m − 1) 2
M
= + Y −Y2
m i=1 Pi m
1 X Yi2 Y 2
M
= −
m i=1 Pi m
ÃM !
1 X Yi2
= −Y2
m i=1 Pi
Porém, notando que:
X
M
Y2 X
M
Y2
i 2 i
−Y = Pi − 2Y 2 + Y 2
i=1
Pi i=1
Pi2
ÃM !
XM
Yi2 X Yi XM
2
= P −2
2 i
Pi Y + Y Pi
i=1
Pi i=1
Pi i=1
XM µ 2 ¶
Yi Yi
= 2
− 2 + Y 2 Pi
i=1
Pi Pi
XM µ ¶2
Yi 2
= − Y Pi = SeP
i=1
P i
Segue-se que:
³ ´ S2
V YbAc1
P
= eP
m
³ ´
e um estimador não viciado de V YbAc1
P
é obtido por:
³ ´ s2
v YbAc1
P
= eP
m
onde:
m µ 0 ¶2
1 X Yi b
s2eP
= P
0 − YAc1
m − 1 i=1 Pi
³ ´ ³ ´
Para mostrar que v YbAc1
P
é não viciado para V YbAc1
P
, escreve-se:
³ ´ Xm µ 0 ¶2
1 Yi
v YbAc1
P
= b P
0 − YAc1
m (m − 1) i=1 Pi
" m µ 0 ¶2 #
1 X Y ³ ´2
= i
0 − m YbAc1
P
m (m − 1) i=1 Pi
Daí, segue-se que:

Ã m µ 0 ¶2 !
h ³ í 1 X Yi
E v YbAc1
P
= E bP
0 − YAc1
m (m − 1) i=1 Pi
Ãm !
1 X µ Y 0 ¶2 ³ ´2
= E i
0 − mE YbAc1 P
m (m − 1) i=1 Pi
Ã M µ ¶ µ ³ !
1 X Yi 2 ´ ³ ³ ´´2 ¶
= m Pi − m V YbAc1 P
+ E YbAc1
P
m (m − 1) i=1
P i
ÃM µ ¶ !
1 X Yi
2 ³ ´
= Pi − V YbAc1
P
−Y2
(m − 1) i=1 Pi
ÃÃ M ! !
1 XY2 ³ ´
= i
− Y 2 − V YbAc1 P
(m − 1) i=1
P i
1 ³ ³ ´ ³ ´´
= mV YbAc1
P
− V YbAc1P
(m − 1)
³ ´
= b
V YAc1P
Probabilidades proporcionais a uma medida de tamanho

Até agora tratamos de um desenho onde a seleção dos conglomerados é feita
com probabilidades desiguais, sem preocupação a respeito do cálculo dessas
probabilidades.
Agora vamos atentar para esse problema e procurar um conjunto de prob-
abilidades que traga uma estimação eficiente. Para tanto consideremos:
³ ´ XM µ ¶2
1 Y
V YbAc1 =
P i
−Y Pi
m i=1 Pi
Nesta expressão, se tomarmos:
Yi
Pi =
Y
segue-se que:  2
³ ´ 1 X  Yi
M

V YbAc1
P
=  Y − Y  Pi = 0
m i=1 i
Y
Logo, se as probabilidades Pi fossem exatamente proporcionais aos totais
Yi dos conglomerados, o estimador YbAc1P
teria variância zero.
Acontece que os totais Yi são desconhecidos e não podem ser utilizados
para determinação das probabilidades de seleção.
Assim é que será necessário definir as Pi a partir de outra forma, porém
tentando fazer com que elas tenham valores aproximadamente iguais àqueles
sugeridos pela definição anterior. Isto é, as Pi devem ser aproximadamente
proporcionais aos totais dos conglomerados.
Fundamentalmente, existem 3 maneiras para fazer isto:
1. Fazer as probabilidades Pi proporcionais aos tamanhos Ni dos conglom-
Ni
erados. Pi = (i = 1, 2, · · · , M). Esta solução é boa quase sempre,
N
entretanto não é sempre viável pois em certas situações os tamanhos
Ni também não são conhecidos para todos os conglomerados.
2. Fazer as probabilidades Pi proporcionais a uma medida de tamanho
dos conglomerados, x, conhecida para todos os conglomerados e cor-
relacionada com a característica y de interesse:
Xi
Pi = (i = 1, 2, · · · , M)
X
P
M
onde: X = Xi .
i=1
Exemplo: se o conglomerado é uma partição geográfica, usar a área total

x do conglomerado como medida de tamanho.
3. Fazer as probabilidades Pi exatamente proporcionais aos valores da

mesma característica y observadas num censo anterior.
O estatístico examina a situação e recomenda o uso de probabilidades pro-

y
porcionais a x sempre que os valores puderem ser admitidos aproximada-
x
mente constantes, pois neste caso a variância de YbAc1
P
deverá ser pequena.
Deve ser enfatizado que o sucesso da adoção da alternativa da amostragem
com probabilidades proporcionais ao tamanho depende fortemente do acerto
na escolha da medida de tamanho. Se esta for ruim, no sentido de que
não há proporcionalidade entre y e x, este desenho não deve ser melhor que
amostragem com equiprobabilidades. Pode ser demonstrado que em certas
condições, este desenho pode ser pior que amostragem com equiprobabili-
dades.
Algoritmo para seleção da amostra com probabilidade proporcional

ao tamanho (método dos totais cumulativos - seleção aleatória)
1. Calcular os totais parciais acumulados Tk dados por:
X
K
Tk = Xi ∀ K ∈ {1, 2, · · · , M}
i=1
X
M
T0 = 0 e X = Xi
i=1
2. Selecionar um número aleatoriamente no intervalo [1, X]. Seja u o

número selecionado.
3. Verificar em que intervalo (Tk , Tk+1 ] , K ∈ {1, 2, · · · , M} , o número

selecionado caiu. Caso u ∈ (Tk , Tk+1 ] então incluir na amostra o con-
glomerado k + 1. Caso a amostra não tenha sido completada, repetir
o processo a partir da etapa 2. Caso contrário, a amostra está sele-
cionada.
Note-se que o procedimento é com reposição, donde se pode obter uma

amostra contendo várias repetições de uma mesma unidade da população.
Exemplo 2.5
Suponha-se que os conglomerados são quarteirões e que desejamos amostrar

os domicílios. Numa população de 10 quarteirões, selecionar uma amostra
de 5 quarteirões com probabilidade proporcional ao número de domicílios no
quarteirão.
Seleção dos quarteirões da amostra

o
n do medidas medida designação
quarteirão de tamanho acumulada da amostra
1 50 50 x
2 12 62
3 20 82 x
4 31 113
5 10 123
6 60 183
7 55 238 xx
8 13 251
9 30 281
10 20 301 x
Selecionar aleatoriamente um número entre 1 e 301. (Cochran pág. 19,

linha 1 e coluna 17). O número selecionado é 226, então o primeiro con-
glomerado a ser selecionado é o número 7. Os números aleatórios seguintes
menores ou iguais a 301 são: 15, 218, 79 e 294. Logo, os conglomerados 1, 3,
7 e 10 estão também designados para a amostra.
Observe que o conglomerado 7 foi selecionado duas vezes.
Se M é grande, a probabilidade de um conglomerado ser selecionado mais
de uma vez é muito pequena e, como aproximação, pode-se usar a seleção
sistemática.
Algoritmo para seleção da amostra com probabilidade proporcional

ao tamanho (método dos totais cumulativos - seleção sistemática)
Se a seleção é proporcional a uma medida de tamanho, a probabilidade de

inclusão do conglomerado i na amostra é:
Xi Xi
m =
X X
m
X
1. Divide-se X em partes sendo o intervalo da amostra para fins de
m
seleção sistemática.
· ¸
X
2. Seleciona-se aleatoriamente um ponto de partida no intervalo 1, ;
m
ponto esse que vai determinar o 1o conglomerado da amostra.
3. Somando-se ao ponto de partida o intervalo vai determinar o 2o con-
glomerado da amostra; e assim por diante até selecionar os m conglom-
erados.
X
No exemplo anterior = 60, 2. Se o número aleatório é 22,5, os con-
m
glomerados selecionados são aqueles cujos totais cumulativos são: 22,5; 60,2
+ 22,5 = 82,7; 82,7 + 60,2 = 142,9; 142,9 + 60,2 = 213,1; 213,1 +60,2 =
273,3, que correspondem respectivamente, aos conglomerados 1, 4, 6, 7 e 9.
Seleção dos conglomerados com probabilidades desiguais e sem

reposição
Suponha agora que a amostra de m conglomerados tenha sido selecionada me-
diante algum procedimento aleatório sem reposição, tal que a probabilidade
de que o conglomerado i, Ci , pertença a amostra seja π i , e a probabilidade de
que o par de conglomerados (Ci , Cj ) pertença a amostra em qualquer ordem
seja π ij , ∀ i = 1, 2, · · · , m e j = 1, 2, · · · , m, com i 6= j.
Horvitz e Thompson (1952) desenvolveram uma teoria geral de amostragem
com probabilidades desiguais de seleção e sem reposição, baseada no uso
de um estimador não viciado de total populacional, dado pela seguinte ex-
pressão:
X m
Yi0
b
YHT =
i=1
π0i
com π 0i igual a algum dos π k , π k > o, ∀ k = 1, 2, · · · , M.
m
Caso particular de equiprobabilidade: π i = ∀ i = 1, 2, · · · , M.
M
A variância de YbHT é dada pela seguinte expressão:
³ ´ X M
(1 − π i ) 2 X X (πij − π i π j )
M M
b
V YHT = Yi + Yi Yj
i=1
πi i=1 j=1
πiπj
i6=j
Prova: Seja ti a indicadora se o conglomerado i ∈ a amostra:


 1 se Ci ∈ a amostra
ti = i ∈ {1, 2, · · · , M}

0 se Ci não ∈ a amostra
Então, ti tem distribuição binomial para uma amostra de tamanho m,

com probabilidade π i .
Assim,
E (ti ) = π i
V (ti ) = π i (1 − π i )
COV (ti , tj ) = E (ti tj ) − E (ti ) E (tj ) = π ij − π i πj
Logo:
X
m
Y0 X
M
Yi
YbHT = i
0
= ti
i=1
π i i=1
πi
³ ´ X M
Yi XM
Yi XM
b
E YHT = E (ti ) = πi = Yi = Y
π
i=1 i
π
i=1 i i=1
ÃM !
³ ´ X Yi XM
Yi2 XM X M
Yi Yj
b
V YHT = V ti = V (ti ) + COV (ti , tj )
2
π
i=1 i i=1
πi ππ
i=1 j=1 i j
i6=j
X
M
Y2 X
M X
M
Yi Yj
i
= 2
π i (1 − π i ) + (π ij − π i π j )
i=1
π i i=1 j=1
πiπj
i6=j
X
M
Y2 X
M X
M
Yi Yj
i
= (1 − π i ) + (πij − π i π j )
i=1
πi i=1 j=1
πi πj
i6=j
³ ´
Um estimador não viciado da V YbHT é dado por:
³ ´ X m Xm X m ¡ 0 ¢
(1 − π 0
) π ij − π 0i π 0j 0 0
v YbHT = i 02
Yi + Yi Yj
i=1
π 0i i=1 j=1
π 0i π 0j
i6=j
com π0ij igual a algum dos π kl , π kl > o, ∀ k = 1, 2, · · · , M; l = 1, 2, · · · , M e

l 6= k.
Grande parte dos procedimentos de seleção com probabilidades desiguais

e sem reposição que aparecem na literatura de amostragem apresentam ex-
pressões complexas ou aproximadas para os estimadores da variância, con-
siderando o tamanho da amostra de conglomerados fixo. Este fato é jus-
tificado pelas dificuldades matemáticas encontradas na avaliação dos πij -
probabilidade de inclusão conjunta da i-ésima e j-ésima unidades na amostra.
Hanif e Brewer (1980) apresentam uma lista de vários procedimentos
de seleção com probabilidades desiguais sem reposição. Estes procedimen-
tos podem ser classificados por diferentes modos, tais como: classificação na
maneira da seleção, classificação por classe de equivalência (os procedimentos
pertencem a mesma classe de equivalência quando as probabilidades de se-
leção conjunta de todas as combinações possíveis são idênticas), classificação
por tipo de estimador apropriado.
Dentre os procedimentos apresentados destaca-se o método dos Grupos
Aleatórios de Rao Hartley e Cochran (1962). Uma descrição e compara-
ções deste método com métodos de seleção com probabilidades desiguais sem
reposição pode ser vista em Lima (1985).
Método dos Grupos Aleatórios de Rao Hartley e Cochran

Propriedades:
1. Permite a computação de um estimador para o total populacional que
tem variância sempre inferior ao estimador padrão da amostragem com
probabilidades desiguais com reposição.
2. Não acarreta computação árdua para seleção ou para computaçãodo

estimador da variância e da respectiva estimativa.
3. Fornece fórmula exata da variância para qualquer tamanho de
população e de amostra fixa.
4. Encontra-se disponível um estimador não viciado e sempre não
negativo para a variância amostral do estimador do total, quais-
quer que sejam os tamanhos de amostra e da população.
Algoritmo
1. Divide-se a população composta de M conglomerados, aleatoriamente,
em m grupos de tamanhos M1 , M2 , · · · , Mm ;
X
m
M= Mi
i=1
onde m é o tamanho da amostra.

2.6. ESTRATIFICAÇÃO DE CONGLOMERADOS 93
2. Selecionar um conglomerado de cada um dos m grupos, independente-

mente, com probabilidade proporcional à probabilidade de seleção Pt
da t-ésima unidade. Se a t-ésima unidade cair no grupo i, então a
Pt P
probabilidade real da seleção desta unidade é ,onde: πi = Pi .
πi grupo i
Se estiver sendo usada probabilidade proporcional ao tamanho Xi , então:

Xt
Pt = .
X
Neste caso, o estimador do total populacional é dado por:
X
m
πi
YbRHC = Yi0
i=1
Pi
onde: Yi0é o valor da característica y no i-ésimo grupo.
A variância de YbRHC é dada por:
µm ¶
P 2
³ ´ Mi − M ÃX M 2
!
Y
V YbRHC = i=1 i
−Y2
M (M − 1) i=1
P i
³ ´
e um estimador de v YbRHC é dado por:
µm ¶
P
³ ´ Mi2 −M X
m µ 0 ¶2
Yi
v YbRHC = i=1
πi − YbRHC
M (M − 1) i=1
Pi0
2.6 Estratificação de conglomerados

Uma outra forma de controlar a variação dos tamanhos dos conglomerados
é estratificá-los segundo alguma característica que meça seu tamanho, isto
é grupar os conglomerados em estratos homogêneos segundo alguma medida
de tamanho.
Esta alternativa é praticamente equivalente à seleção dos conglomerados
com proporcionais ao tamanho, pois é indispensável conhecer, para todos os
M conglomerados da população, o valor de uma medida de tamanho que
permita separar os conglomerados em estratos homogêneos, para poder então
selecionar a amostra.
Em termos de eficiência em relação à seleção dos conglomerados com
probabilidades proporcionais ao tamanho, não parece haver vantagem nítida
de qualquer das duas alternativas, sendo bastante semelhante os resultados

obtidos com ambas as técnicas em termos da precisão final das alternativas.
2.6.1 Estimadores e respectivas precisões

Inicialmente, suponhamos que os M conglomerados são grupados em L es-
tratos E1 , E2 , · · · , EL , tendo-se associado a cada conglomerado o total da
característica y:
E1 EL
C11 → Y11 CL1 → YL1
C12 → Y12 ··· CL2 → YL2
.. .. .. ..
. . . .
C1M1 → Y1M1 CLML → YLML
Denotando por Eh um estrato genérico (h = 1, 2, · · · , L), segue-se que:
Mh o número de conglomerados no estrato h;
Ph
M
Yh = Yhi o total da característica y no estratro h;
i=1
Yh
Yh = o total médio por conglomerado do estrato h;
Mh
2 1 Ph
M
She = (Yhi −Y h )2 a variância entre os totais dos conglomerados
Mh − 1 i=1
dentro do estrato h.
Agora, selecionando-se em cada um dos L estratos amostras aleatórias
simples de conglomerados, sem reposição de tamanhos m1 , m2 , · · · , mL e
investigando-se todas as unidades pertencentes aos conglomerados da amostra
tem-se:
E1 EL
0 0 0 0
C11 → Y11 CL1 → YL1
0 0 0 0
C12 → Y12 ··· CL2 → YL2
.. .. .. ..
. . . .
0 0 0 0
C1m1 → Y1m1 CLmL → YLm
L
Como as amostras nos estratos são amostras de conglomerados em 1 es-

tágio, pode-se estimar os totais dos estratos por:
mh
Mh X
Ybh.Ac1 = Y 0 ∀h = 1, 2, · · · , L
mh i=1 hi
2.6. ESTRATIFICAÇÃO DE CONGLOMERADOS 95
e tem-se que:
Mh2 (Mh − mh ) She

2
V (Ybh.Ac1 ) = ∀h = 1, 2, · · · , L
Mh mh
e a estimação não viciada de V (Ybh.Ac1 ) pode ser feita por:
Mh2 (Mh − mh ) s2he

v(Ybh.Ac1 ) = ∀h = 1, 2, · · · , L
Mh mh
onde: m
1 X h
2
s2he = (Y 0 − y h.Ac1 )
mh − 1 i=1 hi
sendo: mh
1 X Ybh.Ac1
y h.Ac1 = Yhi0 =
mh i=1 Mh
Assim pode-se estimar o total Y da população por:
X X mh
Mh X
L L
YbAc1
est
= Ybh.Ac1 = Yhi0
h=1 h=1
mh i=1
com:
³ ´ X
L ³ ´ XL
b est
E YAc1 = b
E Yh.Ac1 = Yh = Y
h=1 h=1
Além disto,
X
L XL
Mh2 (Mh − mh ) She
2
V (YbAc1
est
)= V (Ybh.Ac1 ) =
h=1 h=1
Mh mh
e esta variância pode ser estimada por:
X
L XL
Mh2 (Mh − mh ) s2he
v(YbAc1
est
)= v(Ybh.Ac1 ) =
h=1 h=1
Mh mh
mh
Se a fração de amostragem (∀h = 1, 2, · · · , L) for constante e igual
Mh
a f nos estratos (equivalendo a uma alocação proporcional nos estratos),
obtém-se:
mh
= f (∀h = 1, 2, · · · , L)
Mh
L mh
b est 1 XX
YAc1 = Yhi0
f h=1 i=1
1−f X
L
b est
V (YAc1 ) = 2
Mh She
f h=1
1−f X
L
v(YbAc1
est
)= Mh s2he
f h=1
Exemplo 2.5 (Nascimento (1981), pág 63)
Em certa localidade, existem 1.200 setores censitários que vão ser con-
siderados como conglomerados de domicílios. Foram formados 6 estratos,
de acordo com a população do último Censo, cujos números de setores por
estrato constam da tabela abaixo.
A população total da localidade, de acordo com o Censo, foi de 1.960.800
habitantes, o que corresponde a uma média de 1.634 habitantes por setor ou
380 domicílios por setor ( na base de 4,3 pessoas por domicílio, com base em
pesquisa anterior).
Considerando as disponibilidades de tempo e custo, foi fixada uma amostra
de 24 setores ou, aproximadamente, 9.120 domicílios, o que corresponde à
24 1
fração de amostragem de 1200 = 50 .
A tabela abaixo apresenta o número de setores na população e na amostra
e o número de habitantes nos setores da amostra.
Estimar a população atual da localidade e o respectivo coeficiente de
variação associado à essa estimativa.
Setores na Setores na Habitantes nos

Estratos população amostra setores da amostra
(Mh ) (mh ) (Yhi0 )
1 90 2 3.450; 3.120
2 100 2 2.890; 3060
3 140 3 2.320; 2.850; 2.010
4 250 5 1.910; 1.990; 1.300; 1.400; 1.520
5 295 6 1.040; 1.090; 1.200; 990; 1.460; 1.310
6 325 6 980; 1.010; 870; 1.100; 900; 930
Estimativa do número de habitantes da localidade:

L mh
M XX
YbAc1
est
= Y 0 = 50 (40.730) = 2.036.500 habitantes
m h=1 i=1 hi
2.7. ESTIMADOR DE RAZÃO 97
Em cada estrato calcula-se a média da amostra por setor, no estrato h:

mh
1 X
y h.Ac1 = Yhi0
mh i=1
e a variância da amostra entre os setores de cada estrato h:
X h m
1 2
s2he = (Yhi0 − y h.Ac1 )
mh − 1 i=1
obtendo-se os seguintes resultados:
Média da amostra Variância entre

Estratos por setor os setores
(y h.Ac1 ) (s2he )
1 3.285 54.450
2 3.020 3.200
3 2.393 360.867
4 1.624 381.720
5 1.172 129.084
6 965 34.950
Estimativa da variância da estimativa do número de habitantes da loca-
lidade:
1−f X
L
v(YbAc1
est
)= Mh s2he = 49 (64.226.395) = 3.147.093.351
f h=1
o respectivo erro padrão é estimado por:
q
v(YbAc1
est
) = 56.098, 96
e o respectivo coeficiente de variação estimado por:
q
v(YbAc1
est
) 56.098, 96
cv(YbAc1
est
)= = = 0, 0276
Yb est
Ac1
2.036.500
2.7 Estimador de razão

Há situações práticas em que o controle da variação nos tamanhos dos con-
glomerados não pode ser feito mudando as probabilidades de seleção ou es-
tratificando os conglomerados, em virtude de não se dispor de nenhuma me-
dida de tamanho com valores conhecidos para todos os conglomerados.
Nestas situações, a alternativa que resta é a estimação por um outro pro-

cesso. Neste caso, o processo mais comumente empregado é o da estimação
por razão.
Para que esse processo possa ser empregado, basta que sejam conhecidos
os valores Ni0 e Yi0 , respectivamente, tamanho e total da característica y dos
conglomerados da amostra.
2.7.1 Estimador de razão baseado no tamanho dos con-

glomerados
Sabe-se que:
P
M
Yi
Y
Y = = i=1
N P
M
Ni
i=1
Assim, lembrando que um estimador não viciado de Y é dado por:
MX 0
m
b
YAc1 = Y
m i=1 i
e também, notando que um estimador não viciado do tamanho total N é

dado por:
MX 0
m
b
NAc1 = N
m i=1 i
Segue-se que um estimador consistente de Y é dado por:
M Pm Pm
Yi0 Yi0
R YbAc1 m i=1 i=1
y Ac1 = = = P
NbAc1 M Pm m
Ni0 Ni0
m i=1 i=1
Aqui pode-se notar que este estimador depende só dos tamanhos Ni0 e
dos totais Yi0 dos conglomerados da amostra, não dependendo do tamanho
total da população (N) como o estimador não viciado y Ac1 que vimos ante-
riormente.
R
Variância de y Ac1
Se considerarmos uma amostra aleatória simples de m unidades de uma

população de tamanho M, a variância do estimador de razão é dada por:
2
b ∼ M − m SeR
V (R) = 2
MX m
onde:
b
b= Y
R e R=
Y
b
X X
1 X
M
2
SeR = (Yi − R Xi )2
M − 1 i=1
Supondo que m é suficientemente grande para tornar desprezível o vício
do estimador de razão, e substituindo X por N segue-se que:
2
R M − m SeR
V (y Ac1 ) ∼
= 2
MN m
com:
1 X
M
2 Y
SeR = (Yi − Ni )2
M − 1 i=1 N
1 X
M
= (Yi − Y Ni )2
M − 1 i=1
1 X 2
M
= Ni (Y i − Y )2
M − 1 i=1
Além disso, um estimador consistente desta variância é dado por:
R M − m s2eR
v(y Ac1 ) = 2
MN m
com:
1 X 0
m
R 0
s2eR = (Yi − y Ac1 Ni )2
m − 1 i=1
1 X 02 0
m
R
= N (Y i − y Ac1 )2
m − 1 i=1 i
100CAPÍTULO 2. AMOSTRAGEM DE CONGLOMERADOS
Se N não for conhecido, pode ser estimado por:

1 X 0
m
N Ac1 = N
m i=1 i
A partir do que foi visto até agora, é imediata a obtenção do estimador
de razão consistente para o total Y .
P
m
Yi0
R
YbAc1
R i=1
= MN y Ac1 = MN Pm
Ni0
i=1
com:
¡ ¢2 R ¡ ¢2 M − m SeR
2
V (YbAc1
R
) = MN V (y Ac1 ) ∼
= MN 2
MN m
2
M − m SeR
= M2
M m
Além disso, se o parâmetro que se deseja estimar é a proporção PA de

unidades da população com certo atributo A, segue-se que um estimador de
razão consistente de PA é dado por:
Pm
0
Ni PA0 i
i=1
pR
Ac1 = Pm
Ni0
i=1
com:
2
∼ M − m SeR
V (pR
Ac1 ) = 2
MN m
e
1 X 2
M
2
SeR = N (PA i − PA )2
M − 1 i=1 i
e o estimador dessa variância dado por:
M − m s2eR
v(pR
Ac1 ) = 2
MN m
com:
1 X 02 0
m
s2eR = N (P − pR
Ac1 )
2
m − 1 i=1 i A i
2.7.2 Estimador de razão baseado em uma caracterís-

tica que não seja o tamanho do conglomerado
Aqui a característica auxiliar x que se utiliza para construir o estimador
de razão é outra qualquer que não o tamanho dos conglomerados. Para
que o estimador de razão possa ser construído com esta característica x, é
indispensável conhecer o total X da população e observar os totais Xi0 dos
conglomerados da amostra. Assim, o estimador de razão do total Y é dado
por:
P
m
Yi0
YbAc1
R i=1
= Pm X
Xi0
i=1
2
M − m SeR
V (YbAc1
R
)∼
= M2
M m
com:
1 X
M
2
SeR = (Yi − R Xi )2
M − 1 i=1
sendo:
Y
R=
X
e
M − m s2eR
v(YbAc1
R
)∼
= M2
M m
com:
1 X 0 b 0 2
m
s2eR = (Y − R Xi )
m − 1 i=1 i
e
P
m
0
bAc1 Yi
b= Y i=1
R = Pm
bAc1
X Xi0
i=1
2.8 Exercícios
2.8.1 Considere uma população de 100 conglomerados de mesmo tamanho
de 4 unidades elementares, em que a proporção de pessoas com certo
atributo P = 0, 5. Em uma amostra de 5 conglomerados foram obtidos
os seguintes resultados:
Conglomerado (i) 1 2 3 4 5
Unidades elementares 2 3 1 2 1
com o atributo (Ai )
Estime a eficiência da amostra de conglomerados em relação à amostragem

aleatória simples.
2.8.2 Seja PN uma população de N = 20 unidades, cujos valores associados
a uma certa característica y são relacionadas a seguir:
U1 U2 U3 U4 U5 U6 U7 U8 U9 U10
↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓
Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y9 Y10
q q q q q q q q q q
66 70 37 56 61 38 55 05 23 47
U11 U12 U13 U14 U15 U16 U17 U18 U19 U20
↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓
Y11 Y12 Y13 Y14 Y15 Y16 Y17 Y18 Y19 Y20
q q q q q q q q q q
94 51 85 65 92 49 10 87 31 02
Grupando essas 20 unidades em 4 conglomerados como sugerido a
seguir, calcular o coeficiente de correlação intraclasse δ.
C1 = {U1 , U6 , U11 , U16 , U20 } C2 = {U2 , U3 , U7 , U8 , U19 }

C3 = {U4 , U5 , U14 , U15 , U18 } C4 = {U9 , U10 , U12 , U13 , U17 }
Comente o resultado!!!
2.8.3 Segue-se uma tabela contendo os dados de uma amostra de 20 quar-
teirões selecionados aleatoriamente sem reposição entre os 270 quar-
teirões de uma cidade que continha 6.786 domicílios. Nesta pesquisa
considerou-se como unidade de investigação o domicílio. Há interesse
em estimar a proporção de domicílios alugados e o intervalo dessa es-
timativa com 95% de confiança.
2.8. EXERCÍCIOS 103
Quarteirão No de Domicílios No de Domicílios

¡ 0¢
(i) (Ni0 ) Alugados Yi
1 5 3
2 9 5
3 18 5
4 68 52
5 32 21
6 48 34
7 11 3
8 1 0
9 1 0
10 4 0
11 29 17
12 31 14
13 5 0
14 2 0
15 4 2
16 102 54
17 20 11
18 15 11
19 1 0
20 29 23
Total 435 255
X
20 X
20
Ni02 = 22.239 Yi02 = 8.545
ı́=1 ı́=1
2.8.4 Segue-se uma tabela contendo os dados de uma amostra de 20 quar-

teirões selecionada com probabilidade proporcional ao número de domicílios,
dentre os 270 quarteirões considerados na população que continha 6.786
domi-cílios, do exercício 2.8.3. Estimar a proporção de domicílios alu-
gados e comparar a precisão obtida com aquela do exercício 2.8.3 (cuja
seleção dos conglomerados havia sido com equiprobabilidade). Justi-
fique o resultado.
Quarteirão No de Domicílios No de Domicílios

(i) (Ni0 ) Alugados (Yi0 )
1 45 30
2 22 13
3 76 69
4 4 2
5 4 2
6 33 27
7 46 34
8 81 43
9 58 42
10 89 84
11 76 69
12 48 46
13 46 36
14 18 6
15 76 69
16 102 54
17 44 24
18 39 26
19 22 7
20 30 25
Total 959 708
2.8.5 Estimar a proporção de domicílios alugados, a partir da amostra aleatória

simples de 20 quarteirões selecionada, cujos resultados foram dados no
exercício 2.8.3 deste capítulo, utilizando o estimador de razão baseado
no tamanho dos conglomerados.
Calcule também o intervalo dessa estimativa com 95% de confiança e

compare com os intervalos obtidos nos exercícios 2.8.3 e 2.8.4.
2.8.6 É dada uma população com N unidades distribuídas em M conglom-

erados de tamanhos desiguais. Deseja-se selecionar uma amostra de
m conglomerados para estimar o total de uma determinda caracterís-
tica. Quais as medidas que devem ser tomadas na definição do desenho
amostral para controlar a variação do tamanho dos conglomerados, se o
tamanho de cada conglomerado for conhecido? E se não for conhecido?
2.8.7 Os habitantes de um bairro estão distribuídos em 170 quarteirões, onde
se estima que há um total de 8.500 domicílios. Sabendo-se que uma
amostra aleatória simples de 500 domicílios anteriormente selecionada
forneceu uma precisão de cerca de 10% (em termos do coeficiente de
variação) para estimar o total de domicílios alugados e, que o coe-
ficiente de correlação intraclasse foi estimado na mesma amostra em
torno de 0,30. Usando a fórmula aproxi-mada que relaciona a variân-
cia da amostra aleatória simples e da amostra de conglomerados em 1
estágio, supondo conglomerados de igual tamanho:
a) Estime a precisão que seria obtida para estimar o total de domicílios

alugados se fosse selecionada uma amostra de quarteirões corre-
spondente ao mesmo número de domicílios que a amostra aleatória
simples.
b) Determine o tamanho de amostra de quarteirões necessário para
estimar o total de domicílios alugados no bairro em questão, com
a mesma precisão da amostra aleatória simples.
2.8.8 Uma amostra aleatória simples sem reposição de 8 caixas de laranjas

foi retirada de um lote que continha 1.000 caixas, tendo-se examinado
cada fruto das caixas selecionadas para verificar se estavam com bicho.
Os dados observados foram:
Caixa Total de frutos Total de frutos com

na amostra na caixa bicho na caixa
1 50 4
2 40 21
3 45 6
4 55 30
5 70 50
6 65 4
7 35 20
8 40 15
Total 400 150
a) Estime a proporção de frutos com bicho no lote.

b) Calcule o intervalo com 95% de confiança para a estimativa obtida
em a) e dê a sua opinião a respeito da dimensão da amostra uti-
lizada. ( s2eR = 625).
2.8.9 Compare as seguintes 2 amostras, cada uma delas baseada em 3.600

unidades elementares selecionadas de uma população com 1.800.000
unidades.
(1) Uma amostra aleatória simples de 3.600 unidades elementares com:
y = 513 e v(y) = 10, 89
(2) Uma amostra aleatória de 180 conglomerados selecionados dentre

90.000 conglomerados, com cada conglomerado contendo N = 20
unidades elementares e
y Ac1 = 524 e v(y Ac1 ) = 102, 01
Note que a variância estimada para estimar a média da característica

y para a segunda amostra é quase 10 vezes maior que a da primeira
amostra. Isto indica que: (complete com (V) se a afirmativa for ver-
dadeira e (F) se for falsa, justificando a escolha para cada item.)
a) O coeficiente de correlação intraclasse dos 90.000 conglomerados é

maior que zero.
b) Todos os elementos dentro de cada conglomerado são iguais (Yij =
Yik ∀ j e k).
c) O estimativa da variância da segunda amostra pode ser reduzida,
para atingir o valor da variância estimada com a primeira amostra,
aumentando em menos de 1.000 o número de conglomerados na
segunda amostra.
d) Se a primeira amostra for reduzida para 1.200 unidades elementares,
ela teria a mesma precisão estimada para estimar a média da car-
acterística y que a segunda amostra.
2.8.10 De uma população com 10.000 conglomerados e 50.000 unidades el-

ementares uma amostra aleatória simples sem reposição de 10 con-
glomerados foi selecionada. Desses conglomerados temos as seguintes
informações:
Conglomerado Valor da característica Total de unidades

(i) y no conglomerado i no conglomerado i
1 80 3
2 110 4
3 95 5
4 55 3
5 150 5
6 120 6
7 175 7
8 90 4
9 50 3
10 100 5
Total 1.025 45
a) Dê 2 estimativas da média por unidade elementar.

b) Qual estimativa é provavelmente melhor? Justifique.
2.8.11 De uma população formada por M conglomerados foi selecionada

uma amostra de m conglomerados com o seguinte procedimento: o 1o
conglomerado foi selecionado com probabilidades desiguais Pi , sendo
PM
Pi = 1 e os (m − 1) conglomerados restantes da amostra foram
i=1
selecionados com probabilidades iguais, sendo que todas as seleções
foram sem reposição.
a) Obtenha a probabilidade zi de que o conglomerado Ci pertença a

amostra; e
P
M
b) Prove que: zi = m.
i=1
Capítulo 3
Conglomerados em 2 estágios
3.1 Probabilidades iguais de seleção

3.1.1 Introdução e definições básicas
Quando foi estudada a eficiência da amostragem de conglomerados em 1 es-
tágio em relação à£ amostragem
¡ ¢ aleatória
¤ simples, mostrou-se que o efeito
de conglomeração 1 + N − 1 δ costuma determinar uma perda de pre-
cisão da amostra de conglomerados em 1 estágio, comparada a uma amostra
aleatória simples de mesmo tamanho, porque o coeficiente de correlação in-
traclasse δ costuma ser positivo. De fato, constatou-se ainda que a perda da
precisão é tanto maior quanto maior o tamanho do conglomerado.
Neste capítulo será estudada uma maneira de reduzir a influência do
tamanho dos conglomerados na eficiência da amostra de conglomerados em
1 estágio. Esta solução consiste em fazer subamostragem nos conglomerados
da amostra, ao invés de investigar todas as unidades desses conglomerados.
A subamostragem mencionada consiste na seleção de amostras de unidades
elementares de π N dentro de cada um dos conglomerados da amostra.
Por exemplo, se os quarteirões de uma cidade são considerados conglom-
erados de domicílios, selecionando-se uma amostra de quarteirões e depois
uma amostra de domicílios em cada quarteirão da amostra se obtém uma
amostra de conglomerados em 2 estágios.
O plano amostral de conglomerados em 2 estágios (Ac2) é constituído de
uma amostra de conglomerados com subamostragem.
Na exposição seguinte será adotada a seguinte terminologia:
conglomerado = unidade primária de amostragem (U P A ou UP )
unidade elementar = unidade secundária de amostragem (USA ou U S).
Assim, se πN é uma população com N unidades, ela pode ser vista como
109
110 CAPÍTULO 3. CONGLOMERADOS EM 2 ESTÁGIOS
se segue:
UP1 U P2 UPM
U S11 → Y11 US21 → Y21 ... U SM1 → YM1
U S12 → Y12 US22 → Y22 ... U SM2 → YM2
.. .. .. .. .. ..
. . . . . .
US1N1 → Y1N1 US2N2 → Y2N2 . . . U SMNM → YMNM
Assim verifica-se que na UPi há Ni unidades secundárias (USij ) e, portanto:
X
M
Ni = N
i=1
Agora, seleciona-se uma amostra aleatória simples, sem reposição de m unidades

primárias:
Amostra de 1o estágio
UP10 U P20 U Pm0
0
U S11 → Y110 US210
→ Y210 ... USm10
→ 0
Ym1
0
U S12 → Y120 US220
→ Y220 ... USm20
→ 0
Ym2
.. .. .. .. .. ..
. . . . . .
0 0 0 0 0 0
US1N1
→ Y1N 0 US2N 0 → Y2N 0 . . . U SmNm
0 → YmNm
0
1 2 2
E agora, em cada UP da amostra de 1o estágio, seleciona-se uma amostra

aleatória simples de unidades secundárias, obtendo-se:
Amostra de 2o estágio
U P10 UP20 UPm0

us0011 → y11 us0021 → y21 ... us00m1 → ym1
us0012 → y12 us0022 → y22 ... us00m2 → ym2
.. .. .. .. .. ..
. . . . . .
us001n0 → y1n01 us002n0 → y2n02 . . . us00m n0m → ym n0m
1 2
Finalmente, a amostra resultante é:

© ª
y11 , y12 , · · · , y1n01 ; · · · ; ym1 , ym2 , · · · , ym n0m
E assim, ao invés de se ter os conglomerados na amostra com N10 , N20 , · · · , Nm

0
0 0 0
unidades, tem-se as subamostras de tamanho n1 , n2 , · · · , nm .
A figura 3.1 apresenta uma ilustração da seleção das unidades de uma

amostra de conglomerados em 2 estágios.
3.1. PROBABILIDADES IGUAIS DE SELEÇÃO 111
Figura 3.1: Ilustração da seleção das unidades de uma Ac2
Neste caso tem-se: M = 10 e m = 6

UPs No de U Ss UP s No de U Ss No de USs
da UPi selecionadas da UPi0 selecionadas
0 0
(UPi ) (Ni ) (UPi ) (Ni ) da U Pi0 (n0i )
0 0
UP1 N1 = 4 U P1 N1 = 4 n01 = 2
UP2 N2 = 4 - - -
0 0 0
UP3 N3 = 5 U P2 N2 = 5 n2 = 3
UP4 N4 = 5 U P30 N30 = 5 n03 = 2
UP5 N5 = 3 - - -
0 0 0
UP6 N6 = 3 U P4 N4 = 3 n4 = 2
UP7 N7 = 3 U P50 N50 = 3 n05 = 2
UP8 N8 = 3 - - -
UP9 N9 = 2 U P60 N60 = 2 n06 = 1
UP10 N10 = 4 - - -
A fração de amostragem correspondente à seleção equiprovável das unidades

primárias no 1o estágio é representada por:
m
f1 =
M
e a fração de amostragem de 2o estágio para cada unidade primária sele-
cionada é representada por:
n0i
f2i = (∀i = 1, 2, · · · , m)
Ni0
Na situação usual (mais simples) é comum fazer a fração de amostragem do

2o estágio constante, representando-a por f2 , ou seja:
f2i = f2 (∀i = 1, 2, · · · , m)
Além disto, há que se notar que o tamanho final da amostra é uma variável
aleatória n, com:
Xm
n= n0i
i=1
Os valores da variável aleatória n dependem das unidades primárias sele-

cionadas no 1o estágio. Tem-se que:
Ãm ! Ãm !
X X 1 X
M
n = E (n) = E n0i =E f2 Ni0 = f2 m Ni = f1 f2 N
i=1 i=1
M i=1
No caso de fração de amostragem constante no 2o estágio, qualquer unidade

da população tem a mesma probabilidade de pertencer à amostra, dada por
f1 f2 .
3.1.2 Parâmetros da característica y

Vamos definir agora a notação dos parâmetros de π N quando a população
está representada de acordo com a configuração de conglomerados definida:
Total da característica y em U Pi :
Ni
X
Yi = Yij (∀i = 1, 2, · · · , M)
j=1
sendo: Yij o valor da característica y associada à j-ésima unidade se-

cundária da unidade primária i.
Média da característica y em UPi :
Yi
Yi = (∀i = 1, 2, · · · , M)
Ni
Variância da característica y dentro da UPi :

N
1 X i
Si2 = (Yij − Y i )2 (∀i = 1, 2, · · · , M)

Ni − 1 j=1
Total da característica y em toda população:
X
M
Y = Yi
i=1
Média da característica y por unidade da população:
Y
Y =
N
Média da característica y por conglomerado:
Y
Y =
M
Variância da característica y em toda população:

N
1 XX i M
2
S = (Yij − Y )2
N − 1 i=1 j=1
3.1.3 Estatísticas da amostra em cada estágio

De acordo com o desenho de amostragem de conglomerados em 2 estágios,
serão definidas as seguintes estatísticas da amostra:
Total da característica y em UPi0 :
Ni 0
X
Yi0 = Yij0 (∀i = 1, 2, · · · , m)
j=1
sendo: Yij0 o valor da característica y associada à j-ésima unidade se-

cundária da unidade primária selecionada i.
Média da característica y em UPi0 :

0 Yi0
Yi = (∀i = 1, 2, · · · , m)
Ni0
Variância da característica y em U Pi0 :

N0
02 1 X i
0
Si = 0 (Y 0 − Y i )2 (∀i = 1, 2, · · · , m)
Ni − 1 j=1 ij
Total da característica y na subamostra de UPi0 :

0
ni
X
yi = yij (∀i = 1, 2, · · · , m)
j=1
sendo: yij o valor da característica y associada à j-ésima unidade se-

cundária selecionada da unidade primária selecionada i.
Média da característica y na subamostra de U Pi0 :
yi
yi = (∀i = 1, 2, · · · , m)
n0i
Variância da característica y na subamostra de UPi0 :

n0
1 X i
s2i = 0 (yij − y i )2 (∀i = 1, 2, · · · , m)

ni − 1 j=1
3.1.4 Estimadores de total e médias e respectivas var-

iâncias
Estimadores de total e médias
Trata-se de obter estimadores para os parâmetros de π N . Para isso, será
empregado um princípio de construção de estimadores não viciados a partir
do desenho da amostra cuja aplicabilidade é geral na amostragem. O princí-
pio consiste consiste em ir construindo o estimador de dentro para fora (ou
de baixo para cima).
No nosso caso, a aplicação deste princípio resulta no seguinte raciocínio:
Seja U Pi0 uma unidade primária qualquer selecionada da amostra. O total
de y em U Pi0 é dado por Yi0 , que no caso é desconhecido visto se dispor apenas
de uma amostra das unidades de UPi0 . Entretanto, essa amostra pode ser
usada para estimar Yi0 ,levando em conta que:
i) a amostra é aleatória simples na U Pi0 ; e
ii) são conhecidos os valores yi1 , yi2 , · · · , yi n0i da amostra na UPi0 .
Assim um estimador não viciado de Yi0 é dado por:
ni 0
Ni0 Ni0 X
Ybi0 = 0 yi = 0 yij = Ni0 y i (∀i = 1, 2, · · · , m)
ni ni j=1
Por outro lado, dado que as UPs da amostra são selecionadas com equiprob-
abilidade, o estimador de total conhecido da Ac1 para o total da população
depende somente dos totais dos conglomerados da amostra: Y10 , Y20 , · · · , Ym0 ,
e é dado por:
MX 0
m
b
YAc1 = Y
m i=1 i
Usando as idéias anteriormente expostas, e lembrando que na Ac2 os

totais dos conglomerados da amostra são estimados por Yb10 , Yb20 , · · · , Ybm0 , segue-
se que um estimador do total Y é dado por:
ni 0
M X b 0 M X Ni0 M X Ni0 X
m m m
YbAc2 = Y = yi = yij
m i=1 i m i=1 n0i m i=1 n0i j=1
MX 0
m
= Ny
m i=1 i i
³ ´
YbAc2 é um estimador não viciado de Y, isto é, E YbAc2 = Y.
Para fazer essa demonstração, utiliza-se esperanças condicionais. Assim,
lembrando que:
Se Z e X são variáveis aleatórias então:
E (Z) = EX [E (Z |X )]
Neste caso é conveniente considerar internamente a esperança condi-

cionada sobre todas as possíveis seleções de subamostra quando se fixa uma
dada seleção de unidades primárias U P10 , · · · , UPm0 , e depois a esperança
sobre todas as possíveis seleções de amostras de unidades primárias.
Segue-se, então que:

³ ´ ³ ³ ´´
E YbAc2 = EUP10 ,··· ,UPm0 E YbAc2 |U P10 , · · · , UPm0
Ã Ã !!
MX 0
m
0
= EUP10 ,··· ,UPm0 E N y |UPi
m i=1 i i
Ã !
MX
m
0 0
= EUP10 ,··· ,UPm0 E (Ni y i |UPi )
m i=1
Ã ! Ã !
MX 0 0 MX 0
m m
= EUP10 ,··· ,UPm0 NY = EU P10 ,··· ,U Pm0 Y
m i=1 i i m i=1 i
³ ´
b
= E YAc1 = Y
Um estimador não viciado para Y é dado por:

M X 0 1 X 0
m m
YbAc2
y Ac2 = = Ny = Ny
N mN i=1 i i mN i=1 i i
pois, Ã !
¡ ¢ YbAc2 1 ³b ´ Y
E y Ac2 = E = E YAc2 = =Y
N N N
Um estimador não viciado para Y é dado por:
M X 0 1 X 0
m m
YbAc2
y Ac2 = = Ny = Ny
M mM i=1 i i m i=1 i i
pois, Ã !
YbAc2 1 ³b ´ Y
E (y Ac2 ) = E = E YAc2 = =Y
M M M
Variância dos estimadores de total e das médias
Na obtenção da expressão da variância de YbAc2 também será utilizado o
emprego de esperanças condicionais, o que irá facilitar bastante essa dedução.
Deve-se lembrar que: Se Z e X são variáveis aleatórias então:
V (Z) = EX [V (Z |X )] + VX [E (Z |X )]
Daí, segue-se que:
³ ´ h ³ í
b b 0
V YAc2 = EU P10 ,··· ,U Pm0 V YAc2 |UP1 , · · · , U Pm + 0
h ³ í
+VU P10 ,··· ,U Pm0 E YbAc2 |UP10 , · · · , U Pm0
Porém, foi demonstrado anteriormente que:

³ ´ MX m
b 0 0
E YAc2 |UP1 , · · · , UPm = Y 0 = YbAc1
m i=1 i
Segue-se que:
h ³ í h i 2
b 0 0 b 2 M − m Se
VUP10 ,··· ,UPm
0 E YAc2 |U P1 , · · · , UPm = VU P1 ,··· ,U Pm YAc1 = M
0 0
M m
onde:
1 X
M
Se2 = (Yi − Y )2
M − 1 i=1
Por outro lado:
Ã !
³ ´ MX 0
m
V YbAc2 |UP10 , · · · , UPm0 = V N y |UPi0
m i=1 i i
M 2 X 02
m
= N V (y i |UPi0 )
m2 i=1 i
M 2 X 02 Ni0 − n0i Si02
m
= N
m2 i=1 i Ni0 n0i
Logo:
" #
h ³ í M 2 X m
N 0
− n0 02
S
EU P10 ,··· ,U Pm0 V YbAc2 |UP10 , · · · , UPm0 = EU P10 ,··· ,U Pm0 N 02 i 0 i i0
m2 i=1 i Ni ni
· ¸
M2 X
m 0 0 02
02 Ni − ni Si
= E UPi0 N i
m2 i=1 Ni0 n0i
m M · ¸
M2 X X 2 Ni − ni Si
2
1
= 2
Ni
m i=1 i=1 Ni ni M
M X 2 Ni − ni Si2
M
= N
m i=1 i Ni ni
E assim, obtém-se finalmente:

³ ´ M − m Se2 M X 2 Ni − ni Si2
M
V YbAc2 = M 2 + N
M m m i=1 i Ni ni
onde as parcelas do 2o membro representam as ”componentes” da variância

devidas ao 1o e ao 2o estágios de seleção, respectivamente.
Segue-se, imediatamente, que as variâncias dos estimadores das médias
y Ac2 e y Ac2 são, respectivamente:
Ã !
¡ ¢ YbAc2 1 ³b ´
V y Ac2 = V = 2 V YAc2
N N
Ã !
YbAc2 1 ³ ´
V (y Ac2 ) = V = 2 V YbAc2
M M
Note-se que:
i) Se m = M então, a 1a componente da variância é nula, ou seja:
³ ´ X M
Ni − ni Si2 ³ ´
b
V YAc2 = Ni2 = V Ybest
i=1
Ni ni
e este plano amostral equivale ao de uma amostra estratificada.
ii) Se ni = Ni (∀i = 1, 2, · · · , m) então, a 2a componente da variância é
nula, ou seja:
³ ´ M − m Se2 ³ ´
V YbAc2 = M 2 = V YbAc1
M m
e este plano amostral equivale ao de uma amostra de conglomerados
em um estágio.
Uma análise pouco cuidadosa do problema a partir deste resultado pode-
ria levar à conclusão de que:
³ ´ ³ ´
b
V YAc2 ≥ V YAc1b
posto que:
³ ´ ³ ´ MX M
Ni − ni Si2
b b
V YAc2 = V YAc1 + Ni2
m i=1 Ni ni
Isto é verdadeiro se o número de conglomerados m for o mesmo nos dois

planos amostrais. Porém, como no plano amostral de conglomerados em 2
estágios é feita a subamostragem, as amostras não têm o mesmo tamanho
em termos de unidades elementares. O tamanho da Ac2, em média, tem em
termos de unidades elementares f2 % do número de unidades elementares da
Ac1.
A maneira correta de comparar os 2 desenhos de amostragem é fixando
o tamanho total da amostra, em termos de unidades elementares, e não o
número de conglomerados da amostra, como será visto mais adiante.
3.1.5 Estimadores das variâncias dos estimadores de

total e médias
Em primeiro lugar,
³ vamos
´ nos ocupar para a obtenção de um estimador não
viciado para a V YbAc2 , propondo o seguinte estimador:
³ ´ 2
M X 0 2 Ni0 − n0i s2i
m
b 2 M − m se
v YAc2 = M + N
M m m i=1 i Ni0 n0i
onde:
1 X 0
m
=s2e (N y − y Ac2 )2
m − 1 i=1 i i
³ ´
A seguir será demonstrado que o estimador v YbAc2 é não viciado para
³ ´
b
V YAc2 .
Para esta prova, vamos mostrar que:
1 PM Ni − ni Si2
i) E (s2e ) = Se2 + Ni2 e
M i=1 Ni ni
µ ¶ M
M Pm 0 0 2
0 2 Ni − ni si P 2 Ni − ni Si2
ii) E Ni = Ni .
m i=1 Ni0 n0i i=1 Ni ni
Demostração da parte (i):

Ã !
1 X 0
m
E(s2e ) = E (N y − y Ac2 )2
m − 1 i=1 i i
Ã m !
1 X
= E (Ni0 y i − y Ac2 )2
m−1
Ã i=1 !
1 X m
2
= E (Ni0 y i ) − m (y Ac2 )2
m−1
Ã i=1 !
1 X m
2 m ¡ ¢
= E (Ni0 y i ) − E y 2Ac2
m−1 i=1
m−1
Segue-se que:
Ãm ! Ã Ãm !!
X 2
X 2
E (Ni0 y i ) = EU P10 ,··· ,U Pm0 E 0
(Ni y i ) |U Pi0
i=1 i=1
Ãm !
X ³ ´
0 2 0
= EU P10 ,··· ,U Pm0 E (Ni y i ) |UPi
Ã i=1 !
X m ³ ´ X
m
0 2 0 2
= EU P10 ,··· ,U Pm0 V (Ni y i ) |UPi + [E (Ni0 y i |UPi0 )]
Ã i=1 i=1
!
X m
N0
− n0i Si02 X
m
¡ 0 ¢2
= EU P10 ,··· ,U Pm0 Ni02 i + Ni Y i
i=1
Ni0 n0i i=1
µ ¶ ³¡
0 0 02
02 Ni − ni Si
¢2 ´
= mEU P10 ,··· ,U Pm0 Ni + mEU P10 ,··· ,U Pm0 Ni Y i
Ni0 n0i
XM µ ¶
m X¡
M
2 Ni − ni Si
2
1 ¢2
= m Ni + Ni Y i
i=1
Ni ni M M i=1
m X 2 Ni − ni Si2 mX 2
M M
= N + Y
M i=1 i Ni ni M i=1 i
Por outro lado, segue-se que:
¡ ¢
E y 2Ac2 = V (y Ac2 ) + [E (y Ac2 )]2
Ã ! " Ã !#2
YbAc2 YbAc2
= V + E
M M
Ã ! " Ã !#2
YbAc2 YbAc2
= V + E
M M
( )
1 M − m S 2
M XM
Ni − n S
i i
2
e
= M2 + N2 +Y2
M2 M m m i=1 i Ni ni
1 X 2 Ni − ni Si2
M
M − m Se2 2
= + Ni +Y
M m mM i=1 Ni ni
Assim, segue-se que:

Ãm !
1 X 2 m ¡ ¢
E(s2e ) = E (Ni0 y i ) − E y 2Ac2
m−1 i=1
m−1
( )
m X 2 Ni − ni Si2 mX 2
M M
1
= N + Y +
m − 1 M i=1 i Ni ni M i=1 i
( )
1 X 2 Ni − ni Si2
M
m M − m Se2 2
− + N +Y
m−1 M m mM i=1 i Ni ni
½ ¾X M
m m 1 Ni − ni Si2
= − Ni2 +
(m − 1) M m − 1 mM i=1 Ni ni
m XM
m 2 m M − m Se2
+ Yi2 − Y −
(m − 1) M i=1 m−1 m−1 M m
" #
1 X 2 Ni − ni Si2 1 X 2
M M
m 2
= N + Y − MY +
M i=1 i Ni ni (m − 1) M i=1 i
m M − m Se2
−
m−1 M m
"M #
1 XM
Ni − n S
i i
2
m 1 X ¡ ¢2
E(s2e ) = N2 + Yi − Y +
M i=1 i Ni ni (m − 1) M i=1
m M − m Se2
−
m−1 M m
µ ¶
1 X 2 Ni − ni Si2
M
m M −1 M −m
= N + − Se2
M i=1 i Ni ni (m − 1) M Mm
µ ¶
1 X 2 Ni − ni Si2
M
m mM − m − M + m
= N + Se2
M i=1 i Ni ni (m − 1) Mm
µ ¶
1 X 2 Ni − ni Si2
M
mM m−1
= N + Se2
M i=1 i Ni ni (m − 1) Mm
1 X 2 Ni − ni Si2
M
= N + Se2
M i=1 i Ni ni
Agora resta a demonstração de (ii):

Ã ! Ã Ã !!
M X 0 2 Ni0 − n0i s2i M X 0 2 Ni0 − n0i s2i
m m
0
E N = EU P10 ,··· ,U Pm0 E N |UPi
m i=1 i Ni0 n0i m i=1 i Ni0 n0i
Ã m !
M X 0 0
0 N − n E (si )
2
= EUP10 ,··· ,UPm0 Ni 2 i 0 i 0
|UPi0
m Ni ni
Ã i=1 !
M X m 0 0 02
0 N − n S
= EUP10 ,··· ,UPm0 Ni 2 i 0 i i0
m i=1
Ni ni
M X 2 Ni − ni Si2 1
M
= m N
m i=1 i Ni ni M
M m X 2 Ni − ni Si2
M
= N
m M i=1 i Ni ni
X
M
Ni − ni Si2
= Ni2
i=1
Ni ni
Finalizando:
Ã !
h ³ í 2
M − m E (se ) M Xm 0 0 2
0 N − n s
E v YbAc2 = M2 +E Ni 2 i 0 i i0
M m m i=1 Ni ni
" #
1 X 2 Ni − ni Si2
M
2M − m 1 2
= M S + N +
M m e M i=1 i Ni ni
X
M
Ni − ni Si2
+ Ni2
i=1
Ni ni
− m Se2 X
M
Ni − ni Si2
2M 2M − m 1 1
= M +M Ni2 +
M m M m M i=1 Ni ni
X
M
Ni − ni Si2
+ Ni2
i=1
Ni ni
2
µ ¶XM
2 M − m Se M −m Ni − ni Si2
= M + +1 Ni2
M m m i=1
Ni ni
M − m Se2 M X 2 Ni − ni Si2
M
= M2 + N
M m m i=1 i Ni ni
³ ´
b
= V YAc2
3.1.6 Amostra autoponderada

Na amostragem de conglomerados em 2 estágios, existe uma fração de amos-
m
tragem no 1o estágio (f1 = M ) e existem frações correspondentes ao 2o estágio
n0
(f2i = Ni0 ), que podem ser diferentes.
i
Todos os estimadores que trabalhamos anteriormente foram preparados
nessa hipótese. Supondo-se que:
f21 6= f22 6= · · · 6= f2m
Sabe-se que a probabilidade de U Sij pertencer a amostra é dada por:
m n0i
P {USij ∈ amostra} = ∀i, j
M Ni0
Foi dito anteriormente que é comum na prática trabalhar com uma fração
de amostragem f2 constante em todos os conglomerados. Isto é usual devido
principalmente à simplicidade que resulta em termos de fórmulas dos esti-
madores, como também à simplicidade de operacionalização da seleção da
amostra. neste caso, devemos ter:
n
f2 =
N
onde:
P
m P
M
n0i Ni
i=1 i=1
n= e N=
m M
Daí resulta que todas as unidades secundárias terão a mesma probabili-
dade de pertencer à amostra, dada por:
m n n
P {USij ∈ amostra} = = f1 f2 = f =
MN N
O que veremos a seguir é como se define amostra autoponderada e, como
se modificam os estimadores de total e da respectiva variância da amostragem
de conglomerados em 2 estágios.
Definição
Diz-se que a amostra de conglomerados em 2 estágios é autoponderada
se e somente se as unidades secundárias tiverem a mesma probabilidade de
inclusão na amostra, isto é, se e somente se:
n m n0i n0i Mn
= P {U Sij ∈ amostra} = 0
⇐⇒ 0
=
N M Ni Ni mN
n0i n
⇐⇒ 0
=
Ni N
Adaptação dos estimadores do total e respectiva variância

A expressão do estimador de total YbAc2 pode ser reescrita como:
ni 0 0
m ni
M X Ni0 X M N XX
m
YbAc2 = yij = yij
m i=1 n0i j=1 m n i=1 j=1
0 0
m ni m ni
N XX 1 XX
= yij = yij
n i=1 j=1 f i=1 j=1
e a expressão da variância de YbAc2 fica:

³ ´ 2
M X 2 Ni − ni Si2
M
b 2 M − m Se
V YAc2 = M + N
M m m i=1 i Ni ni
2
µ ¶XM
2 M − m Se M N
= M + −1 Ni Si2
M m m n i=1
µ ¶ M
2
2 M − m Se M N N −n X
= M + Ni Si2
M m m n N i=1
fazendo:
1 X
M
Sd2 = Ni Si2
MN i=1
Segue-se que:
³ ´ µ ¶ 2 µ ¶
M − m S ¡ ¢2 N − n Sd2
V YbAc2 = M 2 e
+ MN
M m N mn
ou, em termos das frações de amostragem:
³ ´ µ ¶ µ ¶
1 1 − f
V YbAc2 = M 2 2
− 1 Se + N Sd2
f1 f1 f2
Notando-se que:
1 X 0 2
m
s2d = Ni si
mN i=1
³ ´
é um estimador não viciado de Sd2 , b
segue-se a expressão adaptada de v YAc2
³ ´ µ ¶ 2 µ ¶
M − m s ¡ ¢2 N − n s2d
v YbAc2 = M 2 e
+ MN
M m N mn
ou ainda, em termos das frações de amostragem:
³ ´ µ ¶ µ ¶
1 1 − f
v YbAc2 = M 2 2
− 1 se + N s2d
f1 f1 f2
Uma vez mais convém ressaltar que a vantagem da amostra autopon-

derada advém da facilidade prática de seleção da amostra e do cálculo dos
estimadores e suas respectivas precisões.
Em determinada área, de acordo com o último Censo Demográfico, há 150

setores com aproximadamente 36.400 domicílios. Seleciona-se uma amostra
de 364 domicílios, com o objetivo de estimar o número de habitantes da área.
Isto corresponde a uma fração geral de amostragem:
364 1
f= =
36.400 100
36.400 ∼
Há em média = 243 domicílos por setor na área.
150
Serão selecionados com equiprobabilidade 10 setores, o que corresponde
a uma fração de amostragem de 1o estágio de:
10 1
f1 = =
150 15
Para que a amostra seja autoponderada deve-se ter: f1 f2 = f .

Logo:
1
f 100
f2 = = 1 = 15%
f1 15
Supondo que a amostra forneceu os seguintes dados, estimar o número

total de habitantes da área e sua precisão.
Setores Domicílios Domicílios da Moradores nos Variância de y

da no setor subamostra domicílios da na subamos-
amostra (Ni0 ) no setor (n0i ) subamostra (yi ) tra (s2i )
1 320 48 168 4,018
2 210 32 138 5,224
3 180 27 130 5,905
4 400 60 222 1,044
5 250 38 201 2,840
6 221 33 149 4,345
7 120 18 97 6,000
8 500 75 300 2,012
9 262 39 199 3,484
10 238 36 108 3,000
Total 2.701 406 1.712 -
0
m ni
1 XX 1
YbAc2 = yij = 1 (1.712) = 171.200 habitantes
f i=1 j=1 100
1 X 0
m
s2e = (N y − y Ac2 )2
m − 1 i=1 i i
1
= (1.502.364, 65) = 166.929, 41
9
YbAc2 171.200
y Ac2 = = = 1.141, 33
M 150
1 X 0 2
m
1
s2d = Ni si = (8.886, 353) = 3, 657
mN i=1 10 (243)
³ ´ µ ¶ µ ¶
b 1 2 1 − f2 2
v YAc2 = M − 1 se + N sd
f1 f1 f2
µ ¶ µ 15 ¶
1 1 − 100
= 150 1 − 1 166.929, 41 + 36.400 1 3, 657
15 100
= 350.551.750, 8 + 11.314.558, 1 = 361.866.308, 9
Logo: r ³ ´
³ ´ b
v YAc2
b
cv YAc2 = = 11, 11%
YbAc2
3.1.7 Dimensionamento da amostra de conglomerados

em 2 estágios
Na amostragem de conglomerados em um estágio, o dimensionamneto da
amostra pode ser feito fixando-se uma precisão desejada, e calculando-se o
número de conglomerados da amostra, através da expressão da variância.
Na amostragem de conglomerados em 2 estágios, o dimensionamento con-
siste em determinar não só o número de unidades primárias (conglomerados)
na amostra de 1o estágio, como também o número de unidades secundárias
da subamostra em cada unidade primária selecionada.
Uma solução para o problema pode ser obtida utilizando-se a expressão
da variância e introduzindo-se uma função custo, que indica o custo da apli-
cação do desenho da amostra para os tamanhos de 1o e 2o estágios a serem
escolhidos.
Aqui será considerado o caso simples em que o tamanho médio das unidades
primárias N e o tamanho médio da subamostra n são determinados de acordo
com um dos critérios possíveis:
a) minimizar a variância com custo fixado;

b) minimizar o custo com variância fixada.
Definição de uma função custo

A função custo que vamos considerar não é a única possível, mas a ade-
quada para muitas situações práticas, e possibilita a solução do problema de
determinação dos tamanhos de amostra segundo os dois critérios já definidos
de maneira simples.
Função Custo:
CT = Cf + C1 m + C2 mn
onde:
Cf é o custo fixo;
C1 é o custo unitário por unidade primária selecionada;
C2 é o custo unitário por unidade secundária selecionada.
Na prática, as despesas dever ser atribuídas a cada um dos custos definidos

como segue:
Custo fixo: Cf
- planejamento e orientação do trabalho, incluindo os salários do pessoal

técnico e as despesas de administração;
- preparação de mapas e outras informações que não dependam do tamanho

da amostra a ser selecionada;
- impressão de tabelas e treinamento de pessoal de campo que não de-

penda do tamanho da amostra a ser selecionada.
Afinal, devem ser incluídas como custo fixo, as despesas que não variam
com o processo de seleção nem com o tamanho da amostra.
Custo de seleção das unidades primárias: C1 m
- despesas de seleção das unidades primárias;
- preparação de roteiros de viagem para as unidades primárias;
- impressão do material para a amostra de unidades primárias;
- tempo de treinamento para investigação das unidades primárias;
- gastos de transporte para as unidades primárias e entre as mesmas.
Afinal, devem ser incluídas aqui todas as despesas que variam com o
número de unidades primárias na amostra.
Custo de seleção das unidades secundárias: C2 mn
- custo de entrevista de cada unidade secundária;
- impressão do material referente às unidades secundárias da amostra;
- despesas de transporte dentro das unidades primárias.
Enfim, devem ser incluídas aqui todas as despesas diretamente relacionadas

com o número de unidades secundárias na amostra.
Tamanho de amostra com custo fixado e mínima variância
Agora, vamos resolver o problema de determinação dos tamanhos de

amostra segundo o critério de minimização da variância com o custo fixado.
Para tanto, considere-se a seguinte função Lagrangeana:
F = V (y Ac2 ) + λ (Cf + C1 m + C2 mn − CT )
que pode ser reescrita como:

2
M − m S e N − n Sd2
F = + + λ (C1 m + C2 mn − C)
M m N mn
onde:
C = CT − Cf
λ é o multiplicador de Lagrange.
Tomando as derivadas parciais em relação a m e a n e igualando a zero
vem:
∂F S2
= − d 2 + λC2 m = 0 (3.1)
∂n mn
2
∂F S N − n Sd2
= − e2 − + λ (C1 + C2 n) = 0 (3.2)
∂m m N m2 n
De (1) obtém-se:
λC2 m2 n2 = Sd2 (3.3)
De (2) obtém-se:
2 ¡ ¢
λ (C1 + C2 n) Nm2 n = S e Nn + N − n Sd2 (3.4)
Dividindo-se (4) por (3), tem-se:

2 ¡ ¢
λ (C1 + C2 n) Nm2 n S e Nn + N − n Sd2
=
λC2 m2 n2 Sd2
2 ¡ ¢
(C1 + C2 n) N S e Nn + N − n Sd2
=⇒ =
C2 n Sd2
2 ¡ ¢
=⇒ (C1 + C2 n) N Sd2 = S e C2 N n2 + N − n C2 n Sd2
¡ ¢ 2
=⇒ C1 N + C2 nN − N C2 n + C2 n2 Sd2 = S e C2 N n2
2
=⇒ C1 N Sd2 = S e C2 N n2 − C2 n2 Sd2
³ 2 ´
=⇒ C1 N Sd2 2 2
= C2 n S e N − Sd
C N Sd2
=⇒ n2 = ³ 12 ´
C2 S e N − Sd2
v
u
u C N Sd2
=⇒ nótimo =t ³ 12 ´ (3.5)
2
C2 S e N − Sd
Derivando a F em relação a λ, vem:
∂F
= C1 m + C2 mn − C = 0
∂λ
=⇒ m (C1 + C2 n) = C
C
=⇒ m = (3.6)
C1 + C2 n
substituindo-se na expressão (6) o valor nótimo , obtém-se o valor ótimo de m:
C C
mótimo = = v (3.7)
C1 + C2 nótimo u C N Sd2
u
C1 + C2 t ³ 12 ´
C2 S e N − Sd2
Assim pode-se observar que:
i) nótimo cresce se C1 cresce em relação a C2 , ou seja, se cresce a parte do

custo referente à seleção das unidades primárias, cabe aumentar nótimo
e diminuir mótimo .
C1
. Pequenas variações deste
ii) Para achar nótimo , basta conhecer a razão
C2
valor têm pouca
r influência sobre o valor de nótimo , visto que nótimo
C1
depende de .
C2
iii) o valor de nótimo pode ser estimado por:

v
uC s2
bótimo u 1
n =u µ d 2¶
t C2 s
s2e − d
n
pois:
¡ ¢
E s2d = Sd2
e
µ ¶ µ ¶
2 s2d 2 N − n s2d s2d
E se − = E se − −
n N n N
µ 2¶
¡ ¢ sd 2 S2
= E s2e − E = Se − d
N N
Note-se que isto vale somente se:
s2d
s2e − >0
n
se isto não ocorrer, nótimo pode ser obtido considerando a função custo:
C = m (C1 + C2 n)
- Se C > C1 + C2 N, então:
nótimo = máximo de n = N
implicando que
C
mótimo =
C1 + N C2
- Se C ≤ C1 + C2 N , então nótimo é a solução para n da equação
C − C1
C = C1 + C2 n =⇒ nótimo = e mótimo = 1
C2
Tamanho de amostra com variância fixada e custo mínimo
Aqui o problema a resolver é minimizar a função:
G = C + µ V (y Ac2 )
onde:
µ é o multiplicador de Lagrange.
Assim:
Ã 2
!
G = (C1 m + C2 mn) + µ +
M m N mn
Tomando as derivadas parciais em relação a m e a n e igualando a zero vem:
∂G S2
= C2 m − µ d 2 = 0 (3.8)
∂n mn
Ã 2
!
∂G Se N − n Sd2
= C1 + C2 n − µ + =0 (3.9)
∂m m2 N m2 n
É imediato notar que estas equações são idênticas àquelas anterior-

1
mente obtidas com µ = . Em conseqüência, a solução para o valor ótimo
λ
de n é a mesma, seja fixando o custo e minimizando a variância, seja fixando
a variância e minimizando o custo.
Quanto ao valor ótimo de m é obtido fixando-se V (y Ac2 ) e substituindo-se
nótimo no lugar de n.
2
V (y Ac2 ) = +
M m N mn
µ ¶ µ ¶
1 1 2 1 1 Sd2
=⇒ − Se + − = V (y Ac2 )
m M n N m
µ µ ¶ ¶
1 2 1 1 1 2
=⇒ Se + − Sd2 = V (y Ac2 ) + S e
m n N M
µ ¶
2 1 1
Se + − Sd2
n N
m=
1 2
V (y Ac2 ) + S e
M
µ ¶
2 1 1
Se + − Sd2
nótimo N
mótimo =
1 2
V (y Ac2 ) + S e
M
sendo que V (y Ac2 ) deve ser fixada.
Tamanho de amostra em função do coeficiente de correlação intra-
classe
Considere as expressões já encontradas no caso de amostragem de con-
glomerados em 1 estágio:
2
(M − 1) S e 1 2
− Sd
δ= M N (3.10)
MN − 1 2
S
MN
¡ ¢ 2
MN − 1 S 2 = (N − 1) M Sd2 + N (M − 1) S e (3.11)
Substituindo-se (11) em (10), obtém-se:
2
(M − 1) S e 1 2
− Sd
δ= M N
(N − 1) 2 M − 1 2
Sd + Se
N M
Logo:
Sd2
1−δ =
(N − 1) 2 M − 1 2
Sd + Se
N M
1−δ Sd2 ∼ Sd2
= =
δ 2
(M − 1) S e 1 2 2 1 2
− Sd Se − S
M N N d
Assim, pode-se escrever:
v v
u u
u C1 N Sd2 uC Sd2
nótimo = t ³ 2 ´ =u 1µ ¶
C2 S N − S 2 t C2 2 1 2
e d Se − S
N d
ou r
C1 1 − δ
nótimo = (3.12)
C2 δ
E assim verifica-se, uma vez mais, a importância prática de conhecer o

valor do coeficiente de correlação intraclasse.
Em certa área existem 740 setores censitários rurais. Trata-se de estimar
a produção total de café da área, através e uma amostra de conglomerados
em 2 estágios, sendo os setores as unidades primárias e os estabelecimentos
produtores as unidades secundárias.
De uma pesquisa anterior sabe-se que para a característica ”produção de
café ” e o setor como conglomerado tem-se:
C1
δ = 0, 201 e = 10
C2
Logo, o tamanho da subamostra em cada setor selecionado é:
r r
C1 1 − δ 1 − 0, 201 ∼
nótimo = = 10 =6
C2 δ 0, 201
O custo da investigação de um estabelecimento foi orçado em R$ 30,00
de modo que a função custo é:
C = 300m + 30mn
A quantia total para a pesquisa é R$ 35.000,00, sendo R$5.000,00 para a
parte fixa dos custos.
Logo:
30.000
m= = 62 setores
300 + 30(6)
correspondendo a um total de 6 (62) = 372 estabelecimentos produtores na
amostra.
A fração de amostragem do 1o estágio é:
m 62 1
f1 = = =
M 740 12
Considerando que cada setor tem em média N = 30 estabelecimentos, a
fração de amostragem do 2o estágio é:
n 6 1
f2 = = =
N 30 5
Logo, a fração geral de amostragem é:
µ ¶µ ¶
1 1 1
f = f1 f2 = =
12 5 60
3.1.8 Efeito de conglomeração

O objetivo desta seção é a comprovação de que a amostragem de conglomera-
dos em 2 estágios pode ser mais precisa que a amostragem de conglomerados
em 1 estágio. Isto será feito comparando-se os respectivos efeitos de con-
glomeração em relação à amostragem aleatória simples.
Para atingir esse objetivo é necessário, no entanto, escrever a expressão da
variância V (y Ac2 ) em termos do coeficiente de correlação intraclasse δ, o que
será feito somente para o caso em que o tamanho médio por conglomerado
N for admitido constante para os M conglomerados.
Assim, recordando as seguintes expressões:
¡ ¢ 2
MN − 1 S 2 = (N − 1) M Sd2 + N (M − 1) S e (3.13)
2 M N − 1 S2 £ ¡ ¢ ¤
Se = 1+ N −1 δ (3.14)
(M − 1) N N
Substituindo-se (14) em (13) tem-se:
¡ ¢ MN −1 2£ ¡ ¢ ¤
MN − 1 S 2 = (N − 1) M Sd2 + S 1+ N −1 δ
N
µ ¶
¡ ¢ MN −1£ ¡ ¢ ¤
=⇒ MN − 1 − 1 + N − 1 δ S 2 = (N − 1) M Sd2
N
Ã¡ ¢£ ¡ ¢ ¤!
MN − 1 N − 1 − N − 1 δ
=⇒ S 2 = (N − 1) M Sd2
N
Ã¡ ¢¡ ¢ !
MN − 1 N − 1 (1 − δ)
=⇒ S 2 = (N − 1) M Sd2
N
¡ ¢¡ ¢
2 MN − 1 N − 1 (1 − δ) 2
=⇒ Sd = S
(N − 1) MN
¡ ¢
MN − 1 (1 − δ) 2
=⇒ Sd2 = S
MN
Lembrando que a variância V (y Ac2 ) é dada por:
2
V (y Ac2 ) = +
M m N mn
e supondo as seguintes aproximações:
M −m ∼ N −n ∼
=1 e =1 (3.15)
M N
obtém-se:
2
S S2
V (y Ac2 ) ∼
= e+ d
m mn
¡ ¢
S 2
M N − 1 £ ¡ ¢ ¤ 1 MN − 1 (1 − δ) 2
V (y Ac2 ) ∼
= 1+ N −1 δ + S
mN (M − 1) N mn MN
Mas pela hipótese em (15) tem-se:
MN − 1 ∼ MN −1 ∼
=1 e =1 (3.16)
MN (M − 1) N
Logo:
S2 £ ¡ ¢ ¤ 1
V (y Ac2 ) ∼
= 1+ N −1 δ + (1 − δ) S 2
mN mn
" ¡ ¢ #
2 N − 1
S 1 1 δ
V (y Ac2 ) ∼
= + δ+ −
m N N n n
¡ ¢
1 N −1
se N for grande =⇒ −→ 0 e −→ 1
N N
Então:
S2
V (y Ac2 ) ∼
= [ n δ + 1 − δ]
mn
S2
= [1 + ( n − 1) δ]
mn
S2
Se lembrarmos que é a expressão aproximada para a variância da
mn
média de y da amostragem aleatória simples de tamanho mn (desprezando-
se a correção de população finita), segue-se que:
V (y Ac2 ) ∼
= V (y AAS ) [1 + ( n − 1) δ]
Donde se conclui que o efeito de conglomeração da amostragem de
conglomerados em 2 estágios é dado por [1 + ( n − 1) δ] .
De imediato segue-se que:

3.2. CONTROLE DE VARIAÇÃO DE TAMANHO DAS UPAS 137
£ ¡ ¢ ¤
i) se δ > 0 =⇒ [1 + ( n − 1) δ] << 1 + N − 1 δ que é o efeito de
conglomeração na amostragem de conglomerados em 1 estágio.
Logo é interessante manter n pequeno, o que implica em ter m grande.
Isto é, a amostra deve ter mais unidades primárias e subamostras menores
(f1 deve crescer e f2 decrescer).
£ ¡ ¢ ¤
ii) se δ < 0 =⇒ [1 + ( n − 1) δ] > 1 + N − 1 δ
Logo, a melhor alternativa é fazer n = N, isto é, fazer amostragem de
conglomerados em 1 estágio, tomando menos unidades primárias ( f1 deve
decrescer e f2 crescer).
C1
Vale o comentário: se f1 cresce e, como em geral >> 1, então o custo
C2
da pesquisa tende a crescer bastante, de modo que este fator não deve ser
ignorado na determinação dos tamanhos da amostra.
No exercício 3.2, o efeito de conglomeração é:
1 + ( n − 1) δ = 1 + (6 − 1)0, 201 = 1 + 5(0, 201) ∼
=2
Para baixar esse efeito de conglomeração, poderia reduzir a relação de
C1
custos ou partir para a definição de uma nova unidade primária com
C2
menor δ.
A eficiência da amostragem de conglomerados em 2 estágios em
relação à amostragem aleatória simples de mesmo tamanho é dada
por:
V (y AAS ) ∼ 1
Ef = =
V (y Ac2 ) 1 + ( n − 1) δ
3.2 Controle de variação de tamanho das UPAs

Se o coeficiente de correlação intraclasse é positivo, a subamostragem melhora
e eficiência, posto que se substitui N por n no efeito de conglomeração.
No entanto, a influência da variação do tamanho das unidades primárias
ainda persiste na estimação e total, uma vez que a variância do estimador:
³ ´ 2
M X 2 Ni − ni Si2
M
b 2 M − m Se
V YAc2 = M + N
M m m i=1 i Ni ni
ainda depende da variabilidade das unidades prrimárias.
Desse modo, as diversas formas de controle da variação de tamanho enun-
ciadas na amostragem de conglomerados em 1 estágio, podem ser repetidas
na amostragem de conglomerados em 2 estágios.
3.2.1 Probabilidades desiguais de seleção das unidades

primárias
Seja Pi a probabilidade de seleção da unidade primária i (i = 1, 2, · · · , M).
Valem as considerações feitas na Ac1, com relação à probabilidade pro-
porcional ao tamanho do conglomerado, definida por:
Ni
Pi = (i = 1, 2, · · · , M)
N
ou à probabilidade proporcional a uma medida de tamanho definida por:
Xi
Pi = (i = 1, 2, · · · , M)
X
Seleciona-se uma amostra de m unidades primárias de acordo com as
probabilidades de seleção Pi e com reposição.
Em cada uma dessas unidades primárias da amostra de 1o estágio, seleciona-
se uma subamostra com igual probabilidade de seleção e sem reposição.
Um estimador não viciado do total da característica y é dado por:
1 X Ni0
m
b p
YAc2 = y
m i=1 Pi0 i
onde:
Pi0 é a probabilidade de seleção associada à i-ésima unidade primária sele-

cionada (U Pi0 ). Pi0 é igual a algum dos Pk (k = 1, 2, · · · , M);
Ni0 é o número de unidades secundárias na UPi0 ;
n0i é o número de unidades secundárias selecionadas na UPi0 ;
yi é o total da característica y na subamostra de U Pi0 ;
yij é o valor da característica y na j-ésima unidade selecionada da U Pi0 .
0
ni
P
yij
yi j=1
yi = 0 = 0 (∀i = 1, 2, · · · , m)
ni ni
³ ´
Para mostrar b p
que YAc2 é não viciado, basta mostrar que: E YAc2 = Y b p
Ã !
³ ´ 1 X Ni0
m
E YbAc2
p
= E y
m i=1 Pi0 i
" Ã !#
1 X Ni0
m
= EU P10 ,··· ,U Pm0 E y |UPi0
m i=1 Pi0 i
" #
1 X Ni0
m
= EU P10 ,··· ,U Pm0 E (y i |UPi0 )
m i=1 Pi0
" # " #
1 X Ni0 0 1 X Yi0
m m
= EU P10 ,··· ,U Pm0 Y = EUP10 ,··· ,UPm0
m i=1 Pi0 i m i=1 Pi0
h i
= b P
EU P1 ,··· ,U Pm0 YAc1 = Y
0
Um estimador
³ ´ não viciado da média da característica y por unidade pop-
ulacional Y é dado por:
1 X Ni0
m
p
y Ac2 = y
Nm i=1 Pi0 i
Variância de YbAc2
p
³ ´ h ³ í
b p b p 0
V YAc2 = VU P10 ,··· ,UPm0 E YAc2 |UP1 , · · · , UPm + 0
h ³ í
+EU P10 ,··· ,U Pm0 V YbAc2
p
|UP10 , · · · , UPm0
" Ã !#
1 X Ni0
m
= VU P10 ,··· ,UPm0 E y |U Pi0 +
m i=1 Pi0 i
" Ã !#
1 X Ni0
m
+EU P10 ,··· ,U Pm0 V y |UPi0
m i=1 Pi0 i
Mas,
" Ã !# " #
1 X Ni0 1 X Ni0
m m
VUP10 ,··· ,UPm0 E y |U Pi0 = VU P10 ,··· ,U Pm0 E (y i |UPi0 )
m i=1 Pi0 i m i=1 Pi0
" #
1 X Ni0 0
m ³ ´
= VU P10 ,··· ,U Pm0 Y = V b
Y P
m i=1 Pi0 i Ac1
M µ ¶2
1 X Yi
= − Y Pi
m i=1 Pi
" Ã !# " Ãm µ ¶ !#
1 X Ni0 X N0 2
m
1 i
EUP10 ,··· ,UPm0 V y |U Pi0 = EU P10 ,··· ,U Pm0 V (y i |UPi0 )
m i=1 Pi0 i m2 Pi0
"Ã i=1
m µ ¶2 0 !#
1 X Ni0
0
Ni − n0i Si 2
= EU P10 ,··· ,U Pm0
m2 i=1 Pi0 Ni0 n0i
M µ ¶2
1 X Ni Ni − ni Si2
= m Pi
m2 i=1 Pi Ni ni
1 X Ni2 Ni − ni Si2
M
=
m i=1 Pi Ni ni
Logo,
³ ´ XM µ ¶2
1 X Ni2 Ni − ni Si2
M
b p 1 Yi
V YAc2 = − Y Pi +
m i=1 Pi m i=1 Pi Ni ni
³ ´
Um estimador não viciado de V YbAc2
p
é dado por:
³ ´ Xm µ 0 ¶2
1 Ni y i b p
v YbAc2
p
= − YAc2
m (m − 1) i=1 Pi0
³ ³ ´´ ³ ´
Prova que E v YbAc2
p
= V YbAc2
p
:
Ã m µ 0 ¶2 !
³ ³ ´´ 1 X Ni y i b p
E v YbAc2
p
= E − YAc2
m (m − 1) i=1 Pi0
Ãm µ !
1 X N 0 y ¶2 ³ ´2
= E i i
0
− m YbAc2
p
m (m − 1) P i
Ã mi=1 µ ¶2 !
1 X Ni0 y i ³ ´2
= E − mE YbAc2p
m (m − 1) i=1 Pi0
mas:
µ ¶2 " µ ¶2 #
Ni0 y i 0
Ni y i
E = EUP10 ,··· ,UPm0 E |UPi0
Pi0 Pi 0
" µµ ¶ ¶ µ µ 0 ¶¶2 #
0
Ni y i Ni y i
= EUP10 ,··· ,UPm0 V 0
|UPi0 + E 0
|UPi0
Pi Pi
 Ã !2 
µ 0 ¶2 0 0 02 0 0
Ni Ni − ni Si Ni Y i 
= EUP10 ,··· ,UPm0  0 0 0
+
Pi Ni ni Pi0
XM µ ¶2 XM µ ¶2
Ni Ni − ni Si2 Ni Y i
= Pi + Pi
i=1
Pi N i n i i=1
P i
³ ´2 ³ ´ h ³ í2 ³ ´
E YbAc2
p
= V YbAc2
p
+ E YbAc2
p
= V YbAc2
p
+Y2
então:
Ãm µ ¶2 !
³ ³ ´´ 1 X Ni0 y i ³ ´2
E v YbAc2
p
= E 0
− mE YbAc2p
m (m − 1)i=1
P i
Xm µ 0
¶2 ³ ´2
1 Ni y i m b p
E − E YAc2
m (m − 1) i=1 Pi0 m (m − 1)
ÃM µ ¶ M µ ¶2 !
1 X Ni 2 Ni − ni S 2 X Ni Y i
i
= Pi + Pi +
m − 1 i=1 Pi Ni ni i=1
Pi
1 ³ ³bp ´ ´
− V YAc2 + Y 2
m−1
ÃM µ ¶ M µ ¶2 !
1 X Ni 2 Ni − ni S 2 X Yi
i
= Pi + Pi − Y 2 +
P i
1 ³ ´
− V YbAc2
p
m−1
ÃM µ ¶ M µ ¶2 !
³ ³ ´´ 1 X Ni 2 Ni − ni S 2 X Yi X M
b p
E v YAc2 = i
Pi + Pi − Y 2
Pi
m−1 i=1
Pi Ni ni i=1
Pi i=1
1 ³ ´
− V YbAc2
p
m−1
ÃM µ ¶ M µ ¶2 !
1 X Ni 2 Ni − ni S 2 X Yi
i
= Pi + −Y Pi
P i
1 ³ ´
− V YbAc2
p
m−1
1 ³ ´ 1 ³ ´ µm − 1¶ ³ ´
= mV YbAc2 −
p
V YbAc2 =
p
V YbAc2
p
m−1 m−1 m−1
³ ´
= V YbAc2
p
Amostra autoponderada
A probabilidade de uma unidade secundária qualquer (USij ) pertencer
a amostra, num esquema de amostragem em 2 estágios com probabilidade
desigual no primeiro estágio e equiprobabilidade no segundo estágio é dada
por:
0
0 n
P {USij ∈ amostra} = mPi i0 ∀i, j
Ni
Com este plano amostral, a amostra é autoponderada se essa probabili-
n
dade é constante e igual a fração de amostragem geral . Tem-se, então:
N
0
0 n n
mPi i0 = =f
Ni N
P
m
Observe que, em média, n0i dá o tamanho pré-fixado, pois: se n0i =
i=1
nNi0
, então:
mNPi0
Ãm ! Ãm ! Ãm M !
X n X N0 n X X Ni
i
E n0i = E = Pi
i=1
mN i=1
Pi0 mN i=1 i=1 Pi
nmN
= =n
mN
Adaptação dos estimadores do total e da respectiva variância

A expressão do estimador de total YbAc2

p
pode ser reescrita como:
ni 0 0
m ni
1 X Ni0 1 X Ni0 1 X 1 XX
m m
YbAc2
p
= y = yij = yij
m i=1 Pi0 i m i=1 Pi0 n0i j=1 f i=1 j=1
mesma expressão já encontrada com equiprobabilidades nos 2 estágios.
³ ´ m µ 0
X ¶2
1 Ni y i b p
v YbAc2
p
= − YAc2
m (m − 1) i=1 Pi0
 2
n0i
1 X N X
m 0
=  i
0 0
yij − YbAc2
p 
m (m − 1) i=1 Pi ni j=1
 2
n0i n0i
1 X
m X X m X
= m yij −
1
yij 
m (m − 1) i=1 f j=1 f i=1 j=1
 0 2
ni n0i
m 2 Xm X 1 Xm X
=  yij − yij 
2
m (m − 1) f i=1 j=1 m i=1 j=1
 0 2
ni n0i
m X
m X 1 Xm X
=  yij − yij 
2
(m − 1) f i=1 j=1 m i=1 j=1
Numa determinada localidade com 53 povoados, selecionam-se 14, com

reposição e probabilidade de seleção proporcional à população do último
Censo. No povoado i da amostra, faz-se uma listagem das Ni0 fazendas de
gado e seleciona-se uma subamostra de fazendas com tamanho suficiente
1
para se obter uma fração geral de amostragem f = das fazendas, com o
100
objetivo de estimar o número total de cabeças de gado.
Considerando:
Pi0 a probabilidade de seleção do i-ésimo povoado selecionado;
Ni0 o número de fazendas no i-ésimo povoado selecionado;
n0i o número de fazendas na subamostra do i-ésimo povoado selecionado;

ni0
P
yi = yij o número de cabeças de gado na subamostra do i-ésimo povoado
j=1
selecionado; e a igualdade:
n0i n
mPi0 0
= =f
Ni N
obtém-se a fração de amostragem de 2o estágio:

µ ¶µ ¶
n0i 1 1 1
0
= 0
=
Ni 100 mPi 1.400Pi0
Feita a seleção dos 14 povoados e a listagem das fazendas, aplicou-se a
fração de amostragem de 2o estágio, obtendo-se as fazendas da subamostra e
levantando, em cada uma, o número de cabeças de gado.
n0i
Povoados (i) Pi0 Ni0 Ni0
n0i yi
1 0,0026 19 0,2747 5 2.200
2 0,0098 23 0,0729 2 820
3 0,0146 31 0,0489 2 760
4 0,0167 40 0,0428 2 1.100
5 0,0187 54 0,0382 2 600
6 0,0187 54 0,0382 2 510
7 0,0220 39 0,0325 1 300
8 0,0249 55 0,0385 2 1.200
9 0,0258 46 0,0277 1 500
10 0,0298 83 0,0240 2 880
11 0,0362 74 0,0197 1 300
12 0,0370 70 0,0193 1 410
13 0,0465 60 0,0154 1 570
14 0,0465 60 0,0154 1 350
Total - - - 25 10.500
0
m ni
1 XX
YbAc2
p
= yij = 100 (10.500) = 1.050.000 cabeças de gado.
f i=1 j=1
 0 2
³ ´ ni n0i
m X
m X 1 XX 
m
v YbAc2
p
=  yij − yij
(m − 1) f 2 i=1 j=1
m i=1 j=1
14
= (100)2 (3.305.100) = 3.559.230, 77 (1000)
13
r ³ ´
v YbAc2
p
= 188.659, 24
r ³ ´
³ ´ b p
v YAc2
b p
cv YAc2 = = 0, 1797
YbAc2
p
Estimação de proporção
e
Suponha que a população seja dividida nas classes A e A.
ei unidades,
A unidade primária i fica dividida nas classes, com Ai e A
respectivamente.
A subamostra de tamanho ni fica também dividida nas duas classes com
ai e e
ai unidades, em cada unidade primária i.
S
M
Ai
i=1
Um estimador não viciado para estimar a proporção PA = N
é dado
por:
1 X Ni0 1 X Ni0
m m
p
ppAc2 = y Ac2 = y i = pi
Nm i=1 Pi0 N m i=1 Pi0
onde:
a0
pi = 0i é a proporção de A na subamostra.
ni
Um estimador não viciado de V (ppAc2 ) é dado por:
Xm µ ¶2
1 Ni0
v (ppAc2 ) = p
pi − pAc2
m (m − 1) i=1 N Pi0
Se a amostra é autoponderada, ocorre a condição:
n0i n
mPi0 0
= =f
Ni N
logo:
1X 0
m
ppAc2 = a
n i=1 i
1 X ³m 0 m ´2
v (ppAc2 ) = p
a − pAc2
m (m − 1) i=1 n i
Exemplo 3.4
Considere o exercício 3.3. Suponha que as fazendas da subamostra foram

classificadas de acordo com o tipo de criação de gado: para corte ou não (
para leite e/ou reprodução). Deseja-se estimar a proporção das fazendas cujo
tipo de criação de gado é para corte e o coeficente de variação associado a
essa estimativa.
Os valores obtidos na subamostra foram:
Povoados No de fazendas No de fazendas com

da amostra na subamostra criação de gado para corte
1 5 3
2 2 1
3 2 1
4 2 0
5 2 2
6 2 1
7 1 0
8 2 1
9 1 0
10 2 0
11 1 0
12 1 0
13 1 0
14 1 1
Total 25 10
1 X 0 10
m
ppAc2 = a = = 0, 40
n i=1 i 25
1 X ³m 0
m ´2
v (ppAc2 ) = ai − ppAc2
m (m − 1) i=1 n
Ãm !
1 X ³ m 0 ´2
= a − m (ppAc2 )2
m (m − 1) i=1 n i
Ã m µ 0 ¶2 !
m X a (pp
)2
i
= − Ac2
m − 1 i=1 n m
Ãµ ¶ ¡ 10 ¢2 !
14 1
= (9 + 4 + 1 + 1 + 1 + 1 + 1) − 25
13 (25)2 14
µ ¶ µ ¶
14 18 100 14 18 (14) − 100
= − =
13 625 625 (14) 13 625 (14)
µ ¶ µ ¶ µ ¶
1 18 (14) − 100 1 18 (14) − 100 1 152
= = =
13 625 13 625 13 625
= 0, 0187076
q
v (ppAc2 ) = 0, 1367757
p
v (ppAc2 )
cv (ppAc2 ) = = 0, 342
ppAc2
3.2.2 Estratificação das unidades primárias e seleção

com probabilidades desiguais de seleção
A estratificação das unidades primárias é feita grupando em mesmo estrato
as unidades primárias de tamanhos aproximadamente iguais. A seleção
das unidades primárias, dentro de cada estrato é feita com probabilidade
proporcional ao tamanho.
O processo para definir os estimadores é muito simples. Basta consid-
erar as expressões do item anterior e adaptá-las a um estrato genérico h,
acrescentando aos símbolos um índice h (h=1,2,· · · , L).
Recorde que o estimador de Y num esquema com 2 estágios de seleção e
probabilidades desiguais de seleção no 1o estágio (sem considerar a estrati-
ficação das unidades de 1o estágio) e com reposição e equiprobabilidades no
2o estágio é dado por:
1 X Ni0
m
YbAc2
p
= y
m i=1 Pi0 i
No estrato h, o estimador do total do estrato h, Yh , é dado por:

mh
b p 1 X 0
Nhi
Yh.Ac2 = 0
y hi
mh i=1 Phi
conseqüentemente, o estimador de Y é dado por:
X X mh
1 X
L L 0
Nhi
YbAc2
p.est
= Ybh.Ac2
p
= 0
y hi
h=1 h=1
mh i=1 Phi
Recorde-se que a variância de YbAc2

p
é:
³ ´ M µ ¶2
1 X Yi 1 X Ni2 Ni − ni Si2
M
b p
V YAc2 = − Y Pi +
m i=1 Pi m i=1 Pi Ni ni
³ ´
b p
No estrato h, a variância do estimador do total do estrato h, V Yh.Ac2 ,
é dado por:
³ ´ Mh µ
X ¶2 Mh
b p 1 Y hi 1 X 2
Nhi 2
Nhi − nhi Shi
V Yh.Ac2 = − Yh Phi +
mh i=1 Phi mh i=1 Phi Nhi nhi
conseqüentemente, a variância de YbAc2

p.est
é dada por:
³ ´ X
L ³ ´
V YbAc2
p.est
= V Ybh.Ac2
p
h=1
X Mh µ ¶2 Mh
1 X X 1 X
L L 2 2
Yhi Nhi Nhi − nhi Shi
= − Yh Phi +
h=1
mh i=1 Phi h=1
mh i=1 Phi Nhi nhi
³ ´
O estimador da V YbAc2
p.est
é dado por:
³ ´ X
L Xm µ 0 ¶2
b p.est 1 Nhi y hi b p
v YAc2 = 0
− Yh.Ac2
h=1
mh (mh − 1) i=1 Phi
A probabilidade de uma unidade secundária qualquer do estrato h per-

tencer a amostra, num esquema de amostragem em 2 estágios é dada por:
0
n 0
mh Phi hi0
Nhi
Esta probabilidade pode ser constante no estrato ou variar de estrato para

estrato. , neste caso:
0
0n nh
mh Phi hi0 = (h = 1, 2, · · · , L)
Nhi Nh
ou ser constante para todos os estratos:

0
0n n
mh Phi hi0 = (h = 1, 2, · · · , L)
Nhi N
No primeiro caso, a amostra é autoponderada no estrato e no segundo

caso é autoponderada em geral.
3.2.3 Estimador de razão

Estuda-se agora o estimador de razão, tendo como característica auxiliar o
tamanho das unidades primárias, num esquema de amostragem de conglom-
erados em 2 estágios com equiprrobabilidade nos 2 estágios.
Sabe-se que a média por unidade secundária é:
P
M
Yi
i=1 Y
Y = =
P
M N
Ni
i=1
o que mostra que Y pode ser entendida como uma razão de duas médias.
Um estimador consistente de Y é obtido substituindo-se o numerador e
denominador por estimadores não viciados.
R
Desse modo, representando por y Ac2 esse estimador consistente, tem-se:
1 Pm
0 Pm
0
Ni y i Ni y i
R m i=1
y Ac2 = Pm = i=1
Pm
1 0 0
Ni Ni
m i=1 i=1
cuja variância é dada por:

³ ´ M − m S2 M µ ¶2
R eR 1 X Ni Ni − ni Si2
V y Ac2 = 2 +
MN m Mm i=1 N Ni ni
1 X 2³ ´2
M
2
SeR = N Yi−Y
M − 1 i=1 i
e um estimador consistente para essa variância é:
³ ´ m µ ¶2 m µ ¶2 0
R M − m X Ni0 ³ R
´2 1 X Ni0 Ni − n0i Si02
v y Ac2 = y i − y Ac2 +
Mm (m − 1) i=1 N Mm i=1 N Ni0 n0i
Estimador de razão para o total Y :

 
P
m
0
R  i=1 Ni y i 
b
YAc2 = MN y Ac2 = MN 
R 
 P m
0

Ni
i=1
e a variância de YbAc2
R
é dada por:
³ ´ ¡ ¢2 ³ R ´
V YbAc2
R
= MN V y Ac2
M X 2 Ni − ni Si2
2 M
2M − m SeR
= M + N
M m m i=1 i Ni ni
e um estimador consistente para essa variância é:
³ ´ 2
µ ¶µ ¶Xm ³ ´2
M M − m 1 R
v YbAc2 =
R
Ni02 y i − y Ac2 +
m M m − 1 i=1
M X 0 2 Ni0 − n0i s02
m
i
+ N
m i=1 i Ni0 n0i
M2 M
Supondo M >> m =⇒ >> , então a expressão acima pode ser
m m
aproximada para:
³ ´ M2 µM − m¶ µ 1 ¶ X m ³ ´2
R
v YbAc2 ∼
R
= Ni02 y i − y Ac2
m M m − 1 i=1
ou
³ ´ 2
2 seR
v YbAc2
R ∼
= M
m
com
1 X 02 ³ ´2
m
R
s2eR = Ni y i − y Ac2
m − 1 i=1
Sabe-se que a condição para que a amostra seja autoponderada é dada
pela igualdade:
m ni n
= =f
M Ni N
n
ou seja, todas as unidades secundárias têm a mesma probabilidade de
N
pertencer à amostra. Nesta condição, tem-se:
ni 0 ni 0
P
m P P
m P
yij yij
R N i=1 j=1 1 i=1 j=1
y Ac2 = =
n P m
0 f2 Pm
0
Ni Ni
i=1 i=1
n
sendo f2 = a fração de amostragem de 2o estágio.
N
Para o estimador da variância aproximada de
³ ´ s2
R
v y Ac2 ∼ = eR 2
N m
com M >> m e
1 X 02 ³ ´2
m
R
s2eR = Ni y i − y Ac2
m − 1 i=1
 2
P n0i
0 P
m
Xn0i Ni yij 
1 X Ni02 
m
i=1 j=1 
=  yij − 
02  P 0 
m
m − 1 i=1 ni  j=1 
Ni
i=1
 0
2
P
m ni
P
0
µ ¶2 m X n0i Ni yij 
1 mN X   i=1 j=1

=  yij − P
m 
m−1 nM i=1  j=1
0

Ni
i=1
ou
 0
2
P
m ni
P
0
³ ´ Xm X n0i Ni yij 
R s2
m  i=1 j=1
v y Ac2 ∼= eR =  yij − 
2
(m − 1) n2  P
m 
N m i=1  j=1 
0
Ni
i=1
Exemplo 3.5
Suponha que se deseja estimar o consumo médio semanal por domicílio
(em unidades de produto) de determinado produto para alimentação.
Dispõe-se de um mapa da localidade onde podem ser identificados 400
quarteirões, que serão considerados unidades primárias de amostragem. Sabe-
se que existem na localidade cerca de 26.000 domicílios dando uma média de
65 domicílios por quarteirão. Seleciona-se uma amostra autoponderada de
650 domicílios com 2 estágios de seleção e com equiprobabilidade em cada
1
estágio, tendo fixado a fração de amostragem do 1o estágio em , o que
8
implicou na seleção de 50 quarteirões.
n 650 1
Neste caso f = = = . Logo a fração de amostragem do 2o
N 26.000 40
f 1
estágio é dada por: f2 = = .
f1 5
Sabendo-se que:
P
m
i) o número de domicílios nos quarteirões da amostra é Ni0 = 3.152;
i=1
ii) o número de domicílios selecionados na subamostra dos quarteirões

P
m
selecionados é n0i = 710;
i=1
iii) o total de unidades consumidas nos domicílios selecionados na sub-

P n0i
m P
amostra dos quarteirões selecionados é yij = 1.910; e que
i=1 j=1
 0
2
P
m ni
P
0
 n0 Ni yij 
P
m Pi i=1 j=1
iv)  yij −  = 4.500.
 P
m 
i=1 j=1 0

Ni
i=1
a estimativa do consumo médio semanal por domicílio é dada por:

ni 0
P
m P
yij
R 1 i=1 j=1 1.910
y Ac2 = P
m = (5) = 3, 03
f2 0 3.152
Ni
i=1
e a estimativa aproximada da variância é dada por:
 0
2
P
m ni
P
0
m X Ni yij 
0
³ ´ m X  i
n
i=1 j=1
R  
v y Ac2 ∼= yij −
(m − 1) n2 i=1 
 j=1
P
m
0


Ni
i=1
50
= (4.500) = 0, 0091
49 (710)2
r ³ ´
R
³ ´ v y Ac2
R
cv y Ac2 = R
= 0, 031
y Ac2
3.3 Exercícios
3.3.1 Compare a precisão de uma amostra de conglomerados em 2 estágios
(Ac2) com a fração de subamostragem de 50% com a de uma amostra
de conglomerados em um estágio (Ac1)de igual tamanho, supondo que
o tamanho médio do conglomerado é de 50 unidades e que o coeficiente
de correlação intraclasse é igual a 0,1.
Indicar se há ganho ou perda relativa da Ac2 em relação a Ac1.
(Devem ser usadas as fórmulas aproximadas relacionando as variâncias

da Ac1 com a amostra aleatória simples (AAS), e da Ac2 com a AAS).

se estima que há um total de 8.500 domicílios. Deseja-se estimar o
número total de domicílios alugados no bairro.
a) Represente esquematicamente a população de interesse, definindo

adequadamente:
• unidades primárias; e
• unidades secundárias.
b) Para uma característica genérica y, defina:
• a notação dos parâmetros das unidades primárias (total, mé-
dia e variância); e
• a notação dos parâmetros da população (total, total médio por
unidade primária, média por unidade da população e variância
global).
c) Defina um esquema de amostragem de conglomerados em 2 está-
gios que permita selecionar uma amostra probabilística das unidades
da população com o objetivo de estimar o total de domicílios alu-
gados no bairro.
d) Considerando o esquema apresentado em c), obtenha um esti-
mador não viciado para o total de domicílios alugados no bairro,
e uma expressão para a variância desse estimador.
3.3.3 Deseja-se selecionar uma amostra de m conglomerados, de uma pop-

ulação de 90 conglomerados, nos quais será selecionada uma sub-
amostra de n unidades em cada conglomerado da amostra. Será usada
amostragem aleatória simples sem reposição em ambos os estágios para
estimar a média por unidade elementar de uma dada característica.
Assume-se que a função custo é da forma:
Ct = C0 + C1 m + C2 mn
Dado que Ct = 1.000, C0 = 300, C1 = 9 e C2 = 1 encontre os val-

ores ótimos do número de conglomerados da amostra e do número de
unidades a serem selecionadas por conglomerado, sabendo-se que:
2
Sd2 = 49, 5 S e = 9, 045 N = 20
3.3.4 Numa grande cidade, um bairro continha 100 quarteirões dos quais 10
foram selecionados com probabilidade proporcional a um dado tamanho,
com reposição. Uma amostra autoponderada foi selecionada com fração
geral f = 2%. Utilize os dados observados, mostrados a seguir:
Quarteirão no de pessoas dos no de cômodos nos domi-

na amostra domicílios selecionados cílios selecionados nos
nos quarteirão da amostra quarteirões da amostra
1 115 60
2 80 52
3 82 58
4 93 56
5 105 62
6 109 51
7 130 72
8 93 48
9 109 71
10 95 58
Total 1.011 588
a) Estime o no total de pessoas no bairro e o respectivo coeficiente

de variação.
b) Estime o no total de comôdos dos domicílios do bairro e o respec-
tivo coeficiente de variação.
c) Estime o no médio de pessoas por cômodo nos domicílios do bairro.

se estima que há um total de 9.000 domicílios. Deseja-se estimar o
número total de domicílios alugados no bairro. De um censo anterior
se conhece o número de domicílios por quarteirão. O orçamento e o
tempo disponíveis para fazer a pesquisa permitem que se realize cerca
de 300 entrevistas.
a) Defina um esquema de amostragem de conglomerados em 2 está-

gios que permita selecionar uma amostra probabilística das unidades
da população com o objetivo de estimar o total de domicílios alu-
gados no bairro.
b) Considerando o esquema apresentado em a), apresente um esti-
mador não viciado para o total de domicílios alugados no bairro,
e uma expressão para a variância desse estimador.
3.3.6 De uma população de 100 conglomerados de 40 elementos cada um

foi selecionada uma amostra de 2 estágios, com seleção aleatória sem
reposição em cada estágio. Foram selecionadas 6 unidades primárias
no primeiro estágio e a fração de subamostragem é de 10%.
Sabendo-se que para uma determinada característica y:
P
m
yi = 84 s2d = 1, 33 s2e = 1338, 65
i=1
a) Calcule a estimativa de total para a característica y e o respectivo

coeficiente de variação.
b) Calcule a participação da componente da variância devida ao 1o
estágio.
c) O que você faria para diminuir a contribuição dessa componente de
variância devida ao 1o estágio?
3.3.7 Uma pesquisa é realizada com a finalidade de fornecer informações so-

bre a produção de uma certa planta que só pode ser produzida com
autorização do governo. As permissões concedidas no início da estação
de cultivo foram usadas como fonte de informação. Essas permissões
são concedidas pelas prefeituras dos municípios. A amostra será feita
em 2 estágios: primeiramente seleciona-se uma amostra de municípios;
em seguida, os entrevistadores visitarão as prefeituras dos municípios
selecionados, preparando então uma lista dos produtores que têm per-
missão e selecionarão uma amostra de produtores. A seguir, visitarão
as fazendas coletando os dados necessários. Como nem todos os mu-
nicípios possuem produtores dessa planta, cada município selecionado
terá um entrevistador exclusivo.
A seguir você encontrará alguns itens que compõem o custo da pesquisa.

Indique com um X na coluna apropriada se os custos podem ser con-
siderados parte do custo geral, custo de unidade de primeiro estágio ou
custo de unidade de segundo estágio. (Marque um único X para cada
item de custo apresentado).
Item (descrição) Geral 1o estágio 2o estágio
a) Impressão dos questionários.
b)Treinamento dos entrevistadores.
c) Obtenção da lista de municípios

que fornecem permissão.
d) Viagem aos municípios que for-

necem permissão selecionados, para
selecionar amostra de produtores.
e) Seleção da amostra de municípios

com permissão.
f) Obtenção de informação dos pro-

dutores selecionados.
g) Verificação do trabalho de campo

dos entrevistadores, feita pelos super-
visores.
h) Crítica dos questionários coletados.
i) Preparação de um programa para ta-

bulação dos resultados.
j) Preparação e divulgação dos resulta-

dos finais da pesquisa.
3.3.8 Uma população está formada por N unidades elementares agrupadas

em 50 conglomerados de tamanho desiguais Ni (i = 1, 2, · · · , M). O
P
M
valor de N = Ni é conhecido e igual a 1.000. Com objetivo de es-
i=1
timar a proporção de unidades elementares pertencentes a uma certa
classe, foi decidido utilizar uma amostra de conglomerados com sub-
amostragem. Em ambos os estágios foi empregado o procedimento de
seleção com probabilidades iguais sem reposição.
No 1o estágio foram selecionados 5 conglomerados com os seguintes

valores de Ni : 6, 10, 8, 20 e 60. No 2o com fração amostral f2i = N4i ,
foram obtidos os seguintes valores para o número de elementos que
pertencem à classe em questão: 1, 3, 2, 2 e 3.
São fornecidos, ainda, os seguintes resultados:
1 X 0
5
2
s2e = (Ni y i − y Ac2 ) = 318, 67
m − 1 i=1
X
5
Ni0 − n0i s2i
Ni02 = 118, 78
i=1
Ni0 n0i
X
5 ³ ´2
R
Ni02 y i − y Ac2 = 53, 20
i=1
a) Dê a probabilidade de que a unidade elementar j do conglom-

erado i pertença a amostra e determine o número de unidades
elementares selecionadas em cada conglomerado.
b) Estime a proporção de unidades elementares que pertençam à
classe e o respectivo coeficiente de variação.
c) Dê as estimativas definidas em b) utilizando o estimador de razão,
adotando o tamanho dos conglomerados como variável auxiliar.
d) Comente as vantagens e desvantagens do estimador usado em c)
em relação ao usado em b).
3.3.9 Para estudar as condições de vida dos trabalhadores que vivem em uma
área industrial, foi selecionada uma amostra estratificada com 2 estágios
de seleção. Em cada estrato da amostra foram selecionadas 4 fábricas
com probabilidade proporcional ao número de trabalhadores obtidos
de um período anterior e de cada fábrica selecionada foi selecionado
aleatoriamente um certo número de trabalhadores, totalizando uma
amostra de 1000 trabalhadores.
Sabe-se que foram definidos 4 estratos e que o número de trabalhadores
conhecidos de um período anterior em cada estrato é dado por:
N1 = 5.896 N2 = 43.096 N3 = 31.625 N4 = 10.774

P4
Nh = 91.391
h=1
Determine o número de trabalhadores a serem selecionados em cada

fábrica de tal modo a ter uma amostra autoponderada.
3.3.10 Explique qual a vantagem de se fazer uma amostra de conglomera-

dos em 2 estágios ao invés de uma amostra de conglomerados em um
estágio.
Capítulo 4
Conglomerados em 3 estágios
4.1 Introdução
A dificuldade de cadastramento para seleção da amostra se reduz à medida
em que aumenta o número de estágios. Mas no entanto, à medida em que
aumenta o número de estágios, mais se torna complicada a expressão da
variância do estimador.
Seleciona-se uma amostra de r unidades primárias. Seja U Pi0 a i-ésima
unidade primária da amostra. De cada unidade primária da amostra seleciona-
se uma amostra de unidades secundárias. Desse modo na UPi0 seleciona-se
uma amostra de m0i unidades secundárias. De cada unidade secundária da
00
amostra seleciona-se uma amostra de unidades terciárias. Assim, na U Sij
00
seleciona-se uma amostra de nij unidades terciárias.
Associado à U Tijk (unidade terciária) a observação yijk ,obtém-se a amostra
final, constituída pelo conjunto:
n ¯ o
¯ 0 00
yijk ¯ i = 1, 2, · · · , r; j = 1, 2, · · · , mi ; k = 1, 2, · · · , nij
sendo: 0
mi
X
r X
00
n= nij
i=1 j=1
4.2 Seleção com probabilidades desiguais

Seja Pi a probabilidade de seleção da unidade primária UPi (i = 1, 2, · · · , R) .
De cada U Pi0 da amostra selecionam-se m0i unidades secundárias, tendo a U Sij
00
probabilidade de seleção Pij . Finalmente, da USij da amostra selecionam-se
00
nij unidades terciárias com equiprobabilidade.
161
4.2.1 Estimador não viciado de Y

Considerando o processo em 2 estágios, o estimador do total da UPi0 é dado
por:
mi 0
b p 1 X Nij00
Yi = 0 00 y
mi j=1 Pij ij
logo, o estimador não viciado de Y é dado por:
mi 0
1 X 1 bp 1 X 1 1 X
r r
Nij00
YbAc3
p
= Y = 00 y
r i=1 Pi0 i r i=1 Pi0 m0i j=1 Pij ij
Caso particular de equiprobabilidade no 1o e 2o estágios:
1 00 1
Pi0 = e Pij = 0
R Mi
mi 0
R X Mi0 X
r
YbAc3 = 0
Nij00 y ij
r i=1 mi j=1
Amostra autoponderada (caso genérico)

00
nij
0 0 00
A probabilidade da UTijk pertencer a amostra é dada por: rPi mi Pij 00
Nij
A amostra será autoponderada se esta probabilidade for constante e igual
a fração geral de amostragem, isto é:
00
0 00 nij n
rPi0 m0i Pij 00 = =f
Nij N
Neste caso, o estimador YbAc3

p
assume a mesma forma do estimador YbAc3 :
00
mi 0 n
1 XX X
r ij
YbAc3
p
= YbAc3 = yijk
f i=1 j=1 k=1
O capítulo seguinte apresenta alguns métodos especiais para a estimação

das variâncias de estimadores que são em geral aplicados em desenhos amostrais
complexos.
4.3 Exercícios
4.3.1 Os estudantes de 1o grau de um determinado município estão distribuí-
dos em 15 escolas, com uma média de 20 turmas por escola e estima-se
que há um total de 10.000 estudantes. Deseja-se estimar a proporção
de alunos aprovados no último ano no município.
a) Represente esquematicamnete a população de interesse, definido ad-

equadamente:
- unidades primárias;
- unidades secundárias;
- unidades terciárias;
- a característica y.
b) Para uma característica genérica y, defina:
- a notação dos parâmetros para uma dada unidade primária (to-
tal, média por unidade secundária e média por unidade da
população);
- a notação dos parâmetros da população (total, média por unidade
primária, média por unidade secundária e média por unidade
da população).
c) Defina um esquema de amostragem de conglomerados em 3 estágios
que permita selecionar uma amostra probabilística das unidades
da população com o objetivo de estimar a proporção de alunos
aprovados no último ano no município.
d) Considerando o esquema apresentado em c), obtenha um estimador
não viciado para a proporção de alunos aprovados no último ano
no município.
Capítulo 5
Estimação de variâncias
5.1 Porque é importante estimar variâncias?

Em amostragem, a estimação de variâncias é uma componente essencial da
abordagem de inferência utilizada: sem estimativas de variância, não se terá
indicação da precisão das estimativas.
Tentação: é fácil ”esquecer” que os resultados das pesquisas são baseados
apenas em uma amostra da população, e portanto sujeitos ao erro amostral.
Com uma estimativa de variância para cada estimativa de parâmetro de
interesse, é fácil obter intervalos de confiança e fazer inferências estatísticas
adequadas:
Estimativas de variância são também essenciais para comunicar aos usuários
da pesquisa sobre a qualidade e precisão dos resultados.
Algumas vezes, problemas inesperados podem ser detectados mediante
análise das estimativas de variância: valores suspeitos (”outliers”), celas
raras, etc.
5.2 Problemas para estimar variâncias

Para os casos ”regulares”, estimadores de variância estão disponíveis nos
livros-texto de Amostragem. Entretanto, os pacotes estatísticos tradicionais
(SAS, SPSS, BMDP, MINITAB, etc.) não fornecem estimadores de variância
diretamente, nem mesmo para planos amostrais comuns tais como AAS e
AES.
Para alguns planos amostrais, as probabilidades de inclusão conjuntas (de
segunda ordem) podem ser nulas (como na amostragem sistemática) ou difí-
ceis de calcular (como no caso de alguns planos amostrais com probabilidades
desiguais).
165
166 CAPÍTULO 5. ESTIMAÇÃO DE VARIÂNCIAS
Em muitos casos, estimadores dos parâmetros de interesse são ”não lin-

eares” (isto é, não são médias, totais ou proporções). Exemplos incluem
razões, correlações, coeficientes de regressão, quantis de distribuições, etc.
Alguns estimadores de variância podem fornecer valores negativos (como
é o caso do estimador de variância de Horvitz-Thompson em alguns planos
amostrais com probabilidades desiguais).
5.3 Métodos para estimar variâncias

Wolter (1985) enfatiza ambas a teoria e aplicações de vários métodos para
estimar variâncias.
5.3.1 Método de Linearização de Taylor ou δ-método

Um dos primeiros métodos, desenvolvido para fornecer estimadores de var-
iância para estimadores não lineares.
A hipótese básica deste método é que o parâmetro de interesse possa ser
representado como uma função de K totais populacionais, isto é:
θ = f (Y1 , · · · , YK )
P
N
onde YK = yik são totais poulacionais para váriáveis de pesquisa
i=1
yk , k = 1, · · · , K.
O estimador amostral do parâmetro θ é dado por
b
θ = f (Yb1 , · · · , YbK )
Pn y
onde YbK =
ik
é o estimador de Horvitz-Thompson do total Yk , k =
i=1 π i
1, ..., K.
Quando f é uma função linear, é fácil obter expressões de variância para
b
θ. Isto ocorre por causa da linearidade de f , já que neste caso
X
K
θ = a0 + ak Yk
k=1
e consequentemente
X
K
b
θ = a0 + ak Ybk
k=1
5.3. MÉTODOS PARA ESTIMAR VARIÂNCIAS 167
Portanto, neste caso podemos usar propriedades de combinações lineares

de variáveis aleatórias para obter
Ã !
³ ´ X
K
V b
θ = V a0 + ak Ybk
k=1
X
K ³ ´ X K X
K
= a2k V b
Yk + ak aj COV (Ybk , Ybj )
k=1 k=1 j6=k
Dessa forma, um estimador para a variância de pode ser facilmente obtido

substituindo as variâncias e covariâncias na expressão acima por seus respec-
tivos estimadores não viciados, levando a:
³ ´ XK ³ ´ X K X
K
b
v θ = 2 b
ak v Yk + ak aj cov(Ybk , Ybj )
k=1 k=1 j6=k
Para funções de fato não lineares, a idéia é aproximar o estimador b θ por

b
uma quantidade linearizada θL , obtida mediante expansão da função f em
série de Taylor em torno do ponto (Y1 , · · · , YK ), e desprezando-se o termo do
resto, isto é:
XK ³ ´
b ∼ b
θ = θL = θ + ak Ybk − Yk
k=1
onde
∂f (Yb1 , · · · , YbK ) ¯¯
ak = ¯Ye1 ,··· ,YeK =Y1 ,··· ,YK
∂ Ybk
para k = 1, ..., K.
Para amostras grandes, o estimador não linear b θ terá comportamento
b
semelhante ao do estimador linearizado θL , e portanto podemos usar a var-
iância deste estimador linearizado como aproximação para a variância do
estimador bθ . Isto é:
³ ´ ³ ´2 ³ ´2
V b
θ = E b θ−θ ∼ =E b θL − θ
ÃK !
X ³ ´ 2
= E ak Ybk − Yk
k=1
X
K ³ ´ X K X
K
= a2k V b
Yk + ak aj COV (Ybk , Ybj )
k=1 k=1 j6=k
A variância aproximada de b θ pode então ser obtida, bastando para isso

calcular as derivadas da função f e substituir na expressão acima.
Um estimador para a variância de b θ pode então ser facilmente obtido
usando
³ ´ XK ³ ´ X K X
K
v b
θ = a2k v Ybk +
b b aj cov(Ybk , Ybj )
ak b
k=1 k=1 j6=k
onde os valores de b ak são as estimativas das derivadas ak obtidas substi-

tuindo os totais Y1 , · · · , YK pelas respectivas estimativas Yb1 , · · · , YbK .
Notas:
1. Linearização de Taylor pode ser trabalhosa, pois para cada parâmetro

ou estimador de interesse é necessário calcular derivadas e fórmulas
específicas.
2. Muitas estatísticas de interesse não podem ser facilmente escritas como
funções lineares de totais, como por exemplo a mediana e os quantis de
uma distribuição.
3. Apesar disso, vários pacotes computacionais usam este método para es-
timar variâncias e desvios padrões para diversas estatísticas, tais como
médias e totais para domínios, razões, coeficientes de regressão, e até
mesmo quantis.
5.3.2 Método do Conglomerado Primário (Ultimate Clus-

ter - Hansen et al, 1953)
O termo conglomerado primário (ultimate cluster) é usado para denotar o
agregado de unidades incluídas na amostra de uma unidade primária.
O valor agregado da característica y para o i-ésimo conglomerado primário
é yi ;e o tamanho do i-ésimo conglomerado primário é ni .
Esta definição de conglomerado primário é válida para qualquer número
de estágios de amostragem.
Supondo que um município é amostrado como unidade primária e um
conjunto de 5 setores contendo 200 domicílios cada é selecionado do município
como unidades secundárias e 20 domicílios são selecionados de cada setor
selecionado. O conglomerado primário consiste do total da amostra de 100
domicílios selecionados do município.
A idéia central deste método para estimar variâncias de médias e totais,
em planos amostrais de múltiplos estágios, é considerar apenas a variação entre
informações disponíveis a nível das unidades primárias de amostragem (UPAs),
isto é, a nível dos conglomerados primários, e supor que estes tivessem sido
selecionados por amostragem com reposição da população de UPAs.
Trata-se de idéia simples, porém bastante poderosa, pois permite aco-
modar grande variedade de planos amostrais estratificados, conglomerados
e com probabilidades desiguais (com ou sem reposição), tanto das unidades
primárias como das demais unidades de amostragem.
O requisito fundamental para aplicação deste método é que estejam dispo-
níveis estimadores não viciados dos totais da(s) variável(is) de interesse para
cada um dos conglomerados primários selecionados, e que pelo menos dois
destes sejam selecionados em cada estrato (caso esta condição não seja sat-
isfeita para alguns estratos, estes podem ser agrupados).
Embora este método tenha sido proposto para estimar variâncias de mé-
dias e totais em planos amostrais de múltiplos estágios (portanto complexos),
pode ser também aplicado em combinação com Linearização de Taylor para
obter estimativas de variâncias para estatísticas não lineares que possam ser
escritas como funções de totais.
Este método fornece, juntamente com a Linearização de Taylor, a base
metodológica de vários pacotes especializados para estimação de variâncias,
tais como SUDAAN, STATA, CENVAR e PC-CARP, entre outros.
Considere um plano amostral em vários estágios, com mh ≥ 2 unidades
primárias selecionadas do estrato h, h = 1, ..., L.
Denote por π hi a probabilidade de inclusão na amostra da i-ésima UPA
(conglomerado primário) do estrato h, e por Ybhi um estimador não viciado
do total Yhi da característica de interesse y na i-ésima UPA do estrato h,
h = 1, ..., L.
P
L MPh
Um estimador não viciado do total populacional Y = Yhi é dado
h=1 i=1
por
XL Xmh
Ybhi
YbCP =
h=1 i=1
πhi
e um estimador não viciado da variância correspondente é dado por
Ã !2
³ ´ XL
mh X
m h
Ybhi Ybh
v YbCP = −
h=1
mh − 1 i=1 π hi mh
P
mh Ybhi
onde Ybh = para h = 1, ..., L.
i=1 π hi
Embora muitas vezes a seleção das unidades primárias seja feita sem
reposição, o estimador de Conglomerados Primários aqui apresentado pode
fornecer uma aproximação razoável da variância de aleatorização desejada.
Isso ocorre porque planos amostrais sem reposição geralmente são mais
eficientes que planos de mesmo tamanho com reposição.
Esta aproximação é bastante usada na prática por sua simplicidade, em
comparação com os estimadores de variância que procuram incorporar todos
os estágios do plano amostral.
5.3.3 Métodos de Replicação

A idéia de métodos de replicação para estimar variâncias em Amostragem
não é nova, e foi primeiramente proposta por Mahalanobis em 1939.
O segredo é construir sua amostra de tamanho n mediante a seleção de
n
G amostras independentes de tamanho cada uma, usando o mesmo plano
G
amostral, onde G é o número de replicações.
Então, se θ é o parâmetro alvo, e b
θg é um estimador não viciado baseado
na réplica g, é imediato notar que:
1 Xb
G
b
θR = θg
G g=1
é um estimador não viciado de θ e
³ ´ G X ³b
G ´2
v b
θR = θg − b
θR
G − 1 g=1
é um estimador não viciado da variância do estimador de replicação b θR .

O resultado acima vale para qualquer plano amostral adotado para sele-
cionar cada réplica.
A abordagem de replicação é bastante geral. É válida para qualquer
estimador, não somente para aqueles que podem ser escritos como funções
de totais.
Aplicações práticas ”exatas” dessa técnica são raras, entretanto, devido
as seguintes causas:
a) algumas vezes é caro e inconveniente selecionar de fato G amostras

independentes segundo o mesmo plano amostral;
b) Se G for pequeno, o estimador de variância pode ser instável.
Aplicação: US Consumer Price Index (CPI) - usa 3 réplicas de um plano

amostral com estratificação detalhada e múltiplos estágios de conglomeração.
Método dos Grupos Aleatórios Algumas vezes, a amostra é subdividida

em grupos após a seleção. Se as amostras nos diversos grupos puderem ser
consideradas como ”aproximadamente independentes”, então o estimador
de variância proposto serve como uma aproximação para a variância do esti-
mador.
Note que a divisão da amostra em grupos deve considerar o plano amostral.
Sob planois amostrais estratificados, há duas alternativas:
a) aplicar o método de grupos aleatórios para estimar as variâncias dentro

dos estratos; ou
b) aplicar o método de grupos aleatórios à amostra como um todo, preser-

vando a estratificação quando da divisão da amostra em grupos - esta
opção requer amostras grandes o bastante em cada estrato para permi-
tir a subdivisão em G grupos.
Freqüentemente as UPAs são alocadas nos grupos aleatórios carregando

todas as unidades amostrais a elas subordinadas.
Um outro estimador de variância empregado com o método de grupos
aleatórios é o que considera diferenças em relação a um estimador de amostra
completa bθ, a saber:
³ ´ G X ³b
G ´2
v b
θ = θg − b
θ
G − 1 g=1
Método Jackknife Este método foi inventado como uma técnica para
redução de vício na estatística clássica (Quenouille, 1949, 1956).
A idéia consiste em dividir a amostra em G grupos mutuamnete ex-
n
clusivos, cada um de tamanho . Em seguida, são calculados os ”pseudo-
G
valores” b
θ(g) dados por
b
θ(g) = Gb
θ − (G − 1) b
θg
onde, bθg é uma estimativa de θ obtida da amostra após a exclusão das

unidades do grupo g, usando a mesma forma funcional que se teria aplicado
com a amostra completa (no caso, o estimador bθ).
Planos amostrais estratificados não estão cobertos imediatamente pela
descrição acima. A situação é mais complicada nesse caso. Consulte Wolter
(1985).
Estima-se a variância usando um dos estimadores:
³ ´ 1 X³
G ´2
vJ1 b
θ = b
θ(g) − b
θJK
G (G − 1) g=1
³ ´ 1 XG ³ ´2
vJ2 b
θ = b
θ(g) − b
θ
G (G − 1) g=1
1 PG
onde b
θJK = b
θ(g) .
G g=1
Notas:
1. O estimador de Jackknife b θJK de θ poderia ser utilizado como um

estimador alternativo ao estimador de amostra completa bθ.
³ ´ ³ ´
2. vJ2 bθ é um estimador mais conservador da variância do que vJ1 bθ .
3. Freqüentemente se toma n = G e se elimina uma observação da amostra

de cada vez.
4. Com planos amostrais de múltiplos estágios, eliminam-se UPAs inteiras

da amostra de cada vez. Isto é, se uma UPA é excluída, excluem-se ao
mesmo tempo todas as unidades a ela subordinadas.
Justificativas para o estimador Jackknife de variância:
a) quando a estatística for linear, os estimadores de variância coincidem

com estimadores usuais;
b) evidência empírica (limitada).
5.4 Sistemas para estimação de variâncias

A maior parte das pesquisas realizadas por agências de estatísticas oficiais
usam alguma forma de plano amostral estratificado em múltiplos estágios.
Cálculos de variâncias, mesmo para estimadores lineares, podem se tornar
trabalhosos de programar.
Programas desenvolvidos ”sob medida” custam mais caro e aumentam
risco de erros e prazos de obtenção de resultados.
Alternativa: usar pacotes prontos.
Problema: pacotes padrões (SAS, SPSS, BMDP, MINITAB, etc.) calcu-
lam variâncias supondo que as observações amostrais são IID (independentes
5.4. SISTEMAS PARA ESTIMAÇÃO DE VARIÂNCIAS 173
e identicamente distribuídas), e portanto IGNORANDO a natureza complexa

do plano amostral empregado para obter os dados.
Isto geralmente levaria a obter estimativas dos desvios padrões severa-
mente viciadas. Em alguns casos, a subestimação das variâncias pode ser
bastante grande, especialmente com planos amostrais muito conglomerados.
Solução: usar pacotes especializados para estimação de variâncias em
amostras complexas.
Alguns pacotes atualmente disponíveis incluem:
• SUDAAN (Research Triangle Institute)
• WESVARPC (Westat Inc.)
• GES (Statistics Canada)
• STATA (Stata Corporation)
• CENVAR (US Bureau of Census)
• Biblioteca ADAC (Análise de Dados Amostrais Complexos) do Sistema

R (Coordenação de Métodos e Qualidade / Diretoria de Pesquisas /
IBGE - Prof. Djalma Galvão Pessoa)
Vantagens de usar pacotes especializados prontos incluem:
- cálculo de estimativas para proporções, médias e totais e seus desvios

padrões facilmente tratados;
- desvios padrões disponíveis para estatísticas tais como razões de mé-

dias, médias de domínios e suas diferenças, coeficientes de regressão,
correlações, etc.;
- algoritmos numéricos exaustivamente testados, reduzindo as chances

de erros de cálculo;
- computação eficiente;
- usuário pode se concentrar no que calcular, e não em como calcular;
- mais barato que desenvolvimento local;
- testes de hipóteses e p-valores também disponíveis.
Desvantagens de usar pacotes especializados prontos incluem:

- abrangência limitada - pacotes não podem fazer tudo;
- pacotes não avaliam estimativas, apenas calculam;
- integração com outros pacotes pode ser difícil;
- necessário investir na aquisição e manutenção da licença do pacote,

mais treinamento do pessoal usuário;
- resultados produzidos precisam ser editorados antes de servir para pub-

licação.
Conclusões
- Vantagens devem mais que compensar desvantagens.
- Uso de pacotes especializados para estimação de variâncias é altamente

recomendável.
- Você provavelmente não consegue fazer melhor sem pacotes, dadas re-
strições de tempo e recursos.
- Poupe seu tempo e esforço para melhorias verdadeiras do processo de

pesquisa.
Capítulo 6
Dupla amostragem
6.1 Descrição da técnica
Como visto, em muitos casos é conveniente o uso de informações adicionais

sobre uma variável auxiliar, que nos permite melhorar a precisão das esti-
mativas. Vimos por exemplo, como a estratificação produz amostras mais
representativas, e como se pode obter estimadores mais precisos; o mesmo
ocorre, sob certas condições, com os estimadores de razão e com o uso de
probabilidades desiguais de seleção.
Nestes casos a teoria estudada até aqui supõe que é conhecida a infor-
mação prévia para a formação dos estimadores mencionados. Na prática
pode não ser viável, então coloca-se a possibilidade de selecionar uma 1a
amostra, relativamente grande, em que com um baixo custo pode-se obser-
var uma ou várias características gerais das unidades que nos proporcione
a(s) informação(ões) que necessitamos.
Em uma 2a fase selecionamos uma subamostra da 1a , em que observamos
a(s) característica(s) objeto de estimação. Esta técnica é conhecida como
dupla amostragem ou amostragem em 2 fases.
A dupla amostragem (ou amostragem em duas fases) pode ser general-
izada para qualquer número de fases, dando lugar à amostragem multifásica.
Na amostragem multifásica se utiliza as mesmas unidades de amostragem
em todas as fases, diferentemente da amostragem em múltiplos estágios onde
há uma hierarquia das unidades de amostragem que variam de estágio para
estágio.
175
176 CAPÍTULO 6. DUPLA AMOSTRAGEM
6.2 Considerações sobre o custo

É evidente que a conveniência desta técnica de amostragem depende dos
custos, se a observação da característica que nos interessa não tem custo,
ou é muito baixo, tomaríamos uma amostra do tamanho necessário para a
precisão desejada e com ela faríamos as estimações.
Suponha que dispomos de um pressuposto custo total C; que o custo por
unidade da 1a amostra de tamanho n0 é c0 ; e que o custo por unidade da 2a
amostra de tamanho n << n0 é c (c0 << C).
Nestas condições temos:
se selecionarmos uma só amostra: C = c n0 ; e
se fizermos dupla amostragem: C = c0 n0 + c n
igualando os custos totais, tem-se:
c0 0
n0 = n + n
c
Logo, com a técnica de dupla amostragem a observação efetiva se faz com
uma amostra de tamanho n, menor que n0 , que corresponde a uma amostra
aleatória simples em uma fase com o mesmo custo total.
c0
Por exemplo, se = 0, 1, o tamanho n0 = 1.000 é equivalente aos tama-
0
C
nhos n = 400 e n = 6.000. A diminuição de n0 − n = 600 unidades no
tamanho da amostra efetiva produzirá uma perda em precisão.
A questão que se coloca é decidir se compensa a diminuição do tamanho
efetivo da amostra, com o aumento de informação adquirida na 1a fase. Para
isso, deve-se calcular a variância correspondente com a aplicação da dupla
2
amostragem e compará-la com a de uma amostra de uma só fase ( σn0 , no caso
da estimação da média com amostragem aleatória simples).
c0
É óbvio que quanto menor for a relação mais favorável é o uso da dupla
C
amostragem, mas não é o único parâmetro a ser considerado.
Em amostragem com reposição a variância dos estimadores toma a forma:
k1 k2
V = + 0
n n
que é válida para amostragem sem reposição quando as frações são pequenas.
Esta variância pode ser minimizada para um custo total dado e nos fornece,
através dos multiplicadores de Lagrange, os tamanhos ótimos de n0 e n.
6.3. DUPLA AMOSTRAGEM PARA ESTRATIFICAÇÃO 177
6.3 Dupla amostragem para estratificação

Seleciona-se a 1a amostra de tamanho n0 , através de um esquema aleatório.
Utiliza-se essa amostra para estratificar as unidades, atendendo a uma ou
várias características que observamos, assim como para estimar a proporção
de unidades da população pertencentes a cada estrato, supondo que a popu-
lação seja estratificada em L estratos.
Sejam n01 , n02 , · · · , n0L onde n0h é o número de unidades na amostra (da 1a
fase) em cada estrato h e a respectiva proporção:
n0h
wh =
n0
A segunda fase consiste em tomar uma subamostra aleatória de tamanho
nh ≤ n0h em cada estrato h, independentemente.
O estimador usual da média em amostragem estratificada é:
X
L
y est = Wh y h
h=1
em dupla amostragem os Wh são estimados pelos wh obtidos da 1a amostra

e com a 2a amostra estimamos as médias, tomando:
yh
yh =
nh
de forma que resulta no estimador para a média:
X
L
y d,est = wh y h
h=1
y d,est é não viciado, pois:
( Ã L !) Ã L !
¡ ¢ X X
E y d,est = E Ew wh y h =E wh Ew (y h )
h=1 h=1
Ã L !
X X
L X
L
= E wh Y h = E (wh ) Y h = Wh Y h = Y
h=1 h=1 h=1
onde:
Ew (T ) expressa a esperança matemática de uma estatística T condi-
cionada ao conjunto de amostras da 1a fase, nas quais n01 , n02 , · · · , n0L são
fixos e para um dado n0 , w1 , w2 , · · · , wL são fixos.
¡ ¢ ¡ ¡ ¢¢ ¡ ¡ ¢¢
V y d,est = V Ew y d,est + E Vw y d,est
Ã L ! Ã L !
¡ ¡ ¢¢ X X ¡ ¢2
V Ew y d,est = V wh Y h =V Y h wh
h=1 h=1
X
L
¡ ¢2 X
L
= Y h V (wh ) + Y h Y k COV (wh , wk )
h=1 h6=k
as V (wh ) e COV (wh , wk ) em amostragem sem reposição, usando a dis-

tribuição hipergeométrica para L classes, são dadas por:
N − n0 Wh (1 − Wh )
V (wh ) =
N −1 n0
e
N − n0 Wh Wj
COV (wh ) = −
N − 1 n0
Logo:
( L )
¡ ¡ ¢¢ X ¡ ¢2 Wh (1 − Wh ) X L
Wh Wj
V Ew y d,est = g0 Yh 0
− Y hY k
h=1
n h6=k
n0
( L )
g0 X ¡ ¢2 X X X
L L L
¡ ¢2
= 0 Y h Wh − Y h (Wh )2 − Y h Wh Y k Wk
n h=1 h=1 h6=k k=1
 Ã ! 
2
g0 X ¡ ¢2 X 
L L
= 0 Y h Wh − Wh Y h
n  h=1 h=1

( L )
g0 X ¡ ¢2
= 0 Wh Y h − Y
n h=1
N − n0
sendo: g 0 = .
N −1
Por outro lado, tem-se:
6.3. DUPLA AMOSTRAGEM PARA ESTRATIFICAÇÃO 179
Ã Ã L !! Ã L !
¡ ¡ ¢¢ X X
E Vw y d,est = E Vw wh y h =E (wh )2 Vw (y h )
h=1 h=1
Ã L !
X Sh2 XL
Sh2
= E (wh )2 (1 − fh ) = E (wh )2 (1 − fh )
h=1
nh h=1
nh
X
L
Sh2 ¡ ¢
= (1 − fh ) V (wh ) + Wh2
h=1
nh
XL µ ¶
S2 g0 Wh (1 − Wh )
= (1 − fh ) h 0
+ Wh2
h=1
nh n
Portanto:
( L ) L µ ¶
¡ ¢ g0 X ¡ ¢2 X Sh2 g 0 Wh (1 − Wh ) 2
V y d,est = 0 Wh Y h − Y + (1 − fh ) + Wh
n h=1 h=1
nh n0
onde:
fh é a fração de amostragem da 2a fase, supondo que a seleção foi com
probabilidades iguais e sem reposição nas fases.
Observe que n0 aparece no denominador na expressão da variância. Por-
tanto, quanto maior n0 (n0 < N) a perda de precisão pelo uso da dupla
amostragem diminui. Obviamente o custo aumenta, razão pela qual convém
estudar os tamanhos ótimos em função do custo.
Se a amostra é com reposição na 1a fase temos:
µ ¶
¡ ¢ X L
S2 Wh (1 − Wh ) 1 X
L
¡ ¢2
V y d,est = (1 − fh ) h 2
Wh + + Wh Y h − Y
h=1
nh n0 n0 h=1
fórmula aproximada para n0 pequeno em relação a N em caso sem reposição.

Se a amostra é com reposição nas 2 fases:
µ ¶
¡ ¢ X L
σ 2h 2 Wh (1 − Wh ) 1 X
L
¡ ¢2
V y d,est = Wh + + Wh Y h − Y
h=1
nh n0 n0 h=1
fórmula aproximada para nh pequeno em relação a Nh , ∀h e n0 pequeno em

relação a N no caso sem reposição.
Para o total
³ Y´ = NY , o estimador não viciado Ybd,est = N y d,est e a
¡ ¢
variância V Ybd,est = N 2 V y d,est .
Observe que se na amostra da 1a fase n0 = N, isto é, se observa todas as
unidades da população para efetuar a estratificação, então g 0 = 0 e a fórmula
geral da variância do estimador de dupla amostragem fica:
¡ ¢ X L
S2
V y d,est = (1 − fh ) Wh2 h
h=1
nh
que coincide com a variância de uma amostra estratificada usual em uma

única fase.
¡ ¢
6.3.1 Estimador não viciado para V y d,est
Um estimador não viciado para a variância do estimador
¡ ¢ da média em dupla
amostragem para estratificação com reposição V y d,est é dado por:
( L )
¡ ¢ n0 X s2 ³ wh
´ 1 XL
¡ ¢2
h
v y d,est = wh2 + 0 + 0 wh y h − y d,est
n0 − 1 h=1
nh n n h=1
n0 ∼
= 1 se n0 não for pequeno, então:
n0 − 1
¢ X s2h ³ 2 wh ´ 1 X ¡
L L
¡ ¢2
v y d,est = wh + 0 + 0 wh y h − y d,est
h=1
nh n n h=1
6.3.2 Estimação de uma proporção na dupla amostragem

para estratificação
Se se deseja estimar uma proporção PA de um atributo A na população,
sendo PAh a correspondente proporção no estrato h, o estimador não viciado
na dupla amostragem é:
X
L
pA(d,est) = wh pAh
h=1
6.4. DUPLA AMOSTRAGEM PARA ESTIMADORES DE RAZÃO 181
sendo: pAh a proporção amostral do atributo A na 2a fase.

XL µ ¶
¡ ¢ PAh QAh 2 g0 Wh (1 − Wh )
V pA(d,est) = (1 − fh ) Wh +
h=1
n h n0
( L )
g0 X
+ 0 Wh (PAh − PA )2
n h=1
sendo:
Nh
Sh2 = PAh QAh ∼
= PAh QAh
Nh − 1
Em amostragem com reposição nas 2 fases, ou sem reposição e tamanhos
amostrais pequenos com relação à população (fh ∼
= 0 e g0 ∼
= 1).
XL µ ¶
¡ ¢ PAh QAh 2 Wh (1 − Wh )
V pA(d,est) = Wh +
h=1
nh n0
( L )
1 X
+ 0 Wh (PAh − PA )2
n h=1
Para o total do atributo A = N PA , o estimador é:
Abd,est = NpA(d,est)
e ³ ´ ¡ ¢
V Abd,est = N 2 V pA(d,est)
6.4 Dupla amostragem para estimadores de

razão
O estimador usual de razão para a média Y utiliza como informação previa-
mente conhecida da média X (ou total) de uma característica x, definida em
todas as unidades da população, escolhida convenientemente de modo que
sua relação com y seja linear pelo menos aproximadamente.
Em dupla amostragem utiliza-se a 1a amostra de tamanho n0 para obter
uma boa estimativa de X (ou de X) e a 2a amostra de tamanho n para
estimar y e x. Desta forma o estimador de razão para a média em dupla
amostragem é:
y
y d,R = x0
x
sendo x0 a média estimada usando as informações da amsotra da 1a fase.
Com este procedimento de dupla amostragem cabe considerar duas pos-
sibilidades:
1. a 2a amostra é uma amostra aleatória da população selecionada inde-

pendentemente da 1a ;
2. a 2a amostra é uma subamostra aleatória da 1a . Em ambos casos con-

0
siderar n ≤ n .
¡ ¢ ³ ´
Em qualquer caso: E y d,R = X E R b e será não viciado se R b = y for
x
não viciado.
Para calcular o erro médio quadrático que coincida com a variância quando
³ ´
b =R= Y
E R
X
temos:
y 0 b x0 − Y = R
b x0 − RX
y d,R − Y = x −Y =R
x
= R b x0 − RX + RX − RX
³ ´ ¡ ¢
= X R b−R +R b x0 − X
X³ b
´ ¡
b x0 − X
¢
= y −Rx +R
x
b∼ X ∼
utilizando as aproximações: R =Re = 1.
x
Podemos escrever para o cálculo aproximado da variância do estimador:
¡ ¢ © ¡ ¢ª2
V y d,R = E (y − R x) + R x0 − X
© ¡ ¢ª
= V (y − R x) + R x0 − X
¡ ¡ ¢¢ © ¡ ¢ª
= V (y − R x) + V R x0 − X + 2R COV (y − R x) x0 − X
= V (y) + R2 V (x) − 2R COV (x, y) + R2 V ( x0 ) +
+2R COV (y, x0 ) − 2R2 COV (x, x0 )
No caso em que as amostras das 2 fases são independentes, as covariâncias

se anulam entre (x, y) e (x, x0 ), resultando:
¡ ¢
V y d,R = V (y) + R2 V (x) − 2R COV (x, y) + R2 V ( x0 )
¡ ¢ 1© 2 ª 1
V y d,R = σ y + R2 σ 2x − 2R σ xy + 0 R2 σ 2x
n n
6.5. DUPLA AMOSTRAGEM PARA PROBABILIDADES DESIGUAIS183
fórmula válida para amostragem com reposição (no caso de sem reposição,
usar fator de correção de populações finitas).
Para o caso¡ em que ¢ a 2a amostra de tamanho n é uma subamostra
0
aleatória da 1a n ≤ n temos que calcular as covariâncias.
Fixando a amostra da 1a fase:
Ew0 (y) = y 0 e Ew0 (x) = x0

por y e x serem médias de subamostras aleatórias =⇒
COV (y, x0 ) = E (y, x0 ) − E (y ) E ( x0 )

= E (Ew0 (y, x0 )) − E (Ew0 (y )) E (Ew0 ( x0 ))
= E (y 0 , x0 ) − E (y 0 ) E (x 0 ) = COV (y 0 , x0 )
σ xy
=
n0
analogamente:
σ 2x
COV (x, x0 ) =
n0
Logo:
¡ ¢ 1© 2 ª 1 2 2
V y d,R = σ y + R2 σ 2x − 2R σ xy + R σx +
n n0
1 1
− 0 2R2 σ 2x + 0 2R σ xy
n n
1© 2 ª 1 © ª
= σ y + R2 σ 2x − 2R σ xy + 0
2R σ xy − R2 σ 2x
n n
admitindo com reposição. ¡ ¢
Se n0 = N =⇒ COV (x, x0 ) = COV (y, x0 ) = 0,então V y d,R reduz à
variância do estimador de razão em uma única fase.
6.5 Dupla amostragem para probabilidades

desiguais
O estimador usual do total Y , com probabilidades de seleção das unidades
proporcionais a uma medida de tamanho, seja Mi , é dado por:
1 X yi
n
Yb =
n i=1 Pi
Mi
com: Pi = .
M
Se não se conhece a priori os tamanhos das unidades da população, pode-
mos tomar uma amostra aleatória da população de tamanho n0 com probabil-
idades iguais, para obter informação acerca dos tamanhos M1 , M2 , · · · , Mn0 ,
Pn0
sendo M 0 = Mi . Nestas condições se toma uma subamostra de tamanho
i=1
n < n0 , para formar o estimador de dupla amostragem baseado em:
Mi Mi
como esstimador de = Pi
N 0 M
M
n0
e o estimador não viciado de total fica da forma:
Xn
N M 0 yi NM 0 X yi
n
Ybdp = =
i=1
n0 n Mi nn0 i=1 Mi
Ã Ã n !! µ ¶
³ ´ N X M 0 yi N 0
E Ybdp = E Ew0 =E y =Y
n0 i=1
n Mi n0
onde:
Ew0 indica a esperança da 1a amostra fixa com probabilidade proporcional
ao tamanho;
y 0 é o total da amostra da 1a fase, tomando n0 , tomada com probabili-
dades iguais.
Supondo que a 1a amostra seja selecionada com probabilidades iguais e
sem reposição e a 2a amostra com probabilidades proporcionais ao tamanho
e com reposição, a variância do estimador de total é dada por:
³ ´ µ ¶2
N n0 − 1 X
N
Yi N (N − n0 ) 2
V Ybdp = Pi −Y + Sy
N − 1 nn0 i=1 Pi n0
n0 − 1 ∼
se n0 é grande então = 1 então:
n0
³ ´ 1X N µ ¶2
b p Yi N (N − n0 ) 2
V Yd = Pi −Y + Sy
n i=1 Pi n0
Bibliografia
[1] Albieri, S. e Dias, A.J.R. (1994). Metodologia de expansão da amostra

do censo demográfico de 1991: uma descrição resumida. Rio de Janeiro:
IBGE, Divisão de Metodologia.
[2] Andersson, C. e Nordberg, L. (1994). A method for variance estima-

tion of non-linear functions of totals in surveys - theory and software
implementation. Journal of Official Statistics, 10, 395-406.
[3] Cochran, W.G. (1977). Sampling Techniques, third edition. New York:
John Wiley & Sons.
[4] Deville, J.C. e Särndal, C.E. (1992). Calibration estimators in survey

sampling. Journal of the American Statistical Association, 87, 376-382.
[5] Estevao, V., Hidiroglou, M.A. e Särndal, C.E. (1995). Methodological

principles for a generalized estimation system at Statistics Canada. Jour-
nal of Official Statistics, 11, 181-204.
[6] Fieller, E. C. (1932). The distribution of the index in a normal bivariate

population. Biometrika, 24, 428-440.
[7] Hanif, M. and Brewer, K.R.W. (1980). Sampling with unequal proba-
bilities without replacement. International Statistical Review,Voorburg:
Holand, 48: 317-35.
[8] Hansen, Morris H; Hurvitz, William N. and Madow, William G. (1953).

Sample Survey Methods and Theory ( vol. I and II). New York: John
Wiley & Sons.
[9] Hartley, H.O. et alli. (1962). Sampling with unequal probabilities with-
out replacement. Annals of Mathematical Statistics, Hayward; EUA, 33:
350-74.
185
186 BIBLIOGRAFIA
[10] Horvitz, D.G., and Thompson, D.J. (1952). A generalization of sampling

without replacement from a finite universe. Jour. Amer. Stat. Assoc.,
47, 663-685.
[11] IBGE (1983). Metodologia do censo demográfico de 1980. Rio de Janeiro:

Série Relatórios Metodológicos, v. 4.
[12] Kish, L. (1965) Survey Sampling. New York: John Wiley & Sons.
[13] Lima, J.M.(1985). Seleção de amostra com probabilidades desiguais -

o método dos grupos aleatórios. Rio de Janeiro: IMPA, (Informes de
Matemática Série D-015/85 - Tese de Mestrado).
[14] Mahalanobis, P.C. (1939). A Sample Survey of the Acreage Under Jute
in Bengal. Sankhya 4, 511-531.
[15] Nascimento, W.A. (1981). Amostragem de Conglomerados.

IBGE/ENCE.
[16] Quenouille, M.H. (1949). Aproximate Tests of Correlation in Time Se-

ries. Journal of the Royal Statistical Society, B 11, 68-84.
[17] Quenouille, M.H. (1956). Notes on Bias in Estimation. Biometrika 43,

353-360.
[18] Paulson, E. (1942). A note on the estimation of some mean values for a
bivariate distribution. Ann. Math. Stat., 13, 440-444.
[19] Pessoa, D.G.C. e Silva, P.L.N. (1998). Análise de dados em planos

amostrais complexos. Minicurso do SINAPE 1998.
[20] Raj, Des. (1968). Sampling Theory. Bombay, New Delhi: Tata McGraw-
Hill.
[21] Särndal, C.E., Swensson, B. e Wretman, J. (1992). Model assisted survey

sampling. New York: Springer-Verlag.
[22] Shah, B.V., Barnwell, B.G., Hunt, P.N. e LaVange, L.M. (1992). SUD-
DAN user’s manual - professional software for survey data analysis for
multi-stage sample designs - release 6.0. North Carolina: Research Tri-
angle Institute.
[23] Silva, P.L.N. (1996). Planejamento, estimação e análise de dados em

pesquisas por amostragem: desvendando a realidade brasileira com o
”telescópio da estatística”. Rio de Janeiro: IBGE.
BIBLIOGRAFIA 187
[24] Silva, P.L.N. (1996). Utilizing auxiliary information in sample survey

estimation and analysis. Southampton: Department of Social Statistics,
University of Southampton, tese de doutorado.
[25] Silva, P.L.N., Bianchini, Z.M. e Albieri, S. (1993). Uma proposta de

metodologia para a expansão da amostra do censo demográfico de 1991.
Rio de Janeiro: IBGE, Diretoria de Pesquisas, Série Textos para Dis-
cussão, n. 62.
[26] Silva, P.L.N., Silva, D.B.N., Moura, F.A.S. e Jooris, L.R. (1995). Frame
problems and survey design for the Brazilian annual retail and wholesale
trade survey. Artigo submetido para publicação na revista Estadística.
[27] Silva, P.L.N. e Skinner, C.J. (1995). Estimating distribution functions

with auxiliary information using poststratification. Journal of Official
Statistics, 11, 277-294.
[28] Silva, P.L.N. e Skinner, C.J. (1996). Variable selection for regression
estimation in finite populations. Artigo submetido para publicação no
Journal of the American Statistical Association.
[29] Skinner, C. J., Holt, D. and Smith, T.M.F. (1989). Analysis of Complex
Surveys. Chichester: Wiley.
[30] Thompson, S.K. (1992). Sampling. New York: John Wiley & Sons.
[31] Westat (1995). A user’s guide to WesVarPC, version 1.0. Rockville:

Westat.
[32] Wolter, K.M. (1985). Introduction to Variance Estimation. New York:

Springer-Verlag.

BIANCHINI, Z.M. (2003) - Técnicas de Amostragem (Parte 2)

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

BIANCHINI, Z.M. (2003) - Técnicas de Amostragem (Parte 2)

Enviado por

Direitos autorais:

Formatos disponíveis

Técnicas de Amostragem (parte 2)

Zélia Magalhães Bianchini

3 Conglomerados em 2 estágios 109

4 Conglomerados em 3 estágios 161

5 Estimação de variâncias 165

6 Dupla amostragem 175

Cabe esclarecer que é intenção incorporar num mesmo volume o conteúdo

Zélia Magalhães Bianchini

Rio de Janeiro, agosto de 2003.

1.1 Informações auxiliares em amostragem

1.2 Estimação de uma razão

1.2.1 Propriedades do estimador de uma razão

Sabe-se ainda que:

Desta forma, se pode escrever:

Por outro lado:

Agora note-se que a correlação entre x e y na população, ρ (x, y), é

Denotando-se então ρ (x, y) simplesmente por ρ , vem:

onde Cx2 é a variância relativa de característica x na população.

Note-se que se a tendenciosidade se anula, isto é, se o estimador for não

Analisando-se a expressão acima, note-se que:

Um critério prático para avaliar quão próximos estão V (R) b e EQM(R)

Por outro lado, note-se que:

Substituindo na expressão anterior, segue-se que:

Lembrando a condição de |ρ∗ | ≤ 1 segue-se que:

Considere a expressão do tamanho de uma amostra aleatória simples

já que a precisão relativa da média amostral pode ser escrita como:

1.2.2 Variância do estimador de uma razão

Nesta última expressão, desprezar todos os termos com grau superior a

(b) Calcule os valores exatos do vício, do erro quadrático médio e da var-

(c) Calcule os valores aproximados do vício e da variância desse estimador.

(d) Compare os resultados obtidos em (b) com os resultados obtidos em

O número de possíveis amostras é dado por:

b) Os valores exatos do vício e do erro quadrático médio deste estimador

e a variância dada por:

c) O vício aproximado é dado por:

com respeito à variância aproximada tem-se:

d) Observe que o vício aproximado subestima ligeiramente o valor ver-

1.2.3 Estimação da variância do estimador de uma razão

que são estimadores não viciados de Sy2 , Sx2 e Sxy , respectivamente.

1.2.4 Precisão do estimador de uma razão

Inicialmente, já foi demonstrado que o estimador de razão é consistente.

Daí segue-se que:

b dado por v1 (R)

1.3 Estimadores de razão para o total e a mé-

As técnicas que foram apresentadas para estimação de uma razão podem

wi é o peso amostral associado ao i-ésimo domicílio da amostra, obtido

1.3.1 Variâncias dos estimadores de razão para o total

1.3.2 Estimação das variâncias dos estimadores de razão

1.3.3 Comparação da precisão do estimador de razão

V (YbR ) < V (Yb ) ⇐⇒ Sy2 + R2 Sx2 − 2 R ρ Sx Sy < Sy2

1.4 Estimadores de razão em amostragem es-

• estimador de razão combinada; e

• estimador de razão separada.

1.4.1 Estimador de razão combinada

best = P Nh xh é o estimador simples do total da característica x na

O estimador de razão combinada YbRC é consistente para o total Y .

é usual considerar a tendensiosidade desprezível quando

supondo—se n grande, tem se

Sh2 (y) = (Yhj − Y h )2

Sh2 (x) = (Xhj − X h )2

COV (xest , y est ) = E[xest − X)(y est − Y )]

Lembrando—se que a amostra dentro de cada estrato é aleatória simples,

Sh (x, y) = (Xhj − X h )(Yhj − Y h )

(Yhj − Y h )2 + R2 (Xhj − X h )2 − 2R(Xhj − X h )(Yhj − Y h )