Escolar Documentos
Profissional Documentos
Cultura Documentos
TECNICAS DE AMOSTRAGEM Apostila Zelia PDF
TECNICAS DE AMOSTRAGEM Apostila Zelia PDF
(2averso)
Agosto/2003
2
Contedo
1 Estimadores Especiais 1
1.1 Informaes auxiliares em amostragem . . . . . . . . . . . . . 1
1.2 Estimao de uma razo . . . . . . . . . . . . . . . . . . . . . 1
1.2.1 Propriedades do estimador de uma razo . . . . . . . . 3
1.2.2 Varincia do estimador de uma razo . . . . . . . . . . 9
1.2.3 Estimao da varincia do estimador de uma razo . . 14
1.2.4 Preciso do estimador de uma razo . . . . . . . . . . . 14
1.3 Estimadores de razo para o total e a mdia . . . . . . . . . . 16
1.3.1 Varincias dos estimadores de razo para o total e a
mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3.2 Estimao das varincias dos estimadores de razo para
o total e a mdia . . . . . . . . . . . . . . . . . . . . . 19
1.3.3 Comparao da preciso do estimador de razo com a
do estimador simples em amostragem aleatria simples 19
1.4 Estimadores de razo em amostragem estratificada . . . . . . 20
1.4.1 Estimador de razo combinada . . . . . . . . . . . . . 20
1.4.2 Estimador de razo separada . . . . . . . . . . . . . . . 26
1.4.3 Comparao dos estimadores de razo separada e com-
binada . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.4.4 O uso de estimadores de razo . . . . . . . . . . . . . . 32
1.5 Estimadores de Regresso . . . . . . . . . . . . . . . . . . . . 33
1.5.1 Comparao dos estimadores de regresso, razo e sim-
ples da mdia sob amostragem aleatria simples . . . . 36
1.5.2 O uso de estimadores de regresso . . . . . . . . . . . . 37
1.6 Ps-estratificao . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.6.1 Estimao do total e da mdia . . . . . . . . . . . . . . 39
1.6.2 Preciso dos estimadores com ps-estratificao . . . . 40
1.7 O uso de informaes auxiliares na estimao . . . . . . . . . . 43
1.8 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3
4 CONTEDO
2 Amostragem de Conglomerados 53
2.1 Conceituao Bsica . . . . . . . . . . . . . . . . . . . . . . . 53
2.2 Amostragem de reas . . . . . . . . . . . . . . . . . . . . . . 55
2.3 Conglomerados em 1 estgio . . . . . . . . . . . . . . . . . . 56
2.3.1 Probabilidades iguais de seleo . . . . . . . . . . . . . 56
2.3.2 Estimao de propores na Ac1 . . . . . . . . . . . . 65
2.3.3 Coeficiente de Correlao Intraclasse . . . . . . . . . . 69
2.3.4 Estimao do coeficiente de correlao intraclasse . . . 75
2.3.5 Eficincia da Ac1 em relao AAS com conglomera-
dos de tamanhos iguais . . . . . . . . . . . . . . . . . . 77
2.4 Controle na variao de tamanho . . . . . . . . . . . . . . . . 82
2.5 Probabilidades desiguais de seleo . . . . . . . . . . . . . . . 83
2.5.1 Seleo dos conglomerados com probabilidades desiguais
e com reposio . . . . . . . . . . . . . . . . . . . . . . 83
2.6 Estratificao de conglomerados . . . . . . . . . . . . . . . . . 93
2.6.1 Estimadores e respectivas precises . . . . . . . . . . . 94
2.7 Estimador de razo . . . . . . . . . . . . . . . . . . . . . . . . 97
2.7.1 Estimador de razo baseado no tamanho dos conglom-
erados . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
2.7.2 Estimador de razo baseado em uma caracterstica que
no seja o tamanho do conglomerado . . . . . . . . . . 101
2.8 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
Prefcio
Estas notas de aula vm sendo ministradas na disciplina de Tecnologia da
Amostragem II do Curso de Graduao em Estatstica da Escola Nacional
de Cincias Estatsticas - ENCE. Trata-se da apresentao da teoria e apli-
cao de estimadores especiais e das tcnicas de seleo e de estimao em
amostras de conglomerados em um ou mais estgios e de dupla amostragem.
As notas de aula preparadas por Pedro Luis do Nascimento Silva quando
de sua atuao como professor no referido curso, bem como as referncias
bibilogrficas bsicas, serviram como base para a elaborao deste material.
ii CONTEDO
Estimadores Especiais
1
2 CAPTULO 1. ESTIMADORES ESPECIAIS
entre os gastos das famlias com alimentao e a renda das famlias. Outro
exemplo seria a razo entre a quantidade colhida de certo produto pela rea
plantada, medindo a produtividade da lavoura. Ainda outro exemplo se-
ria a razo entre o salrio dos trabalhadores da indstria e o nmero de
trabalhadores da indstria, medindo o salrio mdio dos trabalhadores da
indstria.
Em todos estes exemplos, o que se procura conhecer o valor de uma
Y
razo R onde R = .
X
Considere-se a populao PN = {U1 , U2 , , UN }, onde sero investigadas
duas caractersticas, x e y, gerando uma populao-matriz bivariada
PN (x, y) = {(X1 , Y1 ), (X2 , Y2 ), , (XN , YN )} ,
onde:
XI = x(UI )
I {1, 2, , N}
YI = y(UI )
Pode-se ento definir o parmetro razo na populao, R, de forma
que:
P
N
YI
Y I=1 Y
R= = N =
X P X
XI
I=1
Ponha-se ento, o problema de estimar a razo R a partir de uma amostra
aleatria simples sem reposio de n unidades de PN ,{u1 , u2 , , un }, onde
sero investigadas as caractersticas x e y, fornecendo
{(x1 , y1 ), (x2 , y2 ), , (xn , yn )} .
Note-se que:
1
i {1, 2, , n} e I {1, 2, , N} .
P [(xi , yi ) = (XI , YI )] =
N
Conclui-se que os vetores (xi , yi ), i {1, 2, , n}, so identicamente
distribudos e que no so independentes, devido se tratar de amostragem
sem reposio.
Como R = Y / X = Y / X , um estimador intuitivamente razovel para
R dado por:
1X 1X
n n
b= y
R onde y= yi e x = xi .
x n i=1 n i=1
1.2. ESTIMAO DE UMA RAZO 3
1X 1 X 1X
n n n
y= yi = Y + i = Y + =Y +
n i=1 n i=1 n i=1 i
onde:
1X
n
=
n i=1 i
De modo anlogo se tem que:
1X
n
x = X + onde = .
n i=1 i
N n Sy2 2 2 2
= V ( y ) = V (Y + ) = V ( ) = E( ) E() = E( )
N n
pois, E() = 0.
Analogamente,
2 N n Sx2
E( ) = V ( ) =
N n
Note-se que:
1 X 1 X
N N
2 2
Sx2 = XI X e Sy2 = YI Y .
N 1 I=1 N 1 I=1
4 CAPTULO 1. ESTIMADORES ESPECIAIS
N n Sxy
E = E y Y x X = COV ( x, y) =
N n
onde:
1 X
N
Sxy = XI X YI Y
N 1 I=1
b dada aproximada-
De qualquer forma, a tendenciosidade do estimador R
mente por:
2
1 1
b b
T (R) = E(R) R = R 1 + 2 E E R
X Y X
1 1
= R 2V COV ( x, y)
X Y X
ou ainda:
b 1 N n Sx2 1 N n Sxy
T (R) = R 2
X N n Y X N n
2
N n 1 Sx Sxy
= R 2
N n X Y X
1 PN
XI X YI Y
N I=1
(x, y) = s
1 PN 2 1 PN 2
XI X YI Y
N I=1 N I=1
N
P
XI X YI Y
I=1
= s
N
P 2 N
P 2
XI X YI Y
I=1 I=1
1
P
N
XI X YI Y
N 1 I=1
= s
1 P N 2 1 P N 2
XI X YI Y
N 1 I=1 N 1 I=1
Sxy Sxy
(x, y) = p 2 2 =
Sx Sy Sx Sy
Sxy = Sx Sy
Ento:
b N n 1 Sx2 1
T (R) = R Sx Sy
N n X2 Y X
N n 1 2
= R Cx Cx Cy
N n
Cx2 Cx Cy = 0
Isto , quando:
Sx2 Sx Sy
2 =
X X Y
1.2. ESTIMAO DE UMA RAZO 7
Ou melhor, quando:
Sx Sy
Y = X = Sy X
Sx2 Sx
2
X
Assim, a condio para que R b seja um estimador no viciado de R que
Y = ( Sy /Sx ) X, que a condio para a reta de regresso entre y e x
passar pela origem, com coeficiente angular ( Sy /Sx ) .
Foi verificado que, quando a condio anterior no satisfeita, R b um
estimador tendencioso, embora com tendncia que tende a se anular quando
o tamanho n da amostra for grande.
Com o objetivo de calcular uma medida da preciso do estimador R, b ser
estabelecida uma cota superior a tendenciosidade de R b que permitir tambm
a determinao do tamanho de amostra necessrio para tomar desprezvel a
tendenciosidade.
Inicialmente, quando se trata de um estimador viciado, a medida de sua
preciso deve ser o seu erro quadrtico mdio, dado por:
2
b b
EQM(R) = E(R R) = E 2 b b b
R E(R) + E(R) R
2 2
= E b E(R)
R b + E R bR
b b
2 E(R) R E R E(R) b
h i2
b b
= V (R) + T (R) .
Donde:
b x)
COV (R, Y
= b)
E(R
X X
ou seja:
Y b x)
COV (R, b x)
COV (R,
b) =
E(R =R
X X X
ou ainda:
b
b ) = E(R
T (R b ) R = COV (R, x)
X
b
Seja (R, x) = o coeficiente de correlao entre Rb e x. Logo:
q p
b
COV (R, x) = b
V (R) V (x)
ou ainda:
b)
T (R
q = | | CV (x)
V (R)b
1.2. ESTIMAO DE UMA RAZO 9
2 Sx2
N z/2 2
N z/2 Cx2
X
2 Cx2
n= = =
Sx2 2
N z/2 (CV (x))2 + z/2
2
Cx2 Cx2
2
N d2r + z/2 2 (CV (x))2 +
X N
Cx2
n
Cx2
0, 01 +
N
Por exemplo, se Cx = 0, 4 e N = 5.000, ento n 16 bastaria para tornar
b
desprezvel a tendenciosidade do estimador de razo R.
e que: !
2
b
E(R) = R +R E 2
X Y X
logo,
2
! 2
!
b E(R)
b
R =R +R 2 R E 2
Y X X Y X X Y X
b dada por:
Da, a varincia de R
2
b = E R
V (R) b E(R)
b
" 2 ! 2 !#2
= E R +R 2 RE 2
Y X X Y X X Y X
1 X
N
b N n 1
V (R) = (YI R XI )2
N n X 2 N 1 I=1
1.2. ESTIMAO DE UMA RAZO 11
Exemplo 1.1
O vcio e erro quadrtico mdio do estimador de uma razo, sob amostragem
aleatria simples, pode ser ilustrado imaginando a aplicao de amostragem
em uma populao muito pequena e examinando o espao amostral, isto ,
o conjunto de todas as possveis amostras. Suponha que os valores de duas
variveis x e y nas 4 unidades da populao so:
Ui Yi Xi
U1 1 1
U2 2 3
U3 3 4
U4 4 6
Y
(a) Calcule o valor da razo populacional X , obtenha todas as possveis
amostras de tamanho 2, a serem selecionadas aleatoriamente e sem
reposio e estime essa razo para cada possvel amostra.
Soluo:
a) A razo populacional dada por:
P
N
Yi
Y 10 5
R= = i=1 = =
X PN 14 7
Xi
i=1
P
n P
n
b= y
Amostras possveis Probabilidades y = yi x= xi R
i=1 i=1 x
1 3
U 1 U2 6
3 4 4
1 4
U1 U3 6
4 5 5
1 5
U1 U4 6
5 7 7
1 5
U2 U3 6
5 7 7
1 6
U2 U4 6
6 9 9
1 7
U3 U4 6
7 10 10
b dado por:
o valor exato do vcio de R
b R = 365 5 = 5 = 0, 0099
b = E(R)
T (R)
504 7 504
O erro quadrtico mdio dado por:
b 2 1 3 5 2 4 5 2 6 5 2 7 5 2
E(R R) = ( ) + ( ) + ( ) + ( ) = 0, 00185
6 4 7 5 7 9 7 10 7
h i2
b = E(R
V (R) b R)2 T (R)
b = 0, 00185 0, 0000009 = 0, 0018491
b N n 1 Sx2 Sxy 1f
T (R) =R 2 = 2 R Sx2 Sxy
N n X Y X nX
1.2. ESTIMAO DE UMA RAZO 13
1 7
sendo: f = n=2 X=
2 2
P
N 2
Xi2 N X
I=1 62 49 13
Sx2 = = =
N 1 3 3
P
N
Xi Yi N X Y
I=1 43 35 8
Sxy = = =
N 1 3 3
1
b 1f 2 5 13 8 3
T (R) = 2 R Sx2 Sxy = 2 = = 0, 0087
nX 7 7 3 3 343
2
2
b N n 1 2 2 2
V (R) = 2 Sy + R Sx 2 R Sxy
N nX
1f 2 2 2
= 2 Sy + R Sx 2 R Sxy
nX
sendo:
P
N 2
Yi2 N Y
I=1 30 25 5
Sy2 = = =
N 1 3 3
portanto:
b 1f 2 2 2
V (R) = 2 Sy + R Sx 2 R Sxy
nX
1 2 !
2 5 5 13 5 8
= 2 + 2 = 0, 00139
7 3 7 3 7 3
2
2
onde:
1 X
n
s2y = (yi y)2
n 1 i=1
1 X
n
s2x = (xi x)2
n 1 i=1
1 X
n
sxy = (xi x)(yi y)
n 1 i=1
1 X
n
b = N n 1 b xi )2
v1 (R) 2 (yi R
N n X n 1 i=1
b
Quando X no for conhecido, um estimador alternativo para V (R)
dado por:
b = N n 1 s2y + R
v2 (R) b2 s2x 2 R
b sxy
N n x2
ou
1 X
n
b = N n 1
v2 (R) b xi )2 .
(yi R
N n x2 n 1 i=1
Da segue-se que:
q
RbR
P q z/2 = 1 = P R
b R z/2 V (R)
b = 1
V (R)
b
onde:
z/2 a abscissa da distribuio Normal padro tal que
b
RR
P q > z/2 =
b 2
V (R)
e o nvel de significncia.
16 CAPTULO 1. ESTIMADORES ESPECIAIS
Portanto, q
D(R)b = z/2 V (R) b e
b a preciso do estimador R;
e
b = z/2 V (R)
Dr (R) b a preciso relativa do estimador R;
= z/2 CV (R) b
R
Pode-se utilizar como estimador da preciso do estimador de R, b o valor
b
d(R) tal que:
q
b = z/2 v(R)
d(R) b
P
n
wi yi Xn Xn Xn
b b Yb i=1
YP NAD = R Xp = X = n Xp = wi yi = ( wi ) yi = i yi
Xb p P
wi xi i=1 i=1 i=1
i=1
onde:
YbP NAD o estimador de razo para o total da caracterstica y ajustado
pela projeo de populao, utilizado na PNAD, para a rea em questo;
Yb o estimador de total da caracterstica y, obtido considerando os pesos
simples da amostra;
Xb o estimador de total da populao residente, obtido considerando os
pesos simples da amostra;
Xp a estimativa da populao residente, obtida pela projeo de popu-
lao.
18 CAPTULO 1. ESTIMADORES ESPECIAIS
N n 1 2
b
V (YbR ) = X 2 V (R) = X2 Sy + R 2 2
Sx 2 R Sxy
N n X2
N n 2
= N Sy + R2 Sx2 2 R Sxy
n
ou
N n 1 X
N
V (YbR ) = N (YI R XI )2
n N 1 I=1
De modo anlogo, para a mdia y R tem-se:
E(y R ) y R = X E(R)b R
b
1.3. ESTIMADORES DE RAZO PARA O TOTAL E A MDIA 19
YbR N n 1 2
V (y R ) = V ( )= Sy + R2 Sx2 2 R Sxy
N N n
ou
N n1 1 X
N
V (y R )
= (YI R XI )2
N n N 1 I=1
b 2 b N n h 2 b2 2 b
i
v(YR ) = X v(R) = N sy + R sx 2 R sxy
n
ou
N n 1 X
n
v(YbR ) = X 2 v(R)
b =N b xi )2
(yi R
n n 1 i=1
e um estimador para V (y R ) dado por:
2
b = N n 1 h 2 b2 2 b sxy
i
v(y R ) = X v(R) sy + R sx 2 R
N n
ou
N n1 1 X
n
v(y R ) = b xi )2
(yi R
N n n 1 i=1
N n Sy2
V (Yb ) = N 2
N n
N n 1 2
V (YbR ) = X 2 2 2
2 Sy + R Sx 2 R Sxy
N nX
N n 1 2
= N2 Sy + R2 Sx2 2 R Sxy
N n
20 CAPTULO 1. ESTIMADORES ESPECIAIS
Note-se que:
Na prtica, esta relao pode ser utilizada para verificar, quando conve-
niente o uso do estimador de razo ao invs do estimador simples do total ou
da mdia, j que muitas vezes possvel conhecer aproximadamente o valor
de = (x, y) e tambm a relao entre Cx e Cy .
Xbest
xest = o estimador simples da mdia da caracterstica x na amostra
N
estratificada.
X
L X
L
Ybest = Nh y h = Nh Y h = Y
h=1 h=1
X
L X
L
best =
X Nh xh = Nh X h = X
h=1 h=1
donde:
Y
YbRC |n=N = X=Y
X
sabido que os estimadores de razo so viciados exceto se a populao
for de um tipo muito especial em termos de relao entre x e y.
Apesar disso, temse afirmado que em muitos casos o estimador de razo
prefervel ao estimador natural (simples) por que d melhor preciso. Entre-
tanto, esta afirmao s verdadeira, quando se consegue tornar desprezvel
o vcio ou tendenciosidade do estimador de razo.
Acontece que, como YRC um estimador de razo se pode demonstrar
que:
| E(YbRC Y | best ) = CV (xest )
q CV (X
V (YbRC )
1
O estimador YbRC depende apenas do conhecimento do total X, e no dos totais Xh
dos estratos.
22 CAPTULO 1. ESTIMADORES ESPECIAIS
X
L
N 2 S 2 (x) 2 X
L
N 2 Sh (x)
h h h
0, 01 X +
h=1
N2 n h h=1
N 2 Nh
PL S 2 (x) N 2
h h
2
h=1 h N
n
2 P L N 2 S 2 (x)
h h
0, 01 X + 2 N
h=1 N h
onde:
nh
h = depende do critrio de alocao da amostra em cada estrato;
n
1 Nh
P 2
Sh2 (x) = Xhj X h
Nh 1 j=1
Xhj o valor da caracterstica x associada unidade j do estrato h.
Esta condio quanto preciso na estimao de X ser tambm usada no
estabelecimento de uma expresso aproximada para a varincia do estimador
de razo combinada.
Alm disto, h que notar a equivalncia de fixar um coeficiente de variao
de 10% para xest e de admitir um erro mximo de 20% na estimao de X
com 95% de confiana.
No se dispe de uma expresso exata para a varincia do estimador de
razo combinada. Porm, se a amostra de tamanho suficientemente grande
para tornar desprezvel a tendenciosidade do estimador, podese obter uma
expresso aproximada para a varincia:
2 !
2 y
V (YbRC ) = E YbRC Y = E est
X Y
xest
2 ! 2
y est Y X X 2
= E X xest =E (y R xest )
xest X xest x2est est
2 !
X
= N 2E (y R xest )2
x2est est
1.4. ESTIMADORES DE RAZO EM AMOSTRAGEM ESTRATIFICADA23
X
=1
xest
Da
V (YbRC ) 2
= N 2 E (y est R xest ) = N 2 E y 2est + R2 x2est 2R y est xest
Porm:
2
E(y 2est ) = V (y est ) + [E(y est )]2 = V (y est ) + Y
2
E(x2est ) = V (xest ) + X
E(xest y est ) = COV (xest , y est ) + E(xest )E(y est ) = COV (xest , y est ) + X Y
Da
V (YbRC )
= N 2 [V (y est ) + R2 V (xest ) 2 R COV (xest , y est )]
2 2
+N 2 [Y + R2 X 2RX Y ]
como:
2 2
Y + R2 X 2RX Y = (Y RX)2 = 02 = 0
V (YbRC )
= N 2 [V (y est ) + R2 V (xest ) 2R COV (xest , y est )]
agora:
X
L
N 2 Nh nh S 2 (y)
h h
V (y est ) =
h=1
N2 Nh nh
X
L
N 2 Nh nh S 2 (x)
h h
V (xest ) =
h=1
Nh Nh nh
onde:
N
1 X h
N
1 X h
e finalmente:
X
L
Nh2
= E(xh X h )(y h Y h ) + 0
h=1
N2
XL
Nh2
= COV (xh , y h )
h=1
N2
Ento finalmente:
X
L
N 2 Nh nh Sh (x, y)
h
COV (xest , y est ) =
h=1
N2 Nh nh
Da, obtm-se:
XL
Nh2 Nh nh 1 2
V (YbRC )
= N2 2
[Sh (y) + R2 Sh2 (x) 2 R Sh (x, y)]
h=1
N N h n h
1.4. ESTIMADORES DE RAZO EM AMOSTRAGEM ESTRATIFICADA25
Substituindo-se nesta expresso os valores de Sh2 (y), Sh2 (x) e Sh (x, y) vem:
X
L
Nh2 Nh nh 1
V (YbRC )
=
h=1
Nh 1 Nh nh
"N #
Xh
V (YbRC )
= [(Yhj Y h ) R(Xhj X h )]2
h=1
Nh 1 nh j=1
X (Nh nh ) h 2 i
L
v(YbRC ) = Nh b 2 2 b
sh (y) + Rest sh (x) 2 Rest sh (x, y)
h=1
nh
onde:
best = y est
R
xest
e sh (y), sh (x) e sh (x, y) so estimadores no viciados de Sh2 (y), Sh2 (x) e
2 2
YbRC
y RC =
N
Neste caso a varincia V (y RC ) dada por:
1
V (y RC ) = 2 V (YbRC )
N
e um estimador de V (y RC ) dado por:
1
v(y RC ) = 2 v(YbRC )
N
26 CAPTULO 1. ESTIMADORES ESPECIAIS
X
L
y XL
Yh XL
YbRS |n=N = h
Xh = Xh = Nh Y h = Y
h=1
xh h=1
X h h=1
| E(YbhR ) Yh |
q CV (xh ) h = 1, 2, , L
b
V (YhR )
| E(YbRS ) Y |
q
V AR(YbRS )
poderia ser to grande quanto L CV (xh )
Exemplo: Se tivermos 50 estratos com CV (xh ) = 0, 1 em cada estrato,
o vcio de YbRS poderia ser da ordem de 0,7 vezes seu erro padro.
Uma regra prtica aadotar contra-indica o uso do estimador de razo
separada a menos que: L(CV (xh ) < 0, 20 L = 1, 2, , L.
Talvez esta regra seja conservadora demais pois o vcio pode ser bem
menor que o limite superior conhecido; mas a menos que haja forte evidncia
disso no se deve usar o estimador de razo separada.
Tambm no existe uma expresso exata para a varincia de YbRS . Ser
obtida uma expresso aproximada no caso em que os nh so suficientemente
grandes para tornar desprezvel o vcio em cada um dos estratos. Caso esta
condio no se verifique, a expresso obtida para a varincia no confivel,
e o estimador de razo separada no deve ser usado.
Supondo os nh suficientemente grandes, vem:
!2
XL X
L
V (YbRS )
= E[(YbRS Y )2 ] = E YbhR Yh
h=1 h=1
!2
XL
y
= E ( h Xh Yh )
h=1
xh
" 2 #
XL
yh
= E Xh Yh +
h=1
xh
X L XL
yh yk
+ E Xh Yh Xk Yk
h=1 k=1
xh xk
k6=h
X
L
= V (YbhR ) + 0
h=1
X
L
Nh nh 1 2
= Nh2 Sh (y) + Rh2 Sh2 (x) 2Rh Sh (x, y)
h=1
Nh nh
28 CAPTULO 1. ESTIMADORES ESPECIAIS
Yh
onde: Rh = e Sh2 (y), Sh2 (x) e Sh (x, y) so como definidos anteriormente.
Xh
Esta varincia pode ainda ser escrita:
(N )
X L
N 2
N n 1 X h
V (YbRS ) h h h
= [(Yhj Y h ) Rh (Xhj X h )]2
h=1
Nh1 N h nh j=1
X (Nh nh ) h 2 i
L
v(YbRS ) = Nh b 2 2 b
sh (y) + Rh sh (x) 2 Rh sh (x, y)
h=1
nh
YbRS
y RS =
N
X
L
Nh nh 1 2
V (YbRC ) V (YbRS )
= Nh2 [Sh (y) + R2 Sh2 (x) 2R Sh (x, y)]
h=1
Nh nh
X
L
Nh nh 1 2
Nh2 [Sh (y) + Rh2 Sh2 (x) 2Rh Sh (x, y)]
h=1
Nh nh
X
L
Nh nh
= Nh [(R2 Rh2 )Sh2 (x) 2(R Rh )Sh (x, y)]
h=1
nh
T amanho
Estratos (acres)
Nh Yh Xh Sh2 (y) Sh2 (x) Sh (x, y) Rh
N n1 2 1 2
V (y R )
= Sy + R2 Sx2 2 R Sxy = Sy + R2 Sx2 2 R Sxy
N n n
1
= [620 + (0, 2242)2 (7619) 2(0, 2242)(1453)] = 3, 51
100
PL N
h
3 - Amostra aleatria estratificada (AAE): y est = y h o estimador
h=1 N
simples da mdia da rea com plantao de milho por fazenda
X
L
N 2 Nh nh S 2 (Y ) X
L
N 2 S 2 (y)
V (y est ) = h h
= h h
h=1
N2 Nh nh h=1
N 2 nh
X
L
= Qh Sh2 (y) = (0, 008828)(312) + (0, 001525)(922) = 4, 16
h=1
1.4. ESTIMADORES DE RAZO EM AMOSTRAGEM ESTRATIFICADA31
y est
4 - Amostra aleatria estratificada (AAE): y RC = X o estimador
xest
de razo combinada da mdia da rea com plantao de milho por fazenda
XL
Nh2 Nh nh 1 2
V ( y RC )
= 2
Sh (y) + R2 Sh2 (x) 2R Sh (x, y)
h=1
N Nh nh
X
L
= Qh Sh2 (y) + R2 Sh2 (x) 2R Sh (x, y)
h=1
= (0, 008828)(312) + (0, 001525)(922) + (0, 008828)(0, 2242)2 (2055) +
+(0, 001525)(0, 2242)2 (7357) 2(0, 008828)(0, 2242)(494) +
2(0, 001525)(0, 2242)(858)
= 3, 10
1 PL y
h
5 - Amostra aleatria estratificada (AAE): y RS = Xh o es-
N h=1 xh
timador de razo separada da mdia da rea com plantao de milho por
fazenda
XL
Nh2 Nh nh 1 2
V ( y RS )
= 2
Sh (y) + Rh2 Sh2 (x) 2Rh Sh (x, y)
h=1
N Nh nh
X
L
= Qh Sh2 (y) + Rh2 Sh2 (x) 2Rh Sh (x, y)
h=1
= (0, 008828)(312) + (0, 001525)(922) + (0, 008828)(0, 2350)2 (2055) +
+(0, 001525)(0, 2109)2 (7357) 2(0, 008828)(0, 2350)(494) +
2(0, 001525)(0, 2109)(858)
= 3, 06
32 CAPTULO 1. ESTIMADORES ESPECIAIS
Resumo e comentrios:
Desenho M etodo de Ganhos de
Estrategia amostral estimaao
V ariancias precisao
V (y)
4 AAE razo combinada V ( y RC ) = 3, 10 V ( y RC )
= 2, 00
V (y)
5 AAE razo separada V ( y RS ) = 3, 06 V ( y RS )
= 2, 03
No existem frmulas exatas para o vcio nem para a varincia dos es-
timadores, embora as aproximaes da varincia existentes sejam sat-
isfatrias para amostras cujo tamanho satisfaz a condio de tornar
desprezvel o vcio.
y reg = y + b(X x)
34 CAPTULO 1. ESTIMADORES ESPECIAIS
onde:
b o estimador usual de mnimos quadrados baseado na amostra.
P
n
(yi y)(xi x)
sxy i=1
b= 2 = P
n
sx
(xi x)2
i=1
N n 1 n1 2
v(y reg ) = sy + b2 s2x 2bsxy
N n n2
1 1 X
n
N n
= [(yi y) b(xi x)]2
N n n 2 i=1
Ybreg = N y reg
N n1 1 X
n
v(Ybreg ) = N 2 [(yi y) b(xi x)]2
N n n 2 i=1
Ybreg = N y reg = N y + b(X x)
= 100 (1657, 5 + 2, 62 (100 125))
= 100 (1592) = 159 200
ybi = a + bxi
onde: a = y bx = 1675, 5 2, 62 (125) = 1330.
Neste caso, tem-se:
N (N n) 1 X
n
v(Ybreg ) = N 2 v(y reg ) = [(yi y) b(xi x)]2
n n 2 i=1
N (N n) X
n
= (yi ybi )2
n (n 2) i=1
100 (100 4)
= (1410 1461)2 + + (1850 1854)2
4 (4 2)
100 (96)
= (7035) = 16 884 000
4
q
cujo desvio padro estimado por: v(Ybreg ) = 4 109.
N (N n) X
4
v(Yb ) = N 2 v(y) = (yi y)2
n i=1
100 (96)
= (33292) = 79 900 000
4
q
cujo desvio padro estimado por: v(Yb ) = 8 939.
N n1 2
V (y reg )
= Sy (1 2xy )
N n
N n1 2
V (y R )
= Sy + R2 Sx2 2 R Sxy
N n
1.5. ESTIMADORES DE REGRESSO 37
N n1 2
V (y) = S
N n y
Examinando as expresses acima, imediato notar que o estimador de
regresso mais preciso que o estimador simples da mdia a no ser xy = 0,
caso em que os estimadores so igualmente precisos.
O estimador de regresso prefervel ao estimador de razo quando:
1.6 Ps-estratificao
muito comum na prtica a ocorrncia de situaes onde a tcnica de estrat-
ificao poderia ser aplicada para melhorar a qualidade da amostra, porm
no se dispe de uma lista completa das unidades da populao com os re-
spectivos valores da caracterstica a ser usada na estratificao, ou seja, o
estrato para o qual a unidade pertence no conhecido at que os dados da
amostra sejam coletados. Caractersticas de pessoas, tais como: idade, sexo,
raa e nvel educacional so exemplos prticos dessa aplicao.
Nestes casos, quando forem conhecidos os limites dos estratos, e os seus
respectivos tamanhos (atravs de um censo anterior, por exemplo), possvel
fazer uso da estratificao para melhorar a qualidade das estimativas, atravs
da tcnica de ps-estratificao que consiste no seguinte:
i) selecionase uma amostra aleatria simples sem reposio de tamanho
n da populao N (sem considerar a estratificao);
ii) observase para cada unidade selecionada o valor da caracterstica de
estratificao x;
iii) de acordo com os valores observados de x, distribui-se a amostra em
L estratos previamente delimitados;
iv) considera-se a parte da amostra em cada um dos estratos como uma
amostra aleatria simples sem reposio do estrato (vide estimao em sub-
populaes), de tal forma que n1 + n2 + + nL = n
Neste caso n1 , n2 , nL so variveis aleatrias. A amostra em cada
estrato considerada como uma amostra aleatria simples sem reposio da
subpopulao formada pelas unidades pertencentes ao estrato.
Assim sendo, a maneira de estimar ser derivada da teoria apresentada
para estimao em subpopulaes.
1.6. PS-ESTRATIFICAO 39
Ento:
V (y pos ) = En1 ,n2 , ,nL V (y pos | n1 , n2 , , nL +
+Vn1 ,n2 , ,nL [E(y pos | n1 , n2 , , nL ]
Mas:
E(y pos | n1 , n2 , , nL ) = Y
Donde:
Logo:
V (y pos ) = En1 ,n2 , ,nL V (y pos | n1 , n2 , , nL
L !
X N2 1 1 2
h
= En1 ,n2 , ,nL ( )S
h=1
N 2 nh Nh h
Da:
X
L
N2 1 XL
Nh2 Sh2
h
V (y pos ) = 2
E( )Sh2
h=1
N nh h=1
N 2 Nh
1.6. PS-ESTRATIFICAO 41
1 1 E(nh ) 1 1 1 1
= = nh = E(n )
nh E(nh ) nh E(nh ) h nh E(nh )
E(nh ) 1+
E(nh )
Tambm: hn i
h Nh
E =
n N
42 CAPTULO 1. ESTIMADORES ESPECIAIS
Logo:
Nh
E(nh ) = n
N
2N n 1 Nh Nh
V (nh ) = n 1
N n N N
Isto :
Nh
E(nh ) = n
N
(N n) Nh Nh
V (nh ) = n 1
N N N
1
Levando na expresso de E( ) vem:
nh
(N n) Nh Nh
n 1
1 1 N N N
E( ) = 1+ 2
nh Nh N
n n2 h2
N
N
1 (N n) 1 1
=
Nh
1+ N 1
N n h
n
N N
1 (N n) 1 Nh
= 1+ 1
Nh N n N
n
N
Substituindo, finalmente, na expresso de V (y pos ), vem:
XL XL
Nh2 N N n1 N Nh2 Sh2
V (y pos )
= 1 + 1 Sh
2
h=1
N 2 n Nh N n Nh h=1
N 2 Nh
XL XL
Nh2 N 1 2 Nh2 N N n 1 N
= 2
Sh + 2
1 Sh2
h=1
N nNh Nh h=1
N n Nh N n Nh
N n 1 X Nh 2 N n 1 X
L L
Nh 2
= Sh + (1 )S
N n h=1 N 2
N n h=1 N h
Da:
N n 1 X
L
Nh 2
V (y pos )
(p)
= V (y est ) + (1 )S
2
N n h=1 N h
1.7. O USO DE INFORMAES AUXILIARES NA ESTIMAO 43
(p)
onde: V (y est ) a varincia do estimador da mdia no desenho de amostragem
estratificada com alocao proporcional.
medida que n cresce, a segunda parcela de V (y pos ) tende a zero.
(p)
V (y pos ) V (y est )
populao.
46 CAPTULO 1. ESTIMADORES ESPECIAIS
1.8 Exerccios
1.8.1 (Thompson (1992), pg. 76) Numa cidade com 75.000 habitantes,
uma amostra aleatria simples de 4 domiclios selecionada dos 25.000
domiclios da cidade para estimar o custo mdio de alimentao por
domiclio em uma semana. O primeiro domiclio selecionado tinha 4
pessoas e gastou R$150,00 com alimentao naquela semana. O se-
gundo domiclio tinha 2 pessoas e gastou R$100,00. O terceiro, com 4
pessoas, gastou R$200,00. O quarto, com 3 pessoas, gastou R$140,00.
N n
Considere: =1 s2y = 1691, 70 s2x = 0, 9166 sxy = 37, 5
N
1 X
n
sxy = (xi x)2
n 1 i=2
1 X
N
Sxy = (XI X)(YI Y )
N 1 I=1
P
4 P
4
yi = 488 xi = 1.100
i=1 i=1
P
4 P
4 P
4
yi2 = 63.714 x2i = 315.000 xi yi = 141.050
i=1 i=1 i=1
1.8.4 O objetivo estimar o total de despesa com gastos sociais das prefeituras
de uma regio que abrange 281 municpios. Foi selecionada uma amostra
aleatria sem reposio de 50 municpios. Sabe-se que a populao to-
tal da regio de 6.818 (em milhares). Calcule a estimativa de total
da caracterstica y, que representa a despesa com gastos sociais, e o re-
spectivo intervalo com 95% de confiana para essa estimativa de total
baseada em cada um dos seguintes estimadores:
a) Estimador simples.
P
50 P
50
yi = 128.080 xi = 1.067
i=1 i=1
di x y1 y2 y3 di x y1 y2 y3 di x y1 y2 y3
d1 5 3 1 3 d8 2 0 0 1 d15 6 3 2 0
d2 2 0 1 1 d9 3 1 1 1 d16 4 2 1 1
d3 4 1 2 0 d10 2 0 2 0 d17 4 2 1 1
d4 4 2 1 1 d11 6 4 2 1 d18 3 1 0 1
d5 6 4 1 1 d12 3 1 0 0 d19 2 0 2 1
d6 3 1 1 2 d13 4 2 1 1 d20 4 2 1 1
d7 5 3 1 1 d14 5 3 1 1 d21 3 1 1 1
Estrato 1
Famlias na amostra 1 2 4 4 5
Pessoas com mais de 16 anos 4 3 2 1 2
Fumantes com mais de 16 anos 1 1 0 1 1
Estrato 2
Famlias na amostra 1 2 4 4 5
Pessoas com mais de 16 anos 5 6 4 4 3
Fumantes com mais de 16 anos 3 3 1 2 2
Estimar o total de fumantes entre as pessoas maiores de 16 anos na
localidade, utilizando:
P
2.055 P
2.055
yi = 25. 751 xi = 62. 989
i=1 i=1
s2y =
1.334, 470 s2x = 490, 4300 b = 0, 354585
N n
(Considere = 1)
N
1.8.10 Para estimar o total de cabeas de gado em uma determinada regio, foi
selecionada aleatoriamente uma amostra de 24 fazendas dentre as 1.238
fazendas daquela regio. O nmero de cabeas de gado de cada fazenda
da amostra foi coletado (caracterstica y) e alm disso dispunha-se do
correspondente nmero de cabeas de gado obtido no ltimo Censo
Agropecurio. Usando como varivel auxiliar (x) a informao do
nmero de cabeas de gado coletado no ltimo censo e sabendo-se que:
P
24 P
24
yi = 13.646 xi = 13.638 s2y = 256.154, 86
i=1 i=1
Amostragem de Conglomerados
53
54 CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
C1 C2 CM
U11 Y11 U21 Y21 ... UM1 YM1
U12 Y12 U22 Y22 ... UM2 YM2
.. .. .. .. .. ..
. . . . . .
U1N1 Y1N1 U2N2 Y2N2 . . . UMNM YMNM
onde:
2.3. CONGLOMERADOS EM 1 ESTGIO 57
C10 C20 0
Cm
0
U11 Y110 0
U21 Y210 ... 0
Um1 0
Ym1
0
U12 Y120 0
U22 Y220 ... 0
Um2 0
Ym2
.. .. .. .. .. ..
. . . . . .
0 0 0 0 0 0
U1N 0 Y1N 0 U2N 0 Y2N 0 . . . UmNm
0 YmNm
0
1 1 2 2
P
m
O tamanho total da amostra : n = Ni0 que uma varivel aleatria,
i=1
cujos valores dependem dos conglomerados selecionados.
m ! P
M
X X
m Ni
i=1
n = E Ni0 = E(Ni0 ) =m
i=1 i=1
M
N m
= m = N = f1 N
M M
58 CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
m
sendo: f1 = , a frao de amostragem do primeiro estgio.
M
A figura 2.1 apresenta uma ilustrao da seleo das unidades de uma
amostra de conglomerados em 1 estgio.
Parmetros da caracterstica y
Total da caracterstica y no conglomerado Ci :
Ni
X
Yi = Yij
j=1
Yi
Yi =
Ni
Varincia da caracterstica y em Ci :
N
1 X i
Si2 = (Yij Y i )2
Ni 1 j=1
X
M
Y = Yi
i=1
Y
Y =
N
Y
Y =
M
N
1 XX
M i
S2 = (Yij Y )2
N 1 i=1 j=1
60 CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
MX 0
m
b
YAc1 = Y
m i=1 i
Prova:
MX MX
m m
b
E(YAc1 ) = 0
E(Yi ) = E(Yi0 )
m i=1 m i=1
M ! M !
MX 1 X Mm X
m
= Yk = Yk
m i=1 M k=1 m M k=1
X
M
= Yk = Y
k=1
1MX 0 1 X 0
m m
YbAc1
y Ac1 = = Yi = Yi
N N m i=1 m N i=1
2.3. CONGLOMERADOS EM 1 ESTGIO 61
N
onde: N = o tamanho mdio por conglomerado.
M
!
YbAc1 1 b 1
E y Ac1 = E = E YAc1 = Y =Y
N N N
1 X 0
m
YbAc1
y Ac1 = = Y
M m i=1 i
!
YbAc1 1 b Y
E (y Ac1 ) = E = E YAc1 = =Y
M M M
62 CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
! !2
M X
m
M X
m
V (YbAc1 ) = V Y0 =E Y0Y
m i=1 i m i=1 i
2
Pm
0 m !2
M i=1 Yi mY 2 X
= E = E M Yi0 mY
m m2
i=1
!2 !2
M 2 X m
M 2 X m
0
= 2
E Yi0 mY = 2 E Yi Y
m i=1
m i=1
M2 Xm
0 2 X m X m
0 0
= E Y Y + Y Y Y Y
m2 i=1 i
i=1 k=1
i k
i6=k
M2 Xm
0 2 X
m X
m
= E Yi Y + E Yi0 Y Yk0 Y
m2
i=1 i=1 k=1
i6=k
m X m(m 1) X X 0
M M M
M2
2 0
= Y Y + Y Y Y Y
m2 M i=1
i i k
M(M 1) i=1 k=1
i6=k
MXM
2 (m 1) XM X M
0
= Yi Y + Yi Y Yk0 Y
m i=1 (M 1) i=1 k=1
i6=k
fazendo:
1 X
M
2
Se2 = Yi Y
M 1 i=1
2.3. CONGLOMERADOS EM 1 ESTGIO 63
e notando que:
M !2
X
M
X
0 = Yi Y = Yi Y
i=1 i=1
XM
2 XX
M M
= Yi Y + Yi Y Yk Y
i=1 i=1 k=1
i6=k
X
M X
M
X
M
2
= Yi Y Yk Y = Yi Y
i=1 k=1 i=1
i6=k
Segue-se que:
" #
M (m 1) X M
2
V (YbAc1 ) = 2
(M 1) Se Yi Y
m (M 1) i=1
M
= (M 1) Se2 (m 1) Se2
m
M(M m) 2 M 2 (M m) Se2
= Se =
m M m
b M 2 (M m) s2e
v(YAc1 ) =
M m
2.3. CONGLOMERADOS EM 1 ESTGIO 65
ei = Ni
Ai + A
Segue-se que:
P
Ni
Ai = Yi = Yij o nmero de unidades em A, do conglomerado i;
j=1
Ai Yi
PA i = = = Y i a proporo de unidades em A, do conglomerado
Ni Ni
i.
Assim, a proporo global de unidades em A na populao N dada
por:
P
M P
M
Ai Yi
i=1 i=1 Y
PA = = = =Y
PM P
M N
Ni Ni
i=1 i=1
ou ainda,
P
M
Ai X
M
i=1 Ni
PA = = PA i
N i=1
N
Em vista dessas expresses, e considerando a teoria j apresentada para
obteno dos parmetros de N , imediata a obteno de estimadores no
viciados para a proporo PA :
M X Ni0 0 1 X 0 0 1 X 0
m m m
pAc1 = PA i = Ni PA i = Ai
m i=1 N mN i=1 mN i=1
66 CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
onde: 0
Ni
P
A0i = Yi0 = Yij0 o nmero de unidades em A, do i-simo conglomerado
i=1
selecionado;
A0 Y0 0
PA0 i = i0 = i0 = Y i a proporo de unidades em A, do i-simo
Ni Ni
conglomerado selecionado.
1 X 2 2
M
1 2 2
= Ni PA i 2NNi PA i PA + N PA
M 1 N 2 i=1
(M )
1 1 X XM XM
2 2
2 2
= 2 Ni PA i 2NPA Ni PA i + N PA
N M 1 i=1 i=1 i=1
(M )
1 1 X 2
= 2 Ni2 PA2 i 2NPA NPA + MN PA2
N M 1 i=1
(M )
1 1 X 2
= 2 Ni2 PA2 i MN PA2
N M 1 i=1
(M ) (M )
1 1 X N 2
1 1 X Y 2
= 2 Yi2 M 2 PA2 = 2 Yi2 M 2
N M 1 i=1
M N M 1 i=1
M
(M )
1 1 X 2 1 1 X
M
2 1
2
= 2 Y i MY = 2 Yi Y = 2 Se2
N M 1 i=1 N M 1 i=1 N
Esta varincia pode ser estimada por:
M m s2e 1 M m s2e
v(pAc1 ) = = 2
M m N M m
com:
m 2
1 X Yi0
s2e = pAc1
m 1 i=1 N
2.3. CONGLOMERADOS EM 1 ESTGIO 67
e
!2
1 Xm
1 Xm
s2e = Yi0 Y0
m 1 i=1 m i=1 i
mas:
1 X
m
0 2
s2e = 2 Yi N pAc1
N (m 1) i=1
!2
1 X
m
N Xm
= 2 Yi0 Yi0
N (m 1) i=1 mN i=1
!2
1 Xm
1 X 0
m
0
= Yi Y
2
N (m 1) i=1 m i=1 i
m !2
1 Xm
1 X 1
= Yi02 Yi0 = 2 s2e
2
N (m 1) i=1 m i=1 N
conseqentemente:
m !2
1 M m 1 1 Xm
1 X
v(pAc1 ) = 2 Yi02 Yi0
N M m (m 1) i=1 m i=1
Exemplo 2.1
Com o objetivo de avaliar a proporo de fumantes, entre os alunos da 3a
srie do 2o grau da rede de ensino publico de certa localidade, foram formados
conglomerados a partir de uma relao de 3500 turmas existentes, grupando-
se cada 5 turmas em aproximadamente 150 alunos, supondo uma base de 30
alunos por turma.
Uma amostra de 10 conglomerados foi selecionada, observando-se:
68 CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
1 X 0
m
1
pAc1 = Ai = 562 = 0, 375 ou 37, 5%
mN i=1 10 (150)
ento:
1 M m s2e 1 700 10 165, 51
v(pAc1 ) = 2 =
N M m (150)2 700 10
= 0, 000725
XM
1 X 1
N
1 XX
M N
E(Yij0 ) = Yij = Yij = Y
i=1
M j=1 N M N i=1 j=1
E(Yik0 ) = Y
h 2 i XM X
N
1 2 MN 1
0 0
E Yij E(Yij ) = Yij Y = S2
i=1 j=1
MN MN
70 CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
1 XX
M N 2
S2 = Yij Y
MN 1 i=1 j=1
Donde tambm:
h i MN 1
2
E (Yik0 E(Yik0 )) = S2
MN
Finalmente:
XM X N X N Y ij Y Yik Y
E Yij0 E(Yij0 ) (Yik0 E(Yik0 )) =
i=1 j=1 k=1
MN N 1
j6=k
1 P
M P N P N
Yij Y Yik Y
M N N 1 i=1 j=1 k=1
j6=k
(Yij0 , Yik0 ) =
MN 1 2
S
MN
Esta correlao expressa uma medida de homogeneidade dentro dos con-
glomerados da populao, e ser denominada coeficiente de correlao
intraclasse e denotada por :
1 P
M P N P N
Yij Y Yik Y
M N N 1 i=1 j=1 k=1
j6=k
= (Yij0 , Yik0 ) =
MN 1 2
S
MN
1 P
M P N P N
Yij Y Yik Y
M N N 1 i=1 j=1 k=1
j6=k
=
MN 1 2
S
MN
2.3. CONGLOMERADOS EM 1 ESTGIO 71
X
M X N
N X
Yij Y Yik Y =
i=1 j=1 k=1
j6=k
X
M X N
N X
= Yij Y i + Y i Y Yik Y i + Y i Y
i=1 j=1 k=1
j6=k
X
M X N
N X 2
= Yij Y i (Y ik Y i ) + Y i Y
i=1 j=1 k=1
j6=k
X
M X
N X
N M
X 2
= Yij Y i (Y ik Y i ) + N(N 1) YiY
i=1 j=1 k=1 i=1
j6=k
2
X
M XN X
M X
N M
X 2
2
= Yij Y i Yij Y i + N(N 1) YiY
i=1 j=1 i=1 j=1 i=1
Note que:
X
N
Yij Y i = 0
j=1
Lembrando que:
1 X
N
2
Si2 = Yij Y i
N 1 j=1
e fazendo:
1 X 2
M
Sd2 = S
M i=1 i
Segue-se que:
X
M X N
N X X
M M
X 2
2
Yij Y Yik Y = N 1 Si +N(N 1) YiY
i=1 j=1 k=1 i=1 i=1
j6=k
72 CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
Como tambm:
1 X 2
M
2
Se = YiY
M 1 i=1
vem:
X
M X N
N X 2
Yij Y Yik Y = N 1 M Sd2 +N(N 1) (M 1) S e
i=1 j=1 k=1
j6=k
X N
M X 2
2
MN 1 S = Yij Y
i=1 j=1
X N
M X 2
= Yij Y i + Y i Y
i=1 j=1
X N h
M X i
2
MN 1 S = (Yij Y i )2 + 2(Yij Y i )(Y i Y ) + (Y i Y )2
i=1 j=1
X
M X
N X
M X
N X
M
2
= (Yij Y i ) + 2 (Y i Y ) (Yij Y i ) + N (Y i Y )2
i=1 j=1 i=1 j=1 i=1
X
M X
M
= (N 1)Si2 + N (Y i Y )2
i=1 i=1
2
= (N 1) M Sd2 + N (M 1) S e
2.3. CONGLOMERADOS EM 1 ESTGIO 73
ou seja:
2
2 (N 1) M Sd2 + N (M 1) S e
S =
MN 1
Assim estamos agora em posio para analisar melhor a influncia na
variao de da maior homogeneidade dos conglomerados.
Supondo que os conglomerados fossem homogneos devemos ter:
Sd2 = 0
portanto:
2 2
(M 1) S e 1 2 (M 1) S e
Sd
= M N = M
2 = 1
MN 1 2 N (M 1) S e
S
MN MN
Logo, quando h homogeneidade mxima dentro dos conglomerados =
= 1.
Por outro lado, se h heterogeneidade dentro dos conglomerados com
homogeneidade entre eles, o valor de deve diminuir. Se admitirmos que
2
S e = 0 vem:
MN 1 S 2 = (N 1) M Sd2
donde:
1 2
Sd 1
= N =
2
(N 1) M Sd (N 1)
MN
Logo, conclui-se que:
1
;1
(N 1)
Exemplo 2.2
74 CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
U1 U2 U3 U4 U5 U6
Y1 Y2 Y3 Y4 Y5 Y6
q q q q q q
3 5 3 7 2 8
C1 C2
U1 3 U2 5
U3 3 U4 7
U5 2 U6 8
C1 C2
U2 5 U1 3
U5 2 U3 3
U6 8 U4 7
1 1
Note-se que: = = 0, 50
N 1 2
Portanto, est bem prximo do valor mnimo que pode assumir, indi-
cando alto grau de heterogeneidade.
1 X 0 2
m
s2e = Y i y Ac1
m 1 i=1
2
um estimador no viciado para S e , e notando que:
1 X 02
m
s2d = S
m i=1 i
um estimador no viciado para Sd2 , basta substituir estes estimadores na
expresso de para obter um estimador consistente para .
(M 1) s2e 1 2
sd
b= M N
M(N 1) s2d + N (M 1) s2e
MN
Alm disso, notando-se que:
2
MN 1 2 M(N 1) Sd2 + N (M 1) S e
S =
MN MN
Segue-se que um estimador no viciado para S 2 dado por:
e conseqentemente, que b
pode ser escrito:
(M 1) s2e 1 2
sd
b
= M N
MN 1 2
s
MN
ou ainda, para M muito grande:
1 2
s2e sd
b
= N
s2
Exemplo 2.3 (Nascimento (1981), pg.32)
Tem-se um fichrio de 20.000 segurados de uma Companhia de Seguros,
em um plano A. As 20.000 fichas esto dispostas em 400 gavetas, com 50
fichas cada.
Considerando as gavetas como conglomerados, tem-se:
M = 400 e N = 50
Selecionou-se uma amostra aleatria sem reposio de 10 gavetas, correspon-
dendo a 500 fichas. Nas gavetas selecionadas foram calculadas as reservas
tcnicas de todas as fichas, obtendo-se:
Estimativa de Sd2
1 X 0 2 277
m
s2d = S = = 27, 7
m i=1 i 10
2
Estimativa de S e
1 X 0
m
1 2
s2e = (Y y Ac1 )
m 1 N 2 i=1 i
m 2
P 0
Xm Yi
1 1 02 i=1
= 2 Yi
m 1 N i=1 m
" #
2
1 (3.514)
= 2 1.484.156 = 11, 082
9 (50) 10
Estimativa de S 2
M(N 1) s2d + N (M 1) s2e
s2 =
MN 1
400(50 1) (27, 7) + 50 (399) (11, 082)
= = 38, 20
20.000 1
Estimativa do coeficiente de correlao intraclasse
1 2
s2e sd 11, 0832 0, 554
b
= N = = 0, 276
s2 38, 20
V (y AAS )
Ef =
V (y Ac1 )
78 CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
onde:
y o estimador de Y na AAS; e
y Ac1 o estimador de Y na Ac1.
A eficincia Ef > 1 se V (y Ac1 ) < V (y AAS ).
Mas:
M m 1 Se2
V (y Ac1 ) =
M N2 m
e:
N n S2
V (y AAS ) = aqui N = MN
N n
onde:
1 X
M
2
Se2 = Yi Y
M 1 i=1
1 XX M N 2
S2 = Yij Y
M N 1 i=1 j=1
MN mN S 2 M m S2
V (y AAS ) = =
MN mN M mN
logo, tem-se:
M m S2
2
Ef = M mN = N S
M m 1 Se2 Se2
M N2 m
2
X
M
2 X
M XN
Yi Y = Yij N Y
i=1 i=1 j=1
X N
M X 2 X
M X N
N X
= Yij Y + Yij Y Yik Y
i=1 j=1 i=1 j=1 k=1
j6=k
= M N 1 S 2 + N 1 MN 1 S 2
como:
X
M
2
Yi Y = (M 1) Se2
i=1
vem:
MN 1 2 MN 1
Se2 = S + N 1 S2
M 1 M 1
MN 1 2
= S 1+ N 1
M 1
Da segue-se que:
N S2
Ef =
MN 1 2
S 1+ N 1
M 1
= M e MN 1
supondo: M 1 = MN vem:
1
Ef
=
1+ N 1
Ef > 1 1 + N 1 < 1 N 1 < 0 < 0
O termo 1 + N 1 mostra quanto a varincia afetada pelo uso
de conglomerado ao invs de um elemento como unidade amostral. Kish
(1965) define este fator como o efeito de desenho de uma amostra de
conglomerados de tamanho N ou efeito de conglomerao. Este fator
mede a influncia da conglomerao na preciso do estimador.
Portanto:
V (y AAS ) 1
Ef = =
V (y Ac1 ) 1+ N 1
vem:
1
Ef ; +
N
e
V (y Ac1 )
= V (y AAS ) 1 + N 1
isto , a varincia do estimador da mdia
naAc1
a varincia do estimador
da mdia na AAS vezes o fator 1 + N 1 .
Para o caso de conglomerados de mesmo tamanho, se estivermos inte-
ressados na mesma preciso, qual dever ser o tamanho da amostra de con-
glomerados?
V (y Ac1 ) equivale a V (y AAS ) quando:
V (y Ac1 )
= V (y AAS )
1+ N 1
ou seja, quando:
1 Se2 S2
2
=
N m 1+ N 1 mN
2
S S2
e =
m 1+ N 1 mN
1 X
M
2
Se2 = Yi Y
M 1 i=1
o aumento de Se2 tanto maior quanto mais diferentes forem os totais dos
conglomerados. Em geral, os totais de uma caracterstica y tendem a crescer
quando os tamanhos dos conglomerados crescem. Ento, usual controlar a
variao de tamanho dos conglomerados na expectativa de reduo da varin-
cia e de aumento da eficincia com o uso da amostragem de conglomerados.
Os processos usuais de controle do tamanho dos conglomerados so:
a) selecionar os conglomerados com probabilidades proporcionais ao tamanho
dos conglomerados;
b) estratificar os conglomerados, de modo que a caracterstica de estrati-
ficao seja o tamanho; e
c) usar um estimador de razo, com caracterstica auxiliar definida pelo
tamanho do conglomerado.
2.5. PROBABILIDADES DESIGUAIS DE SELEO 83
i = 1, 2, , m.
A partir dos conglomerados selecionados pode-se calcular as seguintes
estatsticas:
0
Ni
X
Yi0 = Yij0
j=1
0 Yi0
Yi =
Ni0
N0
02 1 X i
0
Si = 0 (Yij0 Y i )2
Ni 1 j=1
1 X Yi0
m
b P
YAc1 =
m i=1 Pi0
1 X Yi0
m
P
y Ac1 =
m N i=1 Pi0
2
V YbAc1 = E
P
YbAc1
P
Y2
!2
1 X m 0
Yi
= E 0
Y2
m i=1 Pi
Xm 0 2 Xm X m
1 Yi Yi0 Yk0
Y2
= E +
m2 i=1 Pi0 P 0
i=1 k=1 i k
P 0
i6=k
X
m
0 2 XX
m m
1 Yi 1 Yi0 Yk0
= E + 2 E Y2
m2 i=1
Pi0 m i=1 k=1
Pi0 Pk0
i6=k
M 2 0 0
1 X Yi 1 Yi Yk
= 2
m Pi + 2 m(m 1)E 0
E 0
Y2
m i=1
Pi m Pi Pk
1 X Yi2 (m 1) 2
M
= + Y Y2
m i=1 Pi m
1 X Yi2 Y 2
M
=
m i=1 Pi m
M !
1 X Yi2
= Y2
m i=1 Pi
X
M
Y2 X
M
Y2
i 2 i
Y = Pi 2Y 2 + Y 2
i=1
Pi i=1
Pi2
M !
XM
Yi2 X Yi XM
2
= P 2
2 i
Pi Y + Y Pi
i=1
Pi i=1
Pi i=1
XM 2
Yi Yi
= 2
2 + Y 2 Pi
i=1
Pi Pi
XM 2
Yi 2
= Y Pi = SeP
i=1
P i
86 CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
Segue-se que:
S2
V YbAc1
P
= eP
m
e um estimador no viciado de V YbAc1
P
obtido por:
s2
v YbAc1
P
= eP
m
onde:
m 0 2
1 X Yi b
s2eP
= P
0 YAc1
m 1 i=1 Pi
Para mostrar que v YbAc1
P
no viciado para V YbAc1
P
, escreve-se:
Xm 0 2
1 Yi
v YbAc1
P
= b P
0 YAc1
m (m 1) i=1 Pi
" m 0 2 #
1 X Y 2
= i
0 m YbAc1
P
m (m 1) i=1 Pi
1
= mV YbAc1
P
V YbAc1P
(m 1)
= b
V YAc1P
2.5. PROBABILIDADES DESIGUAIS DE SELEO 87
X
K
Tk = Xi K {1, 2, , M}
i=1
X
M
T0 = 0 e X = Xi
i=1
Exemplo 2.5
2.5. PROBABILIDADES DESIGUAIS DE SELEO 89
E (ti ) = i
V (ti ) = i (1 i )
Logo:
X
m
Y0 X
M
Yi
YbHT = i
0
= ti
i=1
i i=1
i
X M
Yi XM
Yi XM
b
E YHT = E (ti ) = i = Yi = Y
i=1 i
i=1 i i=1
M !
X Yi XM
Yi2 XM X M
Yi Yj
b
V YHT = V ti = V (ti ) + COV (ti , tj )
2
i=1 i i=1
i
i=1 j=1 i j
i6=j
X
M
Y2 X
M X
M
Yi Yj
i
= 2
i (1 i ) + ( ij i j )
i=1
i i=1 j=1
ij
i6=j
X
M
Y2 X
M X
M
Yi Yj
i
= (1 i ) + (ij i j )
i=1
i i=1 j=1
i j
i6=j
Um estimador no viciado da V YbHT dado por:
X m Xm X m 0
(1 0
) ij 0i 0j 0 0
v YbHT = i 02
Yi + Yi Yj
i=1
0i i=1 j=1
0i 0j
i6=j
Algoritmo
1. Divide-se a populao composta de M conglomerados, aleatoriamente,
em m grupos de tamanhos M1 , M2 , , Mm ;
X
m
M= Mi
i=1
m
P
Mi2 M X
m 0 2
Yi
v YbRHC = i=1
i YbRHC
M (M 1) i=1
Pi0
E1 EL
C11 Y11 CL1 YL1
C12 Y12 CL2 YL2
.. .. .. ..
. . . .
C1M1 Y1M1 CLML YLML
Denotando por Eh um estrato genrico (h = 1, 2, , L), segue-se que:
Mh o nmero de conglomerados no estrato h;
Ph
M
Yh = Yhi o total da caracterstica y no estratro h;
i=1
Yh
Yh = o total mdio por conglomerado do estrato h;
Mh
2 1 Ph
M
She = (Yhi Y h )2 a varincia entre os totais dos conglomerados
Mh 1 i=1
dentro do estrato h.
Agora, selecionando-se em cada um dos L estratos amostras aleatrias
simples de conglomerados, sem reposio de tamanhos m1 , m2 , , mL e
investigando-se todas as unidades pertencentes aos conglomerados da amostra
tem-se:
E1 EL
0 0 0 0
C11 Y11 CL1 YL1
0 0 0 0
C12 Y12 CL2 YL2
.. .. .. ..
. . . .
0 0 0 0
C1m1 Y1m1 CLmL YLm
L
e tem-se que:
X X mh
Mh X
L L
YbAc1
est
= Ybh.Ac1 = Yhi0
h=1 h=1
mh i=1
com:
X
L XL
b est
E YAc1 = b
E Yh.Ac1 = Yh = Y
h=1 h=1
Alm disto,
X
L XL
Mh2 (Mh mh ) She
2
V (YbAc1
est
)= V (Ybh.Ac1 ) =
h=1 h=1
Mh mh
X
L XL
Mh2 (Mh mh ) s2he
v(YbAc1
est
)= v(Ybh.Ac1 ) =
h=1 h=1
Mh mh
mh
Se a frao de amostragem (h = 1, 2, , L) for constante e igual
Mh
a f nos estratos (equivalendo a uma alocao proporcional nos estratos),
obtm-se:
mh
= f (h = 1, 2, , L)
Mh
96 CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
L mh
b est 1 XX
YAc1 = Yhi0
f h=1 i=1
1f X
L
b est
V (YAc1 ) = 2
Mh She
f h=1
1f X
L
v(YbAc1
est
)= Mh s2he
f h=1
Exemplo 2.5 (Nascimento (1981), pg 63)
Em certa localidade, existem 1.200 setores censitrios que vo ser con-
siderados como conglomerados de domiclios. Foram formados 6 estratos,
de acordo com a populao do ltimo Censo, cujos nmeros de setores por
estrato constam da tabela abaixo.
A populao total da localidade, de acordo com o Censo, foi de 1.960.800
habitantes, o que corresponde a uma mdia de 1.634 habitantes por setor ou
380 domiclios por setor ( na base de 4,3 pessoas por domiclio, com base em
pesquisa anterior).
Considerando as disponibilidades de tempo e custo, foi fixada uma amostra
de 24 setores ou, aproximadamente, 9.120 domiclios, o que corresponde
24 1
frao de amostragem de 1200 = 50 .
A tabela abaixo apresenta o nmero de setores na populao e na amostra
e o nmero de habitantes nos setores da amostra.
Estimar a populao atual da localidade e o respectivo coeficiente de
variao associado essa estimativa.
1f X
L
v(YbAc1
est
)= Mh s2he = 49 (64.226.395) = 3.147.093.351
f h=1
o respectivo erro padro estimado por:
q
v(YbAc1
est
) = 56.098, 96
e o respectivo coeficiente de variao estimado por:
q
v(YbAc1
est
) 56.098, 96
cv(YbAc1
est
)= = = 0, 0276
Yb est
Ac1
2.036.500
P
M
Yi
Y
Y = = i=1
N P
M
Ni
i=1
MX 0
m
b
YAc1 = Y
m i=1 i
MX 0
m
b
NAc1 = N
m i=1 i
M Pm Pm
Yi0 Yi0
R YbAc1 m i=1 i=1
y Ac1 = = = P
NbAc1 M Pm m
Ni0 Ni0
m i=1 i=1
Aqui pode-se notar que este estimador depende s dos tamanhos Ni0 e
dos totais Yi0 dos conglomerados da amostra, no dependendo do tamanho
total da populao (N) como o estimador no viciado y Ac1 que vimos ante-
riormente.
2.7. ESTIMADOR DE RAZO 99
R
Varincia de y Ac1
1 X
M
2
SeR = (Yi R Xi )2
M 1 i=1
Supondo que m suficientemente grande para tornar desprezvel o vcio
do estimador de razo, e substituindo X por N segue-se que:
2
R M m SeR
V (y Ac1 )
= 2
MN m
com:
1 X
M
2 Y
SeR = (Yi Ni )2
M 1 i=1 N
1 X
M
= (Yi Y Ni )2
M 1 i=1
1 X 2
M
= Ni (Y i Y )2
M 1 i=1
R M m s2eR
v(y Ac1 ) = 2
MN m
com:
1 X 0
m
R 0
s2eR = (Yi y Ac1 Ni )2
m 1 i=1
1 X 02 0
m
R
= N (Y i y Ac1 )2
m 1 i=1 i
100CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
2 R 2 M m SeR
2
V (YbAc1
R
) = MN V (y Ac1 )
= MN 2
MN m
2
M m SeR
= M2
M m
M m s2eR
v(pR
Ac1 ) = 2
MN m
com:
1 X 02 0
m
s2eR = N (P pR
Ac1 )
2
m 1 i=1 i A i
2.7. ESTIMADOR DE RAZO 101
P
m
Yi0
YbAc1
R i=1
= Pm X
Xi0
i=1
2
M m SeR
V (YbAc1
R
)
= M2
M m
com:
1 X
M
2
SeR = (Yi R Xi )2
M 1 i=1
sendo:
Y
R=
X
e
M m s2eR
v(YbAc1
R
)
= M2
M m
com:
1 X 0 b 0 2
m
s2eR = (Y R Xi )
m 1 i=1 i
e
P
m
0
bAc1 Yi
b= Y i=1
R = Pm
bAc1
X Xi0
i=1
102CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
2.8 Exerccios
2.8.1 Considere uma populao de 100 conglomerados de mesmo tamanho
de 4 unidades elementares, em que a proporo de pessoas com certo
atributo P = 0, 5. Em uma amostra de 5 conglomerados foram obtidos
os seguintes resultados:
Conglomerado (i) 1 2 3 4 5
Unidades elementares 2 3 1 2 1
com o atributo (Ai )
U11 U12 U13 U14 U15 U16 U17 U18 U19 U20
Y11 Y12 Y13 Y14 Y15 Y16 Y17 Y18 Y19 Y20
q q q q q q q q q q
94 51 85 65 92 49 10 87 31 02
Grupando essas 20 unidades em 4 conglomerados como sugerido a
seguir, calcular o coeficiente de correlao intraclasse .
X
20 X
20
Ni02 = 22.239 Yi02 = 8.545
=1 =1
Conglomerados em 2 estgios
109
110 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
se segue:
UP1 U P2 UPM
U S11 Y11 US21 Y21 ... U SM1 YM1
U S12 Y12 US22 Y22 ... U SM2 YM2
.. .. .. .. .. ..
. . . . . .
US1N1 Y1N1 US2N2 Y2N2 . . . U SMNM YMNM
X
M
Ni = N
i=1
Amostra de 2o estgio
n0i
f2i = (i = 1, 2, , m)
Ni0
112 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
f2i = f2 (i = 1, 2, , m)
Alm disto, h que se notar que o tamanho final da amostra uma varivel
aleatria n, com:
Xm
n= n0i
i=1
m ! m !
X X 1 X
M
n = E (n) = E n0i =E f2 Ni0 = f2 m Ni = f1 f2 N
i=1 i=1
M i=1
Total da caracterstica y em U Pi :
Ni
X
Yi = Yij (i = 1, 2, , M)
j=1
Yi
Yi = (i = 1, 2, , M)
Ni
3.1. PROBABILIDADES IGUAIS DE SELEO 113
Si2 = (Yij Y i )2 (i = 1, 2, , M)
Ni 1 j=1
X
M
Y = Yi
i=1
Y
Y =
N
Y
Y =
M
Ni 0
X
Yi0 = Yij0 (i = 1, 2, , m)
j=1
yi
yi = (i = 1, 2, , m)
n0i
s2i = 0 (yij y i )2 (i = 1, 2, , m)
ni 1 j=1
ni 0
Ni0 Ni0 X
Ybi0 = 0 yi = 0 yij = Ni0 y i (i = 1, 2, , m)
ni ni j=1
Por outro lado, dado que as UPs da amostra so selecionadas com equiprob-
abilidade, o estimador de total conhecido da Ac1 para o total da populao
depende somente dos totais dos conglomerados da amostra: Y10 , Y20 , , Ym0 ,
e dado por:
MX 0
m
b
YAc1 = Y
m i=1 i
ni 0
M X b 0 M X Ni0 M X Ni0 X
m m m
YbAc2 = Y = yi = yij
m i=1 i m i=1 n0i m i=1 n0i j=1
MX 0
m
= Ny
m i=1 i i
YbAc2 um estimador no viciado de Y, isto , E YbAc2 = Y.
Para fazer essa demonstrao, utiliza-se esperanas condicionais. Assim,
lembrando que:
Se Z e X so variveis aleatrias ento:
E (Z) = EX [E (Z |X )]
h i
+VU P10 , ,U Pm0 E YbAc2 |UP10 , , U Pm0
3.1. PROBABILIDADES IGUAIS DE SELEO 117
Segue-se que:
h i h i 2
b 0 0 b 2 M m Se
VUP10 , ,UPm
0 E YAc2 |U P1 , , UPm = VU P1 , ,U Pm YAc1 = M
0 0
M m
onde:
1 X
M
Se2 = (Yi Y )2
M 1 i=1
Por outro lado:
!
MX 0
m
V YbAc2 |UP10 , , UPm0 = V N y |UPi0
m i=1 i i
M 2 X 02
m
= N V (y i |UPi0 )
m2 i=1 i
M 2 X 02 Ni0 n0i Si02
m
= N
m2 i=1 i Ni0 n0i
Logo:
" #
h i M 2 X m
N 0
n0 02
S
EU P10 , ,U Pm0 V YbAc2 |UP10 , , UPm0 = EU P10 , ,U Pm0 N 02 i 0 i i0
m2 i=1 i Ni ni
M2 X
m 0 0 02
02 Ni ni Si
= E UPi0 N i
m2 i=1 Ni0 n0i
m M
M2 X X 2 Ni ni Si
2
1
= 2
Ni
m i=1 i=1 Ni ni M
M X 2 Ni ni Si2
M
= N
m i=1 i Ni ni
posto que:
MX M
Ni ni Si2
b b
V YAc2 = V YAc1 + Ni2
m i=1 Ni ni
2
M X 0 2 Ni0 n0i s2i
m
b 2 M m se
v YAc2 = M + N
M m m i=1 i Ni0 n0i
onde:
1 X 0
m
=s2e (N y y Ac2 )2
m 1 i=1 i i
A seguir ser demonstrado que o estimador v YbAc2 no viciado para
b
V YAc2 .
Para esta prova, vamos mostrar que:
1 PM Ni ni Si2
i) E (s2e ) = Se2 + Ni2 e
M i=1 Ni ni
M
M Pm 0 0 2
0 2 Ni ni si P 2 Ni ni Si2
ii) E Ni = Ni .
m i=1 Ni0 n0i i=1 Ni ni
Segue-se que:
120 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
m ! m !!
X 2
X 2
E (Ni0 y i ) = EU P10 , ,U Pm0 E 0
(Ni y i ) |U Pi0
i=1 i=1
m !
X
0 2 0
= EU P10 , ,U Pm0 E (Ni y i ) |UPi
i=1 !
X m X
m
0 2 0 2
= EU P10 , ,U Pm0 V (Ni y i ) |UPi + [E (Ni0 y i |UPi0 )]
i=1 i=1
!
X m
N0
n0i Si02 X
m
0 2
= EU P10 , ,U Pm0 Ni02 i + Ni Y i
i=1
Ni0 n0i i=1
0 0 02
02 Ni ni Si
2
= mEU P10 , ,U Pm0 Ni + mEU P10 , ,U Pm0 Ni Y i
Ni0 n0i
XM
m X
M
2 Ni ni Si
2
1 2
= m Ni + Ni Y i
i=1
Ni ni M M i=1
m X 2 Ni ni Si2 mX 2
M M
= N + Y
M i=1 i Ni ni M i=1 i
E y 2Ac2 = V (y Ac2 ) + [E (y Ac2 )]2
! " !#2
YbAc2 YbAc2
= V + E
M M
! " !#2
YbAc2 YbAc2
= V + E
M M
( )
1 M m S 2
M XM
Ni n S
i i
2
e
= M2 + N2 +Y2
M2 M m m i=1 i Ni ni
1 X 2 Ni ni Si2
M
M m Se2 2
= + Ni +Y
M m mM i=1 Ni ni
m !
1 X 2 m
E(s2e ) = E (Ni0 y i ) E y 2Ac2
m1 i=1
m1
( )
m X 2 Ni ni Si2 mX 2
M M
1
= N + Y +
m 1 M i=1 i Ni ni M i=1 i
( )
1 X 2 Ni ni Si2
M
m M m Se2 2
+ N +Y
m1 M m mM i=1 i Ni ni
X M
m m 1 Ni ni Si2
= Ni2 +
(m 1) M m 1 mM i=1 Ni ni
m XM
m 2 m M m Se2
+ Yi2 Y
(m 1) M i=1 m1 m1 M m
" #
1 X 2 Ni ni Si2 1 X 2
M M
m 2
= N + Y MY +
M i=1 i Ni ni (m 1) M i=1 i
m M m Se2
m1 M m
"M #
1 XM
Ni n S
i i
2
m 1 X 2
E(s2e ) = N2 + Yi Y +
M i=1 i Ni ni (m 1) M i=1
m M m Se2
m1 M m
1 X 2 Ni ni Si2
M
m M 1 M m
= N + Se2
M i=1 i Ni ni (m 1) M Mm
1 X 2 Ni ni Si2
M
m mM m M + m
= N + Se2
M i=1 i Ni ni (m 1) Mm
1 X 2 Ni ni Si2
M
mM m1
= N + Se2
M i=1 i Ni ni (m 1) Mm
1 X 2 Ni ni Si2
M
= N + Se2
M i=1 i Ni ni
! !!
M X 0 2 Ni0 n0i s2i M X 0 2 Ni0 n0i s2i
m m
0
E N = EU P10 , ,U Pm0 E N |UPi
m i=1 i Ni0 n0i m i=1 i Ni0 n0i
m !
M X 0 0
0 N n E (si )
2
= EUP10 , ,UPm0 Ni 2 i 0 i 0
|UPi0
m Ni ni
i=1 !
M X m 0 0 02
0 N n S
= EUP10 , ,UPm0 Ni 2 i 0 i i0
m i=1
Ni ni
M X 2 Ni ni Si2 1
M
= m N
m i=1 i Ni ni M
M m X 2 Ni ni Si2
M
= N
m M i=1 i Ni ni
X
M
Ni ni Si2
= Ni2
i=1
Ni ni
Finalizando:
!
h i 2
M m E (se ) M Xm 0 0 2
0 N n s
E v YbAc2 = M2 +E Ni 2 i 0 i i0
M m m i=1 Ni ni
" #
1 X 2 Ni ni Si2
M
2M m 1 2
= M S + N +
M m e M i=1 i Ni ni
X
M
Ni ni Si2
+ Ni2
i=1
Ni ni
m Se2 X
M
Ni ni Si2
2M 2M m 1 1
= M +M Ni2 +
M m M m M i=1 Ni ni
X
M
Ni ni Si2
+ Ni2
i=1
Ni ni
2
XM
2 M m Se M m Ni ni Si2
= M + +1 Ni2
M m m i=1
Ni ni
M m Se2 M X 2 Ni ni Si2
M
= M2 + N
M m m i=1 i Ni ni
b
= V YAc2
3.1. PROBABILIDADES IGUAIS DE SELEO 123
ni 0 0
m ni
M X Ni0 X M N XX
m
YbAc2 = yij = yij
m i=1 n0i j=1 m n i=1 j=1
0 0
m ni m ni
N XX 1 XX
= yij = yij
n i=1 j=1 f i=1 j=1
fazendo:
1 X
M
Sd2 = Ni Si2
MN i=1
Segue-se que:
2
M m S 2 N n Sd2
V YbAc2 = M 2 e
+ MN
M m N mn
ou, em termos das fraes de amostragem:
1 1 f
V YbAc2 = M 2 2
1 Se + N Sd2
f1 f1 f2
Notando-se que:
1 X 0 2
m
s2d = Ni si
mN i=1
um estimador no viciado de Sd2 , b
segue-se a expresso adaptada de v YAc2
2
M m s 2 N n s2d
v YbAc2 = M 2 e
+ MN
M m N mn
3.1. PROBABILIDADES IGUAIS DE SELEO 125
1 1 f
v YbAc2 = M 2 2
1 se + N s2d
f1 f1 f2
364 1
f= =
36.400 100
36.400
H em mdia = 243 domiclos por setor na rea.
150
Sero selecionados com equiprobabilidade 10 setores, o que corresponde
a uma frao de amostragem de 1o estgio de:
10 1
f1 = =
150 15
1
f 100
f2 = = 1 = 15%
f1 15
1 X 0
m
s2e = (N y y Ac2 )2
m 1 i=1 i i
1
= (1.502.364, 65) = 166.929, 41
9
YbAc2 171.200
y Ac2 = = = 1.141, 33
M 150
1 X 0 2
m
1
s2d = Ni si = (8.886, 353) = 3, 657
mN i=1 10 (243)
b 1 2 1 f2 2
v YAc2 = M 1 se + N sd
f1 f1 f2
15
1 1 100
= 150 1 1 166.929, 41 + 36.400 1 3, 657
15 100
= 350.551.750, 8 + 11.314.558, 1 = 361.866.308, 9
Logo: r
b
v YAc2
b
cv YAc2 = = 11, 11%
YbAc2
3.1. PROBABILIDADES IGUAIS DE SELEO 127
Funo Custo:
CT = Cf + C1 m + C2 mn
onde:
Cf o custo fixo;
C1 o custo unitrio por unidade primria selecionada;
C2 o custo unitrio por unidade secundria selecionada.
Custo fixo: Cf
Afinal, devem ser includas como custo fixo, as despesas que no variam
com o processo de seleo nem com o tamanho da amostra.
Afinal, devem ser includas aqui todas as despesas que variam com o
nmero de unidades primrias na amostra.
F = V (y Ac2 ) + (Cf + C1 m + C2 mn CT )
2
= C1 N + C2 nN N C2 n + C2 n2 Sd2 = S e C2 N n2
130 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
2
= C1 N Sd2 = S e C2 N n2 C2 n2 Sd2
2
= C1 N Sd2 2 2
= C2 n S e N Sd
C N Sd2
= n2 = 12
C2 S e N Sd2
v
u
u C N Sd2
= notimo =t 12 (3.5)
2
C2 S e N Sd
F
= C1 m + C2 mn C = 0
= m (C1 + C2 n) = C
C
= m = (3.6)
C1 + C2 n
substituindo-se na expresso (6) o valor notimo , obtm-se o valor timo de m:
C C
motimo = = v (3.7)
C1 + C2 notimo u C N Sd2
u
C1 + C2 t 12
C2 S e N Sd2
C1
ii) Para achar notimo , basta conhecer a razo
. Pequenas variaes deste
C2
valor tm pouca
r influncia sobre o valor de notimo , visto que notimo
C1
depende de .
C2
3.1. PROBABILIDADES IGUAIS DE SELEO 131
pois:
E s2d = Sd2
e
2 s2d 2 N n s2d s2d
E se = E se
n N n N
2
sd 2 S2
= E s2e E = Se d
N N
s2d
s2e >0
n
se isto no ocorrer, notimo pode ser obtido considerando a funo custo:
C = m (C1 + C2 n)
- Se C > C1 + C2 N, ento:
notimo = maximo de n = N
implicando que
C
motimo =
C1 + N C2
C C1
C = C1 + C2 n = notimo = e motimo = 1
C2
132 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
G = C + V (y Ac2 )
onde:
o multiplicador de Lagrange.
Assim:
2
!
M m S e N n Sd2
G = (C1 m + C2 mn) + +
M m N mn
Tomando as derivadas parciais em relao a m e a n e igualando a zero vem:
G S2
= C2 m d 2 = 0 (3.8)
n mn
2
!
G Se N n Sd2
= C1 + C2 n + =0 (3.9)
m m2 N m2 n
2 1 1
Se + Sd2
notimo N
motimo =
1 2
V (y Ac2 ) + S e
M
sendo que V (y Ac2 ) deve ser fixada.
Tamanho de amostra em funo do coeficiente de correlao intra-
classe
Considere as expresses j encontradas no caso de amostragem de con-
glomerados em 1 estgio:
2
(M 1) S e 1 2
Sd
= M N (3.10)
MN 1 2
S
MN
2
MN 1 S 2 = (N 1) M Sd2 + N (M 1) S e (3.11)
Substituindo-se (11) em (10), obtm-se:
2
(M 1) S e 1 2
Sd
= M N
(N 1) 2 M 1 2
Sd + Se
N M
Logo:
Sd2
1 =
(N 1) 2 M 1 2
Sd + Se
N M
1 Sd2 Sd2
= =
2
(M 1) S e 1 2 2 1 2
Sd Se S
M N N d
Assim, pode-se escrever:
v v
u u
u C1 N Sd2 uC Sd2
notimo = t 2 =u 1
C2 S N S 2 t C2 2 1 2
e d Se S
N d
ou r
C1 1
notimo = (3.12)
C2
134 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
2 M N 1 S2
Se = 1+ N 1 (3.14)
(M 1) N N
Substituindo-se (14) em (13) tem-se:
MN 1 2
MN 1 S 2 = (N 1) M Sd2 + S 1+ N 1
N
MN 1
= MN 1 1 + N 1 S 2 = (N 1) M Sd2
N
!
MN 1 N 1 N 1
= S 2 = (N 1) M Sd2
N
!
MN 1 N 1 (1 )
= S 2 = (N 1) M Sd2
N
2 MN 1 N 1 (1 ) 2
= Sd = S
(N 1) MN
MN 1 (1 ) 2
= Sd2 = S
MN
Lembrando que a varincia V (y Ac2 ) dada por:
2
M m S e N n Sd2
V (y Ac2 ) = +
M m N mn
136 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
M m N n
=1 e =1 (3.15)
M N
obtm-se:
2
S S2
V (y Ac2 )
= e+ d
m mn
S 2
M N 1 1 MN 1 (1 ) 2
V (y Ac2 )
= 1+ N 1 + S
mN (M 1) N mn MN
Mas pela hiptese em (15) tem-se:
MN 1 MN 1
=1 e =1 (3.16)
MN (M 1) N
Logo:
S2 1
V (y Ac2 )
= 1+ N 1 + (1 ) S 2
mN mn
" #
2 N 1
S 1 1
V (y Ac2 )
= + +
m N N n n
1 N 1
se N for grande = 0 e 1
N N
Ento:
S2
V (y Ac2 )
= [ n + 1 ]
mn
S2
= [1 + ( n 1) ]
mn
S2
Se lembrarmos que a expresso aproximada para a varincia da
mn
mdia de y da amostragem aleatria simples de tamanho mn (desprezando-
se a correo de populao finita), segue-se que:
V (y Ac2 )
= V (y AAS ) [1 + ( n 1) ]
Donde se conclui que o efeito de conglomerao da amostragem de
conglomerados em 2 estgios dado por [1 + ( n 1) ] .
Ni
Pi = (i = 1, 2, , M)
N
ou probabilidade proporcional a uma medida de tamanho definida por:
Xi
Pi = (i = 1, 2, , M)
X
Seleciona-se uma amostra de m unidades primrias de acordo com as
probabilidades de seleo Pi e com reposio.
Em cada uma dessas unidades primrias da amostra de 1o estgio, seleciona-
se uma subamostra com igual probabilidade de seleo e sem reposio.
Um estimador no viciado do total da caracterstica y dado por:
1 X Ni0
m
b p
YAc2 = y
m i=1 Pi0 i
onde:
0
ni
P
yij
yi j=1
yi = 0 = 0 (i = 1, 2, , m)
ni ni
3.2. CONTROLE DE VARIAO DE TAMANHO DAS UPAS 139
Para mostrar b p
que YAc2 no viciado, basta mostrar que: E YAc2 = Y b p
!
1 X Ni0
m
E YbAc2
p
= E y
m i=1 Pi0 i
" !#
1 X Ni0
m
= EU P10 , ,U Pm0 E y |UPi0
m i=1 Pi0 i
" #
1 X Ni0
m
= EU P10 , ,U Pm0 E (y i |UPi0 )
m i=1 Pi0
" # " #
1 X Ni0 0 1 X Yi0
m m
= EU P10 , ,U Pm0 Y = EUP10 , ,UPm0
m i=1 Pi0 i m i=1 Pi0
h i
= b P
EU P1 , ,U Pm0 YAc1 = Y
0
Um estimador
no viciado da mdia da caracterstica y por unidade pop-
ulacional Y dado por:
1 X Ni0
m
p
y Ac2 = y
Nm i=1 Pi0 i
Varincia de YbAc2
p
h i
b p b p 0
V YAc2 = VU P10 , ,UPm0 E YAc2 |UP1 , , UPm + 0
h i
+EU P10 , ,U Pm0 V YbAc2
p
|UP10 , , UPm0
" !#
1 X Ni0
m
= VU P10 , ,UPm0 E y |U Pi0 +
m i=1 Pi0 i
" !#
1 X Ni0
m
+EU P10 , ,U Pm0 V y |UPi0
m i=1 Pi0 i
Mas,
" !# " #
1 X Ni0 1 X Ni0
m m
VUP10 , ,UPm0 E y |U Pi0 = VU P10 , ,U Pm0 E (y i |UPi0 )
m i=1 Pi0 i m i=1 Pi0
" #
1 X Ni0 0
m
= VU P10 , ,U Pm0 Y = V b
Y P
m i=1 Pi0 i Ac1
M 2
1 X Yi
= Y Pi
m i=1 Pi
140 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
" !# " m !#
1 X Ni0 X N0 2
m
1 i
EUP10 , ,UPm0 V y |U Pi0 = EU P10 , ,U Pm0 V (y i |UPi0 )
m i=1 Pi0 i m2 Pi0
" i=1
m 2 0 !#
1 X Ni0
0
Ni n0i Si 2
= EU P10 , ,U Pm0
m2 i=1 Pi0 Ni0 n0i
M 2
1 X Ni Ni ni Si2
= m Pi
m2 i=1 Pi Ni ni
1 X Ni2 Ni ni Si2
M
=
m i=1 Pi Ni ni
Logo,
XM 2
1 X Ni2 Ni ni Si2
M
b p 1 Yi
V YAc2 = Y Pi +
m i=1 Pi m i=1 Pi Ni ni
Um estimador no viciado de V YbAc2
p
dado por:
Xm 0 2
1 Ni y i b p
v YbAc2
p
= YAc2
m (m 1) i=1 Pi0
Prova que E v YbAc2
p
= V YbAc2
p
:
m 0 2 !
1 X Ni y i b p
E v YbAc2
p
= E YAc2
m (m 1) i=1 Pi0
m !
1 X N 0 y 2 2
= E i i
0
m YbAc2
p
m (m 1) P i
mi=1 2 !
1 X Ni0 y i 2
= E mE YbAc2p
m (m 1) i=1 Pi0
3.2. CONTROLE DE VARIAO DE TAMANHO DAS UPAS 141
mas:
2 " 2 #
Ni0 y i 0
Ni y i
E = EUP10 , ,UPm0 E |UPi0
Pi0 Pi 0
" 0 2 #
0
Ni y i Ni y i
= EUP10 , ,UPm0 V 0
|UPi0 + E 0
|UPi0
Pi Pi
!2
0 2 0 0 02 0 0
Ni Ni ni Si Ni Y i
= EUP10 , ,UPm0 0 0 0
+
Pi Ni ni Pi0
XM 2 XM 2
Ni Ni ni Si2 Ni Y i
= Pi + Pi
i=1
Pi N i n i i=1
P i
2 h i2
E YbAc2
p
= V YbAc2
p
+ E YbAc2
p
= V YbAc2
p
+Y2
ento:
m 2 !
1 X Ni0 y i 2
E v YbAc2
p
= E 0
mE YbAc2p
m (m 1)i=1
P i
Xm 0
2 2
1 Ni y i m b p
E E YAc2
m (m 1) i=1 Pi0 m (m 1)
M M 2 !
1 X Ni 2 Ni ni S 2 X Ni Y i
i
= Pi + Pi +
m 1 i=1 Pi Ni ni i=1
Pi
1 bp
V YAc2 + Y 2
m1
M M 2 !
1 X Ni 2 Ni ni S 2 X Yi
i
= Pi + Pi Y 2 +
m 1 i=1 Pi Ni ni i=1
P i
1
V YbAc2
p
m1
142 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
M M 2 !
1 X Ni 2 Ni ni S 2 X Yi X M
b p
E v YAc2 = i
Pi + Pi Y 2
Pi
m1 i=1
Pi Ni ni i=1
Pi i=1
1
V YbAc2
p
m1
M M 2 !
1 X Ni 2 Ni ni S 2 X Yi
i
= Pi + Y Pi
m 1 i=1 Pi Ni ni i=1
P i
1
V YbAc2
p
m1
1 1 m 1
= mV YbAc2
p
V YbAc2 =
p
V YbAc2
p
m1 m1 m1
= V YbAc2
p
Amostra autoponderada
A probabilidade de uma unidade secundria qualquer (USij ) pertencer
a amostra, num esquema de amostragem em 2 estgios com probabilidade
desigual no primeiro estgio e equiprobabilidade no segundo estgio dada
por:
0
0 n
P {USij amostra} = mPi i0 i, j
Ni
Com este plano amostral, a amostra autoponderada se essa probabili-
n
dade constante e igual a frao de amostragem geral . Tem-se, ento:
N
0
0 n n
mPi i0 = =f
Ni N
P
m
Observe que, em mdia, n0i d o tamanho pr-fixado, pois: se n0i =
i=1
nNi0
, ento:
mNPi0
m ! m ! m M !
X n X N0 n X X Ni
i
E n0i = E = Pi
i=1
mN i=1
Pi0 mN i=1 i=1 Pi
nmN
= =n
mN
ni 0 0
m ni
1 X Ni0 1 X Ni0 1 X 1 XX
m m
YbAc2
p
= y = yij = yij
m i=1 Pi0 i m i=1 Pi0 n0i j=1 f i=1 j=1
m 0
X 2
1 Ni y i b p
v YbAc2
p
= YAc2
m (m 1) i=1 Pi0
2
n0i
1 X N X
m 0
= i
0 0
yij YbAc2
p
m (m 1) i=1 Pi ni j=1
2
n0i n0i
1 X
m X X m X
= m yij
1
yij
m (m 1) i=1 f j=1 f i=1 j=1
0 2
ni n0i
m 2 Xm X 1 Xm X
= yij yij
2
m (m 1) f i=1 j=1 m i=1 j=1
0 2
ni n0i
m X
m X 1 Xm X
= yij yij
2
(m 1) f i=1 j=1 m i=1 j=1
Considerando:
ni0
P
yi = yij o nmero de cabeas de gado na subamostra do i-simo povoado
j=1
selecionado; e a igualdade:
n0i n
mPi0 0
= =f
Ni N
0
m ni
1 XX
YbAc2
p
= yij = 100 (10.500) = 1.050.000 cabeas de gado.
f i=1 j=1
0 2
ni n0i
m X
m X 1 XX
m
v YbAc2
p
= yij yij
(m 1) f 2 i=1 j=1
m i=1 j=1
14
= (100)2 (3.305.100) = 3.559.230, 77 (1000)
13
3.2. CONTROLE DE VARIAO DE TAMANHO DAS UPAS 145
r
v YbAc2
p
= 188.659, 24
r
b p
v YAc2
b p
cv YAc2 = = 0, 1797
YbAc2
p
Estimao de proporo
e
Suponha que a populao seja dividida nas classes A e A.
ei unidades,
A unidade primria i fica dividida nas classes, com Ai e A
respectivamente.
A subamostra de tamanho ni fica tambm dividida nas duas classes com
ai e e
ai unidades, em cada unidade primria i.
S
M
Ai
i=1
Um estimador no viciado para estimar a proporo PA = N
dado
por:
1 X Ni0 1 X Ni0
m m
p
ppAc2 = y Ac2 = y i = pi
Nm i=1 Pi0 N m i=1 Pi0
onde:
a0
pi = 0i a proporo de A na subamostra.
ni
Um estimador no viciado de V (ppAc2 ) dado por:
Xm 2
1 Ni0
v (ppAc2 ) = p
pi pAc2
m (m 1) i=1 N Pi0
Se a amostra autoponderada, ocorre a condio:
n0i n
mPi0 0
= =f
Ni N
logo:
1X 0
m
ppAc2 = a
n i=1 i
1 X m 0 m 2
v (ppAc2 ) = p
a pAc2
m (m 1) i=1 n i
Exemplo 3.4
146 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
1 X 0 10
m
ppAc2 = a = = 0, 40
n i=1 i 25
3.2. CONTROLE DE VARIAO DE TAMANHO DAS UPAS 147
1 X m 0
m 2
v (ppAc2 ) = ai ppAc2
m (m 1) i=1 n
m !
1 X m 0 2
= a m (ppAc2 )2
m (m 1) i=1 n i
m 0 2 !
m X a (pp
)2
i
= Ac2
m 1 i=1 n m
10 2 !
14 1
= (9 + 4 + 1 + 1 + 1 + 1 + 1) 25
13 (25)2 14
14 18 100 14 18 (14) 100
= =
13 625 625 (14) 13 625 (14)
1 18 (14) 100 1 18 (14) 100 1 152
= = =
13 625 13 625 13 625
= 0, 0187076
q
v (ppAc2 ) = 0, 1367757
p
v (ppAc2 )
cv (ppAc2 ) = = 0, 342
ppAc2
1 X Ni0
m
YbAc2
p
= y
m i=1 Pi0 i
148 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
X X mh
1 X
L L 0
Nhi
YbAc2
p.est
= Ybh.Ac2
p
= 0
y hi
h=1 h=1
mh i=1 Phi
M 2
1 X Yi 1 X Ni2 Ni ni Si2
M
b p
V YAc2 = Y Pi +
m i=1 Pi m i=1 Pi Ni ni
b p
No estrato h, a varincia do estimador do total do estrato h, V Yh.Ac2 ,
dado por:
Mh
X 2 Mh
b p 1 Y hi 1 X 2
Nhi 2
Nhi nhi Shi
V Yh.Ac2 = Yh Phi +
mh i=1 Phi mh i=1 Phi Nhi nhi
X
L
V YbAc2
p.est
= V Ybh.Ac2
p
h=1
X Mh 2 Mh
1 X X 1 X
L L 2 2
Yhi Nhi Nhi nhi Shi
= Yh Phi +
h=1
mh i=1 Phi h=1
mh i=1 Phi Nhi nhi
O estimador da V YbAc2
p.est
dado por:
X
L Xm 0 2
b p.est 1 Nhi y hi b p
v YAc2 = 0
Yh.Ac2
h=1
mh (mh 1) i=1 Phi
Amostra autoponderada
0
n 0
mh Phi hi0
Nhi
P
M
Yi
i=1 Y
Y = =
P
M N
Ni
i=1
o que mostra que Y pode ser entendida como uma razo de duas mdias.
Um estimador consistente de Y obtido substituindo-se o numerador e
denominador por estimadores no viciados.
R
Desse modo, representando por y Ac2 esse estimador consistente, tem-se:
1 Pm
0 Pm
0
Ni y i Ni y i
R m i=1
y Ac2 = Pm = i=1
Pm
1 0 0
Ni Ni
m i=1 i=1
M m S2 M 2
R eR 1 X Ni Ni ni Si2
V y Ac2 = 2 +
MN m Mm i=1 N Ni ni
1 X 2 2
M
2
SeR = N YiY
M 1 i=1 i
e um estimador consistente para essa varincia :
m 2 m 2 0
R M m X Ni0 R
2 1 X Ni0 Ni n0i Si02
v y Ac2 = y i y Ac2 +
Mm (m 1) i=1 N Mm i=1 N Ni0 n0i
R i=1 Ni y i
b
YAc2 = MN y Ac2 = MN
R
P m
0
Ni
i=1
e a varincia de YbAc2
R
dada por:
2 R
V YbAc2
R
= MN V y Ac2
M X 2 Ni ni Si2
2 M
2M m SeR
= M + N
M m m i=1 i Ni ni
2
Xm 2
M M m 1 R
v YbAc2 =
R
Ni02 y i y Ac2 +
m M m 1 i=1
M X 0 2 Ni0 n0i s02
m
i
+ N
m i=1 i Ni0 n0i
M2 M
Supondo M >> m = >> , ento a expresso acima pode ser
m m
aproximada para:
M2 M m 1 X m 2
R
v YbAc2
R
= Ni02 y i y Ac2
m M m 1 i=1
3.2. CONTROLE DE VARIAO DE TAMANHO DAS UPAS 151
ou
2
2 seR
v YbAc2
R
= M
m
com
1 X 02 2
m
R
s2eR = Ni y i y Ac2
m 1 i=1
Amostra autoponderada
Sabe-se que a condio para que a amostra seja autoponderada dada
pela igualdade:
m ni n
= =f
M Ni N
n
ou seja, todas as unidades secundrias tm a mesma probabilidade de
N
pertencer amostra. Nesta condio, tem-se:
ni 0 ni 0
P
m P P
m P
yij yij
R N i=1 j=1 1 i=1 j=1
y Ac2 = =
n P m
0 f2 Pm
0
Ni Ni
i=1 i=1
n
sendo f2 = a frao de amostragem de 2o estgio.
N
Para o estimador da varincia aproximada de
s2
R
v y Ac2 = eR 2
N m
com M >> m e
1 X 02 2
m
R
s2eR = Ni y i y Ac2
m 1 i=1
2
P n0i
0 P
m
Xn0i Ni yij
1 X Ni02
m
i=1 j=1
= yij
02 P 0
m
m 1 i=1 ni j=1
Ni
i=1
0
2
P
m ni
P
0
2 m X n0i Ni yij
1 mN X i=1 j=1
= yij P
m
m1 nM i=1 j=1
0
Ni
i=1
152 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
ou
0
2
P
m ni
P
0
Xm X n0i Ni yij
R s2
m i=1 j=1
v y Ac2 = eR = yij
2
(m 1) n2 P
m
N m i=1 j=1
0
Ni
i=1
Exemplo 3.5
Suponha que se deseja estimar o consumo mdio semanal por domiclio
(em unidades de produto) de determinado produto para alimentao.
Dispe-se de um mapa da localidade onde podem ser identificados 400
quarteires, que sero considerados unidades primrias de amostragem. Sabe-
se que existem na localidade cerca de 26.000 domiclios dando uma mdia de
65 domiclios por quarteiro. Seleciona-se uma amostra autoponderada de
650 domiclios com 2 estgios de seleo e com equiprobabilidade em cada
1
estgio, tendo fixado a frao de amostragem do 1o estgio em , o que
8
implicou na seleo de 50 quarteires.
n 650 1
Neste caso f = = = . Logo a frao de amostragem do 2o
N 26.000 40
f 1
estgio dada por: f2 = = .
f1 5
Sabendo-se que:
P
m
i) o nmero de domiclios nos quarteires da amostra Ni0 = 3.152;
i=1
0
2
P
m ni
P
0
n0 Ni yij
P
m Pi i=1 j=1
iv) yij = 4.500.
P
m
i=1 j=1 0
Ni
i=1
3.3. EXERCCIOS 153
0
2
P
m ni
P
0
m X Ni yij
0
m X i
n
i=1 j=1
R
v y Ac2 = yij
(m 1) n2 i=1
j=1
P
m
0
Ni
i=1
50
= (4.500) = 0, 0091
49 (710)2
r
R
v y Ac2
R
cv y Ac2 = R
= 0, 031
y Ac2
3.3 Exerccios
3.3.1 Compare a preciso de uma amostra de conglomerados em 2 estgios
(Ac2) com a frao de subamostragem de 50% com a de uma amostra
de conglomerados em um estgio (Ac1)de igual tamanho, supondo que
o tamanho mdio do conglomerado de 50 unidades e que o coeficiente
de correlao intraclasse igual a 0,1.
unidades primrias; e
unidades secundrias.
b) Para uma caracterstica genrica y, defina:
a notao dos parmetros das unidades primrias (total, m-
dia e varincia); e
a notao dos parmetros da populao (total, total mdio por
unidade primria, mdia por unidade da populao e varincia
global).
c) Defina um esquema de amostragem de conglomerados em 2 est-
gios que permita selecionar uma amostra probabilstica das unidades
da populao com o objetivo de estimar o total de domiclios alu-
gados no bairro.
d) Considerando o esquema apresentado em c), obtenha um esti-
mador no viciado para o total de domiclios alugados no bairro,
e uma expresso para a varincia desse estimador.
Ct = C0 + C1 m + C2 mn
2
Sd2 = 49, 5 S e = 9, 045 N = 20
3.3.4 Numa grande cidade, um bairro continha 100 quarteires dos quais 10
foram selecionados com probabilidade proporcional a um dado tamanho,
com reposio. Uma amostra autoponderada foi selecionada com frao
geral f = 2%. Utilize os dados observados, mostrados a seguir:
3.3. EXERCCIOS 155
P
m
yi = 84 s2d = 1, 33 s2e = 1338, 65
i=1
1 X 0
5
2
s2e = (Ni y i y Ac2 ) = 318, 67
m 1 i=1
X
5
Ni0 n0i s2i
Ni02 = 118, 78
i=1
Ni0 n0i
X
5 2
R
Ni02 y i y Ac2 = 53, 20
i=1
3.3.9 Para estudar as condies de vida dos trabalhadores que vivem em uma
rea industrial, foi selecionada uma amostra estratificada com 2 estgios
de seleo. Em cada estrato da amostra foram selecionadas 4 fbricas
com probabilidade proporcional ao nmero de trabalhadores obtidos
de um perodo anterior e de cada fbrica selecionada foi selecionado
aleatoriamente um certo nmero de trabalhadores, totalizando uma
amostra de 1000 trabalhadores.
Sabe-se que foram definidos 4 estratos e que o nmero de trabalhadores
conhecidos de um perodo anterior em cada estrato dado por:
4.1 Introduo
A dificuldade de cadastramento para seleo da amostra se reduz medida
em que aumenta o nmero de estgios. Mas no entanto, medida em que
aumenta o nmero de estgios, mais se torna complicada a expresso da
varincia do estimador.
Seleciona-se uma amostra de r unidades primrias. Seja U Pi0 a i-sima
unidade primria da amostra. De cada unidade primria da amostra seleciona-
se uma amostra de unidades secundrias. Desse modo na UPi0 seleciona-se
uma amostra de m0i unidades secundrias. De cada unidade secundria da
00
amostra seleciona-se uma amostra de unidades tercirias. Assim, na U Sij
00
seleciona-se uma amostra de nij unidades tercirias.
Associado U Tijk (unidade terciria) a observao yijk ,obtm-se a amostra
final, constituda pelo conjunto:
n o
0 00
yijk i = 1, 2, , r; j = 1, 2, , mi ; k = 1, 2, , nij
sendo: 0
mi
X
r X
00
n= nij
i=1 j=1
161
162 CAPTULO 4. CONGLOMERADOS EM 3 ESTGIOS
b p 1 X Nij00
Yi = 0 00 y
mi j=1 Pij ij
mi 0
1 X 1 bp 1 X 1 1 X
r r
Nij00
YbAc3
p
= Y = 00 y
r i=1 Pi0 i r i=1 Pi0 m0i j=1 Pij ij
1 00 1
Pi0 = e Pij = 0
R Mi
mi 0
R X Mi0 X
r
YbAc3 = 0
Nij00 y ij
r i=1 mi j=1
YbAc3
p
= YbAc3 = yijk
f i=1 j=1 k=1
4.3 Exerccios
4.3.1 Os estudantes de 1o grau de um determinado municpio esto distribu-
dos em 15 escolas, com uma mdia de 20 turmas por escola e estima-se
que h um total de 10.000 estudantes. Deseja-se estimar a proporo
de alunos aprovados no ltimo ano no municpio.
Estimao de varincias
165
166 CAPTULO 5. ESTIMAO DE VARINCIAS
= f (Y1 , , YK )
P
N
onde YK = yik so totais poulacionais para vriveis de pesquisa
i=1
yk , k = 1, , K.
O estimador amostral do parmetro dado por
b
= f (Yb1 , , YbK )
Pn y
onde YbK =
ik
o estimador de Horvitz-Thompson do total Yk , k =
i=1 i
1, ..., K.
Quando f uma funo linear, fcil obter expresses de varincia para
b
. Isto ocorre por causa da linearidade de f , j que neste caso
X
K
= a0 + ak Yk
k=1
e consequentemente
X
K
b
= a0 + ak Ybk
k=1
5.3. MTODOS PARA ESTIMAR VARINCIAS 167
!
X
K
V b
= V a0 + ak Ybk
k=1
X
K X K X
K
= a2k V b
Yk + ak aj COV (Ybk , Ybj )
k=1 k=1 j6=k
onde
f (Yb1 , , YbK )
ak = Ye1 , ,YeK =Y1 , ,YK
Ybk
para k = 1, ..., K.
Para amostras grandes, o estimador no linear b ter comportamento
b
semelhante ao do estimador linearizado L , e portanto podemos usar a var-
incia deste estimador linearizado como aproximao para a varincia do
estimador b . Isto :
2 2
V b
= E b =E b L
K !
X 2
= E ak Ybk Yk
k=1
X
K X K X
K
= a2k V b
Yk + ak aj COV (Ybk , Ybj )
k=1 k=1 j6=k
168 CAPTULO 5. ESTIMAO DE VARINCIAS
isto , a nvel dos conglomerados primrios, e supor que estes tivessem sido
selecionados por amostragem com reposio da populao de UPAs.
Trata-se de idia simples, porm bastante poderosa, pois permite aco-
modar grande variedade de planos amostrais estratificados, conglomerados
e com probabilidades desiguais (com ou sem reposio), tanto das unidades
primrias como das demais unidades de amostragem.
O requisito fundamental para aplicao deste mtodo que estejam dispo-
nveis estimadores no viciados dos totais da(s) varivel(is) de interesse para
cada um dos conglomerados primrios selecionados, e que pelo menos dois
destes sejam selecionados em cada estrato (caso esta condio no seja sat-
isfeita para alguns estratos, estes podem ser agrupados).
Embora este mtodo tenha sido proposto para estimar varincias de m-
dias e totais em planos amostrais de mltiplos estgios (portanto complexos),
pode ser tambm aplicado em combinao com Linearizao de Taylor para
obter estimativas de varincias para estatsticas no lineares que possam ser
escritas como funes de totais.
Este mtodo fornece, juntamente com a Linearizao de Taylor, a base
metodolgica de vrios pacotes especializados para estimao de varincias,
tais como SUDAAN, STATA, CENVAR e PC-CARP, entre outros.
Considere um plano amostral em vrios estgios, com mh 2 unidades
primrias selecionadas do estrato h, h = 1, ..., L.
Denote por hi a probabilidade de incluso na amostra da i-sima UPA
(conglomerado primrio) do estrato h, e por Ybhi um estimador no viciado
do total Yhi da caracterstica de interesse y na i-sima UPA do estrato h,
h = 1, ..., L.
P
L MPh
Um estimador no viciado do total populacional Y = Yhi dado
h=1 i=1
por
XL Xmh
Ybhi
YbCP =
h=1 i=1
hi
e um estimador no viciado da varincia correspondente dado por
!2
XL
mh X
m h
Ybhi Ybh
v YbCP =
h=1
mh 1 i=1 hi mh
P
mh Ybhi
onde Ybh = para h = 1, ..., L.
i=1 hi
Embora muitas vezes a seleo das unidades primrias seja feita sem
reposio, o estimador de Conglomerados Primrios aqui apresentado pode
fornecer uma aproximao razovel da varincia de aleatorizao desejada.
170 CAPTULO 5. ESTIMAO DE VARINCIAS
1 Xb
G
b
R = g
G g=1
um estimador no viciado de e
G X b
G 2
v b
R = g b
R
G 1 g=1
G X b
G 2
v b
= g b
G 1 g=1
Mtodo Jackknife Este mtodo foi inventado como uma tcnica para
reduo de vcio na estatstica clssica (Quenouille, 1949, 1956).
A idia consiste em dividir a amostra em G grupos mutuamnete ex-
n
clusivos, cada um de tamanho . Em seguida, so calculados os pseudo-
G
valores b
(g) dados por
b
(g) = Gb
(G 1) b
g
1 X
G 2
vJ1 b
= b
(g) b
JK
G (G 1) g=1
1 XG 2
vJ2 b
= b
(g) b
G (G 1) g=1
1 PG
onde b
JK = b
(g) .
G g=1
Notas:
- computao eficiente;
Concluses
Dupla amostragem
175
176 CAPTULO 6. DUPLA AMOSTRAGEM
c0 0
n0 = n + n
c
Logo, com a tcnica de dupla amostragem a observao efetiva se faz com
uma amostra de tamanho n, menor que n0 , que corresponde a uma amostra
aleatria simples em uma fase com o mesmo custo total.
c0
Por exemplo, se = 0, 1, o tamanho n0 = 1.000 equivalente aos tama-
0
C
nhos n = 400 e n = 6.000. A diminuio de n0 n = 600 unidades no
tamanho da amostra efetiva produzir uma perda em preciso.
A questo que se coloca decidir se compensa a diminuio do tamanho
efetivo da amostra, com o aumento de informao adquirida na 1a fase. Para
isso, deve-se calcular a varincia correspondente com a aplicao da dupla
2
amostragem e compar-la com a de uma amostra de uma s fase ( n0 , no caso
da estimao da mdia com amostragem aleatria simples).
c0
bvio que quanto menor for a relao mais favorvel o uso da dupla
C
amostragem, mas no o nico parmetro a ser considerado.
Em amostragem com reposio a varincia dos estimadores toma a forma:
k1 k2
V = + 0
n n
que vlida para amostragem sem reposio quando as fraes so pequenas.
Esta varincia pode ser minimizada para um custo total dado e nos fornece,
atravs dos multiplicadores de Lagrange, os tamanhos timos de n0 e n.
6.3. DUPLA AMOSTRAGEM PARA ESTRATIFICAO 177
X
L
y est = Wh y h
h=1
X
L
y d,est = wh y h
h=1
( L !) L !
X X
E y d,est = E Ew wh y h =E wh Ew (y h )
h=1 h=1
L !
X X
L X
L
= E wh Y h = E (wh ) Y h = Wh Y h = Y
h=1 h=1 h=1
onde:
Ew (T ) expressa a esperana matemtica de uma estatstica T condi-
cionada ao conjunto de amostras da 1a fase, nas quais n01 , n02 , , n0L so
fixos e para um dado n0 , w1 , w2 , , wL so fixos.
178 CAPTULO 6. DUPLA AMOSTRAGEM
V y d,est = V Ew y d,est + E Vw y d,est
L ! L !
X X 2
V Ew y d,est = V wh Y h =V Y h wh
h=1 h=1
X
L
2 X
L
= Y h V (wh ) + Y h Y k COV (wh , wk )
h=1 h6=k
N n0 Wh (1 Wh )
V (wh ) =
N 1 n0
e
N n0 Wh Wj
COV (wh ) =
N 1 n0
Logo:
( L )
X 2 Wh (1 Wh ) X L
Wh Wj
V Ew y d,est = g0 Yh 0
Y hY k
h=1
n h6=k
n0
( L )
g0 X 2 X X X
L L L
2
= 0 Y h Wh Y h (Wh )2 Y h Wh Y k Wk
n h=1 h=1 h6=k k=1
!
2
g0 X 2 X
L L
= 0 Y h Wh Wh Y h
n h=1 h=1
( L )
g0 X 2
= 0 Wh Y h Y
n h=1
N n0
sendo: g 0 = .
N 1
Por outro lado, tem-se:
6.3. DUPLA AMOSTRAGEM PARA ESTRATIFICAO 179
L !! L !
X X
E Vw y d,est = E Vw wh y h =E (wh )2 Vw (y h )
h=1 h=1
L !
X Sh2 XL
Sh2
= E (wh )2 (1 fh ) = E (wh )2 (1 fh )
h=1
nh h=1
nh
X
L
Sh2
= (1 fh ) V (wh ) + Wh2
h=1
nh
XL
S2 g0 Wh (1 Wh )
= (1 fh ) h 0
+ Wh2
h=1
nh n
Portanto:
( L ) L
g0 X 2 X Sh2 g 0 Wh (1 Wh ) 2
V y d,est = 0 Wh Y h Y + (1 fh ) + Wh
n h=1 h=1
nh n0
onde:
fh a frao de amostragem da 2a fase, supondo que a seleo foi com
probabilidades iguais e sem reposio nas fases.
Observe que n0 aparece no denominador na expresso da varincia. Por-
tanto, quanto maior n0 (n0 < N) a perda de preciso pelo uso da dupla
amostragem diminui. Obviamente o custo aumenta, razo pela qual convm
estudar os tamanhos timos em funo do custo.
Se a amostra com reposio na 1a fase temos:
X L
S2 Wh (1 Wh ) 1 X
L
2
V y d,est = (1 fh ) h 2
Wh + + Wh Y h Y
h=1
nh n0 n0 h=1
X L
2h 2 Wh (1 Wh ) 1 X
L
2
V y d,est = Wh + + Wh Y h Y
h=1
nh n0 n0 h=1
Para o total
Y = NY , o estimador no viciado Ybd,est = N y d,est e a
varincia V Ybd,est = N 2 V y d,est .
Observe que se na amostra da 1a fase n0 = N, isto , se observa todas as
unidades da populao para efetuar a estratificao, ento g 0 = 0 e a frmula
geral da varincia do estimador de dupla amostragem fica:
X L
S2
V y d,est = (1 fh ) Wh2 h
h=1
nh
6.3.1 Estimador no viciado para V y d,est
Um estimador no viciado para a varincia do estimador
da mdia em dupla
amostragem para estratificao com reposio V y d,est dado por:
( L )
n0 X s2 wh
1 XL
2
h
v y d,est = wh2 + 0 + 0 wh y h y d,est
n0 1 h=1
nh n n h=1
n0
= 1 se n0 no for pequeno, ento:
n0 1
X s2h 2 wh 1 X
L L
2
v y d,est = wh + 0 + 0 wh y h y d,est
h=1
nh n n h=1
X
L
pA(d,est) = wh pAh
h=1
6.4. DUPLA AMOSTRAGEM PARA ESTIMADORES DE RAZO 181
y 0 b x0 Y = R
b x0 RX
y d,R Y = x Y =R
x
= R b x0 RX + RX RX
= X R bR +R b x0 X
X b
b x0 X
= y Rx +R
x
b X
utilizando as aproximaes: R =Re = 1.
x
Podemos escrever para o clculo aproximado da varincia do estimador:
2
V y d,R = E (y R x) + R x0 X
= V (y R x) + R x0 X
= V (y R x) + V R x0 X + 2R COV (y R x) x0 X
= V (y) + R2 V (x) 2R COV (x, y) + R2 V ( x0 ) +
+2R COV (y, x0 ) 2R2 COV (x, x0 )
1 2 1
V y d,R = y + R2 2x 2R xy + 0 R2 2x
n n
6.5. DUPLA AMOSTRAGEM PARA PROBABILIDADES DESIGUAIS183
frmula vlida para amostragem com reposio (no caso de sem reposio,
usar fator de correo de populaes finitas).
Para o caso em que a 2a amostra de tamanho n uma subamostra
0
aleatria da 1a n n temos que calcular as covarincias.
Fixando a amostra da 1a fase:
1 X yi
n
Yb =
n i=1 Pi
184 CAPTULO 6. DUPLA AMOSTRAGEM
Mi
com: Pi = .
M
Se no se conhece a priori os tamanhos das unidades da populao, pode-
mos tomar uma amostra aleatria da populao de tamanho n0 com probabil-
idades iguais, para obter informao acerca dos tamanhos M1 , M2 , , Mn0 ,
Pn0
sendo M 0 = Mi . Nestas condies se toma uma subamostra de tamanho
i=1
n < n0 , para formar o estimador de dupla amostragem baseado em:
Mi Mi
como esstimador de = Pi
N 0 M
M
n0
e o estimador no viciado de total fica da forma:
Xn
N M 0 yi NM 0 X yi
n
Ybdp = =
i=1
n0 n Mi nn0 i=1 Mi
n !!
N X M 0 yi N 0
E Ybdp = E Ew0 =E y =Y
n0 i=1
n Mi n0
onde:
Ew0 indica a esperana da 1a amostra fixa com probabilidade proporcional
ao tamanho;
y 0 o total da amostra da 1a fase, tomando n0 , tomada com probabili-
dades iguais.
Supondo que a 1a amostra seja selecionada com probabilidades iguais e
sem reposio e a 2a amostra com probabilidades proporcionais ao tamanho
e com reposio, a varincia do estimador de total dada por:
2
N n0 1 X
N
Yi N (N n0 ) 2
V Ybdp = Pi Y + Sy
N 1 nn0 i=1 Pi n0
n0 1
se n0 grande ento = 1 ento:
n0
1X N 2
b p Yi N (N n0 ) 2
V Yd = Pi Y + Sy
n i=1 Pi n0
Bibliografia
[3] Cochran, W.G. (1977). Sampling Techniques, third edition. New York:
John Wiley & Sons.
[7] Hanif, M. and Brewer, K.R.W. (1980). Sampling with unequal proba-
bilities without replacement. International Statistical Review,Voorburg:
Holand, 48: 317-35.
[9] Hartley, H.O. et alli. (1962). Sampling with unequal probabilities with-
out replacement. Annals of Mathematical Statistics, Hayward; EUA, 33:
350-74.
185
186 BIBLIOGRAFIA
[12] Kish, L. (1965) Survey Sampling. New York: John Wiley & Sons.
[14] Mahalanobis, P.C. (1939). A Sample Survey of the Acreage Under Jute
in Bengal. Sankhya 4, 511-531.
[18] Paulson, E. (1942). A note on the estimation of some mean values for a
bivariate distribution. Ann. Math. Stat., 13, 440-444.
[20] Raj, Des. (1968). Sampling Theory. Bombay, New Delhi: Tata McGraw-
Hill.
[22] Shah, B.V., Barnwell, B.G., Hunt, P.N. e LaVange, L.M. (1992). SUD-
DAN users manual - professional software for survey data analysis for
multi-stage sample designs - release 6.0. North Carolina: Research Tri-
angle Institute.
[26] Silva, P.L.N., Silva, D.B.N., Moura, F.A.S. e Jooris, L.R. (1995). Frame
problems and survey design for the Brazilian annual retail and wholesale
trade survey. Artigo submetido para publicao na revista Estadstica.
[28] Silva, P.L.N. e Skinner, C.J. (1996). Variable selection for regression
estimation in finite populations. Artigo submetido para publicao no
Journal of the American Statistical Association.
[29] Skinner, C. J., Holt, D. and Smith, T.M.F. (1989). Analysis of Complex
Surveys. Chichester: Wiley.
[30] Thompson, S.K. (1992). Sampling. New York: John Wiley & Sons.