Escolar Documentos
Profissional Documentos
Cultura Documentos
Amostragem
--- Estatística – é uma função da amostra aleatória que não contém parâmetros
desconhecidos.
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
exemplos: um animal, uma planta, um objecto, uma família, uma exploração agrícola,
um bairro, etc.
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
Outros desenvolvimentos além dos que irão ser aqui abordados podem ver-se
em Cochran (1977).
- a precisão do estimador;
- o tamanho da amostra para obter a precisão desejada;
- a escolha do melhor método de selecção da amostra.
$)= E Θ
EQM ( Θ [(
$ −θ ) ] = Var[Θ$ ] + ( E[Θ$ ] − θ )
2 2
.
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
N Ai
Valor Médio µ = µX = ∑ (1)
i =1 N
N( Ai − µ ) 2 N A
Variância σ 2X = E ( X − µ ) 2 = ∑ = ∑ i − µ2 (2)
i =1 N i =1 N
N
( A − µ) 2
N
ou σ X' 2 =∑ i = σ X2 (3)
i =1 N −1 N −1
Total T = X T = ∑ Ai = nµ (4)
XT
Razão de dois totais YT (5)
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
n Xi
Um estimador centrado para µ é, como sabemos, X =∑ .
i =1 n
σ2
Tem-se ainda Var ( X ) = . (6)
n
σ
A Var ( X ) = chama-se erro padrão da média.
n
Como regra geral não se conhece σ 2 não é possível saber o valor do erro padrão.
Há então que determinar um estimado de σ 2 . Vamos relembrar que
n ( Xi − X )2
S' 2 = ∑ é um estimador centrado de σ 2 .
i =1 n − 1
Efectivamente
n 2
∑ E[ X ] − nE[ X ]
n
(X − X) 2 ∑ X i − nX 2 2 2
[ ]
n i
E S' 2 = E ∑ i = E
i =1 = i =1
.
i = 1 n − 1 n − 1 n −1
∑ ( σ + µ ) − n ( σ / n + µ ) nσ + n µ − σ − n µ
2 2 2 2 2 2 2 2
E S' 2 = = = σ2.
n −1 n −1
s' s'
x − t α /2 , x + t α /2 (7)
n n
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
s′
2
t s'
tα / 2 ≤ ε ⇒ n ≥ α /2 . (8)
n ε
2
t s' 2
n ≥ α / 2 1 1 + . (9)
ε n1
n
Se o valor resultante para n é tal que é apreciável (>5% ou >10%), deve
N
considerar-se como dimensão de amostra a recolher o valor dado por
n
n* ≥ .
1+ n / N
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
1 se A j está na amostra
Ij
0 se A j não está na amostra
∑ Xi ∑A I j j
i =1 j =1
então X= =
n n
(Note-se que se A j está na amostra A j I j = X j )
[ ] ( ) n
E I j = 0 × P I j = 0 + 1 × P I j = 1 = ; donde
N
( )
N
E ∑ A j I j
E[ X ] =
j =1
n
1 1 N
= ∑ Aj E I j = ∑ Aj
n n j =1
n
N
=µ [ ]
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
1 N 1
Var[ X ] = Var ∑ A j I j = 2 Var
n j =1 n
[∑ A I ] j j
[ ]
N
Var ∑ A j I j = ∑ A 2j Var I j + ∑ Ai A j Cov ( I i , I j )
j =1 i≠ j
Ora [ ] [ ] [ ]
Var I j = E I 2j − E 2 I j =
n n2
− 2 =
N N
Nn − n 2
N 2
n
= 1 −
N
n
N
(10)
N − 2
n−2 n n
( ) [ ] [ ] n( n − 1) n
2
Cov I i , I j = E I i I j − E [ I i ]. E I j = − . = −
N N N N ( N − 1) N
n
o que, após pequenos cálculos dá
n n 1
Cov ( I i , I j ) = − 1 − . (11)
N N N − 1
( )
Cov ( I i , I j ) 1
ρ Ii , I j = =− . (12)
Var ( I i )Var ( I j ) N −1
Calculemos então
1 N 1
Var ( X ) = 2 Var ∑ A j I j = 2 ∑ A 2j Var ( I j ) + ∑ A j Ak Cov ( I j , I k ) =
n j =1 n j≠k
1 N 2 n n n n 1
= 2 ∑ A j 1 − − ∑ A j Ak 1 −
n j =1 N N j≠k N N N − 1
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
∑A
j≠k
j Ak = ∑ A j ∑ ' Ak
j k≠ j
com ∑' A
k≠ j
k = ( A1 + .. .+ AN ) − A j = Nµ − A j
vem
∑ A j Ak = ∑ A j ( N µ − A j ) = N 2 µ 2 − ∑ A j ,
2
j≠k j j
=
N −n 1 ∑A 2
j − N µ2
=
N −nσ2
. (13)
N −1 n N N −1 n
Observe-se que
N − n σ2 σ2
< isto é
N −1 n n
Sendo assim, quer dizer que a amostragem sem reposição é mais eficiente do
que a amostragem com reposição para estimar o valor médio.
N −n
Se N é grande comparativamente a n, a fracção não difere muito de 1 e
N −1
a diferença na eficiência torna-se desprezável.
N −n
Ao factor chama-se correcção de população finita e a
N −1
n
f = chama-se fracção de amostragem.
N
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
Ora
n ( Xi − X )2
E S [ ]
'2
= E ∑
i =1
=
n −1 n −1
1
E [∑ ( X i ]
− µ ) 2 − n( X − µ ) 2 =
1 2 N −nσ2
=
1
n −1
[ ]
∑ E ( X i − µ ) 2 − nE ( X − µ ) 2 =
n −1
nσ − n =
N −1 n
1 nσ 2 ( N − 1) − ( N − n )σ 2 1 N ( n − 1)σ 2 N
= = = σ 2 = σ ′2
n −1 N −1 n − 1 N − 1 N − 1
1− f
s′ (15)
n
5 2 4 1 5 8 8 6 6 8 9 10 7 11 9 14 12 8 14 11 9
8 11 10 15
10 15 8 11 5
10
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
σ′2
Para esta amostra tem-se x = 9.8 e Var ( X ) = (1 − f )
= 1. 9872
5
Barnett (1994) apresenta o resultados obtidos quando, para aquela população se
geram 500 amostras de dimensão 5. Verificou que
x500 = 8. 46 ≈ µ e s ′ 2 = 1. 94 ≈ Var ( X ) .
Tendo em conta o que foi acabado de observar, pode pensar-se numa extensão
do Teorema Limite Central ao caso de populações finitas.
N
( Ai − µ ) 3
n > 25G12 com G1 = ∑ (coeficiente de assimetria
i =1 Nσ ′ 3
para populações finitas)
Sendo assim, nas condições anteriores pode usar-se a distribuição normal para
fazer inferências sobre µ.
1- f 1- f
x − t α / 2(n −1) s ′ < µ < x + t α / 2(n −1) s ′ (18)
n n
11
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
sendo ( )
t α / 2 ( n −1) tal que P T > t α / 2( n −1) = α , com T v.a. com distribuição t de Student.
⇔ N ( zα / 2 σ ′ ) 2 − n ( zα / 2 σ ′ ) 2 − nNd 2 ≤ 0 ⇔ n ( zα / 2 σ ′ ) 2 + Nd 2 ≥ N ( zα / 2 σ ′ ) 2
zα / 2 σ ′
2
N ( zα / 2 σ ′ ) 2 d
⇔n≥ ⇔n≥
( zα / 2 σ ′ ) 2 + Nd 2 zα / 2 σ ′ 1
2
+1
d N
n≥ + 1 (18)
d d N
12
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
Observe-se que, regra geral, mais uma vez se desconhece σ ′ , devendo então
substituí-lo por s ′ .
Para isso seria necessário conhecer previamente a amostra que é aquilo que não
se conhece. Há basicamente quatro atitudes a tomar:
Recorrendo a estudos piloto, que nos permitam uma primeira estimativa para
σ′.
2
t s' 2
n ≥ α / 2 1 1 + .
d n1
13
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
Estimação do total T
X T* = N X (20)
σ′2
sendo E X T* = N µ = X T e Var X T* = N 2 (1 − f ) .
n
Nas mesmas condições referidas atrás, pode também aqui usar-se a aproximação
à normal, tendo-se
σ ′2
X T* ≈ N X T , N 2 (1 − f ) (21)
n
para construir intervalos de confiança para X T e ainda determinar a dimensão da
amostra necessária para obter certa precisão na estimação de X T .
1- f 1- f
x T* − zα / 2 N σ ′ < X T < x T* + zα / 2 N σ ′ (22)
n n
Escolha de n
P X T* − X T < d ≥ 1 − α
donde, e tendo em conta o intervalo de confiança escrito acima, terá que exigir-se
2
1- n / N
≤ d ⇔ ( zα / 2 N σ ′ )
1- f 2 1- n / N d
zα / 2 N σ ′ ≤ d2 ⇔ ≤
n n n zα / 2 N σ ′
N -n d
2
1 d
2
⇔ ≤ N ⇔ N ≤ n 1 +
n zα / 2 N σ ′ N zα / 2 σ ′
donde se tem
14
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
−1
1 d
2
n ≥ N 1 + . (23)
N zα / 2 σ ′
Mais uma vez estaremos em presença das mesmas dificuldades que surgiram
anteriormente aquando da determinação da dimensão da amostra. As considerações
sobre os procedimentos a usar deverão ser aqui tidas em conta.
n0 ≥ N .
d
−1
n n
Se 0 grande deve considerar-se n0 ≥ n0 1 + 0 .
N N
p$ = r / n
15
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
N
YT = ∑ Yi = R , onde R é o número de elementos da população que verificam A.
1
N
∑Y i
R
µY = 1
= =P (24)
N N
∑Y i
R$
Y = = = P$ ,
1
(25)
n n
∑Y i
R
P = µY = i =1
= (26)
N N
com variância
N
∑ (Y − µ )
2
σ Y'2 = 1
i Y
=
∑Y i
2
− NµY2
=
NP − NP 2 NP (1 − P )
= . (27)
N −1 N −1 N −1 N −1
∑ E [Y ]
n
[ ]
i
i =1 nP
Portanto E P$ = = =P
n n
σ ′2 NP (1 − P ) N − n P (1 − P )
[ ]
Var P$ = (1 − f ) Y = (1 − f )
n n( N − 1)
=
N − 1
n
. (28)
Porém, mais uma vez estamos na situação de ter nas definições anteriores
parâmetros desconhecidos, isto é, P é desconhecido, e por isso não é possível calcular
16
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
σ ' 2 . Então terá que ser estimado, usando o estimador centrado de σ ' 2 , S′ 2 , cuja
estimativa é
1 n
s′ =
2
Y ∑
n − 1 i =1
( yi − y ) 2 =npˆ qˆ /(n − 1) (29)
[]
Var Pˆ =
N − n P (1 − P )
N −1 n
,
Se f é desprezável, tem-se
S ′ 2 ( Pˆ ) = Pˆ Qˆ /( n − 1) . (31)
17
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
Rˆ ≈ B (n, P )
(1 − f ) pˆ qˆ (1 − f ) pˆ qˆ
pˆ − zα / 2 < P < pˆ + zα / 2 (33)
n −1 n −1
Pˆ Qˆ
S ′2 ( Pˆ ) = (1 − f ) . (34)
n −1
R$
Como vimos um estimador para P é P$ = com
n
N − n PQ
E P$ = P e Var P$ = .
N −1 n
[]
A Var Pˆ atinge o seu máximo para P=Q=1/2.
18
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
[ ]
s. e. P$ =
PQ
n
≤d (supondo N grande, portanto (1 − f ) ≅ 1 )
[]
s.e. Pˆ / P =
Q
nP
≤ε (supondo N grande, portanto (1 − f ) ≅ 1 )
Observe-se que o erro relativo não é mais do que o coeficiente de variação, por
isso a condição expressa atrás é equivalente a dizer que pretendemos o coeficiente de
variação não superior a ε.
{ }
P P$ − P > d ≤ α {
ou P P$ − P > ξP ≤ α }
ou seja, considerando a aproximação pela normal, viria
[]
s.e. Pˆ =
PQ
n
≤
d
zα / 2
ou []
s.e. Pˆ / P =
Q
≤
ξ
nP zα / 2
.
19
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
Var Pˆ = []
N − n PQ
N −1 n
, donde
2
N − n PQ N − n PQ d 2 N − n N −1 d
zα / 2 ≤d ⇔ ≤ 2 ⇔ ≤ ⇔
N −1 n N −1 n zα / 2 n PQ zα / 2
−1 −1
N − 1 d 2 PQ zα2 / 2 1 zα / 2
2
n ≥ N 1 + ⇔n≥ 1 + PQ − 1
PQ zα / 2
d2 N d
N − n PQ
Ora sabe - se que Var ( P$ ) = e pretende - se que
N −1 n
N − n PQ N − n PQ ξ 2 P 2 N −n ξ 2P2
zα / 2 ≤ ξP ⇔ ≤ 2 ⇔ ≤ ( N − 1) ⇔
N −1 n N −1 n zα / 2 n PQ z α2 / 2
−1 −1
2
N ξ 2P ξ 2P Qz 1 Q zα / 2
2
⇔ ≤ 1 + ( N − 1) ⇔ n ≥ N 1 + ( N − 1) ⇔ n ≥ α / 2 1 + − 1 .
n Q z α2 / 2 Q z α2 / 2 P ξ N P ξ
2
Q z α2 /2
Como primeira aproximação pode considerar-se n0 ≥ . (37)
P ξ2
−1
n n0 − 1
De novo se 0 é grande, deve considerar-se n0 ≥ n0 1 + .
N N
20
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
E R* ≅ R = µ X µY ;
1 − f N ( X i − RYi ) 2 1 − f
Var R *
≅ 2 ∑
= σ ' 2X −2 R σ ' XY + R 2 σ 'Y2 (40)
ny 1 N −1 ny 2
com r * = x y .
Acontece por vezes que ao estudarmos duas características para cada unidade de
amostragem, para uma delas é conhecido o total dos valores dessa característica.
X
XR = µ = R * µY (42)
Y Y
21
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
1 − f N ( X i − RYi ) 2 1 − f
Var X R ≅ ∑ = σ ' 2X −2 R σ ' XY + R 2 σ 'Y2 .
n 1 N −1 n
Ora tem-se
1− f 1− f 2
n
[ ]
σ ' 2X −2 Rσ ' XY + R 2σ 'Y2 <
n
σ'X
⇓
2 Rρσ ' X σ ' Y > R 2σ 'Y2
⇓
R σ 'Y 1 CVY
ρ> ⇒ρ> ,
2 σ'X 2 CV X
22
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
Amostragem Estratificada
k
N = ∑ Ni
i =1
1 k k
Valor médio µ= ∑ N i µ i = ∑ Wi µ i (43)
N i =1 i =1
1 k k
2
σ ′2 = ∑ ( N i − 1)σ i + ∑ N i ( µi − µ )
'2
Variância da (44)
N −1 1 1
população
Ni
onde Wi = N é o “peso “ em cada estrato.
23
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
De facto tem-se
Ni 2
1
(
∑ a −µ ) 1 k Ni
∑∑ a − µ ( ) 1
∑ ( )
∑ aij − µi + µi − µ
2 2
σ '2
= = =
N − 1 i , j ij N − 1 i =1 j =1 ij N − 1 i j =1
N
1 i
( ) (
+ 2( µi − µ ) ∑ aij − µi = )
Ni
∑ ∑
2
= a − µ ) 2
+ N ( µ − µ
N − 1 i j =1 ij i i i
j =1
1 4243
=0
1 k k
= ∑
N − 1 i =1 i
( N − 1 )σ i
'2
+ ∑ N i ( µi − µ ) 2 .
i =1
( )
Ni
1 1 Ni
µi =
Ni
∑a ij e σ i
'2
= ∑ a − µi
N i − 1 j =1 ij
(45)
j =1
k
n1 , n2 ,..., nk ∑ n i = n
i
( )
ni
1 1 ni
∑ xij ∑ x − xi
2
xi = e si'2 =
ni j =1 n i −1 j =1 ij
ni
A fi = chama-se fracção de amostragem em cada estrato.
Ni
24
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
ni N Ni
= i donde ni = n
n N N
Verifica-se portanto que
ni n
fi = = (46)
Ni N
k k Ni X i
X st = ∑ Wi X i = ∑ . (47)
i =1 i =1 N
E [X st ] = ∑ Wi µ i = µ E [X ′] =
k
1 k
1
enquanto ∑ ni µ i ≠ µ
n 1
ni N
X ′ só será estimador centrado se = i , ou seja, no caso da afectação ser
n N
proporcional.
Vejamos agora
Var [X st ] = ∑ Wi 2 (1 − f i )σ ' i2 / ni
k
1
pois
k
Var X st = ∑ Wi 2 Var ( X i ) , visto que na amostragem estratificada os
1
diferentes estratos as médias não estão correlacionadas, logo Cov ( X i , X j ) = 0.
25
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
Observação:
1− f k
2. Se wi = i = i -- caso proporcional Var [X st ] =
n N
n N
∑ Wi σ i'2
n 1
;
k
X T∗ = N X st = ∑ N i X i . (49)
1
Intervalos de Confiança
26
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
2
k
∑ g i s ' i2
N i ( N i − ni )
n = k i =21 4 com gi =
g i s'i ni
∑i =1
(ni − 1)
Var [X st ] <Var X
Ora vejamos:
σ '2
Como sabemos Var X[ ] = (1 − f ) n
e
σ i'2
Var [X st ] = ∑ Wi (1 − f i )
k
2
.
i =1 ni
Ni − 1 Ni Ni
= =
N −1 N N −1 (53)
27
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
1 k k
2
donde σ ′2 = ∑ N i σ i′ 2 + ∑ N i (µ i − µ )
N i =1 i =1
1− f 1− f
⇒ Var [X ] − Var [X st ] =
k k
∑ N i (µ i − µ ) = ∑ W (µ − µ) > 0
2 2
i i
Nn i =1 n i =1
excepto se µ i todos iguais.
1 k k
2
σ ′2 = ∑ ( N i − 1)σ i′ 2 + ∑ N i (µ i − µ )
N − 1 i =1 i =1
1− f k
⇒ Var [X ] − Var [X st ] =
k
N i (µ i − µ ) − ∑ (N − N )σ ′
1
∑
n( N − 1) i =1
2
N i =1
i i
2
∑ N i (µ i − µ ) > ∑ (N − N )σ ′
2 1 2
i i . (54)
i =1 N i =1
Nesta questão há dois pontos a ter em conta. Pretende-se saber como escolher a
dimensão da amostra de modo a satisfazer uma certa precisão ou questões de custo .
28
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
∂L k
= ∑ c n − C + c0 = 0
∂λ i=1 i i
29
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
k
( CT − c0 ) ∑ Wi σ i′ / ci
i =1
n= k
(56)
∑W σ ′ i i ci
i =1
Caso particular
Varmin [X st ] =
1 k 1 k
∑ Wiσ i′ − ∑W σ i
'2
i . (58)
n i N i =1
30
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
Wi σ i′
ni = k
ci
onde k deve ser escolhido de modo a assegurar que
σ i′ 2
Var [X st ] = ∑ Wi 2
k k
1
i =1 ni
−
N
∑W σ ′
i =1
i i
2
=V .
k
∑ Wiσ i′ ci
ni = i =1 k Wiσ i′ / ci . (59)
1
V + ∑ W σ ′ 2
N i =1
i i
4∑ Wiσ i′ 2
n0 ≅ se α = 0.05
d2
n0
n= .
1 + n0 / N
Estimação de Proporções
31
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
Seja
N
N
∑ Yi
i =1
YT = ∑ Yi donde P= (60)
1 N
Ni k k
Como estimador de P tem sentido considerar Yst = ∑ Yi = ∑ Wi P$i = P$st ,
i =1 N i =1
$
onde Yi = Pi designa a proporção de individuos no estrato i, incluidos na amostra e
verificando A. O estimador de P é tal que
[ ]
E Pˆst = P
Var [Pˆ ] = ∑
W k 2
N i − ni (61)
i
Pi (1 − Pi )
Ni −1
st
n i =1 i
Wi 2 N i − ni $
[ ]
k
S ' Pst = ∑
2$ Pi (1 − P$i ) .
n
i =1 i − 1 N i − 1
Se N i grande tem-se
[ ]
2
Var P$st = ∑ i (1 − f i ) Pi (1 − Pi ) .
W
ni
ni n
Se estarmos numa situação de afectação proporcional, isto é, se = tem-
Ni N
se
$ N −n Wi 2 1− f
Var Pst = ∑ Pi (1 − Pi ) ≅ ∑ Wi Pi (1 − Pi ) .
n Ni − 1 n
32
Amostragem
ApostilasBrasil.com Seu Futuro é o Nosso Presente!
nWi Pi Qi
ni = . (62)
∑ Wi Pi Qi
No caso de CT = c0 + ∑ ci ni , tem-se a dimensão da amostra a recolher em cada
estrato
(C − c 0 )Wi Pi Qi / ci
ni = T . (63)
∑ i i ii
W P Q c
33
Amostragem