Você está na página 1de 24

Estatística 2022-2023

Licenciatura em Economia

Amostragem, Distribuições Amostrais

Patrícia Filipe e Jorge Sinval


Amostragem

2 / 24
População vs Amostra

Afonso, A., Nunes, C. (2019), p. 2

População: Conjunto de todos Amostra: O subgrupo, de n


os N elementos que se pretende elementos, da população
estudar e que possuem uma ou selecionado para análise é
mais características em comum. designado por amostra.
As medidas relativas à população As medidas relativas à amostra
designam-se por parâmetros designam-se por estatísticas. O
(usualmente desconhecidos, mas valor destas estatísticas varia de
xos). amostra para amostra.

3 / 24
Amostragem

https: Taxa de amostragem:


//www.ine.pt/scripts/db_censos_2021.html n
f = N × 100%
Amostragem: Conjunto de
Censo ou recenseamento:
procedimentos estatísticos usados
processo de recolha de
para selecionar amostra(s) da(s)
informação de toda a população.
população(ões) do estudo.

4 / 24
Métodos de Amostragem

Amostragem aleatória (ou


probabilística): É conhecida a
probabilidade de selecionar cada
elemento da população.
Amostragem Aleatória Simples;
Amostragem Sistemática;
Amostragem Estraticada;
Amostragem por Clusters;
Amostragem Multi-etapas;
...
Amostragem não aleatória (ou
não probabilística): A
probabilidade de seleção de um
elemento da população não é
conhecida.
Amostragem por conveniência;
Amostragem Intencional;
Amostragem Snowball ;
...

Triola, M.F. et al. (2019) p.27


5 / 24
Amostragem Aleatória Simples

◦ Todos os elementos da população têm igual probabilidade de


serem selecionados para a amostra;
◦ Cada amostra de dimensão n tem a mesma probabilidade de
ser selecionada do que qualquer outra de igual dimensão.
◦ Exige a existência de uma lista exaustiva da população;
Por este método a amostra pode ser selecionada pelo método da

lotaria ou por lista de números aleatórios.

Exemplo: População N=100 seleção de uma amostra de dimensão


n=10 pelo método de amostragem aleatória simples gerando uma
lista de números aleatórios (ver exemplo no EXCEL).

6 / 24
Distribuição conjunta de uma amostra aleatória

X v.a. que representa a população com distribuição expressa por


fX (x)

(X1 , X2 , · · · , Xn ) Amostra aleatória (a.a.) segundo um Método de
Amostragem Aleatória Simples.
(X1 , X2 , · · · , Xn ) é um vector aleatório de v.a.s i.i.d., em que cada
Xi é representa o i-ésimo valor selecionado da população, logo a
distribuição de probabilidade de Xi é expressa por fX (xi )


Amostra observada  (x1 , x2 , · · · , xn )

A função massa(densidade) de probabilidade conjunta da a.a. é
dada por

n
Q
f(X1 , X2 , ··· ,Xn ) (x1 , x2 , · · · , xn ) = fX (xi )
i=1

7 / 24
Distribuição conjunta de uma amostra aleatória

Exemplo: Se tivermos uma população com distribuição de Bernoulli de


parâmetro p a função de probabilidade conjunta de uma amostra
aleatória de dimensão n, é dada por
n n
n
P P
xi n− xi
xi
(1 − p)1−xi i=1 i=1
Q
f(X1 , X2 , ··· , Xn ) (x1 , x2 , · · · , xn ) = p =p (1 − p)
i=1
Admitindo p = 0.7 e a seleção de uma amostra aleatória de dimensão
n = 5. Qual a probabilidade da amostra selecionada ser (0, 0, 1, 1, 1)?

f(X1 , X2 , X3 , X4 , X5 ) (0, 0, 1, 1, 1) = 0.73 0.32 = 0.03087

8 / 24
Distribuição Amostral

Qualquer função de uma amostra aleatória é uma Estatística, uma v.a.


cujo valor observado varia de amostra para amostra. São exemplos de
Estatísticas de uma amostra aleatória de dimensão n:
n
P
◦ Sn = Xi
i=1
n
1 P
◦ X̄ = n Xi
i=1
n
1
◦ S2 = (Xi − X̄ )2
P
n−1
i=1

Exemplo: Ainda no contexto de uma população de Bernoulli, e


admitindo a seleção de uma amostra aleatória de dimensão n, vericamos
que
Sn ∼ B(n, p)
Se p = 0.7 e n = 5, qual a probabilidade de S5 > 3?

P[S5 > 3] = 0.5282

9 / 24
Principais Distribuições Amostrais

10 / 24
Distribuição Amostral da Média: População normal e σ2 conhecida

Se a distribuição da população for normal e a variância (σ 2 ) for


conhecida então, a Distribuição amostral da média é

σ
X ∼ N(µ, √ )
n

Diz-se que a distribuição por amostragem da média X segue uma


2
distribuição normal com valor esperado µ e variância σn .
Ao desvio padrão da média amostral ( √σn ) dá-se o nome de erro
padrão.

11 / 24
Distribuição Amostral da Média: Teorema Limite Central

Teorema Limite Central (TLC)


Suponhamos que se recolhe uma amostra aleatória de dimensão n
de uma dada população X (muito grande), com valor esperado µ e
variância σ 2 . Então, se a amostra for sucientemente grande, X
pode ser modelada, aproximadamente, por um modelo normal com
2
valor esperado µ e variância σn .

12 / 24
Distribuição Amostral da Média: Teorema Limite Central

Anderson et al. (2020) p.190 13 / 24


Distribuição Amostral da Média: Teorema Limite Central

Teorema Limite Central


Seja (X1 , X2 , . . . , Xn ) uma sucessão de v.a.'s i.i.d., tal que
E [Xi ] = µ e Var[Xi ] = σ 2 , ∀i = 1, . . . , n, nita.
Considere-se Sn = X1 + · · · + Xn . Para valores grandes de n tem-se
que:
√ Sn − nµ
Sn ∼N(nµ,
˙ nσ) ⇒ √ ˙ 0, 1)
∼N(

Consequentemente, quando n → ∞,

σ √ X −µ
X ∼N(µ,
˙ √ )⇒ n ˙ 0, 1)
∼N(
n σ

Na prática, considera-se amostra sucientemente grande quando


n ≥ 30.

14 / 24
Distribuição Amostral da Média (cont.)

Se a distribuição populacional não for normal, a variância for


conhecida mas a amostra for sucientemente grande então (pelo
TLC),
 
σ
X ∼N
˙ µ, √
n

Se a distribuição populacional for normal, a variância não for


conhecida então,
√ X −µ
n ∼t(n−1)
S

15 / 24
Distribuição Amostral da Média (cont.)

Se a distribuição populacional for normal, a variância não for


conhecida mas a dimensão da amostra for sucientemente grande
então (pela aprox. da t-Student pela Normal),

√ X −µ
 
n ∼N
˙ 0, 1
S

 
S
X ∼N
˙ µ, √
n

16 / 24
Distribuição Amostral da Proporção

Seja X =Número de vezes que ocorre o acontecimento A (sucesso),


numa experiência aleatória tal que X ∼ B(1, p), com p = P[A] =
proporção de sucessos na população; e (X1 , X2 , · · · , Xn ) uma a.a., então,

n
P
Xi
i=1
P̂ = X = n = proporção amostral = proporção de sucessos na amostra
np(1−p)
⇒ E [P̂] = p e Var[P̂] = n2

nP̂ ∼ B (n, p) e a distribuição amostral exata da proporção é


expressa pela função de probabilidade

p̂ = n0 , n1 , n2 , ..., 1
n n−np̂
fP̂ (p̂) = Cnp̂ p np̂ (1 − p) ,

Para uma a.a. de dimensão elevada (n ≥ 30), pelo T.L.C.


 q 
p(1−p)
P̂ ∼N
˙ p, n V Distribuição amostral aproximada da

proporção.

Para além de n ≥ 30, deve-se vericar a condição 0.1 ≤ p ≤ 0.9.


17 / 24
Distribuição Amostral da Variância

Seja (X1 , X2 , . . . , Xn ) uma a.a. extraída de uma população com


variância σ 2 , nita. Se a distribuição da população for normal então
(n−1)S 2
χ2 = σ2
∼ χ2(n−1) V Distribuição amostral da variância

Nota: Seja Z1 , Z2 , . . . , Zn uma sucessão


Pn de2v.a.'s2 i.i.d. Se
Zi ∼ N(0, 1), i = 1, . . . , n, então, i=1 Zi ∼ χ(n)

18 / 24
Triola, M.F. et al. (2019) p.255

19 / 24
Distribuições Amostrais para duas populações

Estatística Condições Distribuição amostral



X̄1 − X̄2 − (µ1 − µ2 )
σ12 , σ22 conh., Pop. Normais Z = ∼ N (0, 1)
2 σ2
r
σ1
n1
+ n2
2

X̄1 − X̄2 − (µ1 − µ2 )
σ12 , σ22 conh. Z = ˙ (0, 1)
∼N
2 σ2
r
σ1
n1
+ n2
2
Pop. quaisquer, n1 , n2 ≥ 30
X̄1 − X̄2

X̄1 − X̄2 − (µ1 − µ2 )
σ12 , σ22 desconh., σ12 = σ22 T = r ∼ tn1 +n2 −2
2 2 
(n1 −1)S1 +(n2 −1)S2 1 + 1

n +n −2
1 2 n 1n 2
Pop. Normais

X̄1 − X̄2 − (µ1 − µ2 )
σ12 , σ22 desconh., σ12 = σ22 Z = ˙ (0, 1)
∼N
2 2
r
S1
+ n2
S
n1 2
Pop. quaisquer, n1 , n2 ≥ 30

20 / 24
Distribuições Amostrais duas populações (cont.)

Estatística Condições Distribuição amostral

σ12 , σ22 conh.


S12 S12 σ22
Pop. Normais F = ∼ Fn1 −1, n2 −1
S22 S22 σ12

 
P̂1 − P̂2 − (p1 − p2 )
P̂1 − P̂2 n1 , n2 ≥ 30 Z= q ∼N
˙ (0, 1)
p1 (1−p1 )
n1 + p2 (1n−p
2
2)

Pop. Bernoulli

21 / 24
Exercícios

1. Seja X uma variável aleatória que representa uma população com


distribuição normal de média 25 e desvio-padrão 4. Calcule a
probabilidade de uma amostra aleatória de dimensão 64 apresentar:

a) média inferior a 26.


b) média entre 24 e 26.
c) variância máxima 8.

2. Considere que um lote de 5000 esferas apresenta um peso médio de


5,02 kg e um desvio-padrão de 0,50 kg. Calcular a probabilidade de
numa amostra aleatória de 100 esferas, se encontrar:

a) um peso total entre 503 kg e 505 kg.


b) um peso médio que não exceda 5,05 kg.

3. Pretende-se recolher uma amostra aleatória de uma população


gaussiana. Sabendo que se deve vericar a seguinte condição
h σi
P |X̄ − µ| ≤ = 0.6827
20

e admitindo que σ é conhecido, determine o valor para a dimensão


da amostra recolhida
22 / 24
Exercícios

4. Imagine que possui uma amostra da nota nal de 25 alunos de


Estatística, da população de alunos de uma Universidade (N =
800). Admita a normalidade das notas.

a) Qual é a distribuição mais apropriada para a média de uma


amostra com esta dimensão?
b) Se aumentarmos a dimensão da amostra para uma taxa
amostral de 50%, qual será a distribuição mais apropriada para
a média amostral? Justique.
c) A amostragem realizada é de uma população que se pode
considerar pequena?

5. Numa escola primária estão inscritos 100 alunos. Sabe-se que 60


destes alunos têm medo de trovoada.

a) Caracterize a distribuição amostral da proporção de alunos


com medo de trovoada relativamente a amostras de 30 alunos.
b) Calcule a probabilidade de entre as 30 crianças, menos de 50%
terem medo de trovoada.
c) Calcule a probabilidade, para uma amostra de 20 crianças,
mais de 25% terem medo de trovoada.

23 / 24
Exercícios

6. Os pneus da marca M1 andam em média 105,6 (× 1000 km) antes


de precisarem de substituição e os da marca M2 andam em média
178,5 (× 1000 km) antes de lhes acontecer o mesmo.
Recolheram-se duas amostras aleatórias, de dimensão 10 cada, da
quantidade dos quilómetros percorridos até ao desgaste dos pneus
M1 e M2, obtendo-se, respetivamente, os desvios-padrão amostrais
de 10,97 e 11,75, qual a probabilidade de a média amostral da
marca M2 ser superior à da marca M1? Admita a normalidade das
populações e a igualdade das variâncias.

7. A proporção de consumidores que optaram pelos cereais da marca


Branca é no hipermercado X de 0.4, e no hipermercado Y de 0.27.
Calcule a probabilidade de, consideradas duas amostras aleatórias,
para o primeiro hipermercado de 200 consumidores e para o segundo
de 150 consumidores, a diferença das proporções amostrais de
consumidores que optam pelos cereais de marca Branca ser positiva.

24 / 24

Você também pode gostar