Você está na página 1de 17

Distribuies

Amostrais
Distribuio de Probabilidades de
Estatsticas Amostrais
Teorema Central do Limite

Na aula passada...

55

50

50

60

70

60

Peso mdio:

65

50

60

65

Populao:
N=5
50

55

55

= 60 Kg
55

65

70

50

60

65

60

65

70

70

55

70

Desviopadro:
= 7.1 Kg

Vimos que os valores de X variam de acordo


com uma distribuio de probabilidade

X uma varivel aleatria


1
1
2
2

E[ X ] = 52.5 + 55.0 + 57.5 + 60.0 +


10
10
10
10

2
1
1

= 62.5 + 65.0 + 67.5


10
10
10

= 60.0 =

A mdia dos valores de X igual mdia da


populao de onde retirada a amostra.

X uma varivel aleatria


Var[ X ] =

1
1
2
2
2
2
( 52.5 60.0 ) + ( 55.0 60.0 ) + ( 57.5 60.0 ) +
10
10
10
2
2
1
2
2
2
( 60.0 60.0 ) + ( 62.5 60.0 ) + ( 65.0 60.0 ) +
10
10
10
1
2
( 67.5 60.0 ) = 18.75
10

dp[ X ] = Var[ X ] = 18.75 = 4.33


dp[ X ] < 7.1 =

O desvio-padro de X menor do que o desviopadro da populao de onde retirada a


amostra.

Assim, j conhecemos algumas propriedades


da mdia amostral:

o estimador de

uma varivel aleatria

um
estimador
no-viciado
de

E[ X ] =

dp[ X ] <

A variabilidade de

X = dp[ X ] =

em torno de diminui
quando n cresce

As propriedades da mdia amostral X valem


para qualquer populao e para qualquer
tamanho de amostra n.

X = E[ X ] =
X = dp[ X ] =

Quanto distribuio de probabilidade de X ,


fcil encontr-la quando a populao pequena.

Mas, e quando a populao for grande ??

Para casos gerais, vamos precisar de um


resultado muito importante em Estatstica:

o Teorema Central do Limite


Mas, antes, vamos definir o que uma
Amostra Aleatria da varivel aleatria X.

Amostra Aleatria
Uma Amostra Aleatria da varivel
aleatria X um conjunto de n variveis
aleatrias X1, X2,, Xn, que tm a mesma
distribuio de probabilidade de X.
Exemplo: X Normal ( = 60; = 6)
O conjunto

X 1 , X 2 ,..., X n tal que

X 1 Normal ( = 60; = 6)
X 2 Normal ( = 60; = 6)
X n Normal ( = 60; = 6)

uma amostra aleatria da varivel X.

Teorema Central do Limite


Seja uma amostra aleatria
varivel aleatria

x1 , x2 ,..., xn

, de uma

com mdia e desvio padro .

medida que n cresce, a distribuio de


probabilidade de X aproxima-se de uma Normal com
mdia e desvio padro

Ou seja, Z =

X
/ n

n.

aproxima-se de uma Normal (0 ;1).

Ilustrao do Teorema Central do Limite


Vamos realizar o seguinte experimento:
Considere uma populao de indivduos cuja
caratecterstica de interesse tenha distribuio de
probabilidade Normal com mdia igual a =75.0 e
desvio-padro igual a =19.7

quantidade de peixe pescado


por embarcao,por ms, em
toneladas.

150000
50000

produo semanal de leite,


por animal, em litros;

Exemplos:

Populacao

50

100

Valor do individuo

150

Ilustrao do Teorema Central do Limite


1

Para vrios tamanhos de amostra n, vamos retirar um


nmero grande de amostras da populao, digamos,
10000 amostras de mesmo tamanho n.
Para cada amostra retirada, vamos calcular a mdia
amostral, X .
Ao final da retirada das 10000 amostras, teremos 10000
valores de X
Para verificar a distribuio desses valores, construiremos

3 um histograma.

100

150

200

n=5

150000

50

Populacao

50

100

150

Valor da media amostral

50

100

150

50

Valor do individuo
0

150

250

50000

n = 10

50

100

Valor da media amostral

150

200

300

n = 50

150000

50 100

Populacao

50

100

150

50000

Valor da media amostral

50

100

100

150

n = 100

150

50

Valor do individuo

50

100

150

Valor da media amostral

n = 10

50

50

100

150

150

250

200

n=5

50

100

150

50

100

150

Valor da media amostral

Valor da media amostral

n = 50

50

50 100

100

200

150

300

n = 100

0
0

50

100

50

100

150

Valor da media amostral


Valor da media amostral

150

O que podemos observar a partir desta


ilustrao do TCL quando a populao
segue a distribuio Normal?
1 - O que acontece com a mdia da distribuio
da mdia amostral medida que n cresce?
2 - O que acontece com a forma da distribuio
da mdia amostral medida que n cresce?
3 - O que acontece com a variabilidade da
distribuio da mdia amostral medida que n cresce?

Teorema Central do Limite


Seja uma amostra aleatria
varivel aleatria

x1 , x2 ,..., xn

, de uma

com mdia e desvio padro .

X
Z=
/ n

N (0,1)

Observe que o TCL no fala nada sobre a


distribuio de X, a varivel aleatria associada
populao de interesse.

Ilustrao do Teorema Central do Limite


Vamos visualizar o que acontece com a
distribuio da mdia amostral X quando a
populao de interesse NO tem distribuio
Normal.
Distribuio Assimtrica

Populacao

Populacao

Media = 2.80

20000

150000

Distribuio Uniforme

40

60

80

100

120

140

160

Valor do individuo

Valor do individuo

n=5

n=5

Ilustrao do Teorema Central do Limite


Vamos fazer um experimento igual ao anterior,
mas agora com duas populaes diferentes:
Distribuio Assimtrica

Populacao

Populacao

Media = 2.80

20000

150000

Distribuio Uniforme

40

60

80

100

120

140

160

Valor do individuo

Valor do individuo

n=5

n=5

=95.0

=2.80

n=5

50

10000

30000

100 150 200 250

Populacao

60

80

100

120

140

160

40

60

80

100

120

Valor do individuo

Valor da media amostral

n = 10

n = 100

140

160

140

160

50

50

100

100

150

150 200

250

200

40

80

100

120

140

160

40

60

80

100

120

Valor da media amostral

Valor da media amostral

Populacao

n=5
100 150 200 250

60

200000

40

50

100000

Media = 2.80

Valor do individuo

Valor da media amostral

n = 10

n = 100

50

50

100

100

150 200

150

250

4
Valor da media amostral

4
Valor da media amostral

O que podemos observar a partir desta


ilustrao do TCL quando a populao NO
segue a distribuio Normal?
1 - O que acontece com a mdia da distribuio
da mdia amostral medida que n cresce?
2 - O que acontece com a forma da distribuio
da mdia amostral medida que n cresce?
3 - O que acontece com a variabilidade da
distribuio da mdia amostral medida que n cresce?

Teorema Central do Limite


(resumo)
Distribuio de X

Distribuio de X

Tamanho de
amostra

N ( ; )

N (;

n)

Qualquer

Qualquer

N (;

n)

n > 30

Aplicaes
O nvel de bilirrubina srico em crianas nascidas com peso
menor que 750g tem distribuio Normal com mdia
=8.5 mg/dl e desvio-padro =3.5 mg/d.
Para uma amostra de tamanho n=16 crianas desta populao,
sabemos que X ~ N (8.5 ; 3.5 16)
Qual a probabilidade de que a mdia amostral, para uma
amostra de 16 crianas, esteja entre 6.79 e 10.22 mg.dl?

P[6.79 < X < 10.22] = P[

6.79 8.50 X 8.50 10.22 8.50


<
<
]
3.50 / 16 3.50 / 16
3.50 / 16

*O nvel de bilirrubina no sangue usado para diagnosticar doenas do fgado, entre outras.

Aplicaes
P[6.79 < X < 10.22] = P[

1.71
1.72
<Z<
]
0.88
0.88

= P[1.94 < Z < 1.95]


= P[ Z < 1.95] P[ Z < 1.94]
= 0.9744 - 0.0262 = 0.9482
0.9482 0.95

6.79

10.22

Aplicaes
Em uma amostra de 16 crianas nascidas com peso menor
que 750g, a mdia amostral do nvel de bilirrubina srico
foi igual a 10.5 mg/dl.
Considerando que a populao tem distribuio Normal
com mdia =8.5 mg/dl e desvio-padro =3.5 mg/dl,
qual a probabilidade de obter amostras de 16 crianas
com valores mdios de bilirrubina srico iguais ou mais
extremos do que 10.5 mg/dl?

P[ X > 10.5] = P[ Z >

10.5 8.5
] = P[ Z > 2.27]
3.5 16

= P[ Z < 2.27] = 0.0116

Distribuio Amostral de
uma Proporo
Uma proporo amostral pode ser vista com uma mdia
amostral
n
X
nmero de sucessos
p =
= i
n
i =1 n

onde

se sucesso
1,
Xi =
0, caso contrrio

Exemplo: estimar a proporo de eleitores contrrios ao


voto obrigatrio.

1,
Xi =
0,

se contra o voto obrigatrio


se a favor do ao voto obrigatrio

Distribuio Amostral de
uma Proporo
p uma mdia de variveis aleatrias Xi ~ Bernoulli (p).
Assim, = E [ X i ] = p e = Var[ X i ] =

p (1 p )

Pelo Teorema Central do Limite, a distribuio amostral


de

p pode ser aproximada por uma Normal com mdia p

e desvio-padro

Ou seja,

p (1 p) quando n > 30.

Z=

p p
p(1 p ) / n

N (0,1)

Ilustrao: o que acontece com a distribuio dos


p 0.50
valores de Z =
quando n cresce?
0.50(1 0.50) / n

Populao: X
Bernoulli
20
50
(p=0.50)
10
3
nnn~
=
1000
n===
30
4
2
5
100

Aplicaes
Um bilogo est estudando a preferncia de uma espcie de
aranha quanto ao local de confeco de sua teia em rvores:
perto do tronco ou ao final dos galhos.
Para aranhas de espcies parecidas, a proporo das que
preferem fazer teias perto do tronco j foi estimada em 0.75.
Em um estudo com 40 teias de aranha da espcie em questo, o
pesquisador observou que 22 teias foram tecidas perto do
tronco, ou seja, p = 22 / 40 = 0.55 .
Supondo que a proporo populacional das aranhas em
estudo que fazem teias perto do tronco tambm seja p=0.75,
qual a probabilidade de o resultado amostral ter ocorrido?

Aplicaes
Como a proporo amostral uma varivel aleatria contnua,
j sabemos que o clculo de P[ p = 0.55] no faz sentido.
Assim, vamos calcular a probabilidade de amostras com
propores ainda mais extremas do que a obtida. Ou seja,

0.55 0.75
p p
<
P[ p < 0.55] = P

0.75(1 0.75) / 40
p(1 p) / n

= P [ Z < 2.92]
= 0.0017

0.0017
0.55

0.75

Aplicaes
Concluso:

Sob a hiptese de que a proporo populacional das


aranhas em estudo que fazem teias perto do tronco
tambm seja p=0.75, a amostra coletada pouco
verossmil (probabiliade de 0.0017).

Sendo assim, a hiptese do estudo deve ser revista.

Propriedades do Estimador Mdia Amostral


_
_

PDFs of X and X

f HX L , g HX L
12
12
20
40
120
12
10
10
100
10
15
30
8
8
808

6
10
20
6066

n = 1000
1
2
3
4
5
6
7
8
9
10
25
100
X
s = 0.100
X
s = 0.003
0.100
0.071
0.058
0.050
0.045
0.041
0.038
0.035
0.033
0.032
0.020
0.010
X

4
4044
105
202

_
7.7

8.0

8.3

X , X

O que acontece com a distribuio de probabilidade


de X (em vermelho) quando n cresce?

Para saber mais


Exerccios da Seo ???

Referncias Bibliogrficas
As ilustraes do Teorema Central do Limite para o caso da
proporo amostral e das propriedades do estimador
mdia amostral foram elaboradas a partir dos arquivos
do Demonstraction Project do Wolfram Mathematica
(http://demonstrations.wolfram.com/).
Para a primeira ilustrao, foi utilizado o arquivo
SamplingDistributionOfTheSampleMean.nbd.
Para a segunda ilustrao, foi utilizado o arquivo
IllustratingTheCentralLimitTheoremWithSumsOfBernoulli
RandomV.nbd