Você está na página 1de 32

Objetivo: tirar concluses sobre uma populao com base na informao de uma amostra.

estimao testes de hipteses Parmetro: quantidades desconhecidas da populao metro e sobre as quais temos interesse. Ex : - mdia da populao Estimador: combinao dos elementos da amostra, construda com a finalidade de representar, ou estimar, um parmetro de interesse na populao. Ex : X - mdia da amostra (estimador de ) Estimativa: valor numrico assumido pelo estimador. Ex : x o valor de X para a amostra observada.

Estudamos algumas distribuies tericas probabilidade: distribuio binomial e normal. Probabilidade Inferncia

de

os parmetros da distribuio eram conhecidos calculamos probabilidades

os valores desses parmetros no so conhecidos.

A amostra deve ser representativa da populao da qual ela selecionada. Se no for, as concluses extradas sobre a populao podem estar distorcidas ou viesadas.

Exemplos: 1. Fazer uma afirmao sobre o nvel srico mdio colesterol para todos os homens de 20 a 74 anos idade amostramos somente homens acima de anos provvel que nossa estimativa da mdia populao seja muito alta.

de de 60 da

2. Estimar a proporo de eleitores que pretendem votar no candidato A amostra selecionada dentro da USP. Que estimador usar nos exemplos acima? (X1, X2,...,Xn) representa uma amostra de tamanho n. Estimador f (X1, X2,...,Xn).

Os estimadores X (mdia amostral) e p (proporo amostral) so intuitivos e tm boas propriedades. Estimadores so funes de variveis aleatrias e, portanto, eles tambm so variveis aleatrias. Conseqentemente, tm uma distribuio de probabilidades, denominada distribuio amostral do estimador.

Distribuio amostral da mdia


Exemplo 1: Considere uma populao em que uma 1 varivel X assume um dos valores do conjunto {1, 3, 5, 5, 7}. A distribuio de probabilidade de X dada por

x P(X = x)
fcil ver que e

1 1/5

3 1/5
= E(X) = 4,2

5 2/5

7 1/5

= Var(X) = 4,16.

Vamos relacionar todas as amostras possveis de tamanho n = 2, selecionadas ao acaso e com reposio dessa populao, e encontrar a distribuio da mdia amostral de

X
sendo

X 1

2 ,

X1: valor selecionado na primeira extrao, X2: valor selecionado na segunda extrao.

Amostra (X1,X2) (1,1) (1,3) (1,5) (1,7) (3,1) (3,3) (3,5) (3,7) (5,1) (5,3) (5,5) (5,7) (7,1) (7,3) (7,5) (7,7)

Probabilidade 1/25 1/25 2/25 1/25 1/25 1/25 2/25 1/25 2/25 2/25 4/25 2/25 1/25 1/25 2/25 1/25 1

Mdia Amostral 1 2 3 4 2 3 4 5 3 4 5 6 4 5 6 7

A distribuio de probabilidade de X para n = 2


x

1
x)

2 2/25

3 5/25

P( X

1/25

6/25 6/25 4/25 1/25

Neste caso, e

E( X ) 4,2 Var X 2,08

X 2 X

Repetindo o mesmo procedimento, para amostras de tamanho n = 3, temos a seguinte distribuio de probabilidade de ,
x
1 5/3 7/3 3 11/3 13/3 5 17/3 19/3 7
13/3

P(X

x)

1/125 3/125 9/125 16/125 24/125 27/125 23/125 15/125 6/125 1/125

Neste caso, E( X ) 4,2 e Var X 1,39


X 2 X

Figura 1: Histogramas correspondentes s distribuies 1 de X e de X , para amostras de {1,3,5,5,7}.

Dos histogramas, observamos que conforme n aumenta, os valores de X tendem a se concentrar cada vez mais em torno de E( X ) = 4,2 = x , uma vez que a varincia vai diminuindo; os casos extremos passam probabilidade de ocorrncia; a ter pequena

para n suficientemente grande, a forma do histograma aproxima-se de uma distribuio normal.

Figura 2: Histogramas correspondentes s distribuies de X para amostras de algumas populaes

2002,

273

Esses grficos sugerem que, quando n aumenta, independentemente da forma da distribuio de X , a distribuio de probabilidade da mdia amostral aproximase de uma distribuio normal.

Teorema do Limite Central


Seja X uma v. a. que tem mdia e varincia 2. Para amostras X1, X2, ..., Xn , retiradas ao acaso e com reposio de X, a distribuio de probabilidade da mdia amostral aproxima-se, para n grande, de uma distribuio normal, com mdia e varincia 2 / n , ou seja,
2

X ~N

, para grande, aproximadamente.

Comentrios: Se a distribuio de X normal, ento distribuio normal exata, para todo n. n


2

tem

O desvio padro
erro padro da mdia.

denominado

Considere uma amostra aleatria de tamanho n de uma varivel N(10, 16). Como se comporta em funo de n ?

Exemplo 2: 2
Uma v.a. X tem mdia = 5,4 e varincia 2 = 4,44. Uma amostra com 40 observaes sorteada. Qual a probabilidade da mdia amostral ser maior do que 5? = 5,4 X 2 = 4,44 Consideramos que n = 40 observaes uma amostra grande o suficiente para usar o Teorema do Limite Central. Assim,
2 X ~ N ; n 4,44 , isto , X ~ N 5,4; 40 e

P( X

5) P Z

5 - 5,4 4,44 40

P (Z

- 1,20)

A(1,20) 0,8849 ,

lembrando que Z ~ N(0, 1).

Exemplo 3:
Sabe-se que o faturamento dirio de um posto de gasolina segue uma certa distribuio de mdia R$ 20 mil e desvio padro de R$ 2 mil. Qual a probabilidade, em um perodo de 60 dias, do faturamento total ultrapassar R$ 1230 mil? Seja X o faturamento dirio de um posto de gasolina, em mil reais. Sabemos que = E(X) = 20 2 = Var(X) = 4

Obtemos uma amostra aleatria de 60 valores de X, denotada por X1, X2, , X60, sendo Xi o faturamento do posto no dia i, i = 1, 2, , 60.
Ento, P(X 1 X2 X 60 1230)
P X1 X2 60 X 60 1230 60

P (X

20,5)

P Z

20,5 - 20 4 60

P Z

1,94

0,026.

Exemplo 4: Considere que a distribuio dos nveis


sricos de colesterol para todos os homens de 20 a 74 anos normal com mdia = 211 mg/100ml e o desvio padro = 46 mg/100ml. Selecionamos amostras de tamanho 25 da populao. Que proporo de amostras ter um valor mdio maior do que 230 mg/100ml?
P( X 230 ) ?

A distribuio da mdia amostral (n =25) normal com mdia = 211 mg/100ml e erro padro / n = 46/5 = 9,2mg/100ml.

230 211 ) P( 2,07) 0,019. 9,2 Somente 1,9% das amostras tero uma mdia maior do que 230 mg/100ml. Equivalentemente, se selecionamos uma amostra de tamanho 25 da populao de homens de 20 a 74 anos, a probabilidade de que o nvel srico mdio de colesterol para essa amostra seja maior do que 230 mg/100ml de 0,019. P( 230 ) P(

Que valor mdio de nvel srico de colesterol limita os 10% valores mais baixos da distrib. amostral?
P( X x x) 0,1 - 1,28 P( Z x x 211 ) 0,1. 9,2 211 - 1,28 9,2 199,2.

211 9,2

10% das amostras de tamanho 25 tm mdias que so menores ou iguais a 199,2 mg/100ml.

Calcular os limites superior e inferior que incluem 95% das mdias das amostras de tamanho 25.

P(

x X x) 0,95 P( 211 x 211 Z 211 x 211 ) 0,95 9,2 9,2 x ) 0,95 P( x Z 9,2 9,2 x 1,96 x 1,96 9,2 18,03. 9,2

Limites: 211-18 = 193,0 e 211+18 = 229,0 95% das mdias das a.a. de tamanho 25 esto entre 193,0 mg/100ml e 229,0 mg/100ml. se selecionamos uma a.a. de tamanho 25 e a amostra tem uma mdia maior que 229,0 ou menor que 193,0 mg/100ml ento, ou a a.a. foi extrada de uma populao diferente ou um evento raro se realizou.

Suponha que selecionamos amostras de tamanho 10 da populao. Nesse caso, o erro padro de X

/ n = 46/ 10 = 14,5 mg/100ml.


P( x X x 1,96 14,5 x) x 0,95 28,5.

1,96 14,5

Limites: 211-28,5=182,5 e 211+28,5=239,5 95% das mdias das a.a. de tamanho 10 esto entre 182,5 mg/100ml e 239,5 mg/100ml.

n 1 10 25 50 100

/ n 46,0 14,5 9,2 6,5 4,6

Intervalo contendo 95% das mdias

Comprimento do intervalo

120,8
182,5

X
X

301,2
239,5

180,4 57,0 36,0 25,6 18,0

193,0 198,2
102,0

X X
X

229,0 223,8
220,0

Conforme o tamanho das amostras aumenta, a variabilidade entre as mdias da amostra (erro padro) diminui os limites englobando 95% dessas mdias se aproximam.
comprimento do intervalo = limite superior - limite inferior.

Os intervalos que construmos foram simtricos ao redor da mdia da populao de 211 mg/100ml. Existem outros intervalos que contm a proporo apropriada de mdias da amostra. Suponha que desejamos construir um intervalo que contenha 95% das mdias das amostras de tamanho 25.
P ( x1 X x 2 ) 0,95, mas com 1% da rea acima de x2 e 4% abaixo de x1.

x1

211 - 1,75 9,2 x 2 211 2,32 9,2

x1 x2

211 - 1,75 9,2 194,9. 211 1,75 9,2 232,9.

Podemos dizer que aproximadamente 95% das mdias das amostras de tamanho 25 se encontram entre 194,9 mg/100ml e 232,3 mg/100ml. Em geral, prefervel construir um intervalo simtrico. intervalo assimtrico intervalo simtrico comprimento = 232,3 - 194,9 = 37,4 mg/100ml; comprimento = 229,0 - 193,0 = 36,0 mg/100ml.

Qual deve ser o tamanho das amostras para que 95% de suas mdias se encontrem a 5 mg/100ml da mdia da populao? Para responder isso, no necessrio conhecer o valor do parmetro . Precisamos encontrar o tamanho da amostra n para o qual P( 5 X 5) 0,95
P( 5 46 5 46 n n Z 5 46 n n ) 0,95 n 325,2.

1,96

1,96 46 5

Amostras de tamanho 326 seriam exigidas para que 95% das mdias das amostra se encontrem a 5 mg/100ml da mdia da populao. Ou, se selecionamos uma amostra de tamanho 326 da populao e calculamos sua mdia, a probabilidade de que a mdia da amostra esteja a 5 mg/100ml da verdadeira mdia da populao 0,95.

This document was created with Win2PDF available at http://www.daneprairie.com. The unregistered version of Win2PDF is for evaluation or non-commercial use only.