Você está na página 1de 46

Inferncia Estatstica

Distribuies Amostrais

 Introduo e conceitos fundamentais


 Distribuies amostrais
 Teorema central do limite
 Propriedades dos estimadores

Prof Lisiane Selau 1


Diviso da Estatstica

 Descritiva
 Inferncia

Prof Lisiane Selau 2


Inferncia Estatstica
Idia fundamental

Dar informao sobre o todo com


base no conhecimento da parte

No preciso beber toda a garrafa


para saber se o vinho bom.

Prof Lisiane Selau 3


 Pesquisas so feitas com amostras, mas o pesquisador quer
estender os resultados que obteve para toda a populao.
populao
amostra
Pesquisador
quer fazer
inferncia
pesquisas
interesse

Inferncia estatstica
Conceito: o conjunto de procedimentos estatsticos que
tm por finalidade generalizar concluses de uma amostra
para uma populao.
Prof Lisiane Selau 4
Exemplo: Pesquisas eleitorais no Rio Grande do Sul

Generalizao= Inferncia Erro provvel

Candidato A - 25%
Resultados Candidato B 18%
 Candidato C 12%


 
   
Amostragem 
 (deve garantir a
 representatividade) Amostra
(de 1000 a 2000
Populao entrevistados)
(8 milhes de
eleitores)

Prof Lisiane Selau 5


Conceitos fundamentais
Populao o conjunto de todos os indivduos ou elementos que
atendem a determinadas caractersticas definidoras. Estas
caractersticas dependem do objetivo do estudo.
Pesquisa eleitoral no Rio Grande do Sul
Objetivo: Conhecer a preferncia eleitoral no estado
Populao: Todos eleitores votantes no RS

Amostra um subconjunto da populao retirado com o objetivo


de represent-la.
Pesquisa eleitoral no Rio Grande do Sul
Amostra: Conjunto de 1.000 a 2.000 eleitores votantes
no RS que sero entrevistados pelos pesquisadores

Amostragem o mtodo de seleo que empregamos para


obteno de amostras.
Prof Lisiane Selau 6
Por que fazer amostragem?
 populao infinita
 diminuir custo
 aumentar velocidade na caracterizao (medidas que variam no
tempo)
 minimizar perdas por medidas destrutivas

Quanto amostrar? depende:


 da variabilidade original dos dados (maior varincia maior n)
 da preciso requerida na estimao (maior preciso maior n)
 do tempo disponvel (menor o tempo menor n)
 do custo da amostragem (maior o custo menor n)

Prof Lisiane Selau 7


 Riscos da amostragem: o processo de
amostragem envolve riscos, pois toma-se
decises sobre toda a populao com base
em apenas uma parte dela.

 A teoria da probabilidade pode ser utilizada


para fornecer uma idia do risco envolvido,
ou seja, do erro que se comete ao utilizar
uma amostra ao invs de toda a populao.

Prof Lisiane Selau 8


Exemplo

N = tamanho
n = tamanho
da populao
da amostra (1, 1)
4 1 4 (1, 2) A amostra
6 3 uma varivel
2 1 [X1, X2] (1, 3)
5 4 ... aleatria
3 n=2
(6, 6)
N=10 com reposio

[X1, X2] X S2
(1, 1) x1 = 1 s12 = 0
(1, 2) x2 = 1,5 s22 = 0,5
(1, 3) x3 = 2 s32 = 2
... ... ...
(6, 6) xk = 6 sk2 = 0
Prof Lisiane Selau 9
Como a amostra uma varivel aleatria, qualquer funo da amostra
(soma, mdia, varincia) tambm ser uma varivel aleatria.

Amostra: [X1, X2, ..., Xn] Varivel aleatria

Estatsticas
X S2 Variveis aleatrias
x1 s12
x2 2 Se temos k amostras
s2
de mesmo tamanho n,
... ...
temos k mdias e
xk s2
k varincias

Estatstica qualquer valor obtido em funo da amostra.


 Como as estatsticas so variveis aleatrias, tambm tero
alguma distribuio de probabilidade com mdia, varincia, etc.

Distribuio amostral a distribuio de probabilidade de


uma estatstica.
Prof Lisiane Selau 10
Exerccio:
Formem 4 grupos de tamanhos crescentes...

Grupo 1: 1 dado Grupo 2: 2 dados


Grupo 3: 3 dados Grupo 4: 4 dados

Respondam:
Joguem algumas vezes os dados e calculem a mdia dos
valores obtidos. Algum valor mais provvel?
Quais os possveis valores para as mdias entre os valores
dos dados?
Quais as probabilidades para cada valor de mdia possvel?

Prof Lisiane Selau 11


Exemplo:
O mecnico de uma oficina de regulagem para carros 1.0, 1.4, 2.0,
cobra pelo servio 40, 45 e 50 reais, respectivamente. Seja a varivel
X = valor cobrado pelo mecnico, com a seguinte distribuio de
probabilidade:

X=x 40 45 50
P(X = x) 0,2 0,3 0,5 1

a) Determine a mdia e a varincia da populao.

E(X) = = x p(x) = 40 0,2 + 45 0,3 + 50 0,5 = 46,5


xS X

V(X) = 2 = E(X 2 ) 2
= (40 2 0,2 + 45 2 0,3 + 50 2 0,5) 46,5 2 = 15,25
Prof Lisiane Selau 12
Exemplo:
O mecnico de uma oficina de regulagem para carros 1.0, 1.4, 2.0,
cobra pelo servio 40, 45 e 50 reais, respectivamente. Seja a varivel
X = valor cobrado pelo mecnico, com a seguinte distribuio de
probabilidade:

X=x 40 45 50
P(X = x) 0,2 0,3 0,5 1

b) Suponha a retirada de uma amostra de tamanho n = 2, com


reposio.
Quantas e quais so as possveis amostras retiradas da populao e
qual a probabilidade associada a cada uma?
Determine a mdia e a varincia da distribuio amostral da mdia.

Prof Lisiane Selau 13


X=x 40 45 50
P(X = x) 0,2 0,3 0,5 1

n = 2 [X1, X2] k = Nn = 32 = 9 quantas


onde:
k = nmero de amostras possveis
N = tamanho da populao
n = tamanho da amostra
Amostra [X1, X2] P [X1 , X2] X
1 (40, 40) 0,2 . 0,2 = 0,04 40
2 (40, 45) 0,2 . 0,3 = 0,06 42,5
3 (40, 50) 0,2 . 0,5 = 0,10 45
4 (45, 40) 0,06 42,5
quais 5 (45, 45) 0,09 45
6 (45, 50) 0,15 47,5
7 (50, 40) 0,10 45
8 (50, 45) 0,15 47,5
9 (50, 50) 0,25 50
Prof Lisiane Selau 14
Distribuio amostral da mdia das amostras de tamanho 2

40 42,5 45 47,5 50
X=x
P( X 0,04 0,12 0,29 0,3 0,25 1
=x)

E(X) = X = x p(x)
xS X

= 40 0,04 + 42,5 0,12 + 45 0,29 + 47,5 0,3 + 50 0,25


= 46,5 = (mdia da populao)

V(X) = 2X = E(X 2 ) 2X
= (40 2 0,04 + 42,5 2 0,12 + K + 50 2 0,25) 46,5 2
= 7,625 = metade de 2 (varincia da populao)

Prof Lisiane Selau 15


Exemplo:
O mecnico de uma oficina de regulagem para carros 1.0, 1.4, 2.0,
cobra pelo servio 40, 45 e 50 reais, respectivamente. Seja a varivel
X = valor cobrado pelo mecnico, com a seguinte distribuio de
probabilidade:

X=x 40 45 50
P(X = x) 0,2 0,3 0,5 1

c) Suponha a retirada de uma amostra de tamanho n = 3, com


reposio.
Quantas e quais so as possveis amostras retiradas da populao e
qual a probabilidade associada a cada uma?
Determine a mdia e a varincia da distribuio amostral da mdia.

Prof Lisiane Selau 16


Quantas?

n = 3 [X1, X2 , X3] k = Nn = 33 = 27

Quais?
Amostra [X1, X2, X3] P[X1, X2, X3] Amostra [X1, X2, X3] P[X1, X2, X3]
X X
1 (40, 40, 40) 0,008 40 15 (45, 45, 50) 0,045 46,7
2 (40, 40, 45) 0,012 41,7 16 (45, 50, 40) 0,030 45
3 (40, 40, 50) 0,020 43,3 17 (45, 50, 45) 0,045 46,7
4 (40, 45, 40) 0,012 41,7 18 (45, 50, 50) 0,075 48,3
5 (40, 45, 45) 0,018 43,3 19 (50, 40, 40) 0,020 43,3
6 (40, 45, 50) 0,030 45 20 (50, 40, 45) 0,030 45
7 (40, 50, 40) 0,020 43,3 21 (50, 40, 50) 0,050 46,7
8 (40, 50, 45) 0,030 45 22 (50, 45, 40) 0,030 45
9 (40, 50, 50) 0,050 46,7 23 (50, 45, 45) 0,045 46,7
10 (45, 40, 40) 0,012 41,7 24 (50, 45, 50) 0,075 48,3
11 (45, 40, 45) 0,018 43,3 25 (50, 50, 40) 0,050 46,7
12 (45, 40, 50) 0,030 45 26 (50, 50, 45) 0,075 48,3
13 (45, 45, 40) 0,018 43,3 27 (50, 50, 50) 0,125 50
14 (45, 45, 45) 0,027 45

Prof Lisiane Selau 17


Distribuio amostral da mdia das amostras de tamanho 3

40 41,7 43,3 45 46,7 48,3 50


X=x
P( X =x) 0,008 0,036 0,114 0,207 0,285 0,225 0,125 1

E(X) = X = x p(x)
xSX

= 40 0, 008 + 41, 7 0, 036 + K


... + 50 0, 125

= 46, 5 = (mdia da populao)

V(X) = 2X = E(X 2 ) X2
= (402 0, 008 + 41, 72 0, 036 + K
... + 502 0, 125) 46, 52

= 5, 083 = um tero de 2 (varincia da populao)

Prof Lisiane Selau 18


Populao
E(X) = = 46,5

V(X) = 2 = 15,25
E(X) =
Amostras de tamanho n = 2

E(X) = X = 46,5 = 2
V(X) =
n
V(X) = 2X = 7,625 = 2/2

Amostras de tamanho n = 3 2
X = V(X) = =
n n
E(X) = X = 46,5 =
Erro padro
2
V(X) = = 5,083
X
= 2/3 da mdia

Prof Lisiane Selau 19


Distribuio de probabilidade da populao

X=x 40 45 50
P(X = x) 0,2 0,3 0,5 1

Distribuio amostral da mdia das amostras de tamanho 2


40 42,5 45 47,5 50
X=x
P( X 0,04 0,12 0,29 0,3 0,25 1
=x)

Distribuio amostral da mdia das amostras de tamanho 3


40 41,7 43,3 45 46,7 48,3 50
X=x
P( X 0,008 0,036 0,114 0,207 0,285 0,225 0,125 1
=x)
Prof Lisiane Selau 20
Distribuio da Distribuio da mdia das Distribuio da mdia das
populao amostras de tamanho 2 amostras de tamanho 3

Comparando o histograma da populao X com os histogramas da


mdia para as amostras de tamanhos 2 e 3, observamos que,
mesmo a distribuio da populao no sendo simtrica, a
distribuio amostral da mdia tende para a simetria medida que
o tamanho da amostra aumenta.
Prof Lisiane Selau 21
Prof Lisiane Selau 22
Qual a distribuio da mdia?
 Se a populao (X) de onde foi extrada a amostra aleatria
no tiver distribuio normal, ento a distribuio amostral da
mdia se aproximar da normal medida que o tamanho da
amostra (n) cresce (Teorema Central do Limite).

 Se a populao (X) de onde foi extrada a amostra aleatria


tiver distribuio normal, ento a distribuio amostral da
mdia ser normal.
As mdias so
se X ~ N (, ),
2
iguais, mas a
varincia de X n
ento, X ~ N (, 2/n) vezes menor.

Prof Lisiane Selau 23


Exerccio proposto: Sabe-se a varivel X (peso do queijo ralado
contido em pacotinhos de 100g vendidos em supermercados) tem
distribuio normal de mdia 100 e desvio padro 10.

(a) Qual a probabilidade de encontrar um pacote de queijo ralado


com peso entre 95g e 105g?

(b) Se 16 pacotes so escolhidos ao acaso em um supermercado,


qual a probabilidade do peso mdio estar entre 95g e 105g?

Soluo:

(a) Como X uma N(100, 102) vem:

P(95 < X < 105)= P(-0,5 < Z < 0,5) = 2 . 0,1915 = 38,30%

(b) Neste caso uma N(100; 2,52), ento:

P(95 < X < 105)= P(-2,0 < Z < 2,0) = 2 . 0,4772 = 95,44%

Prof Lisiane Selau 24


Exerccio proposto: A renda de um conjunto de pessoas de
uma certa regio tem mdia 6 s.m. e desvio padro de 2 s.m.
Se desta populao for extrada uma amostra de n = 100
pessoas, qual a probabilidade de a mdia desta amostra acuse
um valor superior a 6,3 s.m?

Soluo:

Neste caso, como no foi declarado que a populao normal


necessrio aplicar o teorema central do limite, uma vez que n
= 100 > 30, isto possvel. A mdia da amostra ter uma
distribuio aproximadamente normal com mdia 6 s.m. e
desvio padro de: 2 / 10 = 0,20.

P( X > 6,30) = P(Z > (6,30 - 6)/0,20 ) = P (Z > 1,5) = 6,68%

Prof Lisiane Selau 25


Teorema Central do Limite (exemplo)

 Como estimar a probabilidade de obter cara ao lanar uma


moeda?

 Seja a probabilidade de sair cara ao lanar a moeda

 Supondo a moeda honesta, uma estimativa adequada seria

 Conde de Buffon (1707-1788) em 4040 lanamentos da


moeda encontrou 2048 caras, logo a estimativa foi 0,5069

 Karl Pearson (1857-1937) em 24.000 lanamentos encontrou


12.012 caras, logo a estimativa foi 0,5005

Prof Lisiane Selau 26


Simulao para estimar a probabilidade de cara com uma
amostra de tamanho 30

1,0

0,9 p1 p2 p3 p4 p5

0,8

0,7
Estimativa de

0,6

0,5

0,4

0,3

0,2

0,1

0,0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
tam anho da am ostra (n)

Prof Lisiane Selau 27


Simulao para estimar a probabilidade de cara com
uma amostra de tamanho 100

1,0

0,9

0,8
p1 p2 p3 p4 p5
0,7
Estimativa de

0,6

0,5

0,4

0,3

0,2

0,1

0,0
0 10 20 30 40 50 60 70 80 90 100
Tamanho da amostra (n)

Prof Lisiane Selau 28


Simulao para estimar a probabilidade de cara
com uma amostra de tamanho 500
1,0

0,9 p1 p2 p3 p4 p5

0,8

0,7
Estimativa de

0,6

0,5

0,4

0,3

0,2

0,1

0,0
0 50 100 150 200 250 300 350 400 450 500
Tamanho da amostra (n)

Prof Lisiane Selau 29


Estimao de parmetros
Parmetros
Constantes Estimadores
2 Variveis
S2
X aleatrias
P

Amostra Varivel aleatria

Populao

 O estimador uma varivel aleatria; portanto, pode assumir


diferentes valores
Estimativa um valor particular que o estimador assume
Prof Lisiane Selau 30
Podem existir vrios estimadores para um mesmo parmetro.
Exemplos:

X=
X i

Xp =
Xp i i
estimadores de
p i

Xi

S2 =
i
(X X) 2

n 1
estimadores de 2

Sn2 =
i
(X X) 2

n
Prof Lisiane Selau 31
Propriedades dos estimadores
 Imparcialidade ou no tendenciosidade
Um estimador um estimador imparcial do parmetro
se o valor esperado de for igual a .

E( ) =
Exemplos:
X um estimador imparcial de , pois de E( X) =
X p um estimador imparcial de , pois de E( X p) =
X i um estimador imparcial de , pois de E( X i ) =
S2 um estimador imparcial de 2, pois de E(S2) = 2
Sn2 no um estimador imparcial 2, pois de E(Sn2 ) = n 1 2
n
Prof Lisiane Selau 32
Distribuio de probabilidade da populao

X=x 40 45 50 E(X) = = 46,5



P(X = x) 0,2 0,3 0,5 1 V(X) = 2 = 15,25

n = 2 [X1, X2]

Amostra [X 1, X2] P [X1, X2] X S2 S2n


1 (40, 40) 0,2 . 0,2 = 0,04 40 0 0
2 (40, 45) 0,2 0,3 = 0,06 42,5 12,5 6,25
3 (40, 50) 0,2 0,5 = 0,10 45 50 25
4 (45, 40) 0,3 0,2 = 0,06 42,5 12,5 6,25
5 (45, 45) 0,3 0,3 = 0,09 45 0 0
6 (45, 50) 0,3 0,5 = 0,15 47,5 12,5 6,25
7 (50, 40) 0,5 0,2 = 0,10 45 50 25
8 (50, 45) 0,5 0,3 = 0,15 47,5 12,5 6,25
9 (50, 50) 0,5 0,5 = 0,25 50 0 0

Prof Lisiane Selau 33


2
Distribuio amostral de S das amostras de tamanho 2

E(S2 ) = S2 = s2p(s2 ) = 0 0,38 + 12,5 0, 42 + 50 0,2 =15,25

E(S2 ) = 2 = 15,25

2
Distribuio amostral de Sn das amostras de tamanho 2

E(Sn2 ) = S2 = sn2p(sn2 ) = 0 0,38 + 6,25 0, 42 + 25 0,2 = 7, 625


n

2 n 1 2
E( n ) =
S
n
Prof Lisiane Selau 34
Propriedades dos estimadores
 Imparcialidade ou no tendenciosidade
Um estimador um estimador imparcial do parmetro
se o valor esperado de for igual a .

E( ) =
Exemplos:
X um estimador imparcial de , pois de E( X) =
X p um estimador imparcial de , pois de E( X p) =
X 1 um estimador imparcial de , pois de E( X ) =
1

S2 um estimador imparcial de 2, pois de E(S2) = 2


Sn2 no um estimador imparcial 2, pois de E( Sn2 ) = n 12
n
Prof Lisiane Selau 35
 Eficincia ou varincia mnima
Se dois ou mais estimadores de um mesmo parmetro so
imparciais, mais eficiente aquele que possui a menor
varincia.
Exemplo:
Dentre todos os estimadores imparciais de ( X , X p e Xi ), a
mdia simples ( X ) o mais eficiente porque tem a menor
varincia.
Demonstrao:
Consideremos uma amostra aleatria de tamanho trs
(n = 3) [X1, X2 , X3]

Mdia simples: X =
X i
X=
X1 + X2 + X3 1
= (X1 + X 2 + X3 )
n 3 3

Mdia ponderada: Xp =
Xp i i
Xp = 1
1X + 2X 2 + 1X 3 1
= (X1 + 2X 2 + X3 )
p i Prof Lisiane Selau
4 4 36
Mdia simples Mdia ponderada
1 1
X = (X1 + X 2 + X3 ) Xp = (X1 + 2X 2 + X3 )
3 4
1 1
( )
V X = V (X1 + X 2 + X3 ) ( )
V Xp = V (X1 + 2X 2 + X3 )
3 4
1 1
( )
VX = [V (X1 + X2 + X3 )] ( )
V Xp =
16
[V(X1 ) + V(2X2 ) + V(X3 )]
9
1 1
( )
V X = [V (X1 ) + V (X 2 ) + V (X3 )] ( )
V Xp =
16
[V (X1 ) + 4V (X2 ) + V (X3 )]
9
1 1 2
( ) (
V X = 2 + 2 + 2 ) ( )
V Xp =
16
(
+ 4 2 + 2 )
9
Mais eficiente
3 2 6 2
( )
VX = = 0,33 2 ( )
V Xp =
16
= 0,38 2
9
( ) ( )
V X = 0,33 2 < V Xp = 0,38 2 < V (Xi ) = 2
Prof Lisiane Selau 37
 Consistncia

Um estimador consistente se medida que o tamanho da


amostra aumenta o valor do estimador se aproxima do
parmetro.

n
N

n 1 2
Exemplo: E( Sn2) =
n
Sn2 um estimador consistente de 2

Com base nessa propriedade, podemos concluir que:


Se a amostra for pequena, devemos utilizar S 2 para
estimar 2
2
Se a amostra for grande, podemos utilizar Sn2 ou S para
estimar 2
Prof Lisiane Selau 38
Propriedades dos estimadores (RESUMO)
 Imparcialidade ou no tendenciosidade

No
Tendencioso

 Eficincia ou varincia mnima

Mais Os dois
Eficiente estimadores so
no tendenciosos!

 Consistncia nN
Tendencioso
Sn2 =
i
(X X) 2

S2 =
i
(X X) 2
os dois estimadores
tendem a dar valores
Sub-estimativas n n 1 prximos

Prof Lisiane Selau 39


Imparcialidade Populao

Estimador imparcial
ou no tendencioso
ou no viesado

E( ) =

Estimadores
Estimador tendenciosos
Estimador
tendencioso ou viesados
tendencioso
subestimando E()
superestimando
o parmetro o parmetro
E( ) < E( ) >
Populao

E( ) E( )

Vis Vis 40
Prof Lisiane Selau
Eficincia ou varincia mnima

Estimador 1 Estimador 2

Menor
varincia

E( ) = E( ) =

Populao Populao
Estimador
mais eficiente Estimador Estimador
imparcial imparcial
Mdias das amostras
se concentram num
intervalo menor

E( ) = Prof Lisiane Selau E( ) = 41


Melhores estimadores

Melhor estimador X=
X i

imparcial e Xp =
Xp i i estimadores de
mais eficiente p i

Xi

Melhor estimador S2 =
i
(X X) 2

n 1
estimadores de 2
imparcial 2
S =
i
(X X) 2

n
n
Prof Lisiane Selau 42
Significado prtico das propriedades dos estimadores

Objetivo da pesquisa: conhecer o peso mdio de


bebs ao nascer

Varivel em estudo: X = peso de bebs ao nascer

A varivel X tem distribuio normal com mdia e varincia 2

Populao de pesos

Amostra todos os possveis


n=50 pesos de todos os
bebs

estimar conhecer
Prof Lisiane Selau 43
Para estimar mdia aritmtica simples da amostra: X=
X i

Cada amostra ter uma mdia diferente

Ao escolhermos a amostra para


estimar , passamos a ter apenas
uma de todas as possveis amostras
de tamanho 50 e, portanto, apenas
uma das possveis mdias.

Objetivo: garantir que esta


estimativa esteja o mais
prximo possvel de

Prof Lisiane Selau 44


X ~ N (, 2/50)
Como a distribuio das mdias
normal, muito mais provvel que
escolhamos uma amostra que tenha
uma mdia prxima de do que
distante dela.

E(X) =
x estimativa de

A imparcialidade garante que as mdias das amostras


flutuem em volta da mdia da populao.

A propriedade de eficincia garante que a variao dessa


flutuao das mdias das amostras seja a menor possvel.

Prof Lisiane Selau 45


Exerccio proposto: Mostre que a mdia simples mais
eficiente que a mdia ponderada
X1 + X2 (X1 + 3X2 )
X= Xp =
2 4
Mdia simples Mdia ponderada
1
X= (X1 + X 2 ) 1
(X1 + 3X 2 )
Xp =
2 4
1 1
V(X ) = V (X1 + X 2 ) ( )
V X p = V (X1 + 3X 2 )
2 4
1 1
V (X ) = [V(X1 + X 2 )] V (X p ) = [V(X1 ) + V(3X 2 )]
4 16
1
1
V(X ) = [V(X1 ) + V(X 2 )] V (X p ) = [V(X1 ) + 9V(X 2 )]
4 16
1
1
(
V (X ) = 2 + 2 ) V(X p ) = ( 2 + 9 2 )
4 16
Mais eficiente 10 2
V(X p ) =
2
2 = 0,625 2
V(X ) = = 0,5 2 16
4
V (X ) = 0,5 2 < V(X p ) = 0,625 2 < V(X1 ) = 2
Prof Lisiane Selau 46

Você também pode gostar