Você está na página 1de 25

Inferncia

Estatstica
Estimao Intervalar
Mdia e Proporo

Estimao Pontual

x Estimao Intervalar

Exemplo Inicial:
Um estudo pretende estimar o valor de
mdia familiar dos alunos da UFMG.

a renda

Em uma amostra de 40 alunos da universidade,


encontrou-se uma renda familiar mdia x =
1600
reais (estimativa pontual), com desvio-padro s=323
reais.
J sabemos que os valores de x variam de amostra para
amostra e se distribuem em torno do valor de .

Estimao Pontual

x Estimao Intervalar

Assim, divulgar somente um nico valor como estimativa


deixa de lado toda a
de (estimao pontual)
incerteza envolvida no processo de estimao de um
parmetro.
Para nos lembrar da incerteza envolvida no resultado
amostral, vamos associar um erro de estimao
estimativa pontual:

Estimativa
= Estimativa pontual Erro de estimao
Intervalar

Estimao Pontual

x Estimao Intervalar

Exemplo Inicial:
A estimativa pontual para a renda familiar mdia do aluno
da UFMG 1600 reais.
O erro de estimao foi calculado em 100 reais.
Assim, a estimativa intervalar para a renda familiar mdia
do aluno da UFMG de
[1600 100] = [1500 ; 1700] reais.

Nvel de Confiana de uma


Estimativa Intervalar
Toda estimativa intervalar tem associada a ela um nvel de
confiana, geralmente expresso em porcentagem.
Ex: nvel de confiana de 95%
Ento, falamos em Intervalo de Confiana.
Ex: o intervalo de 95% de confiana para a renda familiar
mdia do aluno da UFMG vai de R$1500,00 a R$1700,00.

Como calcular um Intervalo de Confiana ?


Intervalo de
= Estimativa pontual Erro de estimao
Confiana
O erro de estimao ocorre porque X uma varivel
aleatria.
Assim, para calcular o erro de estimao, vamos
precisar da distribuio de probabilidades de X .

Relembrando: Teorema Central do Limite

Seja uma amostra aleatria


varivel aleatria

x1 , x2 ,..., xn

, de uma

com mdia e desvio padro .

X
Z=
/ n

N (0,1)

Intervalo de 95% de confiana para a mdia populacional ()


Queremos encontrar um intervalo (L1, L2) tal que com probabilidade
95% a mdia da populao esteja dentro dele, isto

P[L1 < < L2] = 0,95

Utilizando o T.C.L . temos que P - 1,96


< X < + 1,96
= 0,95
n
n

Podemos escrever a expresso acima como

P X - 1,96
< < X + 1,96
= 0 ,95
n
n

O intervalo

X
1,96
,
X
+
1,96

n
n

chamado de intervalo de 95% de confiana para a mdia


populacional.
Exemplo: O peso mdio ao nascer de crianas nascidas de
mes de certo grupo etrio tem mdia desconhecida e desvio
padro conhecido igual a 0,5kg. Uma amostra de 30 crianas
desta populao foi observada encontrando-se uma mdia
amostral igual a 2,5 kg.
Obtenha um intervalo de 95% de confiana para o peso
mdio ao nascer dos filhos das mulheres deste grupo etrio.

X peso ao nascer
peso mdio ao nascer
= 0,5 Kg desvio padro do peso ao nascer

Dados da amostra : n = 30, x = 2,5


O intervalo de 95% de confiana para dado por

0,5
0,5

2,5
1,96
;
2
,
5
+
1,96
= [2,32;2,68]

30
30
Interpretao: Com 95% de confiana o peso mdio ao nascer
das crianas nascidas de mes do grupo etrio de interesse est
entre 2,32 kg e 2,68 kg.

Porque usamos o termo confiana ao invs de probabilidade?

P X - 1,96
< < X + 1,96
= 0,95
n
n

Na expresso acima, para e conhecidos, podemos


dizer que o intervalo aleatrio

X - 1,96 n < < X + 1,96 n

contm o valor da mdia populacional com probabilidade


igual a 0,95.

Num problema de estimao assumimos que o parmetro


de interesse desconhecido e queremos estim-lo a partir
da amostra
Quando substitumos, no intervalo abaixo, a varivel aleatria X
por seu valor observado no podemos mais interpret-lo em
termos de probabilidade, pois a varivel aleatria deixa de
existir.

< < X - 1,96


X - 1,96
n
n

Exemplo : [2,32 < < 2,67]

Como podemos entender o termo confiana?


Suponha que muitas amostras de mesmo tamanho n
sejam retiradas da populao de interesse e que a partir
de cada uma delas seja obtido um intervalo de 95% de
confiana para o parmetro de Interesse. Qual a
porcentagem esperada de intervalos que incluiro o
valor do parmetro?

102
100
98
94

96

Intervalo de confinaa

104

106

No grfico seguinte so apresentados 200 intervalos de


95% de confiana obtidos a partir de amostras de
tamanho 50 de uma populao Normal com mdia
=100 e desvio padro = 10.

50

100

150

200

amostra

Observe que alguns intervalos (com centro fora delimitado pelas retas
inferior e superior) no incluem a media populacional =100.
Esperaramos de 95% dos intervalos construdos o contivessem.

Outra maneira de interpretar o intervalo de confiana

< < X + 1,96


X - 1,96

n
n

X - < 1,96

X - chamado erro de estimao ou margem de erro


Exemplo: Com 95% de confiana o peso mdio ao nascer das
crianas filhas de mes do grupo etrio de interesse estimada
em 2,5 kg com margem de erro de no mximo 0,18 kg.

Intervalo de 100(1-)% de Confiana para

Coeficiente de confiana

Erro de estimao


)%
IC100(1
=
x

z
.

/2

estimativa
pontual de

variabilidade de

Percentil de ordem
1-/2 da N(0,1)

Para o exemplo, encontre o intervalo de 90% de


confiana para peso mdio ao nascer
100(1 - ) = 90

(1 - ) = 0,90

= 0,1

/2 = 0,05

Z0,05 = 1,64

0,5
0,5
;2,5 + 1,64
= [ 2,35;2,65]
2,5 - 1,64
30
30

A escolha de coeficiente de confiana cabe ao pesquisador.


Usualmente utiliza coeficiente de confiana de 95%.

Intervalo de 100(1-)% de Confiana para

Nvel de confiana

Erro de estimao


)%
IC100(1
=
x

z
.

/2

estimativa
pontual de

variabilidade de

Fator para reduo


da confiana

 Para obteno do intervalo de confiana para a mdia


populacional assumimos at agora que o desvio padro
populacional conhecido.
 Isto no acontece na pratica. Se no conhecemos a

mdia como podemos conhecer o desvio padro?


 O que fazer? Vamos estimar o desvio padro

populacional pelo desvio padro amostral S


n

S=

i =1

( xi x )
n 1

Para construirmos o intervalo de confiana para a


mdia populacional partimos do teorema central
do limite

Seja uma amostra aleatria


varivel aleatria

x1 , x2 ,..., xn

, de uma

com mdia e desvio padro .

X
Z=
/ n

N (0,1)

Qual a distribuio da varivel aleatria T, obtida quando substitumos por


S em Z ?

T=

X
S
n

1) Assim como Z, tem mdia zero.


2) Assim como Z, T simtrica em torno da mdia.
3) Diferentemente de Z, o desvio de T diferente de 1 (> 1) . Toda a
variao de Z resulta da variao da mdia amostral. Quando
substitumos por S, outra quantidade amostral, introduzimos uma
nova fonte de variao.
4) Quanto menor for o tamanho da amostra, maior deve ser a
variao introduzida em T como resultado da variao de S.
Quando n cresce, S aproximar-se de .
5) Temos ento uma distribuio diferente para tamanho de amostra.

Mas, qual a distribuio de T?


Resultado Importante:
Se X1, X2, . . . Xn uma amostra aleatria de uma
populao Normal com mdia e desvio padro , a
varivel

T=

X
tem distribuio t de Student com
s/ n

(n-1) graus de liberdade.


Obs: O termo graus de liberdade para identificar a distribuio, pois
para cada tamanho de amostra temos uma distribuio diferente.

Distribuio t-Student
Normal (0;1)

t-Student com 3
graus de liberdade

Distribuio t-Student
A distribuio t-Student foi proposta
por W. Gosset, que usava o
pseudnimo
de
Student,
para
trabalhar com pequenas amostras.
A distribuio t-Student tem o formato
parecido com a da distribuio Normal
Padro e tambm centrada no valor
zero.

William Gosset
(Student)

A distribuio t-Student depende de um nico parmetro,


chamado grau de liberdade (g.l.)

A distribuio t-Student aproxima-se da Normal Padro


medida que os graus de liberdade crescem.
g.l.=1
g.l.=10
g.l.=30
g.l.=4
g.l.=3
g.l.=8
g.l.=2
g.l.=5
g.l.=20
g.l.=6
g.l.=25
g.l.=15
g.l.=7
g.l.=9

Como calcular probabilidades com a


distribuio t-Student ?
Ao contrrio da tabela Normal, a tabela t-Student fornece
percentis.
A distribuio t-Student simtrica em torno do valor 0.
Assim, somente os percentis positivos so tabelados.

t g .l .;(1 )

= t g .l .;

t g .l .;

Tabela t
Distribuio T de Student
Graus de
liberdade
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

= P(T > t )

.25

.20

.15

.10

.05

.025

.02

.01

.005

1.000
.816
.765
.741
.727
.718
.711
.706
.703
.700
.697
.695
.694
.692
.691
.690
.689

1.376
1.061
.978
.941
.920
.906
.896
.889
.883
.879
.876
.873
.870
.868
.866
.865
.863

1.963
1.386
1.250
1.190
1.156
1.134
1.119
1.108
1.100
1.093
1.088
1.083
1.079
1.076
1.074
1.071
1.069

3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333

6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740

12.71
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110

15.89
4.849
3.482
2.999
2.757
2.612
2.517
2.449
2.398
2.359
2.328
2.303
2.282
2.264
2.249
2.235
2.224

31.82
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.567

63.66
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898

Distribuio T de Student
Graus de
liberdade
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
80
100
inf.

= P(T > t )

.25

.20

.15

.10

.05

.025

.02

.01

.005

.688
.688
.687
.663.
.686
.685
.685
.684
.684
.684
.683
.683
.683
.681
.679
.679
.678
.677
.674

.862
.861
.860
.859
.858
.858
.857
.856
.856
.855
.855
.854
.854
.851
.849
.848
.846
.845
.841

1.067
1.066
1.064
1.063
1.061
1.060
1.059
1.058
1.058
1.057
1.056
1.055
1.055
1.050
1.047
1.045
1.043
1.042
1.036

1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.303
1.295
1.296
1.292
1.290
1.282

1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
1.684
1.676
1.671
1.664
1.660
1.64

2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.021
2.009
2.000
1.990
1.984
1.960

2.214
2.205
2.197
2.189
2.183
2.177
2.172
2.167
2.162
2.15
2.154
2.150
2.147
2.123
2.109
2.099
2.088
2.081
2.054

2.552
2.539
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.423
2.403
2.390
2.374
2.364
2.326

2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.704
2.678
2.660
2.639
2.626
2.576

Para compreender melhor .


Encontre os seguintes percentis da distribuio t-Student

t19;0.05 =

0.05

t10;0.025 =

t19
1.729

t7;0.005 =
t19;0.95 =

0.95

-1.729

Agora,que j conhecemos a distribuio vamos


utiliz-la na obteno de intervalos de confiana
para a mdia populacional

t19

Intervalo de 100(1-)% de Confiana para


Erro de estimao

IC100(1 )% = x t( n 1); / 2 .

estimativa
pontual de

/ 2;( n 1) o percentil de ordem 1 - /2 da


distribuio
t-Student com (n-1) graus de
liberdade, isto que deixa uma rea de /2
acima dele

t( n 1)
/2

t / 2;( n 1)

Exemplo: estimao da idade mdia ao falar


Em um experimento com uma amostra de n=20
crianas, a idade mdia ao falar foi de x = 10 meses
com desvio-padro de s =1.5 meses.

s
1.5

IC100(1 )% = x t( n 1; / 2) .
=
10

t
(19; / 2) .

n
20

100(1 )%
= [10
.0.335]

IC100(1 )% = [10 t(19; / 2) 0.335]

Exemplo: estimao da idade mdia ao falar


Em um experimento com uma amostra de n=20
crianas, a idade mdia ao falar foi de = x10 meses com
desvio-padro de s =1,5 meses.

IC100(1 )% = [10 t(19; / 2) 0.335]


Intervalo de 90% de confiana: 100(1-)%=90%
1- = 0.90 = 0.10 /2 = 0.05 t(19;0,05) = 1.729

IC90% = [10 1.729 0.335] = [10 0, 6 ] = [10 0.6;10 + 0.6]


[
IC 90% = [9.4;10.6 ]
IC = [9.4 ; 10.6 ]

Interpretando o intervalo de confiana


A idade mdia ao falar para esta populao de crianas
est entre 9.4 e 10.6 meses, com 90% de confiana.

Quando a amostra pode ser considerada


grande (n > 30) .
os percentis da distribuio t-Student podem ser
substitudos pelos percentis calculados na Tabela
Normal-Padro (tabela Z).

Percentis da Distribuio Normal Padro

Intervalo de 100(1-)% de Confiana para


quando n > 30
Erro de estimao

IC100(1 )% = x z / 2 .

estimativa
pontual de

estimativa da
variabilidade de

Fator para reduo


da confiana

z / 2 o percentil da distribuio Normalpadro que deixa uma rea de /2 acima dele

/2

z / 2

Intervalo de Confiana para a Proporo

)%
IC100(1
p

p (1 p )
= p z / 2 .

Proporo
amostral

Vlido somente quando n > 30 (amostras grandes)

Exemplo: estimao da proporo de


pessoas curadas com um novo tratamento
Deseja-se saber a eficcia de um novo tratamento
contra micose em adultos. Ou seja, deseja-se estimar:
P = proporo de pessoas que seriam curadas
com o novo tratamento
Uma amostra de 50 pessoas doentes foi tratada
segundo o novo tratamento e 45 deles foram curadas.

Estimativa Pontual: a proporo amostral

p = 45 / 50 = 0.90

Exemplo: estimao da proporo de


pessoas curadas com um novo tratamento
Estimativa Intervalar

p (1 p )
)%
IC100(1
= p z /2 .
p

0.9(0.1)
= 0.9 z /2 .

50

= [ 0.9 z /2 0.04]

Exemplo: estimao da proporo de


pessoas curadas com um novo tratamento
Intervalo de 90% de confiana: 100(1-)%=90%
1- = 0.90 = 0.10 /2 = 0.05 z/2 = z0,05 =1.64

IC 90%
= [ 0.9 1.64 0.04] = [ 0.9 0.07 ] = [ 0.9 0.07;0.9 + 0.07]
p
90%
IC p = [ 0.83 ; 0.97]
Assim, com base nesta amostra, estimamos que a
proporo de cura com o novo tratamento est entre
83% e 97%, com 90% de confiana.

Como aumentar a preciso da estimativa do


parmetro de interesse,isto , como reduzir o erro
amostral?
Aumentando o tamanho da amostra
Clculo do tamanho de amostra para estimao da mdia
populacional
Qual o menor tamanho de amostra necessrio para
estimarmos com 100(1-)% de confiana a mdia
populacional com erro de estimao de no mximo E?

O valor de n pode ser extrado da expresso para o


erro de estimao
Para o caso da mdia populacional , temos

erro de estimao = z / 2 .

n = z / 2 .

erro de estimao

Exemplo: idade mdia ao falar


Qual o tamanho mnimo de amostra para se estimar
a idade mdia ao falar, em um intervalo de 95% de
confiana, com um erro de estimao mximo de 1
ms? Suponha que o desvio-padro seja de = 2
meses.

2.0

n = z(0.05/ 2)

1.0

2.0

n = 1.96
= 15.37
1.0

Ou seja, devem ser amostradas, no mnimo, 16 crianas.

Alternativa
Se no tivermos como saber nem aproximar o valor

de , podemos trabalhar com o valor da razo


.
erro

n = z / 2 .

erro

Exemplo anterior: Qual o tamanho mnimo de amostra


para se estimar a idade mdia ao falar, em um intervalo de
95% de confiana, de modo que o erro de estimao seja,
no mximo, 80% do desvio-padro populacional?
Ou seja,

erro 0.80 0.80 erro

erro

1.25

Clculo de tamanho de amostra para o


caso da estimao de uma proporo
p (1 p )
n

erro de estimao = z / 2 .

O erro de estimao depende do prprio


parmetro a ser estimado (!!!)
Como fazer ???
Vamos usar uma propriedade interessante
da expresso

p(1 p )

p(1 p )

0.5

Propriedade de

0.4

O valor de

p(1 p)

0.3

mximo
quando
p=0.50.

0.0

0.1

0.2

p (1 p)

0.0

0.2

0.4

0.6
p

0.8

1.0

Clculo de tamanho de amostra para o


caso da estimao de uma proporo
p (1 p )
n

erro de estimao = z / 2 .

O clculo de n feito considerando p=0.50.

n = /2
erro

p (1 p )

n = /2
erro

2
0.5

Exemplo: estimao da proporo de pessoas


curadas com um novo tratamento
Qual o tamanho mnimo de amostra para se estimar a
proporo de cura com novo tratamento, em um
intervalo de 95% de confiana, com um erro de
estimao mximo de 0.10?

n = /2
erro

2
0.5

1.96
n=

0.10

2
0.5

= 96.04

Ou seja, devem ser amostradas, no mnimo, 97 pessoas.


Se o erro mximo fosse de 0.05, seriam necessrias, no
mnimo, 385 pessoas.

Ateno !!
As expresses aqui apresentadas s so vlidas
para estudos em que:
1 - Todos os indivduos da populao tero a
mesma probabilidade de serem selecionados para a
amostra.
2 A populao pode ser considerada muito grande
em relao amostra (populaes infinitas).
Para casos mais complexos, devemos utilizar
tcnicas de Amostragem mais avanadas (Bussab e
Bolfarine, 2005) .

Para compreender melhor .


Exerccios de 9.1 a 9.5 da Seo 9