Você está na página 1de 42

AULA:

Inferncia Estatstica

Prof. Vctor Hugo Lachos Dvila

Inferncia Estatstica
Inferncia Estatstica um conjunto de tcnicas
que objetiva estudar uma populao atravs de
evidncias fornecidas por uma amostra.
Populao o conjunto de todos os elementos ou
resultados sob investigao. Amostra qualquer
subconjunto da populao.

Problemas da Inferncia
Exemplo: Qual a distribuio da altura dos brasileiros
adultos?. Parece razovel pensar num modelo Normal, a
questo agora identificar os parmetros ( e 2) para que
ela fique completamente especificada. Como fazer isso?
Medindo a altura de todos os Brasileiros adultos. Neste caso no
necessrio usar Inferncia Estatstica!

Escolher estrategicamente uma amostra (X1,X2,...,Xn) da populao de


adultos e atravs dessa amostra inferir sobre os parmetros ( e 2)
da populao.
Os resultados dependeram da qualidade da amostra. Esta tem que ser
representativa da populao.
Descrevemos aqui um dos problemas bsicos da Inferncia
estatstica: Estimao

Problemas da Inferncia
Exemplo: suponha agora que desejamos saber se a mdia
da altura dos brasileiros maior que a dos argentinos
(1,65m)?
Para tomarmos uma deciso, escolhemos estrategicamente uma amostra

(X1,X2,...,Xn) da populao de adultos e analisamos se > 1,65 com alta


probabilidade.

Descrevemos aqui um outro problema bsico da Inferncia estatstica:


Teste de Hipteses

Estimao

Teste de Hipteses

Qual

a probabilidade de
"cara"no lanamento de
uma moeda?

moeda honesta ou
desequilibrada?

Qual

a proporo de
votos que o candidato A tem
nas eleies?

candidato A vencer as
eleies ?

Qual

Pelo

a proporo de
motoristas
que tiveram
sua
carteira
apreendida
aps a vigncia da nova lei
de trnsito?

menos 2% dos
motoristas habilitados de
SP tiveram suas carteiras
apreendidas
aps
a
entrada da nova lei do
trnsito ou no?
5

Como Selecionar uma Amostra


Ex1: Anlise da quantidade de glbulos brancos na sangue de certo
indivduo. Uma gota do dedo seguramente ser representativa para a
anlise. Caso Ideal!
Ex2: Opinio sobre um projeto governamental. Se escolhemos uma
cidade favorecida o resultado certamente conter erro (vis).

Note que a maneira de se obter a amostra muito importante. A


Tecnologia da AMOSTRAGEM uma das especialidades dentro da
estatstica que fornece procedimentos adequados.
Aqui trataremos o caso mais simples e que serve de base para
procedimentos muito mais elaborados: Amostragem aleatria simples
(AAS)

AAS
Supomos que podemos listar todos os N elementos da populao
(populao finita).

Usando mtodos de gerao de nmeros aleatrios, sorteia-se um

elemento da populao, sendo que todos os elementos tem a mesma chance


de ser selecionados.
Repete-se o procedimento at que sejam sorteadas as n unidades da
amostra.
Temos AAS com reposio e sem reposio.
AAS com reposio implica que tenhamos independncia entre as
unidades selecionadas, facilitando o estudo das propriedades dos
estimadores. Logo, nestas notas:

AAS AAS com reposio


7

Algumas Definies
Definio: Uma amostra aleatria simples (a.a) de tamanho n de uma
v.a. X, o conjunto de n v.as independentes (X1,X2,...,Xn), cada uma
com a mesma distribuio de X.
Definio: As quantidades da populao, em geral desconhecidas,
sobre as quais temos interesse, so denominadas parmetros. , , 2

Definio: A combinao de elementos da amostra, construda com a


finalidade de
estimar um parmetro, chamado de estimador,
___
exemplo, X
Aos valores numricos
assumidos pelos estimadores
___
chamamos de estimativas exemplo, x

Definio: Chamamos de estatstica a qualquer funo T da amostra


aleatria, i.e.
T=T(X1,X2,...,Xn)
8

Exemplo: Estamos interessados na mdia () e varincia (2) das


alturas de jovens com idade entre 15 e 18 anos de certa cidade. Vamos
coletar uma amostra para tirar concluses. Suponha que escolhemos
ao acaso 10 jovens (AAS).
Possveis estimadores para (que por sua vez so estatsticas)
1 = t1 ( X 1 ,..., X 10 ) =

X + ... + X 10
( Min + Max)
; 2 = t 2 ( X 1 ,..., X 10 ) = X 1 ; 3 = t3 ( X 1 ,..., X 10 ) = 1
= X;
2
10

Possveis estimadores para 2

2
1

1 n
1 n
Max Min 2
2
2
2
2
2

= t 4 ( X 1 ,..., X 10 ) = ( X i X ) ; 2 = S =

=
(
X
X
)
;

(
)
3

i
n i =1
n 1 i =1
2

Agora temos a amostra observada: (em metros)

1,65;1.57;1,72;1,66;1,71;1,74;1,81;1,68;1,60;1,77. As estimativas seriam:

(1,57 + 1,81)
1,65 + ... + 1,77
= 1,69; 2 = 1,651 ; 3 =
= 1,69;
2
10
21 = 0,005; 2 2 = s 2 = 0,006; 2 3 = 0,014

1 =

Propriedades dos estimadores


Definio:
) Um estimador no viciado para um parmetro
se E ( ) =
Definio: Um estimador consistente, se, a medida que o
tamanho de amostra aumenta, seu valor esperado converge para o
parmetro de interesse e sua varincia converge para zero. i.e.

i ) lim E () =
n

ii ) lim Var () = 0
n

Observe que na definio de consistncia estamos supondo que o


estimador depende do tamanho de amostra n. Na definio de vcio o
resultado vale para qualquer que seja n.

10

Exemplo: Considere que uma certa caracterstica X, na populao tem


media e varincia 2. Uma amostra aleatria simples (a.a.) de
tamanho n, representado por (X1,...,Xn) obtida para estimar . Estude
as propriedades da media amostral.

Claro que E(X i ) = , Var(X i ) = 2 e que os X i so independentes, i = 1,...,n.


)
O estimador da media populacional , es da forma = X . Logo

X 1 + ... + X n
n
)=
=
n
n
X 1 + ... + X n
2
1 n
Var() = Var(X) = Var(
) = 2 Var ( X i ) =
n
n i =1
n
E() = E(X) = E(

Portanto, a mdia amostral um estimador no viciado para a mdia


populacional e como sua variancia tende a zero conforme n cresce,
conclumos tambm que um estimador consistente para .
Se o interesse estimar 2. Estude as propriedades de

21 e 2 2 = S 2
11

Exemplo: Considere uma a.a. (X1,...,Xn) de uma varivel X~N(10,16).


Como se comporta X em funo de n.
n=100
n=50
n=30
n=10

medida que n aumenta, a f.d.p. vai se concentrando ao redor da mdia


populacional 10. Quanto maior o tamanho de amostra maior probabilidade que
uma estimativa de X este prxima da mdia populacional.
12

Estimadores para a mdia, proporo e Varincia

Parmetro

Esimador

p
2
2

Propriedades
No viciado e consistente

X
No de casos favoraveis carateristica
p =
n
S2 =

1
( X 2 i nX 2 )
n 1
1
n

2 = ( X 2 i nX 2 )

No viciado e consistente
No viciado e consistente
Viciado e consistente

13

Teorema Limite Central (TLC)


Suponha que uma amostra aleatria simples (X1,...Xn) retirada de uma
populao com mdia e varincia 2 . Ento, temos que

X
N (0, 1),
/ n

quando n

Em palavras o TLC garante que para n grande a distribuio da mdia


amostral, devidamente padronizada, se comporta segundo um modelo
Normal padronizado (Z).
Em casos onde a verdadeira distribuio dos dados simtrica, boas
aproximaes so obtidas para n ao redor de 30.
Um estudo de simulao descreve graficamente o comportamento de

para diferentes situaes. X~U(0,1), X~Bin(10,0,3) e X~Exp(1)

14

Efeito do tamanho de amostra sobre a distribuio


de X

15

Exemplo: Numa certa cidade, a durao de conversas telefnicas em


minutos, segue um modelo Exponencial com parmetro 3. Observandose uma amostra aleatria de 50 dessas chamadas, qual ser a
probabilidade de em mdia, a durao de conversas telefnicas no
ultrapassarem 4 minutos.
Seja X : durao das chamadas, X ~ Exp(3) . Logo E(X) = 3 e Var(X) = 9

Admitindo que n grande o suficiente, podemos calcular a probabilidade


desejada da seguinte forma:

P ( X 4) = P (

X 3
43

) P ( Z 2,36) = 0,9909
9 / 50
9 / 50

16

O Caso da Proporo Amostral ( p )


Coletamos uma a.a. (X1,...Xn) de X~Bernoulli(p), com o objetivo de
estimar p. Definimos a proporo amostral (estimador de p) como sendo
a frao de indivduos com a caracterstica X , i.e.,

No de casos favoraveis carateristica


n
Note que podemos escrever
p =

X + X 2 + ... X n
P = 1
= X,
n
Assim, temos que
E ( X 1 ) + E ( X 2 ) + ... + E ( X n ) np
E ( P ) =
=
=p
n
n

Xi =

1, sucesso
0, fracaso

X + X 2 + ... + X n
np (1 p) p (1 p )
Var ( P ) = Var ( 1
)=
=
n
n2
n

Pelo TLC
X E( X )
=
Var ( X )

Xp
=
p (1 p ) / n

)
p p
N (0,1)
p (1 p ) / n
17

Exemplo: A proporo de peas fora de especificao num lote de 0,4.


Numa amostra de tamanho 30, calcule a probabilidade de que a
proporo de peas defeituosas seja menor do que 0,5.

Seja p : a proporo de peas defeituosas na amostra ( proporo amostral ).


Ento,
Como conseqncia do TLC, temos que
p - E( p )
=
Var( p )

p - p
N ( 0 ,1 ), quando
p(1 - p)/n

0,40(0,6)
), Assim,
30
p 0 , 4
0 ,5 0 , 4
P ( p < 0 , 5 ) = P (
<
0,40(0,6)
0,40(0,6)
30
30

p ~ N(0,40,

) P ( Z 1,12 ) = 0 ,8686

18

Estimao por Intervalos

Definio[Intervalo de Confiana] Seja X1,...,Xn uma amostra


aleatria de uma populao com a caracterstica X~f(x,). Seja
T1=G(X1,...,Xn) e T2=H(X1,...,Xn) duas estatsticas tais que T1< T2 e
que

P (T1 < < T2 ) = 1 .

O intervalo (T1, T2) chamado de intervalo de 100(1-)% de


confiana para .
Notao: IC(,1-)= (T1, T2), onde T1 e T2 so os limite inferior
superior respectivamente e 1- o coeficiente (ou nvel) de
confiana

19

Intervalo de confiana para uma mdia populacional


Suponha que X1,LXn uma amostra aleatria de tamanho n, de uma
populao normal com mdia (desconhecida) e varincia
2(conhecida). Vimos que a mdia amostral X , tem distribuio
normal com mdia e varincia 2/n. Isto
Z=

~ N (0,1)

Logo, fixando um nvel de confiana


z/2 de tal forma:.

P( z

Zz

(1-), pode-se determinar

) = 1

Ou que equivalente
X
P( z
z ) = 1
1
/ n 1 2
2

1-
-z1-/2

z1-/2
20

E
6
47
4
8

E
6
47
4
8

z X z
X +z

1
1
1
/ n
n
n
2
2
2

Logo, intervalo de 100 (1-)% de confiana para dado por:.

= (X E; X + E )
IC ( ,1 ) = X z
;X +z
1
1
n
n
2
2

Exemplo 1: Em uma industria de cerveja, a quantidade de cerveja


inserida em latas tem-se comportado como uma distribuio
normal com mdia 350 ml e desvio padro 3 ml. Aps alguns
problemas na linha de produo, suspeita-se que houve alterao
na mdia. Uma amostra de 20 latas acusou uma mdia 346 ml.
Obtenha um intervalo de 95% para a quantidade mdia de
cerveja inserida em latas, supondo que no tenha ocorrido
alterao na variabilidade.
21

J que 1-=0,95, temos da tabela normal padro z0,975=1,96.

0.95


; X + 1,96
IC ( , 0,95) = X 1,96

n
n

3
3
IC ( , 0,95) = 346 1,96
; 346 + 1,96
= (346 1,31;346 + 1,31)
20
20

= (344,69 ; 347,31)
22

Determinao do tamanho da amostra para estimao de


O erro mximo de estimao na estimao de dado por

E=z

z 21 / 2 2
n=
E2

No caso de populao finita de N elementos introduzida o fator


de correo de populao finita

E=z

N n
N 1

Nz 21 / 2 2
n= 2
E ( N 1) + z 21 / 2 2

23

Exemplo: Uma firma construtora deseja estimar a resistncia mdia


das barras de ao utilizadas na construo de casas. Qual o
tamanho amostral necessrio para garantir que haja um risco de
0,001 de ultrapassar um erro de 5 kg ou mais na estimao ? O
desvio padro da resistncia para este tipo de barra de 25 kg.
Do enunciado tem-se =25, =0,001, e E=5, z0,9995=3,29

E=z

=5

(3,29) 2 (25) 2
n=
= 270,6025 271
2
5

24

Intervalo de confiana para uma mdia populacional quando


desconhecido
A distribuio t-Student
Supondo que a caracterstica de interesse da populao
normal, a estatstica

T=

X
S
n

(1)

tem distribuio de probabilidade conhecida com distribuio t


de Student com n-1 graus de liberdade.

25

A funo de densidade de um v.a t-Student com k graus de


liberdade dado por:.
k + 1

f (t ) =
k
(k )1 / 2
2

t2
1 +
k

( k +1) / 2

; tR

26

Notao; T~t(k), indica que v.a tem distribuio t-Student com k


graus de liberdade.
Propriedades: se T~t(k)

k
(i ) E (T ) = 0; Var (T ) =
,k>2
k 2
(ii )k T ~ N (0,1)
Uso Da Tabela Distribuio t-Student

P(T t1 , k ) = 1

1-

t1-,k
27

Considerando a estatstica dada em (1), pode-se mostrar que um


intervalo de 100(1-)% de confiana para dado por:

S
S
= (X E; X + E )
IC ( ,1 ) = X t1 / 2, n 1
; X + t1 / 2, n 1
n
n

14
4244
3
14
4244
3

E
E

Exemplo 3: Deseja-se avaliar a dureza esperada do ao


produzido sob um novo processo de tmpera. Uma amostra de 10
corpos de prova de ao produziu os seguintes resultados, em HRc:
36,4 35,7 37,2 36,5 34,9 35,2 36,3 35,8 36,6 36,9
Construir um intervalo de confiana para , com nvel de
confiana de 95%.

28

(X i X )

10

1 10
X = X i = 36,5; S =
10 i =1

i =1

n 1

= 0,7352;

S
n

= 0,2325

J que, n=10 (1-)=0,95, =0,05, temos:

t0,975, 9=2,26

E = (2,26)(0,2325) = 0,53
IC ( , 0,95) == (X E; X + E )

IC ( , 0,95) == (36,5 0,53; 36,5 + 0,53) = (35,97; 37,03)

29

Intervalo de confiana para uma varincia populacional


A distribuio Qui-quadrado
Supondo que a caracterstica de interesse da populao
normal, a estatstica

W =

(n 1) S 2

( 2)

tem distribuio de probabilidade conhecida com distribuio


qui-quadrado com n-1 graus de liberdade.
A funo de densidade de um v.a qui-quadrado com k graus de
liberdade dado por:.
k

1
k
w2 e 2 ; w > 0
f ( w) =
k
(2) k / 2
2

Notao : W ~ (2k )
30

Se W tem distribuio qui-quadrado com k graus de liberdade


ento:
E(W)=k, Var(W)=2k;
A distribuio assimtrica direita;
A medida que os graus de liberdade aumenta a distribuio
torna-se simtrica.
31

Uso Da Tabela Distribuio Qui-Quadrado

2
Se W ~ (k)
P( W 12 , k ) = 1

x21-,k

Exemplo 4: Suponha que W uma v.a com 10 graus de liberdade


determinar:
(a) P(W>2,56);
(b) P(2,56<W<4,87)
(c) O valor de k tal que, P(W<k)=0,95.
32

Da Estatstica dada em (2) temos:

W=

(n 1) S 2

~ (2n 1)

2
Para uma nvel de confiana 100(1-)% fixado pode-se determinar , n 1 e
2

1 , n 1
2

da distribuio qui-quadrado como mostra a figura::

X2/2,n-1

X21-/2, n-1
33

P / 2, n 1 W
2

2
1 / 2 , n 1

(n 1) S 2
2
= P / 2, n 1
1 / 2, n 1 = 1
2

Um intervalo de 100(1-)% de confiana para 2 ado por


(n 1) S 2 (n 1) S 2

IC ( ,1 ) = 2
,
1 / 2, n 1 2 / 2, n 1

Exemplo: pretende-se avaliar a variabilidade associada ao resultado de


um determinado mtodo de anlise qumica. Com esse objetivo,
efetuaram-se 24 anlises a uma determinada substncia em que se
segui o referido mtodo, em condies perfeitamente estabilizadas. A
varincia amostral dos resultados (expressados numa determinada
unidade) foi de 4,58. Admitindo que o resultado das anlises segue uma
distribuio normal. Obtenha um intervalo de 90% de confiana para
varincia.
34

Para 1-=0,90 =0,10, da distribuio qui-quadrado com n1=24-1=23 graus de liberdade temos:

x20.05,23

x20.95,23
(24 1)(4,58) (24 1)(4,58)
IC ( ,0,9) =
,
= (2,995; 8,047 )
35
,
17
13
,
09

35

Intervalo de confiana para uma proporo populacional


Suponha que tem-se uma populao dicotmica, constituda
apenas por elementos de dois tipos , isto , cada elemento pode
ser classificado com
sucesso ou
fracasso,
suponha que
probabilidade de sucesso p e de fracasso q=1-p, e desta
populao se retira uma amostra aleatria, X1, Xn de n
observaes. Vimos

Z=

p p
p (1 p )
n

~ N (0,1)

Para um nvel confiana fixando em 100(1-)%,um intervalo para p,


para uma amostra suficientemente grande.

IC ( p,1 ) = p z1 / 2

p (1 p )
; p + z1 / 2
n

p (1 p )

36

Abordagem otimista

substituir p( 1-p) por p ( 1-p )

IC ( p,1 ) = p z1 / 2

p (1 p )

(1a )

1
1

IC ( p,1 ) = p z1 / 2
; p + z1 / 2

4n
4n

(1b)

p (1 p )
; p + z1 / 2
n

Abordagem conservativa

substituir p(1-p) por 1/4

37

Exemplo: Um estudo foi feito para determinar a proporo de famlias


em uma comunidade que tem telefone (p). Uma amostra de 200
famlias selecionada, ao acaso, e 160 afirmam ter telefone. Que
dizer de p com 95% de confiana?

Uma estimativa pontual de p

p =

160
= 0,8 (80%)
200

J que 1-=0,95, temos da tabela normal padro z0975.=1,96.


Substituindo em (1a)

0,8(1 0,8)
0,8(1 0,8)

= (0,745; 0,855)
IC ( p, 0,95) = 0,8 1,96
; 0,8 + 1,96

200
200

Em (1b)

1
1
IC ( p, 0,95) = 0,8 1,96
;0,8 1,96
= (0,731; 0,869)
4 200
4 200

38

Determinao do tamanho da amostra para estimao de p


O erro mximo de estimao na estimao de p dado por

E=z

p (1 p)
n

z 21 / 2 ( p (1 p) )
n=
E2

Quando no se tem informao de p:

z 21 / 2 (0,25)
n=
E2

No caso de populao finita de N elementos introduzida o fator


de correo de populao finita

E=z

p (1 p) N n
n
N 1

Nz 21 / 2 p (1 p )
n= 2
E ( N 1) + z 21 / 2 p (1 p )

Nz 21 / 2 (0,25)
Quando no se tem informao de p: n = 2
E ( N 1) + z 21 / 2 (0,25)
39

Exemplo: O servio social de um municpio deseja determinar a


proporo de famlias com uma renda familiar inferior a R$ 200,00.
Estudos anteriores indicam que esta proporo de 20%.
(a) Que tamanho de amostra se requer para assegurar uma confiana
de 95% que o erro mximo de estimao desta proporo no
ultrapasse o 0,05?
(b) Em quanto variara o tamanho da amostra se o erro mximo
permissvel reduzido a 0,01.?
Dos dados temos p=0,20 e 1-=0,95. Da tabela normal padro
z0,975.=1,96.
(a) O erro mximo de estimao E=0,05.

(1,96) 2 (0,2 0,8)


n=
= 245,86 246
2
0,05
40

(b) O erro mximo de estimao E=0,01.

(1,96) 2 (0,2 0,8)


n=
= 6146,56 6147
2
0,01
No caso de estarmos usando nvel de confiana de 95% , temos
que z0,975.=1,96 2, ento temos:

1
n0 = 2
E
A expresso anterior muito usado no planejamento de pesquisa
de levantamento, com o objetivo de estimar vrias propores
como nos exemplos seguintes:
Numa pesquisa eleitoral, em que comum a necessidade de
avaliar a proporo de cada candidato;
Na pesquisa de mercado, em que normalmente desejam-se
avaliar as propores de vrias caractersticas dos consumidores.
41

No caso de populao finita de N elementos introduzida o fator


de correo de populao finita:

Nn0
n=
N + n0 1

42

Você também pode gostar