Escolar Documentos
Profissional Documentos
Cultura Documentos
Inferencia
1 Introducao 5
1.1 Tecnicas de amostragem. . . . . . . . . . . . . . . . . . . . . . . 6
1.1.1 Principais tecnicas de amostragem probabilsticas. . . . . 7
1.1.1.1 Amostragem Simples ao Acaso . . . . . . . . . . 7
1.1.1.2 Amostragem Sistematica . . . . . . . . . . . . . 7
1.1.1.3 Amostragem por Conglomerados . . . . . . . . . 7
1.1.1.4 Amostragem Estratificada . . . . . . . . . . . . . 7
1.1.2 Principais tecnicas de amostragem nao probabilsticas. . . 8
1.1.2.1 Inacessibilidade a toda populacao . . . . . . . . 8
1.1.2.2 Amostragem sem norma (a esmo) . . . . . . . . 8
1.1.2.3 Populacao formada por material contnuo. . . . 8
1.1.2.4 Intencional . . . . . . . . . . . . . . . . . . . . . 9
1.2 Amostras aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . 9
2 Distribuicoes Amostrais 11
2.1 Distribuicao amostral da media . . . . . . . . . . . . . . . . . . . 11
2.1.1 Esperanca e variancia . . . . . . . . . . . . . . . . . . . . 12
2.1.1.1 Amostragem com reposicao . . . . . . . . . . . . 12
2.1.1.2 Amostragem sem reposicao . . . . . . . . . . . . 14
2.1.2 A distribuicao de x . . . . . . . . . . . . . . . . . . . . . . 15
2.1.2.1 Populacoes normais . . . . . . . . . . . . . . . . 15
2.1.2.2 Populacoes nao normais - Teorema Central do
Limite . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2 Distribuicao amostral da variancia . . . . . . . . . . . . . . . . . 16
2.3 Distribuicao amostral da media quando nao se conhece a variancia 18
2.4 Distribuicao amostral da proporcao . . . . . . . . . . . . . . . . . 19
3 Metodos de estimacao 21
3.1 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2 Maxima verossimilhanca . . . . . . . . . . . . . . . . . . . . . . . 23
3.3 Mnimos quadrados . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3
4 SUMARIO
4 Teoria da estimacao 29
4.1 Propriedades dos Estimadores pontuais . . . . . . . . . . . . . . 30
4.1.1 Nao tendenciosidade . . . . . . . . . . . . . . . . . . . . . 30
4.1.2 Consistencia . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.1.3 Eficiencia relativa . . . . . . . . . . . . . . . . . . . . . . . 32
4.2 Estimacao por intervalo . . . . . . . . . . . . . . . . . . . . . . . 32
4.2.1 Intervalo de confianca para a media . . . . . . . . . . . 32
4.2.1.1 Variancia conhecida . . . . . . . . . . . . . . . . 32
4.2.1.2 Variancia desconhecida . . . . . . . . . . . . . . 33
4.2.2 Diferenca entre duas media (a b ) . . . . . . . . . . . 34
4.2.2.1 Variancias Conhecidas: . . . . . . . . . . . . . . 34
4.2.2.2 Variancias Desconhecidas: . . . . . . . . . . . . . 35
4.2.3 Intervalo de confianca para proporcao . . . . . . . . . . . 36
4.2.3.1 Amostras grandes (n > 30) . . . . . . . . . . . . 36
4.2.3.2 Amostras pequenas (n 30) . . . . . . . . . . . 37
4.2.4 Intervalo de confianca para a diferenca entre proporcoes . 37
4.2.4.1 Amostras grandes (n > 30) . . . . . . . . . . . . 37
4.2.4.2 Amostras pequenas (n 30) . . . . . . . . . . . 37
4.2.5 Intervalo de confianca para a variancia ( 2 ) . . . . . . . . 38
6 Referencias Bibiliograficas 49
Captulo 1
Introducao
Definicao 1.1 (Populacao) conjunto de indivduos com pelo menos uma car-
acterstica observavel em comum.
5
6 CAPITULO 1. INTRODUCAO
i. Uniforme
Quando de K estratos, retiram-se amostras de mesmo tamanho n, indepen-
dentemente do tamanho do estrato.
8 CAPITULO 1. INTRODUCAO
ii. Proporcional
Quando o tamanho da amostra retirado em cada estrato (ni) e proporcional
ao tamanho do estrato.
1.1.2.4 Intencional
O pesquisador escolhe deliberadamente certos elementos da
populacao para formar a amostra, baseado num pre-julgamento.
Ex. Pesquisa de mercado para lancar uma nova marca de leite
longa vida tipo A . O pesquisador selecionara indivduos com poder aquisitivo
medio/alto, que sao os principais consumidores deste produto (publico alvo),
embora toda a populacao independentemente do poder aquisitivo possa ser con-
sumidora deste produto.
x 0 1 2 4 P
P (X = x) 15 51 25 15 =1
Extraindo-se todas as possveis amostras, com reposicao, desta
populacao 0, 1, 2, 2, 4, a distribuicao de probabilidade da variavel aleatoria bidi-
mensional (X1 , X2 ) e:
X1
X2 0 1 2 4 Total
1 1 2 1 1
0 25 25 25 25 5
1 1 2 1 1
1 25 25 25 25 5
2 2 4 2 2
2 25 25 25 25 5
1 1 2 1 1
4 25 25 25 25 5
1 1 2 1
Total 5 5 5 5 1
Deste modo, verifica-se, facilmente que, X1 e X2 sao indepen-
dentes e possuem a mesma distribuicao de X.
10 CAPITULO 1. INTRODUCAO
Captulo 2
Distribuicoes Amostrais
11
12 CAPITULO 2. DISTRIBUICOES AMOSTRAIS
Pn
E(x) = x = i=1 xi P (x = xi ) = 9, 0
Pn 1
V (x) = x2 = i=1 [xi E(x)]2 P (x = xi ) = 3
Prova:
1
Pn
x = n i=1 xi
" n
#
1X
E(x) = E xi
n i=1
1
= E [x1 + x2 + + xn ]
n
1
= [E(x1 ) + E(x2 ) + + E(xn )]
n
1
= [ + + + ]
n
1
= n
n
=
14 CAPITULO 2. DISTRIBUICOES AMOSTRAIS
" n
#
1X
V (x) = V xi
n i=1
1
= V [x1 + x2 + + xn ]
n2
1
= [V (x1 ) + V (x2 ) + + V (xn )]
n2
1 2
+ 2 + + 2
=
n2
1
= n 2
n2
= 2
x 8,5 9 9,5
1 1 1
P (x = xi ) 3 3 3
Neste caso,
n
X
E(x) = x = xi P (x = xi ) = 9, 0
i=1
n
X 1
V (x) = x2 = [xi E(x)]2 P (x = xi ) =
i=1
6
E(x) = 9, 0 = ,
e
1 2 N n
V (x) = =
6 n N 1
O termo N n
N 1 e conhecido como fator de correcao para
amostragem sem reposicao em populacoes finitas (ASRPF). Uma populacao
2.1. DISTRIBUICAO AMOSTRAL DA MEDIA 15
n
e considerada finita quando N > 0, 05 ou seja a amostra representar mais de
5% do tamanho da populacao. Quando tal criterio nao for satisfeito, o fator de
correcao torna-se desprezvel, podendo, portanto ser eliminado.
2.1.2 A distribuicao de x
2.1.2.1 Populacoes normais
Para obtencao da distribuicao amostral da media amostral (x)
de populacoes com distribuicao normal, torna-se necessario a apresentacao dos
seguintes teoremas:
n
Y
M 0 (t) = 0
M(X i)
(t)
i=1
n
1 2 2
e(i t+ 2 i t )
Y
=
i=1
(t ni=1 i + 12 t2 ni=1 i2 )
P P
= e ,
z : P (z z) = 0.05 = 1, 65
assim,
65 750
1, 65 = 7,5
n
n = 12 pessoas
entao,
(n1)s2
i. 2 2(n1) ;
ii. E(s2 ) = 2 ;
2 4
iii. V (s2 ) = n1 .
Prova:
(n1)s2
2 2(n1)
2.2. DISTRIBUICAO AMOSTRAL DA VARIANCIA 17
n
X n
X
(xi )2 = [(xi x) + (x )]2
i=1 i=1
n
X
= [(xi x)2 + 2(xi x)(x ) + (x )2 ]
i=1
Xn n
X
= (xi x)2 + 2(x ) (xi x) + n(x )2
i=1 i=1
n
X
= (xi x)2 + n(x )2 ,
i=1
consequentemente,
n
X n
X
(xi x)2 = (xi )2 n(x )2 ,
i=1 i=1
portanto,
n
X
(n 1)s2 = (xi )2 n(x )2 ,
i=1
1
multiplicando ambos os lados da expressao por 2 ,
Pn
(n 1)s2 i=1 (xi )2 n(x )2
=
2 2 2
n 2 !2
X xi x
=
i=1 n
Sabendo que:
Pn xi 2
i=1 2(n) ;
2
x x
2(1) , pois N (0, 1).
n n
(n 1)s2
2(n1) .
2
E(s2 ) = 2 .
18 CAPITULO 2. DISTRIBUICOES AMOSTRAIS
Pn
x)2
2 i=1 (xi
E(s ) = E
n1
" n #
1 X
2
= E (xi x)
n1 i=1
" n #
1 X
2 2
= E (xi ) n(x )
n1 i=1
" n #
1 X
2 2
= E(xi ) nE(x )
n 1 i=1
" n #
1 X
= V (X) nV (X)
n 1 i=1
2
1 2
= n n
n1 n
1 2
= (n 1)
n1
= 2
2 4
V (s2 ) = n1 .
(n 1)s2
2(n1) ,
2
logo,
(n 1)s2
V = 2(n 1)
2
(n 1)2
V (s2 ) = 2(n 1)
4
2(n 1) 4
V (s2 ) =
(n 1)2
2 4
V (s2 ) =
n1
X
s
n
Prova:
A proporcao de indivduos, portadores de uma certa carac-
terstica, em uma amostra e dada por:
1, se o indivduo possui a caracterstica;
yi =
0, caso contrario;
Pn
i=1 yi
p = = y.
n
20 CAPITULO 2. DISTRIBUICOES AMOSTRAIS
Pn
i=1 yi
E(p) = E
n
1
= E[y1 + y2 + + yn ]
n
1
= [E(y1 ) + E(y2 ) + + E(yn )]
n
1
= [p + p + + p], pois, Y Bernoulli(p)
n
1
= np
n
= p
Pn
i=1 yi
V (p) = V
n
1
= V [y1 + y2 + + yn ]
n2
1
= [V (y1 ) + V (y2 ) + + V (yn )]
n2
1
= [p(1 p) + p(1 p) + + p(1 p)], pois, Y Bernoulli(p)
n
1
= np(1 p)
n2
p(1 p)
=
n
Pelo teorema central do limite,
y E((y) p p
p =q N (0, 1)
V (Y ) p(1p)
n
Captulo 3
Metodos de estimacao
3.1 Momentos
O metodo dos momentos e um dos metodos de estimacao mais
simples e antigos utilizados na estatstica. E consiste, basicamente, em igualar
os momentos populacionais aos amostrais sendo o estimador do parametro em
questao dado pela solucao deste sistema. Assim, sejam:
n
1X r
Mr0 = x , r 1,
n i=1 i
o r-esimo momento amostral de uma variavel aleatoria X.
0r = E[X r ], r 1,
o r-esimo momento populacional. Entao, o metodo dos momentos consiste na
obtencao dos estimadores para = (1 , , n ), resolvendo as euquacoes:
0r = Mr0 , r = 1, , k.
Exemplo 3.1.1 Obter os estimadores da media () e da variancia ( 2 ) de uma
variavel aleatoria X N (, 2 ).
Sabe-se que a funcao geradora de momentos de uma variavel
aleatoria X N (, 2 ) e:
t2 2
MX (t) = et+ 2
21
22 CAPITULO 3. METODOS DE ESTIMACAO
d2 MX (t)
0
2 =
dt
t=0
h 2 2 t2 2
i
2 t+ t 2
= ( )e + ( + t 2 )( + t 2 )et+ 2
t=0
= 2 + 2
N +1
M10 = E(X) =
2
fazendo: x = M10 vem:
N + 1
x =
2
N = 2X 1 (3.1)
n
1 xi 2
e 2 ( )
Y 1
L(x; , 2 ) =
i=i 2 2
n
1 1
Pn
( xi )
2
= e 2 i=1
2 2
L(x, )
=0 (3.3)
l(x, )
=0 (3.4)
n
1 1
Pn
( xi )
2
L(x; , 2 ) = e 2 i=1
2 2
n
2 n 2
X (xi )2
l(x, , ) = ln2
2 i=1
2 2
Assim,
26 CAPITULO 3. METODOS DE ESTIMACAO
l(x, , 2 )
= 0
n
X xi
2 = 0
i=1
2 2
n
X
(xi ) = 0
i=1
Pn
i=1 xi
= (3.5)
n
l(x, , 2 )
= 0
2
n
n 1 X
2+ 4 (xi )2 = 0
2 i=1
n
n 1 X
= (xi )2
2 2 4 i=1
Pn 2
i=1 (xi )
2 = (3.6)
n
Um problema do metodo da maxima verossimilhanca e que ape-
sar das boas propriedades estatsticas, este metodo, nem sempre conduz a esti-
madores esplcitos, isto e o sistema de equacoes l(x,)
= 0 nem sempre apre-
senta uma solucao algebrica, sendo necessario a utilizacao de procedimentos
iterativos (Newton-Raphson, Algortmos EM, etc.) para obtencao das estima-
tivas de maxima verossimilhanca.
Xi = E(Xi ) + ei ,
em que:
E(Xi ) e o modelo pelo qual deseja-se descrever a variavel;
ei e o erro de estimacao associado a Xi
Assim o metodo visa obter os estimadores E(X) que minimizem
os erros de etimacao ei . Uma medida do erro total de estimacao e dada por
P n
i=1 ei , contudo este valor e sempre nulo. Uma medida Pn do2 erro de estimacao
e dada entao pela soma dos quadrados dos desvios i=1 ei . Asim sendo, os
estimadores de mnimos quadrados sao obtidos, pela solucao do sistema:
3.3. MINIMOS QUADRADOS 27
S(x, )
=0 (3.7)
Pn 2
em que: S(x, ) = i=1 ei
xi = E(X) + ei ,
entao,
ei = xi E(X),
consequentemente,
S(x, )
= 0
Pn
i=1 (xi )2
= 0
n
X
2 (xi ) = 0
i=1
Pn
i=1 xi
=
n
28 CAPITULO 3. METODOS DE ESTIMACAO
Captulo 4
Teoria da estimacao
29
30 CAPITULO 4. TEORIA DA ESTIMACAO
E() =
Pn
i=1 xi
E(x) = E
n
" n
#
1 X
= E xi
n i=1
1
= E [x1 + x2 + + xn ]
n
1
= [E(x1 ) + E(x2 ) + + E(xn )]
n
1
= [ + + + ]
n
1
= n
n
=
Pn 2
i=1 (xi x)
Ex2.:s2 = n e um estimador tendencioso da
variancia populacional 2 .
4.1. PROPRIEDADES DOS ESTIMADORES PONTUAIS 31
prova:
n
X n
X
(xi x)2 = (xi + x)2
i=1 i=1
n
2
X
= [(xi ) (x )]
i=1
n
X n
X n
X
2
= (xi ) 2 (xi )(x ) + (x )2
i=1 i=1 i=1
n
X
= como (x ) e uma constante e (xi ) = n(x ), tem-se:
i=1
n
X n
X
(xi x)2 = (xi )2 n(x )2
i=1 i=1
Portanto,
Pn
)2 n(x )2
i=1 (xi
E s2
= E
n
( n
)
1 X 2
2
= E (xi ) nE (x )
n i=1
1
= {nV (X) nV (x)}
n
2
1 2
= n n
n n
n1 2
=
n
4.1.2 Consistencia
Um estimador e um estimador consistente do parametro se:
i. limn E[] = ;
ii. limn V () = 0.
Pn
xi
x = i=1
n e um estimador consistente da media populacional
, pois
32 CAPITULO 4. TEORIA DA ESTIMACAO
i. E(x) =
) = limn 2
ii. limn V (x n = 0.
V (1 ) < V (2 )
A eficiencia relativa do estimador 1 , em relacao ao estimador
2 e dada por:
V (2 )
Ef1 ,2 = (4.2)
V (1 )
P (z 2 z z 2 ) = 1
P (z 2 x
z 2 ) = 1
n
P (z 2 n x z 2 n ) = 1
P (x z 2 n x + z 2 n ) = 1
P (x + z 2 n x z 2 n ) = 1 reorganizando vem
P (x z 2 n x + z 2 n ) = 1
r
N n
IC()1 = x z 2 (4.4)
n N 1
onde:
N e o tamanho da populacao;
n e o tamanho da amostra.
Exemplo 4.2.2 Um Cia adquiriu 500 cabos. Uma amostra de 30 deles sele-
cionados ao acaso apresentou tensao de ruptura media igual a 2400 kg com
desvio padrao de 150 kg. Obter o intervalo com 95% de confianca para a ver-
dadeira tensao media de ruptura destes cabos.
solucao:
Tem-se:N = 500 n = 30 x = 2400 s = 150 1 = 0, 95
n 30
N = 500 = 0, 06 > 0, 05 ocorreu ASRPF.
r
150 500 30
IC()0,95 = 2400 t0,025
30 500 1
= 2400 (2, 045)(27, 38)(0, 97)
= 2400 54, 31
s
a2 2
IC(a b )1 = xa xb z 2 + b (4.7)
na nb
em que:
4.2. ESTIMACAO POR INTERVALO 35
na 1 + nn 1
Exemplo 4.2.4
r
pa qa pa qb
IC(Pa Pb )1 = (pa pb ) z + (4.14)
2
na nb
em que:
pa e a proporcao estimada na amostra;
qa = 1 pa ;
qa = 1 pa ;
na e nb sao os tamanhos das amostras a e b, respectivamente
Obs: Se ocorrer ASRPF, deve-se multiplicar o componente da
variancia, referente a populacao na qual ocorreu ASRPF pelo fator de correcao
N n
N 1 .
r
pa qa pa qb
IC(Pa Pb )1 = (pa pb ) t 2 + (4.15)
na nb
t 2 com na + nb 2 graus de liberdade
Obs: Se ocorrer ASRPF, deve-se multiplicar o componente da
variancia, referente a populacao na qual ocorreu ASRPF pelo fator de correcao
N n
N 1 .
38 CAPITULO 4. TEORIA DA ESTIMACAO
(n 1)s2
sin 2n1
2
Entao,
" #
(n 1)s2 2 (n 1)s2
P =1
21 2
2 2
39
40 CAPITULO 5. TEORIA DA DECISAO (TESTES DE HIPOTESES)
equipados com motores 1.6 c.c. seja de 14km/l, como afirma o fabricante,
ou se este e inferior a 14km/l. Entao deve-se formular as seguintes hipotese
estatsticas:
H0 : = 14km/l
Ha : < 14km/l
na amostra de n = 9 carros
obteve-se x = 13 km/l e s2 =
2
4 (km/l)2 ; sabendo-se que x sin N , n , assumido = 14 km/l, e como nao
se conhece 2 , mas sim s2 , tem-se:
x t(8) 14, 94
grafico
x 13 14
tc = = = 1, 5
2
n 9
Entao,
5.1. CONSIDERACOES INICIAIS 41
Decisao
Realidade Rejeita H0 Nao Rejeita H0
H0 verdadeira 1
(erro Tipo I) Decisao correta
H0 falsa 1
Decisao correta (erro Tipo II)
v. Tomar a decisao;
vi. Conclusao.
i.
H0 : = 14km/l
Ha : < 14km/l
ii. = 0, 05
iv.
x 0 13 14
tcalc = = = 1, 5
s 2
n 9
a b
Xa N (a , a2 ) tcalc = xa xq
b (a b )
sp n1a + n1 n > 30 N (0, 1)
Xb N (b , b2 ) b
n 30 t(na +nb 2
q
(na 1)s2a +(nb 1)s2b
a2 = b2 sp = na +nb 2
n > 30 N (0, 1)
Xa N (a , a2 ) n 30 t(v)
2
xa xb (a b ) s2
s2
Xb N (b , b2 ) tcalc = r a b
na + nb
s2 s2
a2 6= b2 a
na + nb
b
v=
s2
!2 2 !2
s
a b
na nb
na 1 + nn 1
0
dd
tcalc = s
d n > 30 N (0, 1)
dados pareados n
di = x i antes xi depois
n 30 t(n1)
qpp0
n > 30 N (0, 1)
p tcalc = p(1p)
n
n 30 t(n1)
a2 Xa N (a , a2 ) s2a b2
Fcalc = F(na 1),(nb 1)
b2 Xb N (b , b2 ) s2b a2
k
X (Foi Fei )2
2calc = ; (5.1)
i=1
F ei
em que:
Foi e a frequencia observada;
Fei e a frequencia esperada.
5.2. ESTATISTICA APROPRIADAS PARA OS TESTES DE HIPOTESES45
v = k 1 m,
em que:
k e o numero de classes, e
m o numero de parametros estimados para se obter as freq.
esperadas.
Tabela 5.2: Numero de gols por partida marcados pelo Cruzeiro Esporte Clube
durante o campeonato brasileiro de 2002.
Numero de gols 0 1 2 3 4
Numero de partidas 8 9 4 2 3
Tabela 5.4: Frequencias esperadas do numero de gols por partida marcados pelo
Cruzeiro Esporte Clube durante o campeonato brasileiro de 2002, estimadas pelo
modelo Poisson.
Numero de gols 0 1 2 3 4
Numero de partidas (Fo) 8 9 4 2 3
Fe 6,76 9,10 6,24 2,86 1,04
Referencias Bibiliograficas
RAO,C. R. Linear statistical inference and its aplications. 2 ed. John Willey
& Sons Inc., New York, 1973, 624 p.
49