Escolar Documentos
Profissional Documentos
Cultura Documentos
1 Introdução
Inferência estatística é o processo pelo qual podemos tirar conclusões acerca de um
conjunto maior (a população) usando informação de um conjunto menor (a amostra).
Podemos estimar o parâmetro θ usando a informação de nossa amostra. Chamamos
este único número que representa o valor mais plausível do parâmetro (baseado nos dados
amostrais) de uma estimativa pontual de θ. Alguns exemplos são a média amostral, o
desvio padrão amostral, a mediana amostral, os quais estimam a verdadeira média, desvio
padrão e mediana da população (que são desconhecidos).
2 Estimação Pontual
A estimação pontual (por ponto) consistirá simplesmente em, à falta de melhor infor-
mação, adotar a estimativa disponível como sendo o valor do parâmetro. A idéia é, em sua
essência, extremamente simples, porém a qualidade dos resultados irá depender funda-
mentalmente da conveniente escolha do estimador. Assim, dentre os vários estimadores
razoáveis que poderemos imaginar para um determinado parâmetro, devemos ter a pre-
ocupação de escolher aquele que melhor satisfaça às propriedades de um bom estimador.
Consideremos uma amostra (X1 , X2 , . . . , Xn ) de uma v.a. que descreve uma carac-
terística de interesse de uma população.
Seja θ um parâmetro que desejamos estimar, como por exemplo a média µ = E(X) ou
a variância σ 2 = V (X).
Definição: Um estimador T do parâmetro θ é qualquer função das observações da
amostra, ou seja, T = g(X1 , X2 , . . . , Xn ).
1
3.1 Justeza e não-tedenciosidade
A adoção de um estimador que não seja justo nos levará a incorrer no vício de esti-
mação, ou viés.
Exemplo
Seja X1 , X2 , . . . , Xn uma amostra aleatória
Pn de tamanho n obtida de uma populaçao
2 1
commédia µ e variância σ , então X̄ = n i=1 Xi é um estimador não viciado de µ.
Pn Pn nµ
E(X̄) = E( n1 i=1 Xi ) = 1
n i=1 E(Xi ) = n
=µ
3.2 Consitência
Diremos que uma sequência de estimadores Tn é consitente se, para todo > 0,
lim E(Tn ) = θ
n→∞
lim σ 2 (Tn ) = 0
n→∞
Exemplo Pn
Se Xi ∼ Bernoulli(p) então X = i=1 Xi ∼ Binomial(n, p), daí E(X) = np e
V (X) = np(1 − p). Então,
E(X) np
E(p̂) = E( Xn ) = n
= n
= p (e p̂ é um estimador não viciado de p);
V (X) np(1−p) p(1−p) p(1−p)
V (p̂) = V ( Xn ) = n2
= n2
= n
e limn→∞ n
=0
concluindo-se que p̂ é um estimador consistente de p.
3.3 Eficiência
2
V (T ) < V (T 0 ),
Solução:
Pn Pn np(1−p) p(1−p)
V (p̂) = V ( X1 ,X2n,...,Xn ) = 1
n2 i=1 V (Xi ) = 1
n2 i=1 p(1 − p) = n2
= n
;
3.4 Suficiência
4 Estimação Intervalar
Uma estimativa pontual de parâmetros, por nao dizer o quão próximo o parâmetro es-
timado vai estar do parâmetro verdadeiro, não é suficiente para informar sobre a precisão
da estimativa. Os métodos de estimação por intervalo tem propósito de determinar os in-
tervalos aleatórios, chamados intervalos de confiança, que contém o valor do parâmetro
desconhecido com uma probabilidade especificada chamada nível de confiança. Neste
caso a amplitude do intervalo dá uma indicação da precisão da estimativa obtida.
1
Pn 2
X̄ = n i=1 Xi ∼ N (µ, σn ) e, com a variância σ 2 é suposta conhecida, a variável
aleatória
3
X̄ − µ
Z= ∼ N (0, 1)
√σ
n
Assim, dado o nível de confinaça 1−α, tendo em vista a simetria da distribuição N (0, 1)
e, para garantir que o ntervalo obtido tenha amplitude mínima, obtemos na tabela da dis-
tribuição normal padronizada, q1 = −Z α2 e q2 = −q1 = Z α2 tal que P (Z ≤ Z α2 ) = 1 − α2 de
modo que
X̄ − µ
P − Z α2 ≤ σ ≤ Z α =1−α
2√
n
ou, equivalentemente,
σ σ
P X̄ − Z α2 · √ ≤ µ ≤ X̄ + Z α2 · √ =1−α
n n
σ σ
IC(µ, 1 − α) = X̄ − Z · √ ; X̄ + Z 2 · √
α α
n n2
σ
IC(µ, 1 − α) = X̄ ± Z α2 · √
n
Exemplo
Suponha que se extraia uma amostra de tamanho 35 de uma população com média
µ e desvio padrão conhecido e igual a 3,90. Suponha que a média amostral seja 44,8.
Determinar um intervalo com 95% de confiança para µ.
Solução:
Temos que,
α 0,05
1 − α = 0, 95, α = 0, 05, P (Z ≤ Zα/2 ) = 1 − 2
=1− 2
= 0, 975. Logo, Zα/2 = 1, 96
3,90
IC(µ, 95%) = (44, 8 ± 1, 96 · √
35
)
4
4.2 Intervalo de Confiança para Média com variância desconhecida
Admitindo, mais realisticamente, que a variância σ 2 é desconhecida, a variável aleatória
X̄ − µ
t= ∼ tn−1
√S
n
e, de forma equivalente,
S S
P X̄ − tn−1; α2 · √ ≤ µ ≤ X̄ + tn−1; α2 · √ =1−α
n n
de modo que o intervalo de confiança simétrico para µ é
S S
IC = (µ, 1 − α) = X̄ − t n−1; α · √ ; X̄ + tn−1; 2 · √
α
2
n n
ou, de outra forma
S
IC = (µ, 1 − α) = X̄ ± tn−1; α2 · √
n
em que S é o desvio padrão amostral dado por
v
u n
u 1 X
S=t (Xi − X̄)2
n − 1 i=1
Exemplo
Suponha que se extraia uma amostra de tamanho 25 de uma população com média
µ e desvio padrão desconhecido. Suponha que a média amostral seja 4,004 e o desvio
padrão amostral seja 0,366. Determinar intervalo 99% de confiança para µ.
Solução:
Temos que,
t0,005;24 = 2, 797
0,366
IC(4, 004 ± 2, 797 · √ )
25
5
4.3 Intervalo de Confiança para proporção populacional
Seja X1 , X2 , . . . , Xn uma amostra aleatória de tamanho n obtida de umapopulaçãode
Bernoulli com parâmetro p, onde os componentes da amostra só podem assumir os valores
0 e 1.
p̂ − p
Z=q ∼ N (0, 1)
p(1−p)
n
A expressão final para o intervalo de confiança aproximado para p, com nível de confi-
ança 1 − α, será
r r
p̂(1 − p̂) p̂(1 − p̂)
IC(p, 1 − α) = p̂ − Z α2 · ; p̂ + Z α2 ·
n n
r
p̂(1 − p̂)
IC(p, 1 − α) = p̂ ± Z · α
2
n
Exemplo
Uma amostra aleatória de 600 peças de computador são obtidas de um grande lote de
produção, observando-se 45 com defeito. Estimar, através de um intervalo de confiança
de 95%, a proporção verdadeira, p, de peças de computador com defeito no lote.
Solução:
X 45
Temos p̂ = n
= = 0, 075, para 1 − α = 0, 95, α = 0, 05 e Z α2 = 1, 96 logo,
600
q
IC(p, 95%) = (0, 075 ± 1, 96 0,075·0,925
600
) = (0, 075 ± 0, 0211) ou
IC(p, 95%) = (0, 0539; 0, 0961) ou, ainda: IC(p, 95%) = (5, 39%; 9, 61%).
ou, equivalentemente,
6
(n − 1)S 2 (n − 1)S 2
P ≤ σ2 ≤ = 1 − α,
χ2n−1; α χ2n−1;1− α
2 2
(n − 1)S 2 (n − 1)S 2
IC(σ 2 , 1 − α) = P ; 2 .
χ2n−1; α χn−1;1− α
2 2
Exemplo Suponha que seja retirada uma amostra de tamanho cinco de uma população
normalmente distribuida, e que se tenha encontrado uma variância amostral de 13,52.
Construa um intervalo com 95% de confiança para a variância populacional.
Solução:
Temos que χ20,975;4 = 0, 484 e χ20,025;4 = 11, 143. Logo o intervalo de confiança para σ 2
é
4(13,52) 4(13,52)
IC(σ 2 , 95%) = 11,143
; 0,484
7
Logo
Assim, temos
(x̄1 − x̄2 ) − (µ1 − µ2 )
P −Z ≤ α
2
q 2 ≤ Z2 = 1 − α
α
σ1 σ22
n1
+ n2
s s
σ12 σ22 σ12 σ22
IC(µ1 − µ2 , 1 − α) = (x̄1 − x̄2 ) − Z α2 + ; (x̄1 − x̄2 ) + Z α2 +
n1 n2 n1 n2
8
(x̄1 −x̄2 )−(µ1 −µ2 )
q
σ 2 ( n1 + n1 ) (x̄1 − x̄2 ) − (µ1 − µ2 )
1 2
t= q = q ∼ tn1 +n2 −2
(n1 +n2 −2)Sp2
σ 2 (n1 +n2 −2)
Sp2 ( n11 + n12 )
Procedendo de maneira análoga ao caso anterior, obtemos as seguintes expressões
para o IC(µ1 − µ2 , 1 − α) simétrico:
r r
1 1 1 1
IC(µ1 −µ2 , 1−α) = (x̄1 −x̄2 )−tn1 +n2 −1; α2 Sp2 ( + ); (x̄1 −x̄2 )+tn1 +n2 −1; α2 Sp2 ( + )
n1 n2 n1 n2
e
r
1 1
IC(µ1 − µ2 , 1 − α) = (x̄1 − x̄2 ) ± tn1 +n2 −1; α2 Sp2 ( + )
n1 n2
Exemplo: Duas amostras de plantas foram cultivadas com dois fertilizantes diferentes.
A primeira amostra oriunda de 200 sementes, acusou altura média de 10,9 cm e desvio
padrão 2,0 cm. A segunda amostra, de 100 sementes, acusou uma altura média de 10,5
cm com desvio padrão de 5,0 cm. Construir um intervalo de confiança entre as alturas
médias das populações ao nível de 95% de confiança.
s s
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 ) p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
IC(p1 −p2 , 1−α) = (p̂1 −p̂2 )−Z α + ; (p̂1 −p̂2 )+Z α2 +
2
n1 n2 n1 n2
ou
s
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
IC(p1 − p2 , 1 − α) = (p̂1 − p̂2 ) ± Z α +
2
n1 n2
9
Exemplo 2: Numa pesquisa sobre a opinião dos moradores de duas cidades, A e B,
com relação a um determinado projeto, revelou que na cidade A, dos 400 entrevistados,
180 eram favoráveis ao projeto, na cidade B, dos 600 entrevistados, 350 foram favoráveis.
Verifique, por meio de um intervalo de 90% de confiança, se há diferença entre as pro-
porções de moradores favoráveis nas duas cidades.
Exercícios
3. Seja X a duração da vida de uma peça de equipamento tal que σ = 5 horas. Admita
que 100 peças foram ensaiadas fornecendo uma duração de vida média de 500 horas
e que se deseja obter um intervalo de 95% para a verdadeira média populacional.
4. Deseja-se estimar a nota média em um exame aplicado em uma escola. Para isso
considerou-se uma amostra de 16 alunos submetidos a esse exame e obteve-se
uma nota média de 7,3 e um desvio padrão de 0,4. Construa o intervalo com 95%
de confiança para a verdadeira média.
6. Uma empresa emprega 200 pessoas. Numa amostra aleatória de 25 notas de despe-
sas numa semana de dezembro, um auditor constatou uma despesa média de 220
u.m. com desvio padrão de 20 u.m. Qual é a estimativa intervalar com 99confiança
para a despesa média da empresa com seus empregados ?
10
9. Para avaliar a taxa de desemprego em uma cidade, obteve-se uma amostra aleatória
de 1.000 habitantes em idade de trabalho, dos quais 87 eram desempregados. Esti-
mar a porcentagem de desempregados em toda a cidade através de um intervalo de
90% de confiança.
10. Uma amostra de onze elementos, extraída de uma população com distribuição nor-
mal, forneceu variância s2 = 7, 08. Construir um intervalo de 90% de confiança para
a variância dessa população.
11. Dentre 100 peixes capturados num certo lago, 18 não estavam apropriados para con-
sumo devido aos níveis de poluição do ambiente. Construa um intervalo de confiança
de 99% para a verdadeira proporção de peixes contaminados.
13. Através de uma aas de 145 profissionais de certa região, verificou-se que o salário
médio é de 8 salários mínimos (s.m.) com um desvio padrão de 1,8 s.m. A amostra
também forneceu a informação de que 70% dos profissionais eram casados.
a) Determine e interprete o intervalo de confiança de 99% para a proporção de profis-
sionais casados desta região?
b) Determine e interprete um Intervalo de Confiança de 90% para σ 2 .
X1 + X2 + X3
T1 =
3
e
X1 + 2X2 + X3
T2 =
4
a) Encontre a esperança e a variância dos estimadores acima.
b) Verifique se são não viciados e consistentes. Qual é o melhor? Porquê?
15. Seja X uma única variável aleatória com distribuição de Bernoulli com parâmetro θ.
Sejam θ̂1 = X e θ̂2 = 1/2 dois estimadores de θ. Verifique se θ̂1 e θ̂2 são não viciados
para θ.
E(T1 ) = θ V (T1 ) = 9
11
E(T2 ) = 3θ V (T2 ) = 3
17. Uma empresa emprega 200 pessoas. Numa amostra aleatória de 25 notas de de-
spesas numa semana de dezembro, um auditor constatou uma despesa média de
220 u.m. com desvio padrão de 20 u.m. Qual é a estimativa intervalar com 99% de
confiança para a despesa média da empresa com seus empregados ? [208,812 ;
231,188]
18. Para uma amostra aleatória de 100 trabalhadores, em uma firma com 1200 em-
pregados, 70 preferem receber seus salários através de créditos em conta corrente
bancária. De posse dessa informação construir o intervalo de 90% de confiança para
a proporção de trabalhadores da firma que têm preferência pelo crédito em conta
corrente para seus trabalhos. [0,62 ; 0,77]
20. Em uma empresa, o número médio da venda de 12 produtos distintos, coletados por
amostragem, indicou 27,33 como média de produtos vendidos por período de tempo.
O desvio-padrão desta amostra foi 4,28. Se desejarmos construir um intervalo de
99% confiança para a verdadeira média de vendas, podemos afirmar o quê?
21. Em uma amostra aleatória de 400 eleitores de uma cidade, 228 foram contra o uso
de recurso públicos para a construção de uma certa obra. Com 95% de confiança,
qual a proporção correspondente a todos os eleitores da cidade?
22. Em uma amostra de 300 clientes de um supermercado, 234 deles utilizavam cartão
de crédito em suas compras. Construa um intervalo de 98% de confiança para
a probabilidade de que um cliente escolhido ao acaso vá comprar com cartão de
crédito.
23. Uma amostra aleatória da previsão de 15 analistas financeiros sobre os ganhos por
ação da General Motors Corporation foi coletada. O desvio padrão amostral foi de
$ 0,88. Ache o intervalo de confiança de 98% para a variância das previsões dos
analistas. [0,372; 2,326]
12
24. Uma amostra aleatória de dimensão n1 = 120 retirada da população X1 com dis-
tribuição Normal de parâmetros µ1 e σ1 , deu origem aos seguintes valores: x̄1 = 20, 5
e s1 = 3, 5. Uma outra amostra, independente da anterior, de dimensão n2 = 130 e
retirada da população X2 de parâmetros µ2 e σ2 , deu origem aos valores x̄2 = 28, 2
e s2 = 4, 8.
a) Determine o intervalo de confiança a 90% para µ1 − µ2 admitindo que σ1 = 4 e
σ2 = 5. [-8,636 ; -6,764]
b) Determine o intervalo de confiança a 90% para µ1 − µ2 assumindo, como é mais
natural, que os desvios padrão são desconhecidos. [-8,58 ; -6,82]
26. Uma amostra aleatória de 200 possuidores de cartão de crédito mostra que o débito
médio anual nesses cartões, para contas individuais, é U$ 1592, com desvio padrãode
U$ 997 (com base em dados do USA Today). Com essas estatísticas, construa um
intervalo de 94% de confiança para o débito médio anual em cartões de crédito para
a população de todas as contas.
27. Um banco pretende estimar a percentagem de clientes que passam cheques sem
cobertura. Numa amostra de 150 clientes 15 deles já tinham passado cheques sem
cobertura. Estime, a 95% de confiança a verdadeira percentagem (ou proporção) de
clientes do banco que passam cheques sem cobertura.
Homens Mulheres
n1 = 25 n2 = 5
x̄1 = 16, 0 x̄2 = 11, 0
S12 = 16 S22 = 10
29. A média dos pesos de uma amostra de 10 embalagens de adubos (em kg) distribuí-
dos por uma empresa foi de 46,02 kg e com desvio padrão de 0,64 kg.
a) Com 99% de confiança, estime um intervalo para a verdadeira média dos pesos
das embalagens de adubo.
b) Ao nível de 90% de confiança, determine um intervalo para verdadeira variância
das embalagens de adubo.
30. A média aritmética dos gastos com livros de uma amostra de 100 estudantes do
primeiro ano de administração é de 70 reais com desvio padrão populacional de 15
13
reais. Construa intervalos com 95% e 98% de confiança para o gasto médio de todos
os estudantes. Resp: [67,06; 72,94] e [66,51;73,49]
31. Em uma amostra com 200 estudantes de uma universidade, verificou-se que 57um
intervalo de 95% e 99% de confinfica para a verdadeira proporção de estudantes fa-
voráveis ao determinado projeto. R: ]0:501386; 0:638614[ e ]0:4796816; 0:6603184[
33. Numa pesquisa sobre a opinião dos moradores de duas cidades, A e B, com relação
a um determinado projeto, obteve-se a tabela abaixo. Utilize o Int. confiança de 95%
para avaliar a diferença entre os percentuais de favoráveis nas duas cidades.
Cidade A B
Número de Entrevistados 400 600
Número defavoráveis 180 350
34. De uma população normal com média e variância desconhecidas, extraise uma amostra
de tamanho 15 obtendo-se x̄ = 12 e s2 = 49. Obtenha um intervalo de confiança
para a variância populacional, utilizando o nível de confiança de 95%.
14