Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Nota importante:
• Essas aulas foram produzidos por meio de coletânea dos textos
indicados na bibliografia. Não são citadas diretamente para não
poluir o visual dos mesmos.
• Os textos estão organizados e traduzidos para minha linguagem
didática pessoal.
• Um estudo mais aprofundado deverá ser baseado nas
referências bibliográficas indicadas.
Introdução
Falamos anteriormente que conhecer o tipo de uma variável aleatória é necessário para a
escolha adequada das técnicas estatísticas.
Vamos lidar agora, com as informações geradas por elas!
1. ESTIMAÇÃO
O interesse num determinado parâmetro de uma população, lançamos mão de uma amostra
extraída dessa população, estudamos seus elementos e procuramos, através dessa amostra,
estimar o parâmetro populacional.
Uma estatística desse tipo é chamada de estimador.
Temos dois tipos de estimador:
1. PONTUAL: procura fixar um valor numérico único que esteja satisfatoriamente
próximo do verdadeiro valor do parâmetro
2. INTERVALAR: procura determinar intervalos com limites aleatórios, que abranjam o
valor do parâmetro populacional, com margem de segurança pré-fixada.
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Um estimador é uma variável aleatória, podendo assumir valores diferentes para cada amostra.
Para caracterizá-lo é preciso conhecer sua distribuição de probabilidade.
Exemplo 1: Uma companhia eletrônica fabrica resistores que têm uma resistência média de
100 ohms e um desvio padrão de 10 ohms. A distribuição das resistências é normal. Considere
um lote de 1.000 resistores de sua fabricação. Podemos observar pelo histograma que esse lote
preserva a distribuição normal
80
70
60
Frequencia
50
40
30
20
10
0
70 80 90 100 110 120 130
Resistores
Pode-se observar que essas amostras produzem médias e desvios-padrão diferentes. Então se
for considerado o conjunto de médias dessas amostras, obtêm-se uma nova variável aleatória,
denominada de Média Amostral. Agora o interesse está em se conhecer a distribuição de
probabilidade dessa nova variável aleatória.
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Média=100 ohms
10
n = 50
8
n = 30
Frequencia
6 n = 20
n = 10
4
0
80 90 100 110 120
resistores (ohms)
Genericamente,
Considere uma amostra de tamanho n de uma variável aleatória X com média µ e desvio-
padrão σ , que vamos denotar por X1, X2,..., Xn, e que satisfaça as seguintes condições:
• todos os Xi’s , i=1,2,...,n, são independentes
• cada Xi tem a mesma distribuição de probabilidade de X.
1 1
E(X) = E( X1 + X 2 + ..... + X n ) = [E( X 1 ) + E( X 2 ) + ..... + E( X n )]
n n
1 nµ
= (µ + µ + ..... + µ) = =µ
n n
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
1
Var ( X ) = Var ( X1 + X 2 + ... + X n ) =
n2
1
[Var ( X1 ) + Var ( X 2 ) + ... + Var ( X n )] =
n2
1 nσ 2 σ2
(σ 2 + σ 2 + ... + σ 2 ) = =
n2 n2 n
σ
X ~ N µ,
n
80
População com
70 distribuição
60
Frequencia
50 N (0;1)
40
30
20
10
0
-2,4 -1,6 -0,8 0,0 0,8 1,6 2,4
X -Histograma
população Média Amostral para n=10; n=20; n=30 e n=50
População N(0,1)
20
10
Frequencia
0
Mean30 Mean50
30
20
10
0
-0,6 -0,3 0,0 0,3 0,6
Agora, se a variável aleatória X não for proveniente de uma distribuição normal então a
distribuição da média amostral será aproximadamente normal quando o tamanho da amostra
for grande.
Esse resultado é assegurado pelo Teorema Central do Limite (TCL).
Nos próximos gráficos podemos observar claramente o resultado desse teorema:
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
30
População com
25
distribuição
Uniforme –
Frequencia
20
15 U[0,1]
10
0
0,00 0,15 0,30 0,45 0,60 0,75 0,90
X - população
Histograma Media Amostral para n=10; n=20; n=30 e n=50
População U[0,1]
30
20
10
Frequencia
0
Mean30 Mean50
30
20
10
0
0,32 0,40 0,48 0,56 0,64 0,72
250
distribuição
Binomial (10; 0,15)
Frequencia
200
150
100
50
0
0 1 2 3 4 5 6
X - população
Histograma Média Amostral para n=10; n=20; n=30 e n=50
População Bin(10; 0,15)
18
12
Frequencia
0
Mean30 Mean50
24
18
12
0
1,0 1,2 1,4 1,6 1,8 2,0 2,2
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
160
População com
140 distribuição
120
Exp (1)
Frequencia
100
80
60
40
20
0
0 1 2 3 4 5 6 7
Histograma
expo10 Média Amostral para n=10, n=20, n=30 e n=50
População Exp(1)
20
10
Frequencia
0
Mean30 Mean50
30
20
10
0
0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8
Tamanho da
Distribuição de X Distribuição de X
amostra
σ
σ)
N(µ,σ N µ, qualquer
n
aproximadamente
qualquer σ n > 30
N µ,
n
A média amostral pode ser padronizada da mesma maneira que a população, para efeito de
facilitação do cálculo de suas probabilidades por meio dos valores previamente tabelados:
X−µ
Z= ~ N(0,1)
σ
n
Lembrando apenas que o desvio-padrão a ser utilizado é o da Média Amostral, X .
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Exemplo 2:
Voltando ao exemplo 1, da Companhia eletrônica, suponha que tenha sido levada para o
controle de qualidade, uma amostra de 100 resistores. Suponha que o desvio-padrão de 10
ohms é conhecido como verdadeiro. (1) Qual a estimativa pontual da resistência média para os
resistores dessa companhia? (2) Determine um intervalo simétrico em torno da média que
concentre 95% dos valores amostrados.
Solução de (1):
A estimativa será fornecida pela média obtida dessa amostra: µ
ˆ = x = 101,11 ohms.
Solução de (2):
Precisam ser encontrados os valores a e b tais que,
P(a ≤ X ≤ b) = 0,95
a − 101,11 b − 101,11
P ≤Z≤ = P(z a ≤ Z ≤ z b ) = 0,95
10 10
100 100
Logo,
a − 101,11 b − 101,11
za = = −1,96 ⇒ a = 99,15 e zb = = 1,96 ⇒ b = 103,07
10 10
100 100
Dessa maneira, um intervalo em torno da média que concentra 95% dos valores da média
amostral é de 99,15 a 103,07 ohms.
Conclusão: nesse exemplo 2 tem-se que, em uma amostra de 100 resistores a estimativa média
pontual das resistências é 101,11 ohms e a intervalar, com 95% de confiança, é de 99,15 a
103,07 ohms.
Genericamente, uma estimativa intervalar para a média com 100(1-a)% de confiança é dada
por:
X−µ
P − z α 2 ≤ ≤ zα 2 = 1 − α
σ
n
σ σ
P X − z α 2 ≤ µ ≤ X + zα 2 =1− α
n n
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Ou podemos escrevê-lo: (X ± E )
E E
x−E x x+E
σ
Em que, E = z α 2 , é denominado de o erro máximo provável ou precisão amostral.
n
Esse é o famoso erro “para mais” ou “para menos” tão difundido em épocas eleitorais...
Mas....
O que quer dizer “confiança”?
Sabe-se que para cada amostra diferente retirada de uma população poderá ser observado
valores diferentes para a média e o desvio-padrão e consequentemente ter-se-á intervalos
diferentes, pois os limites dos intervalos são aleatórios.
Não pode-se afirmar com certeza que o valor µ estará incluído dentro do intervalo, mas, pode-
se dizer que com 100(1- α )% de confiança o verdadeiro valor de µ pertence ao intervalo.
Isso quer dizer que se for observado um grande número de amostras de mesmo tamanho e
para cada amostra for calculado um intervalo de 95% de confiança ( α =0,05), por exemplo,
cerca de 95% dos intervalos conterão o verdadeiro valor de µ .
106
104
102
Data
100 100
98
96
94
92
1 2 3 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0
A A A A A A A A A1 A 1 A 1 A 1 A 1 A 1 A 1 A 1 A 1 A 1 A 2 A 2 A 2 A 2 A 2 A 2 A 2 A 2 A 2 A 2 A3
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Observe que 29 dentre os 30 intervalos, o que corresponde a 96,7% dos intervalos, contiveram
o verdadeiro valor da média µ =100 ohms.
Se o número de amostras for aumentado, a proporção de intervalos que conterão µ tenderá a
ficar mais próxima de 95%.
Considere uma amostra de tamanho n de uma variável aleatória X, representada por X1, X2, ...,
Xn, em que cada Xi será definida por:
1, se ocorre sucesso
Xi =
0, se ocorre fracasso
Seja p a probabilidade de sucesso que será estimada pela proporção amostral de sucessos
n
número de sucessos
∑X
i=1
i
p̂ = = =X
n n
Ou seja, uma proporção amostral nada mais é do que uma média amostral de uma variável
aleatória que assume valores 0’s e 1’s.
Como os Xi’s são ensaios de Bernoulli, então µ = p e σ 2 = p(1-p). Pelo Teorema Central do
Limite, pode-se escrever:
p̂ − p
≈ N(0,1)
p(1 − p)
n
)
Então o intervalo de 100(1- α )% pode ser escrito: p ± E
0,1176(1 − 0,1176)
E = 1,96 ≅ 0,0685
85
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Isso significa, que com 95% de confiança pode-se dizer que de 4,9% a 18,6% dos eixos dos
motores terão rugosidade no acabamento da superfície que excede as especificações.
2. TESTE DE HIPÓTESES
Problema ilustrativo:
Exemplo 4: Um fabricante de resistores afirma que suas resistências são normalmente
distribuídas com média de 100 ohms e desvio-padrão de 10 ohms. Suspeita-se, entretanto, que
a resistência média é menor do que o anunciado. Para decidir se a suspeita sobre a média tem
procedência ou não, foi retirada uma amostra aleatória de 25 resistências e foi considerado o
desvio-padrão do fabricante como correto.
Para decidir qual dessas hipóteses é verdadeira é preciso um critério para tomada de decisão:
Critério de decisão é baseado na estatística do teste que mede a discrepância entre o que
foi observado na amostra (25 resistências) e o que seria esperado se a hipótese nula fosse
verdadeira, ou seja, H0 será julgada.
Situação real
Decisão
H0 verdadeira H0 falsa
Rejeitar H0
Decisão incorreta
Decisão correta
(resistência não é (Erro tipo I)
100 ohms)
Não rejeitar H0
Decisão incorreta
Decisão correta
(Erro tipo II)
(resistência é 100)
Erro do tipo I:
A probabilidade de se cometer esse erro recebe o nome de nível de significância do
teste, sendo usualmente representado pela letra grega α.
No exemplo:
• Erro tipo I: concluir que a resistência média é menor que 100 ohms quando na
realidade ela é igual a 100 ohms;
• Erro tipo II: concluir que a resistência média é igual a 100 ohms quando na realidade
ela é diferente de 100 ohms
Para um tamanho de amostra fixo (dados coletados) não é possível controlar os dois erros
simultaneamente, conforme pode ser observado na figura a seguir:
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Sob H1 Sob H0
α β
Por outro lado, os dois tipos de erro são indesejáveis.
O erro tipo I é considerado, na maioria dos testes, como o mais grave sendo então controlado
na análise dos dados. Ele é equivalente a julgar um assassino e dar o veredicto: inocente. Ou
dizer que uma pessoa está sadia, quando na realidade ela está com um tumor maligno
(câncer)....
O erro tipo II pode ser controlado no planejamento do estudo por meio da determinação de um
tamanho de amostra adequado.
Dessa maneira, o erro tipo I será utilizado no processo de julgamento de H0 , feito na análise
dos dados.
Para esse julgamento, precisamos de algum critério para tomada de decisão. Por exemplo:
fixando α= 0,05 e determinando um valor crítico, xc tal que a probabilidade dos valores das
médias estarem abaixo dela seja de 5%, temos:
x − 100
P( X < x c ) = P Z < c = 0,05
2
Como, P(Z < −1,64 ) = 0,05 temos,
x c − 100
= −1,64 ⇒ x c = 96,72
2
ou seja, a probabilidade de uma média amostral ser menor que 96,72 ohms é de 0,05.
Nesse exemplo, de uma população com µ =100 ohms e σ =10 ohms, fixando α =0,05 (5%)
obteve-se x0=92,72 ohms tal que para qualquer média de uma amostra com 25 elementos tem-
se:
P( X < x c ) = 0,05
Retirando-se uma amostra, cuja média é x0 , pode-se estabelecer o seguinte:
Se x 0 > x c ⇒ aceita - se H0
Se x 0 ≤ x c ⇒ rejeita - se H0 (aceitando − se H1 )
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
xc
A região em que se rejeita H0, quando a média da amostra pertencer a ela, é chamada de
REGIÃO CRÍTICA ou REGIÃO DE REJEIÇÃO DO TESTE.
Conclusão:
Se a média x0 de uma amostra de 25 resistências for menor que xc=96,72 ohms , tem-se uma
das duas alternativas:
1. O fabricante está certo, a média da população de resistências é µ =100 ohms e foi
obtida uma amostra com pouca chance de ocorrer erro por puro acaso.
2. O fabricante não diz a verdade, pois obteve-se tal média amostral porque a
probabilidade de sua ocorrência não era tão pequena, ou seja, a média da população é
menor que 100 ohms.
Qual delas escolher?
Nesse exemplo foi utilizado o teste Z para uma média em que foi suposto que o desvio-padrão
da população ( σ ) era conhecido.
A estatística do teste, calculada para os dados observados (zobs), é dada por:
x − µ0
z obs =
σ
n
Que é comparada com um valor crítico (zc) que depende do nível de significância adotado ( α )
e do tipo do teste (unicaudal ou bicaudal).
No nosso exemplo, zc = -1,64
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
-2 -1,64 0
µ 96,72
O próximo quadro apresenta as regiões críticas para teste unilateral (unicaudal) e bilateral
(bicaudal):
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Se essa probabilidade (p-valor) é maior do que α , decide-se por não rejeitar H0.
Exemplo 5: Um mancal usado em uma aplicação automotiva deve ter um diâmetro nominal de
38,01 mm. Sabe-se que o diâmetro do mancal é normalmente distribuído com desvio-padrão de
0,254 mm. Foi selecionada uma amostra aleatória de 36 mancais e o diâmetro interno médio
desses mancais é de 37,97 mm. Verifique, ao nível de 5% de significância, se esses diâmetros
diferem do valor nominal exigido.
Solução:
As hipóteses de interesse são:
Ho : µ = 38,01 mm
H1 : µ ≠ 38,01 mm
onde µ é o verdadeiro valor dos diâmetros e µ 0 é o valor nominal especificado pela indústria
automobilística (38,01 mm)
A estatística de teste é
37,97 − 38,01
z obs = ≅ −0,95
0,254
36
A probabilidade observada do erro tipo I é de 34,2% bem maior que 5% confirmando que as
evidências indicam que H0 não é falsa
0,17106 0,17106
0,025 0,025
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
0,254
37,97 ± 1,96 = [37,97 ± 0,083] = [37,887 ; 38,053]
36
X − µ0
Z=
dp( X )
Como uma proporção pode ser considerada como uma média, a estatística do teste para
H0 : p = p 0 é
pˆ − p 0 pˆ − p 0
z obs = =
dp(p 0 ) p 0 (1 − p 0 )
n
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
H0 : p = p 0 pˆ − p 0
Unilateral à z obs = < −z α
esquerda
p 0 (1 − p 0 ) P(Z < zobs)
H1 : p < p 0
n
ˆp − p 0
H0 : p = p 0 z obs = > zα
Unilateral à
direita
p 0 (1 − p 0 ) P(Z > zobs)
H1 : p > p 0
n
pˆ − p 0
z obs = < −z α
p 0 (1 − p 0 ) 2
n
H0 : p = p 0 2P(Z < - zobs)
Bilateral ou
H1 : p ≠ p 0 (pela simetria)
pˆ − p 0
z obs = > zα
p 0 (1 − p 0 ) 2
n
15
p̂ = = 0,003
5.000
0,003 − 0,002
Z obs = = 1,58
O valor observado da estatística do teste é 0,002(1 − 0,002)
5.000
0,943
R.R. de H0
0,01
-2,33 1,58
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
0,003 ± 1,96 0,003x 0,997 = (0,0015 ; 0,005) = (0,15% ; 0,5%)
5.000
Ou seja, com 95% de confiança, a verdadeira proporção de baterias dos telefones celulares que
falham está entre 0,15% e 0,5%. Observe que este intervalo contém o valor p0 = 0,2%, o que
confirma a decisão de não rejeição de H0 do teste de hipóteses, considerando o nível de
significância de 5%.
Solução:
O problema nos forneceu:
X: quantidade de álcool presente na gasolina, ml/litro
n=25
X ~ N ( µ ; 2,5)
a) A estimativa pontual para a média populacional, µ , é obtida pela média dos dados
coletados:
µˆ = x = 240,75 ml/litro
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Logo, X ~ N (240,75; 2,5) e a média amostral X ~ N 240,75; 2,5
25
(esse é o erro conhecido como 0,98 “ para mais” e 0,98 “para menos”.....)
R.R. de H0
R.A. de H0
Zc=1,64
Isso significa que P(Z > 1,64) = 0,05, que é a probabilidade do erro tipo I ou a probabilidade
máxima aceita ao tomar a decisão de rejeitarmos H0 (afirmar que ela é falsa), quando na
realidade ela é verdadeira.
O teste baseia-se na comparação da estatística do teste observada com esse valor crítico
Como zobs < 1,64, ele pertence à região de aceitação de H0, ou seja, podemos afirmar com
95% de confiança que a quantidade de álcool encontrada na gasolina dessa rede de postos não
é considerada como adulterada.
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Outra maneira de tomarmos essa decisão é por meio do cálculo do p-valor. Se p-valor for
menor ou igual a 0,05 (erro máximo aceitável do teste conhecido como nível de significância)
então a hipótese nula deverá ser rejeitada.
Nesse exemplo, o p-valor = P(Z> zobs), pois o teste é unilateral (ou unicaudal). Então,
P(Z > zobs) = P(Z > 1,50) = P(Z < -1,50) = 0,066807 (~6,7%)
Ou seja, p-valor = 0,067 > 0,05 – confirmando a indicação de não rejeição de H0.
Solução:
Seja:
X: tempo de duração da lâmpada, em horas.
X ~ N(1.570; 120) – µ foi estimada pela amostra:
n = 100
H0 : µ = 1.600 vs H1: µ ≠ 1.600
α = 0,02
1.570 − 1600
z obs = = = −2,50
120 12
100
R.A. H0
R.R. H0 R.R. H0
0,01 0,01
-2,32 2,32
Zobs =-2,50
p-valor= P(Z < -2,5) = 0,0062 → a probabilidade de estarmos errando ao tomarmos a decisão
de rejeitarmos a hipótese nula (dizer que ela é falsa) é de 0,62%. Confirma que o fabricante
está equivocado em sua informação!
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Conclusão: ao nível de significância de 2%, ou seja, com 98% de confiança, podemos dizer
que a duração da lâmpadas se alterou, ou seja, sua duração é diferente de 1.600 horas. A
afirmação do fabricante não é verdadeira.
Obs.:
Como o zobs< 0, a indicação é de que o tempo de duração é menor que 1.600 horas. Equivale a
considerar a hipótese alternativa, H1 : µ < 1.600
Ao nível de significância de 2% ( α = 0,02) e considerando o teste unilateral à esquerda, então
z α = z0,02 = -2,05
Como zobs < z α a indicação é de rejeição de H0, confirmando que o tempo de duração das
lâmpadas é menor que 1.600 horas.
3) Um censo de há dois anos passados revelou que 20% das famílias de uma grande
comunidade viviam abaixo do nível de pobreza. Para determinar se essa porcentagem se
modificou, estudou-se uma amostra aleatória de 500 famílias, encontrando-se 91 abaixo do
nível de pobreza.
a) Qual é a estimativa pontual da proporção de famílias dessa comunidade que vivem
atualmente abaixo do nível de pobreza?
b) Calcule e interprete um intervalo de 95% de confiança para a proporção de famílias
dessa comunidade que vivem atualmente abaixo do nível de pobreza.
c) Com base no intervalo de confiança calculado, qual é a margem de erro?
d) Ao nível de 5% de significância, o resultado amostral indica que a porcentagem atual
difere da porcentagem verificada há dois anos? Não se esqueça de escrever as
hipóteses, calcular a estatística do teste, calcular e interpretar o valor p e tirar a
conclusão. (faça o teste baseado na distribuição normal)
Solução:
91
a) A estimativa pontual é: p̂ = = 0,182
500
p̂ − p
≈ N(0,1)
b) Sabemos que para n > 100, p(1 − p)
n
Isso significa que podemos dizer com 95% de confiança que o verdadeiro valor da porcentagem
de famílias que vivem abaixo do nível de pobreza nessa grande comunidade está entre 14,8% e
21,6%.
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
A estatística do teste é:
p̂ − p 0 0,182 − 0,20
z obs = = = −1,01
p 0 (1 − p 0 ) 0,20(1 − 0,20)
n 500
0,025 0,025
-1,96 zobs
Podemos concluir com 95% de confiança que o percentual de famílias que vivem abaixo do
nível de pobreza nessa grande comunidade não se modificou.
OBS.: Comparando esse resultado com o intervalo de confiança obtido no item (b) podemos
verificar que 20% está dentro dele!!
Questão 1: De uma população normal X, com variância igual a 9, foi retirada uma amostra
25
com 25 observações, obtendo ∑ x i = 152 . Os limites (L) em que se corre o risco de 10% que
i =1
o verdadeiro valor da média populacional µ seja menor que Linf ou maior que Lsup, são
aproximadamente:
a) 3,128 ; 9,032
b) 5,096 ; 7,064
c) 2,551 ; 9,606
d) 4,904 ; 7,256
Correta: B
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Solução:
Temos: X ~ N( µ ; 3), pois σ 2 = 9 ; n = 25 e ∑x
i
i =152
∑x i
152
Logo, x= i
= ≅ 6,08
n 25
Então a estimativa pontual para a verdadeira média é :
3
µˆ = x = 6,08 ⇒ X ~ N 6,08; ⇒ X ~ N (6,08; 0,6 )
25
Para α =10%, significa que P(-1,64 < Z < 1,64) = 0,90 (pois P(Z<-1,64)=0,05, pela Tabela 3)
Calculando um intervalo com 90% de confiança para µ , tem-se:
σ
E = zα = (1,64)(0,6) = 0,984 ⇒ x ± E = 6,08 ± 0,984 ⇒ (5,096; 7,064)
2 n
Questão 2: Para uma população normal com variância conhecida σ 2 , o nível de significância
σ σ σ σ
para os intervalos: (1) x − 2,14 ≤ µ ≤ x + 2,14 e (2) x − 1,85 ≤ µ ≤ x + 1,85
n n n n
. São aproximadamente:
a) 1,6% e 3,3%
b) 98,4% e 96,7%
c) 96,8% e 93,6%
d) 3,2% e 6,4%
Correta: D
Solução:
X ~ N( µ ; σ ) com σ 2 conhecida
(1) tem-se que zα = 2,14 . Pela Tabela 3, verifica-se que P(Z < -2,14) = 0,016177, que por
2
(2) Processo análogo ao (1) encontra-se P(Z < -1,85) = 0,032157 ⇒ α ≅ 6,4%
Questão 3: Com base em experiências passadas, sabe-se que a resistência à quebra de um fio
2
usado na fabricação de material moldável é normalmente distribuída com variância σ = 4 psi.
Uma amostra aleatória de 16 espécimes é testada e a resistência média à quebra é 98 psi. Uma
estimativa intervalar, com nível de significância α de 10%, para a resistência média da
população é aproximadamente:
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
a) 97,2 a 98,8
b) 93,1 a 102,9
c) 95,3 a 95,7
d) 96,0 a 100,0
Correta: A
Solução:
Seja, X: resistência à quebra do fio, em psi
X ~ N( µ ; 2), pois σ 2 = 4 ; n = 16 e x = 98
2
µˆ = x = 98 ⇒ X ~ N 98; ⇒ X ~ N (98; 0,5)
16
Para α =10%, significa que z α = 1,64 (pois P(Z<-1,64)=0,05, pela Tabela 3).
2
Correta: C
Solução:
Seja o evento D: dispositivo defeituoso
Num lote de 1000 tem-se 823 não defeituosos e 117 defeituosos.
Então,
) 117
p = P( D) = = 0,117 - que é a estimativa para a verdadeira proporção de dispositivos
1000
defeituosos dessa indústria.
pˆ − E p̂ pˆ + E
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
2
)
pˆ (1 − p )
)
pˆ (1 − p ) zα
Por definição: E = zα ⇒ n = zα ⇒n = 2 [ pˆ (1 − p) ) ]
2 n 2 E E
)
Dados: E =0,03 ; p = 0,117 ; α = 5% ⇒ zα = 1,96
2
2
1,96
Então, n = (0,117)(0,823) ≅ 622
0,03
Correta: B
Solução:
Seja o evento X: tempo de resposta, em milissegundos; σ = 12
Dado:
6
µ̂ − E µ̂ µ̂ + E
σ σ σ
2
Tem-se: E = zα ⇒ n = zα ⇒ n = zα
2 n 2 E 2 E
Logo,
σ
2 2
12
n = zα = 1,96 ≅ 62
2 E 6
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
se uma média de 210 kg. Ao nível de 10%, das alternativas abaixo o fabricante pode aceitar
como Verdadeira:
a) que a resistência média de suas lajotas não aumentou
b) que a resistência média de suas lajotas aumentou
c) que a amostra foi pequena para a conclusão desse teste
d) o novo material introduzido deve ser descartado
Correta: B
Solução:
Seja X: resistência da lajota, em kg.
σ
X ~ N( µ ; 12) ; n = 30; x = 210 e dp (X )= σ X
= =
12
≅ 2,16
n 30
H 0 : µ = 206
Hipóteses:
H 1 : µ > 206
Teste unilateral à direita. Considerando α = 10%; a hipótese nula, H0, deverá ser rejeitada se
zobs > 1,28 , pois z0,10 = 1,28 (ou P(Z > 1,28) = 0,10)
R.R. H0
0,10
1,28
210 − 206.
Tem-se, z obs = ≅ 1,83
2,16
Como zobs > z0,10 (1,83 > 1,28), a evidência é a rejeição da hipótese nula. Donde se conclui,
com 90% de confiabilidade, que a verdadeira média obtida da resistência da lajota aumenta
com o acréscimo da substância.
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
H1 : µ ≠ 5 V., usando uma amostra com 8 unidades. Decida se cada uma das afirmativas a
seguir é Verdadeira (V) ou Falsa (F):
R.R. H 0 R.R. H0
R.A. H0
α α
2 2
Por
simetria
Correta: F
Solução:
0,25
Se n = 16 então ⇒ X ~ N µ; ⇒ X ~ N(µ;0,0625)
16
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
4,85 − 5 5,15 − 5 − 0,15 0,15
α=P Z≤ +P Z ≥ = P Z ≤ + P Z ≥
0,25 0,25 0,0625 0,0625
16 16
α = 2 P(Z ≤ −2,4) = 2(0,0082) = 0,0164
Logo α é menor.
c) A potência (ou poder) do teste para detectar uma voltagem de saída média
verdadeira de 5,1 V é de 28,7%;
Correta: V
Solução:
Correta: V
Solução:
Correta, pois em (a) n = 8 e α = 0,089;
E em (c) n = 16 e α = 0,0164.
Logo α é menor.
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Correta: D
Solução:
H0 : p = 0,10
H1 : p ≠ 0,10
α = 2% ⇒ z 0 ,01 = 2,32
72
Proporção estimada: p̂ = = 0,144
500
0,144 (1 − 0,144 )
E = 2,32 = 0,0364268
500
Estimativa intervalar com 98% de confiança: 0,144 ± 0,0364268 ⇒ (0,1075 ; 0,1805) ⇒
(10,755 ; 18,05%)
Conclusão: p-valor < 0,02 ⇒ a hipótese nula é rejeitada (ela é falsa) ⇒ hipótese alternativa é
aceita como verdadeira, ou seja, o percentual de motoristas que falam ao telefone é diferente
de 10% (nesse caso é maior) - a empresa de seguro está com a razão.
p̂ − p 0 0,144 − 0,10
Estatística do teste: z obs = = ≅ 3,28
p 0 (1 − p 0 ) 0,10(1 − 0,10)
n 500
Teste unilateral, então p-valor = P(Z > zobs) = (Z > 3,28) ≅ 0,000
Correta: C
Solução:
Seja X: espessura das garrafas, em mm
Temos: n=25 ; x = 4,05; dp( X ) = 0,08
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
α = 5% ⇒ z α = 1,96
2
0,08
E = 1,96 = (1,96)(0,016) = 0,03136
25
Correta: D
Solução:
) 10
A proporção de defeituosos estimados nessa amostra: p = ≅ 0,1176
85
α = 5% ⇒ z α = 1,96
2
E = 5% = 0,05
pˆ (1 − pˆ ) pˆ (1 − pˆ )
Do erro máximo provável temos: E = zα = zα . Isolando o
2 n 2
n
2
pˆ (1 − pˆ )
valor de n dessa fórmula obtemos: n = zα .
2 E
p̂(1 − p̂) = 0,1176(1 − 0,1176) = 0,10376 = 0,3221
Então,
2
p̂(1 − p̂) 0,3221
2
n = zα = 1,96 = (12,627) 2 ≅ 159,46.
2 E 0,05
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Os valores calculados para essa amostra da: (1) estimativa pontual da espessura média do
óxido para todas as pastilhas na população, (2) o erro-padrão da estimativa pontual do item
(1), (3) a estimativa pontual da proporção de pastilhas na população que tem uma espessura
de óxido maior do que 430 angströms são, respectivamente, aproximados por:
a) 433,0; 9,08; 0,302
b) 423,3; 1,85; 0,292
c) 423,3; 9,08; 0,292
d) 433,0; 1,85; 0,302
Resposta: B
Solução:
µ
ˆ = x =423,3
σ 9,08
2) O erro-padrão da média é obtido por: ep = = =1,85
n 24
3) Os dados apresentam 7 espessuras maiores que 430, logo a estimativa pontual da
7
proporção será de = 0,292
24
Questão 12: Para uma população normal com variância conhecida σ 2 , o nível de confiança
σ σ σ σ
para os intervalos: (1) x − 2,14 ≤ µ ≤ x + 2,14 e (2) x − 1,85 ≤ µ ≤ x + 1,85
n n n n
. São aproximadamente:
a) 1,6% e 3,3%
b) 98,4% e 96,7%
c) 96,8% e 93,6%
d) 3,2% e 6,4%
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Resposta: C
Solução:
Questão 13: O calor liberado, em calorias por grama, de uma mistura de cimento tem
distribuição aproximadamente normal. A média deve ser 100 e o desvio-padrão é 2. Deseja-se
Resposta: B
Solução:
X: calor liberado em calorias por grama
X ~N (100; 2)
n =9 e x =100
I.C. com 95%: x ± E
Mas, I.C. com 95%: 98,5 ≤ x ≤ 101,5
Logo, a amplitude do intervalo de confiança é 101,5 – 98,5 = 3 = 2E, donde E = 1,5
σ n 9
Por definição, E = zα ⇒ zα = E = 1,5 ≅ 2,25
2 n 2 σ 2
E a P(Z < -2,25) = P(Z > 2,25) = 0,01224 – da tabela da normal
Dessa maneira,
α = P(Rejeitar H0 | H0 é verdadeira) = p-valor = 2(0,01224) = 0,024448 ≅ 2,4%
Questão 14: O calor liberado, em calorias por grama, de uma mistura de cimento tem
distribuição aproximadamente normal. A média deve ser 100 e o desvio-padrão é 2. Deseja-se
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Se a região de aceitação da hipótese nula for definida como 98,5 ≤ x ≤ 101,5, o valor da
probabilidade β do erro tipo II para o caso em que o verdadeiro calor médio liberado seja de
103, é aproximadamente:
a) 0,05
b) 0,024
c) 0,012
d) 0,09
Resposta: C
Solução:
Para µ =103, temos β =P(98,5 ≤ x ≤ 101,5 | µ =103)
98,5 − 103 x − 103 101,5 − 103
β = P ≤ ≤ = P(-6,75 ≤ Z ≤ -2,25)
2 2 2
9 9 9
= P(Z ≤ -2,25) - P(Z ≤ -6,75) = 0,01222 – 0
Logo, β ≅ 0,012
Questão 15: Um pesquisador afirma que no mínimo 10% dos capacetes utilizados nas provas
de ciclismos têm falhas de fabricação que poderiam causar danos físicos ao usuário. Uma
amostra de 200 capacetes revelou que 16 deles continham tais defeitos. Das afirmações a
seguir, a única que está CORRETA, considerando o nível de significância de 5%, é:
a) A hipótese nula foi rejeitada, logo a afirmativa do pesquisador está correta.
b) A hipótese nula foi aceita, logo a afirmativa do pesquisador está incorreta.
c) O pesquisador está correto em sua afirmativa, pois p-valor < 0,05.
d) O pesquisador está correto em sua afirmativa, pois o poder do teste é de 95%.
Resposta: B
Solução:
Pesquisador afirma: p ≥ 10% = 0,10
) 16
Amostra com n = 200, 16 são defeituosos ⇒ p= = 0,08
200
Hipóteses do pesquisador: H0 : p = 0,10 vs. H1: p > 0,10
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
)
p− p 0,08 − 0,10
Teste: zobs = = = −0,94
p (1 − p ) (0,10)(0,90)
n 200
Logo, se α = 5% , z α =1,64, como zobs < 1,64 ⇒ H0 é aceita ⇒ afirmativa do pesquisador
está incorreta.
Resposta: C
Solução:
n = 20 e x = 153,7 psi
153,7 − 150
Teste: zobs = = 1,46
11,3
20
Logo, se α = 5% , z α =1,64, como zobs < 1,64 ⇒ H0 é aceita ⇒ H1 é rejeitada
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
Questão 17: Deseja-se obter uma estimativa de intervalo de confiança para o ganho em um
circuito de um dispositivo semicondutor. Suponha que o ganho seja normalmente distribuído
com média igual a 1000 e desvio-padrão igual a 20. O erro máximo provável (erro amostral)
obtidos na construção de intervalos de 95% de confiança para uma amostra de tamanho 10,
outro para uma amostra de tamanho 25 e outro para uma amostra de tamanho 50, são
respectivamente:
a) 4,639; 6,560; 12,372
b) 10,372; 6,560; 4,639
c) 12,396 ; 7,840 ; 5,544
d) 5,544; 7,840 ; 12,396
Correta: C
Solução:
Seja X: ganho em circuitos semicondutores
20
X ~ N (1.000; 20) ⇒ X ~ N1.000;
n
20
1) para n = 10 ⇒ X ~ N1.000; ⇒ X ~ N(1.000; 6,3245)
10
20
2) para n = 25 ⇒ X ~ N1.000; ⇒ X ~ N(1.000; 4)
25
I.C.95% : E = (1,96)(4) = 7,84 → {I.C.: (1.000 ± 7,84) → (992,16 ; 1.007,84)}
20
3) para n = 50 ⇒ X ~ N1.000; ⇒ X ~ N(1.000; 2,828)
50
I.C.95% : E = (1,96)(2,828) = 5,544 → {I.C.: (1.000 ± 5,544) → (994,456 ; 1.007,544)}
e)
Questão 18: Suponha que foram retiradas 100 amostras aleatórias de água proveniente de
um lago com água límpida, sendo medida a concentração de cálcio em miligramas por litro. Um
intervalo com 95% de confiança para a concentração média de cálcio é 0,49 ≤ µ ≤ 0,82 .
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
95% de que o verdadeiro valor tenha sido encontrado, ou seja, admite-se um erro máximo de
5% de erro
b) Se 100 amostras aleatórias de água proveniente do lago forem tomadas e o
Intervalo de Confiança de 95% para for calculado e se esse processo for repetido
por 1.000 vezes, 950 dos intervalos de confiança conterão o valor verdadeiro de .
Correta: V
Solução:
CORRETO. Nível de confiança tem exatamente esse conceito, num processo de repetições
aleatórias espera-se encontrar o verdadeiro valor em 95% dos intervalos construídos para cada
uma dessas repetições. Nesse caso, se forem feitas 1.000 repetições do processo é esperado
que 950 dos intervalos construídos contenham o verdadeiro valor da média e que 50 deles (5%
de 1.000) venham a falhar. Os limites (inferior e superior) dos intervalos são variáveis
aleatórias
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
13
pˆ = ≅ 0,043
300
0,043(1 − 0,043)
desvio − padrão de pˆ : dp( pˆ ) = ≅ 0,0117
300
I.C. de 90% → = 10% = 0,10 ⇒ z α = z 0 ,05 = 1,64
2
E = (1,64)(0,0117) = 0,0192
Logo, I.C.98% : (0,043 ± 0,0192) ⇒ (0,0238 ; 0,0622) ⇒ (2,4% ; 6,2%)
Solução:
H0 : p = 0,25
H1 : p < 0,25
80
Proporção estimada: p̂ = = 0,20
400
p̂ − p 0 0,20 − 0,25
Estatística do teste: z obs = = ≅ −2,30
p 0 (1 − p 0 ) 0,25(1 − 0,25)
n 400
Teste unilateral, então p-valor = P(Z < zobs) = P(Z < -2,31) = 0,0107 ≅ 0,011
Conclusão: p-valor < 0,05 ⇒ a hipótese nula é rejeitada (ela é falsa) ⇒ hipótese alternativa é
aceita como verdadeira.
Portanto:
a) A hipótese alternativa (H1: p < 0,25) é rejeitada, pois p-valor= 0,011
FALSA
b) A hipótese alternativa (H1: p < 0,25) é aceita, pois p-valor= 0,011
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
VERDADEIRA
c) A hipótese nula (H0: p = 0,25) é aceita, pois p-valor= 0,011
FALSA
d) A hipótese nula (H0: p = 0,25) é rejeitada, pois p-valor= 0,011
VERDADEIRA
72
Proporção estimada: p̂ = = 0,144
500
0,144 (1 − 0,144 )
E = 2,32 = 0,0364268
500
Conclusão: p-valor < 0,02 ⇒ a hipótese nula é rejeitada (ela é falsa) ⇒ hipótese alternativa é
aceita como verdadeira, ou seja, o percentual de motoristas que falam ao telefone é diferente
de 10% (nesse caso é maior) - a empresa de seguro está com a razão.
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
α = 2% ⇒ z 0, 02 = 2,05
p̂ − p 0 0,144 − 0,10
Estatística do teste: z obs = = ≅ 3,28
p 0 (1 − p 0 ) 0,10(1 − 0,10)
n 500
Teste unilateral, então p-valor = P(Z > zobs) = (Z > 3,28) ≅ 0,000
Conclusão: hipótese nula é rejeitada, consequentemente a hipótese alternativa é verdadeira e
nesse caso, corrobora a empresa de seguro
Questão 22: Uma pesquisa com 150 executivos de recursos humanos mostrou que 44% deles
acreditam que “pequeno ou nenhum conhecimento da companhia” é o erro mais freqüente
cometido pelos candidatos, durante entrevistas para emprego. Ao nível de significância de 5%
para testar a afirmativa de que metade de todos os executivos identifica aquele erro como o
mais comum em entrevistas para emprego, pode-se concluir:
a) A afirmativa está correta, pois o p-valor é 0,142
b) A afirmativa está incorreta, pois o p-valor é 0,142
c) A afirmativa está correta, pois a estatística do teste Z é 1,96
d) A afirmativa está incorreta, pois o nível de significância é de 5%
Correta: A
Solução:
H0 : p = 0,50 vs H1 : p ≠ 0,50
Temos: n = 150 e p̂ = 0,44
p̂ − p 0 0,44 − 0,50
Estatística do teste: z obs = = ≅ −1,47
p 0 (1 − p 0 ) 0,50(1 − 0,50)
n 150
Teste bilateral, então p-valor = 2P(Z < zobs) = 2P(Z < -1,47= 2(0,070781)=0,14156
Conclusão: p-valor > 0,05 ⇒ a hipótese nula não é rejeitada (ela é verdadeira) ⇒ a afirmativa
está correta
Questão 23: Sabe-se que a vida, em horas, de uma bateria tem aproximadamente uma
distribuição normal com desvio-padrão de 1,25 horas. O fabricante garante que a vida útil das
baterias excede 40 horas. Uma amostra aleatória de 10 baterias tem uma vida média de 40,5
Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
horas. Faça o teste estatístico adequado usando um nível de significância de 5%. Decida se
cada uma das afirmações a seguir é Verdadeira (V) ou Falsa (F):
a) O fabricante está correto, pois o teste indica rejeição de H0
b) O fabricante está incorreto, pois o teste indica aceitação de H0
c) O fabricante está incorreto, pois a estatística do teste é menor que 1,96
d) O fabricante está incorreto, pois p-valor é maior que 0,05
Solução:
X: tempo de vida das baterias, em horas
X ~ N( ; 1,25)
Temos: n = 10 e x = 40,5
H0 : µ = 40
H1 : µ > 40
40,5 − 40 0,5
z obs = = = 1,26
1,25 0,39528
10
Teste unilateral, zobs < zcrítico=1,64 ⇒ indicação: não rejeitar a hipótese nula , isto significa que
o tempo de vida das baterias Não excede 40 h.
Teste unilateral, então p-valor = P(Z > zobs) = P(Z > 1,26) = P(Z < -1,26)= 0,103835
Conclusão: p-valor > 0,05 ⇒ a hipótese nula não é rejeitada (ela é verdadeira) ⇒ hipótese
alternativa é aceita como falsa
a) O fabricante está correto, pois o teste indica rejeição de H0
FALSA