Você está na página 1de 39

129

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Essa Unidade está no capítulo 7, 8 9 e 10 do livro base:


MONTGOMERY, Douglas C, RUNGER, George C. Estatística aplicada
e Probabilidade para Engenheiros. 4ª edição. Rio de Janeiro: LTC,
2009.
Você também pode, se preferir, fazer a leitura dos capítulos 7, 8 e 9
do livro do Mario Triola, Introdução à Estatística, LTC, 2005.
Cópias desses capítulos podem ser obtidas por meio da Pasta do
Professor (www.pastadoprofessor.com.br), fazendo login nessa
página e enviando-as para serem impressas na Copiadora Set (casa
amarela) da Unidade do Coração Eucarístico, ou em alguma outra
copiadora da Unidade a que o aluno pertence.
Não deixem de ler!

Nota importante:
• Essas aulas foram produzidos por meio de coletânea dos textos
indicados na bibliografia. Não são citadas diretamente para não
poluir o visual dos mesmos.
• Os textos estão organizados e traduzidos para minha linguagem
didática pessoal.
• Um estudo mais aprofundado deverá ser baseado nas
referências bibliográficas indicadas.

Algumas notas de aulas:

Introdução

Falamos anteriormente que conhecer o tipo de uma variável aleatória é necessário para a
escolha adequada das técnicas estatísticas.
Vamos lidar agora, com as informações geradas por elas!

1. ESTIMAÇÃO

O interesse num determinado parâmetro de uma população, lançamos mão de uma amostra
extraída dessa população, estudamos seus elementos e procuramos, através dessa amostra,
estimar o parâmetro populacional.
Uma estatística desse tipo é chamada de estimador.
Temos dois tipos de estimador:
1. PONTUAL: procura fixar um valor numérico único que esteja satisfatoriamente
próximo do verdadeiro valor do parâmetro
2. INTERVALAR: procura determinar intervalos com limites aleatórios, que abranjam o
valor do parâmetro populacional, com margem de segurança pré-fixada.

© Tânia F Bogutchi – PUC Minas – Revisão 2012


130

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Um estimador é uma variável aleatória, podendo assumir valores diferentes para cada amostra.
Para caracterizá-lo é preciso conhecer sua distribuição de probabilidade.

• Distribuição amostral da MÉDIA

Exemplo 1: Uma companhia eletrônica fabrica resistores que têm uma resistência média de
100 ohms e um desvio padrão de 10 ohms. A distribuição das resistências é normal. Considere
um lote de 1.000 resistores de sua fabricação. Podemos observar pelo histograma que esse lote
preserva a distribuição normal

Histograma do lote de Resistores


Normal
90

80

70

60
Frequencia

50

40

30

20

10

0
70 80 90 100 110 120 130
Resistores

Retirando 6 diferentes amostras de tamanhos 30 dessa população e calculando a media e o


desvio-padrão para cada uma delas:
Variável N Média Desvio-padrão
A1 30 100,25 10,35
A2 30 100,69 8,48
A3 30 102,07 8,96
A4 30 97,86 11,39
A5 30 97,31 10,01
A6 30 100,92 9,38

Pode-se observar que essas amostras produzem médias e desvios-padrão diferentes. Então se
for considerado o conjunto de médias dessas amostras, obtêm-se uma nova variável aleatória,
denominada de Média Amostral. Agora o interesse está em se conhecer a distribuição de
probabilidade dessa nova variável aleatória.

O próximo gráfico apresenta a distribuição da produção de resistores para amostras de


tamanhos: 10, 20, 30 e 50

© Tânia F Bogutchi – PUC Minas – Revisão 2012


131

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Média=100 ohms
10

n = 50
8
n = 30
Frequencia

6 n = 20

n = 10
4

0
80 90 100 110 120
resistores (ohms)

Observa-se que a média da distribuição concentra-se em torno da média populacional (100


ohms) e o desvio-padrão vai diminuindo em torno da média, à medida que o tamanho da
amostra aumenta (formato da curva vai se alongando à medida que o n aumenta).

Genericamente,
Considere uma amostra de tamanho n de uma variável aleatória X com média µ e desvio-
padrão σ , que vamos denotar por X1, X2,..., Xn, e que satisfaça as seguintes condições:
• todos os Xi’s , i=1,2,...,n, são independentes
• cada Xi tem a mesma distribuição de probabilidade de X.

Uma amostra com as condições acima é chamada de AMOSTRA ALEATÓRIA.

Se X ~ N( µ , σ ) então temos: E(Xi) = µ e Var(Xi) = σ 2 , para i=1,2,...,n


Se de cada Xi for calculado sua média e ela for armazenada, então será obtida uma nova
variável aleatória, constituída por todas elas, que pode ser denotada por X .
Essa nova variável aleatória pode ser escrita como:
1
X= (X 1 + X 2 + ..... + X n )
n
E terá como média (valor esperado):

1 1
E(X) = E( X1 + X 2 + ..... + X n ) = [E( X 1 ) + E( X 2 ) + ..... + E( X n )]
n n
1 nµ
= (µ + µ + ..... + µ) = =µ
n n

Ou seja, a média da variável aleatória X será a mesma da população X.

Analogamente, calculando sua variância:

© Tânia F Bogutchi – PUC Minas – Revisão 2012


132

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

1
Var ( X ) = Var ( X1 + X 2 + ... + X n ) =
n2
1
[Var ( X1 ) + Var ( X 2 ) + ... + Var ( X n )] =
n2
1 nσ 2 σ2
(σ 2 + σ 2 + ... + σ 2 ) = =
n2 n2 n

Ou seja, a variância da variável aleatória X será a variância da população X diminuída pelo


fator n, tamanho da amostra.

Desses resultados, podemos concluir:

Se X ~ N( µ , σ ) então a Média Amostral terá um distribuição

 σ 
X ~ N µ, 

 n

Isso significa que se a população for normalmente distribuída as amostras, de qualquer


tamanho, também terão distribuição de probabilidade normal. O próximo gráfico exemplifica
com as distribuições de amostras de tamanhos 10, 20, 30 e 50 provenientes de uma população
normalmente distribuída:
Histograma - População Normal (0,1)
90

80
População com
70 distribuição
60
Frequencia

50 N (0;1)
40

30

20

10

0
-2,4 -1,6 -0,8 0,0 0,8 1,6 2,4
X -Histograma
população Média Amostral para n=10; n=20; n=30 e n=50
População N(0,1)

-0,6 -0,3 0,0 0,3 0,6


Mean10 Mean20
30

20

10
Frequencia

0
Mean30 Mean50
30

20

10

0
-0,6 -0,3 0,0 0,3 0,6

Agora, se a variável aleatória X não for proveniente de uma distribuição normal então a
distribuição da média amostral será aproximadamente normal quando o tamanho da amostra
for grande.
Esse resultado é assegurado pelo Teorema Central do Limite (TCL).
Nos próximos gráficos podemos observar claramente o resultado desse teorema:

© Tânia F Bogutchi – PUC Minas – Revisão 2012


133

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Histograma - População U(0,1)


35

30
População com
25
distribuição
Uniforme –
Frequencia

20

15 U[0,1]
10

0
0,00 0,15 0,30 0,45 0,60 0,75 0,90
X - população
Histograma Media Amostral para n=10; n=20; n=30 e n=50
População U[0,1]

0,32 0,40 0,48 0,56 0,64 0,72


Mean10 Mean20

30

20

10
Frequencia

0
Mean30 Mean50

30

20

10

0
0,32 0,40 0,48 0,56 0,64 0,72

População Binomial (10; 0,15)


350
População com
300

250
distribuição
Binomial (10; 0,15)
Frequencia

200

150

100

50

0
0 1 2 3 4 5 6
X - população
Histograma Média Amostral para n=10; n=20; n=30 e n=50
População Bin(10; 0,15)

1,0 1,2 1,4 1,6 1,8 2,0 2,2


Mean10 Mean20
24

18

12
Frequencia

0
Mean30 Mean50
24

18

12

0
1,0 1,2 1,4 1,6 1,8 2,0 2,2

© Tânia F Bogutchi – PUC Minas – Revisão 2012


134

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Histograma População Exponencial (1)


180

160
População com
140 distribuição
120
Exp (1)
Frequencia

100

80

60

40

20

0
0 1 2 3 4 5 6 7
Histograma
expo10 Média Amostral para n=10, n=20, n=30 e n=50
População Exp(1)

0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8


Mean10 Mean20
30

20

10
Frequencia

0
Mean30 Mean50
30

20

10

0
0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8

Podemos então sintetizar esses resultados da seguinte maneira:

Síntese dos resultados do Teorema Central do Limite

Tamanho da
Distribuição de X Distribuição de X
amostra

 σ 
σ)
N(µ,σ N  µ,  qualquer
 n

aproximadamente
qualquer  σ  n > 30
N  µ, 
 n

A média amostral pode ser padronizada da mesma maneira que a população, para efeito de
facilitação do cálculo de suas probabilidades por meio dos valores previamente tabelados:
X−µ
Z= ~ N(0,1)
σ
n
Lembrando apenas que o desvio-padrão a ser utilizado é o da Média Amostral, X .

© Tânia F Bogutchi – PUC Minas – Revisão 2012


135

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Exemplo 2:
Voltando ao exemplo 1, da Companhia eletrônica, suponha que tenha sido levada para o
controle de qualidade, uma amostra de 100 resistores. Suponha que o desvio-padrão de 10
ohms é conhecido como verdadeiro. (1) Qual a estimativa pontual da resistência média para os
resistores dessa companhia? (2) Determine um intervalo simétrico em torno da média que
concentre 95% dos valores amostrados.
Solução de (1):
A estimativa será fornecida pela média obtida dessa amostra: µ
ˆ = x = 101,11 ohms.

Solução de (2):
Precisam ser encontrados os valores a e b tais que,
P(a ≤ X ≤ b) = 0,95

Que é equivalente à sua transformação na Normal padronizada:

 
 a − 101,11 b − 101,11 
P ≤Z≤  = P(z a ≤ Z ≤ z b ) = 0,95
 10 10 
 100 100 

Lembrando que na distribuição N(0,1),

P (-1,96 < Z < 1,96) = 0,95 0,95

Tem-se que za = -1,96 e zb = 1,96.

Logo,
a − 101,11 b − 101,11
za = = −1,96 ⇒ a = 99,15 e zb = = 1,96 ⇒ b = 103,07
10 10
100 100

Dessa maneira, um intervalo em torno da média que concentra 95% dos valores da média
amostral é de 99,15 a 103,07 ohms.

Conclusão: nesse exemplo 2 tem-se que, em uma amostra de 100 resistores a estimativa média
pontual das resistências é 101,11 ohms e a intervalar, com 95% de confiança, é de 99,15 a
103,07 ohms.

Genericamente, uma estimativa intervalar para a média com 100(1-a)% de confiança é dada
por:

 
 X−µ 
P − z α 2 ≤ ≤ zα 2  = 1 − α
 σ 
 n 

Que pode ser reescrita por:

 σ σ 
P X − z α 2 ≤ µ ≤ X + zα 2  =1− α

 n n

© Tânia F Bogutchi – PUC Minas – Revisão 2012


136

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Ou seja, o intervalo:  X − z α 2 σ ; X + z α 2 σ  é um intervalo com 100(1- α )% de confiança


 
 n n
para µ , a média populacional.

Ou podemos escrevê-lo: (X ± E )
E E

x−E x x+E
σ
Em que, E = z α 2 , é denominado de o erro máximo provável ou precisão amostral.
n

Esse é o famoso erro “para mais” ou “para menos” tão difundido em épocas eleitorais...

Mas....
O que quer dizer “confiança”?

Sabe-se que para cada amostra diferente retirada de uma população poderá ser observado
valores diferentes para a média e o desvio-padrão e consequentemente ter-se-á intervalos
diferentes, pois os limites dos intervalos são aleatórios.

Não pode-se afirmar com certeza que o valor µ estará incluído dentro do intervalo, mas, pode-
se dizer que com 100(1- α )% de confiança o verdadeiro valor de µ pertence ao intervalo.

Isso quer dizer que se for observado um grande número de amostras de mesmo tamanho e
para cada amostra for calculado um intervalo de 95% de confiança ( α =0,05), por exemplo,
cerca de 95% dos intervalos conterão o verdadeiro valor de µ .

No exemplo da produção dos resistores, foram retiradas 30 amostras de tamanho 30 cada da


população de 1.000 resistores e para cada uma delas foi calculado o intervalo de 95% de
confiança para o verdadeiro valor da média da população, µ , conforme apresentado no
próximo gráfico:

Intervalos 95% confiança para 30 amostras de tamanho 30


I.C. 95% para a média
108

106

104

102
Data

100 100

98

96

94

92
1 2 3 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0
A A A A A A A A A1 A 1 A 1 A 1 A 1 A 1 A 1 A 1 A 1 A 1 A 2 A 2 A 2 A 2 A 2 A 2 A 2 A 2 A 2 A 2 A3

© Tânia F Bogutchi – PUC Minas – Revisão 2012


137

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Observe que 29 dentre os 30 intervalos, o que corresponde a 96,7% dos intervalos, contiveram
o verdadeiro valor da média µ =100 ohms.
Se o número de amostras for aumentado, a proporção de intervalos que conterão µ tenderá a
ficar mais próxima de 95%.

• Distribuição amostral de uma proporção

Considere uma amostra de tamanho n de uma variável aleatória X, representada por X1, X2, ...,
Xn, em que cada Xi será definida por:
1, se ocorre sucesso
Xi = 
0, se ocorre fracasso
Seja p a probabilidade de sucesso que será estimada pela proporção amostral de sucessos
n

número de sucessos
∑X
i=1
i
p̂ = = =X
n n

Ou seja, uma proporção amostral nada mais é do que uma média amostral de uma variável
aleatória que assume valores 0’s e 1’s.
Como os Xi’s são ensaios de Bernoulli, então µ = p e σ 2 = p(1-p). Pelo Teorema Central do
Limite, pode-se escrever:
p̂ − p
≈ N(0,1)
p(1 − p)
n

Um intervalo com 100(1- α )% de confiança para a média populacional µ é dado por:

 p̂(1 − p̂) p̂(1 − p̂) 


 p̂ − z ; p̂ + z α 2
α2
 n n 
 
p̂(1 − p̂)
Se o erro máximo provável ou precisão amostral for definido como: E = z α 2
n

)
Então o intervalo de 100(1- α )% pode ser escrito: p ± E

Exemplo 3: (Adaptado do Montgomery) Em uma amostra aleatória de 85 mancais de eixos


motores de automóveis, 10 têm uma rugosidade no acabamento de superfície que excede as
especificações. Qual a estimativa pontual e a intervalar para a rugosidade no acabamento dos
mancais. Considere o nível de significância de 5% ( α =0,05).
Solução: 10
A estimativa pontual é: p̂ = = 0,1176
85
Para o calculo da estimativa intervalar com 95% de confiança, será obtido primeiramente o erro
da precisão amostral:

0,1176(1 − 0,1176)
E = 1,96 ≅ 0,0685
85

© Tânia F Bogutchi – PUC Minas – Revisão 2012


138

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

E a estimativa intervalar será: 0,1176 ± 0,0685 ⇒ (0,0491 ; 0,1861)

Isso significa, que com 95% de confiança pode-se dizer que de 4,9% a 18,6% dos eixos dos
motores terão rugosidade no acabamento da superfície que excede as especificações.

2. TESTE DE HIPÓTESES

Problema ilustrativo:
Exemplo 4: Um fabricante de resistores afirma que suas resistências são normalmente
distribuídas com média de 100 ohms e desvio-padrão de 10 ohms. Suspeita-se, entretanto, que
a resistência média é menor do que o anunciado. Para decidir se a suspeita sobre a média tem
procedência ou não, foi retirada uma amostra aleatória de 25 resistências e foi considerado o
desvio-padrão do fabricante como correto.

Existem duas hipóteses:


- Hipótese nula: H0 (resistência média é igual a 100 ohms)
- Hipótese alternativa: H1 ou Ha ( resistência média é menor que 100 ohms)

Para decidir qual dessas hipóteses é verdadeira é preciso um critério para tomada de decisão:

Critério de decisão é baseado na estatística do teste que mede a discrepância entre o que
foi observado na amostra (25 resistências) e o que seria esperado se a hipótese nula fosse
verdadeira, ou seja, H0 será julgada.

Situação real
Decisão
H0 verdadeira H0 falsa

Rejeitar H0
Decisão incorreta
Decisão correta
(resistência não é (Erro tipo I)
100 ohms)

Não rejeitar H0
Decisão incorreta
Decisão correta
(Erro tipo II)
(resistência é 100)

Erro do tipo I:
A probabilidade de se cometer esse erro recebe o nome de nível de significância do
teste, sendo usualmente representado pela letra grega α.
No exemplo:
• Erro tipo I: concluir que a resistência média é menor que 100 ohms quando na
realidade ela é igual a 100 ohms;
• Erro tipo II: concluir que a resistência média é igual a 100 ohms quando na realidade
ela é diferente de 100 ohms

Para um tamanho de amostra fixo (dados coletados) não é possível controlar os dois erros
simultaneamente, conforme pode ser observado na figura a seguir:

© Tânia F Bogutchi – PUC Minas – Revisão 2012


139

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Sob H1 Sob H0

α β
Por outro lado, os dois tipos de erro são indesejáveis.
O erro tipo I é considerado, na maioria dos testes, como o mais grave sendo então controlado
na análise dos dados. Ele é equivalente a julgar um assassino e dar o veredicto: inocente. Ou
dizer que uma pessoa está sadia, quando na realidade ela está com um tumor maligno
(câncer)....

O erro tipo II pode ser controlado no planejamento do estudo por meio da determinação de um
tamanho de amostra adequado.

Dessa maneira, o erro tipo I será utilizado no processo de julgamento de H0 , feito na análise
dos dados.
Para esse julgamento, precisamos de algum critério para tomada de decisão. Por exemplo:
fixando α= 0,05 e determinando um valor crítico, xc tal que a probabilidade dos valores das
médias estarem abaixo dela seja de 5%, temos:

 x − 100 
P( X < x c ) = P Z < c  = 0,05
 2 
Como, P(Z < −1,64 ) = 0,05 temos,

x c − 100
= −1,64 ⇒ x c = 96,72
2

ou seja, a probabilidade de uma média amostral ser menor que 96,72 ohms é de 0,05.

Critério de decisão para julgamento de H0 :

Nesse exemplo, de uma população com µ =100 ohms e σ =10 ohms, fixando α =0,05 (5%)
obteve-se x0=92,72 ohms tal que para qualquer média de uma amostra com 25 elementos tem-
se:
P( X < x c ) = 0,05
Retirando-se uma amostra, cuja média é x0 , pode-se estabelecer o seguinte:

Se x 0 > x c ⇒ aceita - se H0
Se x 0 ≤ x c ⇒ rejeita - se H0 (aceitando − se H1 )

© Tânia F Bogutchi – PUC Minas – Revisão 2012


140

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

O nível de significância, α , é a probabilidade do erro tipo I:

α = P(erro tipo I) = P(rejeitar H0 | H0 é verdadeira)

xc
A região em que se rejeita H0, quando a média da amostra pertencer a ela, é chamada de
REGIÃO CRÍTICA ou REGIÃO DE REJEIÇÃO DO TESTE.

Conclusão:
Se a média x0 de uma amostra de 25 resistências for menor que xc=96,72 ohms , tem-se uma
das duas alternativas:
1. O fabricante está certo, a média da população de resistências é µ =100 ohms e foi
obtida uma amostra com pouca chance de ocorrer erro por puro acaso.
2. O fabricante não diz a verdade, pois obteve-se tal média amostral porque a
probabilidade de sua ocorrência não era tão pequena, ou seja, a média da população é
menor que 100 ohms.
Qual delas escolher?

Nesse exemplo foi utilizado o teste Z para uma média em que foi suposto que o desvio-padrão
da população ( σ ) era conhecido.
A estatística do teste, calculada para os dados observados (zobs), é dada por:
x − µ0
z obs =
σ
n

Que é comparada com um valor crítico (zc) que depende do nível de significância adotado ( α )
e do tipo do teste (unicaudal ou bicaudal).
No nosso exemplo, zc = -1,64

A síntese do teste Z para uma média, nesse exemplo é:

© Tânia F Bogutchi – PUC Minas – Revisão 2012


141

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Desde que a hipótese nula seja


verdadeira, apenas 5% dos
resistores terão resistência menor
que 96,72 ohms.

α = 0,05 Se a informação do fabricante é


incorreta, então a média real é
menor que 100 ohms e a
probabilidade de uma média de 25
96,72 µ resistores ser menor que 96,72 ohms
é maior que 5%.

-2 -1,64 0

Supondo que a média de 96


ohms seja correta, a
0,6406
probabilidade de se obter uma
amostra de média menor que
96,72 ohms é 64,06%.

µ 96,72

O próximo quadro apresenta as regiões críticas para teste unilateral (unicaudal) e bilateral
(bicaudal):

Teste Hipóteses Rejeitar Ho se p-valor =


H0 : µ = µ 0 x − µ0
Unilateral à z obs = < −z α
esquerda σ P(Z < zobs)
H1 : µ < µ 0 n
H0 : µ = µ 0 x − µ0
Unilateral à z obs = > zα
direita σ P(Z > zobs)
H1 : µ > µ 0 n
x − µ0
z obs = < −z α
σ 2
n
H0 : µ = µ 0 2P(Z < -zobs)
Bilateral ou
H1 : µ ≠ µ 0 (pela simetria)
x − µ0
z obs = > zα
σ 2
n

© Tânia F Bogutchi – PUC Minas – Revisão 2012


142

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

O p-valor ou probabilidade de significância é a probabilidade do erro cometido ao rejeitar H0


sendo H0 verdadeira e é calculado com base nos dados observados sendo maior ou menor que
o nível tolerável α

Se essa probabilidade (p-valor) é menor do que α , decide-se por rejeitar H0.

Se essa probabilidade (p-valor) é maior do que α , decide-se por não rejeitar H0.

Exemplo 5: Um mancal usado em uma aplicação automotiva deve ter um diâmetro nominal de
38,01 mm. Sabe-se que o diâmetro do mancal é normalmente distribuído com desvio-padrão de
0,254 mm. Foi selecionada uma amostra aleatória de 36 mancais e o diâmetro interno médio
desses mancais é de 37,97 mm. Verifique, ao nível de 5% de significância, se esses diâmetros
diferem do valor nominal exigido.
Solução:
As hipóteses de interesse são:
Ho : µ = 38,01 mm
H1 : µ ≠ 38,01 mm

onde µ é o verdadeiro valor dos diâmetros e µ 0 é o valor nominal especificado pela indústria
automobilística (38,01 mm)
A estatística de teste é
37,97 − 38,01
z obs = ≅ −0,95
0,254
36

Para α = 0,05 rejeita-se H0 se |zobs| > z0,025 = 1,96.

Como |zobs| = 0,95 < 1,96 - a evidência é a não rejeição de H0.

Conclui-se então que os mancais estão com os diâmetros dentro da especificação.

O p-valor é P(|z| > 0,95) = 2 x 0,171056 = 0,342 >> 0,05

A probabilidade observada do erro tipo I é de 34,2% bem maior que 5% confirmando que as
evidências indicam que H0 não é falsa

0,17106 0,17106

0,025 0,025

© Tânia F Bogutchi – PUC Minas – Revisão 2012


143

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Um intervalo de 95% de confiança para o diâmetro dos mancais é:

 0,254 
37,97 ± 1,96  = [37,97 ± 0,083] = [37,887 ; 38,053]
 36 

Observe que o valor de µ 0 = 38,01 pertence ao intervalo de confiança obtido!

Equivalência entre testes de hipóteses (bicaudal ou bilateral) e intervalos de


confiança
Nesse exemplo, tem-se as hipóteses:
Ho : µ = µ 0 = 38,01
H1 : µ ≠ µ 0 = 38,01

Se o valor de µ 0 pertencer ao intervalo de confiança, não existem evidências para rejeitar H0 ao


nível de significância α .
Se o valor µ 0 de não pertencer ao intervalo de confiança, existem evidências para rejeitar H0
ao nível de significância α .
Nesse caso, o intervalo com 95% de confiança confirma a conclusão do teste efetuado.

Testes de hipóteses para uma proporção


Vimos que para testar H 0 : µ = µ 0 , quando as amostras são grandes, a estatística do teste é

X − µ0
Z=
dp( X )

Como uma proporção pode ser considerada como uma média, a estatística do teste para
H0 : p = p 0 é

pˆ − p 0 pˆ − p 0
z obs = =
dp(p 0 ) p 0 (1 − p 0 )
n

A síntese do teste Z para uma proporção é

© Tânia F Bogutchi – PUC Minas – Revisão 2012


144

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Teste Hipóteses Rejeitar Ho se p-valor =

H0 : p = p 0 pˆ − p 0
Unilateral à z obs = < −z α
esquerda
p 0 (1 − p 0 ) P(Z < zobs)
H1 : p < p 0
n
ˆp − p 0
H0 : p = p 0 z obs = > zα
Unilateral à
direita
p 0 (1 − p 0 ) P(Z > zobs)
H1 : p > p 0
n
pˆ − p 0
z obs = < −z α
p 0 (1 − p 0 ) 2
n
H0 : p = p 0 2P(Z < - zobs)
Bilateral ou
H1 : p ≠ p 0 (pela simetria)

pˆ − p 0
z obs = > zα
p 0 (1 − p 0 ) 2
n

Exemplo 6: A garantia para baterias de telefones móveis é estabelecida em 48 horas


operacionais, seguindo os procedimentos apropriados de carga. Um estudo com 5.000 baterias
é executado e 15 param de operar antes das 48 horas. Esses experimentos confirmam a
afirmação de que menos de 0,2% das baterias das companhias falhará durante o período de
garantia? Considere um nível de significância de 1%.
Solução:
Ho : p = p 0 = 0,2% = 0,002
H1 : p < p 0 = 0,2% = 0,002

15
p̂ = = 0,003
5.000
0,003 − 0,002
Z obs = = 1,58
O valor observado da estatística do teste é 0,002(1 − 0,002)
5.000

Ao nível de significância de 1% o valor crítico é -2,33

0,943

R.R. de H0
0,01

-2,33 1,58

© Tânia F Bogutchi – PUC Minas – Revisão 2012


145

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Então, ao nível de significância de 1% não existem evidências amostrais para rejeitarmos a


hipótese nula.
A conclusão é que a proporção de baterias que falham não é menor que 0,2% ao nível de 1%
de significância.
Mesmo que o teste fosse considerado ao nível de 5% de significância, a hipótese nula não seria
rejeitada, pois zobs= 1,58 > -1,96

Um intervalo com 95% de confiança para a verdadeira proporção de baterias de telefones


celulares que falham é:

 
 0,003 ± 1,96 0,003x 0,997  = (0,0015 ; 0,005) = (0,15% ; 0,5%)
 5.000 
 

Ou seja, com 95% de confiança, a verdadeira proporção de baterias dos telefones celulares que
falham está entre 0,15% e 0,5%. Observe que este intervalo contém o valor p0 = 0,2%, o que
confirma a decisão de não rejeição de H0 do teste de hipóteses, considerando o nível de
significância de 5%.

3. RESOLUÇÃO DE ALGUNS EXERCÍCIOS

1) (Provão-ECO-2002) Uma rede de postos de gasolina afirma que, em seus estabelecimentos,


não se vende gasolina adulterada. Sabe-se que, de acordo com os padrões de qualidade, a
gasolina não pode conter mais que 240 ml de álcool por litro. Um órgão de fiscalização
colheu 25 medições do produto nos postos dessa rede, que estão abaixo. Admita que a
quantidade de álcool presente na gasolina tem uma distribuição normal com desvio padrão
de 2,5 ml/litro.

249,6 242,0 241,1 243,3 241,1 239,4 239,0 239,3 240,6


239,6 243,0 238,0 241,9 233,2 239,7 242,3 240,6 240,0
239,6 242,0 239,4 241,0 242,2 240,0 240,8

a) Qual é a estimativa pontual da quantidade média de álcool presente na gasolina dos


postos da rede?
b) Construa e interprete um intervalo de 95% de confiança para a quantidade média de
álcool presente na gasolina nos postos dessa rede?
c) Com base no intervalo de confiança calculado, qual é o erro máximo provável cometido
na estimação da verdadeira quantidade média de álcool presente na gasolina dos
postos da rede?
d) Analise, com um nível de significância de 5%, se a gasolina é ou não adulterada.

Solução:
O problema nos forneceu:
X: quantidade de álcool presente na gasolina, ml/litro
n=25
X ~ N ( µ ; 2,5)

a) A estimativa pontual para a média populacional, µ , é obtida pela média dos dados
coletados:
µˆ = x = 240,75 ml/litro

© Tânia F Bogutchi – PUC Minas – Revisão 2012


146

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

 
Logo, X ~ N (240,75; 2,5) e a média amostral X ~ N 240,75; 2,5 
 
 25 

b) Intervalo com 95% de confiança, então α = 5% e pela tabela da Normal: z α = 1,96


2

O intervalo é dado por: x ± E

Em que, E = z  σ  = 1,96 2,5 = 0,98


α  
2 n  25

Então um intervalo com 95% de confiança: 240,75 ± 0,98

Ou seja, (239,77 ; 241,73)


Isso significa, que podemos dizer com 95% de confiança que o verdadeiro valor da quantidade
de álcool na gasolina está entre 239,77 e 241,73 ml/litro.

c) O erro máximo provável cometido é o E, ou seja, 0,98 ml/litro

(esse é o erro conhecido como 0,98 “ para mais” e 0,98 “para menos”.....)

d) As hipóteses a serem testadas são: H0: µ = 240 vs H1: µ > 240


Obs.: H0 está significando, na realidade, que a quantidade de álcool é menor ou igual a 240
ml/litro, ou seja, a gasolina não é adulterada.
Para verificarmos qual dessas hipóteses é a verdadeira, o teste a ser aplicado é o Z.
Como o teste é unilateral, o valor crítico de Z, com 95% de confiança será: zc = z0,05 = 1,64

R.R. de H0
R.A. de H0

Zc=1,64

Isso significa que P(Z > 1,64) = 0,05, que é a probabilidade do erro tipo I ou a probabilidade
máxima aceita ao tomar a decisão de rejeitarmos H0 (afirmar que ela é falsa), quando na
realidade ela é verdadeira.
O teste baseia-se na comparação da estatística do teste observada com esse valor crítico

240,75 − 240 0,75


z obs = = = 1,50
2,5 0,5
25

Como zobs < 1,64, ele pertence à região de aceitação de H0, ou seja, podemos afirmar com
95% de confiança que a quantidade de álcool encontrada na gasolina dessa rede de postos não
é considerada como adulterada.

© Tânia F Bogutchi – PUC Minas – Revisão 2012


147

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Outra maneira de tomarmos essa decisão é por meio do cálculo do p-valor. Se p-valor for
menor ou igual a 0,05 (erro máximo aceitável do teste conhecido como nível de significância)
então a hipótese nula deverá ser rejeitada.
Nesse exemplo, o p-valor = P(Z> zobs), pois o teste é unilateral (ou unicaudal). Então,
P(Z > zobs) = P(Z > 1,50) = P(Z < -1,50) = 0,066807 (~6,7%)
Ou seja, p-valor = 0,067 > 0,05 – confirmando a indicação de não rejeição de H0.

2) Um fabricante de lâmpadas garante que a vida média de um determinado tipo de lâmpada


é 1.600 horas. Se uma amostra ao acaso com 100 lâmpadas tiver uma vida média de 1.570
horas, você tem evidência suficiente para rejeitar a alegação do fabricante, usando α =
0,02? Suponha que a população seja normalmente distribuída com um desvio padrão de
120 horas.

Solução:

Seja:
X: tempo de duração da lâmpada, em horas.
X ~ N(1.570; 120) – µ foi estimada pela amostra:
n = 100
H0 : µ = 1.600 vs H1: µ ≠ 1.600
α = 0,02

Calculando a estatística do teste:

1.570 − 1600
z obs = = = −2,50
120 12
100

R.A. H0
R.R. H0 R.R. H0

0,01 0,01

-2,32 2,32
Zobs =-2,50

Zobs = -2,50 < z0,01=-2,32 → a indicação é de rejeição da hipótese nula

p-valor= P(Z < -2,5) = 0,0062 → a probabilidade de estarmos errando ao tomarmos a decisão
de rejeitarmos a hipótese nula (dizer que ela é falsa) é de 0,62%. Confirma que o fabricante
está equivocado em sua informação!

© Tânia F Bogutchi – PUC Minas – Revisão 2012


148

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Conclusão: ao nível de significância de 2%, ou seja, com 98% de confiança, podemos dizer
que a duração da lâmpadas se alterou, ou seja, sua duração é diferente de 1.600 horas. A
afirmação do fabricante não é verdadeira.

Obs.:
Como o zobs< 0, a indicação é de que o tempo de duração é menor que 1.600 horas. Equivale a
considerar a hipótese alternativa, H1 : µ < 1.600
Ao nível de significância de 2% ( α = 0,02) e considerando o teste unilateral à esquerda, então
z α = z0,02 = -2,05
Como zobs < z α a indicação é de rejeição de H0, confirmando que o tempo de duração das
lâmpadas é menor que 1.600 horas.

3) Um censo de há dois anos passados revelou que 20% das famílias de uma grande
comunidade viviam abaixo do nível de pobreza. Para determinar se essa porcentagem se
modificou, estudou-se uma amostra aleatória de 500 famílias, encontrando-se 91 abaixo do
nível de pobreza.
a) Qual é a estimativa pontual da proporção de famílias dessa comunidade que vivem
atualmente abaixo do nível de pobreza?
b) Calcule e interprete um intervalo de 95% de confiança para a proporção de famílias
dessa comunidade que vivem atualmente abaixo do nível de pobreza.
c) Com base no intervalo de confiança calculado, qual é a margem de erro?
d) Ao nível de 5% de significância, o resultado amostral indica que a porcentagem atual
difere da porcentagem verificada há dois anos? Não se esqueça de escrever as
hipóteses, calcular a estatística do teste, calcular e interpretar o valor p e tirar a
conclusão. (faça o teste baseado na distribuição normal)

Solução:
91
a) A estimativa pontual é: p̂ = = 0,182
500
p̂ − p
≈ N(0,1)
b) Sabemos que para n > 100, p(1 − p)
n

Para um intervalo com 95% de confiança, utilizamos z0,025 = 1,96


 
O intervalo de confiança será: p̂ ± E, em que E = z  p̂(1 − p̂) 
α
2 n 
 
 0,182(1 − 0,182) 
Então, E = 1,96  = (1,96)(0,01726) = 0,0338
 500 
 

E o intervalo de 95% de confiança será: (0,1482 ; 0,2158) ou ~ (14,8% ; 21,6%)

Isso significa que podemos dizer com 95% de confiança que o verdadeiro valor da porcentagem
de famílias que vivem abaixo do nível de pobreza nessa grande comunidade está entre 14,8% e
21,6%.

c) margem de erro é E = 0,0338 ≈ 3,4%


(“o percentual é 18,2% com 3,4% para mais ou para menos” – fala que ouvimos sempre
em época de eleições!!!)

© Tânia F Bogutchi – PUC Minas – Revisão 2012


149

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

d) As hipóteses a serem testadas:

H0: p = p0 = 0,20 vs H1: p ≠ 0,20

A estatística do teste é:

p̂ − p 0 0,182 − 0,20
z obs = = = −1,01
p 0 (1 − p 0 ) 0,20(1 − 0,20)
n 500

R.R. H0 R.A. H0 R.R. H0

0,025 0,025

-1,96 zobs

Zobs= -1,01 > -1,96, logo pertence à região de aceitação de H0.

Podemos concluir com 95% de confiança que o percentual de famílias que vivem abaixo do
nível de pobreza nessa grande comunidade não se modificou.

OBS.: Comparando esse resultado com o intervalo de confiança obtido no item (b) podemos
verificar que 20% está dentro dele!!

4. MISCELÂNEA DE EXERCÍCIOS RESOLVIDOS EM ATIVIDADES E PROVAS

Questão 1: De uma população normal X, com variância igual a 9, foi retirada uma amostra
25
com 25 observações, obtendo ∑ x i = 152 . Os limites (L) em que se corre o risco de 10% que
i =1
o verdadeiro valor da média populacional µ seja menor que Linf ou maior que Lsup, são
aproximadamente:
a) 3,128 ; 9,032
b) 5,096 ; 7,064
c) 2,551 ; 9,606
d) 4,904 ; 7,256

Correta: B

© Tânia F Bogutchi – PUC Minas – Revisão 2012


150

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Solução:
Temos: X ~ N( µ ; 3), pois σ 2 = 9 ; n = 25 e ∑x
i
i =152

∑x i
152
Logo, x= i
= ≅ 6,08
n 25
Então a estimativa pontual para a verdadeira média é :
 3 
µˆ = x = 6,08 ⇒ X ~ N  6,08;  ⇒ X ~ N (6,08; 0,6 )
 25 

Para α =10%, significa que P(-1,64 < Z < 1,64) = 0,90 (pois P(Z<-1,64)=0,05, pela Tabela 3)
Calculando um intervalo com 90% de confiança para µ , tem-se:
σ
E = zα = (1,64)(0,6) = 0,984 ⇒ x ± E = 6,08 ± 0,984 ⇒ (5,096; 7,064)
2 n

Questão 2: Para uma população normal com variância conhecida σ 2 , o nível de significância
σ σ σ σ
para os intervalos: (1) x − 2,14 ≤ µ ≤ x + 2,14 e (2) x − 1,85 ≤ µ ≤ x + 1,85
n n n n
. São aproximadamente:
a) 1,6% e 3,3%
b) 98,4% e 96,7%
c) 96,8% e 93,6%
d) 3,2% e 6,4%

Correta: D

Solução:
X ~ N( µ ; σ ) com σ 2 conhecida
(1) tem-se que zα = 2,14 . Pela Tabela 3, verifica-se que P(Z < -2,14) = 0,016177, que por
2

simetria é a mesma P(Z > 2,14).


Então, o nível de significância α = P(Z < -2,14) + P(Z > 2,14) = 2 P(Z < -2,14)
Logo, α = (2))(0,016177) ≅ 0,032, ou seja, α ≅ 3,2%

(2) Processo análogo ao (1) encontra-se P(Z < -1,85) = 0,032157 ⇒ α ≅ 6,4%

Questão 3: Com base em experiências passadas, sabe-se que a resistência à quebra de um fio
2
usado na fabricação de material moldável é normalmente distribuída com variância σ = 4 psi.
Uma amostra aleatória de 16 espécimes é testada e a resistência média à quebra é 98 psi. Uma
estimativa intervalar, com nível de significância α de 10%, para a resistência média da
população é aproximadamente:

© Tânia F Bogutchi – PUC Minas – Revisão 2012


151

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

a) 97,2 a 98,8
b) 93,1 a 102,9
c) 95,3 a 95,7
d) 96,0 a 100,0

Correta: A

Solução:
Seja, X: resistência à quebra do fio, em psi
X ~ N( µ ; 2), pois σ 2 = 4 ; n = 16 e x = 98
 2 
µˆ = x = 98 ⇒ X ~ N  98;  ⇒ X ~ N (98; 0,5)
 16 

Para α =10%, significa que z α = 1,64 (pois P(Z<-1,64)=0,05, pela Tabela 3).
2

Logo, um intervalo de 90% de confiabilidade para a verdadeira média µ é:


σ
E = zα = (1,64)(0,5) = 0,82 ⇒ x ± E = 98 ± 0,82 ⇒ ≈ (97,2; 98,8)
2 n

Questão 4: Em um lote de 1000 dispositivos eletrônicos selecionados aleatoriamente de uma


industria, 823 não apresentam defeitos. Considerando esses dados, temos: (1) a estimativa
pontual para a verdadeira proporção (p) de dispositivos defeituosos dessa indústria e (2) o
tamanho necessário da amostra para estar 95% confiante de que o erro em estimar o valor
verdadeiro de p seja no máximo de 0,03 são aproximadamente:
a) 0,0823 e 500
b) 0,823 e 622
c) 0,177 e 622
d) 0,0177 e 500

Correta: C

Solução:
Seja o evento D: dispositivo defeituoso
Num lote de 1000 tem-se 823 não defeituosos e 117 defeituosos.
Então,
) 117
p = P( D) = = 0,117 - que é a estimativa para a verdadeira proporção de dispositivos
1000
defeituosos dessa indústria.

O erro máximo amostral é E = 0,03 isso significa:


E =0,03 E =0,03

pˆ − E p̂ pˆ + E

© Tânia F Bogutchi – PUC Minas – Revisão 2012


152

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

2
)
pˆ (1 − p )
)
pˆ (1 − p )  zα 
Por definição: E = zα ⇒ n = zα ⇒n = 2  [ pˆ (1 − p) ) ]
2 n 2 E  E 
 
)
Dados: E =0,03 ; p = 0,117 ; α = 5% ⇒ zα = 1,96
2
2
 1,96 
Então, n =  (0,117)(0,823) ≅ 622
 0,03 

Questão 5: Um sistema operacional de um computador pessoal tem sido estudado


extensivamente. Sabe-se que o desvio-padrão do tempo de resposta seguinte a um comando
particular é σ = 12 milissegundos. Uma nova versão do sistema operacional é instalada e
desejamos estimar o tempo médio de resposta do novo sistema, de modo a assegurar que um
intervalo de confiança de 95% para a verdadeira média µ tenha um comprimento de no
máximo 6 milissegundos. Se puder considerar que o tempo de resposta é normalmente
distribuído e que σ = 12 milissegundos para o novo sistema, o tamanho da amostra
recomendado é de aproximadamente:
a) 100
b) 62
c) 40
d) 10

Correta: B

Solução:
Seja o evento X: tempo de resposta, em milissegundos; σ = 12
Dado:
6

µ̂ − E µ̂ µ̂ + E

Ou seja, E = 3 e para α = 5% ⇒ zα = 1,96


2

σ σ σ
2

Tem-se: E = zα ⇒ n = zα ⇒ n =  zα 
2 n 2 E  2 E
Logo,
σ 
2 2
 12 
n =  zα  = 1,96  ≅ 62
 2 E  6

Questão 6: Um fabricante de lajotas de cerâmica introduz um novo material em sua fabricação


e acredita que aumentará a resistência media, que é de 206 kg. A resistência das lajotas tem
distribuição normal com desvio-padrão de 12 kg. Retira-se uma amostra de 30 lajotas, obtendo-

© Tânia F Bogutchi – PUC Minas – Revisão 2012


153

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

se uma média de 210 kg. Ao nível de 10%, das alternativas abaixo o fabricante pode aceitar
como Verdadeira:
a) que a resistência média de suas lajotas não aumentou
b) que a resistência média de suas lajotas aumentou
c) que a amostra foi pequena para a conclusão desse teste
d) o novo material introduzido deve ser descartado

Correta: B

Solução:
Seja X: resistência da lajota, em kg.
σ
X ~ N( µ ; 12) ; n = 30; x = 210 e dp (X )= σ X
= =
12
≅ 2,16
n 30

Dessa maneira, X ~ N ( 210 ; 2,16 )

 H 0 : µ = 206
Hipóteses: 
 H 1 : µ > 206
Teste unilateral à direita. Considerando α = 10%; a hipótese nula, H0, deverá ser rejeitada se
zobs > 1,28 , pois z0,10 = 1,28 (ou P(Z > 1,28) = 0,10)

R.R. H0

0,10

1,28

210 − 206.
Tem-se, z obs = ≅ 1,83
2,16

Como zobs > z0,10 (1,83 > 1,28), a evidência é a rejeição da hipótese nula. Donde se conclui,
com 90% de confiabilidade, que a verdadeira média obtida da resistência da lajota aumenta
com o acréscimo da substância.

Questão 7: Um fabricante está interessado na voltagem de saída de um fornecimento de


energia usado em um computador pessoal. A voltagem de saída é considerada normalmente
distribuída com desvio-padrão de 0,25 V. O fabricante deseja testar H 0 : µ = 5 V contra

© Tânia F Bogutchi – PUC Minas – Revisão 2012


154

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

H1 : µ ≠ 5 V., usando uma amostra com 8 unidades. Decida se cada uma das afirmativas a
seguir é Verdadeira (V) ou Falsa (F):

a) Se a região de aceitação for de 4,85 ≤ x ≤ 5,15. Podemos afirmar que a


probabilidade do erro tipo I ( α ) é 0,089;
Correta: V
Solução:

R.R. H 0 R.R. H0

R.A. H0

α α
2 2

α = P(erro tipo I µ = 5) = P( X ≤ 4,85) + P( X ≥ 5,15) µ = 5


       
       
 4,85 − 5   5,15 − 5   − 0,15   0,15 
=P Z≤ +P Z ≥ =P Z≤ +P Z ≥
 0,25   0,25   0,25   0,25 
       
 8   8   8   8 
= P (Z ≤ −1,70 ) + P (Z ≥ 1,70 ) = 2 P (Z ≤ −1,70 ) = 2(0,044565) = 0,08913

Por
simetria

b) Se a amostra selecionada for de 16 unidades e a região de aceitação de (a) for


mantida, o valor de α será maior.

Correta: F
Solução:

 0,25 
Se n = 16 então ⇒ X ~ N µ;  ⇒ X ~ N(µ;0,0625)

 16 

© Tânia F Bogutchi – PUC Minas – Revisão 2012


155

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

   
   
 4,85 − 5   5,15 − 5   − 0,15   0,15 
α=P Z≤ +P Z ≥ = P Z ≤  + P Z ≥ 
 0,25   0,25   0,0625   0,0625 
   
 16   16 
α = 2 P(Z ≤ −2,4) = 2(0,0082) = 0,0164
Logo α é menor.

c) A potência (ou poder) do teste para detectar uma voltagem de saída média
verdadeira de 5,1 V é de 28,7%;

Correta: V
Solução:

Se µ = 5,1V então δ = 5,1 – 5 = 0,1


β = P(erro tipo II) = P(4,85 ≤ X ≤ 5,15 µ = 5,1)
   
   
 4,85 − 5,1 5,15 − 5,1   − 0,25 0,05 
β=P ≤Z≤ = P ≤Z≤ =
 0,25 0,25   0,25 0,25 
   
 8 8   8 8 

= P(− 2,83 ≤ Z ≤ 0,57 ) = P (Z ≤ 0,57 ) − P (Z ≤ −2,83) = 0,715661 − 0,002327 = 0,713334

Poder do teste ou Potência do teste: 1 - β = 0,2867 (≈ 28,7%)

d) Se a amostra selecionada for de 16 unidades e a região de aceitação de (a) for


mantida, o valor de α será menor.

Correta: V
Solução:
Correta, pois em (a) n = 8 e α = 0,089;
E em (c) n = 16 e α = 0,0164.
Logo α é menor.

Questão 8: As companhias de seguro de automóvel estão cogitando de elevar os prêmios para


aqueles que falam ao telefone enquanto dirigem. Um grupo de defesa dos consumidores afirma
que este problema não é tão sério, porque apenas 10% dos motoristas usam o telefone. Uma
companhia de seguro faz uma pesquisa e constata que, entre 500 motoristas selecionados
aleatoriamente, 72 usam o telefone enquanto dirigem. Ao nível de 2% de significância as
afirmativas a seguir, a correta é:
a) A companhia de seguro está incorreta, pois o p-valor é 0,001
b) O grupo de defesa dos consumidores está correto, pois o p-valor é 0,001

© Tânia F Bogutchi – PUC Minas – Revisão 2012


156

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

c) O grupo de defesa dos consumidores está correto, pois a estimativa intervalar é


(10,75%; 18,05%)
d) A companhia de seguro está correta, pois a estimativa intervalar é (10,75%; 18,05%)

Correta: D
Solução:
H0 : p = 0,10
H1 : p ≠ 0,10
α = 2% ⇒ z 0 ,01 = 2,32
72
Proporção estimada: p̂ = = 0,144
500
0,144 (1 − 0,144 )
E = 2,32 = 0,0364268
500
Estimativa intervalar com 98% de confiança: 0,144 ± 0,0364268 ⇒ (0,1075 ; 0,1805) ⇒
(10,755 ; 18,05%)

Conclusão: p-valor < 0,02 ⇒ a hipótese nula é rejeitada (ela é falsa) ⇒ hipótese alternativa é
aceita como verdadeira, ou seja, o percentual de motoristas que falam ao telefone é diferente
de 10% (nesse caso é maior) - a empresa de seguro está com a razão.

2) Se for feito o teste unilateral à direita


H0 : p = 0,10
H1 : p > 0,10
α = 2% ⇒ z
0,02 = 2,05

p̂ − p 0 0,144 − 0,10
Estatística do teste: z obs = = ≅ 3,28
p 0 (1 − p 0 ) 0,10(1 − 0,10)
n 500

Teste unilateral, então p-valor = P(Z > zobs) = (Z > 3,28) ≅ 0,000

Questão 9: Um engenheiro do controle de qualidade mediu a espessura da parede de 25


garrafas de 2 litros e encontrou uma média de 4,05 milímetros e um desvio-padrão de 0,08
milímetros. Dessa maneira, o engenheiro conclui, com 95% de confiança, que a verdadeira
média da produção de garrafas possui espessura, em milímetros, entre:
a) 4,15 e 4,25
b) 5,05 e 6,01
c) 4,02 e 4,08
d) 4,03 e 5,03

Correta: C
Solução:
Seja X: espessura das garrafas, em mm
Temos: n=25 ; x = 4,05; dp( X ) = 0,08

© Tânia F Bogutchi – PUC Minas – Revisão 2012


157

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

α = 5% ⇒ z α = 1,96
2

0,08
E = 1,96 = (1,96)(0,016) = 0,03136
25

Estimativa intervalar com 95% de confiança: 4,05 ± 0,03136 ⇒ (4,02 ; 4,08)

Questão 10: Em uma amostra aleatória de 85 mancais de eixos de manivelas de motores de


automóveis, 10 têm um acabamento de superfície que é mais rugoso que as especificações
permitidas. O tamanho da amostra que deverá ser utilizada no caso de se querer estar com
uma confiabilidade de 95% de que o erro em usar essa proporção para estimar a proporção
verdadeira de superfícies fora das especificações seja menor que 5% é aproximadamente:
a) 385
b) 176
c) 185
d) 160

Correta: D
Solução:

) 10
A proporção de defeituosos estimados nessa amostra: p = ≅ 0,1176
85
α = 5% ⇒ z α = 1,96
2

E = 5% = 0,05
 pˆ (1 − pˆ )   pˆ (1 − pˆ ) 
Do erro máximo provável temos: E = zα   = zα   . Isolando o
2 n  2  
 n 
2
 pˆ (1 − pˆ ) 
valor de n dessa fórmula obtemos: n =  zα  .
 2 E 
 
p̂(1 − p̂) = 0,1176(1 − 0,1176) = 0,10376 = 0,3221
Então,
2
 p̂(1 − p̂)   0,3221 
2
n = zα = 1,96  = (12,627) 2 ≅ 159,46.
 2 E   0,05 
 

Conclusão: o tamanho da amostra necessário será de no mínimo 160 mancais.

© Tânia F Bogutchi – PUC Minas – Revisão 2012


158

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Questão 11: Dados sobre a espessura de óxido de semicondutores são os seguintes:


425 431 416 419 421 436 418 410 431 433 423 426
410 435 436 428 411 426 409 437 422 428 413 416

Os valores calculados para essa amostra da: (1) estimativa pontual da espessura média do
óxido para todas as pastilhas na população, (2) o erro-padrão da estimativa pontual do item
(1), (3) a estimativa pontual da proporção de pastilhas na população que tem uma espessura
de óxido maior do que 430 angströms são, respectivamente, aproximados por:
a) 433,0; 9,08; 0,302
b) 423,3; 1,85; 0,292
c) 423,3; 9,08; 0,292
d) 433,0; 1,85; 0,302

Resposta: B
Solução:

Esses n = 24 dados fornecem média de 423,33 e desvio-padrão de 9,08 (estimativa para σ-


desvio-padrão da população).
1) A estimativa pontual da espessura média é fornecida pela média da amostra, logo

µ
ˆ = x =423,3
σ 9,08
2) O erro-padrão da média é obtido por: ep = = =1,85
n 24
3) Os dados apresentam 7 espessuras maiores que 430, logo a estimativa pontual da
7
proporção será de = 0,292
24

Questão 12: Para uma população normal com variância conhecida σ 2 , o nível de confiança
σ σ σ σ
para os intervalos: (1) x − 2,14 ≤ µ ≤ x + 2,14 e (2) x − 1,85 ≤ µ ≤ x + 1,85
n n n n
. São aproximadamente:
a) 1,6% e 3,3%
b) 98,4% e 96,7%
c) 96,8% e 93,6%
d) 3,2% e 6,4%

© Tânia F Bogutchi – PUC Minas – Revisão 2012


159

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Resposta: C
Solução:

Da tabela da Normal, obtemos que


1) P(Z < -2,14)= P(Z > 2,14) = 0,016177 . Logo o nível de confiança será:
1 – (2) (0,016177) = 0,968 (96,8%).
2) Analogamente, P(Z < -1,85) = 0,032157, logo nível de confiança de 93,6%.

Questão 13: O calor liberado, em calorias por grama, de uma mistura de cimento tem
distribuição aproximadamente normal. A média deve ser 100 e o desvio-padrão é 2. Deseja-se

testar as hipóteses: H0 : µ = 100 versus H1 : µ ≠ 100 com uma amostra de 9 espécimes.


Se a região de aceitação da hipótese nula for definida como 98,5 ≤ x ≤ 101,5, a probabilidade
α do erro tipo I é aproximadamente:
a) 0,05
b) 0,024
c) 0,012
d) 0,09

Resposta: B
Solução:
X: calor liberado em calorias por grama
X ~N (100; 2)
n =9 e x =100
I.C. com 95%: x ± E
Mas, I.C. com 95%: 98,5 ≤ x ≤ 101,5
Logo, a amplitude do intervalo de confiança é 101,5 – 98,5 = 3 = 2E, donde E = 1,5

σ n 9
Por definição, E = zα ⇒ zα = E = 1,5 ≅ 2,25
2 n 2 σ 2
E a P(Z < -2,25) = P(Z > 2,25) = 0,01224 – da tabela da normal
Dessa maneira,
α = P(Rejeitar H0 | H0 é verdadeira) = p-valor = 2(0,01224) = 0,024448 ≅ 2,4%

Questão 14: O calor liberado, em calorias por grama, de uma mistura de cimento tem
distribuição aproximadamente normal. A média deve ser 100 e o desvio-padrão é 2. Deseja-se

testar as hipóteses: H0 : µ = 100 versus H1 : µ ≠ 100 com uma amostra de 9 espécimes.

© Tânia F Bogutchi – PUC Minas – Revisão 2012


160

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Se a região de aceitação da hipótese nula for definida como 98,5 ≤ x ≤ 101,5, o valor da
probabilidade β do erro tipo II para o caso em que o verdadeiro calor médio liberado seja de

103, é aproximadamente:
a) 0,05
b) 0,024
c) 0,012
d) 0,09

Resposta: C
Solução:
Para µ =103, temos β =P(98,5 ≤ x ≤ 101,5 | µ =103)

 
 98,5 − 103 x − 103 101,5 − 103 
β = P ≤ ≤  = P(-6,75 ≤ Z ≤ -2,25)
 2 2 2 
 9 9 9 
= P(Z ≤ -2,25) - P(Z ≤ -6,75) = 0,01222 – 0

Logo, β ≅ 0,012

Questão 15: Um pesquisador afirma que no mínimo 10% dos capacetes utilizados nas provas
de ciclismos têm falhas de fabricação que poderiam causar danos físicos ao usuário. Uma
amostra de 200 capacetes revelou que 16 deles continham tais defeitos. Das afirmações a
seguir, a única que está CORRETA, considerando o nível de significância de 5%, é:
a) A hipótese nula foi rejeitada, logo a afirmativa do pesquisador está correta.
b) A hipótese nula foi aceita, logo a afirmativa do pesquisador está incorreta.
c) O pesquisador está correto em sua afirmativa, pois p-valor < 0,05.
d) O pesquisador está correto em sua afirmativa, pois o poder do teste é de 95%.

Resposta: B
Solução:
Pesquisador afirma: p ≥ 10% = 0,10

) 16
Amostra com n = 200, 16 são defeituosos ⇒ p= = 0,08
200
Hipóteses do pesquisador: H0 : p = 0,10 vs. H1: p > 0,10

© Tânia F Bogutchi – PUC Minas – Revisão 2012


161

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística
)
p− p 0,08 − 0,10
Teste: zobs = = = −0,94
p (1 − p ) (0,10)(0,90)
n 200
Logo, se α = 5% , z α =1,64, como zobs < 1,64 ⇒ H0 é aceita ⇒ afirmativa do pesquisador
está incorreta.

Analogamente, se α = 1% , z α =2,32 ⇒ H0 é aceita ⇒ afirmativa do pesquisador está


incorreta.
Conclusão: ao nível de significância de 5% a afirmativa do pesquisador está incorreta.

Questão 16: O sistema de resfriamento em um submarino nuclear consiste em um arranjo de


tubos soldados, através dos quais circula um líquido refrigerante. As especificações requerem
que a resistência da solda tem de encontrar ou exceder a 150 psi. Sabe-se que a resistência é
uma variável aleatória normalmente distribuída com desvio-padrão de 11,3 psi. Uma amostra
de 20 soldas resultou em uma média de 153,7 psi. Considerando esses dados, a única
afirmativa INCORRETA é:
a) Ao nível de significância de 10%, a hipótese nula é rejeitada, pois p-valor=0,072
b) Ao nível de significância de 5%, a hipótese alternativa é rejeitada, pois p-
valor=0,072
c) Ao nível de significância de 5%, a hipótese nula é rejeitada, pois p-valor=0,072
d) Ao nível de significância de 10%, a hipótese alternativa é aceita, pois p-valor=0,072

Resposta: C
Solução:

X: resistência à solda, em psi.


X ~N ( µ ; 11,3)

Hipóteses: H0 : µ = 150 vs. H1: µ > 150

n = 20 e x = 153,7 psi

153,7 − 150
Teste: zobs = = 1,46
11,3
20
Logo, se α = 5% , z α =1,64, como zobs < 1,64 ⇒ H0 é aceita ⇒ H1 é rejeitada

p-valor = P(Z > 1,46) = 0,072145 ≅ 7,2% > 5%

© Tânia F Bogutchi – PUC Minas – Revisão 2012


162

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Analogamente, se α = 10% , z α =1,28 como zobs > 1,28 ⇒ H0 é rejeitada ⇒ H1 é aceita

p-valor ≅ 7,2% < 10%

Questão 17: Deseja-se obter uma estimativa de intervalo de confiança para o ganho em um
circuito de um dispositivo semicondutor. Suponha que o ganho seja normalmente distribuído
com média igual a 1000 e desvio-padrão igual a 20. O erro máximo provável (erro amostral)
obtidos na construção de intervalos de 95% de confiança para uma amostra de tamanho 10,
outro para uma amostra de tamanho 25 e outro para uma amostra de tamanho 50, são
respectivamente:
a) 4,639; 6,560; 12,372
b) 10,372; 6,560; 4,639
c) 12,396 ; 7,840 ; 5,544
d) 5,544; 7,840 ; 12,396
Correta: C
Solução:
Seja X: ganho em circuitos semicondutores

 20 
X ~ N (1.000; 20) ⇒ X ~ N1.000; 
 n
 20 
1) para n = 10 ⇒ X ~ N1.000;  ⇒ X ~ N(1.000; 6,3245)

 10 

I.C.95% : E = (1,96)(6,3245) = 12,396 → {I.C.: (1.000 ± 12,397)→ (987,603; 1.012,325)}

 20 
2) para n = 25 ⇒ X ~ N1.000;  ⇒ X ~ N(1.000; 4)
 25 
I.C.95% : E = (1,96)(4) = 7,84 → {I.C.: (1.000 ± 7,84) → (992,16 ; 1.007,84)}

 20 
3) para n = 50 ⇒ X ~ N1.000;  ⇒ X ~ N(1.000; 2,828)
 50 
I.C.95% : E = (1,96)(2,828) = 5,544 → {I.C.: (1.000 ± 5,544) → (994,456 ; 1.007,544)}
e)

Questão 18: Suponha que foram retiradas 100 amostras aleatórias de água proveniente de
um lago com água límpida, sendo medida a concentração de cálcio em miligramas por litro. Um
intervalo com 95% de confiança para a concentração média de cálcio é 0,49 ≤ µ ≤ 0,82 .

© Tânia F Bogutchi – PUC Minas – Revisão 2012


163

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

Considere se as seguintes afirmações estão corretas escolhendo a opção Verdadeira (V) ou se


estão incorretas, escolhendo a opção Falsa (F):
a) Há uma probabilidade de 95% de o verdadeiro valor da média () estar entre 0,49 e
0,82.
Correta: F
Solução:

ERRADO. O intervalo de confiança é um intervalo aleatório. A probabilidade de ele conter ou


não conter o verdadeiro valor de µ é a mesma e igual a 1. O nível de confiança é que é de

95% de que o verdadeiro valor tenha sido encontrado, ou seja, admite-se um erro máximo de
5% de erro
b) Se 100 amostras aleatórias de água proveniente do lago forem tomadas e o
Intervalo de Confiança de 95% para  for calculado e se esse processo for repetido
por 1.000 vezes, 950 dos intervalos de confiança conterão o valor verdadeiro de .
Correta: V
Solução:

CORRETO. Nível de confiança tem exatamente esse conceito, num processo de repetições
aleatórias espera-se encontrar o verdadeiro valor em 95% dos intervalos construídos para cada
uma dessas repetições. Nesse caso, se forem feitas 1.000 repetições do processo é esperado
que 950 dos intervalos construídos contenham o verdadeiro valor da média e que 50 deles (5%
de 1.000) venham a falhar. Os limites (inferior e superior) dos intervalos são variáveis
aleatórias

Questão 19: Em um estudo para estimar a fração (proporção) de circuitos integrados


defeituosos produzidos em um processo de fotolitografia foi retirada uma amostra de 300
circuitos para serem testados e foram encontrados 13 defeitos. Um intervalo bilateral (ou
bicaudal) de 90% de confiança para a proporção, p, de circuitos defeituosos produzidos por
essa ferramenta particular é aproximadamente:
a) (2,0% ; 6,6%)
b) (2,4%; 6,2%)
c) (1,8%; 7,2%)
d) (1,6%; 7,0%)
Correta: B
Solução:
1) Intervalo com 90% de confiança:
proporção de circuitos defeituosos produzidos por essa ferramenta particular:

© Tânia F Bogutchi – PUC Minas – Revisão 2012


164

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

13
pˆ = ≅ 0,043
300
0,043(1 − 0,043)
desvio − padrão de pˆ : dp( pˆ ) = ≅ 0,0117
300
I.C. de 90% →  = 10% = 0,10 ⇒ z α = z 0 ,05 = 1,64
2

E = (1,64)(0,0117) = 0,0192
Logo, I.C.98% : (0,043 ± 0,0192) ⇒ (0,0238 ; 0,0622) ⇒ (2,4% ; 6,2%)

Questão 20: Os produtores de um programa de televisão pretendem modificá-lo se for


assistido regularmente por menos de um quarto dos possuidores de televisão. Uma pesquisa
encomendada a uma empresa especializada mostrou que, de 400 famílias entrevistadas, 80
assistem ao programa regularmente. Com base nos dados, qual deve ser a decisão dos
produtores, considerando um nível de significância de 5%?. Decida se cada uma das afirmações
a seguir é Verdadeira (V) ou Falsa (F):
a) A hipótese alternativa (H1: p < 0,25) é rejeitada, pois p-valor= 0,011
b) A hipótese alternativa (H1: p < 0,25) é aceita, pois p-valor= 0,011
c) A hipótese nula (H0: p = 0,25) é aceita, pois p-valor= 0,011
d) A hipótese nula (H0: p = 0,25) é rejeitada, pois p-valor= 0,011

Solução:
H0 : p = 0,25
H1 : p < 0,25
80
Proporção estimada: p̂ = = 0,20
400

p̂ − p 0 0,20 − 0,25
Estatística do teste: z obs = = ≅ −2,30
p 0 (1 − p 0 ) 0,25(1 − 0,25)
n 400
Teste unilateral, então p-valor = P(Z < zobs) = P(Z < -2,31) = 0,0107 ≅ 0,011

Conclusão: p-valor < 0,05 ⇒ a hipótese nula é rejeitada (ela é falsa) ⇒ hipótese alternativa é
aceita como verdadeira.

Portanto:
a) A hipótese alternativa (H1: p < 0,25) é rejeitada, pois p-valor= 0,011
FALSA
b) A hipótese alternativa (H1: p < 0,25) é aceita, pois p-valor= 0,011

© Tânia F Bogutchi – PUC Minas – Revisão 2012


165

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

VERDADEIRA
c) A hipótese nula (H0: p = 0,25) é aceita, pois p-valor= 0,011
FALSA
d) A hipótese nula (H0: p = 0,25) é rejeitada, pois p-valor= 0,011
VERDADEIRA

Questão 21: As companhias de seguro de automóvel estão cogitando de elevar os prêmios


para aqueles que falam ao telefone enquanto dirigem. Um grupo de defesa dos consumidores
afirma que este problema não é tão sério, porque apenas 10% dos motoristas usam o telefone.
Uma companhia de seguro faz uma pesquisa e constata que, entre 500 motoristas
selecionados aleatoriamente, 72 usam o telefone enquanto dirigem. Ao nível de 2% de
significância as afirmativas a seguir, a correta é:
a) A companhia de seguro está incorreta, pois o p-valor é 0,001
b) O grupo de defesa dos consumidores está correto, pois o p-valor é 0,001
c) A companhia de seguro está correta, pois a estimativa intervalar é (10,75%; 18,05%)
d) O grupo de defesa dos consumidores está correto, pois a estimativa intervalar é
(10,75%; 18,05%)
Correta: C
Solução:
H0 : p = 0,10
H1 : p ≠ 0,10
α = 2% ⇒ z 0 ,01 = 2,32

72
Proporção estimada: p̂ = = 0,144
500

0,144 (1 − 0,144 )
E = 2,32 = 0,0364268
500

Estimativa intervalar com 98% de confiança: 0,144 ± 0,0364268 ⇒ (0,1075 ; 0,1805) ⇒


(10,755 ; 18,05%)

Conclusão: p-valor < 0,02 ⇒ a hipótese nula é rejeitada (ela é falsa) ⇒ hipótese alternativa é
aceita como verdadeira, ou seja, o percentual de motoristas que falam ao telefone é diferente
de 10% (nesse caso é maior) - a empresa de seguro está com a razão.

Obs.: Se for feito o teste unilateral à direita


H0 : p = 0,10
H1 : p > 0,10

© Tânia F Bogutchi – PUC Minas – Revisão 2012


166

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

α = 2% ⇒ z 0, 02 = 2,05

p̂ − p 0 0,144 − 0,10
Estatística do teste: z obs = = ≅ 3,28
p 0 (1 − p 0 ) 0,10(1 − 0,10)
n 500

Teste unilateral, então p-valor = P(Z > zobs) = (Z > 3,28) ≅ 0,000
Conclusão: hipótese nula é rejeitada, consequentemente a hipótese alternativa é verdadeira e
nesse caso, corrobora a empresa de seguro

Questão 22: Uma pesquisa com 150 executivos de recursos humanos mostrou que 44% deles
acreditam que “pequeno ou nenhum conhecimento da companhia” é o erro mais freqüente
cometido pelos candidatos, durante entrevistas para emprego. Ao nível de significância de 5%
para testar a afirmativa de que metade de todos os executivos identifica aquele erro como o
mais comum em entrevistas para emprego, pode-se concluir:
a) A afirmativa está correta, pois o p-valor é 0,142
b) A afirmativa está incorreta, pois o p-valor é 0,142
c) A afirmativa está correta, pois a estatística do teste Z é 1,96
d) A afirmativa está incorreta, pois o nível de significância é de 5%
Correta: A
Solução:

H0 : p = 0,50 vs H1 : p ≠ 0,50
Temos: n = 150 e p̂ = 0,44

p̂ − p 0 0,44 − 0,50
Estatística do teste: z obs = = ≅ −1,47
p 0 (1 − p 0 ) 0,50(1 − 0,50)
n 150
Teste bilateral, então p-valor = 2P(Z < zobs) = 2P(Z < -1,47= 2(0,070781)=0,14156

Conclusão: p-valor > 0,05 ⇒ a hipótese nula não é rejeitada (ela é verdadeira) ⇒ a afirmativa

está correta

Questão 23: Sabe-se que a vida, em horas, de uma bateria tem aproximadamente uma
distribuição normal com desvio-padrão de 1,25 horas. O fabricante garante que a vida útil das
baterias excede 40 horas. Uma amostra aleatória de 10 baterias tem uma vida média de 40,5

© Tânia F Bogutchi – PUC Minas – Revisão 2012


167

Probabilidade e Estatística I
Unidade 4: Introdução à Inferência Estatística

horas. Faça o teste estatístico adequado usando um nível de significância de 5%. Decida se
cada uma das afirmações a seguir é Verdadeira (V) ou Falsa (F):
a) O fabricante está correto, pois o teste indica rejeição de H0
b) O fabricante está incorreto, pois o teste indica aceitação de H0
c) O fabricante está incorreto, pois a estatística do teste é menor que 1,96
d) O fabricante está incorreto, pois p-valor é maior que 0,05
Solução:
X: tempo de vida das baterias, em horas
X ~ N( ; 1,25)
Temos: n = 10 e x = 40,5

H0 : µ = 40
H1 : µ > 40

40,5 − 40 0,5
z obs = = = 1,26
1,25 0,39528
10
Teste unilateral, zobs < zcrítico=1,64 ⇒ indicação: não rejeitar a hipótese nula , isto significa que
o tempo de vida das baterias Não excede 40 h.

Teste unilateral, então p-valor = P(Z > zobs) = P(Z > 1,26) = P(Z < -1,26)= 0,103835
Conclusão: p-valor > 0,05 ⇒ a hipótese nula não é rejeitada (ela é verdadeira) ⇒ hipótese
alternativa é aceita como falsa
a) O fabricante está correto, pois o teste indica rejeição de H0
FALSA

b) O fabricante está incorreto, pois o teste indica aceitação de H0


VERDADEIRA

c) O fabricante está incorreto, pois a estatística do teste é menor que 1,96


VERDADEIRA

d) O fabricante está incorreto, pois p-valor é maior que 0,05


VERDADEIRA

© Tânia F Bogutchi – PUC Minas – Revisão 2012