Escolar Documentos
Profissional Documentos
Cultura Documentos
Objetivos do Capítulo
No capítulo anterior foi visto como estimar a média de uma população e como determinar um
intervalo de confiança para um valor do nível de confidência. Neste capítulo será visto como
essa média pode ser usada para se tirar conclusões sobre valores. Ao término deste capítulo,
você deverá ser capaz de:
159
8.1 A natureza do teste de hipótese
O teste de hipótese pode ser empregado para se tomar decisões sobre o valor de um parâmetro de
uma população tal como a média ou uma proporção da população. Por exemplo, pode-se ter uma
situação onde um grupo de consumidores deseja saber se a vida de uma determinada marca de
lâmpada corresponde ao valor de 700 horas anunciado pelo fabricante ou se a idade média, µ,
dos estudantes que entraram em uma universidade pública diminuiu com relação ao valor µo de
10 anos atrás.
Um dos métodos usados para se tomar tais decisões é o método denominado teste de
hipótese. Uma hipótese é simplesmente uma afirmação de que alguma coisa é verdadeira. Por
exemplo, a afirmação “o conteúdo líquido de todas as latas de cerveja da marca Cristal sendo
envasilhadas difere do volume anunciado de 350 ml” é uma hipótese.
Hipótese nula: É a hipótese a ser testada. Usamos a notação Ho para indicar a hipótese nula.
Hipótese alternativa: É a hipótese a ser considerada como uma alternativa à hipótese nula.
Usamos a notação Ha para indicar a hipótese alternativa.
Por exemplo, no caso das latas de cerveja, a hipótese nula poderia ser “o conteúdo médio
de todas as latas de cerveja envasilhadas é igual ao conteúdo anunciado de 350 ml” e a hipótese
alternativa poderia ser “o conteúdo médio de todas as latas de cerveja envasilhadas difere do
conteúdo anunciado de 350 ml”. Isto seria indicado por:
Ho: µ = µo
A hipótese alternativa, por outro lado, deve refletir o propósito do teste de hipótese em
questão. Existem três possibilidades para a escolha da hipótese alternativa.
160
1. Teste bilateral: Se estivermos preocupados em decidir se a média de uma população, µ, é
diferente de um valor especificado µo. Neste caso expressamos a hipótese alternativa
como
Ha: µ ≠ µo
Uma vez definidas as duas hipóteses, a questão agora é: Como podemos decidir qual das
duas hipóteses é a verdadeira, isto é, como decidir se devemos rejeitar ou não a hipótese nula em
favor da hipótese alternativa?
Uma companhia produz saquinhos de batata de 454 gramas. Para verificar se a máquina de
empacotar está trabalhando corretamente o controle de qualidade tomou uma amostra aleatória
de 50 saquinhos. Os pesos líquidos, em gramas, dos 50 saquinhos de batata obtidos são
mostrados na tabela abaixo.
161
Tabela 8.1 – Pesos dos 50 saquinhos de batata (gramas).
Solução:
Ho: µ = 454 g
Ha: µ ≠ 454 g
_
x=
∑ x = 22.261 = 451,2 g
n 50
µ =µ σ
_ σ =_
x x n
0,9544
x
µ - 2σx µ µ +2σx
-2 0 2
Figura 8.1 – Distribuição normal das médias das amostras
Com base neste fato, podemos dizer, por exemplo, que a probabilidade da média x estar
em um intervalo de dois desvios padrões da média da população µ é de 0,9544, ou ainda, que a
probabilidade da média da amostra estar fora deste intervalo é de apenas 0,0456 (1-0,9544),
como mostrado na figura 8.1. Podemos usar este fato como um critério para decidir se devemos
ou não rejeitar a hipótese nula. Especificamente, se a média da amostra retirada da população
estiver dentro do intervalo então podemos atribuir a diferença encontrada a um erro de
amostragem e, assim, aceitar a hipótese nula. Por outro lado, se a média da amostra estiver
distante mais de dois desvios padrões da média da população de 454g, então podemos concluir
que a hipótese nula é verdadeira e um evento extremamente improvável ocorreu durante a coleta
da amostra ou que a hipótese nula é falsa (o que é muito mais razoável) e que a hipótese
alternativa é verdadeira.
Se a média x, dos 50 sacos de batata coletados estiver mais de dois desvios padrões distante
da média da população (454g), então rejeite a hipótese nula, µ = 454g, e conclua que a
hipótese alternativa, µ ≠ 454g, é verdadeira. Caso contrário, não rejeite a hipótese nula.
Na figura 8.2, isto é mostrado graficamente através das regiões de rejeição e não rejeição.
163
Rejeite Ho Não rejeite Ho Rejeite Ho
0,0228 0,0228
0,9544
x
454 - 2σx 454 454 +2σx
-2 0 2 z
A probabilidade de rejeitar Ho é de apenas 0,0456, como pode ser visto na figura acima. Esta
probabilidade é denominada nível de significância do teste de hipótese.
d) Finalmente, aplicando o critério da parte (c) aos dados coletados da amostra, podemos colocar
nossa conclusão. Assumiremos que o desvio padrão da população seja conhecido e igual a σ =
7,9 gramas. Para aplicar o critério da parte (c) necessitamos determinar quantos desvios padrões
a média da amostra se desvia da média da população. Isto é feito determinando-se o valor da
variável aleatória padrão
_ _
x − 454 x − 454
z= =
σ _ σ n
x
Sabendo que σ = 7,9 gramas, n = 50 e, da parte (b), que a média da amostra é 451,2 gramas
podemos calcular o valor de z.
_
x − 454 451,2 − 454
z= = = −2,51
σ 7,9
n 50
Uma vez que a média dos 50 saquinhos de batata se encontra a mais de 2 desvios padrões
da média de 454 gramas, decidimos rejeitar a hipótese nula e concluir que a hipótese alternativa,
µ ≠ 454 gramas, é verdadeira. Em outras palavras, os dados proporcionam evidência suficiente
para concluir que a máquina de empacotamento não está trabalhando corretamente.
164
Erros tipo I e II
Como pode ser visto do exemplo, uma vez formuladas as hipóteses Ho e Ha, o nosso
objetivo é analisar os dados da amostra para escolher se rejeitamos Ho ou se retemos Ho. A
rejeição de Ho implica em confirmar Ha e a não rejeição de Ho significa que não há evidência de
que Ha seja verdadeira. Porém, o ponto mais importante é que a decisão de rejeitar Ho deve ser
baseada em uma forte evidência senão, a hipótese Ha não poderá ser considerada verdadeira além
de uma certa dúvida. Qualquer que seja a decisão, é sempre possível que ela seja incorreta
devido ao fato de se usar informações obtidas através de uma amostra da população.
Em testes de hipóteses existem quatro possíveis resultados, sendo que dois deles levam a
decisões incorretas, como pode ser visto na tabela abaixo.
Como pode ser visto da tabela, uma decisão incorreta ocorre se rejeitamos uma hipótese
nula verdadeira ou se não rejeitamos uma hipótese nula falsa. A primeira decisão incorreta é
denominada Erro tipo I e a segunda, Erro tipo II.
165
A probabilidade de cometer o Erro do tipo II é a probabilidade de não rejeitar uma
hipótese nula falsa. Em outras palavras, é a probabilidade da estatística de teste estar na região de
não rejeição mesmo sendo falsa a hipótese nula. A letra grega β é utilizada para indicar a
probabilidade do Erro tipo II.
Assumindo um teste de hipótese unilateral à esquerda, fica fácil mostrar que escolhido
um valor pequeno para α, será improvável que a hipótese nula será rejeitada quando ela de fato
for verdadeira. Na figura 8.3, a probabilidade α é definida pela área hachurada sob a curva
normal com µ = 270. Por outro lado, a probabilidade β de se cometer um Erro tipo II não é
normalmente conhecida e depende do valor de µ que ocorrer quando Ha for verdadeira. Essa
probabilidade é mostrada na figura 8.3 pela área hachurada sob a curva normal com µ = 262
(assumido), considerando que Ha seja verdadeira, ou seja, µ < 270.
x
c µ = 270
c x
µ = 262
Figura 8.3 – As probabilidades de erro α e β.
Também da figura 8.3 pode-se observar que não existe uma escolha do ponto c (fronteira
das regiões de rejeição e de não rejeição) que minimize ambas as probabilidades de erro. Se c é
deslocado para a esquerda, α fica menor mas β torna-se maior e o oposto ocorre se c é deslocado
para a direita. Em vista desse dilema, e assumindo que uma rejeição errada de Ho seja um erro
mais sério, nós usualmente fixamos α com um valor baixo, como por exemplo α = 0,10 ou α =
0,05 ou, ainda, α = 0,01.
166
8.3 Teste de hipótese para média de uma população com base em grandes amostras
Procedimento 8.1- Teste de hipóteses para uma média de uma população com
hipótese nula Ho: µ = µo
α/2 α/2 α α
z z z
- zα/2 0 zα/2 - zα 0 0 zα
Bilateral Unilateral à esquerda Unilateral à direita
167
Nota: No passo 4 do procedimento nós usamos o desvio padrão da amostra, s, em vez do desvio
padrão da população σ, porque nós raramente conhecemos σ e o desvio padrão s é uma boa
estimativa de σ quando se trabalha com grandes amostras. Nos raros casos onde σ é conhecido,
ele deve ser usado no lugar de s para o cálculo de z no passo 4 do procedimento.
Uma empresa de coleta de informações verificou que em 1986, o preço médio, no varejo, de
todos os livros de capa dura de História era de U$ 28,44 dólares. Os preços de varejo de 40 livros
de História deste ano, aleatoriamente escolhidos, são dados na tabela 8.4 como valores inteiros
em dólares. Os dados fornecidos proporcionam evidência suficiente para concluir que o preço
deste ano de todos os livros de História de capa dura aumentou com relação à média de U$ 28,44
de 1986? Realize o teste apropriado com nível de significância de 1%.
35 37 33 26 50 32 30 39
32 33 48 27 20 24 33 31
39 25 28 31 36 32 26 41
33 25 35 32 41 36 45 27
18 28 32 36 22 34 26 21
Solução:
Uma vez que o tamanho da amostra é grande (n ≥ 30), podemos aplicar o procedimento 8.1.
Para α = 0,01, o valor crítico será z0,01. Da tabela 8.3 (ou tabela 6.1) obtemos z0,01 = 2,33.
Portanto, o valor crítico é 2,33, conforme mostrado na figura 8.4.
168
Não rejeite Ho Rejeite Ho
Área de 0,01
z
0 2,33
_
x− µ o
z=
s n
_
x− µ o 31,75 − 28,44
z= = = 2,85
s n 7,53 40
Este valor de z está marcado na figura 8.4 com uma bolinha preta próxima do valor 2,33.
Passo 5 – Se o valor da estatística de teste cair na região de rejeição, então rejeite Ho;
caso contrário, não rejeite Ho.
O valor da estatística de teste encontrado é de 2,85. Como pode ser visto na figura 8.4,
esse valor cai na região de rejeição e, assim, nós devemos rejeitar Ho.
Os dados proporcionam evidência suficiente para concluir que o preço médio de todos os
livros de história aumentou com relação ao preço médio de 1986.
169
Já vimos no capítulo anterior que se tomarmos uma amostra de tamanho n de uma
população normalmente distribuída com média µ, a variável aleatória
_
x− µ
t=
s n
tem uma distribuição t com n-1 graus de liberdade. Em outras palavras, as probabilidades para
aquela variável aleatória são iguais às áreas sob a curva t com GL = n-1. Conseqüentemente,
quando a população sendo amostrada é normalmente distribuída, nós podemos realizar um teste
de hipóteses com a hipótese nula Ho: µ = µo, empregando a variável aleatória acima como nossa
estatística de teste e usando a tabela da distribuição t para obter o valor crítico (ou os valores
críticos).
Procedimento 8.2- Teste de hipóteses para uma média de uma população com
hipótese nula Ho: µ = µo
α/2 α/2 α α
t t t
- tα/2 0 tα/2 - tα 0 0 tα
Bilateral Unilateral à esquerda Unilateral à direita
170
Exemplo 8.4 – Ilustra o procedimento 8.2
Assuma que a média de gasto com energia elétrica de todas as famílias de uma certa
região seja de R$ 1123,00 em um determinado ano. Neste mesmo ano, coletando-se uma amostra
aleatória de 15 famílias de classe média alta obteve-se os valores mostrados na tabela abaixo,
arredondados para o inteiro mais próximo. Com um nível de significância de 5%, os dados
indicam que famílias da classe média alta gastam, em média, em energia mais do que a média da
região de R$ 1123,00? (Assuma que a distribuição de gasto com energia das famílias da classe
média alta seja normalmente distribuída).
Solução:
O valor crítico para um teste unilateral à direita é tα, com GL = n-1. Neste caso, n = 15 e
GL = 15-1 = 14, com α = 0,05. Da tabela 7.4 (capítulo 7, pag. 151) obtemos t0,05 = 1,761. Veja
figura 8.5.
Curva t com
GL = 14
0,05
t
0 1,761
_
x− µ o
t=
s n
Sabemos que µo = 1123 e n = 15. Além disso, a média e o desvio padrão dos dados
constantes na tabela acima são 1344,27 e 231, respectivamente. Conseqüentemente, o valor da
estatística de teste é:
_
x− µ o 1344,27 − 1123
t= = = 3,710
s n 231 15
Passo 5 – Se o valor da estatística de teste cair na região de rejeição, então rejeite Ho;
caso contrário não rejeite Ho.
O valor encontrado é igual a 3,710 e este valor cai dentro da região de rejeição. Assim,
nós rejeitamos Ho.
Os dados proporcionam evidência suficiente para concluir que famílias da classe média
alta gastaram mais do que a média das famílias da região.
172
Exercícios – Sequência 8.1
1) Um fabricante de tintas afirma que o tempo médio de secagem de sua nova tinta látex é
de duas horas. Para testar esta afirmação, foram obtidos os tempos de secagem para 20
latas aleatoriamente selecionadas. A média da amostra e o desvio padrão são 123,1 min e
10,0 min, respectivamente. Assumindo que os tempos de secagem sejam normalmente
distribuídos, os dados apresentados proporcionam evidência suficiente para concluir que
o tempo médio de secagem é na verdade maior do que o tempo anunciado de 120 min?
Use α = 0,05.
a) Os dados indicam que a vida média das baterias recebidas é menor do que os 36
meses anunciados? Realize o teste com 1% de nível de significância. (Nota: Σx =
303,3 e Σx2 = 9343,85).
b) Qual condição você tem que assumir sobre as vidas das baterias para realizar o teste
de hipóteses que você realizou na parte a?
173
8.5 Teste de hipótese para médias de duas populações
Nesta seção examinamos métodos usados para fazer inferência estatística sobre as médias
de duas populações trabalhando com amostras grandes e independentes. Entendemos que duas
amostras são independentes se a amostra retirada de uma população não interfere na amostra
retirada da outra população.
População 1 População 2
µ1 µ2
σ1 σ2
n1 Amostra 1 Amostra 2 n2
x1 x2
s1 Calcule média 1 Calcule média 2 s2
1. Nosso problema é que nós temos duas populações com médias µ1 e µ2 e desejamos saber
se existe diferença entre elas. A hipótese nula é
2. Observando a figura 8.6, note que retiramos uma amostra de cada uma das populações e
_ _
calculamos as médias. A diferença observada x1 − x 2 é, agora, a estatística de teste (em
vez de x da seção anterior).
174
3. Se retirássemos todas as possíveis amostras de tamanho n1 e n2 das duas populações, nós
teríamos uma distribuição das “diferenças entre as médias das amostras”. Se as amostras
são grandes, o Teorema do Limite Central nos permite assumir que a distribuição da
amostragem é aproximadamente normal.
2 2 σ 12 σ 22
σ _ _ = σ _ + σ _ = +
x1 − x2 x1 x2 n
1 n 2
6. Como os valores das variâncias das duas populações são raramente conhecidos, podemos
usar as variâncias das amostras como estimadores ou estimativas das variâncias das
populações para calcular uma estimativa do desvio padrão. Para isso, basta substituir σ
por s na fórmula anterior.
s12 s 22
s_ _ = +
x1 − x2
n1 n2
_ _
7. A localização da estatística da amostra x1 − x 2 , relativa à média da distribuição, pode ser
encontrada calculando-se o valor de z.
_ _
x1 − x 2 − 0
z=
s_ _
x1 − x2
175
8. Se a estatística de teste cair na região de rejeição então rejeite Ho; caso contrário, não
rejeite Ho.
Solução:
Passo 1 – Definir as hipóteses nula e alternativa.
Seja µ1 a média salarial dos professores da rede pública e µ2 a média salarial dos
professores da rede privada. As hipóteses nula e alternativa podem ser escritas como
z
0
-1,96 1,96
176
_ _
x1 − x 2 − 0
37335,20 − 39558,97
z= = = −0,64
s_ _ 3481,92
x1 − x2
Passo 5 – Pela figura observamos que o valor –0,64 não cai dentro da região de rejeição. Assim,
nós não rejeitamos a hipótese nula Ho.
177
Exercícios – Sequência 8.2
Tratamento 1 Tratamento 2
Média 109 128
Desvio padrão 46,2 53,4
Com base nos dados acima é possível concluir que o tratamento 2 tem uma resposta
maior que o tratamento 1? Adote um nível de significância de 5%.
178