Teste de Hipótese

Testes de Hipóteses para a Diferença Entre Duas Médias Populacionais
Vamos considerar o seguinte problema: Um pesquisador está estudando o

efeito da deficiência de vitamina E sobre o armazenamento de vitamina A em
ratos. Ele quer saber se uma dieta deficiente em vitamina E altera a quantidade
de vitamina A armazenada. A pergunta que ele faz é:
O valor médio de vitamina A armazenada em ratos com dieta deficiente em

vitamina E é igual ao valor médio de vitamina A armazenada em ratos com
dieta normal?
Para responder a sua pergunta, o pesquisador toma um grupo de 20 ratos e os

divide aleatoriamente em dois grupos de 10. Durante um certo tempo, um dos
grupos é alimentado com a dieta normal e o outro grupo é alimentado com
uma dieta deficiente em vitamina E. Depois disso, o pesquisador sacrifica os
ratos dos dois grupos e mede a quantidade de vitamina A no fígado deles.
O valor médio de vitamina A no fígado dos ratos alimentados com a dieta

normal foi de x1 = 3.371 ui (unidades internacionais) e o valor médio de
vitamina A armazenada no fígado dos ratos alimentados com a dieta deficiente
em vitamina E foi de x2 = 2.570 ui, de maneira que a diferença entre as médias
das duas amostras é de: x1 − x 2 = 805 ui.
O problema agora é decidir se essa diferença é grande o suficiente para que o

pesquisador possa concluir que existe realmente uma diferença na quantidade
de vitamina A armazenada entre as duas populações, ou se a diferença obtida é
apenas uma variação amostral.
1
Vamos supor que o pesquisador tem bons motivos para crer que as
distribuições populacionais da vitamina A armazenada no fígado de ratos com
dietas normal e deficiente em vitamina E são normais.
Vamos supor também que o pesquisador conhece as variâncias populacionais

σ 12 e σ 22 . Este é um caso muito difícil de acontecer na prática, mas vamos
considerá-lo aqui apenas para ilustrar o método. Vamos supor que σ1 = σ2 =

600 ui.
Para este caso, sabemos que a distribuição amostral da diferença entre as

médias x1 − x2 tem média igual a µ x − x = µ 1 − µ 2 e desvio padrão igual a
1 2
σ 12 σ 22 σ2 σ2 2 × (600)
2
σ x1 − x2 = + = + = = 268,2 ui.
n1 n2 n1 n2 10
A hipótese nula a ser testada neste caso é:

H0: µ1 = µ 2 ⇒ µ1 − µ 2 = 0;
H1: µ1 ≠ µ 2 ⇒ µ1 − µ 2 ≠ 0.
Portanto, o teste é bilateral.
Para encontrar o valor P, calculamos o valor z correspondente a x1 − x2 = 805 :

805 − 0
z= = 3,0.
268,2
Isto implica que o valor P é 0,0026 (veja a figura a seguir).
2
Para um nível de significância de α = 0,05, temos que P < α e deve-se rejeitar
a hipótese nula. O pesquisador conclui então que, com um nível de
significância de 0,05 existe uma diferença entre as quantidades de vitamina A
armazenadas no fígado de ratos alimentados com dieta normal e deficiente em
vitamina E.
O exemplo dado foi para um teste bilateral. Entretanto, o pesquisador poderia

ter feito um teste unilateral. Suponha que ele tenha certeza que a dieta
deficiente em vitamina E não pode ocasionar um aumento na quantidade de
vitamina A armazenada. Neste caso, a sua pergunta seria: µ1 é maior do que
µ2 ?
Agora a hipótese nula é H0: µ1 ≤ µ 2 e o valor P deve ser calculado apenas
como a probabilidade de que x1 − x2 seja maior que 805 ui se µ1 = µ 2 . Neste

caso, o valor P é 0,0013 e continua menor que 0,05. Novamente a hipótese
nula é rejeitada e a conclusão do experimento favorece a hipótese alternativa
com um nível de significância de 0,05: H1: µ1 > µ 2 .
Vamos agora considerar o caso mais realista em que as variâncias

populacionais σ 12 e σ 22 são desconhecidas.
3
Neste caso, sabemos que há duas possibilidades: σ 12 = σ 22 e σ 12 ≠ σ 22 . Já vimos,
nas aulas sobre distribuições amostrais, como tratar os dois casos. Aqui,
vamos considerar apenas o caso em que σ 12 = σ 22 .
Vamos supor que no caso do exemplo anterior σ 2

é desconhecida, mas o
desvio padrão foi calculado para cada amostra, dando:
s1 = 626 ui e s2 = 538 ui.
Conhecendo-se s1 e s2 , pode-se estimar o valor desconhecido de σ como:
(n1 − 1)s12 + (n2 − 1)s 22 9(626) 2 + 9(538) 2

σ =
2
= = 340958 ⇒
n1 + n 2 − 2 18
⇒ σ = 584 ui .
Desta forma, o valor estimado para o desvio padrão da distribuição amostral

da diferença entre as médias é,
584 2 584 2
σ x1 − x2 = + = 261 ui.
10 10
Como no exemplo anterior, a hipótese nula é:

H0: µ1 = µ 2 ⇒ µ1 − µ 2 = 0;
H1: µ1 ≠ µ 2 ⇒ µ1 − µ 2 ≠ 0.
Agora porém, como as amostras são pequenas e as variâncias populacionais

são desconhecidas, devemos usar a distribuição t de Student. Para encontrar o
valor P, calculamos o valor t correspondente a x1 − x2 = 805 :
4
805 − 0
t= = 3,1.
261
Consultando a tabela para a distribuição t de Student para gl = 18, vemos que

todos os valores são menores do que 3,1 (desde a coluna para t.90 até a coluna
para t.995). Portanto, sabemos que a área à esquerda de t = 3,1 é maior que
0,995. Isto implica que a área à direita de t = 3,1 é menor do que 0,005.
Para um teste bilateral, o valor P será então: P < 2x0,005 = 0,001 ⇒ P < α =
0,05. Portanto, deve-se rejeitar a hipótese nula: há evidência suficiente para
rejeitar a afirmação de que o valor médio de vitamina A armazenada em ratos
com dieta deficiente em vitamina E é igual ao valor médio de vitamina A
armazenada em ratos com dieta normal.
Para um teste unilateral, P < 0,005 < α. Logo, também rejeita-se a hipótese
nula.
Dados emparelhados
Nos exemplos anteriores, o pesquisador tratou as duas amostras de 10 ratos

como se elas fossem independentes, ou seja, com se não houvesse qualquer
relação entre a amostra de ratos alimentados com dieta normal e a amostra de
ratos alimentados com a dieta deficiente em vitamina E.
Porém, em muitos casos em que se faz um teste de hipóteses sobre a diferença

entre duas médias costuma-se trabalhar com amostras que possuem algum
grau de relação entre si.
5
Em tais casos, em que as amostras não são independentes, costuma-se chamá-
las de amostras emparelhadas . Um exemplo disso ocorre quando se compara
uma amostra de pesos de pessoas antes de se submeterem a uma dada dieta
com a amostra de pesos das mesmas pessoas após se submeterem à dieta.
Neste caso, o que se faz é comparar a diferença entre os pesos de uma mesma
pessoa antes e depois da dieta.
Um outro exemplo, aproveitando o caso dos 20 ratos apresentado acima, é

dado a seguir. Vamos supor que ao invés de escolher 20 ratos de forma
aleatória e separá-los em duas amostras de 10 ratos cada, uma alimentada com
a dieta normal e a outra alimentada com dieta deficiente em vitamina E, o
pesquisador prefira trabalhar com 10 pares de ratos, sendo que cada par é
composto por ratos retirados da mesma ninhada e com o mesmo peso. Desta
forma, pode-se considerar que os ratos de um dado par possuem as mesmas
condições antes do experimento, ou seja, eles não são independentes.
Desta forma, o pesquisador vai trabalhar com 10 pares de ratos nas mesmas
condições iniciais. A partir daí, as condições passam a ser diferentes. Um rato
de cada par é escolhido para ser alimentado com a dieta normal e o outro rato
é alimentado com a dieta deficiente em vitamina E. Após um certo tempo, o
pesquisador mede as quantidades de vitamina A armazenadas nos fígados dos
10 pares de ratos.
Como os dados estão emparelhados (existem 10 pares de ratos), é conveniente

trabalhar com a variável x definida como sendo a diferença entre as
quantidades de vitamina A armazenadas para cada par de ratos: x = x1 – x2. A
tabela abaixo ilustra isso.
6
Par x1 (ui) x2 (ui) x (ui) x2
(dieta normal) (dieta deficiente) (diferença: x1 – x2 )
1 3950 2650 1300 1690000
2 3800 3350 450 202500
3 3450 2450 1000 1000000
4 3400 2650 750 562500
5 3700 2650 1050 1102500
6 3900 3150 750 562500
7 3800 2900 900 810000
8 3050 1700 1350 1822500
9 2700 1700 1000 1000000
10 2000 2500 − 500 250000
Soma 8050 9002500
Note que a tabela acima diz respeito a 20 ratos, só que eles estão
emparelhados em 10 pares. Um rato de cada par foi alimentado com a dieta
normal e o outro foi alimentado com a dieta deficiente. A variável de interesse
agora não é a diferença entre as médias das amostras de ratos alimentados com
cada tipo de dieta ( x1 − x2 ), como nos casos anteriores. A variável de interesse
para o caso dos dados emparelhados é a diferença entre os valores de vitamina
A armazenados para cada par de ratos (x).
Podemos considerar que a tabela acima nos dá uma amostra de 10 pares de

ratos, com os valores de 10 diferenças de quantidades de vitamina A
armazenadas em ratos alimentados com dietas normais e deficientes em
vitamina E.
7
O valor médio e o desvio padrão dessas 10 diferenças são:
x=
8050
= 805 ui; s 2
=
∑x 2
− x 2 10
= 280250 ⇒ s = 529 ui.
10 9
Podemos considerar que todas as diferenças possíveis x formam uma

população e que as 10 diferenças obtidas constituem uma amostra de tamanho
10 desta população. Vamos assumir que a distribuição da população de x é
normal. Como não se conhece o desvio padrão da população de x, vamos
aproximar o valor de σ por s. Desta forma, o desvio padrão da distribuição
amostral das diferenças é
s 529
σx = = = 167,4 ui.
n 10
A hipótese nula é a de que a média das diferenças x seja igual a zero:

H0: µ x = 0;
H1: µ x ≠ 0.
Se o número de pares de ratos escolhido fosse maior ou igual a 30, faríamos o

cálculo do valor P correspondente usando o valor z da distribuição normal.
Porém, como o número de pares de ratos é menor do que 30, teremos que
fazer o cálculo de P usando a distribuição t de Student.
O valor de t para este caso é:

805 − 0
t= = 4,8.
167,4
8
Para gl = n – 1 = 10 – 1 = 9, todos os valores da tabela para a distribuição t de
Student são menores do que 4,8. Logo:
P < 2x0,005 = 0,001 ⇒ P < α = 0,05.
Portanto, deve-se rejeitar a hipótese nula: as evidências levam o pesquisador a

rejeitar a hipótese de que o valor médio de vitamina A armazenada em ratos
com dieta deficiente em vitamina E é igual ao valor médio de vitamina A
armazenada em ratos com dieta normal.
Exemplos
1. Um epidemiologista quer estudar os efeitos de duas vacinas anti-rábicas

para verificar qual é a mais efetiva. Ele dividiu um grupo de indivíduos que já
foram vacinados anteriormente contra a raiva em duas amostras. Os
indivíduos da amostra 1 receberam uma dose extra da vacina do tipo 1 e os
indivíduos da amostra 2 receberam uma dose extra da vacina do tipo 2. As
respostas dos anti-corpos foram medidas duas semanas depois, resultando nos
seguintes dados (unidades arbitrárias):
Amostra n x s
1 10 4,5 2,5
2 9 2,5 2,0
O epidemiologista pode concluir que a vacina 1 é mais eficaz que a vacina 2?

Considere α = 0,05. Assuma que as variâncias populacionais são iguais.
9
Neste caso, como a pergunta do epidemiologista é se a vacina 1 é mais eficaz
do que a vacina 2 (se a resposta média dos indivíduos vacinados com a vacina
1, µ1, é maior do que a resposta média dos indivíduos vacinados com a vacina
2, µ2), a hipótese nula e a hipótese alternativa devem ser:
H0: µ1 − µ 2 ≤ 0;
H1: µ1 − µ 2 > 0.
Estimando σ2:
σ 2
=
(n1 − 1)s12 + (n2 − 1)s 22
=
9 × 6,25 + 8 × 4
= 5,2 ⇒
n1 + n2 − 2 17
⇒ σ = 5,2 = 2,3.
O valor t para este caso é:
t=
(x1 − x2 ) − (µ1 − µ2 ) = (4,5 − 2,5) − 0 = 2,0
= −1,9.
σ2 σ2 5,2 3,2
+
1,05
+
n1 n2 10 9
Olhando para a tabela da distribuição t de Student para gl = n1 + n2 – 2 = 17,

vemos que 1,9 está entre 1,7396 e 2,1098 (veja abaixo).
10
Logo, 0,025 < P < 0,05. Como P < α, o epidemiologista deve rejeitar a
hipótese nula e concluir que as evidências experimentais favorecem a hipótese
de que a vacina 1 é mais eficaz do que a vacina 2.
2. Um personal trainer garante que uma pessoa que faça ginástica sob a sua
supervisão por um mês perderá peso sem necessitar fazer qualquer tipo de
dieta especial. Para testar a afirmação do personal trainer, seleciona-se uma
amostra de 7 pessoas e toma-se os seus pesos antes do início do programa de
ginásticas. As 7 pessoas são então submetidas ao treinamento oferecido pelo
personal trainer durante 1 mês, com a recomendação de não alterar seus
hábitos alimentares nem seu modo de vida. Após o mês de treinamento, os
pesos das 7 pessoas são novamente medidos, resultando na tabela abaixo.
Indivíduo 1 2 3 4 5 6 7
Peso antes 94 81 65 70 83 72 69
(kg)
Peso depois 93,5 80 65 70 80 74 65
(kg)
Pode-se concluir, baseado nestes dados e com um índice de significância α =

0,05, que a afirmação do personal trainer é correta?
Este é um caso para trabalharmos com dados emparelhados, pois podemos

considerar que temos 7 pares de valores não independentes: eles são as
diferenças x dos pesos das mesmas pessoas, antes e depois do treinamento.
Como a afirmação do personal trainer é a de que os pesos das pessoas

diminuem, as hipóteses nula e alternativa devem ser:
11
H0: µ x ≥ 0;
H1: µ x < 0.
Da tabela, temos: x = 0,9; s = 2,0.
O desvio padrão da distribuição amostral de x é então:

s 2,0
σx = = = 0,75.
n 7
O valor de t é então:
0,9 − 0
t= = 1,2.
0,75
Pela tabela da distribuição t de Student para gl = 7 – 1 = 6, vemos que este

valor de t é menor do que todos os valores listados. Isto implica que
P > 0,10.
Como o valor P para este caso é maior do que α, não se pode rejeitar a
hipótese nula. Ou seja, as evidências não apóiam fortemente a afirmação do
personal trainer de que as pessoas perdem peso após se submeter ao seu
programa de exercícios por um mês.
12

Teste de Hipótese

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Teste de Hipótese

Enviado por

Direitos autorais:

Formatos disponíveis

Testes de Hipóteses para a Diferença Entre Duas Médias Populacionais

Vamos considerar o seguinte problema: Um pesquisador está estudando o

O valor médio de vitamina A armazenada em ratos com dieta deficiente em

Para responder a sua pergunta, o pesquisador toma um grupo de 20 ratos e os

O valor médio de vitamina A no fígado dos ratos alimentados com a dieta

O problema agora é decidir se essa diferença é grande o suficiente para que o

Vamos supor também que o pesquisador conhece as variâncias populacionais

considerá-lo aqui apenas para ilustrar o método. Vamos supor que σ1 = σ2 =

Para este caso, sabemos que a distribuição amostral da diferença entre as

A hipótese nula a ser testada neste caso é:

Portanto, o teste é bilateral.

Para encontrar o valor P, calculamos o valor z correspondente a x1 − x2 = 805 :

Isto implica que o valor P é 0,0026 (veja a figura a seguir).

O exemplo dado foi para um teste bilateral. Entretanto, o pesquisador poderia

Agora a hipótese nula é H0: µ1 ≤ µ 2 e o valor P deve ser calculado apenas

como a probabilidade de que x1 − x2 seja maior que 805 ui se µ1 = µ 2 . Neste

com um nível de significância de 0,05: H1: µ1 > µ 2 .

Vamos agora considerar o caso mais realista em que as variâncias

Vamos supor que no caso do exemplo anterior σ 2

Conhecendo-se s1 e s2 , pode-se estimar o valor desconhecido de σ como:

(n1 − 1)s12 + (n2 − 1)s 22 9(626) 2 + 9(538) 2

Desta forma, o valor estimado para o desvio padrão da distribuição amostral

Como no exemplo anterior, a hipótese nula é:

Agora porém, como as amostras são pequenas e as variâncias populacionais

Consultando a tabela para a distribuição t de Student para gl = 18, vemos que

Nos exemplos anteriores, o pesquisador tratou as duas amostras de 10 ratos

Porém, em muitos casos em que se faz um teste de hipóteses sobre a diferença

Um outro exemplo, aproveitando o caso dos 20 ratos apresentado acima, é

Como os dados estão emparelhados (existem 10 pares de ratos), é conveniente

Podemos considerar que a tabela acima nos dá uma amostra de 10 pares de

Podemos considerar que todas as diferenças possíveis x formam uma

A hipótese nula é a de que a média das diferenças x seja igual a zero:

Se o número de pares de ratos escolhido fosse maior ou igual a 30, faríamos o

O valor de t para este caso é:

P < 2x0,005 = 0,001 ⇒ P < α = 0,05.

Portanto, deve-se rejeitar a hipótese nula: as evidências levam o pesquisador a

1. Um epidemiologista quer estudar os efeitos de duas vacinas anti-rábicas

O epidemiologista pode concluir que a vacina 1 é mais eficaz que a vacina 2?

Olhando para a tabela da distribuição t de Student para gl = n1 + n2 – 2 = 17,

Pode-se concluir, baseado nestes dados e com um índice de significância α =

Este é um caso para trabalharmos com dados emparelhados, pois podemos

Como a afirmação do personal trainer é a de que os pesos das pessoas

Da tabela, temos: x = 0,9; s = 2,0.

O desvio padrão da distribuição amostral de x é então:

Pela tabela da distribuição t de Student para gl = 7 – 1 = 6, vemos que este

Você também pode gostar