Você está na página 1de 12

Testes de Hipóteses para a Diferença Entre Duas Médias Populacionais

Vamos considerar o seguinte problema: Um pesquisador está estudando o


efeito da deficiência de vitamina E sobre o armazenamento de vitamina A em
ratos. Ele quer saber se uma dieta deficiente em vitamina E altera a quantidade
de vitamina A armazenada. A pergunta que ele faz é:

O valor médio de vitamina A armazenada em ratos com dieta deficiente em


vitamina E é igual ao valor médio de vitamina A armazenada em ratos com
dieta normal?

Para responder a sua pergunta, o pesquisador toma um grupo de 20 ratos e os


divide aleatoriamente em dois grupos de 10. Durante um certo tempo, um dos
grupos é alimentado com a dieta normal e o outro grupo é alimentado com
uma dieta deficiente em vitamina E. Depois disso, o pesquisador sacrifica os
ratos dos dois grupos e mede a quantidade de vitamina A no fígado deles.

O valor médio de vitamina A no fígado dos ratos alimentados com a dieta


normal foi de x1 = 3.371 ui (unidades internacionais) e o valor médio de
vitamina A armazenada no fígado dos ratos alimentados com a dieta deficiente
em vitamina E foi de x2 = 2.570 ui, de maneira que a diferença entre as médias
das duas amostras é de: x1 − x 2 = 805 ui.

O problema agora é decidir se essa diferença é grande o suficiente para que o


pesquisador possa concluir que existe realmente uma diferença na quantidade
de vitamina A armazenada entre as duas populações, ou se a diferença obtida é
apenas uma variação amostral.

1
Vamos supor que o pesquisador tem bons motivos para crer que as
distribuições populacionais da vitamina A armazenada no fígado de ratos com
dietas normal e deficiente em vitamina E são normais.

Vamos supor também que o pesquisador conhece as variâncias populacionais


σ 12 e σ 22 . Este é um caso muito difícil de acontecer na prática, mas vamos

considerá-lo aqui apenas para ilustrar o método. Vamos supor que σ1 = σ2 =


600 ui.

Para este caso, sabemos que a distribuição amostral da diferença entre as


médias x1 − x2 tem média igual a µ x − x = µ 1 − µ 2 e desvio padrão igual a
1 2

σ 12 σ 22 σ2 σ2 2 × (600)
2
σ x1 − x2 = + = + = = 268,2 ui.
n1 n2 n1 n2 10

A hipótese nula a ser testada neste caso é:


H0: µ1 = µ 2 ⇒ µ1 − µ 2 = 0;

H1: µ1 ≠ µ 2 ⇒ µ1 − µ 2 ≠ 0.

Portanto, o teste é bilateral.

Para encontrar o valor P, calculamos o valor z correspondente a x1 − x2 = 805 :


805 − 0
z= = 3,0.
268,2

Isto implica que o valor P é 0,0026 (veja a figura a seguir).

2
Para um nível de significância de α = 0,05, temos que P < α e deve-se rejeitar
a hipótese nula. O pesquisador conclui então que, com um nível de
significância de 0,05 existe uma diferença entre as quantidades de vitamina A
armazenadas no fígado de ratos alimentados com dieta normal e deficiente em
vitamina E.

O exemplo dado foi para um teste bilateral. Entretanto, o pesquisador poderia


ter feito um teste unilateral. Suponha que ele tenha certeza que a dieta
deficiente em vitamina E não pode ocasionar um aumento na quantidade de
vitamina A armazenada. Neste caso, a sua pergunta seria: µ1 é maior do que
µ2 ?

Agora a hipótese nula é H0: µ1 ≤ µ 2 e o valor P deve ser calculado apenas

como a probabilidade de que x1 − x2 seja maior que 805 ui se µ1 = µ 2 . Neste


caso, o valor P é 0,0013 e continua menor que 0,05. Novamente a hipótese
nula é rejeitada e a conclusão do experimento favorece a hipótese alternativa

com um nível de significância de 0,05: H1: µ1 > µ 2 .

Vamos agora considerar o caso mais realista em que as variâncias


populacionais σ 12 e σ 22 são desconhecidas.

3
Neste caso, sabemos que há duas possibilidades: σ 12 = σ 22 e σ 12 ≠ σ 22 . Já vimos,
nas aulas sobre distribuições amostrais, como tratar os dois casos. Aqui,
vamos considerar apenas o caso em que σ 12 = σ 22 .

Vamos supor que no caso do exemplo anterior σ 2


é desconhecida, mas o
desvio padrão foi calculado para cada amostra, dando:
s1 = 626 ui e s2 = 538 ui.

Conhecendo-se s1 e s2 , pode-se estimar o valor desconhecido de σ como:

(n1 − 1)s12 + (n2 − 1)s 22 9(626) 2 + 9(538) 2


σ =
2
= = 340958 ⇒
n1 + n 2 − 2 18

⇒ σ = 584 ui .

Desta forma, o valor estimado para o desvio padrão da distribuição amostral


da diferença entre as médias é,

584 2 584 2
σ x1 − x2 = + = 261 ui.
10 10

Como no exemplo anterior, a hipótese nula é:


H0: µ1 = µ 2 ⇒ µ1 − µ 2 = 0;

H1: µ1 ≠ µ 2 ⇒ µ1 − µ 2 ≠ 0.

Agora porém, como as amostras são pequenas e as variâncias populacionais


são desconhecidas, devemos usar a distribuição t de Student. Para encontrar o
valor P, calculamos o valor t correspondente a x1 − x2 = 805 :

4
805 − 0
t= = 3,1.
261

Consultando a tabela para a distribuição t de Student para gl = 18, vemos que


todos os valores são menores do que 3,1 (desde a coluna para t.90 até a coluna
para t.995). Portanto, sabemos que a área à esquerda de t = 3,1 é maior que
0,995. Isto implica que a área à direita de t = 3,1 é menor do que 0,005.

Para um teste bilateral, o valor P será então: P < 2x0,005 = 0,001 ⇒ P < α =
0,05. Portanto, deve-se rejeitar a hipótese nula: há evidência suficiente para
rejeitar a afirmação de que o valor médio de vitamina A armazenada em ratos
com dieta deficiente em vitamina E é igual ao valor médio de vitamina A
armazenada em ratos com dieta normal.

Para um teste unilateral, P < 0,005 < α. Logo, também rejeita-se a hipótese
nula.

Dados emparelhados

Nos exemplos anteriores, o pesquisador tratou as duas amostras de 10 ratos


como se elas fossem independentes, ou seja, com se não houvesse qualquer
relação entre a amostra de ratos alimentados com dieta normal e a amostra de
ratos alimentados com a dieta deficiente em vitamina E.

Porém, em muitos casos em que se faz um teste de hipóteses sobre a diferença


entre duas médias costuma-se trabalhar com amostras que possuem algum
grau de relação entre si.

5
Em tais casos, em que as amostras não são independentes, costuma-se chamá-
las de amostras emparelhadas . Um exemplo disso ocorre quando se compara
uma amostra de pesos de pessoas antes de se submeterem a uma dada dieta
com a amostra de pesos das mesmas pessoas após se submeterem à dieta.
Neste caso, o que se faz é comparar a diferença entre os pesos de uma mesma
pessoa antes e depois da dieta.

Um outro exemplo, aproveitando o caso dos 20 ratos apresentado acima, é


dado a seguir. Vamos supor que ao invés de escolher 20 ratos de forma
aleatória e separá-los em duas amostras de 10 ratos cada, uma alimentada com
a dieta normal e a outra alimentada com dieta deficiente em vitamina E, o
pesquisador prefira trabalhar com 10 pares de ratos, sendo que cada par é
composto por ratos retirados da mesma ninhada e com o mesmo peso. Desta
forma, pode-se considerar que os ratos de um dado par possuem as mesmas
condições antes do experimento, ou seja, eles não são independentes.

Desta forma, o pesquisador vai trabalhar com 10 pares de ratos nas mesmas
condições iniciais. A partir daí, as condições passam a ser diferentes. Um rato
de cada par é escolhido para ser alimentado com a dieta normal e o outro rato
é alimentado com a dieta deficiente em vitamina E. Após um certo tempo, o
pesquisador mede as quantidades de vitamina A armazenadas nos fígados dos
10 pares de ratos.

Como os dados estão emparelhados (existem 10 pares de ratos), é conveniente


trabalhar com a variável x definida como sendo a diferença entre as
quantidades de vitamina A armazenadas para cada par de ratos: x = x1 – x2. A
tabela abaixo ilustra isso.

6
Par x1 (ui) x2 (ui) x (ui) x2
(dieta normal) (dieta deficiente) (diferença: x1 – x2 )
1 3950 2650 1300 1690000
2 3800 3350 450 202500
3 3450 2450 1000 1000000
4 3400 2650 750 562500
5 3700 2650 1050 1102500
6 3900 3150 750 562500
7 3800 2900 900 810000
8 3050 1700 1350 1822500
9 2700 1700 1000 1000000
10 2000 2500 − 500 250000
Soma 8050 9002500

Note que a tabela acima diz respeito a 20 ratos, só que eles estão
emparelhados em 10 pares. Um rato de cada par foi alimentado com a dieta
normal e o outro foi alimentado com a dieta deficiente. A variável de interesse
agora não é a diferença entre as médias das amostras de ratos alimentados com
cada tipo de dieta ( x1 − x2 ), como nos casos anteriores. A variável de interesse
para o caso dos dados emparelhados é a diferença entre os valores de vitamina
A armazenados para cada par de ratos (x).

Podemos considerar que a tabela acima nos dá uma amostra de 10 pares de


ratos, com os valores de 10 diferenças de quantidades de vitamina A
armazenadas em ratos alimentados com dietas normais e deficientes em
vitamina E.

7
O valor médio e o desvio padrão dessas 10 diferenças são:

x=
8050
= 805 ui; s 2
=
∑x 2
− x 2 10
= 280250 ⇒ s = 529 ui.
10 9

Podemos considerar que todas as diferenças possíveis x formam uma


população e que as 10 diferenças obtidas constituem uma amostra de tamanho
10 desta população. Vamos assumir que a distribuição da população de x é
normal. Como não se conhece o desvio padrão da população de x, vamos
aproximar o valor de σ por s. Desta forma, o desvio padrão da distribuição
amostral das diferenças é
s 529
σx = = = 167,4 ui.
n 10

A hipótese nula é a de que a média das diferenças x seja igual a zero:


H0: µ x = 0;

H1: µ x ≠ 0.

Se o número de pares de ratos escolhido fosse maior ou igual a 30, faríamos o


cálculo do valor P correspondente usando o valor z da distribuição normal.
Porém, como o número de pares de ratos é menor do que 30, teremos que
fazer o cálculo de P usando a distribuição t de Student.

O valor de t para este caso é:


805 − 0
t= = 4,8.
167,4

8
Para gl = n – 1 = 10 – 1 = 9, todos os valores da tabela para a distribuição t de
Student são menores do que 4,8. Logo:

P < 2x0,005 = 0,001 ⇒ P < α = 0,05.

Portanto, deve-se rejeitar a hipótese nula: as evidências levam o pesquisador a


rejeitar a hipótese de que o valor médio de vitamina A armazenada em ratos
com dieta deficiente em vitamina E é igual ao valor médio de vitamina A
armazenada em ratos com dieta normal.

Exemplos

1. Um epidemiologista quer estudar os efeitos de duas vacinas anti-rábicas


para verificar qual é a mais efetiva. Ele dividiu um grupo de indivíduos que já
foram vacinados anteriormente contra a raiva em duas amostras. Os
indivíduos da amostra 1 receberam uma dose extra da vacina do tipo 1 e os
indivíduos da amostra 2 receberam uma dose extra da vacina do tipo 2. As
respostas dos anti-corpos foram medidas duas semanas depois, resultando nos
seguintes dados (unidades arbitrárias):

Amostra n x s
1 10 4,5 2,5
2 9 2,5 2,0

O epidemiologista pode concluir que a vacina 1 é mais eficaz que a vacina 2?


Considere α = 0,05. Assuma que as variâncias populacionais são iguais.

9
Neste caso, como a pergunta do epidemiologista é se a vacina 1 é mais eficaz
do que a vacina 2 (se a resposta média dos indivíduos vacinados com a vacina
1, µ1, é maior do que a resposta média dos indivíduos vacinados com a vacina
2, µ2), a hipótese nula e a hipótese alternativa devem ser:
H0: µ1 − µ 2 ≤ 0;

H1: µ1 − µ 2 > 0.

Estimando σ2:

σ 2
=
(n1 − 1)s12 + (n2 − 1)s 22
=
9 × 6,25 + 8 × 4
= 5,2 ⇒
n1 + n2 − 2 17

⇒ σ = 5,2 = 2,3.
O valor t para este caso é:

t=
(x1 − x2 ) − (µ1 − µ2 ) = (4,5 − 2,5) − 0 = 2,0
= −1,9.
σ2 σ2 5,2 3,2
+
1,05
+
n1 n2 10 9

Olhando para a tabela da distribuição t de Student para gl = n1 + n2 – 2 = 17,


vemos que 1,9 está entre 1,7396 e 2,1098 (veja abaixo).

10
Logo, 0,025 < P < 0,05. Como P < α, o epidemiologista deve rejeitar a
hipótese nula e concluir que as evidências experimentais favorecem a hipótese
de que a vacina 1 é mais eficaz do que a vacina 2.

2. Um personal trainer garante que uma pessoa que faça ginástica sob a sua
supervisão por um mês perderá peso sem necessitar fazer qualquer tipo de
dieta especial. Para testar a afirmação do personal trainer, seleciona-se uma
amostra de 7 pessoas e toma-se os seus pesos antes do início do programa de
ginásticas. As 7 pessoas são então submetidas ao treinamento oferecido pelo
personal trainer durante 1 mês, com a recomendação de não alterar seus
hábitos alimentares nem seu modo de vida. Após o mês de treinamento, os
pesos das 7 pessoas são novamente medidos, resultando na tabela abaixo.
Indivíduo 1 2 3 4 5 6 7
Peso antes 94 81 65 70 83 72 69
(kg)
Peso depois 93,5 80 65 70 80 74 65
(kg)

Pode-se concluir, baseado nestes dados e com um índice de significância α =


0,05, que a afirmação do personal trainer é correta?

Este é um caso para trabalharmos com dados emparelhados, pois podemos


considerar que temos 7 pares de valores não independentes: eles são as
diferenças x dos pesos das mesmas pessoas, antes e depois do treinamento.

Como a afirmação do personal trainer é a de que os pesos das pessoas


diminuem, as hipóteses nula e alternativa devem ser:

11
H0: µ x ≥ 0;

H1: µ x < 0.

Da tabela, temos: x = 0,9; s = 2,0.

O desvio padrão da distribuição amostral de x é então:


s 2,0
σx = = = 0,75.
n 7

O valor de t é então:
0,9 − 0
t= = 1,2.
0,75

Pela tabela da distribuição t de Student para gl = 7 – 1 = 6, vemos que este


valor de t é menor do que todos os valores listados. Isto implica que

P > 0,10.

Como o valor P para este caso é maior do que α, não se pode rejeitar a
hipótese nula. Ou seja, as evidências não apóiam fortemente a afirmação do
personal trainer de que as pessoas perdem peso após se submeter ao seu
programa de exercícios por um mês.

12