Você está na página 1de 42

Testes de Hipóteses sobre a média: Várias

Amostras

Na aula de hoje veremos como comparar mais


de duas populações, baseados em dados forneci-
dos por amostras dessas populações.

A Análise de Variância (ANOVA) é uma técnica


usada em Estatı́stica para este fim e requer
que a variável sob análise tenha distribuição
normal.

Uma versão não paramétrica para a compara-


ção de várias populações é o teste de Kruskal-
Wallis que também será apresentado na aula
de hoje.

1
EXEMPLO 1: (ÁLCOOL E HABILIDADE DE
DIRIGIR)

Trinta e seis (36) pessoas participaram de um


experimento para descobrir os efeitos do álcool
na habilidade de dirigir. Elas foram aleato-
riamente associadas a uma de três condições:
placebo, pouco álcool e muito álcool. A bebida
não-alcoólica parecia e tinha o mesmo gosto
das demais. Os participantes foram pesados e
tomaram a quantidade apropriada de bebida.
Observe que temos uma situação de amostras
independentes (interparticipantes), pois os gru-
pos são diferentes. Uma hora após beber, os
participantes dirigiram em um simulador du-
rante 10 minutos e o número de erros que eles
cometeram foi automaticamente registrado por
um computador.

Os dados obtidos estão na tabela a seguir.


2
Placebo Pouco Álcool Muito Álcool
5 5 8
10 7 10
7 9 8
3 8 9
5 2 11
7 5 15
11 6 7
2 6 11
3 4 8
5 4 8
6 8 17
6 10 11
x̄ = 5, 83 x̄ = 6, 17 x̄ = 10, 25
s = 2, 69 s = 2, 33 s = 3, 05

Há diferença significativa entre am médias dos


diferentes grupos (placebo, pouco álcool e mui-
to álcool)?

Em caso afirmativo, a diferença está presente


entre todos os grupos ou em apenas um em
relação aos demais?
3
Análise Exploratória dos dados: a seguir apre-
senta-se um box-plot(gráfico caixa) dos resul-
tados para cada grupo.

4
Na ANOVA a um fator com amostras indepen-
dentes, os dados podem ser representados da
seguinte forma

cond. 1 cond. 2 ... cond. a


y11 y12 ... y1a
y21 y22 ... y2a
... ... ... ...
yn11 yn22 ... ynaa

Como as amostras são independentes, elas po-


dem ter tamanhos diferentes.

a representa o número de condições diferentes.

nj representa o número de observações sob a


j-ésima condição, j = 1, 2, ..., a

yij representa a i-ésima observação sob a j-


ésima condição, i = 1, 2, ..., nj e j = 1, 2, ..., a.

5
O nome em Estatı́stica para um experimento
com essa cofiguração é experimento a um
fator completamente aleatorizado.

No Bioestat a função apropriada para esse caso


está em

Estatı́sticas,

Análise da Variância,

ANOVA:um critério.

6
Um teste de hipóteses apropriado aqui é

H0 : µ1 = µ2 = ... = µa
H1 : pelo menos uma das médias é diferente das demais

µj corresponde à média do j-ésimo grupo. Neste


exemplo temos três grupos tal que j = 1, 2, 3.

A técnica que iremos trabalhar, Análise de Va-


riância (ANOVA) requer que as amostras pro-
venham de populações normais com variâncias
iguais.

O Bioestat tem testes que verificam a norma-


lidade.

A ANOVA busca por diferenças entre as médias


dos grupos. Quando as médias são bem dife-
rentes, dizemos que existe um alto grau de
variação entre condições.

Se não existirem diferenças entre as médias dos


grupos, não existirá variação entre as condições.
7
Variância entre grupos: corresponde à variação
devida às condições que definem os grupos.

Variância intra-grupos: corresponde à variação


dentro de cada grupo.

Na ANOVA a um fator com amostras inde-


pendentes a variação total é decomposta em
duas parcelas correspondentes à variação entre
grupos e à variação intra-grupos.

|SQ
{zT ot} = SQentre
| {z } + SQdentro
| {z }
variação total variação entre grupos variação dentro dos grupos

Se a hipótese nula de que todas as médias são iguais,


isto é, de que não há variação entre grupos, é ver-
dadeira, segue que a variação dentro dos grupos tende
a ser igual à variação total.

8
Notação: SQT ot: variação total, SQentre: va-
riação entre grupos e SQdentro: variação intra
grupos.

SQT ot
QMT ot = : é uma média da variação to-
N −1
tal.

N é o número total de observações no pro-


blema. No exemplo que estamos considerando
N = 3 × 12 = 36.

SQentre
QMentre = : é uma média da variação
a−1
entre grupos, chamada quadrado médio entre
grupos.

a é o número de grupos (condições) no pro-


blema. No exemplo que estamos considerando
a = 3.
SQdentro
QMdentro = : é uma média da variação
N −a
intra grupos, chamada quadrado médio intra
grupos.
9
A estatı́stica do teste realizado pela ANOVA
é dada pela razão dos quadrados médios entre
grupos e intra grupos, a saber,

QMentre
F = .
QMdentro

Se a hipótese nula é verdadeira, é possı́vel mos-


trar que a estatı́stica F tem uma distribuição F
de Snedecor com a − 1 e N − a graus de liber-
dade no numerador e denominador, respecti-
vamente.

Se a hipótese nula é verdadeira, espera-se que


a razão entre os quadrados médios entre e den-
tro dos grupos seja pequena. Em geral, re-
jeitaremos H0 quando os valores amostrais de
F forem grandes.

10
A Distribuição F de Snedecor

A distribuição F está definida para valores po-


sitivos e apresenta assimetria positiva. A seguir
veja um gráfico da densidade F com 4 e 2 graus
de liberdade.

11
Usando um nı́vel de significância α, a Região
Crı́tica do teste da ANOVA será a cauda su-
perior da distribuição Fa−1,N −a de área α.

12
Na ANOVA é comum apresentar os resultados
usando uma tabela chamada tabela ANOVA.
Esta tabela contém as seguintes informações:
fontes de variação, graus de liberdade, quadra-
dos médios e a razão F .
fonte de
variação SQ gl QM F
entre
QMentre
grupos SQentre a−1 QMentre F = QMdentro
dentro dos
grupos (residual) SQdentro N −a QMdentro
total SQT ot N −1

SQentre SQdentro
QMentre = , QMDentro =
a−1 N −a
Se o valor de F for grande, H0 será rejeitada.

13
Uma outra medida que também decorre da
análise de variância é a chamada porcenta-
gem da variação total explicada pelo fator
sob consideração.

Vimos que

|SQ
{zT ot} = SQentre
| {z } + SQdentro
| {z }
variação total variação entre grupos variação dentro dos grupos

Essa equação leva à seguinte definição


SQentre
R2 =
SQT ot

Observe que R2 está entre 0 e 1. Quanto


maior for o valor de R2, mais o fator explica a
variação dos dados no problema.

14
O Bioestat tem a função ANOVA. No caso do
exemplo apresentado devemos escolher:

Estatı́sticas, Análise da Variância, ANOVA: um


critério.

O quadro a seguir mostra a saı́da do Bioestat


para os dados do exemplo sob consideração.

15
Do quadro anterior podemos ver que o p-valor
do teste ANOVA é muito pequeno (menor que
0,001), indicando que esses dados trazem evi-
dência muito forte contra a hipótese nula de
que as médias sob as diferentes condições são
iguais. Observe que o valor da estatı́stica de
teste F também é grande.

Logo, devemos rejeitar H0 em favor da hipótese


alternativa de que pelo menos uma das médias
é diferente das demais.

Se a hipótese nula, médias iguais, for rejeitada,


significa que há evidência de que existem dife-
renças nas médias de tratamento.

Observe que a hipótese alternativa é bastante


vaga: pelo menos uma média é diferente das
demais.

A diferença existente não é especificada por


H1 .
16
Dado que rejeitamos H0, será importante saber,
por exemplo, se as médias são duas a duas
diferentes entre si, ou se uma delas é diferente
das demais, ou outras possibilidades contem-
pladas por H1.

Existem vários testes de comparação das mé-


dias duas a duas, no caso de rejeição de H0
na ANOVA. Vamos apresentar aqui o teste de
Tukey.

17
Comparações de pares de médias de trata-
mento

Vamos ver a seguir o método de Tukey desig-


nado para este tipo de comparação:

(
H0 : µi = µk , ∀i 6= k
.
H1 : pelo menos um par de médias é desigual

Teste de Tukey (1953): Procedimento para


o qual o nı́vel de significância global é exata-
mente α, quando os tamanhos amostrais são
iguais e no máximo α, quando os tamanhos
são desiguais.

Este procedimento também pode ser usado


para construir intervalos de confiança sobre
as diferenças de todos os pares de médias.
Para estes intervalos, o nı́vel de confiança si-
multâneo é 100(1−α)% para amostras de tama-
nhos iguais e pelo menos 100(1 − α)% para
amostras de tamanhos desiguais.
18
O procedimento de Tukey usa a distribuição
da estatı́stica de variação “studentizada”
ȳmax − ȳmin
q=q ,
QMdentro/n

com ȳmax e ȳmin a maior e a menor entre as


médias de tratamento.

Para tamanhos amostrais iguais, o teste de


Tukey declara que duas médias são significa-
tivamente diferentes se o valor absoluto da
diferença amostral excede
s
QMdentro
Tα = qα(a, N − a) .
n

Valores de qα(a, N −a) são tabulados em textos


especializados de Estatı́stica e também estão
disponı́veis em programas computacionais.

19
Atenção: É possı́vel ocorrer a seguinte situação:

(i) rejeita-se H0 via ANOVA.

(ii) não são encontradas diferenças significa-


tivas quando se comparam as médias duas a
duas.

Esta situação tem uma explicação, pois o teste


F é um teste simultâneo de todos as com-
parações possı́veis e não apenas das médias
duas a duas.

Se isso ococrrer significa que o contraste signi-


ficativo não será uma comparação simples de
duas médias.

20
Rodando as comparações, via teste de Tukey,
dos pares de médias dos diferentes grupos para
o problema sob estudo no Bioestat obtemos o
seguinte quadro:

21
Pela saı́da no Bioestat podemos concluir que a
média sob a condição muito álcool é significati-
vamente diferente das outras duas médias, mas
as médias sob as condições placebo e pouco
álcool não são significativamente diferentes.

Na saı́da do programa temos um resumo da


tabela ANOVA, as médias amostrais em cada
grupo e as linhas comparando os pares de mé-
dias duas a duas.

ns representa não significativo.

Assim, as médias sob placebo e pouco álcool


não são significativamente diferentes.

Observe também, pelo quadro anterior, que


145, 167
R2 = ' 0, 375 ou 37,5%.
145, 167 + 241, 583

22
EXEMPLO 2: Um laboratório farmacêutico
deseja investigar a bioatividade de uma nova
droga. Um experimento a um fator comple-
tamente aleatorizado foi conduzido com três
nı́veis de dosagem da droga, e os resultados
obtidos estão na tabela a seguir.

20 g 30 g 40 g
24 37 42
28 44 47
37 31 52
30 35 38

(a) Há evidências para indicar que os nı́veis


de dosagem afetam a bioatividade? Use α =
0, 05.

(b) Se a sua resposta foi afirmativa, faça com-


parações entre os pares de média. Que con-
clusões você pode tirar?

24
Saı́da do Bioestat:

FV gl SQ QM F p-valor
dose 2 450.7 225.33 7.036 0.0145 *
Residuals 9 288.2 32.03

Concluı́mos, ao nı́vel de significância de 5% que há


efeito de dosagem na bioatividade.

A porcentagem da variação total explicada pela dosagem


450,7
é dada por 450,7+288,2 ' 0, 61 ou 61%.

25
(b) Vamos usar o prodedimento de Tukey para
comparar as médias duas a duas.

Saı́da do Bioestat:

diferença p-valor
30-20 7 0.2403
40-20 15 0.0114
40-30 8 0.1680

Observa-se que a diferença existe entre a dosa-


gem menor e a dosagem maior.

Entre dosagens consecutivas, a diferença não


é significativa.
26
Além disso, pelos efeitos estimados, concluı́mos
que maior é a dosagem, maior será a bioativi-
dade.

27
Amostras relacionadas: experimento intrapar-
ticipantes: Como fica?

Em Estatı́stica o nome usado para esse tipo


de situação é Experimento a um fator em
Blocos Completos Aleatorizados.

No Bioestat usa-se a seguinte função para esse


caso: Estatisticas, Análise da Variância, ANO-
VA:dois critérios.

Suponha agora que no experimento do exem-


plo anterior participam apenas 12 pessoas e
que em intervalos de tempo espaçados elas se-
jam submetidas, em ordem aleatória, a cada
uma das condições: placebo, pouco álcool e
muito álcool. Ou seja, agora são as mesmas
pessoas que são observadas sob cada condição.

28
Nesse caso as amostras não são independentes
e além da variação entre grupos e dentro do
grupos, passamos a poder medir uma variação
inerente a cada participante (variação de linha,
também chamada variação devido aos blocos).
Observe que agora as amostras sob cada con-
dição terão tamanhos iguais.

Na ANOVA a um fator com amostras rela-


cionadas(medidas repetidas), os dados podem
ser representados da seguinte forma

cond. 1 cond. 2 ... cond. a


y11 y12 ... y1a
y21 y22 ... y2a
... ... ... ...
yn1 yn2 ... yna

Como as amostras são as mesmas, elas têm


tamanhos iguais.

29
cond. 1 cond. 2 ... cond. a
y11 y12 ... y1a
y21 y22 ... y2a
... ... ... ...
yn1 yn2 ... yna

a representa o número de condições diferentes.

n representa o número de observações sob cada


condição.

N = an é o número total de observações.

yij representa a i-ésima observação sob a j-


ésima condição, i = 1, 2, ..., n e j = 1, 2, ..., a.

30
Na ANOVA a um fator com amostras rela-
cionadas a variação total é decomposta em
três parcelas correspondentes à variação entre
grupos, a variação inerente a cada participante
(variação dos blocos) e a variação residual.

|SQ
{zT ot} = SQentre
| {z } + SQBl
|{z} + SQres
| {z }
variação total variação entre grupos variação do indivı́duo variação residual

Notação: SQT ot : variação total, SQentre : variação entre grupos,


SQBl - variação nos blocos (individual) e SQdentro : variação residual
(dentro de cada grupo).
SQT ot
QMT ot = : é uma média da variação total.
N −1
N é o número total de observações no problema.
SQentre
QMentre = : é uma média da variação entre grupos, chamada
a−1
quadrado médio entre grupos.

a é o número de grupos (condições) no problema.


SQBl
QMBl = : é uma média da variação dos blocos, chamada
n−1
quadrado médio dos blocos.

n é o número de observações (igual) sob cada condição.


SQdentro
QMdentro = : é uma média da variação residual, chamada
(a − 1)(n − 1)
quadrado médio residual ou intra grupos.
31
A estatı́stica do teste realizado pela ANOVA
nesse caso é dada pela razão dos quadrados
médios entre grupos e residual, a saber,

QMentre
F = .
QMdentro

Se a hipótese nula é verdadeira, é possı́vel mos-


trar que a estatı́stica F tem uma distribuição
F de Snedecor com a − 1 e (a − 1)(n − 1) graus
de liberdade no numerador e denominador, re-
spectivamente.

Se a hipótese nula é verdadeira, espera-se que


a razão entre os quadrados médios entre e den-
tro dos grupos seja pequena. Em geral, re-
jeitaremos H0 quando os valores amostrais de
F forem grandes.

32
A tabvela ANOVA correspondente a esse caso
é dada por
fonte de
variação SQ gl QM F
entre
QMentre
grupos SQentre a−1 QMentre F = QMdentro
blocos
(individual) SQBl n−1 QMBl
dentro dos
grupos
(residual) SQdentro (a − 1)(n − 1) QMdentro
total SQT ot N −1

SQentre SQdentro
QMentre = , QMDentro =
a−1 (a − 1)(n − 1)
Se o valor de F for grande, H0 será rejeitada.

O Bioestat tem essa função.

Estatı́sticas, Análise da Variância, ANOVA: dois critérios.

33
O quadro a seguir mostra a saı́da do Bioestat
para os dados do exemplo sob consideração.

Podemos perceber que o teste ANOVA rejeita


H0, pois o p-valor é muito pequeno. Logo,
faz sentido realizar as comparações de médias
duas a duas.

34
O quadro a seguir mostra a saı́da do Bioestat
usando o procedimento de Tukey.

35
Cuidado: toda vez que as medidas forem repeti-
das para as mesmas unidades amostrais é fun-
damental rodar a ANOVA a dois critérios, pois
caso contrário a variação dentro dos grupos
poderá ficar inflacionada acarretando na não
rejeição de H0 um maior número de vezes por
conta da variação residual inflacionada, ou seja,
aumentando a chance de cometer o erro tipo
II.

Se as amostras forem relacionadas, ou seja, se


for um experimento intra-participantes, rode o
a ANOVA a dois critérios.

36
Vamos agora apresentar um método não-para-
métrico para a análise de variância (ANOVA):
O teste de Kruskal-Wallis

Em situações nas quais a suposição de nor-


malidade não é justificada, existe um procedi-
mento alternativo ao teste F da ANOVA que
não depende desta suposição. Um procedi-
mento desse tipo foi desenvolvido por Kruskal
e Wallis em 1952.

Neste teste, H0 corresponde à hipótese de que


os a tratamentos (grupos ou condições) são
idênticos versus a alternativa de que algum
tratamento (grupo ou condição) gera observa-
ções que são maiores que as outras geradas pe-
los outros tratamentos (grupos ou condições).

37
Como este procedimento é designado para ser
sensı́vel para testar diferenças em médias, al-
gumas vezes é conveniente pensar no teste de
Kruskal-Wallis como um teste para a igualdade
de médias de tratamento (grupo ou condição).

Este teste é uma alternativa não-paramétrica


à ANOVA usual.

Passos no teste Kruskal-Wallis

P1) Designe postos rij às observações yij em


ordem crescente das observações. Em caso
de empate, designe às observações empatadas
a média dos postos correspondentes caso não
houvesse empate.

yij representa a i-ésima observação do j-ésimo


grupo.

38
P2) Calcule a soma dos postos para cada trata-
mento (grupo ou condição), a saber, ri. =
ni
X
rij , i = 1, 2, ..., a.
j=1

P3) Calcule a estatı́stica de teste H dada por


( a
) " a
#
X X R2 N (N + 1)2
H= 1
S2
N (R̄i. − R̄.. )2 = 1
S2
i.

i=1 i=1
ni 4

com ni o número de observações no i-ésimo


tratamento (grupo), N o número total de replicações,
e
 
a X n a X ni
2 1
X
2 1 X
2 N (N + 1)2 
S = N −1 (Rij −R̄.. ) =  Rij − .
i=1 j=1
N − 1 i=1 j=1
4

Observe que S 2 é a variância amostral dos pos-


tos. Se não existem empates,

S 2 = N (N + 1)/12 e a estatı́stica de teste sim-


plifica para
a R2
12 X
i. − 3(N + 1).
H=
N (N + 1) i=1 ni
39
Quando o número de empates é moderado,
haverá pouca diferença entre as duas expres-
sões para H e a forma mais simples pode ser
usada. Se os ni’s são razoavelmente grandes,
digamos ni ≥ 5, ∀ i, a distribuição de H é
aproximadamente uma Qui-quadrado com a−1
graus de liberdade sob H0.

Portanto, a região crı́tica do teste a um nı́vel


α de significância, será dada por

H ≥ χ2
(1−α),a−1 .

O p-valor também pode ser usado.

:) Calma: o Bioestat contém esse teste e


você não precisará se preocupar em designar
postos e calcular a estatı́stica H.

40
Vamos rodar o teste proposto por Kruskal-
Wallis no Bioestat.

Estatı́sticas seguido de Análise da Variância


seguido de Kruskal-Wallis.

Indique as colunas contendo os dados e exe-


cute para obter

Como podemos ver o p-valor é pequeno, in-


dicando que os dados trazem evidência muito
forte contra H0.
41
Novamente, como H0 é rejeitada, faz sentido
em comparar os pares de médias duas a duas.
No Bioestat há dois testes disponı́veis: Dunn
e Student-Newman-Keuls.

Rodando o procedimento porposto por Dunn


obtém-se

42
Referências bibliográficas:

(1) Busssab e Morettin - Estatı́stica Básica.


Editora Saraiva

(2) Triola. Introdução à Estatı́stica. LTC.

(3) Dancey e Reidy - Estatı́stica sem Matemática


para Psicologia - Penso

43

Você também pode gostar