Você está na página 1de 10

Após o teste ANOVA (2 fatores) com Efeito Interação Significante: - O que fazer?

Referências.

1) Huck, Schuyler W; Reading statistics and research. 5th ed Schuyler W. Huck; Boston
Pearson/Allyn & Bacon c2008;
2) http://www2.gsu.edu/~epstco/aeraMain.pdf: T. Cris Oshima and Frances McCarty. How
Should We teach Follow-Up Tests After Significant Interaction in Factorial Analysis of
Variance. American Educational Research Association, New Orleans, April 2000;
3) http://www2.gsu.edu/~epstco/aeraStudent.pdf: Factorial Analysis of Variance. Statistically
Significant Interactions: What’s the next step? T.C. Oshima and F. McCarty. Georgia State
University.

Nos livros de estatística, nível introdutório, básico ou intermediário, não se encontra uma
explicação clara, convincente, completa, do que fazer, como proceder, após o teste ANOVA
fatorial, indicar efeito interação estatisticamente significante. Embora a maioria dos livros textos
inclua esse tópico de análise fatorial da análise de variância, o procedimento de, como
prosseguir após o efeito interação significante, de como efetuar um teste “follow-up tests” é
rápido, superficial.

Segundo Huck, há três estratégias, para ganharmos compreensão do efeito interação


significante, após o teste ANOVA (2 fatores):

Estratégia 1 (Graph): Investigar o gráfico de médias (graph of cell means).


Estratégia 2 (APC): Efetuar uma comparação estatística das médias (all comparison of cell
means).
Estratégia 3 (SME): Conduzir testes “simple main effects”.

Exemplo

Suponha um delineamento tipo CRD: (completely randomized design) com dois fatores:
Medicamento (3 níveis) e Gênero (masculino e feminino).

Primeira estratégia (Graph). Vamos observar o gráfico de médias e avaliar as linhas não
paralelas. A estatística F na interação significante sugere que essas linhas, provavelmente, não
vêem de linhas que são paralelas na população. Essa estratégia é útil e podemos até considerá-la
etapa necessária para investigar a natureza da interação, porém, não é uma estratégia completa.
Enfim, as médias das linhas, se visualmente diferem, pertencem a uma abordagem descritiva.

Segunda estratégia (APC). As médias são comparadas simultaneamente mediante um teste


post-hoc, o teste de comparação múltipla de Tukey, por exemplo. Essa estratégia é direta e de
fácil entendimento. Porém, essa estratégia é muito conservadora e apresenta muitas
comparações que não são de interesse para o pesquisador. Voltando ao exemplo do CRD, com

Huck, Schuyler W; Reading statistics and research ( 3ª ed.), New York: Harper Collins.
2

Medicamentos e Gênero, seria útil uma comparação do medicamento tipo 1 em relação ao


medicamento tipo 2 para os pacientes do sexo masculino; mas, não seria interessante uma
comparação entre o medicamento tipo 1 para homens em relação ao medicamento 2 para
mulheres. Porque o pesquisador não quer saber qual medicamento administrar uma vez
estabelecido o sexo do paciente.

Terceira estratégia (SME). Conhecida como “simple-main effects”, é a estratégia mais


difícil de ser ensinada aos estudantes. Nesta estratégia, após a interação se apresentar como
significante, os dados são separadas para cada nível de um fator e, a seguir, é efetuada o teste
ANOVA 1 fator. Voltando ao exemplo do CRD, com Medicamentos e Gênero, uma ANOVA (1
fator) é conduzida para homens para descobrir qual o melhor medicamento e, um outro teste
ANOVA (1 fator) é efetuado para as mulheres a fim de descobrir qual o melhor medicamento.
Assim, como em qualquer outra aplicação do teste ANOVA (1 fator), após o efeito apresentar-se
como significante, qualquer teste post-hoc, o teste de comparação múltipla de Tukey, por
exemplo, pode ser aplicado. Porém, para a aplicação do teste post-hoc, é aconselhável
considerar a variância residual (MSE: mean square error, do CRD fatorial, ou seja, da tabela
ANOVA (2 fatores).

Após conhecermos essas três estratégias, vamos a um exemplo prático. Mas, antes de
apresentá-lo, convém considerar o significado do efeito interação na estatística, que nada tem a
ver com o efeito interação da farmacologia. Nessa ciência biológica, o efeito combinado de dois
medicamentos pode ou não conduzir a efeitos sinérgicos; enquanto, na estatística, o efeito
interação do modelo ANOVA pode ser entendido como “diferença das diferenças”.

Interpretação do Efeito Interação (diferença das diferenças).

Quando existe uma interação significante, o efeito de uma variável independente (VI)
sobre a variável resposta ou dependente (VD) depende do valor (nível) de alguma outra VI
incluída no delineamento experimental. Em outras palavras, o teste de interação dá ênfase
(focus) na questão de se o efeito de um fator é o mesmo para cada nível do outro fator, ou se o
efeito de um fator não é o mesmo para cada nível do outro fator. Em qualquer um desses dois
casos, o nosso interesse vai para as médias das condições experimentais estabelecidas palas
variáveis em estudo (VIs). Então, estamos, agora, considerando essas médias das células (cell
means) e não as médias marginais (das linhas e das colunas). Para recordar, os testes de efeitos
principais, consideram (focus) nas médias marginais.

Quando existe uma interação significante, evitamos interpretar os efeitos principais e


interpretamos, apenas, o efeito interação. Porque interpretar os efeitos principais na presença de
uma interação significante pode conduzir-nos a conclusões errôneas.

Ainda, antes de apresentarmos um exemplo prático, vamos apresentar dois termos


propostos por JACCARD em 1998, que facilita o entendimento, quando se opta pela estratégia
3, referente simple-effects means. Esse autor propõe uma distinção entre variável independente
focal e variável independente moderadora. Assim, a VI focal é a variável que o pesquisador está
mais interessado em comparar e é comumente manipulada (tal como tratamento A versus

JACCARD, J. Interactions effects in factorial analysis of variance, SAGE University Papers Series on
Quantitative Applications in Social Sciences, 07-118. Thousand Oaks, CA: SAGE.
3

tratamento B). Uma VI moderadora é a variável na qual o pesquisador acredita que o efeito da
variável focal na variável dependente é “moderada” (tal como o gênero). Então, a VI
moderadora pode ser julgada como a variável que interessa devido ao seu efeito potencial na VI
focal, que é a de interesse principal. De outra forma, pode-se considerar como variável
moderadora aquela referente às características intrínsecas do sujeito; enquanto a VI focal é
aquela determinada de forma ativa pelo pesquisador, ou seja, características extrínsecas que
foram determinadas pelo pesquisador.

Exemplo 1. (SME). Simple Main effects.

Um pesquisador está interessado em avaliar o efeito de três métodos de redução de


esgotamento físico e mental, stress (yoga, meditação, e exercício). Com fundamento em
pesquisas anteriores, o pesquisador sente que o gênero pode ter algum impacto nos efeitos de
redução de tensão. Com isso em mente, o pesquisador delineia um estudo onde noventa
participantes (45 homens e 45 mulheres) são designados, aleatoriamente, a um dos três métodos
de redução de stress. No final do estudo, cada participante preencheu um questionário (menor
escore indica menor stress). Os dados foram analisados via ANOVA fatorial.
A variável dependente (resposta) foi a quantidade de stress medida pelo questionário.
As variáveis independentes foram duas. A saber, o método de redução de stress, com três
níveis (yoga, meditação, e exercício), e o gênero, com dois níveis (masculino e feminino).

A tabela ANOVA (2 fatores) aplicada aos dados de redução de stress, é apresentada:


Efeito gl SQ QM F p-valor
Método 2 1361,22 680,61 28,30 0,0001
Gênero 1 220,00 220,00 9,15 0,003
Interação 2 1120,23 560,11 23,29 0,0001*
Resíduo 84 2020,05 24,05
Total 89 4721,50
*p<0,05

Pode-se verificar, tabela acima, que o efeito interação foi significante e a nossa atenção
está sobre esse efeito.

Estratégia 1 (Graph): Investigar o gráfico de médias (graph of cell means).


4

Redução de Stress
50 Gênero
feminino
45 masculino

40
35
escore médio

30

20

10

0
1: Yoga 2: Meditaçao 3: Exercício
Método

Quanto menor o valor de escore menor é o nível de stress.


Figura 1. Gráfico de médias referente às seis condições experimentais.

As médias obtidas são apresentadas na Tabela 1, mostrada a seguir.


Tabela 1. Médias dos escores de redução de stress, das seis condições experimentais
estabelecidas pelas variáveis: Método e Gênero.
Método
Gênero
1: yoga 2: meditação 3: exercício
masculino 44,66* 40,95 38,11
feminino 35,22 47,67 31,47
*n = 15 pacientes
A variável focal é o método de redução de stress: característica extrínseca, criada pelo
pesquisador.
A variável moderadora é o gênero: característica intrínseca, não criada pelo pesquisador.
Essa distinção nos ajudará a estabelecer os nossos testes de simple effects.

Terceira estratégia (SME).


ANOVA (1 fator) para os dados de escore obtidos para o sexo masculino.
5

ANOVA (1 fator) para os dados de escore obtidos para o sexo feminino.


Sexo masculino
Efeito gl SQ QM F p-valor
Entre Métodos 2 325,019 162,510 7,222 0,002*
Resíduo 42 945,135 22,503
Total 44 1270,154

F recalculado para masculino: 162,510 /24,05 = 6,757


Sexo feminino
Efeito gl SQ QM F p-valor
Entre Métodos 2 2156,429 1078,214 42,129 0,0001*
Resíduo 42 1074,916 25,593
Total 44 3231,345
F recalculado para feminino: 1078,214 /24,05 = 44,832
A tabela ANOVA (2 fatores) aplicada aos dados de redução de stress, é apresentada:
Efeito gl SQ QM F p-valor
Método 2 1361,22 680,61 28,30 0,0001
Gênero 1 220,00 220,00 9,15 0,003
Interação 2 1120,23 560,11 23,29 0,0001*
Resíduo 84 2020,05 24,05
Total 89 4721,50
*p<0,05

F recalculado para masculino: 162,510 /24,05 = 6,757 > Fgl(2; 84) 5% = 3,15
F recalculado para feminino: 1078,214 /24,05 = 44,832 > Fgl(2; 84) 5%= 3,15

IC (95%) do teste de Tukey (5%): ( x i- x j) = q,gl(k grupos; resíduo)(QMresíduo/n)

n = 15 ... tamanho comum do grupo


q .... valor tabelado (estatística faixa de Student) = 3,399
( x i- x j) .... médias dos métodos em comparação
gl resíduo = 84
gl k = 3 ... três métodos em comparação
QMErro (ou resíduo) = 23,29 associado com gl resíduo = 84

( x i- x j) = q,gl(k grupos; resíduo)(QMresíduo/n) = dms = 3,399)(23,29/15) = 4,304

dms = 3,399)(23,29/15) = 4,304 para masculino


dms = 3,399)(23,29/15) = 4,304 para feminino

MASCULINO
dms = 3,399(23,29/15) = 4,304 para masculino

Comparação diferença IC (95%) do teste de Tukey


Yoga – Meditação 44,68-40,95 = 3,73 <dms -0,574 a 8,034
6

Yoga – Exercício 44,68-38,11 = 6,57* >dms 2,266 a 10,874


Meditação – Exercício 40,95-38,11 = 2,84 <dms -1,464 a 7,144

Yoga – Meditação  µdifª = 3,734,304 = -0,574 a 8,034


etc...
FEMININO
dms = 3,399)(23,29/15) = 4,304 para feminino

Comparação diferença calculada vs dms IC (95%) do teste de Tukey


Yoga – Meditação 35,22-47,67 = 12,45* >dms 8,146 a 16,754
Yoga – Exercício 35,22-31,47 = 3,75 <dms -0,554 a 8,054
Meditação – Exercício 47,67-31,47 = 16,2* >dms 11,896 a 20,504

Yoga – Meditação  µdifª = 12,454,304 = 8,146 a 16,754


etc...

Conclusão:

Por meio da tabela ANOVA(2 fatores) verificamos que o Método depende do Gênero.
Uma análise de simple effects indica que as médias foram diferentes para os homens (F gl(2;84) =
6,757; p<0,05) e para as mulheres (F gl(2;84) = 44,832; p<0,05). Para os homens, o teste de Tukey
(5%) indica que o método Yoga difere apenas do Exercício. Para as mulheres, o teste de Tukey
(5%) indica que o método difere do Exercício e da Meditação.

O método de Exercícios para os homens pode trazer um maior alívio, quando comparado
com Yoga.

Os métodos de Exercícios e de Yoga para as mulheres podem trazer um maior alívio,


quando comparado com a Meditação.

Exemplo 2. Segunda estratégia (APC).


introdução
Essa abordagem pode ser útil quando o pesquisador está interessado em descobrir qual
combinação de fatores produzirá resultados mais desejáveis; neste contexto, uma consideração
7

importante é saber se (ou não), os grupos criados pelas variáveis independentes proporcionam
comparações de interesse, do ponto de vista de significado clínico.
Essa abordagem é comumente empregada quando ambas as VIs são ativas, isto é,
pesquisador tem controle sobre elas (foram manipuladas, criadas por ele).
Essa abordagem é mais direta do que a SME (simple effects). Compara todas as possíveis
médias das condições experimentais. Por exemplo, num delineamento tipo 2 x 2 teremos 4
médias a serem comparadas entre si (C4,2 = total de 6 comparações).
Enunciado da Pesquisa
Um pesquisador está interessado em avaliar o efeito de Exercícios para casa (EPC) e da
Duração do curso (DC) sobre o aprendizado. Assim, ele delineou um estudo onde 28 estudantes
foram distribuídos, ao acaso, às condições de: (i) alunos que receberam EPC num curso com
duração de 8 semanas; (ii) alunos que receberam EPC num curso com duração de 16 semanas;
(iii) alunos que não receberam o EPC num curso com duração de 8 semanas; (iv) alunos que não
receberam o EPC num curso com duração de 16 semanas. Nesse experimento 7 alunos
participaram em cada uma das quatro condições experimentais. No final de cada curso, foram
submetidos a uma avaliação (exame). As notas foram analisadas por meio do teste ANOVA
fatorial (2 fatores).
A variável dependente (resposta) foram as notas obtidas pelos alunos no exame.
As variáveis independentes foram duas. A saber, a tarefa de exercícios para casa, com dois
níveis (alunos que receberam e alunos que não receberam), e o tempo de duração do curso, com
dois níveis (8 semanas e 16 semanas).

A tabela ANOVA (2 fatores) aplicada às notas obtidas


Efeito gl SQ QM F p-valor
Exercício em casa 1 276,901 276,901 13,973 0,0001
Tempo 1 173,507 173,507 8,756 0,007
Interação 1 555,111 555,111 28,013 0,0001*
Resíduo 24 475,591 19,816
Total 27
*p<0,05

Pode-se verificar, tabela acima, que o efeito interação foi significante e a nossa atenção
está sobre esse efeito.
8

Notas
Exercício
100
não
95
sim
90
85
80
75
70

60
média

50

40

30

20

10

0
8 16
Tempo(s)

As médias obtidas são apresentadas na Tabela 1, mostrada a seguir.


Tabela 1. Médias (dp) obtidas pelos alunos, nas quatro condições experimentais
estabelecidas pelas variáveis: tempo de duração do curso e Exercícios para casa
Exercício para casa
Tempo
1: não receberam 2: receberam linha
8 semanas 76,864(4,69)* 92,058(2,76) 84,461
16 semanas 90,747(4,50) 88,132(5,42) 89,439
coluna 83,805 90,095
*n = 7 pacientes

A tabela ANOVA (2 fatores) aplicada às notas obtidas


Efeito gl SQ QM F p-valor
Exercício em casa 1 276,901 276,901 13,973 0,0001
Tempo 1 173,507 173,507 8,756 0,007
Interação 1 555,111 555,111 28,013 0,0001*
Resíduo 24 475,591 19,816
Total 27
*p<0,05

Para aplicar o teste de Tukey (5%):


q ... valor tabelado para k = 4 médias e gl = 24 é igual a 3,90
( x i- x j) = q,gl(k grupos; resíduo)(QMresíduo/n) = dms = 3,90(19,816/7) =
dms = 3,90(19,816/7) = 3,90 (1,683) = 6,562

Exercício para casa


Tempo
1: não receberam 2: receberam linha
8 semanas 76,864(4,69)* 92,058(2,76) 84,461
9

16 semanas 90,747(4,50) 88,132(5,42) 89,439


coluna 83,805 90,095

Teste de Tukey (5%) aplicado aos quatro grupos


Comparações diferença média dms* Interpretação
8s / EPC (92,06) 15,19* difere
16s / sem 13,88* difere
8s / sem EPC
EPC(90,75)
(76,86)
16s / EPC(88,13) 11,27* 6,562 difere
8s / EPC 16s / sem 1,31 não difere
(92,06)
EPC(90,75)
16s / EPC (88,13) 3,93 não difere
16s / sem EPC 16s / EPC(88,13) 1,32 não difere
(90,75)
*dms = 3,90(19,816/7) = 3,90 (1,683) = 6,562

Notas
Exercício
100
não
95
90 sim
85
80
75
70

60
média

50

40

30

20

10

0
8 16
Tempo(s)

Conclusão:
A condição: 8 semanas/ Sem Exercício para casa (EPC) difere das outras três condições
experimentais. Essa condição apresentou o pior desempenho (média igual a 76,86). A
recomendação é, portanto, impedir a existência de cursos de pequena duração e que não passam
exercícios para casa aos alunos.

Considerações adicionais: Efeito Interação Tripla estatisticamente significante.


No caso de ANOVA fatorial com três fatores, tipo 2 x 2 x 2, por exemplo, o raciocínio é
análogo ao que já vimos. Se encontrarmos um efeito interação tripla estatisticamente
significante, então, uma abordagem seria efetuar duas ANOVA (2 fatores), separadamente, uma
para cada nível do terceiro fator e usar o termo erro (resíduo) da original ANOVA três fatores. E,
10

caso uma interação dupla seja significante, então, podemos seguir as estratégias (gráfica e
simple effects ou gráfica e todas as comparações possíveis, APC) aqui apresentadas.

Você também pode gostar