Você está na página 1de 14

Capítulo 6: Análise de variância - ANOVA

Conteúdo do Capítulo 6:

1. ANOVA com um só fator

2. ANOVA com dois fatores/dois níveis, sem repetição

3. ANOVA com dois fatores/dois níveis, com repetição

4. ANOVA com dois fatores/vários níveis, com repetição

5. ANOVA com dois fatores/dois níveis, com repetição e presença de interação.

Estatística - Francisco Boratto Capítulo 6, p. 1


Capítulo 6: Análise de variância - ANOVA
6.1 ANOVA com um só fator
No capítulo anterior foi visto como comparar duas amostragens diretamente, ou , na
linguagem estatística, influência de dois tratamentos. Neste capítulo será mostrado
como é que se faz para comparar vários tratamentos (vários níveis de um dado fator)
ao mesmo tempo. Este tipo de comparação é muito comum, como por exemplo a
comparação entre quatro turmas de trabalho. O Excel chama cada tratamento de grupo,
o que é bem próprio para o caso das turmas.
A Análise de Variância (ANOVA) é a maneira de se estudar o efeito de vários
tratamentos sobre um dado fator.
Níveis (tratamentos)

Medida A B C D
1 240 255 245 234
2 250 235 235 244
3 234 245 244 255 Réplicas
. . . . . (repetições nas medidas)
. . . . .
. . . . .
5 234 245 266 237

Estatística - Francisco Boratto Capítulo 6, p. 2


Análise de variância - ANOVA

Apesar do nome, ANOVA é na realidade um teste de médias e as hipóteses a serem


testadas são:

Ho: m1 = m2= m3 =...= mp

H1: Pelo menos uma das médias é diferente

Considera-se verdade que:


• Os erros são distribuídos normalmente
• Os erros são independentes
• Os erros têm variância constante

Estatística - Francisco Boratto Capítulo 6, p. 3


Análise de variância - ANOVA

Considere os resultados de produção de


quatro turmas de trabalho em um dado mês
(junho), conforme mostrado na Tabela 6.1. Nos
dias em que a turma está de folga sua
produção é nula (e não zero), e neste dia os
valores são deixados em branco.

Estatística - Francisco Boratto Capítulo 6, p. 4


Análise de variância - ANOVA

Nota-se que existe uma variação dos resultados dentro das turmas e também uma
variação entre as turmas. O que se deseja saber aqui é se a variação entre as turmas
é real ou se é apenas um reflexo da variação aleatória que está presente dentro das
turmas, devido a fatores externos, fora de controle tais como programação da
produção, paradas para manutenção, etc.

Fig. 6.1: Valores médios das 4 turmas. Fig. 6.2: Dispersão de resultados entre as turmas.

Estatística - Francisco Boratto Capítulo 6, p. 5


Análise de variância - ANOVA
Para realizar um teste ANOVA a variação total nas medidas é subdividida em duas
partes: aquela devido à diferenças entre os grupos e aquela devido à diferenças dentro
dos grupos.
A variação total é chamada de soma total dos quadrados (STQ). O valor de STQ pode
ser obtido pela somatória das diferenças quadráticas entre as medições e a média
geral.
Assim
MQE = SQE/(c-1) é a média dos quadrados entre os C grupos e
MQD = SQD/(n-c) é a média dos quadrados dos n pontos dentro dos grupos
A relação MQE/MQD segue a distribuição F, servindo de parâmetro de teste.

Estatística - Francisco Boratto Capítulo 6, p. 6


Análise de variância - ANOVA
Utilizando o ANOVA- Fator único, do Excel, para os dados da Tabela 6.1, obtém-se:
Anova: fator único

RESUMO
Grupo Contagem Soma Média Variância
A 22 10530 479 22001
B 22 10841 493 15861
C 24 12218 509 27994
D 22 10204 464 38160

ANOVA
Fonte da variação SQ gl MQ F valor-P F crítico
Entre grupos 25775 3 8592 0,33 0,80 2,71
Dentro dos grupos 2240316 86 26050

Total 2266091 89

A tabela ANOVA resultante mostra não só o valor F da razão entre as somas dos
quadrados, mas também o valor de F crítico para rejeição da hipótese nula. No caso
presente F < F crítico e aceita-se a hipótese nula, ou seja, não existe nenhuma turma
destacadamente melhor, ou pior, do que a média geral.

Nota-se que a força da evidência a favor de H o (igualdade de médias) é muito alta


(valor-P grande, próximo de 1).
Estatística - Francisco Boratto Capítulo 6, p. 7
Análise de variância - ANOVA
6.2 ANOVA com dois fatores/dois níveis, sem repetição

É possível a utilização de ANOVA também no caso em que duas variáveis (dois fatores)
de controle estão presentes. A maneira de raciocínio é similar ao caso anterior. Veja o
exemplo abaixo:
Tabela 6.3: Anova: fator duplo sem repetição
Experiencia de dois fatores/ dois níveis
(sem repetição) RESUMO Contagem Soma Média Variância
F1 2 57,2 28,6 52,0
Fator Nível F2 2 58,7 29,4 49,0
N1 N2
F1 23,5 33,7 N1 2 47,9 24,0 0,4
F2 24,4 34,3 N2 2 68,0 34,0 0,2

ANOVA
Fonte da variação SQ gl MQ F valor-P F crítico
Fator Linhas 0,56 1 0,56 25 0,13 161
Colunas 101,0 1 101,0 4489 0,01 161
Nível Erro 0,02 1 0,02

Total 101,59 3
Nota-se que:
Entre linhas F<F crítico, (não há diferença) – Fator não faz diferença
Entre colunas F>F crítico (existe diferença) – Nível é importante

Estatística - Francisco Boratto Capítulo 6, p. 8


Análise de variância - ANOVA
6.3 ANOVA com dois fatores/dois níveis, com repetição
Se existirem réplicas a análise é mais sofisticada, pois interação entre os fatores pode
ser avaliada:
Anova: fator duplo com repetição

Tabela 6.4: RESUMO N1 N2 Total


Experiencia de dois fatores/ dois níveis F1
(com repetição) Contagem 3 3 6
Soma 71,9 102,6 174,5
Fator Nível Média 24,0 34,2 29,1
N1 N2 Variância 0,2 0,7 31,8
F1 23,5 33,3
F2
24,1 34,4
Contagem 3 3 6
24,3 34,9
Soma 73,0 106,4 179,4
F2 23,1 34,1 Média 24,3 35,5 29,9
25,3 36,3 Variância 1,3 1,4 38,3
24,6 36
Total
Contagem 6 6
Soma 144,9 209,0
Média 24,2 34,8
Variância 0,6 1,3

ANOVA
Fator Fonte da variação SQ gl MQ F valor-P F crítico
Amostra 2,0 1,0 2,0 2,3 0,2 5,3
Colunas 342,4 1,0 342,4 388,0 0,0 5,3
Nível Interações 0,6 1,0 0,6 0,7 0,4 5,3
Dentro 7,1 8,0 0,9
Interação
Total 352,07 11

Estatística - Francisco Boratto Capítulo 6, p. 9


Análise de variância - ANOVA
6.4 ANOVA com dois fatores/vários níveis, com repetição
Veja Tabela 6.5 com valores de resistência de fibras, produzidas por 4 fabricantes,
usando duas máquina diferentes, uma da marca Alfa, outra da marca Beta.
Tabela 6.5: Anova: fator duplo com repetição
Experiencia de dois fatores/ vários níveis
(com repetição) RESUMO A B C D Total
Alfa
Máquina Fabricante Contagem 5 5 5 5 20
A B C D Soma 92,1 117,7 109,9 102,5 422,2
Alfa 20,6 22,6 27,7 21,5 Média 18,4 23,5 22,0 20,5 21,1
18,0 24,6 18,6 20,0 Variância 10,2 7,6 18,4 8,4 13,1
19,0 19,6 20,8 21,1
21,3 23,8 25,1 23,9 Beta
13,2 27,1 17,7 16,0 Contagem 5 5 5 5 20
Beta 18,5 26,3 20,6 25,4 Soma 97,6 121,3 114,2 105,8 438,9
24,0 25,3 25,2 19,9 Média 19,5 24,3 22,8 21,2 21,9
17,2 24,0 20,8 22,6 Variância 7,2 3,7 4,6 8,9 8,5
19,9 21,2 24,7 17,5
18,0 24,5 22,9 20,4 Total
Contagem 10 10 10 10
Soma 189,7 239,0 224,1 208,3
Média 19,0 23,9 22,4 20,8
Variância 8,1 5,1 10,4 7,8

ANOVA
Máquina Fonte da variação SQ gl MQ F valor-P F crítico
Amostra 7,0 1,0 7,0 0,8 0,4 4,1
Colunas 134,3 3,0 44,8 5,2 0,0 2,9
Fabricante Interações 0,3 3,0 0,1 0,0 1,0 2,9
Dentro 275,6 32,0 8,6
Interação
Total 417,2 39

Estatística - Francisco Boratto Capítulo 6, p. 10


Análise de variância - ANOVA
Obs. sobre interações

Um entendimento sobre as interações pode ser feito através da colocação em um


diagrama das médias obtidas, dados ordenados pela médias dos fabricantes, Figura
6.3.
Note que as duas linhas, representando
as duas máquinas, são relativamente
paralelas.
Isto indica que a diferença entre os
valores de resistência, correspondente às
duas máquinas, obtidos pelos 4
fabricantes, são virtualmente iguais, ou
seja, não existe interação entre estes
dois fatores.
Na próxima página é mostrado um caso
onde existe interação entre os fatores.
Fig. 6.3: Médias dos resultados, separadas
pelas duas máquinas.

Estatística - Francisco Boratto Capítulo 6, p. 11


Análise de variância - ANOVA
6.5 ANOVA com dois fatores/dois níveis, com repetição e presença de
interação.

Estatística - Francisco Boratto Capítulo 6, p. 12


Análise de variância - ANOVA
Note que agora F>Fcrítico para “fonte da variação-interações” e as duas linhas, no
diagrama representando as duas temperaturas de cozimento, não são mais paralelas.
Este tipo de comportamento será quantificado no Capítulo 8 no estudo sobre
“Regressão Linear Múltipla”.

Fig. 6.4: Médias dos resultados, separadas pelas duas temperaturas de cozimento.

Estatística - Francisco Boratto Capítulo 6, p. 13


Exercício

A tabela baixo mostra medidas do teor de açúcar em refrigerantes dietéticos e


refrigerantes regulares de 4 fabricantes (A, B, C e D) diferentes. Faça uma ANOVA
(dois fatores, com repetição) comparando os dois tratamentos (dietético versus regular)
e comparando os 4 fabricantes.
Discuta o resultado.

Obs. Estes dados estão na Planilha 08, orelha exercício”.

Teor açucar Fabricante


A B C D
Dietético 292,6 167,8 178,8 292,6
285,8 249,7 167,8 253,6
280,9 187,3 156,1 214,6
220,9 210,7 136,6 269,2
293,1 292,6 174,9 312,2
288,7 287,8 136,6 312,2
Regular 312,2 256,1 198,3 292,6
292,6 253,6 210,7 253,6
311,7 273,1 152,2 362,9
355,1 175,6 177,1 280,9
322,9 284,8 189,7 249,7
331,7 260,1 180,5 314,6

Estatística - Francisco Boratto Capítulo 6, p. 14

Você também pode gostar