Você está na página 1de 79

SUMRIO

1. ANOVA: idias fundamentais


2. ANOVA Fator nico para diferenas
nas mdias aritmticas
3. Suposies para ANOVA
4. Detalhamento e exemplo
numrico
5. ANOVA Fator nico no Excel
6. Exerccios Fator nico
7. ANOVA dois Fatores sem repetio
8. ANOVA dois Fatores com repetio

1. ANOVA: Introduo
Muitas vezes, temos interesse em comparar
diferenas nos resultados entre diversos grupos.
Muitas aplicaes industriais envolvem experincias
nas quais so considerados os grupos ou nveis
pertencentes a apenas um fator de interesse (por
exemplo, a temperatura de cozimento ou o sabor de
preferncia).

Um fator como a temperatura de cozimento pode ter


diversos nveis numricos (isto : 300o.C, 350o., 400o.C.,
etc) ou um fator como sabor de preferncia pode ter
diversos nveis categorizados (baunilha, chocolate,
morango, pistache, etc).

4 Anlise dos Efeitos via ANOVA


Tais experincias, projetadas a partir de um
fator, nas quais os sujeitos ou unidades
experimentais so atribudos aleatoriamente
a grupos ou nveis de um nico fator, so
chamados de modelo inteiramente
aleatrio ou modelo nico.
Quando algumas medidas de resultado em
c grupos so contnuas e atendem
certos pressupostos, podemos empregar a
metodologia denominada Anlise de
Varincia.

4 Anlise dos Efeitos via ANOVA


Aparente inadequao do termo
Anlise de Varincia
Este nome parece inadequado uma vez que
queremos comparar as diferenas entre as
mdias dos resultados dos c grupos.
No entanto, a partir da anlise das
variaes nos dados dentro dos grupos ou
entre os grupos que seremos capazes de
tirar concluses sobre possveis diferenas
nas mdias aritmticas dos grupos.

4 Anlise dos Efeitos via ANOVA


Dividimos a variao total nas medidas de resultado naquilo que se pode atribuir a diferenas entre os
grupos c e aquilo que se deve ao acaso ou se atribui a variaes inerentes aos grupos c.
A variao dentro do grupo considerada erro experimental.
A variao entre grupos atribuda a efeitos de tratamento.

1. ANOVA: Introduo
O objetivo da ANOVA comparar respostas
mdias a vrios tratamentos em um
Experimento, onde os tratamentos so
combinaes de nveis de todos os fatores
envolvidos no experimento.
O mais simples de todos os experimentos so
aqueles que utilizam um nico fator para
comparar valores da varivel resposta.
Como h apenas um nico fator no experimento,
os vrios nveis do fator so os tratamentos no
experimento.
Este experimento pode ser analisado com

1. ANOVA: Introduo

A idia fundamental para a comparao de


mdias:
O que interessa no quo separadas esto as
mdias amostrais, mas quo separadas elas
esto em relao variabilidade de observaes
individuais.
Considere dois conjuntos de diagramas em caixa:

(a)

(b)

1. ANOVA: Introduo
Temos diagramas em caixa para trs
amostras cada.
As mdias amostrais so as mesmas
em (a) e (b).
A Anlise de Varincia encontrar
uma diferena mais significante entre
as mdias em (b), porque h menos
variao entre os indivduos dessas
amostras.

1. ANOVA: Introduo
Os diagramas em (a) apresentam
caixas altas (grande variao
entre os indivduos em cada grupo.
Com tal variao entre indivduos,
no seria surpreendente se outro
conjunto de amostras desse mdias
amostrais bastante diferentes.
As diferenas observadas entre as
mdias amostrais poderiam ocorrer
apenas por mera casualidade.

1. ANOVA: Introduo
Os diagramas em (b) tm os mesmos
centros que os de (a), mas as caixas
so bem mais curtas.
H menos variao entre os
indivduos em cada grupo.
improvvel que qualquer amostra
do primeiro grupo tenha uma mdia
to pequena quanto a mdia do
segundo grupo.

1. ANOVA: Introduo
Como mdias to dispersas como as
observadas raramente ocorrem
apenas por casualidade em uma
amostragem repetida, elas
constituem evidncia convincente de
diferenas reais entre as mdias das
trs populaes de onde estamos
extraindo amostras.

1. ANOVA: Introduo
Esta comparao demasiada simples
no sentido em que no levamos em
conta o tamanho da amostra (as
caixas no mostram este efeito).
Pequenas diferenas entre mdias
amostrais podem ser significantes se
as amostras so muito grandes.
E grandes diferenas entre mdias
amostrais podem no ser significantes
se a amostra muito pequena.

1. ANOVA: Introduo
O que podemos garantir: para o mesmo
tamanho da amostra, a parte (a) da
Figura anterior dar um p-valor muito
menor que a parte (b).
Mesmo assim, vale a idia fundamental:
Se mdias amostrais se apresentam
muito dispersas em relao
variao entre indivduos do mesmo
grupo, isso evidncia de que algo
que no o acaso est atuando.

1. ANOVA: Introduo
A idia da Anlise de Varincia
A anlise de varincia compara a
variao devida a fontes especficas
com a variao entre indivduos que
deveriam ser semelhantes.
A ANOVA testa se vrias populaes
tm a mesma mdia, comparando a
disperso das mdias amostrais
com a variao existente dentro das
amostras.

1. ANOVA: Introduo
Variao Total = Variao entre as
amostras +

Mdia
Global

Variao dentro das amostras


Soma Quadrados Total = Soma Quadrados
Entre as amostras + Soma Quadrados
Mdia
do grupo
j amostras
dentro
das

Variao da soma
relacionada com a
varivel x: (Soma entre)

Variao da soma no
relacionada com a varivel x:
soma residual ou erro (Soma
dentro)

1. ANOVA: Introduo
A estatstica F da ANOVA para comparao
de vrias mdias tem a forma:

A estatstica F s pode tomar valores positivos ou nulos.


zero apenas quando todas as mdias amostrais so idnticas.
A variao aleatria origina algumas diferenas entre as mdias
amostrais mesmo quando as mdias populacionais so iguais.
Se H0 verdadeira, esperamos que F tome valores prximos de 1.
Quando as mdias amostrais se dispersam, o valor de F aumenta.

1. ANOVA: Introduo
Grandes valores de F constituem
evidncia contra a H0 de que todas
as mdias amostrais sejam iguais.

Exemplo automveis
2. ANOVA: Fator nico para comparao de mdias
1. Os carros menores tm realmente melhor
milhagem?
A tabela a seguir apresenta as milhas
percorridas com
um galo de combustvel, na cidade e na
rodovia, declaradas pelo Departamento de
Proteo
Ambiental dos EUA para uma Amostra de 59
modelos de
automvel de 1994:
Compactos, mdios e grandes.
Desejamos fazer uma comparao das
milhas por galo

2. ANOVA: Fator nico para comparao de mdias


Milhas por Galo, para modelos de carros de 1994, na cidade e na rodovia
Modelo
Tamanho
MPG na cidade
MPG na estrada
Acura Legend
Compacto
19
24
Acura Vigor
Compacto
20
26
Audi 100
Compacto
18
24
Audi 90
Compacto
18
26
BMW 525i
Compacto
18
25
Buick Skylark
Compacto
22
32
Chevrolet Beretta
Compacto
25
31
Chrysler Lebaron
Compacto
22
27
Dodge Shadow
Compacto
23
30
Ford Tempo
Compacto
22
27
Honda Accord
Compacto
23
29
Jaguar XJ12
Compacto
12
16
Mazda Protege
Compacto
23
29
Mazda 323
Compacto
26
33
Mercedes-Benz E320
Compacto
19
25
Mercedes-Benz E420
Compacto
18
24
Mitsubishi Diamant
Compacto
18
24
Mitsubishi Galant
Compacto
20
26
Mitsubishi Precis
Compacto
27
35
Nissan Altima
Compacto
21
29
Oldsmobile Achieva
Compacto
22
32
Saturn SL
Compacto
26
35
Subaru Legacy
Compacto
22
29
Toyota Corolla
Compacto
26
29

2. ANOVA: Fator nico para comparao de mdias


Volskwagen Golf
Volskwagen Jetta
BMW 740i
Buick Century
Buick Regal
Cadillac Eldorado
Chevrolet Lumina
Dodge Spirit
Ford Taurus
Ford Thunderbird
Hyundai Sonata
Infiniti Q45
Lexus GS300
Lexus LS400
Lincoln-Mercury Mark VIII
Mazda 626
Mazda 929
Nissan Maxima
Rolls-Royce Silver Spur
Saab 900
Toyota Camry
Volvo 850
Buick LeSabre
Buick Park Avenue
Buick Roadmaster
Cadillac DeVille
Chevrolet Caprice
Chrysler Concorde
Chrysler New Yorker
Ford LTD
Lincoln-Mercury Continental
Mercedes-Benz S320
Mercedes-Benz S420
Mercedes-Benz S500
Saab 9000

Compacto
Compacto
Mdio
Mdio
Mdio
Mdio
Mdio
Mdio
Mdio
Mdio
Mdio
Mdio
Mdio
Mdio
Mdio
Mdio
Mdio
Mdio
Mdio
Mdio
Mdio
Mdio
Grande
Grande
Grande
Grande
Grande
Grande
Grande
Grande
Grande
Grande
Grande
Grande
Grande

21
21
16
25
19
16
19
22
20
19
21
17
17
18
18
23
19
19
10
19
21
19
19
19
17
16
18
20
18
18
18
17
15
14
17

28
27
23
31
29
25
29
27
29
26
27
22
23
23
25
31
24
26
15
26
28
26
28
27
25
25
26
28
26
26
26
24
20
19
27

2. ANOVA: Exemplo (Ramo-e-folhas)


Compacto
Mdio
10
100
Jaguar
11
11
XJ12
120
12
13
13
14
14
15
15
16
16 00
17
17 00
18 00000
18 00
19
20
21
22
23
24
25

00
00
000
00000
000
0

19 0000000
20 0
21 00
22 0
23 0
24
25 0

Grande
10
Rolls11
Royce
12
Silver
13
Spur
14
15
16
17
18

0
0
0
000
0000

19 00
20 0
21
22
23
24
25

2. ANOVA: Fator nico para comparao de mdias

Descrevendo os dados
Median Desvio Mnim Mxim
a
Padro
o
o

Mdia

Q1

Q3

Compacto

25

21,6

22

2,8136

18

27

19

23

Mdio

19

19,31

19

2,3106

16

25

18

21

Grande

13

17,38

18

1,6602

14

20

16,5

18,5

2. ANOVA: Fator nico para comparao de mdias

Parece que a milhagem decresce a


medida que cresce o tamanho dos
carros.
Os grficos mostram um outlier no
grupo compacto e outro grupo dos
mdios.
Como se tratam de carros incomuns,
foram excludos das anlises que
seguem.

2. ANOVA: Exemplo automveis


Utilizaremos a mdia para descrever o
centro das distribuies de milhagem.
Como era de se esperar, a milhagem
mdia diminui a medida em que
passamos dos carros compactos para os
carros mdios e para os carros grandes.
As diferenas entre as mdias no so
grandes.
So estatisticamente significantes?

2. ANOVA: Exemplo automveis


O problema das comparaes mltiplas.
As milhagens mdias na cidade das trs populaes de
carros sero denotadas por:
1 para os carros compactos
2 para os carros mdios
3 para os carros grandes
Poderamos realizar repetidamente o teste t para duas
amostras:
Testar H0: 1 = 2 para ver se a milhagem mdia para
compactos difere daquela para mdios
Testar H0: 1 = 3 para ver se carros compactos diferem
de grandes
Testar H0: 2 = 3 para ver se carros mdios diferem de
grandes.
Ponto fraco da realizao desses trs testes: obtemos 3
valores p, um para cada teste isoladamente.

2. ANOVA: Exemplo automveis


Isto no nos diz at que ponto
provvel que trs mdias amostrais
estejam to dispersas quanto estas.
Pode ser que 17,385 e 21,600 sejam
significativamente diferentes se
considerarmos apenas dois grupos,
mas no mais se soubermos que elas
so a menor e a maior mdia em trs
grupos.

2. ANOVA: Exemplo automveis

Quando consideramos maior nmero


de grupos, a diferena entre o menor
e o maior valor da mdia amostrar, se
tornar, claro, maior.
(comparao entre a pessoa mais
baixa e a pessoa mais alta em grupos
cada vez maiores de pessoas).

2. ANOVA: Exemplo automveis


Teste F de Anlise de Varincia
Queremos testar a hiptese que no h diferena
entre o consumo de combustvel dos trs tipos de
carros na cidade: H0: 1 = 2 = 3
H1 que h alguma diferena (as trs mdias no
so todas iguais):
H1: nem todas as i (i = 1,2,3) so iguais.
A hiptese alternativa no nem unicaudal nem
bicaudal.
multicaudal: admite qualquer relao alm de
todas as trs iguais.

2. ANOVA: Exemplo automveis


Realizamos o teste F da Anlise da
Varincia (fator nico)
no
Excel:
(7,916667+5,339181+2,75641)/3
= 5,910781 =
Anova: fator nico
Variao residual (dentro) dos
RESUMO
grupos
Contage
Grupo
m
Soma
Mdia Varincia
Compact
Razo de
o
25
540
21,6 7,916667
Varincia
Soma de
Quadrad
Mdio
19
367 19,31579 5,339181
s
Quadrad
os
Grande
13
os226 17,38462 2,75641
Mdios

ANOVA
Fonte da
variao
SQ
Entre
grupos
160,9582
Dentro

gl

MQ

valor-P

F crtico

2 80,47908 13,61564 1,63E-05 3,168246

Detalhes numricos:
Observe que:

= mdia em cada grupo (=2,968064;


0,315174; 6,212943) com n1 = 25; n2 =
19; n3 = 13

= Mdia Global = 19,877


Ento: Soma Entre = 25*(2,96-19,877)^2
+ 19*(0,315-19,877)^2 + 13*(6,2119,877)^2 = 160,95816

2. ANOVA: Exemplo automveis


Observemos que:

2. ANOVA: Exemplo automveis


A estatstica F = 13,62
valor P = 1,63*10^(-5)
Temos P < = 0,05
H evidncia extremamente forte de
que os trs tamanhos de carro no
apresentam todos a mesma milhagem
mdia.

2. ANOVA: Exemplo peixes em uma lago da


Finlndia

A tabela a seguir d os resultados de um estudo


de peixes pescados em um lago da Finlndia.
Vamos considerar os peixes pescados pelos
pesquisadores como uma amostra aleatria de
todos os peixes do lago.
O peso do peixe comercial tem especial interesse.
H evidncia de que o peso mdio de todas as
bremas, percas e parcas encontradas no lago seja
diferente?

2. ANOVA: Exemplo peixes em uma lago da


Finlndia
Pesos (em gramas) de trs espcies de peixes
Bremas
13,4
13,8
15,1
13,3
15,1
14,2
15,3
13,4
13,8
13,7
14,1
13,3
12
13,6
13,9

Percas
14,8
14,1
13,7
13,3
15,1
13,8
14,8
15
14,1
14,9
15,5
14,3
14,3
14,9
14,7

Parcas

16
13,6
15,2
15,3
15,9
17,3
16,1
15,1
14,6
13,2
15,8
14,7
16,3
15,5
14,5

15,1
15,1
15
14,8
14,9
15
15,9
13,9
15,7
14,8
17,9
14,6
15
15
15,8

17,5
20,9
17,6
17,6
15,9
16,2
18,1
14,5
17,8
16,8
17
17,6
15,6
15,4
16,1

14
13,9
13,7
14,3
16,1
14,7
14,7
13,9
15,2
14,6
15,1
13,3
15,2
14,1
13,6

15

15

14,3

16,3

15,4

13,8

15

15,4

14

13,5

15

15,1

15,4

13,3

17

17,7

15,6

2. ANOVA: Exemplo peixes


Antes de proceder ANOVA, devemos examinar
os dados.
a)

Exiba a distribuio dos pesos das trs


espcies de peixe
com ramos-e-folhas comparativos, lado a lado. H
outliers ou
evidncia de assimetria acentuada em alguma
das
distribuies?
b) Determine o esquema dos cinco nmeros para
cada

2. ANOVA: Exemplo peixes

Ramo-e-folhas para o exemplo dos peixes

Bremas
120
133333445677788880
141112337899
001113
15 5
Percas

Parcas
1336799
140013677
151223446

13269
14355667889
00000001111234456788
15 990
011233
16 38
1700356667789
181

161

2. ANOVA: Exemplo peixes


Esquema de cinco nmeros (exemplo dos peixes)

Brema
s
Percas
Parcas

Mnim
o
12
13,2
13,3

Q1

Media
na

Q3

Mxim
o

13,6

14,1

14,9

15,5

15,0
15,55 16,675 20,9
13,925 14,65 15,275 16,1
Bremas Percas Parcas
Mdia
14,13
15,7
14,60
Desvio Padro 0,7695 1,1856 0,7796

2. ANOVA: Exemplo peixes


a) A distribuio para as percas
ligeiramente mais alta do que as outras
duas, e tem um outlier (20,9).
No h forte assimetria.
b) As percas so maiores que os outros dois
peixes.
Parece tambm que as bremas podem ser
Ligeiramente menores que as percas.

2. ANOVA: Exemplo peixes


Passemos agora ANOVA dos dados.
A perca mais pesada tinha seis parcas
no estmago quando foi pescada.
Como este peixe pode ser um outlier e
sua condio fora do comum, vamos
eliminar dos dados esta observao.
A seguir temos a ANOVA com o outlier
excludo.

2. ANOVA: Exemplo peixes


a)

Qual a hiptese nula testada pela


estatstica F da
ANOVA?
Expresse essa hiptese em palavras e em
smbolos.
b) Qual o valor da estatstica F? Qual o pvalor?
c) Com base neste exerccio e no anterior, qual
sua
concluso sobre os pesos dessas espcies de

2. ANOVA: Exemplo peixes


a) Queremos testar a hiptese que no h
diferena entre o peso mdio entre as
trs espcies de peixes.
Em smbolos:
H0: 1 = 2 = 3
H1 que h alguma diferena (as trs
mdias no so todas iguais):
Ou, de outra forma:
H1: nem todas as i (i = 1,2,3) so iguais.

2. ANOVA: Exemplo peixes


Tabela ANOVA para o Exemplo dos
peixes:
Anova: fator nico
RESUMO
Contage
Grupo
m
Coluna 1

35

Coluna 2

55

Coluna 3

20

ANOVA
Fonte da
variao
SQ
Entre
60,1667
grupos
1
Dentro

Soma

Mdia Varincia
14,1314 0,59221
494,6
3
8
15,7472 1,40587
866,1
7
2
0,60786
292,1 14,605
8

gl

MQ
F
valor-P F crtico
30,0833 29,9150
3,08119
2
5
4 4,79E-11
3

2. ANOVA: Exemplo peixes

b)
Graus de Liberdade: numerador = 2,
denominador = 107
Como no encontramos este valor na Tabela
F, vamos aproximar gl denominador = 100.
F = 29,92
P-valor = 4,79*10^(-11)
Como F > F_crtico = 7,41
Rejeitamos H0.

gl = 2 , 100
valor
p
crtico
0,100
2,36
0,050
3,09
0,025
3,83
0,010
4,82
0,001
7,41

2. ANOVA: Exemplo peixes


c) Concluso: no h evidncias para
concluirmos que os pesos mdios dos peixes
sejam iguais.
0.1
0.09

Grfico Distribuio
F(x,2;100)

0.08
0.07
0.06
0.05

Fcrtico =
7,41

0.04

Fteste =
29,92

0.03
0.02
0.01
0
0

10

15

20

25

30

2. ANOVA: Exemplo automveis


Voltando ao exemplo dos automveis.
Os graus de liberdade para o teste F aparecem
nas duas primeiras linha da coluna DF
(degree of freedom = graus de liberdade).
H 2 graus de liberdade no numerador e 54 no
denominador.
Na tabela F apresentada a seguir, localizamos
2 graus de liberdade do numerador no topo da
tabela. Em seguida, localizamos o nmero 54
gl no denominador esquerda da tabela.

2. ANOVA: Exemplo automveis


Como no h 54, utilizamos o valor mais
prximo (gl = 50). Os valores crticos para 2 e
50 graus
de de
liberdade
so
Graus
liberdade:
2, 50
p
0,100
0,050
0,025
0,010
0,001

valor crtico
2,41
3,19
3,97
5,06
7,96

F = 13,62 superior ao valor crtico 0,001 e


assim, P < 0,001.
A figura a seguir mostra F com 2 e 50 graus de
liberdade.

2. ANOVA: Exemplo automveis


Abaixo temos o grfico de F(x,2;50)
0.1
0.09
0.08
0.07
0.06
0.05

Fcrtico =
7,96

0.04

Fteste =
13,62

0.03
0.02
0.01
0
0

10

12

14

2. ANOVA: Exemplo automveis


Graus de Liberdade para o Teste F
Desejamos comparar as mdias de I populaes.
Temos uma Amostra Aleatria Simples de tamanho ni
da i-sima populao, e assim o nmero total de
observaes em todas as amostras combinadas
N = n 1 + n2 + n3
Se a hiptese nula, de igualdade de todas as mdias
populacionais, for verdadeira, a estatstica F ANOVA
tem distribuio F com I 1 graus de liberdade no
numerador e N I graus de liberdade no denominador.

2. ANOVA: Exemplo automveis


Graus de Liberdade para o Teste F
Exemplo dos automveis:
3 tamanhos de carro (I = 3).
As trs amostras possuem tamanhos:
n1 =25, n2 = 19, n3 = 13. Ento
N = = n1 + n2 + n3 = 25 + 19 + 13 = 57
O Teste F ANOVA tem I 1 = 3 1 = 2 graus de
liberdade no numerador e
N I = 57 3 = 54 graus de liberdade no
denominador.

3. Suposies para ANOVA


ANOVA vlida apenas em determinadas
circunstncias.
i) Temos I Amostras Aleatrias simples
independentes, uma de cada uma de I populaes
ii) A i-sima populao tem distribuio normal com
mdia desconhecida i. As mdias podem ser
diferentes
nas diferentes populaes.
A estatstica F de ANOVA testa H0 de que todas as
populaes tm a mesma mdia:
H0: 1 = 2 = 3
H1: nem todas as i so iguais.
iii) Todas as populaes tm o mesmo desvio padro
, cujo valor desconhecido.

3. Suposies para ANOVA


O planejamento da produo de dados
o fundamento mais importante da
inferncia.
Uma amostragem tendenciosa podem
invalidar uma inferncia.
Se no extrairmos AAS separadas de cada
populao (ou se no fazemos um
experimento comparativo aleatorizado),
nunca sabemos ao certo a que
populao se aplicam as concluses da
inferncia.

3. Suposies para ANOVA


Como nenhuma populao real tem
distribuio normal, a utilidade dos
processos de inferncia que pressupem
normalidade depende de quo sensveis
eles so em relao a afastamentos da
normalidade.
Processos para comparao de mdias no
so muito sensveis falta da normalidade.
Os teste F de ANOVA robusto neste
aspecto.
O que importa a normalidade das mdias
amostrais (teorema central do limite)

3. Suposies para ANOVA


Quando apenas o pressuposto de
normalidade seriamente violado,
alternativas no-paramtricas ao
teste F de ANOVA de fator nico
encontram-se disponveis (ver teste
de Classificao de Kruskal-Wallis
para diferenas em medianas em c
grupos, c > 2).

3. Suposies para ANOVA


No deixe de procurar possveis outliers
(modificam valores das mdias amostrais) ou
assimetria acentuada.
Quando no h outliers e as distribuies so
aproximadamente simtricas, podemos aplicar
ANOVA com segurana, mesmo para tamanhos
amostrais como 4 ou 5 (no confundir F de
ANOVA com a estatstica F de comparao de
desvios padres que no robusta contra a
no-normalidade).

3. Suposies para ANOVA


ANOVA supe que a variabilidade das
observaes (medida pelo desvio padro),
seja a mesma em todas as populaes.
Os testes estatsticos para verificar a
suposio de igualdade de desvios padres
so muito sensveis normalidade, o que os
torna de pouco valor prtico.
A ANOVA no muito sensvel a violaes
desta suposio, principalmente quando as
amostras possuem mesmo tamanho ou
tamanhos aproximados.
Ao planejar um estudo, procuremos extrair
amostras de igual tamanho de todos os
grupos que pretendemos comparar.

3. Suposies para ANOVA


REGRA EMPRICA
VERIFICAO DOS DESVIOS PADRES
EM ANOVA
Os resultados do teste F de ANOVA so
aproximadamente corretos quando o
maior desvio padro amostral no
supera o dobro do menor
desvio padro amostral.

3. Suposies para ANOVA

studo de milhagem, os desvios padres amostrais


os carros compactos, mdios e grandes so:
2,814, s2 = 2,311, s3 = 1,660

s desvios padres satisfazem facilmente a Regra Em


s tamanhos de amostra so 25, 19 e 13.
amos de fora os dois carros atpicos que apareceram
o outliers.
mos aplicar ANOVA com segurana para comparar a
agem mdia dos trs tamanhos de carros.

3. Suposies para ANOVA

latrio do qual foi extrada a tabela do exemplo dos


os tambm contm dados sobre 33 carros subcompa

svio padro de sua milhagem na cidade


5,888 milhas por galo.

mais que o dobro do menor desvio padro:

seria seguro aplicar ANOVA para comparar a milhag


ia de todos os quatro tipos de carros.

3. Suposies para ANOVA

ios padres grandes, muitas vezes, esto associado


metria na distribuio.
o-e-folha da milhagem dos carros subcompactos:
1
2

778888899
002233334

2 556666678899
3 3
3 6
4 4
Distribuio assimtrica
direita.
Trs modelos fazem 33, 36 e 44 milhas por
galo na cidade.
A mdia 24,1 para todos os 33 carros
pequenos e

4. Detalhamento da ANOVA
Seguem, agora, as expresses detalhadas
para ANOVA.
Os ndices de 1 a I nos dizem a que amostra
uma estatstica
se refere.
Tamanho
Popula
Mdia Desvio Padro
da
o
Amostral
Amostral
Amostra

n1
s1
1
n2
s2
2

.
.
.
.
.
.
.
.
.
.
.
.
nI
sI
I

4. Detalhamento da ANOVA
A estatstica F de ANOVA tem a forma

As medidas de variao no numerador e no


denominador so chamadas mdias
quadrticas.
Uma mdia quadrtica uma forma mais
geral de uma varincia amostral.
Uma varincia amostral ordinria s2 uma
mdia dos quadrados dos desvios das
observaes em relao mdia.

4. Detalhamento da ANOVA
O numerador de F uma mdia quadrtica
que mede a variao entre as I mdias
amostrais
(i = 1,2,...,I).
Chamemos
a resposta mdia global (a
mdia de todas as N observaes juntas.
Pode-se achar
a partir das I mdias
Mdia
amostrais
pela expresso
global

A soma dos produtos de cada mdio pelo


nmero de observaes que ela representa
a soma de todas as observaes individuais.

4. Detalhamento da ANOVA
A mdia quadrtica do numerador de F uma
mdia dos I quadrados dos desvios das
mdias das amostras em relao a
.
Esta chamada mdia quadrtica entre
grupos (MQE).

Cada desvio ao quadrado ponderado pelo


nmero de observaes
que ele
representa.

4. Detalhamento da ANOVA
A mdia quadrtica no denominador de F mede
a variao entre as observaes individuais na
mesma amostra.
Para qualquer amostra, a varincia amostral
faz esse trabalho.
Para todas as I amostras juntas, usamos uma
mdia das varincias amostrais individuais.
novamente uma mdia ponderada em que
cada
ponderado por
.
Temos ento a mdia quadrtica dentro dos
grupos (MQD).

4 Anlise dos Efeitos via ANOVA


Como os nveis c do fator esto sendo comparados, existem c 1 graus de liberdade,
associados soma dos quadrados entre grupos.
Em cada nvel c temos n j -1 graus de liberdade.
Ento:

Existem n c gl associados soma dos quadrados


dentro dos grupos.
Existem n 1 gl associados ao total dos quadrados
(cada observao Xij est sendo comparada
mdia geral com base nas n observaes).

4 Anlise dos Efeitos via ANOVA


Se cada uma das somas de quadrados for dividida por
seus correspondentes graus de liberdade, teremos
trs varincias (termos quadrticos de mdias):

O principal interesse comparar as mdias de


grupos c ou os nveis de um fator, para determinar
se existe um efeito de tratamento entre os grupos c.
Para tal, a ANOVA deve seu nome ao fato de que
isto alcanado comparando-se as varincias.

4. Detalhamento da ANOVA
Finalmente:

4. Detalhamento da ANOVA
ANOVA de um fator: decomposio da variao total
Varivel Independente

Varia
o dentro
de
categori
as =
SQdentr
o

X1
Y1
Y2
Y3
.
.
.
Yn

X2
Y1
Y2
Y3

X3
Y1
Y2
Y3

...
Y1
Y2
Y3

Xc
Y1
Y2
Y3

Yn

Yn

Yn

Yn

Mdia da
categori
a
Variao entre categorias = SQentre

Y1
Y2
Y3
.
.
.
Yn

Varia
o Total
= SQt

4. Exemplo numrico de ANOVA


Para detectar a presena de insetos daninhos nas
plantaes, colocam-se papeles untados com uma
substncia pegajosa e examinam-se os insetos
capturados.
Que cores atraem mais insetos?
Os pesquisadores colocaram seis papeles de cada cor
em posies aleatrias em um campo de aveia, e
contaram o nmero de insetos capturados.

4. Exemplo numrico de ANOVA


Cor do
Papel
o
Azul
Verde
Branco
Amarel
o

Insetos apanhados
16
37
21

11
32
12

20
20
14

21
29
17

14
37
13

7
32
20

45

59

48

46

38

47

4. Exemplo numrico de ANOVA


a) Faa os ramos-e-folhas para as quatro cores
de papelo.
H assimetria nas distribuies?
b) Aplique a regra emprica que vimos.
Podemos aplicar ANOVA neste caso?
c) Utilize as frmulas apresentadas e as mdias
fornecidas
para calcular MQE, MQD e a estatstica F.
d) Qual a sua concluso?
H alguma cor que favorece a captura de
insetos?

4. Exemplo numrico de ANOVA


Cor do Papelo
Azul
Verde
Branco
Amarelo

Mdias
14,83
31,17
16,17
47,17

Desvios Padres
5,345
6,306
3,764
6,795

4. Exemplo numrico de ANOVA

J montou os ramos-e-folhas?
Qual sua concluso?

4. Exemplo numrico de ANOVA

J aplicou a Regra Emprica?


Qual sua concluso?

4. Exemplo numrico de ANOVA


Dando um tempo para todos
efetuarem os clculos...
Busque a expresso para MQE e MQD.
Determine os graus de liberdade.

4. Exemplo numrico de ANOVA


Azul
0 7

Verde
0

Branco
0

Amarelo

1 146
2 01

2 09

12347
2 01

1
2

32277

3 8

4
5

4
5

4
5

45678
5 9

4. Exemplo numrico de ANOVA

A razo menor que 2, portanto os dados


satisfazem a Regra Emprica para aplicao
segura da ANOVA.
As formas das quatro distribuies so
irregulares (como seria de se esperar em
amostras de apenas 6 observaes em cada
grupo), mas no h outliers.

4. Exemplo numrico de ANOVA

4. Exemplo numrico de ANOVA


N = 24
I1=41=3
N I = 24 4 = 20
Mdia global = 27,33
MQE = 1.378,033
MQD = 32,169
F = 42,84:
rejeitamos H0: h evidncias de que o nmero mdio
de insetos que cada cor de papel atrai no apresenta
mesma mdia.