Você está na página 1de 12

Anlise de Varincia (ANOVA) 1 fator

Queremos determinar se a diferena observada entre duas mdias amostrais


devida, apenas, s variaes aleatrias de uma amostra a outra, ou se os dados vm de
populaes onde as mdias so verdadeiramente diferentes. Esse um outro modo de dizer
que ns queremos descobrir se a diferena entre as mdias estatisticamente diferente. Enfim,
mesmo que ns possamos concluir que as mdias so diferentes, ns tambm temos de decidir
se elas diferem o suficiente para poderem ser consideradas de importncia pr!tica "cl#nica$.
%amos considerar trs situaes "&, ' e ($ onde os )rupos (ontrole e *ratado
apresentam a mesma mdia amostral, porm, diferem em termos de variabilidade "em
disperso, ou se+a, em desvio,padro$.
C T C T C T
0
1
2
3
4
5
6
7
8
9
10
caso A caso B
caso C
m
m
( - )rupo controle
* - )rupo tratado
Caso A: duas mdias diferentes "no podemos dizer outra coisa, seno que diferem
numericamente$.
Caso B: as mesmas duas mdias "de &$ com valores bem dispersos "a diferena no
estatisticamente si)nificante$. .evido disperso, a diferena no muito convincente.
Caso C: as mesmas mdias "as duas de & e '$ com valores concentrados "pr/imos ao valor
mdio$. 0esse caso, 1! diferena estatisticamente si)nificante.

O teste t (de Student) para a diferena entre duas mdias um caso especial de anlise de
varincia (ANOVA 1 fator). A frmula para t pode ser epressa para !. Vale a rela"o# ! $ t
%
.
2 problema como decidir quando as mdias so diferentes, em relao
disperso dos valores em cada )rupo, a fim de concluir se 1! diferena estatisticamente
si)nificante entre as mdias.
& an!lise de varincia a+uda,nos a responder esta questo.
2 que temos a fazer descobrir um modo de avaliar "medir$ numericamente o
quo diferentes so as mdias e quanto as observaes se afastam "encontram,se dispersas$ ao
redor das respectivas mdias.
(om essas duas medidas "avaliaes$ nossa disposio, somos capazes de dizer
se as mdias diferem si)nificantemente ou no.
A idia da Anlise de Varincia
Esta a idia principal para a comparao de mdias3 o que importa no o quanto
as mdias amostrais esto distantes , mas o quo distantes esto relativamente & varia'ilidade
de o'serva(es individuais.
& &02%& compara a variao resultante de fontes espec#ficas com a variao
entre indiv#duos que deveriam ser semel1antes. Em particular, a &02%& testa se v!rias
populaes tm a mesma mdia, comparando o afastamento entre as mdias amostrais com a
variao e/istente dentro das amostras.
& &02%& pressupe que podemos decompor cada valor observado em trs termos
aditivos4 ou se+a, ns somos capazes de escrever cada observao como uma soma de trs
termos. & decomposio pode ser escrita como3
%alor obtido "/$ - mdia )eral "5$ 6 desvio da mdia do )rupo em relao mdia )eral " ,
5$ 6 desvio "7
i+
$ entre o valor observado em relao mdia do )rupo " / ,

$ ou
.ata - fit 6 residue "error$
2 modelo formal de &02%& "8 fator $ 3 /i+ - 5 6 9i+ 6 7i+
/
i+ :
so os valores observados em cada )rupo
i : refere,se ao )rupo
+ : refere,se observao dentro do )rupo
5 : uma constante " a mdia )eral$
7 : so os termos residuais "diferena entre o valor observado e o fit, modelo a+ustado$
;
2bservao.
<uposies do modelo &02%&3
"i$ todas as populaes tm o mesmo desvio padro = , de valor descon1ecido4
"ii$ os res#duos devem se)uir uma curva normal com mdia i)ual a zero e varincia =
;
.
A estatstica F da ANOVA
> - variao "entre mdias amostrais$ / variao "entre indiv#duos dentro das amostras$
&s medidas de variao no numerador e denominador de > so c1amadas de mdias
quadr!ticas. ?ma mdia quadr!tica uma forma mais )eral de uma varincia amostral. ?ma
varincia amostral usual s
;
uma mdia dos desvios quadr!ticos das observaes a partir de
suas mdias, lo)o se qualifica de @mdia quadr!ticaA.
& estat#stica > testa a 1iptese nula de que todas as ) populaes tm a mesma mdia3
Bo3 C8 - C; - CD- .. - C *
Ba3 nem todos os C so i)uais
<ob Biptese Bo, ento, a estat#stica > tem distribuio > com E,8 e 0,E )raus de
liberdade.
D
Exe!lo resol"ido:
0a *abela 8, mostrada a se)uir, temos cinco )rupos com cinco observaes em cada
)rupo. Queremos saber @as diferenas nas mdias amostrais so variaes aleatrias que
ocorrem apenas devido ao acaso "+ust ', c-ance$ ou se e/istem diferenas sistem!ticas entre
as mdiasA.
*abela 8. .ados obtidos em cinco )rupos num e/perimento inteiramente casualizado com
cinco rplicas.
A
B C # E
F G H I D
F J H I H
F J I F H
J J F F H
K K F J I
dias aostrais (

$
$ % & ' (
dia )eral * '
O+ser"a,-o:
Lrimeira re)ra de an!lise de dados3 @maMe a pictureA
<e)unda re)ra de an!lise de dados3 @maMe a pictureA
*erceira re)ra de an!lise de dados3 @maMe a pictureA
assim. um /dot plot0. e1ou um 'o2plot e1ou ou -isto3rama convm serem apresentados4
H
Valores
G
r
u
p
o
s
10 9 8 7 6 5 4 3 2 1 0
A
B
C
D
E
Dotplot of Valores vs Grupos
9 8 7 6 5 4 3
Dotplot for A-E
A
B
C
D
E
Mea
Mea !- 1 "tDev
Descriptive Statistics: A, B, C, D, E
Grupos N Mdia DP CoefVar (%)
A 5 7.000 1.414 20.20
B 5 .000 0.707 .4
C 5 5.000 1.000 20.00
D 5 !.000 1.225 20.41
" 5 4.000 0.707 17.!
O+s.: 8.H8H o dobro de N.GNG
I
/esol0,-o:
12 entre )r0!os: n( 3

4)
5
6r0!o A
On#cio Efeito
tratamento
Erupo
"
,
/
,
$
Pes#duo "+o)o$ >inal 7
;
F 68 G ,8 F 8
F 68 G ,8 F 8
F 68 G ,8 F 8
F 68 G 68 J 8
F 68 G 6; K H
& (1)
5
6r0!o B
On#cio Efeito
tratamento
Erupo
"
,
/
,
$
Pes#duo "+o)o$ >inal 7
;
F 6; J ,8 G 8
F 6; J N J N
F 6; J N J N
F 6; J N J N
F 6; J 68 K 8
&(5)
5
6r0!o C
On#cio Efeito
tratamento
Erupo
"
,
/
,
$
Pes#duo "+o)o$ >inal 7
;
F ,8 I ,8 H 8
F ,8 I ,8 H 8
F ,8 I N I N
F ,8 I 68 F 8
F ,8 I 68 F 8
&(31)
5
6r0!o #
On#cio Efeito
tratamento
Erupo
"
,
/
,
$
Pes#duo "+o)o$ >inal 7
;
F N F ,8 I 8
F N F ,8 I 8
F N F N F N
F N F N F N
F N F 6; J H
&(7)
5
6r0!o E
On#cio Efeito
tratamento
Erupo
"
,
/
,
$
Pes#duo "+o)o$ >inal 7
;
F ,; H ,8 D 8
F ,; H N H N
F ,; H N H N
F ,; H N H N
F ,; H 68 I 8
&((3')
5
* &(35)
5
Clc0lo da 1oa de 20adrados
F
12 Entre )r0!os *12E * & 81
5
95
5
9 (31)
5
9 7
5
9 (35)
5
: * &7
12 #entro dos )r0!os * 12# * ; 7
;
- 55.
; 7
;
- ",8$
;
6",8$
;
6 ",8$
;
6 "8$
;
6 ";$
;
6 ",8$
;
6 "N$
;
6"N$
;
6"N$6"8$
;
6

",8$
;
6",8$
;
6"N$
;
6"8$
;
6"8$
;
6 ",8$
;
6 ",8$
;
6"N$
;
6"N$
;
6";$
;
6
",8$
;
6"N$
;
6"N$
;
6"N$
;
6"8$
;
-
; 7
;
- J6 ; 6 H 6 F 6 ; - ;;
12< * 1oa de 20adrados <otal * 12E 9 12# * &7 9 55 * $5
12< * (x =

3dia )eral )
5
*
<Q* - "/ : mdia )eral $
;
- "F,F$
;
6 "F,F$
;
6 "F,F$
;
6"J,F$
;
6"K,F$
;
6"G,F$
;
6 ... 6"H,F$
;
6 "I,
F$
;
- G;
(esse valor representa a soma de %5 valores de desvios elevados ao 6uadrados)
Efetue o teste de 0ormalidade dos res#duos eQou avaliao )r!fica.
2bservao.
<uposio do modelo &02%&3
"i$ todas as populaes tm o mesmo desvio padro = , de valor descon1ecido4
"ii$ os res#duos devem se)uir uma curva normal com mdia i)ual a zero e varincia =
;
.
G
#es$%ual
&
e
r
'
e

t
2 1 0 -1 -2
99
90
50
10
1
N 25
AD 1.493
P-Value <0.005
($tte% Value
#
e
s
$
%
u
a
l
8 7 6 5 4
2
1
0
-1
#es$%ual
(
r
e
)
u
e

'
*
2+0 0+5 -1+0
16
12
8
4
0
,or-al &ro.a.$l$t* &lot #es$%uals Versus t/e ($tte% Values
0$sto1ra- of t/e #es$%uals
#es$%ual &lots for A2 B2 C2 D2 E
0esse nosso caso, estamos diante de um mau e/emplo, porque os res#duos no se)uem
uma distribuio 0ormal com mdia i)ual a zero.
2 que fazer, entoR
?ma soluo seria submeter os dados a uma transformao lo)ar#tmica. 2utra
possibilidade seria efetuar um teste no paramtrico "anova de SrusMal,Tallis$.
Lara prosse)uirmos em nosso e/emplo did!tico, vamos fazer de conta que os res#duos
se)uem uma distribuio 0ormal, pois o teste > da &02%& um procedimento robusto. E o
que importa a normalidade das mdias amostrais4 assim, a &02%& torna,se mais se)ura
medida que os taman1os das amostras aumentam, devido ao efeito do teorema central do
limite. Quando no 1ouver valores at#picos " esse o nosso caso$ e as distribuies forem
apro/imadamente simtricas, podemos usar a &02%& com se)urana para taman1os de
amostras bem pequenos, como H ou I.
& &02%& considera que a variabilidade das observaes, medida pelo desvio padro,
se+a a mesma em todas as populaes. 0o f!cil verificar a suposio de as populaes
terem desvios,padro i)uais. *estes estat#sticos de i)ualdade dos desvios,padro so to
J
sens#veis ausncia de normalidade que, na pr!tica, tm pouco valor. & soluo contar com
a robustez da &02%&.
Qual a )ravidade de os desvios,padro serem desi)uaisR & &02%& no muito
sens#vel a violaes da suposio, particularmente quando todas as amostras tm taman1os
i)uais ou semel1antes e nen1uma das amostras muito pequena. &o plane+ar um estudo, tente
tomar amostras do mesmo taman1o de todos os )rupos que pretende comparar. 2s desvios,
padro amostrais estimam os desvios,padro da populao, lo)o, certifique,se antes de fazer a
&02%& de que os desvios,padro amostrais so semel1antes entre si. Espera,se que 1a+a certa
variao entre eles devido ao acaso. & se)uir apresentamos uma re)ra pr!tica que se)ura em
quase todas as situaes3
%erificao dos .esvios,Ladro na &02%&3
2s resultados do teste > da &02%& so apro/imadamente corretos quando o maior desvio,
padro amostral n"o for mais do 6ue duas ve7es do que o menor desvio,padro amostral.
U
?m desvio,padro )rande muitas vezes ocorre devido a valores at#picos ou assimetria.
(ontinuemos com a resoluo de nosso e/emplo...
F>r0las ANOVA 1 fator
%arincia - <QQ n
QV - quadrado mdio - varincia - <QQ)l
Entre )r0!os:
<Q entreQ )l entre - <Q entre )ruposQ ),8
0o nosso e/emplo )-I e <Q e) - IN lo)o, QV entre )rupos - INQH - 8;,IN
#entre )r0!os (resd0o):
<Q dentroQ )l dentro - <Q dentro res#duoQ 0,)
0o nosso e/emplo )l * N3) * 5&3& * 57 "I )rupos com n-I$
Wo)o3 2? dentro resd0o * 55/57 * 1@1
K
& nossa 1iptese "Bo$ 3 @sendo as mdias nas populaes das quais procedem as
amostras i)uaisA, qual a probabilidade de obtermos valores X >calculado to e/tremosR
>
calculado
- QV
entre
Q QV
dentro
- 8;,I Q 8,8 - 88,DF
2 p2valor quantifica a discrepncia entre os dados e Bo3 se a probabilidade de >
to discrepante ou mais que Bo.
& nossa 1iptese em investi)ao "ou em estudo$ se as mdias diferem
estatisticamente. ?sualmente e/pressa a 1iptese estat#stica de nulidade "ou i)ualdade$
assim3 Bo3 5& - 5' - 5( - 5. - 5E.
& ri)or, Bo, no um teste para verificar a probabilidade de i)ualdade das mdias,
mas sim para verificar a probabilidade de ocorrncia da estat#stica > tendo como condio
verdadeira o fato de que essas amostras procedem de populaes que apresentam o mesmo
valor mdio "no nosso e/emplo, 5 - F$. "Bo3 1iptese onde quaisquer diferenas encontradas
so devido ao acaso$.
Em nosso e/emplo, a 1iptese em investi)ao no coincide com a 1iptese
estat#stica de nulidade "Bo$. &ssim, se re+eitarmos Bo, ento se pode inferir @com cautelaA que
1! uma diferena sistem!tica atuando, o que e/plica a diferena entre os valores amostrais
mel1or do que a ao do acaso.
2s resultados obtidos so apresentados de forma resumida na tabela ;3
*abela ;. &02%& "8 fator$ para os dados da *abela 8.
>onte de variao "ou efeito$ )l <Q QV Pazo
>
p,valor
Entre )rupos H IN 8;,I 88,DF N,NNNNFY
.entro "res#duo$ ;N ;; 8,8
*otal ;H G;
YpZ N,NI
8N
Clc0lo do A!3"alorB associado C estatstica AFB.
Lrocedimento no Vinitab.
0uma tabela @>A encontrada nos livros de estat#stica, obtemos > )l "H3;N$ - ;,JG para
I[. & estat#stica > : razo de varincia foi calculada. Ela ocorre muito ou pouco num
mecanismo de pura c1ance "diferenas amostrais devido ao acaso$R
Se uma observao rara (improvvel) sob determinada hiptese (Ho), ento
evidncia contra essa hiptese
0o Vinitab "comando (*P 6 W$ temos de di)itar o comando (.> "cumulative
distri'ution function$ e, a se)uir, o valor da estat#stica > calculada para indicar que estamos
considerando a distribuio > e, no por e/emplo a 0ormal. 0uma outra lin1a, os n\meros de
)raus de liberdade das varincias entre os )rupos "numerador$ e dentro dos )rupos
"denominador$. & constante M8 representa a probabilidade de , at > "- ;.JG$ e o p,valor a
parte da curva que falta para 8NN[ de probabilidade "!rea total da curva$4 por esse motivo,
para se obter o p,valor, !rea do que falta, temos de subtrair do total. 2 pro)rama Vinitab vai
armazenar esse resultado como constante M;
<e quisermos testar esses comandos "como )arantia$3
Edit]] (ommand Wine Editor3
cdf ;.JG M8D
> H ;N.
let M; - 8 : M8
print M;
" ^$ <ubmit (ommands3
nesse caso temos p,valor - M; - N.NI confirmando como verdadeira a *abela >.
____________________________________
88
Crva !
"# $%mera&'r( ) 4
"# $&e%'mi%a&'r( ) 20
0*0
0*1
0*2
0*3
0*4
0*5
0*6
0*7
0 1 2 3 4
CD!
5+
2*87
F calc0lado (* 11.E') aior F0e F (* 5.%$) ta+elado a &G@ ent-o@ reHeita3se Io
Jara se o+ter o A!3"alorB associado C estatstica F
)l((D57)
* 11.E'
Edit]] (ommand Wine Editor3
cdf 88.DF M8D
> H ;N.
let M; - 8 : M8
print M;
& resposta ser! M; - p,valor -8,p "-M8$ - N,NNNNF - Z I[, lo)o re+eita,se Bo.
(oncluso. B! evidncia amostral de que as cinco mdias diferem do
ponto de vista estat#stico.
8;

Você também pode gostar