Você está na página 1de 10

C aptulo 7

Ana lise de Varia ncia


7. 1

Introduc a o

A Ana lise de Varia ncia ( ANOVA) e um procedimento utilizado para comparar tre s
ou mais tratamentos. Existem muitas variac o es da ANOVA devido aos diferentes tipos
de experimentos que podem ser realizados. Nesse curso sera estudado apenas a ana lise de
varia ncia com um fator.
Inicialmente, sa o apresentados alguns conceitos utilizados em planejamento de experimentos e na ana lise de varia ncia.

7. 2
7. 2 . 1

C onceitos Ba sicos sobre Exp erimentac a o


Tratamento

Um tratame nto e uma condic a o imposta ou ob jeto que se deseja medir ou avaliar em
um experimento. Normalmente, em um experimento, e utilizado mais de um tratamento.
C omo exemplos de tratamentos, podem-se citar: equipamentos de diferentes marcas, diferentes tamanhos de pec as, doses de um nutriente em um meio de cultura, quantidade de
lubricante em uma ma quina, temperatura de armazenamento de um alimento.
O s tratamentos que podem ser dispostos em uma ordem, como por exemplo, doses
de nutrientes, quantidade de lubricante, nveis de temperatura, sa o ditos tratamentos
quantitativo s. Ja os tratamentos que na o podem ser dispostos numa ordem, sa o ditos
tratamentos qualitativo s, por exemplo, variedades de plantas, me todos de preparac a o de
alimento, marcas de equipamentos e outros.
C ada tipo de tratamento tambe m pode ser chamado de um fator. Nesse texto, sera o
estudados somente experimentos com um fator de interesse.
O tipo de tratamento tem importa ncia na forma como os dados sera o analisados.
Q uando os tratamentos sa o quantitativos, pode-se usar, por exemplo, te cnicas de ana lise
de regressa o.
1 09

110

Ana lise de Varia ncia

Anjos, A. dos

O s tratamentos sa o chamados de varia ve is inde pe nde nte s. Q uando, em um experimento, estamos interessados em estudar apenas um tipo de varia vel independente, dizemos
que possumos apenas um fator. Em um experimento, um fator pode ter va rias categoriais
que sa o chamadas de nve is.
Exemplo: Um laborato rio deseja estudar o efeito da composic a o de pec as de metal
sobre a dilatac a o.
Neste exemplo, a composic a o das pec as e o fator ( varia vel independente) . O s diferentes tipos de composic a o sa o os nveis do fator. A dilatac a o das pec as, medida em
milmetros, por exemplo, e a varia vel resposta ( varia vel dependente) .
Em um experimento, podem existir mais de um fator e mais de uma varia vel resposta.
Toda e qualquer varia vel que possa interferir na varia vel resposta ou dependente
deve ser mantida constante. Q uando isso na o e possvel, existem te cnicas ( estrate gias)
que podem ser utilizadas para reduzir ou eliminar essa interfere ncia.

7. 2 . 2

Unidade exp erimental ou parcela

a
Unidade e xpe rime ntal o u parce la e onde e feita a aplicac a o do tratamento. E
unidade experimental que fornece os dados para serem avaliados. C omo exemplos de
unidades experimentais ou parcelas pode-se citar: um motor, uma pec a do motor, uma
placa de Petri com meio de cultura, uma porc a o de algum alimento.
As unidades experimentais podem ser formadas por grupos ou indivduos. Por exemplo, quando trabalha-se com cobaias, pode-se ter apenas uma cobaia como unidade experimental, ou seja, apenas um animal fornecera a resposta do tratamento, ou ainda, pode-se
ter um grupo de cobaias em uma gaiola fornecendo as informac o es. O uso de grupos
ou indivduos como unidades experimentais depende do feno meno que se esta estudando,
da forma como o experimento e conduzido e dos recursos disponveis. De modo geral, a
escolha da unidade experimental deve ser feita de forma a minimizar o erro experimental.

7. 2 . 3

Rep etic a o

Re pe tic a o e o nu mero de vezes que um tratamento aparece no experimento.


O nu mero de repetic o es, em um experimento, vai depender tambe m dos recursos
disponveis, do tipo de experimento ( delineamento) e, tambe m, da variabilidade do experimento ou da varia vel resposta. Existem va rias metodologias para estimar o nu mero
satisfato rio de repetic o es em um experimento. Mas, em func a o das possveis limitac o es
acima, a denic a o do nu mero de repetic o es, muitas vezes, torna-se uma tarefa difcil. A
experie ncia do pesquisador sobre o feno meno em estudo deve ser levada em considerac a o. Ale m disso, as metodologias empregadas, para esse ca lculo, pressupo em que uma
estimativa do erro experimental e conhecida. Nem sempre essa informac a o esta disponvel

7. 2. Conceitos Ba sicos sob re Experimentac a o

111

antes da realizac a o de um experimento e, como cada experimento e uma nova histo ria, em
func a o de caractersticas intrnsecas de cada feno meno, esse ca lculo pode ser em va o.

7. 2 . 4

Varia vel resp osta ou varia vel dep endente

Uma varia vel e qualquer caracterstica que apresenta variac a o, por exemplo, a altura
de pessoas, o peso de animais, o comprimento de uma pec a, o nu mero de microrganismos
em um litro de leite etc.
Q uando o valor de uma varia vel na o pode ser determinado antes da realizac a o de
um experimento, tem-se enta o uma varia ve l aleato ria.
As varia veis que assumem valores enumera veis, sa o denominadas varia veis aleato rias
discre tas. Por exemplo, o nu mero de sementes germinadas, o nu mero de microrganismos
em um litro de leite.
As varia veis que assumem valores em um intervalo, sa o denominadas varia veis aleato rias co ntnuas. Por exemplo, o peso de animais, o teor de umidade em um alimento, o
conteu do de o leo em uma semente.
Em um experimento, podem ser medidas muitas varia veis, mas deve-se considerar
somente aquelas que possam contribuir para a explicac a o da hipo tese formulada.
o pesquisador, em geral, quem sabe quais sera o as varia veis que sera o medidas
E
em um experimento. Ele deve ser alertado, sempre, sobre as condic o es para a realizac a o
de tais medic o es, no sentido de evitar gastar recursos com varia veis que na o fornecera o as
informac o es para se testar a( s) hipo tese( s) . Q uando o volume de dados de um experimento
torna-se grande, aumentam os riscos de erros grosseiros, como de registro, de inversa o de
varia veis etc.

7. 2 . 5

D elineamento exp erimental ( D esign)

C om a nalidade de reduzir o e rro e xpe rime ntal, existem os chamados de lineame nto s
e xpe rime ntais. Um delineamento experimental e a forma como os tratamentos ou nveis
de um fator sa o designados `a s unidades experimentais ou parcelas. A ana lise de varia ncia
( que sera vista mais adiante) e baseada no delineamento experimental utilizado.
Por isso, saber como o experimento foi instalado e conduzido, e de fundamental
importa ncia. Pequenas modicac o es podem acarretar em grandes mudanc as na forma da
ana lise estatstica. Na o raro, acontecem situac o es em que as hipo teses formuladas, a prio ri,
na o podem ser testadas, ou ainda, e impossvel de se realizar uma ana lise estatstica. Por
isso, deve-se dar muita importa ncia ao planejamento experimental.
Um delineamento experimental e planejado de tal forma que a variac a o ao acaso
seja reduzida o ma ximo possvel. Alguns dos principais delineamentos experimentais sa o:
delineamento completamente casualizado ( DC C ) , delineamento em blocos casualizados
( DBC ) e quadrado latino.

112

Ana lise de Varia ncia

7. 2 . 6

Anjos, A. dos

Modelo e ana lise de varia ncia

Em um experimento, cada observac a o Yij pode ser decomposta conforme o modelo


a seguir:
Yij = + i + ij

i = 1, . . . , I e j = 1, . . . , J

( 7. 1 )

em que:
Yij e a observac a o do i-e simo tratamento na j-e sima unidade experimental ou parcela;
e o efeito constante ( me dia geral) ;
i e o efeito do i-e simo tratamento;
ij e o erro associado ao i-e simo tratamento na j-e sima unidade experimental ou parcela
IID
assumido como: ij N( 0, 2 ) . Aqui, IID signica que os erros devem ser independentes
e identicamente distribudos.
Em um experimento, existe o interesse em testar se ha diferenc as entre as me dias
dos tratamentos, o que equivale a testar as hipo teses:

H0
H1

:
:

1
i

=
=

2
i

= = I
para pelo menos um par ( i, i ) ,

com i = i

em que:
i = + i

i = 1 , 2 , . . . , I.

De forma equivalente, podemos escrever tais hipo teses da seguinte forma:


H0
H1

:
:

1
i

=
=

2
0

= = I = 0
para pelo menos um i .

Note que, se a hipo tese nula for verdadeira, todos os tratamentos tera o uma me dia
comum .
A ana lise de varia ncia, baseia-se na decomposic a o da variac a o total da varia vel
resposta em partes que podem ser atribudas aos tratamentos ( varia ncia entre) e ao erro
experimental ( varia ncia dentro) . Essa variac a o pode ser medida por meio das somas de
quadrados denidas para cada um dos seguintes componentes:
I
J

S Q Total =

i= 1 j= 1
I
P

S Q Trat =

i=1

I P
J
P

(
2
yij

C, em que C =

i= 1 j= 1

IJ

yi j ) 2

y i2.

C,

e a soma de quadrados dos resduos pode ser obtida por diferenc a:


S Q Res = S Q Total S Q Trat.
A S Q Trat tambe m e chamada de variac a o Entre, que e a variac a o existente entre
os diferentes tratamentos e a S Q Res e chamada de variac a o Dentro uqe e func a o das
diferenc as existentes entre as repetic o es de um mesmo tratamento.

113

7. 3. Ana lise de Varia ncia

Essas somas de quadrados podem ser organizadas em uma tabela, denominada tabela
da ana lise de varia ncia, como apresentado na Tabela 7. 1 .
Para testar a hipo tese H0 , utiliza-se o teste F apresentado na tabela da Ana lise
de Varia ncia ( Tabela 7. 1 ) . C onve m lembrar que esse teste e va lido se os pressupostos
assumidos para os erros do modelo estiverem satisfeitos.
Tabela 7. 1 : Tabela da ana lise de varia ncia.
C ausas de
Variac a o
Tratamentos
Resduo
Total

G raus de
Liberdade
I-1
I( J-1 )
IJ-1

S oma de
Q uadrados
S Q Trat
S Q Res
S Q Total

Q uadrados
Me dios
Q MTrat
Q MRes

F calculado
Q MTrat/ Q MRes

em que Q MTrat= S Q Trat/ ( I-1 ) e Q MRes= S Q Res/ ( I( J-1 ) ) .


Pode-se mostrar que o quociente Q MTrat/ Q MRes tem distribuic a o F com ( I 1 )
e I( J 1 ) graus de liberdade, supondo que, yij sa o varia veis aleato rias independentes,
todos os tratamentos te m varia ncias iguais a 2 e Yij N( i , 2 ) . Por esses motivos, os
pressupostos da ANOVA devem ser testados ou avaliados em qualquer ana lise
S e Fcalculado> Ftabelado, rejeitamos a hipo tese de nulidade H0 , ou seja, existem
evide ncias de diferenc a signicativa entre pelo menos um par de me dias de tratamentos, ao
nvel de signica ncia escolhido. C aso contra rio, na o se rejeitamos a hipo tese de nulidade
H0 , ou seja, na o ha evide ncias de diferenc a signicativa entre tratamentos, ao nvel de
signica ncia escolhido.
O utra maneira de avaliar a signica ncia da estatstica F e utilizando o p-valor. S e
o p-valor< , rejeitamos a hipo tese de nulidade H0 . C aso contra rio, na o se rejeitamos a
hipo tese de nulidade H0 , ou seja, na o ha evide ncias de diferenc as signicativas entre os
tratamentos, ao nvel de signica ncia escolhido.

7. 2 . 7

D elineamento exp erimental

Q uando as unidades experimentais sa o homoge neas, ou seja, as parcelas sa o uniformes, os tratamentos podem ser sorteados nas unidades experimentais sem qualquer
restric a o. Nessa situac a o, o delineamento experimental e chamado de delineamento completamente casualizado ( DC C ) . Neste caso, todos os tratamentos te m a mesma chance de
serem aplicados em qualquer unidade experimental ou parcela. Nesse texto, abordaremos
apenas esse tipo de delineamento que e o caso mais simples da ANOVA.

7. 3

Ana lise de Varia ncia

Exemplo 7. 1 . C onsidere o seguinte experimento que foi conduzido, considerando um delineamento inteiramente casualizado. Foram comparados 4 tratamentos ( tipos de cultivo:

114

Ana lise de Varia ncia

Anjos, A. dos

Agar
( A) , C a ssia ( C ) , G uar ( G ) , Leucena ( L) ) . Mediu-se o crescimento, em gramas, de
explantes de morango ( Tabela 7. 2 ) .
Tabela 7. 2 : C rescimento de explantes de morangos em gramas.
Trat.
A
G
L
C
Total

I
0. 1 95 8
0. 362 7
0. 1 62 1
0. 2 841

II
0. 1 301
0. 4841
0. 1 1 5 0
0. 3099

III
0. 1 806
0. 41 1 9
0. 2 01 1
0. 2 92 2

Repetic o es
IV
V
0. 1 5 45
0. 1 2 5 2
0. 445 7
0. 475 5
0. 2 1 2 3
0. 1 475
0. 1 5 05
0. 2 345

Total
VI
0. 1 882
0. 5 1 74
0. 1 92 2
0. 1 65 2

VI I
0. 2 2 1 1
0. 41 73
0. 1 802
0. 1 379

VI I I
0. 1 734
0. 4001
0. 2 2 48
0. 1 960

1 , 3689
1 , 7703
3, 5 1 47
1 , 435 2
8, 0891

Para este experimento, consideramos o modelo:


yij = + i + ij

em que

IID

ij N( 0, 2 )

i = 1 , 2 , . . . , 4 tratamentos;
j = 1 , 2 , . . . , 8 repetic o es;
yij e o peso em gramas correspondente ao i-e simo tratamento na j-e sima unidade experimental;
i e o efeito do i-e simo tratamento;
ij e o erro experimental associado ao i-e simo tratamento e a j-e sima repetic a o.
As hipo teses testadas neste experimento sa o:
H0 :

1 = 2 = 3 = 4

H1 :

i = i

com i = i .

para pelo menos um par,

C a lculos para a Ana lise de Varia ncia


Tem-se que:
I
J

I
J

i= 1 j= 1

i= 1 j= 1

yij = 0, 1 95 8 + 0, 1 301 + . . . + 0. 1 960 = 8, 0891 .


2 = 0, 1 95 8 2 + 0, 1 301 2 + . . . + 0. 1 960 2 = 2 , 495 2 .
yij

G raus de liberdade de tratamentos= I 1 = 4 1 = 3.


G raus de liberdade do resduo= I( J 1 ) = 4( 8 1 ) = 2 8.
G raus de liberdade total= IJ 1 = 4 8 1 = 31 .
As somas de quadrados sa o obtidas da seguinte forma:
I
J

1 . S Q Total=

i= 1 j= 1

I P
J
P

(
2
yij

i= 1 j= 1

IJ

yi j ) 2

= 2 , 495 2

( 8, 0891 ) 2
32

= 0, 45 04

115

7. 4. Teste de Tu key para Comparac a o de Me dias


I P
J
P

i= 1 j= 1

yi j ) 2

O bs: A expressa o
IJ
da soma de quadrados.
I
P

2 . S Q Trat=

i= 1

I P
J
P

y i2.

i= 1 j= 1

IJ

e referenciada em alguns textos como fator de correc a o

yi j ) 2

1 , 3689 2 + 1 , 7703 2 + 3, 5 1 47 2 + 1 , 435 2 2


8

( 8, 0891 ) 2
32

= 0, 382 8.

3. A S oma de Q uadrados dos resduos e obtida por diferenc a:


S Q Res= S Q Total-S Q Trat= 0, 45 04 0, 382 8 = 0, 0676.
O s quadrados me dios sa o obtidos pela divisa o da soma de quadrados, pelos seus respectivos
graus de Liberdade. Assim,
Q MTrat= S Q Trat/ ( I-1 ) = 0, 382 8/ 3= 0, 1 2 76 e
Q MRes= S Q Res/ I( J-1 ) = 0, 0676/ 2 8= 0, 002 41 4.
O teste F e o quociente entre o Q MTrat e o Q MRes. Logo,
Fcalculado= Q MTrat/ Q MRes= 0, 1 2 76/ 0, 002 41 4= 5 2 , 85 83.
O Fcalculado e comparado com o Ftabelado, com 3 e 2 8 graus de liberdade, na tabela de
F ( Tabela ) :
Ftabelado a 1 % = 2 , 95
Ftabelado a 5 % = 4, 5 7.
Efetuados os ca lculos, podemos resumi-los na tabela da ana lise de varia ncia apresentada a seguir:
Tabela 7. 3: Ana lise de varia ncia do exemplo 7. 1 .
C ausas de
GL
S oma de
Q uadrados F calculado
Variac a o
Q uadrados
Me dios

Tratamentos
Resduo

4-1 = 3
4( 8-1 ) = 2 8

0, 382 8
0, 0676

Total

4 8-1 = 31

0, 45 04

0, 1 2 76
0, 002 41 4

5 2 , 85 83

S ignicativo ao nvel de 1 % de probabilidade

C onclusa o da ana lise de varia ncia: De acordo com o teste F, foram encontradas
evide ncias de diferenc as signicativas, ao nvel de 1 % de probabilidade, entre os tratamentos, com relac a o ao crescimento. Rejeitamos, portanto, a hipo tese de nulidade H0 . Deve
existir, pelo menos um contraste signicativo entre as me dias de tratamentos, com relac a o
ao crescimento me dio.
O procedimento seguinte, quando de interesse do pesquisador, e o de comparar as
me dias de tratamentos utilizando algum teste de comparac a o de me dias ou contrastes para
identicar qual ou quais tratamentos e ou sa o diferente( s) .

7. 4

Teste de Tukey para C omparac a o de Me dias

116

Ana lise de Varia ncia

Anjos, A. dos

Apo s concluirmos que existe diferenc a signicativa entre tratamentos, por meio do
teste F, podemos estar interessados em avaliar a magnitude destas diferenc as utilizando
um teste de comparac o es mu ltiplas.
O teste de Tukey permite testar qualquer contraste, sempre, entre duas me dias de
tratamentos, ou seja, na o permite comparar grupos entre si.
O teste baseia-se na Diferenc a Mnima S ignicativa ( DMS ) . A estatstica do teste
e dada da seguinte forma:

=q

QMRes
,
r

( 7. 2 )

em que, q e a amplitude total studentizada, tabelada ( tabela 5 ) , Q MRes e o quadrado


me dio do resduo, e r e o nu mero de repetic o es. O valor de q depende do nu mero de
tratamentos e do nu mero de graus de liberdade do resduo. Tambe m, em um teste de
comparac o es de me dias, deve-se determinar um nvel de signica ncia para o teste. Normalmente, utiliza-se o nvel de 5 % ou 1 % de signica ncia.
C omo o teste de Tukey e , de certa forma, independente do teste F, e possvel que,
mesmo sendo signicativo o valor de Fcalculado, na o se encontrem diferenc as signicativas
entre contrastes de me dias.

Aplicando o teste de Tukey `a s me dias dos tratamentos do exemplo 7. 1 , temos:


( 5 % ) = 3, 85

0, 002 42
= 0, 06696.
8

sendo
q= 3, 85 e = 0, 05
S e o contraste for maior do que , enta o as me dias diferem ao nvel de signica ncia.
Utilizar-se-a o me todo de letras para exemplicar o uso do teste, mas existem outras
maneiras de representac a o como, por exemplo, o uso de tabelas ou barras.
Inicialmente, ordenamos as me dias de forma crescente ou decrescente, para facilitar
as comparac o es. C olocamos uma letra do alfabeto na primeira me dia ( normalmente a
letra a ) e, em seguida, comparamos a diferenc a com as me dias seguintes. S e a diferenc a
for superior ao valor de ( 5 % ) = 0, 06696, a diferenc a entre duas me dias sera considerada signicativa. A diferenc a entre duas me dias e representada pela presenc a de letras
diferentes. O resultado nal e o seguinte:
G
C
L
A

0, 4393
0, 2 2 1 3
0, 1 794
0, 1 71 1

a
b
b
b

Temos que, me dias de crescimento, seguidas de letras iguais, na o diferem signicativamente entre si, pelo teste de Tukey ao nvel de 5 % de probabilidade.

117

7. 5. Teste de Kru skal-Wallis

7. 5

Teste de Kruskal-Wallis

A ana lise de varia ncia exige que os erros ij tenham distribuic a o Normal e deve haver
homocedasticidade entre os tratamentos ( varia ncias homoge neas) . Estes pressupostos nem
sempre sa o satisfeitos em um experimento ou conjunto de dados.
C omo uma alternativa para a ana lise de varia ncia parame trica para um delineamento
completamente casualizado, k 3 tratamentos, existe o teste de Kruskal-Wallis. Este teste
pode ser utilizado para testar a hipo tese H0 : 1 = 2 = = k . No lugar das medidas,
utiliza-se os postos e na o ha suposic o es com relac a o a Normalidade e Homocedasticidade.
Uma exige ncia do teste de Kruskal-Wallis e que a varia vel em estudo seja contnua.
O utra e que as observac o es devem ser independentes. A ana lise consiste em obter o posto
de cada uma das observac o es. Adota-se que o menor valor recebe ( ranking ou posto) 1 ,
o segundo 2 e assim por diante, ate que todas as observac o es tenham sido consideradas.
Q uando ocorrerem empates, atribui-se o valor me dio entre as observac o es, ou seja, atribuise a me dia das ordens que seriam atribudas a elas se na o ocorresse o empate. S e, por
exemplo, as duas menores observac o es forem iguais ha um empate. Neste caso, cada uma
recebe o posto 1 , 5 que e a me dia dos valores 1 e 2 .
k

12
( Rj) 2
3( N + 1 )
N( N + 1 )
nj

Para testar a hipo tese nula, utilizamos a estatstica de teste:

H=

j= 1

em que:
N = nu mero total de observac o es;
k = nu mero de tratamentos;
n j = nu mero de observac o es no j-e simo tratamento;
R j = soma dos postos do j-e simo tratamento.
Rejeitamos H0 se H 2 com k 1 graus de liberdade ao nvel de signica ncia.
S e ocorrerem empates, a estatstica de teste H deve ser corrigida com a seguinte
expressa o:

C=1

( t 3i t i )
,
N3 N

em que t i e o nu mero de observac o es empatadas no i-e simo grupo.


Assim, temos a estatstica corrigida:
H1 =

H
C

Para testar H0 , procedemos exatamente como se na o houvesse empates.


Exemplo 7. 2 . Em um experimento para avaliar o consumo de energia ele trica em KWh
de tre s motores durante um hora de funcionamento, obteve-se os seguintes resultados:
Aplicando-se o teste de Kruskal-Wallis, temos que:

118

Ana lise de Varia ncia

Anjos, A. dos

Tabela 7. 4: C onsumo de energia ele trica de tre s motores durante uma hora.
Motor 1
Motor 2
Motor 3
2 2 1 2 ( 1 3)
2 02 5 ( 9)
1 989 ( 8)
2 2 32 ( 1 4)
2 02 7 ( 1 0)

2 1 95 ( 1 2 )
2 031 ( 1 1 )
1 876 ( 7)
1 75 0 ( 2 )
1 060 ( 1 )

1 770
1 800
1 85 2
1 769

R1 = 5 4

R 1 = 33

R1 = 1 8

H=

12
1 4( 1 5 )

( 4)
( 5)
( 6)
( 3)

5 42
33 2
1 82
+
+
3( 1 5 ) = 5, 4
5
5
4

O valor 2 , com k 1 = 3 1 = 2 graus de liberdade e um nvel de signica ncia de


5 % e 5 , 99. portanto, na o rejeitamos H0 , ou seja, na o ha evide ncias de que que os motores
possuem um consumo diferente de energia ele trica.

Você também pode gostar