Você está na página 1de 10

C aptulo 7

An lise de Vari ncia a a


7. 1 Introdu o ca

A Ana lise de Vari ncia ( ANOVA) e um procedimento utilizado para comparar tr s a e ou mais tratamentos. Existem muitas varia es da ANOVA devido aos diferentes tipos co de experimentos que podem ser realizados. Nesse curso sera estudado apenas a ana lise de vari ncia com um fator. a Inicialmente, s o apresentados alguns conceitos utilizados em planejamento de exa perimentos e na ana lise de vari ncia. a

7. 2
7. 2 . 1

C onceitos B sicos sobre Exp erimenta o a ca


Tratamento

Um tratame nto e uma condi o imposta ou ob jeto que se deseja medir ou avaliar em ca um experimento. Normalmente, em um experimento, e utilizado mais de um tratamento. C omo exemplos de tratamentos, podem-se citar: equipamentos de diferentes marcas, diferentes tamanhos de pe as, doses de um nutriente em um meio de cultura, quantidade de c lubricante em uma ma quina, temperatura de armazenamento de um alimento. O s tratamentos que podem ser dispostos em uma ordem, como por exemplo, doses de nutrientes, quantidade de lubricante, nveis de temperatura, s o ditos tratamentos a quantitativo s. Ja os tratamentos que n o podem ser dispostos numa ordem, s o ditos a a tratamentos qualitativo s, por exemplo, variedades de plantas, me todos de prepara o de ca alimento, marcas de equipamentos e outros. C ada tipo de tratamento tambe m pode ser chamado de um fator. Nesse texto, ser o a estudados somente experimentos com um fator de interesse. O tipo de tratamento tem import ncia na forma como os dados ser o analisados. a a Q uando os tratamentos s o quantitativos, pode-se usar, por exemplo, te cnicas de ana lise a de regress o. a 1 09

110

An lise de Vari ncia a a

Anjos, A. dos

O s tratamentos s o chamados de vari ve is inde pe nde nte s. Q uando, em um experia a mento, estamos interessados em estudar apenas um tipo de varia vel independente, dizemos que possumos apenas um fator. Em um experimento, um fator pode ter va rias categoriais que s o chamadas de nve is. a Exemplo: Um laborato rio deseja estudar o efeito da composi o de pe as de metal ca c sobre a dilata o. ca Neste exemplo, a composi o das pe as e o fator ( varia vel independente) . O s dica c ferentes tipos de composi a o s o os nveis do fator. A dilata o das pe as, medida em c a ca c milmetros, por exemplo, e a varia vel resposta ( varia vel dependente) . Em um experimento, podem existir mais de um fator e mais de uma varia vel resposta. Toda e qualquer varia vel que possa interferir na varia vel resposta ou dependente deve ser mantida constante. Q uando isso n o e possvel, existem te cnicas ( estrate gias) a que podem ser utilizadas para reduzir ou eliminar essa interfer ncia. e

7. 2 . 2

Unidade exp erimental ou parcela

Unidade e xpe rime ntal o u parce la e onde e feita a aplica o do tratamento. E a ca unidade experimental que fornece os dados para serem avaliados. C omo exemplos de unidades experimentais ou parcelas pode-se citar: um motor, uma pe a do motor, uma c placa de Petri com meio de cultura, uma por o de algum alimento. ca As unidades experimentais podem ser formadas por grupos ou indivduos. Por exemplo, quando trabalha-se com cobaias, pode-se ter apenas uma cobaia como unidade experimental, ou seja, apenas um animal fornecera a resposta do tratamento, ou ainda, pode-se ter um grupo de cobaias em uma gaiola fornecendo as informa es. O uso de grupos co ou indivduos como unidades experimentais depende do fen meno que se esta estudando, o da forma como o experimento e conduzido e dos recursos disponveis. De modo geral, a escolha da unidade experimental deve ser feita de forma a minimizar o erro experimental.

7. 2 . 3

Rep eti o ca

Re pe ti o e o n mero de vezes que um tratamento aparece no experimento. ca u O n mero de repeti es, em um experimento, vai depender tambe m dos recursos u co disponveis, do tipo de experimento ( delineamento) e, tambe m, da variabilidade do experimento ou da varia vel resposta. Existem va rias metodologias para estimar o n mero u satisfato rio de repeti o es em um experimento. Mas, em fun o das possveis limita o es c ca c acima, a deni o do n mero de repeti es, muitas vezes, torna-se uma tarefa difcil. A ca u co experi ncia do pesquisador sobre o fen meno em estudo deve ser levada em considerae o a o. Ale m disso, as metodologias empregadas, para esse ca lculo, pressup em que uma c o estimativa do erro experimental e conhecida. Nem sempre essa informa o esta disponvel ca

7. 2. Conceitos B sicos sob re Experimenta a o a c

111

antes da realiza a o de um experimento e, como cada experimento e uma nova histo ria, em c fun o de caractersticas intrnsecas de cada fen meno, esse ca lculo pode ser em v o. ca o a

7. 2 . 4

Vari vel resp osta ou vari vel dep endente a a

Uma varia vel e qualquer caracterstica que apresenta varia o, por exemplo, a altura ca de pessoas, o peso de animais, o comprimento de uma pe a, o n mero de microrganismos c u em um litro de leite etc. Q uando o valor de uma varia vel n o pode ser determinado antes da realiza o de a ca um experimento, tem-se ent o uma vari ve l aleat ria. a a o As varia veis que assumem valores enumera veis, s o denominadas varia veis aleato rias a discre tas. Por exemplo, o n mero de sementes germinadas, o n mero de microrganismos u u em um litro de leite. As varia veis que assumem valores em um intervalo, s o denominadas varia veis alea ato rias co ntnuas. Por exemplo, o peso de animais, o teor de umidade em um alimento, o conte do de o leo em uma semente. u Em um experimento, podem ser medidas muitas varia veis, mas deve-se considerar somente aquelas que possam contribuir para a explica o da hipo tese formulada. ca o pesquisador, em geral, quem sabe quais ser o as varia veis que ser o medidas E a a em um experimento. Ele deve ser alertado, sempre, sobre as condi es para a realiza o co ca de tais medi es, no sentido de evitar gastar recursos com varia veis que n o fornecer o as co a a informa es para se testar a( s) hipo tese( s) . Q uando o volume de dados de um experimento co torna-se grande, aumentam os riscos de erros grosseiros, como de registro, de invers o de a varia veis etc.

7. 2 . 5

D elineamento exp erimental ( D esign)

C om a nalidade de reduzir o e rro e xpe rime ntal, existem os chamados de lineame nto s e xpe rime ntais. Um delineamento experimental e a forma como os tratamentos ou nveis de um fator s o designados `a s unidades experimentais ou parcelas. A ana lise de vari ncia a a ( que sera vista mais adiante) e baseada no delineamento experimental utilizado. Por isso, saber como o experimento foi instalado e conduzido, e de fundamental import ncia. Pequenas modica es podem acarretar em grandes mudan as na forma da a co c ana lise estatstica. N o raro, acontecem situa o es em que as hipo teses formuladas, a prio ri, a c n o podem ser testadas, ou ainda, e impossvel de se realizar uma ana lise estatstica. Por a isso, deve-se dar muita import ncia ao planejamento experimental. a Um delineamento experimental e planejado de tal forma que a varia o ao acaso ca seja reduzida o ma ximo possvel. Alguns dos principais delineamentos experimentais s o: a delineamento completamente casualizado ( DC C ) , delineamento em blocos casualizados ( DBC ) e quadrado latino.

112

An lise de Vari ncia a a

Anjos, A. dos

7. 2 . 6

Modelo e an lise de vari ncia a a

Em um experimento, cada observa o Yij pode ser decomposta conforme o modelo ca a seguir: Yij = + i + ij i = 1, . . . , I e j = 1, . . . , J ( 7. 1 )

em que: Yij e a observa o do i-e simo tratamento na j-e sima unidade experimental ou parcela; ca e o efeito constante ( me dia geral) ; i e o efeito do i-e simo tratamento; ij e o erro associado ao i-e simo tratamento na j-e sima unidade experimental ou parcela IID assumido como: ij N( 0, 2 ) . Aqui, IID signica que os erros devem ser independentes e identicamente distribudos. Em um experimento, existe o interesse em testar se ha diferen as entre as me dias c dos tratamentos, o que equivale a testar as hipo teses: H0 H1 em que: i = + i i = 1 , 2 , . . . , I. : : 1 i = = 2 i = = I para pelo menos um par ( i, i ) ,

com i i =

De forma equivalente, podemos escrever tais hipo teses da seguinte forma: H0 H1 : : 1 i = = 2 0 = = I = 0 para pelo menos um i .

Note que, se a hipo tese nula for verdadeira, todos os tratamentos ter o uma me dia a comum . A ana lise de vari ncia, baseia-se na decomposi o da varia o total da varia vel a ca ca resposta em partes que podem ser atribudas aos tratamentos ( vari ncia entre) e ao erro a experimental ( vari ncia dentro) . Essa varia o pode ser medida por meio das somas de a ca quadrados denidas para cada um dos seguintes componentes:
I J
I J P P

( 2 yij

S Q Total =

i= 1 j= 1
I P i=1 2 yi .

C, em que C =

i= 1 j= 1

yi j ) 2

IJ

S Q Trat =

C,

e a soma de quadrados dos resduos pode ser obtida por diferen a: c S Q Res = S Q Total S Q Trat. A S Q Trat tambe m e chamada de varia o Entre, que e a varia o existente entre ca ca os diferentes tratamentos e a S Q Res e chamada de varia o Dentro uqe e fun a o das ca c diferen as existentes entre as repeti es de um mesmo tratamento. c co

7. 3. An lise de Vari ncia a a

113

Essas somas de quadrados podem ser organizadas em uma tabela, denominada tabela da ana lise de vari ncia, como apresentado na Tabela 7. 1 . a Para testar a hipo tese H0 , utiliza-se o teste F apresentado na tabela da Ana lise de Vari ncia ( Tabela 7. 1 ) . C onve m lembrar que esse teste e va lido se os pressupostos a assumidos para os erros do modelo estiverem satisfeitos. Tabela 7. 1 : Tabela da ana lise de vari ncia. a
C ausas de Varia a o c Tratamentos Resduo Total G raus de Liberdade I-1 I( J-1 ) IJ-1 S oma de Q uadrados S Q Trat S Q Res S Q Total Q uadrados Me dios Q MTrat Q MRes F calculado Q MTrat/ Q MRes

em que Q MTrat= S Q Trat/ ( I-1 ) e Q MRes= S Q Res/ ( I( J-1 ) ) . Pode-se mostrar que o quociente Q MTrat/ Q MRes tem distribui o F com ( I 1 ) ca e I( J 1 ) graus de liberdade, supondo que, yij s o varia veis aleato rias independentes, a 2 e Y N( , 2 ) . Por esses motivos, os todos os tratamentos t m vari ncias iguais a e a ij i pressupostos da ANOVA devem ser testados ou avaliados em qualquer ana lise S e Fcalculado> Ftabelado, rejeitamos a hipo tese de nulidade H0 , ou seja, existem evid ncias de diferen a signicativa entre pelo menos um par de me dias de tratamentos, ao e c nvel de signic ncia escolhido. C aso contra rio, n o se rejeitamos a hipo tese de nulidade a a H0 , ou seja, n o ha evid ncias de diferen a signicativa entre tratamentos, ao nvel de a e c signic ncia escolhido. a O utra maneira de avaliar a signic ncia da estatstica F e utilizando o p-valor. S e a o p-valor< , rejeitamos a hipo tese de nulidade H0 . C aso contra rio, n o se rejeitamos a a hipo tese de nulidade H0 , ou seja, n o ha evid ncias de diferen as signicativas entre os a e c tratamentos, ao nvel de signic ncia escolhido. a

7. 2 . 7

D elineamento exp erimental

Q uando as unidades experimentais s o homog neas, ou seja, as parcelas s o unia e a formes, os tratamentos podem ser sorteados nas unidades experimentais sem qualquer restri o. Nessa situa o, o delineamento experimental e chamado de delineamento comca ca pletamente casualizado ( DC C ) . Neste caso, todos os tratamentos t m a mesma chance de e serem aplicados em qualquer unidade experimental ou parcela. Nesse texto, abordaremos apenas esse tipo de delineamento que e o caso mais simples da ANOVA.

7. 3

An lise de Vari ncia a a

Exemplo 7. 1 . C onsidere o seguinte experimento que foi conduzido, considerando um delineamento inteiramente casualizado. Foram comparados 4 tratamentos ( tipos de cultivo:

114

An lise de Vari ncia a a

Anjos, A. dos

Agar ( A) , C a ssia ( C ) , G uar ( G ) , Leucena ( L) ) . Mediu-se o crescimento, em gramas, de explantes de morango ( Tabela 7. 2 ) . Tabela 7. 2 : C rescimento de explantes de morangos em gramas.
Trat. A G L C Total I 0. 1 95 8 0. 362 7 0. 1 62 1 0. 2 841 II 0. 1 301 0. 4841 0. 1 1 5 0 0. 3099 III 0. 1 806 0. 41 1 9 0. 2 01 1 0. 2 92 2 Repeti es co IV V 0. 1 5 45 0. 1 2 5 2 0. 445 7 0. 475 5 0. 2 1 2 3 0. 1 475 0. 1 5 05 0. 2 345 Total VI 0. 1 882 0. 5 1 74 0. 1 92 2 0. 1 65 2 VI I 0. 2 2 1 1 0. 41 73 0. 1 802 0. 1 379 VI I I 0. 1 734 0. 4001 0. 2 2 48 0. 1 960 1 , 3689 1 , 7703 3, 5 1 47 1 , 435 2 8, 0891

Para este experimento, consideramos o modelo: yij = + i + ij em que ij N( 0, 2 )


IID

i = 1 , 2 , . . . , 4 tratamentos; j = 1 , 2 , . . . , 8 repeti es; co yij e o peso em gramas correspondente ao i-e simo tratamento na j-e sima unidade experimental; i e o efeito do i-e simo tratamento; ij e o erro experimental associado ao i-e simo tratamento e a j-e sima repeti a o. c As hipo teses testadas neste experimento s o: a H0 : H1 : 1 = 2 = 3 = 4 i i = para pelo menos um par, com i i . =

C lculos para a An lise de Vari ncia a a a Tem-se que: I J


I J

i= 1 j= 1

yij = 0, 1 95 8 + 0, 1 301 + . . . + 0. 1 960 = 8, 0891 .


2 yij = 0, 1 95 8 2 + 0, 1 301 2 + . . . + 0. 1 960 2 = 2 , 495 2 .

i= 1 j= 1

G raus de liberdade de tratamentos= I 1 = 4 1 = 3. G raus de liberdade do resduo= I( J 1 ) = 4( 8 1 ) = 2 8. G raus de liberdade total= IJ 1 = 4 8 1 = 31 . As somas de quadrados s o obtidas da seguinte forma: a
I J
I J P P

( 2 yij

1 . S Q Total=

i= 1 j= 1

yi j ) 2

i= 1 j= 1

IJ

= 2 , 495 2

( 8, 0891 ) 2 32

= 0, 45 04

7. 4. Teste de Tu key para Compara o de Me dias ca


I J P P

115

O bs: A express o a IJ da soma de quadrados.


I P 2 yi . I J P P

i= 1 j= 1

yi j ) 2

e referenciada em alguns textos como fator de corre o ca

2 . S Q Trat=

i= 1

i= 1 j= 1

yi j ) 2

IJ

1 , 3689 2 + 1 , 7703 2 + 3, 5 1 47 2 + 1 , 435 2 2 8

( 8, 0891 ) 2 32

= 0, 382 8.

3. A S oma de Q uadrados dos resduos e obtida por diferen a: c S Q Res= S Q Total-S Q Trat= 0, 45 04 0, 382 8 = 0, 0676. O s quadrados me dios s o obtidos pela divis o da soma de quadrados, pelos seus respectivos a a graus de Liberdade. Assim, Q MTrat= S Q Trat/ ( I-1 ) = 0, 382 8/ 3= 0, 1 2 76 e Q MRes= S Q Res/ I( J-1 ) = 0, 0676/ 2 8= 0, 002 41 4. O teste F e o quociente entre o Q MTrat e o Q MRes. Logo, Fcalculado= Q MTrat/ Q MRes= 0, 1 2 76/ 0, 002 41 4= 5 2 , 85 83. O Fcalculado e comparado com o Ftabelado, com 3 e 2 8 graus de liberdade, na tabela de F ( Tabela ) : Ftabelado a 1 % = 2 , 95 Ftabelado a 5 % = 4, 5 7. Efetuados os ca lculos, podemos resumi-los na tabela da ana lise de vari ncia aprea sentada a seguir: Tabela 7. 3: Ana lise de vari ncia do exemplo 7. 1 . a C ausas de GL S oma de Q uadrados F calculado Varia a o c Q uadrados Me dios Tratamentos Resduo Total

4-1 = 3 4( 8-1 ) = 2 8 4 8-1 = 31

0, 382 8 0, 0676 0, 45 04

0, 1 2 76 0, 002 41 4

5 2 , 85 83

S ignicativo ao nvel de 1 % de probabilidade

C onclus o da ana lise de vari ncia: De acordo com o teste F, foram encontradas a a evid ncias de diferen as signicativas, ao nvel de 1 % de probabilidade, entre os tratamene c tos, com rela o ao crescimento. Rejeitamos, portanto, a hipo tese de nulidade H0 . Deve ca existir, pelo menos um contraste signicativo entre as me dias de tratamentos, com rela o ca ao crescimento me dio. O procedimento seguinte, quando de interesse do pesquisador, e o de comparar as me dias de tratamentos utilizando algum teste de compara o de me dias ou contrastes para ca identicar qual ou quais tratamentos e ou s o diferente( s) . a

7. 4

Teste de Tukey para C ompara o de Me dias ca

116

An lise de Vari ncia a a

Anjos, A. dos

Apo s concluirmos que existe diferen a signicativa entre tratamentos, por meio do c teste F, podemos estar interessados em avaliar a magnitude destas diferen as utilizando c um teste de compara o es m ltiplas. c u O teste de Tukey permite testar qualquer contraste, sempre, entre duas me dias de tratamentos, ou seja, n o permite comparar grupos entre si. a O teste baseia-se na Diferen a Mnima S ignicativa ( DMS ) . A estatstica do teste c e dada da seguinte forma: =q QMRes , r ( 7. 2 )

em que, q e a amplitude total studentizada, tabelada ( tabela 5 ) , Q MRes e o quadrado me dio do resduo, e r e o n mero de repeti es. O valor de q depende do n mero de u co u tratamentos e do n mero de graus de liberdade do resduo. Tambe m, em um teste de u compara o es de me dias, deve-se determinar um nvel de signic ncia para o teste. Norc a malmente, utiliza-se o nvel de 5 % ou 1 % de signic ncia. a C omo o teste de Tukey e , de certa forma, independente do teste F, e possvel que, mesmo sendo signicativo o valor de Fcalculado, n o se encontrem diferen as signicativas a c entre contrastes de me dias. Aplicando o teste de Tukey `a s me dias dos tratamentos do exemplo 7. 1 , temos: ( 5 % ) = 3, 85 sendo q= 3, 85 e = 0, 05 S e o contraste for maior do que , ent o as me dias diferem ao nvel de signic ncia. a a Utilizar-se-a o me todo de letras para exemplicar o uso do teste, mas existem outras maneiras de representa a o como, por exemplo, o uso de tabelas ou barras. c Inicialmente, ordenamos as me dias de forma crescente ou decrescente, para facilitar as compara es. C olocamos uma letra do alfabeto na primeira me dia ( normalmente a co letra a ) e, em seguida, comparamos a diferen a com as me dias seguintes. S e a diferen a c c for superior ao valor de ( 5 % ) = 0, 06696, a diferen a entre duas me dias sera considec rada signicativa. A diferen a entre duas me dias e representada pela presen a de letras c c diferentes. O resultado nal e o seguinte: G C L A 0, 4393 0, 2 2 1 3 0, 1 794 0, 1 71 1 a b b b 0, 002 42 = 0, 06696. 8

Temos que, me dias de crescimento, seguidas de letras iguais, n o diferem signicaa tivamente entre si, pelo teste de Tukey ao nvel de 5 % de probabilidade.

7. 5. Teste de Kru skal-Wallis

117

7. 5

Teste de Kruskal-Wallis

A ana lise de vari ncia exige que os erros ij tenham distribui a o Normal e deve haver a c homocedasticidade entre os tratamentos ( vari ncias homog neas) . Estes pressupostos nem a e sempre s o satisfeitos em um experimento ou conjunto de dados. a C omo uma alternativa para a ana lise de vari ncia parame trica para um delineamento a completamente casualizado, k 3 tratamentos, existe o teste de Kruskal-Wallis. Este teste pode ser utilizado para testar a hipo tese H0 : 1 = 2 = = k . No lugar das medidas, utiliza-se os postos e n o ha suposi es com rela a o a Normalidade e Homocedasticidade. a co c Uma exig ncia do teste de Kruskal-Wallis e que a varia vel em estudo seja contnua. e O utra e que as observa es devem ser independentes. A ana lise consiste em obter o posto co de cada uma das observa es. Adota-se que o menor valor recebe ( ranking ou posto) 1 , co o segundo 2 e assim por diante, ate que todas as observa o es tenham sido consideradas. c Q uando ocorrerem empates, atribui-se o valor me dio entre as observa es, ou seja, atribuico se a me dia das ordens que seriam atribudas a elas se n o ocorresse o empate. S e, por a exemplo, as duas menores observa es forem iguais ha um empate. Neste caso, cada uma co recebe o posto 1 , 5 que e a me dia dos valores 1 e 2 . Para testar a hipo tese nula, utilizamos a estatstica de teste:
k ( Rj) 2 12 3( N + 1 ) N( N + 1 ) nj j= 1

H=

em que: N = n mero total de observa es; u co k = n mero de tratamentos; u n j = n mero de observa es no j-e simo tratamento; u co R j = soma dos postos do j-e simo tratamento. Rejeitamos H0 se H 2 com k 1 graus de liberdade ao nvel de signic ncia. a S e ocorrerem empates, a estatstica de teste H deve ser corrigida com a seguinte express o: a C=1 ( t3 ti ) i , N3 N

em que t i e o n mero de observa es empatadas no i-e simo grupo. u co Assim, temos a estatstica corrigida: H1 = H C

Para testar H0 , procedemos exatamente como se n o houvesse empates. a Exemplo 7. 2 . Em um experimento para avaliar o consumo de energia ele trica em KWh de tr s motores durante um hora de funcionamento, obteve-se os seguintes resultados: e Aplicando-se o teste de Kruskal-Wallis, temos que:

118

An lise de Vari ncia a a

Anjos, A. dos

Tabela 7. 4: C onsumo de energia ele trica de tr s motores durante uma hora. e Motor 1 Motor 2 Motor 3 2 2 1 2 ( 1 3) 2 02 5 ( 9) 1 989 ( 8) 2 2 32 ( 1 4) 2 02 7 ( 1 0) R1 = 5 4 H= 12 1 4( 1 5 ) 2 1 95 ( 1 2 ) 2 031 ( 1 1 ) 1 876 ( 7) 1 75 0 ( 2 ) 1 060 ( 1 ) R 1 = 33 1 770 1 800 1 85 2 1 769 ( 4) ( 5) ( 6) ( 3)

R1 = 1 8

5 42 33 2 1 82 + + 3( 1 5 ) = 5, 4 5 5 4

O valor 2 , com k 1 = 3 1 = 2 graus de liberdade e um nvel de signic ncia de a 5 % e 5 , 99. portanto, n o rejeitamos H0 , ou seja, n o ha evid ncias de que que os motores a a e possuem um consumo diferente de energia ele trica.

Você também pode gostar