Você está na página 1de 10

C aptulo 7

An a lise de Vari a ncia


7. 1 Introdu c ao

A Ana lise de Vari a ncia ( ANOVA) e um procedimento utilizado para comparar tr es ou mais tratamentos. Existem muitas varia c o es da ANOVA devido aos diferentes tipos de experimentos que podem ser realizados. Nesse curso sera estudado apenas a ana lise de vari a ncia com um fator. Inicialmente, s a o apresentados alguns conceitos utilizados em planejamento de experimentos e na ana lise de vari a ncia.

7. 2
7. 2 . 1

C onceitos B a sicos sobre Exp erimenta c ao


Tratamento

Um tratame nto e uma condi c a o imposta ou ob jeto que se deseja medir ou avaliar em um experimento. Normalmente, em um experimento, e utilizado mais de um tratamento. C omo exemplos de tratamentos, podem-se citar: equipamentos de diferentes marcas, diferentes tamanhos de pe c as, doses de um nutriente em um meio de cultura, quantidade de lubricante em uma ma quina, temperatura de armazenamento de um alimento. O s tratamentos que podem ser dispostos em uma ordem, como por exemplo, doses de nutrientes, quantidade de lubricante, nveis de temperatura, s a o ditos tratamentos quantitativo s . Ja os tratamentos que n a o podem ser dispostos numa ordem, s a o ditos tratamentos qualitativo s , por exemplo, variedades de plantas, me todos de prepara c a o de alimento, marcas de equipamentos e outros. C ada tipo de tratamento tambe m pode ser chamado de um fator. Nesse texto, ser ao estudados somente experimentos com um fator de interesse. O tipo de tratamento tem import a ncia na forma como os dados ser a o analisados. Q uando os tratamentos s a o quantitativos, pode-se usar, por exemplo, te cnicas de ana lise de regress a o. 1 09

110

An a lise de Vari a ncia

Anjos, A. dos

O s tratamentos s a o chamados de vari a ve is inde pe nde nte s . Q uando, em um experimento, estamos interessados em estudar apenas um tipo de varia vel independente, dizemos que possumos apenas um fator. Em um experimento, um fator pode ter va rias categoriais que s a o chamadas de nve is . Exemplo: Um laborato rio deseja estudar o efeito da composi c a o de pe c as de metal sobre a dilata c a o. Neste exemplo, a composi c a o das pe c as e o fator ( varia vel independente) . O s diferentes tipos de composi ca o s a o os nveis do fator. A dilata c a o das pe c as, medida em milmetros, por exemplo, e a varia vel resposta ( varia vel dependente) . Em um experimento, podem existir mais de um fator e mais de uma varia vel resposta. Toda e qualquer varia vel que possa interferir na varia vel resposta ou dependente deve ser mantida constante. Q uando isso n a o e possvel, existem te cnicas ( estrate gias) que podem ser utilizadas para reduzir ou eliminar essa interfer e ncia.

7. 2 . 2

Unidade exp erimental ou parcela

a Unidade e xpe rime ntal o u parce la e onde e feita a aplica c a o do tratamento. E unidade experimental que fornece os dados para serem avaliados. C omo exemplos de unidades experimentais ou parcelas pode-se citar: um motor, uma pe c a do motor, uma placa de Petri com meio de cultura, uma por c a o de algum alimento. As unidades experimentais podem ser formadas por grupos ou indivduos. Por exemplo, quando trabalha-se com cobaias, pode-se ter apenas uma cobaia como unidade experimental, ou seja, apenas um animal fornecera a resposta do tratamento, ou ainda, pode-se ter um grupo de cobaias em uma gaiola fornecendo as informa c o es. O uso de grupos ou indivduos como unidades experimentais depende do fen o meno que se esta estudando, da forma como o experimento e conduzido e dos recursos disponveis. De modo geral, a escolha da unidade experimental deve ser feita de forma a minimizar o erro experimental.

7. 2 . 3

Rep eti c ao

Re pe ti c a o e o n u mero de vezes que um tratamento aparece no experimento. O n u mero de repeti c o es, em um experimento, vai depender tambe m dos recursos disponveis, do tipo de experimento ( delineamento) e, tambe m, da variabilidade do experimento ou da varia vel resposta. Existem va rias metodologias para estimar o n u mero satisfato rio de repeti co es em um experimento. Mas, em fun c a o das possveis limita co es acima, a deni c a o do n u mero de repeti c o es, muitas vezes, torna-se uma tarefa difcil. A experi e ncia do pesquisador sobre o fen o meno em estudo deve ser levada em considera ca o. Ale m disso, as metodologias empregadas, para esse ca lculo, pressup o em que uma estimativa do erro experimental e conhecida. Nem sempre essa informa c a o esta disponvel

7. 2. Conceitos B a sicos sob re Experimenta ca o

111

antes da realiza ca o de um experimento e, como cada experimento e uma nova histo ria, em fun c a o de caractersticas intrnsecas de cada fen o meno, esse ca lculo pode ser em v a o.

7. 2 . 4

Vari a vel resp osta ou vari a vel dep endente

Uma varia vel e qualquer caracterstica que apresenta varia c a o, por exemplo, a altura de pessoas, o peso de animais, o comprimento de uma pe c a, o n u mero de microrganismos em um litro de leite etc. Q uando o valor de uma varia vel n a o pode ser determinado antes da realiza c a o de um experimento, tem-se ent a o uma vari a ve l aleat o ria . As varia veis que assumem valores enumera veis, s a o denominadas varia veis aleato rias discre tas . Por exemplo, o n u mero de sementes germinadas, o n u mero de microrganismos em um litro de leite. As varia veis que assumem valores em um intervalo, s a o denominadas varia veis aleato rias co ntnuas . Por exemplo, o peso de animais, o teor de umidade em um alimento, o conte u do de o leo em uma semente. Em um experimento, podem ser medidas muitas varia veis, mas deve-se considerar somente aquelas que possam contribuir para a explica c a o da hipo tese formulada. E o pesquisador, em geral, quem sabe quais ser a o as varia veis que ser a o medidas em um experimento. Ele deve ser alertado, sempre, sobre as condi c o es para a realiza c ao de tais medi c o es, no sentido de evitar gastar recursos com varia veis que n a o fornecer a o as informa c o es para se testar a( s) hipo tese( s) . Q uando o volume de dados de um experimento torna-se grande, aumentam os riscos de erros grosseiros, como de registro, de invers a o de varia veis etc.

7. 2 . 5

D elineamento exp erimental ( D esign)

C om a nalidade de reduzir o e rro e xpe rime ntal , existem os chamados de lineame nto s e xpe rime ntais . Um delineamento experimental e a forma como os tratamentos ou nveis de um fator s a o designados `a s unidades experimentais ou parcelas. A ana lise de vari a ncia ( que sera vista mais adiante) e baseada no delineamento experimental utilizado. Por isso, saber como o experimento foi instalado e conduzido, e de fundamental import a ncia. Pequenas modica c o es podem acarretar em grandes mudan c as na forma da ana lise estatstica. N a o raro, acontecem situa co es em que as hipo teses formuladas, a prio ri , n a o podem ser testadas, ou ainda, e impossvel de se realizar uma ana lise estatstica. Por isso, deve-se dar muita import a ncia ao planejamento experimental. Um delineamento experimental e planejado de tal forma que a varia c a o ao acaso seja reduzida o ma ximo possvel. Alguns dos principais delineamentos experimentais s a o: delineamento completamente casualizado ( DC C ) , delineamento em blocos casualizados ( DBC ) e quadrado latino.

112

An a lise de Vari a ncia

Anjos, A. dos

7. 2 . 6

Modelo e an a lise de vari a ncia

Em um experimento, cada observa c a o Yij pode ser decomposta conforme o modelo a seguir: Yij = + i + ij i = 1, . . . , I e j = 1, . . . , J ( 7. 1 )

em que: Yij e a observa c a o do i-e simo tratamento na j-e sima unidade experimental ou parcela; e o efeito constante ( me dia geral) ; i e o efeito do i-e simo tratamento; ij e o erro associado ao i-e simo tratamento na j-e sima unidade experimental ou parcela IID assumido como: ij N ( 0 , 2 ) . Aqui, IID signica que os erros devem ser independentes e identicamente distribudos. Em um experimento, existe o interesse em testar se ha diferen c as entre as me dias dos tratamentos, o que equivale a testar as hipo teses: H0 H1 em que: i = + i i = 1 , 2 , . . . , I. : : 1 i = = 2 i = = I para pelo menos um par ( i , i ) ,

com i = i

De forma equivalente, podemos escrever tais hipo teses da seguinte forma: H0 H1 : : 1 i = = 2 0 = = I = 0 para pelo menos um i .

Note que, se a hipo tese nula for verdadeira, todos os tratamentos ter a o uma me dia comum . A ana lise de vari a ncia, baseia-se na decomposi c a o da varia c a o total da varia vel resposta em partes que podem ser atribudas aos tratamentos ( vari a ncia entre) e ao erro experimental ( vari a ncia dentro) . Essa varia c a o pode ser medida por meio das somas de quadrados denidas para cada um dos seguintes componentes:
I J
I P J P

( 2 yij

S Q Total =

i= 1 j= 1
I P i=1 2 yi .

C , em que C =

i= 1 j= 1

yi j ) 2

IJ

S Q Trat =

C,

e a soma de quadrados dos resduos pode ser obtida por diferen c a: S Q Res = S Q Total S Q Trat. A S Q Trat tambe m e chamada de varia c a o Entre, que e a varia c a o existente entre os diferentes tratamentos e a S Q Res e chamada de varia c a o Dentro uqe e fun ca o das diferen c as existentes entre as repeti c o es de um mesmo tratamento.

7. 3. An a lise de Vari a ncia

113

Essas somas de quadrados podem ser organizadas em uma tabela, denominada tabela da ana lise de vari a ncia, como apresentado na Tabela 7. 1 . Para testar a hipo tese H0 , utiliza-se o teste F apresentado na tabela da Ana lise de Vari a ncia ( Tabela 7. 1 ) . C onve m lembrar que esse teste e va lido se os pressupostos assumidos para os erros do modelo estiverem satisfeitos. Tabela 7. 1 : Tabela da ana lise de vari a ncia.
C ausas de Varia ca o Tratamentos Resduo Total G raus de Liberdade I-1 I( J-1 ) IJ-1 S oma de Q uadrados S Q Trat S Q Res S Q Total Q uadrados Me dios Q MTrat Q MRes F calculado Q MTrat/ Q MRes

em que Q MTrat= S Q Trat/ ( I-1 ) e Q MRes= S Q Res/ ( I( J-1 ) ) . Pode-se mostrar que o quociente Q MTrat/ Q MRes tem distribui c a o F com ( I 1 ) e I ( J 1 ) graus de liberdade, supondo que, yij s a o varia veis aleato rias independentes, 2 todos os tratamentos t e m vari a ncias iguais a e Yij N ( i , 2 ) . Por esses motivos, os pressupostos da ANOVA devem ser testados ou avaliados em qualquer ana lise S e Fcalculado > Ftabelado, rejeitamos a hipo tese de nulidade H0 , ou seja, existem evid e ncias de diferen c a signicativa entre pelo menos um par de me dias de tratamentos, ao nvel de signic a ncia escolhido. C aso contra rio, n a o se rejeitamos a hipo tese de nulidade H0 , ou seja, n a o ha evid e ncias de diferen c a signicativa entre tratamentos, ao nvel de signic a ncia escolhido. O utra maneira de avaliar a signic a ncia da estatstica F e utilizando o p-valor. S e o p-valor < , rejeitamos a hipo tese de nulidade H0 . C aso contra rio, n a o se rejeitamos a hipo tese de nulidade H0 , ou seja, n a o ha evid e ncias de diferen c as signicativas entre os tratamentos, ao nvel de signic a ncia escolhido.

7. 2 . 7

D elineamento exp erimental

Q uando as unidades experimentais s a o homog e neas, ou seja, as parcelas s a o uniformes, os tratamentos podem ser sorteados nas unidades experimentais sem qualquer restri c a o. Nessa situa c a o, o delineamento experimental e chamado de delineamento completamente casualizado ( DC C ) . Neste caso, todos os tratamentos t e m a mesma chance de serem aplicados em qualquer unidade experimental ou parcela. Nesse texto, abordaremos apenas esse tipo de delineamento que e o caso mais simples da ANOVA.

7. 3

An a lise de Vari a ncia

Exemplo 7. 1 . C onsidere o seguinte experimento que foi conduzido, considerando um delineamento inteiramente casualizado. Foram comparados 4 tratamentos ( tipos de cultivo:

114

An a lise de Vari a ncia

Anjos, A. dos

Agar ( A) , C a ssia ( C ) , G uar ( G ) , Leucena ( L) ) . Mediu-se o crescimento, em gramas, de explantes de morango ( Tabela 7. 2 ) . Tabela 7. 2 : C rescimento de explantes de morangos em gramas.
Trat. A G L C Total I 0. 1 95 8 0. 362 7 0. 1 62 1 0. 2 841 II 0. 1 301 0. 4841 0. 1 1 5 0 0. 3099 III 0. 1 806 0. 41 1 9 0. 2 01 1 0. 2 92 2 Repeti c o es IV V 0. 1 5 45 0. 1 2 5 2 0. 445 7 0. 475 5 0. 2 1 2 3 0. 1 475 0. 1 5 05 0. 2 345 Total VI 0. 1 882 0. 5 1 74 0. 1 92 2 0. 1 65 2 VI I 0. 2 2 1 1 0. 41 73 0. 1 802 0. 1 379 VI I I 0. 1 734 0. 4001 0. 2 2 48 0. 1 960 1 , 3689 1 , 7703 3, 5 1 47 1 , 435 2 8, 0891

Para este experimento, consideramos o modelo: yij = + i + ij em que ij N ( 0 , 2 )


IID

i = 1 , 2 , . . . , 4 tratamentos; j = 1 , 2 , . . . , 8 repeti c o es; yij e o peso em gramas correspondente ao i-e simo tratamento na j-e sima unidade experimental; i e o efeito do i-e simo tratamento; ij e o erro experimental associado ao i-e simo tratamento e a j-e sima repeti ca o. As hipo teses testadas neste experimento s a o: H0 : H1 : 1 = 2 = 3 = 4 i = i para pelo menos um par, com i = i.

C a lculos para a An a lise de Vari a ncia Tem-se que: I J


I J

i= 1 j= 1

yij = 0 , 1 95 8 + 0 , 1 301 + . . . + 0 . 1 960 = 8 , 0891 .


2 = 0 , 1 95 8 2 + 0 , 1 301 2 + . . . + 0 . 1 960 2 = 2 , 495 2 . yij

i= 1 j= 1

G raus de liberdade de tratamentos= I 1 = 4 1 = 3. G raus de liberdade do resduo= I ( J 1 ) = 4( 8 1 ) = 2 8. G raus de liberdade total= IJ 1 = 4 8 1 = 31 . As somas de quadrados s a o obtidas da seguinte forma:
I J
I P J P

( 2 yij

1 . S Q Total=

i= 1 j= 1

yi j ) 2

i= 1 j= 1

IJ

= 2 , 495 2

( 8 , 0891 ) 2 32

= 0 , 45 04

7. 4. Teste de Tu key para Compara c a o de Me dias


I P J P

115

O bs: A express ao IJ da soma de quadrados.


I P 2 yi . I P J P

i= 1 j= 1

yi j ) 2

e referenciada em alguns textos como fator de corre c ao

2 . S Q Trat=

i= 1

i= 1 j= 1

yi j ) 2

IJ

1 , 3689 2 + 1 , 7703 2 + 3 , 5 1 47 2 + 1 , 435 2 2 8

( 8 , 0891 ) 2 32

= 0 , 382 8.

3. A S oma de Q uadrados dos resduos e obtida por diferen c a: S Q Res= S Q Total-S Q Trat= 0 , 45 04 0 , 382 8 = 0 , 0676. O s quadrados me dios s a o obtidos pela divis a o da soma de quadrados, pelos seus respectivos graus de Liberdade. Assim, Q MTrat= S Q Trat/ ( I-1 ) = 0, 382 8/ 3= 0, 1 2 76 e Q MRes= S Q Res/ I( J-1 ) = 0, 0676/ 2 8= 0, 002 41 4. O teste F e o quociente entre o Q MTrat e o Q MRes. Logo, Fcalculado= Q MTrat/ Q MRes= 0, 1 2 76/ 0, 002 41 4= 5 2 , 85 83. O Fcalculado e comparado com o Ftabelado, com 3 e 2 8 graus de liberdade, na tabela de F ( Tabela ) : Ftabelado a 1 % = 2 , 95 Ftabelado a 5 % = 4, 5 7. Efetuados os ca lculos, podemos resumi-los na tabela da ana lise de vari a ncia apresentada a seguir: Tabela 7. 3: Ana lise de vari a ncia do exemplo 7. 1 . C ausas de GL S oma de Q uadrados F calculado Varia ca o Q uadrados Me dios Tratamentos Resduo Total

4-1 = 3 4( 8-1 ) = 2 8 4 8-1 = 31

0, 382 8 0, 0676 0, 45 04

0, 1 2 76 0, 002 41 4

5 2 , 85 83

S ignicativo ao nvel de 1 % de probabilidade

C onclus a o da ana lise de vari a ncia: De acordo com o teste F, foram encontradas evid e ncias de diferen c as signicativas, ao nvel de 1 % de probabilidade, entre os tratamentos, com rela c a o ao crescimento. Rejeitamos, portanto, a hipo tese de nulidade H0 . Deve existir, pelo menos um contraste signicativo entre as me dias de tratamentos, com rela c ao ao crescimento me dio. O procedimento seguinte, quando de interesse do pesquisador, e o de comparar as me dias de tratamentos utilizando algum teste de compara c a o de me dias ou contrastes para identicar qual ou quais tratamentos e ou s a o diferente( s) .

7. 4

Teste de Tukey para C ompara c a o de Me dias

116

An a lise de Vari a ncia

Anjos, A. dos

Apo s concluirmos que existe diferen c a signicativa entre tratamentos, por meio do teste F, podemos estar interessados em avaliar a magnitude destas diferen c as utilizando um teste de compara co es m u ltiplas. O teste de Tukey permite testar qualquer contraste, sempre, entre duas me dias de tratamentos, ou seja, n a o permite comparar grupos entre si. O teste baseia-se na Diferen c a Mnima S ignicativa ( DMS ) . A estatstica do teste e dada da seguinte forma: =q QMRes , r ( 7. 2 )

em que, q e a amplitude total studentizada, tabelada ( tabela 5 ) , Q MRes e o quadrado me dio do resduo, e r e o n u mero de repeti c o es. O valor de q depende do n u mero de tratamentos e do n u mero de graus de liberdade do resduo. Tambe m, em um teste de compara co es de me dias, deve-se determinar um nvel de signic a ncia para o teste. Normalmente, utiliza-se o nvel de 5 % ou 1 % de signic a ncia. C omo o teste de Tukey e , de certa forma, independente do teste F, e possvel que, mesmo sendo signicativo o valor de Fcalculado, n a o se encontrem diferen c as signicativas entre contrastes de me dias. Aplicando o teste de Tukey `a s me dias dos tratamentos do exemplo 7. 1 , temos: ( 5 % ) = 3 , 85 sendo q= 3, 85 e = 0 , 05 S e o contraste for maior do que , ent a o as me dias diferem ao nvel de signic a ncia. Utilizar-se-a o me todo de letras para exemplicar o uso do teste, mas existem outras maneiras de representa ca o como, por exemplo, o uso de tabelas ou barras. Inicialmente, ordenamos as me dias de forma crescente ou decrescente, para facilitar as compara c o es. C olocamos uma letra do alfabeto na primeira me dia ( normalmente a letra a ) e, em seguida, comparamos a diferen c a com as me dias seguintes. S e a diferen ca for superior ao valor de ( 5 % ) = 0 , 06696, a diferen c a entre duas me dias sera considerada signicativa. A diferen c a entre duas me dias e representada pela presen c a de letras diferentes. O resultado nal e o seguinte: G C L A 0, 4393 0, 2 2 1 3 0, 1 794 0, 1 71 1 a b b b 0 , 002 42 = 0 , 06696 . 8

Temos que, me dias de crescimento, seguidas de letras iguais, n a o diferem signicativamente entre si, pelo teste de Tukey ao nvel de 5 % de probabilidade.

7. 5. Teste de Kru skal-Wallis

117

7. 5

Teste de Kruskal-Wallis

A ana lise de vari a ncia exige que os erros ij tenham distribui ca o Normal e deve haver homocedasticidade entre os tratamentos ( vari a ncias homog e neas) . Estes pressupostos nem sempre s a o satisfeitos em um experimento ou conjunto de dados. C omo uma alternativa para a ana lise de vari a ncia parame trica para um delineamento completamente casualizado, k 3 tratamentos, existe o teste de Kruskal-Wallis. Este teste pode ser utilizado para testar a hipo tese H0 : 1 = 2 = = k . No lugar das medidas, utiliza-se os postos e n a o ha suposi c o es com rela ca o a Normalidade e Homocedasticidade. Uma exig e ncia do teste de Kruskal-Wallis e que a varia vel em estudo seja contnua. O utra e que as observa c o es devem ser independentes. A ana lise consiste em obter o posto de cada uma das observa c o es. Adota-se que o menor valor recebe ( ranking ou posto) 1 , o segundo 2 e assim por diante, ate que todas as observa co es tenham sido consideradas. Q uando ocorrerem empates, atribui-se o valor me dio entre as observa c o es, ou seja, atribuise a me dia das ordens que seriam atribudas a elas se n a o ocorresse o empate. S e, por exemplo, as duas menores observa c o es forem iguais ha um empate. Neste caso, cada uma recebe o posto 1 , 5 que e a me dia dos valores 1 e 2 . Para testar a hipo tese nula, utilizamos a estatstica de teste:
k 12 ( Rj ) 2 3( N + 1 ) N( N + 1 ) nj j= 1

H=

em que: N = n u mero total de observa c o es; k = n u mero de tratamentos; n j = n u mero de observa c o es no j-e simo tratamento; R j = soma dos postos do j-e simo tratamento. Rejeitamos H0 se H 2 com k 1 graus de liberdade ao nvel de signic a ncia. S e ocorrerem empates, a estatstica de teste H deve ser corrigida com a seguinte express a o: C=1 ( t3 i ti ) , 3 N N

em que t i e o n u mero de observa c o es empatadas no i-e simo grupo. Assim, temos a estatstica corrigida: H1 = H C

Para testar H0 , procedemos exatamente como se n a o houvesse empates. Exemplo 7. 2 . Em um experimento para avaliar o consumo de energia ele trica em KWh de tr e s motores durante um hora de funcionamento, obteve-se os seguintes resultados: Aplicando-se o teste de Kruskal-Wallis, temos que:

118

An a lise de Vari a ncia

Anjos, A. dos

Tabela 7. 4: C onsumo de energia ele trica de tr e s motores durante uma hora. Motor 1 Motor 2 Motor 3 2 2 1 2 ( 1 3) 2 02 5 ( 9) 1 989 ( 8) 2 2 32 ( 1 4) 2 02 7 ( 1 0) R1 = 5 4 H= 12 1 4( 1 5 ) 2 1 95 ( 1 2 ) 2 031 ( 1 1 ) 1 876 ( 7) 1 75 0 ( 2 ) 1 060 ( 1 ) R 1 = 33 1 770 1 800 1 85 2 1 769 ( 4) ( 5) ( 6) ( 3)

R1 = 1 8

5 42 33 2 1 82 + + 3( 1 5 ) = 5 , 4 5 5 4

O valor 2 , com k 1 = 3 1 = 2 graus de liberdade e um nvel de signic a ncia de 5 % e 5 , 99. portanto, n a o rejeitamos H0 , ou seja, n a o ha evid e ncias de que que os motores possuem um consumo diferente de energia ele trica.

Você também pode gostar