Você está na página 1de 27

Introduo

ANOVA 2 fatores (two-way)

Em muitos trabalhos, que envolvem a realizao de experimentos, comum os pesquisadores se depararem com a questo: como avaliar se os resultados obtidos so confiveis? Sabemos que qualquer medida realizada sempre afetada por erros. Erros muito pequenos no traro grandes implicaes. Contudo, se forem significativos, podero prejudicar seriamente os resultados levando a falsas concluses. Portanto conhecer a natureza dos erros e preparar planejamentos que possam minimiz-los uma estratgia que deve estar presente no dia-a-dia de todo pesquisador. Existem dois tipos de erros, o erro sistemtico e o erro aleatrio. O primeiro tem como caracterstica afetar os resultados dos experimentos sempre na mesma direo, seja para mais ou para menos. Um exemplo simples deste tipo de situao o caso de uma balana descalibrada que pode indicar sempre massas maiores que as reais. Mas vale notar que os erros sistemticos podem ser identificados e, portanto, evitados. Por outro lado, h um tipo de erro que afeta as medidas sem nenhuma tendncia clara. As medidas podem oscilar, ora para mais, ora para menos. Este tipo e erro chamado de erro aleatrio e, infelizmente, sempre estar presente em maior ou menor grau. Ao fazer um estudo sempre interessante fazer replicatas, repeties, pois permite que o erro presente nas medidas seja investigado. Alm disso, com a realizao de vrias replicatas aumentam as chances de se aproximar mais do valor exato. Isto evidenciado por um importante princpio da estatstica: o teorema do limite central, que comprova que o erro no valor mdio menor que o erro de uma observao individual (referncia: Barros Neto, B,
Scarminio, I.S., Bruns, R.E. Como fazer experimentos: pesquisa e desenvolvimento na cincia e na indstria. Ed. da Unicamp; Campinas, 2001).

Muitas vezes as caractersticas do procedimento experimental dificultam muito a execuo de replicatas autnticas. No correto simplesmente realizar duas medidas do mesmo experimento de forma seqencial, pois um erro que afetar a primeira medida certamente ir, de forma sistemtica, afetar a seguinte.

nessa introduo as idias expostas foram copiadas do artigo: Conseqncias da anlise incorreta de experimentos blocados, sob autoria de Joo Alexandre Bortoloti e Roy Edward Bruns. Artigo publicado na revista Qumica Nova, vol. 30, n 2, pgs. 436-440, 2007.

No so raros os casos em que o ajuste das condies experimentais extremamente trabalhoso ou lento. Portanto, parece haver um dilema, realizar medidas com duplicatas e arcar com o custo do trabalho envolvido, mas garantir a qualidade das medidas, ou evitar um grande esforo no laboratrio, mas correr o risco de ter todo o seu trabalho prejudicado. neste contexto que surge uma interessante possibilidade, a blocagem dos experimentos.
continuao da aula sobre Anova 1 fator

Ao analisar os dados classificados em dupla-entrada, temos de aplicar o mtodo da classificao 1 fator duas vezes: - uma vez para cada sistema de classificao. Em resumo, a anova 1 fator duas vezes (uma vez para o fator na coluna e uma vez para o fator na linha). Veremos a aplicao desse mtodo (anova 2 fatores) em dois tipos de delineamentos: CRD e CRBD sob presena ou ausncia de repeties, replicatas. Por repetio (replicata) se entende um teste completo de todos os tratamentos no experimento (a replication is a complete run for all treatments to be tested in the experiment). 1) experimento inteiramente ao acaso (completely randomized design, CRD) sem repeties; 2) experimento em blocos ao acaso (randomized complete block design (CRBD) sem repeties;

3) experimento em blocos ao acaso (CRBD) com repeties; 4) experimento inteiramente casualizado (CRD) com repeties.

1) CRD. Experimento inteiramente ao acaso , sem repeties. Exemplo 1. Por exemplo, 12 jovens foram classificados em trs grupos de acordo com a idade deles. Ao mesmo tempo eles foram classificados de acordo com o sexo em dois grupos: masculino e feminino. Assim, cada jovem esteve sujeito a dois sistemas de classificao simultaneamente, Tabela 1. Tabela 1. Dados obtidos no experimento tipo CRD. colunas linhas 1 2 3 total coluna mdia coluna efeito coluna

1 6 8 4 18 6 -1

2 2 9 4 15 5 -2

3 9 11 10 30 10 +3

4 3 12 6 21 7 0

total linha 20 40 24 84

mdia linha 5 10 6 7

efeito linha -2 +3 -1 0

(-1) = efeito coluna = mdia coluna 1(=6) mdia geral (=7) (+3) = efeito linha = mdia linha 2(=10) mdia geral (=7)

Anlise dos dados segundo a classificao do fator linha. anova 1 fator. SQ linha = 4{(-2)2 + (3)2+ (-1)2} = 56 Anlise dos dados segundo a classificao do fator coluna. anova 1 fator. SQ coluna = 3{(-1)2 + (-2)2+ (3)2+(0)2} = 42 Clculo da Soma de Quadrados Total SQ Total*= x2 (X)2 / n =
* deduo dessa frmula = SQ = (x-)2 = (x2-2x +2) = (x2)-2x +(2)= x2-22n +n 2 =x2- n2 = x2- n(x)2/ n2 = x2 (x)2 / n que a forma usual do clculo da soma de quadrados total.

{(52+22+92+32+82+92+112+122+42+42+102+62)-(5+2+9+3+8+9+11+12+4+4+10+6)2 / 12 }= SQTotal = 120 Clculo da Soma de Quadrados Resduo (h dois mtodos)


a) por meio da diferena (mtodo mais fcil)

Denomina-se experimento inteiramente ao acaso quando os tratamentos (fatores) so designados s unidades experimentais sem qualquer restrio. Esse tipo de delineamento s pode ser conduzido quando as unidades experimentais (corpos-de-prova, pessoas, etc...) so similares. Por similares deve-se entender: no no sentido de igualdade, mas no sentido de que essas unidades respondem ao tratamento da mesma forma.

SQ Total = SQ LINHA + SQ COLUNA + SQ RESDUO assim, SQ RESDUO = SQ Total (SQ LINHA + SQ COLUNA) SQ RESDUO = 120 (56+42) = 120 98 = 22
b) por meio do clculo direto (mtodo mais trabalhoso) 22+(-1) 2+12+(-2)2+(-1)2+12+(-2)2+22+(-1)2+02+12+02 = 4+1+1+4+1+1+4+4+1+0+1+0 = 22

Clculo dos Graus de Liberdade (gl) Fator Linha = Blocos = b-1 e no nosso exemplo 3 1 = 2 Fator Coluna = G-1 e no nosso exemplo 4 1 = 3 Total N-1 e no nosso exemplo 12 1 = 11 Resduo ( N-1 ) - [ (B-1) +(G-1) ] = ( BK-1 ) - [ (B-1) +(G-1) ] = (B-1)(G-1) e no nosso exemplo o gl resduo igual a 11-(2+3) = 6 = (3-1)(4-1) = (2)(3)

Tabela 2. ANOVA 2 fatores para os dados da Tabela 1. Efeito


(ou fonte de variao)

gl
3-1= 2 4-1=3

SQ 56 42 22 120

QM
56/2= 28 42/3= 14 22/6= 3,67

razo F
28/3,67= 7,64 14/3,67= 3,82

p-valor
0,0224150* 0,0764059

Linhas Colunas Resduo Total


*p<0,05

6
12-1= 11

Concluso. Apenas o efeito fator (Linhas) estatisticamente significante. Os valores mdios dos trs nveis diferem. H pelo menos uma diferena entre as trs mdias. No temos condies, por meio do teste anova, de dizer se a diferena se encontra entre a linha 1 e a linha 2 ou entre a 1 e a 3 ou entre a 2 e a 3. O teste de comparao mltipla de Tukey, por exemplo, poder nos indicar qual desses trs pares de mdias apresenta diferena estatstica.

..................................................................................................................

2) CBRD. Experimento em blocos ao acaso , sem repeties. Vamos considerar, agora, os experimentos casualizados. Nesse delineamento os tratamentos so designados s unidades experimentais com certa restrio: so sorteados dentro de cada bloco. Neste item ao considerar os CBRD vamos estudar os casos sem repetio, ou seja, com apenas uma aplicao dos tratamentos s unidades experimentais. Para a anlise dos dados em planejamentos desse tipo, convm recordar o que foi dito anteriormente: ao analisar os dados classificados em dupla-entrada, temos de aplicar o mtodo da classificao 1 fator duas vezes: - uma vez para cada sistema de classificao. Em resumo, a anova 1 fator duas vezes (uma vez para o fator na coluna e uma vez para o fator na linha). Quando as unidades experimentais no so similares, devia ser intuitivamente claro que as variaes nas unidades por si mesmas poderiam ofuscar (obscurecer) os verdadeiros efeitos do tratamento. O mtodo de blocagem considera forma de avaliar as unidades heterogneas em todos os tipos de experimentao.

O CBRD um delineamento no qual as unidades - s quais os tratamentos so aplicados - so subdivididas em grupos homogneos (chamados de blocos), de modo que o nmero de unidades em um bloco seja igual ao nmero (ou algum mltiplo do nmero) de tratamentos que esteja sendo estudado. Os tratamentos so ento designados ao acaso s unidades experimentais dentro de cada bloco. Deve-se enfatizar que cada tratamento aparece em cada um dos blocos, e cada bloco recebe cada um dos tratamentos em estudo. Assim, cada um dos blocos inclui todos os tratamentos. Dentro de cada bloco os tratamentos so atribudos s parcelas inteiramente ao acaso. Para que o experimento seja eficiente (aumente em preciso, diminuio da varincia erro ou resduo), dever cada bloco ser to uniforme quanto possvel, mas os blocos podero diferir bastante uns dos outros. O pesquisador s deve optar por experimento tipo CRD quando dispe de nmero suficientemente grande de unidades experimentais similares. Como isso nem sempre acontece na prtica, preciso um delineamento que permita comparar adequadamente os tratamentos, mesmo que as unidades apresentem certa heterogeneidade. Unidades similares so agrupadas (d-se o nome de blocos a esse conjunto de unidades similares). Os experimentos em blocos ao acaso surgiram na rea agrcola. O campo era dividido em blocos e os blocos eram divididos em parcelas que recebiam os tratamentos (adubo, por exemplo) em investigao. Ento o termo bloco designava originalmente, uma faixa de terra de mesma fertilidade. Esse tipo de delineamento surgiu em 1925 na Inglaterra por R. A. Fisher que foi, tambm, o idealizador do mtodo ANOVA. O bloco pode ser uma faixa de terra, uma ala de estufa, um perodo de tempo, uma ninhada, uma partida de produtos industriais, uma faixa de idade tudo depende do que est em experimentao. O CBRD pode ser empregado de forma muito eficiente quando um experimento deve ser efetuado em mais de um laboratrio (blocos) ou quando vrios dias (blocos) so necessrios para a sua realizao. O essencial que os blocos renem unidades similares e que haja variabilidade entre blocos. No teria sentido organizar esses blocos se no houvesse variabilidade entre eles. Quem vai decidir se a variabilidade entre as unidades justifica ou no a formao de blocos o pesquisador, no o estatstico. Embora o bloco deva reunir unidades similares, isso no significa que essa reunio deva ser fsica. Por exemplo, se um mdico pretende comparar duas drogas hipotensoras, A e B, e considerar que a presso arterial do paciente, no incio do tratamento, importante na resposta do paciente droga, deve organizar blocos. Cada bloco ser formado por um par de pacientes com presses arteriais similares, mas, para formar os blocos, o mdico no precisa colocar seus pacientes em fila, nem junt-los aos pares. Basta reunir os dados numricos. Dois pacientes do mesmo bloco no precisam nem mesmo se conhecer. O objetivo do CBRD isolar e remover do termo resduo (erro) a variao atribuvel aos blocos, aumentando assim a preciso do experimento sem aumentar o nmero de unidades experimentais.

Historicamente, os blocos casualizados o primeiro delineamento vlido para estimar o erro experimental e testar a significncia dos efeitos de tratamento apesar da heterogeneidade das unidades experimentais sobre as quais as observaes so realizadas. Esse delineamento revolucionou os experimentos na agricultura no mundo todo. No seria um exagero afirmar que ele ainda a espinha dorsal do delineamento da cincia experimental. Porm, nenhum delineamento torna-se popular e aceito para uso geral, no importa quo bem fundamentado do ponto de vista estatstico que ele seja, se for complicado e difcil de empreend-lo. A beleza desse planejamento em blocos a feliz combinao de validade, simplicidade e flexibilidade. O planejamento em blocos consiste de duas etapas. A primeira a de coletar, reunir, as unidades afins, similares para juntas formarem um grupo homogneo; esse grupo formado chamado de bloco. Essa operao conhecida como blocagem. A segunda etapa a de designar os vrios tratamentos ao acaso s unidades dentro de cada bloco. Essa a principal diferena entre o delineamento em blocos e o delineamento inteiramente casualizado. Em termos de casualizao pode-se considerar que, em blocos, h uma restrio. Veremos, a seguir, a aplicao desse mtodo para um experimento onde a unidade experimental a pessoa que vira bloco. Ela recebe, sob aplicao aleatria, dois tratamentos A e B. Convm recordar que, experimentos desse tipo, onde a unidade experimental a pessoa que recebe todos os tratamentos em comparao, um caso especial de experimento em blocos casualizados . Toda vez que a pessoa que participa do experimento recebe todos os tratamentos em comparao, essa pessoa um bloco no uma unidade. Esse tipo de experimento muito criticado. Por exemplo, a diferena que se mede na pessoa, antes e depois de uma srie de exerccios fsicos, s seria explicada pelos prprios exerccios fsicos? De qualquer forma, so feitos experimentos em que cada pessoa um bloco. O pesquisador precisa apenas estar alerta para o fato que possvel de a pessoa se modificar por qualquer outro motivo, que no o tratamento. Embora os experimentos em que se toma cada indivduo como bloco sejam bastante comuns preciso muito senso crtico para planej-los. Muitas vezes esses experimentos no tm qualquer validade. O pesquisador planeja um experimento em blocos ao acaso quando pretende eliminar uma causa de variao. Por exemplo, para testar o efeito de um hormnio sobre o crescimento

Muitas idias aqui apresentadas foram selecionadas do livro: Estatstica Experimental. Autores: S. Vieira & R. Hoffmann. Ed. Atlas. Ano 1989.

de ratos se os ratos disponveis so de diferentes idades o pesquisador deve organizar blocos que correspondam s idades. Os blocos tambm ampliam a validade da concluso. Por exemplo, se um entomologista quer comparar a eficincia de diversos inseticidas, tanto pode usar insetos de uma nica espcie como fazer a comparao usando insetos de vrias espcies. O experimento seria em blocos ap acaso se cada espcie fosse um bloco. Os blocos teriam a vantagem de ampliar a validade da concluso. Isto porque o entomologista poderia, com base em um s experimento, estabelecer concluses para vrias espcies. Em termos de eficincia, ou seja, de uma comparao de tratamentos qual seria o melhor delineamento: CRD ou CBRD? Qual seria a conseqncia de uma m escolha? Para responder temos de considerar o nmero de graus de liberdade do resduo. Vamos, ento, realizar uma comparao entre o nmero de graus de liberdade do resduo de um experimento CRD frente a um experimento tipo CRBD. Na tabela ANOVA obtm-se um valor igual a (k-1)(r-1) para um experimento em blocos; enquanto, para um experimento CRD, o gl do resduo ser igual a k(r1), onde r o nmero de rplicas (ou repeties). Se k for igual a 3 e r = 20, ento, o gl de resduo do CBRD seria igual a (3-1)(20-1) = 2 x 19 = 38 e o gl do CRD seria igual a 3(20-1) = 3 x 19 = 57. Essa diferena de 57 38 = 19 representa r-1 graus de liberdade, em geral. Em termos de notao, temos inicialmente no CRD k(r-1) e depois no CBRD (k-1)(r-1), isto , k(r-1) (k-1)(r-1) = r-1 graus de liberdade a menos sob a escolha de um possvel mau delineamento. Como o valor de F na tabela (F, de valores crticos) aumenta quando diminui o nmero de graus de liberdade de resduo, fcil entender que o uso indevido de blocos torna o teste menos sensvel. Fcalculado = QM Trat / QM resduo ; assim, quanto menor Fcalc e maior o F tabela mais difcil para que se estabelea a condio de rejeitar Ho, ou seja, de que Fcalc > F tabelado . QM resduo = SQ res / gl res ; assim, quanto menor res implica aumento de QM resduo que gl traz como conseqncia uma diminuio de Fcalc.

Exemplo 1. Experimento em blocos (CBRD), sem repeties. Numa pesquisa sobre o efeito do leo de milho no teor de colesterol do sangue, o mdico Dr. Bem Hur obteve os seguintes dados, de 7 pacientes, Tabela 3. Tabela 3. Teor de colesterol no sangue, em mg por 100g, de sete pacientes. Pacientes 1 2 3 4 5 6 7
Totais de Tratamentos Mdias de Tratamentos

Tratamentos (dois tipos de dietas) A B 270 410 350 360 350 430 268
2438 348,286

Totais dos blocos 445 718 598 591 546 620 520

Mdias dos blocos 222,5 359,0 299,0 295,5 273,0 310,0 260,0

175 308 248 231 196 190 252


1600 228,571

A anlise feita tomando-se os pacientes como blocos. Para casos desse tipo, pode-se dizer em termos gerais, que a mesma anlise dos delineamentos tipo ANOVA de medidas repetidas e, nesse especial caso, a mesma anlise que se obtm com o teste t-Student de amostras pareadas (estatstica t = 4,66; vale a relao estatstica F da anova igual ao valor da estatstica t-Student ao quadrado, ou seja, F = t2 = 4,662 = 21,71). Pelo mesmo procedimento do caso anterior obtm-se o seguinte resultado do teste ANOVA 2 fatores, Tabela 4. Tabela 4. ANOVA 2 fatores pata os dados da Tabela 3.
Efeito (ou fonte de variao) Blocos Tratamentos Resduo Total *p<0,05 gl 7-1= 6 2-1=1 6 14-1= 13 SQ 22000,40 50160,30 13862,70 86023,40 QM 22000,40/6= 3666,70 50160,30/1= 50160,30 13862,70/6= 2310,50 razo F p-valor

50160,30/2310, 50= 21,71

0,003*

Concluso. O efeito fator Tratamento (colunas) estatisticamente significante. Os valores mdios dos dois nveis diferem (A: 348,3 62,2mg; B: 228,6 45,9mg). O teste de comparao mltipla de Tukey, no precisa ser efetuado porque so apenas dois nveis do fator Tratamento. O

9 clculo de F para blocos desnecessrio. Os experimentos tipo CRBD so feitos, essencialmente, para comparar tratamentos a comparao de blocos secundria.

Exemplo 2. Experimento em blocos (CBRD), sem repeties. Um experimento foi delineado para estudar o desempenho de quatro diferentes detergentes de tecidos de roupas. Os seguintes ndices de limpeza, Tabela 5, foram obtidos (maior o ndice maior a limpeza) por meio de um instrumento especial para trs diferentes tipos comuns de manchas. A hiptese da pesquisa saber se h diferena entre os detergentes? Tabela 5. ndice de limpeza de 12 tecidos manchados segundo tipo de detergente e tipo de mancha. Detergentes Total (mdia: x ) Manchas
1 1 2 3 2 3 4

45 43 51
139 46,333

47 46 52
145 48,333

48 50 55
153 51,000

42 37 49
128 42,667

182 (45,50) 176 (44,00) 207 (51,75)

Total (mdia: x )

565
mdia geral: 565/12 = 47,083

Resoluo Vamos aplicar a mesma frmula, porm, com outra forma , mais direta, para se obter as somas de quadrados entre grupos (referente s colunas e/ou s linhas). SQE = (T2/n) - (FC); onde T... o total da coluna (ou linha); n ... o tamanho da amostra e FC o chamado fator de correo dado pela soma dos valores ao quadrado dividido pelo tamanho amostral total, ou seja, FC = (x)2 / N. Anlise dos dados segundo a classificao do fator Detergente coluna. anova 1 fator. SQ coluna = [ (1392/3) + (1452/3) +(1532/3)+(1282/3) ] (182+176+207)2/12 = SQ coluna = 26713,000 26602,083 = 110,917 Anlise dos dados segundo a classificao do fator Mancha linha (blocos). anova 1 fator. SQ linha = 1822/4 + 1762/4 +2072/4 (182+176+207)2/12 = 135,167 Clculo da Soma de Quadrados Total SQ Total = x2 FC = x2 (x)2 / n
SQ = (x-)2 = (x2-2x +2) = (x2)-2x +(2)= x2-22n +n 2 =x2- n2 = x2- n(x)2/ n2 = x2 (x)2 / n que a forma usual do clculo da soma de quadrados total. Dessa forma usual vem SQfator coluna = n( x -)2 = n x 2 (x)2 / n = n(x)2/n2 (x)2 / n = (Total)2/n (x)2 / n = (T2 /n) FC.

10

SQ Total = (452+432+512+472+462+522+482+502+552+422+372+492 ) (565)2/12 = 264,917 SQ Total = 26867,000 26602,083 = 264,917 SQ Total = SQ LINHA + SQ COLUNA + SQ RESDUO assim, SQ RESDUO = SQ Total (SQ LINHA + SQ COLUNA) SQ RESDUO = 264,917 (135,167+110,917) = 264,917 246,084 = 18,833
Tabela 6. ANOVA 2 fatores para os dados da Tabela 5.

Efeito Detergente Manchas Erro Total


*p<0,05

gl SQ 3 110,917 2 135,167 6 18,833 11 264,917

QM 36,972 67,583 3,139

F 11,78

P 0,006*

Concluso: H diferena estatisticamente significante entre os quatro detergentes. A hiptese H0(1 = 2 = 3 = 4 ) rejeitada. Os valores mdios diferem! Teste de comparao mltipla de Tukey (5%) para o efeito Detergente Por meio do Teste de Tukey (5%) obtm-se o valor HSD

MSW = QM resduo = 3,139 ; n = 3; q crtico = 4,897; HSD = 5,0095


valores das diferenas a serem comparadas com o valor HSD ou dms.(=5,0095)

Detergente 1 2 3 4

Mdia 46,333 48,333 51,000 42,667

1( x =46,33) 2,000 4,667 3,667

2( x =48,333) 3( x =51)

2,667 5,667*

8,333*

Alfa (nvel de significncia) 0,05 Valor Crtico Q 4,897 Valor Crtico para Comparao = 5,0095 Graus de liberdade do termo Erro (resduo) = 6

Formao de grupos homogneos aps a aplicao do teste de Tukey(5%) Detergente Mdia Grupos Homogneos* 3 51,000 A 2 48,333 A 1 46,333 AB 4 42,667 B

11
* mdias seguidas de letras diferentes diferem estatisticamente

Alfa (nvel de significncia) 0,05 Valor Crtico Q 4,897 Valor Crtico para Comparao = dms = HSD = 5,0095 Graus de liberdade do termo Erro (resduo) = 6

Concluso: Grupos 1 e 4 (letra A e AB) no diferem entre si (letra B comum). Grupo 4 (letra B) difere dos grupos 2 e 3 (letra A). Grupo 1 (letra AB) no difere do grupo 4 e, tambm, no difere dos grupos 2 e 3, ou seja, o detergente 1 ocupa um comportamento intermedirio em relao aos outros trs detergentes. Quanto limpeza o pior detergente o tipo 4. Os detergentes tipo 1, 2 e 3 no apresentaram diferena do ponto de vista estatstico.
........................................................................................................................................................

Exemplo 3. Experimento em blocos (CBRD), sem repeties.


Supe-se que a impureza de um produto qumico afetada pela presso. Optou-se por utilizar a temperatura como fator de blocagem. Os dados so apresentados na Tabela 7 mostrada a seguir. Tabela 7. Quinze valores de impureza, sob condies de temperatura (C) e presso (mmHg), obtidos num experimento em blocos ao acaso. Presso Total Mdia x Temperatura 25 30 35 40 45 23 4,60 100 5 4 6 3 5 13 2,60 125 3 1 4 2 3 8 1,60 150 1 1 3 1 2
Total Mdia x 9 3,00 6 2,00 13 4,33 6 2,00 10 3,33 44 geral: 2,93

Resoluo

FC = fator de correo da soma de quadrados = (44)2/15 = 129,067 SQ Total = SQ Total = x2 (X)2 / n = 166 (44)2/15= 166 129,067 = 36,933 SQ linha = SQ temperatura = SQ blocos = (232+132+82) / 5 FC = 152,400-129,067 = 23,333 SQ coluna = SQ presso = (92+62+132+62+102) / 3 FC = 140,667-129,067 = 11,600 SQ Total = SQ LINHA + SQ COLUNA + SQ RESDUO assim, SQ RESDUO = SQ Total (SQ LINHA + SQ COLUNA) SQ RESDUO = 36,933 (23,333+11,600) = 36,933 34,933 = 2,000 Clculo dos Graus de Liberdade (gl) Fator Linha = Blocos = b-1 e no nosso exemplo 3 1 = 2

12

Fator Coluna = Presso = G-1 e no nosso exemplo 5 1 = 4 Total N-1 e no nosso exemplo 15 1 = 14 Resduo ( N-1 ) - [ (B-1) +(G-1) ] = ( BG-1 ) - [ (B-1) +(G-1) ] = (B-1)(G-1) e no nosso exemplo gl resduo = 14-(2+4) = 8 = (3-1)(5-1) = (2)(4) Clculo da estatstica F Varincia Efeito Coluna (presso) = QM colunas / gl colunas = (11,600/4) = 2,900 Varincia Resduo = QM resduo / gl resduo = (2,00/8) = 0,250 F calculado = Var Coluna / Var resduo = Var Presso/ Var resduo = 2,900/0,25 = 11,60
Comando no Minitab para se obter o p-valor associado ao F calculado aps Edit >> Command Line Editor (ou Ctrl+L) digitamos cdf 11.60 k1; F 4 8. let k2 = 1-k1 print k2
K2 0.00206337

clicar no (X) Submit Commands Tabela 8. ANOVA 2 fatores para os dados da Tabela 7. Efeito gl SQ QM F Presso 4 11,600 2,900 11,60 Temperatura 2 23,333 11,667 Erro 8 2,000 0,250 Total 14 36,933
*p<0,05

P 0,002*

.......................................................................................................................................................

13

3) experimento em blocos ao acaso (CRBD) com repeties Nesse item vamos considerar trs situaes. A primeira com os blocos apresentando o mesmo valor mdio em cada tratamento; na segunda situao, temos uma diferena constante entre os valores mdios de cada bloco; e na terceira valores desiguais entre os valores mdios dos blocos em cada tratamento. Entende-se melhor o que queremos explicar por meio dos exemplos. Primeira situao. Valores mdios iguais dos blocos. Exemplo 1. Dados de um experimento em blocos ao acaso com repeties. Tratamentos Blocos A 22 I
Mdias dos blocos

B 31 38 36
35 e 35

C 30 31 38
33 e 33

D 39 42 45
42 e 42

Total das linhas

Mdia dos blocos

26 30
26 e 26

408

34

25 II Total 26 27 156

34 35 36 210

32 33 34 198

41 42 43 252 Total geral: 816 Mdia geral: 34 408 34

Resoluo. Segue-se o mesmo procedimento dos casos anteriores, ou seja, clculo do fator de correo; clculo da soma de quadrados total; clculo da soma de quadrados devido ao fator coluna (tratamentos); clculo da soma de quadrados do fator linha (blocos) e, enfim, onde est a novidade. A resposta, para essa justificada pergunta, a relao:

14

SQ Total = SQ COLUNA + SQ LINHA + SQ RESDUO. Clculo da Soma de Quadrados dos Tratamentos SQ trat = {1562+2102+1982+2522)/6} (816)2/24 = 780,00 Clculo da Soma de Quadrados dos Blocos SQ blocos = {4082+4082)/12} (816)2/24 = 27744-27744 = 0 Clculo da Soma de Quadrados dos Resduos SQ resduo= (x - x )2 onde x o valor de cada clula (casela) e x a mdia de cada casela SQ resduo = {42+02+42}+{42+32+12}+{32+22+52}+{32+02+32} referente ao bloco I +{12+02+12}+{12+02+12}+{12+02+12}+{12+02+12} referente ao bloco I I= = {32+26+38+18}+{2+2+2+2} = 114 + 8 = 122 Nesse nosso exemplo os nmeros calculados indicam: 902,00 = 780,00 + 0 + 122 902,00 = 902,00 relao de igualdade. Concluso: valeu nesse caso a relao: SQ Total = SQ COLUNA + SQ LINHA + SQ RESDUO. Ser que essa relao, na presena de repeties, sempre vlida?

Segunda situao. Valores mdios dos blocos diferem de uma constante. Exemplo 2. Dados de um experimento em blocos ao acaso com repeties. Tratamentos Blocos A 22 B 31 C 30 D 39 Total das linhas Mdia dos blocos

15

I
Mdias dos blocos

26 30
26 e 30

38 36
35 e 39

31 38
33 e 37

42 45
42 e 46

408

34

29 II Total 30 31 168

38 39 40 222

36 37 38 210

45 46 47 264 Total geral: 864


DP 3,41 3,22 3,58 2,97

456

38 Mdia geral: 36

Tratamentos 1 2 3 4

N 6 6 6 6

Mdia 28,00 37,00 35,00 44,00

Nesse caso, tambm, vale a relao:

SQ Total = SQ COLUNA + SQ LINHA + SQ RESDUO.


998,00 = 780,00 + 96 + 122

Terceira situao. Vai aparecer o fator interao! Valores desiguais entre os valores mdios dos blocos em cada tratamento Exemplo 3. Dados de um experimento em blocos ao acaso com repeties. Tratamentos Blocos A 22 I
Mdias dos blocos Total das linhas Mdia dos blocos

B 31 38 36
35 e 51 difere de 16

C 30 31 38
33 e 45 difere de 12

D 39 42 45
42 e 48 difere de 6

26 30
26 e 32 difere de 6

408

34

16

27 II
Total das colunas

47 50 56
258
Tratamentos A B C D

42 45 48
234
N 6 6 6 6 Mdia 29,00 43,00 39,00 45,00

44 47 53
270
DP 4,98 9,51 7,38 4,77

34 35
174

528 Total geral: 936

44 Mdia geral: 39

Nesse caso, tambm, vale ainda a relao:

SQ Total = SQ COLUNA + SQ LINHA + SQ RESDUO.


1874,00 = 912,00 + 600,00 + 254,00 ?? 1874,00 = 1766,00 ?? no (esse caso difere dos outros dois)

Para que seja vlida essa relao de igualdade temos de acrescentar o

valor diferena = 1874,00 1766,00 = 108

Esse valor acrescentado ser denominado de SQ interao : soma de quadrados do fator interao que aparece devido presena de repeties e da diferena entre os valores mdios dos blocos nos tratamentos. O grfico de mdias ajuda-nos a observar (e a verificar) a existncia do efeito interao.

17

50

Blocos 1 2

45

6 16

mdias

40

12

35

30

25 A B C D

Grupos

Figura 1. Grfico de mdias referente s seis condies experimentais. Ilustrao do efeito interao entre as duas variveis em estudo. Para avaliar se essa diferena, entre os quatro valores diferenas, difere estatisticamente temos de aplicar verificar se a razo F do efeito interao estatisticamente significante. Em um experimento em blocos o efeito interao, em geral, no um efeito interessante, ou seja, avaliado. H uma suposio inicial da inexistncia desse efeito interao.

Tabela W. ANOVA dois fatores para os dados do exemplo 3, terceira situao. Efeito gl SQ QM F P Blocos 1 600,00 600,00 37,80 0,001 Tratam 3 912,00 304,00 19,15 0,001 Interao 3 108,00 36,00 2,27 0,120 Erro 16 254,00 15,88 Total 23 1874,00 Por meio do resultado do teste ANOVA 2 fatores, Tabela W, pde-se verificar que o efeito interao estatisticamente no significante (p = 0,120 >0,05). Ento, podemos desconsiderar o valor

18 Soma da Soma de Quadrados correspondente ao efeito interao (no caso foi de 108) e, assim, obtemos uma outra tabela ANOVA, a usual em experimento em blocos ao acaso, que desconsidera o efeito interao, Tabela Z mostrada a seguir. Tabela Z. ANOVA dois fatores para os dados do exemplo 3, terceira situao. Efeito gl SQ QM F P BLOCOS 1 600,00 600,000 TRATAM 3 912,00 304,000 15,96 0,0001 Erro 19 362,00 19,053 Total 23 1874,00

19

4) experimento inteiramente casualizado (CRD) com repeties.


Nesse item vamos considerar os experimentos que seguem um delineamento fatorial. No vamos considerar fatores como blocos. Blocagem, agora, no nos interessa por um motivo de didtica, apenas. Vamos considerar dois fatores, duas variveis experimentais, cujos efeitos sobre a unidade experimental so avaliados pela varivel resposta. Esses efeitos, dessas duas variveis, nos interessam. Queremos avali-los isoladamente, efeitos principais e, tambm, se houver repeties (caso mais freqente, comum) vamos ter de nos enfrentar com o efeito interao. Que significa saber se h ou no diferena entre as diferenas. O termo interao no apresenta, no jargo da estatstica, o mesmo significado quando empregado na cincia biolgica. A Farmacologia, por exemplo, que considera a interao entre as drogas, o efeito da mistura, da ao conjunta entre vrios medicamentos sobre a pessoa em comparao com a ao individual desses medicamentos sobre a pessoa. Considera-se, agora, como exemplo de um delineamento fatorial o mesmo exemplo anterior, mas com uma alterao apenas. Dessa vez, no houve blocagem. No h o fator blocos. A casualizao dos tratamentos no foi restrita aos blocos. No houve restrio alguma quanto ao sorteio dos tratamentos s unidades experimentais. Porm, a forma de anlise dos dados anloga, ou seja, o mesmo procedimento. O novo fator ser denominado de Termociclagem Mecnica, por exemplo, indicado por TCM que apresentar dois nveis. O nvel I como ausncia e o nvel II como presena de TCM. O outro fator, tratamentos, pode ser considerado como Tratamentos Superficiais apresentando quatro diferentes nveis: Controle, Alumina, Rocatec e New. A varivel resposta o resultado do teste de trao (em megapascal, MPa) obtido numa mquina de ensaio universal. A unidade experimental o corpo de prova em forma de cilindro.

20

Exemplo 1. Dados de resistncia a trao (MPa) de um experimento fatorial (tipo 4 x 2) com trs repeties. Tratamentos Superficiais TCM A: controle 22
I: ausncia mdias dos nveis Total das linhas Mdia dos nveis do fator TCM

B: alumina 31 38 36
35 e 51 difere de 16

C: rocatec 30 31 38
33 e 45 difere de 12

D: new 39 42 45
42 e 48 difere de 6

26 30
26 e 32 difere de 6

408

34

27
II: presena Total das colunas

47 50 56
258
Tratamentos A B C D

42 45 48
234
N 6 6 6 6 Mdia 29.00 43.00 39.00 45.00

44 47 53
270
DP 4.98 9.51 7.38 4.77

34 35
174

528 Total geral: 936

44 Mdia geral: 39

Nesse caso, com repeties, vlida a seguinte relao entre as somas de quadrados:

SQ Total = SQ COLUNA + SQ LINHA + SQ Interao + SQ RESDUO. 1874,00 = 912,00 + 600,00 + 254,00 + SQ Interao
Assim SQ interao = 108. Com o mesmo procedimento dos casos anteriores obtm-se a Tabela Y referente ao teste ANOVA (2 fatores) dos dados.

Clculo dos Graus de Liberdade (gl) Fator Linha = TCM = L-1 e no nosso exemplo 2 1 = 1 Fator Coluna = Tratamentos = G-1 e no nosso exemplo 4 1 = 3

21

Total N-1 e no nosso exemplo 24 1 = 23 = (LCR) 1


onde R o nmero de repeties

Fator Interao determinado pelo produto dos graus de liberdade do fator na linha pelo fator coluna = (L-1)(G-1) = (2-1)(4-1) = 3. O gl resduo dado pela diferena entre o gl do total em relao aos outros fatores, ou seja, (24-1)-{(2-1)+(4-1)+(2-1)(4-1)) = 23- (1+3+3) = 23-7 = 16. Ou o gl resduo dado pela frmula gl resduo = (LC)(R 1) onde R o nmero de
repeties; assim gl resduo = (2 x 4)(3-1) = 8 (2) = 16. Tabela Y. ANOVA (2 fatores) dos dados de resistncia a trao (MPa) de um experimento fatorial (tipo 4 x 2) com trs repeties. Efeito gl SQ QM F P Tratamento 3 912,00 304,000 19,15 0,0001* TCM 1 600,00 600,000 37,80 0,0001* Interao 3 108,00 36,000 2,27 0,1198 Erro 16 254,00 15,875 Total 23 1874,00
* p<0,05

A interpretao inicial dos resultados de uma tabela ANOVA (2 fatores) comea pelo efeito do fator interao. Repito. Primeiro avalie o efeito interao. Depois, se for o caso, avalie os efeitos principais. Diante dos efeitos principais numa possvel avaliao h dois casos no grfico de mdias das condies experimentais: interao tipo ordinal e interao do tipo no ordinal. Vamos explicitar o que dissemos acima. Se o efeito interao foi avaliado como significante, ento, pode sempre possvel no avaliar os efeitos principais. O foco de ateno do resultado , ento, o efeito interao e ponto final. Porm, o efeito principal que foi, tambm, avaliado como significante pode ser interpretado (teste de Tukey, por exemplo) se, no grfico de mdias das condies experimentais, ele se mostrar como efeito ordinal (ordinal interaction effect). Ainda, h o caso de o efeito principal que foi, tambm, avaliado como significante no pode ser interpretado (teste de Tukey, por exemplo) se, no grfico de mdias das condies experimentais, ele se mostrar como efeito no ordinal (disordinal interaction effect). Quando h o efeito tipo ordinal as linhas que unem os valores mdios se apresentam como paralelas. Caso contrrio, diante do efeito no ordinal h um cruzamento dessas linhas que unem os valores mdios do grfico de mdias. Se o efeito interao for no significante, ento, vamos interpretar os efeitos principais que apresentaram significncia (p valor inferior ao nvel de significncia).

22 O efeito interao estatisticamente no significante. Assim, o relacionamento entre os nveis do fator Termociclagem expressa mediante a perda de resistncia (diferena entre presena menos ausncia) obtido no grupo controle praticamente a mesma perda de resistncia obtida nos demais tipos de tratamentos superficiais, Figura Z.
TCM ausncia presena

50

45

MPa

40

35

30

25 A B C D

Tratamentos Superficiais

Figura Z. Grfico de mdias referente s seis condies experimentais. Perda de resistncia (indicada pela seta) devido ao da Termociclagem mecnica, TCM, em cada tipo de tratamento.

Pode-se concluir mediante o resultado do teste ANOVA, Tabela Y, que h diferena estatisticamente significante entre os quatro Tratamentos. Para o fator Tratamentos, a hiptese H0(1 = 2 = 3 = 4 ) rejeitada. Os valores mdios diferem!

Teste de comparao mltipla de Tukey (5%) para o efeito Tratamento Superficial Por meio do Teste de Tukey (5%) obtm-se o valor HSD

23

MSW = QM resduo = 15,875 ; n = 6; q crtico = 4,047; HSD = 6,5824

valores das diferenas a serem comparadas com o valor HSD ou dms.(=6,5824) Tratamentos Mdia A B C A 29,000 ---B 43,000 14,000* ---C 39,000 10,000* 4,000 ---D 45,000 16,000* 2,000 6,000
Alfa (nvel de significncia) 0,05 Valor Crtico Q 4,047 Valor Crtico para Comparao = 6,5824 Graus de liberdade do termo Erro (resduo) = 16

Formao de grupos homogneos aps a aplicao do teste de Tukey(5%) Tratamentos Mdia Grupos Homogneos* D 45,000 A B 43,000 A C 39,000 A A 29,000 B
* mdias seguidas de letras diferentes diferem estatisticamente

Pode-se concluir, ainda, mediante o resultado do teste ANOVA, Tabela Y, que h diferena estatisticamente significante entre os dois nveis entre o fator Termociclagem mecnica (TCM). Assim, como so apenas dois nveis desse fator, no h necessidade de se efetuar um teste de comparao mltipla como o teste de Tukey. Se os dois nveis diferem pode-se estabelecer que a condio de ausncia de Termociclagem menos resistente (34,006,77MPa) que a condio de presena de Termociclagem (44,008,37MPa). Quando se comparam as seis condies experimentais entre si, pelo teste de Tukey, obtm-se, por exemplo, que a condio Tratamento A(controle) sem TCM a menos resistente (mdia igual a 26MPa) enquanto as mais resistentes so as condies Tratamentos B (alumina) e D(new) com TCM. Outras consideraes podem ser ainda obtidas. Trata B TCM 2 Mdia Grupos Homogneos* 51 A

24 D C D B C A A 2 2 1 1 1 2 1 48 45 42 35 33 32 26 A AB ABC BCD CD CD D

* mdias seguidas de letras diferentes diferem estatisticamente

Alfa (nvel de significncia) 0,05 Valor Crtico Q 4,903 Valor Crtico para Comparao = 11,278 Graus de liberdade do termo Erro (resduo) = 16 ...............................................................................................................

25

Apndice

Clculo direto da Soma de Quadrados do Fator Interao


Experimento inteiramente casualizado. Planejamento fatorial (com repeties). Experimento inteiramente casualizado. Planejamento fatorial. Mdicos psiquiatras de um centro de Trauma desenvolveram um programa para ajudar as vtimas de danos cerebrais a conseguirem alcanar certo nvel aceitvel de independncia. No experimento participaram 27 pessoas com o mesmo grau de dano cerebral. O objetivo foi comparar diferentes combinaes de tratamentos psiquitricos e de fisioterapias. Para cada pessoa foi designada uma das 9 diferentes combinaes de trs tratamentos psiquitricos e de trs programas de fisioterapias. Houve trs sujeitos para cada combinao. A varivel resposta o nmero de meses de durao entre o indivduo da terapia e o tempo no qual o paciente foi capaz de voltar a agir com independncia. Os resultados foram apresentados na forma de tabela mostrada a seguir.
Valores obtidos por 27 pessoas submetidas ao teste psiquitrico e ao programa de fisioterapia.

Programa de fisioterapia 1 2 3
soma mdia

Tratamento psiquitrico 9 10 10 A 10 11 12 11 12 15 10 11 12 B 11 12 14 12 15 16 13 15 13 C 11 12 15
124 13,78

13 15 17

100 113 11,11 12,55 Soma geral = 337 ; Mdia geral = 12,48

vamos dispor os dados de uma forma conveniente para o clculo da SQ interao Programa Tratamento Psiquitrico = fator A Fisioterapia Total = Fator B 1 2 3 9 10 13 1 10 11 11 100 11 12 13

total a1b1: 30
2 10 11 12

total a2b1: 33
11 12 15

total a3b1: 37
15 12 15 113

total a1b2: 33
3 10 12 15

total a2b2: 38
12 14 16

total a3b2: 42
13 15 17 124

total a1b3: 37
100

total a2b3: 42
113

total a3 b3: 45
124

337

26

J sabemos - procedimento visto anteriormente -, como efetuar o clculo da SQ das linhas e das colunas. Ou seja, somo o total da coluna (ou da linha) e elevo ao quadrado e esse valor deve ser dividido pelo nmero de elementos (tamanho da amostra, nmero de repeties) e, dessa soma geral subtramos o fator de correo, FC = (X)2 / N). Agora, o procedimento bem parecido para se obter a SQ do fator interao. O procedimento o seguinte: 1) Clculo da SQ AB ou SQ Tratamentos AB a1b1 3 30 900 as 9 condies experimentais (os 9 tratamentos: 3 x 3) a2b1 a3b1 a1b2 a2b2 a3b2 a1b3 a2b3 3 3 3 3 3 3 3 33 37 33 38 42 37 42 1089 1369 1089 144 1764 1369 1764 a3b3 3 45 2025

N Total: T

T2

T2 = 12813,00 (12813,00) / 3 = 4271,00


FC = (X)2 / N) = (337)2/27 = 4206,2593 SQ tratam AB = 4271,00 - (337)2/27 = 4271,00 4206,2593 = 64,7407 2) Clculo da SQ A. Clculo da SQ B. Temos de obter essas somas porque a SQ interao obtida pela diferena entre o valor calculado antes (SQ tratam AB) e a soma (SQA+SQB).

SQ A = {(1002+1132+1242) / 9 FC} = (38145,00/9) 4206,2593 = 4238,3333 - 4206,2593 = 32,0740 SQ B = {(1002+1132+1242) / 9 FC} = (38145,00/9) 4206,2593 = 4238,3333 - 4206,2593 = 32,0740
3) Clculo da SQ interao SQ trata AB = SQ A + SQ B + SQ interao

SQ interao

= SQ trata AB { SQ A + SQ B}

SQ interao = 64,7407 - {32,074 + 32,074} = 64,7407 - 64,148 = 0,593aprox. SQ interao = 0,593 Varincia do fator interao = { SQ interao = 0,593} / gl interao O nmero de graus de liberdade (gl) do fator interao dado pelo produto (a-1)(b-1) no nosso exemplo, gl inter = (3-1)(3-1) = 4 Portanto Varincia do fator interao = 0,593/4 = QM inter = 0,1481

Frmula do nmero de graus de liberdade (gl) na ANOVA 2 fatores de um experimento fatorial

27 Efeito gl no nosso exemplo a-1 3 -1 = 2 b-1 3 -1 = 2 Interao (a-1)(b-1) (3-1)(3-1) = 2 x 2 = 4 Erro ab(r -1) (3)(3)[3-1] = 9 x 2 = 18 Total: N-1= abr-1 27-1 = 3(3)(3) 1 = 26 r ... corresponde ao nmero de repeties (no nosso exemplo 3) A: B: (A x B):

Você também pode gostar