Escolar Documentos
Profissional Documentos
Cultura Documentos
Em muitos trabalhos, que envolvem a realizao de experimentos, comum os pesquisadores se depararem com a questo: como avaliar se os resultados obtidos so confiveis? Sabemos que qualquer medida realizada sempre afetada por erros. Erros muito pequenos no traro grandes implicaes. Contudo, se forem significativos, podero prejudicar seriamente os resultados levando a falsas concluses. Portanto conhecer a natureza dos erros e preparar planejamentos que possam minimiz-los uma estratgia que deve estar presente no dia-a-dia de todo pesquisador. Existem dois tipos de erros, o erro sistemtico e o erro aleatrio. O primeiro tem como caracterstica afetar os resultados dos experimentos sempre na mesma direo, seja para mais ou para menos. Um exemplo simples deste tipo de situao o caso de uma balana descalibrada que pode indicar sempre massas maiores que as reais. Mas vale notar que os erros sistemticos podem ser identificados e, portanto, evitados. Por outro lado, h um tipo de erro que afeta as medidas sem nenhuma tendncia clara. As medidas podem oscilar, ora para mais, ora para menos. Este tipo e erro chamado de erro aleatrio e, infelizmente, sempre estar presente em maior ou menor grau. Ao fazer um estudo sempre interessante fazer replicatas, repeties, pois permite que o erro presente nas medidas seja investigado. Alm disso, com a realizao de vrias replicatas aumentam as chances de se aproximar mais do valor exato. Isto evidenciado por um importante princpio da estatstica: o teorema do limite central, que comprova que o erro no valor mdio menor que o erro de uma observao individual (referncia: Barros Neto, B,
Scarminio, I.S., Bruns, R.E. Como fazer experimentos: pesquisa e desenvolvimento na cincia e na indstria. Ed. da Unicamp; Campinas, 2001).
Muitas vezes as caractersticas do procedimento experimental dificultam muito a execuo de replicatas autnticas. No correto simplesmente realizar duas medidas do mesmo experimento de forma seqencial, pois um erro que afetar a primeira medida certamente ir, de forma sistemtica, afetar a seguinte.
nessa introduo as idias expostas foram copiadas do artigo: Conseqncias da anlise incorreta de experimentos blocados, sob autoria de Joo Alexandre Bortoloti e Roy Edward Bruns. Artigo publicado na revista Qumica Nova, vol. 30, n 2, pgs. 436-440, 2007.
No so raros os casos em que o ajuste das condies experimentais extremamente trabalhoso ou lento. Portanto, parece haver um dilema, realizar medidas com duplicatas e arcar com o custo do trabalho envolvido, mas garantir a qualidade das medidas, ou evitar um grande esforo no laboratrio, mas correr o risco de ter todo o seu trabalho prejudicado. neste contexto que surge uma interessante possibilidade, a blocagem dos experimentos.
continuao da aula sobre Anova 1 fator
Ao analisar os dados classificados em dupla-entrada, temos de aplicar o mtodo da classificao 1 fator duas vezes: - uma vez para cada sistema de classificao. Em resumo, a anova 1 fator duas vezes (uma vez para o fator na coluna e uma vez para o fator na linha). Veremos a aplicao desse mtodo (anova 2 fatores) em dois tipos de delineamentos: CRD e CRBD sob presena ou ausncia de repeties, replicatas. Por repetio (replicata) se entende um teste completo de todos os tratamentos no experimento (a replication is a complete run for all treatments to be tested in the experiment). 1) experimento inteiramente ao acaso (completely randomized design, CRD) sem repeties; 2) experimento em blocos ao acaso (randomized complete block design (CRBD) sem repeties;
3) experimento em blocos ao acaso (CRBD) com repeties; 4) experimento inteiramente casualizado (CRD) com repeties.
1) CRD. Experimento inteiramente ao acaso , sem repeties. Exemplo 1. Por exemplo, 12 jovens foram classificados em trs grupos de acordo com a idade deles. Ao mesmo tempo eles foram classificados de acordo com o sexo em dois grupos: masculino e feminino. Assim, cada jovem esteve sujeito a dois sistemas de classificao simultaneamente, Tabela 1. Tabela 1. Dados obtidos no experimento tipo CRD. colunas linhas 1 2 3 total coluna mdia coluna efeito coluna
1 6 8 4 18 6 -1
2 2 9 4 15 5 -2
3 9 11 10 30 10 +3
4 3 12 6 21 7 0
total linha 20 40 24 84
mdia linha 5 10 6 7
efeito linha -2 +3 -1 0
(-1) = efeito coluna = mdia coluna 1(=6) mdia geral (=7) (+3) = efeito linha = mdia linha 2(=10) mdia geral (=7)
Anlise dos dados segundo a classificao do fator linha. anova 1 fator. SQ linha = 4{(-2)2 + (3)2+ (-1)2} = 56 Anlise dos dados segundo a classificao do fator coluna. anova 1 fator. SQ coluna = 3{(-1)2 + (-2)2+ (3)2+(0)2} = 42 Clculo da Soma de Quadrados Total SQ Total*= x2 (X)2 / n =
* deduo dessa frmula = SQ = (x-)2 = (x2-2x +2) = (x2)-2x +(2)= x2-22n +n 2 =x2- n2 = x2- n(x)2/ n2 = x2 (x)2 / n que a forma usual do clculo da soma de quadrados total.
Denomina-se experimento inteiramente ao acaso quando os tratamentos (fatores) so designados s unidades experimentais sem qualquer restrio. Esse tipo de delineamento s pode ser conduzido quando as unidades experimentais (corpos-de-prova, pessoas, etc...) so similares. Por similares deve-se entender: no no sentido de igualdade, mas no sentido de que essas unidades respondem ao tratamento da mesma forma.
SQ Total = SQ LINHA + SQ COLUNA + SQ RESDUO assim, SQ RESDUO = SQ Total (SQ LINHA + SQ COLUNA) SQ RESDUO = 120 (56+42) = 120 98 = 22
b) por meio do clculo direto (mtodo mais trabalhoso) 22+(-1) 2+12+(-2)2+(-1)2+12+(-2)2+22+(-1)2+02+12+02 = 4+1+1+4+1+1+4+4+1+0+1+0 = 22
Clculo dos Graus de Liberdade (gl) Fator Linha = Blocos = b-1 e no nosso exemplo 3 1 = 2 Fator Coluna = G-1 e no nosso exemplo 4 1 = 3 Total N-1 e no nosso exemplo 12 1 = 11 Resduo ( N-1 ) - [ (B-1) +(G-1) ] = ( BK-1 ) - [ (B-1) +(G-1) ] = (B-1)(G-1) e no nosso exemplo o gl resduo igual a 11-(2+3) = 6 = (3-1)(4-1) = (2)(3)
gl
3-1= 2 4-1=3
SQ 56 42 22 120
QM
56/2= 28 42/3= 14 22/6= 3,67
razo F
28/3,67= 7,64 14/3,67= 3,82
p-valor
0,0224150* 0,0764059
6
12-1= 11
Concluso. Apenas o efeito fator (Linhas) estatisticamente significante. Os valores mdios dos trs nveis diferem. H pelo menos uma diferena entre as trs mdias. No temos condies, por meio do teste anova, de dizer se a diferena se encontra entre a linha 1 e a linha 2 ou entre a 1 e a 3 ou entre a 2 e a 3. O teste de comparao mltipla de Tukey, por exemplo, poder nos indicar qual desses trs pares de mdias apresenta diferena estatstica.
..................................................................................................................
2) CBRD. Experimento em blocos ao acaso , sem repeties. Vamos considerar, agora, os experimentos casualizados. Nesse delineamento os tratamentos so designados s unidades experimentais com certa restrio: so sorteados dentro de cada bloco. Neste item ao considerar os CBRD vamos estudar os casos sem repetio, ou seja, com apenas uma aplicao dos tratamentos s unidades experimentais. Para a anlise dos dados em planejamentos desse tipo, convm recordar o que foi dito anteriormente: ao analisar os dados classificados em dupla-entrada, temos de aplicar o mtodo da classificao 1 fator duas vezes: - uma vez para cada sistema de classificao. Em resumo, a anova 1 fator duas vezes (uma vez para o fator na coluna e uma vez para o fator na linha). Quando as unidades experimentais no so similares, devia ser intuitivamente claro que as variaes nas unidades por si mesmas poderiam ofuscar (obscurecer) os verdadeiros efeitos do tratamento. O mtodo de blocagem considera forma de avaliar as unidades heterogneas em todos os tipos de experimentao.
O CBRD um delineamento no qual as unidades - s quais os tratamentos so aplicados - so subdivididas em grupos homogneos (chamados de blocos), de modo que o nmero de unidades em um bloco seja igual ao nmero (ou algum mltiplo do nmero) de tratamentos que esteja sendo estudado. Os tratamentos so ento designados ao acaso s unidades experimentais dentro de cada bloco. Deve-se enfatizar que cada tratamento aparece em cada um dos blocos, e cada bloco recebe cada um dos tratamentos em estudo. Assim, cada um dos blocos inclui todos os tratamentos. Dentro de cada bloco os tratamentos so atribudos s parcelas inteiramente ao acaso. Para que o experimento seja eficiente (aumente em preciso, diminuio da varincia erro ou resduo), dever cada bloco ser to uniforme quanto possvel, mas os blocos podero diferir bastante uns dos outros. O pesquisador s deve optar por experimento tipo CRD quando dispe de nmero suficientemente grande de unidades experimentais similares. Como isso nem sempre acontece na prtica, preciso um delineamento que permita comparar adequadamente os tratamentos, mesmo que as unidades apresentem certa heterogeneidade. Unidades similares so agrupadas (d-se o nome de blocos a esse conjunto de unidades similares). Os experimentos em blocos ao acaso surgiram na rea agrcola. O campo era dividido em blocos e os blocos eram divididos em parcelas que recebiam os tratamentos (adubo, por exemplo) em investigao. Ento o termo bloco designava originalmente, uma faixa de terra de mesma fertilidade. Esse tipo de delineamento surgiu em 1925 na Inglaterra por R. A. Fisher que foi, tambm, o idealizador do mtodo ANOVA. O bloco pode ser uma faixa de terra, uma ala de estufa, um perodo de tempo, uma ninhada, uma partida de produtos industriais, uma faixa de idade tudo depende do que est em experimentao. O CBRD pode ser empregado de forma muito eficiente quando um experimento deve ser efetuado em mais de um laboratrio (blocos) ou quando vrios dias (blocos) so necessrios para a sua realizao. O essencial que os blocos renem unidades similares e que haja variabilidade entre blocos. No teria sentido organizar esses blocos se no houvesse variabilidade entre eles. Quem vai decidir se a variabilidade entre as unidades justifica ou no a formao de blocos o pesquisador, no o estatstico. Embora o bloco deva reunir unidades similares, isso no significa que essa reunio deva ser fsica. Por exemplo, se um mdico pretende comparar duas drogas hipotensoras, A e B, e considerar que a presso arterial do paciente, no incio do tratamento, importante na resposta do paciente droga, deve organizar blocos. Cada bloco ser formado por um par de pacientes com presses arteriais similares, mas, para formar os blocos, o mdico no precisa colocar seus pacientes em fila, nem junt-los aos pares. Basta reunir os dados numricos. Dois pacientes do mesmo bloco no precisam nem mesmo se conhecer. O objetivo do CBRD isolar e remover do termo resduo (erro) a variao atribuvel aos blocos, aumentando assim a preciso do experimento sem aumentar o nmero de unidades experimentais.
Historicamente, os blocos casualizados o primeiro delineamento vlido para estimar o erro experimental e testar a significncia dos efeitos de tratamento apesar da heterogeneidade das unidades experimentais sobre as quais as observaes so realizadas. Esse delineamento revolucionou os experimentos na agricultura no mundo todo. No seria um exagero afirmar que ele ainda a espinha dorsal do delineamento da cincia experimental. Porm, nenhum delineamento torna-se popular e aceito para uso geral, no importa quo bem fundamentado do ponto de vista estatstico que ele seja, se for complicado e difcil de empreend-lo. A beleza desse planejamento em blocos a feliz combinao de validade, simplicidade e flexibilidade. O planejamento em blocos consiste de duas etapas. A primeira a de coletar, reunir, as unidades afins, similares para juntas formarem um grupo homogneo; esse grupo formado chamado de bloco. Essa operao conhecida como blocagem. A segunda etapa a de designar os vrios tratamentos ao acaso s unidades dentro de cada bloco. Essa a principal diferena entre o delineamento em blocos e o delineamento inteiramente casualizado. Em termos de casualizao pode-se considerar que, em blocos, h uma restrio. Veremos, a seguir, a aplicao desse mtodo para um experimento onde a unidade experimental a pessoa que vira bloco. Ela recebe, sob aplicao aleatria, dois tratamentos A e B. Convm recordar que, experimentos desse tipo, onde a unidade experimental a pessoa que recebe todos os tratamentos em comparao, um caso especial de experimento em blocos casualizados . Toda vez que a pessoa que participa do experimento recebe todos os tratamentos em comparao, essa pessoa um bloco no uma unidade. Esse tipo de experimento muito criticado. Por exemplo, a diferena que se mede na pessoa, antes e depois de uma srie de exerccios fsicos, s seria explicada pelos prprios exerccios fsicos? De qualquer forma, so feitos experimentos em que cada pessoa um bloco. O pesquisador precisa apenas estar alerta para o fato que possvel de a pessoa se modificar por qualquer outro motivo, que no o tratamento. Embora os experimentos em que se toma cada indivduo como bloco sejam bastante comuns preciso muito senso crtico para planej-los. Muitas vezes esses experimentos no tm qualquer validade. O pesquisador planeja um experimento em blocos ao acaso quando pretende eliminar uma causa de variao. Por exemplo, para testar o efeito de um hormnio sobre o crescimento
Muitas idias aqui apresentadas foram selecionadas do livro: Estatstica Experimental. Autores: S. Vieira & R. Hoffmann. Ed. Atlas. Ano 1989.
de ratos se os ratos disponveis so de diferentes idades o pesquisador deve organizar blocos que correspondam s idades. Os blocos tambm ampliam a validade da concluso. Por exemplo, se um entomologista quer comparar a eficincia de diversos inseticidas, tanto pode usar insetos de uma nica espcie como fazer a comparao usando insetos de vrias espcies. O experimento seria em blocos ap acaso se cada espcie fosse um bloco. Os blocos teriam a vantagem de ampliar a validade da concluso. Isto porque o entomologista poderia, com base em um s experimento, estabelecer concluses para vrias espcies. Em termos de eficincia, ou seja, de uma comparao de tratamentos qual seria o melhor delineamento: CRD ou CBRD? Qual seria a conseqncia de uma m escolha? Para responder temos de considerar o nmero de graus de liberdade do resduo. Vamos, ento, realizar uma comparao entre o nmero de graus de liberdade do resduo de um experimento CRD frente a um experimento tipo CRBD. Na tabela ANOVA obtm-se um valor igual a (k-1)(r-1) para um experimento em blocos; enquanto, para um experimento CRD, o gl do resduo ser igual a k(r1), onde r o nmero de rplicas (ou repeties). Se k for igual a 3 e r = 20, ento, o gl de resduo do CBRD seria igual a (3-1)(20-1) = 2 x 19 = 38 e o gl do CRD seria igual a 3(20-1) = 3 x 19 = 57. Essa diferena de 57 38 = 19 representa r-1 graus de liberdade, em geral. Em termos de notao, temos inicialmente no CRD k(r-1) e depois no CBRD (k-1)(r-1), isto , k(r-1) (k-1)(r-1) = r-1 graus de liberdade a menos sob a escolha de um possvel mau delineamento. Como o valor de F na tabela (F, de valores crticos) aumenta quando diminui o nmero de graus de liberdade de resduo, fcil entender que o uso indevido de blocos torna o teste menos sensvel. Fcalculado = QM Trat / QM resduo ; assim, quanto menor Fcalc e maior o F tabela mais difcil para que se estabelea a condio de rejeitar Ho, ou seja, de que Fcalc > F tabelado . QM resduo = SQ res / gl res ; assim, quanto menor res implica aumento de QM resduo que gl traz como conseqncia uma diminuio de Fcalc.
Exemplo 1. Experimento em blocos (CBRD), sem repeties. Numa pesquisa sobre o efeito do leo de milho no teor de colesterol do sangue, o mdico Dr. Bem Hur obteve os seguintes dados, de 7 pacientes, Tabela 3. Tabela 3. Teor de colesterol no sangue, em mg por 100g, de sete pacientes. Pacientes 1 2 3 4 5 6 7
Totais de Tratamentos Mdias de Tratamentos
Tratamentos (dois tipos de dietas) A B 270 410 350 360 350 430 268
2438 348,286
Totais dos blocos 445 718 598 591 546 620 520
Mdias dos blocos 222,5 359,0 299,0 295,5 273,0 310,0 260,0
A anlise feita tomando-se os pacientes como blocos. Para casos desse tipo, pode-se dizer em termos gerais, que a mesma anlise dos delineamentos tipo ANOVA de medidas repetidas e, nesse especial caso, a mesma anlise que se obtm com o teste t-Student de amostras pareadas (estatstica t = 4,66; vale a relao estatstica F da anova igual ao valor da estatstica t-Student ao quadrado, ou seja, F = t2 = 4,662 = 21,71). Pelo mesmo procedimento do caso anterior obtm-se o seguinte resultado do teste ANOVA 2 fatores, Tabela 4. Tabela 4. ANOVA 2 fatores pata os dados da Tabela 3.
Efeito (ou fonte de variao) Blocos Tratamentos Resduo Total *p<0,05 gl 7-1= 6 2-1=1 6 14-1= 13 SQ 22000,40 50160,30 13862,70 86023,40 QM 22000,40/6= 3666,70 50160,30/1= 50160,30 13862,70/6= 2310,50 razo F p-valor
0,003*
Concluso. O efeito fator Tratamento (colunas) estatisticamente significante. Os valores mdios dos dois nveis diferem (A: 348,3 62,2mg; B: 228,6 45,9mg). O teste de comparao mltipla de Tukey, no precisa ser efetuado porque so apenas dois nveis do fator Tratamento. O
9 clculo de F para blocos desnecessrio. Os experimentos tipo CRBD so feitos, essencialmente, para comparar tratamentos a comparao de blocos secundria.
Exemplo 2. Experimento em blocos (CBRD), sem repeties. Um experimento foi delineado para estudar o desempenho de quatro diferentes detergentes de tecidos de roupas. Os seguintes ndices de limpeza, Tabela 5, foram obtidos (maior o ndice maior a limpeza) por meio de um instrumento especial para trs diferentes tipos comuns de manchas. A hiptese da pesquisa saber se h diferena entre os detergentes? Tabela 5. ndice de limpeza de 12 tecidos manchados segundo tipo de detergente e tipo de mancha. Detergentes Total (mdia: x ) Manchas
1 1 2 3 2 3 4
45 43 51
139 46,333
47 46 52
145 48,333
48 50 55
153 51,000
42 37 49
128 42,667
Total (mdia: x )
565
mdia geral: 565/12 = 47,083
Resoluo Vamos aplicar a mesma frmula, porm, com outra forma , mais direta, para se obter as somas de quadrados entre grupos (referente s colunas e/ou s linhas). SQE = (T2/n) - (FC); onde T... o total da coluna (ou linha); n ... o tamanho da amostra e FC o chamado fator de correo dado pela soma dos valores ao quadrado dividido pelo tamanho amostral total, ou seja, FC = (x)2 / N. Anlise dos dados segundo a classificao do fator Detergente coluna. anova 1 fator. SQ coluna = [ (1392/3) + (1452/3) +(1532/3)+(1282/3) ] (182+176+207)2/12 = SQ coluna = 26713,000 26602,083 = 110,917 Anlise dos dados segundo a classificao do fator Mancha linha (blocos). anova 1 fator. SQ linha = 1822/4 + 1762/4 +2072/4 (182+176+207)2/12 = 135,167 Clculo da Soma de Quadrados Total SQ Total = x2 FC = x2 (x)2 / n
SQ = (x-)2 = (x2-2x +2) = (x2)-2x +(2)= x2-22n +n 2 =x2- n2 = x2- n(x)2/ n2 = x2 (x)2 / n que a forma usual do clculo da soma de quadrados total. Dessa forma usual vem SQfator coluna = n( x -)2 = n x 2 (x)2 / n = n(x)2/n2 (x)2 / n = (Total)2/n (x)2 / n = (T2 /n) FC.
10
SQ Total = (452+432+512+472+462+522+482+502+552+422+372+492 ) (565)2/12 = 264,917 SQ Total = 26867,000 26602,083 = 264,917 SQ Total = SQ LINHA + SQ COLUNA + SQ RESDUO assim, SQ RESDUO = SQ Total (SQ LINHA + SQ COLUNA) SQ RESDUO = 264,917 (135,167+110,917) = 264,917 246,084 = 18,833
Tabela 6. ANOVA 2 fatores para os dados da Tabela 5.
F 11,78
P 0,006*
Concluso: H diferena estatisticamente significante entre os quatro detergentes. A hiptese H0(1 = 2 = 3 = 4 ) rejeitada. Os valores mdios diferem! Teste de comparao mltipla de Tukey (5%) para o efeito Detergente Por meio do Teste de Tukey (5%) obtm-se o valor HSD
Detergente 1 2 3 4
2( x =48,333) 3( x =51)
2,667 5,667*
8,333*
Alfa (nvel de significncia) 0,05 Valor Crtico Q 4,897 Valor Crtico para Comparao = 5,0095 Graus de liberdade do termo Erro (resduo) = 6
Formao de grupos homogneos aps a aplicao do teste de Tukey(5%) Detergente Mdia Grupos Homogneos* 3 51,000 A 2 48,333 A 1 46,333 AB 4 42,667 B
11
* mdias seguidas de letras diferentes diferem estatisticamente
Alfa (nvel de significncia) 0,05 Valor Crtico Q 4,897 Valor Crtico para Comparao = dms = HSD = 5,0095 Graus de liberdade do termo Erro (resduo) = 6
Concluso: Grupos 1 e 4 (letra A e AB) no diferem entre si (letra B comum). Grupo 4 (letra B) difere dos grupos 2 e 3 (letra A). Grupo 1 (letra AB) no difere do grupo 4 e, tambm, no difere dos grupos 2 e 3, ou seja, o detergente 1 ocupa um comportamento intermedirio em relao aos outros trs detergentes. Quanto limpeza o pior detergente o tipo 4. Os detergentes tipo 1, 2 e 3 no apresentaram diferena do ponto de vista estatstico.
........................................................................................................................................................
Resoluo
FC = fator de correo da soma de quadrados = (44)2/15 = 129,067 SQ Total = SQ Total = x2 (X)2 / n = 166 (44)2/15= 166 129,067 = 36,933 SQ linha = SQ temperatura = SQ blocos = (232+132+82) / 5 FC = 152,400-129,067 = 23,333 SQ coluna = SQ presso = (92+62+132+62+102) / 3 FC = 140,667-129,067 = 11,600 SQ Total = SQ LINHA + SQ COLUNA + SQ RESDUO assim, SQ RESDUO = SQ Total (SQ LINHA + SQ COLUNA) SQ RESDUO = 36,933 (23,333+11,600) = 36,933 34,933 = 2,000 Clculo dos Graus de Liberdade (gl) Fator Linha = Blocos = b-1 e no nosso exemplo 3 1 = 2
12
Fator Coluna = Presso = G-1 e no nosso exemplo 5 1 = 4 Total N-1 e no nosso exemplo 15 1 = 14 Resduo ( N-1 ) - [ (B-1) +(G-1) ] = ( BG-1 ) - [ (B-1) +(G-1) ] = (B-1)(G-1) e no nosso exemplo gl resduo = 14-(2+4) = 8 = (3-1)(5-1) = (2)(4) Clculo da estatstica F Varincia Efeito Coluna (presso) = QM colunas / gl colunas = (11,600/4) = 2,900 Varincia Resduo = QM resduo / gl resduo = (2,00/8) = 0,250 F calculado = Var Coluna / Var resduo = Var Presso/ Var resduo = 2,900/0,25 = 11,60
Comando no Minitab para se obter o p-valor associado ao F calculado aps Edit >> Command Line Editor (ou Ctrl+L) digitamos cdf 11.60 k1; F 4 8. let k2 = 1-k1 print k2
K2 0.00206337
clicar no (X) Submit Commands Tabela 8. ANOVA 2 fatores para os dados da Tabela 7. Efeito gl SQ QM F Presso 4 11,600 2,900 11,60 Temperatura 2 23,333 11,667 Erro 8 2,000 0,250 Total 14 36,933
*p<0,05
P 0,002*
.......................................................................................................................................................
13
3) experimento em blocos ao acaso (CRBD) com repeties Nesse item vamos considerar trs situaes. A primeira com os blocos apresentando o mesmo valor mdio em cada tratamento; na segunda situao, temos uma diferena constante entre os valores mdios de cada bloco; e na terceira valores desiguais entre os valores mdios dos blocos em cada tratamento. Entende-se melhor o que queremos explicar por meio dos exemplos. Primeira situao. Valores mdios iguais dos blocos. Exemplo 1. Dados de um experimento em blocos ao acaso com repeties. Tratamentos Blocos A 22 I
Mdias dos blocos
B 31 38 36
35 e 35
C 30 31 38
33 e 33
D 39 42 45
42 e 42
26 30
26 e 26
408
34
25 II Total 26 27 156
34 35 36 210
32 33 34 198
Resoluo. Segue-se o mesmo procedimento dos casos anteriores, ou seja, clculo do fator de correo; clculo da soma de quadrados total; clculo da soma de quadrados devido ao fator coluna (tratamentos); clculo da soma de quadrados do fator linha (blocos) e, enfim, onde est a novidade. A resposta, para essa justificada pergunta, a relao:
14
SQ Total = SQ COLUNA + SQ LINHA + SQ RESDUO. Clculo da Soma de Quadrados dos Tratamentos SQ trat = {1562+2102+1982+2522)/6} (816)2/24 = 780,00 Clculo da Soma de Quadrados dos Blocos SQ blocos = {4082+4082)/12} (816)2/24 = 27744-27744 = 0 Clculo da Soma de Quadrados dos Resduos SQ resduo= (x - x )2 onde x o valor de cada clula (casela) e x a mdia de cada casela SQ resduo = {42+02+42}+{42+32+12}+{32+22+52}+{32+02+32} referente ao bloco I +{12+02+12}+{12+02+12}+{12+02+12}+{12+02+12} referente ao bloco I I= = {32+26+38+18}+{2+2+2+2} = 114 + 8 = 122 Nesse nosso exemplo os nmeros calculados indicam: 902,00 = 780,00 + 0 + 122 902,00 = 902,00 relao de igualdade. Concluso: valeu nesse caso a relao: SQ Total = SQ COLUNA + SQ LINHA + SQ RESDUO. Ser que essa relao, na presena de repeties, sempre vlida?
Segunda situao. Valores mdios dos blocos diferem de uma constante. Exemplo 2. Dados de um experimento em blocos ao acaso com repeties. Tratamentos Blocos A 22 B 31 C 30 D 39 Total das linhas Mdia dos blocos
15
I
Mdias dos blocos
26 30
26 e 30
38 36
35 e 39
31 38
33 e 37
42 45
42 e 46
408
34
29 II Total 30 31 168
38 39 40 222
36 37 38 210
456
38 Mdia geral: 36
Tratamentos 1 2 3 4
N 6 6 6 6
Terceira situao. Vai aparecer o fator interao! Valores desiguais entre os valores mdios dos blocos em cada tratamento Exemplo 3. Dados de um experimento em blocos ao acaso com repeties. Tratamentos Blocos A 22 I
Mdias dos blocos Total das linhas Mdia dos blocos
B 31 38 36
35 e 51 difere de 16
C 30 31 38
33 e 45 difere de 12
D 39 42 45
42 e 48 difere de 6
26 30
26 e 32 difere de 6
408
34
16
27 II
Total das colunas
47 50 56
258
Tratamentos A B C D
42 45 48
234
N 6 6 6 6 Mdia 29,00 43,00 39,00 45,00
44 47 53
270
DP 4,98 9,51 7,38 4,77
34 35
174
44 Mdia geral: 39
Esse valor acrescentado ser denominado de SQ interao : soma de quadrados do fator interao que aparece devido presena de repeties e da diferena entre os valores mdios dos blocos nos tratamentos. O grfico de mdias ajuda-nos a observar (e a verificar) a existncia do efeito interao.
17
50
Blocos 1 2
45
6 16
mdias
40
12
35
30
25 A B C D
Grupos
Figura 1. Grfico de mdias referente s seis condies experimentais. Ilustrao do efeito interao entre as duas variveis em estudo. Para avaliar se essa diferena, entre os quatro valores diferenas, difere estatisticamente temos de aplicar verificar se a razo F do efeito interao estatisticamente significante. Em um experimento em blocos o efeito interao, em geral, no um efeito interessante, ou seja, avaliado. H uma suposio inicial da inexistncia desse efeito interao.
Tabela W. ANOVA dois fatores para os dados do exemplo 3, terceira situao. Efeito gl SQ QM F P Blocos 1 600,00 600,00 37,80 0,001 Tratam 3 912,00 304,00 19,15 0,001 Interao 3 108,00 36,00 2,27 0,120 Erro 16 254,00 15,88 Total 23 1874,00 Por meio do resultado do teste ANOVA 2 fatores, Tabela W, pde-se verificar que o efeito interao estatisticamente no significante (p = 0,120 >0,05). Ento, podemos desconsiderar o valor
18 Soma da Soma de Quadrados correspondente ao efeito interao (no caso foi de 108) e, assim, obtemos uma outra tabela ANOVA, a usual em experimento em blocos ao acaso, que desconsidera o efeito interao, Tabela Z mostrada a seguir. Tabela Z. ANOVA dois fatores para os dados do exemplo 3, terceira situao. Efeito gl SQ QM F P BLOCOS 1 600,00 600,000 TRATAM 3 912,00 304,000 15,96 0,0001 Erro 19 362,00 19,053 Total 23 1874,00
19
20
Exemplo 1. Dados de resistncia a trao (MPa) de um experimento fatorial (tipo 4 x 2) com trs repeties. Tratamentos Superficiais TCM A: controle 22
I: ausncia mdias dos nveis Total das linhas Mdia dos nveis do fator TCM
B: alumina 31 38 36
35 e 51 difere de 16
C: rocatec 30 31 38
33 e 45 difere de 12
D: new 39 42 45
42 e 48 difere de 6
26 30
26 e 32 difere de 6
408
34
27
II: presena Total das colunas
47 50 56
258
Tratamentos A B C D
42 45 48
234
N 6 6 6 6 Mdia 29.00 43.00 39.00 45.00
44 47 53
270
DP 4.98 9.51 7.38 4.77
34 35
174
44 Mdia geral: 39
Nesse caso, com repeties, vlida a seguinte relao entre as somas de quadrados:
SQ Total = SQ COLUNA + SQ LINHA + SQ Interao + SQ RESDUO. 1874,00 = 912,00 + 600,00 + 254,00 + SQ Interao
Assim SQ interao = 108. Com o mesmo procedimento dos casos anteriores obtm-se a Tabela Y referente ao teste ANOVA (2 fatores) dos dados.
Clculo dos Graus de Liberdade (gl) Fator Linha = TCM = L-1 e no nosso exemplo 2 1 = 1 Fator Coluna = Tratamentos = G-1 e no nosso exemplo 4 1 = 3
21
Fator Interao determinado pelo produto dos graus de liberdade do fator na linha pelo fator coluna = (L-1)(G-1) = (2-1)(4-1) = 3. O gl resduo dado pela diferena entre o gl do total em relao aos outros fatores, ou seja, (24-1)-{(2-1)+(4-1)+(2-1)(4-1)) = 23- (1+3+3) = 23-7 = 16. Ou o gl resduo dado pela frmula gl resduo = (LC)(R 1) onde R o nmero de
repeties; assim gl resduo = (2 x 4)(3-1) = 8 (2) = 16. Tabela Y. ANOVA (2 fatores) dos dados de resistncia a trao (MPa) de um experimento fatorial (tipo 4 x 2) com trs repeties. Efeito gl SQ QM F P Tratamento 3 912,00 304,000 19,15 0,0001* TCM 1 600,00 600,000 37,80 0,0001* Interao 3 108,00 36,000 2,27 0,1198 Erro 16 254,00 15,875 Total 23 1874,00
* p<0,05
A interpretao inicial dos resultados de uma tabela ANOVA (2 fatores) comea pelo efeito do fator interao. Repito. Primeiro avalie o efeito interao. Depois, se for o caso, avalie os efeitos principais. Diante dos efeitos principais numa possvel avaliao h dois casos no grfico de mdias das condies experimentais: interao tipo ordinal e interao do tipo no ordinal. Vamos explicitar o que dissemos acima. Se o efeito interao foi avaliado como significante, ento, pode sempre possvel no avaliar os efeitos principais. O foco de ateno do resultado , ento, o efeito interao e ponto final. Porm, o efeito principal que foi, tambm, avaliado como significante pode ser interpretado (teste de Tukey, por exemplo) se, no grfico de mdias das condies experimentais, ele se mostrar como efeito ordinal (ordinal interaction effect). Ainda, h o caso de o efeito principal que foi, tambm, avaliado como significante no pode ser interpretado (teste de Tukey, por exemplo) se, no grfico de mdias das condies experimentais, ele se mostrar como efeito no ordinal (disordinal interaction effect). Quando h o efeito tipo ordinal as linhas que unem os valores mdios se apresentam como paralelas. Caso contrrio, diante do efeito no ordinal h um cruzamento dessas linhas que unem os valores mdios do grfico de mdias. Se o efeito interao for no significante, ento, vamos interpretar os efeitos principais que apresentaram significncia (p valor inferior ao nvel de significncia).
22 O efeito interao estatisticamente no significante. Assim, o relacionamento entre os nveis do fator Termociclagem expressa mediante a perda de resistncia (diferena entre presena menos ausncia) obtido no grupo controle praticamente a mesma perda de resistncia obtida nos demais tipos de tratamentos superficiais, Figura Z.
TCM ausncia presena
50
45
MPa
40
35
30
25 A B C D
Tratamentos Superficiais
Figura Z. Grfico de mdias referente s seis condies experimentais. Perda de resistncia (indicada pela seta) devido ao da Termociclagem mecnica, TCM, em cada tipo de tratamento.
Pode-se concluir mediante o resultado do teste ANOVA, Tabela Y, que h diferena estatisticamente significante entre os quatro Tratamentos. Para o fator Tratamentos, a hiptese H0(1 = 2 = 3 = 4 ) rejeitada. Os valores mdios diferem!
Teste de comparao mltipla de Tukey (5%) para o efeito Tratamento Superficial Por meio do Teste de Tukey (5%) obtm-se o valor HSD
23
valores das diferenas a serem comparadas com o valor HSD ou dms.(=6,5824) Tratamentos Mdia A B C A 29,000 ---B 43,000 14,000* ---C 39,000 10,000* 4,000 ---D 45,000 16,000* 2,000 6,000
Alfa (nvel de significncia) 0,05 Valor Crtico Q 4,047 Valor Crtico para Comparao = 6,5824 Graus de liberdade do termo Erro (resduo) = 16
Formao de grupos homogneos aps a aplicao do teste de Tukey(5%) Tratamentos Mdia Grupos Homogneos* D 45,000 A B 43,000 A C 39,000 A A 29,000 B
* mdias seguidas de letras diferentes diferem estatisticamente
Pode-se concluir, ainda, mediante o resultado do teste ANOVA, Tabela Y, que h diferena estatisticamente significante entre os dois nveis entre o fator Termociclagem mecnica (TCM). Assim, como so apenas dois nveis desse fator, no h necessidade de se efetuar um teste de comparao mltipla como o teste de Tukey. Se os dois nveis diferem pode-se estabelecer que a condio de ausncia de Termociclagem menos resistente (34,006,77MPa) que a condio de presena de Termociclagem (44,008,37MPa). Quando se comparam as seis condies experimentais entre si, pelo teste de Tukey, obtm-se, por exemplo, que a condio Tratamento A(controle) sem TCM a menos resistente (mdia igual a 26MPa) enquanto as mais resistentes so as condies Tratamentos B (alumina) e D(new) com TCM. Outras consideraes podem ser ainda obtidas. Trata B TCM 2 Mdia Grupos Homogneos* 51 A
24 D C D B C A A 2 2 1 1 1 2 1 48 45 42 35 33 32 26 A AB ABC BCD CD CD D
Alfa (nvel de significncia) 0,05 Valor Crtico Q 4,903 Valor Crtico para Comparao = 11,278 Graus de liberdade do termo Erro (resduo) = 16 ...............................................................................................................
25
Apndice
Programa de fisioterapia 1 2 3
soma mdia
Tratamento psiquitrico 9 10 10 A 10 11 12 11 12 15 10 11 12 B 11 12 14 12 15 16 13 15 13 C 11 12 15
124 13,78
13 15 17
100 113 11,11 12,55 Soma geral = 337 ; Mdia geral = 12,48
vamos dispor os dados de uma forma conveniente para o clculo da SQ interao Programa Tratamento Psiquitrico = fator A Fisioterapia Total = Fator B 1 2 3 9 10 13 1 10 11 11 100 11 12 13
total a1b1: 30
2 10 11 12
total a2b1: 33
11 12 15
total a3b1: 37
15 12 15 113
total a1b2: 33
3 10 12 15
total a2b2: 38
12 14 16
total a3b2: 42
13 15 17 124
total a1b3: 37
100
total a2b3: 42
113
total a3 b3: 45
124
337
26
J sabemos - procedimento visto anteriormente -, como efetuar o clculo da SQ das linhas e das colunas. Ou seja, somo o total da coluna (ou da linha) e elevo ao quadrado e esse valor deve ser dividido pelo nmero de elementos (tamanho da amostra, nmero de repeties) e, dessa soma geral subtramos o fator de correo, FC = (X)2 / N). Agora, o procedimento bem parecido para se obter a SQ do fator interao. O procedimento o seguinte: 1) Clculo da SQ AB ou SQ Tratamentos AB a1b1 3 30 900 as 9 condies experimentais (os 9 tratamentos: 3 x 3) a2b1 a3b1 a1b2 a2b2 a3b2 a1b3 a2b3 3 3 3 3 3 3 3 33 37 33 38 42 37 42 1089 1369 1089 144 1764 1369 1764 a3b3 3 45 2025
N Total: T
T2
SQ A = {(1002+1132+1242) / 9 FC} = (38145,00/9) 4206,2593 = 4238,3333 - 4206,2593 = 32,0740 SQ B = {(1002+1132+1242) / 9 FC} = (38145,00/9) 4206,2593 = 4238,3333 - 4206,2593 = 32,0740
3) Clculo da SQ interao SQ trata AB = SQ A + SQ B + SQ interao
SQ interao
= SQ trata AB { SQ A + SQ B}
SQ interao = 64,7407 - {32,074 + 32,074} = 64,7407 - 64,148 = 0,593aprox. SQ interao = 0,593 Varincia do fator interao = { SQ interao = 0,593} / gl interao O nmero de graus de liberdade (gl) do fator interao dado pelo produto (a-1)(b-1) no nosso exemplo, gl inter = (3-1)(3-1) = 4 Portanto Varincia do fator interao = 0,593/4 = QM inter = 0,1481
27 Efeito gl no nosso exemplo a-1 3 -1 = 2 b-1 3 -1 = 2 Interao (a-1)(b-1) (3-1)(3-1) = 2 x 2 = 4 Erro ab(r -1) (3)(3)[3-1] = 9 x 2 = 18 Total: N-1= abr-1 27-1 = 3(3)(3) 1 = 26 r ... corresponde ao nmero de repeties (no nosso exemplo 3) A: B: (A x B):