Você está na página 1de 13

1

I EXPERIMENTO 1.1) INTRODUO Experimentos tm sido realizados na rea cientifica desde h muito tempo, mas foi principalmente dentro dos ltimos 100 anos que houveram estudos de metodologias no sentido de fundamentar e padronizar os experimentos e um dos cientistas que mais contribuiu nesses estudos foi R. A. Fisher . Ele produziu trabalhos nessa direo por mais de 30 anos e muito do que vai ser escrito a seguir est relacionado com suas idias. Este documento trata de planejamento de experimentos nas reas aplicadas onde os resultados so influenciados por alguns fatores que so controlados pelo experimentador e por outros que no so O planejamento visa a separao destes dois grupos de fatores e possibilita suas respectivas quantificaes. As reas de biologia, psicologia, educao, etc. so exemplos de reas aplicadas. Dentro das cincias naturais, um experimento faz parte de um projeto de pesquisa; na maioria das vezes o projeto para resolver um ou mais problemas bem definidos e, possivelmente, prev a execuo de vrios experimentos, levantamentos por amostragem e estudos de casos, todos com a finalidade de se observar e quantificar as variveis importantes para a soluo dos problemas que deram origem ao projeto. Especificamente, um experimento consiste de um conjunto de estratgias e aes que levam gerao das observaes necessrias e com qualificaes suficientes para se estimar os parmetros relevantes da pesquisa e para se testar hipteses estatsticas; nas reas cientfica e tecnolgica; por outro lado, um experimento pode ser considerado como um sistema construdo pelo experimentador, parcialmente controlado e que vai fornece as informaes requeridas pela pesquisa desejada; para sua construo, entre muitos detalhes, define-se as variveis que vo influenciar o sistema e so controlveis, as variveis resposta que vo possibilitar a estimao dos parmetros e as variveis que influenciam o sistema mas no so controlveis pelo experimentador. As variveis controladas pelo pesquisador esto em duas classes: Aquelas que fazem parte do sistema e aquelas que o pesquisador vai impor ao sistema, esta ltima chamada tratamentos. As variveis no controladas, por sua vez, dividem-se em duas classes: Aquelas que podem ser observadas e utilizadas na anlise, chamadas covariveis e aquelas que no podem ser observadas e originam o erro experimental. Exemplo 1.1 Um dos problemas na rea de sementes de soja a reduo da taxa de germinao, causado por doenas bacterianas e fngicas. No esforo de manter aceitvel esta taxa, foi planejado um experimento para testar a eficincia de 4 tratamentos de sementes. O experimentador tem que construir um sistema que gerar observaes com qualificao suficiente para a comparao dos 4 tratamentos. Um quinto tratamento ser chamado de controle ( ou testemunha) e poder ser um tratamento padro ou ausncia de qualquer tratamento de sementes. O experimento vai requerer 30 bandejas, prprias de testes de germinao, contendo como meio vinculante a vermiculita, originria de um mesmo lote; 100 sementes de uma variedade estvel e comercial sero usadas em cada bandeja; os tratamentos sero aplicados s sementes em cada bandeja de uma forma aleatria atravs de um sorteio.
________________________________________________________________________________________ LUCIO JOS VIVALDI. DELINEAMENTO E ANLISE DE EXPERIMENTOS. EST-UnB. 01/2010

Todas as 30 bandejas sero colocadas sobre uma mesa, dentro de uma casa de vegetao, com condies controladas de umidade, ventilao, temperatura e luminosidade. Os procedimentos correspondentes tcnica experimental sero aplicados igualmente s 30 bandejas. Aps x dias do incio do experimento, o nmero de sementes germinadas ser registrado. A descrio anterior corresponde ao sistema construdo pelo pesquisador e nele constata-se o seguinte: 1) No h diferena observvel entre as bandejas no que concerne a vermiculita; os contedos das bandejas evidentemente no so iguais e as diferenas so devidas variveis aleatrias como umidade e populao de microorganismos, entre outras; elas variam de bandeja para bandeja, mas uma variao pequena que, espera-se, no vai influenciar o efeito de um tratamento de semente. Estas variveis no so controladas pelo pesquisador e geram o erro experimental. 2) Os 30 conjuntos de 100 sementes tambm no so iguais, entretanto, as pequenas diferenas entre eles so devidas tambm variveis aleatrias, no controlveis, como peso e forma da semente, e tambm contribuem para o erro experimental 3) As variveis exgenas que agem no ambiente que envolve o experimento, so controladas pelo pesquisador: temperatura, insolao, etc.. Neste sistema ficam caracterizadas: a) A parcela - uma bandeja com vermiculita e 100 sementes de soja; b) Uma varivel resposta - a taxa de germinao; c) As variveis que podem influenciar os tratamentos mas so controladas - as variveis exgenas; d) As variveis aleatrias que influenciam a vermiculita e as sementes - que fazem parte do erro experimental e) Os 5 tratamentos. Diferentemente dos experimentos, muitos estudos utilizam pesquisa amostral ou pesquisa por amostragem; nos levantamentos por amostragem os dados so obtidos pela observao de um sistema j existente, sem a interveno do pesquisador; num estudo scio-economico sobre todos os produtores rurais de uma determinada regio, toma-se uma amostra de produtores utilizando uma tcnica adequada de amostragem aleatria e coleta-se os dados dos produtores que nela esto; no h interveno do pesquisador sobre o comportamento dos produtores. Na inteno de se estimar a diversidade de uma reserva biolgica , o pesquisador pode lanar mo de linhas transversais ("transect lines") para a obteno dos dados; aqui tambm no h interferncia sobre o sistema natural existente. Em algumas situaes a pesquisa se d de forma diferente das anteriores; para se acompanhar a evoluo de dois tipos naturais de cerrados , pode-se escolher duas reas convenientes e observ-las ao longo do tempo. Isto no um experimento nem um levantamento por amostragem; costuma-se denomin-lo de um estudo de caso ou um estudo observacional. A anlise estatstica dos dados depende de como eles foram gerados, por isto, um importante caracterizar se os dados da pesquisa vieram de um experimento, de um levantamento por amostragem ou um estudo observacional. Neste trabalho estamos interessados na descrio dos mtodos estatsticos relacionados aos dados de experimentos.

________________________________________________________________________________________ LUCIO JOS VIVALDI. DELINEAMENTO E ANLISE DE EXPERIMENTOS. EST-UnB. 01/2010

1.2) DEFINIES Para uma descrio organizada de um experimento, precisa-se de definies e elas sero colocadas no decorrer do texto, sempre que for oportuno. A varivel que controlada pelo pesquisador e cujas caractersticas dependem do objetivo do experimento recebe o nome de tratamento ou de fator ; um tratamento causar mudanas no sistema criado pelo pesquisador que, espera-se, refletir-se- no valor da varivel resposta; os tratamentos so estmulos aplicados ao sistema que est sob controle parcial do pesquisador. Os experimentos podem ter o objetivo de comparar tratamentos ou grupos de tratamentos; no exemplo 1.1, o interesse est na comparao de cada tratamento com o controle e entre os tratamentos propostos. Em ensaios de competio de variedades, o objetivo comparar variedades ou grupos de variedades; estes experimentos so denominados experimentos comparativos, conceito introduzido por Anscombe(1948). Outra classe de experimentos compreende aqueles cuja finalidade somente a de se estimar parmetros, como no caso da estimao de uma superfcie de resposta nveis de nitrognio e de fsforo aplicado em milho. Em algumas situaes ambos propsitos coexistem. A unidade bsica de referncia em um experimento a parcela ou unidade experimental; a entidade que vai dar origem s observaes. Pode ser uma rea contnua de terra, um animal ou grupo de animais, um vaso ou como no exemplo 1.1 , uma bandeja de vermiculita com 100 sementes, depende do experimento; em experimentos de campo, uma rea de terra; em experimentos em casa de vegetao, um vaso com terra ; em experimentos em laboratrio , uma placa de petri ou uma lmina. na parcela que o tratamento ser aplicado. Um tratamento um estmulo que fornecido parcela, produz um efeito e as variveis observadas (respostas) refletem este efeito; entretanto, as variveis ou fatores no controlveis tambm as influenciam e no final, o valor de uma varivel resposta encerra a ao dos dois conjuntos de variveis: o controlado pelo pesquisador e o no controlado. Se as parcelas fossem iguais, a influncia das variveis no controladas seria desprezvel; se Y representa uma varivel resposta, como o nmero de sementes germinadas no exemplo 1.1, ento o valor de Y correspondente parcela pode ser escrita da seguinte forma: Yik = X i + t k onde Yik , o valor observado de Y na parcela i que recebeu o tratamento k; X i o valor da varivel resposta Y na parcela i sem tratamento e t k o efeito do tratamento k, aplicado parcela i. No modelo apresentado, X i o valor de Y na parcela i, uma propriedade da parcela i, denominado de efeito da parcela i; o valor de t k o mesmo para qualquer parcela i onde o tratamento k for aplicado; nem o efeito da parcela i, X i , nem o efeito do tratamento k, t k , so conhecidos. No exemplo 1.1, uma parcela i que no recebeu um tratamento vai produzir um resultado, X i , que depende somente dos recursos que ela tem e num contexto terico, isto ocorre com todas elas. A diferena entre duas parcelas i e j, por exemplo, que receberam o mesmo tratamento k, : Yik Yjk = ( X i + t k ) ( X j + t k ) = ( Xi X j ) ;

a quantidade ( X i X j ) advm da diferena entre as duas parcelas i e j que receberam o mesmo tratamento; o conjunto das diferenas deste tipo que vai dar origem ao erro
________________________________________________________________________________________ LUCIO JOS VIVALDI. DELINEAMENTO E ANLISE DE EXPERIMENTOS. EST-UnB. 01/2010

experimental. Em algumas reas de pesquisa, a influncia dos fatores no controlveis desprezvel porque as parcelas so muito semelhantes e a diferena ( X i X j ) prxima de zero, tornando muito pequeno o erro experimental . Por exemplo, para se testar a eficincia de 4 antioxidantes utilizados em fios de arame, selecionou-se 30 pedaos de um fio uniforme, cada um com 50 cm, para um experimento com os 4 produtos; devido forma de fabricao do fio , a diferena entre os pedaos muito pequena e portanto, se o protocolo experimental for o mesmo para todas as parcelas, o erro experimental pode ser desconsiderado (evidentemente, num contexto mais profundo, elas no so iguais). Isto no ocorre nas cincias biolgicas, o que leva elaborao de uma estratgia com mais recursos no planejamento, na conduo e na anlise dos resultados, que possibilite estimar a influncia dos tratamentos e dos fatores no controlveis ou erro experimental. Esta estratgia d origem ao delineamento experimental. Os fatores no controlveis que afetam o comportamento das variveis resposta em um experimento, derivou da no igualdade das parcelas utilizadas; dois animais no so iguais, duas parcelas no campo no so iguais, duas folhas de uma planta no so iguais, duas rvores da mesma espcie no so iguais e assim, de acordo com a natureza do experimento sempre vo haver parcelas diferentes. Em alguma fase do projeto de pesquisa, o pesquisador definir quais so as parcelas do experimento, ele procurar um conjunto homognio de parcelas e no um conjunto de parcelas iguais; este conceito tem o seguinte significado. Um conjunto de parcelas homogneo quando a diferena entre elas devida apenas a fatores no controlveis ou variveis aleatrias. No exemplo 1.1, as 30 bandejas com vermiculita e 100 sementes apresentam esta propriedade e no h um fator que possa ser referncia para dividir o grupo em subgrupos mais homogneos. Em experimentos de campo, dificilmente conseguir-se- 30 parcelas homogneas de 40 m 2 e o dilema do pesquisador dividir este grupo em subgrupos homogneos atravs de fatores controlveis como a declividade, por exemplo, utilizando o conceito de blocagem, que ser tratado mais adiante. Em experimentos com animais, tambm ser difcil obter um conjunto de 30 carneiros que possam ser considerados homogneos; idade, sexo, peso, por exemplo, so referenciais utilizados para se obter subgrupos homogneos de animais. Na rea biolgica, o objetivo no conseguir parcelas iguais e sim homogneas, por que o mximo que se pode atingir. Em experimentos, alem do erro experimental, existem, pelo menos, outros 3 tipos de erro; o chamado erro de mensurao, associado s variveis resposta e que se origina do instrumental ou do meio utilizado para quantificar estas variveis; balanas e aparelhos de laboratrio sensveis utilizados na mensurao, podem ocasionar esse tipo de erro. A forma incorreta de aplicao dos tratamentos ou a quantidade errada utilizada em uma parcela, tambm causa o erro de aplicao. A modificao da parcela ao longo do tempo, como um dano fsico no registrado ocorrido em uma parcela com uma variedade de milho, vai introduzir um o erro de parcela. Infelizmente, no h tcnicas estatsticas que possam tratar estes trs tipo de erro e no final eles vo aumentar o erro experimental e viezar as comparaes entre tratamentos; o melhor que se pode fazer evit-los. Uma discusso mais abrangente sobre experimentos e tipos de erros nas reas cientfica e tecnolgica, pode ser encontrada em Kempthorne (1955, 1966, 1977) e Hinkermann e Kempthorne(1994).

________________________________________________________________________________________ LUCIO JOS VIVALDI. DELINEAMENTO E ANLISE DE EXPERIMENTOS. EST-UnB. 01/2010

1.3) REPETIO E CASUALIZAO A repetio de um procedimento ou de um tratamento uma prtica antiga em experimentao e sempre esteve relacionada com algum tipo de erro; entretanto, no conceito moderno de experimentao este erro bem definido, como ver-se- a seguir. Diante das diferenas entre as parcelas devido aos fatores no controlveis - erro experimental - e que influenciam o valor das variveis resposta, necessrio avaliar o grau desta influncia; para isto precisa-se de pelo menos duas parcelas homogeneas como o mesmo tratamento, pois a diferena entre elas uma medida do erro experimental. Observando-se duas parcelas i e j que receberam o mesmo tratamento k e considerando o modelo Yik = X i + t k tem-se que ( Yik Yjk ) = ( X i X j ) e (Yik Yjk ) uma estimativa do erro experimental. Desta forma, a repetio do mesmo tratamento possibilita a estimao do erro experimental; como ele vai ser estimado depende do tipo de delineamento a ser adotado. O nmero de repeties de um experimento o nmero de parcelas que receberam o mesmo tratamento e pode ser diferente de um tratamento para o outro. Aps a definio do conjunto de parcelas ou subconjuntos de parcelas homogneas do experimento, dos tratamentos e do nmero de repeties, em algum momento do processo experimental, os tratamentos vo ser aplicados s parcelas; a pergunta que se faz : qual tratamento ser aplicado ou designado uma determinada parcela? At meados da dcada de 1920, esta deciso era pessoal, baseada em argumentos subjetivos. Fisher (1926) preconizou que esta alocao fosse aleatria, no sentido de que todas as parcelas tivessem a mesma probabilidade de ser alocada um determinado tratamento (dentro de um conjunto homogneo de parcelas). Esta prtica denominada de casualizao e no decorrer do tempo passou a ser um dos princpios da experimentao; a casualizao obtida mediante um sorteio devidamente planejado que depende do delineamento adotado e utiliza urnas ou programas de computador; costuma-se dizer que os tratamentos foram alocados aleatoriamente s parcelas. Embora seja aceita pela maioria dos pesquisadores, constata-se a falta de explanaes sobre a real funo da casualizao, porque deve ser aplicada e quando, e finalmente, as implicaes na anlise estatstica. As funes da casualizao foram descritas no clssico livro de Cox (1958), no captulo 5 e so as seguintes: 1. Permite estimar o erro experimental de forma no viezada; a repetio necessria, mas no suficiente. 2. Possibilita o uso de testes de hipteses. 3. Possibilita a estimao no viezada da diferena entre os efeitos de tratamentos. A casualizao , portanto, o principio que d sustentao anlise estatstica dos delineamentos de experimentos e nas prximas sees ser apresentado um desenvolvimento para justificar este fato. 1.4) DELINEAMENTO INTEIRAMENTE CASUALIZADO A inteno aqui desenvolver um estudo simplificado sobre o efeito da casualizao nos experimentos e para isso ele ser aplicado ao delineamento mais simples que se conhece. Uma situao experimental em que o pesquisador dispe de um conjunto suficiente de parcelas homogeneas foi ilustrada com o exemplo 1.1; 30 parcelas homogeneas e 5 tratamentos, com 6 parcelas alocadas aleatoriamente a cada tratamento. O
________________________________________________________________________________________ LUCIO JOS VIVALDI. DELINEAMENTO E ANLISE DE EXPERIMENTOS. EST-UnB. 01/2010

delineamento estratgia amostral utilizado neste experimento denominado de completamente ao acaso ou inteiramente casualizado. So sorteadas 6 parcelas para cada tratamento e portanto, 6 repeties ; o nome encerra o significado, isto , no h restries para a casualizao e o conjunto de parcelas homogneas nico. O modelo estatstico usualmente adotado para representar Yik , o valor de uma varivel resposta na parcela i que recebeu o tratamento k : Yik = + t k + e ik , onde : mdia geral. t k : efeito do tratamento k.
e ik : erro experimental, com distribuio normal de mdia zero, varincia 2 e independentes. Este delineamento tem sido escolhido onde as condies de experimentao permitem a existncia de um conjunto razovel de parcela homogeneas; experimentos em casas de vegetao e em laboratrios possibilitam o uso deste delineamento. O modelo acima aparentemente no est relacionado com a casualizao e chamado de modelo normal clssico com erros independentes e varincia homogenea; a ligao entre modelo , casualizao e normalidade pode ser examinada pela anlise de varincia. A anlise mais frequente de um experimento estatisticamente delineado a anlise de varincia, formulada por Fisher na dcada de 20 do sculo passado, descrita em seu livro "The Design of Experiments" em 1935 e extendida por outros autores, entre os quais se destaca Yates. Existem outros tipos de anlise, mas no que segue a anlise de varincia a que vai ser utilizada, por ser a mais importante em anlise de experimentos. Embora mais de uma varivel resposta seja observada nos experimentos, somente uma ser referenciada no modelo; por outro lado, a varivel resposta considerada para anlise numrica, no sentido de que representa uma quantidade, que varia dentro de um intervalo; como exemplos tem-se pesos, comprimentos, rea , volumes, etc. (usualmente denominada de varivel contnua).

1.5) ANLISE DA VARINCIA A analise de varincia foi introduzida por Fisher na dcada de 1920 e como uma tcnica das mais difundidas entre os pesquisadores, cabe aqui uma explicao mais detalhada dos seus objetivos, dos seus pontos fortes e de suas limitaes. Se Y uma varivel resposta, como o peso da matria seca em um experimento em casa de vegetao, pode-se observar que Y varia de parcela para parcela, ou seja, existe uma variabilidade dos valores de Y, denominada de variabilidade total; a anlise de varincia consiste em se separar e quantificar as causas desta variabilidade. Algumas das causas (ou fontes de variao, como so tambm conhecidas), so devidas ao delineamento utilizado e isto ser explicado quando dos seus respectivos estudos; a segunda fonte a devida a ao dos tratamentos, imposto ao sistema pelo experimentador; a ultima fonte de variao aquela devida ao erro experimental, originria da desigualdade das parcelas. Assim, em termos gerais os componentes so 3: delineamento, tratamentos e erro experimental; o delineamento definido pela estrutura de parcelas (quando h controle local, como uso de
________________________________________________________________________________________ LUCIO JOS VIVALDI. DELINEAMENTO E ANLISE DE EXPERIMENTOS. EST-UnB. 01/2010

blocos ou linhas e colunas) e pela casualizao; os tratamentos so estmulos aplicados s parcelas de acordo com a casualizao; o erro experimental advm das pequenas diferenas entre as parcelas homogneas. A forma utilizada por Fisher para concretizar a separao dos componentes da variabilidade total, chamados de fontes de variao, foi pela da soma de quadrados em torno de mdias. A anlise de varincia de um experimento completamente casualizado firma-se no modelo Yik = + t k + e ik e a variabilidade total da varivel resposta Y , dada por 2 2 2 SQT = y11 + y12 + ... + y 2 = y ik rv
ik

chamada de soma de quadrados total (SQT); a variabilidade total pode ser decomposta da seguinte forma: 2 2 t tk onde , k e e ik so estimativas de , t k e e ik yik = 2 + 2 + eik ,
ik ik ik ik

respectivamente, e so as seguintes: = y.. (media geral dos dados) k = y k y.. (media do tratamento k, menos a media geral) t t y ik = + k ( valor de Y estimado pelo modelo) t e ik = y ik ik = y ik y ik (diferena entre o valor observado e o estimado pelo modelo ou erro estimado). Entretanto, a forma mais frequente para esta decomposio a seguinte: 2 (Soma de quadrados total corrigida pela ( yik y.. ) 2 = ( y k y.. ) 2 + eik
ik ik ik

mdia). Assim, SQT=SQTRAT + SQERRO Onde ( y k y.. ) 2 a soma de quadrados para tratamentos
ik
ik

2 e ik

a soma de quadrado do erro.

Se o nmero de repeties do tratamento k rk , ento a SQTRAT pode ser representada pela expresso

rk ( y k y.. ) 2
k

Neste caso no h efeito do delineamento porque no houve controle local (como blocos, por exemplo). O quadro abaixo, chamado de quadro ou tabela da anlise da varincia, contm estas somas de quadrados e outras informaes: Fv Tratamentos Erro Total Gl v-1 Diferena n-1 SQ SQTRAT SQERRO SQT QM QMTRAT QMERRO F

________________________________________________________________________________________ LUCIO JOS VIVALDI. DELINEAMENTO E ANLISE DE EXPERIMENTOS. EST-UnB. 01/2010

Graus de liberdade(Gl) uma constante que caracteriza a distribuio das somas de quadrados;(?) O quadrado mdio (QM), uma estatstica intermediria para testes de hipteses; F= QMTRAT / QMERRO . A SQTRAT uma medida da variao que houve entre os tratamentos; a SQERRO uma medida da variao que houve entre as parcelas homogeneas. O quadrado mdio do erro(QMERRO ou 2 ) uma estimativa de 2 , parmetro que faz parte do modelo normal com erros independentes. Como ser discutido mais adiante, 2 tambm uma medida do erro experimental. Uma importante propriedade da anlise da varincia que se os efeitos dos tratamentos no so diferentes o quadrado mdio para tratamentos(QMTRAT) tambm um estimador de do erro experimental( 2 ) . O teste F testa a hiptese H 0 : t 1 = t 2 = ... = t v (no h diferena entre os tratamentos) H a : pelo menos dois tratamentos so diferentes , onde H 0 significa hiptese nula, e H a hiptese alternativa. Quanto maior o valor de F , maior a evidencia contra a hiptese nula (fornecida pelos dados do experimento). Para se decidir sobre o teste, usa-se a distribuio de F ( mediante uma tabela ou pelo computador). Rejeita-se H 0 se o valor de F cair na regio de rejeio , isto , se o valor de F for maior do que o tabelado a um nvel de significncia especificado pelo pesquisador. A questo dos clculos e formulas para a anlise da varincia foi resolvida pelos aplicativos de estatstica e assim no h necessidade de elaborao maior desse aspecto; o que importante entender os resultados da anlise expedida pelos programas de comptador.
1.6) MODELO INDUZIDO PELA CASUALIZAO

Considere ento um experimento com v tratamentos, r repeties e que o pesquisador dispe de N=rv parcelas homogeneas; o nmero de repeties pode variar de tratamento para tratamento sem causar modificaes nos resultados que vo ser obtidos, entretanto, mais simples considerar o caso onde todos os tratamentos tem o mesmo nmero de repeties. Seja Y a varivel resposta que ser observada em cada parcela (peso de matria seca, nmero de sementes germinadas, populao de nematodes, ganho de peso em bovinos); o primeiro passo formular uma representao para a resposta em cada parcela e para isto voltar-se- para o exemplo 1.1: Se nenhum tratamento de semente for aplicado parcela i, o nmero de sementes germinadas depender somente das condies da parcela i. Seja X i o valor da resposta Y na parcela i (i=1,2,..., N), na ausncia de tratamento (ou na presena de um tratamento padro), isto , X i o produto das prprias caractersticas da parcela i. No exemplo 1.1, X i o nmero de sementes germinadas que a parcela i produziria sem tratamento de semente. Quando o tratamento aplicado a parcela i espera-se que haja um efeito sobre as condies da parcela com reflexos no valor de Y; seja ento t k o efeito do tratamento k na resposta Y; com estas definies chega-se representao mais simples de Yik , o valor de Y na parcela i que recebeu o tratamento k, ou seja:
________________________________________________________________________________________ LUCIO JOS VIVALDI. DELINEAMENTO E ANLISE DE EXPERIMENTOS. EST-UnB. 01/2010

Yik = X i + t k (1.4) Quando o efeito de qualquer tratamento k, t k , o mesmo para toda parcela i, o modelo (1.4) denominado modelo aditivo; quando isso ocorre, tambm diz-se que existe aditividade. Sem aditividade no possvel estimar a diferena entre dois tratamentos. O prximo passo associar o modelo (1,4) ao processo de casualizao; no modelo apresentado em (1.3) no h tal associao. Certamente as N parcelas homogneas no constitue uma amostra aleatria de um conjunto maior de parcelas (populao) e os exemplos 1.1 e 1.2 evidenciam este fato; as 30 bandejas com 100 sementes cada uma no foram retiradas aleatoriamente de uma populao de bandejas. Casualizar os tratamentos consiste em alocar r parcelas para cada tratamento, de tal forma que cada parcela tenha a mesma probabilidade de receber o tratamento k. Como qualquer parcela pode receber qualquer tratamento, o que vai ocorre na parcela i devido casualizao, pode ser representada por variveis aleatrias; assim na parcela i, o tratamento 1 pode ser aplicado ou no, ou o tratamento 2, e assim por diante. Para estudar situaes como esta utiliza-se um modelo probabilstico induzido pela casualizao e o resultado o seguinte modelo: Yik = + t k + e ik , (1.5) onde os erros e ik so correlacionados, tm mdia zero mas a distribuio desconhecida. As covarincias no nulas, determinam que as observaes em diferente parcelas so correlacionadas ou as parcelas no so independentes; esta uma consequncia do modelo aditivo e da casualizao. A correlao entre os resultados de 1 duas parcelas . O desenvolvimento terico que origina esses resultados est em N 1 Hinkelmann e Kempthorne(1994)

1.7) INFERNCIA EXPERIMENTAL

Na seo 1.4 foi definido o modelo normal clssico, com varincias homogeneas , erros independentes e com distribuio normal, e na seo 1.5, foi definido o modelo aleatrio induzido pela casualizao; conduzido um experimento (com casualizao) e obtido as observaes, o prximo passo estabelecer julgamentos a partir dessas observaes, isto , inferir; inferncia em estatstica utiliza estimativas, testes de hipteses e intervalos de confiana a partir de modelos probabilisticos aplicado s observaes e, quando estas vierem de experimentos, o processo leva o nome de inferncia experimental. Nesta seo ser desenvolvida um metodologia para fazer inferncias atravs de experimentos casualizados . Antes porm, edificante uma discusso sobre os 2 modelos. O modelo normal clssico assume que as observaes das parcelas so independentes e portanto no correlacionadas, isto , e11, e12..., esr, em 1.3, uma amostra aleatria de uma populao infinita. Entretanto, pelo que j foi exposto, no existe tal amostra aleatria em experimentao: A populao de parcelas finita. Pode-se at argumentar que as N parcelas constituem uma amostra de uma possvel populao de parcelas, entretanto, no uma amostra aleatria, pela forma como os pesquisadores selecionam as parcelas para um experimento. Por sua vez, a casualizao implica na correlao entre as parcelas, no havendo portanto, independncia. A distribuio estatstica de X i desconhecida e no desenvolvimento e anlise do modelo aleatrio ela no necessria. Porque ento o modelo normal utilizado? Para responder a esta
________________________________________________________________________________________ LUCIO JOS VIVALDI. DELINEAMENTO E ANLISE DE EXPERIMENTOS. EST-UnB. 01/2010

10

pergunta precisamos analisar um experimento pelo modelo correto induzido pela casualizao e pelo modelo modelo normal. Pode-se afirmar que o modelo normal obtido por pressuposio enquanto que o modelo aleatrio por construo; no primeiro caso no h influncia da casualizao e no segundo ela utilizada para se definir uma estrutura de varincias e covarincias entre as parcelas (observaes) e o modelo matemtico para cada observao. A comparao entre dois tratamentos, 1 e 2, consiste primeiro em se estimar a diferena ( t 1 t 2 ) ; em ambos os modelos o estimador a diferena entre as duas mdias dos tratamentos, isto ,( y1 y 2 ) e tem varincia 2 2 / r . Para se estimar um contraste, k t k , entre tratamentos, em ambos os modelos o estimador k y k com varincia
k k

; nos dois modelos 2 um parmetro desconhecido e tem que ser estimado r k atravs da analise de varincia. A anlise de varincia de experimentos conhecida por todos os pesquisadores que conduzem experimentos e para no modificar esta base vejamos quais os resultados desta anlise segundo o modelo induzido pela casualizao; como exemplo, considere um experimento para comparar 3 estirpes de Rhizobeum (bactrias fixadoras de nitrognio um Leguminosas) em soja, conduzido em casa de vegetao e inteiramente casualizados. As parcelas, os tratamentos e os valores da varivel resposta Y, nmero de ndulos por parcela(dados artificiais), encontram-se na tabela abaixo:
2 ( k )

PARCELA 1 2 3 4 5 6 7 8 9

TRAT. A A A B B B C C C

Y 99 86 104 98 110 110 133 126 127

A anlise de varincia, atravs do modelo normal, fornece os seguintes resultados; esta anlise obtida mediante o mtodo dos quadrados mnimo aplicado em 1.3.
F.V. Tratamentos Erro Total gl 2 6 8 SQ 1652,66 297,33 1950,00 QM 826,33 49,55 F 16,67

A estimativa de 2 , o erro experimental, dada pelo quadrado mdio do erro e 49,55 e o teste F leva rejeio da hiptese nula H 0 de que os efeitos de tratamentos so
________________________________________________________________________________________ LUCIO JOS VIVALDI. DELINEAMENTO E ANLISE DE EXPERIMENTOS. EST-UnB. 01/2010

11

iguais; pela tabela de F, observa-se que Prob (F 16,67)=0,0035=0,35%. Como obter as somas de quadrado ser fornecida por programas em linguagem SAS(2003). O valor de F reflete a evidencia dos resultados contra H 0 e sua distribuio sob H 0 fundamental para o teste de hiptese. No modelo normal a distribuio desta estatstica conhecida e outras propriedades da anlise de varincia so encontradas nos livros sobre delineamentos de experimentos; entretanto o mesmo no ocorre com relao ao modelo aleatrio e o problema calcular Prob (F 16,67) no modelo aleatrio (induzido pela casualizao) Sem entrar em detalhes do procedimento e dos calculos, a prob(F 16,07)=0,0071=0.71%. O valor de F observado no experimento esta ento na regio de rejeio (considerando o nvel de significncia de 0,05) e H0 rejeitada; este teste exato, independente de normalidade de erros e considerando que so correlacionados. A comparao de dois tratamentos feito pelo teste de t de Student no modelo normal e neste experimento as mdias foram A=96,3, B=106,0 e C=128,8. A estatstica t para testar H0: C=B :
= 3,94 ; 2 49,5 3 que, sob H0, tem distribuio de t de Student, com 6 graus de liberdade (gl), a Prob (t 3,94)=0,0076 =0,76% e rejeita-se H0. Pelo modelo aleatrio Prob (t 3,94)=0,0077.=0,76%. Em ambos os casos, o teste F e o teste t, os resultados do modelo normal so aproximaes daqueles do modelo aleatrio e, por outro lado, como j foi visto anteriormente, os estimativas de contrastes de tratamentos e suas varincia so iguais. Outro ponto importante que 2 , o erro experimental, embora, tenha definies diferentes nos dois modelos, o quadrado mdio do erro na anlise de varincia um estimados no viezado de 2 em ambos os modelos, o que leva tambm os contrastes de tratamento terem a mesma estimativa de varincia. Os detalhes dessa anlise esto em Hinkelmann e Kempthorne(1994). No exemplo em anlise, nenhuma distribuio conhecida foi assumida para os dados do experimento quando sob o modelo aleatrio, enquanto que as pressuposies de independncia e normalidade so sob o modelo normal; independncia entre as parcelas no ocorre se houver casualizao e a casualizao no leva normalidade. Utilizando a linguagem SAS foi simulado um experimento com as observaes tendo distribuio de Poisson, isto , os valores de X i s em (1.4) constituem os elementos de uma amostra gerada pela distribuio de Poisson; foi estabelecida uma estrutura aditiva e a analise de varincia sob medida normal seguem: t= 128,8 106

Tratamento Y

A A A B B B C C C 26 23 20 29 23 23 30 32 37

________________________________________________________________________________________ LUCIO JOS VIVALDI. DELINEAMENTO E ANLISE DE EXPERIMENTOS. EST-UnB. 01/2010

12

F. V.

Gl

SQ

QM

(P F)

Tratamento Erro Total

2 6 8

168 68 236

84 11,33

7,41

0,024

A Prob (F 7,41) obtida pelo modelo aleatrio 0,036. Os valores de Y no foram transformados para y , procedimento recomendado para a distribuio de Poisson; os resultados evidenciam que a aproximao obtida com o modelo normal aceitvel. Os exemplos apresentados foram casos particulares, mas conclui-se o seguinte sobre o modelo normal: 1) simples e demanda pouco calculo; 2) uma aproximao aceitvel do modelo aleatrio; 3) Sob aditividade, no h necessidade de transformaes para se atingir normalidade. Em outros estudos com simulao (Hinkelmann e Kempthorne 1994), foi visto que as distribuies de F sob os dois modelos se aproximam medida que r, o nmero de repeties, aumenta. Entretanto, mesmo com r=3, o resultado excelente. Os estudos tericos e de simulao vo continuar, mas os que existem at hoje levam a utilizao do modelo normal na anlise de experimentos casualizados e inferncia experimental seguir ainda feito atravs dele, embora os resultados sejam aproximaes daqueles que seriam obtidos pelo modelo induzido pela casualizao, deve-se compreender, entretanto, que a varivel resposta sob anlise no precisa ter distribuio normal(se tiver, melhor ainda ), que transformao de variveis necessria somente para atingir atividade, que as observaes so correlacionadas e que no existe uma amostra aleatria de parcelas. Referncias
Anscombe, F. J. The validity of comparative experiments. Jour. Roy. Stat. Soc. A, 111, 182-211 (1948). Cox, D. R. Planning of Experiments. Wiley. 1958. Fisher, R.A. The arrangement of field experiments. J. Ministry Agric. Engl. , 33, 503-513. 1926. Fisher, R.A. The Design of Experiments. Edinburgh an London: Oliver and Boyd. 1935. Hinkelmann, K. e Kempthorne , O. Design and Analysis of Experiments. Volume I. Introduction to Experimental Design. Wiley. 1994. Kempthorne , O . The randomization theory of experimental inference. J. Amer. Statist. Assoc. 50, 946-967.(1955) Kempthorne , O. Inference from experiments and randomization. In A Survey of Statistical Design and Linear Models ( editado por J. N. Srivastava) . Amsterdam: NorthHolland Publ. Co. , 303-331. 1973 Kempthorne , O. Some aspects of experimental inference . J. Amer. Statist. Assoc. , 61. 11-34, 1966.
________________________________________________________________________________________ LUCIO JOS VIVALDI. DELINEAMENTO E ANLISE DE EXPERIMENTOS. EST-UnB. 01/2010

13

SAS Institute, Inc. SAS STAT Users Guide, Release 9.03. Cary, NC : SAS Inst., Inc. 2003

________________________________________________________________________________________ LUCIO JOS VIVALDI. DELINEAMENTO E ANLISE DE EXPERIMENTOS. EST-UnB. 01/2010