Testes Estatísticos para Comparação de Médias 2

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.
Artigo Nmero 76 TESTES ESTATSTICOS PARA COMPARAO DE MDIAS Andria Fres Galuci Oliveira1
INTRODUO Quando a anlise de varincia de um experimento mostra que as mdias de tratamento no so estatisticamente iguais, apenas lgico perguntar quais so as mdias que diferem entre si. O pesquisador em geral gostaria de aplicar um teste para comparar mdias, duas a duas. Considere um experimento para comparar trs tratamentos, A, B e C. Se a anlise de varincia mostrar que as mdias desses tratamentos no so estatisticamente iguais, bastante possvel que o pesquisador procure um teste estatstico para comparar as mdias de A e B, A e C, B e C. Mas como se faz comparao de mdias, duas a duas? O pesquisador precisa de um mtodo que fornea a diferena mnima significante entre duas mdias. Essa diferena seria o instrumento de medida. Toda vez que o valor absoluto da diferena entre duas mdias igual ou maior do que a diferena mnima significante, as mdias so consideradas estatisticamente diferentes, ao nvel de significncia estabelecida (VIEIRA et al., 1989). A estratgia da anlise estatstica se define a partir dos objetivos do pesquisador e das condies experimentais ento existentes. A natureza quantitativa dos tratamentos empregados pode sugerir o estudo de modelos (ou funes) que venham a trazer alguma informao adicional ao pesquisador, mas este procedimento, por si s, no substitui a comparao das mdias obtidas no ensaio (SAMPAIO, 2002). Segundo VIEIRA et al. (1989), a comparao de mdias s pode ser feita aps a anlise de varincia. Isto porque todos os procedimentos para obter a d.m.s. exigem o clculo do quadrado mdio do resduo. Mas a anlise de varincia tambm d o valor de F, que permite decidir se as mdias so ou no iguais, a determinado nvel de significncia. A Anlise de Varincia um mtodo suficientemente poderoso para poder identificar diferenas entre as mdias populacionais devidas a vrias causas atuando simultaneamente sobre os elementos da populao (COSTA NETO, 1977). A possibilidade de utilizar um dos vrios testes estatsticos existentes para a comparao de mdias, de alguma maneira, seduz o experimentador que, entre comedido e inovador, deseja optar por um deles. A eleio de um teste pelo pesquisador deve contemplar aquele cujas concluses que advieram de seu uso sejam menos sujeitas a erros tidos como indesejveis (SAMPAIO, 2002). Segundo FONSECA et al. (1982) o mtodo de anlise de varincia indica a aceitao ou rejeio da hiptese de igualdade das mdias. Se a hiptese de nulidade (Ho) for rejeitada, estaremos admitindo que, pelo menos, uma das mdias diferente das demais. Surge, contudo a questo: Quais mdias devem ser consideradas diferentes?
Zootecnista, Doutoranda em Produo Animal, Universidade Estadual de Maring froesgaluci@hotmail.com
Revista Eletrnica Nutritime
777
Existem alguns testes para a soluo dessa questo, que sero apresentados a seguir.
CONSIDERAES GERAIS
Segundo SAMPAIO (2002), as situaes que conduzem comparao de valores mdios precisam considerar sempre dois aspectos essenciais para a escolha do teste adequado: 1. O primeiro deles refere-se caracterizao da resposta a ser medida (varivel alvo) quanto a sua natureza (qualitativa ou quantitativa), a sua distribuio (normal ou no), a sua continuidade (contnua ou discreta) e a sua instabilidade (muito ou pouco instvel). 2. O segundo aspecto a ser considerado que, aps a utilizao de um teste de comparao de mdias, existem dois tipos de erro reconhecidos pela teoria estatstica: o erro tipo I (atribuir uma significncia quando ela realmente no existir) e o erro tipo II (atribuir uma equivalncia quando realmente houver uma diferena significativa).
OS TESTES ESTATSTICOS
Todos os testes atualmente em voga fornecem o mesmo resultado quando existem apenas dois tratamentos e, portanto um s contraste a ser avaliado (1 gl ou 1 grau de liberdade). Os testes de comparao mltipla procuram atender aos interesses da experimentao moderna que utiliza um nmero maior de grupos investigados devidos s limitaes amostral e de infra-estrutura, este nmero varia entre 3 e 6 na grande maioria dos ensaios, exceto nas competies de variedades em agricultura e em geral em esquemas fatoriais. Os esquemas fatoriais so casos especiais onde cada fator estudado se apresenta com 2 a 4 nveis, aqui tambm limitados para atender restries oramentrias. O estudo fundamental das interaes entre os fatores exigir a comparao dos nveis de um fator dentro de nveis fixos dos demais. As comparaes racionais envolvero, portanto, muito menos mdias (de 2 a 4) do que aquelas subitamente sugeridas pelo fatorial completo. A teoria estatstica sempre deixou claro que frente a vrios tratamentos (t) apenas os (t-1) graus de liberdade poderiam ser decompostos e testados enquanto na realidade existiam t(t-1)/2 comparaes possveis. Os pesquisadores sempre se interessaram mais por estas t(t-1)/2 comparaes entre mdias, j que os t-1 contrastes permitidos nem sempre retratavam a comparao de dois tratamentos e sim de grupos deles. Na realidade percebeu-se que com o aumento do nmero de tratamento (e, portanto da amplitude da menor para a maior mdia) aumentava a probabilidade de se detectarem diferenas significativas entre t(t-1)/2 contrastes possveis. Neste caso, o erro I estaria sendo beneficiado medida que a distncia entre duas mdias fosse aumentando. Todos os estudos desenvolvidos a partir deste alerta preocuparam-se em controlar aquele tipo de erro em particular, criando testes mais rigorosos no controle do erro I e conseqentemente mais permissivos no do erro II. Revista Eletrnica Nutritime 778
Com base no exposto em consideraes gerais, passaremos a tecer comentrios sobre os testes mais freqentemente elegidos na experimentao (SAMPAIO, 2002).
O Teste F Em 1924, Fisher apresentou a fundamentao bsica que permitiu a posterior formulao do teste F por Snedecor. Estruturado para avaliar a variao mdia de uma determinada fonte em relao variao individual, ou seja: F = Varincia da fonte testada/ Varincia do resduo O valor assim calculado de F deve ser comparado quele tabelado segundo os graus de liberdade da fonte testada e do resduo, respectivamente nas colunas e linhas daquela tabela. Quando a fonte sendo testada no for uma interao e se redigir a apenas um grau de liberdade, o teste F adequadamente aplicado ao teste t de Student (t2 = F). Segundo SAMPAIO (2002), uma fonte de variao com apenas 1 gl pode advir das seguintes situaes: 1. Existem apenas dois tratamentos, e, portanto um nico contraste a ser feito, equivalente a 1 gl. A significncia ou no do teste F executado na anlise de varincia traduzir ou no a diferena significativa entre os dois tratamentos. 2. Existem mais de dois tratamentos (t tratamentos, por exemplo), e, portanto existiro t-1 contrastes ortogonais, cada um correspondente a 1 gl. Alguns desses contrastes podero definir a comparao direta entre dois tratamentos, outros envolvero mais de um deles. Para aqueles contrastes, prevalece o comentrio feito no item 1 anterior. Para a os ltimos, independentemente do resultado do teste F, as concluses devero ser feitas discretamente, obedecendo natureza do contraste. Segundo VIEIRA et al., (1989). Para obter a diferena mnima significante (d.m.s.) estabelecida pelo teste t, basta calcular: d.m.s. = t r 2 . QMR
onde t um valor dado em tabela, QMR o quadrado mdio do resduo da anlise de varincia e r o nmero de repeties de cada tratamento. Toda vez que o valor absoluto da diferena entre duas mdias igual ou maior do que o valor da d.m.s., as mdias so estatisticamente diferentes.
Contrastes Ortogonais
Se existirem cinco tratamentos de natureza qualitativa, apenas 4 gl podero ser decompostos ortogonalmente (ou seja, sem confundimentos) de modo que as somas de quadrados individuais somadas correspondam a SQTratamento com 4 gl. Portanto, se existirem mais de dois tratamentos, o teste F s fornecer uma informao efetiva quando o contraste utilizado envolver apenas dois grupos experimentais.
779
Uma fonte de variao com mais de 1 grau de liberdade pode ser testada pela razo de varincias F, entretanto o que estar sendo julgado a variao mdia desta fonte. O resultado do teste F avaliar, portanto a magnitude dessa variao mdia, mas no deixar entrever se existe algum contraste que poderia ser significativo. Contudo, percebemos que quando utilizamos o teste F para mais de um grau de liberdade, algumas comparaes significativas podero passar despercebidas.
QUADRO 1.
Mdias segundo o tratamento e comparaes. Mdias 41 38 33 25 24 Comparaes A Ab Abc Bc C
Tratamento B A E C D Fonte: SAMPAIO, 2002.
Nos modelos matemticos lineares com mais de uma varivel independente, cada um desses elementos no modelo (Quadro 1) assume apenas 1 gl, razo pela qual caberia a utilizao do teste F. Cada varivel independente no modelo seria um contraste, com 1 gl. Esses contrastes poderiam ser de origem qualitativa, mais tambm podem ser de origem quantitativa. Isto ocorre quando os tratamentos estudados so nveis eqidistantes e variveis de um mesmo fator. Neste caso, embora fosse possvel sugerir qualquer grupo de contrastes ortogonais, o mais adequado seria investigar o tipo de funo observada atravs dos coeficientes dos polinmios ortogonais. O teste de F, portanto, para ser devidamente aplicado, exige um profundo conhecimento por parte do pesquisador das condies envolvidas que caracterizam o contraste (ou fonte) por ele testado (SAMPAIO, 2002).
O Teste t Segundo PIMENTEL GOMES (2000), outro teste clssico o teste t, que pode ser usado para comparar mdias. Como requisitos para sua aplicao conscienciosa temos porm, os seguintes: 1. As comparaes feitas pelo teste t devem ser escolhidas antes de serem examinados os dados; 2. Pode-se fazer no mximo tantas comparaes quantos so os graus de liberdade para tratamentos, e os contrastes devem ser ortogonais. Segundo VIEIRA et al. (1989), para obter a diferena mnima significante (d.m.s.) estabelecida pelo teste t, basta calcular:
d.m.s. = t
2 . QMR / r
780
onde t um valor dado em tabela, QMR o quadrado mdio do resduo da anlise de varincia e r o nmero de repeties de cada tratamento. Toda vez que o valor absoluto da diferena entre duas mdias igual ou maior que o valor da d.m.s., as mdias so estatisticamente diferentes.
O Teste t de Student Embora os estudos iniciais da distribuio de t fossem encetados por Gosset em 1908, citado por SAMPAIO (2002), o domnio, aplicao e divulgao deste teste deveram-se novamente a Fisher em 1926, citado por SAMPAIO (2002). Duas mdias A e B obtidas de grupos experimentais com rA e rB observaes respectivamente podem ser comparadas pela relao. t= (se2 A-B / rA) + (se2 / rB)
onde se2 a varincia do resduo estimada pela anlise de varincia. A existncia de vrios tratamentos conduzir mesma estimativa de se2 , mas medida que as mdias se distanciarem uma das outras, haver maior chance de ocorrncia do erro tipo I. Beneficiar a ocorrncia deste erro significa utilizar um teste mais sensvel para detectar diferenas significativas. Quando colocadas em ordem decrescente, apenas as mdias adjacentes podem ser comparadas sem aquele risco. Em conseqncia, este teste no deveria ser aplicado quando existisse um grande nmero de tratamentos. Na prtica, a limitao oramentria de utilizao de poucos tratamentos, abona a utilizao confortvel deste teste desde que o nmero de tratamentos no ultrapasse quatro. Por outro lado, o estudo de respostas muito instveis (CV>30%), onde o erro tipo II mais freqente, poderia se valer deste teste para ento contrabalanar tal probabilidade. As mdias comparadas por este teste sero diferentes estatisticamente se o valor calculado de t for maior que aquele tabelado segundo os graus de liberdade do erro (SAMPAIO, 2002). O valor da diferena mnima significativa seria, portanto: d.m.s.(Student) = tgl erro se2 + se2 rA rB
Se a distribuio de uma populao essencialmente normal (com a forma aproximadamente de um sino), ento a distribuio de t = x - M s n
781
essencialmente uma distribuio t de Student para todas as amostras de tamanho n. A distribuio t de Student, geralmente conhecida como distribuio t, utilizada na determinao da valores crticos denotados por t2 (TRIOLA 1999).
Segundo BONINI et al. (1972) a distribuio t de Student utilizada para amostras com um nmero de elementos inferior a 30 (n < 30). Segundo TRIOLA (1999), a distribuio t de Student utilizada tambm quando o desconhecido e quando a populao original tem distribuio essencialmente normal.
O Teste de Student Newman Keuls (SNK) Newman (1939) citado por SAMPAIO (2002), apresentou um teste que contornava os inconvenientes do teste t para ensaios com mais de dois tratamentos. Ajustava o valor de t dependendo da distncia entre as mdias ento ordenadas. Em uma relao decrescente de t mdias, duas delas (A e F) apresentaro diferena significativa se: A - F > qi se2 / r nde se2 o valor estimado do quadrado mdio do resduo, pela anlise de varincia, r o nmero de repeties, comum a todos os tratamentos e q i o valor tabelado proposto (t ajustado) obtido em funo da distncia entre as mdias (i = p + 2, p sendo o nmero de mdias existentes entre as duas mdias comparadas, na relao decrescente) e dos graus de liberdade do resduo, se2 . Os valores de q i diminuem com o aumento dos gl, mas aumentam com a distncia entre as mdias, corrigindo os excessos de erro tipo I. A diferena mnima significativa entre duas mdias com distncia i entre elas e com igual nmero de repeties : d.m.s.(SNK) = qi se2 /r
Segundo SAMPAIO (2002), quando as mdias comparadas A e B apresentarem diferente nmero de repeties, a diferena mnima significativa seria:
d.m.s.(SNK) =
qi
se2 2
1 rA
1 rB
O Teste de Tukey
O teste de Tukey, baseado na amplitude total estudentizada (studentized range, em ingls) pode ser utilizado para comparar todo e qualquer contraste entre duas mdias de tratamentos. O teste exato e de uso muito simples quando o nmero de repeties o mesmo para todos os tratamentos.
782
No caso de serem diferentes os nmeros de repeties o teste de Tukey pode ainda ser usado, mas ento apenas aproximado (PIMENTEL GOMES, 2000). No caso de comparaes mltiplas entre amostras de tamanhos iguais, o procedimento mais eficiente parece ser o proposto por Tukey, que utiliza valores crticos da amplitude studentizada, que denotamos por q (COSTA NETO, 1977). Tukey (1953) citado por SAMPAIO, (2002) considerou muito trabalhoso o procedimento proposto por Newman (1939) citado por SAMPAIO (2002), mas compactuava com a preocupao no controle do erro tipo I. A opo proposta de apenas um valor de diferena mnima significativa, a despeito da existncia de vrias mdias, caracterizou o teste como extremamente rigoroso, que embora controlasse muito bem o erro tipo I, permitia o aparecimento do erro tipo II. O valor nico proposto por Tukey coincide com o valor mximo do SNK, 0u seja, equivalente comparao entre a maior e a menor mdia. se2 / r
d.m.s.(Tukey) =
onde q o valor tabelado por Tukey em funo do nmero de tratamento e dos graus de liberdade do resduo. Para obter o valor da diferena mnima significante (d.m.s.) pelo teste de Tukey basta calcular:
d.m.s. = q
QMR r
onde q o valor dado na tabela ao nvel de mdio do resduo da anlise de varincia e tratamentos. De acordo com o teste, duas vez que o valor absoluto da diferena entre et al., 1989).
significncia estabelecido, QMR o quadrado r o nmero de repeties de cada um dos mdias so estatisticamente diferentes toda elas for igual ou maior que a d.m.s. (VIEIRA
Um teste assim rigoroso aplicado em um ensaio com muitos tratamentos (q aumenta com o nmero de tratamentos) e envolvendo uma varivel muito instvel (CV>25%) favorecer sobremaneira o aparecimento do erro tipo II (SAMPAIO, 2002). Se as mdias comparadas A e B tiverem diferente nmero de repeties, a d.m.s. seria:
d.m.s.(Tukey) =
se2 2
1 rA
+ 1 rB
Segundo COSTA NETO (1939) o mtodo de Tukey aproximadamente 37% mais eficiente que o de Scheff, para efeito de comparao das mdias duas a duas. No entanto, muito raramente, pode acontecer que, embora o teste F no tenha sido significativo na anlise da varincia, obtenha-se um ou mais contrastes significativos pelo teste de Tukey (PIMENTEL GOMES, 2000).
783
Teste de Scheff Segundo PIMENTEL GOMES (2000), o teste de Scheff s deve ser aplicado quando o teste F tiver dado resultado significativo. Se o valor de F obtido no for significativo, nenhum contraste poder ser significativo, e, pois, a aplicao do teste de Scheff no se justifica. Quando, porm, o valor de F obtido significativo, pelo menos um dos contrastes entre tratamentos ser significativo. Mas o contraste em questo pode ser muito complicado ou sem interesse prtico. E pode ainda acontecer que nenhum dos contrastes entre duas mdias apenas seja significativo. A flexibilidade proposta por Scheff (1953) citado por SAMPAIO (2002), para comparar qualquer contraste entre mdias e permitindo diferentes nmeros de observaes por tratamento definiu um teste um pouco mais rigoroso que aquele que Tukey, merecendo, portanto os mesmos comentrios com relao ao perigo aumento do erro tipo II. A diferena mnima significativa para qualquer contraste (que pode ser a comparao entre apenas duas mdias) (t - 1) F. Var(contraste)
d.m.s.(Scheff) =
onde t o nmero de tratamentos, F o valor tabelado de F com (t 1) e x graus de liberdade, sendo x os graus de liberdade do resduo (relativos a se2). Como a varincia de um contraste definida por: Var(contraste) = se2 C2i / ri onde Ci o coeficiente do tratamento i com ri repeties. Para a comparao de duas mdias oriundas de um igual nmero de repeties, tem-se: (t 1) F. 2 se2 / r
d.m.s.(scheff) =
Este teste tem a vantagem de utilizar os prprios valores do quadro da Anlise de Varincia, alm de poder ser usado no caso de amostras de tamanhos diferentes (COSTA NETO, 1977).
O Teste de Duncan Duncan (1955) citado por PIMENTEL GOMES, (2000) introduziu um novo teste ou prova para comparao de mdias, ao qual chegou depois de uma tentativa anterior. Sua aplicao bem mais trabalhosa do que a do teste de Tukey, mas se chega a resultados mais detalhados e se discrimina com mais facilidade entre os tratamentos, isto , o teste de Duncan indica resultados significativos em casos em que o teste de Tukey no permite obter significao estatstica. Tal como o teste de Tukey, o de Duncan exige, para ser exato, que todos os tratamentos tenham o mesmo nmero de repeties. O teste de Duncan mais trabalhoso do que o teste t e o de Tukey porque exige o clculo de diversas diferenas mnimas significantes. Para aplicar o teste de Duncan preciso primeiro ordenar as mdias. Calcula-se ento a diferena mnima significante (d.m.s.) para comparar a maior mdia com a menor. No conjunto ordenado das mdias, a comparao entre a maior e a menor mdia corresponde a um intervalo que abrange Revista Eletrnica Nutritime 784
todas as k mdias. Se a diferena entre a maior e a menor mdia significante, calculase outra d.m.s., agora para comparar mdias em um intervalo abrangendo k 1 mdias, e assim p diante. Sempre que duas mdias no so estatisticamente diferentes, no se podem testar as diferenas entre mdias que esto no intervalo delimitado por aquelas duas mdias. Para fazer o teste usual escrever as mdias em linha e em ordem crescente (ou decrescente). Toda vez que a diferena entre duas mdias no significante sublinha-se o intervalo delimitado por essas duas mdias; cada comparao nosignificante deve ser indicada por uma linha, distinta das demais; mdias sublinhadas por uma mesma linha no so estatisticamente diferentes e as diferenas entre elas no podem ser testadas (VIEIRA et al., 1989). Duncan (1955) citado por SAMPAIO (2002) sugeriu a utilizao de um teste baseando-se na mesma argumentao do teste de Student Newman Keuuls. A percepo e o controle do erro tipo I era sem dvida flagrante no SNK, mas a comparao de mdias mais afastadas criava uma oportunidade para o aparecimento do erro tipo II (j que o maior valor da diferena mnima significativa se equipara com aquela do teste Tukey). Segundo VIEIRA et al. (1989), para obter a d.m.s. aplica-se a frmula:
d.m.s. = z
QMR r
onde z um valor dado em tabela ao nvel de significncia estabelecido e para o nmero de mdias abrangidas pelo intervalo delimitado pelas mdias em comparao, QMR o quadrado mdio do resduo da anlise de varincia e r o nmero de repeties. Toda vez que o valor absoluto da diferena entre as mdias em comparao igual ou maior que a d.m.s., conclui-se que as mdias so estatisticamente diferentes, ao nvel de significncia estabelecida. Segundo Duncan (1955) citado por SAMPAIO (2002), Duncan tentou reduzir as d.m.s. impostas pelas comparaes mais dramticas: se2 / r
d.m.s.(Duncan) =
qi
onde qi o valor tabelado por Duncan (ou seja, um t ajustado) obtido em funo da distncia entre as duas mdias a serem comparadas (i = p + 2, p = nmero de mdias localizadas entre as duas que esto sendo comparadas, quando relacionadas em ordem crescente) e r o nmero comum de observaes por tratamento. Os valores de qi no sobem to rapidamente quanto aqueles do teste Student Newman Keuls, controlando assim o aparecimento do erro tipo II na comparao de mdias mais afastadas. Se as mdias comparadas A e B contiverem diferente nmero de repeties, a d.m.s. seria: se2 2
d.m.s.(Duncan) =
qi
1 rA
1 rB
Segundo PIMENTEL GOMES (2000), quando o nmero de mdias avultado (superior a 10, por exemplo) a aplicao do teste de Duncan se torna muito trabalhosa. Revista Eletrnica Nutritime 785
O Teste de Dunnett
Segundo VIEIRA et al. (1989), o teste de Dunnett deve ser aplicado toda vez que se pretendem comparar as mdias dos tratamentos apenas com a mdia do controle. Para obter a d.m.s. aplica-se a frmula:
d.m.s. = d
2 . QMR r
onde d um valor dado em tabela, ao nvel de significncia estabelecido, QMR o quadrado mdio do resduo da anlise de varincia e r o nmero de repeties. Para as comparaes mltiplas onde um tratamento serve de referncia para os demais, ou seja, deseja-se comparar todos com apenas um. Dunnett (1955) citado por SAMPAIO (2002) sugeriu a seguinte diferena mnima significativa: se2 C2i / ri
d.m.s.(Dunnett) = D
onde D o valor encontrado na tabela de Dunnett proposta em funo dos (t 1) graus de liberdade (t = nmero de tratamentos) e os graus de liberdade do resduo (relativos a se2), se2 a estimativa do quadrado mdio do resduo obtida da anlise de varincia e Ci o coeficiente utilizado no contraste i com ri repeties. Quando todos os tratamentos tm igual nmero de observaes: 2 se2 / r
d.m.s.(Dunnett) =
que semelhante ao teste t de Student, exceto pelo valor de D, aqui ajustado para um maior nmero de tratamentos. A utilizao deste teste, que impede outras comparaes no contidas em suas condies iniciais pouco freqente dado a esta limitao (SAMPAIO, 2002).
O Teste de Bonferroni
Segundo PIMENTEL GOMES (2000), o teste de Bonferroni um aperfeioamento do teste t. Com efeito, recomendamos que s se aplique o teste t a contrastes escolhidos previamente, antes de serem examinados os dados, e que tais contrastes, em nmero no mximo igual ao de graus de liberdade para tratamentos, devem ser ortogonais.
ALGUMAS CONSIDERAES (VANTAGENS E DESVANTAGENS DOS TESTES)
A escolha do mtodo adequado para comparar mdias exige, que se leve em considerao tanto o nvel de significncia como o poder do teste. O nvel de significncia de um teste a probabilidade de rejeitar a hiptese de que as mdias so iguais, quando esta hiptese , na realidade, verdadeira. J o poder do teste a probabilidade de Revista Eletrnica Nutritime 786
rejeitar a hiptese de que as mdias so iguais quando esta hiptese , na realidade, falsa. Mas a escolha do procedimento adequado para comparar mdias exige distinguir ainda nvel de significncia para comparaes de mdias e nvel de significncia para experimentos. Se for escolhido, para a comparao de mdias, ou o teste de Tukey ou o teste de Dunnett, o nvel de significncia para experimentos ser de 5%, mas o nvel de significncia para comparaes de mdias ser menor que 5%. Por outro lado, se for escolhido, para comparao de mdias, ou o teste t ou o teste de Duncan, o nvel de significncia para comparaes de mdias ser de aproximadamente 5%, mas o nvel de significncia para experimentos ser maior do que 5%. Em compensao, o poder do teste tambm ser maior (VIEIRA et al., 1989). Segundo PIMENTEL GOMES (2000), os testes de Tukey e de Duncan tm fundamentos muitos semelhantes. O teste de Duncan , porm, menos conservador, isto , d diferenas significativas com mais facilidade. J o teste de Tukey, mais exigente, temos sempre uma probabilidade de 95% de no apontar como significativa uma diferena realmente nula entre todas as mdias de tratamentos. No de admirar, pois, que, com n > 2 o teste de Duncan d resultados significativos em casos em que isto no acontece com o teste de Tukey: que ento o teste de Duncan nos leva a afirmativas erradas com maior freqncia. O mesmo acontece, com perigo muito maior, com o teste t aplicado indiscriminadamente, o que hoje no se aceita mais. O teste de Duncan estabelece, pois, um meio termo entre o rigor um tanto excessivo do teste de Tukey e a falta de rigor exagerado do teste t usado sem as devidas cautelas. Se o pesquisador quer ter alta chance de rejeitar a hiptese de que as mdias so iguais, pode optar pelo teste t ou pelo teste de Duncan. Estes dois testes tm caractersticas similares, mas o teste t mais antigo e, talvez por isso, mais conhecido. Tambm de aplicao mais fcil. Entretanto, o pesquisador tambm pode optar por aplicar o teste de Tukey ou de Dunnett, com nvel de significncia mais elevado. Estes testes teriam, ento, maior poder. Por exemplo, o teste de Tukey a 10% tem maior poder que o teste de Tukey a 5%. Se o pesquisador s pretende rejeitar a hiptese de que as mdias so iguais com muita confiana, deve optar pelo teste de Tukey ou de Dunnett, com baixo nvel de significncia. O teste t, apresentado aqui, uma extenso do teste t de Student, feita por Fisher. Muitos autores consideram errado aplicar o teste t para comparao de mdias, duas a duas. Na verdade, no existe propriamente erro: apenas o nvel de significncia para experimentos se torna, nesse caso, muito elevado (VIEIRA et al., 1989). J o teste de Scheff ainda mais perigoso desaconselhvel para a comparao de duas mdias, mas presta bons servios para provar contrastes mais complicados, e para isto de uso indicado. O teste de Bonferroni muito bom para pequeno nmero de contrastes, mas excessivamente conservador quando esse nmero cresce. Por exemplo, com 6 tratamentos se podem obter 15 contrastes diferentes entre duas mdias. O teste de Bonferroni aplicado a 10 ou mais desses contrastes mais conservador do que o de Tukey. Mas no se esquea que o teste de Bonferroni se pode aplicar tambm a contrastes mais complexos (PIMENTEL GOMES, 2000). De qualquer forma, fica aqui um alerta: todos os procedimentos para a comparao de mdias tm vantagens e desvantagens. Ainda no existe um teste definitivamente melhor que todos os outros. Convm at lembrar que um estatstico Revista Eletrnica Nutritime 787
conhecido recomendou no usar testes de hipteses que se propem a comparar mdias, duas a duas. J outro estatstico de renome considerou que os procedimentos para comparar mdias devem ser vistos mais como indicadores do que como solues exatas. No entanto, preciso adotar um procedimento formal para comparar mdias. Isto evita que as concluses fiquem totalmente dependentes da opinio do pesquisador. Mesmo assim, existe uma grande margem de opo tanto na escolha do teste, como no estabelecimento do nvel de significncia (VIEIRA et al., 1989).
REFERNCIAS CONSULTADAS
BONINI, E. E.; BONINI, S. E. Estatstica. Edies Loyola. So Paulo, 1972. 439p.
COSTA NETO, P. L. O. Estatstica. So Paulo: Edgard Blcher, 1977. 264p.
FONSECA, J. S.; MARTINS, G. A. M. Curso de estatstica. 3. ed. So Paulo: Atlas, 1982. 286p.
PIMENTEL GOMES, F. Curso de estatstica experimental. 14 ed. Piracicaba SP: Editora da Universidade de So Paulo, 2000. 477p.
SAMPAIO, I. B. M. Estatstica aplicada experimentao animal. 2.ed. Belo Horizonte: Fundao de Estudo e Pesquisa em Medicina Veterinria e Zootecnia, 2002. 265p.
TRIOLA, M. F. Introduo estatstica. Rio de Janeiro: JC, 1999. 410p.
VIEIRA, S.; HOFFMANN, R. Estatstica experimental. So Paulo: Atlas, 1989. 175p.
788

Testes Estatísticos para Comparação de Médias 2

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Testes Estatísticos para Comparação de Médias 2

Enviado por

Direitos autorais:

Formatos disponíveis

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

Zootecnista, Doutoranda em Produo Animal, Universidade Estadual de Maring froesgaluci@hotmail.com

Revista Eletrnica Nutritime

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

Revista Eletrnica Nutritime

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

Mdias segundo o tratamento e comparaes. Mdias 41 38 33 25 24 Comparaes A Ab Abc Bc C

Tratamento B A E C D Fonte: SAMPAIO, 2002.

Revista Eletrnica Nutritime

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

Revista Eletrnica Nutritime

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

Revista Eletrnica Nutritime

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

Revista Eletrnica Nutritime

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

ALGUMAS CONSIDERAES (VANTAGENS E DESVANTAGENS DOS TESTES)

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

BONINI, E. E.; BONINI, S. E. Estatstica. Edies Loyola. So Paulo, 1972. 439p.

COSTA NETO, P. L. O. Estatstica. So Paulo: Edgard Blcher, 1977. 264p.

TRIOLA, M. F. Introduo estatstica. Rio de Janeiro: JC, 1999. 410p.

VIEIRA, S.; HOFFMANN, R. Estatstica experimental. So Paulo: Atlas, 1989. 175p.

Revista Eletrnica Nutritime

Você também pode gostar