076V5N6P777 788 Nov2008 PDF

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.
Artigo Nmero 76
TESTES ESTATSTICOS PARA COMPARAO DE MDIAS
Andria Fres Galuci Oliveira1
INTRODUO
Quando a anlise de varincia de um experimento mostra que as mdias de
tratamento no so estatisticamente iguais, apenas lgico perguntar quais so as
mdias que diferem entre si. O pesquisador em geral gostaria de aplicar um teste para
comparar mdias, duas a duas. Considere um experimento para comparar trs
tratamentos, A, B e C. Se a anlise de varincia mostrar que as mdias desses
tratamentos no so estatisticamente iguais, bastante possvel que o pesquisador
procure um teste estatstico para comparar as mdias de A e B, A e C, B e C. Mas como
se faz comparao de mdias, duas a duas?
O pesquisador precisa de um mtodo que fornea a diferena mnima significante
entre duas mdias. Essa diferena seria o instrumento de medida. Toda vez que o valor
absoluto da diferena entre duas mdias igual ou maior do que a diferena mnima
significante, as mdias so consideradas estatisticamente diferentes, ao nvel de
significncia estabelecida (VIEIRA et al., 1989).
A estratgia da anlise estatstica se define a partir dos objetivos do pesquisador e
das condies experimentais ento existentes.
A natureza quantitativa dos tratamentos empregados pode sugerir o estudo de
modelos (ou funes) que venham a trazer alguma informao adicional ao pesquisador,
mas este procedimento, por si s, no substitui a comparao das mdias obtidas no
ensaio (SAMPAIO, 2002).
Segundo VIEIRA et al. (1989), a comparao de mdias s pode ser feita aps a
anlise de varincia. Isto porque todos os procedimentos para obter a d.m.s. exigem o
clculo do quadrado mdio do resduo. Mas a anlise de varincia tambm d o valor de
F, que permite decidir se as mdias so ou no iguais, a determinado nvel de
significncia.
A Anlise de Varincia um mtodo suficientemente poderoso para poder
identificar diferenas entre as mdias populacionais devidas a vrias causas atuando
simultaneamente sobre os elementos da populao (COSTA NETO, 1977).
A possibilidade de utilizar um dos vrios testes estatsticos existentes para a
comparao de mdias, de alguma maneira, seduz o experimentador que, entre
comedido e inovador, deseja optar por um deles.
A eleio de um teste pelo pesquisador deve contemplar aquele cujas concluses
que advieram de seu uso sejam menos sujeitas a erros tidos como indesejveis
(SAMPAIO, 2002).
Segundo FONSECA et al. (1982) o mtodo de anlise de varincia indica a
aceitao ou rejeio da hiptese de igualdade das mdias. Se a hiptese de nulidade
(Ho) for rejeitada, estaremos admitindo que, pelo menos, uma das mdias diferente
das demais. Surge, contudo a questo: Quais mdias devem ser consideradas diferentes?
Zootecnista, Doutoranda em Produo Animal, Universidade Estadual de Maring froesgaluci@hotmail.com
Revista Eletrnica Nutritime
777
Existem alguns testes para a soluo dessa questo, que sero apresentados a
seguir.
CONSIDERAES GERAIS
Segundo SAMPAIO (2002), as situaes que conduzem comparao de valores

mdios precisam considerar sempre dois aspectos essenciais para a escolha do teste
adequado:
1. O primeiro deles refere-se caracterizao da resposta a ser medida (varivel
alvo) quanto a sua natureza (qualitativa ou quantitativa), a sua distribuio
(normal ou no), a sua continuidade (contnua ou discreta) e a sua instabilidade
(muito ou pouco instvel).
2. O segundo aspecto a ser considerado que, aps a utilizao de um teste de
comparao de mdias, existem dois tipos de erro reconhecidos pela teoria
estatstica: o erro tipo I (atribuir uma significncia quando ela realmente no
existir) e o erro tipo II (atribuir uma equivalncia quando realmente houver uma
diferena significativa).
OS TESTES ESTATSTICOS
Todos os testes atualmente em voga fornecem o mesmo resultado quando

existem apenas dois tratamentos e, portanto um s contraste a ser avaliado (1 gl ou 1
grau de liberdade).
Os testes de comparao mltipla procuram atender aos interesses da
experimentao moderna que utiliza um nmero maior de grupos investigados devidos s
limitaes amostral e de infra-estrutura, este nmero varia entre 3 e 6 na grande maioria
dos ensaios, exceto nas competies de variedades em agricultura e em geral em
esquemas fatoriais.
Os esquemas fatoriais so casos especiais onde cada fator estudado se apresenta
com 2 a 4 nveis, aqui tambm limitados para atender restries oramentrias. O estudo
fundamental das interaes entre os fatores exigir a comparao dos nveis de um fator
dentro de nveis fixos dos demais. As comparaes racionais envolvero, portanto, muito
menos mdias (de 2 a 4) do que aquelas subitamente sugeridas pelo fatorial completo.
A teoria estatstica sempre deixou claro que frente a vrios tratamentos (t) apenas
os (t-1) graus de liberdade poderiam ser decompostos e testados enquanto na realidade
existiam t(t-1)/2 comparaes possveis. Os pesquisadores sempre se interessaram mais
por estas t(t-1)/2 comparaes entre mdias, j que os t-1 contrastes permitidos nem
sempre retratavam a comparao de dois tratamentos e sim de grupos deles.
Na realidade percebeu-se que com o aumento do nmero de tratamento (e,
portanto da amplitude da menor para a maior mdia) aumentava a probabilidade de se
detectarem diferenas significativas entre t(t-1)/2 contrastes possveis. Neste caso, o
erro I estaria sendo beneficiado medida que a distncia entre duas mdias fosse
aumentando.
Todos os estudos desenvolvidos a partir deste alerta preocuparam-se em controlar
aquele tipo de erro em particular, criando testes mais rigorosos no controle do erro I e
conseqentemente mais permissivos no do erro II.
778
Com base no exposto em consideraes gerais, passaremos a tecer comentrios

sobre os testes mais freqentemente elegidos na experimentao (SAMPAIO, 2002).
O Teste F
Em 1924, Fisher apresentou a fundamentao bsica que permitiu a posterior
formulao do teste F por Snedecor. Estruturado para avaliar a variao mdia de uma
determinada fonte em relao variao individual, ou seja:
F = Varincia da fonte testada/ Varincia do resduo
O valor assim calculado de F deve ser comparado quele tabelado segundo os
graus de liberdade da fonte testada e do resduo, respectivamente nas colunas e linhas
daquela tabela.
Quando a fonte sendo testada no for uma interao e se redigir a apenas um
grau de liberdade, o teste F adequadamente aplicado ao teste t de Student (t2 = F).
Segundo SAMPAIO (2002), uma fonte de variao com apenas 1 gl pode advir das
seguintes situaes:
1. Existem apenas dois tratamentos, e, portanto um nico contraste a ser feito,
equivalente a 1 gl. A significncia ou no do teste F executado na anlise de
varincia traduzir ou no a diferena significativa entre os dois tratamentos.
2. Existem mais de dois tratamentos (t tratamentos, por exemplo), e, portanto
existiro t-1 contrastes ortogonais, cada um correspondente a 1 gl. Alguns desses
contrastes podero definir a comparao direta entre dois tratamentos, outros
envolvero mais de um deles. Para aqueles contrastes, prevalece o comentrio
feito no item 1 anterior. Para a os ltimos, independentemente do resultado do
teste F, as concluses devero ser feitas discretamente, obedecendo natureza
do contraste.
Segundo VIEIRA et al., (1989). Para obter a diferena mnima significante (d.m.s.)
estabelecida pelo teste t, basta calcular:
d.m.s. =
2 . QMR
r
onde t um valor dado em tabela, QMR o quadrado mdio do resduo da anlise de

varincia e r o nmero de repeties de cada tratamento. Toda vez que o valor
absoluto da diferena entre duas mdias igual ou maior do que o valor da d.m.s., as
mdias so estatisticamente diferentes.
Contrastes Ortogonais
Se existirem cinco tratamentos de natureza qualitativa, apenas 4 gl podero ser

decompostos ortogonalmente (ou seja, sem confundimentos) de modo que as somas de
quadrados individuais somadas correspondam a SQTratamento com 4 gl.
Portanto, se existirem mais de dois tratamentos, o teste F s fornecer uma
informao efetiva quando o contraste utilizado envolver apenas dois grupos
experimentais.
779
Uma fonte de variao com mais de 1 grau de liberdade pode ser testada pela
razo de varincias F, entretanto o que estar sendo julgado a variao mdia desta
fonte. O resultado do teste F avaliar, portanto a magnitude dessa variao mdia, mas
no deixar entrever se existe algum contraste que poderia ser significativo.
Contudo, percebemos que quando utilizamos o teste F para mais de um grau de
liberdade, algumas comparaes significativas podero passar despercebidas.
QUADRO 1.
Mdias segundo o tratamento e comparaes.
Tratamento
Mdias
Comparaes
41
38
Ab
33
Abc
25
Bc
24
Fonte: SAMPAIO, 2002.
Nos modelos matemticos lineares com mais de uma varivel independente, cada
um desses elementos no modelo (Quadro 1) assume apenas 1 gl, razo pela qual caberia
a utilizao do teste F. Cada varivel independente no modelo seria um contraste, com 1
gl. Esses contrastes poderiam ser de origem qualitativa, mais tambm podem ser de
origem quantitativa. Isto ocorre quando os tratamentos estudados so nveis
eqidistantes e variveis de um mesmo fator. Neste caso, embora fosse possvel sugerir
qualquer grupo de contrastes ortogonais, o mais adequado seria investigar o tipo de
funo observada atravs dos coeficientes dos polinmios ortogonais.
O teste de F, portanto, para ser devidamente aplicado, exige um profundo
conhecimento por parte do pesquisador das condies envolvidas que caracterizam o
contraste (ou fonte) por ele testado (SAMPAIO, 2002).
O Teste t
Segundo PIMENTEL GOMES (2000), outro teste clssico o teste t, que pode ser
usado para comparar mdias. Como requisitos para sua aplicao conscienciosa temos
porm, os seguintes:
1. As comparaes feitas pelo teste t devem ser escolhidas antes de serem
examinados os dados;
2. Pode-se fazer no mximo tantas comparaes quantos so os graus de liberdade
para tratamentos, e os contrastes devem ser ortogonais.
Segundo VIEIRA et al. (1989), para obter a diferena mnima significante (d.m.s.)
estabelecida pelo teste t, basta calcular:
d.m.s. = t
2 . QMR / r
780
onde t um valor dado em tabela, QMR o quadrado mdio do resduo da anlise de

varincia e r o nmero de repeties de cada tratamento. Toda vez que o valor
absoluto da diferena entre duas mdias igual ou maior que o valor da d.m.s., as
mdias so estatisticamente diferentes.
O Teste t de Student
Embora os estudos iniciais da distribuio de t fossem encetados por Gosset em
1908, citado por SAMPAIO (2002), o domnio, aplicao e divulgao deste teste
deveram-se novamente a Fisher em 1926, citado por SAMPAIO (2002).
Duas mdias A e B obtidas de grupos experimentais com rA e rB observaes
respectivamente podem ser comparadas pela relao.
t=
A-B
(se2
/ rA) + (se2 / rB)
onde se2 a varincia do resduo estimada pela anlise de varincia.

A existncia de vrios tratamentos conduzir mesma estimativa de se2 , mas
medida que as mdias se distanciarem uma das outras, haver maior chance de
ocorrncia do erro tipo I. Beneficiar a ocorrncia deste erro significa utilizar um teste
mais sensvel para detectar diferenas significativas.
Quando colocadas em ordem decrescente, apenas as mdias adjacentes podem
ser comparadas sem aquele risco.
Em conseqncia, este teste no deveria ser aplicado quando existisse um grande
nmero de tratamentos. Na prtica, a limitao oramentria de utilizao de poucos
tratamentos, abona a utilizao confortvel deste teste desde que o nmero de
tratamentos no ultrapasse quatro.
Por outro lado, o estudo de respostas muito instveis (CV>30%), onde o erro tipo
II mais freqente, poderia se valer deste teste para ento contrabalanar tal
probabilidade.
As mdias comparadas por este teste sero diferentes estatisticamente se o valor
calculado de t for maior que aquele tabelado segundo os graus de liberdade do erro
(SAMPAIO, 2002).
O valor da diferena mnima significativa seria, portanto:
d.m.s.(Student) = tgl erro
se2 + se2
rA
rB
Se a distribuio de uma populao essencialmente normal (com a forma

aproximadamente de um sino), ento a distribuio de
t = x - M
s
n
781
essencialmente uma distribuio t de Student para todas as amostras de tamanho n. A

distribuio t de Student, geralmente conhecida como distribuio t, utilizada na
determinao da valores crticos denotados por t2 (TRIOLA 1999).
Segundo BONINI et al. (1972) a distribuio t de Student utilizada para

amostras com um nmero de elementos inferior a 30 (n < 30).
Segundo TRIOLA (1999), a distribuio t de Student utilizada tambm quando o
desconhecido e quando a populao original tem distribuio essencialmente normal.
O Teste de Student Newman Keuls (SNK)

Newman (1939) citado por SAMPAIO (2002), apresentou um teste que contornava
os inconvenientes do teste t para ensaios com mais de dois tratamentos. Ajustava o valor
de t dependendo da distncia entre as mdias ento ordenadas.
Em uma relao decrescente de t mdias, duas delas (A e F) apresentaro
diferena significativa se:
A - F
> qi
se2 / r
nde se2 o valor estimado do quadrado mdio do resduo, pela anlise de varincia, r o
nmero de repeties, comum a todos os tratamentos e q i o valor tabelado proposto (t
ajustado) obtido em funo da distncia entre as mdias (i = p + 2, p sendo o nmero de
mdias existentes entre as duas mdias comparadas, na relao decrescente) e dos
graus de liberdade do resduo, se2 .
Os valores de q i diminuem com o aumento dos gl, mas aumentam com a distncia
entre as mdias, corrigindo os excessos de erro tipo I.
A diferena mnima significativa entre duas mdias com distncia i entre elas e
com igual nmero de repeties :
d.m.s.(SNK) = qi
se2 /r
Segundo SAMPAIO (2002), quando as mdias comparadas A e B apresentarem

diferente nmero de repeties, a diferena mnima significativa seria:
d.m.s.(SNK) =
qi
se2
2
1
rA
1
rB
O Teste de Tukey
O teste de Tukey, baseado na amplitude total estudentizada (studentized range,

em ingls) pode ser utilizado para comparar todo e qualquer contraste entre duas mdias
de tratamentos. O teste exato e de uso muito simples quando o nmero de repeties
o mesmo para todos os tratamentos.
782
No caso de serem diferentes os nmeros de repeties o teste de Tukey pode

ainda ser usado, mas ento apenas aproximado (PIMENTEL GOMES, 2000).
No caso de comparaes mltiplas entre amostras de tamanhos iguais, o
procedimento mais eficiente parece ser o proposto por Tukey, que utiliza valores crticos
da amplitude studentizada, que denotamos por q (COSTA NETO, 1977).
Tukey (1953) citado por SAMPAIO, (2002) considerou muito trabalhoso o
procedimento proposto por Newman (1939) citado por SAMPAIO (2002), mas
compactuava com a preocupao no controle do erro tipo I. A opo proposta de apenas
um valor de diferena mnima significativa, a despeito da existncia de vrias mdias,
caracterizou o teste como extremamente rigoroso, que embora controlasse muito bem o
erro tipo I, permitia o aparecimento do erro tipo II. O valor nico proposto por Tukey
coincide com o valor mximo do SNK, 0u seja, equivalente comparao entre a maior e
a menor mdia.
d.m.s.(Tukey) =
se2 / r
onde q o valor tabelado por Tukey em funo do nmero de tratamento e dos graus de
liberdade do resduo.
Para obter o valor da diferena mnima significante (d.m.s.) pelo teste de Tukey
basta calcular:
d.m.s. = q
QMR
r
onde q o valor dado na tabela ao nvel de

mdio do resduo da anlise de varincia e
tratamentos. De acordo com o teste, duas
vez que o valor absoluto da diferena entre
et al., 1989).
significncia estabelecido, QMR o quadrado

r o nmero de repeties de cada um dos
mdias so estatisticamente diferentes toda
elas for igual ou maior que a d.m.s. (VIEIRA
Um teste assim rigoroso aplicado em um ensaio com muitos tratamentos (q

aumenta com o nmero de tratamentos) e envolvendo uma varivel muito instvel
(CV>25%) favorecer sobremaneira o aparecimento do erro tipo II (SAMPAIO, 2002).
Se as mdias comparadas A e B tiverem diferente nmero de repeties, a d.m.s.
seria:
d.m.s.(Tukey) =
se2
2
1
rA
+ 1
rB
Segundo COSTA NETO (1939) o mtodo de Tukey aproximadamente 37% mais

eficiente que o de Scheff, para efeito de comparao das mdias duas a duas.
No entanto, muito raramente, pode acontecer que, embora o teste F no
tenha sido significativo na anlise da varincia, obtenha-se um ou mais
contrastes significativos pelo teste de Tukey (PIMENTEL GOMES, 2000).
783
Teste de Scheff
Segundo PIMENTEL GOMES (2000), o teste de Scheff s deve ser aplicado
quando o teste F tiver dado resultado significativo. Se o valor de F obtido no for
significativo, nenhum contraste poder ser significativo, e, pois, a aplicao do teste de
Scheff no se justifica. Quando, porm, o valor de F obtido significativo, pelo menos
um dos contrastes entre tratamentos ser significativo. Mas o contraste em questo pode
ser muito complicado ou sem interesse prtico. E pode ainda acontecer que nenhum dos
contrastes entre duas mdias apenas seja significativo.
A flexibilidade proposta por Scheff (1953) citado por SAMPAIO (2002), para
comparar qualquer contraste entre mdias e permitindo diferentes nmeros de
observaes por tratamento definiu um teste um pouco mais rigoroso que aquele que
Tukey, merecendo, portanto os mesmos comentrios com relao ao perigo aumento do
erro tipo II.
A diferena mnima significativa para qualquer contraste (que pode ser a
comparao entre apenas duas mdias)
(t - 1) F. Var(contraste)
d.m.s.(Scheff) =
onde t o nmero de tratamentos, F o valor tabelado de F com (t 1) e x graus de

liberdade, sendo x os graus de liberdade do resduo (relativos a se2).
Como a varincia de um contraste definida por:
Var(contraste) = se2 C2i / ri
onde Ci o coeficiente do tratamento i com ri repeties. Para a comparao de duas
mdias oriundas de um igual nmero de repeties, tem-se:
d.m.s.(scheff) =
(t 1) F. 2 se2 / r
Este teste tem a vantagem de utilizar os prprios valores do quadro da

Anlise de Varincia, alm de poder ser usado no caso de amostras de
tamanhos diferentes (COSTA NETO, 1977).
O Teste de Duncan
Duncan (1955) citado por PIMENTEL GOMES, (2000) introduziu um novo teste ou
prova para comparao de mdias, ao qual chegou depois de uma tentativa anterior. Sua
aplicao bem mais trabalhosa do que a do teste de Tukey, mas se chega a resultados
mais detalhados e se discrimina com mais facilidade entre os tratamentos, isto , o teste
de Duncan indica resultados significativos em casos em que o teste de Tukey no permite
obter significao estatstica. Tal como o teste de Tukey, o de Duncan exige, para ser
exato, que todos os tratamentos tenham o mesmo nmero de repeties.
O teste de Duncan mais trabalhoso do que o teste t e o de Tukey porque exige o
clculo de diversas diferenas mnimas significantes. Para aplicar o teste de Duncan
preciso primeiro ordenar as mdias. Calcula-se ento a diferena mnima significante
(d.m.s.) para comparar a maior mdia com a menor. No conjunto ordenado das mdias,
a comparao entre a maior e a menor mdia corresponde a um intervalo que abrange
784
todas as k mdias. Se a diferena entre a maior e a menor mdia significante, calculase outra d.m.s., agora para comparar mdias em um intervalo abrangendo k 1 mdias,
e assim p diante.
Sempre que duas mdias no so estatisticamente diferentes, no se podem
testar as diferenas entre mdias que esto no intervalo delimitado por aquelas duas
mdias. Para fazer o teste usual escrever as mdias em linha e em ordem crescente
(ou decrescente). Toda vez que a diferena entre duas mdias no significante
sublinha-se o intervalo delimitado por essas duas mdias; cada comparao nosignificante deve ser indicada por uma linha, distinta das demais; mdias sublinhadas por
uma mesma linha no so estatisticamente diferentes e as diferenas entre elas no
podem ser testadas (VIEIRA et al., 1989).
Duncan (1955) citado por SAMPAIO (2002) sugeriu a utilizao de um teste
baseando-se na mesma argumentao do teste de Student Newman Keuuls. A
percepo e o controle do erro tipo I era sem dvida flagrante no SNK, mas a
comparao de mdias mais afastadas criava uma oportunidade para o aparecimento do
erro tipo II (j que o maior valor da diferena mnima significativa se equipara com
aquela do teste Tukey).
Segundo VIEIRA et al. (1989), para obter a d.m.s. aplica-se a frmula:
d.m.s. = z
QMR
r
onde z um valor dado em tabela ao nvel de significncia estabelecido e para o nmero

de mdias abrangidas pelo intervalo delimitado pelas mdias em comparao, QMR o
quadrado mdio do resduo da anlise de varincia e r o nmero de repeties. Toda
vez que o valor absoluto da diferena entre as mdias em comparao igual ou maior
que a d.m.s., conclui-se que as mdias so estatisticamente diferentes, ao nvel de
significncia estabelecida.
Segundo Duncan (1955) citado por SAMPAIO (2002), Duncan tentou reduzir as
d.m.s. impostas pelas comparaes mais dramticas:
d.m.s.(Duncan) =
qi
se2 / r
onde qi o valor tabelado por Duncan (ou seja, um t ajustado) obtido em funo da
distncia entre as duas mdias a serem comparadas (i = p + 2, p = nmero de mdias
localizadas entre as duas que esto sendo comparadas, quando relacionadas em ordem
crescente) e r o nmero comum de observaes por tratamento. Os valores de qi no
sobem to rapidamente quanto aqueles do teste Student Newman Keuls, controlando
assim o aparecimento do erro tipo II na comparao de mdias mais afastadas.
Se as mdias comparadas A e B contiverem diferente nmero de repeties, a
d.m.s. seria:
d.m.s.(Duncan) =
qi
se2
rA
1
rB
Segundo PIMENTEL GOMES (2000), quando o nmero de mdias avultado

(superior a 10, por exemplo) a aplicao do teste de Duncan se torna muito trabalhosa.
785
O Teste de Dunnett
Segundo VIEIRA et al. (1989), o teste de Dunnett deve ser aplicado toda vez que
se pretendem comparar as mdias dos tratamentos apenas com a mdia do controle.
Para obter a d.m.s. aplica-se a frmula:
d.m.s. = d
2 . QMR
r
onde d um valor dado em tabela, ao nvel de significncia estabelecido, QMR o

quadrado mdio do resduo da anlise de varincia e r o nmero de repeties.
Para as comparaes mltiplas onde um tratamento serve de referncia para os
demais, ou seja, deseja-se comparar todos com apenas um. Dunnett (1955) citado por
SAMPAIO (2002) sugeriu a seguinte diferena mnima significativa:
d.m.s.(Dunnett) = D
se2 C2i / ri
onde D o valor encontrado na tabela de Dunnett proposta em funo dos (t 1) graus

de liberdade (t = nmero de tratamentos) e os graus de liberdade do resduo (relativos a
se2), se2 a estimativa do quadrado mdio do resduo obtida da anlise de varincia e Ci
o coeficiente utilizado no contraste i com ri repeties.
Quando todos os tratamentos tm igual nmero de observaes:
d.m.s.(Dunnett) =
2 se2 / r
que semelhante ao teste t de Student, exceto pelo valor de D, aqui ajustado para um
maior nmero de tratamentos.
A utilizao deste teste, que impede outras comparaes no contidas em suas
condies iniciais pouco freqente dado a esta limitao (SAMPAIO, 2002).
O Teste de Bonferroni
Segundo PIMENTEL GOMES (2000), o teste de Bonferroni um aperfeioamento

do teste t. Com efeito, recomendamos que s se aplique o teste t a contrastes escolhidos
previamente, antes de serem examinados os dados, e que tais contrastes, em nmero no
mximo igual ao de graus de liberdade para tratamentos, devem ser ortogonais.
ALGUMAS CONSIDERAES (VANTAGENS E DESVANTAGENS DOS TESTES)
A escolha do mtodo adequado para comparar mdias exige, que se leve em

considerao tanto o nvel de significncia como o poder do teste. O nvel de significncia
de um teste a probabilidade de rejeitar a hiptese de que as mdias so iguais, quando
esta hiptese , na realidade, verdadeira. J o poder do teste a probabilidade de
786
rejeitar a hiptese de que as mdias so iguais quando esta hiptese , na realidade,

falsa.
Mas a escolha do procedimento adequado para comparar mdias exige distinguir
ainda nvel de significncia para comparaes de mdias e nvel de significncia para
experimentos.
Se for escolhido, para a comparao de mdias, ou o teste de Tukey ou o teste de
Dunnett, o nvel de significncia para experimentos ser de 5%, mas o nvel de
significncia para comparaes de mdias ser menor que 5%. Por outro lado, se for
escolhido, para comparao de mdias, ou o teste t ou o teste de Duncan, o nvel de
significncia para comparaes de mdias ser de aproximadamente 5%, mas o nvel de
significncia para experimentos ser maior do que 5%. Em compensao, o poder do
teste tambm ser maior (VIEIRA et al., 1989).
Segundo PIMENTEL GOMES (2000), os testes de Tukey e de Duncan tm
fundamentos muitos semelhantes. O teste de Duncan , porm, menos conservador, isto
, d diferenas significativas com mais facilidade. J o teste de Tukey, mais exigente,
temos sempre uma probabilidade de 95% de no apontar como significativa uma
diferena realmente nula entre todas as mdias de tratamentos. No de admirar, pois,
que, com n > 2 o teste de Duncan d resultados significativos em casos em que isto no
acontece com o teste de Tukey: que ento o teste de Duncan nos leva a afirmativas
erradas com maior freqncia. O mesmo acontece, com perigo muito maior, com o teste
t aplicado indiscriminadamente, o que hoje no se aceita mais. O teste de Duncan
estabelece, pois, um meio termo entre o rigor um tanto excessivo do teste de Tukey e a
falta de rigor exagerado do teste t usado sem as devidas cautelas.
Se o pesquisador quer ter alta chance de rejeitar a hiptese de que as mdias so
iguais, pode optar pelo teste t ou pelo teste de Duncan. Estes dois testes tm
caractersticas similares, mas o teste t mais antigo e, talvez por isso, mais conhecido.
Tambm de aplicao mais fcil. Entretanto, o pesquisador tambm pode optar por
aplicar o teste de Tukey ou de Dunnett, com nvel de significncia mais elevado. Estes
testes teriam, ento, maior poder. Por exemplo, o teste de Tukey a 10% tem maior
poder que o teste de Tukey a 5%.
Se o pesquisador s pretende rejeitar a hiptese de que as mdias so iguais com
muita confiana, deve optar pelo teste de Tukey ou de Dunnett, com baixo nvel de
significncia.
O teste t, apresentado aqui, uma extenso do teste t de Student, feita por
Fisher. Muitos autores consideram errado aplicar o teste t para comparao de mdias,
duas a duas. Na verdade, no existe propriamente erro: apenas o nvel de significncia
para experimentos se torna, nesse caso, muito elevado (VIEIRA et al., 1989).
J o teste de Scheff ainda mais perigoso desaconselhvel para a comparao
de duas mdias, mas presta bons servios para provar contrastes mais complicados, e
para isto de uso indicado.
O teste de Bonferroni muito bom para pequeno nmero de contrastes, mas
excessivamente conservador quando esse nmero cresce. Por exemplo, com 6
tratamentos se podem obter 15 contrastes diferentes entre duas mdias. O teste de
Bonferroni aplicado a 10 ou mais desses contrastes mais conservador do que o de
Tukey. Mas no se esquea que o teste de Bonferroni se pode aplicar tambm a
contrastes mais complexos (PIMENTEL GOMES, 2000).
De qualquer forma, fica aqui um alerta: todos os procedimentos para a
comparao de mdias tm vantagens e desvantagens. Ainda no existe um teste
definitivamente melhor que todos os outros. Convm at lembrar que um estatstico
787
conhecido recomendou no usar testes de hipteses que se propem a comparar mdias,

duas a duas. J outro estatstico de renome considerou que os procedimentos para
comparar mdias devem ser vistos mais como indicadores do que como solues exatas.
No entanto, preciso adotar um procedimento formal para comparar mdias. Isto evita
que as concluses fiquem totalmente dependentes da opinio do pesquisador. Mesmo
assim, existe uma grande margem de opo tanto na escolha do teste, como no
estabelecimento do nvel de significncia (VIEIRA et al., 1989).
REFERNCIAS CONSULTADAS
BONINI, E. E.; BONINI, S. E. Estatstica. Edies Loyola. So Paulo, 1972. 439p.
COSTA NETO, P. L. O. Estatstica. So Paulo: Edgard Blcher, 1977. 264p.
FONSECA, J. S.; MARTINS, G. A. M. Curso de estatstica. 3. ed. So Paulo: Atlas, 1982.

286p.
PIMENTEL GOMES, F. Curso de estatstica experimental. 14 ed. Piracicaba SP:

Editora da Universidade de So Paulo, 2000. 477p.
SAMPAIO, I. B. M. Estatstica aplicada experimentao animal. 2.ed. Belo

Horizonte: Fundao de Estudo e Pesquisa em Medicina Veterinria e Zootecnia, 2002.
265p.
TRIOLA, M. F. Introduo estatstica. Rio de Janeiro: JC, 1999. 410p.
VIEIRA, S.; HOFFMANN, R. Estatstica experimental. So Paulo: Atlas, 1989. 175p.
788

076V5N6P777 788 Nov2008 PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

076V5N6P777 788 Nov2008 PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

Zootecnista, Doutoranda em Produo Animal, Universidade Estadual de Maring froesgaluci@hotmail.com

Revista Eletrnica Nutritime

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

Segundo SAMPAIO (2002), as situaes que conduzem comparao de valores

Todos os testes atualmente em voga fornecem o mesmo resultado quando

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

Com base no exposto em consideraes gerais, passaremos a tecer comentrios

onde t um valor dado em tabela, QMR o quadrado mdio do resduo da anlise de

Se existirem cinco tratamentos de natureza qualitativa, apenas 4 gl podero ser

Revista Eletrnica Nutritime

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

Mdias segundo o tratamento e comparaes.

Fonte: SAMPAIO, 2002.

Revista Eletrnica Nutritime

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

onde t um valor dado em tabela, QMR o quadrado mdio do resduo da anlise de

/ rA) + (se2 / rB)

onde se2 a varincia do resduo estimada pela anlise de varincia.

Se a distribuio de uma populao essencialmente normal (com a forma

Revista Eletrnica Nutritime

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

essencialmente uma distribuio t de Student para todas as amostras de tamanho n. A

Segundo BONINI et al. (1972) a distribuio t de Student utilizada para

O Teste de Student Newman Keuls (SNK)

Segundo SAMPAIO (2002), quando as mdias comparadas A e B apresentarem

O teste de Tukey, baseado na amplitude total estudentizada (studentized range,

Revista Eletrnica Nutritime

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

No caso de serem diferentes os nmeros de repeties o teste de Tukey pode

onde q o valor dado na tabela ao nvel de

significncia estabelecido, QMR o quadrado

Um teste assim rigoroso aplicado em um ensaio com muitos tratamentos (q

Segundo COSTA NETO (1939) o mtodo de Tukey aproximadamente 37% mais

Revista Eletrnica Nutritime

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

onde t o nmero de tratamentos, F o valor tabelado de F com (t 1) e x graus de

Este teste tem a vantagem de utilizar os prprios valores do quadro da

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

onde z um valor dado em tabela ao nvel de significncia estabelecido e para o nmero

Segundo PIMENTEL GOMES (2000), quando o nmero de mdias avultado

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

onde d um valor dado em tabela, ao nvel de significncia estabelecido, QMR o

onde D o valor encontrado na tabela de Dunnett proposta em funo dos (t 1) graus

Segundo PIMENTEL GOMES (2000), o teste de Bonferroni um aperfeioamento

ALGUMAS CONSIDERAES (VANTAGENS E DESVANTAGENS DOS TESTES)

A escolha do mtodo adequado para comparar mdias exige, que se leve em

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

rejeitar a hiptese de que as mdias so iguais quando esta hiptese , na realidade,

Revista Eletrnica Nutritime, v.5, n 6, p.777-788 Novembro/Dezembro 2008.

conhecido recomendou no usar testes de hipteses que se propem a comparar mdias,

BONINI, E. E.; BONINI, S. E. Estatstica. Edies Loyola. So Paulo, 1972. 439p.

COSTA NETO, P. L. O. Estatstica. So Paulo: Edgard Blcher, 1977. 264p.

FONSECA, J. S.; MARTINS, G. A. M. Curso de estatstica. 3. ed. So Paulo: Atlas, 1982.

PIMENTEL GOMES, F. Curso de estatstica experimental. 14 ed. Piracicaba SP:

SAMPAIO, I. B. M. Estatstica aplicada experimentao animal. 2.ed. Belo

TRIOLA, M. F. Introduo estatstica. Rio de Janeiro: JC, 1999. 410p.

VIEIRA, S.; HOFFMANN, R. Estatstica experimental. So Paulo: Atlas, 1989. 175p.

Revista Eletrnica Nutritime

Você também pode gostar