Escolar Documentos
Profissional Documentos
Cultura Documentos
Artigo Nmero 76
TESTES ESTATSTICOS PARA COMPARAO DE MDIAS
Andria Fres Galuci Oliveira1
INTRODUO
Quando a anlise de varincia de um experimento mostra que as mdias de
tratamento no so estatisticamente iguais, apenas lgico perguntar quais so as
mdias que diferem entre si. O pesquisador em geral gostaria de aplicar um teste para
comparar mdias, duas a duas. Considere um experimento para comparar trs
tratamentos, A, B e C. Se a anlise de varincia mostrar que as mdias desses
tratamentos no so estatisticamente iguais, bastante possvel que o pesquisador
procure um teste estatstico para comparar as mdias de A e B, A e C, B e C. Mas como
se faz comparao de mdias, duas a duas?
O pesquisador precisa de um mtodo que fornea a diferena mnima significante
entre duas mdias. Essa diferena seria o instrumento de medida. Toda vez que o valor
absoluto da diferena entre duas mdias igual ou maior do que a diferena mnima
significante, as mdias so consideradas estatisticamente diferentes, ao nvel de
significncia estabelecida (VIEIRA et al., 1989).
A estratgia da anlise estatstica se define a partir dos objetivos do pesquisador e
das condies experimentais ento existentes.
A natureza quantitativa dos tratamentos empregados pode sugerir o estudo de
modelos (ou funes) que venham a trazer alguma informao adicional ao pesquisador,
mas este procedimento, por si s, no substitui a comparao das mdias obtidas no
ensaio (SAMPAIO, 2002).
Segundo VIEIRA et al. (1989), a comparao de mdias s pode ser feita aps a
anlise de varincia. Isto porque todos os procedimentos para obter a d.m.s. exigem o
clculo do quadrado mdio do resduo. Mas a anlise de varincia tambm d o valor de
F, que permite decidir se as mdias so ou no iguais, a determinado nvel de
significncia.
A Anlise de Varincia um mtodo suficientemente poderoso para poder
identificar diferenas entre as mdias populacionais devidas a vrias causas atuando
simultaneamente sobre os elementos da populao (COSTA NETO, 1977).
A possibilidade de utilizar um dos vrios testes estatsticos existentes para a
comparao de mdias, de alguma maneira, seduz o experimentador que, entre
comedido e inovador, deseja optar por um deles.
A eleio de um teste pelo pesquisador deve contemplar aquele cujas concluses
que advieram de seu uso sejam menos sujeitas a erros tidos como indesejveis
(SAMPAIO, 2002).
Segundo FONSECA et al. (1982) o mtodo de anlise de varincia indica a
aceitao ou rejeio da hiptese de igualdade das mdias. Se a hiptese de nulidade
(Ho) for rejeitada, estaremos admitindo que, pelo menos, uma das mdias diferente
das demais. Surge, contudo a questo: Quais mdias devem ser consideradas diferentes?
777
Existem alguns testes para a soluo dessa questo, que sero apresentados a
seguir.
CONSIDERAES GERAIS
OS TESTES ESTATSTICOS
778
O Teste F
Em 1924, Fisher apresentou a fundamentao bsica que permitiu a posterior
formulao do teste F por Snedecor. Estruturado para avaliar a variao mdia de uma
determinada fonte em relao variao individual, ou seja:
F = Varincia da fonte testada/ Varincia do resduo
O valor assim calculado de F deve ser comparado quele tabelado segundo os
graus de liberdade da fonte testada e do resduo, respectivamente nas colunas e linhas
daquela tabela.
Quando a fonte sendo testada no for uma interao e se redigir a apenas um
grau de liberdade, o teste F adequadamente aplicado ao teste t de Student (t2 = F).
Segundo SAMPAIO (2002), uma fonte de variao com apenas 1 gl pode advir das
seguintes situaes:
1. Existem apenas dois tratamentos, e, portanto um nico contraste a ser feito,
equivalente a 1 gl. A significncia ou no do teste F executado na anlise de
varincia traduzir ou no a diferena significativa entre os dois tratamentos.
2. Existem mais de dois tratamentos (t tratamentos, por exemplo), e, portanto
existiro t-1 contrastes ortogonais, cada um correspondente a 1 gl. Alguns desses
contrastes podero definir a comparao direta entre dois tratamentos, outros
envolvero mais de um deles. Para aqueles contrastes, prevalece o comentrio
feito no item 1 anterior. Para a os ltimos, independentemente do resultado do
teste F, as concluses devero ser feitas discretamente, obedecendo natureza
do contraste.
Segundo VIEIRA et al., (1989). Para obter a diferena mnima significante (d.m.s.)
estabelecida pelo teste t, basta calcular:
d.m.s. =
2 . QMR
r
Contrastes Ortogonais
779
Uma fonte de variao com mais de 1 grau de liberdade pode ser testada pela
razo de varincias F, entretanto o que estar sendo julgado a variao mdia desta
fonte. O resultado do teste F avaliar, portanto a magnitude dessa variao mdia, mas
no deixar entrever se existe algum contraste que poderia ser significativo.
Contudo, percebemos que quando utilizamos o teste F para mais de um grau de
liberdade, algumas comparaes significativas podero passar despercebidas.
QUADRO 1.
Tratamento
Mdias
Comparaes
41
38
Ab
33
Abc
25
Bc
24
Nos modelos matemticos lineares com mais de uma varivel independente, cada
um desses elementos no modelo (Quadro 1) assume apenas 1 gl, razo pela qual caberia
a utilizao do teste F. Cada varivel independente no modelo seria um contraste, com 1
gl. Esses contrastes poderiam ser de origem qualitativa, mais tambm podem ser de
origem quantitativa. Isto ocorre quando os tratamentos estudados so nveis
eqidistantes e variveis de um mesmo fator. Neste caso, embora fosse possvel sugerir
qualquer grupo de contrastes ortogonais, o mais adequado seria investigar o tipo de
funo observada atravs dos coeficientes dos polinmios ortogonais.
O teste de F, portanto, para ser devidamente aplicado, exige um profundo
conhecimento por parte do pesquisador das condies envolvidas que caracterizam o
contraste (ou fonte) por ele testado (SAMPAIO, 2002).
O Teste t
Segundo PIMENTEL GOMES (2000), outro teste clssico o teste t, que pode ser
usado para comparar mdias. Como requisitos para sua aplicao conscienciosa temos
porm, os seguintes:
1. As comparaes feitas pelo teste t devem ser escolhidas antes de serem
examinados os dados;
2. Pode-se fazer no mximo tantas comparaes quantos so os graus de liberdade
para tratamentos, e os contrastes devem ser ortogonais.
Segundo VIEIRA et al. (1989), para obter a diferena mnima significante (d.m.s.)
estabelecida pelo teste t, basta calcular:
d.m.s. = t
2 . QMR / r
780
O Teste t de Student
Embora os estudos iniciais da distribuio de t fossem encetados por Gosset em
1908, citado por SAMPAIO (2002), o domnio, aplicao e divulgao deste teste
deveram-se novamente a Fisher em 1926, citado por SAMPAIO (2002).
Duas mdias A e B obtidas de grupos experimentais com rA e rB observaes
respectivamente podem ser comparadas pela relao.
t=
A-B
(se2
rB
781
se2 /r
d.m.s.(SNK) =
qi
se2
2
1
rA
1
rB
O Teste de Tukey
782
d.m.s.(Tukey) =
se2 / r
onde q o valor tabelado por Tukey em funo do nmero de tratamento e dos graus de
liberdade do resduo.
Para obter o valor da diferena mnima significante (d.m.s.) pelo teste de Tukey
basta calcular:
d.m.s. = q
QMR
r
d.m.s.(Tukey) =
se2
2
1
rA
+ 1
rB
783
Teste de Scheff
Segundo PIMENTEL GOMES (2000), o teste de Scheff s deve ser aplicado
quando o teste F tiver dado resultado significativo. Se o valor de F obtido no for
significativo, nenhum contraste poder ser significativo, e, pois, a aplicao do teste de
Scheff no se justifica. Quando, porm, o valor de F obtido significativo, pelo menos
um dos contrastes entre tratamentos ser significativo. Mas o contraste em questo pode
ser muito complicado ou sem interesse prtico. E pode ainda acontecer que nenhum dos
contrastes entre duas mdias apenas seja significativo.
A flexibilidade proposta por Scheff (1953) citado por SAMPAIO (2002), para
comparar qualquer contraste entre mdias e permitindo diferentes nmeros de
observaes por tratamento definiu um teste um pouco mais rigoroso que aquele que
Tukey, merecendo, portanto os mesmos comentrios com relao ao perigo aumento do
erro tipo II.
A diferena mnima significativa para qualquer contraste (que pode ser a
comparao entre apenas duas mdias)
(t - 1) F. Var(contraste)
d.m.s.(Scheff) =
d.m.s.(scheff) =
(t 1) F. 2 se2 / r
O Teste de Duncan
Duncan (1955) citado por PIMENTEL GOMES, (2000) introduziu um novo teste ou
prova para comparao de mdias, ao qual chegou depois de uma tentativa anterior. Sua
aplicao bem mais trabalhosa do que a do teste de Tukey, mas se chega a resultados
mais detalhados e se discrimina com mais facilidade entre os tratamentos, isto , o teste
de Duncan indica resultados significativos em casos em que o teste de Tukey no permite
obter significao estatstica. Tal como o teste de Tukey, o de Duncan exige, para ser
exato, que todos os tratamentos tenham o mesmo nmero de repeties.
O teste de Duncan mais trabalhoso do que o teste t e o de Tukey porque exige o
clculo de diversas diferenas mnimas significantes. Para aplicar o teste de Duncan
preciso primeiro ordenar as mdias. Calcula-se ento a diferena mnima significante
(d.m.s.) para comparar a maior mdia com a menor. No conjunto ordenado das mdias,
a comparao entre a maior e a menor mdia corresponde a um intervalo que abrange
Revista Eletrnica Nutritime
784
todas as k mdias. Se a diferena entre a maior e a menor mdia significante, calculase outra d.m.s., agora para comparar mdias em um intervalo abrangendo k 1 mdias,
e assim p diante.
Sempre que duas mdias no so estatisticamente diferentes, no se podem
testar as diferenas entre mdias que esto no intervalo delimitado por aquelas duas
mdias. Para fazer o teste usual escrever as mdias em linha e em ordem crescente
(ou decrescente). Toda vez que a diferena entre duas mdias no significante
sublinha-se o intervalo delimitado por essas duas mdias; cada comparao nosignificante deve ser indicada por uma linha, distinta das demais; mdias sublinhadas por
uma mesma linha no so estatisticamente diferentes e as diferenas entre elas no
podem ser testadas (VIEIRA et al., 1989).
Duncan (1955) citado por SAMPAIO (2002) sugeriu a utilizao de um teste
baseando-se na mesma argumentao do teste de Student Newman Keuuls. A
percepo e o controle do erro tipo I era sem dvida flagrante no SNK, mas a
comparao de mdias mais afastadas criava uma oportunidade para o aparecimento do
erro tipo II (j que o maior valor da diferena mnima significativa se equipara com
aquela do teste Tukey).
Segundo VIEIRA et al. (1989), para obter a d.m.s. aplica-se a frmula:
d.m.s. = z
QMR
r
d.m.s.(Duncan) =
qi
se2 / r
onde qi o valor tabelado por Duncan (ou seja, um t ajustado) obtido em funo da
distncia entre as duas mdias a serem comparadas (i = p + 2, p = nmero de mdias
localizadas entre as duas que esto sendo comparadas, quando relacionadas em ordem
crescente) e r o nmero comum de observaes por tratamento. Os valores de qi no
sobem to rapidamente quanto aqueles do teste Student Newman Keuls, controlando
assim o aparecimento do erro tipo II na comparao de mdias mais afastadas.
Se as mdias comparadas A e B contiverem diferente nmero de repeties, a
d.m.s. seria:
d.m.s.(Duncan) =
qi
se2
rA
1
rB
785
O Teste de Dunnett
Segundo VIEIRA et al. (1989), o teste de Dunnett deve ser aplicado toda vez que
se pretendem comparar as mdias dos tratamentos apenas com a mdia do controle.
Para obter a d.m.s. aplica-se a frmula:
d.m.s. = d
2 . QMR
r
d.m.s.(Dunnett) = D
se2 C2i / ri
d.m.s.(Dunnett) =
2 se2 / r
que semelhante ao teste t de Student, exceto pelo valor de D, aqui ajustado para um
maior nmero de tratamentos.
A utilizao deste teste, que impede outras comparaes no contidas em suas
condies iniciais pouco freqente dado a esta limitao (SAMPAIO, 2002).
O Teste de Bonferroni
786
787
REFERNCIAS CONSULTADAS
788