Você está na página 1de 17

PODER E TAXAS DE ERRO TIPO I DOS TESTES

SCOTT-KNOTT, TUKEY E STUDENT-NEWMAN-


KEULS SOB DISTRIBUIES NORMAL E
NO NORMAIS DOS RESDUOS

Lvia Costa BORGES1


Daniel Furtado FERREIRA1

RESUMO: O objetivo deste trabalho foi avaliar o poder e as taxas de erro


tipo I dos testes Scott-Knott, Tukey e SNK em amplas situaes experimen-
tais, em condies de normalidade e no-normalidade dos resduos. Foram
avaliados o poder dos testes e as taxas de erro tipo I por comparao e por
experimento, considerando hipteses H0 completa e parcial. As simulaes
foram feitas considerando as distribuies normal, lognormal, exponencial e
weibull. O teste de Scott-Knott controlou as taxas de erro tipo I por compa-
rao, sob H0 completa e no controlou estas taxas de erro por experimento
para todas as distribuies consideradas. Em situao de nulidade parcial, o
teste de Scott-Knott no controlou as taxas de erro tipo I por comparao e
por experimento, mesmo em situaes de normalidade dos resduos. O teste
de Scott-Knott mais poderoso que os demais e robusto. Pelo fato de pos-
suir poder elevado, taxas de erro tipo I quase sempre de acordo com os
nveis nominais em todas as distribuies consideradas e por ser robusto
violao de normalidade, recomenda-se a utilizao do teste de Scott-Knott.
PALAVRAS-CHAVE: comparaes mltiplas, robustez, anlise de agrupa-
mento.

1 Departamento de Cincias Exatas, Universidade Federal de Lavras, Caixa Postal 37, CEP
37200-000, Lavras, MG, Brasil. E-mail: borgeslc@yahoo.com.br/danielff@ufla.br

Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2003 67


1 Introduo

O objetivo de uma pesquisa se depara, em geral, com a necessi-


dade de comparar e testar mdias de tratamentos. A hiptese de igual-
dade de mdias de tratamentos testada inicialmente com o teste F. A
significncia desse teste em relao a um valor nominal fixado permite
que se infira que pelo menos um tratamento difere dos demais. O teste
F no permite ao pesquisador, no entanto, descobrir onde esto essas
diferenas.
Para tratamentos cujos nveis so quantitativos recomenda-se o
ajuste de equaes de regresso. Por outro lado, se os nveis dos trata-
mentos so qualitativos, recomenda-se aplicar algum tipo de procedi-
mento de comparaes mltiplas. As comparaes mltiplas so lar-
gamente utilizadas devido facilidade de aplicao por envolver ope-
raes matemticas simples; grande disponibilidade de recursos com-
putacionais de fcil acesso e grande difuso de idias desses proce-
dimentos pelos estatsticos, pesquisadores e professores.
Os principais procedimentos de comparaes mltiplas so os
testes de Tukey, Student Newman-Keuls (SNK), t de Student (LSD),
Duncan, entre outros. A dificuldade de utilizao desses procedimentos
interpretar seus resultados. Todos eles apresentam a caracterstica de
ambigidade nos resultados que fornecem. Essa ambigidade decor-
rente da possibilidade de dois nveis de tratamentos serem considerados
iguais a um terceiro, mas diferentes entre si. O pesquisador, de uma
forma geral, tem muita dificuldade na interpretao dos resultados e na
recomendao do melhor tratamento.
Uma alternativa a aplicao do teste aglomerativo de Scott
Knott (1974). Este teste visa a separao de mdias de tratamentos em
grupos distintos, atravs da minimizao da variao dentro e maxi-
mizao da variao entre grupos. Os resultados so facilmente inter-
pretados, devido ausncia de ambigidade. Desta forma este proce-
dimento resulta em maior objetividade e clareza.
Os procedimentos de comparaes mltiplas tm sua teoria fun-
damentada na normalidade dos resduos do modelo linear utilizado
para ajustar os dados. Da mesma forma, o teste de Scott-Knott exige
que os resduos sejam normais. As conseqncias da violao de nor-
malidade dos resduos no so conhecidas. Uma caracterstica desej-
vel que havendo violao dessa pressuposio, os testes apresentem
controle das taxas de erros tipo I e II. Esse tipo de caracterstica
conhecido por robustez do procedimento.

68 Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2002


O presente trabalho teve por objetivo avaliar o poder e as taxas
de erro tipo I do teste proposto por Scott e Knott (1974), em amplas si-
tuaes experimentais com relao preciso, nmero de tratamentos,
nmero de repeties e nvel de significncia adotado, por meio de si-
mulao Monte Carlo em condies de no normalidade do resduo.

2 Metodologia
Para avaliar a taxa de erro tipo I e o poder do teste de Scott e
Knott, foi utilizada simulao Monte Carlo. Os dados do experimento
(yij, i = 1, 2, ..., p e j = 1, 2, ...r) foram simulados utilizando um
algoritmo em Pascal, implementado em Delphi 5.0, para a inverso da
funo de distribuio dos modelos normal, exponencial, lognormal e
weibull. O delineamento inteiramente casualizado, foi escolhido por ser
o mais simples de todos os delineamentos e por ser o mais utilizado na
literatura para esse fim. O modelo linear geral adotado :
Yij = + i +ij,
com i = 1,...p e j = 1,2,. . .r;
em que Yij o valor simulado na j-sima repetio do tratamento i;
uma constante geral fixada para se ter o valor determinado de
coeficiente de variao; i o efeito paramtrico do tratamento i,
p
estipulados de tal forma que i = 0 e ij o erro aleatrio, com
i=1
varincia 2 gerado independentemente com distribuies normal,
exponencial, lognormal e weibull.
Foram gerados 2.000 experimentos para cada situao e foram
avaliadas as taxas de erro tipo I por comparao e por experimento,
considerando hipteses H0 completa e parcial. As simulaes foram
feitas para as combinaes entre o nmero de tratamentos p = 5, 10, 20
e 80, para H0 completa e p = 5, 10, 20, 40 e 96 para H0 parcial, o
nmero de repeties r = 4, 10 e 20, o valor nominal de significncia ,
igual a 5% e 1%, e os coeficientes de variao iguais a 1%, 10%, 20%
e 30%, considerando as distribuies normal, lognormal, exponencial e
weibull.
Ao se considerar H0 parcial, simulaes adicionais foram feitas,
estabelecendo-se diferenas entre grupos de mdias em funo do erro
padro paramtrico de uma mdia de tratamento ( X ). Foram consi-
derados k grupos, com k variando de 3 a 20, dependendo do nmero de
tratamentos usados.

Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2003 69


Para decidir se as taxas de erro eram semelhantes aos valores
nominais estabelecidos, calculou-se um limite mximo e um limite m-
nimo, baseado no intervalo de confiana (IC) para as taxas empricas do
erro tipo I. Os intervalos de 99% de confiana para os valores nominais
foram, em porcentagem, [0,6119; 1,5402] para o valor nominal 1% e
[3,8282; 6,3914] para o valor nominal 5%. Assim, valores que no per-
tencem a este intervalo, no so considerados iguais aos valores nominais
de significncia.
O poder dos testes foi avaliado, sendo as simulaes feitas para
as diversas combinaes entre o nmero de tratamentos (p = 5, 10, 20,
40 e 96), o nmero de repeties (r = 4, 10 e 20), o nvel nominal de
significncia igual a 5% e 1%, e admitindo uma diferena entre
grupos adjacentes igual a erro padro da mdia ( x ). Foram
considerados os mesmos coeficientes de variao e as mesmas
distribuies utilizadas para medir a taxa de erro tipo I. Para medir o
poder dos testes, os resultados significativos foram computados para os
contrastes, envolvendo diferenas de = , 1, 2, 4, 6, 8 e 10 erros
padro da mdia, em todas as situaes especificadas.

3 Resultados e discusso
Ao se considerar a taxa de erro tipo I por comparao (TPC) e
hiptese H0 completa, todos os testes apresentam controle desta taxa de
erro, sendo que o aumento do nmero de tratamentos, proporciona uma
diminuio nesta taxa de erro.
O coeficiente de variao no teve efeito nas taxas de erro tipo I
por comparao e nenhum valor excedeu o limite inferior do IC
(3,8282%) para = 5%, para os testes considerados, independente das
distribuies ou valor de CV considerados.
Ao avaliar as TPC em funo do nmero de repeties, verificou-
se que o aumento do nmero de repeties provocou um aumento
dessas taxas de erro do teste de Scott e Knott, em todas as dis-
tribuies, sendo que estas taxas passam a ficar mais prximas do
limite inferior do IC. O nmero de repeties no influencia as TPC
dos testes de Tukey e SNK, os quais no diferem entre si, exceto na
distribuio lognormal, em que o teste SNK apresentou taxas de erro
superiores s do Tukey.
O teste de Scott e Knott no apresentou controle das taxas de erro
tipo I por experimento em todas as distribuies consideradas, ao se
considerar hiptese H0 completa. Nas situaes em que a distribuio
normal ou exponencial (Figura 1), todos os testes apresentaram taxa de

70 Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2002


erro igual ao valor nominal adotado, independente do nmero de
tratamentos considerados. Quando se considera a distribuio log-
normal (Figura 2), os testes de Tukey e SNK tenderam a apresentar
taxas de erro por experimento bastante altas em situaes de maior n-
mero de tratamentos (em torno de 55% quando se considera 80 trata-
mentos). J o teste de Scott-Knott apresenta taxa de erro muito menor
para esta situao (em torno de 13%), sendo menos afetado pela mu-
dana da distribuio. Nas distribuies weibull 1,5 e 5,0 (Figura 3),
algumas TPE ultrapassaram o limite superior do IC para o teste de
Scott-Knott, diferindo, portanto do valor nominal de significncia pr-
estabelecido de 5%.
Os testes de Tukey e SNK quase no diferem entre si em relao
as TPE em todas as distribuies consideradas. A distribuio lognor-
mal provocou um grande efeito nestes testes, considerando grande n-
mero de tratamentos e tambm provocou efeito significativo no teste de
Scott-Knott, mas de magnitude muito inferior. O teste de Scott e Knott
apresenta uma certa robustez no controle da taxa de erro tipo I por
experimento sob H0 completa. Mesmo nas situaes em que o valor
nominal foi ultrapassado de forma significativa, o vis positivo na taxa
de controle do erro foi muito pequeno.
Taxa de erro tipo I por experimento
r=20 e cv=30
6.6

6.0
Taxa de erro por experimento

5.4

4.8 Tukey (N)


SNK (N)
Scott Knott (N)
Tukey (E)
4.2
SNK (E)
Scott Knott (E)
Limite inferior
3.6
5 10 20 80 Limite Superior

Nmero de tratamentos

FIGURA 1 Taxa de erro tipo I por experimento dos testes de Tukey, SNK e Scott-
Knott, em funo do nmero de tratamentos, considerando-se as distribuies normal e
exponencial, hiptese H0 completa, r = 20 e CV 30%, para = 5%, sendo as linhas
pontilhadas os limites superior e inferior do IC exato com 99% de confiana.

Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2003 71


Taxa de erro tipo I por experimento
r=20 e CV=30%
65

55
Taxa de erro por experimento

45

35

25 Tukey (L)
SNK (L)
15 Scott Knott (L)
Tukey (W3.6)
5 SNK (W3.6)
Scott Knott (W3.6)
Limite inferior
-5
5 10 20 80 Limite Superior

Nmero de tratamentos

FIGURA 2 Taxa de erro tipo I por experimento dos testes de Tukey, SNK e Scott e
Knott, em funo do nmero de tratamentos, considerando-se as distribuies lognormal
e weibull 3,6, hiptese H0 completa, r = 20 e CV 30%, para = 5%, sendo as linhas
pontilhadas os limites superior e inferior do IC exato com 99% de confiana.

Taxa de erro tipo I por experimento


r=20 e CV=30%
7.2

6.6
Taxa de erro por experimento

6.0

5.4

Tukey (W1.5)
4.8 SNK (W1.5)
Scott Knott (W1.5)
Tukey (W5.0)
4.2 SNK (W5.0)
Scott Knott (W5.0)
Limite inferior
3.6
5 10 20 80 Limite superior

Nmero de tratamentos

FIGURA 3 Taxa de erro tipo I por experimento dos testes de Tukey, SNK e Scott-
Knott, em funo do nmero de tratamentos, considerando-se a distribuio weibull com
parmetros 1,5 e 5,0, hiptese H0 completa , r = 20 e CV 30%, para = 5%, sendo as
linhas pontilhadas os limites superior e inferior do IC exato com 99% de confiana.

72 Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2002


O coeficiente de variao teve efeito nas taxas de erro tipo I por
experimento, para os diferentes testes e distribuies (Tabela 1).
Verifica-se que o teste de Scott-Knott apresenta TPE igual ao valor
nominal 5% (taxas de erro menores que o limite superior do IC,
6,3914%), a partir do CV=20% para a distribuio normal e CV=10%
para a exponencial, considerando nmero de tratamentos igual a 10 e
20 repeties. Isso sugere que o teste de Scott-Knott com alta preciso
e experimentos com poucos graus de liberdade para o resduo seja
muito afetado, ou seja, apresente TPE elevados (maiores que o valor
nominal adotado). Se for feita uma especulao para isso, pode-se
apontar a derivao assinttica do teste de Scott-Knott como causa
desse efeito. Ao se considerar um nmero maior de tratamentos (p =
80), o teste de Scott-Knott passa a controlar essa TPE para qualquer
CV, nas distribuies normal e exponencial. Na distribuio lognormal,
os testes de Scott-Knott e SNK tendem a apresentar um aumento da
TPE medida que se aumenta o CV, sendo que com CV superior a
10% estas taxas j diferem do valor nominal adotado, sendo esse efeito
mais pronunciado no teste SNK.
Ao se considerar o efeito do nmero de repeties nas taxas de
erro tipo I por experimento, observou-se que para um maior nmero de
repeties (r=20), o teste de Scott-Knott apresenta TPE acima do limite
superior nas distribuies normal e weibull 5,0. Na distribuio
lognormal, verifica-se que os testes de Scott-Knott e SNK apresentam
TPE maiores que o limite superior do IC para qualquer nmero de re-
petio, sendo que para o teste de SNK estas taxas tendem a diminuir e
se tornarem mais prximas do valor nominal com o aumento do n-
mero de repeties, enquanto que para o teste de Scott-Knott estas
taxas de erro permanecem em torno de 7% independente do nmero de
repeties. Os testes de Tukey e SNK apresentam taxas de erro seme-
lhantes ao valor nominal para a maioria das situaes.
Os testes de Tukey e SNK, em geral, apresentam controle da taxa
de erro por comparao, sendo estas taxas muito menores do que o
valor nominal e, ainda, menores do que aquelas apresentadas pelo teste
de Scott-Knott. Com isso era esperado um maior controle das TPE des-
ses testes. Com exceo do caso da distribuio lognormal, com gran-
des valores de p, em que os testes de Tukey e SNK apresentam eleva-
dssimas TPE, houve um controle desse tipo de erro. O teste de Scott-
Knott, por sua vez, apresenta alguns problemas no controle da taxa de
erro tipo I por experimento, exceto sob normalidade. Embora possa
parecer uma grande desvantagem, os valores da TPE superestimam o
valor de em uma magnitude no muito expressiva. esperado que o
teste de Scott-Knott tenha esse tipo de comportamento devido a sua

Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2003 73


prpria natureza terica que faz com que esse teste nunca apresente
resultados de ambigidade, o que no se pode dizer para os testes de
Tukey ou SNK, principalmente com elevados valores de p. Se for consi-
derado que o teste de Scott-Knott no apresenta ambigidade e controla
as taxas de erro tipo I por experimento e por comparao para a maioria
das situaes, este pode ser considerado robusto e deve ser indicado.

Tabela 1 Taxas de erro tipo I por experimento (%), para os testes de


Tukey, SNK e Scott Knott, para diferentes CV e distribui-
es, considerando nmero de tratamentos (p) igual a 10 e
20 repeties, para os nveis nominais de significncia de
1% e 5%
Testes
Distribuies CV(%) Tukey SNK Scott-Knott
=1% =5% =1% =5% =1% =5%
1 1,20 5,70 1,20 5,70 0,90 6,35
10 1,15 5,05 1,15 5,10 1,25 6,90
Normal
20 1,30 4,60 1,30 4,60 1,20 6,20
30 1,00 4,75 1,00 4,80 1,45 6,00
1 1,15 4,80 1,20 5,05 1,45 5,30
10 0,60 3,80 1,20 6,50 2,00 7,10
Lognormal
20 0,85 4,15 1,55 8,70 2,35 8,15
30 0,35 3,55 0,90 9,25 1,65 7,15
1 0,95 5,00 0,95 5,05 1,45 7,25
10 1,00 5,35 1,10 5,40 1,30 6,35
Exponencial
20 0,85 4,35 0,85 4,40 1,45 6,10
30 1,30 5,20 1,35 5,45 1,95 6,00
1 1,25 5,50 1,25 5,55 1,70 6,25
10 0,70 4,35 0,70 4,35 1,10 5,75
Weibull 3,6
20 0,60 4,05 0,60 4,85 1,30 5,80
30 1,00 4,80 1,00 4,90 1,60 6,60

O teste de Scott e Knott, assim como os demais, controlou as


taxas de erro tipo I por comparao, independente do CV, do nmero
de tratamentos, do nmero de repeties e das distribuies considera-
das, sob H0 completa.
Ao se considerar a taxa de erro tipo I por experimento, ainda sob H0
completa, verifica-se que o teste de Scott e Knott no controlou essa taxa de

74 Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2002


erro para todas as distribuies. Na distribuio lognormal, no houve
controle desta taxa de erro para maiores coeficientes de variao e maiores
nmeros de tratamentos, mas apresentou taxas de erro menores que as de
Tukey e SNK, quando se considera um maior nmero de tratamentos.
Pode se destacar que na maioria das distribuies consideradas, o
CV e o nmero de repeties no influenciaram a taxa de erro por ex-
perimento. Isso devido ao sistema de simulao adotado, porque os
parmetros dos tratamentos esto vinculados ao nmero de repeties e
a diferena entre mdias sempre preservada em termos de erro pa-
dro, o qual est relacionado com o CV e com o nmero de repeties.
Uma outra maneira de se medir a taxa de erro tipo I, atravs da
etapa em que as simulaes foram realizadas, levando-se em conta a
situao de nulidade parcial (Tabela 2). O teste de Scott e Knott no
controlou as taxas de erro tipo I por comparao e por experimento
para qualquer diferena entre grupos considerada, e esse resultado foi
verificado para todas as distribuies consideradas, inclusive para a
distribuio normal. Estas taxas de erro tiveram uma tendncia de au-
mentar com o aumento do nmero de tratamentos. O teste de Tukey,
por sua vez, controla as taxas de erro tipo I por comparao e por ex-
perimento na distribuio normal, o que est de acordo com sua de-
rivao terica apresentada na literatura (Hochberg e Tamhane, 1987).
O SNK controla somente as taxas de erro por comparao, sendo que
por experimento, as taxas de erro esto acima do valor nominal quando
se considera uma diferena de mdias entre grupos consecutivos de
4 X e estas taxas tendem a aumentar com o aumento do nmero de
tratamentos. Nas distribuies exponencial e weibull, verifica-se a
mesma tendncia observada na distribuio normal. Na distribuio
lognormal, o teste de Tukey passa a no controlar as taxas de erro tipo
I por experimento em situaes de maior nmero de tratamentos (p >
20). O teste SNK no controla essas taxas de erro para p maior que 10
e verifica-se um aumento nessas taxas de erro quando a diferena entre
mdias de grupos consecutivos passa de 0,5 X para 4 X . Para esta
distribuio, o teste de Scott-Knott continua no controlando os dois
tipos de taxas de erro tipo I consideradas.
Em situao de nulidade parcial, o teste de Scott e Knott no
controlou as taxas de erro tipo I por comparao e por experimento,
mesmo em situaes de normalidade dos resduos. Observa-se a mesma
tendncia para as demais distribuies consideradas. Os testes de
Tukey e SNK controlaram a TPC, mas com relao a TPE, o teste de
SNK passa a ter baixo controle ao se considerar um maior diferena

Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2003 75


entre grupos. O teste de Tukey na distribuio lognormal passou a no
controlar a TPE, tendo esse efeito mais pronunciado com o aumento do
nmero de tratamentos.
Nas Figuras 4 e 5, esto apresentadas as percentagens de decises
corretas dos testes de Tukey, SNK e Scott Knott (poder dos testes em
detectar reais diferenas), em funo do nmero de tratamentos, para o
valor nominal de significncia =5%, considerando diferena real entre
mdias de 0,5 X . Ao se considerar um pequeno nmero de trata-
mentos (p=5), o teste de Scott e Knott superior aos demais testes em
todas as distribuies consideradas. O poder dos testes de Tukey e
SNK prximo de zero para pequeno nmero de tratamentos e tem
uma tendncia de ainda diminuir com o aumento do nmero de trata-
mentos. O teste de Scott-Knott, ao contrrio dos demais, apresenta um
aumento do poder com o aumento do nmero de tratamentos, sendo
que para p = 96, apresenta em torno de 35% de poder para detectar
pequenas diferenas, exceto na distribuio lognormal (poder em torno
de 25%), enquanto os testes de Tukey e SNK apresentam poder
prximo a 0% para esta situao.

Tabela 2 Taxas de erro tipo I por comparao e por experimento(%),


sob H0 parcial, dos testes Tukey, SNK e Scott-Knott em
funo do nmero de tratamentos, para as distribuies nor-
mal, e lognormal considerando = 5%, CV=10%, r=10 e
diferena entre mdias de grupos consecutivos de 0,5 X e
4 X
Tukey SNK Scott-Knott
Trat 0,5 X 4,0 X 0,5 X 4,0 X 0,5 X 4,0 X
CW EW CW EW CW EW CW EW CW EW CW EW
Distribuio Normal
05 0,85 2,25 0,50 1,40 1,38 3,05 2,38 5,30 4,40 6,60 6,67 10,00

10 1,56 1,35 0,19 1,60 0,32 2,35 2,56 18,75 6,54 17,80 10,10 42,05
20 0,04 1,55 0,03 1,15 0,06 2,00 0,75 17,00 8,89 23,85 9,58 61,00

40 0,01 0,70 0,01 0,35 0,03 1,50 1,27 41,25 23,06 99,85 18,57 98,35
96 0,00 0,60 0,00 0,35 0,01 2,85 0,50 63,40 22,94 100,00 16,67 100,00

Distribuio Lognormal
5 0,40 1,00 0,40 1,00 2,07 4,10 2,18 4,55 7,37 11,05 3,67 5,50
10 0,24 1,70 0,34 2,25 1,52 8,10 3,77 25,05 9,32 3,76 6,38 32,55

20 0,34 6,20 0,28 4,75 1,04 14,80 2,88 39,00 10,93 46,65 7,74 61,30

40 0,54 15,70 0,64 18,15 1,24 30,35 4,15 82,25 21,37 96,65 10,26 94,35
96 0,70 44,05 0,71 43,35 1,44 63,95 2,56 98,20 13,27 99,90 6,41 99,90

76 Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2002


Poder dos testes para diferena de 0,5 erro padro da mdia
r=20 e CV=20%
40

35

30
% de decises corretas

25

20

15

Tukey (N)
10
SNK (N)
Scott-Knott (N)
5
Tukey (E)
SNK (E)
0
5 10 20 40 96 Scott-Knott (E)

Nmero de tratamentos

FIGURA 4 Poder dos testes de Tukey, SNK e Scott e Knott, para detectar uma

diferena entre mdias de 0,5 X , em funo do nmero de tratamentos, considerando-

se as distribuies normal e exponencial, r = 20 e CV 20%, para = 5%.

Poder dos testes para diferena de 0,5 erro padro da mdia


r=20 e CV=20%
40

35

30
% de decises corretas

25

20

15

Tukey (L)
10
SNK (L)
Scott-Knott (L)
5
Tukey (W3.6)
SNK (W3.6)
0
5 10 20 40 96 Scott-Knott (W3.6)

Nmero de tratamentos

FIGURA 5 Poder dos testes de Tukey, SNK e Scott e Knott, para detectar uma

diferena entre mdias de 0,5 X , em funo do nmero de tratamentos, considerando-

se as distribuies lognormal e weibull, r = 20 e CV 20%, para = 5%.

Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2003 77


Ao se considerar uma diferena maior entre mdias consecutivas
a ser detectada (4 X ), ocorre um aumento do poder, como j era es-
perado. Em situaes de pequeno nmero de tratamentos (p = 5), o
teste de Scott-Knott apresenta poder em torno de 80%, em todas as dis-
tribuies consideradas, exceto na lognormal, em que esse poder su-
perior (em torno de 90%), enquanto os testes SNK e Tukey apresentam
poderes inferiores (em torno de 60% e 50%, respectivamente), exceto
na distribuio lognormal em que estes testes apresentam poder pr-
ximo a 90%.
Com o aumento do nmero de tratamentos, o poder do teste de
Scott-Knott aumenta, sendo que para p maior que 40, para detectar uma
diferena de 4 X , esse poder j est em torno de 95%. Os demais
testes apresentam uma queda de alta magnitude no poder medida que
o valor de p aumenta. interessante observar que o teste SNK tende a
ter poder ligeiramente superior ao Tukey em todas as distribuies e
nmeros de tratamentos considerados.
Como era de se esperar, medida que a magnitude da diferena
entre mdias consecutivas aumenta, a percentagem de decises corretas
cresce rapidamente. Nas Figuras 6 e 7, para p=5, o teste de Scott-Knott
apresenta baixo poder para detectar diferena de 0,5 X , mas apesar
de baixo, superior ao poder dos demais testes para esta situao. Para
uma diferena de 6 X , o poder do teste de Scott-Knott j prximo a
99%. Para todas as situaes o teste de Scott-Knott apresenta maior
poder, sendo que para detectar maiores diferenas, os poderes dos testes
em questo se tornam similares, independente da distribuio
considerada. O teste SNK apresenta poder ligeiramente superior ao
Tukey e bem inferior ao Scott-Knott, em todas as situaes consideradas.
Ao se considerar um nmero maior de tratamentos (p = 96),
observa-se uma maior magnitude na diferena entre poder do teste de
Scott-Knott e o poder dos demais testes. Para detectar diferenas em
torno de 2 X , o teste de Scott-Knott apresenta poder superior a 60%
em todas as distribuies, enquanto nos demais testes o poder est pr-
ximo a 0%.
medida que aumenta a diferena a ser detectada, os poderes
dos trs testes tendem a ficar iguais, sendo que para detectar diferena
de 10 X todos os testes apresentam praticamente 100% de poder em
todas as distribuies. No que se refere ao teste de Scott-Knott, pode-se
dizer que se trata de um procedimento de poder elevado, pois seu poder

78 Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2002


supera os dos demais testes em todas as situaes. Quando comparado
ao Tukey, teste amplamente utilizado por pesquisadores nas mais
diversas reas, foi indiscutivelmente melhor.

Poder dos testes para t=5


CV=20% e r=20

100

80
% de decises corretas

60

40

Tukey (N)
SNK (N)
20
Scott-Knott (N)
Tukey (E)
SNK (E)
0
0.5 1 1.5 2 4 6 Scott-Knott (E)

Diferena real entre mdias

FIGURA 6 Poder dos testes de Tukey, SNK e Scott e Knott, para detectar diferenas

entre mdias de 0,5 X a 6 X , considerando-se as distribuies normal e

exponencial, 5 tratamentos, 20 repeties e CV 20%, para = 5%.

O teste de Scott e Knott apresentou poder superior aos demais


testes, em todas as situaes consideradas e, alm disso, apresentou po-
deres semelhantes nas situaes de normalidade e no normalidade dos
resduos. Sob H0 parcial esse efeito tem pouco valor, devido s
elevadas taxas de erro tipo I por experimento e por comparao
observadas. As elevadas taxas de erro tipo I, observadas sob H0 parcial
uma caracterstica desse teste que j tinha sido apontada por Silva,
Ferreira e Bearzoti (1999) e por Santos (2000). conveniente ob-
servar, que as distribuies residuais tm pouco efeito, sob H0 parcial e
completa, mostrando a robustez do teste.

Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2003 79


Poder dos testes para t=5
CV=20% e r=20

100

80
% de decises corretas

60

40

Tukey (L)
SNK (L)
20
Scott-Knott (L)
Tukey (W3.6)
SNK (W3.6)
0
0.5 1 1.5 2 4 6 Scott-Knott (W3.6)

Diferena real entre mdias

FIGURA 7 Poder dos testes de Tukey, SNK e Scott e Knott, para detectar diferenas

entre mdias de 0,5 X a 6 X , considerando-se as distribuies lognormal e

weibull, 5 tratamentos, 20 repeties e CV 20%, para = 5%.

Concluses
O teste de Scott-Knott controla as taxas de erro tipo I por com-
parao, quando so considerados os resultados obtidos na situao de
nulidade completa. A taxa de erro tipo I por experimento do teste de
Scott e Knott, ainda em situao de nulidade completa, esteve acima do
valor nominal adotado para algumas situaes. Para a distribuio
lognormal, com um maior nmero de tratamentos, os testes de Tukey e
SNK apresentaram altas taxas de erro, enquanto o teste de Scott e
Knott foi mais robusto para esta situao.
Quando se considerou situao de nulidade parcial, o teste de
Scott-Knott no controlou as taxas de erro tipo I por experimento e por
comparao, independente das distribuies. Os testes de Tukey e
SNK, na distribuio lognormal, no controlaram as taxas de erro tipo I
por experimento, sendo esse efeito mais pronunciado com maior n-
mero de tratamentos.
O teste de Scott-Knott mais poderoso que os demais e alm
disso apresenta poderes semelhantes nas distribuies normais e no

80 Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2002


normais dos resduos. Pelo fato de possuir poder elevado, taxas de erro
tipo I quase sempre de acordo com os nveis nominais em todas as
distribuies consideradas e por ser robusto violao de normalidade,
recomenda-se a utilizao do teste de Scott e Knott.

BORGES, L. C., FERREIRA, D. F. Power and type I error rates of


Scott-Knott, Tukey and Student-Newman-Keulss tests under residual
normal and non normal distributions. Rev. Mat. Estat. (So Paulo),
v.21, n.1, p.67-83, 2003.

ABSTRACT: This work proposed to evaluate the power and the type I error
rates of the Scott-Knott, Tukey and SNK test, in a wide of experimental
situations, in conditions of normality and non-normality error distribution.
Power and type I comparisonwise and experimentwise error rates were eva-
luated, considering complete and partial null hypotheses. The simulations
were made considering the normal, lognormal, exponential and weibull
distributions. Scott-Knott's test controlled the comparisonwise type I error
rates, under complete H0 and it did not control the experimentwise type I
error rate in all distributions. In situation of partial nullity, Scott-Knott's
test did not control the type I comparisonwise and experimentwise error
rates, even in normality situations. Scott-Knott's test is more powerful than
the others and it is robust. Due to the high power, type I error rates almost
always in agreement with the nominal levels for all distributions and for
being robust to the normality violation, the Scott-Knott test is recommended.
KEYWORDS: Multiple comparisons, robustness, cluster analysis.

Referncias

BANZATO, D. A.; KRONKA, S. N. Experimentao agrcola. 3.ed.


Jaboticabal: FCAV/UNESP, 1995. 247p.
BERNHARDSON, C. S. Type I error rates when multiple comparison
procedures follow a significant F test of ANOVA. Biometrics, v.31,
p.337-340, 1975.
BOARDMAN, T, J.; MOFFITT, D. R. Graphical Monte Carlo Type I
error rates for multiple comparison procedures. Biometrics, v.27, p.738-
744, 1971.
CARMER, S. G.; SWANSON, M. R. Detection of differences between
means: a Monte Carlo study of five pairwise multiple comparison pro-
cedures. Agron. J., v.63, p.940-945, 1971.

Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2003 81


CARMER, S. G.; SWANSON, M. R. An evaluation of ten pairwise
multiple comparison procedures by Monte Carlo methods. J. Am. Stat.
Assoc., v.68, p.66-74, 1973.
DACHS, J. N. Estatstica computacional: uma introduo em turbo
pascal. Rio de Janeiro: Livros Tcnicos e Cientficos, 1988. 236p.
FERREIRA, D. F.; MUNIZ, J. A. D.; F.; AQUINO, L. H. Compa-
raes mltiplas em experimentos com grande nmero de tratamentos
utilizao do teste de Scott - Knott. Cinc. Agrotecnol., v.23, n.3,
p.745-752, 1999.
HOCHBERG, Y.; TAMHANE, A. C. Multiple comparison proce-
dures. New York: John Wiley, 1987. 450p.
JOHNSON, N. L.; KOTZ, S. Distributions in statistics continuous uni-
variate distributions. New York: John Wiley, 1970. 300p.
KROMREY, J. D.; LAROCCA, M. E. Power and type I error rates of
new pairwise multiple comparison procedures under heterogeneous
variances. J. Exp. Educ., v.63 , n.4, p.343-362, 1995.
MOOD A. M.; GRAYBILL, F. A; BOES D. C. Introduction to the
theory of statistics. 3.ed. New York: John Wiley, 1974. 564p.
PERECIN, D.; BARBOSA, J. C. Uma avaliao de seis procedimentos
para comparaes mltiplas. Rev. Mat. Estat., v.6, p.95-103, 1988.
PERECIN, D.; MALHEIROS, E. B. Curso: procedimentos para com-
paraes mltiplas. In: SIMPSIO DE ESTATSTICA APLICADA
EXPERIMENTAO AGRONMICA, 3 ; REUNIO ANUAL DA
REGIO BRASILEIRA DA SOCIEDADE INTERNACIONAL DE
BIOMETRIA, 34, 1989, Lavras, Curso...Lavras: ESAL, 1989. 67 p.
RAMALHO, M. A. P.; FERREIRA D. F.; OLIVEIRA, A. C. Experi-
mentao em gentica e melhoramento de plantas. Lavras: UFLA,
2000. 303p.
SANTOS, A. C. Definio do tamanho amostral usando simulao
Monte Carlo para os testes de normalidade univariado e multivariado
baseados em assimetria e curtose. 2001. 71f. Dissertao (Mestrado
em Estatstica e Experimentao Agropecuria) Universidade Federal
de Lavras, Lavras, 2001.
SANTOS, C. Novas alternativas de testes de agrupamento avaliadas
por meio de simulao Monte Carlo. 2000. 85f. Dissertao (Mestrado
em Estatstica e Experimentao Agropecuria)-Universidade Federal
de Lavras, Lavras, 2000.

82 Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2002


SCOTT, A. J.; KNOTT, M. A Cluster analysis method for grouping
means in the analysis of variance. Biometrics, v.30, p.507-512, 1974.
SILVA, E. C.; FERREIRA, D. F.; BEARZOTI, E. Avaliao do poder
e taxas de erro tipo I do teste de Scott-Knott por meio do mtodo de
Monte Carlo. Cinc. Agrotecnol., v.23, n.3, p.687-696, 1999.
STEEL, R. G.D; TORRIE, J.H.; DICKEY, D.A. Principles and pro-
cedures of statistics a biometrical approach. 3.ed. New York:
McGraw-Hill, 1997. 666p.

Recebido em 15.07.2002.
Aprovado aps reviso em 13.10.2002.

Rev. Mat. Estat., So Paulo, 21(1): 67-83, 2003 83

Você também pode gostar