Você está na página 1de 10

Um estudo sobre o tamanho e poder dos testes t-Student e Wilcoxon

Emlio Augusto Coelho Barros* e Josmar Mazucheli


Departamento de Estatstica, Universidade Estadual de Maring, Av. Colombo, 5790 Bl. F-67, 87020-900, Maring, Paran, Brasil. *Autor para correspondncia. e-mail: emilioaugusto@pop.com.br

RESUMO. Um dos problemas mais comuns em estatstica consiste em testar a hiptese versus a alternativa H1 : 0 , em que 0 algum valor especfico do parmetro . A partir de uma amostra aleatria, sob a suposio de que a mesma proveniente de uma distribuio Normal com mdia e desvio padro , ambos desconhecidos, pode-se aplicar o bem conhecido teste t-Student. Como alternativa, sob a suposio de simetria da distribuio dos dados, pode-se utilizar o teste no-paramtrico conhecido na literatura como teste de Wilcoxon (Conover, 1971). Neste artigo, conduzido um estudo de simulao Monte-Carlo com o intuito de avaliar o tamanho e o poder dos testes t-Student e de Wilcoxon sob diferentes instncias. Para o clculo do tamanho de ambos os testes, foram realizadas B = 100 .000 simulaes Monte-Carlo com 10 diferentes tamanhos de amostras, n = 10, 20, ... , 90, 100. Cada uma das B = 100 .000 amostras foram geradas das distribuies Normal, Laplace, Uniforme, t-Student e Logstica sob a hiptese nula, sem perda de generalizades, com = 0. Para
H0 : =0

o clculo do poder, novamente com 0 = 1.0,0.9,K, 0.9,1.0 .

B = 100.000

amostras foram geradas sob a hiptese alternativa

Palavras-chave: tamanho do teste, poder do teste, simulao Monte-Carlo, teste t-Student, teste de Wilcxon.

ABSTRACT. A study about the size and power of t-Student and Wilcoxon tests. A typical problem in statistics data analysis consists in testing a null hypothesis H0 : =0 versus an alternative H1 : 0 , where 0 is some specific value of the true parameter . From a random sample with normal distribution with mean and variance 2 , both unknown, we might use the well known t-student test. As an alternative to the usual t-student test, under the symmetric supposition, we can use the nonparametric Wilcoxon on test (Conover, 1971). In this paper, a Monte-Carlo simulation study was conducted to calculate the empirical size and power of the t-student and Wilcoxon tests. In this study, several instances were considered. For the size of both tests, we considered sample sizes equal to n =10,20,K,90,100 simulated from Normal, Laplace, Uniform, t-Student and Logistic distributions, under the null hypothesis with = 0 . In the power study, from the same sample sizes and for all distributions, random samples were simulated from the alternative hypothesis considering 0 = 1.0,0.9,K, 0.9,1.0 .
Key words: empirical size, power of tests, Monte-Carlo simulation, t-Student test, Wilcoxon test.

Introduo Seja (x1,K, xn ) uma amostra aleatria proveniente de uma populao com distribuio simtrica escrita na forma
x f

, X N (, ) , bem conhecida que a estatstica definida na forma:


T= n x 0 , s

(Casella e Berger, 1990), com pa-

rmetro de locao e escala , ambos desconhecidos. Suponha o interesse em testar a hiptese H 0 : = 0 versus a alternativa H1 : 0 , em que 0 algum valor especificado do parmetro . Sob a suposio de que (x1,K, xn ) proveniente de uma distribuio Normal com mdia e desvio padro
Acta Sci. Technol.

tem distribuio t-Student com dade; em que


x= 1

(n 1)

graus de libern

n i =1xi e

s=

(n 1) i =1 xi x

so,

respectivamente, a mdia e o desvio padro amostral. Para hipteses alternativas da forma H1 : 0 , rejeita-se H 0 : = 0 , em nvel de significncia , (0 < < 1) , se T > t(n 1; / 2) , em que t(n1; / 2) o 100 / 2 percentil
Maring, v. 27, n. 1, p. 23-32, Jan./June, 2005

24

Barros e Mazucheli

da distribuio t-Student com (n 1) graus de liberdade. Quando no possvel garantir a suposio de normalidade, na presena de amostras suficientemente grandes, o Teorema Central do Limite garante que se os dados so provenientes de uma populao com mdia e varincia finita 2 , ento a varivel aleatria T pode ser aproximada por uma distribuio normal para n (ver, por exemplo, Ferguson, 1967; Graybill, 1974; Casella e Berger, 1990). Na ausncia da suposio de normalidade e assumindo que os dados so provenientes de uma distribuio simtrica, uma alternativa ao teste t-Student o teste de Wilcoxon (Conover, 1971). O teste de Wilcoxon baseado nos postos de (x1,K, xn ) , cuja estatstica escrita na forma:
W=

o do poder, so gerados valores sob a hiptese alternativa atribuindo-se valores a , que variam entre -1 e 1, com passo igual a 0.1. Na Seo Estudo de Simulao, so discutidas as diferentes instncias avaliadas no estudo de simulao. A Seo Tamanho dos Testes avalia o comportamento de ambos os testes com relao ao tamanho dos mesmos. O poder avaliado na Seo Poder dos Testes. A Seo Concluses finaliza este artigo com algumas concluses.
Estudo de simulao

i =1

n+

n (n + 1) , R+ t t i 4

em que

R+

o posto de

| xi 0 |

para

xi 0 ,

nt

e n+ so, respectivamente, o nmero de observaes em que xi 0 e (xi 0 ) > 0. Na presena de empates, a mdia dos postos utilizada. Por exemplo, se x1 = x 2 e o posto de | x1 0 |= 1 e o posto de | x2 0 |= 2 , ento os postos dessas diferenas so
R + = 1.5

R + = 1.5

, respec-

tivamente. Para nt 20 , a distribuio amostral de W obtida a partir da enumerao de todas as possveis amostras sob H 0 (Conover, 1971; Hollander e Wolfe, 1973). Para nt > 20 , a estatstica:
W = W nt 1 nt V W 2

tem aproximadamente distribuio t-Student , com (n 1) graus de liberdade, em que


1 V= nt (nt + 1)(2nt + 1) 0.5 24

(
i =1

ti ti + 1)(ti 1),

n o nmero de grupos com empates e t i o nmero de empates no i-simo grupo (Iman, 1974). Em problemas reais, quando no razovel assumir que os dados so provenientes de uma distribuio simtrica ou normal, pode-se recorrer ao teste do sinal como alternativa aos testes Wilcoxon e tStudent. Vale lembrar que na prtica, em geral, mais fcil garantir a simetria do que a normalidade, o que torna o teste de Wilcoxon uma boa alternativa no paramtrica ao teste t-Student (Conover, 1971). Neste artigo, um estudo de simulao MonteCarlo avalia o comportamento dos testes t-Student e Wilcoxon com relao ao tamanho e poder. Para o clculo do tamanho emprico de ambos os testes, para vrias distribuies, valores pseudo-aleatrios so gerados sob a hiptese nula com = 0 . Na avaliaActa Sci. Technol.

O poder de um teste estatstico definido como a probabilidade de rejeitar a hiptese nula, dado que a mesma falsa. Na prtica, importante que se tenham testes com nvel de significncia prximos do nvel de significncia nominal e que o poder seja alto, mesmo em situaes de amostras pequenas. Na suposio de amostras provenientes de uma distribuio Normal, hipteses da forma H 0 : = 0 versus H1 : 0 podem ser avaliadas a partir da estattica tStudent, como descrito na Seo Introduo. Alternativamente, na suposio de simetria, pode-se utilizar o teste no-paramtrico de Wilcoxon. Para ambos, os testes, quando essas suposies esto satisfeitas, espera-se que o erro Tipo I seja prximo do nvel de significncia nominal e que o poder seja alto. Por outro lado, quando ocorre a quebra de alguma dessas suposies, importante avaliar o comportamento da taxa de rejeio de H 0 quando a mesma verdadeira. Essa taxa de rejeio definida como o tamanho emprico do teste e pode ser calculada via simulao Monte-Carlo, gerando-se amostras sob a hiptese nula. Por outro lado, gerando-se valores sob a hiptese alternativa, tem-se que a proporo de vezes em que H 0 rejeitada define o poder de um teste estatstico. Para os testes t-Student e Wilcoxon, o tamanho e o poder dos mesmos foram calculados considerando-se a distribuio Normal, Laplace, Uniforme, t-Student e Logstica (Tabela 1). Para todas as instncias descritas a seguir, foram adotados nveis de significncia nominais = 0.01 e = 0.05 . As simulaes foram conduzidas utilizando macros desenvolvidas no software SAS, nos quais os valores das estatsticas t-Student e Wilcoxon foram calculadas utilizando o procedimento univariate.
Tamanho dos testes

No clculo dos tamanhos de ambos os testes, t-Student e Wilcoxon, para cada uma das distribuies apresentadas na Tabela 1, foram geradas sob a hiptese nula, H 0 : = 0 , B = 100 . 000 amostras de
Maring, v. 27, n. 1, p. 23-32, Jan./June, 2005

Tamanho e poder dos testes t-Student e Wilcoxon

25
Tabela 4. Taxas de Rejeio X U ( a = 1, b = 1) . de
H0

tamanhos n = 10, 20,K , 90,100 . Para cada n e cada uma das distribuies apresentadas na Tabela 1, a proporo de vezes, entre as B = 100.000 amostras, em que os testes levam a falsa rejeio de H 0 define o tamanho emprico dos testes. Os resultados do estudo de simulao esto apresentados nas Tabelas 2 a 6. A Figura 1 apresenta o comportamento dos tamanhos dos testes em relao aos tamanhos de amostra. Uma vez que o nmero de vezes em que H 0 rejeitada tem distribuio Binomial, a hiptese nula para avaliar se o tamanho emprico estatisticamente igual ao tamanho nominal foi testada em nvel de significncia de 5%. Utilizou-se o teste Binomial exato, sendo que esses resultados tambm so apresentados nas Tabelas 2 a 6.
Tabela 1. Distribuies consideradas no estudo de simulao Monte-Carlo.
Distribuio Normal Laplace Uniforme
f

para

= 5%
n 10 20 30 40 50 60 70 80 90 100
+

= 1 %

t-Student 0.0526+ 0.0527+ 0.0513 0.0507 0.0515 0.0499 0.0497 0.0505 0.0497 0.0515

Wilcoxon 0.0479+ 0.0495 0.0499 0.0518 0.0513 0.0499 0.0498 0.0507 0.0497 0.0517

t-Student 0.0134+ 0.0118+ 0.0112+ 0.0108 0.0109+ 0.0100 0.0104 0.0108 0.0100 0.0106

Wilcoxon 0.0093 0.0095 0.0114+ 0.0109+ 0.0107 0.0101 0.0104 0.0110+ 0.0100 0.0107

Significante ao nvel de 5%.

Tabela 5. Taxas de rejeio de

H0

para X t 4

= 5%
n 10 20 30 40 50 60 70 80 90 100
+

= 1%
t-Student 0.0075+ 0.0078+ 0.0082+ 0.0081+ 0.0087+ 0.0085+ 0.0089+ 0.0092+ 0.0086+ 0.0089+ Wilcoxon 0.0102 0.0095 0.0113+ 0.0108 0.0109+ 0.0109+ 0.0105 0.0105 0.0097 0.0101

(x
f

| ,

= 1)=

Expresso da Densidade
1 2

exp
1 2

1 2

(x

)2

(x

| ,

= 1

)=

exp

(|

x |)

t-Student 0.0440+ 0.0461+ 0.0456+ 0.0474+ 0.0486 0.0479+ 0.0471+ 0.0477+ 0.0487 0.0483

Wilcoxon 0.0500 0.0482+ 0.0486 0.0517 0.0513 0.0496 0.0498 0.0505 0.0496 0.0509

f (x | ) =
f

1 2+ 2

x 1 + 2
(x )
5

Significante ao nvel de 5%.

t-Student Logistica

(x | ) =

2 5 (2 . 5

(1 + )

Tabela 6. Taxas de Rejeio X Logistica ( = 0 , = 1)


= 5%
n 10 20 30 40 50 60 70 80 90 100
+

de

H0

para

f (x | , = 1 ) =

exp ( x ) [1 + exp ( x )] 2

= 1%
Wilcoxon 0.0479+ 0.0495 0.0499 0.0518 0.0513 0.0499 0.0498 0.0507 0.0497 0.0517 t-Student 0.0087+ 0.0095+ 0.0095 0.0095 0.0098 0.0089+ 0.0096 0.0100 0.0096 0.0103 Wilcoxon 0.0093 0.0095 0.0114+ 0.0109+ 0.0107 0.0101 0.0104 0.0110+ 0.0100 0.0107

Tabela 2. Taxas de Rejeio de

H0

para X N ( = 0 , = 1 )

= 5%
n 10 20 30 40 50 60 70 80 90 100
+

= 1%
t-Student 0.0108 0.0101 0.0097 0.0097 0.0098 0.0102 0.0101 0.0098 0.0100 0.0102 Wilcoxon 0.0103 0.0094+ 0.0111 0.0104 0.0104 0.0104 0.0107 0.0102 0.0104 0.0101

t-Student 0.0509 0.0506 0.0491 0.0499 0.0501 0.0505 0.0496 0.0493 0.0497 0.0494

Wilcoxon 0.0500 0.0495 0.0495 0.0499 0.0513 0.0507 0.0511 0.0490 0.0499 0.0493

t-Student 0.0455+ 0.0489 0.0490 0.0496 0.0508 0.0488 0.0496 0.0497 0.0495 0.0509

Significante ao nvel de 5%.

Poderdo teste

Significante ao nvel de 5%.

Tabela
X

3.

Taxas

Laplace

( = 0,

de

Rejeio
= 1)

de

H0

para

= 5%
n 10 20 30 40 50 60 70 80 90 100
+

= 1%
t-Student 0.0057+ 00072+ 0.0084+ 0.0085+ 0.0090+ 0.0084+ 0.0092 0.0094 0.0090+ 0.0092+ Wilcoxon 0.0097 0.0094 0.0120+ 0.0102 0.0105 0.0099 0.0107 0.0104 0.0103 0.0101

t-Student 0.0414+ 0.0467+ 0.0479+ 0.0487 0.0490 0.0479+ 0.0488 0.0491 0.0492 0.0500

Wilcoxon 0.0484 0.0496 0.0493 0.0510 0.0506 0.0502 0.0511 0.0501 0.0496 0.0508

Significante ao nvel de 5%.

No clculo do poder, para ambos os testes e para cada uma das distribuies apresentadas na Tabela 1, tambm foram geradas B = 100 . 000 amostras de tamanhos n = 10 , 20 , K , 90 , 100 , sob a hiptese alternativa com Em cada uma das = 1 . 0 , 0 .9 , K , 0 .9 , 1 . 0 . T = 5 10 100 .000 simulaes, foram calculados os pvalores associados a ambos os testes. A proporo de vezes em que H0 foi corretamente rejeitada definiu o poder dos testes. Os resultados so apresentados nas Figuras 2 a 6. As curvas internas s figuras, representadas por (-o-), mostram o poder exato para o teste t-Student. Para cada uma das distribuies, os nveis de significncia adotados foram os prprios tamanhos dos testes apresentados nas Tabelas 2 a 6.
Maring, v. 27, n. 1, p. 23-32, Jan./June, 2005

Acta Sci. Technol.

26

Barros e Mazucheli

(a)

(b)

(c)

(d)

(e)
Figura 1. Tamanho dos testes; (): Teste t-Student, ( ): Teste de Wilcoxon; (a): Distribuio Normal; (b): Distribuio de Laplace; (c): Distribuio Uniforme; (d): Distribuio t-Student; (e): Distribuio Logstica.

Acta Sci. Technol.

Maring, v. 27, n. 1, p. 23-32, Jan./June, 2005

Tamanho e poder dos testes t-Student e Wilcoxon

27

(a)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(i)

Figura 2. Valores da hiptese alternativa versus o poder dos testes para a distribuio Normal; = 0.05: () t-Student, (---) Wilcoxon; = 0.01: ( ) t-Student, (--) Wilcoxon.

Acta Sci. Technol.

Maring, v. 27, n. 1, p. 23-32, Jan./June, 2005

28

Barros e Mazucheli

(a)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(i)

Figura 3. Valores da hiptese alternativa versus o poder dos testes para a distribuio Laplace; = 0.05: () t-Student, (---) Wilcoxon; = 0.01: ( ) t-Student, (--) Wilcoxon.

Acta Sci. Technol.

Maring, v. 27, n. 1, p. 23-32, Jan./June, 2005

Tamanho e poder dos testes t-Student e Wilcoxon

29

(a)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(i)

Figura 4. Valores da hiptese alternativa versus o poder dos testes para a distribuio Uniforme; = 0.05: () t-Student, (---) Wilcoxon; = 0.01: ( ) t-Student, (--) Wilcoxon.

Acta Sci. Technol.

Maring, v. 27, n. 1, p. 23-32, Jan./June, 2005

30

Barros e Mazucheli

(a)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(i)

Figura 5. Valores da hiptese alternativa versus o poder dos testes para a distribuio t-Student; = 0.05: () t-Student, (---) Wilcoxon; = 0.01: ( ) t-Student, (--) Wilcoxon.

Acta Sci. Technol.

Maring, v. 27, n. 1, p. 23-32, Jan./June, 2005

Tamanho e poder dos testes t-Student e Wilcoxon

31

(a)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(i)

Figura 6. Valores da hiptese alternativa versus o poder dos testes para a distribuio Logstica; = 0.05: () t-Student, (---) Wilcoxon; = 0.01: ( ) t-Student, (--) Wilcoxon.

Acta Sci. Technol.

Maring, v. 27, n. 1, p. 23-32, Jan./June, 2005

32

Barros e Mazucheli

Concluso A partir dos resultados apresentados nas Tabelas 2 a 6, observa-se para a distribuio Normal que os valores das taxas de erro tipo I dos testes t-Student e Wilcoxon se comportam de maneira similar e esto sempre prximos dos nveis de significncia nominais, ( = 5% e = 1% ), independente do tamanho da amostra. Para a distribuio Logstica, em ambos os testes, as taxas de erro tipo I se aproximam do nvel de significncia medida que o tamanho da amostra aumenta. Para n 30 , ambos os testes so conservativos; entretanto seus comportamentos so similares para amostras geradas da distribuio Normal. O comportamento das taxas de erro tipo I do teste de Wilcoxon para a distribuio de Laplace bem diferente do teste t-Student principalmente para n 60 em que a hiptese de que o tamanho emprico igual ao tamanho nominal sempre rejeitada em nvel de significncia de 5% (Tabela 3). Um comportamento similar observado quando os dados so gerados das distribuies t-Student e Uniforme. Como observao, as taxas de erro tipo I do teste de Wilcoxon esto na maioria das instncias prximas do nvel de significncia nominal para qualquer distribuio, independentemente do tamanho da amostra. Esse fato est relacionado com o fato de que o teste de Wilcoxon baseado na suposio de simetria. Em relao ao poder, a partir das Figuras 2 a 6, observa-se que a medida que a hiptese alternativa se

afasta de = 0 , e o tamanho da amostra aumenta, o poder dos testes se aproximam de 1. Ambos os testes se comportam similarmente quando a distribuio Normal e Logstica, porm, para as demais distribuies, o teste de Wilcoxon apresenta um poder maior do que o teste t-Student. Referncias
CASELLA, G.; BERGER, R.L. Statistical inference. The Wadsworth & Brooks/Cole Statistics/Probability Series. Wadsworth & Brooks/Cole Advanced Books & Software, Pacific Grove, CA, 1990. CONOVER, W.J. Practical Nonparametric Statistics. New York: John Wiley and Sons, 1971. FERGUNSON, T.S. Mathematical statistics. New York: Academic Press, 1967. IMAN, R.L. Use of a t-statistic as an approximation to the exact distribution of the Wilcoxon signed ranks test statistic. Comunications in Statistic, v. 3, p. 795-806, 1974. GRAYBILL, A M. et al. Introduction to the Theory of Statistics. So Paulo: McGraw-Hill, 1974. HOLLANDER, M.; WOLFE, D.A. W. Nonparametric statistical inference. New York: John Wiley & Sons, 1973.

Received on January 10, 2005. Accepted on June 15, 2005.

Acta Sci. Technol.

Maring, v. 27, n. 1, p. 23-32, Jan./June, 2005