Você está na página 1de 5

COMPARAO DOS TESTES DE ADERNCIA NORMALIDADE KOLMOGOROVSMIRNOV, ANDERSON-DARLING, CRAMERVON MISES E SHAPIRO-WILK POR SIMULAO

Vanessa Bielefeldt Leotti, Universidade Federal do Rio Grande do Sul, vleotti@yahoo.com.br Alan Rodrigues Birck, Universidade Federal do Rio Grande do Sul, alanbirck@hotmail.com Joo Riboldi, Universidade Federal do Rio Grande do Sul, riboldi@mat.ufrgs.br

RESUMO: Uma grande quantidade de mtodos estatsticos supe que os dados provenham de uma Distribuio Normal, pois este fato permite que seja realizada a maioria das tcnicas de inferncia estatstica conhecidas. Para avaliar o atendimento esta suposio, existem testes no-paramtricos como Kolmogorov-Smirnov, Cramer-von Mises, Anderson-Darling e Shapiro-Wilk, que verificam se a distribuio de um conjunto de dados adere Distribuio Normal. Neste trabalho, atravs de simulao Monte Carlo, a eficincia desses quatro testes foi comparada, sob diferentes distribuies e diferentes tamanhos de amostra. As simulaes foram feitas no software SAS, com 1000 replicaes para cada tamanho de amostra e distribuio especificada. Os resultados mostraram equivalncia dos quatro testes para dados normais, com exceo do critrio de Kolmogorov-Smirnov, que se mostrou inferior, e para dados no-normais o teste de Shapiro-Wilk mostrou-se sempre superior, concluindo-se ento que este aparentemente o melhor teste de aderncia normalidade. Palavras chave: Normalidade, testes de aderncia, simulao.

1. INTRODUO Uma varivel aleatria, seja idade de um grupo de pessoas, seja, por exemplo, o tempo de vida til de determinado equipamento, assume uma distribuio de freqncias especfica. As distribuies de freqncias podem apresentar formas variadas (Callegari-Jacques). Na literatura estatstica encontramos muitas distribuies tericas. Essas so modelos que procuram representar o comportamento de determinado evento em funo da freqncia de sua ocorrncia. No caso das variveis contnuas, esse evento ser um intervalo de valores. As distribuies de freqncias so, em verdade, distribuies de probabilidade, onde para um evento teremos uma probabilidade de ocorrncia associada. Em outras palavras, podemos inferir com que probabilidade determinado evento pode ocorrer novamente. Os modelos tornam certas inferncias exeqveis e por vezes mais poderosas. A modelagem um recurso amide utilizado. No podemos medir o volume de determinado slido se no considerarmos que supostamente seja construdo de igual maneira a um modelo pr-concebido. Uma vez atribuda sua forma a um modelo podemos estimar, atravs de certos parmetros, seu volume com

razovel grau de aproximao. praticamente impossvel medir o volume de uma nuvem que passeia pelo cu. Entretanto, se concebermos sua forma como um elipside, podemos estimar seu volume de maneira algbrica, sabendo apenas sua altura, largura e profundidade. No diferente com as distribuies de probabilidade. Assumir que determinado grupo de dados se distribui conforme um modelo nos permite realizar estimativas sem precisar da totalidade das informaes. Invariavelmente, nos surge uma dvida: Como estimar se a distribuio de um grupo de dados concorda com um particular modelo terico? Nosso objeto de estudo a mais importante distribuio de probabilidade: distribuio normal ou gaussiana. sabido que a suposio de normalidade na distribuio dos dados exigida para a realizao de muitos mtodos estatsticos, assim como a suposio de independncia entre as observaes. A pergunta permanece: de quais maneiras podemos estimar se distribuio dos dados que estamos estudando se ajusta a uma distribuio normal? Existem disponveis alguns testes para verificar a suposio de normalidade dos dados, Anderson-Darling, Cramer-von Mises, Kolmogorov-Smirnov e Shapiro-Wilk, bem como recursos grficos, como histograma e normal plot. Essas estatsticas tm metodologia diferente para realizao do teste de hipteses, assim se faz necessrio um estudo mais aprofundado de qual destas mais adequada. Os testes de Anderson-Darling, Cramer-von Mises e Kolmogorov-Smirnov so baseados na funo de distribuio emprica (FDE) dos dados, e apresentam vantagens sobre o teste de aderncia qui-quadrado, incluindo maior poder e invarincia em relao aos pontos mdios dos intervalos escolhidos. O teste de Kolmogorov-Smirnov pertence classe suprema de estatsticas baseadas na FDE, pois trabalha com a maior diferena entre a distribuio emprica e a hipottica. Os testes Anderson-Darling e Cramer-von Mises pertencem classe quadrtica de estatsticas baseadas na FDE, pois trabalham com as diferenas quadrticas entre a distribuio emprica e a hipottica. No entanto, o teste de Shapiro-Wilk baseia-se nos valores amostrais ordenados elevados ao quadrado e tem sido o teste de normalidade preferido por mostrar ser mais poderoso que diversos testes alternativos.

2. METODOLOGIA Primeiramente, definiram-se os tamanhos de amostras e distribuies a serem estudadas. Os tamanhos de amostra escolhidos foram: n=15, 30, 50 e 100. As distribuies simuladas foram: -

Normal (0,1) : para avaliar a taxa de erro tipo I dos testes (rejeio de H dada H0 0
verdadeira);
1 Gama 10 , 3 : por ser uma distribuio aproximadamente simtrica;

Gama(5,5): por ser uma distribuio levemente assimtrica esquerda;

Qui quadrado(3): por ser uma distribuio acentuadamente assimtrica esquerda;

Exponencial (5): por ser uma distribuio assimtrica e montona decrescente.

Os grficos abaixo, gerados no software Derive, mostram as funes densidade de probabilidade das distribuies acima especificadas, bem como as das distribuies normais, com mdia e varincia correspondente. Comparao das distribuies geradas com a Normal

A escolha destas distribuies levou em conta as possibilidades do software SAS e o fato de que no haveria sentido em simular distribuies como a Binomial (que uma distribuio de variveis discretas) ou a Beta (que uma distribuio de variveis binrias). Para cada tamanho de amostra e distribuio escolhida, fez-se 1000 replicaes no software. Para cada amostra, aplicavam-se os testes e gravava-se o p-value resultante cada um. Aps as 1000 replicaes terem sido geradas, analisava-se a freqncia com que os p-values encontravam-se nas classes: -

0 p value 0,01 : classe que corresponde rejeio de H : Os dados provm de uma 0


distribuio Normal, com nvel de significncia = 0,01 .

0,01 < p value 0,05 : conjuntamente com a classe anterior, corresponde rejeio de
H0 com = 0,05 .

0,05 < p value 0,10 : conjuntamente com as duas classes anteriores, corresponde
rejeio de H0 com = 0,10 .

0,10 < p value 1 : corresponde no rejeio de H com = 0,10 . 0

Neste trabalho adotou-se o nvel de significncia 0,01, pois em testes de suposies de modelos, querer se rejeitar o atendimento suposio somente em casos extremos. Para avaliar a preciso dos testes em relao ao tamanho da amostra, fizeram-se grficos no Excel com os tamanhos de amostra no eixo horizontal, e o percentual de acerto do teste no eixo vertical. Quando a distribuio Normal, este percentual de acerto eqivale s freqncias percentuais dos p-values pertencentes s trs ltimas classes, ou seja, o percentual de no rejeio de H0; caso contrrio, o percentual de p-values pertencentes primeira classe, ou seja, o percentual de rejeio de H0.

3. RESULTADOS E DISCUSSO Os resultados foram condensados de forma grfica, com grficos de linha relacionando o tamanho de amostra e o percentual de acerto para cada teste. A seguir estes so apresentados:
Distribuio N(0,1)
100 % Acerto 99.5 99 98.5 98 15 30 50 Tamanho da Amostra 100 A-D C-M K-S S-W

Distribuio Gama(10,1/3)
100 80 % Acerto 60 40 20 0 15 30 50 Tamanho da Amostra 100
% Acerto 100

Distribuio Gama(5,5)
A-D C-M K-S S-W
80 60 40 20 0 15 30 50 Tamanho da Amostra 100 A-D C-M K-S S-W

Distribuio Qui-quadrado(3)
100 80 % Acerto 60 40 20 0 15 30 50 Tamanho da Amostra 100

Distribuio Exponencial(5)
100 % Acerto
A-D C-M K-S S-W

80 60 40 20 0 15 30 50 Tamanho da Amostra 100

A-D C-M K-S S-W

Atravs dos grficos de comparao dos resultados, percebe-se que, quando o conjunto de dados provm de uma distribuio Normal e independente do tamanho da amostra, todos os testes tm percentual de acerto maior que 98,5%. De uma maneira geral, os quatro critrios se equivalem em eficincia, com exceo do teste Kolmogorov-Smirnov que claramente mostrou-se inferior aos demais. Observa-se que os quatro testes tiveram baixo desempenho quando a distribuio dos dados era aproximadamente simtrica, mas no-normal. Mesmo quando n=100 todos tiveram percentual de acerto abaixo de 40%. Quanto mais assimtrica a distribuio, melhor era o desempenho dos testes, j que o percentual de acerto era maior mesmo com amostras menores. Para todas as distribuies no-normais geradas, evidenciou-se uma superioridade do teste de Shapiro-Wilk em relao aos demais, e inferioridade do teste de Kolmogorov-Smirnov.

4. CONCLUSES Como para dados normais os quatro critrios mostraram-se equivalentes, com exceo do critrio de Kolmogorov-Smirnov, e para dados no-normais o teste de Shapiro-Wilk mostrou-se sempre superior, conclui-se que este aparentemente o melhor teste de aderncia normalidade. Quando a distribuio dos dados for aproximadamente simtrica, sugere-se utilizar um nvel de significncia para o teste no to rigoroso como = 0,01 , pois o desempenho dos testes ser melhor. Mais estudos poderiam ser feitos, considerando-se outras distribuies, outros parmetros destas distribuies e outros tamanhos de amostra.

REFERNCIAS BIBLIOGRFICAS StatSoft, Inc. (2004). Electronic Statistics Textbook. Tulsa, OK: StatSoft. WEB:

http://www.statsoft.com/textbook/stathome.html.

SAS Institute Inc., Cary, NC, USA. Help do software SAS System for Windows V8.

Kirkwood, Betty R (1989) Essentials of Medical Statistics. Blackwell Scientific Publications. Londres.

Callegari-Jacques, Sdia M. (2003) Bioestatstica: princpios e aplicaes. Artmed. Porto Alegre.