Teste Kolmogorov-Smirnov - Wikipédia, A Enciclopédia Livre

09/08/2017 Teste Kolmogorov-Smirnov – Wikipédia, a enciclopédia livre
Teste Kolmogorov-Smirnov
Origem: Wikipédia, a enciclopédia livre.
Em estatística, o teste Kolmogorov–Smirnov (também

conhecido como teste KS ou teste K–S) é um teste não
paramétrico sobre a igualdade de distribuições de
probabilidade contínuas e unidimensionais que pode ser
usado para comparar uma amostra com uma distribuição de
probabilidade de referência (teste K–S uniamostral) ou
duas amostras uma com a outra (teste K–S biamostral).[1]
Recebe este nome em homenagem aos matemáticos russos
Andrei Kolmogorov e Nikolai Smirnov.
A estatística de Kolmogorov–Smirnov quantifica a

distância entre a função distribuição empírica da amostra e
a função distribuição acumulada da distribuição de
referência ou entre as funções distribuição empírica de
duas amostras. A distribuição nula desta estatística é Ilustração da estatística de Kolmogorov–Smirnov. A
calculada sob a hipótese nula de que a amostra é retirada da linha vermelha é a função distribuição acumulada, a
linha azul é a função distribuição empírica e a seta
distribuição de referência (no caso uniamostral) ou de que
preta é a estatística K–S.
as amostras são retiradas da mesma distribuição (no caso
biamostral). Em cada caso, as distribuições consideradas
sob a hipótese nula são distribuições contínuas, mas não restritas.
O teste K–S biamostral é um dos métodos não paramétricos mais úteis e difundidos para a comparação de duas
amostras, já que é sensível a diferenças tanto no local, como na forma das funções distribuição acumulada
empírica das duas amostras.[2]
O teste de Kolmogorov–Smirnov pode ser modificado para servir como um teste da qualidade do ajuste. No
caso especial do teste da normalidade da distribuição, as amostras são padronizadas e comparadas com uma
distribuição normal padrão. Isto equivale a tornar a média e a variância da distribuição de referência iguais aos
estimados da amostras, sabendo que usar isto para definir a distribuição de referência específica muda a
distribuição nula da estatística. Vários estudos encontraram que, mesmo nesta forma corrigida, o teste é menos
potente em avaliar a normalidade do que o teste de Shapiro–Wilk e o teste de Anderson–Darling.[3] Entretanto,
estes outros testes também têm suas desvantagens. O teste de Shapiro–Wilk, por exemplo, é conhecido por não
funcionar bem em amostras com muitos valores idênticos.
Índice
1 Estatística de Kolmogorov-Smirnov
2 Distribuição de Kolmogorov
2.1 Teste com parâmetros estimados
2.2 Distribuição nula discreta
3 Teste Kolmogorov-Smirnov biamostral
4 Limites de confiança para a forma da função distribuição
5 Estatística de Kolmogorov–Smirnov em mais de uma dimensão
6 Ver também
7 Referências
8 Ligações externas
https://pt.wikipedia.org/wiki/Teste_Kolmogorov-Smirnov 1/6
Estatística de Kolmogorov-Smirnov
A função distribuição empírica para observações independentes e identicamente distribuídas é
definida como
em que é a função indicadora, igual a 1 se e igual a 0 de outro modo.
A estatística de Kolmogorov–Smirnov para uma dada função distribuição acumulada é
em que é o supremo do conjunto de distâncias. Pelo teorema de Glivenko–Cantelli, se a amostra vier da

distribuição , então converge a 0 quase certamente no limite quando vai ao infinito. Kolmogorov
fortaleceu este resultado ao oferecer efetivamente a razão desta convergência como mostrado abaixo. O
Teorema de Donsker oferece um resultado ainda mais forte.
Na prática, a estatística exige um número relativamente grande de pontos de dados para que se rejeite
adequadamente a hipótese nula.
Distribuição de Kolmogorov
A distribuição de Kolmogorov é a distribuição da variável aleatória
em que é a ponte browniana. A função distribuição acumulada de é dada por[4]
que também pode ser expressa pela função teta de Jacobi . Tanto a forma da estatística
do teste de Kolmogorov–Smirnov, como sua distribuição assintótica sob a hipótese nula foram publicadas por
Kolmogorov,[5] enquanto uma tabela da distribuição foi publicada por Smirnov.[6] Relações de recorrência para
a distribuição da estatística do teste em amostras finitas também foram divulgadas por Kolmogorov.[5]
Sob a hipótese nula de que a amostra vem da distribuição hipotetizada ,
em distribuição, em que é a ponte browniana.
Se for contínua, então, sob a hipótese nula, converge para a distribuição de Kolmogorov, que não
depende de . Este resultado também pode ser conhecido como teorema de Kolmogorov.
O teste de Kolmogorov–Smirnov para a qualidade do ajuste é construído pelo uso de valores críticos da
distribuição de Kolmogorov.[7] A hipótese nula é rejeitada no nível se
em que é encontrado a partir de
A potência assintótica deste teste é 1.
Teste com parâmetros estimados
Se a forma ou os parâmetros de forem determinados a partir dos dados , os valores críticos

determinados desta forma são inválidos. Em tais casos, o método de Monte Carlo ou outros métodos podem ser
exigidos e as tabelas foram preparadas para alguns casos. Os detalhes para as modificações exigidas para a
estatística do teste e para os valores críticos para a distribuição normal e para a distribuição exponencial foram
divulgados.[8] Publicações mais recentes incluem a distribuição de Gumbel.[9] O teste de Lillefors representa
um caso especial desta questão para a distribuição normal. A transformação do logaritmo pode ajudar a superar
casos em que os dados do teste de Kolmogorov parecem não se ajustar ao pressuposto de que veio da
distribuição normal.
Distribuição nula discreta
O teste de Kolmogorov–Smirnov deve ser adaptado para variáveis discretas.[10] A forma da estatística do teste
permanece igual à do caso contínuo, mas o cálculo de seu valor é mais sutil. Isto pode ser visto quando se
computa a estatística do teste entre uma distribuição contínua e uma função de etapa que tem uma
descontinuidade em . Em outras palavras, o limite , se existir, é diferente de . Assim, quando
se computa a estatística
não fica claro como realocar o limite, a não ser que se saiba o valor limitante da distribuição subjacente.
Teste Kolmogorov-Smirnov biamostral

O teste Kolmogorov–Smirnov pode também ser usado para
testar se duas distribuições de probabilidade
unidimensionais subjacentes diferem entre si. Neste caso, a
estatística de Kolmogorov–Smirnov é
em que e são as funções distribuição empírica da

primeira e da segunda amostra respectivamente e éa
função supremo.
A hipótese nula é rejeitada ao nível se
[11] Ilustração da estatística biamostral de Kolmogorov–

Smirnov. As linhas vermelha e azul correspondem a
funções distribuição empírica e a seta preta é a
estatística K–S biamostral.
e são os tamanhos da primeira e da segunda amostras respectivamente. O valor de é dado na tabela

abaixo para os níveis mais comuns de [11]
0.10 0.05 0.025 0.01 0.005 0.001
1.22 1.36 1.48 1.63 1.73 1.95
e, em geral, por
O teste biamostral verifica se as duas amostras de dados vêm da mesma distribuição e não especifica qual é esta
distribuição comum, isto é, se é normal ou não normal. Tabelas de valores críticos para este caso também foram
publicadas.[8][11] Estes valores críticos têm algo em comum com o teste de Anderson–Darling e o teste qui-
quadrado, nomeadamente, o fato de que valores mais altos tendem a ser mais raros.[12]
Limites de confiança para a forma da função distribuição

Enquanto o teste Kolmogorov–Smirnov é geralmente usado para testar se uma dada é a distribuição de
probabilidade subjacente de , o procedimento pode ser invertido para dar limites de confiança à própria
. Caso se escolha um valor crítico da estatística de teste , tal que , então a banda de
largura em torno de conterá inteiramente com probabilidade .
Estatística de Kolmogorov–Smirnov em mais de uma dimensão

Um teste Kolmogorov–Smirnov de qualidade do ajuste multivariado e livre de distribuição foi proposto por
Ana Justel, Daniel Peña e Rubén Zamar em 1997.[13] O teste usa uma estatística construída pelo uso da
transformação de Rosenblatt e um algoritmo é usado para a computação no caso bivariado. Um teste
aproximado facilmente computado em qualquer dimensão também é apresentado.
A estatística do teste Kolmogorov–Smirnov precisa ser modificada se um teste semelhante for aplicado a dados
multivariados. Ela não pode ser aplicada diretamente porque a diferença máxima entre duas funções
distribuição acumulada conjuntas geralmente não é igual à diferença máxima de qualquer uma das funções
distribuição complementares. Assim, a diferença máxima será diferente, dependendo se
ou ou qualquer um dos dois outros arranjos possíveis for usado. Pode-se exigir que o
resultado do teste usado não dependa da escolha feita.
Uma abordagem à generalização da estatística de Kolmogorov–Smirnov para dimensões mais elevadas que
leva em conta a preocupação acima consiste em comparar as funções distribuição acumulada das duas amostras
com todos os ordenamentos possíveis e tomar o maior conjunto das estatísticas K–S resultantes. Em
dimensões, o número de ordenamentos é . Uma variação deste tipo foi proposta por J. A. Peacock[14] e
outra por G. Fasano e A. Francischini,[15] ambas comparadas por R. H. C. Lopes.[16] Valores críticos para a
estatística do teste podem ser obtidos por simulações, mas isto depende da estrutura de dependência da
distribuição conjunta.
Ver também
Teste de Kuiper
Referências
1. Daniel, Wayne W. (30 de junho de 2000). Applied Nonparametric Statistics (https://books.google.com.br/

books?id=bCDFAAAACAAJ&dq=Applied+Nonparametric+Statistics&hl=pt-BR&sa=X&redir_esc=y)
(em inglês). [S.l.]: Duxbury. ISBN 9780534381943
2. Corder, Gregory W.; Foreman, Dale I. (20 de setembro de 2011). Nonparametric Statistics for Non-
Statisticians: A Step-by-Step Approach (https://books.google.com.br/books?id=T3qOqdpSz6YC&printse
c=frontcover&dq=Nonparametric+Statistics:+A+Step-by-Step+Approach&hl=pt-BR&sa=X&redir_esc=
y#v=onepage&q=Nonparametric%20Statistics:%20A%20Step-by-Step%20Approach&f=false) (em
inglês). [S.l.]: John Wiley & Sons. ISBN 9781118211250
3. Stephens, M. A. (1 de setembro de 1974). «EDF Statistics for Goodness of Fit and Some Comparisons»
(http://www.tandfonline.com/doi/abs/10.1080/01621459.1974.10480196) . Journal of the American
Statistical Association. 69 (347): 730–737. ISSN 0162-1459 (https://www.worldcat.org/issn/0162-1459)
. doi:10.2307/2286009 (https://dx.doi.org/10.2307%2F2286009)
4. «Evaluating Kolmogorov's Distribution | Marsaglia | Journal of Statistical Software» (https://www.jstatso
ft.org/article/view/v008i18) . doi:10.18637/jss.v008.i18 (https://dx.doi.org/10.18637%2Fjss.v008.i18)
. Consultado em 4 de julho de 2017
5. Kolmogorov, Andrei (1933). «Sulla determinazione empirica di una legge di distribuzione». Giornale
dell'istituto italiano degli attuari. 4: 83-91
6. Smirnov, N. (junho de 1948). «Table for Estimating the Goodness of Fit of Empirical Distributions» (htt
p://projecteuclid.org/euclid.aoms/1177730256) . The Annals of Mathematical Statistics (em inglês). 19
(2): 279–281. ISSN 0003-4851 (https://www.worldcat.org/issn/0003-4851) .
doi:10.1214/aoms/1177730256 (https://dx.doi.org/10.1214%2Faoms%2F1177730256)
7. Stephens, M. A. (1 de dezembro de 1979). «Tests of fit for the logistic distribution based on the empirical
distribution function» (https://academic.oup.com/biomet/article/66/3/591/232613/Tests-of-fit-for-the-logi
stic-distribution-based) . Biometrika. 66 (3): 591–595. ISSN 0006-3444 (https://www.worldcat.org/iss
n/0006-3444) . doi:10.1093/biomet/66.3.591 (https://dx.doi.org/10.1093%2Fbiomet%2F66.3.591)
8. Pearson, E. S. and Hartley, H. O., eds. (1972). Biometrika Tables for Statisticians. 2. [S.l.]: Cambridge
University Press. pp. 117–123, Tables 54, 55. ISBN 0-521-06937-8
9. Shorack, Galen R.; Wellner, Jon A. (1986). Empirical Processes with Applications to Statistics. [S.l.]:
Wiley. p. 239. ISBN 047186725X
10. Arnold, Taylor B.; Emerson, John W. (2011). «Nonparametric Goodness-of-Fit Tests for Discrete Null
Distributions» (http://journal.r-project.org/archive/2011-2/RJournal_2011-2_Arnold+Emerson.pdf)
(PDF). The R Journal. 3 (2): 34–39
11. «Critical Values for the Two-sample Kolmogorov-Smirnov test (2-sided)» (https://www.webdepot.umont
real.ca/Usagers/angers/MonDepotPublic/STT3500H10/Critical_KS.pdf) (PDF). Universidade de
Montreal. Consultado em 4 de julho de 2017
12. Mehta, Salil (1 de abril de 2014). Statistics Topics (https://books.google.com.br/books?id=nIaxoAEACA
AJ&dq=mehta+statistics+topics&hl=pt-BR&sa=X&redir_esc=y) (em inglês). [S.l.]: Createspace
Independent Pub. ISBN 9781499273533
13. Justel, Ana; Peña, Daniel; Zamar, Rubén (15 de outubro de 1997). «A multivariate Kolmogorov-Smirnov
test of goodness of fit» (http://www.sciencedirect.com/science/article/pii/S0167715297000205) .
Statistics & Probability Letters. 35 (3): 251–259. doi:10.1016/s0167-7152(97)00020-5 (https://dx.doi.or
g/10.1016%2Fs0167-7152%2897%2900020-5)
14. Peacock, J. A. (1 de março de 1983). «Two-dimensional goodness-of-fit testing in astronomy» (https://ac
ademic.oup.com/mnras/article/202/3/615/967854/Two-dimensional-goodness-of-fit-testing-in) .
Monthly Notices of the Royal Astronomical Society. 202 (3): 615–627. ISSN 0035-8711 (https://www.wo
rldcat.org/issn/0035-8711) . doi:10.1093/mnras/202.3.615 (https://dx.doi.org/10.1093%2Fmnras%2F2
02.3.615)
15. Fasano, G.; Franceschini, A. (1 de março de 1987). «A multidimensional version of the Kolmogorov–
Smirnov test» (https://academic.oup.com/mnras/article/225/1/155/1007281/A-multidimensional-version-
of-the-Kolmogorov) . Monthly Notices of the Royal Astronomical Society. 225 (1): 155–170.
ISSN 0035-8711 (https://www.worldcat.org/issn/0035-8711) . doi:10.1093/mnras/225.1.155 (https://d
x.doi.org/10.1093%2Fmnras%2F225.1.155)
16. Lopes, R.H.C., Reid, I., Hobson, P.R. (27 de abril de 2007). The two-dimensional Kolmogorov–Smirnov
test (http://dspace.brunel.ac.uk/bitstream/2438/1166/1/acat2007.pdf) (PDF). XI International Workshop
on Advanced Computing and Analysis Techniques in Physics Research. Amsterdam, the Netherlands
Ligações externas
Teste Kolmogorov–Smirnov na Encyclopedia of Mathematics (https://www.encyclopediaofmath.org/inde

x.php/Kolmogorov-Smirnov_test) (em inglês)
Breve introdução do Departamento de Física do College of Saint Benedict e Saint John's University de
Minnesota (https://web.archive.org/web/20050710021649/http://www.physics.csbsju.edu/stats/KS-test.ht
ml) (em inglês)
Breve introdução do Engineering Statistics Handbook (http://www.itl.nist.gov/div898/handbook/eda/secti
on3/eda35g.htm) (em inglês)
Calculadora on-line com teste Kolmogorov–Smirnov (https://jumk.de/statistic-calculator/) (em inglês)
Obtida de "https://pt.wikipedia.org/w/index.php?title=Teste_Kolmogorov-Smirnov&oldid=49310398"
Esta página foi editada pela última vez à(s) 04h03min de 16 de julho de 2017.
Este texto é disponibilizado nos termos da licença Creative Commons - Atribuição - Compartilha Igual
3.0 Não Adaptada (CC BY-SA 3.0); pode estar sujeito a condições adicionais. Para mais detalhes,
consulte as condições de uso.

Teste Kolmogorov-Smirnov - Wikipédia, A Enciclopédia Livre

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Teste Kolmogorov-Smirnov - Wikipédia, A Enciclopédia Livre

Enviado por

Direitos autorais:

Formatos disponíveis

09/08/2017 Teste Kolmogorov-Smirnov – Wikipédia, a enciclopédia livre

Em estatística, o teste Kolmogorov–Smirnov (também

A estatística de Kolmogorov–Smirnov quantifica a

em que é a função indicadora, igual a 1 se e igual a 0 de outro modo.

A estatística de Kolmogorov–Smirnov para uma dada função distribuição acumulada é

em que é o supremo do conjunto de distâncias. Pelo teorema de Glivenko–Cantelli, se a amostra vier da

em que é a ponte browniana. A função distribuição acumulada de é dada por[4]

Sob a hipótese nula de que a amostra vem da distribuição hipotetizada ,

em distribuição, em que é a ponte browniana.

em que é encontrado a partir de

A potência assintótica deste teste é 1.

Teste com parâmetros estimados

Se a forma ou os parâmetros de forem determinados a partir dos dados , os valores críticos

Distribuição nula discreta

Teste Kolmogorov-Smirnov biamostral

em que e são as funções distribuição empírica da

A hipótese nula é rejeitada ao nível se

[11] Ilustração da estatística biamostral de Kolmogorov–

e são os tamanhos da primeira e da segunda amostras respectivamente. O valor de é dado na tabela

0.10 0.05 0.025 0.01 0.005 0.001

1.22 1.36 1.48 1.63 1.73 1.95

Limites de confiança para a forma da função distribuição

Estatística de Kolmogorov–Smirnov em mais de uma dimensão

1. Daniel, Wayne W. (30 de junho de 2000). Applied Nonparametric Statistics (https://books.google.com.br/

Teste Kolmogorov–Smirnov na Encyclopedia of Mathematics (https://www.encyclopediaofmath.org/inde

Você também pode gostar