Você está na página 1de 9

1

CENTRO UNIVERSITRIO ANHANGUERA DE SANTO ANDR


ENGENHARIA DE PROCESSO DE PRODUO


Trabalho ATPS
Planejamento

Trabalho de concluso de semestre do
curso de Engenharia de Processos

Professor
















2

Sumrio

1 - Histrico ............................................................................................................................................. 3
2 - Teste de Kolmogorov-Smirnov ........................................................................................................... 3
3 - O teste de Kolmogorov - Smirnov pode ser utilizado para avaliar as hipteses: .............................. 4
Soluo: ................................................................................................................................................... 7























3

1 - Histrico

Em estatstica, o teste Kolmogorov-Smirnov usado para determinar se duas distribuies de
probabilidade subjacentes diferem uma da outra ou se uma das distribuies de probabilidade
subjacentes difere da distribuio em hiptese, em qualquer dos casos com base em amostras
finitas.
O nome uma referncia aos matemticos russos Andrey Kolmogorov e Vladimir Ivanovich
Smirnov.
A funo distribuio acumulada Fn para n observaes yi definida por

As duas estatsticas de teste Kolmogorov-Smirnov de apenas um lado so dadas por


onde F(x) a distribuio em hiptese ou outra distribuio emprica. As distribuies de
probabilidade destas duas estatsticas, dado que a hiptese nula de igualdade das distribuies
verdadeira, no depende daquilo que a distribuio em hiptese , desde que ela seja contnua.
Donald Knuth faz uma descrio detalhada de como analisar a significncia deste par de
estatsticas. Muitas pessoas usam max(Dn+, Dn) alternativamente, mas a distribuio desta
estatstica de uso mais difcil.
Notar que quando a varivel independente subjacente cclica, como em dias da semana,
ento o teste de Kuiper mais apropriado.
Note-se ainda que o teste Kolmogorov-Smirnov mais sensvel em pontos prximos da
mediana da distribuio do que nas caudas. O teste Anderson-Darling um teste que
providencia igual sensibilidade nas caudas.

2 - Teste de Kolmogorov-Smirnov
Grande parte dos problemas que encontramos em estatstica so tratados com a hiptese que
os dados so retirados de uma populao com uma distribuio de probabilidade especfica. O
formato desta distribuio pode ser um dos objetivos da anlise. Por exemplo, suponha que
um pequeno nmero de observaes foram retiradas de uma populao com distribuio
desconhecida e que estamos interessados em testar hipteses sobre a mdia desta populao.
O teste paramtrico tradicional, baseado na distribuio t-student, obtido sob o hiptese de



4

que a populao tem distribuio normal. Nesse sentido, surge a necessidade de certificarmos
se essa suposio pode ser assumida. Em alguns casos, assumir a normalidade dos dados o
primeiro passo que tomamos para simplificar nossas anlise. Para dar suporte a esta
suposio, consideramos, dentre outros, o teste de Kolmogorov - Smirnov.

3 - O teste de Kolmogorov - Smirnov pode ser utilizado para avaliar as
hipteses:


Este teste observa a mxima diferena absoluta entre a funo de distribuio acumulada
assumida para os dados, no caso a Normal, e a funo de distribuio emprica dos dados.
Como critrio, comparamos esta diferena com um valor crtico, para um dado nvel de
significncia.
Considere uma amostra aleatria simples de uma populao com funo de
distribuio acumulada contnua desconhecida. A estatstica utilizada para o teste :


Esta funo corresponde a distncia mxima vertical entre os grficos de F(x) e Fn(x) sobre a
amplitude dos possveis valores de x. Em Dn temos que
F(x) representa a funo de distribuio acumulada assumida para os dados;
Fn(x) representa a funo de distribuio acumulada emprica dos dados.
Neste caso, queremos testar a hiptese contra a hiptese alternativa
. Para isto, tomamos as observaes aleatrias ordenadas
de forma crescente da populao com funo de distribuio contnua . No caso de anlise
da normalidade dos dados, assumimos a funo de distribuio da normal.
A funo de distribuio acumulada assumida para os dados definida por F(x(i))=P(X
x(i)) e a funo de distribuio acumulada emprica definida por uma funo escada, dada
pela frmula:

onde IA a funo indicadora. A funo indicadora definida da seguinte forma:





5

Observe que a funo da distribuio emprica Fn(x) corresponde proporo de valores
menores ou iguais a x. Tal funo tambm pode ser escrita da seguinte forma


Sob , a distribuio assinttica da estatstica de kolmogorov-Smirnov dada por



Esta distribuio assinttica vlida quando temos conhecimento completo sobre a
distribuio de , entretanto, na prtica, especifica uma famla de distribuies de
probabilidade. Neste caso, a distribuio assinttica da estatstica de Kolmogorov-Smirnov
no conhecida e foi determinada via simulao.
Como a funo de distribuio emprica descontnua e a funo de distribuio hipottica
contnua, vamos considerar duas outras estatsticas:





para calcularmos a estatstica de kolmogorov-Smirnov. Essas estatsticas medem as distncias
(vertical) entre os grficos das duas funes, terica e emprica, nos pontos x(i-1) e x(i). Com
isso, podemos utilizar como estatstica de teste


Se Dn maior que o valor crtico, rejeitamos a hiptese de normalidade dos dados com (1-
)100% de confiana. Caso contrrio, no rejeitamos a hiptese de normalidade.








6

Resumo das estatsticas de teste.
x(ordenad
o)





























Tabela : Estatsticas de teste.

OBS: O valor de encontrado na tabela da distribuio normal padro.
A tabela de valores crticos para a estatstica do teste de Komolgorov-Smirnov dada a
seguir.
Nvel de Significncia
n 0,2 0,1 0,05 0,01

5 0,45 0,51 0,56 0,67
10 0,32 0,37 0,41 0,49
15 0,27 0,30 0,34 0,40
20 0,23 0,26 0,29 0,36
25 0,21 0,24 0,27 0,32
30 0,19 0,22 0,24 0,29
35 0,18 0,20 0,23 0,27



7

40 0,17 0,19 0,21 0,25
45 0,16 0,18 0,20 0,24
50 0,15 0,17 0,19 0,23
Valores maiores

Exemplo : Avaliar a normalidade dos dados referente a medio de 10 peas.
1,90642
2,10288
1,52229
2,61826
1,42738
2,22488
1,69742
3,15435
1,98492
1,99568



Soluo:
Aps ordenarmos os dados, obtemos o valor de Fn(x(i)) fazendo a razo entre a posio i e o
valor total de dados, n. O valor de F(x(i)) encontrado na tabela da distribuio normal
padro, aps transformarmos os dados pela relao


onde a mdia aritmtica e s o desvio padro dos dados.




8



Dados Fn(x) emprica F(x) terica |F(x(i))-Fn(x(i))| |F(x(i))-Fn(x(i-1))|
1,42738 0,1 0,109008 0,009008 0,109008
1,52229 0,2 0,147346 0,052654 0,047346
1,69742 0,3 0,239320 0,060680 0,039320
1,90642 0,4 0,380772 0,019228 0,080772
1,98492 0,5 0,439859 0,060141 0,039859
1,99568 0,6 0,448101 0,151899 0,051899
2,10288 0,7 0,530802 0,169198 0,069198
2,22488 0,8 0,623132 0,176868 0,076868
2,61826 0,9 0,859056 0,040944 0,059056
3,15435 1,0 0,982786 0,017214 0,082786
Mximo 0,176868 0,109008

Com isso,


Considerando = 0,05 e n = 10, encontramos pela tabela de valores crticos o valor 0,41.
Como Dn=0,176868 < 0,41, no temos evidncias para rejeitar a hiptese de normalidade dos
dados.

Veja a seguir os resultados obtidos pelo software Action.




9

Você também pode gostar