Você está na página 1de 8

Docente : Elisete Correia

(ecorreia@utad.pt)

Teste de Kolmogorov Smirnov

Kolmogorov (1933) deduziu a distribuição marginal do supremo da distância entre


a função de distribuição empírica e a função de distribuição postulada na hipótese
nula.
Este teste é apropriado desde que os dados estejam pelo menos em escala ordinal
e a hipótese nula especifique completamente a distribuição.

Objetivo: Decidir se a distribuição da variável sob estudo numa determinada


amostra provem de uma população com uma distribuição especifica.

1
Teste de Kolmogorov Smirnov
Kolmogorov (1933) deduziu a distribuição marginal do supremo da distância entre a
função de distribuição empírica e a função de distribuição postulada na hipótese
nula.
Este teste é apropriado desde que os dados estejam pelo menos em escala ordinal e a
hipótese nula especifique completamente a distribuição.

Objetivo: Decidir se a distribuição da variável sob estudo numa determinada


amostra provem de uma população com uma distribuição especifica.

Pressupostos do teste
▪ a variável X é contínua com função de repartição F(x) desconhecida;
▪ conjetura-se que F(x)=F0(x), onde F0(x) é uma função de repartição contínua
completamente especificada, i.e, os parâmetros de F0(x) são completamente
conhecidos.
3

Teste de Kolmogorov Smirnov

Hipóteses a testar:

H0: Fn (x)=F0(x) vs H1: Fn(x)≠F0(x)

O teste de Kolmogorov-Smirnov baseia-se na maior distância vertical entre a função


distribuição empírica, Fn(x), e a função distribuição conjeturada em H0, F0(x),

2
Testes de ajustamento à distribuição normal

Dada a importância da distribuição Normal no âmbito da inferência estatística,


abordamos agora dois testes específicos para averiguar se um conjunto de dados se
pode considerar proveniente de uma população com distribuição normal:

➢ Kolmogorov-Smirnov com correção de Lilliefors;

Lilliefors deduziu extensões do teste K-S para o caso de ser necessário estimar
parâmetros, em populações gaussianas (1967) e em populações exponenciais
(1969).

➢ Shapiro-Wilks.

Testes de normalidade de Lillefors (K-S)

3
Testes de normalidade de Shapiro-Wilk

Nota: xi são os valores da


amostra ordenados e b é uma
constante (calculada por um
dado processo.)

Testes de normalidade de Shapiro-Wilk


Exemplo: Pretende-se testar se o tempo (em minutos) que uma criança demora a
reagir a um dado estimulo segue uma distribuição normal. Para tal selecionaram-se
aleatoriamente 10 crianças e registaram-se os seus tempos de reação:

Jovens 1 2 3 4 5 6 7 8 9 10
Tempo 3 4 5 6 4 9 7 6 4 6

X- v.a. “tempo de reação a um dado estimulo”


H0: X~Normal vs H1: X~Normal

Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Tempo ,185 10 ,200* ,932 10 ,463

Decisão: Como o valor de prova=0.463>0.05, não se rej H0, ou seja, existe


evidência estatística que nos leva a afirmar que os tempos de reação são
normalmente distribuídos. 8

4
Teste de Wilcoxon

Objectivo: Comparar a medida de tendência central da população em


estudo com um determinado valor teórico.
Alternativa não paramétrica ao teste t-Student, se a distribuição não
for normal.

Pressupostos

•As observações devem ser independentes e retiradas da mesma


população (amostra aleatória);

• A variável X é contínua e deve ser simétrica.

10

5
Teste de Wilcoxon

Hipóteses a testar:

Se n>20 e há empates
Estatística de teste

onde,
k- representa o nº de grupos de empates;
ei- nº de observações empatadas no grupo de empates i.

11

Teste de Wilcoxon
Exemplo: Considere os seguintes valores de tempos de realização de
uma dada tarefa, em minutos.

1.1, 2, 2.2, 2.8, 3.1, 3.1, 3.3, 3.4, 3.7


Pretende-se averiguar se podemos considerar que o valor mediano é
de 3.3.

Admitindo a não normalidade e a simetria da lei de v.a. em estudo,


o que pode concluir?

H 0 :  = 3.3 vs H1 :   3.3

12

6
Teste de Wilcoxon- metodologia
1. Determinar as diferenças Di = μ - Xi
2. Ordenar os valores das diferenças absolutas, | Di |
3. Retirar os valores de diferenças nulas da amostra e corrigir a dimensão
da amostra.
4. Associar a cada | Di | a sua ordem ou informação sobre o sinal original
de Di
5. Calcular a soma das ordens (ranks) das diferenças Di positivas, T+, e
das diferenças Di negativas, T−.
6. Determinar o menor dos valores

7. Usar a estatística de Wilcoxon (ou ajustada no caso de empates) para


determinar valores de significância de testes bilaterais ou unilaterais.

13

TESTE de Wilcoxon
1.9 2.0 2.2 2.8 3.1 3.1 3.3 3.4 3.7 valor

1.4 + 1.3+ 1.1 + 0.5 0.2 + 0.2 + 0 0.1 - 0.4 - | Di |


+
8 7 6 5 2.5 2.5 __ 1 4 ordens
(2) (3)
T+ T-=5 N=8
=31
(2+3)/2=2.5

Temos um | Di | igual a zero temos de ajustar N para 8. Os


empates (2ª e 3ª posição) ficam com o valor médio das posições,
no exemplo ambas terão a ordem 2.5.

14

7
Na tabela Ranks temos o nº de diferenças positivas e negativas e as
respetivas médias.

Na tabela Test Statistics temos o valor observado da estatística de teste


assintótica Z; o respetivo asymp. p-value.

Decisão: Com p-value 0.078>0.05, concluímos que não há evidência


estatística para rejeitar a hipótese nula que o valor mediano é de 3.3.

15

Você também pode gostar