Escolar Documentos
Profissional Documentos
Cultura Documentos
Qui-quadrado
Shapiro-Wilk
Levene
N.Sousa, ESAC (c) 24-Nov-09
DEFINIÇÃO
Num teste paramétrico,
A população tem uma forma específica conhecida
(normal, binomial, etc.)
O teste incide sobre um parâmetro da população
(média, variância, desvio-padrão, etc.)
Teste não-paramétrico é todo o teste de hipótese
em que pelo menos uma das condições acima é
violada.
P.ex. o teste incide sobre um parâmetro, mas a forma
da população é desconhecida
O teste não incide sobre um parâmetro, mas sim sobre
a forma da distribuição
2
N.Sousa, ESAC (c) 24-Nov-09
CONTEXTO
Existem muitos testes NP na literatura (para uma lista, ver
p.ex. http://en.wikipedia.org/wiki/Non-parametric_statistics)
Estudaremos apenas alguns testes, que serão
mais tarde úteis para validar os pressupostos da
ANOVA. São eles:
Testes de ajustamento
Qui-quadrado
Shapiro-Wilk
3
N.Sousa, ESAC (c) 24-Nov-09
TESTE DO QUI-QUADRADO
É um teste de ajustamento. Ou seja, verifica se os
dados de uma amostra são compatíveis com uma
distribuição hipotética
As hipóteses em jogo são:
H0: a população possui a distribuição de probabilidade D
vs
H1: a população não possui tal distribuição
Pode ser usado com qualquer população, contínua ou
discreta
Requerimentos:
n > 30 observações
Frequência esperada em cada categoria/classe não inferior
a 5 (ver próximo slide). Se necessário, agregar cat./classes.
4
N.Sousa, ESAC (c) 24-Nov-09
EXEMPLO
À data de 14-Nov-08, o histórico de 189 jogos Benfica-Sporting era:
(dados de www.zerozero.pt, jogo resolvido a penalties conta como empate)
Benfica 85, empate 39, Sporting 65
TESTE: H0: distribuição 1X2 é uniforme (p
(p1X2 = 1/3)
1/3) (distribuição dada)
dada)
vs H1: as flutuações são demasiado grandes para isso
CONSIDERAÇÕES FINAIS
O teste qui-quadrado pode ainda ser usado, embora com
menos confiança, se houver até 20% das categorias/classes
com frequência esperada menor que 5.
Se houver mais do que 20% cat/classes com frequência
esperada menor que 5, devem-se agregar algumas dessas
cat/classes. Agregar é juntar várias cat/classes numa só, e
recalcular as frequências observadas e esperadas.
Vantagens do teste do qui-quadrado:
Pode-se fazer com qualquer tipo de população
Permite que parâmetros desconhecidos dessa população sejam
estimados. Essa estimação pode ser necessária para calcular as
frequências esperadas.
Desvantagens do teste:
É pouco potente. Por vezes, não se rejeita H0 quando o devíamos
fazer
Necessita de um número considerável de observações
7
N.Sousa, ESAC (c) 24-Nov-09
TESTE DE SHAPIRO-WILK
Quando se pretende o ajustamento apenas a uma
normal, uma alternativa ao qui-quadrado é o teste de
Shapiro-Wilk
O teste de Shapiro-Wilk é o mais potente em condições
gerais e pode ser usado mesmo quando o n.º de
observações n é pequeno
Não necessita que haja agrupamento de dados
Hipóteses em jogo:
H0: a amostra provém de uma população normal
H1: a amostra não provém de uma pop. Normal
O teste é unilateral ESQUERDO. Rejeita-se H0 quando
ETobs < ETcrítica
8
N.Sousa, ESAC (c) 24-Nov-09
EXEMPLO
Seguirão as observações 10, 15, 15, 20, 25 uma
distribuição normal, a 5% de significância?
1. Amostra já está ordenada
2. Variabilidade e parâmetro b:
∑i i
( x − x )2
= (10 − 17)2
+ (15 − 17)2
+ ⋯ + (25 − 17)2
= 130
b = 0,6646 × (25 − 10) + 0,2413 × (20 − 15) = 11,1755
3. Estatística de teste: Wobs = 11,17552 / 130 ≈ 0,961
Decisão: Wobs > Wcrítico (α = 5%) = 0,762
Não rejeitar H0. É plausível que as observações
provenham de uma população normal
10
N.Sousa, ESAC (c) 24-Nov-09
TESTE DE LEVENE
Este teste é usado quando há várias amostras, e
verifica se é plausível que as ditas amostras tenham, ou
não, todas a mesma variância.
Exemplo:
Amostra 1: (1,3,4,5,6,6) s12 = 3,77
Amostra 2: (1,4,4,5,6,7) s22 = 4,3
Amostra 3: (1,2,2,4,5,6) s32 = 3,87
Serão as diferenças estatisticamente compatíveis com
H0: σ12 = σ22 = σ32 ou não (H1)?
A elaboração e execução deste teste é uma ANOVA, pelo
que será descrita na apresentação respetiva.
11