Você está na página 1de 11

TESTES NÃO-PARAMÉTRICOS

Qui-quadrado
Shapiro-Wilk
Levene
N.Sousa, ESAC (c) 24-Nov-09

DEFINIÇÃO
 Num teste paramétrico,
 A população tem uma forma específica conhecida
(normal, binomial, etc.)
 O teste incide sobre um parâmetro da população
(média, variância, desvio-padrão, etc.)
 Teste não-paramétrico é todo o teste de hipótese
em que pelo menos uma das condições acima é
violada.
 P.ex. o teste incide sobre um parâmetro, mas a forma
da população é desconhecida
 O teste não incide sobre um parâmetro, mas sim sobre
a forma da distribuição

2
N.Sousa, ESAC (c) 24-Nov-09

CONTEXTO
 Existem muitos testes NP na literatura (para uma lista, ver
p.ex. http://en.wikipedia.org/wiki/Non-parametric_statistics)
 Estudaremos apenas alguns testes, que serão
mais tarde úteis para validar os pressupostos da
ANOVA. São eles:
 Testes de ajustamento
 Qui-quadrado
 Shapiro-Wilk

 Testes de homogeneidade da variância


 Levene

3
N.Sousa, ESAC (c) 24-Nov-09

TESTE DO QUI-QUADRADO
 É um teste de ajustamento. Ou seja, verifica se os
dados de uma amostra são compatíveis com uma
distribuição hipotética
 As hipóteses em jogo são:
H0: a população possui a distribuição de probabilidade D
vs
H1: a população não possui tal distribuição
 Pode ser usado com qualquer população, contínua ou
discreta
 Requerimentos:
 n > 30 observações
 Frequência esperada em cada categoria/classe não inferior
a 5 (ver próximo slide). Se necessário, agregar cat./classes.
4
N.Sousa, ESAC (c) 24-Nov-09

PROCEDIMENTO DO TESTE QUI-QUADRADO


1. Agrupar as n observações da amostra
 em k categorias (dados discretos) ou
 em k classes (dados contínuos)
Designamos as frequências observadas por nobs,i
No caso de classes, a sua construção é algo arbitrária. Usar senso comum.
2. Calcular frequências esperadas, ne,i
 São as frequências que esperaríamos se H0 fosse verdadeiro e
que vamos comparar com as observadas. ne,i = n pi, com pi a
probabilidade de uma observação cair na categoria/classe i.
3. Calcular a ET e decidir
k
(nobs,i − ne,i )2
 ET: Q = ∑ ~> χ k2−1−R (teste unilateral direito)
i =1 ne,i
 R : n.º de parâmetros da distribuição D estimados a partir da
amostra (R = 0 se a comparação for com uma distribuição dada)
5
N.Sousa, ESAC (c) 24-Nov-09

EXEMPLO
 À data de 14-Nov-08, o histórico de 189 jogos Benfica-Sporting era:
(dados de www.zerozero.pt, jogo resolvido a penalties conta como empate)
 Benfica 85, empate 39, Sporting 65
TESTE: H0: distribuição 1X2 é uniforme (p
(p1X2 = 1/3)
1/3) (distribuição dada)
dada)
vs H1: as flutuações são demasiado grandes para isso

Categoria Nobs Ne (Nobs-Ne)2/Ne


Vitória Benfica 85 63 7,6825
Empate 39 63 9,1428
Vitória Sporting 65 63 0,0635
Σ = Q = 16,889
 ET: Q = 16,889 ~ > χ 32−1− 0 = χ 22
 Valor de prova: menor que 0,5% (tabela T6). Excel: ≈ 0,0215%.
 Interpretação: a probabilidade dos desvios à distribuição uniforme
serem os observados ou mais extremos que isso é de 0,0215%. É
fortíssima a evidência estatística de que a distribuição não é
uniforme
6
N.Sousa, ESAC (c) 24-Nov-09

CONSIDERAÇÕES FINAIS
 O teste qui-quadrado pode ainda ser usado, embora com
menos confiança, se houver até 20% das categorias/classes
com frequência esperada menor que 5.
 Se houver mais do que 20% cat/classes com frequência
esperada menor que 5, devem-se agregar algumas dessas
cat/classes. Agregar é juntar várias cat/classes numa só, e
recalcular as frequências observadas e esperadas.
 Vantagens do teste do qui-quadrado:
 Pode-se fazer com qualquer tipo de população
 Permite que parâmetros desconhecidos dessa população sejam
estimados. Essa estimação pode ser necessária para calcular as
frequências esperadas.
 Desvantagens do teste:
 É pouco potente. Por vezes, não se rejeita H0 quando o devíamos
fazer
 Necessita de um número considerável de observações
7
N.Sousa, ESAC (c) 24-Nov-09

TESTE DE SHAPIRO-WILK
 Quando se pretende o ajustamento apenas a uma
normal, uma alternativa ao qui-quadrado é o teste de
Shapiro-Wilk
 O teste de Shapiro-Wilk é o mais potente em condições
gerais e pode ser usado mesmo quando o n.º de
observações n é pequeno
 Não necessita que haja agrupamento de dados
 Hipóteses em jogo:
 H0: a amostra provém de uma população normal
 H1: a amostra não provém de uma pop. Normal
 O teste é unilateral ESQUERDO. Rejeita-se H0 quando
ETobs < ETcrítica

8
N.Sousa, ESAC (c) 24-Nov-09

ELABORAÇÃO DO TESTE SHAPIRO-WILK


1. Ordenar as n observações xi da amostra
2. Calcular a variabilidade da amostra e o parâmetro b
n n
variabil. = ∑ ( xi − x )2 = ( ∑ xi2 ) − nx 2
i =1 i =1
n/2
b = ∑ ai ( xn − i +1 − xi )
i =1
 ai : coeficiente de Shapiro-Wilk (tabela T8)
 Se n impar: ignorar observação mediana
3. Calcular a estatística de teste W e decidir (quantis W: T8)
n
Wobs = b / ∑ i =1 ( xi − x )2 ~ > W
2

Rejeitar H0: a amostra provém de uma população


normal, se Wobs < Wcrítico à significância escolhida
9
N.Sousa, ESAC (c) 24-Nov-09

EXEMPLO
 Seguirão as observações 10, 15, 15, 20, 25 uma
distribuição normal, a 5% de significância?
1. Amostra já está ordenada
2. Variabilidade e parâmetro b:
∑i i
( x − x )2
= (10 − 17)2
+ (15 − 17)2
+ ⋯ + (25 − 17)2
= 130
b = 0,6646 × (25 − 10) + 0,2413 × (20 − 15) = 11,1755
3. Estatística de teste: Wobs = 11,17552 / 130 ≈ 0,961
Decisão: Wobs > Wcrítico (α = 5%) = 0,762
Não rejeitar H0. É plausível que as observações
provenham de uma população normal
10
N.Sousa, ESAC (c) 24-Nov-09

TESTE DE LEVENE
 Este teste é usado quando há várias amostras, e
verifica se é plausível que as ditas amostras tenham, ou
não, todas a mesma variância.
 Exemplo:
 Amostra 1: (1,3,4,5,6,6) s12 = 3,77
 Amostra 2: (1,4,4,5,6,7) s22 = 4,3
 Amostra 3: (1,2,2,4,5,6) s32 = 3,87
 Serão as diferenças estatisticamente compatíveis com
H0: σ12 = σ22 = σ32 ou não (H1)?
 A elaboração e execução deste teste é uma ANOVA, pelo
que será descrita na apresentação respetiva.

11

Você também pode gostar