Você está na página 1de 16

Introdução

aos
Testes de Ajustamento
e
Q-Q Plots

DMat-UA; Versão 2

1 / 16
Testes de ajustamento: objectivos

Averiguar se determinada amostra provém de uma população com uma


determinada distribuição ou, por exemplo, se duas amostras são oriundas
de uma mesma população.

Testes de ajustamento comummente utilizados na literatura:

teste do Qui-Quadrado;
teste de Kolmogorov-Smirnov;
teste de Kolmogorov-Smirnov com correcção de Lilliefors;
teste de Shapiro-Wilk.

Nota importante:
atendendo às suas fragilidades, por prudência, a implementação destes
testes deverá ser acompanhada de outras análises estatísticas.

2 / 16
Teste do Qui-Quadrado
Este teste é válido para qualquer distribuição. Está mais indicado para
variáveis discretas, mas também pode ser aplicado a variáveis contínuas.

H0 : X ∼ F0 vs. H1 : X ∼ outra distribuição.


Procedimento:

1. Organizam-se as n observações da amostra em k classes e calculam-se


as frequências observadas, ni . De notar que
as classes não se podem intersectar e devem percorrer todo o suporte
da variável aleatória X;
devem construir-se classes com frequências esperadas iguais ou
semelhantes;
no caso discreto, as classes podem ser identificadas com os valores
possíveis da variável X;
o número de classes deve ser o maior possível, evitando, no entanto,
classes com frequências observadas inferiores a 5.

3 / 16
Teste do Qui-Quadrado

2. Calculam-se as frequências esperadas das classes, npi , de acordo com


F0 . Se a distribuição incluir um número p ∈ N de parâmetros desconhecidos,
estes serão estimados com a informação da amostra.

3. Utiliza-se a estatística de teste


k
(ni − npi )2 2
T=∑ ∼ χk−p−1
i=1 npi

(distribuição assimptótica).

4. Ao nível de significância α, rejeita-se H0 para valores elevados de T,


2
nomeadamente para T > χ1−α,k−p−1 .

4 / 16
Teste do Qui-Quadrado
Para executar o procedimento do teste no SPSS, de uma forma
(relativamente) expedita, sugere-se a utilização de

Transform/Recode into Different Variables/...


Transform/Compute Variable/...
Analyze/Nonparametric Tests/Legacy Dialogs/Chi-square Test/...

(Em alguns casos, todo o procedimento pode ser executado nesta última sequência.)

5 / 16
Teste de Kolmogorov-Smirnov (uma amostra)
Pressuposto do teste:
a amostra provém de uma distribuição contínua.
(Mas existem adaptações a algumas distribuições discretas. . . )

H0 : F(x) = F0 (x), para todo o x vs. H1 : F(x) 6= F0 (x), para algum x.

A estatística de teste é
D = sup |Fn (x) − F(x)|,
x∈R

e a região crítica, ao nível de significância α, é dada por

RCα = {d : d > cα },

onde os valores críticos, cα , se encontram tabelados; e.g., tabelas em


Guimarães e Cabral (2007), p. 421.

6 / 16
Teste de Kolmogorov-Smirnov (uma amostra)
Analyze/Nonparametric Tests/Legacy Dialogs/1-Sample K-S/...

Distribuições disponíveis no SPSS: Normal, Uniforme, Exponencial e Poisson.

(Resultado do teste de Kolmogorov-Smirnov para o mesmo problema anterior.)

Frequentemente, perante amostras de pequena dimensão, este teste não


rejeita, indevidamente, a hipótese nula e, perante amostras de grande
dimensão, rejeita, indevidamente, a hipótese nula.

7 / 16
Teste de Kolmogorov-Smirnov (duas amostras)
Pressuposto do teste:
amostras independentes provenientes de distribuições contínuas.

H0 : FX (x) = FY (x), para todo o x vs. H1 : FX (x) 6= FY (x), para algum x.

A estatística de teste é

D = max|FX,n (x) − FY,m (x)|,


x∈R

e a região crítica, ao nível de significância α, é dada por

RCα = {d : d ≥ cα },

onde os pontos críticos, cα , se encontram tabelados; e.g., tabelas em


Guimarães e Cabral (2007), pp. 423–425.

Analyze/Nonparametric Tests/Legacy Dialogs/2 Independent Samples/...

8 / 16
Testes de ajustamento específicos
Averiguar se determinada amostra provém de uma população modelada
por uma distribuição Normal.

Teste de Kolmogorov-Smirnov com correcção de Lilliefors


(amostras grandes; o que é uma “amostra grande”?);
Teste de Shapiro-Wilk
(amostras pequenas).

Analyze/Descriptive Statistics/Explore/.../Normality plots with tests

Nota: atenção às possíveis fragilidades destes testes. Como já referido, em


inúmeras situações, a análise destes testes deverá ser acompanhada de
outras análises estatísticas que ajudem a comprovar as suas indicações.

9 / 16
Teste de Shapiro-Wilk

H0 : F(x) = N(µ, σ 2 ) vs. H1 : F(x) 6= N(µ, σ 2 ).

A estatística de teste é
" #2
h
1
W= 2
nS ∑ aj,n (X(n−j+1) − X(j) ) ,
j=1

onde
n
nS2 = ∑ (Xi − X̄)2
i=1
e
n

2, n é par
h= n−1
2 , n é ímpar.
Os valores de aj,n encontram-se tabelados.

Rejeita-se a hipótese nula para valores reduzidos da estatística de teste.

10 / 16
Q-Q Plot

11 / 16
Q-Q Plot

Analyze/Descriptive Statistics/Q-Q Plots/...

12 / 16
Confronto de diferente informação

13 / 16
Confronto de diferente informação

14 / 16
MATLAB e R

Em MATLAB, por exemplo, consultar a documentação:

Q-Q Plots
>> doc qqplot

Alguns testes de ajustamento


>> doc lillietest
>> doc adtest (Teste de Anderson-Darling)
>> doc kstest
>> doc jbtest (Teste de Jarque-Bera)

Em R, por exemplo, consultar a documentação:

> help(qqnorm) e, adicionalmente, > help(qqline)


> help(shapiro.test)
> help(ks.test)

15 / 16
Alguma bibliografia
Anderson, T. W. e Darling, D. A. (1952). Asymptotic Theory of Certain “Goodness of Fit” Criteria
Based on Stochastic Processes. The Annals of Mathematical Statistics, 23(2), pp. 193–212.

Greenwood, P. E. e Nikulin, M. S. (1996). A Guide to Chi-Squared Testing. New York, Wiley.

Guimarães, R. e Sarsfield Cabral, J. (2007). Estatística. Lisboa, McGraw-Hill.

Hall, A., Neves, C. e Pereira, A. (2011). Grande Maratona de Estatística no SPSS. Lisboa,
Escolar Editora.

Jarque, C. M. e Bera, A. K. (1987). A Test for Normality of Observations and Regression


Residuals. International Statistical Review, 55(2), pp. 163–172.

Lilliefors, H. W. (1967). On the Kolmogorov-Smirnov test for normality with mean and variance
unknown. Journal of the American Statistical Association, 62, pp. 399–402.

Massey, F. J. (1951). The Kolmogorov-Smirnov Test for Goodness of Fit. Journal of the American
Statistical Association, 46(253), pp. 68–78.

Shapiro, S. S. e Wilk, M. B. (1965). An analysis of variance test for normality (complete


samples). Biometrika, 52(3-4), pp. 591–611.

16 / 16

Você também pode gostar