Você está na página 1de 20

NORMALIDADE

DA DISTRIBUIO
Existem vrios mtodos para verificao da condio
de normalidade nos dados sob anlise:
Grfico de Probabilidade Normal
Mtodo dos Momentos
Teste W - Shapiro-Wilk
Teste Kolmogorov-Smirnov
Teste de Aderncia X
2
Teste de Aderncia X
2
ONDE:
X
2
= CHI-QUADRADO
O = VALORES OBSERVADOS
E = VALORES ESPERADOS
2
2
) 0 (
E
E
X

=
Etapas do clculo de X
2
1. Transformar os valores observados (x)
em valores de z
s
x x
Z
m i
) (
=
Etapas do clculo de X
2
2. Agrupar os dados padronizados em classes
de freqncia, de modo que todas as
classes geradas tenham freqncia de
ocorrncia maior que 5
20 -1 - 0
6 < -1
FREQUNCIA CLASSES
Etapas do clculo de X
2
3. Calcular a probabilidade de ocorrer o valor z e a
freqncia esperada supondo a distribuio normal
17.07 0.34 20 -1 a 0
...
6
FREQ.OBS
(O)
...
0.16
PROBAB. Z
... ...
7.93 < -1
FREQ.ESP
E
CLASSES
Etapas do clculo de X
2
3. Calcular o valor de X
2
da distribuio analisada e o
valor de X
2
da Tabela fornecida (valor terico)
A CONDIO DE NORMALIDADE ACEITA SE O X
2
ENCONTRADO FOR MENOR QUE O X
2
TABELADO
X
2
tabelado = 3,841 (para gl = 1 e alpha = 0,05)
...
07 . 17
) 07 . 17 20 (
93 . 7
) 93 . 7 6 ( ) 0 (
2 2 2
2

+

=
E
E
X
Teste de Shapiro-Wilk W
O teste de Shapiro-Wilk W tem sido o mais utilizado
para testar a normalidade
Se o valor calculado de W estatisticamente
significativo (para p = 0,05) rejeita-se a hiptese que a
distribuio estudada normal
Ou seja:
Para a Distribuio ser considerada
Normal
Normal o valor de p
deve ser maior que 0,05
Histogram: NORMAL 1
Shapiro-Wilk W=,98455, p=,75196
Expected Normal
2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0
X <= Category Boundary
0
2
4
6
8
10
12
14
N
o
.

o
f

o
b
s
.
DISTRIBUIO NORMAL
Histogram: POISSON 1
Shapiro-Wilk W=,87283, p=,00007
Expected Normal
0 2 4 6 8 10
X <= Category Boundary
0
5
10
15
20
25
N
o
.

o
f

o
b
s
.
DISTRIBUIO NO NORMAL
Teste de Kolmogorov-Smirnov
O teste de Kolmogorov-Smirnov baseia-se na mxima
diferena entre a distribuio acumulada da amostra e
distribuio acumulada esperada.
Se o valor calculado de D estatisticamente significativo
(para p = 0,05) rejeita-se a hiptese que a distribuio
estudada normal
Ou seja:
Para a Distribuio ser considerada
Normal
Normal o valor de p
deve ser maior que 0,05
Quando a mdia e o desvio padro da distribuio
esperada (hipottica) no conhecido, os valores de
probabilidades de Lilliefors devem ser usados.
Histogram: NORMAL 1
K-S d=,04543, p> .20; Lilliefors p> .20
Expected Normal
2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0
X <= Category Boundary
0
2
4
6
8
10
12
14
N
o
.

o
f

o
b
s
.
DISTRIBUIO NORMAL
Histogram: POISSON 1
K-S d=,18430, p<,10 ; Lilliefors p<,01
Expected Normal
0 2 4 6 8 10
X <= Category Boundary
0
5
10
15
20
25
N
o
.

o
f

o
b
s
.
DISTRIBUIO NO NORMAL
TRANSFORMAO DE DADOS:
PADRONIZAO
&
NORMALIZAO
PADRONIZAO
Recurso utilizado quando se deseja comparar
a distribuio de variveis:
centralizao: y = y - y
medio
transformao z: (y - y
mdio
)/s
(para unidades diferentes)
NORMALIZAO: ajuste a distribuio normal
Recurso utilizado quando a distribuio dos
dados originais apresenta-se:
No normal
Heterocedastica (varincias diferentes entre
amostras de uma mesma populao)
Logartmica:
x = log (x) ou x = ln (x)
no caso de existirem valores zero na distribuio pode se adotar:
x = log (x + 1) ou ln (x + 1)
Utilizada principalmente quando ocorre:
Assimetria positiva
Heterocedasticidade
Coeficiente de Variao constante (o desvio padro
aumenta proporcionalmente ao aumento da mdia)
Exemplo de Normalizao
Raiz Quadrada:
x = RAIZ Q (x)
no caso de existirem valores zero na distribuio pode se adotar:
x = RAIZ (x + 0.5)
Utilizada principalmente quando:
As varincias aumentam proporcionalmente ao
aumento da mdia
Exemplo de Normalizao
Arco seno:
p = arcsen (raiz p)
Utilizada principalmente quando:
Os dados so expressos em porcentagens ou razes entre 0 e 1.
Ou seja, quando so afetados pelo fechamento da somatria
(quando o aumento de uma varivel implica necessariamente na
reduo de outra)
OBS: no Excel esta transformao dada em radianos e para retornar a graus
necessrio multiplicar o resultado por (180/pi)
1 radiano = 57,296
Exemplo de Normalizao
Razo Logartmica (Logratio):
X = log (x /Mg)
Mg= mdia geomtrica da distribuio = Soma (log x/n)
Utilizada principalmente quando:
Os dados so expressos em porcentagens ou razes entre
0 e 1.
OBS: no MVSP os valores zero so automaticamente transformados em
valores muito baixos e todos os demais valores reajustados para que a
somatria seja igual a 1
Exemplo de Normalizao

Você também pode gostar