Você está na página 1de 8

Testes de normalidade e transformações

para conseguir a normalidade dos dados

Amanda Magalhães Contin


Prof. Björn Gücker
Métodos em Estatística Aplicada
Distribuição normal

● Simétrica e continua
● É descrita por dois parâmetros: a média (μ) e o desvio
padrão (σ)
● Distribuição gaussiana

Distribuição normal (forma de sino). Fonte: Dytham, 2011


Testes de normalidade

● Para descobrir se os dados apresentam uma distribuição


normal, usa-se testes como Kolmogorov-Smirnov/Lilliefors e
Shapiro-Wilk
● Os testes respondem se os dados diferem ou não de uma
distribuição normal
– p>0.05 não diferem (apresentam distribuição normal- H0)
– p<0.05 diferem (não apresentam distribuição normal- H1)
● Se os dados forem normais, pode-se usar testes
paramétricos (Tukey, Teste T, ANOVA)
Teste Kolmogorov-Smirnov

● Teste não-paramétrico
● n> 30
● Uniamostral: compara uma amostra com uma distribuição
referência
● Biamostral: compara duas amostras entre si
● Normalidade – testa os dados com uma distribuição
normal que tenha a média e a variância iguais a da
amostra
● Pode ser usado para qualquer distribuição contínua
Teste Shapiro-Wilk

● Teste não-paramétrico
● Avalia apenas a normalidade
● H0: a variável aleatória segue uma distribuição normal
● n < 30
E quando a distribuição não é normal?

● p<0.05 (dados não-


paramétricos)
● Transformação dos
dados
● Uso de logaritmo,
raízes quadrada,
cubica ou quarta, arco
seno da raiz quadrada
Transformação dos dados

● Uso da raiz quarta – dados de abundância em ecologia

Distribuição de lapas em Point Nepean (Victoria - AUS)


(a) não transformado, (b) transformação por raiz quadrada e
(c) Transformação por quarta raiz. (Quinn & Keough, 2002)
Transformação dos dados

● Função senoidal inversa – usada quando os dados estão


em porcentagem ou proporção

Distribuição da porcentagem coberta pela alga Hormosira banksii em


quadrados em Point Nepean: (a) não transformado e (b)
transformação por arcsin. (Quinn & Keough, 2002).