Você está na página 1de 28

Análise Exploratória de Dados

Testes paramétricos e Testes não paramétricos


Pressupostos subjacentes à utilização dos testes
paramétricos
Utilização de testes não paramétricos
Metodologia de Investigação Quantitativa

Ricardo Pinto e Joana Cabral


Estatística exploratória

• Conjunto de análises que permite conhecer as características da


distribuição dos dados (para variáveis intervalares)
• A distribuição é normal? Qual o grau e natureza do desvio à
normalidade?
• Existem outliers ou casos extremos?

2
Estatística exploratória
Alguns conceitos
Medidas de assimetria e achatamento - caracterizam a forma da
distribuição comparativamente com a forma da distribuição
normal.
Homogeneidade das variâncias – em que medida as variâncias
de dois (ou mais) grupos ou de duas variáveis são equivalentes.
Outlier – observação ou caso cujo resultado se desvia
marcadamente dos restantes valores da amostra e que poderá
(ou não) comprometer alguns testes estatísticos e a sua
interpretação.

3
Testes paramétricos e não paramétricos
Alguns conceitos
Testes paramétricos:
testes baseados na comparação de médias e variâncias e nas
características populacionais, pelo que dependem da observância de
determinados pressupostos. De uma forma geral, são mais informativos
e mais potentes (maior probabilidade de rejeitar a H0, mas
consequentemente mais sujeitos ao erro tipo I).
Testes não paramétricos:
não exigem o cumprimento dos pressupostos da normalidade e
homogeneidade das variâncias (não utilizam médias e desvio padrão)
não exigem a utilização de variáveis dependentes intervalares (e.g.,
variáveis ordinais);
são também utilizados quando as amostras são de tamanho reduzido.

4
Testes paramétricos e não paramétricos

Testes paramétricos – pressupostos a verificar:


• Natureza intervalar das variáveis (particularmente da
VD)
• Normalidade das distribuições
• Homogeneidade das variâncias
Nota: estes são os principais. Em função de cada testes
poderão haver pressupostos mais específicos.

5
Testes paramétricos e pressupostos
Testes paramétricos
Utilizam a média, variância e o desvio padrão
Pressuposto da normalidade da distribuição

6
Testes paramétricos e pressupostos

Normalidade da distribuição (de uma variável intervalar)


Assimetria
• Grau em que os dados se distribuem equilibradamente acima e/ou abaixo da medida de de
tendência central
Valores = 0 - distribuição da variável simétrica (curva normal “perfeita”)
Valores < 0 – desvios verificam-se, principalmente, no sentido dos valores inferiores à medida –
assimetria à esquerda
Valores > 0 – desvios verificam-se, principalmente, no sentido dos valores superiores à média –
assimetria à direita

7
Testes paramétricos e pressupostos
Normalidade da distribuição (de uma variável intervalar)
Curtose
• Grau de achatamento de uma distribuição ou, por outras palavras, a forma como os valores se
concentram em torno da média.
Valor = 0 - o achatamento (ou altura do pico...da curva) aproxima-se da forma da distribuição
“normal”
Valor > 0 - forte concentração das pontuações em torno da média
Valor < 0 – baixa concentração dos valores em torno da média, verificando uma distribuição mais
dispersa

8
Testes paramétricos e pressupostos

Normalidade da distribuição (de uma variável


intervalar)
Curtose

9
Testes paramétricos e pressupostos

Normalidade da distribuição (de uma variável intervalar)


• Desvio padrão também influencia a distribuição...
Desvio Padrão baixo (próximo de 0) - a maioria dos valores estão mais
próximos da média, havendo melhor representação do fenómeno em
estudo
Desvio Padrão elevado (distante de 0) - os valores encontram-se mais
afastados da média e descrevem uma curva mais achatada

10
Testes paramétricos e pressupostos

Normalidade da distribuição e os critérios da Curtose e


Assimetria
• As Distribuições Normais “ perfeitas ” são raras,
principalmente nas ciências sociais e humanas...
... pelo que se aceita a distribuição como suficientemente
próxima da normalidade, desde que os coeficientes de
assimetria e de curtose se posicionem entre
-1 e +1
Valores toleráveis:
• Valores absolutos de curtose superiores a 10 e de assimetria superiores a 3
são considerados indicadores de violação extrema da normalidade.
• Alguns autores referem que, regra geral alguns testes paramétricos (t-student e
Anova) são robustos à não normalidade da distribuição, desde que não
ultrapassados os valores acima referidos (i.e., se Sk < 3 e Ku < 10 (ver Maroco,
2011 p. 189)
11
Análise exploratória – teste
pressupostos
Teste da normalidade da distribuição
Exemplo: variável “qualidade do laço emocional”

12
Análise exploratória – teste pressupostos

Teste da normalidade da distribuição


Exemplo: variável “qualidade do laço emocional”

13
Análise exploratória – teste
pressupostos
Teste da normalidade da distribuição
Exemplo: variável “qualidade do laço emocional”

14
Análise exploratória – teste pressupostos
Teste da normalidade da distribuição
Exemplo: variável “qualidade do laço emocional”

15
Análise exploratória – teste
pressupostos
Teste da normalidade da distribuição
Exemplo: variável “qualidade do laço emocional”

Descriptives
1º indicador de Statistic Std. Error

que não existe Mean


95% Confidence Lower Bound
5,2358
5,1610
,03806

normalidade de Interval for Mean Upper Bound 5,3107


5% Trimmed Mean 5,3020
distribuição desta Median 5,4000

variável Variance
Qualidade do Laço Emocional Pais Std. Deviation
,461
,67872
Minimum 1,70
Maximum 6,00
Range 4,30
Interquartile Range ,83
Skewness -4,514 3,137
Kurtosis 11,143 5,273

16
Análise exploratória – teste
pressupostos
Teste da normalidade da distribuição
Exemplo: variável “qualidade do laço emocional”
Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

Qualidade do Laço
,130 318 ,000 ,875 318 ,000
Emocional PM

a. Lilliefors Significance Correction

2º indicador de que não existe normalidade de distribuição:


H0: A distribuição da variável é aproximadamente normal.
Os testes rejeitaram a Hipótese nula (p < .05)
Podemos concluir que a variável não segue uma distribuição normal

Nota: Kolmogorov Smirnoff é mais apropriado para amostras acima de 50 sujeitos e o


17
Shapiro Wilk para amostras abaixo de 50 sujeitos
Análise exploratória – teste
pressupostos
Teste da normalidade da distribuição
Exemplo: variável “qualidade do laço emocional”

Normal Q-Q Plot –


quanto mais próximos
os valores estiberem da
linha recta mais
próxima a distribuição
está da normalidade.

Neste caso verificam-se


vários desvios à recta…

18
Análise exploratória – teste
pressupostos
Teste da normalidade da distribuição
Exemplo: variável “qualidade do laço emocional”
Valor máximo
Gráfico “Caixa de Bigodes”-
Quanto mais simétrico for
este gráfico, tomando como
referência o valor da
mediana
(linha carregada que aparece
dentro da caixa), maior a
probabilidade da
distribuição dos valores da Outliers
variável seguir uma
distribuição normal
 Neste caso vemos uma
caixa de bigodes com uma Valor mínimo
assimetria acentuada...

19
Testes paramétricos e pressupostos

Além dos pressupostos da natureza intervalar da(s)


variável(eis) e da normalidade da distribuição...

... a utilização dos testes paramétricos pressupõe ainda a


Homogeneidade das variâncias
Pressuposto postula que as variâncias dos grupos em
comparação devem ser similares e aplica-se, particularmente,
quando estamos na presença de testes de diferenças inter-
sujeitos (e.g., testar de estudantes deslocados diferem dos não
deslocados nos níveis de adaptação pessoal-emocional).

20
Análise exploratória – teste
pressupostos
Teste da homogeneidade das variâncias
Exemplo: variável “qualidade do laço emocional” e sexo (2 grupos)

21
Análise exploratória – teste
pressupostos
Teste da homogeneidade das variâncias
Exemplo: variável “qualidade do laço emocional” e sexo (2 grupos)

Levene Test

22
Análise exploratória – teste
pressupostos
Teste da homogeneidade das variâncias
Exemplo: variável “qualidade do laço emocional” e sexo (2 grupos)

23
Análise exploratória – teste
pressupostos
Teste da homogeneidade das variâncias
Exemplo: variável “qualidade do laço emocional” e sexo (2 grupos)

Test of Homogeneity of Variance

Levene Statistic df1 df2 Sig.

Based on Mean 1,555 1 316 ,213

Based on Median ,733 1 316 ,393


Qualidade do Laço
Based on Median and with
Emocional PM ,733 1 304,197 ,393
adjusted df

Based on trimmed mean 1,139 1 316 ,287

H0: Há homogeneidade de variâncias


Testes de Levene apontam para a retenção da hipótese nula (p > .05)

Podemos concluir que há homogeneidade das variâncias

24
Análise exploratória – teste
pressupostos: VI - 2 grupos (sexo)
Teste da normalidade das distribuições
Exemplo: variável “qualidade do laço emocional” e sexo (2 grupos)
Habitualmente testa-se também a normalidade da distribuição em cada um dos
grupos

Tests of Normality
a
Sexo Kolmogorov-Smirnov Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

Qualidade do Laço masculino ,107 107 ,004 ,890 107 ,000


Emocional PM feminino ,141 211 ,000 ,864 211 ,000

a. Lilliefors Significance Correction

H0: A distribuição da variável é aproximadamente normal.


Os testes rejeitaram a Hipótese nula (p < .05)

Podemos concluir que a variável não segue uma distribuição normal para os
dois grupos (sexo masculino e feminino) 25
Soluções para a violação dos pressupostos

A. Recurso às alternativas não paramétricas


B. Uso das estatísticas mais robustas dentro dos testes
paramétricos
C. Eliminação de Outliers
 Alguns autores reconhecem que o recurso à transformação de
variáveis é controverso, tendendo a concordar que os seus custos não
compensam as suas vantagens (ver Field, 2009, pp.155-156), ainda
que outros considerem esta como uma opção adequada (ver Marôco,
2011 p. 302).

26
Soluções para a violação dos pressupostos

A. Recurso aos testes/alternativas não paramétricas


• Não exigem normalidade de distribuição e homogeneidade das
variâncias
• Baseiam-se na ordenação (rank) dos valores dos indivíduos, sendo as
análises realizadas sobre estes ranks e não sobre valores efetivos e/ou
originais. Isto permite contornar os problemas decorrentes da violação
dos pressupostos (Field, 2011; Martins, 2011).

Exemplo:

27
Redação dos resultados

No caso da utilização dos testes não-paramétricos, no


momento da redação dos resultados, podem relatar-se
os resultados dos testes paramétricos, (APENAS) se
estes coincidirem com os dos não paramétricos;

Em qualquer dos casos, devem ser relatadas todas as


decisões tomadas e devidamente fundamentadas!

28

Você também pode gostar