Escolar Documentos
Profissional Documentos
Cultura Documentos
Exemplo
Coeficiente de correlação
Testes de significância
Questões
Duas variáveis estão relacionadas entre
si?
Será que uma aumenta quando a outra
aumenta?
p. e. competências e salários
Será que uma decresce quando a outra
aumenta?
p. e. problemas de saúde e nutrição
Como podemos obter uma medida
numérica do grau de inter-relação?
Diagramas de dispersão
20
Número médio de bebidas alcoolicas por semana
18
16
14
12
10
0
0 5 10 15 20 25
100
90
80
70
Resultados nos Exames
60
50
40
30
20
10
0
0 2 4 6 8 10 12 14 16 18
melhor leitura
{X = 6, Y = 11}
O que mostra o Scatterplot?
( X X )(Y Y )
Cov XY
N 1
Como funciona e porquê?
Quando poderá a covXY ser grande e
( X X )(Y Y ) 222.44
Covcig .& DAC 11.12
N 1 21 1
Mas afinal o que é uma covariância?
Pensei que estávamos a falar de
correlação…(?)
Coeficiente de Correlação
Correlação do (momento do produto) de
Pearson
Simbolizado por r
Covariância ÷ (produto dos dois DPs)
Cov XY
r
s X sY
Correlação é uma covariância
normalizada
Cálculo para o Exemplo
CovXY = 11.12
sX = 2.33
sY = 6.69
Correlação = .713
Sinal é positivo
Porquê?
Se o sinal fosse negativo
O que significaria?
Não iria alterar o grau de relação mútua.
Outros métodos de cálculo de r
25
Método dos Z
r
z z x y
N 1
Método computacional de cálculo
N XY X Y
r
N X 2 ( X ) 2 N Y 2 ( Y ) 2
Outras medidas de Correlação
Coeficiente de correlação de Spearman
(posição ordenada) (rsp)
usado com 2 variáveis ordenadas/tabeladas
usa a formula de Pearson (adaptada)
Atratividade Simetria
3 2
4 6
1 1
2 3
5 4
6 5 26
rsp = 0,77
Outras medidas de Correlação
Coeficiente de correlação Biserial Pontual
(rpb)
Usado com uma escala contínua e uma escala
nominal, ordinal ou dicotómica.
usa a fórmula de Pearson (adaptada)
Atratividade Encontro?
3 0
4 0
1 1
2 1
5 1 27
6 0
rpb = -0,49
Outras medidas de correlação
Coeficiente Phi ()
Usado com duas escalas dicotómicas.
Usa a formula de Pearson (adaptada)
Attractiveness Date?
0 0
1 0
1 1
1 1
0 0
1 1
= 0.71 28
Factores que afectam r
Restrições intervalares
Olhar apenas para uma pequena parte do
gráfico total (olhar para uma parte menor da
variabilidade dos dados) diminui r.
Reduzir a variabilidade reduz r
Não linearidade
O r de Pearson (e os seus parentes) mede o
grau de relação linear entre duas variáveis
Se existir uma forte relação não linear, o r
dará uma medida pequena, ou pelo menos
incorreta, da verdadeira relação mútua.
Factores que afectam o r
Sub-amostras heterogéneas
Exemplos de todos os dias (p.e. Altura e peso
usando homens e mulheres)
Outliers
Sobre-estimação da correlação
Sub-estimação da correlação
Países com baixos consumos
Dados com intervalos restritos
18
Mortalidade DAC por 10,000
16
14
12
10
4
2
2.5 3.0 3.5 4.0 4.5 5.0 5.5
Parâmetro da população =
Hipótese nula H0: = 0
N 2
tr
1 r 2
N 2 19 19
tr .71* .71* 6.90
1 r 2
1 .712
.4959
CIGARET CHD
CIGARET Pearson Correlation 1 .713**
Sig. (2-tailed) . .000
N 21 21
CHD Pearson Correlation .713** 1
Sig. (2-tailed) .000 .
N 21 21
**. Correlation is significant at the 0.01 level (2-tailed).