Escolar Documentos
Profissional Documentos
Cultura Documentos
2 3
2
1
1
0
Y
Y
0
-1
-1
-2 -2
-3 -3
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
X X
400
Ação B
380
300 11% 10,8%
200 10%
100
9%
0 Ação A
8%
0 10 20 30 40 50 60
Propaganda 8% 9% 10% 11% 12% 13%
( X
i 1
i X ) ( X i X ) ( X
i 1
i X )2
XX 2X
N N
A permutação das variáveis não altera o resultado da
covariância, se os pares de valores não forem alterados:
XY YX
Coeficiente de Correlação
Para facilitar a relação entre duas variáveis e evitar a unidade de
medida da covariância, foi definido o coeficiente de correlação
rXY.
Os valores de rXY estão limitados entre os valores 1 e +1, e sem
nenhuma unidade de medida
É um valor único para população ou amostra, tomando o
cuidado de utilizar dados coerentes no procedimento de cálculo.
Da fórmula do coeficiente de correlação pode-se obter também a
covariância das mesmas variáveis quando conhecidos os
desvios padrões correspondentes:
XY r XY X Y
Características de r
Se a variável Y é a mesma variável X, então o coeficiente de
correlação é igual a 1:
XX 2X
r XX 2 1
X X X
A permutação das variáveis não altera o resultado do coeficiente
de correlação, se os mesmos pares de valores forem mantidos.
r XY rYX
r = +1
r = -1
r=0
ALGUNS CUIDADOS
Em geral, uma forte correlação não é sinônimo de uma relação
causa-efeito entre duas amostras ou variáveis.
Há situações em que um coeficiente de correlação próximo de
um ou de menos um não significa que a maioria dos pares de
valores esteja contida numa reta.
O simples conhecimento do coeficiente de correlação não é
suficiente, devido a anomalias na dispersão dos dados.
O coeficiente de correlação não mede a relação causa-efeito
entre as variáveis, apesar de que essa relação possa estar
presente.
Por exemplo, uma correlação fortemente positiva entre as
variáveis X e Y não autoriza afirmar que variações da variável X
provocam variações na variável Y, ou vice-versa.
O coeficiente de correlação sozinho não identifica a relação
causa-efeito entre as duas variáveis; entretanto, na regressão
linear, a relação causa-efeito é definida no início da análise.
Em alguns casos, a relação causa-efeito pode ser provocada por
um ou mais fatores ocultos, uma variável não considerada na
análise.
Por exemplo, suponha que o número de vendas diárias de
um jornal e a produção diária de ovos tenham uma forte
correlação positiva.
Não se pode afirmar que o aumento da produção de ovos
seja a causa do aumento do número de jornais vendidos,
nem que o aumento do número de jornais vendidos resulte
no aumento da produção de ovos!
Para compreender a forte e positiva correlação, devem
procurar fatores ocultos, por exemplo, o aumento de
riqueza da população que resulta em aumento de
demanda dos dois produtos ao mesmo tempo, jornais e
ovos.
Anomalias com r próximo de +1
12 100
10 80
8
60
6
4 40
2 20
0 0
0 5 10 0 10 20 30 40 50 60 70 80 90
120
80 100
60 80
40 60
40
20
20
0 0
0 20 40 60 80 0 10 20 30
Anomalias com r próximo de 0
120
100
80
60
40
20
0
0 10 20 30
TABELAS