Escolar Documentos
Profissional Documentos
Cultura Documentos
n
y x
y x
n
( )
yy xx
xy
y x
S . S
S
=
y , x Cov
( ) ( )
( )
yy
xy
yy xx
xy xy
xy
S
S b
S S
S S
n n
n
xy
r
.
.
.
S . S
S
y
- y .
x
- x
y . x
-
2
1
yy xx
xy
2
1
2
2
2
2
= = =
(
(
(
(
(
(
=
n
y x
y x S
xy
.
.
( )
n
x
x S
xx
2
2
=
( )
n
y
y S
yy
2
2
=
n = nmero de pares das observaes.
A partir de X e Y so determinadas todas as somas necessrias para
este clculo:
O coeficiente de correlao rxy linear um nmero puro que
varia de 1 a +1 e sua interpretao depender do valor numrico e do
sinal, como segue:
xy
r
(x.y) y
2
x
2
x y
: : ; : :
: : : : :
X . Y Y
2
X
2
X Y
correlao forte* 0,7 < r
xy
<0,9
correlao moderada* 0,4 < r
xy
<0,7
correlao fraca* 0,2 < r
xy
<0,4
correlao perfeita positiva r
xy
= 1
correlao positiva 0 < r
xy
< 1
correlao nula r
xy
= 0
correlao negativa -1 < r
xy
< 0
correlao perfeita negativa r
xy
= -1
*possui o mesmo significado para os casos negativos ou positivos.
Anlise do Diagrama de Disperso
O diagrama de disperso mostrar que a
correlao ser tanto mais forte quanto mais prximo estiver o
coeficiente de 1 ou +1, e ser tanto mais fraca quanto mais
prximo o coeficiente estiver de zero.
a) Correlao perfeita negativa (rxy = -1): Quando os pontos
estiverem perfeitamente alinhados, mas em sentido contrrio, a
correlao denominada perfeita negativa.
b) Correlao negativa (-1 < rxy < 0): A correlao
considerada negativa quando valores crescentes da varivel X
estiverem associados a valores decrescentes da varivel Y, ou
valores decrescentes de X associados a valores crescentes de
Y.
c) Correlao nula (rxy = 0): Quando no houver relao entre
as variveis X e Y, ou seja, quando os valores de X e Y
ocorrerem independentemente, no existe correlao entre elas.
d) Correlao positiva (0 < rxy < 1): Ser considerada positiva
se os valores crescentes de X estiverem associados a valores
crescentes de Y.
e) Correlao perfeita positiva (rxy = 1): A correlao linear
perfeita positiva corresponde ao caso anterior, s que os pontos
(X, Y) esto perfeitamente alinhados.
f) Correlao espria: Quando duas variveis X e Y forem
independentes, o coeficiente de correlao ser nulo. Entretanto,
algumas vezes, isto no ocorre, podendo, assim mesmo, o
coeficiente apresentar um valor prximo de 1 ou +1. Neste caso
a correlao espria.
Algumas situaes que podem se apresentar os
diagramas de disperso
Sxx
n
Total
g Re
yy
xx 2 2
SQ
SQ
=
S
S
.
OBSERVAES:
Correlao no o mesmo que causa e efeito. Duas variveis podem estar
altamente correlacionadas e, no entanto, no haver relao de causa e efeito
entre elas.
Se duas variveis estiverem amarradas por uma relao de causa e efeito
elas estaro, obrigatoriamente, correlacionadas.
O estudo de correlao pressupe que as variveis X e Y tenham uma
distribuio normal.
A palavra simples que compe o nome correlao linear simples, indica que
esto envolvidas no clculo somente duas variveis.
O coeficiente de correlao linear de Pearson mede a correlao em
estatstica paramtrica.
Coeficiente de correlao de Spearman (correlao por postos} o
correspondente rea no paramtrica.
Var(x) =
Sxy
n
Var(y) =
Syy
n
Cov(x,y) =
Testar = 0 equivalente a testar | = 0 na equao de regresso, pois
TESTES DO COEFICIENTE DE CORRELAO
SIGNIFICNCIA DE
O coeficiente de correlao apenas uma estimativa
do coeficiente de correlao populacional e no devemos
esquecer que o valor de calculado com base em de
npares de dados constituindo amostras aleatrias.
Muitas vezes os pontos da amostra podem apresentar
uma correlao e, no entanto a populao no, neste caso,
estamos diante de um problema de inferncia, pois = 0 no
garantia de que = 0.
Podemos resolver o problema aplicando um teste de
hipteses para verificarmos se o valor de coerente com o
tamanho da amostra n, a um nvel de significncia o, que
realmente existe correlao linear entre as variveis.
xy
r
xy
r
xy
r
xy
xy
r
xy
r
xy
~ = =
r
xy
xy
xy
S
r
r - 1
2 - n . r
2
c
t
distribuio t de Student com
n 2 graus de liberdade.
2 - n
r 1
2
=
r
S
Onde, , o erro padro do coeficiente
de correlao.
H0: = 0 (no existe correlao entre X e Y)
H1: 0 (existe correlao entre X e Y).
COEFICIENTE DE DETERMINAO
Indica a proporo de variao da varivel
independente que explicada pela varivel dependente, ou
seja, uma ferramenta que avalia a qualidade do ajuste.
Quanto mais prximo da unidade o R estiver, melhor
a qualidade do ajuste. O seu valor fornece a proporo da
varivel Y explicada pela varivel X atravs da funo
ajustada.
Exemplo: R = = (0,9929) = 0,9858 = 98,50 %.
a proporo que Y explicada por X; ou seja;
98,50% da variao do nmero de livros explicado pelo
tempo que freqentou a escola.
1 0 ,
2 2
s s = R r R
xy
2
xy
r
2
xy
r
CORRELAO LINEAR POR POSTOS
OU SPEARMAM -
De todas as estatsticas baseadas em postos, o
coeficiente de correlao por postos de Spearmam, foi a que
surgiu primeiro, e talvez a mais conhecida hoje. uma
medida de associao que exige que ambas as variveis se
apresentem em escala de mensurao pelo menos ordinal, de
modo que os elementos em estudo possam dispor-se por
postos em duas sries ordenadas.
Este teste no-paramtrico destina-se a determinar o
grau de associao entre duas variveis X e Y, dispostas em
pontos ordenados, o objetivo estudar a correlao entre
duas classificaes.
s
r
Resumo do Procedimento
1) Dispor em postos as duas variveis X e Y de 1 a n (n=nmero de pares de
dados);
2) Relacionar os n elementos, dar o posto de cada elemento;
3) Determinar = (posto x posto y),
4) Se a proporo de empates de ambas as variveis X ou Y grande ento
calcula-se pela frmula:
i
d ;
2 2
i i
d e d
s
r
+
=
2 2
2 2 2
. . 2 y x
d y x
r
i
s
Onde:
x
n n
Tx
2
3
12
=
y
n n
Ty
2
3
12
=
,
12
t - t
3
= T onde t, corresponde ao nmero de empates, usado para corrigir
a soma de quadrados.
Caso contrrio se aplica a frmula:
r = 1 -
6 di
n - n
s
2
3
2
1
2