Você está na página 1de 14

1 - CORRELAO LINEAR SIMPLES rxy

Em pesquisas, freqentemente, procura-se verificar se


existe relao entre duas ou mais variveis, isto , saber se
as alteraes sofridas por uma das variveis so
acompanhadas por alteraes nas outras. Por exemplo,
peso vs. idade, consumo vs. renda, altura vs. peso, de um
indivduo.
O termo correlao significa relao em dois sentidos (co +
relao), e usado em estatstica para designar a fora que
mantm unidos dois conjuntos de valores. A verificao da
existncia e do grau de relao entre as variveis o objeto
de estudo da correlao.
Uma vez caracterizada esta relao, procura-se descrev-la
sob forma matemtica, atravs de uma funo. A estimao
dos parmetros dessa funo matemtica o objeto da
regresso.
Os pares de valores das duas variveis podero ser
colocados num diagrama cartesiano chamado diagrama de
disperso. A vantagem de construir um diagrama de
disperso est em que, muitas vezes sua simples
observao j nos d uma idia bastante boa de como as
duas variveis se relacionam.
Uma medida do grau e do sinal da correlao dada pela
covarincia entre as duas variveis aleatrias X e Y que
uma medida numrica de associao linear existente entre
elas, e definida por:
Cov(X, Y) =
mais conveniente usar para medida de correlao, o
coeficiente de correlao linear de Pearson, como
estimador de xy, definido por:
rxy =
.
.
.
1
(


n
y x
y x
n
( )
yy xx
xy
y x
S . S
S
=

y , x Cov
( ) ( )
( )
yy
xy
yy xx
xy xy
xy
S
S b
S S
S S
n n
n
xy
r
.
.
.
S . S
S
y
- y .
x
- x
y . x
-
2
1
yy xx
xy
2
1
2
2
2
2
= = =
(
(

(
(

(
(

onde: as somas de quadrados so:


=
n
y x
y x S
xy
.
.
( )
n
x
x S
xx
2
2

=
( )
n
y
y S
yy
2
2

=
n = nmero de pares das observaes.
A partir de X e Y so determinadas todas as somas necessrias para
este clculo:
O coeficiente de correlao rxy linear um nmero puro que
varia de 1 a +1 e sua interpretao depender do valor numrico e do
sinal, como segue:
xy
r
(x.y) y
2
x
2
x y
: : ; : :
: : : : :
X . Y Y
2
X
2
X Y
correlao forte* 0,7 < r
xy
<0,9
correlao moderada* 0,4 < r
xy
<0,7
correlao fraca* 0,2 < r
xy
<0,4
correlao perfeita positiva r
xy
= 1
correlao positiva 0 < r
xy
< 1
correlao nula r
xy
= 0
correlao negativa -1 < r
xy
< 0
correlao perfeita negativa r
xy
= -1
*possui o mesmo significado para os casos negativos ou positivos.
Anlise do Diagrama de Disperso
O diagrama de disperso mostrar que a
correlao ser tanto mais forte quanto mais prximo estiver o
coeficiente de 1 ou +1, e ser tanto mais fraca quanto mais
prximo o coeficiente estiver de zero.
a) Correlao perfeita negativa (rxy = -1): Quando os pontos
estiverem perfeitamente alinhados, mas em sentido contrrio, a
correlao denominada perfeita negativa.
b) Correlao negativa (-1 < rxy < 0): A correlao
considerada negativa quando valores crescentes da varivel X
estiverem associados a valores decrescentes da varivel Y, ou
valores decrescentes de X associados a valores crescentes de
Y.
c) Correlao nula (rxy = 0): Quando no houver relao entre
as variveis X e Y, ou seja, quando os valores de X e Y
ocorrerem independentemente, no existe correlao entre elas.
d) Correlao positiva (0 < rxy < 1): Ser considerada positiva
se os valores crescentes de X estiverem associados a valores
crescentes de Y.
e) Correlao perfeita positiva (rxy = 1): A correlao linear
perfeita positiva corresponde ao caso anterior, s que os pontos
(X, Y) esto perfeitamente alinhados.
f) Correlao espria: Quando duas variveis X e Y forem
independentes, o coeficiente de correlao ser nulo. Entretanto,
algumas vezes, isto no ocorre, podendo, assim mesmo, o
coeficiente apresentar um valor prximo de 1 ou +1. Neste caso
a correlao espria.
Algumas situaes que podem se apresentar os
diagramas de disperso
Sxx
n
Total
g Re
yy
xx 2 2
SQ
SQ
=
S
S
.

OBSERVAES:
Correlao no o mesmo que causa e efeito. Duas variveis podem estar
altamente correlacionadas e, no entanto, no haver relao de causa e efeito
entre elas.
Se duas variveis estiverem amarradas por uma relao de causa e efeito
elas estaro, obrigatoriamente, correlacionadas.
O estudo de correlao pressupe que as variveis X e Y tenham uma
distribuio normal.
A palavra simples que compe o nome correlao linear simples, indica que
esto envolvidas no clculo somente duas variveis.
O coeficiente de correlao linear de Pearson mede a correlao em
estatstica paramtrica.
Coeficiente de correlao de Spearman (correlao por postos} o
correspondente rea no paramtrica.
Var(x) =
Sxy
n
Var(y) =
Syy
n
Cov(x,y) =
Testar = 0 equivalente a testar | = 0 na equao de regresso, pois
TESTES DO COEFICIENTE DE CORRELAO
SIGNIFICNCIA DE
O coeficiente de correlao apenas uma estimativa
do coeficiente de correlao populacional e no devemos
esquecer que o valor de calculado com base em de
npares de dados constituindo amostras aleatrias.
Muitas vezes os pontos da amostra podem apresentar
uma correlao e, no entanto a populao no, neste caso,
estamos diante de um problema de inferncia, pois = 0 no
garantia de que = 0.
Podemos resolver o problema aplicando um teste de
hipteses para verificarmos se o valor de coerente com o
tamanho da amostra n, a um nvel de significncia o, que
realmente existe correlao linear entre as variveis.
xy
r
xy
r
xy
r
xy

xy
r
xy
r
xy

~ = =
r
xy
xy
xy
S
r
r - 1
2 - n . r
2
c
t
distribuio t de Student com
n 2 graus de liberdade.
2 - n
r 1
2

=
r
S
Onde, , o erro padro do coeficiente
de correlao.
H0: = 0 (no existe correlao entre X e Y)
H1: 0 (existe correlao entre X e Y).
COEFICIENTE DE DETERMINAO
Indica a proporo de variao da varivel
independente que explicada pela varivel dependente, ou
seja, uma ferramenta que avalia a qualidade do ajuste.
Quanto mais prximo da unidade o R estiver, melhor
a qualidade do ajuste. O seu valor fornece a proporo da
varivel Y explicada pela varivel X atravs da funo
ajustada.
Exemplo: R = = (0,9929) = 0,9858 = 98,50 %.
a proporo que Y explicada por X; ou seja;
98,50% da variao do nmero de livros explicado pelo
tempo que freqentou a escola.
1 0 ,
2 2
s s = R r R
xy
2
xy
r
2
xy
r
CORRELAO LINEAR POR POSTOS
OU SPEARMAM -
De todas as estatsticas baseadas em postos, o
coeficiente de correlao por postos de Spearmam, foi a que
surgiu primeiro, e talvez a mais conhecida hoje. uma
medida de associao que exige que ambas as variveis se
apresentem em escala de mensurao pelo menos ordinal, de
modo que os elementos em estudo possam dispor-se por
postos em duas sries ordenadas.
Este teste no-paramtrico destina-se a determinar o
grau de associao entre duas variveis X e Y, dispostas em
pontos ordenados, o objetivo estudar a correlao entre
duas classificaes.
s
r
Resumo do Procedimento
1) Dispor em postos as duas variveis X e Y de 1 a n (n=nmero de pares de
dados);
2) Relacionar os n elementos, dar o posto de cada elemento;
3) Determinar = (posto x posto y),
4) Se a proporo de empates de ambas as variveis X ou Y grande ento
calcula-se pela frmula:
i
d ;
2 2
i i
d e d
s
r


+
=
2 2
2 2 2
. . 2 y x
d y x
r
i
s
Onde:
x
n n
Tx
2
3
12

=

y
n n
Ty
2
3
12

=

,
12
t - t
3
= T onde t, corresponde ao nmero de empates, usado para corrigir
a soma de quadrados.
Caso contrrio se aplica a frmula:
r = 1 -
6 di
n - n
s
2
3

5) A significncia de testada com tc = ; com n-2 graus de


liberdade, que o mesmo teste anterior (Pearson).
s
r
r n
r
s
s

2
1
2

Você também pode gostar