Você está na página 1de 3

Correlação linear

O desenvolvimento da correlação linear recebeu uma importante


Correlação contribuição a partir de 1893 com os estudos de Karl Pearson.
linear simples
Karl Pearson
1857, Londres, Inglaterra
 1936, Londres, Inglaterra
Dr. Mário B. Wagner, PhD
FAMED/PUCRS e UFGRS
Pearson formou-se em matemática em Cambridge, 1879 e atuou
como professor de Matemática Aplicada no University College,
London durante a maior parte do tempo de sua carreira acadêmica.

Correlação linear Correlação linear

• Para avaliar se existe associação linear entre • O coeficiente de Pearson (r) varia entre −1 e +1.
duas variáveis quantitativas é comum a • Valores negativos indicam relação inversa: x↑ e y↓
utilização do coeficiente de correlação • Valores positivos indicam relação direta: x ↑ e y ↑
(produto-momento) de Pearson (r) • Os valores mínimo (-1) e máximo (+1) de r ocorrem
quando todos os pontos estão sobre a reta.

• O coeficiente de Pearson avalia o quanto


duas séries numéricas repousam sobre uma
linha reta, indicando assim o grau de sua
associação linear. r = −1 r = +1

Gráficos de dispersão de pontos Correlação linear


relação não linear
1.2

1.0
• A fórmula do coeficiente de Pearson (r) é

∑ (x − x )( y − y )
0.8

0.6

covxy
r= onde covxy =
0.4

(n − 1)
0.2

0.0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150
sx ⋅ s y
r = 0,76 r = 0,42
• Quando x e y não estão associados eles não covariam,
a covariância (covxy) é pequena, e o r é pequeno.

• Quando x e y estão associados a covariância tende a


ser tão grande quanto (sx × sy) e assim o valor de
r=0 r = − 0,82 r torna-se grande (próximo de 1).

1
Correlação linear Correlação linear

• A fórmula mais conhecida do coeficiente de • O coeficiente de Pearson como toda estatística


Pearson (r) é obtida em amostra sofre variação aleatória,
devendo ser testado estatisticamente.
( x )( y )
∑ xy − ∑ n∑ • O r populacional é representado por “rô” (ρ).
r=
( x)  
∑ x − ∑  ∑ y − ∑

2
2
( y) 2
2

 • O procedimento clássico é testar o desvio de r em


n  
n 
relação ao ρ populacional

Teste t de Student para o


Teste de significância do coeficiente de correlação
coeficiente de correlação (r)
Dados da amostra
10
9
r = 0,58 e n=8
8
7
Nota na prova

6
5
4
• Ho: ρ = 0
3
2
• Ha: ρ ≠ 0
1
0
• α = 0,05
−1 ρ=0 +1 0 1 2 3 4 5
Estudo (horas)
6 7 8 9
• gl=nº de pares-2=6
• tα;gl = t0,05;6 = 2,447

Teste t de Student para o Intervalo de 95% confiança para a ρ


coeficiente de correlação* por aproximação t

r −ρ r ρˆ ≅ r ± tα; gl ⋅ EPr
t= = 0,58
EPr 1− r2 t= = 1,74
t 0,05;6 = 2,447
n−2 1 − 0,58 2
8−2
Li = 0,58 −( 2,447 × 0,33) = −0,23

Como |tcalc| = 1,74 < t0,05;6 = 2,447, não há evidência de Ls = 0,58 + (2,447 × 0,33) = 1,39 ≅ 1
correlação uma vez que o desvio de r em relação a ρ=0 não
foi significativo. IC 95%assintótico (ρ): −0,23 a 1,0
* É possível obter-se, também, o intervalo de confiança para o r
IC 95%exato (ρ): −0,22 a 0,91

2
Correlação linear
Uma escala de magnitudes Coeficiente de determinação

Trivial Pequena Moderada Grande Mt. Grande Q Prf


• O quadrado do coeficiente de correlação (r2) é
TEP conhecido como coeficiente de determinação e
f dif. representa a “variância explicada”, ou seja, qual a
proporção da variabilidade de y que pode ser
Adaptada de Will Hopkins, http://www.sportsci.org/resource/stats/effectmag.html
explicada pela variabilidade de x.

Você também pode gostar