Você está na página 1de 27

Correlao e Regresso

Exemplos:
Idade e altura das crianas
Tempo de prtica de esportes e ritmo cardaco
Tempo de estudo e nota na prova
Taxa de desemprego e taxa de criminalidade
Expectativa de vida e taxa de analfabetismo
Objetivo
Estudar a relao entre duas variveis quantitativas.

a) Quantificando a fora dessa relao:
correlao.
b) Explicitando a forma dessa relao:
regresso.
Representao grfica de duas variveis
quantitativas: Diagrama de disperso
Investigaremos a presena ou ausncia de
relao linear sob dois pontos de vista:
Exemplo 1: nota da prova e tempo de estudo
X : tempo de estudo (em horas)
Y : nota da prova

10 5 0
9,5
8,5
7,5
6,5
5,5
4,5
3,5
Tempo
N
o
t
a
Diagrama de Disperso
Tempo(X) Nota(Y)
3,0 4,5
7,0 6,5
2,0 3,7
1,5 4,0
12,0 9,3
Pares de observaes (X
i
, Y
i
) para cada estudante
Coeficiente de correlao linear
uma medida que avalia o quanto a nuvem de pontos
no diagrama de disperso aproxima-se de uma reta.

O coeficiente de correlao linear de Pearson dado por:
sendo que,
mente. respectiva Y, e X de padro desvios os so S e S
mente, respectiva Y, e X de amostrais mdias as so Y e X
Y X
Frmula alternativa:
No exemplo:
Tempo (X) Nota (Y)
3,0 4,5
7,0 6,5
2,0 3,7
1,5 4,0
12,0 9,3
25,5 28,0 41,2
25,53
5,76
5,89
1,71
2,31
)
-
X - (X )
-
Y - (Y
5,6
-
Y 5,1
-
X
2,34 S 5,47
4
21,9

4
(3,7) ... (-1,1)
S
4,42 S 19,55
4
78,2

4
(6,9) ... (-2,1)
S
y
2 2
2
y
x
2 2
2
x

0,9959
2,34 . 4,42 . 4
41,2
r
Ento,

0 0
3,7 6,9
-1,6 -3,6
-1,9 -3,1
0,9 1,9
-1,1 -2,1
)
-
X - (X )
-
Y - (Y
Propriedade: -1 r 1

Casos particulares:

r = 1 correlao linear positiva e perfeita
r = -1 correlao linear negativa e perfeita
r = 0 inexistncia de correlao linear
r = 1, correlao linear positiva e perfeita
r = -1, correlao linear negativa e perfeita
r 0

50 40 30 20 10
40
30
20
10
X
Y
r 1

r -1

Exemplo 2: criminalidade e analfabetismo


Considere as duas variveis observadas em 50
estados norte-americanos.

Y: taxa de criminalidade
X: taxa de analfabetismo

Diagrama de disperso
Podemos notar que, conforme aumenta a taxa de
analfabetismo (X), a taxa de criminalidade (Y) tende
a aumentar. Nota-se tambm uma tendncia linear.
Clculo da correlao
Correlao entre X e Y:
Y= 7,38
_
(mdia de Y) e S
Y
= 3,692 (desvio padro de Y)
(mdia de X) e S
x
= 0,609 (desvio padro de X)
X= 1,17
_
X
i
Y
i
= 509,12

Exemplo 3: expectativa de vida e
analfabetismo
Considere as duas variveis observadas em 50
estados norte-americanos.

Y: expectativa de vida
X: taxa de analfabetismo

Diagrama de disperso
Podemos notar que, conforme aumenta a taxa de
analfabetismo (X), a expectativa de vida (Y) tende a
diminuir. Nota-se tambm uma tendncia linear.
Clculo da correlao
Correlao entre X e Y:
Y= 70,88
_
(mdia de Y) e S
Y
= 1,342 (desvio padro de Y)
(mdia de X) e S
x
= 0,609 (desvio padro de X)
X= 1,17
_
X
i
Y
i
= 4122,8

Reta ajustada:

O que so a e b?
Interpretao de b:
a: intercepto
b: inclinao
Para cada aumento de uma unidade em X, temos
um aumento mdio de b unidades em Y.
Reta ajustada
(mtodo de mnimos quadrados)
Os coeficientes a e b so calculados da seguinte maneira:
No exemplo 2,
a reta ajustada :
Para um aumento de uma unidade na taxa do
analfabetismo (X), a taxa de criminalidade (Y)
aumenta, em mdia, 4,257 unidades.
smo analfabeti de taxa : X
ade criminalid de taxa a para predito valor :
^
Y
Interpretao de b:
Graficamente, temos
Como desenhar a reta no grfico?
No exemplo 3,
a reta ajustada :
Interpretao de b:
smo analfabeti de taxa : X
vida de a expectativ a para predito valor :
^
Y
Para um aumento de uma unidade na taxa do
analfabetismo (X), a expectativa de vida (Y)
diminui, em mdia, 1,296 anos.
Graficamente, temos
Exemplo 4: consumo de cerveja e
temperatura
Y: consumo de cerveja dirio por mil habitantes, em
litros.
X: temperatura mxima (em C).

As variveis foram observadas em nove
localidades com as mesmas caractersticas
demogrficas e scio-econmicas.

Dados:
Localidade Temperatura Consumo
(X) (Y)
1 16 290
2 31 374
3 38 393
4 39 425
5 37 406
6 36 370
7 36 365
8 22 320
9 10 269
40 30 20 10
400
350
300
Temperatura
C
o
n
s
u
m
o
Diagrama de disperso
A correlao entre X e Y r = 0,962.

A reta ajustada :
Qual o consumo previsto para uma temperatura de 25C?
Qual a interpretao de b?
Aumentando-se um grau
de temperatura (X), o
consumo de cerveja (Y)
aumenta, em mdia, 4,74
litros por mil habitantes.
litros 335,87 4,74.25 217,37 Y
^

Você também pode gostar