Você está na página 1de 27

Correlao e Regresso

Objetivo
Estudar a relao entre duas variveis quantitativas.

Exemplos:
Idade e altura das crianas
Tempo de prtica de esportes e ritmo cardaco
Tempo de estudo e nota na prova
Taxa de desemprego e taxa de criminalidade
Expectativa de vida e taxa de analfabetismo
Investigaremos a presena ou ausncia de
relao linear sob dois pontos de vista:

a) Quantificando a fora dessa relao:


correlao.
b) Explicitando a forma dessa relao:
regresso.

Representao grfica de duas variveis


quantitativas: Diagrama de disperso
Exemplo 1: nota da prova e tempo de estudo
X : tempo de estudo (em horas)
Y : nota da prova

Pares de observaes (Xi , Yi) para cada estudante


Tempo(X) Nota(Y)
Diagrama de Disperso
3,0 4,5
7,0 6,5 9,5

2,0 3,7
8,5

7,5
1,5 4,0 Nota

6,5
12,0 9,3 5,5

4,5

3,5
0 5 10
Tempo
Coeficiente de correlao linear
uma medida que avalia o quanto a nuvem de pontos
no diagrama de disperso aproxima-se de uma reta.
O coeficiente de correlao linear de Pearson dado por:

sendo que,

X e Y so as mdias amostrais de X e Y, respectivamente


S X e S Y so os desvios padro de X e Y, respectivamente.
Frmula alternativa:
No exemplo:
- - - -
Tempo (X) Nota (Y) (X - X) (Y - Y) (X - X) (Y - Y)
3,0 4,5 -2,1 -1,1 2,31
7,0 6,5 1,9 0,9 1,71
2,0 3,7 -3,1 -1,9 5,89
1,5 4,0 -3,6 -1,6 5,76
12,0 9,3 6,9 3,7 25,53
25,5 28,0 0 0 41,2
- -
X 5,1 Y 5,6

2 (-2,1) 2 ... (6,9) 2 78,2


Sx 19,55 S x 4,42
4 4

2 (-1,1) 2 ... (3,7) 2 21,9


Sy 5,47 S y 2,34
4 4

Ento,
41,2
r 0,9959
4 . 4,42 . 2,34
Propriedade: -1 r 1

Casos particulares:

r = 1 correlao linear positiva e perfeita


r = -1 correlao linear negativa e perfeita
r = 0 inexistncia de correlao linear
r = 1, correlao linear positiva e perfeita

r = -1, correlao linear negativa e perfeita


r 0
40

30

Y
20

10

10 20 30 40 50
X
r 1 r -1
Exemplo 2: criminalidade e analfabetismo

Considere as duas variveis observadas em 50


estados norte-americanos.
Y: taxa de criminalidade
X: taxa de analfabetismo
Diagrama de disperso

Podemos notar que, conforme aumenta a taxa de


analfabetismo (X), a taxa de criminalidade (Y) tende
a aumentar. Nota-se tambm uma tendncia linear.
Clculo da correlao
_
Y= 7,38 (mdia de Y) e SY = 3,692 (desvio padro de Y)
_
X= 1,17 (mdia de X) e Sx = 0,609 (desvio padro de X)
XiYi = 509,12

Correlao entre X e Y:
Exemplo 3: expectativa de vida e
analfabetismo

Considere as duas variveis observadas em 50


estados norte-americanos.
Y: expectativa de vida
X: taxa de analfabetismo
Diagrama de disperso

Podemos notar que, conforme aumenta a taxa de


analfabetismo (X), a expectativa de vida (Y) tende a
diminuir. Nota-se tambm uma tendncia linear.
Clculo da correlao
_
Y= 70,88 (mdia de Y) e SY = 1,342 (desvio padro de Y)
_
X= 1,17 (mdia de X) e Sx = 0,609 (desvio padro de X)
XiYi = 4122,8

Correlao entre X e Y:
Reta ajustada:

O que so a e b?
a: intercepto
b: inclinao

Interpretao de b:
Para cada aumento de uma unidade em X, temos
um aumento mdio de b unidades em Y.
Reta ajustada
(mtodo de mnimos quadrados)

Os coeficientes a e b so calculados da seguinte maneira:


No exemplo 2,
a reta ajustada :

^
Y : valor predito para a taxa de criminalid ade
X : taxa de analfabetismo

Interpretao de b:
Para um aumento de uma unidade na taxa do
analfabetismo (X), a taxa de criminalidade (Y)
aumenta, em mdia, 4,257 unidades.
Graficamente, temos

Como desenhar a reta no grfico?


No exemplo 3,
a reta ajustada :

^
Y : valor predito para a expectativa de vida
X : taxa de analfabetismo
Interpretao de b:
Para um aumento de uma unidade na taxa do
analfabetismo (X), a expectativa de vida (Y)
diminui, em mdia, 1,296 anos.
Graficamente, temos
Exemplo 4: consumo de cerveja e
temperatura

Y: consumo de cerveja dirio por mil habitantes, em


litros.
X: temperatura mxima (em C).

As variveis foram observadas em nove


localidades com as mesmas caractersticas
demogrficas e scio-econmicas.
Dados:
Localidade Temperatura Consumo
(X) (Y)
1 16 290
2 31 374
3 38 393
4 39 425
5 37 406
6 36 370
7 36 365
8 22 320
9 10 269
Diagrama de disperso

400
Consumo

350

300

10 20 30 40
Temperatura

A correlao entre X e Y r = 0,962.


A reta ajustada :

Qual a interpretao de b?
Aumentando-se um grau
de temperatura (X), o
consumo de cerveja (Y)
aumenta, em mdia, 4,74
litros por mil habitantes.

Qual o consumo previsto para uma temperatura de 25C?


^
Y 217,37 4,74.25 335,87 litros

Você também pode gostar