Você está na página 1de 27

Regresso Linear Simples

Objetivo
Estudar a relao entre duas variveis quantitativas.

Exemplos:
Idade e altura das crianas Tempo de prtica de esportes e ritmo cardaco Tempo de estudo e nota na prova Taxa de desemprego e taxa de criminalidade Expectativa de vida e taxa de analfabetismo

Investigaremos a presena ou ausncia de relao linear sob dois pontos de vista: a) Quantificando a fora dessa relao: correlao. b) Explicitando a forma dessa relao: regresso. Representao grfica de duas variveis quantitativas: Diagrama de disperso

Exemplo 1: nota da prova e tempo de estudo


X : tempo de estudo (em horas) Y : nota da prova

Pares de observaes (Xi , Yi) para cada estudante


Tempo(X) 3,0 7,0 2,0 1,5 12,0 Nota(Y) 4,5 6,5 3,7 4,0 9,3
Diagrama de Disperso
9,5 8,5 7,5

Nota

6,5 5,5 4,5 3,5 0 5 10

No MINITAB C1:valores de X C2:valores de Y MTB > plot C1*C2

Tempo

uma medida que avalia o quanto a nuvem de pontos no diagrama de disperso aproxima-se de uma reta. O coeficiente de correlao linear de Pearson dado por:

Coeficiente de correlao linear

sendo que,

X e Y so as mdias amostrais de X e Y, respectivamente S X e S Y so os desvios padro de X e Y, respectivamente.

Frmula alternativa:

No exemplo:
Tempo (X) 3,0 7,0 2,0 1,5 12,0 25,5 Nota (Y) 4,5 6,5 3,7 4,0 9,3 28,0

(X - X)
-2,1 1,9 -3,1 -3,6 6,9 0

(Y - Y)
-1,1 0,9 -1,9 -1,6 3,7 0

(X - X) (Y - Y)
2,31 1,71 5,89 5,76 25,53 41,2

X 5,1

Y 5,6

(-2,1) 2 ... (6,9) 2 78,2 2 Sx 19,55 S x 4,42 4 4 (-1,1) 2 ... (3,7) 2 21,9 2 Sy 5,47 S y 2,34 4 4

Ento, r 41,2 0,9959 4 . 4,42 . 2,34

Propriedade: -1 r 1
Casos particulares: r = 1 correlao linear positiva e perfeita r = -1 correlao linear negativa e perfeita r = 0 inexistncia de correlao linear

r = 1, correlao linear positiva e perfeita

r = -1, correlao linear negativa e perfeita

r
40

30

Y
20 10 10 20 30 40 50

-1

Exemplo 2: criminalidade e analfabetismo


Considere as duas variveis observadas em 50 estados norte-americanos. Y: taxa de criminalidade X: taxa de analfabetismo

Diagrama de disperso

Podemos notar que, conforme aumenta a taxa de analfabetismo (X), a taxa de criminalidade (Y) tende a aumentar. Nota-se tambm uma tendncia linear.

Clculo da correlao

_ Y= 7,38 (mdia de Y) e SY = 3,692 (desvio padro de Y) _ X= 1,17 (mdia de X) e Sx = 0,609 (desvio padro de X) XiYi = 509,12

Correlao entre X e Y:

Exemplo 3: expectativa de vida e analfabetismo


Considere as duas variveis observadas em 50 estados norte-americanos.
Y: expectativa de vida X: taxa de analfabetismo

Diagrama de disperso

Podemos notar que, conforme aumenta a taxa de analfabetismo (X), a expectativa de vida (Y) tende a diminuir. Nota-se tambm uma tendncia linear.

Clculo da correlao
_ (mdia de Y) e SY = 1,342 (desvio padro de Y) Y= 70,88 _ X= 1,17 (mdia de X) e Sx = 0,609 (desvio padro de X) XiYi = 4122,8 Correlao entre X e Y:

Reta ajustada:

O que so a e b?

a: intercepto b: inclinao
Interpretao de b: Para cada aumento de uma unidade em X, temos um aumento mdio de b unidades em Y.

Reta ajustada (mtodo de mnimos quadrados)


Os coeficientes a e b so calculados da seguinte maneira:

No exemplo 2,
a reta ajustada :

^ Y : valor predito para a taxa de criminalid ade X : taxa de analfabetismo


Interpretao de b: Para um aumento de uma unidade na taxa do analfabetismo (X), a taxa de criminalidade (Y) aumenta, em mdia, 4,257 unidades.

Graficamente, temos

Como desenhar a reta no grfico?

No exemplo 3,
a reta ajustada :

^ Y : valor predito para a expectativa de vida X : taxa de analfabetismo


Interpretao de b: Para um aumento de uma unidade na taxa do analfabetismo (X), a expectativa de vida (Y) diminui, em mdia, 1,296 anos.

Graficamente, temos

Exemplo 4: consumo de cerveja e temperatura


Y: consumo de cerveja dirio por mil habitantes, em litros. X: temperatura mxima (em C).
As variveis foram observadas em nove localidades com as mesmas caractersticas demogrficas e scio-econmicas.

Dados:
Localidade Temperatura (X) Consumo (Y)

1 2 3 4 5 6 7 8 9

16 31 38 39 37 36 36 22 10

290 374 393 425 406 370 365 320 269

Diagrama de disperso

400

Consumo

350

300

10

20

30

40

Temperatura

A correlao entre X e Y r = 0,962.

A reta ajustada :
Qual a interpretao de b? Aumentando-se um grau de temperatura (X), o consumo de cerveja (Y) aumenta, em mdia, 4,74 litros por mil habitantes.

Qual o consumo previsto para uma temperatura de 25C?

Y 217,37 4,74.25 335,87 litros

Você também pode gostar