Você está na página 1de 34

CORRELAÇÃO E REGRESSÃO

• A análise de correlação dá um número que


resume o grau de relacionamento entre duas
variáveis.

• A análise de regressão tem como resultado


uma equação matemática que descreve o
relacionamento entre duas variáveis.
CORRELAÇÃO

• É a determinação da força do relacionamento


entre duas observações emparelhadas.
• A idade e a resistência física estão
correlacionadas?
• Renda (R$) x Consumo (R$)
• Pessoas com menores horas de sono tendem
a ficar mais cansadas?
CORRELAÇÃO

Diagrama de Dispersão

• Uma forma de visualizarmos se duas variáveis


apresentam-se correlacionadas.
Diagrama de Dispersão

Exemplo: Uma amostra de dez indivíduos de


uma cidade, do sexo masculino, são verificadas
altura (cm) e o peso (kg). Os dados são
apresentados a seguir:
Diagrama de Dispersão

X = Altura 174 161 170 180 182 164 156 168 176 175

Y = Peso 73 66 78 90 85 72 62 74 90 81
Diagrama de dispersão das
variáveis altura e peso.
Diagrama de dispersão das variáveis altura e
peso com a reta imagem.
Correlação linear

• Positiva: se os pontos do diagrama têm como


imagem uma reta crescente.
• Negativa: se os pontos do diagrama têm como
imagem uma reta decrescente.
• Nula: se os pontos do diagrama apresentam-se
dispersos, não oferecendo imagem definida.
Coeficiente de Correlação Linear

• O instrumento empregado para a medida da


correlação linear é o coeficiente de correlação
de Pearson.
• Esse coeficiente deve indicar o grau de
intensidade da correlação entre duas variáveis
e, ainda, o sentido dessa correlação (positivo
ou negativo).
Coeficiente de correlação de Pearson

n xi y i    xi  y i 
r
n x   xi  n y   y i 
2 2 2 2
i i
Coeficiente de correlação de Pearson

Exemplo: Vamos calcular o coeficiente de


correlação de Pearson dos dados de altura e peso
dos indivíduos vistos anteriormente. Vamos
primeiramente construir uma tabela para os
cálculos das variáveis.
Coeficiente de correlação de Pearson

Indivíduo xi yi x i2 yi2 xi yi
1 174 73 30.276 5.329 12.702
2 161 66 25.921 4.356 10.626
3 170 78 28.900 6.084 13.260
4 180 90 32.400 8.100 16.200
5 182 85 33.124 7.225 15.470
6 164 72 26.896 5.184 11.808
7 156 62 24.336 3.844 9.672
8 168 74 28.224 5.476 12.432
9 176 90 30.976 8.100 15.840
10 175 81 30.625 6.561 14.175
total 1.706 771 291.678 60.259 132.185
Coeficiente de correlação de Pearson

n xi y i    xi  y i 
r
n x   xi  n y   y i 
2 2 2 2
i i
.

Coeficiente de correlação de Pearson

Substituindo os valores:

10 132.185  1.706  771 6.524 6.524


r  
10  291.678  1.7062 10  60.259  7712 6.344 8.149 79,65  90, 27

r  0,91

Obtivemos para r um valor positivo e relativamente alto, pois os


pontos no diagrama de dispersão indicaram uma correlação linear
positiva alta.
Interpretação do Coeficiente de Correlação

Para qualquer conjunto de dados o valor do


coeficiente de correlação de Pearson, r, estará no
intervalo de –1 a 1.
Interpretação do Coeficiente de Correlação
Regressão Linear Simples

O objetivo é descrever, por meio de um modelo


matemático, a relação entre duas variáveis,
partindo de n observações das mesmas.
Regressão Linear Simples

Daremos um estudo de regressão com a


formulação mais simples, relacionando uma
variável Y, chamada de resposta ou dependente,
com uma variável X, denominada de variável
regressora, explicativa ou independente.
Regressão Linear Simples

Este tipo de modelo que buscamos explicar uma


variável Y em função linear de apenas uma
variável X é denominado de modelo de
regressão linear simples.
Regressão Linear Simples
Regressão Linear Simples
Estimando os Parâmetros
do Modelo
Método de Mínimos Quadrados

n xi yi   xi  yi
a
n x    xi 
2 2
i

b
 y i
a
 x i

n n
Método de Mínimos Quadrados
Método de Mínimos Quadrados
Coeficiente de Determinação
Regressão Linear Simples

vamos procurar determinar o ajustamento de


uma reta à relação entre essas variáveis, ou seja,
vamos obter uma função definida por:

Y  a X b
onde a e b são os parâmetros do modelo matemático.
Regressão Linear Simples

n xi yi   xi  yi
a
n x    xi 
2 2
i

b
 y i
a
 x i

n n Ŷ  a X  b
Regressão Linear Simples

Exemplo: Considere uma pesquisa em que se analisa a


taxa de colesterol de indivíduos (Y) em função da
quantidade de exercícios físicos (X). Para isso, foram
realizados testes com nove indivíduos de uma cidade que
realizavam os seguintes períodos de exercícios físicos
diários (em minutos): 30, 45, 60, 75, 90, 100, 120, 140
e 180. Os resultados são mostrados abaixo.
Regressão Linear Simples

X Y
30 242
45 234
60 221
75 199
90 171
100 150
120 146
140 139
180 118
Diagrama de dispersão

xi yi xi2 xi y i
30 242 900 7.260
45 234 2.025 10.530
60 221 3.600 13.260
75 199 5.625 14.925
90 171 8.100 15.390
100 150 10.000 15.000
120 146 14.400 17.520
140 139 19.600 19.460
180 118 32.400 21.240
840 1.620 96.650 134.585
Regressão Linear Simples

n xi yi   xi  yi
a
n x    xi 
2 2
i

b
 y i
a
 x i

n n Ŷ  a X  b
Regressão Linear Simples

n xi yi   xi  yi a
9 134.585  840 1.620

149.535
 0,91
a 9  96.650   840 
2

n xi2    xi 
2 164.250

b
 y i
a
 x i
b
1.620
 0,91
840
 180  0,91 93,33  264,93
n n 9 9

Ŷ  a X  b yˆ   0,91 x  264,93
x  25  yˆ  0,91 25  264,93  242,18

Você também pode gostar