Você está na página 1de 30

Correlação e Regressão

Introdução

Iniciaremos o estudo de
métodos para lidar com
relações entre duas
variáveis.
Introdução
Quando consideramos
observações de duas
variáveis surge um novo
problema: as relações que
podem existir entre as
variáveis estudadas.
Introdução
Para estudar as relações
entre duas variáveis,
utilizaremos os conceitos
fundamentais de
correlação e regressão.
Definição
Existe uma correlação
entre duas variáveis
quando uma delas está,
de alguma forma,
relacionada com a outra.
Exemplo

Uma pesquisa constatou


uma maior incidência de
leucemia em crianças que
viviam a 300 metros de
linhas de força de alta
tensão.
Exemplo
Variação do comprimento de
uma barra de aço conforme
a temperatura.
Temperatura 10 15 20 25 30
Comprimento 1.003 1.005 1.010 1.011 1.014
Diagrama de dispersão

1.016
1.014
comprimento

1.012
1.01
1.008
1.006
1.004
1.002
0 10 20 30 40
temperatura
Tipos de correlação
Forte correlação linear positiva

60

50

40

30

20

10

0
0 10 20 30 40
Correlação linear positiva

60

50

40

30

20

10

0
0 10 20 30 40
Correlação linear negativa

25

20

15

10

0
0 5 10 15
Forte correlação linear negativa

25

20

15

10

0
0 5 10 15
Não há correlação

50

40

30

20

10

0
0 5 10 15
Correlação não linear

10

0
0 1 2 3 4 5 6
Coeficiente de correlação linear ( r )

 Mede a intensidade da relação linear entre os


valores quantitativos emparelhados x e y em
uma amostra.
 Calculado da seguinte forma:

n xy  ( x)( y )
r
n(  x 2 )  (  x ) 2 n(  y 2 )  (  y ) 2
Propriedades

 O valor de r está sempre entre 1 e -1,


inclusive.
 O valor de r não varia para escalas
diferentes.
 O valor de r não é afetado se trocar a
variável x por y, e vice versa.
 r mede a intensidade apenas de uma relação
linear.
Equação da regressão

 Dada uma coleção de dados amostrais


emparelhados, a equação de regressão
Y = b0 +b1x
descreve algebricamente a relação entre as
duas variáveis. O gráfico da equação de
regressão é chamado de reta de regressão
(reta de melhor ajuste ou reta de mínimos
quadrados).
Determinando b1 e b0.
n( xy )  ( x)( y)
b1 
n(  x )  (  x )
2 2

b0  y  b1 x

Onde x e y são as médias amostrais.


Exercício 1

Verifique se existe uma correlação linear entre


a taxa de armas automáticas registradas e a
taxa de criminalidade.

Se possível fazer a regressão linear.


Taxa de armas Taxa de
registradas criminalidade
x y xy xx yy
4 0.6 4.4 2.64 0.36 19.36
7 2.4 3.6 8.64 5.76 12.96
6 2.5 6.6 16.5 6.25 43.56
8 2.6 5.3 13.78 6.76 28.09
3 3.6 10.1 36.36 12.96 102.01
5 6.9 11.5 79.35 47.61 132.25
2 8.3 10.6 87.98 68.89 112.36
1 11.6 13.1 151.96 134.56 171.61
Total 38.5 65.2 397.21 283.15 622.2
Coeficiênte de correlação, r = 0.88

Equação da reta:

y = 0.85x + 4.06
Taxa
Taxa de armas de
registradas criminalidade
x Y reta desvios
1 0.6 4.4 4.57 -0.17
2 2.4 3.6 6.1 -2.5
3 2.5 6.6 6.185 0.415
4 2.6 5.3 6.27 -0.97
5 3.6 10.1 7.12 2.98
6 6.9 11.5 9.925 1.575
7 8.3 10.6 11.115 -0.515
8 11.6 13.1 13.92 -0.82
Total 38.5 65.2
Exercício 2

 Certa empresa, estudando a


variação da demanda de seu
produto em relação a variação de
preço de venda, obteve a seguinte
tabela:
preço demanda x.y xx yy
1 38 350 13300 1444 122500
2 42 325 13650 1764 105625
3 50 297 14850 2500 88209
4 56 270 15120 3136 72900
5 59 256 15104 3481 65536
6 63 246 15498 3969 60516
7 70 238 16660 4900 56644
8 80 223 17840 6400 49729
9 95 215 20425 9025 46225
10 110 208 22880 12100 43264
Total 663 2628 165327 48719 711148
 Determine o coeficiente de correlação.
 Estabeleça a equação da reta de
regressão
 Estime o valor da demanda para x = 60
e para x = 120.
Coeficiênte de correlação, r = -0.9

Equação da reta:

y = -1,87x + 386,78
preço demanda reta desvios
1 38 350 315.72 34.28
2 42 325 308.24 16.76
3 50 297 293.28 3.72
4 56 270 282.06 -12.06
5 59 256 276.45 -20.45
6 63 246 268.97 -22.97
7 70 238 255.88 -17.88
8 80 223 237.18 -14.18
9 95 215 209.13 5.87
10 110 208 181.08 26.92
Total 663 2628
Análise Final
 Calcular os desvios.
 Analisar se existe algum padrão, tanto na
distância como no sinal dos desvios.
 O melhor ajuste deve ter uma dispersão
aleatória dos desvios.

Você também pode gostar