Você está na página 1de 11

15/06/2018

Regressão e Correlação
Linear Simples

Prof. Quintiliano Nomelini

Correlação Linear

 O termo correlação significa


relação em dois sentidos (co +
relação) e é usado para designar a
força da relação entre duas ou
mais variáveis.
Ex:
 Peso e estatura de pessoas;
 Quantidade de chuva e
produtividade agrícola;
 Teor de ferro e capacidade de
carga de vigas de concreto;
 Custo de manutenção e idade do
veículo. 2

 O comportamento conjunto de duas


variáveis quantitativas pode ser observado
através do diagrama de dispersão e medido
através do coeficiente de correlação.

correlação positiva
correlação negativa

O Coeficiente de Correlação ( r ) mede o grau


de correlação de duas variáveis

1
15/06/2018

Diagrama de Dispersão

Diagrama de Dispersão
140.000

120.000
Tempo de entrega (h)

100.000

80.000

60.000

40.000

20.000

0.000
0 500 1000 1500 2000 2500 3000
Peso (kg)

Correlação NÃO LINEAR

30
28
26
24
22
Peso

20
18
16
14
12
10
90 95 100 105 110
Comprimento

Gráfico 1- Comprimento (cm) e peso (kg) de cães.


crianças desnutridas
r = 0,77 6

2
15/06/2018

4
4.5
abdominal (cm)

3
3.5
(ton./m2)

3
perímetro

2
2.5
AumentoCarga

1
0.5
1

0
4.50 5.50 6.50 7.50 8.50 9.50
Ferro (% peso)
% gordura

Gráfico1.1-
Grafico Efeito
Efeito do teor de de
da porcentagem ferro na capacidade
gordura desobre
na alimentação cargao
de vigasdodeperímetro
concreto.
aumento abdominal (cm). r = 0,92
7

2.5

2
Número riachos

1.5

r = - 0,15
0.5

0
0 0.5 1 1.5 2 2.5
Poços artesianos

Gráfico 2- Número de poços artesianos e número de


riachos ou rios presentes numa sub-região.
8

Karl Pearson (1857 – 1936)

A partir de somas de produtos


e
somas de quadrados ajustadas obteve-se
 X. Y
 XY  n SP
r  XY

 X 2
  X2  
   Y 2
.  Y 2  


SQ .SQ
X Y
 n  n 
  

SPXY   XY 
 X. Y
n
 X  2  Y  2

SQy   Y 
2
 X 
2
SQx n
n
9

3
15/06/2018

Valores possíveis de r e interpretação da correlação

Sentido Força
+1 Forte
Positiva Moderada

Fraca
Valor Ausência
0
de r
Fraca

Moderada
Negativa
Forte
-1
Barreta et al., Atlas 2004
10

Correlação

Correlação não significa CAUSALIDADE!

Pode ter o efeito de uma outra variável que não esta


sendo avaliada

11

Ex: O gráfico mostra a população de Oldemberg,


Alemanha, no fim de cada um dos 7 anos (Y)
contra o número de cegonhas (pássaros) naquele
ano (X).

Interpretação: existe associação entre X e Y.


No exemplo, X e Y aumentam com W = tempo.
12

4
15/06/2018

Exemplo: Alta correlação entre X: salário de


prof. Universitários e Y: consumo de
bebidas alcoólicas ou consumo de
automóveis.
Existe uma variável W: aumento geral do
padrão de vida no país.

Exemplo: Alta correlação entre X: consumo


anual de chicletes nos EUA e Y: incidência
de crimes.
Existe uma variável W: aumento do tamanho
da população.
13

Exemplo
 Relação entre o número de pessoas atendidas
em um PS e o número de uma determinada
cirurgia semanal para uma amostra de 10
hospitais.
Hospitais Atendimentos Cirurgias
1 907 11
2 926 11
3 506 7
4 741 9
5 789 9
6 889 10
7 874 9
8 510 6
9 529 7
10 420 6
14

Diagrama de Dispersão

14

12

10
Vendas

. 8

0
300 400 500 600 700 800 900 1000 1100
Atendimentos
Número de clientes

15

5
15/06/2018

10

x
Hospitais Atendimentos (X) Cirurgias (Y) X*Y X^2 Y^2
1
2
907
926
11
11
9977 822649
10186 857476
121
121 i  7091
3 506 7 3542 256036 49 i 1
4 741 9 6669 549081 81 10

y  85
5 789 9 7101 622521 81
6 889 10 8890 790321 100 i
7 874 9 7866 763876 81
i 1
8 510 6 3060 260100 36
10

 x  y   63514
9 529 7 3703 279841 49
10 420 6 2520 176400 36
TOTAL 7091 85 63514 5378301 755 i i
10 i 1

y 
10
 755
 x 
2
 5378301
2

i 1
i
i 1
i
n  10
(7091  85)
63514 
r 10  0,9607
5378301  7091
2
 755 
852
10 10
FORTE CORRELAÇÃO LINEAR POSITIVA!
16

 O coeficiente rXY é capaz de medir a força


que mantém unidas duas variáveis X e Y

Agora vamos estudar as Leis (Matemática) que explicam como


essas variáveis estão unidas e como é possível obter um dado
desconhecido (predizer) a partir de seu par conhecido com
razoável aproximação.

17

Regressão Linear Simples

18

6
15/06/2018

INTRODUÇÃO

 Em numerosos casos, o objetivo é


estabelecer relações que possibilitem
predizer uma ou mais variáveis em
termos de outras.
Ex:
 Vendas futuras de um produto em
função do seu preço
 Perda de peso de uma pessoa em
decorrência do número de semanas
que se submete a uma dieta
 Despesa de uma família com médico e
remédios em função de sua renda
19

Regressão Linear Simples


 Linear: porque a disposição dos
pontos permite interpolar-lhes uma
Reta;

 Simples: porque só há 2 variáveis


envolvidas no processo.

20

Para cada elemento amostral, obtém duas medidas


Objetivo  estudar o relacionamento de X e Y

População Amostra
X1
1
Y1
X2
2
Y2
.
.
.
Xn
n
Yn

21

7
15/06/2018

Variaveis Independentes x Variáveis Dependente

Variável independente, Variável dependente,


X Y
Despesas com marketing (R$) Volume de vendas

Participação de mercado (%) Rentabilidade (R$)

Renda (R$) Consumo (R$)

Memória RAM do computador Tempo de resposta do sistema (s)


(Gb)
Área construída do imóvel Preço do imóvel (R$)
(m2)

Barreta et al., Atlas 2004 22

De todas as retas possíveis, somente a que


apresente melhor ajustamento a todos os
pontos é que deve ser escolhida.
30
28
26
24
22
Peso

20
18
16
14
12
10
90 95 100 105 110
Comprimento

Método dos Quadrados Mínimos


23

 Equação geral da regressão linear simples


Yˆ i = b + aXi
 obter as estimativas “a” e “b” dos parâmetros
e

 : coeficiente linear da reta


 : coeficiente angular da reta

24

8
15/06/2018

 X  Y 
 XY   n 
ˆ
a
 X
X  
2
2

bˆ 
 Y  bˆ X 
Y a
ˆ X Y a
ˆX
n n n

25

ATE QUE PONTO A PREVISÃO E


VÁLIDA?

Coeficiente de Determinação (r2):


representa a proporção da variação
total explicada pela regressão de Y
para X
0  r2  1

26

r2: é o quanto da variabilidade total dos


dados é explicada pelo modelo de regressão.
Quanto maior o r2 mais a variação total de Y
é explicada pela introdução da preditora X no
modelo.
Y
Y r2=0
r2=1
Yˆ  b0  b1 X  
   
 
  
   
  
 



X
X A v. X não ajuda na redução da
A variável preditora X é responsável por variação de Yi com a Reg. Linear
toda a variação nas observações Yi .
27

9
15/06/2018

Exemplo1: Dado o conjunto de dados, determine a equação de


regressão linear.

X Y

0 2
1 5
2 8
3 11

28

Exemplo2. Dados referentes a porcentagem de participação de mercado de 10 empresas


atacadistas e seus rendimentos anual em milhões de reais.

Participação de Mercado Rendimento (milhões de


Empresa (%) reais)
1 26 23
2 25 21
3 31 28
4 29 27
5 27 23
6 31 28
7 32 27
8 28 22
9 30 26
10 30 25

a) Ajustar os dados a um intervalo linear.


b) Uma empresa com 24% de participação de mercado, qual deverá ser seu rendimento anual?

29

30

10
15/06/2018

31

PRÓXIMA AULA

Regressão
Linear
no
Excel
32

11

Você também pode gostar