Você está na página 1de 17

Regressão Linear

Simples
Análise de Resíduos: verificando as
suposições do modelo

Profa. Ilka Afonso Reis – DEST - UFMG


Recapitulando …
(modelo de regressão linear)

Modelo Yi = β 0 + β1 X i + ε i , i = 1, 2, 3..., n
iid
εi ~ N (0, σ )
2

Yˆi = βˆ0 + βˆ1 X i , i = 1, 2, 3..., n


Preditos pelo
modelo

Resíduos εˆi = Yi − Yˆi , i = 1, 2, 3..., n

2
Análise de Resíduos

ei = yi − yˆi

Os resíduos ei podem ser


vistos como observações
das variáveis aleatórias εi,
que são os erros do
modelo.

3
Os resíduos de um modelo de regressão podem
ser usados para investigar a adequação do
modelo e das suposições feitas.

Assim, uma parte importante do ajuste de um modelo


de regressão é a análise dos resíduos deste modelo.

Essa análise é feita de maneira visual, com auxílio de


gráficos.

4
Análise de Resíduos

Gráficos mais utilizados:

• Papel de Probabilidade Normal dos resíduos


• Gráficos de dispersão dos resíduos:
• Resíduos versus preditos pelo modelo ;
• Resíduos versus variáveis explicativas no modelo ;
• Resíduos versus ordem de coleta (se houver)

5
Para avaliar a normalidade dos erros
Papel de Probabilidade Normal dos Resíduos

Normal Probability Plot of the Residuals


(response is gasto.todos)
99.9

99

95
90
80
70
Percent

60
50
40
30
20
10
5

0.1
-1000 -500 0 500 1000
Residual
6
30
Exemplos de padrões no
25
20 Papel de Probabilidade
Sample Quantiles

Normal dos Resíduos que


15

denunciam a falta de
10

normalidade na distribuição
dos erros do modelo de
5

regressão.
0

-3 -2 -1 0 1 2 3

Theoretical Quantiles
4

2.0
2
Sample Quantiles

Sample Quantiles

1.5
0
-2

1.0
-4

0.5

-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
7
Theoretical Quantiles Theoretical Quantiles
Gráficos de dispersão dos resíduos
desejável
resíduo

resíduo
( y,ˆ x ) ( y,ˆ x )

resíduo
resíduo

( y,ˆ x ) ( y,ˆ x )

8
Diagrama de dispersão: resíduos versus preditos
Para avaliar se a forma linear adotada para a
relação entre resposta e explicativa está correta

Pode ser mostrado que, se a relação entre a resposta e


a explicativa é linear, ou seja, da forma
Y = a + bX + ε, então

cor (εˆi , Yˆi ) = 0


Assim, na avaliação do diagrama de dispersão dos Resíduos
contra os valores Preditos para a resposta, não devemos
observar nenhum padrão de correlação.

9
Diagrama de dispersão: resíduos versus preditos
Para avaliar se a forma linear adotada para a
relação entre resposta e explicativa está correta

Residuals Versus the Fitted Values


(response is gasto.todos)
750

500

250
Residual

-250

-500

500 750 1000 1250 1500 1750 2000 2250


Fitted Value
10
Diagrama de dispersão: resíduos versus variáveis
presentes do modelo
Para avaliar se a suposição de variância
constante dos erros
Residuals Versus renda.todos
(response is gasto.todos)
750

500

250
Residual

-250

-500

500 1000 1500 2000 2500


renda.todos 11
Diagrama de dispersão: resíduos versus variáveis
fora do modelo

Para avaliar se essas variáveis podem explicar parte do que não


foi explicado pelas variáveis que já estão no modelo
Residuals Versus sexo
(response is gasto.todos)
750

500

250
Residual

-250

-500

0.0 0.2 0.4 0.6 0.8 1.0


sexo 12
Detecção de outliers
(padronização de resíduos)

ei
Resíduos di = , i = 1, 2, 3..., n
padronizados
σˆ 2

Se os erros seguirem a distribuição Normal, cerca de 95% dos


resíduos padronizados devem estar no intervalo [-2 ; 2]

Observações que geram resíduos padronizados fora deste


intervalo devem ser investigadas como possíveis outliers.

13
Exemplo: Gasto e Renda

Predictor Coef SE Coef T P


Constant 104.33 79.05 1.32 0.190
renda.todos 0.82258 0.04915 16.74 0.000

Source DF SS MS F P
Regression 1 21960510 21960510 280.14 0.000
Residual Error 98 7682403 78392
Total 99 29642913

Unusual Observations
Obs renda.todos gasto.todos Fit SE Fit Residual St Resid
89 1549 2001.4 378.5 28.1 622.9 2.24R
2500

2000
gasto.todos

1500

1000

500

500 1000 1500 2000 2500


renda.todos

Gasto = 99.3 + 0.822 renda Reta estimada sem o outlier


Gasto = 104 + 0.823 renda Reta estimada com o outlier
15
Laboratório R:

funções lm(), predict(),


resid(), rstandard()
qqnorm()

Lab_R_Topico 02_Aula 10.R

16
Leitura

 Aula de hoje: Análise de Resíduos


 Montgomery, DC e Runger, GC (Estatística Aplicada e
Probabilidades para Engenheiros)
• Capítulo 11 - Regressão Linear Simples (seções 11-8,
11-1 e 11-2)

 Próxima aula: Regressão Linear Simples: relações


linearizáveis
 Montgomery, DC e Runger, GC
Capítulo 11 - Regressão Linear Simples

17

Você também pode gostar