Você está na página 1de 37

Regresso Linear

anlise dos pressupostos

Examinando os resduos

Anlise de Resduos

A anlise dos resduos revela:

se a presuno de normalidade da distribuio dos resduos se


confirma;

pode revelar se a varincia dos resduos realmente constante,


ou seja, se a disperso dos dados em torno da reta de
regresso uniforme;

se h ou no uma varivel no identificada que deve ser


includa no modelo;

se a ordem em que os dados foram coletados ( p. ex., tempo da


observao) tem algum efeito sobre os dados, ou se a ordem
deve ser incorporada como uma varivel no modelo.

se a presuno de que os resduos no so correlacionados


est satisfeita.

Premissas dos Testes


Estatsticos

Premissas em relao aos resduos:


So

aleatrios com distribuio normal ?


So independentes entre si ?
Tm Valor Esperado = 0 ?
Possuem Varincia Constante ?

Premissas em relao aos dados:


Modelo

linear nos parmetros

Premissas dos Testes


Estatsticos

Os intervalos de confiana e os testes


estatsticos s sero vlidos se essas
premissas forem verdadeiras para os dados
que esto sendo analisados
Portanto, necessrio verificar se essas
premissas esto presentes antes de
analisar a regresso

Checando as premissas
pelas ferramentas do Excel

Usar os grficos:
Plotagem

dos Resduos

Se os dados atendem s premissas, o grfico


deve mostrar uma faixa horizontal centrada em
torno do 0, sem mostrar uma tendncia positiva
ou negativa
Plotagem

de Probabilidade Normal

Se o grfico aproximadamente linear, podemos


assumir que os resduos tm distribuio normal
6

Testando a adequao do modelo


Resduos

Se o grfico dos resduos mostra


uma tendncia sistemtica positiva
ou negativa significa que uma outra
funo (no linear) deve ser
escolhida.

Resduos

Testando a Existncia de
Variveis Esquecidas
Os resduos no esto
aleatoriamente distribudos em
torno de zero

Se o grfico dos resduos


demonstra um padro quando
plotado contra determinada
varivel, esta varivel deve ser
includa no modelo ao lado do X

Checando Igualdade da
Varincia dos Resduos
A varincia dos resduos indicada pela largura da disperso
dos resduos, quando o valor de x aumenta
Se essa largura aumenta ou diminui quando o valor de x
aumenta, a varincia no constante
Este problema denominado heterocedasticidade
Quando existe heterocedasticidade o mtodo dos mnimos
quadrados no pode ser usado para estimar a regresso,
devendo ser usado um mtodo mais complexo chamado
mnimos quadrados geral.

Checando Heterocedasticidade
Resduos

Resduos

Resduos parecem aleatrios, sem


padro
10

A varincia residual est crescendo

Examinando autocorrelao

11

Examinando autocorrelao

x
12

Examinando autocorrelao

13

Checando as premissas por


Testes dos Pressupostos
Testes bsicos para validao do modelo de
regresso simples
Normalidade dos resduos
Homocedasticidade
Ausncia de autocorrelao dos resduos
Linearidade dos parmetros

14

Normalidade dos resduos


Os resduos devem apresentar distribuio
normal
Identificao da Normalidade:
Compara-se a distribuio dos resduos
com a curva normal
Testes:
Kolmogorov-Smirnov (no paramtrico)
Jarque-Bera (paramtrico assinttico)

15

Normalidade dos resduos


Teste Kolmogorov-Smirnov
H0: distribuio normal
H1: distribuio no normal
Testa a proximidade ou a diferena entre freqncia observada e esperada.
Geralmente, K-S menor que 0,3 indica que a distribuio est apropriada.

Estatstica K-S usa a distribuio D.


D Dcrtico aceita a Hiptese Nula

i
D max. z i
n

16

Normalidade dos resduos


Teste de Jarque-Bera
H0: distribuio normal
H1: distribuio no normal
JB JBcrtico aceita a Hiptese Nula

Estatstica JB qui-quadrado (2( )com 2 gl)

JB = n . [ A2/6 + (C-3)2/24]
onde:
A = assimetria
17
C = curtose

Normalidade dos resduos


Se a distribuio no for normal?
Estimativas no sero eficientes; maior erro
padro
Possveis causas:
Omisso de variveis explicativas
importantes
Formulao matemtica incorreta (forma
funcional)
Soluo:
18
Incluir novas variveis

Homocedasticidade

19

Homocedasticidade
Os resduos devem apresentar a mesma
varincia para cada observao de X
Avalia-se o contedo informacional dos resduos
Identificao da homocedasticidade
Analisa-se a evoluo da disperso dos
resduos em torno da sua mdia, medida
que X aumenta
Examina-se a distribuio dos resduos para
cada observao de X
Testes: Pesarn-Pesarn; BPG; RESET de
Ramsey; White; etc.
20

Homocedasticidade
Teste de Pesarn-Pesarn:

2 = f (Yc2)

Regride-se o quadrado dos resduos (2)


como funo do quadrado dos valores
estimados (Yc2)
Avalia-se o coeficiente de Yc2
H0: resduos homocedsticos
H1: resduos heterocedsticos
21

Homocedasticidade
Se a distribuio no for homocedstica?
Estimativas no sero eficientes; maior erro
padro
Possveis causas:
Diferenas entre os dados da amostra
a. modelo da aprendizagem
b. discricionariedade no uso da renda
c. diferenas em dados em corte (crosssection)
d. erro de especificao
22

Homocedasticidade

Soluo:
Mudar a forma funcional atravs de
transformaes das variveis
Estimar a regresso via mnimos quadrados
ponderados

23

Ausncia de autocorrelao
O modelo pressupe que:
correlao entre os resduos zero
o efeito de uma observao nulo sobre a
outra
no h causalidade entre os resduos e a
varivel X, e, por conseqncia, a varivel
Y
Identificao da autocorrelao
Analisa-se a disperso dos resduos em torno
da sua mdia
Teste de Durbin-Watson
24

Ausncia de autocorrelao
Teste de Durbin-Watson
H0: No existe correlao serial dos
resduos
H1: Existe correlao serial dos resduos
Estatstica DW = (x - x-1)2 / x2

25

Ausncia de autocorrelao
Anlise da Estatstica DW

Autocorrelao
positiva

Regio no
conclusiva

dL

26

Ausncia de
Autocorrelao

dU

Regio no
conclusiva

4-dU

Autocorrelao
negativa

4-dL

Ausncia de autocorrelao
Se os resduos forem correlacionados?
Estimativas no eficientes; maior erro padro
Possveis causas:
Em sries temporais
inrcia
vis de especificao
falta de variveis
forma funcional incorreta
defasagem nos efeitos das vriveis
manuseio dos dados (interpolao / extrapolao)
27

Ausncia de autocorrelao

Soluo:
Formular corretamente a relao

28

funcional
Tornar a srie estacionria

Regresso Linear Mltipla


Extenso do modelo de regresso linear
Valem as hipteses de
Distribuio Normal dos Resduos
Homocedasticidade
Ausncia de autocorrelao
Linearidade nos parmetros
Adicionalmente
Ausncia de multicolinearidade

29

Multicolinearidade

Ocorre com duas ou mais variveis


independentes do modelo explicando o
mesmo fenmeno
Variveis contm informaes similares
Exemplo

Explicar

preo de uma casa com


regresso que tenha como variveis
explicativas a rea da casa e o
nmero de cmodos

30

Multicolinearidade
o Duas ou mais variveis independentes
altamente correlacionadas
o Dificuldade na separao dos efeitos de
cada uma das variveis
o A multicolinearidade tende a distorcer os
coeficientes (b) estimados

31

Multicolinearidade
Conseqncias
Erros padro maiores
Menor eficincia
Estimativas mais imprecisas
Estimadores sensveis a pequenas
variaes dos dados
Dificuldade na separao dos efeitos de
cada uma das variveis
32

Multicolinearidade

Identificao atravs dos Testes seguintes


FARRAR & GLAUBER
VIF (VARIANCE INFLATION FACTOR)
TOLERANCE

33

Multicolinearidade
Identificao

Teste de Farrar & Glauber

2 crtico com g.l. = k . (k-1) / 2


1
2 = -[n - 1 - 1/6 . (2.k+5)] . Ln(det

r21

r12 ........r1k
1 ........r2k

rk1

rk2 ........ 1

onde: n = nmero de observaes


k = nmero de variveis
Ln = logaritmo neperiano
det = determinante
rij = coeficiente de correlao parcial
34

Multicolinearidade
Teste de aceitao

Teste de Farrar & Glauber

H0: Ausncia de Multicolinearidade


H1: Existe Multicolinearidade

2 teste > 2 crtico Rejeita a hiptese nula de ausncia de


multicolinearidade (H correlao entre as
variveis)

35

Multicolinearidade
Identificao

VIF

VIFk = 1 / ( 1 - rk2)
Regra de bolso para o VIF
at 1 - sem multicolinearidade
de 1 at 10 - multicolinearidade aceitvel
acima de 10 - multicolinearidade problemtica
onde: rk = coeficiente de correlao da varivel K com as demais variveis

36

Multicolinearidade
Identificao
Tolerancek = ( 1 - rk2)
Regra de bolso para o ndice Tolerance
at 1 - sem multicolinearidade
de 1 at 0,10 - multicolinearidade aceitvel
abaixo de 0,10 - multicolinearidade problemtica
onde: rk = coeficiente de correlao da varivel K com as demais variveis

37

Você também pode gostar