Você está na página 1de 37

Regresso Linear

anlise dos pressupostos


Examinando os resduos

2
Anlise de Resduos
A anlise dos resduos revela:
se a presuno de normalidade da distribuio dos resduos
se confirma;
pode revelar se a varincia dos resduos realmente
constante, ou seja, se a disperso dos dados em torno da reta
de regresso uniforme;
se h ou no uma varivel no identificada que deve ser
includa no modelo;
se a ordem em que os dados foram coletados ( p. ex., tempo
da observao) tem algum efeito sobre os dados, ou se a
ordem deve ser incorporada como uma varivel no modelo.
se a presuno de que os resduos no so correlacionados
est satisfeita.
3
Premissas dos Testes
Estatsticos

Premissas em relao aos resduos:


So aleatrios com distribuio normal ?
So independentes entre si ?
Tm Valor Esperado = 0 ?
Possuem Varincia Constante ?
Premissas em relao aos dados:
Modelo linear nos parmetros

4
Premissas dos Testes
Estatsticos

Os intervalos de confiana e os testes


estatsticos s sero vlidos se essas
premissas forem verdadeiras para os dados
que esto sendo analisados
Portanto, necessrio verificar se essas
premissas esto presentes antes de
analisar a regresso

5
Checando as premissas
pelas ferramentas do Excel
Usar os grficos:
Plotagem dos Resduos
Se os dados atendem s premissas, o grfico
deve mostrar uma faixa horizontal centrada em
torno do 0, sem mostrar uma tendncia positiva
ou negativa
Plotagem de Probabilidade Normal
Se o grfico aproximadamente linear, podemos
assumir que os resduos tm distribuio normal

6
Testando a adequao do modelo
Resduos

Se o grfico dos resduos mostra


uma tendncia sistemtica positiva
0
ou negativa significa que uma outra
funo (no linear) deve ser
escolhida.

7
Testando a Existncia de
Resduos
Variveis Esquecidas

Os resduos no esto
aleatoriamente distribudos em
0 torno de zero

Se o grfico dos resduos


demonstra um padro quando
plotado contra determinada
X varivel, esta varivel deve ser
includa no modelo ao lado do X

8
Checando Igualdade da
Varincia dos Resduos
A varincia dos resduos indicada pela largura da disperso dos resduos, quando o valor de x
aumenta
Se essa largura aumenta ou diminui quando o valor de x aumenta, a varincia no constante
Este problema denominado heterocedasticidade
Quando existe heterocedasticidade o mtodo dos mnimos quadrados no pode ser usado para
estimar a regresso, devendo ser usado um mtodo mais complexo chamado mnimos quadrados
geral.

9
Checando Heterocedasticidade
Resduos Resduos

0 0

X X

Resduos parecem aleatrios, sem A varincia residual est crescendo


padro
10
Examinando autocorrelao








0 0


x x

11
Examinando autocorrelao




0 0






x x
12
Examinando autocorrelao



0
x

13
Checando as premissas por
Testes dos Pressupostos

Testes bsicos para validao do modelo de


regresso simples

Normalidade dos resduos


Homocedasticidade
Ausncia de autocorrelao dos resduos
Linearidade dos parmetros

14
Normalidade dos resduos

Os resduos devem apresentar distribuio


normal

Identificao da Normalidade:
Compara-se a distribuio dos resduos
com a curva normal
Testes:
Kolmogorov-Smirnov (no paramtrico)
Jarque-Bera (paramtrico assinttico)

15
Normalidade dos resduos
Teste Kolmogorov-Smirnov
H0: distribuio normal
H1: distribuio no normal
Testa a proximidade ou a diferena entre freqncia observada e esperada.
Geralmente, K-S menor que 0,3 indica que a distribuio est apropriada.

Estatstica K-S usa a distribuio D.


D Dcrtico aceita a Hiptese Nula
i
D max. z i
n
16
Normalidade dos resduos
Teste de Jarque-Bera
H0: distribuio normal
H1: distribuio no normal

JB JBcrtico aceita a Hiptese Nula

Estatstica JB qui-quadrado (2( )com 2 gl)

JB = n . [ A2/6 + (C-3)2/24]
onde:
A = assimetria
C = curtose
17
Normalidade dos resduos

Se a distribuio no for normal?


Estimativas no sero eficientes; maior erro
padro

Possveis causas:
Omisso de variveis explicativas
importantes
Formulao matemtica incorreta (forma
funcional)

Soluo:
18
Incluir novas variveis
Homocedasticidade

19
Homocedasticidade
Os resduos devem apresentar a mesma
varincia para cada observao de X
Avalia-se o contedo informacional dos resduos

Identificao da homocedasticidade
Analisa-se a evoluo da disperso dos
resduos em torno da sua mdia, medida
que X aumenta
Examina-se a distribuio dos resduos para
cada observao de X
Testes: Pesarn-Pesarn; BPG; RESET de
Ramsey; White; etc.
20
Homocedasticidade

Teste de Pesarn-Pesarn:
2 = f (Yc2)

Regride-se o quadrado dos resduos (2)


como funo do quadrado dos valores
estimados (Yc2)
Avalia-se o coeficiente de Yc2
H0: resduos homocedsticos
H1: resduos heterocedsticos
21
Homocedasticidade

Se a distribuio no for homocedstica?


Estimativas no sero eficientes; maior erro
padro

Possveis causas:
Diferenas entre os dados da amostra
a. modelo da aprendizagem
b. discricionariedade no uso da renda
c. diferenas em dados em corte (cross-
section)
d. erro de especificao
22
Homocedasticidade

Soluo:
Mudar a forma funcional atravs de
transformaes das variveis
Estimar a regresso via mnimos quadrados
ponderados

23
Ausncia de autocorrelao

O modelo pressupe que:


correlao entre os resduos zero
o efeito de uma observao nulo sobre a
outra
no h causalidade entre os resduos e a
varivel X, e, por conseqncia, a varivel
Y
Identificao da autocorrelao
Analisa-se a disperso dos resduos em torno
da sua mdia
Teste de Durbin-Watson
24
Ausncia de autocorrelao

Teste de Durbin-Watson

H0: No existe correlao serial dos


resduos
H1: Existe correlao serial dos resduos

Estatstica DW = (x - x-1)2 / x2

25
Ausncia de autocorrelao

Anlise da Estatstica DW

Autocorrelao Regio no Ausncia de Regio no Autocorrelao


positiva conclusiva Autocorrelao conclusiva negativa

0 dL dU 4-dU 4-dL 4

26
Ausncia de autocorrelao

Se os resduos forem correlacionados?


Estimativas no eficientes; maior erro padro

Possveis causas:
Em sries temporais
inrcia
vis de especificao
falta de variveis
forma funcional incorreta
defasagem nos efeitos das vriveis
manuseio dos dados (interpolao / extrapolao)
27
Ausncia de autocorrelao

Soluo:
Formular corretamente a relao
funcional
Tornar a srie estacionria

28
Regresso Linear Mltipla
Extenso do modelo de regresso linear
Valem as hipteses de
Distribuio Normal dos Resduos
Homocedasticidade
Ausncia de autocorrelao
Linearidade nos parmetros
Adicionalmente
Ausncia de multicolinearidade

29
Multicolinearidade

Ocorre com duas ou mais variveis


independentes do modelo explicando o
mesmo fenmeno
Variveis contm informaes similares
Exemplo
Explicar preo de uma casa com
regresso que tenha como variveis
explicativas a rea da casa e o
nmero de cmodos
30
Multicolinearidade

o Duas ou mais variveis independentes


altamente correlacionadas
o Dificuldade na separao dos efeitos de
cada uma das variveis
o A multicolinearidade tende a distorcer os
coeficientes (b) estimados

31
Multicolinearidade

Conseqncias
Erros padro maiores
Menor eficincia
Estimativas mais imprecisas
Estimadores sensveis a pequenas
variaes dos dados
Dificuldade na separao dos efeitos de
cada uma das variveis

32
Multicolinearidade

Identificao atravs dos Testes seguintes


FARRAR & GLAUBER
VIF (VARIANCE INFLATION FACTOR)
TOLERANCE

33
Multicolinearidade

Identificao Teste de Farrar & Glauber

2 crtico com g.l. = k . (k-1) / 2

1 r12 ........r1k
2 = -[n - 1 - 1/6 . (2.k+5)] . Ln(det r21 1 ........r2k )

rk1 rk2 ........ 1


onde: n = nmero de observaes
k = nmero de variveis
Ln = logaritmo neperiano
det = determinante
rij = coeficiente de correlao parcial
34
Multicolinearidade

Teste de aceitao Teste de Farrar & Glauber

H0: Ausncia de Multicolinearidade


H1: Existe Multicolinearidade

2 teste > 2 crtico Rejeita a hiptese nula de ausncia de


multicolinearidade (H correlao entre as
variveis)

35
Multicolinearidade

Identificao VIF

VIFk = 1 / ( 1 - rk2)

Regra de bolso para o VIF


at 1 - sem multicolinearidade
de 1 at 10 - multicolinearidade aceitvel
acima de 10 - multicolinearidade problemtica

onde: rk = coeficiente de correlao da varivel K com as demais variveis

36
Multicolinearidade

Identificao

Tolerancek = ( 1 - rk2)

Regra de bolso para o ndice Tolerance


at 1 - sem multicolinearidade
de 1 at 0,10 - multicolinearidade aceitvel
abaixo de 0,10 - multicolinearidade problemtica

onde: rk = coeficiente de correlao da varivel K com as demais variveis

37

Você também pode gostar