Você está na página 1de 52

Correlação Serial

Aula 31

Gujarati, 2006 – Capítulo 12 (trad. da 4a. ed.)


Recomenda-se uma leitura DETALHADA!!!!
INTRODUÇÃO

Em estudos com dados do tipo cross-section as


observações, no geral, são coletadas por meio de
amostragem aleatória, de modo que não há razão, a
priori, para considerar que os termos de erros
aleatórios sejam correlacionados.
INTRODUÇÃO
Todavia, se tal correlação for observada, a mesma
será denominada por correlação espacial. Isto é,
correlação no espaço e não ao longo do tempo
(autocorrelação).

Contudo, é importante recordar que na análise de


dados do tipo cross-section o ordenamento dos
dados deve ter alguma lógica para podermos
determinar se há presença de correlação espacial
ou não.
INTRODUÇÃO
Do anteriormente exposto, os slides dessa aula têm como
objetivo responder às seguintes perguntas:

Qual é a natureza da correlação serial (quer seja espacial,


no caso de uma base de dados do tipo cross-section, ou
temporal, no caso de séries temporais)?
O que acontece com as propriedades dos estimadores dos
parâmetros quando a suposição de ausência de correlação
entre os erros é violada?
Como podemos testar se há ou não correlação entre os
erros?
Caso exista, como podemos corrigir o problema da
correlação?
Quando ocorre?

Ocorre principalmente quando os


dados são observados ao longo do tempo.

5
Observação
Autocorrelação (correlação serial) de primeira
ordem: correlação existente entre uma observação
qualquer num instante t e outra observação no
instante t-1 (ou t+1).

Autocorrelação (correlação serial) de ordem q:


correlação existente entre uma observação qualquer
num instante t e outra observação no instante t-q (ou
t+q).
6
Quando ocorre?
No caso de uma cross-section, pode ocorrer, por
exemplo, no caso de omissão de variável relevante.
Exemplo:

yt   0  1 x1t   2 x1t
2
 ut
40.00

35.00

30.00

(Modelo Verdadeiro) 25.00

20.00

15.00

yt  0
*
 1 x1t
*
 *
ut 10.00

5.00

0.00

(Modelo especificado) 0 2 4 6 8 10 12 14 16 18

Seqüência de resíduos + e -
7
Quais as conseqüências?
Os estimadores de MQO, na classe dos lineares,
continuam não viesados, consistentes e assintoticamente
normais, mas deixam de ser os mais eficientes (BLUE).

O estimador da variância do erro será viesado e, por


consequência, as variâncias estimadas para os
estimadores dos parâmetros do modelo de regressão
também (em geral, subestimadas).

Os testes t, F e 2 podem não ser válidos. Sendo assim,


teremos que recorrer a providências corretivas.
Modelo de regressão linear múltipla
yi = … +
0 + x
1 1i + k xki + i

Algumas Suposições:
(a) Var ( i) = 2: constante, não varia com i
(homocedasticidade).
(b) 2 ).
i ~ N(0;

(c) ( i, j) = 0, para i ≠ j, ou seja, os erros são não


correlacionados.
De (b) e (c) erros são independentes.
9
Modelo de regressão linear múltipla
yi = … +
0 + x
1 1i + k xki + i

No caso da presença de correlação entre os erros


teremos que,

Cov( i, j ) = E( i j) - E( i)E( j) = E( i j) = ij 0

10
r=0
0,8

Exemplos: 0,6

0,4

0,2

simulações de séries de


0

11

13

15

17

19

21

23

25

27

29

31

33

35

37

39

41

43

45

47

49

51
erros com autocorrelação
-0,2

-0,4

de 1a. ordem -0,6

-0,8

ordem

r  0,9 r  -0,9
2 1,5

1,5
1

1
0,5

0,5

 0

11

13

15

17

19

21

23

25

27

29

31

33

35

37

39

41

43

45

47

49
0
1

11

13

15

17

19

21

23

25

27

29

31

33

35

37

39

41

43

45

47

49

-0,5
-0,5

-1
-1

-1,5 -1,5

ordem ordem

11
r=0

Diagramas de 0,8

0,6

0,4

dispersão: 0,2

et
0
-0,8 -0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8

-0,2

-0,4

ei vs ei-1
-0,6

-0,8

et-1

r = 0,9 r = -0,9
2 1,5

1,5
1

0,5

0,5
et

et
0
0 -1,5 -1 -0,5 0 0,5 1 1,5
-1,5 -1 -0,5 0 0,5 1 1,5 2

-0,5
-0,5

-1
-1

-1,5
-1,5

et-1
et-1

12
Modelagem da autocorrelação
i = i-1+ ui

Suposições
• ui ~ N(0; u
2);

• ui independentes entre si;


• ui independente de i-1.

13
Modelagem da autocorrelação
i = i-1+ ui

: número entre -1 e 1.

=0 i independentes (Pq?)

14
Modelo de regressão linear múltipla
Apenas para lembrar, no modelo

yi = 0 + 1 x1i + i

admitindo válidas as suposições de interesse,


demonstramos que

 
Var ˆ1  n
 2

 x - x1 
2
1i
i 1
Modelo de regressão linear múltipla
Entretanto, na presença de correlação de primeira
ordem entre os erros, a variância anterior fica dada por

  x1i - x1 x1i -1 - x1 
 
Var ˆ1 
*  2
1  2 r 

n n

 1i 1
x - x 2
   x1i - x1 2

i 1 i 1


  x - x  x - - x   x - x  x - x  
 2r 2 1 i 1 1i 2 1
   2 r n -1 1i 1 n 1


n n

  x1i - x 1  2
  x1i - x 1 2

i 1 i 1
Teste de Durbin-Watson
(Verificação de Ausência de Correlação de Primeira Ordem)

Regressão auxiliar

i = i-1+ ui

Hipótese nula de interesse:

H0: =0

Em que deve se basear a estatística do teste?

Resíduos: ˆi
Teste de Durbin-Watson
(Verificação de Ausência de Correlação de Primeira Ordem)

Estatística do teste:
n

 εˆ - εˆ 
2
i i -1
d i 2
n

 εˆ
i 1
2
i

0 d 4
Teste de Durbin-Watson
(Verificação de Ausência de Correlação de Primeira Ordem)

Note que

d
 
ˆ i
2
  
ˆ i -1 - 2   i  i -1
2
ˆˆ
 i ˆ 2

Ainda, como

  i    i -1
ˆ 2
ˆ 2
Teste de Durbin-Watson
(Verificação de Ausência de Correlação de Primeira Ordem)

rˆ   ˆ ˆ
i i -1

 ˆ i
2

Então
  ˆiˆi -1 
d  2 1 -   21 - rˆ 

  i 
ˆ 2 

- 1  r̂  1  0  d  4
Teste de Durbin-Watson
(Verificação de Ausência de Correlação de Primeira Ordem)

1) 0 d 4
2) Se a correlação for positiva, o valor de d será baixo.
3) Se a correlação for negativa, o valor de d será alto.
4) Valores próximos a 2 indicam correlação próxima de
zero.

  ˆiˆi -1 
d  2 1 -   21 - rˆ 

  i 
ˆ 2 
21
Teste de Durbin-Watson
(Verificação de Ausência de Correlação de Primeira Ordem)

  ˆiˆi -1 
H0: =0 d  2 1 -   21 - rˆ 

  i 
ˆ 2 

H0 deve ser rejeitada para valores distantes de 2.

A distribuição de d depende do tamanho amostral


(n) e do número de variáveis explicativas (k).
22
Teste de Durbin-Watson
(Verificação de Ausência de Correlação de Primeira Ordem)

H0: =0   ˆiˆi -1 
d  2 1 -   21 - rˆ 
HA: >0 
  i 
ˆ 2 

n = 20, k = 3 e nível de significância de 5%:


Tabela (Gujarati): dL= 0,998 e dU= 1,676
se d < dL então rejeita-se H0 (correlação positiva)
se d > dU então não há evidências para rejeitar H0
e se dL < d < dU então teste inconclusivo.
Teste de Durbin-Watson
(Verificação de Ausência de Correlação de Primeira Ordem)

H0: =0   ˆiˆi -1 
d  2 1 -   21 - rˆ 
HA: <0 
  i 
ˆ 2 

n = 20, k = 3 e nível de significância de 5%:


Tabela (Gujarati): dL= 0,998 e dU= 1,676
se d > 4 - dL então rejeita-se H0
se d < 4 - dU então não há evidências para rejeitar H0
se 4 - dU < d < 4 - dL então teste inconclusivo.
Exemplo
Suponha que os dados da empresa TEMCO estejam
ordenados de acordo com a sequência em que foram
coletados.

Verificar a existência de correlação serial entre os erros


do modelo que apresenta Educ e Anosemp como
variáveis explicativas.

25
Exemplo
Variable Coefficient Std. Error t-Statistic Prob.
C 10.16356 0.040853 248.7820 0.0000
EDUC 0.045373 0.008755 5.182444 0.0000
ANOSEMP 0.015972 0.003270 4.883702 0.0000
R-squared 0.750149 Mean dependent var 10.55832
Adjusted R-squared 0.738528 S.D. dependent var 0.259053
S.E. of regression 0.132465 Akaike info criterion -1.141999
Sum squared resid 0.754523 Schwarz criterion -1.022739
Log likelihood 29.26597 F-statistic 64.55119
Durbin-Watson stat 1.224321 Prob(F-statistic) 0.000000

n = 46, k = 2, = 5% , d = 1,224
dL = 1,430 e dU = 1,615
26
Exemplo
H0: = 0 H1: 0
n = 46, k = 2, = 5% , d = 1,224
dL = 1,430, dU= 1,615, 4-dL = 2,57 e 4-dU=2,38

1,43 1,62 2 2,38 2,57


0 4
Rejeitar ? Não ? Rejeitar
Rejeitar

27
Teste de Durbin-Watson
(Verificação de Ausência de Correlação de Primeira Ordem)
Premissas que embasam a estatística d de Durbin-Watson:

a) O modelo regressão inclui intercepto;

b) Os regressores são conhecidos;

c) Os termos de erro são gerados por um modelo AR(1);

d) Os termos de erro são normalmente distribuídos;

e) O modelo de regressão não inclui variável dependente


defasada como variável explicativa;

f) Todos os indivíduos apresentam todas as informações sobre


todas as variáveis de interesse.
Teste de Durbin-Watson
(Verificação de Ausência de Correlação de Primeira Ordem)

Observação
Se o modelo de regressão de interesse apresentar variável
dependente defasada, então o valor da estatística d de Durbin-
Watson será muito próximo de 2, o que sugere ausência de
correlação entre os erros do modelo. Entretanto, isso não
significa que os mesmos não sejam não-correlacionados. Por
essa razão, caso haja variável dependente defasada na
regressão, o interessante é usar o teste h de Durbin. Para mais
detalhes, vide, por exemplo, o exercício 12.36, página 405, de
Gujarati (2006) – tradução da 4ª edição.
Teste para Verificação de Ausência de
Correlação Serial
(Teste de Breusch-Godfrey – teste LM)
Considere o modelo
yi = 0 + 1 x1i + … + k xki + i

i = g1
… + g
i-1 + p i-p + ui
Suposições:
Var (ui) = 2
u : constante, não varia com i (homocedasticidade).
ui ~ N(0; 2
u )

Os erros são independentes, isto é, corr(ui,uj) = 0 para i ≠ j.


30
Teste para Verificação de Ausência de
Correlação Serial
(Teste de Breusch-Godfrey – teste LM)
Considere o modelo
yi = 0+ 1 x1i + … + k xki + i

i = g1 + … + g
i-1 p i-p + ui

1) O modelo para os erros é chamado autorregressivo de ordem


p, pode-se escrever AR(p);
2) Se p = 1, o teste BG é chamado de teste M de Durbin;
3) Aqui, a variável dependente defasada pode entrar como
variável explicativa no modelo de interesse: vantagem sobre o
teste d de Durbin-Watson.
Teste de Breusch-Godfrey
(teste LM para correlação serial)
Neste caso,
H0: g1 = ... = gp=0,
(hipótese de ausência de correlação serial)

pode ser testada a partir do cálculo de uma estatística LM.

Como não conhecemos os erros no modelo populacional,


temos que estimá-los com base na equação

yi  0  1 x1i    k xki   i ,
e calcular os resíduos. 32
Teste de Breusch-Godfrey
(teste LM para correlação serial)

Então, podemos estimar todos os parâmetros


conjuntamente com base na equação

ˆi   0   1 x1i    k x ki   1ˆi -1     p ˆi - p  u i , (1)

e, se o tamanho da amostra for grande, Breusch-


Godfrey demonstraram que:

33
Teste de Breusch-Godfrey
(teste LM para correlação serial)

LM  n  R ~  2
ˆ
2
p

em que R2ˆ é o coeficiente de explicação do modelo (1).

Rejeitamos H0 quando o valor observado for superior ao crítico

34
Correlação Serial
Observações
Se H0 for rejeitada, então:
1) Os estimadores de MQO são ineficientes
(mesmo assintoticamente);
2) A correção depende do conhecimento que
temos sobre a natureza da interdependência
dos termos de erro, isto é, do conhecimento da
estrutura de correlação.
35
Correlação Serial
Observações
Se H0 for rejeitada, então: (cont)
3) Se, por exemplo, tivermos uma estrutura AR(1) com
conhecido, podemos estimar os parâmetros do
modelo original, de maneira eficiente, a partir de uma
transformação neste modelo (conhecida como
quase-diferença), que é algo equivalente à utilização
do método dos mínimos quadrados generalizados
(GLS).
36
Correlação Serial
Observações
Se H0 for rejeitada, então: (cont)
4) Se, por exemplo, tivermos uma estrutura AR(1) mas com
desconhecido (o que é mais comum na prática),
podemos estimar utilizando diversos procedimentos
possíveis como, por exemplo, o procedimento interativo
de Cochrane-Orcut (C-O). Vale a pena observar que os
métodos em geral produzem resultados semelhantes para
quando estamos lidando com grandes amostras. Já
para pequenas amostras, os resultados costumam diferir
37
bastante.
Correlação Serial
Observações
Se H0 for rejeitada, então: (cont)
5) Após utilizarmos algum método adequado para
estimarmos podemos, na seqüência , a partir de uma
transformação nos dados observados (conhecida como
quase-diferença), estimarmos os parâmetros do modelo
de interesse, que é equivalente a empregar o método dos
mínimos quadrados generalizados (GLS). Mas, já que foi
estimado, o método de estimação dos parâmetros é
denominado FGLS (Feasible GLS).
38
Correlação Serial
Observações
Se H0 for rejeitada, então: (cont)

6) Vale a pena observar que o método FGLS tem as


conhecidas propriedades estatísticas ótimas somente
em grandes amostras.

39
Correlação Serial
Observações
Se H0 for rejeitada, então: (cont)
7) Ao empregar FGLS, é preciso ter o cuidado de abandonar
a primeira observação, pois, nas pequenas amostras, sua
inclusão ou exclusão pode resultar em substanciais
diferenças nos resultados. Assim, em pequenas
amostras, é aconselhável transformar a primeira
observação de acordo com o procedimento de Prais-
Winsten. Contudo, nas grandes amostras, faz pouca
diferença a inclusão ou exclusão da primeira observação.
40
Correlação Serial
Observações
Se H0 for rejeitada, então: (cont)

8) Em lugar de utilizar o método FGLS, podemos empregar o


método dos MQO desde que as variâncias dos estimadores
de MQO sejam modificadas, devido à presença de correlação
serial. Um procedimento bastante adotado na prática é o
proposto por Newey-West (1987). Em termos rigorosos, este
procedimento só é válido para grandes amostras.

41
Correlação Serial
O Método de Newey-West
(para correção de erros-padrão de MQO)

Como dito em (8), no lugar de empregar os métodos de


FGLS, podemos, ainda, adotar o método do MQO, mas
corrigindo os erros padrão associados às estimativas dos
parâmetros, devido à presença da correlação serial. Tal
procedimento, formulado por Newey e West (1987), nada
mais é do que uma extensão da metodologia proposta por
White (1980) para o caso da presença de
heteroscedasticidade. 42
Correlação Serial
O Método de Newey-West
(para correção de erros-padrão de MQO)

Os erros-padrão corrigidos são conhecidos como erros-


padrão consistentes à heterocedasticidade e correlação
serial ou, simplesmente, por erros-padrão de Newey-West.
A matriz de variâncias e covariâncias também é conhecida
por HAC (heteroskedasticity and autocorrelation
consistent). E a expressão é dada por

43
Correlação Serial
O Método de Newey-West
(para correção de erros-padrão de MQO)

em que

44
Correlação Serial
Observações (cont.)
9) Existem outros testes que podem ser úteis na detecção
da autocorrelação como, por exemplo:

(a) Teste das Carreiras;


(b) Teste de Berenblutt-Webb;

Vale lembrar que esses testes apresentam prós e contras!

45
Correlação Serial
Leituras Recomendadas

1) Seção 12.3 do livro de Wooldridge (2003), que descreve, em


detalhes, o uso do método FGLS.
2) Leitura do Exemplo 12.4, descrito em Wooldridge (2003).
Aqui, vale a pena observar as principais diferenças
encontradas com a utilização dos métodos de estimação OLS
e FGLS.
3) Leitura da Seção 12.5 de Wooldridge (2003). Aqui, o principal
é o destaque das idéias que envolvem o método de
estimação proposto por Newey e West (1987), quando na
presença da correlação serial.
46
EXEMPLO
Considere o seguinte modelo de regressão

log( price )   1 log( assess )  


price – preço da residência, em milhares de dólares;
assess – valor avaliado, em milhares de dólares;
bdrms – número de dormitórios;
lotsize – área do terreno, em pés2;
sqrft – área construída, em pés2;
colonial – (1 = casa no estilo colonial);

Ainda, suponha que os dados estejam ordenados de acordo


com a seqüência em que foram coletados e que haja uma
desconfiança de correlação serial de primeira ordem.
EXEMPLO

^
log( price )  0,98523 log( assess )
( 0 , 00274)

n  88 R 2  0,765 Ra2  0,765 ˆ  0,147


48
EXEMPLO

H0: Os erros não apresentam correlação serial de


primeira ordem.

HA: Os erros apresentam correlação serial de primeira


ordem.

49
EXEMPLO

50
EXEMPLO

51
EXEMPLO

Resultado do teste

52

Você também pode gostar