Aula 31 - Correlação Serial

Correlação Serial
Aula 31
Gujarati, 2006 – Capítulo 12 (trad. da 4a. ed.)

Recomenda-se uma leitura DETALHADA!!!!
INTRODUÇÃO
Em estudos com dados do tipo cross-section as

observações, no geral, são coletadas por meio de
amostragem aleatória, de modo que não há razão, a
priori, para considerar que os termos de erros
aleatórios sejam correlacionados.
INTRODUÇÃO
Todavia, se tal correlação for observada, a mesma
será denominada por correlação espacial. Isto é,
correlação no espaço e não ao longo do tempo
(autocorrelação).
Contudo, é importante recordar que na análise de

dados do tipo cross-section o ordenamento dos
dados deve ter alguma lógica para podermos
determinar se há presença de correlação espacial
ou não.
INTRODUÇÃO
Do anteriormente exposto, os slides dessa aula têm como
objetivo responder às seguintes perguntas:
Qual é a natureza da correlação serial (quer seja espacial,

no caso de uma base de dados do tipo cross-section, ou
temporal, no caso de séries temporais)?
O que acontece com as propriedades dos estimadores dos
parâmetros quando a suposição de ausência de correlação
entre os erros é violada?
Como podemos testar se há ou não correlação entre os
erros?
Caso exista, como podemos corrigir o problema da
correlação?
Quando ocorre?
Ocorre principalmente quando os

dados são observados ao longo do tempo.
5
Observação
Autocorrelação (correlação serial) de primeira
ordem: correlação existente entre uma observação
qualquer num instante t e outra observação no
instante t-1 (ou t+1).
Autocorrelação (correlação serial) de ordem q:

correlação existente entre uma observação qualquer
num instante t e outra observação no instante t-q (ou
t+q).
6
Quando ocorre?
No caso de uma cross-section, pode ocorrer, por
exemplo, no caso de omissão de variável relevante.
Exemplo:
yt   0  1 x1t   2 x1t
2
 ut
40.00
35.00
30.00
(Modelo Verdadeiro) 25.00
20.00
15.00
yt  0
*
 1 x1t
*
 *
ut 10.00
5.00
0.00
(Modelo especificado) 0 2 4 6 8 10 12 14 16 18
Seqüência de resíduos + e -
7
Quais as conseqüências?
Os estimadores de MQO, na classe dos lineares,
continuam não viesados, consistentes e assintoticamente
normais, mas deixam de ser os mais eficientes (BLUE).
O estimador da variância do erro será viesado e, por

consequência, as variâncias estimadas para os
estimadores dos parâmetros do modelo de regressão
também (em geral, subestimadas).
Os testes t, F e 2 podem não ser válidos. Sendo assim,

teremos que recorrer a providências corretivas.
Modelo de regressão linear múltipla
yi = … +
0 + x
1 1i + k xki + i
Algumas Suposições:
(a) Var ( i) = 2: constante, não varia com i
(homocedasticidade).
(b) 2 ).
i ~ N(0;
(c) ( i, j) = 0, para i ≠ j, ou seja, os erros são não

correlacionados.
De (b) e (c) erros são independentes.
9
yi = … +
0 + x
1 1i + k xki + i
No caso da presença de correlação entre os erros

teremos que,
Cov( i, j ) = E( i j) - E( i)E( j) = E( i j) = ij 0
10
r=0
0,8
Exemplos: 0,6
0,4
0,2
simulações de séries de

0
11
13
15
17
19
21
23
25
27
29
31
33
35
37
39
41
43
45
47
49
51
erros com autocorrelação
-0,2
-0,4
de 1a. ordem -0,6
-0,8
ordem
r  0,9 r  -0,9
2 1,5
1,5
1
1
0,5
0,5

 0
11
13
15
17
19
21
23
25
27
29
31
33
35
37
39
41
43
45
47
49
0
1
11
13
15
17
19
21
23
25
27
29
31
33
35
37
39
41
43
45
47
49
-0,5
-0,5
-1
-1
-1,5 -1,5
ordem ordem
11
r=0
Diagramas de 0,8
0,6
0,4
dispersão: 0,2
et
0
-0,8 -0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8
-0,2
-0,4
ei vs ei-1
-0,6
-0,8
et-1
r = 0,9 r = -0,9
2 1,5
1,5
1
0,5
0,5
et
et
0
0 -1,5 -1 -0,5 0 0,5 1 1,5
-1,5 -1 -0,5 0 0,5 1 1,5 2
-0,5
-0,5
-1
-1
-1,5
-1,5
et-1
et-1
12
Modelagem da autocorrelação
i = i-1+ ui
Suposições
• ui ~ N(0; u
2);
• ui independentes entre si;

• ui independente de i-1.
13
Modelagem da autocorrelação
i = i-1+ ui
: número entre -1 e 1.
=0 i independentes (Pq?)
14
Apenas para lembrar, no modelo
yi = 0 + 1 x1i + i
admitindo válidas as suposições de interesse,

demonstramos que
 
Var ˆ1  n
 2
 x - x1 
2
1i
i 1
Entretanto, na presença de correlação de primeira
ordem entre os erros, a variância anterior fica dada por

  x1i - x1 x1i -1 - x1 
 
Var ˆ1 
*  2
1  2 r 

n n

 1i 1
x - x 2
   x1i - x1 2
i 1 i 1

  x - x  x - - x   x - x  x - x  
 2r 2 1 i 1 1i 2 1
   2 r n -1 1i 1 n 1


n n
  x1i - x 1  2
  x1i - x 1 2

i 1 i 1
Teste de Durbin-Watson
(Verificação de Ausência de Correlação de Primeira Ordem)
Regressão auxiliar
i = i-1+ ui
Hipótese nula de interesse:
H0: =0
Em que deve se basear a estatística do teste?
Resíduos: î
Estatística do teste:
n
 εˆ - εˆ 
2
i i -1
d i 2
n
 εˆ
i 1
2
i
0 d 4
Note que
d
 
ˆ i
2
  
ˆ i -1 - 2   i  i -1
2
ˆˆ
 i ˆ 2
Ainda, como
  i    i -1
ˆ 2
ˆ 2
rˆ   ˆ ˆ
i i -1
 ˆ i
2
Então
  îî -1 
d  2 1 -   21 - rˆ 

  i 
ˆ 2 
- 1  r̂  1  0  d  4
1) 0 d 4
2) Se a correlação for positiva, o valor de d será baixo.
3) Se a correlação for negativa, o valor de d será alto.
4) Valores próximos a 2 indicam correlação próxima de
zero.
  îî -1 
d  2 1 -   21 - rˆ 

  i 
ˆ 2 
21
  îî -1 
H0: =0 d  2 1 -   21 - rˆ 

  i 
ˆ 2 
H0 deve ser rejeitada para valores distantes de 2.
A distribuição de d depende do tamanho amostral

(n) e do número de variáveis explicativas (k).
22
H0: =0   îî -1 
d  2 1 -   21 - rˆ 
HA: >0 
  i 
ˆ 2 
n = 20, k = 3 e nível de significância de 5%:

Tabela (Gujarati): dL= 0,998 e dU= 1,676
se d < dL então rejeita-se H0 (correlação positiva)
se d > dU então não há evidências para rejeitar H0
e se dL < d < dU então teste inconclusivo.
H0: =0   îî -1 
d  2 1 -   21 - rˆ 
HA: <0 
  i 
ˆ 2 
n = 20, k = 3 e nível de significância de 5%:

Tabela (Gujarati): dL= 0,998 e dU= 1,676
se d > 4 - dL então rejeita-se H0
se d < 4 - dU então não há evidências para rejeitar H0
se 4 - dU < d < 4 - dL então teste inconclusivo.
Exemplo
Suponha que os dados da empresa TEMCO estejam
ordenados de acordo com a sequência em que foram
coletados.
Verificar a existência de correlação serial entre os erros

do modelo que apresenta Educ e Anosemp como
variáveis explicativas.
25
Exemplo
Variable Coefficient Std. Error t-Statistic Prob.
C 10.16356 0.040853 248.7820 0.0000
EDUC 0.045373 0.008755 5.182444 0.0000
ANOSEMP 0.015972 0.003270 4.883702 0.0000
R-squared 0.750149 Mean dependent var 10.55832
Adjusted R-squared 0.738528 S.D. dependent var 0.259053
S.E. of regression 0.132465 Akaike info criterion -1.141999
Sum squared resid 0.754523 Schwarz criterion -1.022739
Log likelihood 29.26597 F-statistic 64.55119
Durbin-Watson stat 1.224321 Prob(F-statistic) 0.000000
n = 46, k = 2, = 5% , d = 1,224
dL = 1,430 e dU = 1,615
26
Exemplo
H0: = 0 H1: 0
n = 46, k = 2, = 5% , d = 1,224
dL = 1,430, dU= 1,615, 4-dL = 2,57 e 4-dU=2,38
1,43 1,62 2 2,38 2,57

0 4
Rejeitar ? Não ? Rejeitar
Rejeitar
27
Premissas que embasam a estatística d de Durbin-Watson:
a) O modelo regressão inclui intercepto;
b) Os regressores são conhecidos;
c) Os termos de erro são gerados por um modelo AR(1);
d) Os termos de erro são normalmente distribuídos;
e) O modelo de regressão não inclui variável dependente

defasada como variável explicativa;
f) Todos os indivíduos apresentam todas as informações sobre

todas as variáveis de interesse.
Observação
Se o modelo de regressão de interesse apresentar variável
dependente defasada, então o valor da estatística d de Durbin-
Watson será muito próximo de 2, o que sugere ausência de
correlação entre os erros do modelo. Entretanto, isso não
significa que os mesmos não sejam não-correlacionados. Por
essa razão, caso haja variável dependente defasada na
regressão, o interessante é usar o teste h de Durbin. Para mais
detalhes, vide, por exemplo, o exercício 12.36, página 405, de
Gujarati (2006) – tradução da 4ª edição.
Teste para Verificação de Ausência de
Correlação Serial
(Teste de Breusch-Godfrey – teste LM)
Considere o modelo
yi = 0 + 1 x1i + … + k xki + i
i = g1
… + g
i-1 + p i-p + ui
Suposições:
Var (ui) = 2
u : constante, não varia com i (homocedasticidade).
ui ~ N(0; 2
u )
Os erros são independentes, isto é, corr(ui,uj) = 0 para i ≠ j.

30
Teste para Verificação de Ausência de
Correlação Serial
(Teste de Breusch-Godfrey – teste LM)
Considere o modelo
yi = 0+ 1 x1i + … + k xki + i
i = g1 + … + g
i-1 p i-p + ui
1) O modelo para os erros é chamado autorregressivo de ordem

p, pode-se escrever AR(p);
2) Se p = 1, o teste BG é chamado de teste M de Durbin;
3) Aqui, a variável dependente defasada pode entrar como
variável explicativa no modelo de interesse: vantagem sobre o
teste d de Durbin-Watson.
Teste de Breusch-Godfrey
(teste LM para correlação serial)
Neste caso,
H0: g1 = ... = gp=0,
(hipótese de ausência de correlação serial)
pode ser testada a partir do cálculo de uma estatística LM.
Como não conhecemos os erros no modelo populacional,

temos que estimá-los com base na equação
yi  0  1 x1i    k xki   i ,
e calcular os resíduos. 32
Então, podemos estimar todos os parâmetros

conjuntamente com base na equação
î   0   1 x1i    k x ki   1î -1     p î - p  u i , (1)
e, se o tamanho da amostra for grande, Breusch-

Godfrey demonstraram que:
33
LM  n  R ~  2
ˆ
2
p
em que R2ˆ é o coeficiente de explicação do modelo (1).
Rejeitamos H0 quando o valor observado for superior ao crítico
34
Correlação Serial
Observações
Se H0 for rejeitada, então:
1) Os estimadores de MQO são ineficientes
(mesmo assintoticamente);
2) A correção depende do conhecimento que
temos sobre a natureza da interdependência
dos termos de erro, isto é, do conhecimento da
estrutura de correlação.
35
Correlação Serial
Observações
Se H0 for rejeitada, então: (cont)
3) Se, por exemplo, tivermos uma estrutura AR(1) com
conhecido, podemos estimar os parâmetros do
modelo original, de maneira eficiente, a partir de uma
transformação neste modelo (conhecida como
quase-diferença), que é algo equivalente à utilização
do método dos mínimos quadrados generalizados
(GLS).
36
Correlação Serial
Observações
4) Se, por exemplo, tivermos uma estrutura AR(1) mas com
desconhecido (o que é mais comum na prática),
podemos estimar utilizando diversos procedimentos
possíveis como, por exemplo, o procedimento interativo
de Cochrane-Orcut (C-O). Vale a pena observar que os
métodos em geral produzem resultados semelhantes para
quando estamos lidando com grandes amostras. Já
para pequenas amostras, os resultados costumam diferir
37
bastante.
Correlação Serial
Observações
5) Após utilizarmos algum método adequado para
estimarmos podemos, na seqüência , a partir de uma
transformação nos dados observados (conhecida como
quase-diferença), estimarmos os parâmetros do modelo
de interesse, que é equivalente a empregar o método dos
mínimos quadrados generalizados (GLS). Mas, já que foi
estimado, o método de estimação dos parâmetros é
denominado FGLS (Feasible GLS).
38
Correlação Serial
Observações
6) Vale a pena observar que o método FGLS tem as

conhecidas propriedades estatísticas ótimas somente
em grandes amostras.
39
Correlação Serial
Observações
7) Ao empregar FGLS, é preciso ter o cuidado de abandonar
a primeira observação, pois, nas pequenas amostras, sua
inclusão ou exclusão pode resultar em substanciais
diferenças nos resultados. Assim, em pequenas
amostras, é aconselhável transformar a primeira
observação de acordo com o procedimento de Prais-
Winsten. Contudo, nas grandes amostras, faz pouca
diferença a inclusão ou exclusão da primeira observação.
40
Correlação Serial
Observações
8) Em lugar de utilizar o método FGLS, podemos empregar o

método dos MQO desde que as variâncias dos estimadores
de MQO sejam modificadas, devido à presença de correlação
serial. Um procedimento bastante adotado na prática é o
proposto por Newey-West (1987). Em termos rigorosos, este
procedimento só é válido para grandes amostras.
41
Correlação Serial
O Método de Newey-West
(para correção de erros-padrão de MQO)
Como dito em (8), no lugar de empregar os métodos de

FGLS, podemos, ainda, adotar o método do MQO, mas
corrigindo os erros padrão associados às estimativas dos
parâmetros, devido à presença da correlação serial. Tal
procedimento, formulado por Newey e West (1987), nada
mais é do que uma extensão da metodologia proposta por
White (1980) para o caso da presença de
heteroscedasticidade. 42
Correlação Serial
Os erros-padrão corrigidos são conhecidos como erros-

padrão consistentes à heterocedasticidade e correlação
serial ou, simplesmente, por erros-padrão de Newey-West.
A matriz de variâncias e covariâncias também é conhecida
por HAC (heteroskedasticity and autocorrelation
consistent). E a expressão é dada por
43
Correlação Serial
em que
44
Correlação Serial
Observações (cont.)
9) Existem outros testes que podem ser úteis na detecção
da autocorrelação como, por exemplo:
(a) Teste das Carreiras;

(b) Teste de Berenblutt-Webb;
Vale lembrar que esses testes apresentam prós e contras!
45
Correlação Serial
Leituras Recomendadas
1) Seção 12.3 do livro de Wooldridge (2003), que descreve, em

detalhes, o uso do método FGLS.
2) Leitura do Exemplo 12.4, descrito em Wooldridge (2003).
Aqui, vale a pena observar as principais diferenças
encontradas com a utilização dos métodos de estimação OLS
e FGLS.
3) Leitura da Seção 12.5 de Wooldridge (2003). Aqui, o principal
é o destaque das idéias que envolvem o método de
estimação proposto por Newey e West (1987), quando na
presença da correlação serial.
46
EXEMPLO
Considere o seguinte modelo de regressão
log( price )   1 log( assess )  

price – preço da residência, em milhares de dólares;
assess – valor avaliado, em milhares de dólares;
bdrms – número de dormitórios;
lotsize – área do terreno, em pés2;
sqrft – área construída, em pés2;
colonial – (1 = casa no estilo colonial);
Ainda, suponha que os dados estejam ordenados de acordo

com a seqüência em que foram coletados e que haja uma
desconfiança de correlação serial de primeira ordem.
EXEMPLO
^
log( price )  0,98523 log( assess )
( 0 , 00274)
n  88 R 2  0,765 Ra2  0,765 ˆ  0,147

48
EXEMPLO
H0: Os erros não apresentam correlação serial de

primeira ordem.
HA: Os erros apresentam correlação serial de primeira

ordem.
49
EXEMPLO
50
EXEMPLO
51
EXEMPLO
Resultado do teste
52

Aula 31 - Correlação Serial

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Aula 31 - Correlação Serial

Enviado por

Direitos autorais:

Formatos disponíveis

Correlação Serial

Gujarati, 2006 – Capítulo 12 (trad. da 4a. ed.)

Em estudos com dados do tipo cross-section as

Contudo, é importante recordar que na análise de

Qual é a natureza da correlação serial (quer seja espacial,

Ocorre principalmente quando os

Autocorrelação (correlação serial) de ordem q:

(Modelo Verdadeiro) 25.00

O estimador da variância do erro será viesado e, por

Os testes t, F e 2 podem não ser válidos. Sendo assim,

(c) ( i, j) = 0, para i ≠ j, ou seja, os erros são não

No caso da presença de correlação entre os erros

de 1a. ordem -0,6

• ui independentes entre si;

admitindo válidas as suposições de interesse,

Hipótese nula de interesse:

Em que deve se basear a estatística do teste?

H0 deve ser rejeitada para valores distantes de 2.

A distribuição de d depende do tamanho amostral

n = 20, k = 3 e nível de significância de 5%:

n = 20, k = 3 e nível de significância de 5%:

Verificar a existência de correlação serial entre os erros

1,43 1,62 2 2,38 2,57

a) O modelo regressão inclui intercepto;

b) Os regressores são conhecidos;

c) Os termos de erro são gerados por um modelo AR(1);

d) Os termos de erro são normalmente distribuídos;

e) O modelo de regressão não inclui variável dependente

f) Todos os indivíduos apresentam todas as informações sobre

Os erros são independentes, isto é, corr(ui,uj) = 0 para i ≠ j.

1) O modelo para os erros é chamado autorregressivo de ordem

pode ser testada a partir do cálculo de uma estatística LM.

Como não conhecemos os erros no modelo populacional,

Então, podemos estimar todos os parâmetros

î   0   1 x1i    k x ki   1î -1     p î - p  u i , (1)

e, se o tamanho da amostra for grande, Breusch-

em que R2ˆ é o coeficiente de explicação do modelo (1).

Rejeitamos H0 quando o valor observado for superior ao crítico

6) Vale a pena observar que o método FGLS tem as

8) Em lugar de utilizar o método FGLS, podemos empregar o

Como dito em (8), no lugar de empregar os métodos de

Os erros-padrão corrigidos são conhecidos como erros-

(a) Teste das Carreiras;

Vale lembrar que esses testes apresentam prós e contras!

1) Seção 12.3 do livro de Wooldridge (2003), que descreve, em

log( price )   1 log( assess )  

Ainda, suponha que os dados estejam ordenados de acordo

n  88 R 2  0,765 Ra2  0,765 ˆ  0,147

H0: Os erros não apresentam correlação serial de

HA: Os erros apresentam correlação serial de primeira

Você também pode gostar