Você está na página 1de 30

CAPÍTULO 12‐AUTOCORRELAÇÃO

12.1. A NATUREZA DO PROBLEMA


O objetivo deste capítulo é examinar as consequências da violação de uma das
hipóteses fundamentais do modelo linear clássico, a hipótese de que os erros do
modelo não são correlacionados.

Este tipo de problema ocorre na prática quando fazemos regressão de séries


temporais, e no restante do capítulo usaremos o subscrito t (ao invés de i) para
explicitar a dependência dos dados no tempo. Também, por razões que deverão ficar
claras ao longo do texto, os erros (correlacionados) serão denotados por u, enquanto
os erros não correlacionados continuarão, como nos capítulos anteriores, a ser
denotados por ε.

Em primeiro lugar, é preciso definir o que entendemos por autocorrelação (ou


correlação serial). A autocorrelação é a correlação que existe entre valores de uma
série temporal observados em diferentes instantes de tempo. A autocorrelação pode
também se referir a observações em diferentes pontos no espaço (correlação
espacial), e o tratamento dado ao problema é basicamente o mesmo apresentado
aqui, por isso nosso foco será apresentar o problema no contexto de séries temporais.

No modelo clássico, uma das premissas é a inexistência de correlação entre os erros


em instantes distintos. Isto é, supõe‐se que: E(ui.uj)=0 para i≠j. Note que esta hipótese
implica em Cov(ui, uj)=0 para i≠j pois a média do erro é zero por hipótese.

Em que situação esta premissa costuma ser violada? Considere, por exemplo, um
modelo para a venda mensal de TVs no varejo. No passado recente, houve a redução
de imposto sobre produtos industrializados para combater a recessão, e isso
incrementou as taxas de juros ao consumidor caíram. Agora, em 2010, estamos a um
passo da Copa do Mundo que, sabidamente, tem um impacto positivo sobre as vendas
de TVs. E os erros de um modelo, como ficam? Muito provavelmente, o erro do
modelo num mês terá uma expressiva correlação com o erro do modelo em meses
adjacentes. Ou seja, a hipótese de que erros em instantes diferentes são
descorrelatados é falsa, ou seja, existe autocorrelação entre os erros. Isso quer dizer
que as perturbações que ocorrem num instante de tempo afetam as que ocorrem em
outro instante.

Antes de descobrir por que existe autocorrelação, é essencial esclarecer algumas


questões sobre nomenclatura. É prática comum tratar a autocorrelação e a correlação
serial como sinônimos, mas alguns autores preferem distinguir os dois termos. Nós não
faremos isso aqui – para nós, autocorrelação e correlação serial significam a mesma
coisa. A Figura 12.1. a seguir exibe alguns padrões plausíveis para a presença e
ausência de autocorrelação. Nela são plotados os erros (ou, na prática, os resíduos)
contra o eixo dos tempos.

A Figura 12.1a mostra um padrão cíclico. A Figura 12.1b sugere uma tendência
ascendente nos erros, enquanto a Figura 12.1c mostra um padrão linear descendente
linear nos distúrbios. 12.1d mostra termos de tendência linear e quadrática nos
distúrbios. Apenas a Figura 12.1.e não exibe um padrão sistemático, apoiando a
hipótese de autocorrelação nula dos erros, que é a premissa do modelo clássico de
regressão.
A pergunta  natural  é:  Por  que  a  c orrelação  serial  ocorre?
 Há  d iversas  razões,  algumas  mostradas  a  s eguir.  

Inércia

Séries temporais econômicas  apresentam  inércia  ou  l entidão.  O  P IB,  í ndices  de 


preços, produção,  emprego  e  d esemprego  apresentam  ciclos.  A  p artir  do  f undo
 da  r ecessão,  começa  a  r ecuperação  econômica e  a  m aioria  destas  séries  come
çar a  s e  m over  para  cima.  Neste  movimento, o  v alor  de  u ma  s érie  num  ponto
 no  t empo  é  m aior  do  q ue  seu  v alor  anterior.  Assim,  há  uma  dinâmica  que  c
ontinua até  que  algo  aconteça  (por  exemplo,  o  a umento  na  taxa  de  j uros  ou 
os impostos,  ou  ambos)  para  atrasá‐
los. Por  isso,  nas  regressões  envolvendo séries  temporais,  observações   s ucessiv
as tendem  a  s er  i nterdependentes.

Viés de Especificação – variáveis excluídas

Na prática  o  p esquisador  muitas  vezes  começa  com  um  m odelo  de  r egressão  p


lausível que  não  podem  ser  o  m ais  "perfeito''. Após  a  a nálise  de  r egressão,  o 
pesquisador examina  os  r esultados
para descobrir  se  eles  estão  de  a cordo  com  as  e xpectativas a  p riori  e  a s  p rem
issas básicas  dos  modelos  de  m ínimos  quadrados.  Por  exemplo,  o  p esquisador 
pode plotar  os  r esíduos  obtidos  a  p artir  da  r egressão  ajustada  e  o bservar  padr
ões como  os  m ostrados  na  Figura  12.1a  a  d .  E sses  resíduos  podem  sugerir  que
 algumas  variáveis  que  foram  originalmente candidatas, mas  não  f oram  incluída
s no  m odelo,  devem  ser  incluídas. Este  é  o  c aso  do  v iés  de  e specificação da  v
ariável excluída.  Muitas  vezes,  a  i nclusão  dessas  variáveis  remove  o  p adrão  de 
correlação observado  nos  resíduos.  Por  exemplo,  suponha  que  temos  o  m odelo
 de  d emanda:

Onde Y  =  q uantidade  demandada  de  c arne  de  boi,  X2  =  p reço  da  c arne  de  b o


i, X3  =  r enda  do  c onsumidor,  X4  =  p reço  da  c arne  de  p orco  e  t  =  t e mpo.  N
 entanto,  por  alguma  razão,  ajustamos  a  r egressão  que  se  s egue:

Agora, se  (12.1.2)  é  o  m odelo  verdadeiro,  mas  ajustamos  (12.1.3), isso  equivale
 a  f azer  vt  =  β 4.X4t  +  u t.  E  n a  m edida  que  o  p reço  da  c arne  suína  afeta  o
onsumo de  c arne,  o  t ermo  de  e rro  ou  d istúrbio  v  i rá  r efl etir  um  padrão  siste
mático, criando  assim  uma  (falsa)  autocorrelação. Um  teste  simples  disso  seria 
executar os  dois  modelos  (12.1.2)  e  ( 12.1.3)  e  v er  s e  a utocorrelação, observada
 no  m odelo  (12.1.3)  desaparece quando  (12.1.2)  é  a justado.  A  m ecânica  de  det
ecção de  autocorrelação  será  discutida  na  seção  12.6.

Viés de Especificação – Forma Funcional Incorreta

Suponha que o modelo verdadeiro é:

Mas em  vez  deste,  ajustamos  o  s eguinte  modelo:

Ou seja,  ajustamos  uma  forma  funcional errada  para  a  f unção  custo  marginal, 
que é  a  v ariável  dependente  no  m odelo.  As  c urvas  de  c usto  marginal  correspo
ndentes ao  m odelo  "verdadeiro'' e  “  i ncorreto”  são  mostradas  na  Figura  12.2. 
]

Como a  F igura  12.2  mostra,  entre  os  p ontos  A  e  B  a  c u rva  de  c usto  marginal


 linear  estará  sempre  acima  do  v erdadeiro custo  marginal, enquanto  que  fora 
deste intervalo  o  o posto  ocorre.  Este  resultado  é  e sperado,  pois  o  t ermo  de  e r
ro vi   e m  ( 12.1.5,  o  m odelo  errado)  é,  de  f ato,  igual  a  O utput2  +  u i   e ,  p o
nto, vai  pegar  o  e feito  sistemático do  termo  Output2  no  c usto  marginal.  Neste
 caso,  vi  e xibirá  autocorrelação por  causa  da  uti lização  de  uma  f orma  funcional
 errada.  No  c apítulo  13,  vamos  considerar  vários  métodos  para  detectar  o  v iés
 de  e specificação.

Fenômeno Cobweb (Teia de Aranha)

O fornecimento de  m uitos  produtos  agrícolas  reflete  o  f enômeno  chamado  “tei


a de  aranha”,  onde  a  o ferta  reage  ao  p reço  com  uma  defasagem  de  um  p erío
do de  tempo,  porque  as  decisões  de  oferta  levam  um  c erto  tempo  para  serem
 implementadas (o  período  de  gestação).  Assim,  no  i nício  do  p lantio  da  s afra  d
este ano,  os  a gricultores  são  influenciados pelo  preço  vigente  no  ano  passado, 
e sua  função  de  o ferta  é:

Suponha que  no  fi nal  do  p eríodo  t,  o  p reço  Pt  é  i nferior  ao  p reço  do  a mo  pa


ssado, Pt‐
1. No  período  t  +  1  o s  a gricultores  podem  decidir  produzir  menos  do  q ue  e les
 fi zeram  no  período  t.  Obviamente,  nesta  situação  os  distúrbios  não   d e verão 
ser aleatórios, pois  se  os  a gricultores produzem  demais  no  a no  t,  d evem  reduzi
r sua  produção  em  t  +  1 ,  e  a ssim  por  diante,  levando  a  u m  p adrão  de  t eia 
e aranha. 

Defasagens

Em uma  regressão  de  séries  temporais  das  despesas  de  c onsumo  sobre  a  r end


a, é  c omum  observar  que  a  d espesa  de  c onsumo  do  p eríodo  atual  período  de
pende, entre  outras  coisas,  das  despesas  de  c onsumo  dos  períodos  anteriores. 
 Por  e xemplo:

Um modelo  de  r egressão  como  (12.1.7)  é  c onhecido  como  auto‐


regressivo porque  uma  das  variáveis  explicativas é  o  v alor  defasado  da  variável
 dependente. (Estes  modelos  serão  novamente  estudados  no  c apítulo  17.)  A  j us
tificativa para  um  m odelo  como  (12.1.7)  é  s imples.  Os  c onsumidores não  muda
m seus  hábitos  de  c onsumo  facilmente  por  motivos  psicológicos, tecnológicos o
u institucionais. Agora,  se  nós  negligenciarmos o  t ermo  defasado  em  (12.1.7),  o
 termo  de  e rro  resultante refletirá  um  padrão  sistemático  devido  à  i nfl uência  d
o consumo  defasado  sobre  o  c onsumo  atual.

Manipulação de dados

Na análise  empírica,  os  dados  brutos  são  frequentemente "Manipulados''. Por  e


xemplo, em  regressões envolvendo  séries  trimestrais,  os  dados  são  às  v ezes  ob
tidos a  p artir  dos  dados  mensais  simplesmente adicionando três  observações  m
ensais e  d ividindo  a  s oma  por  3 .  E sta  m édia  suaviza  as  fl utuações  do  dados  m
ensais, e  o  g r áfico  dos  dados  trimestrais parece  muito  mais  suave  do  que  o  d
os dados  mensais,  e  e ssa  m esma  regularidade  pode  gerar  um  padrão  sistemátic
o nos  termos  de  e rro,  introduzindo  assim  autocorrelação.

Outra fonte  de  m anipulação  é  i nterpolação ou  e xtrapolação  de  dados.  Por  e xe


mplo, o  C enso  de  P opulação  é  r ealizado  a  c ada  1 0  a nos.  Se  e xiste  uma  necess
idade de  obter  dados  para  alguns  anos  no  p eríodo  intercensitários 1990‐
2000 ou  2 000‐
2010, a  p rática  comum  é  a  i nterpolação com  base  em  a lgum  pressuposto  “ad‐
hoc”. Estas  técnicas  de  “massagem”  dos  dados  podem  impor  aos  dados  um  pa
drão sistemático  que  pode  não  e xistir  nos  dados  originais.

Transformação de dados
Considere o  s eguinte  modelo:

Onde, por  exemplo,  Y  =  d e spesa  de  c onsumo  e  X  =  r e nda.  Como  (12.1.8)  é  v á


lido em  todos  os  períodos  de  tempo,  ele  é  v álido  também  no  p eríodo  anterior
 (t  ‐  1 ).  A ssim,  podemos  escrever  (12.1.8)  como:

Yt‐1, Xt‐1,  e  u t‐
1 são  conhecidos  como  os  v alores  defasados  de  Y,  X ,  e  U  r e spectivamente. Ne
ste caso  a  d efasagem  é  d e  u m  p eríodo.  Subtraindo  (12.1.9)  de  (12.1.8),  obtem
os:

Onde Δ  é  c onhecido  como  o  o perador  de  primeira  diferença.

Assim, ΔYt  =  ( Yt  ‐  Y t‐1),  ΔXt  =  ( Xt  ‐  X t‐1)  e   Δ U t  =  ( U t  ‐  U t‐


1). Podemos  escrever  (12.1.10) como:

A equação  (12.1.9)  é  c onhecida  como  forma  de  n ível  e  a  e quação  (12.1.10) é 


conhecida como  a  f orma  de  p rimeira  diferença.  Ambas  as  f ormas  são  f requent
emente utilizadas  em  pesquisas  empíricas. Por  exemplo,  se  e m  ( 12.1.9)  Y  e  X  r
epresentam os  l ogaritmos  das  despesas  de  c onsumo  e  r enda,  então  em  ( 12.1.1
0) ΔY  e  Δ X  r epresentam variações  nos  logaritmos  das  despesas  de  c onsumo  e 
renda. Mas,  uma  variação  no  l ogaritmo  é  u ma  m udança  relativa  (percentual), s
e ela  for  m ultiplicada  por  100.  Assim,  em  vez  de  e studar  relações  entre  as  v ar
iáveis na  forma  de  n ível,  podemos  estar  interessados  em  suas  relações  na  f or
ma de  crescimento.
Se o  t ermo  de  e rro  em  ( 12.1.8)  satisfaz  as  hipóteses‐
padrão MQO,  especialmente  a  h ipótese  de  não  autocorrelação, pode‐
se mostrar  que  o  e rro  vt  e m  ( 12.1.11)  é  a utocorrelacionado.  (A  prova  é  d ada 
no apêndice  12A,  Seção  12A.1.)

Modelos como  (12.1.11)  são  conhecidos como  modelos  de  r egressão  dinâmica, 


ou seja,  modelos  que  envolvem  regressandos  defasados.  Eles  serão  estudados  e
m profundidade  no  Capítulo  17.  O  q ue  i nteressa  no  e xemplo  anterior  é  q ue  às
 vezes  a  a utocorrelação  pode  ser  i nduzida  como  resultado  da  transformação do
 modelo  original. 

Não‐estacionariedade

Lembre‐
se que  uma  série  temporal  é  e stacionária  se  suas  características (por  exemplo, 
média, variância e  c ovariância)  são  invariantes no  tempo,  ou  s eja,  eles  não  mu
dam ao  l ongo  do  t empo.  Se  i sso  não  acontecer,  a  s érie  temporal  é  d ita  não  e
stacionária. Como  veremos  na  P arte  V,  e m  u m  m odelo  de  r egressão  na  f orma 
do nível  como  (12.1.8)  é  p ossível  que  tanto  Y  e  X  s e jam  não‐
estacionárias e,  portanto,  o  e rro  u  t ambém  seja  não‐
estacionário, e  i rá  e xibir  autocorrelação. 

Em resumo,  existem  diversas  razões  pelas  quais  o  t ermo  de  e rro  e m  u m  m ode


lo de  regressão  pode  ser  autocorrelacionado.  No  r estante  do  c apítulo,  investiga
mos os  problemas  decorrentes  da  autocorrelação e  q ue  pode  ser  feito  sobre  is
so.

A autocorrelação  pode  ser  positiva  (Figura  12.3a)  ou  n egativa,  embora  a  m aiori


a das  séries  temporais  econômica  geralmente  apresente  autocorrelação  positiva.
 Isso  acontece  porque  a  m aioria  delas  move‐
se para  cima  ou  p ara  baixo  durante  longos  períodos  de  tempo  e  n ão  a present
a um  m ovimento  constante  para  cima  e  p ara  baixo  como  o  m ostrado  na  Figur
a 12.3b. 
12.2 ESTIMATIVA MQO NA PRESENÇA DE AUTOCORRELAÇÃO
O que  acontece  com  os  e sti madores  de  MQO  e  s uas  variâncias  se  os  e rros  do
 modelo  apresentam  autocorrelação?

Suponha agora  que  E  ( ut.ut  +  s )  ≠  0  p a ra  s  ≠  0  e  q u e  t odas  as  o utras  hipó


ses do  m odelo  clássico  são  m antidas.

Considere o  m odelo  de  r egressão  com  duas  variáveis:  Yt  =  β 1  + β2.Xt +  u t.

Suponha que  os  r uídos  deste  modelo  têm  agora  a  s eguinte  estrutura:


Onde ρ   ( a  l e tra  grega  rô)  é  o  c o efi ciente  de  autocorrelação  e
εt é  o  e rro  e stocástico  que  satisfaz  as  hipóteses  usuais  do  m odelo  de  m ínimos
 quadrados,  a  s aber:  

Na literatura  de  e ngenharia, um  termo  de  e rro  com  as  p ropriedades (12.2.2)  é


 chamado  de  “ruído  branco”.  O  q ue  ( 12.2.1)  postula  é  q ue  a  v alor  do  t ermo 
de erro  no  p eríodo  t  é  i gual  a  ρ  v e zes  o  s eu  v alor  no  p eríodo  anterior,  acres
ido de  um  t ermo  de  e rro  puramente  aleatório.

O esquema  (12.2.1)  é  c onhecido  como  esquema  autoregressivo  de  primeira  ord


em de  M arkov,  ou  simplesmente regime  auto‐
regressivo de  primeira  ordem,  geralmente denotado  como  AR  ( 1).  O  n ome  auto
regressivo é  a propriado  porque  (12.2.1)  pode  ser  interpretado  como  a  r egressã
o de  ut  e m  s im  m esmo  defasado  em  um  p eríodo.  Diz‐
se que  é  d e  p rimeira  ordem  porque  ut  e  s e u  v alor  imediatamente  anterior  est
ão envolvidos, ou  seja,  o  m áximo  atraso  é  1 .  S e  o  m odelo  for  ut  =  ρ 1 ut‐
1 +  ρ 2  u t‐
2   +  ε t ,  s eria  um  A R  ( 2),  um  m odelo  autoregressivo de  segunda  ordem. 

Pode‐se provar  que,  na  s ituação  de  r uídos  AR(1): 


Onde   c ov(ut,ut  +  s )  i ndica  a  c ovariância entre  os  t ermos  de  e rro  separados  p
or s  i nstantes  e  c or(ut,ut  +  s )  a  c orrelação  entre  estes  mesmos  termos  de  e rr
o. Note  que  c or(ut,ut)  =  1  s e mpre,  pois  a  c orrelação  de  uma  v ariável  com  si 
mesma é  s empre  um.  Por  c ausa  da  p ropriedade de  simetria  de  c ovariâncias e 
correlações,   c ov(ut,ut  +  s )  =  c ov(ut,ut  ‐
 s)  e  o  m e smo  ocorre  com  as  c orrelações.

O coeficiente  ρ  é  u m a  c onstante  entre  ‐


1 e  + 1  e  e ntão  (12.2.3)  mostra  que,  sob  o  e squema  AR  (1),  a  v ariância  de  ut
  é  a i nda  c onstante  (ut  é   h o mocedástico),  mas  ut  e stá  correlacionado não  só
 com  o  s eu  v alor  imediatamente  anterior,  mas  também  com  seus  valores  em 
outros instantes  do  passado. 

É fundamental observar  que  |ρ|


< 1,  ou  s eja,  o  v alor  absoluto  de  ρ  é  m e nor  que  um.  Se  ρ  =  1 ,  a s  v ariânci
e covariâncias  acima  não  estão  definidas.  Se  |ρ|
 <1,  dizemos  que  o  p rocesso  AR  ( 1)  d ado  em  ( 12.2.1)  é  e stacionário,  ou  s eja, 
sua média,  variância  e  c ovariância não  mudam  ao  l ongo  do  t empo.  Se  | ρ|
 é  m enor  que  um,  e ntão  a  c ovariância diminuirá  à  m edida  que  avançamos  no 
passado distante,  ou  seja,  à  m edida  que  a  d iferença  entre  as  d efasagens  (“lags
”) aumenta.   S e  | ρ|
é MAIOR  que  um,  o  p r ocesso  é  n ão  e stacionário e  t em  u m  c omportamento cl
aramente “explosivo”. Gere  uma  sequência  de  e rros  iid  { et}  no  E xcel  e  a juste 
o modelo  ut  =  1 ,2ut‐
1 +  e t  p ara  verificar  que  isso  acontece.  Uti lize  qualquer  valor  inicial  para  u0.  S
e ρ  =  1 ,  o  p r ocesso  é  d escrito  por  ut  =  u t‐
1 +  e t,  e  é  u m  p rocesso  NÃO  ESTACIONÁRIO bastante  importante na  prática,  c
hamado de  “random  walk”,  ou  p asseio  aleatório.  O  f ato  interessante  é  q ue  a 
primeira diferença de  um  p asseio  aleatório  é  u m  p rocesso  estacionário,  pois  ut
 ‐  u t‐1  =  e t,  o u  s eja,  Δut  =  e t  o nde  Δ  é  o  o p erador  1a.  diferença.

Uma razão  para  usar  o  m odelo  AR  ( 1)  não  é  a penas  por  sua  simplicidade  em 
relação aos  modelos  AR  de  o rdem  superior,  mas  também  porque,  mostrou  ser
 úti l  em  a plicações  práticas.

Considere novamente o  m odelo  de  r egressão  de  duas  variáveis:  Yt  =  β 1  +


β2.Xt +  u t.   N o  c apítulo  3  v imos  que  o  e sti mador  MQO  do  c oeficiente angular
 é:
Cuja variância é  d ada  por: 

Onde a  l etra  minúscula  indica  que  a  v ariável  é  c alculada  como  um  d esvio  em 


relação à  m édia.  Sob  a  h ipótese  AR(1),  pode‐
se mostrar  que  a  v ariância  deste  estimador é:

Onde Var(β^2)AR1   i ndica  a  v ariância  do  e sti mador  sob  a  h ipótese  de  e rros  AR


(1).

A comparação  de  (12.2.8)  e  ( 12.2.7)  mostra  que  a  v ariância  sob  o  e squema  AR


(1) tem  uma  c oleção  de  termos  adicionais  (em  relação  à  v ariância  sob  a  h ipót
ese de  e rros  não  correlacionados). Estes  termos  adicionais  dependem  de  ρ  e  t
ambém das  autocorrelações amostrais  da  variável  explicativa X  e m  v ários  perío
dos anteriores. 

Além disso,  em  geral  não  podemos  prever  se  a  v ariância  dada  por  (12.2.7)  ser
á maior  ou  m enor  que  a  d ada  por  (12.2.8).  É  c laro  que  se  ρ  =  0 ,  a s  d uas  f
mulas coincidirão.  Mas,  como  princípio  geral,  as  duas  variâncias  não  serão  iguai
s.

Para dar  uma  i déia  da  diferença  entre  as  variâncias  (12.2.7)  e  ( 12.2.8),  suponh
a que  o  r egressor  X  t ambém  siga  um  p rocesso  AR(1)  com  um  c oeficiente  de  a
utocorrelação r.  Pode‐se  mostrar  que  (12.2.8)  se  r eduz  a:

Se, por  exemplo,  r  =  0 ,6  e  ρ  =  0 , 8,  uti lizando  (12.2.9)  segue  que  Var(β^2)AR1 


= 2,8461  Var(β^2)MQO. Dito  de  outra  forma,  Var(β^2)MQO  =  ( 1/  2 ,8461)  Var(β
^2)AR1 =  0 ,3513  Var(β^2)AR1. Ou  seja,  a  f órmula  usual  de  M QO  [ (12.2.7)]  sub
estimará a  v ariância  de  β 2  s ob  o  e squema  AR(1)  por  cerca  de  6 5%. 

Em resumo: uma aplicação cega das fórmulas MQO usuais para calcular os desvios e
os erros padrão dos estimadores MQO estimadores pode levar a resultados
totalmente enganosos.

Suponha que  a  g ente  insista  em  c ontinuar  usando  o  e sti mador  MQO  de  β 2  e 


que corrigimos  a  v ariância  levando  em  c onta  a  e strutura  AR(1)  para  o  e rro.  Qu
ais as  propriedades  de  β ^2  ?
 Ele  é  a inda  linear  e  n ão  t endencioso,  mas  não  é  B LUE  (ou  seja,  não  é  e fi cie
te). Já  tí nhamos  chegado  a  c onclusões  semelhantes quanto  estudamos  o  p roble
ma da  heterocedasticidade, e  v imos  que  naquelas  condições era  possível  encon
trar um  e stimador  efi ciente através  de  m ínimos  quadrados  generalizados.  Na  pr
óxima seção  veremos  quais  os  passos  necessários para  encontrar  estimadores  B
LUE sob  a  h ipótese  de  e rros  AR(1).

12.3. O ESTIMADOR BLUE NA PRESENÇA DE AUTOCORRELAÇÃO


Considere ainda  o  m odelo  de  r egressão  com  duas  variáveis  e  s uponha  a  e xistê
ncia de  e rros  AR(1)  como  na  seção  anterior.  Pode‐
se mostrar  que  o  e sti mador  BLUE  do  c oeficiente angular  é  d ado  por:

Onde C  é  u m  f ator  de  c orreção  que  pode  ser  i gnorado  na  prática.  Note  que  e
m (12.3.1)  o  s ubscrito  t  v ai  de  2  a té  n  ( pois  o  e sti mador  depende  de  y  e  x 
efasados em  um  i nstante).  A  v ariância  deste  estimador é  d ada  por:

Onde D  é  u m  o utro  fator  de  c orreção,  que  também  pode  ser  i gnorado  na  prá
tica. 
O estimador  β^2GLS  ,  c omo  o  e xpoente  sugere,  é  o bti do  pelo  método  de  m íni
mos quadrados  generalizados. Como  observado  no  Capítulo  11,  o  m étodo  de  m
ínimos quadrados  generalizados  quer  incorporar quaisquer  informações adicionai
s disponíveis  (por  exemplo,  a  n atureza  da  heterocedasticidade ou  a  a utocorrela
ção) diretamente  no  processo  de  e sti mação  através  da  transformação das  variá
veis, enquanto  que  os  m ínimos  quadrados  ordinários  esta  informação  não  é  d ir
etamente levada  em  c onsideração.

A fórmula  do  e stimador  de  m ínimos  quadrados  generalizados  dado  em  (12.3.1)


 depende  explicitamente do  parâmetro  de  autocorrelação  ρ  e nquanto  o  e sti ma
dor MQO  dado  por  (12.2.6)  ignora  esta  informação.

Intuitivamente, essa  é  a  r azão  pela  qual  o  e sti mador  de  m ínimos  quadrados  ge


neralizados é  B LUE  e  n ão  o  e sti mador  MQO.  O  e sti mador  de  m ínimos  quadrad
os generalizados  usa  toda  a  i nformação  disponível, o  q ue  não  o corre  com  o  e s
timador MQO.   S e  ρ  =  0 ,  n ão  e xistem  informações adicionais  a  s erem  consider
adas, e,  portanto,  os  e stimadores  por  mínimos  quadrados  generalizados e  m íni
mos quadrados  ordinários  são  idênticos.

Em resumo, sob autocorrelação, é o estimador de mínimos quadrados generalizados


dado em (12.3.1) que é BLUE e a variância mínima é agora dada por (12.3.2) e não
por (12.2.8) ou (12.2.7).

Você pode  reescrever o  e sti mador  de  m ínimos  quadrados  generalizados  de  uma


 forma  mais  parecida  com  o  e sti mador  usual  MQO.  Sejam:

Então, a  e quação  (12.3.1)  torna‐se:

,
que tem  praticamente a  m esma  forma  que  a  d o  e sti mador  MQO,  mas  agora  a
plicado às  variáveist* ex yt*.
Também é  i mportante  notar  que  e m  ( 12.3.1)  e  e m  ( 12.2.6)  os  e sti madores est
ão expressos  como  funções  das  variáveis  centradas  em  torno  das  suas  médias 
(expressas por  letras  minúsculas).

Nota técnica
O Teorema  de  M arkov  fornece  apenas  uma  condição  suficiente  para  o  e sti mad
or MQO  ser  BLUE.  As  c ondições  necessárias e  s ufi cientes para  que  e ste  estima
dor seja  BLUE  são  dadas  pelo  teorema  de  K rushkal,  mencionado  no  c apítulo  an
terior. Logo,  em  alguns  casos  o  e sti mador  MQO  pode  se  B LUE  apesar  da  autoc
orrelação. Mas,  estes  casos  não  são  c omuns  na  prática. 

12.4 O QUE ACONTECE SE USAMOS MQO E EXISTE


AUTOCORRELAÇÃO?
Lembre‐
se: mesmo  quando  existe  autocorrelação, os  esti madores MQO  são  ainda  não  t
endenciosos e  l ineares,  além  de  c onsistentes  e  a ssintoticamente Normais.  Mas, 
eles não  são  m ais  estimadores de  variância  mínima  (ou  seja,  não  são  BLUE)! 

Suponha que  continuamos  a  u sar  os  e sti madores  MQO.  Levaremos  em  c onta  d


uas situações.

1)EstimaçãoMQOlevandoemcontaaautocorrelação

Suponha que  usamos  o  e sti mador  usual  MQO,  dado  por:

Mas, agora  decidimos  empregar  sua  variância  corrigida  para  a  a utocorrelação,  is


to é: 

Se empregarmos  esta  variância  (12.2.8)  na  c onstrução  de  i ntervalos  de  c onfianç


a, os  IC  t endem  a  s er  m ais  largos  que  os  o bti dos  a  p artir  dos  estimadores  de
 mínimos  quadrados  generalizados, e  i sto  ocorre  mesmo  se  a umentarmos  indefi
nidamente o  t amanho  da  a mostra.  Ou  seja,  na  situação  de  autocorrelação dos 
erros, o  e sti mador  MQO  não  é  a ssintoticamente eficiente. 
Em resumo: não use estimadores MQO na presença de autocorrelação, pois você
estará tirando conclusões erradas, e aumentar o tamanho da amostra não melhorará
a situação.

2) Estimação MQO sem levar em conta a autocorrelação

A situação  torna‐
se ainda  pior  se,  além  de  u sarmos  o  e sti mador  MQO  na  p resença  de  a utocorr
elação, deixarmos  de  c orrigir  sua  variância,  isto  é,  c ontinuamos a  u sar:

Quais os problemas decorrentes desta decisão?

 A variância  dos  resíduos,  dada  por:


será provavelmente menor  que  a  v ariância  real   σ 2 .  I sso  nos  l eva  a  s up
erestimar R2  e  a s  e statísticas  t. 
 Mesmo que  σ2  n ão  seja  subestimado, Var(β^2)  poderá  subestimar Var(β
^2)AR1   d ada  pela  equação  (12.2.8),  a  v ariância  do  e sti mador  MQO  sob
 a  p remissa  de  autocorrelação dos  resíduos  de  l ag  1 .  A ssim,  os  testes  t
 e  F  c onstruídos  a  p artir  de  Var(β^2)  levarão  a  c onclusões  erradas  sobre
 a  s ignificância dos  parâmetros  na  r egressão. 
 Sob a premissa do modelo clássico (inexistência de autocorrelação dos

resíduos), o estimador da variância

é não  tendencioso  para2,isto


σ  é:  .
Se a  h ipótese  de  i nexistência  de  autocorrelação for  violada  e  s upormos 
que  os  e rros  seguem  uma  e strutura  AR(1)  então  pode‐se  mostrar  que:
 Onde r é o c o efi ciente de
correlação amostral entre valores sucessivos da variável explicativa X, d

ado por:
 Suponha que
ambos ρ e r s ã o p ositivos, o q ue é u sual no c aso de s éries econômica

s. Então, de (12.4.1) segue que


, ou seja, o e sti mador usual da variância subestimará a v ariâ
nciaverdadeira.

Alémdisso,Var(β^2)éumestimadortendenciosodeVar( β^2)A
R1,oquepodeserobservadocomparando‐
se(12.2.7)e(12.2.8).Seambosρersãopositivossegue
queVar(β^2)<Var(β^2)AR1eentãoavariânciadoestimad
orMQOsubestimasuavariânciasobapremissadeerrosAR(
1).Então,aousaroestimadorMQOβ^2estamossupondoq
ueeletemumaprecisãomaiorqueareal(istoé,estamos
subestimandoseuerropadrão).Assim,aocalcularaestatístic
atparaβ2estaremos“inflando”ovalordestaestatística,qu
eparecerámaiordoqueé,naverdade.Issonoslevaaa
creditarqueoparâmetroβ2ésignificante,quando,nãoverda
de,nãooé.

Exemplo – simulação de Monte Carlo

OobjetivodesteexemploémostrarcomoousodoestimadorMQ
OnasituaçãodeerrosAR(1)tendeasubestimarσ2eVar(β^2).
Suponhaqueomodelorealéconhecidoedadopor:

Osεt
´sserãogeradosaleatoriamentedadistribuiçãoN(0,1)(usandooExce
l),eusamoscomovalorinicialε0=0.Noteque,apartirdag
eraçãodosεt
´sedeumvalorinicialparau,porexemplou0=5,podemosus
araequação(12.4.5)paragerarumasequênciadeutqueaprese
ntamcorrelaçãoserialdelag1.Ondeosεtsãoumruídobranco
commédiazeroevariância1.

Natabelaabaixoestãoosεt
´sgeradosaleatoriamentedadistribuiçãoN(0,1).

Apartirdestatabelapodemosgerarosutdeacordocomaequ
ação(12.4.5)eacondiçãoinicialu0=5.Porexemplo:

u1=0,7.u0+ε1=0,7(5)+(‐0,300)=3,200

u2=0,7.u1+ε2=0,7(3,200)+(‐1,278)=0,962 etc...

Apróximafiguramostraaevoluçãodosut´saolongodotempo.

SuponhaagoraqueosvaloresdeXsão1,2,...,50.Apartird
elesedosu
´sgeradosacimapodemos,apartirdaequação(12.4.3),obteros
Yt.Então,Yt=1+0,8.Xt+utparat=1,2,...,50.
Específicamente,

Y1=1+0,8+u1=1,8+u1=1,8+3,2=5

Y2=1+0,8(2)+u2=2,6+u2=2,6+0,962=3,562,et
c...

ApróximatabelaforneceosvaloresdeuteYtparat=1,2,..
.10.

OgráficodeYtémostradoaseguir(parat=1,2,...,50):

Nopróximopassoajustamosumaregressãoaosprimeiros25pares
(Xt,Yt).Veremosqueoresultadodestaregressãonãolembranemu
mpoucoaequaçãoverdadeiraE(Yt|Xt)=1+0,8*Xt.

OresultadodaregressãolinearnoExcelé:
OR2destaregressãoé86,6%.Notequeavariânciaestimada2ˆ
σé3,50(igualàRSS/(n‐
2)=80,48/23=3,50),umvalorMUITOdiferentedoreal.

Databelaacimanota‐
sequeaequaçãoestimadausandoosprimeiros25paresé:tt XY
*633,0516,2ˆ+=
eambososcoeficientesangularelinearsãosignificantes,dea
cordocomasestatísticastcorrespondentes.

ApróximafiguramostraosvaloresdeYteasretasreal(1+
0,8Xt)eajustadapelomodeloderegressãonos25primeirospontos
(2,516+0,633Xt).

AfiguraanteriorjustificaporqueoprocedimentodeMQOtendea
subestimaravariânciaseexisteautocorrelaçãodosresíduos.Note
queosresíduoscomputadosemrelaçãoàretavermelha(retaMQO
)tendemasermenoresqueosresíduoscalculadosemrelaçãoà
retareal(retaazul).Paraverificarisso,bastaselecionarumponto
YqualqueretraçaralinhaverticalentreYeareta
ajustadaMQO(ouentreYealinhaverdadeira–
linhaazul).Assim,osresíduosMQOnãofornecemumaboaestim
ativadoserrosui.

ConsidereumoutroexperimentodeMonteCarlo,usandoosmesmos
dadosqueantes,massuponhaqueρ
=0naequação(12.4.5),enãomais0,7comosupostonaexperi
ênciaanterior.Entãoosutsãoagoradescorrelatados,u1=ε1=
‐0,300,u2=ε2=‐1,278,etc...

Daí:

Y1=1+0,8+u1=1,8+u1=1,8–0,3=1,5

Y2=1+0,8(2)+u2=2,6+u2=2,6–1,278=1,322 etc...

AseguirajustamosaretaporMQOparaosprimeiros25pares(
Xt,Yt).Notequeagoraahipótesedeerrosdescorrelatadoséválida
eassimaretaajustadadeveseaproximardaretaverdadeira1
+0,8Xt.Os25valoresdeXeYsãomostradosnapróximata
bela:

Aequaçãoestimadausandoosprimeiros25paresé:

Notequeocoeficientelineardaregressãonãoésignificante(a5
%).OR2destaregressãoé96,7%(nocasoanteriorera86,6%).
Avariânciaestimada2ˆσé1,20(videtabelaANOVA),bemmaispr
óximadovalorverdadeiro(1).

Ográficoaseguirapresentaospares(X,Y)easretasrealea
justadaporMQO.
12.5. EXEMPLO ‐ RELAÇÃO ENTRE SALÁRIOS E PRODUTIVIDADE
NOS EUA
Osdadosdatabela12.4apresentamíndicesderemuneraçãorealp
orhora(Y)eproduçãoporhora(X)emempresasdosEUAno
períodoentre1959e1998.

Afiguraaseguirmostraestesdados.

Gujaratiajustadoismodelos,umlineareoutrolog‐
linear,comosresultadosmostradosaseguir.

1) Modelo linear

OndedéaestatísticadeDurbin‐
Watson,queserádiscutidaaseguirese(.)indicaoerropadrão
doestimador.

2) Modelo log‐linear
Asquestõesquesecolocamnapráticasão:

 Osmodelosexibemresultadosparecidos.
 Oscoeficientesestimados,avaliadospelasestatísticast,parecem
altamentesignificantes.Mas,atéquepontoosresultadosdas
regressões(12.5.1)e(12.5.2)sãoconfiáveis?
 Aautocorrelaçãodeveserumproblemaaqui,poisambasas
sériesevoluemnotempo,enestasituaçãonãopodemosconfi
arnoserrospadrão(eassimasestatísticastproduzidastam
bémnãosãoconfiáveis).

Então a questão principal é: COMO DETECTAR A AUTOCORRELAÇÃO?


12.6. DETECTANDO A AUTOCORRELAÇÃO
Lembre‐
sequeaausênciadeautocorrelaçãoéumapremissafeitasobre
oserrosdomodelo,quenãosãoobserváveis–
omelhorquetemospara“inferir”sobreoserrossãoosresí
duosdomodelo,quepodemsercalculados.Entãoomelhorque
podemosfazeréusarosresíduosparaverificarseapremissa
decorrelaçãozerodoserrosestásendoviolada(usamoseste
mesmoraciocínioparainferirsobreaheterocedasticidade,lembra‐
se?).

1) Método Gráfico

Ográficodosresíduos(oudoquadradodosresíduos)podereve
laraexistênciadeautocorrelação.SENÃOEXISTEAUTOCORRELAÇÃ
O,ográficodosresíduosaolongodotempodeveserpurame
ntealeatório,comoseguinteaspecto:

Volteaoexemplodaseção12.5.econsidereomodelolinear(
12.5.1).Ográficodosresíduos(edosresíduospadronizados,i.e.,
divididospeloerropadrãodaregressãoσˆ)émostradoaseg
uir:
Notequeambososresíduos(“puro”epadronizado)exibemum
padrãoparecidocomodafiguraabaixo:

Ouseja,osresíduosparecemseguiropadrão:umasequênciad
evaloresnegativos,umasequênciadevalorespositivoseumas
equênciadevaloresnegativos.Estepadrãosugerequeosresíduo
snãosãopuramentealeatórios,ouseja,háumaindicaçãode
correlaçãoentreosresíduosdediferentesinstantes.

Umaformadetentarverificarissoéfazerográficodoresíduo
noinstantetcontraoresíduonoinstanteanterior.Seeste
gráficoapresentaumpadrãoclaramentenãoaleatório,háevidênci
adequeoresíduonoinstantetdependadoresíduonoinst
anteanterior,ouseja,háevidênciadeautocorrelaçãodelag1.
Ográficoaseguirmostraosresíduosnosinstantestet‐
1daregressãolinear(12.5.1).
Ográficomostraumpadrãolinearbastanteclaroentreu^(t)e
u^(t‐
1).Issoindicaumafortecorrelaçãopositivaentreosresíduos,e
portantoháevidênciadeautocorrelaçãonoserros(nãoobserváv
eis).

2) O teste das carreiras (“runs test”)

Naspáginasanterioresmostramosalgumasmaneirasdetentardete
ctaraautocorrelaçãonoserrosapartirdegráficosdosresídu
os.Oproblemaéqueestasanálises,emboramuitoimportantes,
sãobastanteempíricasesubjetivas,nãoháuma“receita”infalí
velparadizerinequivocamentequeaautocorrelaçãoexisteounã
o.

Otestedascarreiras(tambémconhecidocomtestedeGearyou
testedeWald‐
Wolfowitz)éumtestedealeatoriedade,eseráaplicadoaosresí
duosdomodelo.Elesebaseianosinaldosresíduosdaregress
ão.Lembre‐
sequeosresíduostêmmédiazero,eassimoqueotestev
erificaéseospadrõesderesíduosacimaeabaixodamédia
(zero)sãoaleatórios.Otestepodeserestendidoasériescom
médiasdiferentesdezero,bastaaplicarotesteàsériecom
amédiasubtraída.
Nocasodaregressão(12.5.1)existem40resíduos,queapresenta
moseguintepadrão:

 9resíduosnegativos
 21resíduospositivos
 10resíduosnegativos

Definição (“carreira”)

Umacarreira(“run”)éumasequênciaininterruptaderesultadoscom
omesmosinal.Aextensãodacarreiraéonúmerodeelemento
squeacompõem.Nocasodosresíduosdaregressão(12.5.1)exis
tem3carreiras,aprimeiradeextensão(comprimento)9,asegunda
decomprimento21eaterceiradecomprimento10.Seráquee
stas3carreirassecomportammaisoumenosdamesmaformaq
ueumasequênciade3carreirasde40observaçõesaleatórias?

Sejam:

N=númerototaldeobservações=N1+N2

N1=númerodesinaispositivos

N2=númerodesinaisnegativos

R=númerodecarreiras

Considereahipótesenuladequeosresultadossucessivossãoinde
pendentes.Suponhaque
AMBOSN1eN2>10.Nestascondições,onúmerodecarreir
as®éassintoticamenteNormalcommédiaevariância:

Sobahipótesenuladealeatoriedadeeusandoumintervalodeco
nfiança95%então:
Ouseja,Restánointervalodescritoacimacom95%deprobabilidade.Logo,
REJEITA‐
SEAHIPÓTESEDEALEATORIEDADEDASCARREIRAS(COMNÍVEL5%)SEOI
NTERVALODESCRITOEM(12.6.3)NÃOCONTÉMR.

Nosresíduosdaregressão(12.5.1),N1=21,N2=19,N=21
19=40eR=3.Então:

Logo,oIC95%paraRé:

(20,95–
1,96*3,11,20,95+1,96*3,11)=(14,85,27,05) que obviame
ntenãoincluiR=3.

Logo,rejeitamosahipótesedequeosresíduosdaregressão(12.5.1
)sãoaleatórios,ousejam,elesapresentamalgumtipodecomporta
mentosistemático.

Nota

OtesteapresentadoéválidoquandoambosN1eN2>10.
SwedeEisenhartelaboraramtabelasparavaloresmenoresqueestes.
AstabelasestãonoapêndiceD.6deGujaratiesãoreproduzidas
aseguir.AstabelasD.6AeD.6Bfornecemonúmerocríticon
decarreiras.Senémenorqueovalor
emD.6AoumaiorqueovaloremD.6B,rejeita‐
seahipótesedealeatoriedadeaonível5%,
Porexemplo,suponhaqueexistemN=30observações,dasquais
N1=20sãopositivaseN2=10sãonegativas.Então,seolharmospara
astabelasanteriores,rejeita‐
seahipótesedealeatoriedadeseR<=9(tabelaD.6A)ouR=>
20(tabelaD.6B).

Você também pode gostar