Escolar Documentos
Profissional Documentos
Cultura Documentos
Outubro, 2000
ABSTRACT
Since Hsiao [1986]s work, many surveys have appeared, providing the researcher with
the necessary tools for fully enjoying the advantages of panel data in terms of both
microeconometric and macroeconometric studies. This survey has this very aim and, in a
sense, offers no novel contribution, beyond the fact of bringing together some new
developments in estimation and specification testing in a selective manner. The estimation
of dynamic models either with fixed effects or random effects in the intercept using LSDV,
GLS,MLE, IV and GMM is presented, as well as binary choice models. A short review on
specification tests and unit roots testing is also presented.
RESUMO
Keywords: panel data, dynamic models estimation, LSDV, GLS, MLE, IV, GMM, unit
root tests
Palavras-Chave: dados em painel, estimao de modelos dinmicos, LSDV, GLS, MLE,
IV, GMM e testes de raiz unitria.
*
Centro de Estudos Macroeconmicos e Previso
NDICE
1. INTRODUO........................................................................................................................................... 1
7. DADOS DISCRETOS.............................................................................................................................. 61
8. MISCELNEA DE TEMAS..................................................................................................................... 68
9. CONCLUSO........................................................................................................................................... 78
1
potencialmente distintas. Ou seja, permite tipificar as respostas de diferentes indivduos a
determinados acontecimentos, em diferentes momentos.
Por outro lado, a maior quantidade de informao disponvel aumenta a eficincia
da estimao. Ou seja, os dados em painel permitem identificar e medir efeitos que no
sero pura e simplesmente detectveis em estudos exclusivamente seccionais ou temporais,
bem como construir e testar modelos comportamentais complexos, nomeadamente
recorrendo a modelos com desfasamentos distribudos com poucas restries.
No entanto, a anlise economtrica com dados em painel no est isenta de
problemas, nomeadamente porque:
aumenta o risco de se ter amostras incompletas ou com graves problemas de recolha
de dados, bem como a importncia dos erros de medida;
se virmos uma populao como um conjunto de decises que se reflectem em
diferentes histrias individuais (segundo uma definio de Haavelmo), estas tero que
ser representadas como variveis aleatrias idiossincrticas (i.e., especficas a cada
indivduo) e que certamente estaro correlacionadas no apenas com a varivel
dependente, mas tambm com o conjunto das variveis explicativas, o que causa
diversos problemas ao nvel da identificao e estimao dos modelos;
ocorre o chamado enviesamento de heterogeneidade, i.e., o enviesamento resultante
de uma m especificao pela no considerao de uma eventual diferenciao dos
coeficientes ao longo das unidades seccionais e/ou ao longo do tempo;
surgem problemas relacionados com o enviesamento de seleco (selectivity bias), ou
seja, erros resultantes da recolha dos dados que levam a que estes no constituam uma
amostra aleatria. Inclui questes como a auto-selectividade (amostras truncadas) e
ausncia de resposta ou atrito (excluso de indivduos em sucessivas rondas devido a
morte ou alterao de residncia, por exemplo). Uma forma particular de
enviesamento de seleco, comum nos estudos macroeconomtricos, relaciona-se com
a seleco das unidades individuais a utilizar no estudo. Uma seleco de acordo com
um critrio sistemtico, como usualmente efectuado em macroeconomia, do tipo,
pases da OCDE ou pases que aderiram a um dado regime de poltica econmica,
no garantir a constituio de uma amostra aleatria e, dessa forma, levar a que a
estimao seja genericamente inconsistente.
Na prxima seco, apresenta-se o tema da estimao de modelos uniequacionais
com dados em painel, atravs de uma abordagem genrica dos modelos estticos de efeitos
2
fixos e de efeitos aleatrios, limitados ao termo independente, o que usualmente
conhecido como modelo de componentes de erro. Omitiram-se propositadamente os
modelos de coeficientes variveis (fixos ou aleatrios) mais gerais, para limitar o espectro
de anlise.
No terceiro captulo, abordam-se especificamente os modelos dinmicos, quer de
efeitos fixos, quer de efeitos aleatrios e os problemas que se colocam na sua estimao,
por terem variveis dependentes desfasadas como variveis explicativas. ainda feita uma
breve referncia a uma abordagem heterogeneidade individual alternativa aos modelos de
componentes de erro e que recorre a especificaes diversas para as matrizes de varincias
e covarincias dos termos de perturbao.
Na quarta seco, resumem-se as questes relacionadas com a estimao e
identificao de modelos com desfasamentos distribudos, seguindo-se de perto a
exposio que consta da seco 8.1 de Hsiao [1986].
No quinto captulo, introduz-se a estimao de modelos dinmicos com dados em
painel atravs de tcnicas GMM, recorrendo-se extensivamente a Mtys [1999] e Baltagi
[1995].
No sexto captulo, apresentam-se as principais referncias sobre testes de deteco
da existncia de razes unitrias, com amostras em painel, questo particularmente
relevante para os modelos dinmicos.
O captulo sete apresenta o tema da estimao de modelos dinmicos com dados
discretos, nomeadamente a estimao de modelos de escolha binria.
O captulo oitavo resume os objectivos e concluses de um conjunto restrito de
artigos merecedores de destaque, por serem textos fundadores ou por, sendo recentes,
poderem dar indicaes quanto a eventuais evolues da discusso em torno da estimao
de modelos economtricos dinmicos com dados em painel. So tambm apresentados
diversos testes de especificao adaptados a modelos com dados em painel.
O ltimo captulo apresenta as principais concluses da recolha.
3
2. MODELOS ESTTICOS: ALGUMAS CONSIDERAES
yit = 1it x1it + 2 it x2 it +K+ kit x kit + uit yit = xit it + uit ; i = 1, K, N e t = 1,K, T (2.1)
4
a(I): it = , i,t, em que (k1);
b(I): uit ~ i.i.d.(0,2).
O modelo poder ser estimado pela aplicao de OLS amostra longitudinal visto
cumprirem-se as hipteses clssicas do modelo de regresso linear, no que conhecido
como pooled OLS. No entanto, ao no dar conta de uma heterogeneidade eventualmente
existente, o modelo padecer de um grave erro de especificao e os enviesamentos sero
grandes. Alm disso, por ignorar a existncia de heterogeneidade nos dados, a aplicao de
OLS em pool no verdadeiramente um mtodo de estimao em painel.
5
correlao contempornea entre as perturbaes de dois indivduos, que pode ser traduzida
atravs de uma dada estrutura no nula de covarincias das perturbaes, nomeadamente:
o que no mais que o modelo SUR de Zellner. Quando T, o modelo revela-se muito
abrangente ao dar conta da heterogeneidade individual, ao mesmo tempo que explicita uma
interdependncia relativamente livre. No entanto, na maior parte dos estudos em painel, em
que N grande e T relativamente pequeno, o modelo consome demasiados graus de
liberdade, tornando a sua estimao pouco eficiente, se no mesmo impossvel (o nmero
de parmetros a estimar ascender a Nk+N(N+1)/2).
Uma forma mais simples de enunciar a especificao fazer 1it = 1 + i, pelo que
o modelo base passa a ser:
yit = i + xit + uit (2.2)
6
Este modelo chamado de Anlise de Covarincia, um caso especfico da famlia
de Modelos de Efeitos Fixos1, ou modelo de variveis dummy individuais. O modelo
relativamente fcil de estimar, trata as diferenas individuais de forma sistemtica e
permite que as mesmas sejam testadas.
1
A notao Efeitos Fixos frequentemente usada exclusivamente para este tipo de modelo, ainda que deva
ser aplicada a todos os modelos em que os parmetros (termo independente e coeficientes associados a
variveis explicativas) so variveis de indivduo para indivduo, mas de forma no aleatria.
7
VI. Modelo de Coeficientes Aleatrios
em que uit ser um termo de perturbao com mdia nula e matriz de varincias V. Ser
precisamente a concepo de diferentes configuraes para V que dar origem a diferentes
justificaes para a heterogeneidade dos dados. No caso de V=2INT, temos a verso
pooled OLS do modelo em painel que ser, de todas, a menos interessante. A verso mais
complexa ser a de admitir que
uit = i ui,t-1 + it
E(uit)=0
ii
( )
E u it2 =
1 i2
8
para a qual haver um estimador GLS eficiente, desde que os regressores sejam ortogonais
face aos termos de perturbao. Atendendo a que o nmero de parmetros a estimar cresce
com N, trata-se de uma especificao particularmente adequada para painis relativamente
longos e estreitos (N pequeno e T grande). Para os painis tpicos, com uma dimenso
seccional relativamente grande face temporal, as especificaes com componentes de
erro sero mais parcimoniosas, para alm de serem mais robustas face a erros de
especificao.
9
em que o vector de (k-1) coeficientes associados s variveis explicativas (exclui-se,
pois, o termo independente), x it a linha de (k-1) colunas relativas aos valores assumidos
pelas variveis explicativas, para o i-simo indivduo, no momento t e uit o termo de
perturbao genrico, que se assume respeitar E(uit) = 0 (i,t), E(uit .ujs) = 2, se i=j e t=s e
E(uit .ujs) = 0, caso contrrio. A segunda representao corresponde a uma agregao do
modelo para os T perodos da amostra, em que yi o vector (T1) de yit, iT um vector
unitrio2 coluna (T1) e xi a matriz T(k-1), cujas linhas correspondem a T observaes de
cada uma das variveis explicativas (excluindo termo independente). Finalmente, a ltima
linha corresponde notao matricial mais condensada, em que Y corresponde ao vector
coluna (NT1) formado a partir da agregao vertical de yi, a matriz DN (NTN) e resulta
de DN = IN iT, o vector (N1) dos termos independentes e u o vector-coluna (NT1)
dos termos de perturbao.
Admite-se, ainda, que X no aleatria, independente de u e que [DN X] tem
caracterstica (N + k 1) < NT (o que sempre possvel desde que T 2)3.
A estimao de e por OLS BLUE, se se verificarem todos os pressupostos
enunciados. Os estimadores so:
= (X WN X) 1 X WN Y (2.6)
1
= (DN D N ) 1 D N (Y X ) = D N (Y X )
T (2.7)
Y W N Y X WN (Y X )
2 =
NT N K + 1 (2.8)
Var () = ( X W N X) 1
2
em que WN = INT - DN (DN DN)-1 DN = INT - 1/T DN D N = INT - 1/T(IN JT) uma matriz
simtrica idempotente de ordem NT e caracterstica (NT-N) e JT uma matriz unitria de
ordem T. A matriz Wn um operador de desvio em relao mdia, pelo que, WNu tem
elemento genrico (uit - i), por exemplo.
Note-se que esta forma de estimao do modelo no mais que a estimao por
OLS do modelo (2.5) transformado mediante a pr-multiplicao por Wn, ou seja, da sua
2
Ou seja, cujos elementos so todos iguais a 1.
3
Isto implica tambm que todas as colunas de X sejam linearmente independentes de DN.
10
estimao na forma de desvios em relao mdia (pelo Teorema de Frisch-Waugh4 e
atendendo a que WnDN = 0):
Wn Y = Wn X + Wn u (2.10)
a que tambm se chama estimao por LSDV (Least Square Dummy Variable)5, sendo que
o estimador de mais no que:
T K
i = y it k x ki = y x (2.11)
t =1 k =2
O mtodo LSDV, na prtica, elimina todos os efeitos que no variam com o tempo
(como o sexo, religio, ...) e obriga a uma grande perda de graus de liberdade. Apesar de
tudo, os estimadores LSDV (ou intra-grupo) so BLUE, como dissemos, desde que as
perturbaes sigam as hipteses clssicas e, com N e T, consistentes. No entanto,
se N e T fixo, apenas o estimador LSDV de permanece consistente pois o nmero de
parmetros i aumenta indefinidamente.
Sob a hiptese de normalidade das perturbaes, a usual inferncia estatstica em
amostras finitas permanece vlida. Assim, um teste t passar a ter NT - N - K + 1 graus de
liberdade e um teste existncia de efeitos individuais pode ser efectuado atravs de um
simples teste de Chow com o RSS a ser retirado de uma regresso OLS sobre o modelo
homogneo (I) descrito atrs e o USS a vir da estimao do modelo (1) por LSDV. A
estatstica (retirada de Baltagi[1995],12) a seguinte:
( RSS USS ) ( N 1)
F0 = ~ F ( N 1, NT N K )
USS ( NT N K )
4
Greene[1997],246.
5
De facto, pode-se distinguir esta estimao por LSDV de uma estimao OLS sobre o modelo no
transformado, com incluso de N dummies e que aqui se omitiu porque esta , na maior parte dos casos,
impraticvel atendendo grande dimenso da matriz a ser invertida (NT[N+K]).
11
sinttica, mas bastante clara pode ser encontrada em Mtys e Sevestre [1992],34-43 ou
em Baltagi[1995], cap.3). O estimador LSDV ou within na presena de efeitos fixos
seccionais e temporais opera tambm na base da diferenciao dos dados relativamente a
mdias. Considere-se um modelo tipo
y it = i + t + x it + u it
y i = iT i + + xi + i
Y = D N + D T + X +
em que se torna necessrio admitir duas restries de normalizao dos efeitos especficos,
a saber:
N T
i = 0 e
i =1
t =1
t =0
= ( XWX) 1 XWY
Y WY X W (Y X )
2 =
NT N T K + 1
Var ( ) = 2 ( X WX) 1
em que W = INT 1/T DN DN 1/N DTD T + 1/NT DN D N DTD T = INT 1/T(IN JT)
1/N(IT JN) + 1/NT JN JT. Obviamente, a transformao within, ao eliminar os efeitos
seccionais e temporais, no permite a estimao de variveis que no variem no tempo ou
de indivduo para indivduo.
A considerao de perturbaes no esfricas leva a que os estimadores LSDV no
sejam j BLUE os estimadores eficientes sero os GLS ou os MLE. O mtodo GLS
merece, no entanto, algumas consideraes.
Podemos considerar trs casos especiais de perturbaes no esfricas:
1. Perturbaes serialmente independentes: s h correlao contempornea entre as
perturbaes, i.e., no h autocorrelao temporal mas os erros esto
correlacionados seccionalmente (ou seja, h interdependncia entre os indivduos,
tal como se admite no modelo SUR, j referido). Neste caso, com Aij a representar a
matriz de covarincias entre os termos de perturbao do indivduo i e do indivduo
12
j, temos: Aij = ij IT e Var(u) = 2
= Aij IT , com Aii = i a serem matrizes
diagonais eventualmente iguais (no escalares, no caso de heteroscedasticidade);
2. Independncia Individual: cobre todos os casos de heteroscedasticidade e
autocorrelao ao nvel individual, sendo de particular interesse o caso de
homoscedasticidade em bloco dado por Aij = 0 se ij e Aii = A Var(u) = IN A;
3. Equi-correlao em bloco: Aii = A e Aij = B, com A positiva definida, B semi-
definida positiva e (A B) positiva definida, de tal forma que Var(u) = IN (A B)
+ JN B.
Pode ser demonstrado que a aplicao de um GLS habitual (i.e., recorrendo a -1 )
sobre o modelo transformado por W s ser equivalente (para ) aplicao de um mtodo
GLS sobre o modelo original nos casos 1 e 3. Para uma prova e clarificao do argumento,
veja-se Mtys e Sevestre [1992], 44-5.
13
Ao contrrio do que foi visto para o modelo de efeitos fixos, a heterogeneidade no
induzida atravs do termo independente, logo, atravs de E(yit), mas sim atravs da
varincia da varivel endgena. Uma especificao geral poder ser:
Y = i NT + X + u = i NT + X + i T + v
(2.12)
y it = + x it + u it e u it = i + v it
em que i (elemento genrico do vector coluna (N1), ) ser a varivel aleatria dos
efeitos individuais e vit o termo de perturbao geral.
Assume-se, ainda, que:
(f) X independente de e v.
6
Esta a decomposio espectral de , sendo (T2 + v2) e v2 as primeiras e segundas (nicas) razes
| = (T2 + v2) N(v2) N(T-1).
caractersticas de multiplicidade N e N(T-1), logo, |
7
Mas j no ser consistente se tivernos efeitos seccionais e temporais (Mtys e Sevestre[1992], 51)
14
estimador GLS, para o que precisamos de -1 e -1/2 dadas pela decomposio de
Wansbeek e Kapteyn:
1 1
1 = P + 2 Wn
(T + v )
2
2
v
(2.13) 8
1 1
1 2 = P+ Wn
(T 2 + v2 ) v
GLS = (X 1 X) 1 X 1 Y
V2 V2 (2.14)
GLS = (X Wn X + X PX ) 1 ( X Wn Y + X PY )
V2 + T 2 V2 + T 2
sendo a ltima frmula9 uma mdia ponderada de dois estimadores: o estimador LSDV ou
Intra-Grupo (Within) e o estimador Inter-Grupo (Between) que mais no que a aplicao
de OLS ao modelo (2.12) expresso em termos de mdias temporais para cada indivduo (ou
pr-multiplicado por P). Este ltimo argumento mais visvel se pretendermos estimar
apenas , para o que recorremos frmula proposta por Baltagi [1995]:
1
= XW X + V V2
2
1 1
X(P J ) X XW Y + X(P J )Y
V2 + T 2 V2 + T 2
GLS n NT n NT
NT NT (2.15)
1
2 1
GLS = XWn X + 2 V 2 X(P J NT )X XWn X W +
V + T NT
1 (2.16)
2 1 V2 1
+ XWn X + 2 V 2 X(P J NT )X X(P J ) X B
V + T V2 + T 2 NT
NT NT
GLS = W + W = W + (1 W )
1 W 2 B 1 W 1 B
8
Considera-se que toda a matriz que verifica =(
)(
).
9
De acordo com Mtys e Sevestre[1992], 52.
15
OLS d um peso excessivo variao entre as unidades, em vez de relegar parte destas
para variaes aleatrias atribuveis ao termo de perturbao i varivel seccionalmente; o
LSDV assume que vit = 0, logo, a nica variao entre os indivduos deve-se a um efeito
constante no tempo, pelo que, a questo de saber se este fixo ou aleatrio torna-se
irrelevante. Finalmente, repare-se que se T, o GLS equivalente ao LSDV. Ou seja, o
GLS pode ser visto como uma combinao ptima do estimadores Within e Between.
O estimador GLS ser cntrico e, pelo Teorema de Aitken, eficiente10, com matriz
de covarincias
1
2 1
Var ( GLS ) = v2 XWn X + 2 v 2 X(P J NT )X (2.18)
v + T NT
uPu
v2 =
N
(2.19)
uWn u
2 =
N (T 1)
podendo-se substituir u pelos resduos de estimao LSDV (Amemiya [1985] sugere estes
uma vez que retm a mesma distribuio assimpttica dos estimadores BQU), ainda que
nada garanta que as estimativas sejam todas no-negativas. Para no estender a exposio,
no se mencionam outros estimadores, embora se possa encontrar um resumo em Baltagi
[1995]. Desde que os estimadores das componentes de varincia sejam consistentes, os
estimadores FGLS retm as mesmas propriedades que o GLS (ainda que apenas
assimptoticamente).
10
Note-se que se com T, o GLS equivalente ao LSDV, em amostras com sries temporais longas (o que
, infelizmente, raro acontecer nos dados em painel), a perda de eficincia motivada pela utilizao do
estimador LSDV no dever ser significativa, o que permite contornar as dificuldades calculatrias do GLS,
nomeadamente nos casos em que desconhecida.
16
Um outro mtodo de estimao utilizado o MLE, que pode ser obtido atravs da
maximizao da funo de verosimilhana condensada em relao a e v2 dada por
ln LC = k
NT
(
)[ ]( N
)
ln Y X MLE Wn + 2 (P J NT ) Y X MLE + ln 2 ;
2 2
(2.20)
v2 1
= 2
2
e J NT = J NT
v + T
2
NT
2
=
(Y X
MLE)
W (Y X
n ) MLE
(T 1)(Y X ) (P J )(Y X )
(2.21)
MLE NT MLE
[ 1
] [
MLE = X( Wn + 2 P )X X Wn + 2 P Y ]
sendo que a soluo ter que ser procurada iterativamente. Os estimadores dos restantes
parmetros so baseados nas sucessivas estimativas de e 2, nomeadamente
1
MLE = yit i t Xit MLE = y X MLE
NT i t
(2.22)
2
v ,MLE =
1
NT
(
)[ ](
Y X MLE Wn + 2 (P J NT ) Y X MLE )
e cuja derivao pode ser encontrada em Baltagi [1995],18-9. Num estudo realizado por
Breusch, verificou-se que, quando muito, havia dois mximos na funo de
verosimilhana, pelo que s temos que nos precaver contra um mximo local, que
possivelmente ser uma soluo de canto (para 2=1, i.e., quando comeamos com o
estimador OLS, caso na segunda iterao se obtenha uma estimativa para 2 superior). Um
mtodo sugerido11 (e que se deve a Breusch) que se comece com, por um lado o
estimador Between e, pelo outro, com o estimador Within e se verifique se as duas
sequncias (que so montonas) convergem para o mesmo mximo, caso em que este ser
global. Os estimadores MLE assim obtidos so geralmente consistentes, ainda que para 2
tal s seja verdade no plano semi-assimpttico (i.e., com T fixo e N).
Quanto inferncia estatstica, em particular quanto aos testes existncia de
efeitos individuais e/ou temporais, sugerida a utilizao dos habituais testes
assimptticos, mencionando-se o teste LM por ser menos exigente em termos de clculos.
17
A estimao de modelos com efeitos temporais ou com efeitos seccionais e
temporais no muito distinta da que foi apresentada apenas para os efeitos individuais,
ainda que, no segundo caso, se torne notacional e computacionalmente mais pesada,
motivo pelo qual foi aqui omitida. Ressalve-se apenas o caso da estimao por MLE nos
modelos com efeitos duplos, em que a maximizao da funo de verosimilhana de tal
forma no-linear e complicada que ainda se lhe no conhecem expresses analticas. De
qualquer forma, Baltagi[1995] sugere um mtodo iterativo semelhante ao apresentado
acima. Podem ser encontrados excelentes resumos do tema, tanto em Mtys et al. [1992],
como em Baltagi[1995].
Finalmente, nas formulaes mais simples, assume-se uma dada estrutura para a
matriz de varincias e covarincias dos termos de perturbao (i.e., admite-se a existncia
de variveis omissas que no variam temporal ou seccionalmente), o que nos permite
explorar a estrutura do processo de erro, quando T fixo (e no muito grande) e N. ,
no entanto, possvel estimar consistentemente os parmetros sem impor restries sobre
(permitindo autocorrelao ou heteroscedasticidade) atravs de um mtodo proposto por
Chamberlain [1984] e que consiste em tratar-se cada perodo t como uma equao e
estimar o modelo como um sistema de T equaes com dados seccionais, dado por
y = i T i + (I T )x i + u i
i (2.23)
( T 1)
y = i T + (I T x i ) + v i
i (2.24)
( T 1)
11
Baltagi [1995],19.
12
Ou seja, o previsor de erro quadrtico mdio mnimo ou de mnimos quadrados de y definido como funo
de x.
18
[ f( )] [ f( )] , em que um estimador consistente da matriz de varincias de
13
As frmulas podem ser encontradas em Hsiao [1986],59-60.
19
3. MODELOS DINMICOS AUTORREGRESSIVOS
3.1 Introduo
A natureza mais comum das relaes econmicas dinmica e uma das vantagens
dos dados em painel, como j foi visto, facultar uma melhor compreenso das dinmicas
de ajustamento. Estas relaes dinmicas podem ser representadas por uma varivel
dependente desfasada como regressor, i.e., por um modelo da forma
y it = yi ,t 1 + xit + u it ; i = 1,K, N ; t = 1,K, T
(3.1)
u it = i + vit
em que, 14 um escalar, xit o vector-coluna (K1) de variveis exgenas e uit o termo de
perturbao com apenas uma fonte de erro (individual), verificando-se que i e vit so i.i.d.
e no mutuamente correlacionadas, com mdia nula e varincias 2 e v2,
respectivamente.
Antes de mais, uma vez que as propriedades dos estimadores com amostras finitas
so, em grande medida desconhecidas, a escolha de um mtodo de estimao, em
detrimento de outro, dever ser feita com base nas suas propriedades assimptticas.
A escolha entre a especificao de efeitos fixos e aleatrios acaba por ter
implicaes radicalmente diferentes das verificadas nos modelos estticos, nomeadamente
quanto consistncia, centricidade e eficincia dos estimadores. Assim, quando todas as
variveis explicativas so exgenas, o LSDV BLUE, na especificao de efeitos fixos e
cntrico e consistente, na de efeitos aleatrios, ainda que no eficiente, quando T fixo.
Adicionalmente, se algumas ou todas as variveis independentes se encontram
correlacionadas com os termos de perturbao, o LSDV permanece cntrico no caso de
efeitos fixos (ainda que erradique esses efeitos no observveis da estimao), mas um
GLS que no seja corrigido por essa correlao ser enviesado, o que contribuiu para que
se privilegiasse a primeira especificao, nestes modelos.
No entanto, quando uma dessas variveis explicativas endgena desfasada, o
estimador LSDV (que, recorde-se, MLE, sob o pressuposto de normalidade dos termos
de perturbao) no ser consistente, no caso de efeitos fixos, com T fixo e a eventual
14
No necessrio impor a restrio de estacionaridade | |<1 desde que T seja finito, pois podemos analisar
sempre as propriedades dos estimadores no plano semi-assimpttico N.
20
consistncia dos estimadores MLE e GLS (e, mesmo, a interpretao do modelo), na
especificao de efeitos aleatrios, depender crucialmente dos pressupostos assumidos
quanto primeira observao e da forma como T e N tendem para o infinito.
Um dos problemas com a estimao de modelos dinmicos com dados em painel,
comum aos estudos convencionais15, a correlao existente entre um dos regressores, yi,t-
1, e o termo de perturbao, uit, via i. Esta situao torna os estimadores OLS enviesados e
no consistentes, mesmo que vit no exiba autocorrelao, podendo o enviesamento
assimpttico ser significativo. A mesma situao se verifica para os estimadores LSDV, no
caso do modelo de efeitos fixos, e GLS, para o modelo de efeitos aleatrios, uma vez que
as transformaes operadas para eliminar i no eliminam a correlao entre yi,t-1 e o termo
de perturbao resultante. Assim, torna-se de crucial importncia a escolha de variveis
instrumentais que assegurem a consistncia e eficincia da estimao.
Uma questo fundamental para analisar as propriedades assimptticas dos
estimadores a clarificao do processo gerador da primeira observao, o que pode ser
evidenciado atravs da representao do modelo (3.1) da seguinte forma
t 1
1 t t 1
yit = y i , 0 + xit j +
j j
i + j vi ,t j
j=0 1 j =0
(3.2)
t 1
1 t
yit = j y i , 0 + j xit j + i + it
j=0 1
Ou seja, cada observao da varivel endgena pode ser expressa como a soma de
quatro componentes: a primeira depende do valor inicial ou ponto de partida; a segunda
dos valores actuais e passados das variveis exgenas; a terceira do valor dos efeitos
individuais i e a quarta no mais que um processo autorregressivo, com valores iniciais
fixos
it = i ,t 1 + vit
(3.2)
i 0 = 0
o que torna, desde logo, claro que as observaes iniciais vo influenciar decisivamente as
propriedades semi-assimptticas dos estimadores (com T fixo), levantando-se a questo da
sua eventual exogeneidade.
No entanto, como esta questo s assume relevncia para a estimao com efeitos
aleatrios, s ser abordada no ponto 3.3.
15
Aplicamos aqui a palavra convencional como sinnimo de estudos que recorram a amostras temporais ou
21
3.2 Estimao de Modelos com Efeitos Fixos
ainda equivalente ao MLE admitindo a normalidade de vit, com yi0 dados e WnY 0
(caso em que no existiria) e ser consistente se N e T, mas no quando T fixo. A
prova do argumento relativamente simples, pois, invocando o Teorema de Slutsky,
temos:
seccionais.
16
A frmula, retirada de Mtys e Sevestre[1992],99, resulta da estimao por OLS do modelo (3.3) pr-
multiplicado por Wn. O estimador OLS de , de menor interesse,
= Y Y1 X i = yi yi, 1 x i .
22
1
1 1 1
plim Y1Wn Y1 plim Y1 Wn X plim Y1 Wn v
N NT N NT N NT
plim = +
plim
N 1 1 1
XWn Y1 plim XWn X plim X Wn v
N NT N NT N NT
1
e como, pela ortogonalidade das perturbaes face a X, temos plim XWn v = 0 , mas
N NT
como
1 1
plim
N NT
YWn v = plim t ( yi ,t 1 yi ,1 )( vi ,t 1 vi ,1 ) =
N NT i
1 1 T 1 T + T 2
= E ( yi ,t 1 yi ,1 )( vi ,t 1 vi ,1 ) = 2 v (3.5)
T t T ( 1 )2
temos que (3.5) 0, quando T fixo e quando T ser zero apenas se ||<1, como j
havamos notado. Assim, a semi-inconsistncia do LSDV fica a dever-se correlao (de
ordem O(1/T)) entre (yi,t-1 - yi.-1) e (vi,t - vi.), quando N, mesmo que yi,t-1 e vi,t sejam
independentes, criada pela eliminao dos efeitos individuais (no observveis) i do
modelo transformado.
Ainda que, quando se dispe de um painel com uma dimenso temporal grande, se
espere um enviesamento assimpttico pequeno17, como no esse o caso mais frequente
nas amostras longitudinais, torna-se essencial que se encontre um estimador consistente
para , quando T finito. Esse mtodo o das variveis instrumentais (IV).
Um mtodo IV sugerido por Balestra e Nerlove [1966] para o modelo de efeitos
aleatrios (que veremos na seco seguinte) e que pode ser usado no modelo de efeitos
fixos, sujeito a algumas alteraes, consiste em considerar uma matriz Z de m K+1
variveis instrumentais (p.ex., xit, xi,t-1, ) e estimar o modelo (3.3) por OLS pr-
multiplicado pelo projector de Y em Z*, PZ*=Z*(Z*Z*)-1Z*18, com Z*=(DN, Z). Atendendo
a que PZ*X=X (assumindo que X est contido em Z), PZ*DN=DN e que Wn e DN so
ortogonais, tal equivale aplicao de OLS ao modelo
17
Num modelo sem variveis exgenas, o enviesamento assimpttico , de acordo com Hsiao[1986], 74:
1
1+ 1 1 T 2 1
plim ( ) =
1 1 T (1 ) .
1
N T 1 T 1 (1 )(T 1)
23
Wn PZ Y = Wn PZ Y1 + Wn X + Wn PZ v (3.6)
Um outro estimador IV que se deve a Anderson e Hsiao [1981] poder ser obtido se
reescrevermos o modelo (3.3) nas primeiras diferenas (o que elimina )
Y = Y1 + X + v (3.8)
e usar como instrumento para Y-1, alternativamente, yi,t-2=(yi,t-2 yt-3) ou yt-2, sendo
ambos os estimadores da resultantes consistentes, ainda que o IV baseado em yt-2 seja mais
eficiente e menos exigente (basta que T2), segundo os mesmos autores.
De qualquer forma, os estimadores no sero completamente eficientes pois os
termos de perturbao transformados so MA(1). Mas, se se tentar ultrapassar este
problema atravs da pr-multiplicao do modelo nas primeiras diferenas por -1/2
, em
que a matriz de varincias e covarincias dos termos de perturbao v, obtm-se um
modelo com termos de perturbao que sero combinaes lineares de vit, logo,
correlacionados com quaisquer instrumentos no estritamente exgenos (i.e., yt-p e yt-p).
Pode-se, no entanto, usar os valores desfasados de X ou -1/2X como instrumentos.
Urga [1992] prope que se use, em vez das primeiras diferenas, as diferenas
ortogonais de Arellano e que consistem na transformao do modelo para desvios em
relao mdia dos valores futuros (em cada momento), como forma de remover os efeitos
individuais sem comprometer a ortogonalidade dos termos de perturbao transformados.
Um estimador mais eficiente foi ainda proposto por Arellano e Bond [1991], sob a
forma de um estimador IV generalizado (GIV) e que consiste na estimao por GLS de um
(
modelo na forma (3.8) transformado pela pr-multiplicao por uma matriz Z . Esta, uma
18
A sua multiplicao por Y dar a projeco deste no espao definido por Z*, i.e., Z*b e b=*(Z*Z*)-1Z*Y.
24
matriz que rene todos os instrumentos para cada valor desfasado de yit ortogonais em
( ( ( (
relao a vit, ou seja, Z =[ Z 1 ,, Z N ], que cumpre E( Z ivi)=019,i, com vi=(vi3-
vi2,, viT- vi,T-1). O estimador GIV de = [,
]
Em concluso, ainda que nem sempre se possa comparar um estimador com outro,
parece ser de recomendar o estimador IV de Balestra e Nerlove, desde que as variveis X
sejam estritamente exgenas e os termos de perturbao vit no exibam autocorrelao. J
se X no for estritamente exgeno, ainda que os termos de perturbao permaneam no
autocorrelacionados, os estimadores de Arellano e Bond [1991] afiguram-se como os
melhores candidatos. Se X no for estritamente exgeno e houver autocorrelao, Mtys e
Sevestre [1992] aconselham que se use como instrumento os valores desfasados de X no
modelo (3.8).
O estimador sugerido em Arellano e Bond [1991], tal como a questo da filtragem
com a matriz de varincias, voltar a ser discutido no captulo 5 relativo estimao de
modelos com dados em painel pelo mtodo GMM.
19
Por exemplo, para t=3, teramos como instrumentos vlidos yi0, yi1, yi2 e xi , podendo a lista ser expandida
com valores desfasados de xi . A este propsito veja-se Mtys e Sevestre[1992],100-5 e Baltagi[1995]128-
25
questo dos efeitos aleatrios (autocorrelacionados), ao implicar correlao entre os termos
de perturbao e a varivel autorregressiva tem consequncias mais srias do que nos casos
precedentes.
Considere-se, ento, o seguinte modelo de componentes de erro (unicamente
individuais)
Y = Y1 + X + u
(3.10)
u=+v
em que E(u)=0, Var(u) = = v2Wn+(v2+T2)P = v2(Wn+1/ 2P) e X contm K
variveis exgenas.
fcil ver que o estimador OLS (sem dar conta dos efeitos individuais), ao
contrrio do que sucedia nos modelos estticos, no cntrico nem consistente, devido
correlao entre yi,t-1 e i, podendo o enviesamento ser bastante significativo.
Uma abordagem bastante poderosa, proposta por Maddala, consiste em recorrer
classe geral de estimadores e que mais no so que a estimao do modelo (3.10) pr-
y it = y i ,t 1 + i + v it
1 t t 1 (3.12)
y it = t y i , 0 + i + j v i ,t j
1 j =0
32.
20
Atendendo a que (Wn + P)(Wn + P)=(Wn + P).
26
N T N T
y
i =1 t =1
2
i ,t 1 yi =1 t =1
2
i ,t 1
( i + vit ) y i ,t 1
plim (OLS ) = plim i =1 t =1
N T
>0
y
N N 2
i ,t 1
i =1 t =1
sendo que a incluso de variveis exgenas reduz, mas no elimina o enviesamento, pois o
estimador OLS de continua a sobrestimar o seu verdadeiro valor e o de encontra-se
enviesado para zero. Uma forma de determinar um estimador consistente para foi
desenvolvida por Sevestre e Trognon, em Mtys et al. [1992] e resulta num valor para
dado por
K (1 2 )
=
1 T E ( yi 0 i )
+ K (1 2 + T 2
1 + v
2 2
(T 1 T + ) T
K=
T (1 ) 2
2
= 2
2
+ v2
21
Ver Mtys e Sevestre [1992].
27
Quando o vector de perturbaes normal, a soluo natural para o problema de
estimao o recurso ao MLE que, desde que nada seja assumido quanto primeira
observao, ser regra geral equivalente ao OLS e, como este, no consistente.
A consistncia do MLE (e tambm do GLS, como vimos) vai depender de forma
determinante dos pressupostos admitidos quanto a yi0, pelo que podemos considerar quatro
casos23 para o modelo
22
Quando T e N, o GLS consistente pois converge para o LSDV (Hsiao[1986],88).
23
Para uma abordagem mais completa, veja-se Hsiao[1986],78-81.
28
i, pelo que no foroso que yi0 seja o incio do processo) ser um ponto de
Y + X + Z = U
y10 y11 K y1T x11 x12 K x1T 1 z1
y y 21 K y 2T x x22 K x 2T 1 z (3.14)
Y = 20 ; X = 21 ;Z = 2
M M O M M M O M M M
yN 0 yN1 L y NT xN1 xN 2 L x NT 1 z N
24
Para um ponto de situao, consulte-se Hsiao[1986],84.
29
yi0 = .zi + ui0 (3.15.1)
i = .ui0 + i (3.15.2)
As perturbaes (ui0,i,vi1,,viT) so i.i.d. normais, com mdia nula e varincias u2
2 v2 e a funo logartmica de verosimilhana
N N 1 1
ln LNT ( , , , , , u2 , 2 , v2 ) = C ln ln u2 i 1 i 2 u 2
(3.16)
2 u
i0
2 2 2 i
com = v2Wn+(v2 + T2)P e i um vector coluna (T1) de elemento genrico (yit - yi,t-1
- xit - zi - ui0). A maximizao de (3.16) com respeito aos parmetros desconhecidos
dar os estimadores MLE25, com a particularidade de os estimadores de e u2 serem os
estimadores OLS de (3.15.1) e de ui0 ser substitudo pelos resduos desta ltima regresso
em i. Os estimadores assim obtidos sero consistentes e, no caso de as perturbaes serem
normais, assimptoticamente eficientes, exibindo ainda um bom comportamento em
amostras finitas.
Atendendo a que uma m escolha da especificao das condies iniciais poder
levar a estimadores MLE que no sejam consistentes, por no serem os mais adequados
(no sendo assimptoticamente equivalentes aos verdadeiros MLE, por estarem em causa
funes de verosimilhana diferentes) e porque a regra geral dos estudos que se disponha
de sries temporais relativamente curtas, torna-se imperioso que se encontre um estimador
que no dependa de yi0.
Os diversos mtodos IV, j analisados na seco anterior, valem pelo facto de
serem geralmente consistentes (desde que N), independentemente de yi0 (ainda que
pouco se possa afirmar quanto s suas eficincias relativas) e pela sua grande
aplicabilidade, no havendo grandes diferenas relativamente ao modelo com efeitos fixos.
Por isso, acabam por ser os mais utilizados. Para excelentes resumos de vrios estimadores
podem consultar-se Baltagi [1995], 126-145, Mtys e Sevestre [1992] e Mtys [1999].
Quando se no impe qualquer restrio quanto estrutura de correlaes entre os
termos de perturbao, um mtodo eficiente e consistente (com T fixo) consiste em separar
o modelo (3.13) nas primeiras diferenas em T-1 equaes
25
Ver Mtys e Sevestre[1992], 111 para as equaes normais da condio de primeira ordem.
30
( y i 2 y i1 ) = ( y i1 yi 0 ) + ( xi 2 xi1 ) + (ui 2 ui1 )
( y y ) = ( y y ) + ( x x ) + (u u )
i3
; i = 1,K, N
i2 i2 i1 i3 i2 i3 i2
M
( y iT yi ,T 1 ) = ( y i ,T 1 yi ,T 2 ) + ( xiT xi ,T 1 ) + (uiT u i ,T 1 )
26
As restries podero e devero ser simplificadas, de acordo com Mtys e Sevestre [1992],113, por forma
31
funo da matriz de covarincias de
OLS , S, e de . Assim, teremos um estimador FGLS
( 1
)
FGLS = ( OLS ) 1( OLS ) ( OLS ) 1 OLS .
As vantagens deste mtodo de Chamberlain [1984] prendem-se com o facto de
necessitar de poucas restries, nomeadamente quanto dinmica das perturbaes, de
poder ser aplicado a modelos com variveis autorregressivas de ordem p>1 e de facilitar a
realizao de numerosos testes de especificao. No entanto, ao deixar a matriz de
covarincias de v irrestrita, o mtodo leva a uma perda de eficincia, quando esta tiver uma
estrutura conhecida. Por outro lado, trata-se de um mtodo computacionalmente muito
exigente, pelo que, pouco usado, ainda que esta questo seja cada vez menos relevante.
11 11 12 12 L 1n 1n
(3.18).
22 22 L 2 n 2 n
V = E ( ) = 21 21
M M O M
n1 n1 n 2 n 2 L nn nn
32
A estrutura de covarincias pode ser condicionada de forma a representar diversos
casos de interesse, sendo o mais simples obtido para termos de perturbao
homoscedsticos e no correlacionados:
2 I 0 L 0
0 2I L 0
V = E(it2)=2 , i,t e E(itjs)=0, ij ou ts
M M O M
0 0 L 2 I
o que se pode ficar a dever a uma grande variao nos nveis mdios de inflao entre os
diversos pases, em que alguns deles registaram episdios de hiperinflao mesmo. Esta
hiptese pode ser introduzida no modelo como fonte adicional de heterogeneidade, para
alm dos efeitos fixos. Nesta situao, torna-se necessria a estimao da matriz de
varincias e covarincias, pelo estimador de White com correco por grupo, para uma
estimao robusta, ainda que no eficiente, por OLS. Uma alternativa mais eficiente ser a
estimao do modelo atravs de um estimador GLS se V for conhecida ou FGLS, caso V
seja desconhecida.
Finalmente, uma outra hiptese de heterogeneidade ser a resultante de uma
estrutura de correlaes entre as sries individuais (mas no dentro de cada uma das
sries), a que se chama de correlao seccional (Greene [1997], pg. 658) e que, neste
Sevestre [1992].
33
caso, pode representar a existncia de relaes econmicas estreitas entre dois ou mais
pases da amostra que originam alguma simetria na resposta a certos choques aleatrios
sobre as respectivas dinmicas inflacionrias. Neste caso, a matriz de covarincias ser
11I 12 I L 1n I
I I L I
V = E ( ) = 21 2n
22
M M O M
n1I n 2 I L nn I
em que se admite a ausncia de autocorrelao entre os termos de perturbao28. O
pressuposto de ausncia de autocorrelao torna-se essencial para garantir a consistncia
dos estimadores de mnimos quadrados (ordinrios ou generalizados) pelo que a sua no
verificao levaria a uma estimao por IV ou GMM por os regressores deixarem de ser
ortogonais, face aos termos de perturbao. Em Davidson e Mackinnon [1993] e Greene
[1997] sugere-se o mtodo mais eficiente de Hatanaka que avana como instrumento para
a varivel dependente desfasada, os valores desfasados das restantes variveis exgenas
para a obteno de estimadores consistentes para e e a implementao de um
procedimento FGLS. Para os modelos puramente autorregressivos, tal torna-se
impraticvel na medida em que no existiro variveis verdadeiramente exgenas, o que,
segundo Hamilton [1994], faz com que um mtodo FGLS iterado no corresponda j a
MLE29.
Tal como no caso dos modelos com componentes de erro, os modelos de Kmenta
tm a vantagem de trabalharem com amostras relativamente grandes e com bastante
heterogeneidade e ao permitirem uma correlao serial, encontram uma fundamentao
macroeconmica pertinente. No entanto, Baltagi em Mtys e Sevestre [1992] alerta para o
facto de este tipo de especificao ser menos robusto face a eventuais erros de
especificao que a usual abordagem dos componentes de erro.
28
Por uma questo de constncia na terminologia, estabelece-se que um termo de perturbao se diz
autocorrelacionado quando E(uit.ui,t-s) 0, s0 e serialmente correlacionada quando E(uit.ujt) 0, ij.
29
Uma alternativa apontada por Hamilton [1994] seria a estimao por MLE o que exigiria um
conhecimento, que se poder no ter, sobre as distribuies dos termos de perturbao e sobre a especificao
do processo estocstico gerador da autocorrelao. Mesmo se se conhecer a estrutura ARMA dos termos de
perturbao, caso esta no seja suficientemente simples, a aplicao de um mtodo MLE ou FGLS tornar-se-
impraticvel do ponto de vista computacional.
34
4. Estimao de Modelos com Desfasamentos Distribudos30
30
Esta seco foi quase exclusivamente baseada em Hsiao[1986], Seco 8.1, sujeita a algumas
simplificaes e adaptaes.
35
sries temporais, em princpio ser mais fcil estimar pelo menos alguns dos parmetros,
uma vez que passamos a dispor de N vezes mais informao. Por outro lado, ao juntarmos
a dimenso seccional, permitindo diferenas nas caractersticas individuais, estamos muito
provavelmente a reduzir a importncia do mais que provvel problema de
multicolinearidade entre xt, xt-1 ... xt-p ..., sempre presente neste tipo de especificao.
Assim, Hsiao [1986] sugere que para a estimao do seguinte modelo
yt = + xt + ut , t = 1,..., T (4.1)
=0
onde bit = t + xi , ser a contribuio dos valores pr-amostrais no observados de x.
=0
com uit independente de xis e i.i.d., com valor esperado nulo e varincia ;
1. E(i) = ;
2. i = i , it = i xi ,t e i = ( i1 , . . . , iT ) E * ( i |x i ) = 0;
~ ~
=0
3. E (i |xi) = + axi.
* *
36
pressupostos 1-3 garantem a identificao de E({}) quando N e T. Se T fixo, o
modelo dever ser reescrito da seguinte forma:
t+ p
yit = + xi ,t + bit + u$it , t = 1,..., T ; i = 1,..., N
i
*
(4.3)
=0
Na generalidade dos casos, bit estar correlacionado com as variveis explicativas, pelo
que no ser possvel obter estimadores consistentes, a menos que se introduzam restries
adicionais sobre os coeficientes de desfasamento ou sobre o processo estocstico gerador
dos valores de x, vlido no apenas para os valores amostrais, mas tambm para os pr-
amostrais.
Podemos, ento, distinguir duas estratgias de identificao que podem ser resumidas da
seguinte forma:
Como pretendemos estimar pelo menos alguns dos parmetros , com = 1, ... e
de forma irrestrita (i.e., sem necessitarmos de racionalizarmos {} atravs de um qualquer
mtodo de Koyck ou de Almon), vamos considerar que um coeficiente de desfasamento
se encontra identificado se for possvel calcul-lo atravs da matriz de coeficientes (de
dimenso T x (T + p + 1)) obtida atravs do previsor de erro quadrtico mdio mnimo ou
projeco de yi em xi: E*( yi| xi) = I + xi, em que yi o vector das T observaes de y
para o i-simo indivduo. Esta matriz contm informao sobre a combinao dos
coeficientes de desfasamento relevantes B e sobre as projeces de i* e bit em xi, que ter
que ser separada para se proceder identificao dos referidos coeficientes.
Uma forma simples de o fazer ser reescrever a projeco de yi em xi e i* da
seguinte forma:
E ( y i |x i , i ) = [ B + W] x i + [ i + c] i (4.4)
E (b i |x i , i ) = Wx i + c i (4.5)
37
Ora, ser ento definida por = B + [W + (I + c)a]31, com a obtida atravs de
E ( i |x i ) = + a xi . Hsiao[1986] demonstra que para se identificar B bastam apenas
algumas restries sobre W, sugerindo, para i* independente de xi, que se admita um
processo autorregressivo de ordem q para x, na medida em que possvel obterem-se
estimadores consistentes para os (T + p - q + 1) primeiros parmetros de desfasamento,
com expresso genrica
t + p q q
E ( yit |x i ) = +
=0
xt + t , j p1 xi , j p1
j =1
(4.6)
31
Para mais pormenores, consultar Hsiao[1986], 185.
32
Hsiao[1986] fornece uma frmula mais geral (p.186), que contempla o caso de i* e xi serem
correlacionados, mas que por ser notacionalmente bastante complexa, foi aqui omitida.
38
Uma forma sugerida por Hsiao [1986] considerar-se que h k parmetros
iniciais irrestritos e que os restantes seguem um comportamento de natureza
autorregressiva, nomeadamente:
k
J
j j > k
j =1
1 1 K J J = 0
J
dada por = Aj j , em que Aj so constantes dadas pelas condies iniciais da
j =1
equao e {j} as suas razes caractersticas, e permite-nos escrever o termo residual bit da
seguinte forma:
J J
bit = ( A
= p +1 j =1
j
t +
j ) xi , = jt bij .
j =1
Ou seja, podemos representar o termo residual bit como uma combinao linear das
condies iniciais no observveis (bi1, ..., biJ), pelo que, se juntarmos este pressuposto aos
trs j estabelecidos, o modelo de desfasamentos distribudos reduz-se a um sistema de T
regresses com J+1 coeficientes no observados (i*; bi1, ..., biJ) e em que os ltimos
decaem geometricamente. No caso particular de J=1, temos o modelo de Koyck, em que bit
= bi,t-1 que, aps algumas transformaes (que aqui se omitem para no tornar a
exposio demasiado pesada, mas que podem ser consultados em Hsiao[1986], 190-1),
pode ser identificado a partir de = B* + *w* + ia', em que B* a matriz (T(T+k)) que
contm os k +1 parmetros (de 0 a k) irrestritos e os restantes T 1 parmetros obtidos
a partir de k, = 1, ..., T-1. A matriz * [1,,...,T-1] e w* o vector de coeficientes
obtido da projeco de bi em xi e exige-se que T 3 por forma a que identifique os
parmetros e 34.
33
Nomeadamente, impondo que as razes, reais e distintas, da equao caracterstica 1 J
j Lj = 0
j =1
caiam fora do crculo unitrio. Ver Hsiao[1986], 189.
34
De facto, o que se verifica que o jacobiano de (relativamente aos parmetros desconhecidos) respeita a
condio de caracterstica, desde que T 3. possvel verificar-se, ainda, que para J>1 a condio de
39
A estimao de um modelo de desfasamentos distribudos com base em amostras de
dados em painel de curta durao pode ser feita atravs da decomposio do modelo base
(4.2) no seguinte sistema de T equaes reduzidas:
y = i + [ T xi ] + v i , i = 1,K, N
i (4.7)
(T1)
em que = [
1, ... , T] e j a j-sima linha da matriz (o que torna uma matriz de
dimenso (T21)) e vi no est correlacionado com xi. Sob as usuais condies de
regularidade, o estimador LS de consistente e assimptoticamente normal, sendo
aplicveis os usuais testes assimptticos.
40
5. ESTIMAO GMM DE MODELOS DINMICOS COM DADOS EM PAINEL
41
condies de momentos sejam exactamente identificadas, i.e., que o nmero de parmetros
as estimar (dimenso do vector ) seja igual ao nmero de restries impostas sobre os
momentos.
Nos casos em que os parmetros do modelo esto sobre-identificados pelas
condies de momentos pode, ento, recorrer-se ao mtodo GMM para se obter
estimadores genericamente consistentes. Assim, as q condies de momentos
gi=E(f(Xi ))=0 representam q equaes com k>p incgnitas, de tal forma que as equaes
com os momentos amostrais
( )
f N N = 0
no tero uma soluo. O melhor que se poder fazer encontrar uma estimativa para N
que aproximar f(.) o mais possvel de zero, ou seja, um estimador (GMM) que respeite
( )
( )
N = arg min Q N ( ) = f N N VN f N N = 0
35
Para que os estimadores GMM sejam fracamente consistentes (i.e., que convirjam em probabilidade para
) necessrio que gi exista, seja finita e uma aplicao bijectiva; que os q momentos amostrais convirjam
uniformemente em probabilidade para os seus contrapartes populacionais e que VN convirja em probabilidade
para uma matriz no aleatria definida positiva. Ver Mtys [1999], por exemplo.
36
Para o que ser necessrio impor, para alm da consistncia: que f(XN, ) seja continuamente diferencivel
em ordem a , num espao compacto B; que o Jacobiano (em ordem a , logo, uma matriz q p) das
condies de momentos convirja em probabilidade (para uma qualquer sequncia N* que convirja em
probabilidade para o verdadeiro vector ) para uma sequncia de matrizes de igual dimenso e que no
42
condies anteriores que a sua incluso aumentar a eficincia do estimador GMM. Esta
condio particularmente importante para modelos dinmicos com dados em painel
(Mtys [1999]).
Sobre este tema, devem-se consultar, entre outros, Amemiya [1985], Davidson e
MacKinnon [1993], Greene [1997] e Mtys [1999].
Relativamente ao modelos (5.1), uma estimao por GMM comear por impor
uma condio de ortogonalidade entre um conjunto de (Tp) instrumentos Zi e os termos
de perturbao ui, dada por E(Ziui) = 0 e uma condio de identificao, dada por
car[E(Ziui)] = k. Existindo esses instrumentos, pode-se obter um estimador GMM de
)Z(VN)-1Z(Y-X
pela minimizao da funo objectivo N(Y-X ) e em que VN pode ser
qualquer estimador consistente de V= E(Ziui uiZi). O estimador GMM ser:
(
GMM = XZ(VN ) Z X
1
) 1
XZ(VN ) ZY
1
(5.2)
e em que, como sugere Mtys [1999], se pode obter VN a partir de um estimador inicial
consistente de , como um estimador 2SLS. Assim, sendo ei os resduos dessa estimao:
1 N
VN = Zi ei ei Z i
N i =1
Se se impuser que E(ui ui|Zi) = , com =2(IN JT) + v2INT = IN , como se
vem fazendo desde a seco 2.2, o estimador GMM ser equivalente ao estimador 3SLS
Z. Alis, segundo Mtys [1999], para que essa
dado por (5.2), mas com VN = Z
equivalncia entre 3SLS e GMM se verifique, basta que seja vlido o pressuposto de
inexistncia de heteroscedasticidade condicional (NCH No Conditional
Zi), o
Heteroskedasticity) relativamente aos instrumentos, i.e., que E(Ziui uiZi) = E(Zi
que menos restritivo que E(ui ui|Zi) = . Esta condio NCH permite igualmente a
utilizao do estimador GIV (referido na seco 3.2 a propsito do estimador de Arellano e
Bond [1991]) como um estimador GMM que e de forma anloga a (3.9), pode ser definido
como
( (
GIV = X 1Z Z 1Z )
1
Z 1X )
1
(
X 1Z Z 1Z )
1
Z 1Y
o que mais no que aplicar o mtodo das variveis instrumentais ao modelo (5.1) pr-
multiplicado por -, tendo como instrumentos -Zi (ou seja, depois de filtrar modelo e
instrumentos por -). Um mtodo regra geral equivalente, segundo Mtys [1999] o das
dependam de .
43
variveis instrumentais filtradas (FIV) em que o processo de filtragem por - se aplica
apenas a (5.1) e que consiste em:
(
FIV = X 1 2 Z(ZZ ) Z 1 2 X
1
)
1
X 1 2 Z (ZZ ) Z 1 2 Y
1
e que, mais uma vez, GMM, desde que vigore a condio NCH. Mas Mtys [1999]
mostra que, regra geral, a filtragem (que o equivalente aplicao de GLS no contexto
do OLS) no melhora a eficincia assimpttica do GMM e, assim, deve ser considerada
como irrelevante, no contexto da estimao, quer com efeitos fixos, quer com efeitos
aleatrios, desde que se explorem todas as condies de momentos. O mesmo acaba por
ser vlido para outro tipo de instrumentos com filtragem, como o estimador FF (Forward
Filtering) de Keane e Runkle [1992] e que aqui se omite para no alongar em demasia a
exposio.
De qualquer forma, pode ser demonstrado que, regra geral, os estimadores 3SLS,
FIV e FF no so superiores a um qualquer estimador GMM que faa uso de todas as
condies de momentos, que tem contra si apenas a questo de uma eventual
inexequibilidade. Um estimador GMM, que use todas as condies de momentos (lineares)
e uma matriz de ponderao irrestrita, com p instrumentos fracamente exgenos e uma
amostra de dimenso T, conta com p(1+2++T)=p(T+1)T/2 instrumentos (Mtys
[1999]).
Questo interessante, referida em Mtys [1999], a da determinao de uma
fronteira de eficincia para os estimadores GMM, i.e., se existir ou no um nmero
mximo de condies de momentos a partir do qual no ser possvel aumentar a eficincia
do estimador. A questo , por exemplo, analisada por Koenker e Machado [1997] que,
para modelos GMM lineares com heteroscedasticidade genrica, demonstram que basta
que o nmero de condies de momentos ou instrumentos cresa a um ritmo inferior a N1/3,
relacionando dessa forma a dimenso da amostra com o nmero de instrumentos.
De entre os estimadores GMM utilizados para regressores estritamente exgenos,
merecem destaque em termos de eficincia os apresentados em Hausman e Taylor [1981]
Breusch, Myzon e Schmidt [1989] e em Amemiya e Macurdy [1986] e que passaro a ser
notados por H-T, BMS e A-M, respectivamente. Considere-se, para esse efeito, o seguinte
modelo:
y it = x it + Z i + u it , u it = i + it (5.3)
em que Zi uma matriz de g variveis explicativas constantes no tempo.
44
Hausman e Taylor [1981] sugerem um estimador 2SLS eficiente para a estimao
dos vectores de parmetros e associados s matrizes de variveis explicativas Xit e Zi,
em que as duas matrizes podem incluir variveis ortogonais (X1it e Z1i) e outras
correlacionadas com os efeitos especficos i (X2it e Z2i). Em (5-3), as matrizes Xit, Zi, X1it,
X2it, Z1i e Z2i tm dimenso (k1), (g1), (k11), (k21), (g11) e (g21), respectivamente.
Neste contexto, de eventual correlao entre uma ou vrias variveis explicativas e
os efeitos especficos, sabe-se que os estimadores OLS, assim como os GLS, no so
consistentes e que os estimadores within sero consistentes, mesmo que ineficientes e no
permitiro a estimao dos parmetros contidos em .
Uma soluo proposta por H-T ser a estimao por OLS do modelo (5-3) pr-
multiplicado por -1/2, ou seja, aplicando um operador das primeiras diferenas
generalizadas (1-(1-)L), com dado por (2.9)37 e transformando as variveis X e Z
atravs da respectiva projeco ortogonal num espao A de variveis instrumentais X1it, Z1i
e respectivos vectores de mdias. Na prtica, tal significa, num primeiro passo, regredir Z2i
em X1it e Z1i (com N observaes) e X2i. (ou seja, as mdias amostrais para cada indivduo)
. Num segundo
em X1i. e Z1i. (mais uma vez, as mdias amostrais), obtendo-se Z 2i e X 2 i.
2 it = X 2 it X 2 i. + X
passo, substitui-se em (5.3), X2it e Z2i por, respectivamente, Z 2i e X 2i . e
37
Ou seja, = ( )
v2 v2 + T 2 .
38
Haver uma condio de necessria e suficiente de caracterstica, que consta de Hausman e Taylor [1981],
1385.
45
apenas as mdias de X1 e X2, mas tambm todos os valores desfasados do primeiro vector
de variveis, recursivamente.
Assumindo um pressuposto de exogeneidade ainda mais restritivo, Breusch, Myzon
e Schmidt [1989] deduzem um estimador IV com maior eficincia assimpttica. Para tal,
impem que os efeitos seccionais, para alm de respeitarem as condies impostas por H-T
e A-M, no exibiro correlao com os desvios em relao s mdias seccionais das
variveis X2, i.e., ainda que i e X2 possam estar correlacionadas, a sua covarincia
constante (ou seja, impem uma condio de estacionaridade). Assim, BMZ acrescentam
os desvios em relao s respectivas mdias de X2 ao lote de instrumentos propostos por
A-M, tambm de forma recursiva (ou seja, em T, teremos mais T-1 instrumentos, i.e., os
desvios at T-1). De acordo com Mtys [1999], qualquer um destes estimadores, H-T, A-
M e BMZ, faz parte da classe dos estimadores FIV (variveis instrumentais filtrados) e
ser equivalente ao estimador within, no caso exactamente identificado pela definio de
H-T (k1 = g2), ou mais eficiente no caso sobre-identificado (k1 > g2).
Mtys [1999] refere alguns estimadores que podero ser mais eficientes que os
estimadores H-T, A-M e BMZ, ao reconhecerem mais condies de momentos que as
utilizadas por estes autores, citando para o efeito os estimadores de Ahn e Schmidt (AS) e
Arellano e Bover (AB)39 e que na prtica significaro a estimao do modelo (5.3) usando
como instrumentos, para alm dos propostos H-T, A-M ou BMZ, as primeiras diferenas
disponveis at ao momento das variveis explicativas no correlacionadas com os efeitos
individuais, garantindo mais (T-1)(Tk1+g1)-k1 instrumentos. Apesar disso, Mtys [1999]
sustenta que, do ponto de vista prtico, os estimadores anteriores constituem boas
alternativas ao GMM.
39
Ver Ahn e Schmidt [1995], Efficient Estimation of Dynamic Panel Data, Journal of Econometrics, 68, 5-
27 e Arellano e Bover [1995], Another Look at Instrumental Variables Estimation of Error-Components
Models, Journal of Econometrics, 68, 29-51, citados em Mtys [1999] e tambm em Baltagi [1995], sob a
46
yit = yi,t-1 + uit, com uit = i + vit (5.4)
em que os termos de perturbao e v tm ambos mdias nulas e em que se considera que
1. E(yi0)=0;
2. E(yi0 vit)=0, t;
3. E(i vit)=0, t;
4. os termos de perturbao vit no esto autocorrelacionados, para todo o i.
Destas condies, relativamente comuns na literatura dos modelos dinmicos em
painel, como nota Mtys [1999], pode-se retirar as T(T-1)/2 condies de momentos
E(yisuit)=0, para t=2,...,T e s=0,1,...,T-2 (5.5)
em que uit = vit vi,t-1 e que foram usadas em diversos textos relativos estimao por IV,
como Anderson e Hsiao [1981], Holtz-Eakin, Newey e Rosen [1988] e Arellano e Bond
[1991]. Ahn e Schmidt [1997], retomando o trabalho desenvolvido no seu artigo de 1995,
verificam que as hipteses 2-4 impem mais T-2 condies de momentos que as usadas
pelos outros autores e que a hiptese 1., relativa a yi0, desnecessariamente restritiva. As
condies de momentos adicionais so:
E(uiTuit) = 0, t=2,,T-1 (5.6)
As condies (5.5) e (5.6) vm directamente dos pressupostos de os vit no serem
correlacionados entre si, nem com os efeitos especficos, nem to pouco com yi0, no
necessitando da hiptese de homoscedasticidade. Para alm disso, os autores demonstram
que estas seriam a totalidade das condies de momentos relevantes mesmo para os casos
em que essas correlaes no so nulas, desde que sejam constantes (no que um
pressuposto de estacionaridade). As condies podem e devem ainda ser vistas sob a forma
de restries lineares sobre os elementos da matriz de covarincias de uit, t=0,1,,T:
u i1 11 12 L 1T 10
u 22 L 2T 20
i 2 21
= M = M M O M M
u iT T 1 T 2 L T 0 T 0
u i 0 10 20 L T 0 00
de tal forma que todos os elementos das ltimas linha e coluna (i0) so iguais entre si (T-1
restries) e que todos os restantes elementos fora da diagonal principal so tambm todos
47
iguais entre si (T(T-1)/2-1 condies)40. No entanto, como as condies emergentes de
(5.6) so no lineares em u, a utilizao deste mtodo GMM ter que levar a uma
ponderao entre os ganhos de eficincia permitidos e o acrscimo exigido na
complexidade computacional pela sua implementao.
No caso dos termos v serem homoscedsticos, como consta de Ahn e Schmidt
[1997], h que considerar um novo grupo de (T-1) novas condies de momentos dadas
genericamente por:
E (u i u it ) = 0, t = 2,..., T (5.7)
Para alm disso, como notam Ahn e Schmidt [1997], as condies (5.6) podem ser
substitudas por um idntico nmero de condies lineares dadas por
E(yi,t-2ui,t-1 yi,t-1uit ) = 0, t = 3,,T (5.8)
Como refere Mtys [1999], os ganhos de eficincia permitidos pelo pressuposto de
homoscedasticidade acabam por ser reduzidos, pelo que a condio pode ser dispensada,
tendo como contrapartida uma especificao mais robusta.
Vrias outros pressupostos podem ser acrescentados ou combinados, como
efectuado em Ahn e Schmidt [1997], dando origem a diferentes conjuntos de condies de
momentos. Uma condio que vale a pena analisar a de estacionaridade, como proposta
em Breusch, Mizon e Schmidt [1989], j aqui discutida e cujas consequncias em termos
de uma estrutura GMM so analisadas em Ahn e Schmidt [1997]. Na linha do que foi feito
por Arellano e Bover, Ahn e Schmidt41 impem que cov(i,yit ) seja constante, o que leva a
uma nova restrio:
0 = (1 ) ou de forma equivalente, 0t = ts (1 ) , para t,s=1,T; t s
40
Isto , iguais a, respectivamente, 0 e 2.
41
Artigos citados em Baltagi [1995] e Mtys [1999].
48
E[yit2 + yi1ui2/(1-2) ui,2ui1/(1-2)] = 0
A partir do modelo (5.4), pode-se definir um estimador GMM eficiente da seguinte
forma:
- usam-se as condies de momentos (5.5), escrevendo-as na forma matricial
como E(Aiui()) = 0, com
y i0 0 0 L 0
y
i0 ( y i 0 , y i1 ) 0 L 0
0 ( yi 0 , y i1 ) ( y i 0 , yi1 , y i 2 ) L 0
Ai =
M M M O M
0 0 0 L ( y i 0 , y i1 ,..., y iT 2 )
0 0 0 L ( yi 0 , yi1 ,..., y iT 2 )
- as condies (5.8) podem ser escritas tambm da mesma forma, i.e., como
E(Biui()) = 0, em que
y i1 0 0 L 0
( y + y )
i1 i2 yi2 0 L 0
yi2 ( y i 2 + y i3 ) yi 3 L 0
Bi =
M M M O M
0 0 0 L ( yi ,T 2 + yi ,T 1 )
0 0 0 L y i ,T 1
- as l condies de momentos (5.6), (5.7) (quadrticas em ) e (5.8) podem ser
divididas em l1 condies lineares42 e l2 condies no lineares em ;
- as l1 condies lineares podem ser representadas recorrendo a Si, uma matriz
Tl1 com todas as colunas de Ai e Bi, que rene todos os instrumentos lineares
disponveis, da seguinte forma
E(fi()) = 0, com fi() = Siui() = f1i + f2i, em que f1i =Siyi e f2i= - Siyi,-1
- as restantes l2 condies no lineares podero ser representadas como uma
funo quadrtica, tal que E(gi())=0, com
gi() = g1i + g2i, + (Il2 )g3i
- um estimador eficiente pode ser obtido atravs de um mtodo GMM baseado
em todas as condies de momentos definidas por
42
O nmero de condies lineares, l1, ter que ser pelo menos igual ao nmero de parmetros a estimar (neste
caso, 1) para que estes sejam identificados.
49
f ( )
E[mi ( )] = E i = 0
g i ( )
- defina-se mN = N-1imi()43 e MN = mN / = [fN /, gN /] = [FN, GN] =
[f2N , g2i + 2(Il2 )g3i] e, ainda, M=plim MN = [plimFN , plimGN] e,
finalmente, como matriz de ponderao ptima
ff fg
= = lim cov N mi
gf gg N i
43
Com fN, gN, f1N, f2N, g1N, g2N e g3N definidos de igual forma.
44
2(l-k) no caso de haver k regressores, exgenos ou pr-determinados.
50
para aferir a validade das referidas condies pela comparao entre os estimadores GMM
completos e estimadores GMM linearizados, de mais simples implementao.
Note-se, ainda, que o primeiro dos pressupostos, relativo a E(yi0), faz com que as
condies de momentos de primeira ordem (E(uit=0), com uit=i+vit) cessem de ser
informativas, na medida em que deixam de identificar univocamente , pelo que sempre
seria possvel obter estimadores GMM mais eficientes se se no restringisse yi0.
Nesse sentido, temos Crpon, Kramarz e Trognon [1997] que, admitindo condies
iniciais irrestritas para y, mostram como a eliminao de parmetros redundantes (nuisance
parameters)45 pode no ter qualquer efeito em termos de perda de eficincia. Para tal, basta
que se substituam os parmetros redundantes pelas respectivas contrapartes empricas, nas
condies de ortogonalidade.
Admita-se que o vector de parmetros a estimar, num modelo autorregressivo com
regressores exgenos, dado por , pode ser dividido num vector de parmetros relevantes,
e num vector de parmetros redundantes, . Crpon et al. [1997] mostram que os clculos
exigidos pela estimao GMM, baseada na totalidade das condies de ortogonalidade,
podem ser grandemente simplificados. Ao contrrio do GMM completo (em que os
parmetros redundantes, , tm que ser expressos em funo dos parmetros relevantes, ),
no GMM abreviado, as condies de momentos s necessitam de ser expressas com
relao aos parmetros , na medida em que os parmetros so substitudos por
estimativas obtidas por um estimador etpico consistente. O procedimento acaba por ser
anlogo ao usado na estimao por MLE, quando se opta pela concentrao da funo de
verosimilhana, ainda que a equivalncia assimpttica entre o procedimento GMM
completo e este abreviado s seja verdadeira caso se verifiquem certas condies e que
constam de Crepon et al. [1997] (proposio 2).
5.3 Concluses
45
O conjunto de parmetros a estimar pode ser dividido em duas categorias: uma de parmetros com
interesse econmico, como o coeficiente associado ao termo AR(1) do modelo (5.4); outra de parmetros
51
estimar modelos dinmicos com amostras em painel com uma dimenso temporal pequena.
Isto porque, com um grande nmero de observaes ao longo do tempo para um nmero
comparativamente pequeno de indivduos (ou unidades seccionais), os estimadores within
so consistentes, mesmo que no completamente eficientes. Depois, como mostrado em
Arellano e Bond [1991], entre outros, a quantidade de condies de momentos disponveis
aumenta quadraticamente em T, o que torna o peso computacional do GMM, para um T
elevado, demasiado oneroso.
Para a estimao de modelos lineares, o estimador GMM frequentemente assume a
forma de um estimador IV, o que particularmente verdadeiro se for vlido o pressuposto
de inexistncia de heteroscedasticidade condicional (NCH). A diferena entre o GMM e a
forma convencional de aplicao das variveis instrumentais tem que ver com a completa
identificao das condies de momentos impostas pelos pressupostos do modelo
subjacente que o GMM implica, em que algumas dessas condies de momentos podero
ser redundantes, logo, no contribuindo para a eficincia do estimador.
No caso concreto dos modelos dinmicos, a condio NCH necessariamente
insustentvel, caso se opte pela considerao da totalidade das condies de momentos
suscitadas pelos pressupostos de exogeneidade. Assim, na estimao de modelos
dinmicos com dados em painel, o estimador GMM eficiente no corresponder a um
estimador IV, tanto mais que muitas das condies em que se baseia so no lineares,
dando lugar a procedimentos de estimao iterativos.
A literatura GMM relativa estimao de modelos com dados em painel est a
atravessar um perodo de rpida expanso, pelo que esta reviso estar necessariamente
incompleta. Para alm disso, todos os tpicos relacionados com a estimao de modelos
no-lineares (dinmicos) com GMM foi propositadamente deixada de fora, sob pena de se
alongar indefinidamente a discusso. Uma boa reviso sobre o tema pode ser encontrada
em Mtys [1999], (captulo 9).
52
6. RAZES UNITRIAS E DADOS EM PAINEL
46
Em boa verdade, os painis usados em estudos macroeconomtricos so aquilo a que a literatura chama de
pseudo painis (Im, Pesaran e Shin [1997]) ou cohorts (bandos) na medida em que resultam da
agregao de N sries temporais individuais e no da recolha simultnea de T observaes para N indivduos.
47
Heimonen [1999] um exemplo, com uma aplicao hiptese das paridades de poder de compra.
53
Diversos artigos exploram a utilizao de painis para testar a integrao de
variveis econmicas, como alternativa simples extenso de amostras temporais
(Maddala e Kim [1998]), de que se destacam os artigos de Levin e Lin [1992] e [1993] e o
de Im, Pesaran e Shin [1997].
Levin e Lin [1993] usam como hiptese nula a existncia de resduos integrados
para cada indivduo, contra a hiptese alternativa de todos os indivduos terem resduos
estacionrios. Assim, a hiptese nula impe uma restrio transversal entre as diversas
equaes individuais48 (cross-equation), sobre os coeficientes de autocorrelao parcial de
primeira ordem. Levin e Lin [1993] desenvolvem um teste de raiz unitria que pode
incorporar efeitos individuais e temporais especficos no termo independente e nos
restantes coeficientes e com uma estrutura de varincias e covarincias dos termos de
perturbao sem restries seccionais: a nica restrio ser a existncia ou no de uma
raiz unitria. A revelao deste trabalho acaba por ser a normalidade assimpttica das
estatsticas dos testes de raiz unitria e a sua super-consistncia na dimenso temporal, i.e.,
que a convergncia das estatsticas mais rpida para T do que para N. Mais, no
mesmo artigo, os autores recomendam os testes de estacionariedade especficos a dados em
painel para amostras de mdia dimenso, i.e., com 10<N<250 e 25<T<250, enquanto que
para amostras de grande dimenso temporal se recomendam os testes Augmented Dickey-
Fuller (ADF) tradicionais separadamente para cada srie individual. Para painis com
grande dimenso seccional, quando comparada com a temporal, os autores recomendam os
testes tradicionais da literatura de painis, como o de Holtz-Eakin, Newey e Rosen [1988],
que se ver adiante. Assim, de acordo com Levin e Lin [1993], desde que se utilizem
estimadores apropriados para a mdia e varincia, os valores crticos da distribuio
normal reduzida podero servir como boas aproximaes para os testes de raiz unitria
convencionais, com melhores resultados que os obtidos para cada srie temporal
isoladamente.
Maddala e Kim [1998] criticam, no entanto, os testes de Levin e Lin [1992] por
admitirem que o coeficiente associado ao termo autorregressivo no apresenta
heterogeneidade individual, ou seja, por terem como hiptese nula a no estacionariedade
simultnea de todos os processos geradores de dados individuais e, por isso, consideram
prefervel o procedimento proposto por Im, Pesaran e Shin [1997]. O teste proposto em
48
Intui-se que Levin e Lin [1993] adoptam a verso de Chamberlain [1984] da estimao com dados em
54
Levin e Lin [1993], no entanto, j admite que ocorra heterogeneidade no coeficiente
associado varivel dependente desfasada, sendo o caso com maior interesse o que recorre
ao seguinte modelo:
y it = 0 i + 1i t + i y i ,t 1 + u it
u it = it u it + it
j =0
em que se admite que o termo de perturbao u segue um processo ARMA invertvel e que
os processo geradores de dados individuais so mutuamente independentes ou apenas
dependentes atravs de um efeito temporal especfico agregado (t). O modelo admite,
ento, heterogeneidade individual ao nvel do termo independente e do trend temporal. O
teste consiste nos seguintes passos:
(i) remover os efeitos temporais agregados atravs da transformao do modelo para a
forma de diferenas em relao mdia seccional (y*it=yit y.t);
pi
(ii) estimar N regresses separadamente do tipo y it = 10i + 11i t + 1il y i ,t 1 + u1it e
l =1
pi
y it = 20i + 21i t + 2il y i ,t 1 + u 2it , obter os respectivos resduos, eit e vit e, de
l =1
(iii) estimar o rcio dos desvios padro de curto prazo relativamente aos de longo prazo
para cada indivduo e calcular o rcio mdio para o painel dados por
yi 1 N
1 T k
L 1 T
s i =
ei
e S =
N
s
i =1
i , em que y2i =
T 1 t =2
y it2 + 2
l =1 k + 1 T 1 t =2+l
yit yi ,t l 49
(eit i vi ,t 1 )2 ;
T
1
e e2i =
T pi 1 t = pi + 2
onde,
55
N T
~e ~v it i ,t 1
~ (eit vi ,t 1 ) , RSE( ) =
N T
1 N T ~
v~
i =1 t = 2 + pi ~
= , e2i =
2 2
N T i ,t 1 ,
v 2 NT i =1 t = pi + 2 i =1 t = pi + 2
i ,t 1
i =1 t = 2 + pi
e v 1 N
p
~
ei ,t = it , v~i ,t = it , T = T
~ 1
ei ei
i
N i =1
50
Maddala e Kim [1998] provavelmente referiam-se primeira verso do teste em Levin e Lin [1992].
56
e tem como hipteses nula e alternativa, respectivamente:
H0:i=0 , i
H1:i<0 , i=1,N1
i=0 , i=N1+1, ,N
ou seja, em que se admite como alternativa que nem todas os processos geradores de dados
individuais sejam estacionrios.
A estatstica do teste construda com base nas estatsticas LM para os testes
individuais de i=0 e que so:
Ty i Pi y i
LM iT =
y i M T y i
M T = I T i T (i T i T ) i T
1
em que se tem como matrizes idempotentes e
N
1
A mdia das estatsticas, dada por LM =
N
LM
i =1
iT servir de base estatstica
normalizada
LM =
(
N LM NT E (T ) ) ~ N (0,1)
a
(6.2)51
Var (T )
em que (T) e Var(T) so parmetros fornecidos em Im, Pesaran e Shin [1997] e obtidos
mediante simulaes de Monte Carlo.
Para painis com dinmicas heterogneas e erros autocorrelacionados, de longe o
caso mais interessante, o teste IPS apenas ligeiramente mais elaborado, partindo um
modelo AR(pi+1), o que leva a que as N equaes ADF52 possam ser escritas da seguinte
forma:
pi
y it = i + i y i ,t 1 + ij y i ,t j + it ; i = 1,K , N ; t = 1,K , T
j =1
51
A convergncia em distribuio suficiente para N, com T3.
52
O teste ADF dever ser usado quando os termos de perturbao da regresso DF exibem autocorrelao.
57
Sob a hiptese da independncia dos termos de perturbao idiossincrticos, it, que
tero que ser estacionrios na varincia (ainda que possam ser seccionalmente
heteroscedsticos) e conhecidos os pontos de partida yi0 (estocsticos ou determinsticos),
tem-se que a estatstica definida em (6.2) converge fracamente53 para uma distribuio
normal reduzida (Teorema 4-1 em Im, Pesaran e Shin [1997]). Para calcular (6.2) deve
agora usar-se:
Ty i Pi y i
LM iT =
y i M Qi y i
2
T ~
yi MT ~ y i ,1
LM iT =
~
y M ~ y ~
y M ~ y
i T i i ,1 T i ,1
onde as variveis esto expressas na forma de desvios face s T mdias seccionais e MT
mantm a mesma composio.
Segundo Im, Pesaran e Shin [1997], o teste revela-se relativamente robusto face a
potenciais ms especificaes das componentes temporais, comparando com os testes
correntes em estudos de sries temporais e a estruturas alternativas para as correlaes
entre os termos de perturbao, no sendo apenas vlidos para modelos de efeitos
temporais com heterogeneidade seccional (tipo it).
Um outro teste que sugerido por Maddala e Kim [1998] o teste de Fisher55 e que
consiste numa combinao da evidncia fornecida por diversos testes independentes. O
53
Convergncia fraca sinnimo de convergncia em probabilidade (Amemiya [1985]).
N
1
54
Ter-se-ia que trabalhar com ~
yit = yit
N
y
j =1
jt , etc.
55
O teste deve-se a Fisher, R.A. [1932]. Statiscal Methods for Research Workers, 2nd Edition, Wiley: New
58
teste consiste na realizao de N testes de raiz unitria para cada um dos indivduos no
painel e obter o respectivo p-value, sendo a estatstica P= -2ln(pi) com distribuio
exacta 2(2N) usada para efeitos de teste da hiptese nula de razes unitrias. Este teste,
tambm conhecido por teste P de Pearson e que detalhado em Maddala [1977] (pg. 47-
8)56 tem a vantagem de ser relativamente simples na sua implementao, ainda que exija a
determinao dos p-values por simulaes de Monte Carlo.
Finalmente, para painis curtos de usar o teste de Holtz-Eakin, Newey e Rosen
[1988], H-ENR, que consiste na estimao de um modelo autorregressivo (com ou sem
variveis exgenas) atravs de um mtodo GMM. Holzt-Eakin et al. [1988] sugerem que
se estime, por 2SLS, um modelo autorregressivo como (5-4) nas primeiras diferenas,
usando como instrumentos para yi,t-1, o vector Zt = [1,yi,t-2,yi,t-3,,yi,1]. Se os efeitos
especficos variarem no tempo, i.e., se forem do tipo ti, haver que proceder a uma
quasi-diferenciao do modelo, usando em vez das primeiras diferenas: yi,t (t/t-1)yi,t-1.
Holtz-Eakin et al. [1988] defendem que se use uma verso 3SLS, onde se efectua uma
correco GLS. O teste H-ENR pode ser usado para testar a estacionaridade dos
parmetros, a existncia de razes unitrias ou explosivas na equao autorregressiva, a
dimenso do truncation lag ou o sentido da causalidade Granger, num contexto VAR.
Qualquer um destes testes pode ser visto como um teste a restries lineares sobre os
parmetros do modelo, reunidos num vector (k1). A hiptese nula do teste
H0: = H + G
em que H e G so matrizes de restries lineares e o vector de parmetros (g1) com
restries (de dimenso necessariamente inferior de ). O teste necessita que se estime o
modelo sem restries e com as restries dadas por H0, retendo-se as somas dos
quadrados dos resduos para ambos os caso, ou seja, Q e Qr. Sob H0 e com N:
L = Qr Q ~ 2(J) e J = (k-g) (z-k)
em que z o nmero de instrumentos usados para estimar (Holtz-Eakin et al. [1988],
1381).
Um problema comum a qualquer teste de estacionariedade o da seleco da
dimenso do desfasamento, i.e., da escolha do truncation lag, questo j amplamente
York, citado em Maddala e Kim [1998]. Este mesmo teste poder ser usado em contextos totalmente
diferentes, como se prope, na seco 8.3, para testar uma estrutura particular de heteroscedasticidade.
56
C.f. Maddala [1977], 48,n.
59
explorada no mbito das sries temporais e que, para j, suscita as seguintes linhas de
orientao:
- o nmero de termos desfasados no teste ADF, por exemplo, deve ser o
suficiente para garantir a ausncia de autocorrelao nos resduos da regresso
de suporte do referido teste;
- a existncia de termos MA negativos e de dimenso assinalvel tende a exigir
um aumento do nmero de termos autorregressivos;
- ao invs de se adoptar uma regra determinstica comum para a seleco do
nmero de desfasamentos, deve-se fazer recair a escolha em critrios assentes
nos prprios dados (Maddala e Kim [1998]).
De qualquer forma, segundo Heimonen [1999], a escolha da dimenso do
desfasamento a utilizar em teste de razes unitrias com dados em painel ser de menor
importncia, na medida em que a inferncia parece largamente independente do nmero de
termos autorregressivos. Este autor e Maddala e Kim [1998], por exemplo, sugerem o
seguinte critrio, dito de Schwert, para dados trimestrais e mensais, respectivamente57:
T 1 4
l 4 = int 4
100
T 1 12
l12 = int 12
100
No entanto, Im, Pesaran e Shin [1997] previnem contra os efeitos prejudiciais de
uma subestimao da dimenso do desfasamento a usar no seu teste IPS, pelo que
aconselham a utilizao de um nmero considervel de termos autorregressivos, para o que
conviria uma regra do tipo general-to-specific de Hendry.
Como resumo, pode-se prescrever a seguinte linha de aco:
- para painis curtos, deve-se usar o teste de Holtz-Eakin, Newey e Rosen [1988];
- para painis de dimenso intermdia, pode-se escolher entre o teste de Levin e
Lin [1993] e o teste de Im, Pesaran e Shin [1997], dando preferncia ao
primeiro, quando a dimenso temporal domina e ao segundo, no caso inverso;
- para painis longos (T>250), no de excluir a utilizao dos testes ADF, DF
ou Phillips-Perron, num enquadramento tpico de time series.
57
O critrio deve-se a Schwert, G.W. [1989], Tests for unit roots: a Monte Carlo investigation, Journal of
Business and Economic Statistics, 7, 147-59.
60
7. DADOS DISCRETOS
Para no complicar a exposio, opta-se por abordar apenas os modelos com efeitos
individuais, quer fixos, quer aleatrios, que ser capturada pelo termo de perturbao uit =
i + vit. No caso dos efeitos fixos, temos Var(uit|i) = Var(vit) = v2 e, no caso de efeitos
aleatrios, temos E(i) = E(vit) = 0 e i e vit independentes. Admite-se, ainda, que uit ter
uma distribuio F, que pode ser a logstica () ou a normal reduzida ().
Assim, a existncia destes componentes no observveis permite que indivduos
homogneos, i.e., com as mesmas caractersticas observveis (expressas pela sua funo de
reaco), sejam heterogneos nas suas respostas.
61
dados em painel, em que T usualmente pequeno e, no caso de T fixo, o estimador MLE
de i no consistente, mesmo que N: o recorrente problema do parmetro acidental
(por oposio aos parmetros estruturais que no variam de indivduo), cuja estimao
no ter significado se for apenas avaliada pelas suas propriedades assimptticas.
Resta, pois, estimar : o problema que se coloca neste enquadramento que a
estimao deste no independente da estimao de i, ou seja, a inconsistncia de i,MLE
transmitida para
MLE , mesmo que N, mas T fixo.58
Cumpre ento encontrar condies para a existncia de um estimador consistente de
. Um princpio geral ser o de Neyman-Scott, segundo o qual preciso encontrar funes
(y1,,yN |
) independentes de e que convirjam em probabilidade para zero (com
f(y i | , i )
f(y i | , i ) = , com g( i | , i ) > 0 (7.2)
g( i | , i )
N
(y 1 , K , y N | , 1 , K , N ) = f(y i | , i ) (7.3)
i =1
58
Veja-se uma prova em Hsiao[1986],160.
59
Podendo ser convertidos pela relao de Amemiya:
1.6
L P
62
J no que toca aos modelos de regresso mltipla, os resultados podem variar
muito, consoante sejam obtidos por logit ou probit, da que no seja despicienda a questo
da escolha da especificao. Ainda que a evidncia no seja muito slida, os estudos de
Monte Carlo realizados para o modelo probit apontam para um enviesamento
relativamente pequeno (sempre inferior a 10%) e que ser tanto menor, quanto menor a
escala de variao dos efeitos fixos (Hsiao [1986]).
[ ]
N 1 yit
ln L = ln F( x it + ) yit 1 F( x it + ) d H( | ) (7.4)
i =1
[ ]
N 1 y it
ln L = ln F( x it + x i + ) yit 1 F( x it + x i + ) d H ( ) (7.5)
i =1
63
7.2 Modelos Dinmicos de Escolha Binria
64
(2) implica que a probabilidade marginal limite de yit = 1 e a funo de
probabilidade conjunta de yi, condicionadas por i, sejam, respectivamente
( 0 + i )
Pi = e
1 ( 0 + + i ) + ( 0 + i )
(7.8)
| yi ,t 1 , i ) = { ( 0 + y i ,t 1 + i )(2 yit 1)}Pi (1 Pi )
T T
F( y
t =1
it
t =1
yi 0 1 yi 0
i =1 t =1
(7.9)
L = { ( 0 + yi ,t 1 + )(2 yit 1)}Pi (1 Pi )
N T
1 yi 0
yi 0
d G( )
i =1 t =1
L = { ( 0 + yi ,t 1 + i )(2 y it 1)}f( yi 0 | i ) e
N T
i =1 t =1
(7.10)
L = { ( 0 + y i ,t 1 + )(2 y it 1)}f( y i 0 | )d G( )
N T
i =1 t =1
60
Hsiao [1986], pg. 170
65
1. aproximar a probabilidade de yi0 atravs de um modelo probit y*i0 = Q(xit) + it,
com yi0 = 1 se y*i0 >0, yi0 = 0 se y*i0 0 e it ~N(0,1);
desempregado no futuro do que um indivduo idntico em tudo o resto, mas que no tenha
estado desempregado. A segunda diz-nos que tal relao apenas aparente porque a
proxy para uma heterogeneidade que radica em
66
dependncia intertemporal real vs. espria, o que ser apesar de tudo complicado, quando
existe heterogeneidade (efeitos individuais). De facto, se o modelo contiver efeitos
individuais aleatrios, mesmo que no haja dependncia intertemporal, teremos P(yit | xit,
yi,t-1) P(yit | xit). S no caso de no existir heterogeneidade que a inexistncia de
dependncia ser equivalente a P(yit | it, i,t-1) = P( it | it).
67
8. Miscelnea de Temas
68
Nerlove [1971], constatando por um lado a importncia de tirar partido das
vantagens dos dados em painel no estudo das dinmicas comportamentais e, por outro, o
problema colocado estimao pela pouca profundidade seccional da maior parte das
amostras temporais, estuda o enviesamento dos mtodos OLS, LSDV, GLS, FGLS, IV e
MLE (que evidencia uma tendncia para fornecer solues de canto, levando a um
estimador inconsistente da matriz de covarincias dos termos de perturbao). Apesar de
tudo e com base em estudos de Monte Carlo, o autor d preferncia ao mtodo FGLS (com
estimado por OLS) pelo seu pequeno enviesamento e menor erro quadrtico mdio e
chama a ateno para os problemas do MLE.
Nickell [1981] deriva a expresso analtica do enviesamento assimpttico do
estimador LSDV no modelo dinmico de efeitos fixos, quando T fixo e conclui que este
pode ser muito significativo, ainda que a introduo de variveis exgenas o diminua, sem
nunca o eliminar. No entanto, o enviesamento diminui e tende para zero, quando T
aumenta, mas ser tanto maior quanto mais prximo da unidade estiver o parmetro
associado varivel dependente desfasada.
Bhargava e Sargan [1983] advogam a utilizao de mtodos de estimao de
equaes simultneas nos modelos dinmicos com efeitos aleatrios, especialmente os
mtodos de mxima verosimilhana com informao limitada (LIML), comparando as
diversas hipteses para a primeira observao (exgena ou endgena).
Anderson e Hsiao [1982] exploram a importncia das hipteses relativas s
primeiras observaes, no apenas para as propriedades assimptticas dos estimadores,
mas tambm para a prpria interpretao das estimativas. Outra questo abordada da
dependncia intertemporal vs. autocorrelao e avanam com um mtodo de estimao
MLE de modelos dinmicos com autocorrelao. Como os mtodos MLE so
relativamente difceis de implementar, os autores sugerem um mtodo GLS (ou FGLS),
que lhe assimptoticamente equivalente.
Em termos de literatura mais recente, citam-se desde logo quatro artigos (working
papers) que, admite-se, possam indiciar futuros desenvolvimentos.
Assim, Judson e Owen [1996] exploram os problemas especficos estimao de
modelos macroeconmicos com dados em painel, tipicamente com N pequeno e T grande e
69
numa especificao com efeitos fixos, concluindo que o melhor mtodo de estimao varia
muito consoante a dimenso do painel. De acordo com as simulaes realizadas, as autoras
avanam que o enviesamento do LSDV no de forma alguma irrelevante quando N
fixo: o aumento da dimenso temporal parece reduzir pouco o enviesamento.
O estudo justifica ainda a escolha de uma especificao com efeitos fixos por duas
ordens de razes: (1) porque se os efeitos individuais representam variveis omitidas,
muito provvel que estas se encontrem correlacionadas com os restantes regressores; (2)
como os painis na macroeconomia, apesar da pequena dimenso seccional, incluem muito
provavelmente a maior parte dos indivduos da populao, a hiptese de serem uma
amostra aleatria de uma populao de pases muito maior no tem cabimento. O objectivo
acaba por ser a comparao de diversos estimadores disponveis para esta especificao
LSDV, Anderson-Hsiao, Arellano-Bond e OLS concluindo-se que:
o estimador OLS apresenta-se fortemente enviesado, particularmente para o parmetro
associado varivel dependente desfasada (ainda que, ao contrrio dos restantes
estimadores, apresente um enviesamento significativo para ), mesmo quando T
aumenta;
o LSDV comporta-se exactamente da maneira prevista por Nickell [1981], ainda que
no aumente de eficincia medida que T aumenta. Assim, as autoras defendem a
utilizao de estimadores com melhor relao enviesamento-eficincia;
sugerido um mtodo LSDV corrigido pelo enviesamento (atravs de uma frmula
anloga apresentada por Nickell [1981]) e que se apresenta como o mais eficiente;
O estimador Anderson-Hsiao considerado o melhor, do ponto de vista do
enviesamento mdio, ainda que seja pouco eficiente para amostras com T pequeno.
70
yit=0+1E*(yit)+it, em que E*(yit) a previso de yit (prediction e forecast) e deve ser it
white noise.
Finalmente, Kao e Chiang [1997] investigam as questes relacionadas com a no-
estacionaridade de sries temporais usadas em estudos com dados em painel,
nomeadamente as formas de analisar as propriedades das sries com razes unitrias, os
problemas de regresses esprias e a cointegrao em amostras longitudinais. Os autores
sublinham que existe pouco trabalho terico sobre o tema da no-estacionaridade, em geral
e sobre a questo da cointegrao, em particular. Numa anlise das propriedades de trs
estimadores num modelo com cointegrao OLS, OLS modificado (pelo enviesamento,
de forma anloga a Judson e Owen[1996]) e OLS dinmico (i.e., estimao por OLS do
modelo base aumentado com as primeiras diferenas passadas e futuras da varivel
exgena) os autores concluem pela superioridade deste ltimo em termos de
centricidade.
Kao [1999] estuda a questo das regresses esprias com dados em painel e analisa
as propriedades assimptticas do estimador within, bem como de outras estatsticas
convencionais. Assim, Kao [1999] conclui que a distribuio assimpttica do estimador
LSDV diferente da de estimadores equivalentes no contexto das time series com
regresses esprias, pelo que os testes de cointegrao convencionais tero que ser
adaptados ao contexto dos dados em painel. Outra referncia a consultar, dentro do tema da
cointegrao com dados em painel, Larsson e Lyhagen [1999].
Um tema que tambm tem suscitado numerosos artigos o da estimao de
modelos dinmicos recorrendo aos estimadores between e chamada tcnica da pooled
mean regression proposta por Pesaran e Smith61 e que de certa forma se relaciona com a
questo da cointegrao. J Baltagi e Griffin [1984] haviam discutido a questo da
estimao de multiplicadores de curto e de longo prazo, segundo a noo de que o recurso
a amostras temporais tenderia a captar os primeiros e as seccionais os segundos. Baltagi e
Griffin [1984] sugeriram que se usasse o estimador within ou o GLS (consoante se
assumissem efeitos fixos ou aleatrios) para estimar os efeitos de curto prazo e os
estimadores OLS ou between para os efeitos de longo prazo, caso os resultados produzidos
61
Pesaran, M. Hashem e Ron Smith [1993]. Alternative Approaches to Estimating Long-Run Energy
Demand Elasticities: An Application to Asian Developing Countries, University of Cambridge Department
of Applied Economics Working Paper: 9308.
71
pelos primeiros se afastem consideravelmente dos fornecidos pelos estimador between.
Para uma actualizao desta discusso, veja-se Pirotte [1999].
Baltagi e Griffin [1997] efectuam uma comparao entre estimadores que assumem
a homogeneidade dos parmetros (i.e., a poolability dos dados) e outros que consideram
que os parmetros so heterogneos, pelo que estimam cada indivduo separadamente e
depois recorrem a mdias, eventualmente ponderadas pelas respectivas matrizes de
varincias (shrinkage estimators). Os resultados tendem a confirmar a superioridade dos
estimadores convencionais, em que se contavam os LSDV, GLS e 2SLS. Alm disso,
Baltagi e Griffin [1997] notam que, para uma dimenso temporal considervel, a
implementao dos estimadores LSDV ou GLS pode ser prefervel utilizao de
estimadores IV, sobretudo quando o contedo informativo dos instrumentos pequeno.
Pesaran, Shin e Smith [1998] propem uma variante do estimador de Grupos de
Mdias (MG), para painis de dimenses considerveis, quer em N, quer em T. Em vez de
estimar N regresses e calcular as mdias dos coeficientes, sugerem um meio termo entre
esta metodologia e os estimadores com o pressuposto de homogeneidade. Assim, Pesaran
et al. [1998] restringem os parmetros de longo prazo a serem idnticos, enquanto que os
de curto prazo podem variar de indivduo para indivduo. A estimao, por MLE, requer
que se usem algoritmos iterativos, nomeadamente do tipo Newton-Raphson, podendo ser
aplicado o mesmo procedimento, independentemente da ordem de integrao dos
regressores. Estes estimadores Pooled Mean Group (PMG) so promissores, tanto mais
que podem ser justificados de ponto de vista econmico, sobretudo na macroeconometria,
ainda que a sua utilizao (tal como a do estimador LSDV) requeira uma dimenso
temporal da amostra considervel. O estimador PMG permite que as dinmicas de
ajustamento individuais sejam diferenciadas (tal como as estruturas de varincias e
covarincias), mantendo uma coeso no sistema para o longo prazo, ainda que nem sempre
as estimativas de curto prazo sejam plausveis.
Para aferir a robustez dos resultados de qualquer trabalho emprico, devem ser
efectuados testes existncia de autocorrelao e heteroscedasticidade dos termos de
perturbao aleatrios, para o que se sugerem alguns procedimentos. Para o efeito,
considere-se o seguinte modelo:
72
y it = i + y i ,t 1 + x it + u it , com uit ~ N(0,2it). (8.1)
em que uit tem mdia nula, varincia 2it, no necessariamente constante e covarincias no
necessariamente nulas. Para simplificar a apresentao, admite-se que os efeitos
especficos so apenas de dimenso seccional (ainda que a incluso de efeitos temporais
no constitua uma complicao intransponvel) e so tratados como fixos.
testes autocorrelao:
Para testar a ausncia de autocorrelao dos termos de perturbao recomendam-se
alguns testes:
i) teste LM de Breusch-Godfrey sobre os resduos de estimao por LSDV ou Within
(quando consistentes) com um truncation lag p a ser definido pelo critrio de
Schwert e que consiste na estimao de uma equao auxiliar com os resduos da
equao principal como varivel dependente e com as variveis explicativas do
modelo original e os resduos do mesmo modelo desfasados, seguida de um teste
significncia destes ltimos mediante estatstica nR2 ~ 2(p). O teste tem a vantagem
de ser relativamente robusto face a especificaes alternativas para o processo de
correlao, testando processos estocsticos AR(p) e MA(p), sendo o seu principal
inconveniente o facto de a sua potncia depender crucialmente da escolha do
truncation lag. Para mais pormenores do teste consulte-se, por exemplo, Davidson e
MacKinnon [1993], 357-360. Ainda assim e por o teste no ter sido concebido para
dados em painel, aconselha prudncia na sua utilizao, complementando-o com
testes alternativos.
ii) teste LM5 de Baltagi [1995] (pg. 93) que testa a hiptese nula de ausncia de
autocorrelao AR(1) ou MA(1) num modelo com efeitos fixos atravs de um teste
de multiplicador de Lagrange com estatstica
u u 1
LM 5 = NT 2 (T 1) ~ N (0 ,1) para T.
u u
em que representa um vector de resduos de estimao within, admitindo efeitos
fixos (pelo que o teste no ser apropriado para testar, por exemplo, a existncia de
autocorrelao em modelos pooled OLS). O teste tem a vantagem de se comportar
relativamente bem para outras especificaes ARMA para as perturbaes e por ser
aplicvel para modelos dinmicos ou outros modelos com regressores no
estritamente exgenos.
73
Adicionalmente, como a transformao within elimina os efeitos individuais (ou
temporais), sejam estes tidos como fixos ou aleatrios, o teste tambm pode ser
usado para testar a existncia de autocorrelao da primeira ordem em modelos com
efeitos aleatrios (Baltagi [1995], pg. 94), ainda que no seja possvel efectuar esta
extenso no caso de modelos dinmicos62 (por a transformao within no gerar
estimadores consistentes, nessa situao).
iii) Teste de Durbin-Watson com dados em painel: para um modelo com efeitos fixos
e com regressores no aleatrios, possvel usar-se o teste de Durbin-Watson para
testar-se a existncia de autocorrelao gerada por um termo AR(1). A estatstica
idntica usada para sries temporais, com a diferena de os resduos usados serem
os within e no os OLS, ou seja
( i , t 1 )
N T
2
it
DW p = i =1 t =1 (8.2)
N T
i =1 t =1
2
it
62
Para modelos estticos, com efeitos aleatrios, Baltagi aconselha uma outra estatstica, dita LM4 (pg. 91-
2) ou o uso do teste de Durbin-Watson.
74
Baltagi [1995], Captulo 5, constitui uma boa fonte para exemplos adicionais de
testes existncia da autocorrelao em circunstncias diversas, nomeadamente quando se
pretende testar simultaneamente a hiptese de autocorrelao e da existncia de efeitos
aleatrios ou quando se pretende escolher entre um processo AR(1) ou MA(1).
testes heteroscedasticidade:
O teste de White com termos cruzados ser uma proposta bvia para testar a
existncia de heteroscedasticidade genrica, segunda a qual, a cada observao
corresponde uma varincia distinta. Assim, testa-se a hiptese nula de homoscedasticidade
contra a alternativa de heteroscedasticidade genrica, incidindo o teste sobre os resduos de
estimao Within. Mais uma vez, um dos problemas do teste o de ter uma reduzida
potncia, a que se soma o facto de no ter sido concebido especificamente para dados em
painel.
Pode ainda testar-se a hiptese nula de homoscedasticidade com hiptese
alternativa de heteroscedasticidade em bloco, i.e., em que podemos ter termos de
perturbao homoscedsticos para cada i, mas com varincias diferentes de grupo para
grupo. Formalmente, a hiptese nula ser
Uma sugesto para o teste ser o de estimar o modelo com efeitos fixos e recolher
os resduos para cada um dos indivduos, correndo N regresses auxiliares do teste de
White. Em concreto, estima-se o modelo (8.1), por exemplo e adicionalmente as seguintes
N regresses auxiliares:
2
e it2 = 0 1 y i ,t 1 + 2 y i ,t 1 + x it x it xit + it , i = 1, K , N
em que a barra significa a varivel expressa na forma de diferena face respectiva mdia
seccional e e so (1k), omitindo-se os termos cruzados, para simplificar. Para cada
uma das regresses calcula-se a estatstica do teste e o respectivo p-value, dados por:
TR2 ~ 2(J-1)
75
em que J o nmero de parmetros em cada regresso. Com os N p-values dos referidos
testes individuais, procede-se a um teste de Maddala-Fisher para testes independentes
(Maddala [1977], pg. 47-8 e Maddala e Kim [1998]) que se baseia na estatstica
N
P = 2 ln ( p i ) ~ 2 (2 N )
i =1
e que, segundo Maddala [1977] se trata de uma distribuio exacta para um teste de
hipteses independentes. Maddala e Kim [1998] sugerem este teste para testar a hiptese
nula de estacionariedade das sries com dados em painel como alternativa aos testes de
Levin e Lin [1993] e Im, Pesaran e Shin [1996]63. A sua aplicao a este contexto de
heteroscedasticidade foi implementada em Marques [2000]. Ainda assim, a potncia do
teste, segundo Maddala [1977] depender da potncia dos teste individuais subjacentes,
que para o teste geral de White no ser particularmente elevada, ainda que a consistncia
esteja assegurada, desde que N fixo e T.
Caso se rejeite a hiptese nula de homoscedasticidade, justifica-se a correco da
matriz de covarincias dos estimadores (within, por exemplo) pelo mtodo consistente de
White, com ou sem correco de grupo, dependendo da hiptese alternativa prever
homoscedasticidade intra-grupo, ou no, respectivamente.
Um outro teste proposto por Baltagi [1995] o j conhecido teste de Bartlett em
que se verifica sob a hiptese nula de homoscedasticidade
T /2
2
1 T
N ( yit y i )
u = ~ 2 (N 1)
T t =1
(8.4)
N
i =1 1
2
1 T
NT T ( yit yi )
i =1
t =1
( y it y i )
1
i2 = e 2 = i
T 1 t =1 TN
63
Cuja aplicao vem dificultada pela indisponibilidade de valores exactos para os p-values dos testes ADF
convencionais, como j se referiu no captulo 6.
76
e que, tal como a anterior, pode ser alterada para acomodar painis no balanceados (isto ,
com dimenso temporal varivel). Para mais pormenores sobre o teste consulte-se Judge et
al. [1985], pg. 447-8 ou Gujarati [1996].
77
9. CONCLUSO
64
Ou seja, os efeitos fixos so na verdade resultado de variveis aleatrias mas que, dado estarmos a
condicionar a estimao por i e t, podem ser tratadas como constantes (Judge et al. [1985], pg. 527).
78
variveis endgenas desfasadas, pelo que a nica sada ser a estimao dos modelos
atravs de variveis instrumentais.
Para evitar o problema da perda de consistncia, em ambas as situaes, tem-se
como alternativa genericamente consistente, aps a diferenciao do modelo, a utilizao
de estimadores de variveis instrumentais, IV. A eficincia destes estimadores
questionvel, dependendo do contedo informativo dos instrumentos, que poder no ser
muito, em particular se o nmero de regressores exgenos for diminuto ou nulo.
Uma alternativa plausvel, quer ao LSDV, quer ao IV, a estimao por GMM,
conforme foi discutido no captulo 5. No entanto, haver aqui que efectuar um balano
crtico relativamente ao trade-off existente entre aos ganhos de eficincia que estes
estimadores permitem (preservando a consistncia) e o acrscimo de complexidade e de
carga computacional que exigem.
Como regra geral, para modelos dinmicos com efeitos fixos, com painis longos,
pode optar-se pelo estimador within, enquanto que para painis curtos se deve preferir a
estimao GMM.
Os modelos podem ser generalizados por forma a que heterogeneidade se revele
no apenas no termo independente, mas tambm nos prprios parmetros associados s
variveis explicativas. No entanto, por economia de espao, optou-se por no abordar essa
possibilidade nesta reviso de literatura. Para alm deste tpico, muitos outros foram
preteridos ou abordados apenas superficialmente, como as questes da estimao por
recurso a especificaes alternativas para as estruturas de varincias, os estimadores PMG
ou MG, a existncia de relaes de cointegrao em modelos em painel e, acima de tudo, a
estimao GMM, que poderia e deveria ter merecido um maior desenvolvimento.
Para quem necessitar de um maior aprofundamento das matrias aqui expostas,
referncias fundamentais sero Hsiao [1986], Baltagi [1995] e Mtys e Sevestre [1992]
(existe uma edio mais recente, de 1995, com melhorias substanciais). Para temas como o
GMM ou as razes unitrias, sugerem-se Mtys [1999] e Maddala e Kim [1998],
respectivamente. Finalmente, para quem desejar uma referncia rpida estimao de
modelos dinmicos com dados em painel, prope-se Urga [1992], ainda que
complementado com referncias mais recentes.
79
10. REFERNCIAS
80
[15] Davidson, Russell e James G. MacKinnon [1993]. Estimation and Inference in
Econometrics, Oxford: Oxford University Press.
[16] Granger, Clive W.J. e Huang, Ling-Ling [1997]. Evaluation of Panel Data Models:
Some Suggestions From Time Series, University of California in San Diego -
Department of Economics Discussion Paper 97-10.
[17] Gujarati, Damodar [1995]. Basic Econometrics, 5th Ed., New York: McGraw-Hill
[18] Greene, William H. [1997]. Econometric Analysis, 3rd Ed. (International Edition),
Upper Saddle River: Prentice Hall.
[19] Hamilton, James D. [1994]. Time Series Analysis, Princeton, New Jersey: Princeton
University Press.
[20] Hausman, J.A. e W.E. Taylor [1981]. "Panel Data and Unobservable Individual
Effects", Econometrica, 49, no. 6: 1377-98.
[21] Heimonen, Kari [1999]. Stationarity of the European real exchange rates
evidence from panel data, Applied Economics, 1999, 31: 673-77.
[22] Holtz-Eakin, Douglas, Whitney Newey e Harvey S. Rosen [1988]. Estimating
Vector Autoregressions with Panel Data, Econometrica, vol. 56, no. 6, 1371-95.
[23] Hsiao, Cheng [1986]. Analysis of Panel Data. Cambridge: Cambridge University
Press.
[24] Im, Kyung So, M. Hashem Pesaran e Yongcheol Shin [1997]. Testing for Unit
Roots in Heterogeneous Panels, Department of Applied Economics Discussion Paper,
University of Cambridge s/n.
[25] Jonhston, Jack e John DiNardo [1997]. Econometric Methods, 4 Edio. New
York: McGraw-Hill Companies, Inc..
[26] Judge, George, W.E. Griffiths, R. C. Hill, H. Lktepohl e Tsoung-Chao Lee [1985].
The Theory and Practice of Econometrics, 2 Edio, New York: John Wiley and Sons.
[27] Judson, Ruth e Owen, Ann [1996]. Estimating Dynamic Panel Data Models: A
Pratical Guide for Macroeconomists, Federal Reserve System Working Paper.
[28] Kao, Chihwa [1999]. Spurious regression and residual-based tests for
cointegration in panel data, Journal of Econometrics, 90, 1-44.
[29] Kao, Chihwa e Chiang, Min-Hsien [1997]. On the Estimation and Inference of a
Cointegrated Regression in Panel Data, Syracuse University Working Paper.
[30] Keane, Michael P. e David E, Runkle [1992]. On the Estimation of Panel Data
Models With Serial Correlation When Instruments Are Not Strictly Exogenous,
Journal of Business and Economic Statistics, Vol. 10, No. 1, 18-22.
[31] Kmenta, Jan [1986]. Elements of Econometrics. New York: Macmillan.
81
[32] Koenker, Roger e Jos A.F. Machado [1997]. GMM inference when the number of
moment conditions is large, Working Paper da University of Illinois em Champaign.
[33] Larsson, Rolf e Johan Lyhagen [1999]. Likelihood-Based Inference in
Multivariate Panel Cointegration Models, Stockholm School of Economics Working
Paper Series in Economics and Finance, no. 331.
[34] Levin, Andrew e Chen.Fu Lin [1992]. Unit Root Tests in Panel Data: asymptotic
and finite sample properties, University of California in San Diego Discussion Paper
92-23.
[35] Levin, Andrew e Chen-Fu Lin [1993]. Unit Root Tests in Panel Data: new
results, University of California in San Diego Discussion Paper 93-56.
[36] Maddala, G.S. [1977]. Econometrics. New York: McGraw-Hill.
[37] Maddala, G.S. e In-Moo Kim [1998]. Unit Roots, Cointegration, and Structural
Change. Cambridge: Cambridge University Press.
[38] Marques, Lus David [2000]. Inflation Targeting: Conceitos e Evidncia de um
Novo Regime de Objectivos Intermdios em Poltica Monetria, Tese de Mestrado em
Economia, Faculdade de Economia do Porto.
[39] Mtys, Lzl e Sevestre, Patrick, eds. [1992]. The Econometrics of Panel Data:
Handbook of Theory and Applications, Dordrecht: Kluwer Academic Publishers.
[40] Mtys, Lzl [1999]. Generalized Method of Moments. Cambridge: Cambridge
University Press.
[41] Metcalf, Gilbert E. [1997]. Specification testing in panel data with instrumental
variables, Journal of Econometrics, 71, 291-307.
[42] Nerlove, Marc [1971]. Further Evidence on the Estimation of Dynamic Relations
from a Time Series of Cross Sections, Econometrica, 39:359-382.
[43] Nickell, S. [1981]. Biases in Dynamic Models with Fixed Effects, Econometrica,
49:1399-416.
[44] Pesaran, M. Hashem, Yongcheol Shin e Ron P. Smith [1998]. Pooled Mean Group
Estimation of Dynamic Heterogeneous Panels, Department of Applied Economics,
University of Cambridge Working Paper s/n., Novembro 1998.
[45] Pirotte, Alain [1999]. Convergence of the static estimation toward the long run
effects of dynamic panel data models, Economic Letters, 63, 151-158
[46] Urga, Giovanni [1992]. The Econometrics of Panel Data: a selective introduction,
texto no publicado da London Business School.
82