Você está na página 1de 15

GOVERNO DO ESTADO DO CEAR

SECRETARIA DO PLANEJ AMENTO E GESTO - SEPLAG


INSTITUTO DE PESQUISA E ESTRATGIA ECONMICA DO CEAR - IPECE




NOTA TCNICA
N 37







UMA BREVE DISCUSSO SOBRE OS MODELOS
COM DADOS EM PAINEL






Andr Oliveira Ferreira Loureiro
1

Leandro Oliveira Costa
2









Fortaleza CE

Maro 2009


1
Mestre em Economia CAEN/UFC. Analista de Polticas Pblicas do IPECE.
2
Doutorando em Economia CAEN/UFC. Analista de Polticas Pblicas do IPECE.
Notas Tcnicas do Instituto de Pesquisa e Estratgia Econmica do Cear (IPECE)
GOVERNO DO ESTADO DO CEAR
Cid Ferreira Gomes Governador
SECRETARIA DO PLANEJ AMENTO E GESTO (SEPLAN)
Silvana Maria Parente Neiva Santos Secretria
INSTITUTO DE PESQUISA E ESTRATGIA ECONMICA DO CEAR (IPECE)
Marcos Costa Holanda Diretor-Geral
Marcelo Ponte Barbosa Diretor de Estudos Econmicos
Eveline Barbosa Silva Carvalho Diretora de Estudos Sociais
A Srie Notas Tcnicas do Instituto de Pesquisa e Estratgia Econmica do
Cear (IPECE) tem como objetivo a divulgao de metodologias e trabalhos
elaborados pelos servidores do rgo, que possam contribuir para a
discusso de diversos temas de interesse do Estado do Cear.
Instituto de Pesquisa e Estratgia Econmica do Cear (IPECE)
End.: Centro Administrativo do Estado Governador Virglio Tvora
Av. General Afonso Albuquerque Lima, S/N Edifcio SEPLAN 2 andar
60830-120 Fortaleza-CE
Telefones: (85) 3101-3521 / 3101-3496
Fax: (85) 3101-3500
www.ipece.ce.gov.br
ipece@ipece.ce.gov.br

SUMRIO

Apresentao 1
1. Pressupostos relacionados metodologia de Dados em Painel 2
2. Heterogeneidade No-observada 4
3. Efeitos Fixos 5
4. Efeitos Aleatrios 6
5. Exogeneidade Estrita e Variveis Instrumentais 7
Anexo: Testes frequentemente utilizados em modelos com dados em
painel 9
Referncias Bibliogrficas 11
IPECE Nota Tcnica N 37


1
Apresentao


Em funo de vrios trabalhos do IPECE utilizarem a metodologia de dados
em painel na realizao de avaliaes sobre diversos aspectos socioeconmicos
cearenses
1
, o presente trabalho busca ampliar a acessibilidade dos nossos
trabalhos a essa metodologia amplamente utilizada nos artigos cientficos das
cincias sociais aplicadas e, principalmente, na economia. Dessa forma, a
presente nota tcnica apresenta um breve resumo sobre a metodologia
economtrica utilizada no contexto de Dados em Painel, bem como um breve
guia de como aplic-la utilizando o software Stata
2
.

Dados em Painel ou dados longitudinais so caracterizados por possurem
observaes em duas dimenses que em geral so o tempo e o espao. Este
tipo de dados contm informaes que possibilitam uma melhor investigao
sobre a dinmica das mudanas nas variveis, tornando possvel considerar o
efeito das variveis no-observadas. Outra vantagem a melhoria na inferncia
dos parmetros estudados, pois eles propiciam mais graus de liberdade e maior
variabilidade na amostra em comparao com dados em cross-section ou em
sries temporais, o que refina a eficincia dos estimadores economtricos. Hsiao
(2006) expe um maior detalhamento das vantagens propiciadas pela anlise
de Dados em Painel.

Aps uma introduo que discute o modelo de dados em painel,
apresentado o conceito de heterogeneidade no-observada. So discutidos os
principais modelos utilizados neste contexto: Efeitos Fixos, Primeiras Diferenas e
Efeitos Aleatrios. Finalmente, discutido o caso em que a hiptese de
Exogeneidade Estrita no valida e a utilizao de variveis instrumentais.

1
Entre os trabalhos do IPECE que se utilizam da metodologia de dados em painel, podemos citar os artigos de Irffi,
Oliveira & Barbosa (2008), Irffi et al. (2008) e Loureiro (2008).
2
A escolha do software STATA 10.0 se deve a sua ampla utilizao nas cincias sociais aplicadas.
IPECE Nota Tcnica N 37


2
1. Pressupostos relacionados metodologia de Dados em Painel

Um modelo de regresso com dados em painel, com n observaes em T
perodos e K variveis, pode ser representado da seguinte forma:

it it it
y + = x , i =1, 2, ... , n; t =1, 2, ... , T (1)

onde
it
y a varivel dependente,
it
x um vetor 1 K contendo as variveis
explicativas, um vetor K1 de parmetros a serem estimados e
it
so os erros
aleatrios. Os sub-ndices i e t denotam a unidade observacional e o perodo de cada
varivel, respectivamente. Desta forma, em uma base de dados com dados em painel,
o nmero total de observaes corresponde a nT.

Se o modelo seguir todas as hipteses clssicas de regresso
3
, pode-se estim-lo
por Mnimos Quadrados Ordinrios MQO, obtendo as estimativas desejadas. As
principais se referem ao erro , que se supe homoscedstico e no-correlacionado no
tempo e no espao. Neste caso, ter-se-ia uma matriz de varincia V da seguinte forma:
T n
I I V = ) (
2
, onde
2
a varincia da regresso, denota o produto de kronecker
e
n
I e
T
I denotam matrizes identidade de ordem n e T, respectivamente. Assim, V
uma matriz de ordem nTnT. No caso de dados em painel, os problemas de
heteroscedasticidade e autocorrelao podem ocorrer tanto dentro dos grupos,
quanto entre os grupos, ou as duas situaes simultaneamente.

O problema de heteroscedasticidade, se detectado, torna necessria a
utilizao do mtodo de Mnimos Quadrados Generalizados MQG. Segundo Greene
(2003), se fosse utilizado o estimador de Mnimos Quadrados Ordinrios MQO, no
levando em considerao a no-homoscedasticidade dos distrbios, as estimativas
ainda seriam no-viesadas e consistentes, mas no seriam mais eficientes. Desta forma,
os testes de significncia das estimativas seriam enviesados se MQO fosse utilizado. O
mesmo argumento vlido na presena de autocorrelao dos erros.


3
Para maiores detalhes dessas hipteses, ver Greene (2003) e Davidson & MacKinnon (2004).
IPECE Nota Tcnica N 37


3
Se algum desses dois problemas, ou ambos, estiverem presentes no modelo, a
matriz de varincia do modelo deixa de ser diagonal e passa a ser da seguinte forma:
= ) (
2
V , onde e representam matrizes cujos elementos podem assumir
quaisquer valores.

Em funo de no se conhecer a matriz de varincia V do modelo, no
possvel realizar estimativas dos parmetros por MQG diretamente, sendo ento
necessrio estimar e . Mas a estimao de todos os parmetros dessas matrizes
sem estabelecer qualquer padro para as mesmas tambm invivel, visto que neste
caso teremos mais parmetros a serem estimados do que observaes disponveis. Mais
precisamente, em um modelo com nT observaes, teremos mais nT(nT+1)/2 parmetros
na matriz de varincia V para serem estimados, alm dos parmetros usuais, tornando
qualquer estimativa impossvel. Assim, para que se possa obter as estimativas, faz-se
necessria a estimao por Mnimos Quadrados Generalizados Factveis MQGF, onde
o padro dessa matriz predeterminado.
4


Outro problema que pode surgir em dados em painel, e que inviabilizaria a
utilizao de MQO, a endogeneidade. Esta ocorre quando a correlao entre
alguma varivel explicativa
j
x e o erro diferente de zero, isto : 0 ) , (
it j
x Cov .
Wooldridge (2002) destaca as trs principais fontes de endogeneidade: omisso de
variveis do modelo (heterogeneidade no-observada), erros de medio das variveis
e simultaneidade entre as variveis.

4
Para maiores detalhes sobre esse mtodo, ver Greene (2003) e Wooldridge (2002).
IPECE Nota Tcnica N 37


4
2. Heterogeneidade No-observada

O problema mais frequente em dados em painel a questo da
heterogeneidade no-observada. Neste caso, haveria fatores que determinam a
varivel dependente, mas no esto sendo considerados na equao dentro do
conjunto de variveis explicativas, por no serem diretamente observveis ou
mensurveis. Levando em considerao a heterogeneidade no-observada, o modelo
acima pode ser reescrito da seguinte forma:
it i it it
c y + + = x , i =1, 2, ... , n; t =1, 2, ... , T (2)

onde
i
c representa a heterogeneidade no-observada em cada unidade observacional
(no presente caso, estado) constante ao longo do tempo.

Segundo Wooldridge (2002), se
i
c for correlacionado com qualquer varivel em
it
x e tentarmos aplicar MQO neste caso, as estimativas sero no s viesadas como
inconsistentes.
5
As mesmas consequncias ocorrem no modelo no caso em que a
hiptese clssica que no haja correlao entre alguma varivel explicativa
j
x e o erro,
0 ) , ( =
it j
x Cov , no seja vlida. Assim, neste caso, somente podemos utilizar MQO se
tivermos justificativas para assumir que 0 ) , ( =
j i
x c Cov . Se essa hiptese for vlida
podemos considerar um novo termo composto,
it i it
c v + , e estimar o modelo por
MQO, visto que teramos 0 ) , ( =
j it
x v Cov . Esse mtodo com dados em painel
conhecido como Mnimos Quadrados Ordinrios Agrupados.


5
Para uma discusso mais detalhada das implicaes da existncia da heterogeneidade no-observada nos modelos
economtricos, ver Worrall & Pratt (2004).
IPECE Nota Tcnica N 37


5
3. Efeitos Fixos

No caso em que 0 ) , (
j i
x c Cov , para que possamos estimar essa equao
consistentemente, a abordagem mais usual no contexto de dados longitudinais a de
Efeitos Fixos. Neste mtodo de estimao, mesmo permitindo que 0 ) , (
j i
x c Cov , a idia
eliminar o efeito no-observado
i
c , baseado na seguinte suposio: ( ) 0 , =
i i it
c E x ,
onde ) , ... , , (
2 1 iT i i i
x x x x , conhecida como condio de exogeneidade estrita. A
transformao de efeitos fixos (ou transformao within) obtida em dois passos.
Tirando-se a mdia da equao (2) no tempo obtemos:

i i i i
c y + + = x (3)

e subtraindo (3) de (2) para cada t, obtemos a equao transformada de efeitos fixos:
( )
i it i i it
y y + = x x
it
(4)
ou

it it it
y & & & & & & + = x , i =1, 2, ... , n; t =1, 2, ... , T (5)

removendo assim a heterogeneidade no-observada
i
c .

O estimador de Efeitos Fixos obtido ao se aplicar MQO agrupados na equao
(5) e sob a hiptese de exogeneidade estrita, esse estimador consistente. Este
estimador tambm conhecido como estimador within, por usar a variao do tempo
dentro de cada unidade observacional. Outro estimador bastante utilizado a partir das
transformaes anteriores o estimador between, que obtido ao se aplicar MQO
agrupados na equao (3), e leva em considerao somente a variao entre as
unidades observacionais.



IPECE Nota Tcnica N 37


6
4. Efeitos Aleatrios

Outro mtodo de estimao bastante utilizado com dados em painel o de
Efeitos Aleatrios. Assim como nos MQO agrupados, em uma anlise de efeitos
aleatrios, o efeito no-observado
i
c colocado junto com o termo aleatrio
it
.
Entretanto, impe trs suposies adicionais
6
: a) ( ) 0 , =
i i it
c E x , b) ( ) ( ) 0 = =
i i i
c E c E x
e c)
2 2
) (
c i i
c Var = x . A primeira a mesma do modelo de efeitos fixos, a de
exogeneidade estrita. A segunda diz respeito ortogonalidade entre
i
c e cada
i
x e
mdia de
i
c ser nula. A terceira se refere homoscedasticidade de
i
c .

O modelo de efeitos fixos permite a existncia de correlao entre os efeitos
individuais no-observados com as variveis includas. Entretanto, se esses efeitos forem
estritamente no-correlacionados com as variveis explicativas, pode ser mais
apropriado modelar esses efeitos como aleatoriamente distribudos entre as unidades
observacionais, utilizando o modelo de efeitos aleatrios. Em funo das especificidades
desse modelo, o problema de autocorrelao uma constante, fazendo com que seja
necessria a utilizao de MQG factveis.

Assim, o ponto crucial na deciso de que modelo deve ser utilizado, se efeitos
fixos ou aleatrios, reside na questo se
i
c e
i
x so correlacionados ou no. Esse
questionamento deve ser feito de acordo com os dados que se est trabalhando,
examinando suas especificidades. Um teste mais formal pode ser realizado, o Teste de
Hausman, baseado nas diferenas das estimativas de efeitos fixos e aleatrios. Este teste
descrito na ltima seo.

Haveria ainda a possibilidade de simplesmente no haver heterogeneidade no-
observada no modelo que estamos estimando. Se isso for verdade a estimativa por
MQO agrupado eficiente e vlida. A ausncia de efeitos no-observados
equivalente a testar a hiptese de a varincia de
i
c ser nula. Um teste para verificar a
existncia de efeitos no-observados o de Breusch e Pagan, baseado no multiplicador
de Lagrange, que descrito em Greene (2003) e Wooldridge (2002).

6
Alm das suposies usuais de posto e dos erros.
IPECE Nota Tcnica N 37


7
5. Exogeneidade Estrita e Variveis Instrumentais

Um ponto importante a se destacar dos trs modelos discutidos acima que tratam
da heterogeneidade no-observada a hiptese comum a todos eles: a de
exogeneidade estrita. Embora essa suposio seja crucial para a consistncia de todos
esses estimadores, tambm uma das mais provveis de no ser vlida. Assim,
precisamos saber que procedimento deve-se utilizar se a suposio de exogeneidade
estrita no for vlida. Wooldridge (2002) sugere algumas solues para esse problema,
destacando a utilizao de variveis instrumentais e eliminao do efeito no-
observado para que os estimadores sejam consistentes mesmo quanto hiptese de
exogeneidade estrita no for vlida.

Para que possamos utilizar variveis instrumentais, necessria a utilizao de
mtodos especficos para quando estas precisam ser utilizadas no modelo. O mtodo
mais utilizado nesse contexto o mtodo de Mnimos Quadrados em Dois Estgios
MQ2E. O objetivo principal de se utilizar esse tipo de estimao com variveis
instrumentais resolver o problema de endogeneidade.

Uma discusso mais detalhada do mtodo de M2QE fugiria do escopo do
presente trabalho.
7
Entretanto, faz-se necessrio definir o que caracteriza uma varivel
instrumental. Reescrevendo um modelo de regresso como o descrito na equao (1)
destacando uma das variveis contidas em
it
x que seja endgena (isto ,
0 ) , (
it it
w Cov ), e a denotando por
it
w , teremos:

it it it it
w y + + = x , i =1, 2, ... , n; t =1, 2, ... , T (7)

Sabemos que a estimao de (7) por MQO resultar em estimativas inconsistentes
no s para , como para todos os parmetros contidos no vetor . O mtodo de
variveis instrumentais IV possibilita uma soluo geral pra o caso em que existe
alguma varivel endgena no modelo. Para utilizar essa abordagem, necessria uma

7
Para maiores detalhes sobre estimadores com variveis instrumentais, ver Greene (2003), Davidson & MacKinnon
(2004) e Wooldridge (2002).
IPECE Nota Tcnica N 37


8
varivel observvel
it
z que sirva como instrumento (varivel instrumental) e no esteja
na equao (7).

Esta varivel precisa satisfazer duas condies. Primeiro,
it
z deve ser no
correlacionada com o erro
it
, isto : 0 ) , ( =
it it
z Cov . Desta forma, assim como as
demais variveis em
it
x ,
it
z exgena na equao (7). A segunda condio diz
respeito relao entre
it
z e a varivel endgena
it
w . Em uma projeo linear de
it
w
em todas as variveis exgenas:

it it it it
z w + + = x (8)

o coeficiente de
it
z deve ser no-nulo, isto : 0 . Essa condio pode ser entendida
de uma forma no to rigorosa como: 0 ) , (
it it
z w Cov . Ou seja, a varivel instrumental
deve ser correlacionada com a varivel endgena.

Como j foi mencionado e ser discutido com mais detalhes mais a frente, no
presente trabalho, a varivel no modelo a ser estimado que se acredita que seja
endgena, a varivel de gastos em segurana pblica. Assim, devemos utilizar pelo
menos uma varivel instrumental no somente para corrigir esse problema, como na
prpria determinao se a varivel de gastos pblicos em segurana endgena no
modelo que iremos estimar.
8


Assim, com uma varivel instrumental que satisfaa essas condies, podemos
implementar o mtodo apropriado para corrigir o problema de endogeneidade no
modelo que queremos estimar, seja este problema causado pela hiptese de
exogeneidade estrita no ser vlida, ou haver simultaneidade entre alguma varivel
explicativa e a varivel independente. Isto , alguma varivel explicativa, alm de
determinar a varivel dependente, ao mesmo tempo, ser influenciada pela varivel
dependente.

8
Somente com a varivel instrumental em mos, podemos testar se uma varivel endgena ou no em um modelo. O
teste mais difundido para este fim o teste de Hausman de endogeneidade.
IPECE Nota Tcnica N 37


9
Anexo: Testes frequentemente utilizados em modelos com dados em painel


A - Teste F para Heterogeneidade No-Observada

c c H
i
= :
0

) /( ) 1 (
) 1 /( ) (
) , 1 (
2
2 2
K n nT R
n R R
K n nT n F
LSDV
MQOA LDSV


= (A.1)

onde LSDV indica o estimador com varivel dummy onde
i
c levado em considerao.
Se esta estatstica exceder o valor tabelado, a hiptese de heterogeneidade no-
observada vlida.

B - Teste de Breusch e Pagan

0 :
2
0
=
i
c
H

[ ] ( )
2
1 1
2
2
1
2
1 1
2
1
2
1
1

) 1 ( 2
1

) 1 ( 2



= =
=
= =
= =
n
i
T
t
it
n
i
i
n
i
T
t
it
n
i
T
t
it
T
T
nT
T
nT
LM

(A.2)

onde
it
resduo da regresso de MQO agrupados e sob a hiptese nula,
2
~ LM
com 1 grau de liberdade. Se esta estatstica exceder o valor tabelado, a hiptese de
heterogeneidade no-observada vlida.

IPECE Nota Tcnica N 37


10
C - Teste de Hausman para testar Efeitos Fixos contra Efeitos Aleatrios

Seja
EF

o vetor de estimativas de efeitos fixos e


EA

o vetor de estimativas de
efeitos aleatrios, sob a hiptese nula de:
0

:
0
=
EA EF
H (i.e. efeitos aleatrios vlido), a estatstica:

[ ] [ ] [ ]
EA EF EA EF EA EF
V V H

)

( )

(

1
'
=

(A.3)

possui distribuio
2
com K-1 graus de liberdade. Se esta estatstica exceder o valor
tabelado, devemos utilizar efeitos fixos.
IPECE Nota Tcnica N 37


11
Referncias Bibliogrficas

DAVIDSON, R. and MACKINNON, J . G., Econometric Theory and Methods, Oxford
University Press, 2004.

GREENE, William H. Econometric Analysis 5
th
ed. Prentice-hall. 2003.

IRFFI, G. D.; OLIVEIRA, J .; BARBOSA, E. Anlise dos Determinantes Socioeconmicos da
Taxa de Mortalidade Infantil (TMI) no Cear. Texto para Discusso IPECE N 48, 2008.

IRFFI, G. D.; TROMPIERI, N.; OLIVEIRA, J .; NOGUEIRA, C. A.; BARBOSA, M.; HOLANDA, M.
Determinantes do Crescimento Econmico dos Municpios Cearenses. Texto para
Discusso IPECE N 39, 2008.

HSIAO, Cheng, Analysis of panel data: Second Edition, Cambridge University Press, 2003.

HSIAO, Cheng, Panel Data Analysis - Advantages and Challenges, IEPR Working Papers,
Institute of Economic Policy Research (IEPR), 2006.

LOUREIRO, A. O. F. Avaliando o Impacto do Policiamento sobre a Criminalidade no
Cear. Texto para Discusso IPECE N 53, 2008.

NERLOVE, M. Essays in Panel Data Econometrics. Cambridge University Press, 2002.

WOOLDRIDGE, J effrey M., Econometric Analysis of Cross Section and Panel Data. The MIT
Press, Cambridge, MA, 2002.

IPECE Nota Tcnica N 37


12
WORRALL J . L.; PRATT T. C., On the Consequences of Ignoring Unobserved Heterogeneity
when Estimating Macro-Level Models of Crime. Social Science Research, v. 33, p. 79-105,
2004.