Você está na página 1de 31

ESTIMAO DE MODELOS

LINEARES COM DADOS DE PAINEL






ESTV-IPV
2
Vantagens da anlise de dados em painel
Na rea da finana, ainda no h muitos estudos
que explorem os dados em painel que permitam
controlar os efeitos especficos (e no observveis)
a uma dada empresa, no.
A maioria dos estudo apenas apresenta as estimaes
em OLS para a pool dos dados

Estes estudos frequentemente no fazem qualquer
ajuste aos desvios padro dos erros na estimao
em OLS, o que pode pode ser muito enganador
especialmente quando os paineis so longos (i.e.
quando o periodo de amostragem cobre muitos
anos)
Vantagens da anlise de dados em painel
Mais observaes
Mais graus de liberdade
Reduzir a
multicollineariedae
Maior eficincia (estimador no enviesado com varincias menores
para todos os possiveis valores dos parmetros)
Fundir dados
seccionais com
sries temporais
Derivados do maior
nmero de observaes
Um problem sobretudo
nos modelos com
variveis desfasadas
4
Vantagens da anlise de dados em painel
Assim podemos enunciar pelo menos trs
grandes vantagens da anlise de dados em
painel:
Podemos controlar os efeitos fixos no observveis
que podem enviesar as estimativas dos coeficientes.
Estes efeitos fixos no observveis podem ser especificos empresa,
ao pas ou ao indviduo.

Uma amostra maior possibilita estimativas mais
precisas dos coeficientes.
Podemos incluir variveis desfasadas ou em
diferenas nos nosso modelos.
Estimar em dados de painel no STATA
Explicar as principais carcteristicas ( i.e. sintaxe da
linguagem) para estimar usando o software
economtrico Stata.

Explicar os comandos e a sintaxe para estimar os
modelos lineares estticos com dados em painel.
Explicar os comandos e a sintaxe para estimar os
modelos lineares dinmicos com dados em painel.

Proporcionar aos investigadores ferramentas para
uma gesto eficiente do processo de investigao
utilizando a metodologia de dados de painel e o
software Stata.
Modelos lineares dinmicos com dados em painel
Descrever os pressupostos e as formulas anlticas dos
modelo dinmicos, comeando pelo modelo mais simples:
o autoregresssivo

Extender o modelo autoregresssivo para os caso em que
h tambm variveis explicativas predeterminadas e/ou
estrictamente exogenas.
Explicar em que casos e como possivel extender a nossa
anlise utilizando o mtodo GMM (e a sua variao o GMM-
SYS).

Explicar que instrumentos so vlidos. Notar que esta
deciso tem de ser tomada pelo investigador quando
estima o modelo

Explicar que testes de especificao so exigidos quando
usamos a metodologia GMM para estimar os modelos.

FUNDAMENTOS DE OLS





ESTV-IPV
Ordinary Least Squares (OLS)



i i i
x y c | + = '
Vector das
variveis
explicativas
Vector dos
coeficientes
c | + = ' X y
(
(
(
(
(
(
(
(

+
(
(
(
(
(

(
(
(
(
(
(
(
(

=
(
(
(
(
(
(
(
(

N
K
NK N N N
K
K
K
K
K
N
x x x x
x x x x
x x x x
x x x x
x x x x
x x x x
y
y
y
y
y
y
c
c
c
c
|
|
|
|
.
.
.
.
.
.
*
. .
. . . . . .
. . . . . .
. .
. .
. .
. .
. .
.
.
3
2
1
3
2
1
3 2 1
5 53 52 51
4 43 42 41
3 33 32 31
2 23 22 21
1 13 12 11
5
4
3
2
1
| |
i
K
iK i i i i
x x x x y c
|
|
|
|
+
(
(
(
(
(

=
.
.
* . .
3
2
1
3 2 1
i K iK i i i i
x x x x y c | | | | o + + + + + + = .........
3 3 2 2 1 1
Na forma vectorial Na forma matricial
Nota: Frequentmente aparece x escrito como x
Tambm chamado regresso linear
Assume que varivel dependente uma combinao linear de
variveis independentes mais um ruido aleatrio.
Least squares ou Mnimos quadrados: porque s so de forma a
minimizar a soma dos s.




Em que:




que a expresso acima indica que a estimativa OLS do parmetro de
inclinao igual a covarincia entre x e y dividida pela varincia de x.

OLS
y X X X b
i
' ) ' (
) ( min
1
2

=

c
1
1
2
1
( )( )

( )
n
i i
i
n
i
i
x x y y
x x
|
=
=

=


Os Residuos i.i.d (seguem uma distribuio normal, tm mdia zero e
varncia constante)

Residuos tm mdia zero ..

s e os Xs no esto correlacionados..
violada se o regressor for endgeno
Tal pode ser solucionado pelo mtodo das
Variveis instrumentais

Homoscedasticidae: todos os s tm varincia igual
opo robust no STATA

Non-autocorrelato: s no so correlacionados uns com os outros
Quando o mesmo ndividuo observado vrias vezes
opocluster no STATA

Pressupostos do OLS
0 ) | ( =
i i
X E c
0 ) ( =
i
E c
0 ) ( =
i i
X E c
2
) ( o c =
i
Var
0 ) ( =
j i
E c c
Modelo SS /
Total SS
Testa se todos
os coefs.
excepto a
constante so
todos zero
MS = SS/df
Intervalos definiddos para os
coeficientes com + ou 1.96
desvio padres
T-stat =
coeficiente / desvio padro
Interpretao dos resultados do Stata
para OLS
Analises da varincia
(ANOVA) t

_cons - 819. 931 78. 80064 - 10. 41 0. 000 - 974. 3888 - 665. 4732
mt h_i nt - 5. 059072 4. 036446 - 1. 25 0. 210 - 12. 97094 2. 8528
ed_deg 1076. 674 20. 54526 52. 40 0. 000 1036. 403 1116. 945
ed_sec 380. 5032 14. 36582 26. 49 0. 000 352. 3446 408. 6618
par t ner 155. 7992 16. 62703 9. 37 0. 000 123. 2085 188. 39
age2 - 1. 155281 . 0479992 - 24. 07 0. 000 - 1. 249364 - 1. 061197
age 101. 0994 3. 859657 26. 19 0. 000 93. 53401 108. 6647
f emal e - 594. 9641 13. 26812 - 44. 84 0. 000 - 620. 9711 - 568. 9571

i ncm Coef . St d. Er r . t P>| t | [ 95% Conf . I nt er val ]

Tot al 1. 6626e+10 16457 1010245. 5 Root MSE = 847. 35
Adj R- squar ed = 0. 2893
Resi dual 1. 1811e+10 16450 718000. 667 R- squar ed = 0. 2896
Model 4. 8145e+09 7 687785597 Pr ob > F = 0. 0000
F( 7, 16450) = 957. 92
Sour ce SS df MS Number of obs = 16458
. r eg i ncmf emal e age age2 par t ner ed_sec ed_deg mt h_i nt i f age >= 17 & age <= 64
. do " C: \ DOCUME~1\ mar i a\ LOCALS~1\ Temp\ STD03000000. t mp"
Varivel dependente
Condio if
Modelo auto-regressivos and com a varivel dependente
desfasada
Modelos de variao

Modelos dinmicos simples que utilizam
dados em painel
i i i
x y c | o + + = ......
1
......
1 1 i i i
x y c | o + + =
2
......
2 2 i i i
x y c | o + + =
)
1 2 1 2 1 2
( ...... ) ( ) (
i i i i i i
x x y y c c | + =
i i i
x y c | A + A = A ......
Regresso em OLS
Estimar um modelo em separado para cada ano
Subtrair o 1
o
ao 2
o
modelo
Or, express in terms of change
Explain how obtain and join the data
Explain how to build the variables for research
Explain the structure of a panel data and the
exploratory analysis of the data

Panel data format

Econometric Analysis of Panel Data
Introduction
Panel Data Definition
Data on n cases, over t time periods, giving a total of n t observations

Unbalanced Panel
Balanced Panel:
Short Panel:
Long Panel:

Panel Data Analysis

Unobserved Heterogeneity
Cross Section and Time Series Correlation
First need to tell Stata that you have panel data using xtset
Stata tools for analyzing panel data begin with the prefix xt

, ( 1, 2, ..., ; 1, ..., )
it it i
y t T i N = = x
,
i
T T i =
, T N <
, T N <
it it i it
y u e | = + + x
Whether appending or merging
Whether appending or merging
The data set you are using at the time is called
the master data
The data set you want to merge it with is called
the using data

Make sure you can identify observations
properly beforehand
Make sure you can identify observations
uniquely afterwards

Appending
Use this command to add more observations
Check first that you are really adding observations you dont already
have (or that if you are adding duplicates, you really want to do this)

Syntax: append usi ng using_data
STATA simply sticks the using data on the end of the master data
STATA re-orders the variables if necessary.
If the using data contain variables not present in the master data,
STATA sets the values of these variables to missing in the using data
(and vice versa if the master data contains variables not present in the
using data)
Merging
Use merge to add more variables to a data set
Master data: age.dta
Pid wave age
28005 1 30
19057 1 59
28005 2 31
19057 3 61
19057 4 62
28005 4 33
Using data: gender.dta
Pid wave gender
19057 1 female
19057 3 female
28005 1 male
28005 2 male
28005 4 male
42571 1 male
42571 3 male
First, make sure both data sets are sorted the same way


use gender . dt a
sor t pi d wave
save, r epl ace

use age. dt a
sor t pi d wave


Merging
Pid wave age gender _merge
19057 1 59 female 3
19057 3 61 female 3
19057 4 62 . 1
28005 1 30 male 3
28005 2 31 male 3
28005 4 33 male 3
42571 1 . male 2
42571 3 . male 2
Master data: age.dta
Pid wave age
19057 1 59
19057 3 61
19057 4 62
28005 1 30
28005 2 31
28005 4 33
Using data: sex.dta
pid wave sex
19057 1 female
19057 3 female

28005 1 male
28005 2 male
28005 4 male
42571 1 male
42571 3 male
Notice that both data sets dont contain the same observations
merge 1:1 pid wave using sex
Merging
STATA creates a variable called _merge
after merging
1: observation in master but not using data
2: observation in using but not master data
3: observation in both data sets

Options available for discarding some
observations see help, manual
Reshape wide to long

insheet using "C:\data\exceltable.csv", delimiter(";") clear
save "C:\datai\gdp_imp.dta", replace
gen id = _n
order id

reshape long x , i(id) j(year)
encode variable, gen(varlabel)
tab varlabel
*Crear um do-file com os labels para cada varive. Muito util com muitas variveis .
label save varlabel using varname, replace

label define varlabel 1 `"var1"', modify
label define varlabel 2 `"var2"', modify

egen id2 = group(country year)
move id2 year
drop id
drop variable

reshape wide x, i(id2) j(varlabel)
order id2 country year x1 x2
More on merging
Previous example showed one-to-one merging
Not every observation was in both data sets, but every observation in the master data was
matched with a maximum of only one observation in the using data and vice versa.

Many-to-one merging:
(hid) household-level data sets contain only one observation per household (usually <1 per person)
Sample syntax: merge m:1 hid wave using hhinc_data


hi d pi d age
1604 19057 59
2341 28005 30
3569 42571 59
4301 51538 22
4301 51562 4
4956 59377 46
5421 64966 70
6363 76166 77
6827 81763 71
6827 81798 72




hi d h/ h i ncome
1604 780
2341 1501
3569 268
4301 394
4956 1601
5421 225
6363 411
6827 743

hi d pi d age h/ h i ncome
1604 19057 59 780
2341 28005 30 1501
3569 42571 59 268
4301 51538 22 394
4301 51562 4 394
4956 59377 46 1601
5421 64966 70 225
6363 76166 77 411
6827 81763 71 743
6827 81798 72 743



NOW!
Go To:
ubi_varpanel.do
ubi_lsiv.do
Using Stata
Declare Panel Data and Variables
xtset (or tsset)
xttab
Panel Data Analysis: xt commands
xtdes
xtsum
xtdata
xtline
Panel Data Regression
Xtreg
xtivreg (Instrumental Variables Estimation)
xtabond (Arellano-Bond Estimator)

xtsum in STATA
Similar to ordinary sum command
wi t hi n 4. 320605 1 15 T = 15
bet ween 0 8 8 n = 1294
wave over al l 8 4. 320605 1 15 N = 19410

wi t hi n 4. 030974 - 6. 738331 35. 12834 T- bar = 12. 7845
bet ween 3. 609665 0 29. 69231 n = 1225
LI KERT over al l 11. 26167 5. 344825 0 36 N = 15661

wi t hi n . 1852756 - . 866041 1. 000626 T- bar = 13. 1787
bet ween . 1738938 0 1 n = 1237
ue_ si ck over al l . 0672924 . 2505353 0 1 N = 16302

wi t hi n 4. 31763 31. 30015 54. 30015 T = 15
bet ween 19. 27238 6. 4 90. 93333 n = 1294
age over al l 40. 03349 19. 74332 0 98 N = 19410

wi t hi n . 243531 - . 244038 1. 622629 T- bar = 13. 2026
bet ween . 4217842 0 1 n = 1234
par t ner over al l . 6892954 . 4627963 0 1 N = 16292

wi t hi n 0 . 5397574 . 5397574 T- bar = 13. 1964
bet ween . 4989059 0 1 n = 1237
f emal e over al l . 5397574 . 4984321 0 1 N = 16324

Var i abl e Mean St d. Dev. Mi n Max Obser vat i ons
. xt sum f emal e par t ner age ue_ si ck LI KERT wave i f nwaves == 15
del t a: 1 uni t
t i me var i abl e: wave, 1 t o 15, but wi t h gaps
panel var i abl e: pi d ( unbal anced)
. xt set pi d wave
All variation is
between
All variation is within,
because this is a balanced
sample
Have chosen a balanced sample
Most variation is
between,
because its
fairly rare to
switch between
having and not
having a partner
More on xtsum.
wi t hi n 4. 320605 1 15 T = 15
bet ween 0 8 8 n = 1294
wave over al l 8 4. 320605 1 15 N = 19410

wi t hi n 4. 030974 - 6. 738331 35. 12834 T- bar = 12. 7845
bet ween 3. 609665 0 29. 69231 n = 1225
LI KERT over al l 11. 26167 5. 344825 0 36 N = 15661

wi t hi n . 1852756 - . 866041 1. 000626 T- bar = 13. 1787
bet ween . 1738938 0 1 n = 1237
ue_ si ck over al l . 0672924 . 2505353 0 1 N = 16302

wi t hi n 4. 31763 31. 30015 54. 30015 T = 15
bet ween 19. 27238 6. 4 90. 93333 n = 1294
age over al l 40. 03349 19. 74332 0 98 N = 19410

wi t hi n . 243531 - . 244038 1. 622629 T- bar = 13. 2026
bet ween . 4217842 0 1 n = 1234
par t ner over al l . 6892954 . 4627963 0 1 N = 16292

wi t hi n 0 . 5397574 . 5397574 T- bar = 13. 1964
bet ween . 4989059 0 1 n = 1237
f emal e over al l . 5397574 . 4984321 0 1 N = 16324

Var i abl e Mean St d. Dev. Mi n Max Obser vat i ons
. xt sum f emal e par t ner age ue_ si ck LI KERT wave i f nwaves == 15
del t a: 1 uni t
t i me var i abl e: wave, 1 t o 15, but wi t h gaps
panel var i abl e: pi d ( unbal anced)
. xt set pi d wave
Observations with
non-missing
variable
Average number of
time-points
Number of
individuals
Min & max refer to individual deviation from own averages, with global averages added back in.
Min & max refer to x
i
-bar
The xttab command
( n = 1236)
Tot al 16031 100. 00 2458 198. 87 50. 28

l t si ck, 558 3. 48 105 8. 50 39. 08
f t st udt 718 4. 48 271 21. 93 42. 93
f ami l y c 1159 7. 23 292 23. 62 28. 97
r et i r ed 2687 16. 76 314 25. 40 58. 49
unempl oy 539 3. 36 274 22. 17 17. 51
empl oyed 8982 56. 03 974 78. 80 68. 27
sel f - emp 1388 8. 66 228 18. 45 42. 72

j bst at Fr eq. Per cent Fr eq. Per cent Per cent
Over al l Bet ween Wi t hi n
. xt t ab j bst at i f nwaves == 15 & j bst at >= 1 & j bst at ! = 5 & j bst at <= 8
For simplicity, omitted jbstats of missing, maternity leave,
gov training and other.
Pooled sample, broken down
by person/years
Number of people who spent
any time in this state
Of those who spent any time
in this state, the proportion
of their time (on average)
they spent in it.
Panel correlations


ESTIMATING (STATIC) LINEAR
PANEL DATA MODELS WITH STATA




ESTV-IPV
Sumrio
Tipos de variveis: as que variam no tempo invariantes com
o tempo, e as de tendncia
Variao individual between e within
Conceito de heterogeneidade individual
Propriedades base dos modelos de efeitos fixos (FE) e
aleatrios (RE)
Discutir as limitaes dos modelos estticos, prestanto
particular ateno ao facto de que dificil encontrar
modelos com variveis estrictamente endgenas na rea
microeconomia.
Implementao no STATA
Conceito de heterogeneidade individual
Um conceito muito simple: as pessoas e as empresas so
diferentes!
Nas Cincias Sociais quando falamos de heterogeneidade,
estamos a falar de uma heterogeneidade no observvel (ou
observada).
Heterogeneidade observvel : diferenas nos niveis de
educao, ou algo que possamos medir e controlar os
efeitos na regresso.
Heterogeneidade no observvel: algo que
fundamentalmente no mensurvel, ou apenas mensurvel
com uma grande margem de erro, ou ainda que pelo menos
que no conste dos dados disponiveis para o nosso
trabalho.

Heterogeneidade no observvel
Re-escrever a equao OLS, dividindo o termo de erro em
duas componentes: uma representando as caracteristicas
no observveis da entidade e a outra que representa o
termo de erro genenuinamente aletorio

Nas anlises cross-section, no h forma de distinguir entre
as duas componentes.

Na anlise de dados de painel, temos observaes
repetidas para cada individuo e isto permite-nos
distinguir entre duas estas componentes.


i i K iK i i i i
u x x x x y c | | | | o + + + + + + + = .........
3 3 2 2 1 1
Usando variveis dummy
Pressuposto: impacto parcial (inclinao)
mantem-se constante ao longo do tempo e para
os vrios pases

Mtodos diferentes
Inserir dummies de tempo na regresso
Inserir dummies para as unidades cross-seccionais
Inserir os dois tipos de dummies

Nota: Frequentemente as dummies no so
reportadas se demasiado numerosas!

34
Usando variveis dummy
Na regresso mltipla, incluimos variaveis dummy (dum_1 dum_2
dum_3 dum_4) que permitem controlar o efeito individual
especifico (u
i
)


Sem incluir as dummies das entidades, a nossa estimativa de |
ser enviesada porque as dummies esto correlacionadas com a
idade.
dummies das entidades explicam toda a variao cross-seccional
da carcteristica individual no observvel ao longo destas quatro
entidades.
Notar que necessrio omitir pelo menos uma varivel dummy ou
a constante do modelo de forma a evitar collinearidade
tab identifier, gen(dum_)
reg y x dum_1 dum_2 dum_4 ou
reg y x dum_1 dum_2 dum_3 dum_4, nocons

35
Mtodo alternativo para estimar com dados em painel
Em vez de incluirmos variveis dummy, podemos controlar
os efeitos idiossincrticos transformando as variveis Y e X
variables.


Taking averages of eq. (1) over time gives:

Subtraindo a eq. (2) da eq. (1) resulta:



O mais importante notar que os feitos especificos
individuais (u
i
) foram diferenciados para fora de forma a
no enviesar a nossa estimativa de |.
Fixed effects Efeitos fixos (FE)









Poucos pressupostos so necessrios para FE ser consistente
Ignora a variao entre grupos (between-group) pelo que ser um estimador
ineficiente
No podemos estimar coeficientes para variveis que no variam no tempo
) ( ) ( ) ( i
it
i
it i it
it i it it
x x y y
u x y
c c |
c | o
+ =
+ + + =
Variao entre (Between) e dentro (Within) individuos
Se temos uma amostra com obervaes repetidas para os mesmos
individuos, there temos que reconhecer que h duas fontes de variao
dentro da amostra:
O facto dos individuos serem sistemticamente diferentes uns dos outros (variao
between individuos)
O facto do comportamento dos individuos variar de uma obervao para outra
(within individuos)
i person for ns observatio of mean
mean sample - whole
n observatio year - person a
years denotes s, individual denotes
) ( ) (
) (
) (
2 2
2
2
=
=
=
= =
=
=

i
ij
i
i
i
i j
i i
i j
i
ij
i j
ij
x
x
x
j i
x x n x x B
x x W
x x T
- A variao Total a soma, para todos os individuos
e anos, do quadrado da diferena entre cada
obervao de x e a sua mdia.
- A variao Within a soma dos quadrados das
diferenas entre a observao de cada individuo e a
sua mdia de cada individuo
- A variao Between a soma dos quadrados das
diferenas entre as mdias de cada individuo e a
mdia de toda a amostra




Pensando em termos de declives e interseo
Mtodos cross-section e pool de datos para
vrios perodos ou vagas
Assume que os betas so iguais entre individuos
A interseco da recta da regresso tambm igual para todos
individuos
Efeitos Fixos (Fixed effects - FE)
Assume que os betas so iguais entre individuos
Permite que a interseco da recta da regresso para cada
individuo varie, mas que seja constante ao longo do tempo
Efeitos aletrios (Random effects - RE)
Assume que os betas so iguais entre individuos [e betas within
e betas between so identicos]
Permite interseco da recta da regresso para cada individuo
varie, e within individuos ao longo do tempo.
39
O estimador de efeitos fixos (FE)
O modelo FE controla todas as diferenas que no variam no
tempo entre individuos, pelo que os coeficientes estimados para
os modelos FE no sero enviesados por causa caracteristicas
omitidas que no variem no tempo (gnero, nacionalidade, )
Um efeito colateral dos modelos FE que assim no permitem
investigar as consequncias destas variveis que no variem no
tempo na varivel dependente
Tecnicamente as caracteristicas que no variem no tempo dos
individuos so perfeitamente colineares com as dummies das
respectivas entidades.
Substantivamente, os modelos FE so apropriados para estudar
as causas das mudanas em cada individuo ou entidade (within).
Uma caracteristica que no varie no tempo no pode causar essa
variabilidade, pois so uma constante para cada individuo.
O estimador de efeitos fixos (FE)
Use FE quando estiver apenas interessado em analizar o impacto das
variveis que variam ao longo do tempo.

Outro importante pressuposto do modelo FE de que estas
caracteristicas, que no variam no tempo, so nicas ao grupo e que
no so correlacionadas com as caracteristicas de outros grupos. Cada
entidade diferente, assim o termo de erro de cada entidade e a
constante (que captura as caracteristicas individuais) no deve ser
correlacionado com os outros.
Se os termos de erro so correlacionadas ento o estimador FE no o
indicado porque a inferncia pode no ser correcta . necessrio ento
modelar a relao (provavelmente usando random-effects), o que a lgica
do teste de Hausman (apresentado mais adiante).

41
O estimador de efeitos fixos no Stata
(xtreg, fe i())
xt um prefixo que diz ao STATA que vamos
estimar um modelo em dados de painel

A opo fe diz ao STATA que vamos estimar um
modelo de feitos fixos FE
Estimar em OLS equivalente a incluir variveis
dummy para controlar os efeitos individuais especificos

O termo i() diz ao STATA qual o identificador do
grupo
xtreg y x, fe i(identifier)
Time variables insignificant here (as we would
expect)


Fixed effects estimation
using xtreg y x, fe

43
sigma_u o desvio padro das
estimativas dos efeitos fixos, u
i
(o
u
)

sigma_e o desvio padro das
estimativas dos residuos, e
it
(o
e
)

rho = o
u
2
/ (o
u
2
+ o
e
2
)

44
O estimador de efeitos aleatrios (RE)
Outra alternativa o modelo random effects (RE) no qual se
assume que os u
i
so distribuidos aleatoriomante com mdia
zero e uma varincia constante (u
i
~ I.I.D(0, o
2
u
) em vez de
serem fixos.

the crucial distinction between fixed and random effects is whether the
unobserved individual effect embodies elements that are correlated with the
regressors in the model, not whether these effects are stochastic or not
(Green, 2008, p.183)

Uma imagem intuitiva, do modelo RE que identico a ter um
modelo OLS onde a interseco da recta da regresso varia
aleatriamente entre individuos.
Como o simples OLS, a variao entre entidades assumida
ser aleatria e no correlacionada com as variveis
independentes incluidas no modelo, ou seja, assume uma
correlao nula correlation entre u
i
e X
it
Se u
i
e X
it
esto correlacionados, as estimativas RE esto
enviesadas e no consistentes

O estimador de efeitos aleatrios (RE)
O modelo RE permite que as variveis que no variam no
tempo desepenhem um papel enquanto variveis
explicativas. No modelo FE estas variveis so absorvidas
pela interseco da recta de regresso

No estimador RE necessrio especificar as
caracteristicas que podem ou no influenciar as previses.
O problema que algumas variveis no estaro disponiveis
levando a um problema de enviesamento por omisso de variveis.

RE eficiente por que faz um melhor uso dos dados.

46
O estimador de efeitos aleatrios (RE)
Faz uso da variao within e between entidadades, fazendo
um uso mais eficiente dos dados.
O modelo RE pode ser pensado como uma soluo
intermdia entre ignorar a variao entre grupos (FE) e
trat-la como a variao dentro do grupo (OLS)


O modelo RE (0 s u s 1) tambm conhevido como
estimador generalized least squares ou mnimos
quadrados generalizados (i.e., mais geral que o OLS ou o
modelo FE como demonstraremos adiante.
O modelo OLS corresponde a u = 0.

)} ( ) 1 {( ) ( ) 1 ( ) ( i
it i
i
it i it
u x x y y c u c u | u o u u + + + =
47
Estimao com random effects (xtreg, re)
Se queremos estimar o modelo RE, o comando do stata xtreg , re i().
Por exemplo: xtreg gdp pop, re i( identifier)
O resto do output similar ao modelo FE excepto:
Usa-se uma estatistica teste de Wald em vez de uma estatistica F
para testar a significncia das variveis independentes.


r ho . 3577895 ( f r act i on of var i ance due t o u_i )
si gma_ e 4. 0525618
si gma_ u 3. 0248563

_cons 5. 181864 . 3137662 16. 52 0. 000 4. 566894 5. 796835
badheal t h 1. 433115 . 0385506 37. 17 0. 000 1. 357558 1. 508673
age2 - . 0011062 . 0001498 - 7. 39 0. 000 - . 0013998 - . 0008126
age . 1058038 . 014544 7. 27 0. 000 . 0772981 . 1343094
par t ner - . 1947691 . 0973734 - 2. 00 0. 045 - . 3856175 - . 0039207
ue_si ck 2. 045302 . 1271039 16. 09 0. 000 1. 796183 2. 294422
f emal e 1. 493431 . 1259931 11. 85 0. 000 1. 246489 1. 740373

LI KERT Coef . St d. Er r . z P>| z| [ 95% Conf . I nt er val ]

0. 1986 0. 1986 0. 5482 0. 6629 0. 6629
mi n 5% medi an 95% max
t het a
cor r ( u_ i , X) = 0 ( assumed) Pr ob > chi 2 = 0. 0000
Random ef f ect s u_i ~ Gaussi an Wal d chi 2( 6) = 2013. 32
over al l = 0. 1471 max = 14
bet ween = 0. 2239 avg = 7. 3
R- sq: wi t hi n = 0. 0500 Obs per gr oup: mi n = 1
Gr oup var i abl e: pi d Number of gr oups = 3317
Random- ef f ect s GLS r egr essi on Number of obs = 24204
. xt r eg LI KERT f emal e ue_ si ck par t ner age age2 badh, r e t het a
48
Podemos testar se u
i
e X
it
esto correlacionados.
Se esto correlacionados devemos usar o estimador FE no lugar do
OLS ou RE (seno os coefficients sero enviesados).
Se no esto correlacionados, melhor usar o estimador RE porque
mais eficiente.

Segundo o teste concebido por Hausman
Se u
i
e X
it
esto correlacionados, the random-effects estimates are
biased (inconsistent) while the fixed-effects coefficients are unbiased
(consistent)
Neste caso h grandes diferenas entre os coeficientes estimados
por FE e RE
Se no esto correlacionados, os coeficientes fornecidos por RE e FE
so ambos consistentes, mas os coeficientes FE so infecientes
enquantos que os do RE so eficientes.
Neste caso no haver grandes diferenas entre os coeficientes
estimados por FE e RE

O teste de Hausman indica se os dois conjuntos de coeficientes so
significativamente diferentes.
O teste de Hausman
49
Hausman test: (estimates store, hausman)
Pra decidir entre FE ou RE podemos correr um test Hausman onde a
hiptese nula de que o modelo preferido RE vs. a alternativa FE.
Testa basicamente se erros especficos (u
i
) esto correlacionados com os
regressores. Na hiptese nula no esto.
Procedimento para executar um teste de Hausman ser o
seguinte:
Guardar os coeficientes que sero consistentes ainda que a hipotese
nula no seja verdadeira:
xtreg gdp pop, fe i( id)
estimates store fixed_effects
Guardar os coeficientes que sero inconsistentes se hipotese nula
no forverdadeira :
xtreg gdp pop, re i( id)
estimates store random_effects
The comando para o teste Hausman:
hausman name_consistent name_efficient
hausman fixed_effects random_effects
Testando entre FE and RE
Hypothesis H0: u
i
is uncorrelated with x
i
Hypothesis H1: u
i
is correlated with x
i

Fixed effects consistente sob H0 e H1
Random effects eficiente e consistente sob H0 (mas inconsistente sob H1)


Notar que a matriz das diferenas (V
c
-V
e
)
-1
s assimptticamente que
garantidamente positiva. Em amostras pequenas, esta propriedade assimpttica
pode no se verificar pelo que a estatistica chi
2
ser negativa.
Pr ob>chi 2 = 0. 0000
= 123. 96
chi 2( 5) = ( b- B) ' [ ( V_ b- V_ B) ^( - 1) ] ( b- B)
Test : Ho: di f f er ence i n coef f i ci ent s not syst emat i c
B = i nconsi st ent under Ha, ef f i ci ent under Ho; obt ai ned f r om xt r eg
b = consi st ent under Ho and Ha; obt ai ned f r om xt r eg

badheal t h 1. 230831 1. 433115 - . 2022848 . 0187202
age2 - . 0011833 - . 0011062 - . 0000771 . 0001624
age . 1141748 . 1058038 . 008371 . 0157531
par t ner - . 298668 - . 1947691 - . 1038989 . 0677693
ue_ si ck 1. 951485 2. 045302 - . 0938175 . 0572845

f i xed . Di f f er ence S. E.
( b) ( B) ( b- B) sqr t ( di ag( V_ b- V_ B) )
Coef f i ci ent s
. hausman f i xed .
. qui et l y xt r eg LI KERT f emal e ue_ si ck par t ner age age2 badh, r e
. est i mat es st or e f i xed
. qui et l y xt r eg LI KERT f emal e ue_ si ck par t ner age age2 badh, f e
Random effects rejeitado (inconsistente)
em favor dos fixed effects (consistente
mas ineficient)
Testando entre FE and RE

Pr ob>chi 2 = 0. 0000
= 123. 96
chi 2( 5) = ( b- B) ' [ ( V_ b- V_ B) ^( - 1) ] ( b- B)
Test : Ho: di f f er ence i n coef f i ci ent s not syst emat i c
B = i nconsi st ent under Ha, ef f i ci ent under Ho; obt ai ned f r om xt r eg
b = consi st ent under Ho and Ha; obt ai ned f r om xt r eg

badheal t h 1. 230831 1. 433115 - . 2022848 . 0187202
age2 - . 0011833 - . 0011062 - . 0000771 . 0001624
age . 1141748 . 1058038 . 008371 . 0157531
par t ner - . 298668 - . 1947691 - . 1038989 . 0677693
ue_ si ck 1. 951485 2. 045302 - . 0938175 . 0572845

f i xed . Di f f er ence S. E.
( b) ( B) ( b- B) sqr t ( di ag( V_ b- V_ B) )
Coef f i ci ent s
. hausman f i xed .
. qui et l y xt r eg LI KERT f emal e ue_ si ck par t ner age age2 badh, r e
. est i mat es st or e f i xed
. qui et l y xt r eg LI KERT f emal e ue_ si ck par t ner age age2 badh, f e
Estimadores FE, RE e BE
)} ( ) 1 {( ) ( ) 1 ( ) (
) ( ) ( ) (
: g subtractin
person for ns observatio all of mean
i
it i
i
it i it
i
it
i
it i it
i
i
i
i
it i it it
u x x y y
x x y y
u x y
i
u x y
c u c u | u o u u
c c |
c | o
c | o
+ + + =
+ =
+ + + =
+ + + =
Efeito especifico, fixo ao longo de tempo
Os residuos variam ao longo do tempo e os pressupostos normais
aplicam-se (mdia zero, homoscedasticidade, no correlacionado com x
ou u or consigo mesmo)
Estimador between
Estimador within ou efeitos fixos
O ponderador ; o modelo FE um
caso especial do modelo RE (quando
=1). mede o peso dado variao
entre (between) grupos, e derivado
das varincias de u
i
e de
i.


estimators between e within s estimadore dos ponderada mdia uma que a is
aleatrios efeitos de estimador o , finalmente e
O estimador Between (xtreg, be) raramente usado
ineficiente comparado com os random effects, pois s faz uso da mdia
das variveis.

NOW!
Go To:

ubi_fdferebe.do
OS MODELOS DINMICOS E

O MTODO GENERALIZADO
DOS MOMENTOS (GMM)



ESTV-IPV
Vamos primeiro considerar um diagrama de causalidade para
ilustrar o problema colocado por variveis instrumentais.
Podemos usar mnimos quadrados ordinrios (OLS) para
estimar consistentemente o seguinte modelo:
regresso: y = xb + u (1)




Nenhuma associao entre x e u; OLS consistente
X
y
u
Variveis Instrumentais
O estimador OLS respeita a Hiptese da esperana
condicional nula, pode ser expressa por E[u|x] = 0. Esta
condio tambm pode ser representada pela independncia
entre u e X, ou seja, covarincia(u,x)=0







Entretanto, a regresso falha quando:
Endogeneidade: y = xb + u
Correlao entre x e u; OLS no consistente.




x y
u
Variveis Instrumentais
Uma situao em que temos que utilizar variveis
instrumentais quando temos que levar em conta factores
no observveis relevantes e que so omitidos da equao
de regresso.
o Tanto y como x podem ser afetados por estes factores
latentes, como por exemplo a habilidade.

Considere a regresso de (ln) rendimentos (y) sobre anos
de estudo (x). O termo de erro u engloba todos os outros
factores que afetam os rendimentos tais como habilidade
inata dos indivduos ou inteligncia.
Mas a habilidade certamente correlacionada com o
grau de escolaridade alcanado, causando uma
correlao entre o regressor e o erro,
Matematicamente, este o mesmo problema que aquele
causado pela endogeneidade ou erros de medida.
A soluo deste problema por variveis instrumentais pode
ser vista como uma Regresso de variveis
instrumentais: y = xb + u
Assim se z no correlacionado com u, correlacionado com
x
z x
u
y
Ento a varivel adicional z chamada de instrumento
para x. Em geral, temos muitas variveis em x, e mais de
uma destas variveis correlacionada com u.
Neste caso, necessitamos no mnimo tantas variveis em
z, quantas forem as variveis em x correlacionadas com u.
Porque no utilizar sempre variveis
instrumentais?

Estimadores IV so enviesados para pequenas amostras e
suas propriedades para amostras finitas so freqentemente
problemticas.

A preciso de estimadores IV menor do que a de
estimadores OLS. Na presena de instrumentos fracos
(instrumentos includos com baixa correlao com os
regressores endgenos) a perda de preciso muito grande
e as estimativas IV podem no compensar a inconsistncia
dos estimadores OLS.
O problema da seleco dos instrumentos
Pode ser difcil achar variveis que servem como instrumentos
vlidos. Muitas variveis que tm um efeito sobre as variveis
endgenas includas, tambm tm um efeito direto sobre a
varivel dependente.
Por outrolado, os instrumentos podem ser fracos:
satisfatoriamente exgenos, mas fracamente correlacionados com os
regressores endgenos. Neste caso, a cura pode ser pior do que a doena.
Embora os estimadores de VI sejam consistentes quando z e u
so no correlacionados e z e x tem qualquer correlao positiva
ou negativa, as estimativas de VI podem ter grandes erros
padro, especialmente se z e x forem fracamente
correlacionados.
O estimador de VI tambm pode ter um grande enviesamenyo assimpttico
mesmo se z e u forem s moderadamente correlacionados.
Que mtodo de estimao aplicar
Vamos sistematizar o que vimos at agora sobre variveis instrumentais.
Quando temos certeza de que os regressores da nossa equao no
esto correlacionados com os erros podemos aplicar o mtodo
convencional de OLS.
No entanto, mesmo nesse caso temos que verificar se os resduos da
regresso so homocedsticos. Ento temos que realizar o teste
heterocedasticidade. Caso os resduos sejam heterocedsticos temos
que realizar a regresso robusta. Isto pode ser feito utilizando a opo
robust (aps a vrgula) no comando regress.
Caso tenhamos motivos para acreditar que um ou mais regressores
sejam endgenos (tenham correlao no nula com termo de erro da
equao) temos que aplicar o mtodo das variveis instrumentais.
Mas mesmo nesse caso podemos ter uma complicao. Pode acontecer
que aplicando o mtodo das variveis instrumentais os resduos do
modelo no sejam homocedsticos. Nesse caso temos que aplicar o
mtodo das variveis instrumentais articulado com o mtodo dos
momentos generalizados (GMM).

Você também pode gostar