Você está na página 1de 49

Wooldridge, captulo 13

Prof. Dr. Luciano Sampaio


Discente Maxwell Celestino
Nesta aula veremos como modelar relaes entre variveis quando temos um
conjunto de dados empilhados:

Como incluir efeitos de tempo

O modelo de Diferena em diferenas (DiD) com dois grupos de dois perodos


de tempo

Modelos com dados em painel por Diferenciao

2
Ateno para a diferena entre: Dados de Corte Transversal Empilhados (ou
Agrupados) vs. Verdadeiro Painel

Dados de Corte Agrupados (ou Empilhados):


Dados de corte de mais de um perodo de tempo, agrupados
Exemplos: Pnad, POF e vrias outras bases de dados do IBGE, Inep, etc

Dados em Painel:
conjunto de dados com dimenses de corte transversal e sries temporais
Precisamente, Dados em Painel correspondem a dados em que as mesmas
unidades de corte transversal so observadas no tempo

3
Porque usar dados empilhados?

Apenas para se ter uma amostra maior estimadores mais precisos e


estatsticas de testes mais poderosas (vimos MQO Assimpttico)
Se acharmos que a relao entre algumas variveis se manteve constante ao
longo do tempo, teremos estimativas mais precisas
(Se toda a regresso muda ao longo do tempo, no adianta empilhar os
dados de corte, pois no h ganhos de preciso)

Investigar o efeito do tempo, com dummies para anos, p.e.

Investigar quando as relaes mudaram ao longo do tempo, com dummies para


tempo interagindo com outras variveis
Ex: A fertilidade das mulheres mudou de uma forma que no pode ser
inteiramente captada por mudanas na educao ou na participao na fora
de trabalho;
Anlise de polticas com estimao por Diferena em Diferenas (DiD):
eleio de diretores ou tamanho das turmas
4
Efeitos de tempo em dados empilhados com Dummies para anos

Geralmente comeamos a modelagem supondo que apenas o intercepto muda


ao longo do tempo

Coeficientes de inclinao so os mesmos para todos os instantes do tempo

Modelo com diferentes interceptos: Se temos dados para perodos de


tempo, podemos incluir 1 dummies de tempo (uma para cada perodo)
Uma das dummies (geralmente a do perodo mais antigo) a categoria de
referncia

Um teste t (possivelmente robusto a heterocedasticidade) pode ser usado


para verificar se os interceptos mudam ao longo do tempo

5
Exemplo: fertilidade das mulheres, 72 a 84 (FERTIL1.dta)

Qual o efeito da educao no nmero de filhos?


Podemos fazer uma regresso tradicional que compara nmeros de filhos entre
mulheres mais e menos educadas
No precisamos de dados empilhados para responder a esta questo, mas
teremos mais dados se usarmos dados empilhados

Efeitos de tempo:
Em que medida a queda da fertilidade no pode ser explicada por mudana em
outros fatores observveis como, por exemplo, a educao?
Agora precisamos de dados empilhados
Podemos olhar para os coeficientes das dummies dos anos

6
Exemplo: fertilidade das mulheres, 72 a 84 (FERTIL1.dta)

Como explicar a queda na fertilidade?

= 0 + 1 2 + 2 3 + + 1 + 1 1 + + +

Dummies de tempo para perodos 2 a T Coef. De inclinao


no mudam ao longo
do tempo

O stata nem precisa saber que os dados so empilhados. Apenas temos que criar
e incluir as dummies de tempo na regresso

7
Exemplo: fertilidade das mulheres, 72 a 84 (FERTIL1.dta)
Como a fertilidade mudou nestes anos?
. table year, c(m kids min kids max kids)

year mean(kids) min(kids) max(kids)

72 3.025641 0 7
74 3.208092 0 7
76 2.802632 0 7
78 2.804196 0 7
80 2.816901 0 7
82 2.403226 0 7
84 2.237288 0 7

Que parcela desta queda na fertilidade pode ser explicada por mudanas em
variveis observadas, como educao, e em variveis no observadas?
Fazer a regresso do n de crianas (kids) em idade (age), idade ao quadrado,
negro (black) , leste (east), norte-centro (northcen), oeste (west), agro (farm),
rural (othrural), cidade muito pequena (town), cidade pequena (smcity) e as
dummies de ano (y74 a y84)
8
. reg kids educ age agesq black east northcen west farm othrural town smcity y74-y84

Source SS df MS Number of obs = 1129


F( 17, 1111) = 9.72
Model 399.610888 17 23.5065228 Prob > F = 0.0000
Residual 2685.89841 1111 2.41755033 R-squared = 0.1295
Cada ano adicional de educao reduz
Adj R-squared = 0.1162 o n de crianas em
Total 3085.5093 1128 2.73538059 Root MSE = 1.5548 aproximadamente 0.13, na mdia

Comparado com o ano base (1972), a


kids Coef. Std. Err. t P>|t| [95% Conf. Interval]
fertilidade caiu em aproximadamente
educ -.1284268 .0183486 -7.00 0.000 -.1644286 -.092425 0.55 crianas em 84 (Queda de
age .5321346 .1383863 3.85 0.000 .2606065 .8036626 fertilidade no incio dos anos 80)
agesq -.005804 .0015643 -3.71 0.000 -.0088733 -.0027347
black 1.075658 .1735356 6.20 0.000 .7351631 1.416152
Esta queda no pode ser explicada
east .217324 .1327878 1.64 0.102 -.0432192 .4778672
northcen .363114 .1208969 3.00 0.003 .125902 .6003261
pelas variveis explicativas
west .1976032 .1669134 1.18 0.237 -.1298978 .5251041
farm -.0525575 .14719 -0.36 0.721 -.3413592 .2362443
othrural -.1628537 .175442 -0.93 0.353 -.5070887 .1813814
town .0843532 .124531 0.68 0.498 -.1599893 .3286957
smcity .2118791 .160296 1.32 0.187 -.1026379 .5263961
y74 .2681825 .172716 1.55 0.121 -.0707039 .6070689
y76 -.0973795 .1790456 -0.54 0.587 -.448685 .2539261
y78 -.0686665 .1816837 -0.38 0.706 -.4251483 .2878154
y80 -.0713053 .1827707 -0.39 0.697 -.42992 .2873093
y82 -.5224842 .1724361 -3.03 0.003 -.8608214 -.184147
y84 -.5451661 .1745162 -3.12 0.002 -.8875846 -.2027477
_cons -7.742457 3.051767 -2.54 0.011 -13.73033 -1.754579 9
Interao entre varivel explicativa e dummies de tempo:

At agora assumimos que o efeito das variveis explicativas so constantes ao


longo do tempo
No Ex da fertilidade: educao tinha o mesmo efeito em 72 e em 84

fcil relaxar o modelo para permitir coeficientes que variam ao longo do tempo:
basta incluir termos de interao entre dummies de tempo e a varivel
explicativa de interesse

Exemplo: fertilidade
Mesmo modelo, agora permitindo que o coeficiente de educao varie ano a ano:

= 0 + 1 2 + 2 3 + + 1 + 1
+ + + + 2 2 + + +

10
. reg kids educ age agesq black east northcen west farm othrural town smcity y74-y84 y74educ-y84educ, robust

Linear regression Number of obs = 1129


F( 23, 1105) = 8.21
Prob > F = 0.0000
R-squared = 0.1365
Root MSE = 1.5528

Robust
kids Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ -.0225152 .066141 -0.34 0.734 -.1522913 .1072609


age .5074658 .1400342 3.62 0.000 .232703 .7822287
agesq -.005525 .0015924 -3.47 0.001 -.0086494 -.0024005
black 1.074055 .2006813 5.35 0.000 .6802955 1.467814
east .2060559 .1274167 1.62 0.106 -.04395 .4560619
northcen .3482867 .1165612 2.99 0.003 .1195804 .576993
west .1771221 .163542 1.08 0.279 -.1437658 .4980101
farm -.0721622 .1452696 -0.50 0.619 -.3571976 .2128732
othrural -.1911539 .1784384 -1.07 0.284 -.5412702 .1589625
town .0882295 .1285735 0.69 0.493 -.1640463 .3405053
smcity .2053576 .1543955 1.33 0.184 -.0975839 .5082991

11
Robust
kids Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ -.0225152 .066141 -0.34 0.734 -.1522913 .1072609


Coeficiente de y84 a diferena de fertilidade
y74 .9469149 1.03828 0.91 0.362 -1.090308 2.984138 entre 84 e 72 para mulheres com educao
y76 1.019963 1.127292 0.90 0.366 -1.191912 3.231839 igual a 0. No relevante
y78 1.805985 1.332366 1.36 0.176 -.8082674 4.420238
Efeito de educ no ano base: prx. de 0 (zero)
y80 1.114183 1.050826 1.06 0.289 -.9476562 3.176023
y82 1.199807 1.009239 1.19 0.235 -.7804334 3.180048 Podemos fazer um teste conjunto com todas
y84 1.671261 1.026677 1.63 0.104 -.3431965 3.685718 as interaes de educ. No podemos rejeitar
a hiptese de que os coeficiente so
y74educ -.0564248 .0819404 -0.69 0.491 -.2172012 .1043516 constantes no tempo
y76educ -.0920997 .0897557 -1.03 0.305 -.2682105 .0840112
y78educ -.1523873 .1034737 -1.47 0.141 -.3554144 .0506399 Parece que a fertilidade est mais sensvel
educao nos ltimos anos (82 e 84)
y80educ -.0979049 .0836096 -1.17 0.242 -.2619564 .0661467
y82educ -.1389447 .0792514 -1.75 0.080 -.2944449 .0165554
y84educ -.176097 .0796192 -2.21 0.027 -.3323188 -.0198752
_cons -8.477302 3.193861 -2.65 0.008 -14.74402 -2.210585

12
Anlise de polticas com dados de corte empilhados:
Dois ou mais conjuntos de dados de corte independentes podem ser usados
para avaliar o impacto de um evento ou uma mudana de poltica

Diferena em Diferenas com 2 grupos e 2 perodos de tempo


Dados de dois grupos em dois perodos de tempo

Um dos grupos foi exposto a um tratamento ou interveno no segundo


perodo, mas no no primeiro
O segundo grupo (grupo de controle) no foi exposto ao tratamento

Seja A o grupo de controle e B o grupo de tratamento


Seja d2 uma dummy para o segundo perodo de tempo
13
Diferena em diferenas com 2 grupos e 2 perodos
Modelo (dummy de interao entre perodo e grupo de tratamento):
= 0 + 1 + 0 2 + +
em que o resultado de interesse

A mdia de zero, ento podemos ler as mdias das diferentes combinaes


entre grupos e perodos de tempo:

Antes (1) Depois (2) Depois-Antes


Controle (A) 0 0 + 0 0
Tratamento (B) 0 + 1 0 + 0 + 1 + 1 0 + 1
Tratamento (B) 1 1 + 1
Controle (A)

14
Diferena em diferenas com 2 grupos e 2 perodos
= 0 + 1 + 0 2 + +

Diferenas entre Diferenas Diferenas de mudanas nas


tratamento e sistmicas que mdias para os dois grupos antes e
controle antes da ocorreriam ao longo depois da interveno
interveno do tempo mesmo que 2 = 1 apenas se a obs est no 2
no houvesse perodo e no grupo de tratamento
interveno
1 : mede o efeito da interveno

Antes (1) Depois (2) Depois-Antes


Controle (A) 0 0 + 0 0
Tratamento (B) 0 + 1 0 + 0 + 1 + 1 0 + 1
Tratamento (B) 1 1 + 1
Controle (A)

15
Diferena em diferenas com 2 grupos e 2 perodos
O estimador de Diferena em Diferenas (DiD):
O estimador do efeito da interveno ou da poltica pode ser obtido pela
estimao do modelo abaixo com MQO:
= 0 + 1 + 0 2 + +

= 1 = , , , ,

Inferncia pode ser feita diretamente ao usarmos MQO

O estimador robusto a heterocedasticidade permite varincias diferentes para


grupos ou perodos de tempo

1 : atribui ao efeito da interveno mudanas na mdia ao longo do tempo entre


o grupo de tratamento e o grupo de controle

16
Diferena em diferenas com 2 grupos e 2 perodos de tempo
O estimador de diferena em diferenas muito usado
MAS, pode apresentar alguns problemas

Efeitos de composio
Ex das notas dos aluno: talvez os municpios com turmas menores atraiam
novos estudantes
E se estes estudantes tem desempenho melhor independente da
interveno?
Podemos controlar por efeitos de composio, pelo menos parcialmente, se
incluirmos outras variveis explicativas como controles
Ex: controlar por variveis socioeconmicas dos alunos

Modelo:
= 0 + 1 + 0 2 + 1 2 + +
17
Diferena em diferenas com 2 grupos e 2 perodos de tempo

Efeitos de composio:
A principal hiptese do estimador de DiD que os dois grupos manteriam
suas tendncias ao longo do tempo, se no fosse pela mudana na poltica
(interveno)
Se temos apenas 2 perodos de tempo, no temos como verificar se esta
hiptese razovel
Ex do tamanho das turmas: e se o municpio B tivesse inicialmente pior
desempenho mdio, mas estivesse melhorando mais rpido? leva em
conta as diferenas iniciais, mas o efeito da poltica medido pelo aumento
das mdias
A nica forma de resolver este problema obter outros grupos de controle
ou dados para mais perodos de tempo
Seria bom ter dados para pelo menos 2 perodos de tempo antes da
interveno
18
Mltiplos Grupos de Controle
Podemos refinar nossa definio de grupo de tratamento e grupo de controle
para levar em conta diferenas em tendncias se no houvesse tratamento
O estimador DD mede basicamente uma diferena de tendncias entre 2
perodos de tempo
Se tivermos outro grupo que no est sujeito ao tratamento, podemos us-lo
para obter diferenas em tendncias

Exemplo: Tamanho da turma


Suponha que a reduo no tamanho das turmas foi feita apenas para o 5 ano,
mas temos dados de notas para alunos do 5 e do 4 anos
Seja uma varivel dummy que indica se o estudante do 5 ano (ano final)
Temos um novo grupo de controle: os alunos do 4 ano do mesmo municpio
Poderamos ter feito 2 diff in diffs: comparar alunos de 5 anos de municpios
diferentes ou comparar alunos de 4 e 5 anos do mesmo municpio
Ou podemos fazer as DUAS coisas ao mesmo tempo!

19
Diferena em
Mltiplos Grupos de Controle
tedncias entre
alunos do 5 e 4
Exemplo: Tamanho da turma ano para
Ou podemos fazer as DUAS coisas ao mesmo tempo! municpios com
tratamento
= 3 = ,,2 ,,1 (,,2 ,,1 )
Diferena em
,,2 ,,1 (,,2 ,,1 ) tedncias entre
alunos do 5 e 4
ano para
municpios SEM
tratamento
o estimador de diferena-em-diferena-em-diferenas!
Leva em conta diferenas em tendncias se, tirando a interveno, os alunos do
4 e 5 anos tivessem as mesmas tendncias nos dois distritos

20
Mltiplos Grupos de Controle

Podemos estimar (estimador de diferena-em-diferena-em-diferenas)


usando MQO no modelo abaixo:

= 0 + 1 + 2 + 3 + 0 2 + 1 2 + + +

Adicionar os regressores independentes pode melhorar a eficincia se eles


ajudarem a prever os resultados

21
Exemplo de Diferena em Diferenas (com 2 grupos)
Caso mais simples
Efeito de construo de um incinerador no preo das casas
Examine o efeito da localizao da casa no seu preo antes e depois do novo
incinerador de lixo ser construdo (ANLISE INGNUA: apenas com a regresso
para 1981, posterior a construo do Incinerador ):
Depois que o
= 101307.5 30688.27 incinerador foi
construdo
3 093.0 (5 827.71)

Observe a regresso para 1978: Antes do


= 82517.23 18824.37 incinerador ser
construdo
2 653.79 (4 744.59) 22
Exemplo: Efeito do incinerador no preo das casas (cont.)
No podemos concluir que o incinerador causa uma reduo to forte nos preos
apenas com o resultado da regresso aps a construo do incinerador
preciso compara com a situao antes do incinerador ser construdo:
1 = 30688.27 18824.37 = .

O incinerador diminui os preos, mas o local de construo j tinha preos menores das casas

Neste caso, isto equivalente a:


1 = 1, 1, 0, 0,

Estimador de diferena em diferenas (DiD)

23
Diferena em diferenas em uma regresso
= 0 + 0 + 1 + 1 +

Efeito de estar perto do incinerado e aps o incinerador ter sido construdo

Desta forma fcil calcular o erro padro do estimador de DiD

Se as casas vendidas antes e depois do incinerador ser construdo diferem


sistematicamente, outras variveis explicativas podem ser includas na regresso
Isto tambm reduz a varincia do erro e, consequentemente, o erro-padro

24
Diferena em diferenas em uma regresso

= 82517.23 + 18790.2981 18824.37 11863.9081
Modelo com e sem controles:
Tabela 13.2 -Preos dos imveis e Incinerador
Varivel dependente: rpreo
Varivel Independente (1) (2) (3)
constante 82.517,23 89.116,54 13.807,67
(2.726,91) (2.406,05) (11.166,59)
y81 18.790,29 21.321,04 13.928,48
(4.050,07) (3.443,63) (2.798,75)
perto -18.824,37 9.397,94 3.780,34
(4.875,32) (4.812,22) (4.453,42)
y81*perto -11.863,90 -21.920,27 -14.177,93
(7.456,65) (6.359,75) (4.987,27) Controles:
Outros controles No idade, idade Conjunto total
Observaes 321 321 321
caractersticas dos
R 0,174 0,414 0,66 imveis

Ainda, para o modelo (3), com log(preo): coeficiente de y81*perto = -0.132

Desvalorizao de 13.2% (Estatstica t = -2.53) 25


Comparaes Antes/Depois em "experimentos naturais"
DiD pode ser usado para avaliar mudanas de poltica ou outros eventos
exgenos (poltica, p.e.)
Novamente:

Grupo de Controle (no afetado pela mudana)


Grupo de Tratamento (afetado pela mudana)
So necessrios 2 perodos de dados (um anterior e outro posterior
mudana)
So usadas 2 dummies: uma para distinguir os 2 Grupos e outra para o tempo

26
Comparaes Antes/Depois em "experimentos naturais"
Faz-se uma regresso com dummies para tratamento e perodo para se obter a
diferena em diferenas:
= 0 + 1 + 2 + 3 +

A estiamtiva de 3 ser a diferena em diferenas nas mdias dos grupos

Efeito conhecido como Efeito Mdio de Tratamento

Exemplos de Experimentos Naturais ou Quase-experimentos:

Desastre ou mudana poltica


Artigo Fernanda, Raquel e Luciano publicado na PPE
Impacto da eleio do diretor sobre o desempenho do ensino fundamental da
Bahia: Grupo de tratamento: escolas estaduais; Grupo de controle: escolas
municipais (verso posterior com fast track na RAUSP) 27
O que so dados em painel?

As mesmas unidades so amostradas em dois ou mais perodos de tempo


Para cada unidade (indivduo, escola, cidade, ) temos dados em vrios
instantes de tempo

Vantagem:
com vrios anos, podemos controlar por caractersticas no observadas que no
mudam ao longo do tempo (ou que mudam vagarosamente)

Resolve alguns problemas de vis de variveis omitidas


Pode-se pensar na varivel omitida como fixa no tempo

Muito til para anlise de polticas (ou intervenes)

28
Painel Balanceado:

Um painel dito balanceado, se observamos os mesmos perodos de tempo para


todas as unidades
mais fcil obter um painel balanceado com grandes unidades
Ex: escolas, cidades, estados
Em um nvel desagregado (ex: pessoas ou famlias) seguir as mesmas
unidades ao longo do tempo pode ser difcil. Ex: pessoas que se mudam

A perda de observaes chamada de problema de atrito


Pode ser um problema grave se as pessoas desaparecem por alguma razo
relacionada ao modelo
Vamos assumir que estamos trabalhando com dados em painel
Os mtodos podem ser estendidos para painis no balanceados
ignorando problemas de atrito. MAS: sempre devemos nos perguntar
porque os dados esto faltando
29
Modelo:
Para cada unidade i no tempo t a varivel resposta :
= 0 + 1 1 + 2 2 + + + +

Fatores no observados que Outros fatores no


so constantes no tempo (= observados (= erros
efeitos fixos) idiossincrticos)

A grande mudana neste modelo est na forma de tratar os fatores no observreis


que agora so compostos de dois termos ( = + ):
Componente que no muda com o tempo:
efeito no observado ou heterogeneidade no observada
No nvel de pessoa, tambm chamado de habilidade (algo inato ao
indivduo e que no muda com o tempo)
Atributos no observados
Componente que varia com o tempo:
- tambm chamados de choques ou erros idiossincrticos
Especfico para a unidade i, mas que pode variar com o tempo 30
Anlise de dados em painel com dois perodos de tempo
Exemplo: Efeito do desemprego na taxa de criminalidade das cidades
(CRIME2)
Dados de 46 cidades em 82 e 87
Regresso apenas para 1987: n = 46; R=0.033
= . .

Quando a taxa de desemp aumenta, a taxa de criminalidade diminui

Efeito no esperado e coeficiente no significante


Problema: variveis omitidas

Alternativa: incluir controles (as vezes difceis de obter); incluir taxa de crime
para ano anterior (cap 9)
Melhor usar modelo com dados em Painel
31
Modelo:

= + + + +

i=cidades diferentes
t=tempo (2 anos)

= efeito fixo para as cidades = fatores no observveis das cidades que afetam
a taxa de criminalidade e que no variam no perodo de anlise
Ex: Localizao; Caractersticas da populao como idade, raa, educao,
comportamento das pessoas quanto ao crime, aspectos culturais; questes
histricas, etc

Questo: como estimar ?

32
Intuio do Modelo de Dados em Painel para o caso geral:
Questo: como estimar ?
Se agregarmos os 2 anos e usarmos MQO:
Teremos que assumir que o efeito fixo no observvel ( ) no correlacionado com

Como o termo de erro composto = +
Para ser estimado de forma consistente, precisaramos que: , = 0
Isto , precisaramos que:
( , ) = 0
( , ) = 0
Caso contrrio, seria viesado!
, 0 : chamado de Vis de Heterogeneidade
Felizmente, o Problema do vis de heterogeneidade pode ser corrigido se a
varivel no constante no tempo

Maioria das aplicaes e coleta de dados em painel tem o objetivo de considerar a


correlao entre e
Para o exemplo do crime:
A preocupao com a correlao entre e a taxa de desemprego
33
Diferenciando no tempo

Como remover o vis de heterogeneidade causado por ?

Isto , como estimar de forma apropriada? (Artifcio da Diferenciao)


Como constante no tempo, diferenciando os dados dos 2 anos, elimina-se
do modelo:
Modelo em t=2: 2 = 0 + 0 + 1 2 + + 2
Modelo em t=1: 1 = 0 + 1 1 + + 1

Subtraindo um perodo do outro:


2 1 = 0 + 1 (2 1 ) + (2 1 )
Defina y = 2 1 , em que = mudana. Podemos reescrever a equao acima
como:
= + +

Pode-se, agora, usar MQO diretamente


34
Diferenciando no tempo

Modelo:
= 0 + 1 +

0 a mudana no intercepto entre os dois perodos


Algumas vezes interessante estudar este efeito

Se = 0 para todos os indivduos i, ou mesmo se for constante, esta


estratgia no funciona
Precisamos de alguma variao de em .

O estimador de MQO aplicado ao modelo acima chamado de Estimador de


Primeira diferena
1 = ( )

35
Anlise de dados em painel com dois perodos de tempo
Exemplo: Efeito do desemprego na taxa de criminalidade das cidades
(CRIME2)
Dados de 46 cidades em 82 e 87. (No h identificador das cidades)
Assuma que no existem dados para outras variveis explicativas. Ser
possvel estimar o efeito causal do desemprego no crime?
SIM, se as cidades forem observadas por pelo menos dois perodos de tempo
e os outros fatores que afetam o crime fiquem aproximadamente constantes
nesses perodos:
= 0 + 0 87 + 1 + + , = 1982, 1987

Taxa de Dummy para o Fatores no observados que Outros fatores no


crimes a cada segundo perodo de so constantes no tempo (= observados (= erros
1000 pessoas tempo efeitos fixos) idiossincrticos) 36
Exemplo: Efeito do desemprego na taxa de criminalidade das cidades (cont.)
,1987 = 0 + 0 1 + 1 ,1987 + + ,1987
,1982 = 0 + 0 0 + 1 ,1982 + + ,1982
Subtraindo:
= 0 + 1 +
Comando no Stata para rodar Modelo com Dados em Painel: xtset
x = identificador da unidade; t = identificador do perodo

Neste exemplo, no h identificador de cidades, MAS os dados esto ordenados


da forma correta: cidade ano
Uma possibilidade criarmos um identificador usando a area. No tem duas
cidades com a mesma rea como pode-se verificar com tab area:
egen id = group(area)
Ou, criamos a varivel defasada (lag) ns mesmo 37
Exemplo (cont.):

= 0 + 1 +

Vamos obter o estimador de PD na mo:


(criando a varivel de variao da taxa de crime e da taxa de desemprego)

gen Dcrmrte = crmrte cremte[_n-1] if year==87 (apenas qdo crmrte for de 87 - 82)
gen Dunem = unem unem[_n-1] if year==87

Em que _n a numerao de cada observao e _n-1 n da observao anterior

Precisamos da condio if year==87


Apenas subtrai o dado de 87 pelo de 82
Se no colocar a condio: tambm faria as diferenas entre 82 (p.e., da 2 cidade,
3 obs na base) e 87 (p.e., da 1 cidade, 2 obs na base)

reg Dcrmrte Dunem


38
Exemplo: Efeito do desemprego na taxa de criminalidade das cidades (cont.)
Estime a equao diferenciada por MQO:

Dcrmrte Coef. Std. Err. t P>|t| [95% Conf. Interval]

Dunem 2.217996 .8778657 2.53 0.015 .4487745 3.987218


_cons 15.40219 4.702116 3.28 0.002 5.925702 24.87869

= 15.40 + 2.22

4.70 (0.88)
= 46, 2 = 0.127 +1 ponto percentual na taxa de
desemprego implica em 2.22
Tendncia de aumento na taxa de criminalidade das mais crimes a cada 1000
cidades: se a taxa de desemprego no mudasse, mais pessoas; efeito positivo e
15 homicdios a cada 1000 habitantes estatisticamente significante
39
Exemplo: Efeito do desemprego na taxa de criminalidade das cidades (cont.)

E se a gente tivesse usado MQO direto?

. reg crmrte unem d87

Source SS df MS Number of obs = 92


F( 2, 89) = 0.55
Model 989.717314 2 494.858657 Prob > F = 0.5788
Residual 80055.7864 89 899.503218 R-squared = 0.0122
Adj R-squared = -0.0100
Total 81045.5037 91 890.609931 Root MSE = 29.992

crmrte Coef. Std. Err. t P>|t| [95% Conf. Interval]

unem .4265461 1.188279 0.36 0.720 -1.934539 2.787631


d87 7.940413 7.975324 1.00 0.322 -7.906386 23.78721
_cons 93.42026 12.73947 7.33 0.000 68.1072 118.7333

40
Discusso sobre o estimador da primeira diferena
Outras variveis explicativas podem ser adiciondas regresso

O estimador de PD permite captar efeitos causais mesmo na presena de


endogeneidade, quando esta invariante no tempo
As estimativas de PD sero imprecisas (grande erro-padro) se as variveis
explicativas variarem muito pouco ao longo do tempo (no possvel estim-las
se elas no mudarem no tempo)
No se pode usar dummies, p.e.

Dificuldades operacionais:

Dados de pessoas que se mudam, firmas que fecham ou se fundem; mais facil para
escolas, cidades, estados, pases, etc

Organizao dos dados: mais comum observaes dos 2 anos uma abaixo da outra 41
Duas representaes possveis na base de dados
Forma tradicional (long):
Dados organizados por unidade e em seguida por tempo (em ordem
crescente)
Exemplo: gpa3
Podemos declarar ao stata que estamos com um painel: xtset id tempo
No exemplo: xtset id term

Forma (wide):
uma observao para cada unidade e as variveis diferentes para cada
instante de tempo
Exemplo: Vote2 painel de 2 anos na forma wide
Melhor coisa a fazer transformar da forma wide para a forma long
No stata usar o comando reshape , long
Ex: reshape long vote inexp chexp linexp lchexp incshr win, i(id) j(year)
42
Avaliao de Programa de Treinamento
Dummy para recebimento de verba para treinamento
Grupo de Tratamento: participa do programa aps t=1
Grupo de Controle
t= 1987 , 1988
Efeito do Programa sobre o nmero de peas defeituosas?
Modelo:
peasdef = 0 + 0 88 + 1 + +

Preocupao: correlao entre e


pode representar a habilidade mdia dos empregados, capital, habilidade
gerencial todos os fatores considerados constantes no perodo de 1 ano
Programa pode ter sido implantado em firmas com trabalhadores menos
produtivos ou o oposto (para parecer efetivo)

43
Avaliao de Programa de Treinamento
Painel com 2 perodos
Aps a Diferenciao, como 1 = 0: = 2

= 0.564 0.739
peasdef
Programa reduz o nmero de peas defeituosas
Mas, coeficiente no estatisticamente significante

Modelo usando log do nmero de peas defeituosas:



(peasdef) = 0.057 0. 317

Programa reduz taxa de defeituosos em aproximadamente 31.7%


Clculo exato de 27.2%
Efeito significante

44
Modelos avanados de Dados em Painel:
Diferenciao vista (Estimador de PD)
Estimador de Efeito Fixo (FE): remoo de ai ou Estimador Dentro ou within
Estimador de Efeito Varivel (random effect)
Teste para escolha do modelo
Para t =2:
PD e FE geram resultados idnticos
PD mais fcil de manipular os dados e fazer os testes usuais

Para t > 2: depende da aplicao


Ver Exemplo da tabela 14.2: Aplicao com dados em painel Pooled, FE, RE

FE mais usado porque mais fcil de aplicar: padro de diversos pacotes


estatsticos

Algumas aplicaes apresentam resultados para os dois tipos (Efeitos Fixos e


Variveis)
Efeito varivel usado quando se supe que ai no correlacionado com xit
45
Dados em Painel em Outras Estruturas de Dados
Ex: dados para irmos ou gmeos para controlar para caractersticas familiares
Diferenciao entre irmos

Um ltimo exemplo:
Artigo na RAC: Felipe, Renato, Luciano
Relao entre empreendedorismo e corrupo
Dados agregados, Painel com FE e RE

46
Vimos:
Benefcios quando juntamos dados de corte de vrios perodos de tempo
Se nenhum coeficiente muda ao longo do tempo: aumenta-se a amostra o
que leva estimativas mais precisas

Podemos considerar uma modelagem com efeitos de tempo, ou seja, o


resultado mdio pode variar ao longo do tempo
Isto feito com a incluso de dummies de tempo

Podemos ainda permitir que a relao entre a varivel dependente e algumas


das variveis explicativas possa mudar ao longo do tempo
Isto feito com a incluso de interaes entre dummies de tempo e
varivel explicativa

47
Dados empilhados so muito usados para a avaliao de polticas ou
intervenes, desde que tenhamos:
Pelos menos 2 grupos: tratamento e controle
Pelo menos 2 perodos de tempo: antes de depois da interveno
O impacto (efeito da interveno) pode ser obtido pelo Estimador de
Diferena em diferenas (DiD)
Pode ser rodado usando MQO diretamente com uma dummy de tempo, e
uma de grupo de tratamento e uma interao entre eles

Por fim, vimos o Modelo para Dados em Painel com uso da Diferenciao
Mesmos resultados para Painel com Efeito Fixo para 2 perodos
Alm do Modelo com Efeito Fixo, h o Modelo com Efeito Aleatrio

Outras disciplinas do PPGA de mtodos: Mtodos Quantitativos 2 e Sries


temporais (Anderson); Optativas (Raquel)
48
Wooldridge:
Livro:
Exemplos: Refazer os exemplos 13.3 (Incinerador); 13.4 (Indenizaes
Trabalhistas); 13.3 (relao entre taxa de criminalidade e desemprego) e 13.7
(leis americanas para embriaguez e fatalidades no trnsito)
Exerccios: 13.2; 13.7

Computador: 13.3; 13.5; 13.7; 13.12

Para apresentaes da prxima aula, procurar artigo relacionado ao prottipo e


indicar ideia inicial de seu prottipo

49