Você está na página 1de 33

Microeconometria

Aula 14 – Dados em painel (parte III)

Prof. Gilberto Boaretto

Ibmec/RJ
Conteúdo

Estimação por efeitos fixos


Hipóteses para estimação por efeitos fixos
Efeitos fixos versus primeiras diferenças
Exemplo

Estimação por PD e EF no R

Extra: Estimação por efeitos aleatórios


Hipóteses para estimação por efeitos aleatórios
Efeitos fixos ou efeitos aleaórios?

Extra: Correlação serial


Bibliografia

Wooldridge, J. M. (2017). Introdução à Econometria: uma abordagem


moderna. 6a edição. Cengage Learning – Caps. 13 e 14.

Stock, J. H., and M. M. Watson (2012). Introduction to Econometrics.


3a edição. Pearson – Cap. 10.
Estimação por efeitos fixos
▶ Um método de estimação alternativo ao de primeiras diferenças é o de
efeitos fixos.
▶ Considere o modelo original

Yit = β1 Xit + ai + Uit , t = 1, 2, . . . , T (1)

▶ Para cada i, calculamos a média da equação (1) ao longo do tempo:

Y i = β1 X i + ai + U i (2)
T
1X
onde Y i = Yit . Fazemos o mesmo para Xit e Uit .
T t=1
▶ Como ai é fixo ao longo do tempo, aparece em ambas as equações.
▶ Subtraindo (2) de (1), temos
 
Yit − Y i = β1 Xit − X i + Uit − U i , t = 1, 2, . . . , T. (3)

▶ Note que o efeito fixo é eliminado quando subtraimos (2) de (1).


0 / 27
Estimação por efeitos fixos
▶ Que pode ser escrito como

Ÿit = β1 Ẍit + Üit , t = 1, 2, . . . , T (4)

▶ Essa transformação de efeito fixo também é chamada intragrupo.

▶ Podemos usar MQO agrupados na regressão (4) para estimar β1 . Esse é


o método de estimação por efeitos fixos ou intragrupo.

▶ Esse método explora a variação temporal em Y e X dentro de cada


observação do corte transversal.

▶ No caso mais geral,

Ÿit = β1 Ẍit1 + β2 Ẍit2 + · · · + βk Ẍitk + Üit , t = 1, 2, . . . , T.

▶ Sob a hipótese de exogeneidade estrita das variáveis explicativas, o


estimador de efeitos fixos é não-viesado.
1 / 27
Estimação por efeitos fixos
▶ Note que não há intercepto, que é automaticamente eliminado na
transformação por EF.

▶ O estimador de efeitos fixos leva em conta uma correlação arbitrária


entre ai e as variáveis explicativas em qualquer perı́odo de tempo, como
na primeira diferença.

▶ Portanto, qualquer variável explicativa que seja constante ao longo do


tempo para todo i é removida pela transformação de efeitos fixos:
Ẍit = 0 para todo i e t se Xit for constante ao longo de t.

▶ Graus de liberdade: há N T observações; perdemos k graus de


liberdade, pois estimamos k parâmetros; adicionalmente, também
perdemos um grau de liberdade para cada observação i devido à
centralização na média.

• Portanto, há N T − N − k = N (T − 1) − k graus de liberdade.


• É necessário corrigir os erros-padrão e as estatı́sticas de teste.
2 / 27
Estimação por efeitos fixos
▶ O R2 é interpretado como o montante da variação temporal em Yit que
é explicada pela variação temporal nas variáveis explicativas.

▶ Variáveis explicativas constantes no tempo podem ser incluı́das na


regressão através da interação com variáveis que mudam no tempo, ou
por exemplo, com dummies anuais.

• Retorno educacional. Podemos incluir educação no modelo através de


uma interação com uma dummy de ano. Assim, podemos entender como
o retorno educacional mudou ao longo dos anos. Porém, não podemos
obter o retorno educacional do perı́odo base (o perı́odo base é omitido).
Somente avaliamos como o retorno educacional se alterou em relação ao
perı́odo base.

▶ Podemos estimar os efeitos fixos dos indivı́duos usando uma regressão


com dummies, ou seja, incluindo N dummies de indivı́duos na regressão
(1) e aplicando MQO. Essas dummies se tornam interceptos especı́ficos
dos indivı́duos. É necessário T suficientemente grande e N
relativamente pequeno.
3 / 27
Hipóteses para estimação por efeitos fixos

Hipótese de Efeitos Fixos 1 (HEF.1): Para cada i, o modelo é

Yit = β1 Xit1 + β2 Xit2 + · · · + βk Xitk + ai + Uit , t = 1, 2, . . . , T.

em que βj são os parâmetros a serem estimados e ai os efeitos não


observados.

Hipótese de Efeitos Fixos 2 (HEF.2): Temos uma amostra


aleatória na dimensão do corte transversal.

Hipótese de Efeitos Fixos 3 (HEF.3): Cada variável explicativa


muda ao longo do tempo (para ao menos algum i), e não há relações
lineares perfeitas entre as variáveis explicativas.

4 / 27
Hipóteses para estimação por efeitos fixos

Hipótese de Efeitos Fixos 4 (HEF.4): Para cada t, o valor


esperado do erro idiosincrático, dada as variáveis explicativas em todos
os perı́odos de tempo e o efeito não observado, é zero:

E (Uit | Xi1j , Xi2j , . . . , Xitj , Xi,t+1,j , . . . , XiT j , ai ) = 0.

As hipóteses HEF.1–HEF.4 são idênticas às do modelo de primeiras


diferenças. Sob essas hipóteses, o estimador de EF é não viesado. Também é
consistente se para um T fixo, N → ∞.

Hipótese de Efeitos Fixos 5 (HEF.5):


2
Var (Uit | Xi1j , Xi2j , . . . , Xitj , Xi,t+1,j , . . . , XiT j , ai ) = σU para todo
t = 1, 2, . . . , T .

5 / 27
Hipóteses para a estimação por efeitos fixos
Hipótese de Efeitos Fixos 6 (HEF.6): Para todo t ̸= s, os erros
idiosincráticos são não correlacionados (condicionais a todas as variáveis
explicativas e a ai :

Cov (Uit , Uis | Xi1j , Xi2j , . . . , Xitj , Xi,t+1,j , . . . , XiT j , ai ) = 0.

Sob HEF.1–HEF.6, o estimador de efeitos fixos é o melhor estimador linear


não viesado. Como o estimador de primeiras diferenças é linear e não
viesado, ele é, necessariamente, pior que o estimador de EF pois possui maior
variância. A hipótese que o torna pior do que o estimador de EF é a HEF.6,
que implica que os erros são não correlacionados. No caso do estimador de
PD, tinhamos que exigir que a primeira diferença era não correlacionada.

Hipótese de Efeitos Fixos 7 (HEF.7): Condicional a


(Xi1j , Xi2j , . . . , Xitj , Xi,t+1,j , . . . , XiT j , ai ),
 os Uit ’s são independentes e
2
identicamente distribuı́dos como N 0, σU .

6 / 27
Efeitos fixos versus primeiras diferenças

▶ Quando T = 2, ambas as estimativas são idênticas. O método de PD é


mais simples de ser implementado.

▶ Quando T ≥ 3, os estimadores não são os mesmos. Ambos são não


viesados e consistentes sob as hipóteses HEF.1–HEF.4 quando T é fixo e
N → ∞.

• Se Uit são serialmente não correlacionados, os estimadores de EF são


mais eficientes do que os de PD.

• Em muitos casos, não podemos assumir que os fatores não observados


que se alteram no tempo sejam serialmente não correlacionados. Se Uit
seguir um passeio aleatório, há uma correlação serial bastante
significativa e positiva, então a ∆Uit será não correlacionada. Neste caso,
a estimação por PD é melhor.

7 / 27
Estimação por efeitos fixos – Exemplo

▶ Vamos analisar o efeitos que leis que proı́bem o consumo de bebida


alcoólica ao dirigir têm sobre o número de mortes.

▶ Aproximadamente 40.000 mortes por ano no trânsito nos EUA.

▶ 1/3 das fatalidades no trânsito envolvem o consumo de bebida alcoolica


ao dirigir.

▶ 25% dos motoristas que andam entre 1h e 3h da manhã dirigem sob o


efeito de bebida alcoólica (estimativas).

▶ Um motorista sob o efeito de bebida alcoólica tem 13 vezes mais


chances de causar um acidente fatal.

8 / 27
Estimação por efeitos fixos – Exemplo

▶ Vamos analisar os efeitos de aplicações de leis sobre o consumo de


bebida alcoólica.

• Punição é mandatória para quem dirige sob o efeito do álcool?

• Existe uma idade mı́nima para o consumo de álcool?

• Imposto sobre o consumo de bebida alcoólica?

▶ Dados de painel dos EUA:

• N = 48 estados,

• T = 7 anos (1982–1988).

9 / 27
Estimação por efeitos fixos – Exemplo
▶ Por que o uso dos métodos de estimação para dados em painel pode nos
ajudar?

▶ Há um potencial viés de variável omitida de variáveis que variam entre


os estados mas são constantes no tempo.

• Uso de efeitos fixos de estado pode nos ajudar.

– Cultura sobre beber e dirigir.

– Qualidade das estradas e ruas.

▶ Há um potencial viés de variável omitida de variáveis que variam no


tempo mas são constantes entre os estados.

• Uso de efeito fixo de tempo pode nos ajudar.

– Melhora na segurança dos carros.

– Mudança nacional nas atitudes em relação ao fato de dirigir alcoolizado


(Lei Seca).
10 / 27
Estimação por efeitos fixos – Exemplo

11 / 27
Estimação por efeitos fixos – Exemplo

▶ Principais resultados:

• O sinal do coeficiente associado ao imposto sobre o consumo de bebida


alcoólica muda quando efeitos fixos de estados são incluı́dos.

• Efeitos fixos de tempo são estatisticamente significante (teste F) mas não


tem muito impacto sobre os coeficientes estimados.

• O efeito do imposto sobre bebida alcoólica diminui quando outras leis


são incluı́das como regressores.

• A única variável de polı́tica pública que parece ter efeito sobre a redução
de mortes no trânsito é o imposto sobre o consumo de bebida alcoólica.

12 / 27
Estimação por PD e EF no R

▶ Consultar script

R/aula13 - estimação painel no R.R

no Dropbox da disciplina.

13 / 27
Extra: Estimação por efeitos aleatórios

Não cai na prova!!


Estimação por efeitos aleatórios

▶ Considere o modelo (1) com a inclusão de um intercepto:

Yit = β0 + β1 Xit + ai + Uit , t = 1, 2, . . . , T.

▶ A inclusão do intercepto deve-se ao fato de podermos assumir que


E (ai ) = 0.

▶ Suponha que entendemos que ai seja não correlacionado com a variável


explicativa em todos os perı́odos de tempo.

▶ Neste caso, o uso de uma transformação para eliminar o efeito fixo não
observado resultará em estimadores ineficientes.

14 / 27
Hipóteses para estimação por efeitos aleatórios
As hipóteses do modelo de efeitos aleatórios são: HEF.1, HEF.2, HEF.5 e
HEF.6. As hipóteses HEF.3 e HEF.4 são alteradas para:

Hipótese de Efeitos Aleatórios 3 (HEA.3): Não há relações


lineares perfeitas entre as variáveis explicativas. Não é mais necessário
eliminar variáveis explicativas constantes no tempo pois somente
subtrairemos uma fração das médias temporais.

Hipótese de Efeitos Aleatórios 4 (HEA.4): Para cada t, o valor


esperado do erro idiosincrático, dada as variáveis explicativas em todos
os perı́odos de tempo e o efeito não observado, é zero:

E (Uit | Xi1j , Xi2j , . . . , Xitj , Xi,t+1,j , . . . , XiT j , ai ) = 0.

Adicionalmente, o valor esperado de ai , dadas todas as variáveis


explicativas, é constante:

E (ai | Xi1j , Xi2j , . . . , Xitj , Xi,t+1,j , . . . , XiT j ) = 0.

15 / 27
Hipóteses para estimação por efeitos aleatórios
A hipótese HEF.5 também deve incluir um termo adicional:

Hipótese de Efeitos Aleatórios 5 (HEA.5):


2
Var (Uit | Xi1j , Xi2j , . . . , Xitj , Xi,t+1,j , . . . , XiT j , ai ) = σU

para todo t = 1, 2, . . . , T . Adicionalmente, a variância de ai , dadas


todas as variáveis explicativas, é constante:

Var (ai | Xi1j , Xi2j , . . . , Xitj , Xi,t+1,j , . . . , XiT j ) = σa2 .

▶ Note que se as hipóteses do modelo de efeitos aleatórios forem válidas,


nem precisarı́amos usar os dados de painel. As informações de um corte
transversal seriam suficientes para a estimação.
• Não faz sentido perder as informações ao longo do tempo.

▶ Também poderı́amos usar o MQO agrupado considerando dummies


temporais. Mas ignorarı́amos uma caracterı́stica importante: o ai
pertence ao erro gerando uma correlação serial ao longo do tempo.
16 / 27
Estimação por efeitos aleatórios
▶ Considere o modelo

Yit = β0 + β1 Xit1 + · · · + βk Xitk + Vit , t = 1, 2, . . . , T (5)

em que Vit = ai + Uit é o erro composto.

▶ Também podemos adicionar dummies temporais.

▶ Dada a persistência de ai ao longo do tempo, os Vit ’s são serialmente


correlacionados ao longo do tempo.

σa2
Corr (Vit , Vis ) = 2 , ∀t ̸= s
σa2 + σU

▶ Neste caso, erros-padrão e estatı́sticas de teste usuais não são


válidos.

17 / 27
Estimação por efeitos aleatórios
▶ Podemos resolver aplicando o método de mı́nimo quadrados
ponderados (MQG).

▶ Para isso, N deve ser grande e T relativamente pequeno.

▶ Procedimento: defina
 2
1/2
σU
λ=1− 2 .
σU + T σa2

Note que 0 ≤ λ ≤ 1.

▶ Vamos transformar o modelo original (5) subtraindo uma fração λ das


médias temporais das variáveis:
 
Yit − λY i = β0 (1 − λ) + β1 Xit1 − λX i1 +
 
· · · + βk Xitk − λX ik + Vit − λV i (6)

18 / 27
Estimação por efeitos aleatórios

▶ O método de estimação de efeitos aleatórios, portanto, retira uma


fração da média temporal de forma a corrigir o problema da correlação
serial ao longo do tempo.

▶ O estimador de MQG acima é simplesmente o estimador de MQO


agrupado da equação (6).


▶ Não é óbvio que os erros Vit − λV i serão serialmente não
correlacionados, mas eles são.

▶ Agora podemos incluir variáveis constantes no tempo. Essa é uma


vantagem da estimação por EA em relação às estimações por EF e PD.

19 / 27
Estimação por efeitos aleatórios

▶ O parâmetro λ não é conhecido, mas pode ser estimado:


 1/2
b =1− 1
λ σ̂ 2
 .
1 + T σ̂2a
U

ba2 e σ
em que σ bU2
são estimadores consistentes para σa2 e σU
2
.

▶ Eles podem ser baseados nos resı́duos da estimação por EF ou MQO


agrupado Vbit , em que
Pn PT −1 PT
s=t+1 Vit Vis
b b
i=1 t=1
ba2
σ = N T (T −1)
2 − (k + 1)
2
σ
bU bV2 − σ
=σ ba2

20 / 27
Estimação por efeitos aleatórios

▶ O estimador de MQG factı́vel, em que λ é estimado, é também


chamado de estimador de efeitos aleatórios.

▶ Consistente sob a hipótese de não correlação entre ai e Xitj , sendo T é


fixo e N → ∞.

▶ Note que se λ ≈ 0, temos estimativas próximas às de MQO agrupados.


Já se λ ≈ 1, temos estimativas próximas às de EF.

▶ O segundo caso é mais comum por σa2 ser geralmente grande.

b → 1 e isso faz com que EA e EF sejam


▶ Conforme T fica maior, λ
semelhantes.

21 / 27
Estimação por efeitos aleatórios
▶ Note que
Vit − λV i = (1 − λ) ai + Uit − λU i ,
ou seja, os erros na equação transformada, estimada por efeitos
aleatórios, ponderam o efeito não observado constante no tempo pelo
fator (1 − λ).

▶ Portanto, embora haja uma pequena correlação entre ai e alguma das


variáveis explicativas, causando inconsistência, essa correlação é
atenuada pelo fator (1 − λ).

▶ Quando λ → 1, o termo do viés se aproxima de zero porque o estimador


de EA se aproxima do estimador de EF.

▶ Mesmo se não houver correlação, os erros-padrão das estimativas de


MQO agrupado e dos testes estatı́sticos serão inválidos por ignorar a
correlação serial ao longo do tempo.

22 / 27
Efeitos fixos ou efeitos aleaórios

▶ Sabemos que na estimação por efeitos aleatórios, removemos uma fração


da média da variável no tempo.

▶ Quando λ se aproxima de 1, as estimativas de EF e EA tendem a serem


iguais, dado que

(i) T → ∞; ou

σa2
(ii) 2
→ ∞.
σU

▶ Portanto, se (i) ou (ii) forem válidos, não importa se tratamos ai como


EF ou EA.

23 / 27
EF e EA: vantagens e desvantagens
▶ Estimação por efeitos fixos (EF):
• Vantagem: não é necessário assumir independência entre o efeito
individual fixo no tempo e os regressores.
• Desvantagem: não permite a estimação do efeito de variáveis
observadas fixas no tempo.

▶ Estimação por efeitos aleatórios (EA):


• Vantagem: o número de parâmetros a ser estimado é fixo, portanto
eficiente.
• Desvantagem: hipótese muito forte sobre independência entre os
efeitos individuais fixos no tempo e os regressores.

▶ Portanto, a escolha entre EF e EA deve se basear na hipótese de


independência entre os efeitos individuais fixos no tempo e os
regressores:
• ai ⊥ X it =⇒ EA é eficiente.
• ai ̸⊥ X it =⇒ EA é inconsistente.
24 / 27
EF e EA: qual devemos escolher?

▶ Podemos testar essa hipótese de independência:

• H0 : ai ⊥ X it =⇒ EF e EA são consistentes, EA é eficiente.

• H1 : ai ̸⊥ X it =⇒ EF é consistente e EA é inconsistente.

β
b
EA β
b
EF

H0 consistente & eficiente consistente & ineficiente


H1 inconsistente consistente

b −β P
▶ Sob H0 , β EF → 0.
b
EA

P
b −β
▶ Sob H1 , β EF ̸→ 0.
b
EA

25 / 27
Efeitos fixos ou efeitos aleaórios

▶ βbEA consistente e eficiente sob H0 , inconsistente sob H1 .

▶ β
b
EF consistente sob H0 e H1 .

′ h i−1  d
βbEF − βbEA −→ χ2k

H = N βbEF − βbEA Var(βbEF − Var(βbEA )

▶ Lembre-se do resultado de Hausman:


   
Var βbEF − βbEA = Var βbEF − Var βbEA

26 / 27
Extra: Correlação serial

Não cai na prova!!


Correlação serial
▶ Suponha um modelo do tipo:

Yit = β1 Yit−1 + ci + Uit


| {z }
= Vit

▶ Precisamos que Cov (Yit−1 , ci ) = 0. Veja que

Yit−1 = β1 Yit−2 + ci + Uit−1

ou seja,

Cov (Yit−1 , ci ) = Cov (β1 Yi,t−2 + ci + Ui,t−1 , ci )


= β1 Cov (Yi,t−2 , ci ) + Cov (ci , ci ) + Cov (Ui,t−1 , ci )
= (· · · ) + σc2 + 0

▶ Portanto, ci é necessariamente correlacionado com Yi,t−1 . Essa hipótese


de que Cov (ci , Xit ) = 0 pode ser muito forte em alguns casos.
Voltar

27 / 27

Você também pode gostar