Você está na página 1de 16

ENDOGENEIDADE E VARIAVEIS INSTRUMENTAIS

Luis Filipe Martins*

*ISCTE-IUL, Business School, Departamento de Economia

Novembro 2020

Luis Martins ENDOGENEIDADE - Econometria II, LE page 1 of 16


ENDOGENEIDADE - Conceito, Consequencia

Exogeneidade e Endogeneidade
• (este bloco é apresentado para dados seccionais mas é facilmente
extendido para dados temporais e painel)
• Uma das hipóteses do MRLM,
0
yi = β1 + β2 xi2 + ... + βk xik + ui = xi β + ui , i = 1, ..., n, (1)
é a de exogeneidade (estrita) entre erros e regressores
E (ui |X ) = E (ui |x1 , ..., xn ) = 0, i = 1, ..., n ⇔ E (u|X ) = 0n×1 , (2)
uma condição que implica E (ui ) = 0 e, mais importante,
Cov (ui , xij ) = E (ui xij ) = 0, j = 1, ..., k, i = 1, ..., n. (3)
• Há casos em que este pressuposto não se verifica e ficamos com um
modelo com endogeneidade,
Cov (ui , xij ) = E (ui xij ) 6= 0, para algum j = 1, ..., k e i = 1, ..., n,
(4)
onde se mantém a hipótese de E (u) = 0.
Luis Martins ENDOGENEIDADE - Econometria II, LE page 2 of 16
ENDOGENEIDADE - Conceito, Consequencia

Exemplos de Endogeneidade
• (omitir regressor relevante) Estimar Sal = β1∗ + β2∗ Educ + u, onde Sal
é salário, Educ é anos de educação e u inclui a variável experiencia
que está correlacionada com Educ. O verdadeiro modelo é portanto
Sal = β1 + β2 Educ + β3 Exper + v , β3 6= 0. (5)
• (erro medida regressor) Estimar Sav = β1 + β2 Inc ∗ + u, onde Sav é
poupança e Inc ∗ é rendimento disponı́vel mas que é medido com erro:
e = Inc − Inc ∗ , E (e) = 0, V (e) = σe2 , onde Inc é o verdadeiro valor.
O verdadeiro modelo é
Sav = β1 + β2 Inc + (u − β2 e) , (6)
onde, mesmo assumindo que Cov (u, Inc) = 0 e Cov (e, Inc ∗ ) = 0,
Cov (u − β2 e, Inc) = Cov (u, Inc) + Cov (−β2 e, Inc) = −β2 σe2 6= 0.
• Em time series, modelo dinamico com erros autocorrelacionados ou
modelo com expectativas racionais: Estimar
e + β Unemgap + u.
Inft = β1 Inft+1 2 t
Luis Martins ENDOGENEIDADE - Econometria II, LE page 3 of 16
ENDOGENEIDADE - Conceito, Consequencia

Consequencia para o OLS


• Sob endogeneidade, o OLS é enviesado e inconsistente. Mais grave do
que hetero ou autocor! Logo, não se deve estimar com o OLS.
• (omitir regressor relevante) É enviesado dado que
 
E βb2∗ |Educ, Exper = β2 + β3 δb2 6= β2 , (7)
onde Exper = δ1 + δ2 Educ + w . Como Cov (Educ, Exper ) 6= 0,
tambem é inconsistente: p lim βb2∗ = β2 + β3 Cov (Educ,Exper
V (Educ)
)
6= β2
n→∞  2 
σInc ∗
• (erro medida regressor) Prova-se que p lim βb2 = β2 2 2 < β2 .
σ
n→∞ +σ Inc ∗ e
• (modelos dinamicos com erros autocorrelacionados)
Cov (yt−1 , ut ) 6= 0 porque yt−1 depende directamente de ut−1 no
modelo e ut depende de ut−1 pela sua autocorrelacao.
• (expectativas racionais) Como a expectativa da inflação para t + 1
formada em t (Inft+1 e ) não é observada, estima-se o modelo com

Inft+1 e portanto o erro do modelo incluirá o erro das expectativas,


e , o qual inclui o proprio regressor.
Inft+1 − Inft+1
Luis Martins ENDOGENEIDADE - Econometria II, LE page 4 of 16
ENDOGENEIDADE - Aplicacao

Aplicacao

• Aplicacao (ilustracao). Ver material.

Luis Martins ENDOGENEIDADE - Econometria II, LE page 5 of 16


ENDOGENEIDADE - Solucao

Variaveis Instrumentais
• As variáveis instrumentais estão associadas a um particular regressor
endogeno e definem-se por: ”z é um instrumento para x se (i) z é
exogeno em relação ao erro u, Cov (u, z) = E (uz) = 0; e (ii) z está
(fortemente) correlacionado com o regressor x, Cov (x, z) 6= 0.” Estas
duas propriedades são o garante da qualidade do estimador IV.
• Devem-se escolher instrumentos que intuitivamente satisfazem estas
duas condições mas as quais são testaveis como se vai ver depois.
• Anos de educacao do pai/mae e número de irmãos/irmãs podem ser
instrumentos para Educ. Salário pode ser instrumento para Inc ∗ .
• Por vezes não é facil obter instrumentos. Duas dicas: 1) Usar
potencias de z: z 2 , z 3 , ... e 2) Usar os X’s exogenos como
instrumentos (por exemplo, se num modelo temos X1 endogeno e X2
exogeno usar o X2 como instrumento para X1).
• Em series temporais usam-se como instrumentos para xt o seu
passado xt−l .
Luis Martins ENDOGENEIDADE - Econometria II, LE page 6 of 16
ENDOGENEIDADE - Solucao

Estimador IV no MRLS
• Na pratica, o conjunto de m ≥ k variáveis instrumentais z1 , z2 , ..., zm
são observaveis para todo o i ou t epodemos sintetizar toda essa info
z11 ... z1m
na matriz de instrumentos Zn×m =  ... ...  Num modelo
zn1 ... znm
com termo independente, o z1 pode ser uma coluna de 1’s. Agora,
alem de Y e X tambem temos Z .
• No MRLS, y = β1 + β2 x + u, Cov (u, x) = E (ux) 6= 0, para uma
amostra de dimensão n e um único instrumento para x,
Pn Pn
i=1 (zi − z) (yi − y ) (zi − z) ui
β2,IV = n
b P = β2 + n i=1
P . (8)
i=1 (zi − z) (xi − x) i=1 (zi − z) (xi − x)

Naturalmente, βb1,IV = y − βb2,IV x.


• Ao contrário do OLS, o IV não resulta de min a soma de quadrados
de erros. A sua expressão pode ser justificada por:
Cov (y , z)
Cov (y , z) = β2 Cov (x, z) + Cov (u, z) ⇔ β2 = .
Luis Martins ENDOGENEIDADE - Econometria II, LE
Cov (x, z) page 7 of 16
ENDOGENEIDADE - Solucao

IV versus OLS
• Num modelo com endogeneidade, quando a variável instrumental é
válida (cf duas condições), o estimador IV é consistente:
σu
p lim βb2,OLS = β2 + Corr (u, x) 6= β2 , (9)
n→∞ σx
Corr (u, z) σu
p lim βb2,IV = β2 + = β2 . (10)
n→∞ Corr (x, z) σx
• Sob as hipoteses de homo e nao autocorr dos erros,
qP
s n 2
σ 2 σ i=1 (zi − z)
  b b
se β2,IV =
b
2
= Pn , (11)
SSTx Rx,z i=1 (zi − z) (xi − x)
q
b2
σ 2 = 1, i.e., se x e z são
que coincide com a do OLS SST x
se Rx,z
linearmente dependentes na amostra! Na pratica, o quadrado da
correlação amostral 0 < Rx,z2 < 1.

• OLS tem menos variancia do que o IV mas é inconsistente. Quanto


melhor satisfeitas as duas propriedades do z, melhor para o IV.
Luis Martins ENDOGENEIDADE - Econometria II, LE page 8 of 16
ENDOGENEIDADE - Solucao

Estimador IV no MRLM
• No MRLM com endogeneidade e matriz de instrumentos Zn×m ,
0
yi = xi β + ui , i = 1, ..., n, ⇔ y = X β + u, uma condição necessária é
que m ≥ k.
• Para m = k (modelo exactamente identificado) e Z 0 X invertivel,
 0 −1 0  0 −1 0
βbIV = Z X Z y =β+ Z X Z u (12)

e, sob V (u|Z ) = σ 2 In , tem como matriz de variâncias-covariâncias,


 0 −1  0   0 −1
b k×k = V βb\
 
Σ IV |X , Z = σb2 Z X Z Z X Z (13)
1 n
b2 = n−k 2 .
P
onde σ i=1 u bi,IV
• Em regra, o modelo é sobre-identificado (m ≥ k):

0
 0 −1 0 −1 0  0 −1 0
βIV =
b X Z Z Z Z X X Z Z Z Z y; (14)

0
  0 −1  0 −1
Σ b2
b = σ X Z Z Z Z X . (15)
Luis Martins ENDOGENEIDADE - Econometria II, LE page 9 of 16
ENDOGENEIDADE - Solucao

Estimador IV como 2SLS

• O estimador IV cuja formula está nos slides anteriores, tambem é


denominado por 2SLS (two-stage LS) porque na verdade resulta da
aplicação do usual OLS em dois modelos sucessivos.
• Num primeiro passo, estima-se consistentemente por OLS o modelo
de X em Z (v satisfaz as hipóteses standard) X = Z π + v , do qual
 0 −1 0  0 −1 0
b= Z Z
resulta o OLS π Z X e Xb = Z π b=Z Z Z Z X.
• No segundo passo, estima-se consistentemente por OLS o modelo
principal mas onde para remover a endogeneidade temos Xb do
primeiro passo em vez de X , y = Xb β + w . O estimador OLS
 0 −1 0
resultante para β coincide com o IV: βb = Xb Xb Xb y .
• No entanto, os se 0 s para o 2SLS não são os mesmos que do IV (11) .

Luis Martins ENDOGENEIDADE - Econometria II, LE page 10 of 16


ENDOGENEIDADE - Aplicacao

Aplicacao

• Aplicacao (ilustracao). Ver material.

Luis Martins ENDOGENEIDADE - Econometria II, LE page 11 of 16


ENDOGENEIDADE - Testes

Testar Validade dos Instrumentos


• O teste á hipotese Gauss Markov de exogeneidade (teste de
Hausman) resulta da comparação entre os estimadores OLS e IV. Por
isso, antes desse teste temos de confirmar que os instrumentos que
usamos no IV são validos.
• Cov (x, z) 6= 0? Voltar ao primeiro passo do 2SLS e testar (t/F)
significancia dos Z’s. No modelo X = Z π + v , a hipotese nula é
H0 : π = 0 e a alternativa H1 : π 6= 0.
• Para cada x ”suspeito” de ser endogeno, estimar por OLS
x = π0 + π1 z1 + π2 z2 + ... + πm zm + v . Para zi ser valido H1 : πi 6= 0.
• Cov (u, z) = E (uz) = 0? Não vamos ver os melhores testes de
identificacao. Uma alternativa simples é: i) Usar um instrumento que
se suponha valido z1 e com isso estimar o modelo com βbIV e extrair
os residuos IV, ubIV . ii) No modelo uc IV = δ1 + δ2 z2 + ... + δm zm + e,
testar por OLS H0 : δi = 0 contra H1 : δi 6= 0. Em alternativa
pode-se testar um unico z ou uma parte dos m − 1. Sob H0 temos
Cov (u, zi ) = E (uzi ) = 0. iii) Repetir (i) e (ii) tentando alternativas
Luis Martins z’s validos para se inferir
de sobre todos
ENDOGENEIDADE os instrumentos
- Econometria II, LE disponiveis.
page 12 of 16
ENDOGENEIDADE - Testes

Testar Exogeneidade (hipotese G.M.)


• Cov (u, x) = E (ux) = 0? Sob H0 temos exogeneidade e usa-se o OLS
e sob H1 endogeneidade e o IV (com instrumentos validos).
• Teste de Hausman compara dois estimadores: Um que apenas sob H0
é consistente e eficiente (o OLS) e o outro que é consistente sob
ambas H0, H1 (o IV).
• A fórmula da estatı́stica de Hausman é dada por
 0  \   \
 −1  
d
H = βIV − βOLS
b b V βIV − V βOLS
b b βbIV − βbOLS → χ2k ,
(16)
• Para testar se um particular regressor (p.e. x2 ) não é endógeno,
2
(βb2,IV −βb2,OLS ) d
\ \
→ χ21 . O teste é unilateral á direita.
V (β2,IV )−V (β2,OLS )
b b
• Alternativa ao teste de Hausman para as mesmas hipoteses: Teste t
0
ao δ no modelo yi = xi β + δ vbi + ui , onde vb são os resı́duos do
primeiro passo (slide anterior).
Luis Martins ENDOGENEIDADE - Econometria II, LE page 13 of 16
ENDOGENEIDADE - Aplicacao

Aplicacao

• Aplicacao (ilustracao). Ver material.

Luis Martins ENDOGENEIDADE - Econometria II, LE page 14 of 16


ENDOGENEIDADE - Exercicios

Exercicios

• Exercicios (testes anteriores). Ver material.

Luis Martins ENDOGENEIDADE - Econometria II, LE page 15 of 16


ENDOGENEIDADE - Demonstracoes

Demonstracoes

• Demonstracoes (aspectos mais tcnicos). Ver material.

Luis Martins ENDOGENEIDADE - Econometria II, LE page 16 of 16

Você também pode gostar