Você está na página 1de 141

Métodos Quantitativos II

Aula 7 - Endogeneidade e Variável Instrumental


[Capítulo 12 - Hansen (2019,2020)]

Prof. Flávia Chein


(PPG Economia - UFJF)

April 20, 2021

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 1 / 59


Endogeneidade e Variável Instrumental
1 Introdução

2 Visão Geral
3 Exemplos

4 Variável Instrumental
Forma Reduzida
Identificação
Estimador de Variáveis Instrumentais
Estimador de Wald
Estimador de Mínimos Quadrados em Dois Estágios

5 Local Average Treatment Effects

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 2 / 59


Endogeneidade e Variável Instrumental
1 Introdução

2 Visão Geral
3 Exemplos

4 Variável Instrumental
Forma Reduzida
Identificação
Estimador de Variáveis Instrumentais
Estimador de Wald
Estimador de Mínimos Quadrados em Dois Estágios

5 Local Average Treatment Effects

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 3 / 59


Introdução

Conceitos de endogeneidade e variável instrumental são fundamentais


para a econometria

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 4 / 59


Introdução

Conceitos de endogeneidade e variável instrumental são fundamentais


para a econometria
marca um afastamento substancial de outros ramos das estatísticas

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 4 / 59


Introdução

Conceitos de endogeneidade e variável instrumental são fundamentais


para a econometria
marca um afastamento substancial de outros ramos das estatísticas
As idéias de endogeneidade surgem naturalmente na economia de
modelos de equações simultâneas, mais notavelmente o modelo
clássico de oferta / demanda de determinação de preços

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 4 / 59


Introdução

Conceitos de endogeneidade e variável instrumental são fundamentais


para a econometria
marca um afastamento substancial de outros ramos das estatísticas
As idéias de endogeneidade surgem naturalmente na economia de
modelos de equações simultâneas, mais notavelmente o modelo
clássico de oferta / demanda de determinação de preços
O problema de identificação em equações simultâneas remonta a Philip
Wright (1915) e Working (1927).

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 4 / 59


Introdução

Conceitos de endogeneidade e variável instrumental são fundamentais


para a econometria
marca um afastamento substancial de outros ramos das estatísticas
As idéias de endogeneidade surgem naturalmente na economia de
modelos de equações simultâneas, mais notavelmente o modelo
clássico de oferta / demanda de determinação de preços
O problema de identificação em equações simultâneas remonta a Philip
Wright (1915) e Working (1927).
O método de variáveis instrumentais aparece pela primeira vez em um
apêndice de um livro de 1928 por Philip Wright, embora a autoria às
vezes seja creditada a seu filho Sewell Wright

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 4 / 59


Introdução

Conceitos de endogeneidade e variável instrumental são fundamentais


para a econometria
marca um afastamento substancial de outros ramos das estatísticas
As idéias de endogeneidade surgem naturalmente na economia de
modelos de equações simultâneas, mais notavelmente o modelo
clássico de oferta / demanda de determinação de preços
O problema de identificação em equações simultâneas remonta a Philip
Wright (1915) e Working (1927).
O método de variáveis instrumentais aparece pela primeira vez em um
apêndice de um livro de 1928 por Philip Wright, embora a autoria às
vezes seja creditada a seu filho Sewell Wright
. O rótulo “variáveis instrumentais” foi introduzido por Reiersøl
(1945). Uma excelente revisão da história das variáveis instrumentais e
sua controvérsia é Stock e Trebbi (2003).

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 4 / 59


Endogeneidade e Variável Instrumental
1 Introdução

2 Visão Geral
3 Exemplos

4 Variável Instrumental
Forma Reduzida
Identificação
Estimador de Variáveis Instrumentais
Estimador de Wald
Estimador de Mínimos Quadrados em Dois Estágios

5 Local Average Treatment Effects

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 5 / 59


Visão Geral

Dizemos que há endogeneidade no modelo de regressão linear

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 6 / 59


Visão Geral

Dizemos que há endogeneidade no modelo de regressão linear

y = X 0β + e
(1)

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 6 / 59


Visão Geral

Dizemos que há endogeneidade no modelo de regressão linear

y = X 0β + e
(1)
se β é o parâmetro de interesse e

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 6 / 59


Visão Geral

Dizemos que há endogeneidade no modelo de regressão linear

y = X 0β + e
(1)
se β é o parâmetro de interesse e

E [Xe] 6= 0
(2)

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 6 / 59


Visão Geral

Esse é um problema central na econometria e é o que a diferencia em


relação à estatística. Para distinguir (1) do modelo de regressão e
projeção, vamos chamar (1) de equação estrutural e β de parâmetro
estrutural

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 7 / 59


Overview
Visão Geral
say that there is endogeneity in the linear model

y = X 0Ø + e
Esse é um problema central na econometria e é o que a diferencia em
e parameter of interest
relação and Para distinguir (1) do modelo de regressão e
à estatística.
[X e] 6= 0.estrutural e β de parâmetro
projeção, vamos chamar (1) deEequação
estrutural
core problem in econometrics and largely differentiates the field from statistics.
om the regression and dizemos
Se (2) ocorre, projection quemodels, we will call
X é endógeno a β.(12.1) a structural não
Endogeneidade equation
rameter. When (12.2) holds, it is typical to say that X is endogenous for Ø.
pode ocorrer se o coeficiente é definido pela projeção linear. De fato,
ogeneitypodemos
cannot happen
definir oif coeficiente
the coefficient is defined
de projeção by linear projection. Indeed,
linear
£ §°1
E [XX 0 ]−1 E
β ∗ = coefficient
ar projection ا[XY X0
= E] eX equação Y ]projeção
E [Xde and linear projection equation
linear
Y = X 0 ا + e §
£ §
E X e § = 0.

r, under endogeneity (12.2) the projection coefficient ا does not equal the structu

° £ §¢
0 °1
Prof. Flávia Chein (PPG Economia - UFJF)
ا = E X X
MQ II
E [X Y ] April 20, 2021 7 / 59
r projection coefficient Ø = E X X E [X Y ] and linear projection equation
Visão Geral Y = X 0 ا + e §
£ §
E X e § = 0.

, under endogeneity (12.2) the projection


Se houver endogeneidade, coefficient
o parâmetro ا does
estrural notdiferente
β será equal thedo
structu
coeficiente de projeção linear
° £ §¢°1
ا = E X X 0 E [X Y ]
° £ §¢
0 °1
£ ° ¢§
= E XX E X X 0Ø + e
° £ §¢°1
= Ø+ E X X0 E [X e] 6= Ø

337

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 8 / 59


r projection coefficient Ø = E X X E [X Y ] and linear projection equation
Visão Geral Y = X 0 ا + e §
£ §
E X e § = 0.

, under endogeneity (12.2) the projection


Se houver endogeneidade, coefficient
o parâmetro ا does
estrural notdiferente
β será equal thedo
structu
coeficiente de projeção linear
° £ §¢°1
ا = E X X 0 E [X Y ]
° £ §¢
0 °1
£ ° ¢§
= E XX
R 12. INSTRUMENTAL VARIABLES E X X 0Ø + e
° £ §¢°1
= Ø+ E X X0 E [X e] 6= Ø
relation since E [X e] 6= 0.
endogeneity requires that
A endogeneidade the coefficient
implica be defined
que o estimador
337 differently
de mínimos than projection
quadrados é
as structural.para
nitions inconsistente We will present three
o parâmetro examples
estrutural. Nainverdade,
the following section.
sob i.i.d.
geneityamostragem,
implies that mínimos
the least quadrados
squares estimator is inconsistent
é consistente for the structur
para o coeficiente de
under i.i.d. sampling,
projeção least squares
e, portanto, is consistent
é consistente paraforβ the projection coefficient, and
r Ø.
° £ §¢°1
Øb °! E X X 0 E [X Y ] = ا 6= Ø.
p

nsistency of least squares is typically referred to as endogeneity bias or estimatio


eity. (This is an imperfect label as the actual issue is inconsistency, not bias.)
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 8 / 59
Visão Geral

A inconsistência dos mínimos quadrados é normalmente referida como


viés de endogeneidade ou viés de estimativa devido à endogeneidade.
(Este é um rótulo imperfeito, pois o problema real é inconsistência,
não viés.)

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 9 / 59


Visão Geral

A inconsistência dos mínimos quadrados é normalmente referida como


viés de endogeneidade ou viés de estimativa devido à endogeneidade.
(Este é um rótulo imperfeito, pois o problema real é inconsistência,
não viés.)
Como o parâmetro estrutural β é o parâmetro de interesse, a
endogeneidade requer o desenvolvimento de métodos de estimação
alternativos.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 9 / 59


Endogeneidade e Variável Instrumental
1 Introdução

2 Visão Geral
3 Exemplos

4 Variável Instrumental
Forma Reduzida
Identificação
Estimador de Variáveis Instrumentais
Estimador de Wald
Estimador de Mínimos Quadrados em Dois Estágios

5 Local Average Treatment Effects

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 10 / 59


Exemplo Erro de Medida do Regressor

Suponha que (Y , Z ) variáveis aleatórias conjuntas, E [Y |Z ] = Z 0β é


linear, β é o parâmetro estrutural e Z não é observado.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 11 / 59


Exemplo Erro de Medida do Regressor

Suponha que (Y , Z ) variáveis aleatórias conjuntas, E [Y |Z ] = Z 0β é


linear, β é o parâmetro estrutural e Z não é observado.
Em vez disso, observamos X = Z + u onde u é um erro de medição
k × 1, independente de e e Z .

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 11 / 59


Exemplo Erro de Medida do Regressor

Suponha que (Y , Z ) variáveis aleatórias conjuntas, E [Y |Z ] = Z 0β é


linear, β é o parâmetro estrutural e Z não é observado.
Em vez disso, observamos X = Z + u onde u é um erro de medição
k × 1, independente de e e Z .
Este é um exemplo de modelo de variável latente, em que “latente” se
refere a uma variável estrutural que não é observada.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 11 / 59


Exemplo Erro de Medida do Regressor

Suponha que (Y , Z ) variáveis aleatórias conjuntas, E [Y |Z ] = Z 0β é


linear, β é o parâmetro estrutural e Z não é observado.
Em vez disso, observamos X = Z + u onde u é um erro de medição
k × 1, independente de e e Z .
Este é um exemplo de modelo de variável latente, em que “latente” se
refere a uma variável estrutural que não é observada.
O modelo X = Z + u com Z e u independentes e E [u] = 0 é
conhecido como erro de medição clássico.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 11 / 59


Exemplo Erro de Medida do Regressor

Suponha que (Y , Z ) variáveis aleatórias conjuntas, E [Y |Z ] = Z 0β é


linear, β é o parâmetro estrutural e Z não é observado.
Em vez disso, observamos X = Z + u onde u é um erro de medição
k × 1, independente de e e Z .
Este é um exemplo de modelo de variável latente, em que “latente” se
refere a uma variável estrutural que não é observada.
O modelo X = Z + u com Z e u independentes e E [u] = 0 é
conhecido como erro de medição clássico.
Isso significa que X é uma medida perturbada (noisy), mas imparcial
de Z. Por substituição, podemos expressar Y como uma função da
variável observada X

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 11 / 59


Exemplo Erro de Medida do Regressor

Y = Z 0β + e = (X − u)0β + e = X 0β + v

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 12 / 59


Exemplo Erro de Medida do Regressor

Y = Z 0β + e = (X − u)0β + e = X 0β + v
onde v = e − u0β.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 12 / 59


Exemplo Erro de Medida do Regressor

Y = Z 0β + e = (X − u)0β + e = X 0β + v
onde v = e − u0β.
Isso significa que (Y , X ) satisfaz a equação linear

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 12 / 59


Exemplo Erro de Medida do Regressor

Y = Z 0β + e = (X − u)0β + e = X 0β + v
onde v = e − u0β.
Isso significa que (Y , X ) satisfaz a equação linear

Y = X 0β + v

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 12 / 59


Exemplo Erro de Medida do Regressor

Y = Z 0β + e = (X − u)0β + e = X 0β + v
onde v = e − u0β.
Isso significa que (Y , X ) satisfaz a equação linear

Y = X 0β + v
com um erro v . Mas esse erro não é o erro de projeção

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 12 / 59


Exemplo Erro de Medida doY =Regressor
X 0Ø + v

error v. But this error is not a projection error. Indeed,


De fato,
£ ° ¢§ £ §
E [X v] = E (Z + u) e ° u 0 Ø = °E uu 0 Ø 6= 0
£ §
nd E uuse0 β6= 0.
6= As
0 ewe learned
E [uu 0 ]6=0.in the previous section, if E [X v] 6= 0 then least squar
consistent.
an calculate the form of the projection coefficient (which is consistently estim
For simplicity suppose that k = 1. We find
√ £ §!
§ E [X v] E u2
Ø = Ø + £ 2§ = Ø 1 ° £ 2§ .
E X E X
§ £ §
u 2 /E X 2 < 1 the projection coefficient shrinks the structural parameter Ø towa
measurement error bias or attenuation bias.

mple: Supply and Demand. The variables Q and P (quantity and price) are deter
emand equation
Q = °Ø1 P + e 1
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 13 / 59
Exemplo Erro de Medida doY =Regressor
X 0Ø + v

error v. But this error is not a projection error. Indeed,


De fato,
£ ° ¢§ £ §
E [X v] = E (Z + u) e ° u 0 Ø = °E uu 0 Ø 6= 0
£ §
nd E uuse0 β6= 0.
6= As
0 ewe learned
E [uu 0 ]6=0.in the previous section, if E [X v] 6= 0 then least squar
consistent.
Como vimos anteriormente, se E [Xv ]6=0 , então o OLS será
an calculate the form of the projection coefficient (which is consistently estim
inconsistente
For simplicity suppose that k = 1. We find
√ £ §!
§ E [X v] E u2
Ø = Ø + £ 2§ = Ø 1 ° £ 2§ .
E X E X
§ £ §
u 2 /E X 2 < 1 the projection coefficient shrinks the structural parameter Ø towa
measurement error bias or attenuation bias.

mple: Supply and Demand. The variables Q and P (quantity and price) are deter
emand equation
Q = °Ø1 P + e 1
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 13 / 59
Exemplo Erro de Medida doY =Regressor
X 0Ø + v

error v. But this error is not a projection error. Indeed,


De fato,
£ ° ¢§ £ §
E [X v] = E (Z + u) e ° u 0 Ø = °E uu 0 Ø 6= 0
£ §
nd E uuse0 β6= 0.
6= As
0 ewe learned
E [uu 0 ]6=0.in the previous section, if E [X v] 6= 0 then least squar
consistent.
Como vimos anteriormente, se E [Xv ]6=0 , então o OLS será
an calculate the form of the projection coefficient (which is consistently estim
inconsistente
For simplicity suppose that k = 1. We find
Podemos calcular a forma do coeficiente √
de projeção (que é
£ 2§ !
consistentemente estimado §
por mínimos
E [X v] u
quadrados).
E Para simplificar,
= Ø + £ 2§ = Ø 1 ° £ 2§ .
suponha que k = 1.Ø Encontramos E X E X
§ £ §
u 2 /E X 2 < 1 the projection coefficient shrinks the structural parameter Ø towa
measurement error bias or attenuation bias.

mple: Supply and Demand. The variables Q and P (quantity and price) are deter
emand equation
Q = °Ø1 P + e 1
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 13 / 59
Y = Z 0 Ø + e = (X ° u)0 Ø + e = X 0 Ø + v
Exemplo Erro de Medida doY =Regressor X 0Ø + v
0
= e ° u Ø. This means that (Y , X ) satisfy the linear equation
error v. But this error is not a projection error. Indeed,
De fato,
£ Y °= X 0 Ø +¢§v £ §
E [X v] = E (Z + u) e ° u 0 Ø = °E uu 0 Ø 6= 0
error £v. But
§ this error is not a projection error. Indeed,
nd E uuse0 β 6= 0.
6= As
0 ewe learned
E [uu 0 ]6=0.in the previous section, if E [X v] 6= 0 then least squar
£ ° ¢§ £ §
consistent. E [X v] = E (Z + u) e ° u 0 Ø = °E uu 0 Ø 6= 0
Como vimos anteriormente, se E [Xv ]6=0 , então o OLS será
£ 0 § the form of the projection coefficient (which is consistently estim
an calculate
nd E uuinconsistente
6= 0. As we learned in the previous section, if E [X v] 6= 0 then least squa
For simplicity suppose that k = 1. We find
nconsistent.
Podemos calcular a forma do coeficiente de projeção (que é
√ £ 2§ !
an calculate the form of estimado
consistentemente the projection
por coefficient
mínimos
E [X v] (which
u
quadrados).
E is consistently
Para estim
simplificar,
§
. For simplicity
suponhasuppose
que k =that k==Ø1.+We
1.Ø Encontramos § = Ø 1° £ § .
£ find
E X2 E X2
√ £ 2§ !
§ £ § u
E [X v]shrinks theE structural
u 2 /E X 2 < 1 the projection § coefficient
Ø = Ø + £ 2§ = Ø 1 ° £ 2§ . parameter Ø towa
measurement error bias or attenuation bias. E X E X
§ £ 2§
u 2 /ESupply
mple: X < and 1 theDemand.
projectionThe coefficient
variablesshrinks
Q and the structural
P (quantity parameter
and towa
price) areØ deter
measurement
emand equation error bias or attenuation bias.
Q = °Ø1 P + e 1
mple: Supply and Demand. The variables Q and P (quantity and price) are deter
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 13 / 59
Y = Z 0 Ø + e = (X ° u)0 Ø + e = X 0 Ø + v
Exemplo Erro de Medida doY =Regressor X 0Ø + v
0
= e ° u Ø. This means that (Y , X ) satisfy the linear equation
error v. But this error is not a projection error. Indeed,
De fato,
£ Y °= X 0 Ø +¢§v £ §
E [X v] = E (Z + u) e ° u 0 Ø = °E uu 0 Ø 6= 0
error £v. But§ this error is not a projection error. Indeed,
nd E uuse0 β 6= 0.
6= As
0 ewe learned
E [uu 0 ]6=0.in the previous section, if E [X v] 6= 0 then least squar
£ ° ¢§ £ §
consistent. E [X v] = E (Z + u) e ° u 0 Ø = °E uu 0 Ø 6= 0
Como vimos anteriormente, se E [Xv ]6=0 , então o OLS será
£ 0 § the form of the projection coefficient (which is consistently estim
an calculate
nd E uuinconsistente
6= 0. As we learned in the previous section, if E [X v] 6= 0 then least squa
For simplicity suppose that k = 1. We find
nconsistent.
Podemos calcular a forma do coeficiente de projeção (que é
√ £ 2§ !
an calculate the form of estimado
consistentemente the projection
por coefficient
mínimos
E [X v] (which
u
quadrados).
E is consistently
Para estim
simplificar,
§
. For simplicity
suponhasuppose
que k =that k==Ø1.+We
1.Ø Encontramos § = Ø 1° £ § .
£ find
E X2 E X2
√ £ 2§ !
§ £ § u
E [X v]shrinks theE structural
u 2 /E X 2 < 1 the projection § coefficient
Ø = Ø + £ 2§ = Ø 1 ° £ 2§ . parameter Ø towa
measurement error bias or attenuation bias. E X E X
§ £ 2§
u 2 /ESupply
mple: XComo 1Eu
< andthe2Demand.
projection
/EX 2 < 1 ,coefficient
Theo variables shrinks
coeficiente Q de
and the structural
P (quantity
projeção reduzandoparameter towa
price) areØ deter
parâmetro
measurement
emand equation error bias or attenuation bias.
estrutural β para zero. este é chamado de viés de erro de medição ou
viés de atenuação. Q = °Ø1 P + e 1
mple: Supply and Demand. The variables Q and P (quantity and price) are deter
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 13 / 59
Exemplo Oferta e Demanda
As variáveis Q e P (quantidade e preço) são determinadas
conjuntamente pela equação de demanda

Q = −β1 P + e1

Q = β2 P + e2 .

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 14 / 59


Exemplo Oferta e Demanda
As variáveis Q e P (quantidade e preço) são determinadas
conjuntamente pela equação de demanda

Q = −β1 P + e1

e a equação da oferta

Q = β2 P + e2 .

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 14 / 59


Exemplo Oferta e Demanda
As variáveis Q e P (quantidade e preço) são determinadas
conjuntamente pela equação de demanda

Q = −β1 P + e1

e a equação da oferta

Q = β2 P + e2 .

Suponha que e = (e1 , e2 ) satisfaça E[e] = 0 e Eee0 = I2 (o último


para simplificar). A questão é: se regredirmos Q em P, o que
acontece?

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 14 / 59


Exemplo Oferta e Demanda
As variáveis Q e P (quantidade e preço) são determinadas
conjuntamente pela equação de demanda

Q = −β1 P + e1

e a equação da oferta
ER 12. INSTRUMENTAL VARIABLES

Q = β2 P + e2 .
supply equation
Suponha que e = (e1 , e2 ) satisfaça Q = Ø2E[e]
P + e=2 . 0 e Eee0 = I (o último
2
£ 0§
that e =para
(e 1 , esimplificar).
2 ) satisfies EA questão
[e] = 0 andé:
E se
ee = I
regredirmos
2 (the Q em
latter P,
for o que
simplicity). The qu
acontece?
Q on P, what happens?
helpful to solve
É útil for Q and
resolver paraP Q
in eterms
P emoftermos
the errors. In matrix
de erros. Em notation,
notação de matriz
∑ ∏µ ∂ µ ∂
1 Ø1 Q e1
=
1 °Ø2 P e2

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 14 / 59


that e = (e 1 , e 2 ) satisfies E [e] = 0 and E ee = I 2 (the latter for simplicity). The qu
Q on P, what happens?
Exemplo Oferta e Demanda
helpful to solve for Q and P in terms of the errors. In matrix notation,
∑ ∏µ ∂ µ ∂
1 Ø1 Q e1
=
1 °Ø2 P e2

Então
µ ∂ ∑ ∏°1 µ ∂
Q 1 Ø1 e1
=
P 1 °Ø2 e2
∑ ∏µ ∂µ ∂
Ø2 Ø1 e1 1
=
1 °1 e2 Ø1 + Ø2
µ ° ¢ ∂
Ø2 e 1 + Ø1 e 2 /(Ø1 + Ø2 )
= .
(e 1 ° e 2 ) /(Ø1 + Ø2 )

ection of Q on P yields Q = ا P +e § with E [Pe § ] = 0 and the coefficient defined b

E [PQ] Ø2 ° Ø1
ا = £ §= .
E P2 2

ection coefficient
Prof. Flávia ا equals
Chein (PPG Economia - UFJF) neither theMQ
demand
II slope Ø1 nor theApril
supply
20, 2021 slope Ø2
15 / 59
Exemplo Oferta e Demanda
Examples - Supply and Demand
Sabemos que a projeção de Q em P produz Q = β ∗ P + e ∗ com
We
E[Pe know
∗] = 0 e othat the projection
coeficiente definidoofpela
qi on pi yields
projeção como

q i = p i + "i
E [pi "i ] = 0

onde
where
E [pi qi ] E [(e1i e2i ) ( 2 e1i + 1 e2i )]
= ⇥ 2⇤ = h i
E pi E (e1i e2i ) 2

2 1
=
2
P
If Estimando
we estimate by OLS, b !
por ⇤ = 2
2
1
6= 1 6= 2.

EsseThat
é o viés da simultaneous
is the equação simultânea
equation bias.
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 16 / 59
Exemplo Salário e Educação

log(wage) = βeduci + ei

Se os salários são afetados pela habilidade não observada, então


E[educi , ei ] > 0.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 17 / 59


Exemplo Salário e Educação

log(wage) = βeduci + ei

Se os salários são afetados pela habilidade não observada, então


E[educi , ei ] > 0.
h i
A educação é endógena E β̂ |educ > β, viés positivo.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 17 / 59


Exemplo Salário e Educação

log(wage) = βeduci + ei

Se os salários são afetados pela habilidade não observada, então


E[educi , ei ] > 0.
h i
A educação é endógena E β̂ |educ > β, viés positivo.
O retorno à educação é superestimado.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 17 / 59


Exemplo Salário e Educação

Assim, os mínimos quadrados (que estimam o coeficiente de projeção)


tenderão a superestimar o efeito causal da educação sobre os salários.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 18 / 59


Exemplo Salário e Educação

Assim, os mínimos quadrados (que estimam o coeficiente de projeção)


tenderão a superestimar o efeito causal da educação sobre os salários.
Este tipo de endogeneidade ocorre geralmente quando Y e X são
escolhas feitas por um agente econômico, mesmo que sejam feitas em
momentos diferentes.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 18 / 59


Exemplo Salário e Educação

Assim, os mínimos quadrados (que estimam o coeficiente de projeção)


tenderão a superestimar o efeito causal da educação sobre os salários.
Este tipo de endogeneidade ocorre geralmente quando Y e X são
escolhas feitas por um agente econômico, mesmo que sejam feitas em
momentos diferentes.
Geralmente, quando a variável dependente e um regressor são
variáveis de escolha feitas pelo mesmo agente, as variáveis devem ser
tratadas como endógenas.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 18 / 59


Endogeneidade e Variável Instrumental
1 Introdução

2 Visão Geral
3 Exemplos

4 Variável Instrumental
Forma Reduzida
Identificação
Estimador de Variáveis Instrumentais
Estimador de Wald
Estimador de Mínimos Quadrados em Dois Estágios

5 Local Average Treatment Effects

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 19 / 59


The endogenous regressors Y2 are the critical variables discussed in the examples of the prev
section – simultaneous variables, choice variables, mis-measured regressors – that are potentially co
Variável Instrumental
lated with the equation error e. In most applications k 2 is small (1 or 2). The exogenous variables X
the remaining regressors (including the equation intercept) and can be low or high dimensional.

12.5 Instruments
Para estimar β de forma consistente, precisamos de informações
To consistently estimate Ø we require additional information. One type of information which is c
adicionais. Um tipo de informação comumente usado em aplicações
monly used in economic applications are what we call instruments.
econômicas é o que chamamos de instrumentos.

Definition 12.1 The ` £ 1 random vector Z is an instrumental variable for


(12.3) if

E [Z e] = 0 (12.5)
£ §
E Z Z0 > 0 (12.6)
° £ §¢
rank E Z X 0 = k. (12.7)

There are three components to the definition as given. The first (12.5) is that the instruments
uncorrelated with the regression error. The second (12.6) is a normalization which excludes line

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 20 / 59


Variável Instrumental

Existem três componentes para a definição dada.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 21 / 59


Variável Instrumental

Existem três componentes para a definição dada.


O primeiro (12.5) é que os instrumentos não estão correlacionados com
o erro de regressão.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 21 / 59


Variável Instrumental

Existem três componentes para a definição dada.


O primeiro (12.5) é que os instrumentos não estão correlacionados com
o erro de regressão.
O segundo (12.6) é uma normalização que exclui linearmente
instrumentos redundantes.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 21 / 59


Variável Instrumental

Existem três componentes para a definição dada.


O primeiro (12.5) é que os instrumentos não estão correlacionados com
o erro de regressão.
O segundo (12.6) é uma normalização que exclui linearmente
instrumentos redundantes.
A terceira (12.7) é frequentemente chamada de condição de relevância
e é essencial para a identificação do modelo, como veremos mais
adiante.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 21 / 59


Variável Instrumental

Existem três componentes para a definição dada.


O primeiro (12.5) é que os instrumentos não estão correlacionados com
o erro de regressão.
O segundo (12.6) é uma normalização que exclui linearmente
instrumentos redundantes.
A terceira (12.7) é frequentemente chamada de condição de relevância
e é essencial para a identificação do modelo, como veremos mais
adiante.
Uma condição necessária para (12.7) é que l ≥ k. A condição (12.5) -
que os instrumentos não estão correlacionados com o erro de equação -
é frequentemente descrita como sendo exógena no sentido de que são
determinados fora do modelo para Y .

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 21 / 59


Variável Instrumental
Observe que os regressores X1 satisfazem a condição (12.5) e,
portanto, devem ser incluídos como variáveis instrumentais.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 22 / 59


Variável The
instruments. Instrumental
third (12.7) is often called the relevance condition and is essen
on of the model, as we discuss later. A necessary condition for (12.7) is that ` ∏ k.
on (12.5)Observe
– that the
queinstruments are X
os regressores uncorrelated
1 satisfazemwith the equation
a condição (12.5)error
e, – is often
are exogenous in the sense that they are determined outside the model for Y .
portanto, devem ser incluídos como variáveis instrumentais.
hat the É,
regressors
portanto,X 1um
satisfy condition
subconjunto das(12.5) and thus
variáveis should be included as in
Z . Notacionalmente,
is thus fazemos
a subset of the variables
a partição Z . Notationally we make the partition
µ ∂ µ ∂
Z1 X1 k1
Z= = .
Z2 Z2 `2

Z1 are the included exogenous variables and Z2 are the excluded exogenous vari
riables which could be included in the equation for Y (in the sense that they are un
can be excluded as they have true zero coefficients in the equation. With this notat
he structural equation (12.4) as

Y1 = Z10 Ø1 + Y20 Ø2 + e.

ul notation as it clarifies that the variable Z1 is exogenous and the variable Y2 is en


uthors describe Z1 as the “exogenous variables”, Y2 as the “endogenous variables”
mental variables”.
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 22 / 59
Variável The
instruments. Instrumental
third (12.7) is often called the relevance condition and is essen
on of the model, as we discuss later. A necessary condition for (12.7) is that ` ∏ k.
on (12.5)Observe
– that the
queinstruments are X
os regressores uncorrelated
1 satisfazemwith the equation
a condição (12.5)error
e, – is often
are exogenous in the sense that they are determined outside the model for Y .
portanto, devem ser incluídos como variáveis instrumentais.
hat the É,
regressors
portanto,X 1um
satisfy condition
subconjunto das(12.5) and thus
variáveis should be included as in
Z . Notacionalmente,
is thus fazemos
a subset of the variables
a partição Z . Notationally we make the partition
µ ∂ µ ∂
Z1 X1 k1
Z= = .
Z2 Z2 `2

Z1 are the included


Aqui, X1 = exogenous variables
Z1 são as variáveis and Z2 are
exógenas the excluded
incluídas exogenous
e Z2 são as vari
riables which could
variáveis be included
exógenas in theOu
excluídas. equation
seja, Zfor Y (in
2 são the sense
variáveis quethat they are un
poderiam
can be excluded as they
ser incluídas na have true de
equação zero
Y coefficients
(no sentidoindethe equation.
que With this notat
não estão
he structural equation (12.4)
correlacionadas com as
e), mas podem ser excluídas, pois têm
coeficientes zero verdadeiros na equação.
Y1 = Z10 Ø1 + Y20 Ø2 + e.

ul notation as it clarifies that the variable Z1 is exogenous and the variable Y2 is en


uthors describe Z1 as the “exogenous variables”, Y2 as the “endogenous variables”
mental variables”.
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 22 / 59
Variável The
instruments. Instrumental
third (12.7) is often called the relevance condition and is essen
on of the model, as we discuss later. A necessary condition for (12.7) is that ` ∏ k.
on (12.5)
APTER –INSTRUMENTAL
that the
Observe
12. queinstruments
os regressoresare X
VARIABLES uncorrelated
1 satisfazemwith the equation
a condição (12.5)error
e, – is often
are exogenous in the sense that they are determined outside the model for Y .
portanto, devem ser incluídos como variáveis instrumentais.
hat theinstruments.
undant regressors
É, X 1um
portanto,The satisfy
third condition
(12.7)
subconjunto das(12.5)
is often calledand
variáveis thus should
the relevance be included
condition
Z . Notacionalmente, as in
and is essent
ntification
a of
is thus fazemosthe model,
subset of the as we discuss
variables
a partição Z .later. A necessary
Notationally we condition
make for
the (12.7)
partitionis that ` ∏ k.
Condition (12.5) – that the instruments are uncorrelated with the equation error – is often
µ ∂ µ ∂
hat they are exogenous in the sense that Z1they areXdetermined
1 k1 outside the model for Y .
Z =
Notice that the regressors X 1 satisfy condition
= (12.5) and
.thus should be included as ins
Z2 Z2 `2
ables. It is thus a subset of the variables Z . Notationally we make the partition
Z1 are the included
Aqui, X1 = exogenous variables
Z1 são as variáveis ∂ the excluded
∂andµ Z2 are
µ exógenas incluídas exogenous
e Z2 são as vari
Z1 X1 k
riables which
variáveiscould be included
exógenas Zin=theOu
excluídas. equation
seja,
= Zfor Y1 (in
2 são . the sense
variáveis quethat they are un
poderiam
Z2 Z2 `
can be excluded as they
ser incluídas na have true de
equação zeroY coefficients
(no sentido de2the
in equation.
que With this notat
não estão
he
e, Xstructural
1 = Z 1 are equation
correlacionadas
the (12.4)
includedcom as
e),
exogenousmas podem
variables ser
and Zexcluídas,
2 are the pois têm
excluded exogenous varia
2 are variables which could
coeficientes zero be included inna
verdadeiros theequação.
equation for Y (in the sense that they are unc
0
h e) yet can be excluded as they Y
have1 = Z
true
Com esta notação, também 1podemos Ø
zero
1 + Y20 Ø2escrever
+ e. in the
coefficients equation.estrutural
a equação With this notati
write the structural equation (12.4) as
como
ul notation as it clarifies that the variable Z1 is exogenous and the variable Y2 is en
uthors describe Z1 as the “exogenous Z10 Ø1 + Y20 Ø2Y+ e.as the “endogenous variables”
Y1 =variables”,
2
mental variables”.
s is useful notation as it clarifies that the variable Z is exogenous and the variable Y is end
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 22 / 59
Variável Instrumental

Muitos autores descrevemZ1 como as "variáveis exógenas", Y2 como


as "variáveis endógenas" e Z2 como as “variáveis instrumentais”.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 23 / 59


Variável Instrumental

Muitos autores descrevemZ1 como as "variáveis exógenas", Y2 como


as "variáveis endógenas" e Z2 como as “variáveis instrumentais”.
Dizemos que o modelo é exatamente identificado se l = k e
superidentificado se l > k.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 23 / 59


Variável Instrumental

Muitos autores descrevemZ1 como as "variáveis exógenas", Y2 como


as "variáveis endógenas" e Z2 como as “variáveis instrumentais”.
Dizemos que o modelo é exatamente identificado se l = k e
superidentificado se l > k.
Quais variáveis podem ser usadas como variáveis instrumentais?
Da definição E [Ze] = 0 o instrumento deve ser não correlacionado com
o erro da equação, o que significa que é excluído da equação estrutural
como acima mencionado.
A partir da condição de posto (12.7) também é importante que a
variável instrumental seja correlacionado com as variáveis endógenas
Y2 após o controle para as outras variáveis exógenas Z1 .
Instrumento Z2 é uma medida alternativa de Z . Para que este Z2
satisfaça a propriedade de uma variável instrumental, o erro de medição
em Z2 deve ser independente daquele em X .

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 23 / 59


Variável Instrumental

Exemplo educação e salário: instrumento? Paper David Card (1995)

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 24 / 59


Variável Instrumental

Exemplo educação e salário: instrumento? Paper David Card (1995)


Exemplo Oferta e Demanda: Um instrumento apropriado para o preço
P em uma equação de demanda é uma variável Z 2 que influencia a
oferta, mas não a demanda. Essa variável afeta os valores de
equilíbrio de P e Q, mas não afeta diretamente o preço, exceto por
meio da quantidade.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 24 / 59


Variável Instrumental

Exemplo educação e salário: instrumento? Paper David Card (1995)


Exemplo Oferta e Demanda: Um instrumento apropriado para o preço
P em uma equação de demanda é uma variável Z 2 que influencia a
oferta, mas não a demanda. Essa variável afeta os valores de
equilíbrio de P e Q, mas não afeta diretamente o preço, exceto por
meio da quantidade.
Variáveis que afetam a oferta, mas não a demanda, estão
normalmente relacionadas ao custo de produção

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 24 / 59


Endogeneidade e Variável Instrumental
1 Introdução

2 Visão Geral
3 Exemplos

4 Variável Instrumental
Forma Reduzida
Identificação
Estimador de Variáveis Instrumentais
Estimador de Wald
Estimador de Mínimos Quadrados em Dois Estágios

5 Local Average Treatment Effects

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 25 / 59


Forma Reduzida
college Grew up in same county as a 4-year college
public Grew up in same county as a 4-year public college
private Grew up in same county as a 4-year private college.

.7 Reduced Form
The reduced formreduzida
A forma is the relationship between
é a relação entrethe
osendogenous
regressoresregressors
endógenos Y2 Y
and
2 ethe
osinstr
near reduced form model
instrumentos Z .for
UmY2 is
modelo de forma linear reduzida para Y2 é:
Y2 = °0 Z + u 2 = °012 Z1 + °022 Z2 + u 2

s is a multivariate regression as introduced in Chapter 11. The ` £ k 2 coefficient matrix °


inear projection:
£ §°1 £ §
° = E Z Z0 E Z Y20
£ §
s implies E Z u 20 = 0. Notice that the projection coefficient (12.11) is well defined and uni
.6).
We also construct the reduced form for Y . Substitute (12.10) into (12.9) to obtain
° ¢0
Y1 = Z10 Ø1 + °012 Z1 + °022 Z2 + u 2 Ø2 + e
= Z10 ∏1 + Z20 ∏2 + u 1
Prof. Flávia Chein (PPG Economia - UFJF) = Z 0 ∏ + u 1 MQ II April 20, 2021 26 / 59
Forma Reduzida
college Grew
college Grewup
upin
insame
samecounty
countyas
asaa4-year
4-yearcollege
college
public Grew
public Grewup
upininsame
samecounty
countyas
asaa4-year
4-yearpublic
publiccollege
college
private Grew up in same county as a 4-year private college.
private Grew up in same county as a 4-year private college.

.7 Reduced
.7 Reduced Form
Form
Thereduced
The reduced formreduzida
A forma
form isisthe
therelationship
relationship between
é a relação the
entrethe
between endogenous
osendogenous regressors
regressoresregressors
endógenos YY22 and
and
Y 2 e the instr
osinstru
the
near reduced form model .for
near reduced form model for Y22 is
instrumentos Z UmY is
modelo de forma linear reduzida para Y 2 é:
0 0 0
YY22==°°0 ZZ ++uu22==°°012 Z11++°°022
12Z Z22++uu22
22Z

ss isis aa multivariate
multivariate regression
A matrizregression as introduced
as introduced
de coeficiente, l × k2 , inin éChapter
Γ Chapter
definida11.por
11. Theprojeção
The ``££kk22 coefficient
coefficient matrix °°
linear: matrix
inear projection:
inear projection:
££ §°1 ££
0§°1 0§
§
°°==EE ZZZZ0 EE ZZYY202
££ §§
impliesEE ZZuu2020 ==0.
ssimplies 0. Notice
Noticethat
thatthe
theprojection
projectioncoefficient
coefficient(12.11)
(12.11)isiswell
welldefined
definedand
anduniq
uni
.6).
6).
Wealso
We alsoconstruct
constructthethereduced
reducedform
formfor
forYY.. Substitute
Substitute(12.10)
(12.10)into into(12.9)
(12.9)totoobtain
obtain
0 °° 0 0 ¢¢0
YY11==ZZ101ØØ11++ °°012 Z11++°°022
12Z Z22++uu22 0 ØØ22++ee
22Z
0 0
==ZZ101∏∏11++ZZ202∏∏22++uu11
0
Prof. Flávia Chein (PPG Economia - UFJF) ==ZZ0 ∏∏++uu 1 MQ II April 20, 2021 26 / 59
college Grew up in same county as a 4-year college
Forma public
Reduzida Grew up in same county as a 4-year public college
private Grew up in same county as a 4-year private college.

.7 Reduced Form
The reduced formreduzida
A forma is the relationship between
é a relação entrethe
osendogenous
regressoresregressors
endógenos Y2 Y
and
2 ethe
osinstr
near reduced form model
instrumentos Z .for
UmY2 is
modelo de forma linear reduzida para Y2 é:
Y2 = °0 Z + u 2 = °012 Z1 + °022 Z2 + u 2

s is a multivariate regression as introduced in Chapter 11. The ` £ k 2 coefficient matrix °


inear projection:
£ §°1 £ §
° = E Z Z0 E Z Y20
£ §
s implies E Z u 20 = 0. Notice that the projection coefficient (12.11) is well defined and uni
.6).
We also construct the reduced form for Y . Substitute (12.10) into (12.9) to obtain
° ¢0
Y1 = Z10 Ø1 + °012 Z1 + °022 Z2 + u 2 Ø2 + e
= Z10 ∏1 + Z20 ∏2 + u 1
= Z 0 ∏ + u1
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 27 / 59
college Grew
college Grewup
upininsame
samecounty
countyas
asaa4-year
4-yearcollege
college
Forma public
Reduzida
public Grew
Grew up
up in
in same
same county
county as
as aa 4-year
4-year publiccollege
public college
private Grew
private Grewup
upininsame
samecounty
countyas
asaa4-year
4-yearprivate
privatecollege.
college.

.7 Reduced
.7 Reduced Form
Form
Thereduced
The reduced formreduzida
A forma
form isisthe
therelationship
relationship between
é a relação the
entrethe
between endogenous
osendogenous regressors
regressoresregressors
endógenos YY22 and
and
Y 2 ethe instr
osinstru
the
nearreduced
near reduced formmodel
form model
instrumentos .for
Z for YY22 isis
Um modelo de forma linear reduzida para Y2 é:
0 0 0
YY22==°°0 ZZ ++uu22==°°012 Z11++°°022
12Z Z22++uu22
22Z

ss isis aa multivariate
multivariate regression
A matrizregression as introduced
as
de coeficiente,introduced
l × k2 , in in éChapter
Γ Chapter
definida 11.por
11. Theprojeção
The ``££kk22 coefficient
coefficient matrix °°
linear: matrix
inearprojection:
inear projection:
££ §°1 ££
0§°1 0§
§
°°==EE ZZZZ0 EE ZZYY202
££ §§
impliesEE ZZuu2020 ==0.
ssimplies 0. Notice
Noticethat
thatthe
theprojection
projectioncoefficient
coefficient(12.11)
(12.11)isiswell
welldefined
definedand
anduniq
uni
.6).
6).
Wealso
We alsoconstruct
constructthethereduced
reducedformformfor forYY.. Substitute
Substitute(12.10)
(12.10)into into(12.9)
(12.9)totoobtain
obtain
0 °° 0 0 ¢¢0
YY11==ZZ101ØØ11++ °°012
12ZZ11++°°022
22ZZ22++uu22 0 ØØ22++ee
0 0
==ZZ101∏∏11++ZZ202∏∏22++uu11
0
==ZZ0 ∏∏++uu11
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 27 / 59
college Grew
college Grewup
upininsame
samecounty
countyas
asaa4-year
4-yearcollege
college
Forma public
Reduzida
public Grew
Grew up
up in
in same
same county
county as
as aa 4-year
4-year publiccollege
public college
private Grew
private Grewup
upininsame
samecounty
countyas
asaa4-year
4-yearprivate
privatecollege.
college.

.7 Reduced
.7 Reduced Form
Form
Thereduced
The reduced formreduzida
A forma
form isisthe
therelationship
relationship between
é a relação the
entrethe
between endogenous
osendogenous regressors
regressoresregressors
endógenos YY22 and
and
Y 2 ethe instr
osinstru
the
nearreduced
near reduced formmodel
form model
instrumentos .for
Z for YY22 isis
Um modelo de forma linear reduzida para Y2 é:
0 0 0
YY22==°°0 ZZ ++uu22==°°012 Z11++°°022
12Z Z22++uu22
22Z

ss isis aa multivariate
multivariate regression
A matrizregression as introduced
as
de coeficiente,introduced
l × k2 , in in éChapter
Γ Chapter
definida 11.por
11. Theprojeção
The ``££kk22 coefficient
coefficient matrix °°
linear: matrix
inearprojection:
inear projection:
££ §°1 ££
0§°1 0§
§
°°==EE ZZZZ0 EE ZZYY202
££ §§
impliesEE ZZuu2020 ==0.
ssimplies 0. Notice
Noticethat
hthat0the
the projectioncoefficient
i projection coefficient(12.11)
(12.11)isiswell
welldefined
definedand
anduniq
uni
.6).
6).
Isso implica que E Zu 2 =0. Observe que o coeficiente de projeção
Wealso
We (12.11)
constructéthe
alsoconstruct bem
the definido
reduced
reduced form
form eforúnico
for em (12.6).
YY.. Substitute
Substitute (12.10)into
(12.10) into(12.9)
(12.9)totoobtain
obtain
0 °° 0 0 ¢¢0
YY11==ZZ101ØØ11++ °°012
12ZZ11++°°022
22ZZ22++uu22 0 ØØ22++ee
0 0
==ZZ101∏∏11++ZZ202∏∏22++uu11
0
==ZZ0 ∏∏++uu11
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 27 / 59
A linear reduced form model for Y2 is
Forma Reduzida
Y2 = °0 Z + u 2 = °012 Z1 + °022 Z2 + u 2

This is a multivariate regression as introduced in Chapter 11. The ` £ k 2 coefficie


by linear projection:
£ §°1 £ §
° = E Z Z0 E Z Y20
£ §
This implies
Também E Z u 20 = 0.aNotice
construímos formathat the projection
reduzida de Y . coefficient
Substitua (12.11)
(12.10)is em
well defi
(12.6).
(12.9) para obter
We also construct the reduced form for Y . Substitute (12.10) into (12.9) to obt
° ¢0
Y1 = Z10 Ø1 + °012 Z1 + °022 Z2 + u 2 Ø2 + e
= Z10 ∏1 + Z20 ∏2 + u 1
= Z 0 ∏ + u1

where

∏1 = Ø1 + °12 Ø2
∏2 = °22 Ø2
u 1 = u 20 Ø2 + e.

Prof. Flávia CheinWe can


(PPG also -write
Economia UFJF) MQ II April 20, 2021 28 / 59
Y1 = Z10 Ø1 + °012 Z1 + °022 Z2 + u 2 Ø2 + e
Forma
= Z10 ∏Reduzida
0
1 + Z2 ∏2 + u 1 (12.12)
0
= Z ∏ + u1 (12.13)

Onde

∏1 = Ø1 + °12 Ø2 (12.14)
∏2 = °22 Ø2 (12.15)
u 1 = u 20 Ø2 + e.

∏ = °Ø (12.16)

∑ ∏
I k1 °12
°= .
0 °22
m equations for the system are

Y1 = ∏0 Z + u 1
Y2 = °0 Z + u 2 .
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 29 / 59
Y1 = Z10 Ø1 + °012 Z1 + °022 Z2 + u 2 Ø2 + e
Forma °00 ¢0
=ZZ110∏ØReduzida
0
Y1= 11++Z° 2∏ 2 + u1 0
12 Z1 + °22 Z2 + u 2 Ø2 + e
(12.12)
0
=ZZ 0∏∏+
=
1
u 0
1 + 1Z ∏2 + u 1
2
(12.13)
(12.12)
0
= Z ∏ + u1 (12.13)
Onde

∏1 = Ø1 + °12 Ø2 (12.14)
∏∏21=
=°Ø22 Ø
1 +2°12 Ø2
(12.15)
(12.14)
0
u∏12=
=u°222
ØØ + e.
22 (12.15)

Podemos = u 20 Ø2 +escrever
u 1 também e.
∏ = °Ø (12.16)

∑ ∏ = °Ø ∏ (12.16)
I k °12
°= ∑ 1 .
0 °22 ∏
I k1 °12
°= .
m equations for the system
0 °22 are
m equations for the system are
Y1 = ∏0 Z + u 1
0
YY2 =
=°∏0ZZ++uu21.
1
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 29 / 59
We can also write
Forma Reduzida
∏ = °Ø
where ∑ ∏
I k1 °12
°= .
0 °22
Juntas, as equações de forma reduzida para o sistema são:
Together, the reduced form equations for the system are

Y1 = ∏0 Z + u 1
Y2 = °0 Z + u 2 .

or ∑ ∏
~= ∏01 ∏2
Y Z +u
°012 °022
where u = (u 1 , u 2 ).

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 30 / 59


Forma Reduzida

As equações de forma reduzida são projeções, portanto os coeficientes


podem ser estimados por mínimos quadrados (consulte o Capítulo
11).

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 31 / 59


Forma Reduzida
TRUMENTAL VARIABLES 344

ips (12.14)-(12.16) are critically important for understanding the identification of the
ters Ø1 and 2 , as we discuss
As Øequações below.
de forma These equations
reduzida show the
são projeções, tight relationship
portanto be-
os coeficientes
ters of the structural equations (Ø1 and Ø2 ) and those of the reduced form equations
podem ser estimados por mínimos quadrados (consulte o Capítulo
11).
orm equations are projections, so the coefficients may be estimated by least squares
The least Os estimadores
squares deofmínimos
estimators (12.11) and quadrados
(12.13) arede (12.11) e (12.13) são
√ !°1 √ !
n
X n
X
b 0 0
°= Zi Zi Zi Y2i (12.18)
i =1 i =1
√ !°1 √ !
n
X n
X
b=
∏ Zi Zi0 Zi Y1i (12.19)
i =1 i =1

cation
identified if it is a unique function of the probability distribution of the observables.
that a parameter is identified is to write it as an explicit function of population mo-
ple,
Prof. the
Fláviareduced
Chein (PPG form coefficient
Economia - UFJF) matricesMQ
° and
II ∏ are identified since they
April can be
20, 2021 31 / 59
Endogeneidade e Variável Instrumental
1 Introdução

2 Visão Geral
3 Exemplos

4 Variável Instrumental
Forma Reduzida
Identificação
Estimador de Variáveis Instrumentais
Estimador de Wald
Estimador de Mínimos Quadrados em Dois Estágios

5 Local Average Treatment Effects

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 32 / 59


Identificação

Um parâmetro é identificado se for uma função única da distribuição


de probabilidade dos observáveis.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 33 / 59


Identificação

Um parâmetro é identificado se for uma função única da distribuição


de probabilidade dos observáveis.
Uma maneira de mostrar que um parâmetro é identificado é
escrevê-lo como uma função explícita dos momentos da população.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 33 / 59


√ !°1 √ !
n
X n
X
b= Zi Zi0
Identificação
° Zi Y2i0 (12.18)
i =1 i =1
√ !°1 √ !
n
X n
X
b=
∏ Zi Zi0 Zi Y1i (12.19)
i =1 i =1
Um parâmetro é identificado se for uma função única da distribuição
de probabilidade dos observáveis.
Uma maneira de mostrar que um parâmetro é identificado é
it is a unique function
escrevê-lo comoofuma
the probability distribution
função explícita of the observables.
dos momentos da população.
eter is identified is to as
Por exemplo, write it as an
matrizes deexplicit function
coeficientes of population
de forma reduzida mo-
Γe λ são
ced formidentificadas,
coefficient matrices
pois podem ser escritas como funções they
° and ∏ are identified since can be
explícitas dos
he moments of thedas
momentos varibles (Y , X(Y
variáveis , Z ,).XThat
, Z ).is,Isso é,
£ §°1 £ §
° = E Z Z0 E Z Y20 (12.20)
£ §°1
∏ = E Z Z0 E [Z Y1 ] . (12.21)

by the probability distribution of (Y1 , Y2 , Z ) if Definition 12.1 holds, since


£ §
hat E Z Z 0 is invertible.
uctural parameter Ø. It relates to (∏, °) through (12.16). Ø is identified if
relation. This is a set of ` equations with
Prof. Flávia Chein (PPG Economia - UFJF)
k unknowns with ` ∏ k.
MQ II
From
April 20, 2021 33 / 59
Identificação

Estes são determinados exclusivamente pela distribuição de


probabilidade de (Y1 , Y2 , Z ) se a Definição 12.1 for mantida, uma
vez que inclui o requisito de que E [ZZ 0 ] ser invertível.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 34 / 59


Identificação

Estes são determinados exclusivamente pela distribuição de


probabilidade de (Y1 , Y2 , Z ) se a Definição 12.1 for mantida, uma
vez que inclui o requisito de que E [ZZ 0 ] ser invertível.
Estamos interessados no parâmetro estrutural β. Relaciona-se com
(λ, Γ) a (12.16).

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 34 / 59


Identificação

Estes são determinados exclusivamente pela distribuição de


probabilidade de (Y1 , Y2 , Z ) se a Definição 12.1 for mantida, uma
vez que inclui o requisito de que E [ZZ 0 ] ser invertível.
Estamos interessados no parâmetro estrutural β. Relaciona-se com
(λ, Γ) a (12.16).
β é identificado se for determinado exclusivamente por esta relação.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 34 / 59


Identificação

Estes são determinados exclusivamente pela distribuição de


probabilidade de (Y1 , Y2 , Z ) se a Definição 12.1 for mantida, uma
vez que inclui o requisito de que E [ZZ 0 ] ser invertível.
Estamos interessados no parâmetro estrutural β. Relaciona-se com
(λ, Γ) a (12.16).
β é identificado se for determinado exclusivamente por esta relação.
Este é um conjunto de l equações com k incógnitas com l ≥ k.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 34 / 59


Identificação

Estes são determinados exclusivamente pela distribuição de


probabilidade de (Y1 , Y2 , Z ) se a Definição 12.1 for mantida, uma
vez que inclui o requisito de que E [ZZ 0 ] ser invertível.
Estamos interessados no parâmetro estrutural β. Relaciona-se com
(λ, Γ) a (12.16).
β é identificado se for determinado exclusivamente por esta relação.
Este é um conjunto de l equações com k incógnitas com l ≥ k.
Pela álgebra linear, sabemos que existe uma solução única se e
somente se Γ tiver posto completo k. rank(Γ̄) = k. (12,22)

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 34 / 59


Identificação

Estes são determinados exclusivamente pela distribuição de


probabilidade de (Y1 , Y2 , Z ) se a Definição 12.1 for mantida, uma
vez que inclui o requisito de que E [ZZ 0 ] ser invertível.
Estamos interessados no parâmetro estrutural β. Relaciona-se com
(λ, Γ) a (12.16).
β é identificado se for determinado exclusivamente por esta relação.
Este é um conjunto de l equações com k incógnitas com l ≥ k.
Pela álgebra linear, sabemos que existe uma solução única se e
somente se Γ tiver posto completo k. rank(Γ̄) = k. (12,22)
Em (12.22), β pode ser resolvido exclusivamente a partir de (12.16).
Se (12.22) falhar, então (12.16) terá menos equações do que
coeficientes, portanto não há uma solução única.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 34 / 59


∏=E ZZ E [Z Y1 ] . (12.21)

Identificação
These are uniquely determined by the probability distribution of (Y , Y , Z ) if Definition 12.1 holds, since
£ § 1 2
this includes the requirement that E Z Z 0 is invertible.
We are interested in the structural parameter Ø. It relates to (∏, °) through (12.16). Ø is identified if
it uniquely determined by this relation. This is a set of ` equations with k unknowns with ` ∏ k. From
linear algebra we know that there is a unique solution if and only if ° has full rank k.
≥ ¥
rank ° = k. (12.22)
Podemos escrever
Under (12.22), Ø can be uniquely solved from (12.16). If (12.22) fails then (12.16) has fewer equations
than coefficients so there is not a unique solution.
£ §°1 £ §
We can write ° = E Z Z 0 E Z X 0 (since the projection of X 1 onto Z is simply X 1 .) Thus (12.16) is
the same as
£ §°1 £ §°1 £ §
E Z Z0 E [Z Y1 ] = E Z Z 0 E ZX0 Ø
or
£ §
E [Z Y1 ] = E Z X 0 Ø
which is a set of ` equations with k unknowns. This has a unique solution if (and only if)
° £ §¢
rank E Z X 0 = k (12.23)

which was listed in (12.7) as a condition of Definition 12.1. (Indeed, this is why it was listed as part
of the definition.) We can also see that (12.22) and (12.23) are equivalent ways of expressing the same
requirement. If this condition fails then Ø will not be identified. The condition (12.22)-(12.23) is called
the relevance condition.
It is useful to have explicit expressions for the solution Ø. The easiest case is when ` = k. Then (12.22)
°1
implies ° is invertible, so the structural parameter equals Ø = ° ∏. It is a unique solution because ° and
∏ are unique and ° is invertible.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 35 / 59


∏=E ZZ E [Z Y1 ] . (12.21)

Identificação
These are uniquely determined by the probability distribution of (Y , Y , Z ) if Definition 12.1 holds, since
£ § 1 2
this includes the requirement that E Z Z 0 is invertible.
We are interested in the structural parameter Ø. It relates to (∏, °) through (12.16). Ø is identified if
it uniquely determined by this relation. This is a set of ` equations with k unknowns with ` ∏ k. From
linear algebra we know that there is a unique solution if and only if ° has full rank k.
≥ ¥
rank ° = k. (12.22)
Podemos escrever
Under (12.22), Ø can be uniquely solved from (12.16). If (12.22) fails then (12.16) has fewer equations
than coefficients so there is not a unique solution.
£ §°1 £ §
We can write ° = E Z Z 0 E Z X 0 (since the projection of X 1 onto Z is simply X 1 .) Thus (12.16) is
the same as
£ §°1 £ §°1 £ §
E Z Z0 E [Z Y1 ] = E Z Z 0 E ZX0 Ø
or
£ §
E [Z Y1 ] = E Z X 0 Ø
which is a set of ` equations with k unknowns. This has a unique solution if (and only if)
° £ §¢
rank E Z X 0 = k (12.23)

which was listed in (12.7) as a condition of Definition 12.1. (Indeed, this is why it was listed as part
Essas condições
of the definition.) sãoalsochamadas
We can deand
see that (12.22) condições de relevância.
(12.23) are equivalent ways of expressing the same
requirement. If this condition fails then Ø will not be identified. The condition (12.22)-(12.23) is called
the relevance condition.
It is useful to have explicit expressions for the solution Ø. The easiest case is when ` = k. Then (12.22)
°1
implies ° is invertible, so the structural parameter equals Ø = ° ∏. It is a unique solution because ° and
∏ are unique and ° is invertible.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 35 / 59


Endogeneidade e Variável Instrumental
1 Introdução

2 Visão Geral
3 Exemplos

4 Variável Instrumental
Forma Reduzida
Identificação
Estimador de Variáveis Instrumentais
Estimador de Wald
Estimador de Mínimos Quadrados em Dois Estágios

5 Local Average Treatment Effects

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 36 / 59


Estimador de Variáveis Instrumentais
Instrumental Variable Estimator

Suppose that the model is just identified (` = k).


According to the definition of an instrumental variable, z i is an
instrumental variable if E [z i ei ] = 0.
Substituting ei = yi x 0i ,
⇥ ⇤
E z i yi x 0i =0
⇥ ⇤
E [z i yi ] E z i x 0i =0

since ` = k, has an unique solution


⇥ ⇤ 1
= E z i x 0i E [z i yi ] ,

as long as E [z i x 0i ] is invertible (again the relevance condition (ii)


is essential for identification), which holds if its rank is k (previous
slide discussion).

Nathalie Gimenes (PUC-Rio) Econometrics - Lecture 8 PUC-Rio 19 / 51

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 37 / 59


Estimador de Variáveis Instrumentais

Substituindo os momentos populacionais pelos momentos amostrais,


temos o estimador de variáveis instrumentais

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 38 / 59


Estimador de Variáveis Instrumentais
Instrumental Variable Estimator

Substituindo os momentos
Replacing the populationpopulacionais
moments by thepelos
samplemomentos amostrais,
moments gives the
instrumental variable estimator
temos o estimador de variáveis instrumentais
n
! 1 n
!
b 1X 1X
IV = z i x 0i z i yi
n n
i=1 i=1
n
! 1 n
!
X X
0
= zixi z i yi
i=1 i=1
1
= Z 0X Z 0y

Nathalie Gimenes (PUC-Rio) Econometrics - Lecture 8 PUC-Rio 20 / 51

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 38 / 59


s requires that the matrix E Z X is invertible, which holds under (12.7) or equivalently (12
The instrumental variables (IV) estimator Ø replaces population by sample moments. We
Estimador de Variáveis Instrumentais
√ !°1 √ !
1X n 1X n
b
Øiv = 0
Zi X i Zi Y1i
n i =1 n i =1
√ !°1 √ !
n
X n
X
0
= Zi X i Zi Y1i .
i =1 i =1
De forma mais geral, dada qualquer variável W ∈ Rk é comum se
e generally, given
referir aoany variable W 2 Rk it is common to refer to the estimator
estimador
√ !°1 √ !
n
X n
X
Øbiv = Wi X i0 Wi Y1i
i =1 i =1

he IV estimator
como for Ø using thede
o estimador instrument
Variável W .
Instrumental para β utilizando o
Alternatively, recall that when ` = k the structural parameter can be written as a functi
instrumento W . °1
uced form parameters as Ø = ° ∏. Replacing ° and ∏ by their least squares estimators (12.1
can construct what is called the Indirect Least Squares (ILS) estimator. Using the matr
esentations

Øbils = °
b°1 ∏b
≥° ¢°1 ° 0 ¢¥°1 ≥° 0 ¢°1 ° 0 ¢¥
= Z 0Z Z X Z Z Z Y1
Prof. Flávia Chein (PPG Economia - UFJF)
° 0
¢°1 ° ¢
0 II
MQ
° 0
¢°1 ° 0
¢ April 20, 2021 39 / 59
Estimador de Variáveis Instrumentais

De modo alternativo, lembre-se que, quando l = k, o parâmetro


estrutural pode ser escrito como função da forma reduzida dos
parâmtros: β = Γ−1 λ. Substituindo Γe λ por seus estimadores OLS,
podemos construir o que chamados de ILS estimator - Estimador
Indireto de Mínimos Quadrados.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 40 / 59


i =1 i =1

Estimador
e generally, de variable
given any Variáveis
W 2 RInstrumentais
k
it is common to refer to the estimator
√ !°1 √ !
n
X X n
Øbiv = 0
Wi X i Wi Y1i
De modo alternativo, lembre-se
i =1
que, quando i =1
l=
k, o parâmetro
estrutural pode ser escrito como função da forma reduzida dos
he IV estimator for Ø using
parâmtros: β = the
Γ−1instrument W.
λ. Substituindo Γe λ por seus estimadores OLS,
Alternatively, recall that when ` = k the structural parameter can be written as a functi
podemos construir o que chamados de ILS estimator - Estimador
uced form parameters as Ø = °°1 ∏. Replacing ° and ∏ by their least squares estimators (12.1
Indireto de Mínimos Quadrados.
can construct what is called the Indirect Least Squares (ILS) estimator. Using the matr
Pela
esentations representação de álgebra matricial:

Øbils = ° b
b°1 ∏
≥° ¢°1 ° 0 ¢¥°1 ≥° 0 ¢°1 ° 0 ¢¥
= Z 0Z Z X Z Z Z Y1
° 0 ¢°1 ° 0 ¢ ° 0 ¢°1 ° 0 ¢
= Z X Z Z Z Z Z Y1
° 0 ¢°1 ° 0 ¢
= Z X Z Y1 .

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 40 / 59


Estimador de Variáveis Instrumentais

Podemos dizer, portanto, que o estimador ILS é idêntico ao IV.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 41 / 59


Estimador de Variáveis Instrumentais

Podemos dizer, portanto, que o estimador ILS é idêntico ao IV.


0
Dado o estimador IV definimos o resíduo: êi = Y1i − Xi β̂IV . Ele
satisfaz:

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 41 / 59


Estimador de Variáveis Instrumentais

Podemos dizer, portanto, que o estimador ILS é idêntico ao IV.


0
Dado o estimador IV definimos o resíduo: êi = Y1i − Xi β̂IV . Ele
satisfaz:

0 0 0 0 0
Z ê = Z Y1 − Z X (Z X )−1 (Z Y1 ) = 0

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 41 / 59


Estimador de Variáveis Instrumentais

Podemos dizer, portanto, que o estimador ILS é idêntico ao IV.


0
Dado o estimador IV definimos o resíduo: êi = Y1i − Xi β̂IV . Ele
satisfaz:

0 0 0 0 0
Z ê = Z Y1 − Z X (Z X )−1 (Z Y1 ) = 0
Dado que Z inclui o intercepto, isso significa que os resíduos somam
zero e não estão correlacionados com os instrumentos incluídos e
excluídos.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 41 / 59


Estimador de Variáveis Instrumentais

Podemos dizer, portanto, que o estimador ILS é idêntico ao IV.


0
Dado o estimador IV definimos o resíduo: êi = Y1i − Xi β̂IV . Ele
satisfaz:

0 0 0 0 0
Z ê = Z Y1 − Z X (Z X )−1 (Z Y1 ) = 0
Dado que Z inclui o intercepto, isso significa que os resíduos somam
zero e não estão correlacionados com os instrumentos incluídos e
excluídos.
Para ilustrar a regressão IV, estimamos as equações de forma reduzida
para a proximidade da faculdade (faculdade), agora tratando educação
como endógena e usando faculdade como variável instrumental.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 41 / 59


included and excluded instruments.
To illustrate IV regression, we estimate the reduced form equations for college proximity, now treating
Estimador de Variáveis Instrumentais
education as endogenous and using college as an instrumental variable. The reduced form equations for
log(wage) and education are reported in the first and second columns of Table 12.2.

Table 12.2: Reduced Form Regressions

log(wage) education education experience experience2 /100 education


experience 0.053 °0.410 °0.413
(0.007) (0.032) (0.032)
experience2 /100 °0.219 0.073 0.093
(0.033) (0.170) (0.171)
black °0.264 °1.006 °1.468 1.468 0.282 °1.006
(0.018) (0.088) (0.115) (0.115) (0.026) (0.088)
south °0.143 °0.291 °0.460 0.460 0.112 °0.267
(0.017) (0.078) (0.103) (0.103) (0.022) (0.079)
urban 0.185 0.404 0.835 °0.835 °0.176 0.400
(0.017) (0.085) (0.112) (0.112) (0.025) (0.085)
college 0.045 0.337 0.347 °0.347 °0.073
(0.016) (0.081) (0.109) (0.109) (0.023)
public 0.430
(0.086)
private 0.123
(0.101)
age 1.061 °0.061 °0.555
(0.296) (0.296) (0.065)
age2 /100 °1.876 1.876 1.313
(0.516) (0.516) (0.116)
F 17.51 8.22 1581 1112 13.87

Of particular interest is the equation for the endogenous regressor (education), and the coefficients
. for the excluded instruments – in this case college. The estimated coefficient equals 0.347 with a small
standard error. This implies that growing up near a 4-year college increases average educational attain-
Prof. Flávia Chein ment
(PPGbyEconomia
0.3 years.- This
UFJF) MQ magnitude.
seems to be a reasonable II April 20, 2021 42 / 59
Endogeneidade e Variável Instrumental
1 Introdução

2 Visão Geral
3 Exemplos

4 Variável Instrumental
Forma Reduzida
Identificação
Estimador de Variáveis Instrumentais
Estimador de Wald
Estimador de Mínimos Quadrados em Dois Estágios

5 Local Average Treatment Effects

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 43 / 59


Estimador de Wald

Em muitos casos, incluindo o exemplo de proximidade de Card, o


instrumento excluído é uma variável binária (dummy).

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 44 / 59


Estimador de Wald

Em muitos casos, incluindo o exemplo de proximidade de Card, o


instrumento excluído é uma variável binária (dummy).
Vamos nos concentrar nesse caso e supor que o modelo tenha apenas
um regressor endógeno e nenhum outro regressor além do intercepto.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 44 / 59


Estimador de Wald

Em muitos casos, incluindo o exemplo de proximidade de Card, o


instrumento excluído é uma variável binária (dummy).
Vamos nos concentrar nesse caso e supor que o modelo tenha apenas
um regressor endógeno e nenhum outro regressor além do intercepto.
O modelo pode ser escrito em Y = X β + α + e com E[e|Z ] = 0 e Z
binário.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 44 / 59


Estimador de Wald

Em muitos casos, incluindo o exemplo de proximidade de Card, o


instrumento excluído é uma variável binária (dummy).
Vamos nos concentrar nesse caso e supor que o modelo tenha apenas
um regressor endógeno e nenhum outro regressor além do intercepto.
O modelo pode ser escrito em Y = X β + α + e com E[e|Z ] = 0 e Z
binário.
Considere as expectativas da equação estrutural dado Z = 1 e Z = 0,
respectivamente. Nós obtemos

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 44 / 59


i =1 i =1
√ !°1 √ !
Estimador de Wald n ≥
X ¥≥ ¥0 n ≥
X ¥≥ ¥
= Zi ° Z Xi ° X Zi ° Z Y1i ° Y 1 .
i =1 i =1

Thus the demeaning equations for least squares carry over to the IV estimator. The coeffi
ator Øbiv isEm
a function
muitosonly of the
casos, demeaned
incluindo data.
o exemplo de proximidade de Card, o
instrumento excluído é uma variável binária (dummy).
2.11 Wald
VamosEstimator
nos concentrar nesse caso e supor que o modelo tenha apenas
um regressor endógeno e nenhum outro regressor além do intercepto.
In many cases, including the Card proximity example, the excluded instrument is a binar
O modelo
riable. Let’s focus on pode ser and
that case, escrito em Ythat
suppose =the
X βmodel
+α+ e just
has comoneE[e|Z ]=0eZ
endogenous regres
her regressors beyond the intercept. The model can be written as Y = X Ø + Æ + e with E [e |
binário.
binary.
Considere as expectativas da equação estrutural dado Z = 1 e Z = 0,
Take expectations of the structural equation given Z = 1 and Z = 0, respectively. We obtai
respectivamente. Nós obtemos
E [Y | Z = 1] = E [X | Z = 1] Ø + Æ
E [Y | Z = 0] = E [X | Z = 0] Ø + Æ.

btracting and dividing, we obtain an expression for the slope coefficient

E [Y | Z = 1] ° E [Y | Z = 0]
Ø= .
E [X | Z = 1] ° E [X | Z = 0]
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 44 / 59
E [Y | Z = 1] = E [X | Z = 1] Ø + Æ
Estimador de Wald E [Y | Z = 0] = E [X | Z = 0] Ø + Æ.

Obtemos
Subtracting a seguinte
and dividing, expressão
we obtain paraforothe
an expression coeficiente de inclinação
slope coefficient

E [Y | Z = 1] ° E [Y | Z = 0]
Ø= . (1
E [X | Z = 1] ° E [X | Z = 0]

The natural moment estimator replaces the expectations by the averages within the “grouped d
where Zi = 1 and Zi = 0, respectively. That is, define the group means
Pn Pn
Zi Yi i =1 (1 ° Zi ) Yi
Y 1 = Pi =1n , Y 0 = Pn
Z i (1 ° Zi )
Pni =1 Pni =1
i =1 Z i X i i =1 (1 ° Zi ) X i
X1 = P n , X0 = P n
Z
i =1 i i =1 (1 ° Zi )

leading to the moment estimator


Y 1 °Y 0
Øb = . (1
X1°X0
This is known as the “Wald estimator” as it was proposed by Wald (1940).
These expressions are rather insightful. (12.27) shows that the structural slope coefficient is th
pected change in Y due to changing the instrument divided by the expected change in X due to chan
the instrument. Informally, it is the change in Y (due to Z ) over the change in X (due to Z ). Equa
(12.28) shows that the slope coefficient can be estimated by a simple ratio in means.
The Chein
Prof. Flávia expression (12.28)
(PPG Economia may appear like a distinct
- UFJF) MQ II estimator from the IV estimator Øbiv , but45
April 20, 2021 it /turn
59
E [Y | Z = 1] = E [X | Z = 1] Ø + Æ
Estimador de Wald E [Y | Z = 1] = E [X | Z = 1] Ø + Æ
E [Y | Z = 0] = E [X | Z = 0] Ø + Æ.
E [Y | Z = 0] = E [X | Z = 0] Ø + Æ.
Obtemos
Subtracting a seguinte
and dividing, expressão
we obtain paraforothe
an expression coeficiente de inclinação
slope coefficient
Subtracting and dividing, we obtain an expression for the slope coefficient
E [Y | Z = 1] ° E [Y | Z = 0]
Ø =E [Y | Z = 1] ° E [Y | Z = 0] . (1
Ø = E [X | Z = 1] ° E [X | Z = 0]. (12
E [X | Z = 1] ° E [X | Z = 0]
The natural moment estimator replaces the expectations by the averages within the “grouped d
The O
natural momentnatural
estimador estimatorde
replaces
momentos the expectations
substituibyas theexpecativas
averages within the “grouped d
pelas
where Zi = 1 and Zi = 0, respectively. That is, define the group means
where Zmédias
i = 1 and dentro
Zi = 0, respectively.
dos dados That is, define theem
agrupados, group
que means
Z = 0 e Z = 1
P P i i
Pnn Zi Yi Pnn (1 ° Zi ) Yi
i =1Zi Yi i =1(1 ° Zi ) Yi
Y1= P i =1 , Y = P
i =1
Y 1 = Pnn Zi , Y 00= Pnn (1 ° Zi )
=1Zi
Pni i=1 P i =1(1 ° Zi )
Pn Zi X i Pnni =1 (1 ° Zi ) X i
i =1Zi X i i =1(1 ° Zi ) X i
X = iP =1 , X = iP =1n
X 11= P ni =1 Zi ,
n X 00= P ni =1 (1 ° Zi )
Z
i =1 i i =1 (1 ° Zi )
leading to the moment estimator
leading to the moment estimator
Y 1 °Y 0
Øb =Y 1 ° Y 0 . (1
Øb = X ° X . (12
X 11° X 00
This is known as the “Wald estimator” as it was proposed by Wald (1940).
This is known as the “Wald estimator” as it was proposed by Wald (1940).
These expressions are rather insightful. (12.27) shows that the structural slope coefficient is th
These expressions are rather insightful. (12.27) shows that the structural slope coefficient is the
pected change in Y due to changing the instrument divided by the expected change in X due to chan
pected change in Y due to changing the instrument divided by the expected change in X due to chan
the instrument. Informally, it is the change in Y (due to Z ) over the change in X (due to Z ). Equa
the instrument. Informally, it is the change in Y (due to Z ) over the change in X (due to Z ). Equa
(12.28) shows that the slope coefficient can be estimated by a simple ratio in means.
(12.28) shows that the slope coefficient can be estimated by a simple ratio in means.
The Chein
expression (12.28) may appear like a distinct
MQ II estimator from the IV estimator b
Prof. Flávia (PPG Economia - UFJF) bØiv , but45
April 20, 2021 it /turn
59
Z binary.
E [Y | Z = 1] =given
Take expectations of the structural E [X | ZZ = =11]and
Ø+Æ
Estimador de Wald E [Y equation
| Z = 1] = E [X | Z = 1] Ø + ÆZ = 0, respectively. We obtain
E [Y | Z = 0] = E [X | Z = 0] Ø + Æ.
E [Y | Z = 0] = E [X | Z = 0] Ø + Æ.
E [Y | Z = 1] = E [X | Z = 1] Ø + Æ
Obtemos
Subtracting a seguinte
and dividing, expressão
we obtain an parafor
expression
E [Y | Z = 0] =for
othe
E [X
coeficiente
slope
| Zslope
= 0] Ø
de inclinação
coefficient
+ Æ.
Subtracting and dividing, we obtain an expression the coefficient
E [Y | Z = 1] ° E [Y | Z = 0]
Subtracting and dividing, we obtainØan =E [Y | Z = 1]for
expression Z = 0]coefficient
[Y |slope
° Ethe . (1
Ø = E [X | Z = 1] ° E [X | Z = 0]. (12
E [X | Z = 1] ° E [X | Z = 0]
E [Y | Z = 1] ° E [Y | Z = 0]
The natural moment estimator replaces Ø = the the expectations by the. averages within the “grouped(d
The O natural momentnatural
estimador estimatorde replaces
momentos E [X | Z expectations
1] ° E [X | by
= substitui Z as =the averages within
0]expecativas the “grouped d
pelas
where Zi = 1 and Zi = 0, respectively. That is, define the group means
where Zmédias
i = 1 and dentro
Zi = 0, respectively.
dos dados That is, define theem
agrupados, groupque means
Z = 0 e Z = 1
The natural moment estimatorP Pn
replaces the expectations P by thei averagesi within the “grouped
ni =1 Zi Yi Pnn (1 ° Zi ) Yi
where Zi = 1 and Zi = 0, respectively. Y1= P i That
=1 Zi Yis,i define
, Y the
= i =1(1means
group
P
i =1 ° Z i ) Yi
Y 1 = Pnn Zi , Y 00= Pnn (1 ° Zi )
P i =1Zi P i =1(1 ° Zi )
P P
Pnnini=1 =1ZZ iXYi P nini=1 =1(1 (1°°ZZi i))XYii
XY11== iP iP
=1
=1 Z iX i
n i i ,, XY00== niP =1nn(1 ° Zi ) X i
iP=1
X 1 = Pn i =1ZZi i ,
n X 0 = Pn i =1(1 (1°°ZZii))
Pini=1=1Zi Pini=1 =1(1 ° Zi )
i =1 Z i X i i =1 (1 ° Zi ) X i
leading to the moment estimatorX 1 = Pn , X 0 = Pn
leading to the moment estimator i =1 Zide momento i =1 (1 ° Zi )
Temos, portanto, o estimador b =Y 1 ° YY00 .
Y 1 °
Ø (1
leading to the moment estimator Øb = X ° X . (12
X 11° X 00
This is known as the “Wald estimator” as it wasbproposed Y 1 ° Y 0by Wald (1940).
This is known as the “Wald estimator” as it was Øproposed = by. Wald (1940). (
These expressions are rather insightful. (12.27)Xshows 1 ° X 0 that the structural slope coefficient is th
These expressions are rather insightful. (12.27) shows that the structural slope coefficient is the
pected change
This ischange
knownin in
asYYthedue to changing
“Wald estimator” the as instrument
it was proposed dividedby by the expected change in X due to chan
pected , chamado duedeto changing
Estimador the de instrument
Wald divided
que by Wald (1940). change
the expected
é Zequivalente in X duede
ao Estimador to chan
the instrument.
These expressionsInformally, it is the
are rather change
insightful. in Y (due to ) overthe the change in X (due to Z ). Equa
the instrument. Informally, it is the change in(12.27) Y (dueshows to Z ) thatover thestructural
change inslope
X (due coefficient
to Z ). Equa is th
(12.28)
(12.28)
IV.
shows
pectedshowschange that
that Ythe
in the slope
due coefficient
to changing
slope coefficient the can
can
be estimated
instrument
be estimated
by a simple
divided
by aby
ratio in change
the expected
simple
means. in X due to cha
ratio in means.
The expression (12.28) may appear like a distinct estimator from thechange
IV estimator b butZ45
the
Prof. instrument.
Flávia Chein Informally,
(PPG Economia it is
- UFJF) the change in
MQ Y II(due to Z ) over the bØiv , to
in X20,(due
April 2021 it)./turn
Equ
59
Estimador de Wald

Essas expressões são bastante intuitivas - mostram que o coeficiente


de inclinação estrutural é a mudança esperada em Y devido à
mudança do instrumento dividido pela mudança esperada em X
devida à mudança do instrumento. Informalmente, é a mudança em
Y (devido a Z ) sobre a mudança em X (devido a Z ).

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 46 / 59


Estimador de Wald

Essas expressões são bastante intuitivas - mostram que o coeficiente


de inclinação estrutural é a mudança esperada em Y devido à
mudança do instrumento dividido pela mudança esperada em X
devida à mudança do instrumento. Informalmente, é a mudança em
Y (devido a Z ) sobre a mudança em X (devido a Z ).
A equação (12.28) mostra que o coeficiente de inclinação pode ser
estimado por uma razão simples das médias.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 46 / 59


n i =1 n i =1

Estimador
and similarly
de Wald ≥ ¥≥
X1 ° X = 1° Z X1 ° X0
¥

and hence ≥ ¥≥ ¥
1° Z Y 1 °Y 0
Øbiv = ≥ ¥≥ ¥ = Øb
1° Z X1°X0

as defined in (12.28). Thus the Wald estimator equals the IV estimator.


We can illustrate using the Card proximity example. If we estimate a simple IV model with no covari-
ates we obtain the estimate Øbiv = 0.19. If we estimate the group-mean log wages and education levels
based on the instrument college, we find

near college not near college


log(wage) 6.311 6.156
education 13.527 12.698

Based on these estimates the Wald estimator of the slope coefficient is (6.311 ° 6.156) / (13.527 ° 12.698) =
0.19, the same as the IV estimator.

12.12 Two-Stage Least Squares


The IV estimator described in the previous section presumed ` = k. Now we allow the general case
of ` ∏ k. Examining the reduced-form equation (12.13) we see

Y1 = Z 0 °Ø + u 1
E [Z u 1 ] = 0.
0
Defining W = ° Z we can write this as
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 47 / 59
Endogeneidade e Variável Instrumental
1 Introdução

2 Visão Geral
3 Exemplos

4 Variável Instrumental
Forma Reduzida
Identificação
Estimador de Variáveis Instrumentais
Estimador de Wald
Estimador de Mínimos Quadrados em Dois Estágios

5 Local Average Treatment Effects

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 48 / 59


Estimador de Mínimos Quadrados em Dois Estágios

Vimos, até aqui, o estimador IV para o caso em que l = k. Vamos


agora trabalhar com l ≥ k

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 49 / 59


education 13.527 12.698

Estimador de Mínimos Quadrados em Dois Estágios


Based on these estimates the Wald estimator of the slope coefficient is (6.311 ° 6.156) / (13.527 ° 12
0.19, the same as the IV estimator.

12.12 Vimos,
Two-Stage Least
até aqui, Squares IV para o caso em que l = k. Vamos
o estimador
agora trabalhar com l ≥ k
The IV estimator described in the previous section presumed ` = k. Now we allow the general c
of ` ∏ k.Examinando a forma reduzida,
Examining the reduced-form equation vimos que
(12.13) we see

Y1 = Z 0 °Ø + u 1
E [Z u 1 ] = 0.
0
Defining W = ° Z we can write this as

Y1 = W 0 Ø + u 1
E [W u 1 ] = 0.

One way of thinking about this is that Z is set of candidate instruments. The instrument vector W =
is a k-dimentional set of linear combinations.
0
Suppose that ° were known. Then we would estimate Ø by least squares of Y1 on W = ° Z
° ¢°1 ° 0 ¢ ≥ 0 0 ¥°1 ≥ 0 0 ¥
Øb = W 0W W Y = ° Z Z° ° Z Y1 .

While this is infeasible, we can estimate ° from the reduced form regression. Replacing ° with its e
° ¢ ° ¢
mator ° b = Z 0 Z °1 Z 0 X we obtain
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 49 / 59
education 13.527 12.698
Based on these estimates the Wald estimator of the slope coefficient is (6.311 ° 6.156) / (13.5
Estimador
Based
9, the the de
sameonasthese Mínimos
estimates Quadrados
the Wald estimator
IV estimator. em
of the slope DoisisEstágios
coefficient (6.311 ° 6.156) / (13.527 ° 12
0.19, the same as the IV estimator.

.12 Two-Stage Least Squares


12.12 Vimos,
Two-Stage Least
até aqui, Squares IV para o caso em que l = k. Vamos
o estimador
agora trabalhar com l ≥previous
The IV estimator described in the k section presumed ` = k. Now we allow the ge
The IV estimator described in the previous section presumed ` = k. Now we allow the general c
of k.
`∏ ` ∏Examining the
k.Examinando
Examining reduced-form
the equationvimos
a forma reduzida,
reduced-form equation (12.13)
(12.13) we
que
we seesee
0
YY
11 Z 0Z°Ø°Ø
== + u+1 u 1
[Zuu1 ]1=
EE[Z ]=0.0.
0 0
0
DefiningDefinindo
W = ° Z weW
can=
write
fining W= ° Z we can write Zthis,podemos
Γ̄ this as
as escrever:
Y1 = W 0 Ø0+ u 1
Y1 = W Ø + u 1
E [W u 1 ] = 0.
E [W u 1 ] = 0.
One way of thinking about this is that Z is set of candidate instruments. The instrument vector W =
eisway of thinking about
a k-dimentional this iscombinations.
set of linear that Z is set of candidate instruments. The instrument vecto
0
Suppose thatset
k-dimentional ° were known.
of linear Then we would estimate Ø by least squares of Y1 on W = ° Z
combinations.
0
Suppose that ° were known. Then ° 0 we
¢°1would ≥ 0
° 0 ¢estimate Ø¥°1
by≥ least ¥
0 0 squares of Y 1 on W = ° Z
Øb = W W W Y = ° Z Z° 0
1 °Z Y .
° 0 ¢°1 ° 0 ¢ ≥ 0 0 ¥°1 ≥ 0 0 ¥
Øb = W W W Y = ° Z Z° ° Z Y1 .
While this is infeasible, we can estimate ° from the reduced form regression. Replacing ° with its e
° ¢ ° ¢
mator ° b = Z 0 Z °1 Z 0 X we obtain
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 49 / 59
education 13.527 12.698
Two-Stage
Based Leastthe
on these estimates Squares
Wald estimator of the slope coefficient is (6.311 ° 6.156) / (13.5
Estimador de Mínimos
Based
9, the sameon these
as the estimates
IV the
estimator. Quadrados
Wald estimator em
of the slope DoisisEstágios
coefficient (6.311 ° 6.156) / (13.527 ° 12
IV0.19, the samedescribed
estimator as the IV estimator.
in the previous section presumed ` = k. Now we allow th
Examining the reduced-form equation (12.13) we see
.12 Two-Stage Least Squares
12.12 Vimos,Two-Stage Least
até aqui, Squares IV para o caso em que l = k. Vamos
o estimador
TheThe agora
IV estimatortrabalhar
describedcom
in l ≥previous
the k = Z 0 °Øpresumed
Y1section + u1 k. Now we allow the gec
IV estimator described in the previous section presumed ` = `k.=Now we allow the general
of k.
`∏ ` ∏Examining
k.Examinando
Examiningthe reduced-form
the E [Z u 1vimos
equation
a forma reduzida,
reduced-form equation = 0. we
](12.13)
(12.13) we
queseesee
0 0
YY
11 Z 0Z°Ø°Ø
== + u+1 u 1
W = ° Z we can write this as
[Zuu1 ]1=
EE[Z ]=0.0.

0
0 0 Y1 = W 0 Ø + u 1
DefiningDefinindo
W = ° Z weW
can=
writeZthis,podemos
Γ̄ this as escrever:
fining W= ° Z we can write as
E [W u 1 ] = 0.0
Y1 = W Ø0+ u 1
Y1 = W Ø + u 1
E [W u 1 ] = 0.
of thinking about this is that Z is set of ucandidate instruments. The instrument v
E [W 1 ] = 0.
mentional
One way of set of linear
thinking about combinations.
this is that Z is set of candidate instruments. The instrument vector W =
eose
iswaythat ° were
of Se
thinking
a k-dimentional known.
about
set of thisThen
linear
Γ̄ for conhecida, weZ would
is set ofestimate
iscombinations.
that
estimamos by least squares
candidateØinstruments. of Y1 on Wvecto
The instrument =°
0
Suppose thatset
k-dimentional ° were known.
of linear Then we would estimate Ø by least squares of Y1 on W = ° Z
combinations.
° 0 ¢°1 ° 0 ¢ ≥≥ 0 0 ¥ ¥≥°1 ≥ 0 ¥ 0 ¥ 0
b
Suppose that ° were known.
Ø = W °W0 we
Then ¢°1would
W° 0Y ¢estimate
= °0 Z
0 Z°
Ø°1by least
0 0° squares
Z Y 1 . of Y1 on W = ° Z
Øb = W W W Y = ° Z Z° 1 °Z Y .
° 0 ¢°1 ° 0 ¢ ≥ 0 0 ¥°1 ≥ 0 0 ¥
Øb = W W W Y = ° Z Z° ° Z Y1 .
isWhile
is infeasible, we canwe estimate ° °from
from the reduced form regression. Replacing
° with its °
° 0 this ¢ °is° infeasible,
b °1 0 0 °1¢
¢ ° 0 ¢
can estimate the reduced form regression. Replacing e
mator
=Prof.Z Flávia = Z Z
Z CheinZ(PPG
° Z X
X Economiawe
we obtainobtain
- UFJF) MQ II April 20, 2021 49 / 59
Estimador de Mínimos Quadrados em Dois Estágios

Dado que é não factível, substituímos Γ̄ pelo estimador


0 0
Γ̂ = (Z Z )−1 (Z X )

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 50 / 59


mentional set of linear combinations.
Estimador de Mínimos Quadrados em Dois Estágios
pose that ° were known. Then we would estimate Ø by least squares of Y1 on W =
° ¢°1 ° 0 ¢ ≥ 0 0 ¥°1 ≥ 0 0 ¥
Øb = W 0W W Y = ° Z Z° ° Z Y1 .

his is infeasible, weécan


nãoestimate from the reduced
factível, °substituímos Γ̄ pelo form regression. Replacing
° 0 ¢Dado que
°1 ° 0 0 ¢ −1 0
estimador
= Z Z Γ̂ = Z(ZX Z we
) obtain
(Z X )
° 0 0 ¢°1 ° 0 0 ¢
Øb2sls = °b Z Z°b b Z Y1
°
≥ ° ¢ ¥°1
°1 0 ° 0 ¢°1 0 ° ¢°1 0
= X 0Z Z 0Z Z Z Z Z Z X X 0Z Z 0Z Z Y1
≥ ° ¢ ¥°1 ° ¢
°1 0 °1 0
= X 0Z Z 0Z Z X X 0Z Z 0Z Z Y 1.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 50 / 59


mentional set of linear combinations.
Estimador de Mínimos Quadrados em Dois Estágios
pose that ° were known. Then we would estimate Ø by least squares of Y1 on W =
° ¢°1 ° 0 ¢ ≥ 0 0 ¥°1 ≥ 0 0 ¥
Øb = W 0W W Y = ° Z Z° ° Z Y1 .

his is infeasible, weécan


nãoestimate from the reduced
factível, °substituímos Γ̄ pelo form regression. Replacing
° 0 ¢Dado que
°1 ° 0 0 ¢ −1 0
estimador
= Z Z Γ̂ = Z(ZX Z we
) obtain
(Z X )
° 0 0 ¢°1 ° 0 0 ¢
Øb2sls = °b Z Z°b b Z Y1
°
≥ ° ¢ ¥°1
°1 0 ° 0 ¢°1 0 ° ¢°1 0
= X 0Z Z 0Z Z Z Z Z Z X X 0Z Z 0Z Z Y1
≥ ° ¢ ¥°1 ° ¢
°1 0 °1 0
= X 0Z Z 0Z Z X X 0Z Z 0Z Z Y 1.

O estimador de 2SLS é, portanto, uma generalização do estimador de


IV.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 50 / 59


Estimador de Mínimos Quadrados em Dois Estágios

Por que a denominação 2sls?

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 51 / 59


Estimador
This isde Mínimos
an IV estimatorQuadrados emprevious
as defined in the section using Xb as an
Dois Estágios
Third, since P Z is idempotent, we can also write the 2SLS estimator
° ¢°1 0 ≥ ¥°1
Øb2sls = X 0 P Z P Z X X PZY 1 = Xb 0X
b b
X

which is the least squares estimator obtained by regressing Y1 on the fit


This
Por que is the source of
a denominação the “two-stage” name is since it can be comput
2sls?
° ¢ ° ¢
b = Z 0 Z °1 Z 0 X and X
• Regress X on Z : ° b = PZ X.
b = Z°
≥ ¥°1
• Regress Y1 on Xb : Øb2sls = Xb 0X
b b 0Y 1.
X

b . Recall, X = [Z 1 , Y 2 ] and Z
It is useful to scrutinize the projection X
£ § £ §
b
Z 1 since Z 1 lies in the span of Z . Then X = X b 1 , Yb 2 = Z 1 , Yb 2 . This sh
regress Y1 on Z1 and Yb2 . This means that only the endogenous variabl
values, Yb2 = °
b0 Z1 + °
12
b0 Z2 .
22

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 51 / 59


Consistência do 2SLS

Conjunto de condições de regularidade

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 52 / 59


Consistência do 2SLS

CHAPTER 12. INSTRUMENTAL VARIABLES


Conjunto de condições de regularidade
Assumption 12.1

1. The variables (Y1i , X i , Zi ), i = 1, ..., n, are independent and identically dis-


tributed.
£ §
2. E Y12 < 1.

3. E kX k2 < 1.

4. E kZ k2 < 1.
£ §
5. E Z Z 0 is positive definite.
£ §
6. E Z X 0 has full rank k.

7. E [Z e] = 0.

Assumptions 12.1.2-4 state that all variables have finite variances. Assumption 12.1.5 states tha
instrument
Prof. Flávia Cheinvector has an -invertible
(PPG Economia design matrix,
UFJF) MQ II which is identical to the core
April assumption
20, 2021 52abou
/ 59
Consistência do 2SLS
Assumptions 12.1.2-4 state that all variables have finite variances. Assumption 12.1.5 states tha
instrument vector has an invertible design matrix, which is identical to the core assumption abou
gressors in the linear regression model. This excludes linearly redundant instruments. Assumpt
12.1.6 and 12.1.7 are the key identification conditions for instrumental variables. Assumption 1
states that the instruments and regressors have a full-rank cross-moment matrix. This is often called
relevance condition. Assumption 12.1.7 states that the instrumental variables and structural erro
uncorrelated. Assumptions 12.1.5-7 are identical to Definition 12.1.

Theorem 12.1 Under Assumption 12.1, Øb2sls °! Ø as n ! 1.


p

The proof of the theorem is provided below.


This theorem shows that the 2SLS estimator is consistent for the structural coefficient Ø under sim
moment conditions as the least squares estimator. The key differences are the instrumental varia
° £ §¢
assumption E [Z e] = 0 and the identification assumption rank E Z X 0 = k.
The result includes the IV estimator (when ` = k) as a special case.
The proof of this consistency result is similar to that for the least squares estimator. Take the st
tural equation Y = X Ø + e in matrix format and substitute it into the expression for the estimator
obtain
≥ ° ¢°1 0 ¥°1 0 ° 0 ¢°1 0 ° ¢
Øb2sls = X 0 Z Z 0 Z Z X X Z Z Z Z XØ+e
≥ ° ¢ ¥°1 ° ¢
Prof. Flávia Chein (PPG Economia - UFJF) 0 °1 II 0
0 MQ 0 0 °1 0 April 20, 2021 53 / 59
Consistência do 2SLS
Assumptions 12.1.2-4 state that all variables have finite variances. Assumption 12.1.5 states tha
instrument vector has an invertible design matrix, which is identical to the core assumption abou
gressors in the linear regression model. This excludes linearly redundant instruments. Assumpt
12.1.6 and 12.1.7 are the key identification conditions for instrumental variables. Assumption 1
states that the instruments and regressors have a full-rank cross-moment matrix. This is often called
relevance condition. Assumption 12.1.7 states that the instrumental variables and structural erro
uncorrelated. Assumptions 12.1.5-7 are identical to Definition 12.1.

Theorem 12.1 Under Assumption 12.1, Øb2sls °! Ø as n ! 1.


p

TheA prova
proof é theorem
of the similar isa provided
que vimos below.para OLS.
This theorem shows that the 2SLS estimator is consistent for the structural coefficient Ø under sim
moment conditions as the least squares estimator. The key differences are the instrumental varia
° £ §¢
assumption E [Z e] = 0 and the identification assumption rank E Z X 0 = k.
The result includes the IV estimator (when ` = k) as a special case.
The proof of this consistency result is similar to that for the least squares estimator. Take the st
tural equation Y = X Ø + e in matrix format and substitute it into the expression for the estimator
obtain
≥ ° ¢°1 0 ¥°1 0 ° 0 ¢°1 0 ° ¢
Øb2sls = X 0 Z Z 0 Z Z X X Z Z Z Z XØ+e
≥ ° ¢ ¥°1 ° ¢
Prof. Flávia Chein (PPG Economia - UFJF) 0 °1 II 0
0 MQ 0 0 °1 0 April 20, 2021 53 / 59
We now show that the 2SLS estimator satisfies a central limit theorem. We first state a set of suffic
Disitribuição Assintótica do 2SLS
regularity conditions.

Assumption 12.2 In addition to Assumption 12.1,


£ §
1. E Y14 < 1.

2. E kZ k4 < 1.
£ §
3. ≠ = E Z Z 0 e 2 is positive definite.

Assumption 12.2 strengthens Assumption 12.1 by requiring that the dependent variable and ins
ments have finite fourth moments. This is used to establish the central limit theorem.

Theorem 12.2 Under Assumption 12.2, as n ! 1.


p ° ¢ ° ¢
n Øb2sls ° Ø °! N 0,V Ø
d

where
° ¢°1 ° ¢° ¢°1
V Ø = Q X Z Q °1
ZZQZX Q X Z Q °1 °1 °1
Z Z ≠Q Z Z Q Z X Q X Z Q Z Z Q Z X .
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 54 / 59
Assumption
We now show 12.2 estimator
that the 2SLS In addition
Disitribuição Assintótica do 2SLS to Assumption
satisfies a central12.1,
limit theorem. We first state a set of suffic
regularity conditions.£ §
1. E Y14 < 1.

2. E kZ k4 < 1.
Assumption 12.2 In addition to Assumption 12.1,
£ §
3. ≠£= E§ Z Z 0 e 2 is positive definite.
4
1. E Y1 < 1.

2. E kZ k4 < 1.
£ §
Assumption3.12.2 ≠= E Z Z 0 e 2 isAssumption
strengthens 12.1 by requiring that the dependent variable and in
positive definite.
ments have finite fourth moments. This is used to establish the central limit theorem.

AssumptionTheorem 12.2 Under


12.2 strengthens Assumption
Assumption 12.2,
12.1 byas n ! 1. that the dependent variable and ins
requiring
ments have finite fourth moments. Thispis °used to establish
¢ ° the central
¢ limit theorem.
n Øb2sls ° Ø °! N 0,V Ø
d

where
Theorem 12.2 Under Assumption 12.2, as n ! 1.
° p¢°1° °Q Q °1 ¢ ° ¢¢ ° ¢°1
V Ø = Q X Z Q °1
ZZQZX n Ø b2sls ≠QN°1
X Z° ØZ Z°! Q Z X Q X Z Q °1
Z Z0,V ZZQZX .
Ø
d

where
° ¢°1 ° p ¢° ¢°1
This shows thatVthe Ø =2SLS Q °1
Q X Zestimator
ZZQZX Q X Z Q °1
converges at a °1n rate to a normal°1 random
Z Z ≠Q Z Z Q Z X Q X Z Q Z Z Q Z X . vector. It show
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 54 / 59
Disitribuição Assintótica do 2SLS


Isso mostra que o estimador 2SLS converge a uma taxa n para um
vetor aleatório normal.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 55 / 59


Disitribuição Assintótica do 2SLS


Isso mostra que o estimador 2SLS converge a uma taxa n para um
vetor aleatório normal.
Mostra também a forma da matriz de covariância. O último assume
uma forma substancialmente mais complicada do que o estimador de
mínimos quadrados.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 55 / 59


Disitribuição Assintótica do 2SLS


Isso mostra que o estimador 2SLS converge a uma taxa n para um
vetor aleatório normal.
Mostra também a forma da matriz de covariância. O último assume
uma forma substancialmente mais complicada do que o estimador de
mínimos quadrados.
Como no caso da estimativa de mínimos quadrados, a variância
assintótica simplifica sob a condição de homocedasticidade.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 55 / 59


12.17 Determinants of 2SLS Variance
Determinantes da Variância do 2SLS
It is instructive to examine the asymptotic variance of the 2SLS estimator to understand the fac
which determine the precision (or lack thereof) of the estimator. As in the least squares case, it is m
transparent to examine the variance under the assumption of homoskedasticity. In this case the asy
totic variance takes the form
° ¢°1 2
V 0Ø = Q X Z Q °1
ZZQZX æ
≥ £ § ° £ §¢ §¥°1 £ 2 §
°1 £
= E X Z0 E Z Z0 E ZX0 E e .

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 56 / 59


12.17 Determinants of 2SLS Variance
Determinantes da Variância do 2SLS
It is instructive to examine the asymptotic variance of the 2SLS estimator to understand the fac
which determine the precision (or lack thereof) of the estimator. As in the least squares case, it is m
transparent to examine the variance under the assumption of homoskedasticity. In this case the asy
totic variance takes the form
° ¢°1 2
V 0Ø = Q X Z Q °1
ZZQZX æ
≥ £ § ° £ §¢ §¥°1 £ 2 §
°1 £
= E X Z0 E Z Z0 E ZX0 E e .

Como no caso dos mínimos quadrados, podemos ver que a variância


está aumentando na variância do erro e e diminuindo na variância de
X.

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 56 / 59


12.17 Determinants of 2SLS Variance
Determinantes da Variância do 2SLS
It is instructive to examine the asymptotic variance of the 2SLS estimator to understand the fac
which determine the precision (or lack thereof) of the estimator. As in the least squares case, it is m
transparent to examine the variance under the assumption of homoskedasticity. In this case the asy
totic variance takes the form
° ¢°1 2
V 0Ø = Q X Z Q °1
ZZQZX æ
≥ £ § ° £ §¢ §¥°1 £ 2 §
°1 £
= E X Z0 E Z Z0 E ZX0 E e .

Como no caso dos mínimos quadrados, podemos ver que a variância


está aumentando na variância do erro e e diminuindo na variância de
X.
A diferença é que a variância está diminuindo na correlação (com
valor de matriz) entre X e Z .

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 56 / 59


12.17 Determinants of 2SLS Variance
Determinantes da Variância do 2SLS
It is instructive to examine the asymptotic variance of the 2SLS estimator to understand the fac
which determine the precision (or lack thereof) of the estimator. As in the least squares case, it is m
transparent to examine the variance under the assumption of homoskedasticity. In this case the asy
totic variance takes the form
° ¢°1 2
V 0Ø = Q X Z Q °1
ZZQZX æ
≥ £ § ° £ §¢ §¥°1 £ 2 §
°1 £
= E X Z0 E Z Z0 E ZX0 E e .

Como no caso dos mínimos quadrados, podemos ver que a variância


está aumentando na variância do erro e e diminuindo na variância de
X.
A diferença é que a variância está diminuindo na correlação (com
valor de matriz) entre X e Z .
Também é útil observar que a expressão de variância não é afetada
pela estrutura de variância de Z .

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 56 / 59


Endogeneidade e Variável Instrumental
1 Introdução

2 Visão Geral
3 Exemplos

4 Variável Instrumental
Forma Reduzida
Identificação
Estimador de Variáveis Instrumentais
Estimador de Wald
Estimador de Mínimos Quadrados em Dois Estágios

5 Local Average Treatment Effects

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 57 / 59


Local Average Treatment Effects

Em um par de artigos influentes, Imbens e Angrist (1994) e Angrist,


Imbens e Rubin (1996) propuseram uma nova interpretação do
estimador de variáveis instrumentais usando o modelo de resultados
potenciais

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 58 / 59


Local Average Treatment Effects

Em um par de artigos influentes, Imbens e Angrist (1994) e Angrist,


Imbens e Rubin (1996) propuseram uma nova interpretação do
estimador de variáveis instrumentais usando o modelo de resultados
potenciais
Uma característica particular de interesse, e enfatizada por Imbens e
Angrist (1994), é conhecida como efeito de tratamento médio local
(LATE), e é aproximadamente o efeito médio sobre aqueles afetados
pela variável instrumental.
Para entender o LATE, é útil considerar o exemplo da proximidade da
faculdade usando a estrutura de resultados potenciais. Neste quadro,
cada pessoa é totalmente caracterizada por seu u individual
inobservável. Dado u, a decisão de frequentar a faculdade é função
do indicador de proximidade Z

Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 58 / 59


NSTRUMENTAL VARIABLES
Local Average Treatment Effects
udents, proximity has no effect on their decision. For other students,
hat given Z = 1 they choose to attend college while if Z = 0 they choo
the possibilites with the following chart, which is based on labels d
bin (1996).

X (0) = 0 X (0) = 1
X (1) = 0 Never Takers Deniers
X (1) = 1 Compliers Always Takers

ns indicate the college attendence decision given Z = 0 (not close to


lege attendence decision given Z = 1 (close to a college). The four en
dividuals based on these decisions. The upper-left entry are the ind
regardless of Z . They are called “Never Takers”. The lower-right entr
y attend college regardless of Z . They are called “Always Takers”. Th
o only attend college if they live close to one. They are called “Compl
Prof. Flávia Chein (PPG Economia - UFJF) MQ II April 20, 2021 59 / 59

Você também pode gostar