Você está na página 1de 41

O Método de Variável Instrumenal

Econometria de Avaliação de Políticas Públicas


Aula 4: Variável Instrumental

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas

CEDEPLAR/UFMG

2/2009

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
O Método de Variável Instrumenal

Road Map

1 Variável Instrumental dentro do método GMM.


2 Teste de sobreidenti…cação
3 Dados Faltantes vs Combinação de Base de Dados
4 "Two- sample iv"

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Modelo Linear

Yi = Xi´ β10 + β11 Si + εi


´
Si = X1i π 10 + π 11 Z1i + νi
onde π 11 6= 0 e E [Z1i vi ] = 0.
Xi : variáveis exógenas
si : variável endógena
Z1i : vetor de variáveis instrumentais
Wi = [X1i , Si ]
β = β10, β11
Zi = [X1i , Z1i ]
Qual a hipótese de identi…cação do método de variável
instrumental?
Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Hipótese de Identi…cação

E [Zi εi ] = 0

Qualquer efeito de Z sobre Y se dá através do efeito de Z


sobre S.
Condicional no vetor X , o instrumento é não correlacionado
com os resultados potenciais (é determinado de forma
aleatória).

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Caso 1: Exatamente Identi…cado

Número de instrumentos = número de variáveis endógenas


(k ).
Momento Populacional

E [εi Zi ] = E Yi Wi0 β Zi = 0

onde Zi 2 Rk e β 2 Rk .

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Caso 1: Exatamente Identi…cado

Análogo Amostral
N
1
N ∑ Yi Wi0 b
βIV Zi = 0
i =1
" # 1 " #
N N
1 1
)b
βIV =
N ∑ Wi0 Zi N ∑ Yi Zi
i =1 i =1

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Caso 2: Caso sobreidenti…cado

Número de instrumentos (L) > número de variáveis


endógenas (K )
Zi = [X1i , Zi 1 , ..., Zi 2 ]
Idéia: Usar uma combinação linear das variáveis instrumentais
como instrumento para S.
Para fazer isso, temos que multiplixar o vetor ZL x1 por uma
b LxK :
matriz Π
b
Π´Z
Π pode ser aleatório ou não-aleatório.
b
Quais são as nossas opções para Π?

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Caso 2: Caso sobreidenti…cado


b
Quais são as nossas opções para Π?
Eliminar alguns instrumentos:
b = [IK , 0]
Π´

MQO em dois estágios:


" # 1 " #
N N
1 1
N i∑ ∑ Zi Wi
b =
Π´ Zi´Zi
=1i N i =1

GMM
1
1 N 0 1 N 2
b =
Π´ ∑ Z Wi ∑ Yi Wi0 b
β Zi Zi0
N i =1 i N i =1

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Caso 2: Caso sobreidenti…cado

b
Qual são os requisitos mínimo para Π?
b tem que ter dimensão K xL.
Π

b !p Π
Π

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Caso 2: Caso sobreidenti…cado

Como a dimensão de Z Π b é a mesma de X , podemos substituir


b
Z Π na fórmula do estimador e usar o estimador generalizado de
variáveis instrumentais (ou o estimador do método generalizado
dos momentos):
" # 1 " #
N N
1 1
b
βGIV =
N ∑ b i´Zi
Wi0 Π
N ∑ Yi Πb i´Zi
i =1 i =1

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Caso 2: Caso sobreidenti…cado


O método GMM

Neste caso, temos mais momentos dos que parâmetros.


Temos um sistema com L momentos (L > K ),

m ( β) = E [εi Zi ] = E Yi Wi0 β Zi = 0

onde Zi 2 RL e β 2 Rk .
Pode ser que não exista solução para o análogo amostral deste
sistema de momentos.

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Caso 2: Caso sobreidenti…cado


O método GMM

Estimador semelhante ao caso exatamente identi…cado que


faça com que mN ( β) seja próximo de zero

b
βGMM = arg min SN ( β) (1)
β2Θ

com
SN ( β) = [mN ( β)]0 AN mN ( β)
AN é uma matriz de pesos positiva semide…nida, AN !p A0 .
No caso de variáveis instrumentais,
2 1
A0 = E Yi Wi0 b
β Zi Zi0

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Caso 2: Caso sobreidenti…cado


O método GMM

Estimador de GMM
(" #
N
1
b
βGMM = arg min
θ 2Θ N ∑ Yi Wi0 β Zi AN
i =1
" #0 )
N
1
N ∑ Yi Wi0 β Zi
i =1

2 1
onde AN = 1
N ∑N
i =1 Yi Wi0 b
β Zi Zi0 .

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

b
βGMM =

" 1
# 1
1 N 0 1 N 2 1 N
∑ Z Wi ∑ Yi Wi0 b
β Zi Zi0 ∑ W 0 Zi
N i =1 i N i =1 N i =1 i
" 1
#
1 N 0 1 N 2 1 N
∑ Z Wi ∑ Yi Wi0 b
β Zi Zi0 ∑ Yi Zi
N i =1 i N i =1 N i =1

O estimador de GMM escolhe A0 que minimiza a variância.

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Suponha que a hipótese de homocedasticidade seja válida:


2
E Yi Wi0 b
β Zi Zi0 = σ2 E Zi Zi0

Neste caso, estamos de volta ao estimador de MQO em dois


estágios.

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Caso 2: Caso sobreidenti…cado


O método GMM

Estimador de GMM
(" #
N
1
b
βGMM = arg min
θ 2Θ N ∑ Yi Wi0 β Zi AN
i =1
" #0 )
N
1
N ∑ Yi Wi0 β Zi
i =1

h i 1
onde AN = 1
σ2
1
N ∑N
i =1 Zi Zi
0 .

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Caso 2: Caso sobreidenti…cado


O método GMM

b
βMQO =

" 1
# 1
1 N 0 1 N 1 N
∑ Z Wi ∑ Zi Zi0 ∑ W 0 Zi
N i =1 i N i =1 N i =1 i
" 1
#
1 N 0 1 N 1 N
∑ Z Wi ∑ Zi Zi0 ∑ Yi Zi
N i =1 i N i =1 N i =1

Sob a hipótese de homocedasticidade, o estimador ótimo de


GMM é assintoticamente equivalente ao estimador de MQO
em dois estágios.

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Teste de sobreidenti…cação

Hipótese nula:

H0 : m ( Y , W , Z , β ) E Yi Wi0 β Zi = 0

Suponha que particionaremos o nosso modelo

m 1 (Y , W , Z , β )
m (Y , W , Z , β ) =
m 2 (Y , W , Z , β )

onde m1 (Y , W , Z , β) é K x1 e m2 (Y , W , Z , β) é (L K )x1.

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Teste de sobreidenti…cação

Modelo aumentado
m 1 (Y , W , Z , β )
e (Y , W , Z , β ) =
m
m 2 (Y , W , Z , β ) + ψ

onde ψ é um vetor (L K ) adicional de parâmetros .


Neste modelo aumentado, queremos testar a hipótese nula:
H0 : ψ = 0.

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Teste de sobreidenti…cação

Estatística do Teste:
h i
DM = 2N SeN b
βN , 0 eN β , ψ
S N N
d
2NSN b
βN ! XL2 K

eN β , ψ = 0?
Por que S N N

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Dados Faltantes (Missing Data)

fDi , Xi , Yi gNi=1 são variáveis aleatórias i.i.d que foram


"selecionadas" da mesma população.
Esta população é caracterizada por uma distribuição
desconhecida F0 .
D = 1: observamos X e Y .
D = 0: observamos somente X .

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Dados Faltantes (Missing Data)

O nosso parâmetro de interesse é γ0 que satisfaz o seguinte


momento:
Z Z
E [Ψ (X , Y , γ0 )] = Ψ (x, y , γ0 ) fX ,Y (x, y ) dxdy = 0

Problema: Não podemos identi…car γ0 pelo nosso processo


amostral dado que não observamos Y para todos.
No processo amostral, identi…camos F Y jD ,X ( y j D = 1, x ) e
FD ,X (d, x ) .

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Dados Faltantes (Missing Data)

Exemplo: Efeito de tratamento Médio


D = 1: indivíduo é participante de um programa ou uma
intervenção
D = 0: indivíduo está fora da intervenção do programa
Y1 e Y0 : resultados potenciais
fDi , Xi , Y1i , Y0i gNi=1 são variáveis aleatórias i.i.d que foram
"selecionadas" da mesma população.

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Dados Faltantes (Missing Data)

ATE (Não identi…cado):

γ0 = E [Y1 Y0 ]

Identi…camos: F Y 1 jD ,X ( y j D = 1, x ) ,
F Y 0 jD ,X ( y j D = 0, x ) e FD ,X (d, x ) .

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Combinação de Base de Dados

Z = (W´, X´, Y´)´ é um vetor aleatório de uma população de


estudo com distribuição Fs .
A única restrição a priori é que para um único γ0 :

Es [ψ (Z , γ0 )] = 0

Problema: Não temos uma amostra aleatória de Z .

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Combinação de Base de Dados

Temos acesso a duas bases de dados separadas


Amostra que vem da população de interesse: Ns medidas
de (Y , W )
Amostra que vem de uma população auxiliar: Na medidas de
(X , W )
A distribuição conjunta de Z na população de interesse e na
população auxiliar podem ou não coincidir.

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Combinação de Base de Dados

Exemplo: Efeito Médio do Tratamento sobre os tratados


D = 1: indivíduo é participante de um programa ou uma
intervenção
D = 0: indivíduo está fora da intervenção do programa
Y1 e Y0 : resultados potenciais

γ0 = E [ Y1 Y0 j D = 1]
= Es [ Y1 Y0 j D = 1]

População de interesse: População de tratados.

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Combinação de Base de Dados

Exemplo Clássico: Lalonde (1986) que estima o efeito de um


programa de treinamento no mercado de trabalho
NSW: amostra dos participantes que possui medida de renda
antes da intervenção e características demográ…cas e renda
após a intervenção (Y1 ).
PSID: amostra que contém renda antes da intervenção e
características demográ…cas e renda após a intervenção para
não-participantes (Y0 ) .

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Two-sample IV

Amostra aleatória 1: N1 medidas de (Z1 , Y1 )


Amostra aleatória 2: N2 medidas de (Z2 , Y2 )
Podemos entender este problema como um problema de
combinação de base de dados ou de dados faltantes?

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Two-sample IV
Amostras compatíveis

Problema de dados faltantes (Angrist e Krueger, 1992)


Considere o seguinte modelo de variáveis instrumentais

Y = X´γ0 + ε, E [εZ ] = 0

Momento Populacional:

E [ZY ZX´γ0 ] = 0

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Two-sample IV
Amostras compatíveis

Temos duas amostras aleatórias independentes de tamanho


N1 e N2 da mesma população.
Amostra 1 : N1 medidas de (Y , Z1 )
Amostra 2 : N2 medidas de (X , Z2 )

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Two-sample IV
Amostras compatíveis

Para estimar de maneira e…ciente o modelo TSIV, precisamos


ter um modelo correto para o primeiro estágio:

X = Z´π 0 + η , E [ηZ ] = 0

Usamos a amostra N2 para estimar a relação entre X e Z .


Neste caso, temos o seguinte momento amostral será dado
por:
N1 N2
1 1
mN ( Z , Y , X ) =
N1 ∑ Z1 Y1 N2 ∑ Z2 X2´γ
i =1 i =1

Usa o método generalizado dos momentos


Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Exemplo: Angrist (1990)


SSA: rendimento anual (variável dependente), instrumento
(números retirados nas loterias co…cados a partir da data de
nascimento), vetor de variáveis exógenas (raça, ano de
nascimento)
Informação das …chas militares: se é um veterano ou não,
data de nascimento.

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Two-sample IV
Amostras incompatíveis

Currie e Yelowitz (2000)


Y : indicador se a criança na idade escolar já repetiu uma
série.
X : indicador se é residente em moradia subsidiada.
W0 : o número de irmãos do sexo masculino em um domicílio
W1 : número total de irmãos e as característica dos domícilios
W = [W0´, W1´]´

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Two-sample IV
Amostras incompatíveis

Objeto de Interesse: O efeito causal da moradia subsidiada


nos anos completos de estudo.
Problema: Residir em moradia subsidiada pode estar
correlacionado com características não-observadas do
domicílio que afeta escolaridade.

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Two-sample IV
Amostras incompatíveis

Fatos:
O número de irmãos homens (W0 ) muda a probabilidade de
residir em moradias públicas, dado que condicional no número
total de irmãos, famílias com uma mistura de homens e
mulheres se quali…cam para casas maiores e implicitamente
para um subsídio maior.
Condicional no número total de crianças, a mistura de gênero
não deveria in‡uenciar escolaridade através de outro efeito
que não há exposição a moradia pública.
Estratégia de identi…cação: Usar W0 como um instrumento
para X .

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Two-sample IV
Amostras incompatíveis

Base de Dados:
US Census: Observavam Y e W de subpopulação aleatória de
crianças.
CPS: Observavam X e W de uma amostra estrati…cada de
domicílios.
População de interesse: Crianças em idade escolar vivendo nos
EUA.
As bases de dados são realizações de amostras aleatórias
coletadas da mesma população?

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Two-sample IV
Amostras incompatíveis

US Census: amostra aleatória simples da população de


interesse
CPS não é uma amostra aleatória da população dos EUA.
Evidência: As probabilidades de se encontrar certos tipos de
domicílios era muito diferente na CPS e no Censo.
Neste caso, o estimador TSIV de Angrist e Krueger (1992) é
inconsitente
O que fazer?

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Two-sample IV
Amostras incompatíveis

Usando os pesos amostrais da CPS para que ela represente a


mesma população que o Censo.
Usando estes pesos, eles tratam o Censo e a CPS como
amostras da população de interesse.
Usam o método de Angrist e Krueger adaptado a este
problema.

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Two-sample IV
Literatura mais recente

Angrist e Krueger (1995): introduziram um estimador


computacionalmente mais atrativo chamado de "split-sample
iv" (SSIV)
Estágio 1: Usam a amostra 2 que contém medidas de
(X , Z2 ) e constroem os valores preditos entre as amostras

c12 1
W Z1 (Z2´Z2 ) Z2´X

Estágio 2: c12 .
Regressão de Y em W

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas
Introdução
Método GMM
O Método de Variável Instrumenal Teste de sobreidenti…cação
Problema de Dados Faltantes
Two-sample IV

Two-sample IV
Literatura mais recente

Inoue e Solon (2009): Mostram que a distribuição assintótica


do estimador de Angrist e Krueger só é verdadeira se

Z1´Z1 = Z2´Z2

Esta hipótese é verdadeira se a distribuição marginal dos


instrumentos e variáveis exógenas forem …xas em amostras
repetidas.

Prof. Cristine Xavier, Flavia Chein e Mônica Viegas Avaliação de Politicas Públicas

Você também pode gostar