Escolar Documentos
Profissional Documentos
Cultura Documentos
Ibmec/RJ
Conteúdo
Introdução
Robustez do resultado
Heterogeneidade / Subgrupos
Desenho de experimento
Estratificação × Pareamento
Aleatorização por agrupamento (clustering)
Simulação de um experimento no R
Como analisar dados de um experimento?
▶ Imagine que queremos estimar o efeito médio de uma intervenção T em
um indicador Y .
Ti ⊥ Yi0 , Yi1 .
E(Yi1 ) − E(Yi0 ).
2 / 38
Como analisar dados de um experimento?
[= 1 1 X
X
ATE yi − yi
nT nC
i∈T i∈C
▶ Note que:
p
[ →
ATE E Yi | i ∈ T − E Yi | i ∈ C = ATE.
3 / 38
Regressão
▶ Considere uma regressão simples:
Yi = α + β Ti + Ui
▶ Note que
E Yi | Ti = 1 = α + β
E Yi | Ti = 0 = α
▶ Assim,
p
βb → β = E Yi | Ti = 1 − E Yi | Ti = 0
= E Y1i ) − E Y0i (devido a aleatorização)
= ATE
▶ Por quê?
1. Checar “estabilidade”/robustez do resultado
2. Precisão das estimativas
3. Heterogeneidade / Efeitos em subgrupos
4. Múltiplas observações e múltiplos tratamentos
5. Desenho do experimento
6. Correção de problemas de implementação
5 / 38
Robustez do resultado
▶ Se a aleatorização foi bem feita e o experimento foi bem desenhado,
sabemos que
E(Ui | Ti ) = 0, (1)
Yi = α + β1 Ti + Ui
Yi = α + β2 Ti + X i γ + Vi .
| {z }
= Ui
• Se A implica B, escrevemos A → B.
7 / 38
Precisão
Yi = α1 + β1 Ti + νi
Yi = α2 + β2 Ti + X i γ + ηi
▶ Qual a diferença?
8 / 38
Precisão
▶ Sob aleatorização bem feita, as variâncias dos estimadores das duas
equações são:
σ2 σ2
c1 = U × 1
Var β Var β c2 = V × 1
n 2
σT n σT2
em que
• n = nT + nC ,
2
• σU é a variância de Ui ,
• σV2 é a variância de Vi ,
n
X 2
• n · σT2 é a soma dos quadrados totais de T , isto é, SQTT = Ti − T .
i=1
2
▶ Como Ui = X i γ + Vi , temos σU > σV2 .
▶ Isso implica que Var β
c2 < Var β c1 .
βb
• Como t = , então ↓ EP βb leva a ↑ t
EP β
b
▶ Exemplos:
• Se mulheres possuem mais dificuldade em acessar crédito do que homens,
um programa de microcrédito pode ter efeitos maiores em mulheres do
que em homens.
• Alunos com mais dificuldade são os que se beneficiam mais de um
programa de reforço escolar.
Yi = α + β Ti + γ Hi + δ (Ti × Hi ) + Ui
13 / 38
Interações
Considere a regressão:
Yi = α + β Ti + γ Hi + δ (Ti × Hi ) + Ui
▶ E Yi | Ti = 0, Hi = 0 = α ⇒ média de Y das M em C (M0)
13 / 38
Interações
Considere a regressão:
Yi = α + β Ti + γ Hi + δ (Ti × Hi ) + Ui
▶ E Yi | Ti = 0, Hi = 0 = α ⇒ média de Y das M em C (M0)
▶ E Yi | Ti = 0, Hi = 1 = α + γ ⇒ média de Y dos H em C (H0)
13 / 38
Interações
Considere a regressão:
Yi = α + β Ti + γ Hi + δ (Ti × Hi ) + Ui
▶ E Yi | Ti = 0, Hi = 0 = α ⇒ média de Y das M em C (M0)
▶ E Yi | Ti = 0, Hi = 1 = α + γ ⇒ média de Y dos H em C (H0)
▶ E Yi | Ti = 1, Hi = 0 = α + β ⇒ média de Y das M em T (M1)
13 / 38
Interações
Considere a regressão:
Yi = α + β Ti + γ Hi + δ (Ti × Hi ) + Ui
▶ E Yi | Ti = 0, Hi = 0 = α ⇒ média de Y das M em C (M0)
▶ E Yi | Ti = 0, Hi = 1 = α + γ ⇒ média de Y dos H em C (H0)
▶ E Yi | Ti = 1, Hi = 0 = α + β ⇒ média de Y das M em T (M1)
▶ E Yi | Ti = 1, Hi = 1 = α + β + γ + δ ⇒ média de Y dos H em T
(H1)
13 / 38
Interações
Considere a regressão:
Yi = α + β Ti + γ Hi + δ (Ti × Hi ) + Ui
▶ E Yi | Ti = 0, Hi = 0 = α ⇒ média de Y das M em C (M0)
▶ E Yi | Ti = 0, Hi = 1 = α + γ ⇒ média de Y dos H em C (H0)
▶ E Yi | Ti = 1, Hi = 0 = α + β ⇒ média de Y das M em T (M1)
▶ E Yi | Ti = 1, Hi = 1 = α + β + γ + δ ⇒ média de Y dos H em T
(H1)
13 / 38
Interações
Considere a regressão:
Yi = α + β Ti + γ Hi + δ (Ti × Hi ) + Ui
▶ E Yi | Ti = 0, Hi = 0 = α ⇒ média de Y das M em C (M0)
▶ E Yi | Ti = 0, Hi = 1 = α + γ ⇒ média de Y dos H em C (H0)
▶ E Yi | Ti = 1, Hi = 0 = α + β ⇒ média de Y das M em T (M1)
▶ E Yi | Ti = 1, Hi = 1 = α + β + γ + δ ⇒ média de Y dos H em T
(H1)
Logo,
Yi = α + β Ti + γ Xi + δ (Ti × Xi ) + Ui .
14 / 38
Múltiplas observações
Às vezes temos várias observações para o mesmo indivı́duo antes e/ou depois
do tratamento T . O que fazer?
15 / 38
Múltiplos tratamentos
16 / 38
Múltiplos tratamentos
16 / 38
Exemplo: De Mel et al. (QJE, 2008)
17 / 38
Exemplo: De Mel et al. (QJE, 2008)
▶ Microempresas em vários paı́ses pagam taxas de juros altı́ssimas. Isso
sugere altas taxas de retorno do capital.
• Teoria prevê que o capital deveria fluir para essas empresas, mas há
fricções no mercado de capitais.
18 / 38
Exemplo: De Mel et al. (QJE, 2008)
• Tratamento 2 x 2:
19 / 38
Balanceamento
20 / 38
Especificação básica
▶ δt : controle de tempo = efeito fixo de tempo
▶ λi : controle de firma = efeito fixo de firma
21 / 38
Principais resultados
22 / 38
Principais resultados
▶ Podemos dizer que efeitos in cash foram maiores que efeitos in-kind?
• Formalmente, terı́amos que fazer um teste F que leva em conta a
covariância das estimativas – tabela III do artigo faz isso.
23 / 38
Heterogeneidade
24 / 38
Desenho de experimento
25 / 38
Estratificação × Pareamento
26 / 38
Estratificação × Pareamento
▶ Se chances de T /C são iguais dentro de cada estrato, ATE é média
simples dos efeitos de tratamento nos diferentes estratos.
▶ Exemplo:
27 / 38
Estratificação × Pareamento
▶ Se chances de T /C são iguais dentro de cada estrato, ATE é média
simples dos efeitos de tratamento nos diferentes estratos.
▶ Exemplo:
27 / 38
Estratificação × Pareamento
▶ Formalmente,
28 / 38
Aleatorização por agrupamento (clustering)
▶ Se os dados são coletados no nı́vel do indivı́duo, ou agregamos por
cluster, ou fazemos uma correção nos erros-padrão. Por quê?
30 / 38
Simulação de um experimento
Yi = 0 + 0, 1 Ti + 0, 2 log(rendai ) + Ui
2. Sem controles: Yi em Ti
31 / 38
Simulação no R
num_alunos = 200
beta = 0.1
gamma = 0.2
set.seed(2017)
# simulando renda
RENDA = log(rlnorm(num_alunos, meanlog = log(1786), sdlog = 2))
32 / 38
# função para simulacao
simulacao = function(numRep, sd_e){
# argumentos da funcao:
# numRep: numero de repeticoes da simulacao; sd_e: desvio-padrao do termo de erro
for (i in 1:numRep){
# simulo erros
e <- rnorm(num_alunos, mean = 0, sd = sd_e)
# construo y "verdadeiro"
y <- beta*TRAT + gamma*RENDA + e
# estimacao ’full’
est1 <- summary(lm(y ˜ TRAT + RENDA))
# estimacao sem controles
est2 <- summary(lm(y ˜ TRAT))
# betas
coef1 <- est1$coefficients[2,1]
coef2 <- est2$coefficients[2,1]
# erros-padrao
std_err1 <- est1$coefficients[2,2]
std_err2 <- est2$coefficients[2,2]
# armazeno os resultados
matRes1[i, ] <- c(coef1, std_err1)
matRes2[i, ] <- c(coef2, std_err2)
}
# defino cores
34 / 38
# histograma dos coefientes #
pdf(’experimento_coeficientes.pdf’)
legend("right",
c( "sem controles" , "com controles"),
col = c(’deepskyblue2’, ’sienna2’),
lwd = 10,
bty = "n",
y.intersp = 2)
dev.off() 35 / 38
Resultado
Coeficientes
200
150
Frequência
sem controles
100
com controles
50
0
beta
36 / 38
E o histograma dos erros-padrão:
# histograma dos erros #
pdf(’experimento_std_erros.pdf’)
legend("topleft",
c( "sem controles" , "com controles"),
col = c(’deepskyblue2’, ’sienna2’),
lwd = 10,
bty = "n",
y.intersp = 2)
dev.off() 37 / 38
Resultado
Erros−padrão
sem controles
200
150 com controles
Frequência
100
50
0
σ^β
38 / 38