Você está na página 1de 5

Econometra para la Evaluacin de Impacto de Polticas Pblicas

Prof. Edson Apaza Mamani


Impacto de un Programa de Electrificacin Rural en la Fecundidad

1. Introduccin

El objeto de un anlisis de regresin es investigar la relacin estadstica que existe
entre una variable dependiente () y una o ms variables independientes (X
1
,
X
2
, X
3
,). Para poder realizar esta investigacin, se debe postular una relacin
funcional entre las variables. Debido a su simplicidad analtica, la forma funcional
que ms se utiliza en la prctica es la relacin lineal. Cuando solo existe una
variable independiente, esto se reduce a una lnea recta:

=b
0
+b
1
X
1
+u o
`
=b
`
0
+b
`
1
X
1


donde los coeficientes b
0
y b
1
son los parmetros que definen la posicin e
inclinacin de la recta. (Ntese que hemos usado el smbolo especial
`
para
representar el valor de Y calculado por la recta. Como veremos, el valor real de
rara vez coincide exactamente con el valor calculado, por lo que es importante
hacer esta distincin).

El parmetro b
0
, conocido como la ordenada en el origen, nos indica cunto es
Y cuando X =0. El parmetro b
1
, conocido como la pendiente, nos indica cunto
aumenta Y por cada aumento de una unidad en X. Nuestro problema consiste
en obtener estimaciones de estos coeficientes a partir de una muestra de
observaciones sobre las variables y X. En el anlisis de regresin, estas
estimaciones se obtienen por medio del mtodo de mnimos cuadrados.

La base de datos se refiere a una muestra de mujeres en Botswana, el cual
utilizaremos para investigar los efectos de la electrificacin sobre la fecundidad.
Abrir el archivo: el ect r i co. dt a, cl ear

2. Anlisis descriptivo

Descripcin del contenido de la base de datos: descr i be

Anlisis de estadsticas descriptivas bsicas: summar i ze

Tenga en cuenta que para algunas variables existen una gran cantidad de
informacin faltante. La razn es que, por definicin, no todas las mujeres
respondern estas preguntas (son los llamados casos no aplicables).
Nuestro inters es saber cmo la electricidad influye en la fertilidad. En primer
lugar, esta variable es exgena, ya que la tasa de fecundidad no est determina si
una zona tiene o no electricidad.
Distribuye la frecuencia de la variable de tratamiento: t abul at e el ect r i c
Anlisis descriptivo por sub muestras de mujeres con y sin acceso a electricidad:
by el ect r i c, sor t : summar i ze mnt hbor n year bor n age r adi o- ever mar r

Note que existe una sub muestra de datos omitidos (missing). Suponiendo que la
tasa de respuesta no es aleatoria, estas observaciones se omiten
automticamente.

Un primer sondeo sobre la relacin entre el nmero de nios y el acceso a la
energa elctrica puede hacerse por medio de una tabla:
t abul at e chi l dr en el ect r i c, r ow nof r eq

3. Regresin lineal

Regresin lineal simple:
r egr ess chi l dr en el ect r i c
est i mat es st or e OLSi mpl e

Identificacin de un impacto negativo, puede haber un problema de variables
omitidas (correlacin espuria). Incluimos ms variables:
r egr ess chi l dr en el ect r i c age agesq educ ur ban ever mar r
est i mat es st or e OLSmul t

Tenga en cuenta que el impacto ha cambiado:
est i mat es t abl e OLSi mpl e OLSmul t , st ar

No basta incluir controles, es posible que persista el problema de especificacin:
variables omitidas. Vamos a generar interacciones para agregar ms controles:
media de las variables de control:

summar i ze age i f e( sampl e)

Promedio de la muestra utilizada en la regresin.
Ejemplo, medimos el promedio de la variable edad, que se guarda despus del
comando summarize, en r(mean). Luego generamos la variable de interaccin:
gener at e M_age = el ect r i c*( age r ( mean) )

Cunto difiere la edad de las mujeres que tienen acceso a electricidad de la edad
promedio de la muestra utilizada.

Para agilizar el proceso de generacin de las variables de interaccin para cada
atributo, podemos repetir la misma operacin utilizando los comandos while,
foreach, forvalues y, eventualmente, if. La idea es repetir el mismo procedimiento
varias veces, cambiando slo una parte predefinida. En este caso, queremos
estimar el promedio de una variable y, a continuacin, generar una nueva variable
a partir de este promedio:

f or each var of var l i st agesq educ ur ban ever mar r {
summar i ze `var i f e( sampl e)
gener at e M_`var = el ect r i c*( `var r ( mean) )
}

Ahora, se estima la regresin, incluyendo las variables de interaccin. A fin de no
repetir todas las variables nuevas generadas con el comando (programa), vamos a
utilizar ' * ':

r egr ess chi l dr en el ect r i c age agesq educ ur ban ever mar r M_*
est i mat es st or e OLSat e

Como se esperaba, la interaccin con la variable dummy de rea urbana es
significativa. Antes no sabamos si la fecundidad era menor debido a que las
mujeres vivan en zonas urbanas o porque tenan acceso a la electricidad. De
hecho, la variable dummy de rea urbana explica (determina) positivamente a la
variable dummy de energa elctrica. Este ltimo pierde su poder de explicacin
cuando el primero se incluye en la regresin (segundo grupo de variables de
control).
Otros parmetros de inters pueden ser estimados como el ATT. Para centralizar el
coeficiente de inters sobre el promedio de los covariables del grupo de
tratamiento. Para que el procedimiento a ser realizado no aparezcan en la ventana
de resultados de Stata e innecesariamente aumente su archivo log, utilice el prefijo
quietly:

qui et l y f or each var of var l i st age agesq educ ur ban ever mar r {
summar i ze `var i f e( sampl e) & el ect r i c==1
gener at e S_`var = el ect r i c*( `var r ( mean) )
}

Implementando la regresin:
r egr ess chi l dr en el ect r i c age agesq educ ur ban ever mar r S_*
est i mat es st or e OLSat t

Comparacin de los resultados:
est i mat es t abl e OLSi mpl e OLSmul t OLSat e OLSat t , st ar

Tenga en cuenta que el ATE es mayor que el ATT, podemos esperar incluso que el
ATU sea ms grande que el ATT, por lo que si ampliamos la cobertura de
electricidad en Botswana, estimamos que una reduccin de la fertilidad se debe a
la expansin y ser mayor cuando las actuales casas reciban electricidad.

4. Heterogeneidad del impacto

Volvamos al estimador de ATE, para verificar que el impacto en aquellos que tienen
menos de 7 aos de estudio es diferente al impacto sobre quienes tienen ms de 7
aos de estudio.
Antes, necesitamos saber cunto difieren cada submuestra de la media en
trminos de educacin:
summar i ze M_educ i f e( sampl e) & educ<7

Vamos a guardar este promedio en un escalar (ocupa menos espacio en la
memoria para generar una variable con este valor):
scal ar Educ0 = r ( mean)

Para el otro grupo:
summar i ze M_educ i f e( sampl e) & educ>=7
scal ar Educ7 = r ( mean)

Ahora, analicemos el resultado de la regresin:
est i mat es r est or e OLSat e

Para probar la heterogeneidad, tenemos que hacer una prueba de combinacin
lineal de los coeficientes. Primero con el grupo con menor escolaridad:
l i ncom_b[ el ect r i c] + _b[ M_educ] *Educ0

Luego con el grupo con mayor educacin:
l i ncom_b[ el ect r i c] + _b[ M_educ] *Educ7

Tambin podemos probar la diferencia absoluta entre estos coeficientes:
l i ncom_b[ M_educ] *Educ0 - _b[ M_educ] *Educ7

Y la diferencia relativa (en porcentaje) entre estos coeficientes, se estima utilizando
el comando para probar combinaciones no lineales entre coeficientes:
nl com( _b[ M_educ] *Educ0 - _b[ M_educ] *Educ7) / _b[ el ect r i c]