Você está na página 1de 7

Identificacin de Efectos Causales Usando Variables Instrumentales

Joshua Angrist; Guido Imbens; Donald Rubin

I.- Introduccin Los economistas estn tpicamente ms interesados en conocer los efectos causales ms que meras asociaciones entre variables. El enfoque dominante para hacer inferencias acerca de los efectos causales en la economa en el ltimo tiempo se basa en modelos de ecuaciones estructurales, que se asientan en la especificacin de sistemas de ecuaciones con parmetros y variables que intentan capturar las relaciones de comportamiento y especificar los vnculos causales entre las variables. La inferencia en modelos de ecuaciones estructurales a menudo aprovecha la presencia de variables instrumentales (VI). Estas son variables que estn explcitamente excluidas en algunas ecuaciones e incluidas en otras, y por lo tanto correlacionadas con algunos resultados slo a travs de su efecto sobre otras variables. Inferencias causales en estadsticas estn basadas fundamentalmente en experimentos aleatorios. La nocin bsica de esta formulacin (incluyendo estudios de observacin sin asignacin aleatoria) es la de los resultados posibles. Los efectos causales de un tratamiento a un individuo o unidad es la comparacin entre el valor del resultado (outcome) si la unidad fue tratada y el valor del resultado si la unidad no fue tratada. El objetivo de la estimacin, el estimador, suele ser el efecto causal promedio, definido como la diferencia media entre los resultados de tratados y no tratados en todas las unidades en una poblacin o de alguna subpoblacin. Para que esta definicin de causalidad sea aplicable a muestras con unidades ya expuestas a tratamiento, hay que ser capaces de imaginar los resultados de una observacin en una unidad en otras circunstancias distintas de aquellas a la que fue expuesta. Vamos a mostrar que el estimador de VI puede dar una interpretacin causal precisa y directa en el marco de los resultados posibles, a pesar de la no ignorancia del tratamiento recibido. Esta interpretacin evita los inconvenientes del marco de ecuaciones estructurales estndar, tales como los efectos constantes de todas las unidades, y delimita los supuestos crticos necesarios para una interpretacin causal. El enfoque de VI ofrece una alternativa a un anlisis ms convencional de la intencin de tratar, que se centra exclusivamente en el efecto causal medio de la asignacin de los resultados. Los procedimientos estndar de IV se basan en juicios en cuanto a la correlacin entre la forma funcional especfica de los trastornos y los instrumentos. Nuestro enfoque fuerza al investigador a considerar el efecto de exponer las unidades a los tratamientos especficos. Si no es posible imaginar los tratamientos alternativos que subyacen a estos supuestos, el uso de estas tcnicas pueden ser inadecuadas. Por otra parte, mediante la separacin y la definicin de los supuestos crticos, nuestra formulacin permite una evaluacin clara de las consecuencias de violaciones de estos supuestos a travs de un anlisis de sensibilidad en los modelos ms generales. Nuestros principales resultados se resumen en tres proposiciones: la primera proporciona las condiciones para una interpretacin causal del estimador VI, y los otros revelan las consecuencias de violaciones de los supuestos crticos.
Para desarrollar la presentacin se evaluarn los efectos de servir en el ejercito sobre el resultado en la salud. Los datos provienen de la era de Vietnam, cuando la prioridad para el reclutamiento (de inscripcin obligatoria) se asign al azar a travs de una lotera. Los tratados (si sirvieron en el ejercito o no, denotado por D) y la asignacin (estatus de reclutamiento o inscripcin, determinado por nmero de lotera, denotado por Z) son variables binarias. Si el cumplimiento de la inscripcin obligatoria fue perfecto, entonces todos aquellos con un nmero bajo de lotera (Z=1) deberan haber servido en el ejercito (D=1), y aquellos con un alto nmero de lotera (Z=0) no habran servido (D=0). Se asume que observamos valores de Z, D y el outcome (resultado) de salud Y para cada individuo. Los resultados bsicos, sin embargo, no estn limitados a este caso de tratamiento binario y de instrumento binario. El enfoque ac desarrollado se puede extender a modelos con mltiples

valores de tratamientos e instrumentos. Por otra parte, la generalizacin de los casos con covariables es, en principio, mediante la aplicacin inmediata de los resultados en los distintos valores de las covariables.
1

II.- Modelos de Ecuacin Estructural en la Economa Los podemos definir como: modelos estocsticos en que cada ecuacin representa una relacin causal, ms que una mera asociacin emprica. Un modelo de ecuacin estructural para el problema de inferir el efecto de ser veterano de Vietnam en el resultado de la salud es el modelo de variable endgena dummy. Por persona ! podemos observar !! como resultado de salud, !! ser el tratamiento observado (Estatus de veterano) y !! ser el estatus de reclutamiento observado. Un modelo de variable endgena dummy para este problema tendr la siguiente forma: (1) !! = !! + !! !! + !! (2) !! = !! + !! !! + !! 1 !" !! > 0, (3) !! = 0 !" !! 0. En este modelo !! representa el efecto causal de D en Y. a) El primer supuesto tpicamente usado para identificar !! , es que !! no est correlacionado con los errores !! y !! . (4) !! !! = 0, !! !! = 0. Este supuesto captura la nocin de que cualquier efecto de Z sobre Y debe producirse a travs de un efecto de Z en D. b) El segundo supuesto es que la covarianza entre los tratados !! y la asignacin !! es distinta de cero, es decir: (5)!"#(!! , !! ) 0 Puede ser interpretado como que !! debe ser distinto de cero. Si !! cumple con estos dos supuestos, entonces es considerado un modelo de VI. En general, !! , el regresor endgeno, esta potencialmente correlacionado con !! porque los dos errores !! y !! estn potencialmente correlacionados. Esto implica que la recepcin de tratamiento !! no es ignorable y, por tanto, no exgeno. El estimador de VI esta definida como la relacin de las covarianzas de la muestra:
!" (6) !! = !"# !! ,!! !"# !! ,!!

Crticas al modelo: a) La sensibilidad de estos modelos a supuestos crticos b) Su aparente inhabilidad para reproducir resultados experimentales c) Supuestos crticos son emitidos en trminos de errores de funciones de regresin especificadas de forma incompleta, en lugar de en trminos de variables intrnsecamente significativas y potencialmente observables. Generalmente el investigador no tiene una idea muy clara de lo que realmente representa el error, por lo que es difcil llegar a conclusiones realistas o comunicar resultados basados en sus propiedades.

III.- Estimadores Causales con Variables Instrumentales 1. El modelo Causal de Rubin (RCM) !! = 1 implica que la persona ! tiene un bajo nmero de lotera (sera potencialmente llamable para servir en el ejercito), y !! = 0 indica que la persona tiene un alto nmero de lotera (no sera llamado a servir en el ejercito). La notacin para D e Y vara del modelo


Puede ser entendida como variable independiente. En econometra, el trmino "variable de control" se utiliza generalmente en lugar de "covarianza". En un uso ms especfico, una covariable es una variable secundaria que puede afectar a la relacin entre las variables dependientes y algunas variable independiente de inters primario.
1

anterior por la necesidad de representar los resultados potenciales. Definiremos entonces Z como el vector de asignaciones (!! ), y !! (!) ser el indicador para los individuos ! que servirn en el ejercito dado el mtodo de seleccin por lotera que se aplic. !! (!) debera ser igual a !! para cada !, en un mundo con obediencia perfecta al llamado a servicio, pero en la realidad es distinto por varias razones (por voluntarios, o gente que evita el sorteo y porque puede no estar capacitado por temas de salud o familia). Definiremos !! (!, !) para ser la respuesta por persona ! dado el vector de indicador de servicio D y el vector de prioridades de seleccin Z. Nos referimos a !! (!) y !! (!, !) como resultados potenciales. Supuesto 1: Stable Unit Treatment Value Assumption (SUTVA) Suponer estable el valor unitario del tratamiento: a) Si !! = !!! , entonces !! ! = !! (! ! ). b) Si !! = !!! y !! = !!! , entonces !! !, ! = !! (! ! , ! ! ) SUTVA implica que el resultado potencial para cada individuo ! no esta relacionado con el estatus de tratamiento de otros individuos (permite escribir los trminos D e Y como: !! (!! ) y !! !! , !! ) Es un limitante para algunos anlisis. Dado el grupo de resultados potenciales, podemos definir el efecto causal de Z en D y en Y. Definicin 1: Efecto causal de Z en D y en Y I. El efecto causal por individuo ! de Z en D es !! 1 !! (0) II. El efecto causal de Z en Y es !! 1, !! (1) !! 0, !! (0) Supuesto 2: Asignacin aleatoria: la asignacin de tratamiento es aleatoria. Dados estos dos supuestos (SUTVA y Random Assignment), podemos obtener estimadores insesgados de la media de la intencin a tratar a partir de las diferencias de medias de la muestra de Y y D, clasificados por el valor de Z. El estimador insesgado para el efecto causal promedio de Z sobre Y es: (7)
! !! !! ! !! ! !! !! ! !!

! !!

!!!!

! !!!! ! !! !

El efecto causal promedio de Z en D: (8)


!!!! !!!!

La relacin entre estos dos estimadores (7 y 8) es igual al estimador convencional de variables instrumentales (6). 2. Variables Instrumentales La caracterstica fundamental del problema de evaluar un tratamiento bajo cumplimiento imperfecto es que incuso si la asignacin !! es aleatoria o ignorable, quien recibe el tratamiento !! usualmente no lo es. Por lo tanto, los estimadores anteriores (de diferencia de medias) no proporcionan estimadores insesgados y consistentes del efecto causal medio de D en Y. Se necesitan mas supuestos. Supuesto 3: Restriccin de Exclusin. Esto implica que !! 1, ! = !! (0, !) para ! = 0,1. Captura la nocin de que cualquier efecto de Z en Y debe ser a travs de un efecto de Z en D. Debido a que la restriccin de exclusin relaciona cantidades que no pueden ser observadas en forma conjunta y que no son directamente verificable con la data disponible, aunque tiene implicaciones comprobables si se combina con los supuestos 1 y 2. Por virtud de este supuesto podemos definir !(!, !) como funcin nicamente de D. Por supuesto uno podemos simplificarlo y escribirlo: !! (!! ). Definicin 2: Efectos causales de D en Y El efecto causal de D en Y por persona ! es !! (1) !! (0). Aunque nunca podemos observar alguno de estos efectos causales, para personas con !! (0) !! (1) podemos observar cualquiera de sus trminos a travs de una eleccin apropiada de !! . La asignacin debe afectar el tratamiento.

Supuesto 4: El efecto causal medio de Z sobre D no debe ser cero. Es decir, Z debe tener cierta influencia en la probabilidad media de ser tratado. El promedio del efecto causal de Z en D, !! 1 !! (0) 0. Supuesto 5: Monotonicidad, es decir !! 1 !! 0 ! = 1, , !. La combinacin de los supuestos 4 y 5 asume que, dado !! 1 !! 0 , hay al menos un individuo con mootonicidad fuerte en la desigualdad. Los supuestos del 1 al 5 nos llevan a la definicin formal de un instrumento en el Modelo Causal de Rubin (RCM). Definicin 3: Variables Instrumentales para el efecto causal de D en Y. Una variable Z es una VI del efecto causal de D en Y si: el efecto promedio de D es distinto de cero, y este satisface la restriccin de exclusin, el supuesto de monotonicidad, si la asignacin es aleatoria (o ignorada) y si tiene SUTVA. 3. Interpretando el estimador de VI El efecto causal de para la persona ! es el producto de (i) el efecto causal de D sobre Y y (2) el efecto causal de Z en D. El efecto promedio causal de Z en Y es igual al producto del efecto causal promedio de D sobre Y para las personas con !! (!) = 0 y !! (1) = 1 y su proporcin en la poblacin. Proposicin 1: Interpretacin causal de los estimadores de VI. Dados los supuestos 1, 3, 4 y 5 el estimador de VI es: !! 1 !! (0)|!! 1 !! 0 = 1 , que llamaremos el efecto local promedio del tratamiento (LATE). El promedio del efecto causal de Z en Y es proporcional al efecto causal promedio de D sobre Y para los cumplidores (inducidos a tomar el tratamiento por el sorteo). Por ltimo, es importante sealar que (bajo nuestros supuestos) por lo general no se puede identificar a los miembros especficos del grupo de cumplidores, definido por !! (0) = 0, !! (1) = 1, para los cuales se puede identificar el efecto promedio del tratamiento. Por lo tanto, el efecto promedio del tratamiento local (es decir, el efecto promedio causal de los cumplidores) no es el efecto promedio del tratamiento, ya sea para toda la poblacin o una subpoblacin identificable a partir de valores observados.

IV.- Comparando el modelo de ecuaciones estructurales y el modelo de resultados potenciales. 1. Restriccin de Exclusin y Asignacin de Tratamiento Ignorable La versin economtrica de estos supuestos es que los errores de las ecuaciones (1) y (2) no estn correlacionados (que sean independientes) a la asignacin del tratamiento Z. En el modelo de resultados potenciales se separa en dos supuestos sobre cantidades potencialmente observables: la restriccin de exclusin, que no dice nada sobre el mecanismo de asignacin de tratamiento, y la ignorabilidad de la asignacin de tratamiento, que no dice nada sobre los posibles efectos directos en la asignacin. Si bien tienen las mismas implicancias, no son lo mismo.
2. La condicin de Monotonicidad Este supuesto no tiene un smil en la econometra, pero est implcito en el uso de ecuaciones con trminos constantes de la relacin entre !! y !! . El modelo de resultados potenciales sugiere que este trmino constante es mas fuerte de lo necesario. Por otro lado, no es suficiente postular una covarianza distinta de cero entre el tratamiento y la asignacin, para el estimador por VI, entendido como la media de efectos causales. 3. Forma Reducida y Parmetros Estructurales De forma reducida, los parmetros para la aplicacin de la lotera de seleccin son los coeficientes de Y sobre Z y de D en Z. Segn nuestro modelo estos son los efectos medios de la intencin a tratar bajo los supuestos 1 y 2. El parmetro estructural (!! ) es el efecto

promedio del tratamiento (en s mismo) en Y para la subpoblacin que cumple con la asignacin. Cabe destacar, sin embargo, que los supuestos necesarios para una interpretacin causal del estimador de variables instrumentales (Hiptesis 1 y 3-5) son sustancialmente ms fuertes que las necesarias para la interpretacin causal del estimador de la intencin de tratar.

V.- Sensibilidad del estimador de VI a los supuestos crticos Los supuestos expuestos anteriormente son condiciones suficientes para identificar efectos promedios del tratamiento significativamente. Ahora veremos como se ven afectados los estimadores de VI si se violan sus supuestos.
1. Violaciones en la restriccin de exclusin Se asume que el resto de los supuestos se mantienen. Proposicin 2: Dada estabilidad y fuerte monotonicidad, sin restriccin de exclusin para los no colaboradores (los que no sirven al ejercito), el estimador de VI es igual al LATE adems de un sesgo determinado. El sesgo del estimador IV en relacin con el efecto promedio de tratamiento local es igual al efecto directo medio de Z en Y para los incumplidores, multiplicado por la probabilidad de ser un incumplidor. Cuanto mayor sea la correlacin entre el instrumento y el estado de tratamiento (es decir, mientras ms "fuerte" sea el instrumento), menor ser la probabilidad de incumplimiento, y en consecuencia el estimador IV ser menos sensible a violaciones de la hiptesis de la exclusin. 2. Violaciones a la condicin de monotonicidad Proposicin 3: Mantenemos el resto de los supuestos, sin la monotonicidad, el estimador de VI va a ser igual al efecto local promedio del tratamiento (LATE) ms un sesgo determinado. El sesgo producido por esta violacin esta compuesto por dos factores. El primero, est relacionada con la proporcin de los desafiadores (aquellos electos para ser tratados, pero que se niegan a recibir el tratamiento) y es igual a cero en el supuesto de monotonicidad. Nuevamente, mientras mas fuerte el instrumento, menor ser el efecto de la violacin en el estimador VI. El segundo factor es la diferencia en los efectos causales de D sobre Y para los cumplidores y los desafiadores. Si los efectos causales medios de D sobre Y son idnticos para desafiadores y cumplidores, violaciones del supuesto de monotonicidad no generan ningn sesgo. A menor variacin que haya en el efecto causal de D sobre Y, menor es el sesgo de las violaciones de la hiptesis de monotona.

VI.- Una Aplicacin: El efecto del servicio militar en la mortalidad civil. Hearst, Newman y Hulley mostraron que los hombres con un nmero bajo de lotera en la era de Vietnam (!! = !) tienen una elevada mortalidad luego de cumplir con su servicio militar. Atribuyeron este resultado al perjudicial efecto de servir en el ejrcito durante el periodo de la guerra de Vietnam. Angrist atribuye estas diferencias (de salud) en los ingresos posteriores de los individuos dependiendo de su nmero de lotera. Esta diferencia de ingreso se produce por los problemas psicolgicos producto de ir a la guerra y por la incapacidad de trabajar mientras estaban en ejercicio, por lo que podan recaudar menos dinero, que quienes no fueron a la guerra, esto se tradujo en una menor cantidad de recursos disponibles. El llamado al ejercito es aleatorio, y se produce a travs de un sorteo secuencial que seleccionaba nmeros al azar de acuerdo a las fechas de nacimiento (usando nmeros del 1365 por los das del ao).
1. Evaluacin de los supuestos 1-5 El resultado posible en este caso, !! (!, !), es una variable indicadora dependiente que es igual a uno si la persona ! habra muerto entre 1974 y 1983 dependiendo de su nmero de

lotera asignado Z y el indicador de servicio militar D. Para distinguirla de la mortalidad durante el perodo de la guerra, nos referimos a !! como la mortalidad civil. Para validar la interpretacin causal del estimador de VI debemos aclarar lo siguiente: SUTVA: El estado de veterano de algn hombre con el riesgo de ser llamado a servicio no se ve afectado por el estado de llamado de otros individuos con riesgo de ser llamados. Es decir, la mortalidad civil de un hombre no se ve afectada por el estado de llamado de otros (que llamen a otros no afecta mi mortalidad). La asignacin de tratamiento es aleatoria, si me llaman o no al servicio militar es determinado de forma aleatoria. Restriccin de Exclusin: El riesgo de mortalidad civil no es afectado por el estado de llamado una vez que el estado de Veterano es tomado en cuenta. Media del efecto causal de Z en D distinta de cero: El tener un nmero bajo de lotera aumenta en promedio la probabilidad de servir en el ejercito. Monotonicidad: No hubo nadie que pudo haber servido en el ejercito con un nmero de lotera alto, pero no si recibi un nmero de lotera bajo (si recibi un numero bajo es probable que haya servido). Hay evidencia de que algunos hombres con nmero bajo de lotera (les tocaba servir) cambiaron sus planes educacionales con el fin de no servir en el ejercito, lo que viola algunos supuestos (monotonicidad, no exclusin). Tambin gente que estaba de servicio voluntario en la marina, an teniendo un nmero bajo de lotera, podan decidir quedarse ah y salvarse del servicio (rompe supuesto de monotonicidad). 2. El estimador de Variables Instrumentales Podemos ver que el autor identifica que para saber el efecto causal entre ir a la guerra de Vietnam (ser veterano) y su salud posterior es necesario ocupar una VI, que en este caso es el nmero de lotera (utiliza el grado de mortalidad como dato de la salud posterior). El estado de llamado posee un efecto causal de incrementar la posibilidad de servicio, y aquellos con bajo nmero de lotera, entre 1974 y 1983 muri el 2,04%, mientras que aquellos con nmero alto tuvieron una tasa de muerte de 1,95%. La diferencia, 0,09%, puede ser interpretada como una estimacin del efecto causal medio del estado de llamado en la mortalidad civil. 3. Sensibilidad a la restriccin de exclusin Se comprob que aquellos hombres nacidos en 1952 con un bajo nmero de lotera (entre 1 y 75) tuvieron en promedio 0,358 aos ms de escuela que aquellos con un nmero alto de lotera (mayor a 150) que no fueron llamados al servicio. Esto se debi a que uno poda salvarse del servicio militar si estaba estudiando en el colegio o en la Universidad. Quienes fueron llamados y utilizaron la solucin de estudiar probablemente se quedaron mas tiempo estudiando por el miedo a que los llamaran nuevamente a servir. El resto de los aos no hay evidencia de relacin entre aos de escuela y nmero de lotera, por lo que no podemos asumir nada de esta violacin. 4. Sensibilidad al supuesto de monotonicidad Sin monotonicidad, el efecto promedio causal de Z sobre D estimaciones la diferencia entre las proporciones de cumplidores y desafiadores. En este caso hay mas cumplidores que desafiadores (15%). Para invertir el signo del efecto causal promedio por violaciones del supuesto de monotonicidad, se requiere la presencia de un grupo de un improbablemente gran grupo de desafiadores, o grandes diferencias entre los efectos promedio de los cumplidores y los desafiadores.

VII.- Conclusiones Este articulo esbozo un marco para la inferencia causal en situaciones de asignacin aleatoria, pero donde el cumplimiento de esta asignacin no es completo. En un intento de estimar el efecto de recibir un tratamiento, en lugar de asignacin de tratamiento como en el anlisis de la intencin de tratar, hicimos uso de variables instrumentales. Mostramos que esta tcnica puede ser incorporada en el modelo Causal de Rubin (RCM), y usarse para sacar inferencias causales sin el supuesto de efectos constantes del tratamiento. Las ventajas de incorporar este enfoque en la RCM son dos. En primer lugar, hace que la naturaleza de los supuestos se ms transparente. Segundo, nos permite considerar la sensibilidad de los resultados a las desviaciones de los supuestos de manera directa.

Você também pode gostar