Você está na página 1de 34

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

Clases 6 y 7: Econometra - ICP


Temas:

1.
2.
3.

Solucin en solemne 1 (pizarra)


Variables dummy e interacciones
Inclusin y exclusin de variables
Test de especificacin de la forma
funcional

Gabriel Moraga
Primer Trimestre 2015
1

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

1. Variables dummy e interacciones

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

VARIABLES DUMMY
Hasta el momento nos hemos centrado en el uso de variables
cuantitativas. Sin embargo, en los modelos de regresin lineal
podemos incluir de forma sencilla variables categricas (variables
cualitativas) a partir de la utilizacin de variables dummy.
Las variables dummy son variables que toman valores 0 o 1 por lo
que se les conoce tambin como variables binarias.
Algunos ejemplos de variables categricas que pueden ser
introducidas al modelo mediante una variable dummy son: sexo,
regin, estado civil, etc.

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

VARIABLES DUMMY
Veamos el caso en que tenemos solo una variable dummy y una
variable continua en el modelo de regresin. Supongamos un
modelo para explicar el retorno en ingresos (y) de los aos de
educacin (educ) en que incorporamos una variable dummy para
sexo (d).
= 0 + 0 + 1 +
Donde:
Si el sexo de la persona es mujer d=0
Si el sexo de la persona es hombre d=1

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

VARIABLES DUMMY
El parmetro 0 va a medir el cambio en el intercepto dependiendo si
el sexo es mujer u hombre.
Si es mujer (d=0) entonces el modelo es y = 0 + 1 +
Si es hombre (d=1) entonces el modelo es y = (0 + 0 ) + 1 +

Los datos para lo anterior lucen de la siguiente forma:


Obs

sexo

educ

120.000

200.000

17

125.000

210.000

12
5

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

Grficamente para 0 >0


= 0 + 0 + 1

= 0 + 1

0 + 0
0
0

x1

x2

x3

x4

x
6

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

VARIABLES DUMMY
Como se puede apreciar solo introducimos una variable dummy
cuando tenemos dos categoras. Por qu no incluimos dos variables
dummy, una para cada categora?
Hay colinealidad
Si incluimos una dummy por categora tendramos: perfecta entre d1 y d2
d1=0 si sexo es mujer y d1=1 en otro caso
d2=1 si sexo es hombre y d2=0 en otro caso

(no se cumple el
supuesto RLM3)

Obs

d1

d2

educ

d1+d2

120.000

200.000

17

125.000

210.000

12

1
7

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

VARIABLES DUMMY
Tambin podemos utilizar las variables dummy para ms de dos
categoras, esto lo podemos lograr incluyendo un mayor nmero de
variables dummy.
Ejemplo: Si en vez de medir el efecto de los aos de educacin en el
ingreso quisiramos medir las diferencias en salario de alcanzar
distintos niveles de educacin. Podramos construir 4 categoras:

Ninguna educacin
Bsica completa
Media completa
Profesional completa

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

VARIABLES DUMMY
Por tanto, tendramos las siguientes variables dummy en el modelo:
1 =1 si complet educacin bsica 1 =0 en otro caso.
2 =1 si complet educacin media, 2 =0 en otro caso.
3 =1 si complet educacin superior, 3 =0 en otro caso.
= 0 + 1 1 + 2 2 + 3 3
Obs

90.000

200.000

125.000

210.000

0
9

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

VARIABLES DUMMY
La interpretacin del impacto del nivel educacional alcanzado
debemos hacerlo en referencia a la categora que excluimos. Vemos
el mismo ejemplo pero con nmeros:
= 67.000 + 8.0001 + 30.0002 + 72.0003

Cul es el retorno de ingreso de alcanzar educacin media?


Las personas que completan educaicn media reciben en promedio
30.000 (2 ) pesos ms que las personas que no tienen educacin.
Las personas que completan educaicn media reciben en promedio
22.000 (2 1 ) pesos ms que las personas que solo completaron
educacin bsica.
Las personas que completan educaicn media reciben en promedio
42.000 (2 3 ) pesos ms que las personas que solo completaron
educacin superior.
10

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

VARIABLES DUMMY: INTERACCIONES


Tambin es posible generar interacciones con las variables dummy.
Lo cual podra entenderse como una subdivisin de los grupos. Si
consideramos el ejemplo anterior e incluimos una dammy de
interaccin para sexo (d) tendramos el siguiente modelo:

= 0 + 1 1 + 2 2 + 3 3
Si d=1 y 1 =1 tendramos el efecto de alcanzar educacin bsica
cuando se es hombre en relacin a cundo se es mujer.
Si d=1 y 2 =1 tendramos el efecto de alcanzar educacin media
cuando se es hombre en relacin a cundo se es mujer.
Si d=1 y 3 =1 tendramos el efecto de alcanzar educacin superior
cuando se es hombre en relacin a cundo se es mujer.
11

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

INFERENCIA: MODELO DE REGRESIN SIMPLE


Tambin podemos considerar interaccin entre las variables dummy
(d) con las variables explicativas continuas (x). El modelo quedara
determinado por:

= 0 + 0 + 1 + 1 +
Si d=0 entonces el modelo es = 0 + 1 +
Si d=1 entonces el modelo es = (0 + 0 ) + (1 + 1 ) +
Esto genera por tanto cambios en la pendiente. Es decir, en el caso
de que d=1 si sexo es hombre y d=0 si sexo es mujer, los hombres
tendra distinto retorno por ao de educacin dado por (1 + 1 ).

12

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

Grficamente para 0 >0 y 1 >0


= 0 + 0 + 1 + 1

= 0 + 1
1 + 1

0 + 0
1
0
0

x
13

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

Grficamente para 0 >0 y 1 <0

y
= 0 + 1

= 0 + 0 + 1 + 1
1 + 1

0 + 0
1
0
0

x
14

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

VARIABLES DUMMY: USO


Las variables dummy se pueden utilizar tanto para controlar por
variables cualitativas como par estimar el efecto que tienen stas
en la variable dependiente.
Las variables dummy se utilizan comnmente para estimar los
efectos que podra tener un programa o poltica determinado,
comparando a un grupo al que se le aplic el programa con un
grupo al que no se le aplic el programa. En caso de un modelo
simple esta metodologa sera equivalente a un test de medias.
Si los grupos que se comparan son distintos o pueden verse afectado
por distintos otros sucesos habra que considerar esas caractersticas
distintivas del grupo tratado y el grupo de control y controlar
(incluirlas en el modelo) por esas variables distintivas.
15

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

2. Inclusin y exclusin de variables

16

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

VARIABLES DUMMY
A continuacin veremos los problemas asociados a la especificacin
incorrecta de los modelos de regresin.
Como punto de partida discutiremos sobre los problemas de incluir
una variable irrelevante en el modelo de regresin o excluir una
variable relevante.

17

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: INCLUSIN DE UNA VARIABLE IRRELEVANTE


Supongamos que el verdadero modelo poblacional est dado por:
y = 0 + 1 1 +
Pero estimamos: y = 0 + 1 1 + 2 2 +
El modelo estimado estara mal especificado dado que estamos
incluyendo una variable irrelevante en el modelo, la variable 2 .
Sin embargo, si el modelo mal especificado en que incluimos una
variable irrelevante satisface los supuestos de regresin lineal RLM1
al RLM4, 1 estimado va a seguir siendo insesgado.

18

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: INCLUSIN DE UNA VARIABLE IRRELEVANTE


El problema surge en la varianza:
Veamos con ms detalle esto:
Modelo 1: = 0 + 1 1 (modelo verdadero)

Modelo 2: = 0 + 1 1 + 2 2 (modelo mal especificado)

La varianza de ambos modelos va a estar dada por:


Modelo 1

Modelo 2

2
(1 ) =
1

2
(1 ) =
1 (1 21 )

Donde 21 mide el grado de relacin lineal entre 1 y 2 . Por tanto


se cumple que: (1 ) (1 )
19

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: INCLUSIN DE UNA VARIABLE IRRELEVANTE


Como sabemos siempre vamos a preferir un modelo que permita
estimar los parmetros poblacionales de forma insesgada y adems
que sea de mnima varianza. Dado que as se reduce el error de
estimacin en torno al verdadero valor poblacional.
De acuerdo a las las expresiones de la varianza:
(1 ) = (1 ) si 1 y 2 no estas asociados linealmente (21 = 0)

(1 ) < (1 ) si 1 y 2 no estas asociados linealmente (21 > 0)

2
(1 ) =
1

2
(1 ) =
1 (1 21 )

20

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: EXLUSIN DE UNA VARIABLE RELEVANTE


Ahora supongamos que el verdadero modelo poblacional est dado
por: y = 0 + 1 1 + 2 2 + , y estimamos: y = 0 + 1 1 +
Aqu estaramos omitiendo una variable relevante del modelo, 2 .
Si se cumplen los supuestos RLM1 al RLM4 la estimacin de 1
seguira siendo insesgada siempre y cuando 1 no est
correlacionada con 2 .
En caso que estn correlacionadas las variables explicativas, el
estimador 1 obtenido a partir del modelo donde no se incluye 2
va a ser un estimador sesgado.

21

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: EXLUSIN DE UNA VARIABLE RELEVANTE


Omitiendo 2 en la estimacin obtendramos = 0 + 1 1
Donde (1 ) = (1 + 1 ) = 1 + 2

es la pendiente entre 1 y 2 . Si = 0 no hay correlacin entre


1 y 2 y por tanto no hay sesgo.
Si 0 el sesgo para E(1 ) va a estar determinado por 2 :
(1 , 2 ) > 0

(1 , 2 ) < 0

2 > 0

Sesgo positivo

Sesgo negativo

2 < 0

Sesgo negativo

Sesgo positivo
22

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: INCLUSIN DE UNA VARIABLE IRRELEVANTE


En relacin a la varianza ocurre lo mismo que en el caso anterior.
De acuerdo a las las expresiones de la varianza:
(1 ) = (1 ) si 1 y 2 no estas asociados linealmente (21 = 0)
(1 ) < (1 ) si 1 y 2 no estas asociados linealmente (21 > 0)

En general:
Al excluir una variables relevante que no est correlacionada con las
variables explicativas del modelo no implicara ni sesgo ni una mayor
varianza.
Al excluir una variable relevante que est correlacionada con las
variables explicativas del modelo se obtendran estimadores sesgado
pero con menor varianza.
23

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

3. Test de especificacin de la forma


funcional

24

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: TEST PARA LA FORMA FUNCIONAL


Un modelo de regresin lineal mltiple presenta problemas de
especificacin en su forma funcional cuando no explica
correctamente la relacin existente entre la variable dependiente y
las variables independientes. En la realidad (poblacin) las variables
pueden relacionarse a travs de formas funcionales especficas.
Supongamos el siguiente modelo poblacional:
ln = 0 + 1 + 2 + 3 2 +

Estimamos los siguientes modelos:


(1) ln = 0 + 1 + 2 + 1
(2) salario = 0 + 1 + 2 + 3 2 + 2
25

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: TEST PARA LA FORMA FUNCIONAL


En el primer caso estamos omitiendo una funcin para la variable
experiencia (exp al cuadrado). En el segundo caso se est
especificando mal la forma funcional del ingreso, dado que debera
estar medida en logaritmos.
Estos son dos tipos de errores de especificacin de la forma
funcional. Los cuales se pueden agrupar en: modelos anidados y
modelos no anidados.
Cuando comparamos modelos que agregan formas funcionales nos
referimos a modelos anidados
Cuando comparamos modelos que cambian las formas funcionales de
variables existentes nos referimos a modelos no anidados.
26

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: TEST PARA LA FORMA FUNCIONAL


Para testear la especificacin de la forma funcional de los modelos
anidados simplemente se puede realizar un test t de significancia
en caso que se omita una variable o un test F en caso que se
omitan ms de una variable.
Por otro lado, los modelos no anidados ya no permiten utilizar las
herramientas clsicas de forma directa, por tanto se realizan
algunas adaptaciones antes de realizar los test.

27

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: TEST PARA LA FORMA FUNCIONAL


Como vimos es posible contrastar los modelos anidados a partir de
pruebas t o F, podemos aplicar tambin una prueba general para
especificacin incorrecta. Veremos el test RESET (Test de error de
especificacin de Ramsey).
Lgica del test: Si el verdadero modelo poblacional es:
= 0 + 1 1 + 2 2 + + +

Adems, satisface los supuestos, entonces ninguna funcin no


lineal de las variables explicativas ser significativa al agregarla en la
ecuacin anterior.

28

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: TEST PARA LA FORMA FUNCIONAL


RESET para detectar tipos generales de especificacin incorrecta de
la forma funcional se le agregan al modelo lineal polinomios de los
valores ajustados obtenidos mediante MCO.
Primero se estima: = 0 + 1 1 + 2 2 + + +
Luego se obtiene y se agregan formas funcionales al modelo
lineal original estimando nuevamente el modelo
= 0 + 1 1 + 2 2 + + + 1 2 + 2 2 +

Finalmente se realiza un test F en que se considera que el modelo


original est bien especificado, es decir 0 : 1 = 0 2 = 0.
29

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: TEST PARA LA FORMA FUNCIONAL


Por tanto la hiptesis nula y alternativa son:
0 : 1 = 0 2 = 0
1 : 1 0 2 0

Como vimos el estadstico F puede obtenerse a partir de la suma de


residuos o de los valores de R cuadrado de los modelos restringidos
y no restringidos:

( )/
=
,
/( 1)

2 2 )/
(

=
2
(1
)/( 1)

Si > F-crtico, rechazo 0


Si < F-crtico, no rechazo 0

Si rechazo la hiptesis nula, hay evidencia a favor de que el modelo


debera incorporar no linealidades generales.
30

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: TEST PARA LA FORMA FUNCIONAL


Para testear los modelos no anidados tenemos dos alternativas:
Test de Mizon y Richard
Test de Davison y Mackinnon

Supongamos que queremos comparar


= 0 + 1 1 + 2 2 +

(9.6)

= 0 + 1 log(1 ) + 2 log(2 ) +

(9.7)

31

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: TEST PARA LA FORMA FUNCIONAL


A) Mizon y Richard (1986): Sugieren construir un modelo que
contenga todo. Es decir que incluya ambos modelos que se quieren
comparar:
= 0 + 1 1 + 2 2 + 3 log(1 ) + 4 log(2 ) +
Y luego realizar los siguientes test:
0 : 3 = 0, 4 = 0
1 : 3 0, 4 0

Rechazo 0 como prueba en contra de (9.6)

0 : 1 = 0, 2 = 0
0 : 1 0, 2 0

Rechazo 0 como prueba en contra de (9.7)

32

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: TEST PARA LA FORMA FUNCIONAL


B) Davison y Mackinnon (1981): Sugieren realizar dos estimaciones
para comparar los test:
Primero: para ver si (9.6) es verdadero:
i) Se obtiene correspondiente a los valores ajustados de y para el
modelo 9.7.
ii) Se regresa (corre) el siguiente modelo:
= 0 + 1 1 + 2 2 + 1 +
Iii) Se realiza un test t de significancia para 1
0 : 1 = 0
Si se rechaza 0 entonces rechazo (9.6) ya que 1 es
1 : 1 0
significativamente distinto de cero
33

UNIERSIDAD ALBERTO HURTADO | INGENIERA COMERCIAL PARA PROFESIONALES

ESPECIFICACIN: TEST PARA LA FORMA FUNCIONAL


B) Davison y Mackinnon (1981): Sugieren realizar dos estimaciones
para comparar los test:
Segundo: para ver si (9.7) es verdadero:
i) Se obtiene correspondiente a los valores ajustados de y para el
modelo 9.6.
ii) Se regresa (corre) el siguiente modelo:
= 0 + 1 log(1 ) + 2 log(2 ) + 2 +
Iii) Se realiza un test t de significancia para 2
0 : 2 = 0
Si se rechaza 0 entonces rechazo (9.7) ya que 2 es
1 : 2 0
significativamente distinto de cero
34

Você também pode gostar