Escolar Documentos
Profissional Documentos
Cultura Documentos
1.
2.
3.
Gabriel Moraga
Primer Trimestre 2015
1
VARIABLES DUMMY
Hasta el momento nos hemos centrado en el uso de variables
cuantitativas. Sin embargo, en los modelos de regresin lineal
podemos incluir de forma sencilla variables categricas (variables
cualitativas) a partir de la utilizacin de variables dummy.
Las variables dummy son variables que toman valores 0 o 1 por lo
que se les conoce tambin como variables binarias.
Algunos ejemplos de variables categricas que pueden ser
introducidas al modelo mediante una variable dummy son: sexo,
regin, estado civil, etc.
VARIABLES DUMMY
Veamos el caso en que tenemos solo una variable dummy y una
variable continua en el modelo de regresin. Supongamos un
modelo para explicar el retorno en ingresos (y) de los aos de
educacin (educ) en que incorporamos una variable dummy para
sexo (d).
= 0 + 0 + 1 +
Donde:
Si el sexo de la persona es mujer d=0
Si el sexo de la persona es hombre d=1
VARIABLES DUMMY
El parmetro 0 va a medir el cambio en el intercepto dependiendo si
el sexo es mujer u hombre.
Si es mujer (d=0) entonces el modelo es y = 0 + 1 +
Si es hombre (d=1) entonces el modelo es y = (0 + 0 ) + 1 +
sexo
educ
120.000
200.000
17
125.000
210.000
12
5
= 0 + 1
0 + 0
0
0
x1
x2
x3
x4
x
6
VARIABLES DUMMY
Como se puede apreciar solo introducimos una variable dummy
cuando tenemos dos categoras. Por qu no incluimos dos variables
dummy, una para cada categora?
Hay colinealidad
Si incluimos una dummy por categora tendramos: perfecta entre d1 y d2
d1=0 si sexo es mujer y d1=1 en otro caso
d2=1 si sexo es hombre y d2=0 en otro caso
(no se cumple el
supuesto RLM3)
Obs
d1
d2
educ
d1+d2
120.000
200.000
17
125.000
210.000
12
1
7
VARIABLES DUMMY
Tambin podemos utilizar las variables dummy para ms de dos
categoras, esto lo podemos lograr incluyendo un mayor nmero de
variables dummy.
Ejemplo: Si en vez de medir el efecto de los aos de educacin en el
ingreso quisiramos medir las diferencias en salario de alcanzar
distintos niveles de educacin. Podramos construir 4 categoras:
Ninguna educacin
Bsica completa
Media completa
Profesional completa
VARIABLES DUMMY
Por tanto, tendramos las siguientes variables dummy en el modelo:
1 =1 si complet educacin bsica 1 =0 en otro caso.
2 =1 si complet educacin media, 2 =0 en otro caso.
3 =1 si complet educacin superior, 3 =0 en otro caso.
= 0 + 1 1 + 2 2 + 3 3
Obs
90.000
200.000
125.000
210.000
0
9
VARIABLES DUMMY
La interpretacin del impacto del nivel educacional alcanzado
debemos hacerlo en referencia a la categora que excluimos. Vemos
el mismo ejemplo pero con nmeros:
= 67.000 + 8.0001 + 30.0002 + 72.0003
= 0 + 1 1 + 2 2 + 3 3
Si d=1 y 1 =1 tendramos el efecto de alcanzar educacin bsica
cuando se es hombre en relacin a cundo se es mujer.
Si d=1 y 2 =1 tendramos el efecto de alcanzar educacin media
cuando se es hombre en relacin a cundo se es mujer.
Si d=1 y 3 =1 tendramos el efecto de alcanzar educacin superior
cuando se es hombre en relacin a cundo se es mujer.
11
= 0 + 0 + 1 + 1 +
Si d=0 entonces el modelo es = 0 + 1 +
Si d=1 entonces el modelo es = (0 + 0 ) + (1 + 1 ) +
Esto genera por tanto cambios en la pendiente. Es decir, en el caso
de que d=1 si sexo es hombre y d=0 si sexo es mujer, los hombres
tendra distinto retorno por ao de educacin dado por (1 + 1 ).
12
= 0 + 1
1 + 1
0 + 0
1
0
0
x
13
y
= 0 + 1
= 0 + 0 + 1 + 1
1 + 1
0 + 0
1
0
0
x
14
16
VARIABLES DUMMY
A continuacin veremos los problemas asociados a la especificacin
incorrecta de los modelos de regresin.
Como punto de partida discutiremos sobre los problemas de incluir
una variable irrelevante en el modelo de regresin o excluir una
variable relevante.
17
18
Modelo 2
2
(1 ) =
1
2
(1 ) =
1 (1 21 )
2
(1 ) =
1
2
(1 ) =
1 (1 21 )
20
21
(1 , 2 ) < 0
2 > 0
Sesgo positivo
Sesgo negativo
2 < 0
Sesgo negativo
Sesgo positivo
22
En general:
Al excluir una variables relevante que no est correlacionada con las
variables explicativas del modelo no implicara ni sesgo ni una mayor
varianza.
Al excluir una variable relevante que est correlacionada con las
variables explicativas del modelo se obtendran estimadores sesgado
pero con menor varianza.
23
24
27
28
( )/
=
,
/( 1)
2 2 )/
(
=
2
(1
)/( 1)
(9.6)
= 0 + 1 log(1 ) + 2 log(2 ) +
(9.7)
31
0 : 1 = 0, 2 = 0
0 : 1 0, 2 0
32