Escolar Documentos
Profissional Documentos
Cultura Documentos
Profesores:1
Jose Miguel Benavente
Andrs Otero
Javiera Vsquez
Julio 2004
1 Cualquier
ndice general
1. Introduccin
10
10
14
16
16
18
21
24
24
31
35
36
38
38
39
41
42
42
44
45
45
47
2 . . . . . . . . . . . . . . . . .
2.7.3. Bondad de Ajuste: R2 y R
48
2.8. Inferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
50
53
61
61
63
2.9. Prediccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
65
67
74
75
2.10.2. Estimacin MV . . . . . . . . . . . . . . . . . . . . . . . .
76
80
80
81
81
85
87
87
89
90
92
97
. . . . . . . . . . . . . . . . . . . 114
149
151
. . . . . . . . . . . . . . . 151
Captulo 1
Introduccin
Econometra es la ciencia que aplica mtodos matemticos y estadsticos al anlisis de datos econmicos, con el objetivo de dotar de una base emprica a una
teora econmica, para as refutarla o verificarla.
(1.1)
Aunque la econometra parece ser tan antigua como la misma ciencia econmica,
slo en 1930 se crea la Sociedad Economtrica, la cual sistematiz su estudio y
prctica. En 1933 se lanza el primer nmero de Econometrica en el que Ragnan
Frish (uno de los fundadores de la Sociedad Economtrica, a quin de hecho, se
le acredita el haber acuado el trmino "Econometra") destaca: "La experiencia
ha mostrado que cada uno de estos tres puntos de vista, el de la estadstica, la
teora econmica y las matemticas, es necesario, pero por si mismo no suficiente
para una comprensin real de las relaciones cuantitativas de la vida econmica
modera. Es la unin de los tres aspectos lo que constituye una herramienta de
anlisis potente. Es la unin lo que constituye la econometra".
Sin embargo, las metodologas aplicadas en econometra (los tres puntos de vista
de Frish), no han sido utilizados exclusivamente por la ciencia econmica. Otras
ciencias naturales tambin han aprovechado sus ventajas. Sin embargo, en el
campo del comportamiento econmico adquieren especial particularidad y relevancia, en tanto el ambiente y el comportamiento econmicos, son esencialmente
no-experimentales, colocndonos en situaciones donde todas las variables relevantes parecen moverse constantemente y donde existen factores impredecibles
que pueden alterar los resultados. Es por esto que la econometra es esencialmente una ciencia no determinstica, donde se reconoce la existencia de factores
5
Econometra I
FACEA, Universidad de Chile
Capitulo 1: Introduccin
TEORIA ECONOMICA
MODELO ECONOMETRICO
ECUACION
DATOS
SUPUESTOS
ESTIMACION
SI
NO
PREDICCIONES Y
RECOMENDACIONES DE POLITICA
TEORIA VERIFICADA
Econometra I
FACEA, Universidad de Chile
Capitulo 1: Introduccin
Esta breve descripcin no es ms que una somera vista a lo que realmente implica
hacer econometra. El camino no est exento de dificultades (en trminos de la
calidad de los datos, de la dificultad de medir las variables que la teora indica,
de los supuestos que realizamos, etc), sin embargo, esto, ms que una dificultad,
implica un desafo.
Captulo 2
Modelo de Regresin Lineal
2.1.
Anlisis de Regresin
2.1.1.
Qu es una regresin?
Econometra I
FACEA, Universidad de Chile
Podemos observar dos cosas: primero, para cada nota posible en los controles
(3.0, 4.0,..) tenemos un rango o distribucin de notas en el examen y segundo,
el promedio de notas en el examen es mayor mientras mayores son notas de los
controles. Esto ltimo se puede apreciar al trazar una recta que una los valores
promedios de notas en examen para cada nota en los controles (linea negra del la
Figura 1), la que corresponde a la recta de regresin. Esta nos permite, para
cada nivel de edad, predecir la estatura promedio correspondiente.
2.1.2.
La ley de gravedad de Newton plantea que toda partcula en el universo atrae a cualquier
otra partcula con una fuerza directamente proporcional al producto de sus masas e inversamente
2
), donde F=fuerza, m1 y m2
proporcional al cuadrado de la distancia entre ellas: F=k( mr1 m
2
son la masa de las dos partculas, r es la distancia y k una constante de proporcionalidad. Esta
es una relacin determinstica, ya que para valores de masas, distancia y constante sabemos
exactamente a la fuerza que se atraen estas partculas. Si alguna de las variables estuviera
medida con error, la ley de Newton pasa a ser una relacin estadstica, y F se convierte en una
variable aleatoria.
Econometra I
FACEA, Universidad de Chile
2.1.3.
2.1.4.
Pn
yi Y
i=1 xi X
yx = qP
2 qPn
2
n
x
X
Y
i
i
i=1
i=1
con X =
1
n
Pn
i=1
xi e Y =
1
n
Pn
i=1
yi .
De ahora en adelante denotaremos con un a los estimadores de un estadstico obtenidos a partir de informacin muestral.
10
Econometra I
FACEA, Universidad de Chile
11
Econometra I
FACEA, Universidad de Chile
12
Econometra I
FACEA, Universidad de Chile
13
Econometra I
FACEA, Universidad de Chile
2.2.
Para esta seccin asumiremos que existe una variable dependiente (Y) que es
explicada por slo una variable (X).
Consideremos el siguiente ejemplo. En la Tabla 1 se presentan datos de salarios
y nivel de educacin para una poblacin de 60 individuos 2
Tabla 1: Salarios y Aos de Educacin
Salario (Y)
E(Y|X)
8
16000
32868
50000
80000
100000
150000
219120
300000
547800
166199
9
18260
36520
54780
82170
109560
170000
273900
365200
730400
204532
10
15000
40000
58000
90000
120000
182600
280000
380000
913000
230956
11
15000
40000
60000
90000
120000
188973
328680
434120
821700
233164
15
35000
73040
100000
140000
230000
400000
600000
883085
1826000
476347
16
40000
90000
105000
180000
280000
434686
730400
1000000
2487041
594125
17
60000
120000
165784
250000
365200
600000
1095600
1643400
4000000
922220
salario
2000000
3000000
4000000
La poblacin tiene 10 niveles distintos de educacin, que van desde 8 a 17. Para
cada uno de estos niveles tenemos 9 individuos con distintos salarios. A pesar de la
variabilidad en los salarios para cada nivel educacional considerado, en promedio
el salario se incrementa a medida que los aos de educacin aumentan. Esto
ltimo se puede verificar al calcular el promedio para cada nivel de educacin, lo
que se presenta en la ltima linea de la Tabla 1, estos corresponden a los valores
esperados condicionales, ya que dependen de los valores dados de la variable X.
En la Figura 2, los valores medios condicionales estn marcados con una cruz. La
unin de estos valores representa la Recta de regresin poblacional, donde
el trmino poblacional se refiere a que estamos trabajando con el total de la
poblacin.
1000000
Recta de regesin
poblacional (RRP)
x
8
x
10
14
12
16
18
Escolaridad
Figura 2: Distribucin de los salarios para distintos niveles de educacin.
Una poblacin de 60 individuos puede parecer un poco pequea, pero por el momento
consideremos que estas familias son el total existente
14
Econometra I
FACEA, Universidad de Chile
Definicin: La curva de regresin poblacional es simplemente el lugar geomtrico de las medias condicionales de la variable dependiente para los valores fijos de
la(s) variable(s) explicativa(s).
En el ejemplo anterior los valores de Y (salario) no estaban distribuidos de forma
simtrica en torno al valor promedio para cada valor X, desde ahora asumiremos
que esto si se cumple, tal como lo podemos apreciar en la Figura 3.
15
Econometra I
FACEA, Universidad de Chile
2.2.1.
(2.1)
donde f() es una funcin cualquiera, en el ejemplo anterior era una funcin lineal.
La ecuacin (2.1) se denomina Regresin Poblacional.
Que forma tiene f() es una pregunta emprica, aunque muchas veces la teora nos
puede ayudar bastante. Supongamos que en nuestro ejemplo anterior el salario
esta relacionado linealmente con la educacin, as podemos suponer que la funcin
de regresin poblacional E(Y|Xi ) es una funcin lineal de Xi , es decir:
E(Y |Xi ) = 1 + 2 Xi
(2.2)
2.2.2.
En los dos ejemplos anteriores veamos que a medida que se incrementa la variable explicativa (educacin o ingreso), el valor promedio de la variable dependiente (salario o gasto) tambin se incrementaba. Sin embargo, este patrn se da
solo a nivel de promedios. A nivel individual esto no es necesariamente cierto.
En la Tabla 1 podemos ver que el individuo que gana menos ingreso con 9 aos
de educacin, gana menos que el individuo con 8 aos de educacin con mayor
salario.
Existe una dispersion de los valores individuales de Yi en torno al promedio
condicional de esta variable. De esta forma, podemos definir:
ui = Yi E(Y |Xi )
o
Yi = E(Y |Xi ) + ui
(2.3)
donde ui es una variable aleatoria no observable que toma valores positivos o negativos. Este trmino surge pues no se puede esperar que todas las observaciones
16
Econometra I
FACEA, Universidad de Chile
(2.4)
(2.5)
(2.6)
As, el supuesto de que la recta de regresin pasa a travs de las medias condicionales de Y, implica que la media condicional de ui es cero.
17
Econometra I
FACEA, Universidad de Chile
2.2.3.
(X) y
140
80
93
95
103
108
113
115
101
Gasto
160
102
107
110
116
118
125
113
en consumo
180 200
110 120
115 136
120 140
130 144
135 145
140
125 137
(Y).
220
135
137
140
152
157
160
162
149
240
137
145
155
165
175
189
161
260
150
152
175
178
180
185
191
173
18
Econometra I
FACEA, Universidad de Chile
(2.7)
Definicin: Un estimador es una regla, frmula o mtodo que dice cmo determinar el parmetro poblacional a partir de la informacin suministrada por la
muestra disponible.
De igual manera que para el caso poblacional la funcin de regresin muestral
19
Econometra I
FACEA, Universidad de Chile
(2.8)
(2.9)
(2.10)
(2.11)
(2.12)
Econometra I
FACEA, Universidad de Chile
2.2.4.
Propiedades de un Estimador
lm P r[|Xn X| < ] = 1
Econometra I
FACEA, Universidad de Chile
plim
X plimX
= plimY
Y
Ejemplo: Tenemos una variable yi que esta compuesta por la suma de un componente fijo o determinstico (c) y un componente aleatorio(ui ):
yi =
c
|{z}
componente
f ijo
ui
|{z}
componente
aleatorio
Si ui N (0, u2 ), entonces:
= E(yi ) = c
V (yi ) = E[(yi E(yi ))2 ] = E[u2i ] = u2
22
Econometra I
FACEA, Universidad de Chile
1
1X
= Y = (y1 + y2 + ... + yn ) =
yi
n
n i=1
Veamos que propiedades tiene este estimador:
Insesgamiento: E(
) =
E(
) = E Y
1
= E
(y1 + y2 + ... + yn )
n
1
=
(E(y1 ) + E(y2 ) + ... + E(yn ))
n
dado que E(yi ) = E(c) + E(ui ) = c,
| {z }
0
E(
) = c =
Eficiencia: V ar(
)<V ar(
1 )
Comparemos el estimador promedio muestral con un estimador que es simplemente cualquier valor de yi:
=Y
1 = yi
E(Y ) = c
E(yi ) = c
V ar(Y )= nu
V ar(yi ) = u2
23
Econometra I
FACEA, Universidad de Chile
2.3.
2.3.1.
(2.13)
es decir, los residuos son simplemente la diferencia entre los valores verdaderos y
estimados de Y.
Si queremos que la funcin de regresin muestral sea lo ms cercana posible
a la poblacional, debemos tratar de escoger los coeficientes de regresin (los s)
de forma tal que los errores sean lo ms pequeos posible. De acuerdo a esto
un criterio para escoger la P
funcin P
de regresin muestral podra ser minimizar
la suma de los los errores:
ui = (Yi Yi ), sin embargo este criterio no es
muy bueno. Observemos la Figura 6, existe una gran diferencia en la magnitud
de los errores, sin embargo en la suma de los errores todos reciben el mismo peso.
Debido a esto es posible que la suma de los errores sea muy pequea cercana a
cero, incluso cuando la dispersion de los errores en torno a la funcin de regresin
muestral es alta.
24
Econometra I
FACEA, Universidad de Chile
(2.15)
(2.16)
(2.17)
(2.18)
(2.19)
Yi 2
n
Xi
Xi + 2
Xi2
n
De esta forma, el estimador de 2 es:
P
P P
n Yi Xi Xi Yi
P
P
2 =
n Xi2 ( Xi )2
25
(2.20)
(2.21)
(2.22)
Econometra I
FACEA, Universidad de Chile
P
P
1 =
n Xi2 ( Xi )2
= Y 2 X
(2.23)
1
n
Pn
i=1
Yi
(2.24)
(2.25)
Los resultados (2.23) y (2.25) podran haber sido obtenidos de igual forma, expresando inicialmente el modelo de regresin en desviaciones con respecto a la media.
El modelo de regresin original es:
Yi = 1 + 2 Xi + ui
si le restamos el promedio de esta:
Y = 1 + 2 X + ui
(2.26)
Econometra I
FACEA, Universidad de Chile
Gasto en I+D
(Millones de dlares)
2
3
5
4
11
5
Ganancia Anual
(Millones de dlares)
20
25
34
30
40
31
Econometra I
FACEA, Universidad de Chile
P
P
2 =
n Xi2 ( Xi )2
P
Yi Xi nXY
2 = P 2
Xi n(X)2
Utilicemos los datos para obtener los clculos necesarios para computar el estimador de 2 :
Ao
(n=6)
1990
1991
1992
1993
1994
1995
Suma
Ganancia Anual (Y )
(Millones de dlares)
20
25
34
30
40
P 31
Y =180
XY
40
75
170
120
440
P 155
XY =1000
X2
4
9
25
16
121
P 25
X 2 =200
X = nX
X = 30
6
X =P5
Y = nY
Y = 180
6
Y = 30
De esta forma,
1000 6 5 30
2 =
200 6 (5)2
1000 900
=
200 150
100
=
50
2 = 2
1 = Y 2 X
= 30 2 5
= 30 10
1 = 20
De esta forma, la recta de regresin muestral estimada es:
Y = 20 + 2 X
28
Econometra I
FACEA, Universidad de Chile
Con esta ecuacin en mano, el gerente de I+D de esta compaa puede predecir
el promedio en ganancias futuras anuales a partir de la cantidad presupuestada
de gasto en Investigacin y Desarrollo. Por ejemplo, si la compaa presupuesta
gastar 8 millones de dlares en I+D el prximo ao, entonces debe ganar aproximadamente 36 millones de dlares durante este ao.
Ejemplo 2: Tenemos los siguientes datos de portales de internet, con los cuales
queremos ver el impacto promedio del nmero de visitas en el valor de la empresa:
AOL
Yahoo
Lycos
Cnet
Juno Web
NBC Internet
Earthlink
El sitio
Promedio
Suma
1
2
vempresa
134844
55526
5533
4067
611
4450
2195
1225
26056.4
visitas
50
38
28
8
8
16
5
2
19.4
y-ybar
108787.6
29469.6
-20523.4
-21989.4
-25445.4
-21606.4
-23861.4
-24831.4
x-xbar
30.6
18.6
8.6
-11.4
-11.4
-3.4
-14.4
-17.4
2381.1
-20076.8
29
(y-ybar)*(x-xbar)
3331621.0
548871.8
-177014.1
250129.1
289441.1
72921.5
343007.3
431445.1
(x-xbar)^2
937.9
346.9
74.4
129.4
129.4
11.4
206.6
301.9
5090422.9
2137.9
ygorro
98976.5
70403.7
46593.1
-1028.3
-1028.3
18020.3
-8171.5
-15314.7
26056.4
ugorro
35867.5
-14877.7
-41060.1
5095.3
1639.3
-13570.3
10366.5
16539.7
0
Econometra I
FACEA, Universidad de Chile
5090422,9
2 =
= 2381,1
2137,9
1 = 26056,4 2381,1 19,4 = 20076,8
30
Econometra I
FACEA, Universidad de Chile
2.3.2.
31
Econometra I
FACEA, Universidad de Chile
Figura 8: Homocedasticidad
32
Econometra I
FACEA, Universidad de Chile
Figura 9: Heterocedasticidad
(2.27)
Econometra I
FACEA, Universidad de Chile
Como mencionamos en la seccin 2.2.2 se supone que X y u tienen una influencia separada sobre Y (determinstica y estocstica, respectivamente),
ahora si X y u estn correlacionadas, no es posible determinar los efectos
individuales sobre Y.
Este supuesto se cumple automticamente si X es no estocstica y el supuesto
3 se cumple.
Supuesto 7: El nmero de observaciones n debe ser mayor que el nmero
de parmetros por estimar. El nmero de observaciones tiene que ser
mayor que el nmero de variables explicativas, de otra forma no se puede
resolver el sistema de ecuaciones. Supongamos que tenemos una sola observacin para nuestra variable dependiente y nuestra variable explicativa (Y1
y X1 ), el modelo de regresin es tal que tiene intercepto, es decir:
Y1 = 1 + 2 X1 + u1
el estimador MCO de 2 es :
P
xi yi
2 = P 2
xi
donde xi = Xi X e yi = Yi Y , sin embargo con una observacin X1 = X
e Y1 = Y , as 2 no esta determinado y as tampoco podemos determinar
1 .
Supuesto 8: Variabilidad en los valores de X. No todos los valores de X en
una muestra deben ser iguales, var(X) debe ser un nmero finito positivo.
Si las X son las mismas Xi = X, de esta forma ni 2 ni 1 pueden ser
estimados.
Supuesto 9: El modelo de regresin esta correctamente especificado.
Esto es muy importante, ya que por ejemplo la omisin de variables importantes en el modelo, o la eleccin de la forma funcional inadecuada, o la
consideracin de supuestos estocsticos equivocados sobre las variables del
modelo, harn cuestionable la validez de la interpretacin de la regresin
estimada. (Aspectos que veremos ms adelante).
34
Econometra I
FACEA, Universidad de Chile
2.3.3.
2 = P 2
xi
donde yi = 2 xi +ui (modelo poblacional en desviaciones con respecto a la media).
De esta forma reemplazando yi en el estimador de 2 :
P
xi (2 xi + ui )
P 2
2 =
x
P 2 iP
x
ui x i
= 2 P 2i + P 2
x
xi
Pi
ui x i
= 2 + P 2
xi
Aplicando valor esperado a la expresin anterior:
P
ui x i
E(2 ) = 2 + E P 2
xi
P
E(ui )xi
P 2
= 2 +
por
xi
= 2 por supuesto 3
supuesto 2
(2.28)
35
Econometra I
FACEA, Universidad de Chile
[ xi ui ]2
P
= E
[ x2i ]2
Por supuesto 4 E(u2i ) = 2 y por supuesto 6 E(ui uj ) = 0, esto implica que:
2
var(2 ) = P 2
xi
2.3.4.
(2.29)
= i=1 i
n
pareciera ser un estimador razonable. Pero los errores de MCO, estn estimados
imperfectamente si los comparamos con los errores poblacionales, ya que dependen de una estimacin de 1 y 2 . Veamos esto con ms detalle:
Partiendo del Regresin poblacional expresado en desviaciones con respecto a
la media:
yi = 2 xi + (ui u)
(2.30)
ui = yi 2 xi
(2.31)
xi (ui u)
E
ui
= E(2 2 )
xi + E
(ui u) 2 E (2 2 )
{z
}
{z
}
|
|
(i)
(ii)
X
X
x
u
i
i
2
= var(2 )
xi + (n 1)var(ui ) 2E P 2
xi (ui u)
xi
= 2 + (n 1) 2 2 2
= (n 2) 2
36
Econometra I
FACEA, Universidad de Chile
(i) E
hX
i
hX
i
(ui u)2 = E
(u2i 2ui u + u2 )
i
hX
X
= E
u2i 2u
ui + nu2
hX
i
nX
2
2
= E
ui 2u
ui + nu
n
i
hX
= E
u2i 2nu2 + nu2
hX
i
2
2
= E
ui nu
"
P 2 #
X
ui
2
= E
ui n
n
n
= n 2 2
n
= (n 1) 2
h
i
h
i
X
X
(ii) E (2 2 )
xi (ui u) = E (2 2 )
xi (ui u)
P
x i ui X
= E P 2
xi (ui u)
xi
P
P
P
( xi ui )2
x i ui x i
P 2 u
P 2
= E
xi
xi
2
=
Por lo tanto se define el estimador de la varianza
e2 como:
P 2
ui
2
e =
n2
De forma tal que,
e2 es un estimador insesgado de 2 :
X
1
e2 =
E
u2i = 2
n2
37
(2.32)
Econometra I
FACEA, Universidad de Chile
2.4.
Ahora abandonemos la simplificacin de solo usar dos variables, de ahora en adelante generalizaremos el modelo de regresin lineal para que pueda tener hasta k
variables explicativas.
Aclaracin: haremos un cambio de notacin, cada observacin i de la variable
dependiente ser denotada por yi y cada observacin i de una variable explicativa, por ejemplo X1 , ser denotada por x1i . Ahora las variables en minscula no
significa que estn en desvos.
El Modelo de Regresin Poblacional en este caso es:
yi = 1 + 2 x2i + 3 x3i + ... + k xki + ui
2.4.1.
i = 1, ..., n
y1
1
x21
x31
xk1
u1
y2 1
x22
x32
xk2
u2
+
...
+
+
.. = .. 1 +
..
..
..
..
2
3
k
. .
.
.
.
.
yn
1
x2n
x3n
xkn
un
Donde las variables explicativas se pueden agrupar en una sola matriz de dimensin nk, que denotaremos simplemente como X, de esta manera el modelo se
expresa de la siguiente forma:
u1
1
1 x21 x31 xk1
y1
y2 1 x22 x32 xk2 2 u2
.. = ..
..
.. . .
.. .. + .. Y = X + u(2.33)
. .
.
.
.
. . .
un
k
1 x2n x3n xkn
yn
donde Y es un vector de dimensin n1, X es la matriz de variables explicativas
de dimensin nk y u es un vector correspondiente al trmino de error con dimensin n1.
38
Econometra I
FACEA, Universidad de Chile
E(u1 )
E(u2 )
E(u) =
= 0
..
n1
.
E(un )
E(u21 ) E(u1 u2 ) E(u1 un )
2 0 0
E(u2 u1 ) E(u2 ) E(u2 un ) 0 2 0
2
2
0
I
E(uu ) =
= ..
..
..
..
.. . .
.. = nn
.
.
.
.
.
.
.
.
.
.
E(un u1 ) E(un u2 ) E(u2n )
0 0 2
De los supuestos 3, 4 y 5, tenemos entonces que el trmino de error tiene la
siguiente distribucin:
2
u 0 , I
(2.34)
n1
2.4.2.
nn
El mtodo de MCO, plantea que los parmetros del modelo pueden ser estimados
la que en trminos
minimizando la suma de los errores al cuadrado (SE ()),
matriciales equivale a:
=
SE ()
n
X
u2i = u0 u
i=1
mn SE () = mn (Y X ) (Y X )
h
i
= mn Y 0 Y 20 X 0 Y + 0 X 0 X
SE ()
= 2X 0 Y + 2X 0 X = 0
0
= (X 0 X)1 X 0 Y
39
(2.35)
Econometra I
FACEA, Universidad de Chile
De (2.35) tenemos:
= 0 X 0 u = 0
X 0 (Y X )
(2.36)
1
1
1
x2,1 x2,2 x2,3
x3,1 x3,2 x3,3
..
..
..
.
.
.
xk,1 xk,2 xk,3
1
x2,n
x3,n
..
..
.
.
xk,n
1 x2,1
1 x2,2
1 x2,3
..
..
.
.
1 x2,n
1
1
1
x2,1 x2,2 x2,3
Pn
Pn
n
x
2,i
i=1
Pn 2
Pn i=1 x3,i
Pn x2,i
i=1 x2,i x3,i
Pni=1
Pn i=1 x2,i
P
n
2
i=1 x3,i
i=1 x3,i x2,i
i=1 x3,i
..
..
..
Pn .
Pn .
Pn .
i=1 xk,i
i=1 xk,i x2,i
i=1 xk,i x3,i
1
2
3
.
..
k
1
y1
x2,n
y2
x3,n y3
.. ..
...
. .
xk,n
yn
x3,1 xk,1
x3,2 xk,2
x3,3 xk,3
..
..
..
.
.
.
x3,n xk,n
P
P ni=1 xk,i
Pni=1 x2,i xk,i
n
i=1 xk,i
1
2
3
.
..
k
Pn
Pn i=1 yi
yi x2,i
Pi=1
n
i=1 yi x3,i
..
Pn .
i=1 yi xk,i
Es importante recordar que el estimador MCO esta definido solo cuando la matriz
(XX) es invertible, lo que ocurre siempre y cuando:
1. Las k columnas de la matriz X sean linealmente independientes.
2. Se disponga al menos de tantas observaciones como variables explicativas,
es decir: n k.(Supuesto 7)
Pongamos atencin en el segundo supuesto, cuando n=k la matriz X tiene dimensin kk, por lo tanto salvo que no se cumpla el supuesto 8, X es invertible, y de
esta forma (X 0 X)1 = X 1 (X 0 )1 y por lo tanto:
= (X 0 X)1 X 0 Y = X 1 (X 0 )1 X 0 Y = X 1 Y
40
(2.37)
Econometra I
FACEA, Universidad de Chile
2.5.
(2.38)
(2.39)
41
Econometra I
FACEA, Universidad de Chile
( E())
0]
E[( E())
E[( ) ( )0 ]
E[(X 0 X)1 X 0 uu0 X(X 0 X)1 ]
(X 0 X)1 X 0 E(uu0 )X(X 0 X)1
(X 0 X)1 X 0 ( 2 In )X(X 0 X)1
2 (X 0 X)1
(2.40)
e2 =
2.5.1.
u0 u
nk
2.5.2.
Teorema de Gauss-Markov
42
Econometra I
FACEA, Universidad de Chile
cov()
43
Econometra I
FACEA, Universidad de Chile
2.6.
(2.41)
MY
x1
PY
0
x2
Col X
Econometra I
FACEA, Universidad de Chile
2.7.
El objetivo de esta seccin es introducir un criterio de ajuste de nuestra regresin, es decir, un criterio que nos indique cuan bien se ajusta nuestro modelo a
la muestra.
En principio, podramos pensar que la suma de los residuos cuadrados, es decir, nuestro criterio original de ajuste, es una buena opcin: a menor sea ste,
mejor es nuestro ajuste. Sin embargo, la suma de los residuos cuadrados puede
ser arbitrariamente escalada al multiplicar la variable dependiente (Y) por el factor de escala deseado, lo cual invalida su uso como criterio de ajuste.
Por ello, se ha desarrollado un criterio que elimine el problema anterior. Dicho estadstico ya no se basar en la magnitud de un valor (como la suma de
los cuadrados de los residuos), sino que intentar preguntarse si la variacin de
las variables independientes (X) explica la variacin de la variable independiente, como veremos ms adelante. Para ello analizaremos con un poco ms de
profundidad el modelo de regresin lineal en desvos con respecto a la media y
presentaremos la llamada descomposicin de varianza (o anlisis de varianza),
ambos, insumos fundamentales para obtener nuestro estadstico de bondad de
ajuste.
2.7.1.
(2.42)
(2.43)
Luego, si sumamos para todas las observaciones y dividimos a ambos lados por
el tamao muestral n, tenemos:
Y = 1 + 2 x2 + 3 x3 + + k xk
(2.44)
1 = Y 2 x2 + 3 x3 + + k xk
(2.45)
por lo cual:
45
Econometra I
FACEA, Universidad de Chile
(2.46)
la cual es una expresin similar a (2.43), excepto por dos importantes diferencias.
Primero, el modelo no posee constante y segundo, las variables se encuentran
expresadas en desvos con respecto a la media. A pesar de ello, note que los coeficientes y los residuos son los mismos en ambos modelos.
De lo anterior surge un importante corolario respecto del trmino constante de
nuestro modelo. En general, el inters del investigador se centra en el impacto de
los regresores sobre la variable dependiente, por lo cual, el trmino constante no
es ms que una correccin que garantiza que los promedios muestrales de ambos
miembros del modelo economtrico coincidan.
Para transformar en desvos con respecto a la media un modelo en trminos matriciales, introduciremos una matriz fundamental para el anlisis de esta seccin.
Denotaremos por M 0 una matriz de n n, definida como:
1 0 0
1 1 1
1 n1 n1 n1
1
1 n1 n1
ii0
0 1 0 1 1 1 1
M 0 = I = .. .. . . .. .. .. . . .. = .. n
..
..
..
nn
n
. .
. . n . .
. . .
.
.
.
n1 1 n1
0 0 1
1 1 1
n1
donde I es la identidad (nn) e i corresponde al vector unitario de dimensin n.
Dicha matriz es singular, simtrica (M 0 =M 0 ) e idempotente (M 0 M 0 =M 0 ). En
general, M 0 es conocida como matriz de desvos, ya que resta a cada columna de
la matriz involucrada, su media aritmtica. Por ejemplo, es fcil comprobar que:
Pn
Y
y
y1
1
i
i=1
y2 1 Pn yi y2 Y
1 0
i=1
0
M Y = Y ii Y = ..
=
..
..
n
. n
.
Pn.
yn Y
yn
i=1 yi
Por lo tanto, nuestro modelo expresado en matrices, puede ser expresado en trminos de desvo con respecto a la media como:
M 0 Y = M 0 X + M 0 u
46
(2.47)
Econometra I
FACEA, Universidad de Chile
2.7.2.
Anlisis de Varianza
n
X
(Yi Y )2
(2.48)
i=1
Para encontrar entonces una expresin para (2.48), de la ecuacin (2.47) tenemos
que nuestro modelo estimado en desvos con respecto a la media es:
M 0 Y = M 0 X + M 0 u
con lo cual, al particionar nuestra matriz X en X = [i X2 ], nuestro vector de
parmetros en 0 = [1 2 ] y considerando que M 0 i = 0 y que M 0 u = u,
tenemos que:
M 0Y
= M 0 i1 + M 0 X2 2 + M 0 u
= M 0 X2 2 + u
(2.49)
Luego, para formar la TSS(suma de los cuadrados totales o la suma de los cuadrados de las desviaciones de Y con respecto a su media), de la ecuacin (2.48),
multiplicamos por Y la ecuacin (2.49):
Y 0M 0Y
=
=
=
0
0
Y M Y =
T SS =
Y 0 (M 0 X2 2 + u)
(X + u)0 (M 0 X2 2 + u)
0 X 0 M 0 X2 2 + 0 X 0 u + u0 M 0 X2 2 + u0 u
2 X20 M 0 X2 2 + u0 u
ESS + RSS
(2.50)
(2.51)
donde el segundo y el tercer trmino desaparecen gracias a que los residuos estimados son, por construccin, ortogonales a las variables explicativas 4 . La igualdad
3
Note que para dicha definicin utilizamos los cuadrados de la desviaciones, ya que la suma
de las desviaciones es siempre cero.
4
= X 0 Y X 0 Y = 0.
Ya que X 0 u
= X 0 (Y X )
47
Econometra I
FACEA, Universidad de Chile
2.7.3.
2
Bondad de Ajuste: R2 y R
Definimos entonces la bondad de ajuste del modelo a travs del siguiente estadgrafo llamado tambin coeficiente de determinacin:
R2 =
ESS
T SS
(2.52)
RSS
T SS
(2.53)
Note que:
1. El coeficiente de determinacin es siempre menor a 1. Ello porque RSS
T SS y por lo tanto RSS
1.
T SS
2. El anlisis de varianza anterior fue derivado bajo el supuesto que el modelo
inclua una constante (por ello utilizbamos la matriz M 0 ). En dicho caso,
necesariamente R2 0. En caso de que el modelo no incluya una constante,
se debe utilizar la frmula (2.5.2) utilizando TSS=YY (sin desvos).
3. Al agregar regresores al modelo, el R2 nunca decrecer (se mantendr constante o aumentar)
4. No es claro cuan bueno sea como predictor de ajuste.
Para ver este ltimo punto, suponga que usted posee el siguiente modelo poblacional:
Y = 1 + 2 X + u
48
Econometra I
FACEA, Universidad de Chile
(2.54)
2 = 1 (1 R2 ) (n 1)
R
(n k)
(2.55)
o equivalentemente:
49
Econometra I
FACEA, Universidad de Chile
2.8.
Inferencia
Una vez que hemos estimado nuestra regresin muestral, es necesario preguntarse
cuan buena aproximacin es dicha regresin de la poblacional. Para que la aproximacin sea cercana, es condicin necesaria que los parmetros incluidos en la
regresin muestral sea estadsticamente distintos de cero (en caso contrario, no
pertenecen a la regresin poblacional). As, uno de nuestros objetivos puede ser
el testear la significancia individual de los parmetros.
Pero lo anterior es slo una de las preguntas que como investigadores podemos
estar interesados en responder. Por ejemplo, en la estimacin de la funcin de
produccin de una firma, que asumimos Cobb Douglas (Y = AK L eu o en logaritmo ln Y = ln A + ln K + ln L + u), podemos estar interesados en descubrir si
la firma presenta rendimientos constantes, crecientes o decrecientes a la escala, lo
cual se reflejar en que + > o 1. Por lo tanto, ello podra ser otra hiptesis
interesante de plantearse. Tambin podra ser interesante descubrir si todos los
parmetros a la vez son distintos de cero, o de algn valor determinado.
La gama de preguntas posibles respecto del valor de los parmetros es slo acotada por la pregunta que el investigador desee responder. Nuestro objetivo es,
por lo tanto, desarrollar los mtodos de inferencia y contraste de hiptesis que
nos permitan responder, en el contexto de una regresin muestral particular, las
preguntas anteriores.
Dos notas precautorias. En esta seccin nos ocuparemos de restricciones o hiptesis lineales sobre los coeficientes. Restricciones no lineales son ms escasas en
econometra aplicada y se desarrollan en contexto de un modelo particular. Segundo, en todo lo que se refiere a este apartado, asumiremos que los errores de
nuestra regresin muestral siguen una distribucin normal (ya veremos porqu).
Entonces, sea nuestro modelo poblacional
Y = X + u
donde X es una matriz de (n k),u e Y son vectores (n 1) y es vector de
(k 1).
Sean entonces las siguientes hiptesis:
1. H0 : i = 0 Plantea que el regresor Xi no posee influencia alguna sobre Y.
Este es el test ms comn y nos referiremos a l como test de significancia.
50
Econometra I
FACEA, Universidad de Chile
Econometra I
FACEA, Universidad de Chile
(2.56)
con lo cual, slo nos resta derivar el test que nos permita rechazar o no rechazar
nuestra nula. La construccin del estadgrafo es como sigue. Dado que MCO
= , por lo tanto,
(bajo los supuestos relevantes) es insesgado, tenemos que E()
= R, mientras que la varianza de R corresponde a
E(R)
= E[R( )( )0 R0 ]
V [R]
0
= RV ar()R
= 2 R(X 0 X)1 R0
Necesitamos an un supuesto ms para determinar la distribucin muestral de
nuestra nula. Dado que es funcin de u y u N (0, 2 ), entonces N (, 2 (X 0 X)1 )
y por lo tanto R N (r, 2 R(X 0 X)1 R0 ), entonces:
N [, 2 (X 0 X)1 ]
(2.57)
(2.58)
y si la nula R = r es cierta:
(2.59)
2 R(X 0 X)1 R0
N [0, 1]
(2.60)
(2.61)
(2.62)
Basta con recordar que si x corresponde a un vector de realizaciones normales (0,1), por lo
cual x N (0, 2 I) y A corresponde a una matriz simtrica e idempotente de rango n, entonces
1 0
2
= M Y = M u y que el rango de una matriz simtrica
2 x Ax n . Finalmente, recuerde que u
e idempotente es su traza.
6
Basta con recorder que si el vector x, de dimensin n, es tal que x N (0, ), entonces,
0 1
x x 2n .
52
Econometra I
FACEA, Universidad de Chile
luego, combinando los dos resultados anteriores, se puede demostrar que (hacerlo)7 :
[(R r)0 [R(X 0 X)1 R0 ]1 (R r)]/q
F(q,nk)
u0 u/(n k)
(2.63)
El test expuesto en (2.63) corresponde a la forma general del test F. Dicho test
es de utilidad para testear cualquier hiptesis de la forma expuesta en (2.56). A
continuacin veremos subcasos de dicho test general.
2.8.1.
( i0 )2
F (1, n k)
Vd
ar(i )
(2.64)
(2.65)
utilizada corresponde a t = d
, donde se busca testear la hiptesis nula de
V ar(i )
t= q
d i , j ) + Vd
Vd
ar(i ) + 2Cov(
ar(j )
tnk
(2.66)
Slo un poquito de lgebra y recordar como se construye una distribucin F(q, n-k) a partir
de la divisin de dos 2 con grados de libertad q en el numerador y n-k en el denominador.
53
Econometra I
FACEA, Universidad de Chile
grandes, sin embargo, la t posee colas ms gruesas que la normal (lo cual es ms
pronunciado en muestras pequeas: n30). La siguiente figura expone la relacin
entre la distribucin t y la normal:
Probabilidad
Distribucin Normal
Distribucin t
Nota precautoria:
Toda la derivacin anterior se basa en el estricto supuesto de normalidad de
los errores. En caso de que los mismos no distribuyan normal, la distribucin
del test F (y por lo tanto el del t) es desconocida en muestras finitas. Sin ema
bargo, es posible demostrar que t N (0, 1), es decir, que el test t distribuye
asintticamente normal. Luego, los valores crticos de t y (normal estndar)
se encuentran sumamente cerca si n-k30, por lo cual, en trminos prcticos no
importa mucho cual de ellas escojamos para los valores crticos (a menos que la
muestra sea especialmente pequea).
Finalmente, nos queda examinar los criterios de rechazo del test y los niveles
de confianza. Como usted recordar de sus clases de estadstica, lo anterior depende de como especifiquemos la hiptesis alternativa. A continuacin, pasamos
a revisar este punto.
54
Econometra I
FACEA, Universidad de Chile
Por qu en la cola derecha? Porque la probabilidad de rechazo, es decir, el nivel de significancia, nos indica hasta donde puedo tolerar un valor mayor a io , por lo cual, carecera de
sentido que la zona de rechazo se encuentre en la cola izquierda de la distribucin. Por ejemplo,
si io =0, la distribucin de nuestro estadgrafo se centra en cero (vea la frmula), por lo cual la
hiptesis alternativa correspondera a que el parmetro es positivo. el punto es cun positivo
puedo aceptar que sea?.
55
Econometra I
FACEA, Universidad de Chile
Probabilidad
Se Rechaza (5%)
No se Rechaza
56
Econometra I
FACEA, Universidad de Chile
Probabilidad
Se Rechaza (2,5%))
Se Rechaza (2,5%)
No se Rechaza
Econometra I
FACEA, Universidad de Chile
tamao del test y por lo tanto, el ETI, es una variable endgena al investigador,
en tanto que l decide con que nivel de confianza trabajar. Luego, el objetivo se
transforma en, dado un nivel de confianza, minimizar la ocurrencia de ETII.
Intuitivamente, si usted escoge un nivel de significancia pequeo (1 %, por ejemplo), sus zonas de rechazo sern pequeas, con lo cual, inevitablemente, la zona de
no rechazo crece, lo cual implica que por minimizar el ETI, ha aumentado el ETII.
P-value
Otra forma alternativa al valor crtico de tabla para rechazar o no rechazar nuestra nula, corresponde al uso de los llamados p-values, los cuales son reportados
en cualquier paquete estadstico. El p-value (p) se define como:
p = p(tcalculado ) = P (|Z| |tcalculado |) = 2(1 (|tcalculado |))
(2.67)
para i = 1, ..., N
2 5 6
0 10 18
7
20
4 48
20
2,1935
1
=
= =
48 824
298
0,2338
2
La matriz de varianzas y covarianzas de es:
=
V ()
u2 (X 0 X)1
0,436 4 48
0,180866 0,010536
=
=
48 824
0,010536 0,000878
2
58
Econometra I
FACEA, Universidad de Chile
Y
)
i
i=1
P4
2i /2
RSS/2
2
i=1 u
R = 1
= 1 P4
= 0,953
2
T SS/3
i=1 (Yi Y ) /3
Como podemos ver, el grado de ajuste del modelo es bastante bueno, como el
modelo incluye constante, el R2 se puede interpretar como la proporcin de la
variabilidad de la variable independiente que es explicada por la variabilidad de
la variable dependiente, la que en este caso alcanza un 97 %.
Ahora veamos si estos parmetros estimados son significativos a un 95 % de confianza, para lo cual realizaremos un test t de significancia a cada uno de ellos:
1. Test de significancia de 1 :
H0 : 1 = 0
H1 : 1 6= 0
t=
1
V ar(1 )
t2
No se
Rechaza
Se
Rechaza
(2,5%))
Se
Rechaza
(2,5%)
t(2)=4,303
t(2)=4,303
tc=5,158
59
Econometra I
FACEA, Universidad de Chile
H0 : 2 = 0
H1 : 2 6= 0
t=
2
V ar(2 )
t2
No se
Rechaza
Se
Rechaza
(2,5%))
Se
Rechaza
(2,5%)
t(2)=4,303
t(2)=4,303
tc=7,893
60
Econometra I
FACEA, Universidad de Chile
2.8.2.
Todas las pendientes del modelo son cero: En este caso, se puede
demostrar que el test F puede expresarse como:
F =
ESS/(k 1)
F(k1,nk)
RSS/(n k)
(2.68)
R2 /(k 1)
F(k1,nk)
(1 R2 )/(n k)
(2.69)
(
u0 u u0 u)/k2
F (k2 , n k)
u0 u/(n k)
(2.70)
2.8.3.
Intervalos de Confianza
Una forma alternativa (o mejor dicho complementaria) de examinar la significancia estadstica de un parmetro ( o un conjunto de ellos) es a travs de intervalos
de confianza (IC). Ellos nos indican, dado un nivel de confianza, el rango de
valores admisibles del coeficiente que se estima. Los niveles de confianza generalmente utilizados son 99 %, 95 % y 90 % (al igual que en los test de hiptesis),
61
Econometra I
FACEA, Universidad de Chile
i i0
1 = P r Z/2 q
Z1/2
V ar(i )
i i0
= P r Z1/2 q
Z1/2
V ar(i )
q
q
Intuitivamente, ya que a ms exacta es mi estimacin del rango posible, con menos confianza
puedo afirmar estar en lo correcto.
10
Una forma fcil de verlo es pensando en i0 =0, es decir, que la variable xi no ayuda a
explicar y.
62
Econometra I
FACEA, Universidad de Chile
(n k)
2
2nk
2
(2.71)
tenemos
Utilizando la misma lgica que utilizamos para el IC de un parmetro ,
2
que el IC para
corresponde a:
"
#
2
(n k)
2
(n
k)
2 2
= (1 )
(2.72)
2nk,
nk,1
Note que los valores crticos utilizados corresponden a 2nk,1 y 2nk, , ya que
la distribucin 2 es una distribucin asimtrica.
2.8.4.
E(u3 )
S=
3
( 2 ) 2
mientras que la kurtosis (o coeficiente de):
E(u4 )
K=
( 2 )2
63
Econometra I
FACEA, Universidad de Chile
1X r
mr =
u
n i=1 i
Note que el estadgrafo est definido en trminos del exceso de kurtosis, por
lo cual, a menor sea el valor, menor es la probabilidad de rechazar la nula de
normalidad. Note adems que el estadstico es esencialmente no constructivo, en
trminos de que no nos indica que camino seguir en caso de rechazar la nula,
adems de que no rechazar normalidad no implica confirmar su existencia. Sin
embargo, en la prctica corresponde al test ms utilizado.
64
Econometra I
FACEA, Universidad de Chile
2.9.
Prediccin
Es posible y se recomienda derivar una expresin para la varianza del error de prediccin
utilizando un modelo con 2 regresores. En est expresin se aprecia claramente la dependencia
de la varianza del error de prediccin con la dispersion en torno a la media de las variables
explicativas.
65
Econometra I
FACEA, Universidad de Chile
y 0 yb0
N (0, 1)
2 (1 + x0 (X 0 X)1 x00 )
y 0 yb0
q
tnk
b2 (1 + x0 (X 0 X)1 x00 )
Por lo tanto, dada una prediccin puntual yb0 y una estimacin de la desviacin
estndar del error de prediccin podemos construir un intervalo de confianza para
el valor de y 0 :
p
p
P r[b
y 0 t1/2,nk V ar(b
e0 ) y 0 yb0 + t1/2,T k V ar(b
e0 )] = 1
Consideremos ahora que el investigador no est interesado en predecir el valor
de la variable endgena y 0 , si no tan solo su valor esperado E(y 0 ) = x0 . La
b La diferencia es que el error
prediccin, al igual que en el caso anterior, ser x0 .
de prediccin en este caso estar definido por ee = E[y 0 ] x0 b = x0 x0 b =
b
x0 ( ).
Calculando entonces la varianza (Hacerlo!) de este nuevo error de prediccin
podemos construir ahora un intervalo de confianza para E(y 0 ) de la misma forma
que antes.
E[y 0 ] yb0
q
N (0, 1)
2 (x0 (X 0 X)1 x00 )
P r[b
y 0 t1/2,nk
E[y 0 ] yb0
q
tnk
V ar(e
e0 ) E[y 0 ] yb0 + t1/2,T k
p
V ar(e
e0 )] = 1
b = x0 V ar()x
b 00 = 2 x0 (X 0 X)1 x00 .
Donde utilizamos V ar(yb0 ) = V ar(x0 )
66
Econometra I
FACEA, Universidad de Chile
2.9.1.
Econometra I
FACEA, Universidad de Chile
P
M AE =
| yi ybi |
n0
Donde n0 es el nmero de perodos que hay que predecir. Estos mtodos presentan
un problema obvio de escala. Algunas medidas que no presentan este problema
se basan en el estadstico U de Theil.
s
P
(1/n0 ) i (yi ybi )2
P
U=
(1/n0 ) i yi2
Ejemplo:
Supongamos que un analista comercial est pensando en construir un edificio
comercial para luego vender. Sin embargo, no sabe cuales son las caractersticas
que debiera tener el edificio para maximizar su rentabilidad. Para descubrir esto
el se propone realizar un anlisis de regresin.
El analista elige al azar una muestra de 11 edificios de oficinas de 1500 edificios
posibles. Estos datos los puede utilizar para emplear el anlisis de regresin lineal
multiple para estimar el valor de un edificio de oficinas en un rea determinada
basndose en las siguientes variables.
Datos
x1
Superficie m2
2310
2333
2356
2379
2402
2425
2448
2471
2494
2517
2540
x2
Oficinas
2
2
3
3
2
4
2
2
3
4
2
x3
Entradas
2
2
1,5
2
3
2
1,5
2
3
4
3
x4
Antiguedad aos
20
12
33
43
53
23
99
34
23
55
22
y
Valor Edificio US$
142000
144000
151000
150000
139000
169000
126000
142900
163000
169000
149000
Teniendo los datos podemos entonces utilizar cualquier software estadstico que
nos permita desarrollar la estimacin por mnimos cuadrados ordinarios del modelo de regresin. Supongamos que el modelo que mejor describe el comportamiento de nuestra variable dependiente es un modelo lineal del tipo:
yi = 1 + 2 x2i + 3 x3i + 4 x4i + i
Utilizando el software Stata tenemos:
68
Econometra I
FACEA, Universidad de Chile
69
Econometra I
FACEA, Universidad de Chile
Podemos ver que la distribucin de los errores no es del todo simtrica (Skewness =
1,2) y que tampoco presenta un comportamiento mesocurtico (Kurtosis = 3).
Ambos elementos se ven reflejados en el estadsitico Jarque - Bera, el cual cae en
la zona de rechazo (Ver adems p -value).
Las estimaciones realizadas anteriormente pueden hacerse en cualquier programa
estadstico, incluso en el sub utilizado programa excel, el cual posee un comando
que permite obtener estimaciones de regresiones lineal de manera mu rpida.
70
Econometra I
FACEA, Universidad de Chile
71
Econometra I
FACEA, Universidad de Chile
72
Econometra I
FACEA, Universidad de Chile
Si analizamos los errores de prediccin podemos ver que en promedio son cero,
tal como se demostr en clases.
Para ver la relacin existente entre la varianza de la prediccin y una de las
variables explicativas podemos realizar un ajuste con una variable.
Podemos ver que la varianza de la prediccin es mayor a medida que las variables
explicativas estn ms lejos de su media.
73
Econometra I
FACEA, Universidad de Chile
2.10.
Hasta el momento hemos adoptado el criterio de estimacin consistente con es 2 ) de modo de minimizar la suma de los
coger los valores de los parmetros (,
residuos al cuadrado. A continuacin, expondremos otra forma de obtener los
parmetros de inters, el cual, a diferencia de OLS, descansa en un determinado
supuesto respecto de la distribucin del trmino de error, teniendo por objetivo,
como veremos ms adelante, determinar los parmetros que maximicen la probabilidad de ocurrencia de la muestra observada. La ventaja de MV es que puede
producir estimadores consistentes y asintticamente eficientes cuando MCO falla.
Sea Y=[y1 , y2 , . . ., yn ] un vector n 1 de valores muestrales para la variable
dependiente, los cuales dependen de un vector k 1 = [1 , 2 , . . ., k ]. Sea
f (y; ) la densidad conjunta asociada. A dicha probabilidad conjunta se le llama
funcin de Verosimilitud y se denota por L():
L(; y) = f (y; )
Note que hemos invertido la notacin entre L y la densidad. Ello porque la densidad describe los valores probables de Y dado un vector determinado, sin
embargo, en nuestro caso el sentido es inverso: estamos interesados en el vector
dado un vector Y determinado.
Al maximizar L(; Y ) respecto de se obtienen los estimadores mximo verosmiles
(M V ), los cuales maximizan la probabilidad de ocurrencia de la muestra observada, es decir:
M V = max L(; Y )
(2.73)
(2.74)
o equivalentemente12
13
(2.75)
i=1
i=1
12
13
Bajo independencia, la funcin de distribucin conjunta de una muestra corresponde a la
multiplicacin de las funciones de densidad individuales.
74
Econometra I
FACEA, Universidad de Chile
2.10.1.
(2.76)
(2.77)
l l 0
l
I() = E
= E
0
donde note que la matriz hessiana de segundas derivadas de L es una matriz
cuadrada y simtrica de orden k k.
4. Invarianza: Si es el estimador ML de y g() es una funcin continua
es el estimador ML de g().
de , entonces g()
75
Econometra I
FACEA, Universidad de Chile
2.10.2.
Estimacin MV
donde las matrices poseen los tamaos usuales y u N (0, 2 I). Entonces:
f (u1 , u2 , . . . , un ; 2 I) = f (u1 ) f (u2 ) f (un ) =
n
Y
f (ui )
i=1
y asumiendo una distribucin normal para los errores, tenemos que la funcin de
verosimilitud corresponde a:
2
f (u1 , u2 , . . . , un ; I) =
n
Y
i=1
1
2 2
u2
i
exp 22
0
1
u u2
n exp 2
(2 2 ) 2
(2.78)
(2.79)
(Y X)0 (Y X)
1
2 2
exp
n
(2 2 ) 2
(2.80)
2
0
con lo cual, nuestros estimadores M V = [M V
M
V ] se obtienen siguiendo la
regla expuesta en (2.74):
(Y X)0 (Y X)
1
2 2
ma2x ln(L) = ma2x ln
n exp
,
,
(2 2 ) 2
n
n
(Y X)0 (Y X)
2
= ma2x ln(2) ln( )
(2.81)
,
2
2
2 2
1
lnL
=0
= 2 X 0 (Y X )
= M V = (X 0 X)1 X 0 Y
(2.82)
n
1
lnL
0 (Y X )
=0
= 2 + 4 (Y X )
(Y X M V )0 (Y X M V )
= 2 M V =
n
76
(2.83)
Econometra I
FACEA, Universidad de Chile
Entonces, bajo normalidad de los errores, el estimador M V es equivalente al estimador MCO. Sin embargo, note que el estimador de la varianza de los errores
(
M V ) da lugar al estimador sesgado.
Nos queda entonces derivar la varianza de los estimadores MV. Vimos que la
matriz de varianzas corresponda al inverso de la matriz de informacin (I()).
Por facilidad de clculo, generalmente se utiliza la segunda definicin de I(), es
decir, la de las segundas derivadas de la funcin de verosimilitud. Entonces:
2l
X 0X
= 2
0
2l
X 0X
E
=
0
2
(2.84)
2l
X 0u
= 4
2
2l
E
=0
2
(2.85)
2l
n
u0 u
=
( 2 )2
2 4
6
2l
n
E
= 4
2
2
( )
2
(2.86)
donde esta ltima esperanza se deriva del hecho que E(u0 u) = n 2 . Entonces, la
matriz de informacin corresponde a:
X0X
0
2
I(, ) =
(2.87)
n
0
2 4
mientras que su inversa:
I(, )
(X 0 X)1 2
0
0
2 4
n
(2.88)
Note que el hecho que la matriz de informacin (y por lo tanto su inversa) sea
una matriz diagonal, refleja que X y u se distribuyen independientemente (de otra
77
Econometra I
FACEA, Universidad de Chile
y 0,
e
(yi )xi
li (|yi , xi ) = ln
xi !
= ln yi + xi (ln + ln yi ) ln(xi !)
De esta forma, aplicando sumatoria a la ecuacin anterior obtengo la verosimilitud
conjunta:
L(|y, x) = n ln
n
X
yi + ln
i=1
n
X
i=1
xi +
n
X
i=1
xi ln yi
n
X
ln(xi !)
i=1
i=1
n
X
i=1
yi +
n
X
i=1
xi = 0
Pn
x
n
+
=
Pn i=1 i
i=1 yi
1
+
x
=
Econometra I
FACEA, Universidad de Chile
y
1 + 13
=
= 2,8
5
79
Econometra I
FACEA, Universidad de Chile
2.11.
Inferencia en el contexto MV
2.11.1.
El valor de la funcin de verosimilitud, L(,
2 ), corresponde al valor de la
verosimilitud irrestricta, es decir, sin imponer ninguna restriccin sobre los
parmetros del modelo. Suponiendo entonces que nuestro inters se centra en
una serie de restricciones lineales del tipo R = r (donde R y r se definen como
en la seccin 2.8), entonces el modelo original es estimable en su versin restringida, al maximizar la funcin de verosimilitud sujeta a R = r, cuyo resultado son
2 ) corresponde al valor de la verosimilitud
los estimadores y 2 . Luego L(,
restringida.
El valor de la verosimilitud restringida no puede ser superior al de la no restringida, sin embargo, podra esperarse que si las restricciones impuestas son correctas,
el valor de la primera est cerca del de la segunda. Entonces, definimos la razn
de verosimilitud () como:
2 )
L(,
=
L(,
2)
El test LR se define entonces como:
2 )] a 2 (q)
LR = 2 ln = 2[ln L(,
2 ) ln L(,
(2.89)
2 ) = (2e) n2 (2 ) n2 =
L(,
2e
n
n2
(
u0 u) 2
(2.90)
(2.91)
Econometra I
FACEA, Universidad de Chile
2.11.2.
(2.92)
(R r) (0, RI()1 R0 )
(2.93)
(2.94)
2
Una nota: Dijimos que el test era vlido asintticamente, donde hemos utilizado
el resultado de normalidad asinttica de MV. En caso de que los errores efectivamente distribuyan normal en muestra finita, el test (lgicamente) mantiene su
distribucin.
2.11.3.
Un tercer test corresponde al test LM, el cual tambin es conocido como el test
del Score. recordemos que el Score corresponde a la matriz de primeras derivadas
14
Note que hemos utilizado slo el bloque superior izquierdo de la inversa de la matriz de
informacin. Ello porque el test corresponde a los parmetros asociados a los coeficientes de la
regresin. Adems, ello es posible porque la matriz es diagonal, lo cual implica que no existe
correlacin entre los errores y los regresores.
81
Econometra I
FACEA, Universidad de Chile
de la funcin de Verosimilitud:
ln L
l
=
s() =
s0 ()I()1 s() 2
con lo cual, al evaluar en el vector de parmetros restringido tenemos que bajo
la nula, el test LM se define y distribuye como:
)
1 s()
a 2
LM = s0 ()I(
q
(2.96)
1
0
2X u
s() =
=
u0 u
l
2n2 + 2
4
2
entonces, para evaluar el score en la estimacin restringida, utilizamos los residuos
restringidos, los cuales denotaremos por:
u = Y X
y por lo tanto:
2 =
con lo cual:
=
s()
u0 u
n
1
X 0 u
82
(2.97)
Econometra I
FACEA, Universidad de Chile
1 0
(X X)
0
u
X
2
uX 0
LM =
2
4
2
0
0
n
u0 X(X 0 X)1 X 0 u
=
2
0
u X(X 0 X)1 X 0 u
= n
(2.98)
u0 u
= nR2 a 2q
(2.99)
donde el R2 corresponde a la bondad de ajuste de la regresin auxiliar entre u
y X.
Resumiendo, el test se implementa en tres simples pasos:
1. Estimar el modelo restringido y obtener sus residuos
2. Con ellos correr una regresin de ellos contra X. Obtener el R2
3. Construir el estadstico
Ejemplo: Siguiendo con el ejemplo anterior, testee la hiptesis nula de que = 5.
(i) Test de Razn de Verosimilitud: recordemos que el estadstico de este test es:
ln L()]
a 2 (q)
LR = 2[ln L()
Primero debemos evaluar el logaritmo de la verosimilitud en el parmetro
no restringido (estimado):
x) = n ln
L(|y,
n
X
yi + ln
i=1
n
X
xi +
i=1
n
X
xi ln yi
i=1
n
X
ln(xi !)
i=1
L(|y,
n
X
yi + ln
i=1
n
X
i=1
xi +
n
X
i=1
xi ln yi
n
X
i=1
ln(xi !)
Econometra I
FACEA, Universidad de Chile
LR = 2[ln L()
= 2[5,317999436 + 16,8481637] = 23,06032853
Finalmente, debemos comparar el valor de este estadstico con el valor de
tabla de una 2 con 1 grado de libertad (slo estamos testeando una hiptesis). El valor de la 2 con un grado de libertad a un 5 % de significancia es
de 3.84, por lo tanto se rechaza la hiptesis nula de que sea igual a 5.
(ii) Test de Wald: para poder realizar este test primero necesitamos computar la
matriz de varianzas y covarianzas del estimador, el inverso de la matriz de
informacin. Recordemos la forma de esta matriz:
2
l l 0
l
I() = E
= E
0
El score (o primera derivada de el logaritmo de la funcin de verosimilitud
era:
Pn
n
xi
lnL
n X
=
yi + i=1
i=1
0
2 P 2
2
(n + ni=1 xi )
lnL
=
0
2
Como la variable x es fija el valor esperado del hessiano corresponde a la
misma expresin, luego el negativo de esto constituye la matriz de informacin:
P
(n + ni=1 xi )
I() =
2
(4 + 52)
I() =
2
56
I() =
2
Ahora el estadstico de Wald se construye de la siguiente forma:
5)0 I()(
5) 2
W = (
1
84
Econometra I
FACEA, Universidad de Chile
por 2.8:
Reemplazando
= (2,8 5)
56
(2,8)2
(2,8 5)
W c = 34,6
Como el valor calculado del estadstico de Wald resulta ser mayor al valor
de tabla de una 2 con un grado de libertad, se rechaza la hiptesis nula de
= 5.
que
(iii) Test de multiplicador de Lagrange: para construir este estadstico necesitamos evaluar el score y la matriz de informacin en el estimador restringuido
e que en este caso es igual a 5:
(),
Pn
n
n X
4
52
e
s() =
= 8,8
yi + i=1 = 20 +
e
e
5
5
i=1
56
e =
I()
= 2,24
(5)2
Reemplazando en el estadstico:
e 0 I()
e 1 s()
e
LM = s()
LM = (8,8)(2,24)1 (8,8) = 34,6
= 5.
Con lo cual se rechaza la hiptesis nula de que
2.12.
1. La seccin 2.10.2 asume que la distribucin de los errores sigue una distribucin normal. Sin embargo, suponer errores normales es slo uno de los
posibles supuestos respecto a la distribucin de los errores. Existe una gran
cantidad de posibilidades al respecto, utilizndose otras como la distribucin
logstica y la exponencial, muy regularmente en otros tpicos economtricos.
Lo anterior es una ventaja de la estimacin MV, dado que sus propiedades
asintticas se mantienen independientemente de la distribucin utilizada.
2. Otra ventaja corresponde a la posibilidad de utilizar modelos no lineales.
MCO (tal y como lo hemos estudiado) slo permite estimar modelos lineales
en parmetros, mientras que MV permite no linealidades (aunque ello implique la imposibilidad de obtener de obtener formas funcionales cerradas
85
Econometra I
FACEA, Universidad de Chile
15
86
Captulo 3
Forma Funcional y Especificacin
3.1.
En el desarrollo del modelo de regresin lineal realizado en la seccin 2.4 asumimos que nuestras variables explicativas eran determinsticas (Supuesto 2). En
ese contexto, cada vez que tombamos una muestra diferente los regresores permanecan fijos y solo la variable dependiente cambiaba, haciendo entonces que
la regresin muestral fuera una aproximacin a la regresin poblacional. En est
seccin procederemos a eliminar este supuesto1 y veremos cuales son las consecuencias de asumir regresores estocsticos en las estimaciones del modelo de
regresin lineal. Es decir, asumiremos ahora que X es obtenida aleatoriamente a
partir de alguna distribucin de probabilidad.
Si X es estocstico, X debe ser independiente de u si queremos mantener las
propiedades estadsticas de los estimadores MCO. Un mtodo adecuado para
obtener las propiedades estadsticas de b consiste en obtener primero los resultados condicionados en X. Esto equivale al caso de los regresores no estocsticos.
Despus buscamos los resultados incondicionales "promediando"(por ejemplo, por
integracin total) las distribuciones condicionadas. La clave de este razonamiento es que, si podemos establecer insesgamiento condicionado en un X arbitrario,
podemos promediar las X para obtener un resultado incondicionado.
Manteniendo los supuestos 3 y 4 dados por E(u|x)=E(u)=0, V ar(u|X) = V ar(u) =
1
87
Econometra I
FACEA, Universidad de Chile
88
Econometra I
FACEA, Universidad de Chile
Conclusiones:
Si los errores son independientes de las X entonces se cumplir el Teorema
de Gauss Markov.
Bajo normalidad del error los test estadsticos tienen la misma distribucin
que en el caso de las X no estocsticas.
3.2.
Incorporacin de No Linealidades
En la seccin 2 asumimos que el modelo de regresin deba ser lineal. Sin embargo,
muchas de las relaciones econmicas no son lineales. Veamos el siguiente ejemplo
de la relacin entre las ventas de los portales de Internet y el nmero de visitas
al portal.
Claramente la relacin es no lineal. No es lo mismo en trminos de ventas aumentar desde 40 visitas a 50 que de 10 visitas a 20. Pero, Cmo podemos incorporar
no linealidad entre Y y X en nuestro modelo de regresin?. Bsicamente lo que
haremos es utilizar algunos tipos de transformacin de variables. Esto nos permitir tener un modelo no lineal y a partir de la aplicacin de las transformaciones
tener un modelo de regresin lineal para el que se cumplen todas las cosas que
hemos visto.
89
Econometra I
FACEA, Universidad de Chile
Transformacin Logartmica
Suponga un modelo original no lineal de la siguiente forma Yi = 1 Xi2 ui .
Si aplicamos logaritmo nos quedar un modelo transformado de la siguiente forma
ln(Yi ) = ln(1 ) + 2 ln(Xi ) + ln(ui )
Y X
En donde 2 = X
corresponde a la elasticidad X de Y. Este tipo de
Y
transformaciones es muy til en modelos de demanda y de produccin.
Transformacin Semilogartmica
Suponga un modelo original no lineal de la siguiente forma Yi = 1 e2 Xi ui .
Si aplicamos logaritmo nos quedar un modelo transformado de la siguiente forma
ln(Yi ) = ln(1 ) + 2 Xi + ln(ui )
Y 1
En donde 2 = X
corresponde a la semi elasticidad X de Y. Una utiY
lizacin comn de la formulacin semilogartmica se da en los casos de
)
crecimiento exponencial. Si X es el tiempo t, entonces ln(Y
= 2 =Tasa
t
media de crecimiento de Y.
Transformacin Recproca
Suponga un modelo original no lineal de la siguiente forma Yi = 1 +
2 X1i + ui . El cual podemos expresar como un modelo transformado de
la siguiente forma
Yi = 1 + 2 Zi + u i
En donde 2 =
Y
X
3.2.1.
Una pregunta interesante de plantearse es si nuestro modelo ha omitido no linealidades en ciertos regresores3 . Ramsey (1969) introdujo el siguiente test. Bajo
3
90
Econometra I
FACEA, Universidad de Chile
Y 2 Y 3 . . .
Y m
luego la nula:
H0 : No Existen no linealidades omitidas
H0 : 2 =0
puede ser testeada utilizando un test de Wald sobre 2 . Es posible demostrar que
bajo la nula Wa 2m1 . Por lo tanto, la nula se rechaza al % de significancia si
el estadgrafo es mayor que el valor crtico correspondiente. Para implementar el
test, m (es decir, el nmero de potencias de Y a incluir en la regresin auxiliar)
debe ser seleccionado previamente. Tpicamente, valores pequeos como 2, 3 o 4
parecen funcionar mejor.
que al derivar la funcin objetivo con respecto a los parmetros de inters, podemos no obtener
una forma funcional cerrada para nuestro estimador. Ello nos llevar generalmente a utilizar
mtodos numricos para maximizar o minimizar nuestra funcin objetivo, la cual, incluso puede
dejar de ser estrictamente cncava.
91
Econometra I
FACEA, Universidad de Chile
3.3.
(3.2)
92
Econometra I
FACEA, Universidad de Chile
y el modelo como
Wi = 0 + 1 d2i + ui
entonces, en esta segunda especificacin escogida para la dummy, tenemos que:
0 + 1 = E(W/hombre)
0 = E(W/mujer)
Una tercera forma de definir el modelo sera incluyendo ambas dummies:
Wi = 1 d1i + 2 d2i + ui
con el cual tendramos que los retornos a ambos gneros seran:
2 = E(W/hombre)
1 = E(W/mujer)
Los tres modelos anteriores son equivalentes. Note que en el tercer modelo
no incluimos trmino constante ya que ello hara que la matriz X fuese singular y
por lo tanto, no invertible. Dicho error de especificacin es llamado en la literatura Trampa de las Dummies y corresponde a un error netamente del investigador,
no de los datos.
Un modelo de regresin puede contener variables explicativas que son exclusivamente dicotmicas o cualitativas, tales modelos se denominas Modelos de
anlisis de varianza (ANOVA), estos modelos son utilizados para determinar
la significancia estadstica de la diferencias de medias entre grupos, por ejemplo,
servira para determinar si existe diferencia significativa entre los ingresos medios
de los hombres y mujeres.
Ejemplo I:
Contamos con datos de ingreso proveniente de la ocupacin principal para el ao
2000, de acuerdo a zona geogrfica de Chile: Norte (de la primera a la cuarta
regin), Centro (quinta regin, sexta regin y regin metropolitana) y Sur (de
la sptima a la duodcima regin). Suponga que deseamos averiguar si el salario
promedio difiere entre las distintas zonas geogrficas, si tomamos el promedio de
los salarios de los individuos en cada una de las zonas obtenemos lo siguiente:
Zona Geogrfica
Norte
Centro
Sur
Salario Promedio
$ 270,154
$ 296,857.8
$240,238.9
93
Econometra I
FACEA, Universidad de Chile
Estos nmeros son claramente diferentes entre s, pero lo que nos interesa saber
es si esta diferencia es estadsticamente significativa, para esto utilizaremos un
modelo ANOVA.
Consideremos el siguiente modelo de regresin:
Yi = 0 + 1 D1i + 2 D2i + ui
donde:
Yi =Salario del individuo i.
D1i =es una variable dummy que toma valor 1 si la persona i vive en el norte y
cero sino.
D2i = es una variable dummy que toma valor 1 si la persona i vive en el sur y
cero sino.
Este modelo es como cualquier otro modelo de regresin lineal, la nica diferencia que ahora todo nuestras variables explicativas son binarias. De esta forma,
el salario promedio de los individuos que viven en el norte es:
E(Yi |D1i = 1, D2i = 0) = 0 + 1
de igual forma el salario promedio de los individuos que viven en el sur es:
E(Yi |D1i = 0, D2i = 1) = 0 + 2
y por ltimo, el salario promedio de los individuos que viven en el centro es:
E(Yi |D1i = 0, D2i = 0) = 0
As, el salario promedio de los individuos de la zona centro esta dado por el intercepto de la ecuacin de regresin, adems los coeficientes 1 y 2 ("pendiente"),
indican la cantidad en que los salarios promedios del norte y sur difieren de los del
centro, respectivamente. Ahora necesitamos ver si estas diferencias son estadsticamente significativas.
El modelo estimado es:
94
Econometra I
FACEA, Universidad de Chile
Hombres
W
2
0+ 1
Mujeres
0
E
Salario y Educacin, diferencia de intercepto entre hombres
y mujeres
95
Econometra I
FACEA, Universidad de Chile
= 2 + 3 .
= 2 .
En el caso que existan otros regresores continuos (experiencia, por ejemplo), podra ser deseable poseer efectos diferenciados en la pendiente slo para algunos
de ellos.
Hombres
W
2+3
0+ 1
Mujeres
0
E
Salario y Educacin, diferencia de intercepto y pendiente
entre hombres y mujeres
96
Econometra I
FACEA, Universidad de Chile
3.3.1.
Como hemos mencionado las variable dummies pueden reflejar caractersticas individuales como gnero, status marital,raza, etc, y de esta forma las habiamos
llamado variable cualitativas. Sin embargo, este no es el nico motivo para
incluir dummies en una regresin. Existen adems aquellas dummies llamadas
dummies estacionales cuyo objetivo es controlar por factores temporales de
los datos. Por ejemplo, estimando la demanda de helados, es posible que exista un "efecto verano"por lo cual la demanda aumente en algunos trimestres o
bimestres, de esta forma para controlar dicho efecto, se deben incluir 4 dummies
cada una correspondiente a un trimestre del ao (o 6 en el caso del bimestre, o 2
en el caso del semestre, etc.). Recuerde que el caso de incluir una constante debe
retirar discrecionalmente alguna de ellas, la cual servir como trimestre de referencia. Las dummies tambin pueden ser tiles para captar efectos umbrales.
Siguiendo con nuestro ejemplo de educacin, podramos tener que en la encuesta,
la variable Educacin no fue recogida en forma continua, sino discreta (es decir,
si la persona posee: Educacin Bsica (8 aos), Educacin Media (12 aos), Educacin Universitaria (17 aos), Educacin universitaria con postgrado (19 aos)).
Definiendo una dummy por cada nivel de educacin, el coeficiente asociado a cada una de ellas nos mostrara el retorno a cada tipo de educacin. Finalmente,
las dummies pueden ser de utilidad para cuantificar efectos condicionales. Ya
habamos enunciado stas cuando vimos E(W/E,gnero), en que permitimos que
la pendiente vare entre gneros. Dichas dummies son de inters cuando queremos
captar algn efecto condicional a alguna caracterstica. Por ejemplo, el retorno a
la educacin dado que se es mujer, o que se es casado, o que se es blanco, etc.
En dicho caso, basta introducir la dummy que identifica el estado condicional
multiplicada por la variable de inters.
Concluyendo, la forma en que se incluyan las variables binarias en el modelo
de regresin depende de la pregunta que el investigador desee responder o del
objetivo que tenga para incluirlas. Creatividad y teora.
Desde el punto de vista de la teora de regresin, di corresponde a un variable aleatoria del mismo proceso de muestro que gener el resto de las variables.
Veamos entonces como manejarlas algebraicamente. Sea el modelo simple:
Wi = 1 d1i + 2 d2i + ui
o en nuestra notacin matricial usual:
Y = X + u
97
Econometra I
FACEA, Universidad de Chile
1 Pn
Pn 2
Pn
d
y
d
d
d
1i
i
1i
2i
1i
i=1
i=1
i=1
Pn
Pn
Pn 2
=
i=1 d2i yi
i=1 d1i d2i
i=1 d2i
1 Pn
n1 0
Pni=1 d1i yi
=
0 n2
i=1 d2i yi
y1
=
y2
donde n1 y n2 son el nmero de observaciones con d1i =1 y d2i =1, respectivamente,
y y1 y y2 corresponden a las medias muestrales entre las respectivas observaciones.
Y con respecto a la varianza de los estimadores:
V () = (X 0 X)1
2
" 2
#
0
n1
=
2
0 n 2
donde:
1X 2
=
u
n i=1 i
2
98
Econometra I
FACEA, Universidad de Chile
Ejemplo II:
A continuacin veremos la aplicacin de la llamada "Ecuacin de Mincer"para
estimar el retorno a la educacin. Los datos corresponden a un grupo de jvenes
chilenos egresados de la educacin media tcnica, los que fueron entrevistados en
1997. La primera figura muestra la estimacin de la ecuacin de Mincer en su
versin original (1974):
ln(Salario)i = + 1 Educacioni + ui
Note que el retorno a la educacin sigue siendo positivo, mientras que la dummy
para mujer es negativa (Qu significa que el parmetro sea negativo?). Veamos a
continuacin, la misma especificacin, slo que esta vez la dummy se define como
1 si el individuo es hombre:
99
Econometra I
FACEA, Universidad de Chile
100
Econometra I
FACEA, Universidad de Chile
3.4.
Cuando trabajamos con series de tiempo, es posible que sea de nuestro inters
incluir rezagos de la variable dependiente como variables explicativas. Ello puede
ocurrir cuando creemos que existe cierta persistencia de nuestra variable dependiente. Por ejemplo, para tratar de explicar el comportamiento de la inflacin
(t ), tendra sentido introducir como variables explicativas, junto con la tasa de
crecimiento del dinero (mt ), rezagos de la propia tasa de inflacin:
t = 0 + 1 t1 + 2 mt + ut
Supongamos el modelo ms simple posible:
yt = 1 yt1 + ut
con |1 | < 1
(3.4)
Adelantndonos a la teora de series de tiempo, el modelo anterior recibe el nombre de Proceso Autorregresivo de Primer Orden (AR(1)), donde el nombre
de autorregresivo se debe a que la variable se explica por rezagos de ella misma y
de primer orden porque depende slo del primer rezago (el orden indica el nmero
mximo de rezagos incluidos).
La estimacin MCO del modelo anterior es = (X 0 X)1 X 0 Y , donde X=[i,Yt1 ],
con la diferencia que esta vez poseemos n-1 datos, a menos que supongamos un
valor inicial para Y0 . En este caso dejan de cumplirse uno de los supuestos bajo
los cuales vimos las propiedades del estimador MCO y la inferencia asociada,
aunque continuemos haciendo los supuestos pertinentes para el trmino de error,
el modelo viola el supuesto de regresores fijos (no estocsticos).
Analicemos esto con ms detalle, el estimador MCO de 1 en (3.4) es:
PT
yt yt1
1 = Pt=2
T
t=2 yt12
PT
t=2 (1 yt1 + ut )yt1
=
PT 2
t=2 yt1
PT
ut yt1
= 1 + Pt=2
T
t=2 yt12
para que este estimador sea insesgado se requiere que:
"P
#
T
u
y
t
t1
E Pt=2
=0
T
t=2 yt12
101
(3.5)
Econometra I
FACEA, Universidad de Chile
102
Econometra I
FACEA, Universidad de Chile
3.4.1.
IP Ct IP Ct1
IP Ct1
103
Econometra I
FACEA, Universidad de Chile
Cuando una serie tiene raiz unitaria, esta no es estacionaria, lo que significa que no flucta
en torno a su valor promedio. El test t de significancia del parmetro que acompaa a la variable
dependiente, no sirve para evaluar la hiptesis de raiz unitaria. Comente error tipo I
104
Econometra I
FACEA, Universidad de Chile
3.5.
Seleccin de Modelos
(2)
(3)
donde se dice que el modelo (1) encompasa al (2) y al (3), ya que los dos segundos
son el versiones restringidas del primero. Luego, se dice (2) y (3) son anidados en
(1)
La pregunta relevante es Cul de las tres especificaciones anteriores es mejor?.
Los criterios de informacin nos ayudan a responder dicha pregunta. El primer
criterio de informacin es el Criterio de Akaike (ACI) y se define como:
ACI =
2 ln L k
+
n
n
ln(n)
2 ln L
+k
n
n
105
Econometra I
FACEA, Universidad de Chile
3.5.1.
Recordemos lo aprendido en la seccin 3.3 del curso. Veamos que para estimar el
retorno a la educacin, es decir, cuanto ingreso adicional me genera un ao ms
de educacin, podamos considerar al menos tres especificaciones:
M odelo I :
M odelo II :
M odelo III :
Wi = 0 + 1 d2i + 2 Ei + 3 Ei d2i + ui
Wi = 0 + 1 d2i + 2 Ei + ui
Wi = 0 + 2 Ei + ui
donde Wi era el logaritmo natural del salario del individuo i, d2i era una variable
dummy que tomaba el valor 1 si la persona i era hombre y 0 sino, Ei eran los
aos de educacin del individuo i y Ei d2i era una variable interactiva.
Adems tenemos que el Modelo II anida al modelo III, y el modelo I anida a los
modelos II y III. De esta forma, podemos utilizar los criterios de informacin de
Akaike y Schwarz para determinar con que especificacin nos quedamos.
Estimacin del Modelo I:
Wi = 0 + 1 d2i + 2 Ei + 3 Ei d2i + ui
106
Econometra I
FACEA, Universidad de Chile
107
Econometra I
FACEA, Universidad de Chile
En resumen:
Modelo
I
II
II
Akaike
2.278
2.279
2.338
Schwarz
-680692.847
-680676.053
-676154.845
Como debemos elegir el modelo que minimize el criterio de informacin, de acuerdo a ambos criterios debemos elegir el Modelo I.
108
Econometra I
FACEA, Universidad de Chile
3.6.
Regresin Particionada
1
h
i
X1 X2
X = nk
= k1 1 tal que k = k1 + k2
nk2
1
2
nk
k1
k2 1
X1
X1 Y
1
X1 X2
=
X20
X20 Y
2
0
0
X1 X1 X10 X2
1
X1 Y
=
0
0
X2 X1 X2 X2
X20 Y
2
Lo que puede ser expresado de la siguiente forma:
X10 X1 1 + X10 X2 2 = X10 Y
X20 X1 1 + X20 X2 2 = X20 Y
(i)
(ii)
109
Econometra I
FACEA, Universidad de Chile
X10 Y
X10 Y
| {z }
M2
M2
3.7.
3.7.1.
Econometra I
FACEA, Universidad de Chile
por lo cual:
E(1 ) = 1 + (X10 X1 )1 X10 X2 2
= 1 + Z2
Ello implica que por lo general, la omisin de variables relevantes (que pertenecen
al modelo poblacional), causar que los parmetros estimados sea sesgados. Ello
no suceder, slo en el caso que Z=0 (es decir que X1 y X2 sea ortogonales) o si
2 =0 (aunque dicho caso es contradictorio, dado que implicara que la variable
no pertenece al modelo poblacional).
La direccin del sesgo es difcil de obtener, sin embargo, el anlisis se simplifica si pensamos en 1 y 2 como escalares. En dicho caso:
E(1 ) = 1 +
Cov(X1 , X2 )
2
V (X1 )
3.7.2.
Econometra I
FACEA, Universidad de Chile
3.7.3.
Ejemplo
(1)
(1)
112
Econometra I
FACEA, Universidad de Chile
113
Econometra I
FACEA, Universidad de Chile
3.8.
3.8.1.
u0 u
2
E(
) = E
T k1 k2
2
=
es decir, la inclusin de variable irrelevantes no causa sesgo en los parmetros
estimados, ni en la varianza de los errores estimados. Bajo dichos resultados,
pareciera que es mejor poner muchos regresores en nuestro modelo. Sin embargo,
nos falta estudiar que sucede con la varianza de los parmetros estimados.
3.8.2.
Recordemos que:
1 = 1 + (X10 M2 X1 )1 X10 M2 u
con lo cual, la varianza estimada:
V (1 /X1 , X2 ) = 2 (X10 M2 X1 )1
114
Econometra I
FACEA, Universidad de Chile
V (1 /X1 ) = 2 (X10 X1 )1
3.8.3.
Ejemplo
(1)
(1)
Donde Di corresponde a una variable dicotmica que toma el valor 1 si el individuo fuma y 0 si no fuma.
Los resultados del modelo verdadero son
Econometra I
FACEA, Universidad de Chile
Podemos ver no existe una variacin importante en los parmetros del modelo
estimado y el modelo verdadero. Sin embargo, tal como habamos demostrado, la
varianza de los parmetros aumenta disminuyendo entonces la eficiencia.
116
Econometra I
FACEA, Universidad de Chile
3.9.
Perturbaciones no Esfricas
Figura 8: Homocedasticidad
Figura 9: Heterocedasticidad
Econometra I
FACEA, Universidad de Chile
3.9.1.
V ar() = E
3.9.2.
118
Econometra I
FACEA, Universidad de Chile
ta de la siguiente manera:7
= CC 0
donde las columnas de C son los vectores propios de y los valores propios (j )
de se encuentran en la diagonal
sea 1/2 , la matriz diagonal
p de . Entonces 1/2
con el j-simo elemento igual a j y sea T = C . De esta forma, = T T 0 .
Adems sea P 0 = C1/2 y por lo tanto, 1 = P 0 P . 8
Si pre multiplicamos Y = X + u por P obtenemos:
P Y = P X + P u o
Y = X + u
(3.6)
(3.7)
Por lo tanto, el modelo transformado cumple con los supuestos del modelo clsico
de regresin, y se puede utilizar MCO para estimar el parmetro :
M CG = (X0 X )1 X0 Y
= (X 0 P 0 P X)1 X 0 P 0 P Y
= (X 0 1 X)1 X 0 1 Y
Como el estimador MCG de es idntico al estimador MCO aplicado al modelo
transformado (3.6) y que cumple con los supuestos, M CG es MELI.
3.9.3.
Test de Hiptesis
Nuevamente como el estimador MCG es igual al estimador MCO slo que se aplica
al modelo transformado, todos los procesos para testear hiptesis y construir
intervalos de confianza se mantienen.
Por ejemplo si queremos testear q hiptesis lineales H0 : Q0 = c, se tiene el
7
119
Econometra I
FACEA, Universidad de Chile
siguiente estadstico F:
1
2
0
1
0
Q0 M CG c [Q0
eM
(X
X
)
Q]
Q
M
CG
CG
Q0 M CG
c [Q
q
0
1
(X0 X )1 Q]
0
Q M CG c
eM
CG
Fq,nk
Fq,nk
2
2
donde
eM
CG es el estimador insesgado de en presencia de perturbaciones no
esfricas:
Y X M CG
Y X M CG
u0 u
2
eM
=
=
CG
nk
nk
3.9.4.
Anteriormente asumimos que era conocida, en este caso una simple transformacin del modelo de regresin lineal lleva a una matriz de covarianza esfrica.
En la prctica, es desconocida y es necesario estimar los parmetros al interior
de esta matriz.
EsEntonces lo que debemos hacer es sustituir por un estimador de ella .
to se denomina estimador Mnimos Cuadrados Factibles (MCF), donde el
estimador de se define de la siguiente forma:
1
1 X
1 y
M CF = X 0
X 0
El problema es que tenemos ms incgnitas (n(n+1)/2) en que observaciones,
para n>1. En la prctica para lograr la estimacin de debemos asumir que es
funcin de un nmero fijo y reducido de parmetros . El problema se reduce a
= ().
encontrar y usarlo para computar
120
Econometra I
FACEA, Universidad de Chile
3.9.5.
Heterocedasticidad
La Heterocedasticidad surge cuando a pesar de que Cov(ui uj )=0 para i6= j, las
varianzas de cada observacin son diferentes, es decir, V ar(uj ) = j2 para j=1,...,n.
La matriz de covarianzas en este caso es:
12 0
1 0
n2
salario
2000000
3000000
4000000
1000000
Recta de regesin
poblacional (RRP)
x
8
x
10
14
12
16
18
Escolaridad
Figura 2: Distribucin de los salarios para distintos niveles de educacin.
La heterocedasticidad es un problema bastante recurrente, especialmente al trabajar con datos de corte transversal. Algunas razones por las que ui puede variar
son las siguientes:
En los modelos de aprendizaje sobre errores, a medida que la gente aprende,
sus errores de comportamiento son menores, as en este caso a medida que
aumentan las horas de prctica de una cierta actividad, la varianza de los
errores se reduce.
A medida que aumentan los ingresos, la gente tiene ms posibilidades de
disponer de parte de ese ingreso de la forma que desee. As en una regresin
de ahorro contra ingreso, es posible que i2 aumente en la medida que el
ingreso aumenta.
La Heterocedasticidad tambin puede surgir por la presencia de factores
atpicos, que es muy diferente a las restantes observaciones.
121
Econometra I
FACEA, Universidad de Chile
Al omitir variables relevantes, a parte del sesgo que se produce en las estimaciones por esto, se produce Heterocedasticidad ya que este variable estar
en el trmino de error y por lo tanto la varianza depender de ella.
Otra fuente de Heterocedasticidad es la asimetra en la distribucin de una
o ms variables explicativas incluidas en el modelo, por ejemplo: ingreso,
riqueza y educacin.
122
Econometra I
FACEA, Universidad de Chile
Como mencionamos anteriormente en presencia de Heterocedasticidad el estimador MCO seguir siendo insesgado, pero no tendr varianza mnima. El estimador que si cumple con la propiedad de MELI es el de MCG. Este ltimo
estimador requiere conocimiento de la matriz . Sin embargo, White (1980) ha
propuesto una aproximacin a la matriz de covarianzas del estimador MCO:
V ar(|X)
= (X 0 X)1 (X 0 2 X)(X 0 X)1
que no requiere una representacin especifica de la forma funcional que adopta la
heterocedasticidad, por lo que no tendremos riesgo de asumir una forma funcional
incorrecta.
La sugerencia de White es que la varianza del estimador M CO se exprese de
la siguiente forma:
1 2 0
0
1
V ar(|X) = n(X X)
X X (X 0 X)1
n
se define:
= n1 2 X 0 X
n
X
1
= n
i2 xi x0i
i=1
n
X
ui 2 xi x0i
i=1
n
X
ui 2 xi x0i
i=1
0 X)1
V ar(|X)
= n(X 0 X)1 (X
(3.8)
Econometra I
FACEA, Universidad de Chile
Contrastes de Heterocedasticidad:
1. El contraste de White: La hiptesis nula es de Homocedasticidad (al
igual que en todos los contrastes que estudiaremos). Esto es, H0 : i2 = 2
i, bajo la hiptesis nula el estimador de la matriz de covarianzas de es
Vd
ar(|X)
=
e2 (X 0 X)1 , pero bajo la hiptesis alternativa es (3.8). Basado en la observacin de esto, White propone un test que puede obtenerse
al calcular nR2 de una regresin de u2i contra todos los productos posibles
entre las variables explicativas. Demuestra que nR2 2J1 , donde J es el
nmero de regresores de esta ecuacin.
Consideremos el siguiente modelo:
yi = 0 + 1 xi + 2 zi + ui
Los pasos para realizar el test de White son:
a) Obtener y los residuos de la estimacin del modelo anterior por MCO
{
ui }ni=1
b) Correr una regresin de u2i sobre una constante, xi , zi , x2i , zi2 y xi zi .
c) Computar nR2 de la regresin anterior
d ) Para el nivel de significancia escogido, comparar nR2 con el valor crtico de una distribucin chi cuadrado con 5 grados de libertad. Si nR2
excede el valor crtico se rechaza la hiptesis nula de Homocedasticidad.
2. El contraste de Goldfeld y Quandt: este contraste parte del supuesto de
que la magnitud de i2 depende de cierta variable zi , la que generalmente
es una variable explicativa pero no es necesario. Supongamos que dicha
relacin es positiva, es decir, para valores ms altos de zi mayor es i2 . Las
observaciones se dividen en dos grupos, bajo la hiptesis nula ambos grupos
tienen la misma varianza, pero bajo la alternativa las varianzas difieren
significativamente. Entonces el contraste consiste en:
a) Ordenar las observaciones por los valores de la variable zi , de menor a
mayor.
b) Omitir p observaciones en la mitad de la muestra, se sugiere no eliminar
ms de la tercera parte de las observaciones.
c) Estimar dos veces el modelo original, una con las np
primeras ob2
np
servaciones muestrales y otra con las 2 ltimas observaciones en la
muestra. Notar que p debe ser lo suficientemente pequeo de manera
sea mayor al nmero de parmetros.
que T p
2
124
Econometra I
FACEA, Universidad de Chile
d ) Se calcula es estadstico:
u02 u2
Fm,m
u01 u1
con m =
np
k
2
1 = 2 = ... = p = 0
u
n
c) Se estima una regresin de e2i sobre una constante y las variables z1i ,
z2i ,...,zpi y se obtiene la suma explicada (SE) de dicha regresin.9
d ) Bajo la hiptesis nula de Homocedasticidad y dado el supuesto de
se distribuye 2p .
normalidad del trmino de error, la razn SE
2
9
125
Pn
yi
i=1 (
y)2 , cuando yi es
Econometra I
FACEA, Universidad de Chile
126
Econometra I
FACEA, Universidad de Chile
Estimador de la
desviacin estandar
del error
~2
u
SEC/(n-k)
4307097.27/16
269193.56
u =
127
518.84
Econometra I
FACEA, Universidad de Chile
El estimador del parmetro asociado al empleo resulta ser significativo, por cada
1,000 empleador el PIB aumenta en 3,760 millones de pesetas. Sin embargo, la
estimacin de la constante es bastante imprecisa, y por ello resulta ser no significativa. Existe la posibilidad de que la varianza del componente del PIB no
explicado por el empleo aumente con este, es decir, tengamos un problema de
heterocedasticidad, donde i depende de empleoi , y de esta forma, i2 depende
de empleo2i . Con esta sospecha, es necesario testear Heterocedasticidad.
1. Test Breusch-Pagan: para realizar este test, primero de la estimacin MCO
del modelo de inters se obtienen los residuos, luego se computan los residuos
normalizados (dividir cada residuo al cuadrado por el estimador de la varianza
del error). Se estima una regresin entre los residuos generalizados y el empleo al
cuadrado.
SE
Econometra I
FACEA, Universidad de Chile
= 93.2
Este estadstico debe ser comparado con el valor de tabla de una distribucin
Fm,m al 95 % de confianza, que es igual a 6.39. De esta forma, nuevamente se
rechaza la hiptesis nula de Homocedasticidad.
129
Econometra I
FACEA, Universidad de Chile
3.9.6.
Autocorrelacin
Al comienzo de esta seccin examinamos el caso general cuando la matriz de varianzas y covarianzas del error dejaba de cumplir los supuestos 4 y 5, en este caso la
matriz ya no era 2 In , sino que era igual a 2 . La forma que tome esta matriz
depender de cual de los dos supuestos se estaba rompiendo. En la seccin 3.8.5,
vimos que forma toma la matriz si se rompe el supuesto 4 de Homocedasticidad
en el trmino de error, en este caso la matriz de varianzas y covarianzas del error
es no escalar (o no esfrica) porque los elementos de la diagonal eran distintos
para cada observacin i.
Por otra parte, la autocorrelacin es un problema que surge cuando rompemos el
supuesto 5 de no autocorrelacin en los errores. Ello implica que:
Cov(ui uj ) 6= 0 para i 6= j
La autocorrelacin en el trmino de error se da en los datos se serie de tiempo,
donde es un problema bastante comn.
Luego, nuestra matriz de varianzas y covarianzas del error ya no ser una matriz
diagonal (como en el caso de varianzas esfricas y no esfrica pero slo con heterocedasticidad) ya que el trmino de error se encuentra correlacionado consigo
mismo a travs del tiempo. La forma que toma la matriz cuando slo tenemos
autocorrelacin pero los errores son homocedsticos:
..
..
..
..
.
.
.
.
.
.
.
T,1 T,2 T,3 2
donde t,q = cov(ut uq ).
Nuestro modelo ahora ser:
yt = Xt + ut t = 1, 2, ..., T.
ut = ut1 + t
donde, como vimos en la seccin 3.4, el error sigue un proceso AR(1).
130
(3.9)
Econometra I
FACEA, Universidad de Chile
2
12
2. Como E(ut ) = 0, Cov(ut ut1 ) = E(ut ut1 ). Calculemos esta ltima esperanza:
ut ut1 = ut1 (ut1 + t )
= u2t1 + ut1 t /E()
E(ut ut1 ) = E(u2t1 ) + E(ut1 t )
| {z } | {z }
2
E(ut ut1 ) =
E(ut ut2 ) = 2 2
4. As se puede derivar la siguiente expresin genrica:
E(ut ut(T 1) ) = T 1 2
131
Econometra I
FACEA, Universidad de Chile
Entonces:
E[uu0 ] = 2 =
2 1,2 1,3
2,1 2 2,3
3,1 3,2 2
..
..
..
.
.
.
T,1 T,2 T,3
2
2
2 2
..
.
1,T
2,T
3,T
..
...
.
2
2
2
2
..
.
T 1 2 T 2 2
2
1
1
= 2
..
..
..
.
.
.
T 1
T 2
T 3
2 2
2
2
..
.
T 1 2
T 2 2
T 3 2
..
..
.
.
T 3 2
T 1
T 2
T 3
..
..
.
.
Econometra I
FACEA, Universidad de Chile
Autocorrelacin Negativa
Autocorrelacin Positiva
X Modelo
verdadero
XX
X
Modelo
X
XX
X
estimado
X
X
X X
XX
X
X
X
X
X
X
X X
Variables omitidas: Omisin tanto de variables relevantes, de no linealidades y de relaciones dinmicas (rezagos de la variable dependiente) sern
133
Econometra I
FACEA, Universidad de Chile
(3.10)
1XX
S =
w(t s)
ut us xt x0s
n t=1 s=1
(3.11)
|ts|<L
134
Econometra I
FACEA, Universidad de Chile
Contrastes de Autocorrelacin
1. Test de Durbin-Watson (d): Lejos el test ms utilizado para detectar
autocorrelacin de los residuos es el test propuesto en 1951 por Durbin
y G.S Watson. El test est diseado para detectar autocorrelacin en los
residuos de la forma ut = ut1 +t (AR(1)), donde es ruido blanco (media
cero y varianza constante). La nula corresponde a no autocorrelacin de los
residuos (H0 : = 0 H1 : 6= 0)y el test se define como:
Pn
(
ut ut1 )2
d = t=2Pn 2
(3.12)
t
t=1 u
Si > 0, los valores de u probablemente sern muy cercanos, por lo cual el
numerador ser muy pequeo en comparacin al residuo mismo. Ello implica que d ser pequeo. Si < 0, entonces el numerador probablemente
ser grande, ms grande que el residuos n si mismo. Ello implica que d ser
grande10 .
Se puede demostrar que para muestra grandes d converge a:
d ' 2(1 )
(3.13)
con:
Pn
t ut1
t=2 u
P
=
n
2t
t=1 u
donde puede ser obtenido de la siguiente regresin:
ut =
ut1 + ut
(3.14)
Por lo tanto, autocorrelacin positiva tender a arrojar un pequeo d, mientras que autocorrelacin negativa tender a arrojar un d grande
135
Econometra I
FACEA, Universidad de Chile
136
Econometra I
FACEA, Universidad de Chile
r
DW
n
1
h =
a N (0, 1)
(3.15)
2
1 n
2
donde
2 a la varianza del parmetro asociado al primer rezago de la variable
dependiente incluido en el modelo. Algunas notas respecto al test. Primero,
no importa cuantos rezagos de Y se hallan incluido en el modelo: slo nos
interesa la varianza del primero de ellos. Segundo, el test no es aplicable
cuando n
2 > 1 y tercero, las propiedades del test slo son conocidas asintticamente, por lo cual debe ser implementado con cuidado en muestras
pequeas.
3. Test de Breusch y Godfrey Este test es una alternativa para testear
autocorrelaciones de ordenes superiores a 1 y se basa en el test LM introducido en la seccin 2.12.3. La nula, al igual que en todos los test de
autocorrelacin es que los residuos no se encuentran correlacionados. Consideremos para distintos valores de k, el siguiente conjunto de estadsticos:
Pn
t utk
t=1 u
rk = P
(3.16)
n
2t
t=1 u
note que si k=1, entonces estamos en una caso parecido al estadstico DW.
Los pasos para realizar el test son:
a) Estimar el modelo por MCO y obtener los residuos u. El modelo puede
incluir rezagos de la variable dependiente.
b) Estimar una regresin auxiliar de ut sobre p rezagos: ut1 , . . . , utp ,
incluyendo las variables exgenas (X) del modelo original. Note que
deber excluir p observaciones.
c) Calcular el R2 de la regresin auxiliar
d ) Construir el estadgrafo nR2 2p
La lgica del test se basa en que si no existe autocorrelacin, entonces los
residuos MCO no deberan ser explicados por sus retardos, por lo cual el
R2 de la regresin auxiliar debera ser cercano a cero, lo cual nos llevara a
un bajo valor del estadgrafo y a un no rechazo de la nula.
4. Test de Box-Pierce-Ljung (Q-Stat) Este test se basa en el cuadrado
de las primeras p autocorrelaciones de los residuos MCO. El estadgrafo se
define como:
Q=n
p
X
j=1
137
rj2
(3.17)
Econometra I
FACEA, Universidad de Chile
donde:
Pn
t utj
t=j+1 u
P
rj =
2t
t=1 u
2
1
=
..
..
..
..
.
.
.
.
T 1
T 2
T 3
1
0
0
1
P =
.
..
..
.
.
.
.
0
0
de autocorrelacin es:
T 1
T 2
T 3
..
.
1
es:
0
0
. . ..
. .
1
Entonces utilizando esta matriz P podemos transformar el modelo y aplicar Mnimos Cuadrados Generalizados. Al premultiplicar X e Y por la matriz P tendremos
que la primera observacin se transforma de la siguiente forma:
p
p
p
1 2 y1 = ( 1 2 )x01 + ( 1 2 )u1
(3.18)
Y para el resto de las (T 1) observaciones la transformacin es la siguiente:
yt yt1 = (xt xt1 )0 + ut ut1
| {z }
(3.19)
138
Econometra I
FACEA, Universidad de Chile
xt
yt
xt
+ t
139
Econometra I
FACEA, Universidad de Chile
Supongamos que se pretende estimar el modelo de regresin con autocorrelacin de primer orden. Adems debemos asumir alguna distribucin
para t (recuerde que este es un requisito para poder estimar por mxima
verosimilitud). Supongamos que t se distribuye N (0, 2 ). As, la funcin
de verosimilitud es:
" P
#!
T
Tt=1 2t
1
L=
exp
(3.20)
22
2
Recordemos que P es la matriz que transforma ut en t , es decir, t =
P ut . La funcin de verosimilitud en (3.20) se puede expresar en funcin del
trmino de error ut (AR(1)) como12 :
"
#!
PT
T p
2 2
2
(1
)u
(u
u
)
1
t
t1
1
t=2
L=
1 2 exp
22
2
dado que en este caso el determinante de P (|P |) es
p
1 2 .
L=
0 1
T p
u u
2
1 exp
22
2
(3.21)
T
T
t=2 2t
1
f () =
exp
22
2
o equivalentemente:
f () =
exp
0
22
f (u) =
|P | exp
140
u0 P 0 P u
22
Econometra I
FACEA, Universidad de Chile
lnL =
T 1
2
ln(2)
T 1
2
ln(2 )
T
1 X
2
[(yt xt ) (yt1 xt1 )]2
2 t=2
2 t=2
ecuaciones)
T
lnL
1 X
=
(
ut ut1 )
ut1 = 0 (1 ecuacion)
2 t=2
PT 2
t
lnL
(T 1) 1
t=2
+
= 0 (1 ecuacion)
2
2
(3.22)
(3.23)
(3.24)
t=2
ut ut1
ut1
(3.25)
141
Econometra I
FACEA, Universidad de Chile
20000
16000
12000
8000
4000
0
1955
1960
1980
1965 1970 1975
CONSUMO
PIB
1985
142
Econometra I
FACEA, Universidad de Chile
Std. Error
t-Statistic
Prob.
76.53412
0.768971
81.89808
0.006842
0.934504
112.3909
0.3568
0.0000
C(1)
C(2)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
0.997394
0.997315
180.8607
1079450.
-230.5536
8615.809
3490.620
13.28878
13.37765
0.338818
1960
1980
1985
Fitted
Econometra I
FACEA, Universidad de Chile
C(1)
C(2)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Coefficient
Std. Error
t-Statistic
Prob.
76.53412
0.768971
105.8340
0.008968
0.723152
85.75039
0.4747
0.0000
0.997394
0.997315
180.8607
1079450.
-230.5536
144
8615.809
3490.620
13.28878
13.37765
0.338818
Econometra I
FACEA, Universidad de Chile
145
Econometra I
FACEA, Universidad de Chile
146
Econometra I
FACEA, Universidad de Chile
147
Econometra I
FACEA, Universidad de Chile
148
Captulo 4
Problemas con los datos
4.1.
Multicolinealidad
Econometra I
FACEA, Universidad de Chile
Si existe la inversa de XX, el estimador MCO de este modelo, viene dado por
2
0
1
(4.1)
150
Econometra I
FACEA, Universidad de Chile
4.1.1.
4.1.2.
Deteccin de Multicolinealidad
Multicolinealidad
yi x2i x3i x4i
20 5 10 10
12 2
8
6
28 7 12 16
26 6
4 12
14 4 16 8
24 8 14 14
16 3
6
4
Econometra I
FACEA, Universidad de Chile
(0,42)
(4.2)
(0,21)
R2 = 0,92
u2 = 2,09
(1,61)
(4.3)
(0,81)
R2 = 0,83
u2 = 3,16
Econometra I
FACEA, Universidad de Chile
2. Pequeos cambios en los datos, produce importantes variaciones en las estimaciones mnimo cuadrticas.
3. Los coeficientes pueden tener signos opuestos a los esperados o una magnitud poco creble.
4.1.3.
xj xj x0j Xj
0
XX=
Xj0 xj Xj0 Xj
De esta forma, el elemento (1,1) de (X 0 X)1 es (Demostrar ):
(4.4)
u2
STj (1 Rj2 )
(4.5)
V ar(j ) =
Lo que tiene la siguiente expresin:
V ar(j ) =
1
1 1
1
A11 A12
A11 (I + A12 F2 A21 A1
11 ) A11 A12 F2
=
A21 A22
F2 A21 A1
F2
11
153
Econometra I
FACEA, Universidad de Chile
P
donde STj es la suma total de la regresin entre xj y Xj (STj = ni=1 (xji
xj )2 ) y R2j es el coeficiente de determinacin de esta misma regresin.
La varianza de j depende de tres cosas:
La varianza del trmino de error, que es independiente del grado de
correlacin entre las xs.
La suma total propia de la variable xj , la que depende solo de esta
variable.
El coeficiente de determinacin R2j , el que si depende del grado del grado de correlacin entre la variable xj y las restantes, es decir, depende
del grado de multicolinealidad.
La cota inferior para la varianza de j , cuando R2j =0, es:
V ar(j0 ) =
u2
STj
154
Econometra I
FACEA, Universidad de Chile
10
0
0
x2 x2
..
0
.
0
0x
x
3 3
S=
.
.
..
..
0
0
1
0
0 0
xk xk
4.1.4.
Econometra I
FACEA, Universidad de Chile
estimador MCO sigue siendo el mejor estimador lineal insesgado de los parmetros. El problema es que, cuando hay multicolinealidad, el mejor no resulta ser
muy bueno.
Las soluciones propuestas en la literatura (estimador de ridge o estimador cresta
y estimador de componentes principales) tienen como caracterstica buscar un
estimador ligeramente sesgado pero cuya varianza sea mucho menor, es decir, un
estimador con menor error cuadrtico medio. No existe una metodologa que permita eliminar el problema de alta multicolinealidad sin alterar las propiedades y
la interpretacin de los parmetros.
Estas metodologas tienen poco respaldo intuitivo, por lo tanto la interpretacin
de los parmetros es desconocida.
156
Econometra I
FACEA, Universidad de Chile
4.2.
Error de Medicin
i = 1, ..., n
(4.6)
en el que la variable dependiente yi est medida con error, es decir, solo observamos:
yi = yi + i
i = 1, ..., n
(4.7)
(4.8)
Bajo los supuestos mencionados es fcil darse cuenta que el estimador de ser
el mismo que si observramos el verdadero valor de yi .
En consecuencia, los errores de medida en la variable endgena no producen
ningn problema importante al estimar por MCO.
Ahora supongamos que la variable xi esta medida con error, es decir:
xi = xi + i
i = 1, ..., n
157
(4.9)
Econometra I
FACEA, Universidad de Chile
(4.10)
contrario a lo que ocurra en (4.8) en este caso tenemos dificultad al estimar por
MCO, ya que el trmino de error i esta relacionado con xi , lo que va en contra
del supuesto 6, veamos:
Cov(i , xi ) = Cov(ui i , xi + i )
= Cov(ui , xi ) Cov(i , xi ) + Cov(ui , i ) Cov(i , i )
= 0 0 + 0 2
Esto hace que el estimador MCO de en el modelo (4.10) sea sesgado:
=
=
plim =
plim =
plim =
plim =
plim =
plim =
donde Sx2 = plim n1
Pn
i=1
PN
xi yi
1/N
Pi=1
N
2
1/N
i=1 xi
P
N
1
i=1 xi yi
N
plim
P
N
1
2
x
i
i=1
N
P
1
plim N N
i=1 xi yi
P
2
plim N1 N
i=1 xi
P
plim N1 N
i=1 (xi + i )(xi + ui )
P
2
plim N1 N
i=1 (xi + i )
P
plim N1 N
i=1 (xi + i )(xi + ui + i
P
2
plim N1 N
i=1 (xi + i )
P
plim N1 N
i=1 (xi + i )(ui i )
+
P
2
plim N1 N
i=1 (xi + i )
2
+ 2 2
Sx +
i )
1+
Sx2
Econometra I
FACEA, Universidad de Chile
X0X
n
y = plim
(4.11)
0
.
n
Lo que implica que un slo error basta para generar inconsistencias en todos
los coeficientes del modelo.
4.2.1.
Econometra I
FACEA, Universidad de Chile
(4.12)
Si todas las variables explicativas estn medidas con error cada una de ellas se
necesita un instrumento, entonces Z tiene dimensin nk al igual que X , en este
caso se puede demostrar (Hacerlo) que:
V I = (Z 0 X )1 Z 0 y
con matriz de varianzas y covarianzas (tambin demostrar ):
0
V ar(V I ) = 2 (Z 0 X )1 (Z 0 Z)(X Z)1
4.2.2.
Test de Hausman
Bajo errores de medida, el estimador MCO es inconsistente, mientras que el estimador de variables instrumentales es consistente. Si en ralidad no hubiese errores
de medida, ambos estimadores sern consistentes, y MCO es adems eficiente,
lo que no ocurre con cualquier estimador de variables instrumentales (es un estimador en dos etapas, lo que hace perder eficiencia).
Por lo tanto, para contrastar la existencia de errores de medida Hausman plantea
realizar un test estadstico comparando (M CO V I ) con su matriz de varianzas
y covarianzas.
160
Econometra I
FACEA, Universidad de Chile
M CO V I = 0
(4.13)
161