Escolar Documentos
Profissional Documentos
Cultura Documentos
Econometrı́a
Natàlia Vilor Tejedor (1219777)
28/04/2011
1
Econometrı́a Natàlia Vilor Tejedor
De forma teórica, dado que solo disponemos de dos variables explicativas, el modelo
de regresión lineal es simple y se obtiene que los parámetros estimados por MCO
vienen dados por las siguientes expresiones:
P
Xi Yi − nX̄ Ȳ
β0 = Ȳ − β1 X̄, β1 = P 2
Xi − nX̄ 2
Teóricamente, interpretamos la función del Salario medio de la siguiente forma: el
coeficiente de la pendiente es β1 lo que significa que, permaneciendo constante todo
lo demás, si el gasto disponible aumenta una unidad, el salario medio aumentará
β1 ∗ 100. Por otra parte, el valor del punto de corte es β0 lo que significa que, si el
gasto fuera zero, el salario medio seria aproximadamente β0 . Con mucha frecuencia
esta última interpretación no tiene significado económico.
Por lo general, para interpretar estos resultados hay que utilizar el sentido común,
porque con mucha frecuencia, el intervalo de valores muestrales de X puede no in-
cluir el zero como uno de los valores observados.
2
Econometrı́a Natàlia Vilor Tejedor
En nuestro caso, para obtener los estimadores de los parámetros, sus errores estándar,
el coeficiente de determinación y la suma residual, aplicamos una regresión con
EViews mediante la instrucción: ls salario c gasto. De esta forma se obtiene una
tabla que resume la información deseada:
Teniendo en cuenta que los estimadores MCO son variables aleatorias, dado que sus
valores cambiarán en función de cada muestra, nos interesarı́a saber algo sobre la
variabilidad muestral. Una consecuencia inmediata de los supuestos del modelo de
regresión lineal clásico es que nos permiten estimar las varianzas y errores estándar
de los estimadores de MCO.
σ2 p
V ar(β1 ) = σβ21 = P 2 , se(β1 ) = V ar(β1 )
xi
En la práctica es dificil determinar el valor real de σ 2 , por lo que es usual utilizar
un estadı́stico, σ̂, para estimar el valor de la varianza. Si se supone que σ 2 es
homoscedástica, la variabilidad se estima mediante la fórmula:
P 2
ˆ 2
ei
σ = (1)
n−2
P 2
donde ei es la suma de los residuos al cuadrado (SRC) y de donde se determina
que p
σ̂ = σˆ2 (2)
3
Econometrı́a Natàlia Vilor Tejedor
S.E = 2653.258
R2 = 0.538 (3)
De todas formas, existe un problema, dado que el valor del coeficiente de determi-
nación siempre aumenta cuando incluimos nuevas variables en el modelo, incluso
cuando éstas son poco significativas o tienen poca correlación con la variable de-
pendiente. Para resolverlo se utiliza el coeficiente de determinación corregido que
también nos proporciona el programa EViews:
Para analizar si la estimación tiene sentido económico debemos estudiar los signos
de las variables. No es más que analizar si los signos de los parámetros asociados a
cada una de estas variables (relación directa o inversa entre la variable explicativa
y la endógena) son correctos según nuestros conocimientos teóricos económicos.
4
Econometrı́a Natàlia Vilor Tejedor
sencilla dado que resulta lógico pensar que un incremento en el gasto se deba, en
parte, a un aumento del salario medio del profesorado. Por lo tanto, podemos decir
que a priori, los signos parecen adecuados.
Una vez analizada la parte teórica, la primera de las operaciones básicas consiste
en elaborar intervalos de confianza para los parámetros estimados a fin de deter-
minar la variabilidad o precisión de cada uno de los coeficientes estimados. Para
elaborar un intervalo de confianza de un parámetro resulta básico conocer la forma
y los parámetros de su distribución. El estimador de los parámetros β se distribuye
conforme a una normal, esto es:
β̂ ∼ N (β, σ 2 (X T X)−1 ),
βˆj − βj
√ ∼ tn−k (5)
σ̂ ajj
N (0, 1)
tn−k =
χ2n−k
5
Econometrı́a Natàlia Vilor Tejedor
cometer un error de tipo I, es constante e igual al 5%. Ası́ pues, vemos que para 18
grados de libertad, consultando la tabla t, se obtienen los siguientes valores crı́ticos:
1.822 ≤ β1 ≤ 4.91
Pero, observamos que si la hipótesis nula fuera que el auténtico punto de corte
es 3, no rechazarı́amos esta hipótesis nula porque este valor se haya en la región de
aceptación. (siempre con un nivel de confianza del 95%).
De forma que, substituyendo la variable GASTO por el valor que se nos pide, se
obtiene que el pronóstico del sueldo medio de un profesor de un colegio cuyo gasto
público es de 5000 euros, es de:
SALARIO = 28276.26A
C.
6
Econometrı́a Natàlia Vilor Tejedor
Utilizando la teorı́a económica, observamos que los signos de los coeficientes son
adecuados dado que, por un lado el precio es inversamente proporcional a las ven-
tas, es decir, existe la tendencia de que a menor precio se augmentan las vendas y
viceversa. Por otro lado, la publicidad es proporcional a las ventas, cuanto más pro-
mociono el producto más ventas consigo. Ası́ pues, a priori el modelo se encuentra
bien especificado.
En terminos de significatividad, podemos observar que las variables del modelo son
significativas dentro de éste, dado que los p-valores del test t son suficientemente
pequeños. Por otro lado, el modelo en conjunto también es significativo ya que el
p-valor del test F también es suficientemente pequeño y además, estas variables
incluidas explican un 94.59% del modelo. Ası́ pues se trata de un buen modelo para
estimar las ventas en función del precio y de la publicidad.
7
Econometrı́a Natàlia Vilor Tejedor
ls ventas c publicidad
Relacionando los resultados obtenidos, vemos como, eliminar una variable signi-
ficativa de un modelo lleva a obtener otro modelo que puede no ser adecuado. En
este caso, hemos pasado de un modelo que explicaba un 94.59%, a un modelo que
explica un 14.72%, es decir, estamos perdiendo alrededor de un 80% de información
por excluir la variable Precio del modelo.
8
Econometrı́a Natàlia Vilor Tejedor
Por otro lado, como era de esperar, por lo que se ha analizado en el primer caso, el
modelo es significativo en conjunto (dado que el p-valor del test F es suficientemente
pequeño) y observamos que las variables Precio y Publicidad, tratadas también en
el primer caso, continuan siendo significativas. Por otro lado, ya el enunciado nos
advierte sobre el echo de que la variable Cantidad es irrelevante y esto se puede
contrastar con el resultado de su estadı́stico t, dado que el p-valor asociado a éste
es mayor que el nivel de significación fijado (α = 0.05). El resto de valores de salida
que nos ofrece EViews son los mismos que los del primer modelo exceptuando la
suma de residuos al cuadrado que disminuye.
9
Econometrı́a Natàlia Vilor Tejedor
3. Con el fichero Salario, estimar una regresión original que explique los
salarios con las variables edad y servicio.
Primeramente observamos que los signos de los coeficientes son coherentes con la
teorı́a económica dado que, por un lado, el coeficiente de la variable Edad es pos-
itivo y eso implica que a mayor Edad, mayor Salario, como se suele dar. Por otro
lado, la variable Servicio también tiene coeficiente positivo, cosa que también es
coherente con la teorı́a económica dado que un mayor Servicio suele comportar un
mayor Salario.
10
Econometrı́a Natàlia Vilor Tejedor
donde se observa una relación muy fuerte entre las variables: 99,97%. Ésto, cada
vez con más insistencia nos indica que tendremos un problema de Multicolinealidad.
Aunque muchas veces lo mejor es no corregirla siempre que el modelo económico
sea viable, en nuestro caso no sucede y por lo tanto, tendremos que llevar a cabo
algún procedimiento de corrección.
Puesto que la multicolinealidad surge porque una o más variables explicativas son
una combinación lineal exacta o casi exacta, de otras variables explicativas, una for-
ma de averiguar qué variable X tiene una elevada colinealidad con otras variables X
en el modelo es hacer una regresión de cada variable X sobre las demás y calcular el
correspondiente R2 . Este procedimiento se utiliza para buscar la variable que puede
ser combinación lineal del resto. Ası́ pues, procedemos a realizar las regresiones
auxiliares de forma que obtenemos los siguientes resultados.
11
Econometrı́a Natàlia Vilor Tejedor
Ahora bien, a partir de los resultados, ¿cómo decidimos cuál de las variables tiene
colinealidad? Lo haremos a partir de los coeficientes de determinación auxiliares,
de forma que, si una variable no es una combinación lineal de la otra, entonces R2
no debe ser estadı́sticamente distinto de cero. Como observamos en nuestro caso,
los valores R2 obtenidos en las regresiones auxiliares son:
R22 = 0.999309
R32 = 0.999309
que lógicamente son el mismo dado que sólo se dispone de dos variables explicativas.
12
Econometrı́a Natàlia Vilor Tejedor
regresiones auxiliares, que existe una gran colinealidad entre las variables explica-
tivas del modelo, por lo que se concluye que existe un problema de Multicolinealidad.
Si generamos un grupo con estas dos variables mediante EViews, podemos observar
que la variable Edad se corresponde a un 36% de la variable Servicio, es decir, los
dos vectores de valores son linealmente dependientes y por lo tanto, para corregir
la Multicolinealidad es adecuado eliminar una de las dos variables del modelo. Ası́
pues, analizemos cada uno de los modelos excluyendo una de las dos variables:
Por otro lado, si eliminamos la variable Servicio, se obtiene este otro modelo:
13
Econometrı́a Natàlia Vilor Tejedor
cualquiera de los modelos que escojamos será un buen modelo. Ahora bien, pode-
mos decir que el modelo que relaciona la Edad con el Salario es un poco mejor que
el que relaciona el Servicio con el Salario dado que el coeficiente de determinación
ajustado es un poco más grande y el estadı́stico Akaike es un poco menor. De todas
formas, la conclusión es que estos dos modelos que hemos obtenido solucionan el
problema de Multicolinealidad.
14
Econometrı́a Natàlia Vilor Tejedor
Como vemos, este contraste genera un estadı́stico Obs*R-squared (W) que podemos
comparar con las tablas para obtener la región crśitica. También genera el prob.
Chi-Square(2) que como es suficientemente grande hace que aceptemos la hipótesis
nula, por lo que, acabamos determinando que no se detecta un problema de het-
eroscedasticidad.
15
Econometrı́a Natàlia Vilor Tejedor
emos que los valores de la región crı́tica vienen dados por: (dL = 1.08, dS = 1.36),
y por lo tanto, como nuestro valor se encuentra entre (dS , 4 − dS ), según la tabla
de decisión de Durbin-Watson, no existe autocorrelación positiva ni autocorrelación
negativa. Por lo tanto no tenemos problema de Autocorrelación en nuestro modelo.
Notamos, que este resultado puede venir dado porque estamos aplicando el proced-
imiento al modelo al que, en anteriores apartados, le hemos corregido el problema
de la Multicolinealidad, y es importante recordar el echo de que siempre hay que
corregir primero la Heteroscedasticidad y la Multicolinealidad porque la Autocor-
relación puede venir dada por estos dos factores, cosa que supone que al corregirlos
se corrige de forma automática.
16