Entrega 1 Econometria

Entrega de ejercicios
Econometrı́a
Natàlia Vilor Tejedor (1219777)
28/04/2011
1. La tabla que se presenta representa los salarios medios de un profesor

en 20 escuelas públicas diferentes y el gasto de educación pública por
alumno en dichas escuelas. Queremos estimar la siguiente relación entre
el salario medio y el gasto: Salariomedio = β0 + β1 Gasto + ui
a) Grafique y trace la recta de regresión
Como nos indica el enunciado, la variable dependiente es el Salario medio (Y )

mientras que la variable independiente es el Gasto (X), ası́ pues, vamos a dibujar
los datos de la tabla proporcionada en el enunciado en un diagrama de dispersión,
mostrando el Salario Medio en el eje vertical y el Gasto sobre el eje horizontal.
Como se muestra, generalmente Y tiende a augmentar cuando lo hace X. Entonces,

si conectamos los diversos valores esperados de Y , la lı́nea que se obtiene se denomina
1
Econometrı́a Natàlia Vilor Tejedor
lı́nea de regresión y muestra la media, o valor medio, de la variable dependiente

correspondiente a cada valor de la variable independiente. En definitiva, es una
lı́nea que nos dice cómo se relaciona la media, o el valor medio de Y con cada valor
de X.
b) Obtenga los estimadores de los parámetros, sus errores estándares, el

coeficiente de determinación y la Suma residual.
De forma teórica, dado que solo disponemos de dos variables explicativas, el modelo
de regresión lineal es simple y se obtiene que los parámetros estimados por MCO
vienen dados por las siguientes expresiones:
P
Xi Yi − nX̄ Ȳ
β0 = Ȳ − β1 X̄, β1 = P 2
Xi − nX̄ 2
Teóricamente, interpretamos la función del Salario medio de la siguiente forma: el
coeficiente de la pendiente es β1 lo que significa que, permaneciendo constante todo
lo demás, si el gasto disponible aumenta una unidad, el salario medio aumentará
β1 ∗ 100. Por otra parte, el valor del punto de corte es β0 lo que significa que, si el
gasto fuera zero, el salario medio seria aproximadamente β0 . Con mucha frecuencia
esta última interpretación no tiene significado económico.
Por lo general, para interpretar estos resultados hay que utilizar el sentido común,
porque con mucha frecuencia, el intervalo de valores muestrales de X puede no in-
cluir el zero como uno de los valores observados.
2
En nuestro caso, para obtener los estimadores de los parámetros, sus errores estándar,
el coeficiente de determinación y la suma residual, aplicamos una regresión con
EViews mediante la instrucción: ls salario c gasto. De esta forma se obtiene una
tabla que resume la información deseada:
Además, también podemos obtener la expresión de la recta de regresión que nos

proporciona el propio programa:
SALARIO = 11447.356218 + 3.36578105931 · GASTO
Teniendo en cuenta que los estimadores MCO son variables aleatorias, dado que sus
valores cambiarán en función de cada muestra, nos interesarı́a saber algo sobre la
variabilidad muestral. Una consecuencia inmediata de los supuestos del modelo de
regresión lineal clásico es que nos permiten estimar las varianzas y errores estándar
de los estimadores de MCO.
Ası́ pues, tenemos que

P 2
X p
V ar(β0 ) = σβ20 = P i2 · σ2, se(β0 ) = V ar(β0 )
n xi
σ2 p
V ar(β1 ) = σβ21 = P 2 , se(β1 ) = V ar(β1 )
xi
En la práctica es dificil determinar el valor real de σ 2 , por lo que es usual utilizar
un estadı́stico, σ̂, para estimar el valor de la varianza. Si se supone que σ 2 es
homoscedástica, la variabilidad se estima mediante la fórmula:
P 2
ˆ 2
ei
σ = (1)
n−2
P 2
donde ei es la suma de los residuos al cuadrado (SRC) y de donde se determina
que p
σ̂ = σˆ2 (2)
3
es el error estándar de la regresión.
En la tabla anterior podemos visualizar tanto la suma de cuadrados residual co-

mo el error estardar de la regresión obteniendo los siguientes valores:
SSR = 1.27E + 08,
S.E = 2653.258
Finalmente, el valor del coeficiente de determinación R2 es el porcentaje de la varian-

za de la variable endógena real que es capaz de reproducir el modelo. Si observamos
que analı́ticamente la varianza de la endógena real puede descomponerse en la suma
de la varianza de la endógena estimada más la del error y damos por supuesto que
el objetivo del análisis de regresión es precisamente explicar las variaciones de la
variable endógena, parece razonable pensar que a mayor valor de la R2 mejor ajuste
habremos logrado. EViews ofrece directamente esta información:
R2 = 0.538 (3)
De todas formas, existe un problema, dado que el valor del coeficiente de determi-
nación siempre aumenta cuando incluimos nuevas variables en el modelo, incluso
cuando éstas son poco significativas o tienen poca correlación con la variable de-
pendiente. Para resolverlo se utiliza el coeficiente de determinación corregido que
también nos proporciona el programa EViews:
R̄2 = 0.512 (4)
Ası́ pues, observamos que la variable Gasto presenta un p-valor suficientemente

pequeño para el test t, por lo que podemos determinar que se trata de una variable
significativa y, en general, el modelo también es significativo dado que el p-valor
del estadı́stico F también és inferior al nivel de significación fijado por defecto
(α = 0.05).
No obstante, es importante destacar que tanto el coeficiente de determinación como

el coeficiente de determinación ajustado no son suficientemente grandes (< 0.8), ésto
significa que, el modelo no es del todo malo, pero la introdución de una variable
explicativa significativa harı́a aumentar la parte explicada del modelo.
c) Interprete la estimación, ¿tiene sentido económico?
Para analizar si la estimación tiene sentido económico debemos estudiar los signos
de las variables. No es más que analizar si los signos de los parámetros asociados a
cada una de estas variables (relación directa o inversa entre la variable explicativa
y la endógena) son correctos según nuestros conocimientos teóricos económicos.
En nuestro caso, disponemos de dos parámetros, el del término independiente que

salvo raras excepciones carece de valor “económico” y que por tanto no tiene sentido
interpretar, y por otro lado el signo del parámetro relacionado con la variable Gasto
que como se observa es positivo. La interpretación del signo de esta variable parece
4
sencilla dado que resulta lógico pensar que un incremento en el gasto se deba, en
parte, a un aumento del salario medio del profesorado. Por lo tanto, podemos decir
que a priori, los signos parecen adecuados.
d) Establezca un intervalo de confianza del 95% para β1 .
Una vez analizada la parte teórica, la primera de las operaciones básicas consiste
en elaborar intervalos de confianza para los parámetros estimados a fin de deter-
minar la variabilidad o precisión de cada uno de los coeficientes estimados. Para
elaborar un intervalo de confianza de un parámetro resulta básico conocer la forma
y los parámetros de su distribución. El estimador de los parámetros β se distribuye
conforme a una normal, esto es:
• Para la matriz de parámetros estimados:
β̂ ∼ N (β, σ 2 (X T X)−1 ),
• Para un parámetro especı́fico βj :
βˆ1 ∼ N (β, σ 2 ajj )
donde σ 2 representa la varianza constante de la perturbación aleatoria y ajj los

valores de la diagonal principal de (X T X)−1 . Como en pocas ocasiones se dispone
del valor real de σ 2 , utilizaremos un estimador para la varianza. Por tanto, la
distribución estandarizada del parámetro, que en términos reales se distribuirı́a como
una Normal estándard:
βˆj − βj
√ ∼ N (0, 1)
σ ajj
se distribuye como una t d’Student,
βˆj − βj
√ ∼ tn−k (5)
σ̂ ajj
Recordemos, para ello, que una t se define como:
N (0, 1)
tn−k =
χ2n−k
Y ésta es precisamente la combinación de distribuciones que tenemos con la ex-

presión anterior. Ası́ pues, la expresión general del intervalo de confianza para los
parámetros viene dada por
P (β̂ − tn−k n−k

α/2 · DT (β̂) ≤ β ≤ β̂ + tα/2 · DT (β̂)) = 1 − α (6)
En nuestro ejercicio disponemos de n = 20 valores observados y de k = 2 variables

explicativas, por lo que los grados de libertad de la distribución t vienen dados por
la diferencia entre ambos valores, es decir, disponemos de 18 grados de libertad.
Por otro lado, vamos a suponer que α, el nivel de significación o probabilidad de
5
cometer un error de tipo I, es constante e igual al 5%. Ası́ pues, vemos que para 18
grados de libertad, consultando la tabla t, se obtienen los siguientes valores crı́ticos:
P (−2.1 ≤ t ≤ 2.1) = 0.95
Ahora, como conocemos los valores de la desviación estándard de cada paràmetro y

de las estimaciones de los paràmetros, podemos substituir t de la expresión (5) en
la equación anterior, obteniendo (reordenando las equaciones), la siguiente fórmula
general para obtener el intervalo de confianza:
P (β̂Gasto − tn−k n−k

α/2 · DT (β̂Gasto ) ≤ βGasto ≤ β̂Gasto + tα/2 · DT (β̂Gasto )) = 1 − α (7)
que numéricamente proporciona el siguiente resultado:
1.822 ≤ β1 ≤ 4.91
Este intervalo de confianza se conoce como la región de aceptación de H0 i el área

fuera del intervalo de confianza se denomina región de rechazo de H0 . Ahora bien, si
este intervalo incluye el valor de β1 en la hipótesis nula, no rechazamos la hipótesis,
pero si se encuentra fuera del intervalo de confianza, rechazamos la hipótesis nula,
teniendo en cuenta que, al tomar cualquiera de estas decisiones estamos corriendo
el riesgo de equivocarnos, un determinado porcentaje de las veces (5%).
En el propósito del ejercicio, puesto que el intervalo no incluye el valor cero de

la hipótesi nula, podemos rechazar la hipótesi nula de que el gasto no tiene ningún
efecto sobre el salario. Dicho de otra forma, el gasto sı́ que determina el salario
medio del profesorado.
e) ¿Se rechazarı́a la hipótesis nula de que el coeficiente es 3?
Pero, observamos que si la hipótesis nula fuera que el auténtico punto de corte
es 3, no rechazarı́amos esta hipótesis nula porque este valor se haya en la región de
aceptación. (siempre con un nivel de confianza del 95%).
f ) Obtenga el pronóstico del sueldo medio de un profesor de un cole-

gio cuyo gasto público por alumno es de 5.000 euros.
Finalmente, el pronóstico del sueldo medio de un profesor de un colegio cuyo gasto

público por alumno es de 5000 euros lo obtenemos a partir de la recta de regresión
estimada que se ha obtenido mediante EViews:
SALARIO = 11447.3562168 + 3.36578105931 · GASTO
De forma que, substituyendo la variable GASTO por el valor que se nos pide, se
obtiene que el pronóstico del sueldo medio de un profesor de un colegio cuyo gasto
público es de 5000 euros, es de:
SALARIO = 28276.26A
C.
6
2. Con los datos de Ventas, Cantidad, Precio y Publicidad, se desea esti-

mar una regresión original donde las ventas dependen del precio y de la
publicidad.
a) Estimar el modelo original y comentar los resultados.
Estimamos el modelo original con EViews, a partir de la siguiente sintaxis:
ls ventas c precio publicidad
de forma que obtenemos los siguientes resultados:
Utilizando la teorı́a económica, observamos que los signos de los coeficientes son
adecuados dado que, por un lado el precio es inversamente proporcional a las ven-
tas, es decir, existe la tendencia de que a menor precio se augmentan las vendas y
viceversa. Por otro lado, la publicidad es proporcional a las ventas, cuanto más pro-
mociono el producto más ventas consigo. Ası́ pues, a priori el modelo se encuentra
bien especificado.
En terminos de significatividad, podemos observar que las variables del modelo son
significativas dentro de éste, dado que los p-valores del test t son suficientemente
pequeños. Por otro lado, el modelo en conjunto también es significativo ya que el
p-valor del test F también es suficientemente pequeño y además, estas variables
incluidas explican un 94.59% del modelo. Ası́ pues se trata de un buen modelo para
estimar las ventas en función del precio y de la publicidad.
b) Estimar un modelo en el que se excluya la variable precio. Sabiendo

que ésta es una variable relevante comentar los resultados.
Para estimar este modelo, lo hacemos mediante EViews a partir de la siguiente

sintaxis:
7
ls ventas c publicidad
Como vemos, el coeficiente de la variable Publicidad se mantiene con signo positivo

(si no sucediera serı́a contradictorio con el modelo anterior) dado que como hemos
comentado, la variable Ventas y la variable Publicidad son proporcionales (a mayor
publicidad, mayor número de ventas).
En este caso, escogiendo el nivel de significación α = 0.05, se observa que el p-

valor de la variable publicidad es un poco mayor por lo tanto no podemos concluir
con que esta variable sea del todo significativa, y de igual forma no podemos concluir
que el modelo en conjunto sea significativo. Por otro lado, el coeficiente de determi-
nación ajustado es ahora rı́diculo dado que explica solamente un 14.72%, por lo que
este modelo que explica las ventas en función de la publicidad, no es nada adecuado.
Relacionando los resultados obtenidos, vemos como, eliminar una variable signi-
ficativa de un modelo lleva a obtener otro modelo que puede no ser adecuado. En
este caso, hemos pasado de un modelo que explicaba un 94.59%, a un modelo que
explica un 14.72%, es decir, estamos perdiendo alrededor de un 80% de información
por excluir la variable Precio del modelo.
c) Estimar el modelo original más la variable cantidad. Sabiendo que

cantidad es una variable irrelevante comentar los resultados obtenidos.
En este caso, estimamos el modelo con EViews, a partir de la siguiente sintaxis:
ls ventas c precio publicidad cantidad
8
Primeramente observamos que el coeficiente de la variable cantidad es negativo por

lo que nos indica que las ventas són inversamente proporcionales a la cantidad. Es
lógico dado que cuantas más ventas se produzcan se dispondrá de menos stock.
Por otro lado, como era de esperar, por lo que se ha analizado en el primer caso, el
modelo es significativo en conjunto (dado que el p-valor del test F es suficientemente
pequeño) y observamos que las variables Precio y Publicidad, tratadas también en
el primer caso, continuan siendo significativas. Por otro lado, ya el enunciado nos
advierte sobre el echo de que la variable Cantidad es irrelevante y esto se puede
contrastar con el resultado de su estadı́stico t, dado que el p-valor asociado a éste
es mayor que el nivel de significación fijado (α = 0.05). El resto de valores de salida
que nos ofrece EViews son los mismos que los del primer modelo exceptuando la
suma de residuos al cuadrado que disminuye.
Aunque no es demasiado significativo en este caso, destacamos que al incluir vari-

ables no significativas dentro del modelo, el coeficiente de determinación tiene a
aumentar. De echo, en nuestro ejemplo también sucede, si comparamos los resulta-
dos obtenidos en el primer modelo con los obtenidos en este vemos que el coeficiente
de determinación es ligeramente más grande. Ya en el ejercicio 1, comentábamos
que este caso suele suceder y por lo tanto, debemos fijarnos en el coeficiente de
determinación ajustado, que aunque también aumenta ligeramente, no lo hace en el
porcentaje del coeficiente de determinación sin ajustar.
De todas formas, cuando queramos seleccionar un modelo, estos dos coeficientes no

nos serán de gran ayuda dado que, como vemos, aumentan al introducir variables
al modelo sea cual sea el efecto de éstas y eso conduce a tratar con modelos que
tendrán muchas variables no necesarias.
9
3. Con el fichero Salario, estimar una regresión original que explique los
salarios con las variables edad y servicio.
a) Estimar el modelo original y comentar los resultados.
Estimamos el modelo original a partir de la sintaxis:
ls salario c edad servicio
Primeramente observamos que los signos de los coeficientes son coherentes con la
teorı́a económica dado que, por un lado, el coeficiente de la variable Edad es pos-
itivo y eso implica que a mayor Edad, mayor Salario, como se suele dar. Por otro
lado, la variable Servicio también tiene coeficiente positivo, cosa que también es
coherente con la teorı́a económica dado que un mayor Servicio suele comportar un
mayor Salario.
Visto esto, cabe destacar que aunque el modelo, en general es significativo y el

coeficiente de determinación ajustado es elevado (88.57%), las variables no son sig-
nificativas individualmente. Ésto puede venir dado por un problema de Multicolin-
ealidad que trataremos en próximos apartados.
b) Hallar la matriz de correlaciones entre las variables explicativas.
La matriz de correlaciones entre las variables explicativas se puede obtener directa-

mente a partir de EViews, de forma que se obtiene:

1 0.999655
0.999655 1
10
donde se observa una relación muy fuerte entre las variables: 99,97%. Ésto, cada
vez con más insistencia nos indica que tendremos un problema de Multicolinealidad.
Aunque muchas veces lo mejor es no corregirla siempre que el modelo económico
sea viable, en nuestro caso no sucede y por lo tanto, tendremos que llevar a cabo
algún procedimiento de corrección.
c) Hallar las regresiones auxiliares de las variables explicativas y explicar

los resultados. (edad - Servicio, Servicio-Edad).
Puesto que la multicolinealidad surge porque una o más variables explicativas son
una combinación lineal exacta o casi exacta, de otras variables explicativas, una for-
ma de averiguar qué variable X tiene una elevada colinealidad con otras variables X
en el modelo es hacer una regresión de cada variable X sobre las demás y calcular el
correspondiente R2 . Este procedimiento se utiliza para buscar la variable que puede
ser combinación lineal del resto. Ası́ pues, procedemos a realizar las regresiones
auxiliares de forma que obtenemos los siguientes resultados.
• Para la regresión auxiliar Edad-Servicio:
Por un lado vemos que las variables se encuentra relacionadas proporcional-

mente ya que el signo del coeficiente es positivo. Por otro lado, se obtiene un
modelo significativo globalmente, dado que el p-valor del estadı́stico F es sufi-
cientemente pequeño, y la variable Servicio es significativa individualmente da-
do que el p-valor del estadı́stico t también es suficientemente pequeño. Además,
el coeficiente de determinación ajustado es suficientemente elevado (99.93%)
por lo tanto se concluye con que es un buen modelo para explicar la Edad en
función del Servicio.
• Para la regresión auxiliar Servicio-Edad :
11
De nuevo, como era de esperar, las variables se encuentran relacionadas pro-

porcionalmente y como ya sucedı́a en la regresión auxiliar anterior, el modelo
es significativo en global, y la variable Edad es significativa individualmente.
Además, como el coeficiente de determinación ajustado es suficientemente ele-
vado (99.923%) se concluye con que es un buen modelo para estimar el Servicio
en función de la Edad.
Ahora bien, a partir de los resultados, ¿cómo decidimos cuál de las variables tiene
colinealidad? Lo haremos a partir de los coeficientes de determinación auxiliares,
de forma que, si una variable no es una combinación lineal de la otra, entonces R2
no debe ser estadı́sticamente distinto de cero. Como observamos en nuestro caso,
los valores R2 obtenidos en las regresiones auxiliares son:
R22 = 0.999309
R32 = 0.999309
que lógicamente son el mismo dado que sólo se dispone de dos variables explicativas.
El echo de que el coeficiente de determinación en las regresiones auxiliares sea tan

significativo sugiere que las dos variables explicativas de las que dispone el modelo
tienen una gran colinealidad, una con la otra. (este tipo de regresiones auxiliares
tiene un poco más de sentido cuando el número de variables explicativas del modelo
es mayor de dos).
d) Si existe multicolinealidad, corrija el modelo.
Por lo que hemos comprobado, en el apartado a) el coeficiente de determinación

ajustado es elevado (R̄2 = 88.57%) mientras que las variables no són significati-
vas dentro del modelo. En el apartado b) hemos visto, a partir de la matriz de
correlaciones de las variables explicativas, que existe una elevada relación entre las
variables (99,97%), y en el apartado c) hemos acabado de determinar, a partir de las
12
regresiones auxiliares, que existe una gran colinealidad entre las variables explica-
tivas del modelo, por lo que se concluye que existe un problema de Multicolinealidad.
Si generamos un grupo con estas dos variables mediante EViews, podemos observar
que la variable Edad se corresponde a un 36% de la variable Servicio, es decir, los
dos vectores de valores son linealmente dependientes y por lo tanto, para corregir
la Multicolinealidad es adecuado eliminar una de las dos variables del modelo. Ası́
pues, analizemos cada uno de los modelos excluyendo una de las dos variables:
Por un lado, si eliminamos la variable Edad, se obtiene el siguiente modelo:
Por otro lado, si eliminamos la variable Servicio, se obtiene este otro modelo:
Se observa que ambos modelos son similares en cuanto a la significatividad, y en

ambdos las variables, por si solas, son significativas dentro del modelo. Por eso,
13
cualquiera de los modelos que escojamos será un buen modelo. Ahora bien, pode-
mos decir que el modelo que relaciona la Edad con el Salario es un poco mejor que
el que relaciona el Servicio con el Salario dado que el coeficiente de determinación
ajustado es un poco más grande y el estadı́stico Akaike es un poco menor. De todas
formas, la conclusión es que estos dos modelos que hemos obtenido solucionan el
problema de Multicolinealidad.
e) Existe un problema de Heterocedasticidad? En caso de que exista

corrı́jala.
El primer paso para detectar un problema de Heteroscedasticidad es a partir del

comportamiento gráfico de los residuos. Ası́ pues, generamos un gráfico de disper-
sión de los residuos para tratar los resultados gráficos:
Si analizamos el comportamiento sistemático de los residuos del modelo se observa

que el patrón que siguen los residuos sugiere, tal vez, que no hay Heteroscedasticidad
en los datos. De todas formas, el gráfico no nos garantiza resultados eficientes por
lo que, para acabar de especificar si tenemos un problema de Heteroscedasticidad,
realizaremos el contraste de White. El programa EViews nos permite realizar este
test directamente a partir del modelo determinado, de forma que los resultados
vienen dados por la siguiente tabla:
14
Como vemos, este contraste genera un estadı́stico Obs*R-squared (W) que podemos
comparar con las tablas para obtener la región crśitica. También genera el prob.
Chi-Square(2) que como es suficientemente grande hace que aceptemos la hipótesis
nula, por lo que, acabamos determinando que no se detecta un problema de het-
eroscedasticidad.
f ) ¿Hay algún problema de autocorrelación? En caso afirmativo corrı́jalo.
Como hemos determinado, globalmente el modelo es significativo, pero individual-

mente los parámetros no lo són. Lo más senzillo, primeramente es analizar la gràfica
de residuos dado que la correlación viene dada por problemas en los residuos (esta
parte ya la hemos analizado cuando tratábamos el problema de la Multicolinealidad
y para este caso, la gráfica tampoco presenta una información demasiado precisa
para determinar la existencia de Autocorrelación).
Otra manera de tratar el problema de autocorrelacion es a partir del estadı́stico

Durbin-Watson. Como vemos en la tabla obtenida de la regresión del modelo, ten-
emos que este estadı́stico nos da un valor de 1.96. A partir de ésto, el procedimiento
que debemos realizar es, primeramente, consultar las tablas de Durbin-Watson (con
k=1 variables explicativas, n=15 observaciones y α = 0.05) de esta forma, obten-
15
emos que los valores de la región crı́tica vienen dados por: (dL = 1.08, dS = 1.36),
y por lo tanto, como nuestro valor se encuentra entre (dS , 4 − dS ), según la tabla
de decisión de Durbin-Watson, no existe autocorrelación positiva ni autocorrelación
negativa. Por lo tanto no tenemos problema de Autocorrelación en nuestro modelo.
Notamos, que este resultado puede venir dado porque estamos aplicando el proced-
imiento al modelo al que, en anteriores apartados, le hemos corregido el problema
de la Multicolinealidad, y es importante recordar el echo de que siempre hay que
corregir primero la Heteroscedasticidad y la Multicolinealidad porque la Autocor-
relación puede venir dada por estos dos factores, cosa que supone que al corregirlos
se corrige de forma automática.
16

Entrega 1 Econometria

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Entrega 1 Econometria

Enviado por

Direitos autorais:

Formatos disponíveis

Entrega de ejercicios

1. La tabla que se presenta representa los salarios medios de un profesor

a) Grafique y trace la recta de regresión

Como nos indica el enunciado, la variable dependiente es el Salario medio (Y )

Como se muestra, generalmente Y tiende a augmentar cuando lo hace X. Entonces,

lı́nea de regresión y muestra la media, o valor medio, de la variable dependiente

b) Obtenga los estimadores de los parámetros, sus errores estándares, el

Además, también podemos obtener la expresión de la recta de regresión que nos

SALARIO = 11447.356218 + 3.36578105931 · GASTO

Ası́ pues, tenemos que

es el error estándar de la regresión.

En la tabla anterior podemos visualizar tanto la suma de cuadrados residual co-

SSR = 1.27E + 08,

Finalmente, el valor del coeficiente de determinación R2 es el porcentaje de la varian-

R̄2 = 0.512 (4)

Ası́ pues, observamos que la variable Gasto presenta un p-valor suficientemente

No obstante, es importante destacar que tanto el coeficiente de determinación como

c) Interprete la estimación, ¿tiene sentido económico?

En nuestro caso, disponemos de dos parámetros, el del término independiente que

d) Establezca un intervalo de confianza del 95% para β1 .

• Para la matriz de parámetros estimados:

• Para un parámetro especı́fico βj :

βˆ1 ∼ N (β, σ 2 ajj )

donde σ 2 representa la varianza constante de la perturbación aleatoria y ajj los

Recordemos, para ello, que una t se define como:

Y ésta es precisamente la combinación de distribuciones que tenemos con la ex-

P (β̂ − tn−k n−k

En nuestro ejercicio disponemos de n = 20 valores observados y de k = 2 variables

P (−2.1 ≤ t ≤ 2.1) = 0.95

Ahora, como conocemos los valores de la desviación estándard de cada paràmetro y

P (β̂Gasto − tn−k n−k

que numéricamente proporciona el siguiente resultado:

Este intervalo de confianza se conoce como la región de aceptación de H0 i el área

En el propósito del ejercicio, puesto que el intervalo no incluye el valor cero de

e) ¿Se rechazarı́a la hipótesis nula de que el coeficiente es 3?

f ) Obtenga el pronóstico del sueldo medio de un profesor de un cole-

Finalmente, el pronóstico del sueldo medio de un profesor de un colegio cuyo gasto

SALARIO = 11447.3562168 + 3.36578105931 · GASTO

2. Con los datos de Ventas, Cantidad, Precio y Publicidad, se desea esti-

a) Estimar el modelo original y comentar los resultados.

Estimamos el modelo original con EViews, a partir de la siguiente sintaxis:

ls ventas c precio publicidad

de forma que obtenemos los siguientes resultados:

b) Estimar un modelo en el que se excluya la variable precio. Sabiendo

Para estimar este modelo, lo hacemos mediante EViews a partir de la siguiente

de forma que obtenemos los siguientes resultados:

Como vemos, el coeficiente de la variable Publicidad se mantiene con signo positivo

En este caso, escogiendo el nivel de significación α = 0.05, se observa que el p-

c) Estimar el modelo original más la variable cantidad. Sabiendo que

En este caso, estimamos el modelo con EViews, a partir de la siguiente sintaxis:

ls ventas c precio publicidad cantidad

de forma que obtenemos los siguientes resultados:

Primeramente observamos que el coeficiente de la variable cantidad es negativo por

Aunque no es demasiado significativo en este caso, destacamos que al incluir vari-

De todas formas, cuando queramos seleccionar un modelo, estos dos coeficientes no

a) Estimar el modelo original y comentar los resultados.

Estimamos el modelo original a partir de la sintaxis:

ls salario c edad servicio

de forma que obtenemos los siguientes resultados:

Visto esto, cabe destacar que aunque el modelo, en general es significativo y el

b) Hallar la matriz de correlaciones entre las variables explicativas.

La matriz de correlaciones entre las variables explicativas se puede obtener directa-

c) Hallar las regresiones auxiliares de las variables explicativas y explicar

• Para la regresión auxiliar Edad-Servicio: