Escolar Documentos
Profissional Documentos
Cultura Documentos
E-VIEWS 7.0
Curso: Econometra I
CAPITULO 1
INTRODUCCION AL MANEJO DE E-VIEWS 7.0
1.1 Nociones de Econometra y el Programa E-Views
El programa E-Views es la versin en entorno MS-Windows del antiguo Micro - TSP
(Time Series Analysis) desarrollado por primera vez en 1981. Es uno de los ms utilizados
dentro del campo de la econometra y su manejo permite la estimacin, resolucin y uso de
modelos economtricos de distinta naturaleza mediante la utilizacin de una amplia gama
de procedimientos.
Su puesta al da" en relacin con los ltimos avances de la econometra aplicada es notable
y, para los que conocen cada una de las tcnicas, su utilizacin es extremadamente intuitiva.
Esta adecuacin a la prctica profesional de la econometra se debe sin duda a sus autores
que, desde las primeras versiones del TSP disearon el programa de cara a su utilizacin
real adaptndolo a sus propias necesidades del da a da.
Aunque el programa fue desarrollado por economistas y la mayor parte de sus usos se
realizan en el campo de la economa no hay nada en su diseo que limite su utilidad a las
series temporales econmicas.
Para comenzar a trabajar con el programa E-views, bastara con acceder a icono
correspondiente de nuestro escritorio, y activar la aplicacin seleccionada, presentndonos
una pantalla como la que presentamos en la figura 1, que esta divida en cuatro grandes
partes, marcadas respectivamente del 1 al 4, con los siguientes contenidos.
Curso: Econometra I
Parte 1
Parte 2
Parte
3
Parte 4
Figura 1
En esta primera parte podemos acceder a los diferentes mens desplegables, habituales en
las aplicaciones de tipo Windows, donde se puede ejecutar los comandos genricos de
fichero (File), edicin (Edit), manejo de objetos (Object), Vista (View), desarrollo de
procedimientos (Procs), accesos rpidos a operaciones bsicas (Quick), opciones generales
del programa (Options), gestin de ventanas (Window) y ayuda en lnea (Help), y cuyas
funciones son las siguientes:
File Menu: controla operaciones relacionadas con los ficheros, datos y programas
Edit Menu: contiene los tems bsicos de cualquier programa en entorno Windows
Objects Menu: manipula los distintos objetos que se almacenan en un workfile.
Proc and View Menu: estos dos mens se utilizan de forma diferente que el resto
ya que se refieren siempre a la ventana activa en cada caso y por tanto diferirn
segn el tipo de ventana en uso.
Quick Menu: da acceso directo a comandos que se utilizan con cierta frecuente
Options Menu: altera los parmetros de funcionamiento general del E-Views. Los
cambios que se realicen con este men permanecen an saliendo del programa.
Windows Menu: da acceso directo a las distintas ventanas que tengamos abiertas
en el rea de trabajo.
Help Menu: men de ayuda clsico.
Vamos ahora a entrar con ms detalle en las opciones bsicas de aquellas entradas
principales de mayor inters excepto en los casos de procs y views ya que estas cambian
Curso: Econometra I
segn la ventana activa. No se trata de describir con detalle cada una de las opciones sino
tan slo de anticipar alguno de los tems de cada uno de ellos.
MENU FILE
ENTRADA
New
Open
Save
Save as
Close
Import
Export
Print
Print Setup
Exit
ACCION
Crea nuevos workfiles, ficheros de programa y ficheros de texto.
Abre un men por el que se accede a los workfiles, programas o ficheros
de texto previamente creados.
Salva el workfile, programa o fichero de texto activo, si no se ha grabado
nunca preguntara el nombre a utilizar.
Salva el workfile, programa o fichero de texto preguntando el nombre
Cierra la ventana activa. Si la ventana activa es un workfile, un programa o
un fichero de texto este se cerrara, es decir, ser borrado de la memoria
RAM. Previamente se nos preguntara si deseamos guardar los ltimos
cambios.
Lee datos de un fichero externo. Los ficheros legibles son de los
siguientes tipos: Banco de datos de E-Views, DRI Basic Economic
database, texto, Lotus y Excel. Cuando se importan datos de estos
formatos se abrir un men adicional en el que se nos preguntara el
formato de los mismos.
Escribe datos desde un fichero de trabajo al formato de Banco de datos
E-Views, texto, Lotus y Excel. En el formato de Banco de datos puede
almacenarse cualquier tipo de objeto (en ficheros separados) pero en
ficheros de texto o de hoja de clculo solo pueden almacenarse series de
datos. Se abrirn en todos los casos mens adicionales para especificar el
formato.
Imprime el contenido de la ventana activa. Si no hay ventana activada
imprime el rea de comandos.
Controla las opciones de impresin. El men que se abre permite, entre
otras cosas, especificar si la impresin ser enviada a la impresora o a un
fichero de disco.
Cierra todas las ventanas y sale del programa preguntando si deben
grabarse los cambios realizados.
MEN EDIT
ENTRADA
Undo
Cut
Copy
Paste
Delete
Find
Replace
Next
Insert text file
ACCION
Deshace el efecto de la operacin de edicin ms reciente.
Borra la seleccin y la coloca en el Clipboard de Windows.
Copia la seleccin en el Clipboard de Windows.
Coloca el material residente en el Clipboard de Windows en la zona
seleccionada.
Borra la seleccin.
Encuentra una cadena de caracteres en un texto.
Reemplaza determinadas cadenas de caracteres en un texto.
Ejecuta la siguiente operacin de bsqueda segn la condicin de
bsqueda previa.
Sirve para insertar un documento de texto de tu computadora.
Curso: Econometra I
MENU OBJECTS
ENTRADA
New Object
Fetch
Store
Store As
Name
Copy
Freeze
Print
View Options
ACCION
Crea un nuevo objeto del que se nos preguntara el tipo y el nombre.
Es la operacin contraria a Store y de efecto similar a Import del men
File. Su utilidad es grabar un objeto en formato Base de Datos E-Views
(*.db*) en un disco.
Es la operacin contraria a Fetcht y de efecto similar a Export del men
File. Su utilidad es grabar un objeto en formato Base de Datos E-Views
(*.db*) en un disco.
De efecto idntico a Store permite guardar objetos en formato .db
pero permitiendo especificar el nombre y el lugar de almacenamiento.
Permite dar nombre a un objeto nuevo o ya creado cuando este se
encuentra activo.
Realiza una copia de un determinado objeto cuando este se encuentra
activado o simplemente resaltado. Nos preguntara el nombre del nuevo
objeto.
Congela la vista activa del objeto seleccionado creando un nuevo
objeto. Si el objeto congelado es un grafico de una serie, el grafico se
almacenara como un objeto nuevo que podr ser modificado poniendo
textos, sombras. Para cualquier otro objeto el resultado ser una tabla
que tambin puede ser editada.
Imprime la vista activa del objeto que estemos visualizando.
Activa o desactiva ciertas propiedades de la vista del objeto activo. No
cambia el tipo de vista sino algunas de sus caractersticas. Este men
cambia segn el men de vista activo. Sus opciones son ms accesibles
desde la barra de iconos que aparece en la parte superior de la ventana
de una vista.
MENU QUICK
ENTRADA
Sample
Generate Series
Show
Graph
Empty Group
Series Statistics
ACCION
Altera la muestra de datos que se consideraran para los tratamientos
posteriores a esta orden.
Permite especificar una ecuacin para generar una serie nueva a
partir de otras almacenadas en el fichero de trabajo adems del
periodo (muestra) para el que se generaran datos de esa nueva serie.
Activa la ventana del objeto seleccionado. La principal utilidad de
esta orden no es abrir la ventana de un objeto sino abrir, en una
ventana nica, varios grficos o series.
Permite crear un grafico de la serie seleccionada o de un grupo de
series. Una vez seleccionadas las series puede especificarse el tipo de
grafico que se desea y mltiples opciones que modifican su aspecto
final.
Crea un grupo de series vaco. Una vez creado pueden teclearse en
la barra de edicin de ese grupo las series que se desean en ese
grupo o los valores concretos para cada una de ellas.
Calcula diversos estadsticos que se ofrecen en un men para una o
varias series seleccionadas.
Curso: Econometra I
Group Statistics
Estimate Equation
Estimate VAR
En esta segunda rea, que habitualmente ocupara muy poco espacio, se podrn introducir y
ejecutar de forma manual todos los comandos habilitados en E-views, de forma tal que un
usuario avanzado podr ejecutar las opciones que desee sin necesidad de ir seleccionando
secuencialmente las opciones ofrecidas en las diferentes ventanas de acceso.
Finalmente, este ltimo rea nos informa sobre el estado actual de la aplicacin activa,
detallando la accin que se est ejecutando en ese momento (mensaje de bienvenida en la
imagen adjunta), el directorio activo en ese momento (Path), la base de datos activa, si la
hubiera (DB), y el archivo de trabajo (Workfile).
Ahora para crear un archivo de Trabajo se tiene que cargar en primer lugar el E-views que
aparece en la ventana principal, posteriormente para generar un archivo de trabajo se
realizan los siguientes pasos:
Seleccionar la opcin File situada en la parte posterior de la pantalla, luego New y se sita
sobre la opcin Workfile
Curso: Econometra I
Luego de seleccionar estos pasos, aparecer una nueva ventana en el que se debe especificar
sobre la periodicidad o frecuencia de los datos con los que se va a trabajar.
Luego en Start date y End date debe especificar el rango entre la fecha de inicio y la fecha
de trmino de trabajo respectivamente.
Curso: Econometra I
Ahora tenemos que orientarle a E-views el tipo de serie que se ingresara al sistema. En
Frecuency se muestran los posibles formatos a ingresar:
Por ejemplo:
Tipo o frecuencia
Start date
End date
Multi anual
(Multi-year)
1898
1996
Series anuales
(annual)
1952
2010
Semi anual
(Semi-anual)
1952
2010
Series trimestrales
(quarterly)
1952:3
2010:4
Series mensuales
(monthly)
1952:01
2009:12
Series bimensuales
(bimonthly)
1952:01
2009:12
Serie quincenal
(Fortnight)
1898:01
1899:01
Series trimensuales
(Ten-day Trimonthly)
1898:01
1899:01
1/01/1952
12/12/2009
Series semanales
(weekly)
Series diarias
Curso: Econometra I
(Daily 5 day week)
(Daily 7 day week)
1/20/1999
(Intraday)
1/01/1999
1/01/1999
Das enteros
10
(Integer date)
Donde:
Multianual: 1898-1906, en este caso se selecciono para dos aos, por lo tanto el
programa solo encontrar en ese periodo 5 observaciones (1898, 1900, 1902,1904
,1906).
Anual: 1952-2010, en este caso el programa encontrara 59 observaciones.
Semi anual: 1952-2010, en este caso el programa encuentra 2 observaciones (2
semestres por cada ao), por lo que encontrara 118 observaciones.
Trimestral: 1952:3 - 2010:4, comienza desde el tercer trimestre de 1952 y acaba el
cuarto y ltimo trimestre del 2010, encontrando 234 observaciones.
Mensual: 1952:01 2009:12, significa de enero de 1952 hasta diciembre del 2009,
encuentra 696 observaciones.
Bimensual: 1952:01 2009:12, igual que el tem anterior solo que cada mes se divide
en dos partes iguales, encontrando 1380 observaciones.
Quincenal: 1898:01 1899:01, cada mes equivale a dos quincenas, por tanto
encuentra 27 observaciones.
Trimensuales: 1898:01 1899:01, significa que cada mes se divide en tres partes
iguales, encontrando 37 observaciones.
Semanales: 1/01/1952 - 12/11/2009, hace un conteo de todas las semanas desde el
mes de enero de 1952 hasta el mes de diciembre del 2009.
Diaria: 1/01/1999 - 1/20/1999, para el primer caso (5 day week) considera solo los 5
primeros das como hbiles (Lunes a Viernes), para el segundo caso ( 7 day week)
considera los 7 das como hbiles (Lunes a Domingo), y por ultimo (custom week)
considera los das que usted asigne como das hbiles.
Intraday: 1/01/1999 - 1/01/1999, para este caso se identifica en cada cuanto tiempo
en horas, minutos o segundos se haga el conteo para una fecha determinada dado
los das hbiles segn usted lo determine. Para nuestro ejemplo se especificara 30
minutos para todo el da de 1/01/1999, encontrado as 48 observaciones.
Das enteros: 5-10, hace un conteo simple de los das que usted determine, en
nuestro ejemplo encuentra 6 observaciones.
Curso: Econometra I
Como hemos visto el tipo y la frecuencia de los datos pueden ser multi anual, anuales, semi
anuales, trimestrales, mensuales, bimensuales, quincenales, trimensuales, semanales, diarios
o sin fecha (corte transversal)2.
Si los datos son de frecuencia anual y de rango entre 1978 y 2010 se crea el archivo
workfile:
El E-views crea por default dos objetos c (antecedido de un cono-alfa) y resid (antecedido
del cono relacionado a las series de datos). En el objeto c (alfa) almacenar los valores
estimados para los parmetros de los modelos corridos y el objeto resid almacenar los
valores residuales de la ltima regresin corrida.
Range: 1978 2010 significa que toda la informacin empieza el ao 1978 y termina el ao
2010.
Sample: 1978 2010 significa que la muestra activa va de 1978 a 2010. El sample puede ser
modificado por ejemplo de 1978 a 1990 u otra combinacin dentro del Range, para ello
tiene tres alternativas:
1. Elija la opcin Sample de la barra de herramientas de la ventana workfile. Sobre la
ventana Sample escriba el nuevo rango muestral, por ejemplo: 78 90.
Para este tipo de datos nos situamos en Workfile structure type, desplazamos y escogemos
Unstructured/Undated. En este caso en Observations solo ingresamos el nmero de datos disponibles. La otra
estructura del workfile es para paneles de datos balanceados (Balanced panel).
10
Curso: Econometra I
2. De doble click en el workfile sobre Sample: 1978 1999. Aparecer la ventana Sample
y cambie el rango muestral, por ejemplo 78 90.
3. Escriba sobre la lnea de comando en la ventana principal del E-views: smpl 78 90.
11
Curso: Econometra I
12
Curso: Econometra I
Otra es escribir en la lnea de comandos Open donde debe elegir el archivo donde estn
los datos y el tipo de archivo a elegir. Luego de escoger el archivo marque la opcin abrir.
Se ingresa a una nueva ventana donde debe completarse informacin adicional mostrado
en el cuadro de arriba, tambin debemos tener en cuenta si los datos estn en filas o
columnas (Data order) y del sample donde se va a insertar los datos. Esta debe ser
coherente con el sample del workfile creado inicialmente.
13
Curso: Econometra I
Como ejercicio, utilice el archivo data1_trimestral donde se tiene datos del primer
trimestre de 1980 al primer trimestre del 2009, el cual se usarn tres variables: PBIREAL,
CONSUMO y INVERSION. Tener en cuenta que los datos empiezan en el casillero B2 y
los nombres de las variables estn en la primera fila.
Utilizando el workfile creado anteriormente,
mediante la siguiente opcin:
Save (enter) en la lnea de comandos o File / Save (o Save as) del men bsico de
herramientas generales, luego agregue un nombre, por ejemplo prime_workfile. En el
directorio de trabajo o en lugar donde usted decida guardar el archivo, este aparecer con
extensin wf1, es decir primer_workfile.wf1.
Para ver los datos que contiene el workfile creado, se tiene varias alternativas:
14
Curso: Econometra I
Luego de mostrar en grupo las tres variables a estudiar, E-views muestra otras alternativas
para ver los datos, el cual la mayora de ellas estn asociadas a las siguientes opciones en el
workfile:
View / Graph / Options Pages, Graph Type, Details
View / Descriptive Stats / Individual Sample o Common Sample
View / Covariance Analysis/ Correlation
Ahora utilizando el grupo de series como ventana activa, puede copiar dichas series
eligiendo siguiendo los siguientes pasos:
Utilizar la opcin Freeze. Aparecer una nueva ventana con los datos de las variables
mostradas, esta ventana puede ser grabada en el workfile al dar click en Name y guardarlo
con el nombre que usted crea conveniente.
Elegir la opcin Edit +/- en la barra de herramientas del E-Views para cambiar los valores
de las series si es necesario.
Seleccionar todo los valores del grupo de series y dar click derecho/copy e ir al
documento MS Word y pegar el objeto copiado utilizando la pegar.
Para crear series en base a las variables existentes (PBIREAL, CONSUMO, INVERSION)
se puede elegir la opcin Genr en la barra de herramientas del workfile creado. Aqu
aparecer una nueva ventana por la ecuacin que transforma las series existentes en la
nueva serie que usted desea crear.
Aqu se crea el logaritmo
de la variable consumo.
Tener en consideracin
el periodo muestral
que es esta eligiendo.
15
Curso: Econometra I
16
Curso: Econometra I
PBIREAL
INVERSION
200
180
CONSUMO
50,000
140,000
40,000
120,000
30,000
100,000
20,000
80,000
10,000
60,000
160
140
120
100
80
1980
1985
1990
1995
2000
2005
0
1980
1985
1990
1995
2000
2005
40,000
1980
1985
1990
1995
2000
2005
17
Curso: Econometra I
10
Series: CONSUMO
Sample 1980 2008
Observations 29
Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
79896.72
78223.23
129097.1
59999.71
18539.24
0.958550
3.249980
Jarque-Bera
Probability
4.516462
0.104535
0
60000
70000
80000
90000
100000
110000
120000
130000
el grafico
Show consumo.stats, aqu se muestra las estadsticas bsicas e histograma para la serie
CONSUMO.
Show consumo.label, aqu se la etiqueta de la serie CONSUMO.
Show consumo.sheet, aqu se muestra la hoja de datos de la serie CONSUMO.
Show consumo.statby, aqu se muestra las estadsticas por clasificacin de la serie
CONSUMO.
Show consumo.testby, aqu se muestra las pruebas de igualdad por clasificacin de la serie
CONSUMO.
18
Curso: Econometra I
Dado el grafico anterior (as como la vista Stats), el cual muestra un grfico de barras que
representa la distribucin de frecuencias de la serie analizada. De esta manera, es posible
determinar qu valores tienen la mayor probabilidad de ocurrencia y alrededor de que
valor(es) se centran las observaciones. La forma de la distribucin para los datos de la serie
seleccionada puede analizarse con ms detalle y formalidad a partir de los siguientes
estadsticos:
Media (mean)
Corresponde al valor promedio de la serie. Si el valor de la media fuese muy cercano a
cero, se podra concluir la caracterstica de normalidad estandarizada del proceso
generador de la serie.
Mediana (median)
Corresponde al valor central de la serie (luego de ser ordenada segn su magnitud).
Como se sabe, en una distribucin normal la media, la mediana y la moda arrojan el
mismo resultado debido, precisamente, a que la distribucin es simtrica (el estadstico
relevante para medir la simetra ser explicado ms adelante).
1 N
( yi y )2
N 1 i 1
19
Curso: Econometra I
Sk
1
N
( yi y )3
i 1
1
Ku
N
( yi y )4
i 1
En este sentido, para una distribucin normal, el cuarto momento es igual a tres veces
el cuadrado de su varianza. A partir de lo anterior, si el coeficiente de curtosis es menor
a tres se dice que la distribucin es platicrtica; en cambio, si el cuarto momento es mas
de tres veces el cuadrado de la varianza (coeficiente de curtosis de mayor a tres) se dice
que la distribucin es leptocrtica. Asimismo, una distribucin cuyo coeficiente de
curtosis se aproxima al valor de tres se denomina mesocrtica. Si consideramos la
denominacin anterior, el termino lepto significa delgado (en griego) y se refiere al
hecho de que este tipo de distribuciones presenta una parte central relativamente
delgada; lo cual no se debe confundir con la anchura de colas, ya que distribuciones
leptocrticas presentan colas ms anchas que las platicrticas. Por otro lado, el trmino
plati significa ancho y se refiere a la mayor anchura de la parte central, a pesar de que
las colas sean relativamente ms delgadas. En conclusin, distribuciones con un
coeficiente de curtosis mayor a tres (leptocrticas) poseen un mayor apuntamiento
20
Curso: Econometra I
Platicrticas
Mesocrtica
Leptocrtica
s
Test Jarque-Bera
JB
N k
1
Sk 2 ( Ku 3) 2
6
4
Donde k indica el nmero de coeficientes utilizados para generar la serie analizada. Tal
como se aprecia, la prueba de normalidad se basa en los dos estadsticos explicados
anteriormente: el coeficiente de asimetra y el coeficiente de curtosis. As, cuanto mayor
sea la diferencia entre los valores referenciales a estos estadsticos para una distribucin
normal y los obtenidos para la serie analizada, mayor ser el estadstico JB y, por tanto,
mayor ser la probabilidad de que este resulte mayor al valor crtico y nos encontremos
en zona de rechazo para la hiptesis nula de normalidad.
Tal como se indic la hiptesis nula del test Jarque-Bera es que la distribucin de donde
han sido extrados los datos de la serie analizada es normal. Sin embargo, antes de
contrastar la evidencia que nos brinda el valor del estadstico JB, es necesario fijar un
nivel de confianza (lo usual es trabajar con una certidumbre del 95%) que delimite las
zonas de aceptacin y rechazo para la hiptesis nula.
21
Curso: Econometra I
22
Curso: Econometra I
CAPITULO 2
M0DELO DE REGRESION LINEAL CLASICO
, i 1,..., n
(1)
La variable yi es la variable endgena o dependiente, las variables xij , i 1,......k son las
variables explicativas o regresores y i es la perturbacin aleatoria o comnmente llamado
termino de error, por ltimo los son los parmetros asociados a cada una de las
variables explicativas, tambin llamados coeficientes de regresin y miden el impacto de
cada variable independiente al comportamiento de la variable endgena.
Los parmetros de la poblacin que son 1 , 2 ,...k no son conocidos. Sin embargo
utilizando informacin muestral se pueden obtener estimadores de los parmetros (o
coeficientes).
As utilizando la informacin muestral se debe obtener:
23
Curso: Econometra I
x11
y1
x12
y2
Y
,X
x1n
yn nx1
x21
x22
x2 n
xk1
xk 2
xkn
nxk
(2)
1
1
2 , 2
k kx1
n nx1
Si se quiere que en el modelo exista trmino independiente, la variable x1i tiene que ser
igual a uno, o lo que es lo mismo, la primera columna de la matriz X tiene que ser un
vector de unos. A este regresor se le llama regresor ficticio. Normalmente, se trabajar con
modelos en los que existe trmino independiente.
Adems, se considera que se cumplen las siguientes hiptesis clsicas bsicas:
24
Curso: Econometra I
R2 ajustado:
Se define de tal modo que penaliza la inclusin de nuevas variables explicativas en el
modelo, ya que, si bien al aumentar el nmero de regresores aumenta tambin la Suma de
Cuadrados Explicados, la inclusin de nuevas variables explicativas reduce los grados de
libertad del modelo, por lo que no siempre resultara adecuado incorporar nuevas variables
al mismo.
SCR
n 1
R 1 n k 1
(1 R 2 )
SCT
nk
n 1
SCR 2k
AIC ln
n n
Y su valor tambin aparece calculado automticamente en la estimacin facilitada por Eviews; el nombre que lo identifica es Akaike info criterion.
25
Curso: Econometra I
Criterio de Schwarz
Este criterio es una alternativa mas restrictiva al criterio AIC, ya que permite la seleccin de
variables que deben ser incluidas en el modelo. Este criterio penaliza en un grado mayor la
inclusin de nuevos regresores en el modelo. Al igual que en el caso anterior, se considera
mejor modelo aquel que presente un menor valor del coeficiente. Su valor aparece tambin
calculado en la estimacin facilitada por E-views con el nombre Schwarz criterion y se
obtiene a partir de la siguiente expresin.
SBC
k
SCR
ln(n) ln
n
n
26
Curso: Econometra I
2.2 APLICACIONES
2.2.1 Un alumno de la UNALM desea estimar la funcin de produccin del sector textil
utilizando como variables explicativas el trabajo y el capital.
Observaciones
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
Q
3267636
3664620
4106758
4592483
5250695
6074133
6887865
7848365
8168404
8392581
8972103
9420052
L
1493.8
1549.1
1637.6
1727.6
1848.6
1963.5
2036.2
2070.8
2065.4
2055.9
2093.78
2107.615
K
2923423.74
3138053.94
3364006.38
4672090.06
6413698.56
8526638.63
10744839.7
12597038.7
14444431.8
16260040.2
17962362.2
19226538.1
Se le pide:
1. Estimar una funcin de produccin lineal y verificar la igualdad entre las
productividades marginales del trabajo y el capital.
2. Estimar una funcin tipo Cobb-Douglas y verificar la existencia de rendimientos
constantes de escala.
27
Curso: Econometra I
3. Analizar los efectos que se producen sobre las estimaciones ante cambios de escala
( se multiplica por diez), en la variable dependiente y en los regresores.
4. Analizar los efectos que se producen sobre las estimaciones ante cambios de origen
(se restan quinientas unidades), en la variable dependiente y en los regresores.
5. Considerando el periodo 1985-1993 en la variable dependiente, realizar una
prediccin para dicha variable en los tres aos siguientes.
Solucin:
Primero procedemos a importar la base de datos del excel llamado Ejercicio2.1.xlsx, para
esto abrimos el E-views, luego:
File / New/ Workfile. Luego utilizando Dated-regular frecuency y Frecuency/
Annual, seleccionamos en Start date: 1985 y en End date: 1996, por ltimo pulsamos
OK.
28
Curso: Econometra I
Dependent Variable: Q
Method: Least Squares
Sample: 1985 1996
Included observations: 12
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
L
K
-1832783.
2999.482
0.255262
725849.9
467.3818
0.017681
-2.525017
6.417627
14.43725
0.0325
0.0001
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.996321
0.995503
146379.0
1.93E+11
-158.0286
1218.617
0.000000
6387141.
2182889.
26.83810
26.95933
26.79322
1.577307
o H0 : 0
Value
df
Probability
6.416860
41.17609
41.17609
9
(1, 9)
1
0.0001
0.0001
0.0000
Value
Std. Err.
2999.227
467.3979
29
Curso: Econometra I
La salida del ordenador muestral los estadsticos experimentales y las probabilidades que
dejan a su derecha. Puesto que en ambos casos la probabilidad es menor que el nivel de
significacin elegido (se utiliza normalmente 0,05), se rechaza la hiptesis nula, por lo que
se rechaza la igualdad entre las productividades marginales.
2. La funcin de produccin de tipo Cobb-Douglas a estimar en este caso es:
qt ALt Kt eut
Coefficient
Std. Error
t-Statistic
Prob.
4.392927
0.617822
0.412304
1.714918
0.354840
0.063183
2.561597
1.741128
6.525580
0.0306
0.1156
0.0001
0.992414
0.990729
0.035672
0.011452
24.69955
588.7303
0.000000
15.61025
0.370473
-3.616591
-3.495365
-3.661474
1.348233
30
Curso: Econometra I
Wald Test:
Equation: EQ02
Test Statistic
t-statistic
F-statistic
Chi-square
Value
df
Probability
0.102506
0.010508
0.010508
9
(1, 9)
1
0.9206
0.9206
0.9184
Value
Std. Err.
0.030126
0.293890
Puesto que la probabilidad que deja a la derecha el estadstico es mayor que el nivel de
significacin de 0.05, no se puede rechazar la hiptesis nula, por lo que se considera la
presencia de rendimientos constantes de escala.
3. Anlisis de las estimaciones antes cambios de escala.
Se selecciona en la pantalla principal la ecuacin la ecuacin uno, puesto que es el modelo
de produccin lineal sobre el que se va a trabajar. En primer lugar es necesario definir de
nuevo las variables, incrementndolas por die, incluido el termino independiente.
Instrucciones: Genr/MQ=10*Q
Genr/MC=10*1
Genr/ML=10* L
Genr/MK=10*K
31
Curso: Econometra I
Dependent Variable: Q
Method: Least Squares
Date: 08/09/10 Time: 12:26
Sample: 1985 1996
Included observations: 12
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
ML
MK
-1832783.
299.9482
0.025526
725849.9
46.73818
0.001768
-2.525017
6.417627
14.43725
0.0325
0.0001
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.996321
0.995503
146379.0
1.93E+11
-158.0286
1218.617
0.000000
6387141.
2182889.
26.83810
26.95933
26.79322
1.577307
Coefficient
Std. Error
t-Statistic
Prob.
C
ML
K
-1832783.
299.9482
0.255262
725849.9
46.73818
0.017681
-2.525017
6.417627
14.43725
0.0325
0.0001
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
0.996321
0.995503
146379.0
1.93E+11
-158.0286
6387141.
2182889.
26.83810
26.95933
26.79322
32
Curso: Econometra I
F-statistic
Prob(F-statistic)
1218.617
0.000000
Durbin-Watson stat
1.577307
Si se incrementa solo la variable dependiente, los coeficientes de todos los regresores se ven
multiplicados por diez:
Mqt Lt Kt ut
Dependent Variable: MQ
Method: Least Squares
Date: 08/13/10 Time: 22:30
Sample: 1985 1996
Included observations: 12
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
L
K
-18327831
29994.82
2.552618
7258499.
4673.818
0.176808
-2.525017
6.417627
14.43725
0.0325
0.0001
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.996321
0.995503
1463790.
1.93E+13
-185.6596
1218.617
0.000000
63871413
21828885
31.44327
31.56450
31.39839
1.577307
Coefficient
Std. Error
t-Statistic
Prob.
C
ML
MK
-18327831
2999.482
0.255262
7258499.
467.3818
0.017681
-2.525017
6.417627
14.43725
0.0325
0.0001
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.996321
0.995503
1463790.
1.93E+13
-185.6596
1218.617
0.000000
63871413
21828885
31.44327
31.56450
31.39839
1.577307
33
Curso: Econometra I
Si se incrementan todas las variables, incluido el regresor ficticio, los coeficientes de las
variables, incluido el del regresor ficticio, no se alteran:
Mqt MCt MLt MKt ut
Dependent Variable: MQ
Method: Least Squares
Date: 08/09/10 Time: 12:33
Sample: 1985 1996
Included observations: 12
Variable
Coefficient
Std. Error
t-Statistic
Prob.
MC
ML
MK
-1832783.
2999.482
0.255262
725849.9
467.3818
0.017681
-2.525017
6.417627
14.43725
0.0325
0.0001
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.996321
0.995503
1463790.
1.93E+13
-185.6596
1.577307
63871413
21828885
31.44327
31.56450
31.39839
Genr/RC=1-500
Genr/RL= L-500
Genr/RK=K-500
34
Curso: Econometra I
Dependent Variable: Q
Method: Least Squares
Date: 08/09/10 Time: 12:43
Sample: 1985 1996
Included observations: 12
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
RL
RK
-332914.4
2999.482
0.255262
494515.7
467.3818
0.017681
-0.673213
6.417627
14.43725
0.5177
0.0001
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.996321
0.995503
146379.0
1.93E+11
-158.0286
1218.617
0.000000
6387141.
2182889.
26.83810
26.95933
26.79322
1.577307
35
Curso: Econometra I
Dependent Variable: Q
Method: Least Squares
Date: 08/09/10 Time: 12:48
Sample: 1985 1996
Included observations: 12
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
RL
K
-333042.1
2999.482
0.255262
494508.3
467.3818
0.017681
-0.673481
6.417627
14.43725
0.5176
0.0001
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.996321
0.995503
146379.0
1.93E+11
-158.0286
1218.617
0.000000
6387141.
2182889.
26.83810
26.95933
26.79322
1.577307
Rqt Lt Kt ut
Dependent Variable: RQ
Method: Least Squares
Date: 08/09/10 Time: 12:50
Sample: 1985 1996
Included observations: 12
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
L
K
-1833283.
2999.482
0.255262
725849.9
467.3818
0.017681
-2.525705
6.417627
14.43725
0.0325
0.0001
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.996321
0.995503
146379.0
1.93E+11
-158.0286
1218.617
0.000000
6386641.
2182889.
26.83810
26.95933
26.79322
1.577307
36
Curso: Econometra I
Coefficient
Std. Error
t-Statistic
Prob.
C
RL
RK
-333414.4
2999.482
0.255262
494515.7
467.3818
0.017681
-0.674224
6.417627
14.43725
0.5171
0.0001
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.996321
0.995503
146379.0
1.93E+11
-158.0286
1218.617
0.000000
6386641.
2182889.
26.83810
26.95933
26.79322
1.577307
Coefficient
Std. Error
t-Statistic
Prob.
668.1652
2999.482
0.255262
991.0134
467.3818
0.017681
0.674224
6.417627
14.43725
0.5171
0.0001
0.0000
0.996321
0.995503
146379.0
1.93E+11
-158.0286
1.577307
6386641.
2182889.
26.83810
26.95933
26.79322
37
Curso: Econometra I
Por lo tanto en todas las regresiones el nico estimador que varia es el correspondiente al
regresor ficticio, permaneciendo inalterados los coeficientes de los dems regresores.
5. Prediccin de la variable dependiente para el periodo 1994-1996.
Para poder realizar esta prediccin hay que generar una nueva serie que sea igual a nuestra
serie de produccin pero sin datos para el periodo 1994-1996.
Instrucciones: Genr/qmod=q
Una vez conseguida la nueva serie hay que mostrarla: escriba en la lnea de comandos show
q qmod, y editarla (edit +/-) para poder modificar las tres ltimas observaciones de la
serie, escribiendo sobre ellas NA.
Puesto que la variable dependiente se ha modificado, tiene tres observaciones menos, para
realizar la prediccin es necesario estimar de nuevo el modelo.
Instrucciones: En herramientas generales seleccionamos Quick/Estimate equation/
qmod c L K o en la lnea de comandos escribimos EQUATION EQ05.LS qmod c L K
Dependent Variable: QMOD
Method: Least Squares
Date: 08/09/10 Time: 12:58
Sample (adjusted): 1985 1993
Included observations: 9 after adjustments
38
Curso: Econometra I
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
L
K
-991000.6
2391.562
0.292948
1118930.
765.0700
0.039874
-0.885668
3.125938
7.346843
0.4099
0.0204
0.0003
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.994121
0.992162
159777.9
1.53E+11
-118.7797
507.3115
0.000000
5540107.
1804697.
27.06216
27.12790
26.92029
1.705018
Forecast: QMODF
Actual: QMOD
Forecast sample: 1985 1996
Included observations: 9
Root Mean Squared Error 130458.1
Mean Absolute Error
112710.8
Mean Abs. Percent Error
2.281807
Theil Inequality Coef f icient 0.011257
Bias Proportion
0.000000
Variance Proportion
0.001474
Cov ariance Proportion 0.998526
10,000,000
9,000,000
8,000,000
7,000,000
6,000,000
5,000,000
4,000,000
3,000,000
2,000,000
85
86
87
88
89
90
QMODF
91
92
93
94
95
96
2 S.E.
QMOD
QMODF
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
3267636
3664620
4106758
4592483
5250695
6074133
6887865
7848365
8168404
8392581
8972103
9420052
3267636.
3664620.
4106758.
4592483.
5250695.
6074133.
6887865.
7848365.
8168404.
NA
NA
NA
3437927.
3633056.
3910901.
4509343.
5308923.
6202696.
7026381.
7651728.
8180004.
8689164.
9278449.
9681875.
39
Curso: Econometra I
Como podemos ver en este caso, por regla general las predicciones de la variable son
mayores que los verdaderos valores.
2.2.2
observaciones
x1
x2
x3
x4
Andaluca
40.16
421844
2.96
116.7
Aragn
22.67
72323
1.76
115.4
Asturias
23.43
25581
2.16
117.9
Baleares
43.51
75614
10.96
117.2
Canarias
71.41
249763
8.16
118.7
Cantabria
18.08
18022
1.68
116.1
Castilla y Len
23.65
126887
1.52
116.7
Castilla la Mancha
26.89
77751
1.5
117.2
Catalua
35.81
285090
2.32
116.8
48.2
143514
5.11
115.3
Extremadura
27.69
45072
1.57
117.6
Galicia
22.94
86473
1.9
117.6
Comunidad de Madrid
41.58
317845
1.97
115.9
Murcia
29.35
26471
2.93
116.5
Navarra
22.07
16470
1.69
120.5
Pas Vasco
28.85
57700
1.81
117.1
La Rioja
30.85
12963
1.92
118.6
Comunidad Valenciana
Las variables que inicialmente se desean incluir en el modelo como regresores son: nmero
medio de viajeros (x1), estancia media (x2), renta(x3), variable de localizacin geogrfica
(x4), que toma el valor de 1 si la comunidad autnoma tiene zona costera y el valor 0 en
caso contrario.
El modelo terico con el que se pretende trabajar es una especificacin lineal como la
siguiente:
yt 0 1 x1t 2 x2t 3 x3t 4 x4t t
40
Curso: Econometra I
A partir de la informacin facilitada para el ltimo trimestre de 1995, realice una seleccin
de variables y un contraste de error de especificacin sobre el modelo que considere
adecuado.
Solucin:
La idea de este ejercicio es realizar una seleccin entre los posibles regresores del modelo.
Para ello se estiman modelos alternativos con distintas variables explicativas. A partir de
estas estimaciones se selecciona el modelo ms adecuado en base a los criterios habituales
de seleccin de variables. Es importante recordar que no todos los autores comparten estos
criterios de seleccin que fueron explicados anteriormente, puesto que introducen un
desgaste de datos al utilizar los mismos datos para probar diferentes modelos. Los
contrastes clsicos pierden su significatividad ya que las probabilidades serian
condicionadas a los modelos anteriormente rechazados.
Para comenzar con la seleccin de variables se estima el modelo inicialmente propuesto,
modelo no restringido (modelo inicial) y a continuacin distintos modelos alternativos en
los que se han omitido alguno o algunos de los regresores.
Los modelos considerados son los siguientes:
Y C x1 x2 x3 x4
Y C x1 x2 x4
Y C x1 x3 x4
Y C x2 x3 x4
Y C x1 x2 x3
Y C x1 x2
Y C x1 x3
Y C x1 x4
Y C x2 x3
Y C x2 x4
Y C x3 x4
Y C x1
Y C x2
Y C x3
Y C x4
Para cada uno de ellos se realiza una estimacin mnimo cuadrtica (MCO), comparando
los valores obtenidos en el coeficiente de determinacin corregidos, criterio de informacin
de Akaike y el criterio de Schwarz. Se observan tambin en estas regresiones el valor de la
suma de cuadrados de residuos que se utilizara para el clculo del criterio de Amemiya y el
valor del logaritmo de la funcin de verosimilitud para el clculo del contraste de razn de
verosimilitud.
41
Curso: Econometra I
Dependent Variable: Y
Method: Least Squares
Date: 08/10/10 Time: 11:08
Sample: 1 17
Included observations: 17
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
X1
X2
X3
X4
-181.5765
5.82E-05
3.283160
1.697576
-2.771114
198.5911
1.69E-05
0.710733
1.698589
4.396278
-0.914323
3.442665
4.619403
0.999403
-0.630332
0.3786
0.0049
0.0006
0.3373
0.5403
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.771123
0.694831
7.279629
635.9160
-54.90771
10.10747
0.000809
32.77294
13.17767
7.047965
7.293028
7.072325
2.347176
Del resultado de la estimacin se utilizaran los valores marcados en negrita para realizar la
seleccin de variables. De igual forma y como lo descrito usted puede estimar los
diferentes modelos que se menciono en la pregunta.
Luego de estimar todos los modelos, y segn los criterios explicados anteriormente, se
deduce que el modelo mas adecuado para la estimacin del grado de ocupacin hotelera es
el modelo 6, Quick/Estimate equation/ y c x1 x2, el cual se puede observar a
continuacin:
Dependent Variable: Y
Method: Least Squares
Date: 08/10/10 Time: 12:51
Sample: 1 17
Included observations: 17
Variable
C
X1
X2
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Coefficient
Std. Error
t-Statistic
Prob.
16.67247
5.08E-05
3.257840
3.004335
1.45E-05
0.672418
5.549471
3.510076
4.844963
0.0001
0.0035
0.0003
0.751692
0.716220
7.019883
689.9026
32.77294
13.17767
6.894155
7.041193
42
Curso: Econometra I
Log likelihood
F-statistic
Prob(F-statistic)
-55.60032
21.19082
0.000058
Hannan-Quinn criter.
Durbin-Watson stat
6.908771
2.440799
F-statistic
Likelihood ratio
Value
0.509375
1.385228
df
(2, 12)
2
Probability
0.6133
0.5003
t-statistic
F-statistic
Likelihood ratio
Value
0.117411
0.013785
0.018017
df
13
(1, 13)
1
Probability
0.9083
0.9083
0.8932
Coefficient
Std. Error
t-Statistic
Prob.
16.80535
3.315255
5.069097
0.0002
43
Curso: Econometra I
X1
X2
FITTED^2
4.00E-05
2.414243
0.003134
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.751955
0.694714
7.281018
689.1718
-55.59131
13.13663
0.000312
9.32E-05
7.218797
0.026697
0.428962
0.334438
0.117411
0.6750
0.7434
0.9083
32.77294
13.17767
7.010743
7.206793
7.030230
2.420164
Se puede observar como la nueva variable incluida presenta la una probabilidad superior al nivel de significacin
considerado (5%), por lo que se considera que no es relevante en el modelo estimado. Por lo tanto, el modelo parece
presentar un buen comportamiento en cuanto a su especificacin. Utilizando cualquiera de los criterios anteriormente
comentados se puede observar como el modelo 6 es el mas aceptable. En este modelo se considerad el grado de
ocupacin hotelera (y)en funcin del numero medio de viajeros (x1) y del a estancia media (x2) a travs de la siguiente
estimacin mnimo cuadrtica:
Y
16.6724718112
5.07729318039e-05*X1
3.25784026566*X2
2.2.3
Donde bwght es el peso al nacer del bebe, faminc es la renta familiar y cigs mide el consumo
de tabaco de la madre.
44
Curso: Econometra I
Es probable que cigs y faminc estn correlacionadas? Explicar por que la correlacion
puede ser positiva o negativa
Estimar ahora una ecuacin con y sin faminc, utilizando los datos de jose3.wf.
Presentar los resultados en forma de ecuacin, incluyendo el tamao de la muestra
y el R-cuadrado ajustado. Comentar los resultados, centrndose en si el aadir
faminc cambia de manera sustancial el efecto estimado de cigs sobre bwght.
Solucin:
En la pregunta mencionan que una renta ms alta se traduce generalmente en un mejor
acceso a los cuidados prenatales, as como en una mejor alimentacin de la madre,
ocasionando que el peso del nacer del bebe aumente, por lo tanto a simple vista al parecer
dicho coeficiente tiene signo positivo.
Por otro lado es probable que cigs y faminc estn correlacionadas, debido a que cuando
aumenta la renta familiar, existe un aumento en la capacidad adquisitiva de la madre,
pudiendo gastar dicho dinero en compras de cigarrillo o tabaco u otras cosas, as que puede
haber una correlacin entre estas variables. Esto se puede escribiendo en la lnea de
comandos corr cigs faminc, se obtiene los siguientes resultados:
CIGS
FAMINC
CIGS
FAMINC
1.000000
-0.173045
-0.173045
1.000000
Al parecer hay una correlacin negativa baja entre el ingreso familiar y el consumo de
tabaco de la madre. Ahora estimamos una ecuacin con y sin faminc, los resultados son:
Dependent Variable: BWGHT
Method: Least Squares
Date: 08/12/10 Time: 21:26
Sample: 1 1388
Included observations: 1388
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
CIGS
FAMINC
116.9741
-0.463408
0.092765
1.048984
0.091577
0.029188
111.5118
-5.060315
3.178195
0.0000
0.0000
0.0015
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.029805
0.028404
20.06282
557485.5
-6130.414
21.27392
0.000000
118.6996
20.35396
8.837772
8.849089
8.842005
1.921690
45
Curso: Econometra I
Sample: 1 1388
Included observations: 1388
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
CIGS
119.7719
-0.513772
0.572341
0.090491
209.2668
-5.677609
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.022729
0.022024
20.12858
561551.3
-6135.457
32.23524
0.000000
118.6996
20.35396
8.843598
8.851142
8.846420
1.924390
Si
bien
en
ambos
modelos
estimados,
uno
con
la
variable
faminc y otro sin faminc son ambos significativos, al comparar y escoger un modelo, el
primero tienen un mayor R2 ajustado (aunque bajo) y adems tiene un menor schwarz. Por
lo tanto el mejor modelo es el primero incluyendo la variable renta familiar.
2.2.4
x1
x2
x3
1980
40.96
110.11
112.7
2.15
1981
35.58
109.36
110.24
2.45
1982
36.46
109.35
109.65
2.89
1983
35.82
110.83
111.96
3.49
1984
36.93
108.49
109.65
4.33
1985
40.01
112.18
115.47
5.08
1986
35.81
107.89
106.78
6.1
1987
46.88
123
133.48
7.73
1988
50.07
115.63
131.88
9.57
1989
45.81
110.94
122.83
11.12
1990
44.72
119.07
126.61
12.76
1991
42.53
117.23
120.63
13.91
1992
51.56
121.75
135.35
15.99
1993
40.04
125.76
124.05
17.91
1994
48.07
124.37
133.34
20.11
1995
39.47
128.76
125.32
23.3
46
Curso: Econometra I
1996
51.45
142.61
154.19
25.3
1997
50.9
135.18
146.51
28.53
1998
64.21
136.49
158.81
31.92
1999
56.94
136.2
147.36
35.83
2000
58.06
154.39
169.23
37.45
Una vez estimado este modelo, calcule las elasticidades de la demanda de naranjas, esto es,
la elasticidad-precio, la elasticidad-ingreso y la elasticidad-cruzada con respecto al precio de
las manzanas.
Solucin:
Usando jose4.wf, se estima el modelo de demanda de naranjas siguiendo las instrucciones:
En herramientas generales seleccionamos Quick/Estimate equation/ y c x1 x2 x3 o en
la lnea de comandos escribimos EQUATION EQ01.LS y c x1 x2 x3
La funcin de demanda que resulta de la estimacin anterior puede escribirse como sigue:
Y = 34.1762879794 - 0.775928596947*X1 + 0.784462656639*X2 + 0.307780896207*X3
Antes de proceder al clculo de las elasticidades pedidas, conviene recordar que estas se
expresan, en cada punto de la funcin de demanda, la variacin porcentual de la cantidad
demandada de un producto frente a variaciones porcentuales unitarias del precio del propio
producto, de la renta o del precio de otro producto. Analticamente puede calcularse como:
xy
i
x
y xi
i i
xi y
y
47
Curso: Econometra I
xy1
y x1
x1
1
x1 y
y
xy3
y x3
x3
3
x3 y
y
@mean(y)
=45.346
xy3 0.1028
Luego un aumento de la renta en 1% provocara un incremento del 0.1% de la cantidad
demandada de naranjas. El signo obtenido para esta elasticidad indica que se trata de un
bien normal.
Elasticidad-cruzada de la demanda de naranjas con respecto al precio de las
manzanas
Siguiendo la misma metodologa, en este caso:
xy2
y x2
x2
2
x2 y
y
48
Curso: Econometra I
@mean(x2)
=128.859
@mean(y)
=45.346
xy2 2.2288
Por tanto, a partir de la informacin disponible puede afirmarse que un incremento del
precio de manzanas en 1% provocara un incremento del 2.22% de la cantidad demanda de
naranjas. Se trata, por tanto, de bienes sustitutos.
Una forma alternativa de obtener las elasticidades de una funcin de demanda consiste en
estimar una transformacin doblemente logartmica de dicha funcin. En el caso que nos
ocupa este modelo es:
Lyt o 1Lx1 2 Lx2 3 Lx3 ut
2.2.5
Solucin:
Utilizando jose5.wf, estimamos por MCO la funcin de costos que se necesita, en primer
lugar, generamos las potencias cuadradas y cubicas de Y que se incluyen como regresores
49
Curso: Econometra I
Coefficient
Std. Error
t-Statistic
Prob.
C
YI
Y2
Y3
174.7825
30.49810
-5.084017
0.748526
18.98125
11.56052
2.089334
0.115654
9.208165
2.638124
-2.433319
6.472105
0.0000
0.0139
0.0221
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.997657
0.997386
7.594006
1499.392
-101.2424
3689.580
0.000000
357.0312
148.5356
7.016161
7.202988
7.075929
1.453636
Por tanto, el modelo estimado para esta funcin de costos resultara ser el siguiente:
CTI = 174.782515206 + 30.4980985818*YI - 5.08401653356*Y2 + 0.748525860467*Y3
Con estos resultados pueden generarse las variables costos marginales (cmg), costos
medios (cme) y costos variables medios (cvme) relativas a esta funcin de produccin.
Instrucciones: Genr/
o
/
50
Curso: Econometra I
800
700
CTI
600
500
400
300
200
0
10
12
YI
CMG
100
80
60
40
20
0
0
10
12
YI
51
Curso: Econometra I
CME
100
90
80
70
60
50
0
10
12
YI
CVME
45
40
35
30
25
20
0
10
12
YI
La curva de oferta de una empresa competitiva viene dada por el tramo de su curva de
costos marginales que se encuentra por encima de los costos variables medios. El cierre de
las empresas se producir, por tanto, cuando sus ingresos no cubran los costos variables
medios, aunque los beneficios de las empresas no son positivos hasta que no alcanzan un
nivel de produccin tal que su costo medio supera a su costo marginal. Para ver cul es el
punto de cierre se analizan las variables cvme, cmg y que nivel de produccin se alcanza
cuando se da la igualdad (aproximada) entre estas.
Para ello, en primer lugar, es necesario ordenar los datos de forma creciente en funcin de
la produccin; el comando que nos permite realizar dicha operacin es sort. La utilizacin
de este comando ordenara los datos de todas las variables segn sentido creciente de la
52
Curso: Econometra I
variable especificada, por lo que para poder reordenar posteriormente los datos en el orden
original se debe crear previamente una variable tendencia (t=0,1,2,3,).
Instrucciones: Genr/ t=@trend(1)
En la lnea de comando escribir primero: sort yi, luego show cti yi cmg cvme cme
obs
CTI
YI
CMG
CVME
CME
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
231.6288
214.9501
231.0902
224.9952
232.5102
239.0219
237.9734
242.6670
247.7566
243.7987
249.1614
259.5556
272.6811
279.5434
291.0340
297.9801
307.8361
316.2933
345.7123
404.1607
392.8819
428.8959
441.4836
465.0450
494.8002
519.9197
527.7194
616.7535
716.3884
736.6997
1.82
2.02
2.55
2.63
2.72
2.80
2.93
3.00
3.41
3.43
3.45
3.72
4.12
4.53
4.91
5.17
5.53
5.75
5.91
6.91
7.02
7.47
7.52
7.82
8.20
8.53
8.60
9.32
10.01
10.01
19.43053
19.12153
19.17148
19.28861
19.45473
19.63293
19.98382
20.20420
21.93691
22.04074
22.14637
23.74822
26.72313
30.51818
34.70967
37.95119
42.94066
46.27632
48.83878
67.45905
69.78147
79.84814
81.02280
88.30654
98.11286
107.1550
109.1359
130.7883
153.7232
153.7232
23.72461
23.28267
22.40115
22.30461
22.20747
22.13130
22.02795
21.98278
21.86554
21.86625
21.86757
21.94396
22.25773
22.82793
23.58111
24.22101
25.27408
26.01314
26.59615
31.10823
31.69596
34.28891
34.59573
36.51524
39.14004
41.59485
42.13653
48.13382
54.60946
54.60946
119.7590
109.8087
90.94331
88.76184
86.46574
84.55362
81.68069
80.24362
73.12141
72.82326
72.52917
68.92850
64.68067
61.41126
59.17837
58.02807
56.88032
56.41010
56.17018
56.40237
56.59375
57.68684
57.83809
58.86595
60.45498
62.08518
62.46008
66.88731
72.07025
72.07025
53
Curso: Econometra I
CAPITULO 3
MODELOS DE REGRESION CON VARIABLES
DUMMY
3.1 RESUMEN TEORICO
Las variables dummy (variables ficticias) se incluyen en el modelo bsicamente por tres
razones:
1 4 .
Donde, 4 refleja la magnitud del impacto del terremoto en el modelo. El signo de 4
indicara el sentido el impacto, positivo o negativo.
54
Curso: Econometra I
2 4 .
Donde 4 refleja la magnitud del impacto adicional del terremoto del 2007 en la pendiente
de la variable x2 . El signo de 4 indicara el sentido del impacto, positivo o negativo.
Cambios en el intercepto y en las pendientes:
Utilizando el ejemplo anterior, supongamos que el terremoto ha provocado cambios
nicamente en el intercepto y en la pendiente de la variable x2 . De modo que si no ocurre
el terremoto, D=0, el modelo es Yi 1 2 x2i 3 x3i ui , pero, si ocurre el fenmeno
del nio, D=1, el modelo es: Yi 1 2 x2i 3 x3i 4 Di 5 Di x2i ui .
Donde 4 refleja la magnitud del impacto adicional del terremoto en el intercepto del
modelo y 5 mide el cambio en la pendiente de la variable x2 . El signo de 4 y 5
indicar el sentido del impacto, positivo o negativo, en el intercepto y en la pendiente.
Precauciones en el uso de variables dummy:
1. Si una variable cualitativa tiene m categoras, solo hay que agregar (m-1)
variables dicotmicas. Si por ejemplo la variable cualitativa regin tiene tres
categoras, se introducen solo dos variables dicotmicas. Si no se respeta esta
regla, se provocara lo que se conoce como trampa de la variable dictoma.
2. La categora a la cual no se le asigna la variable dicotmica se conoce como
categora base, de comparacin, de control.
3. El valor de la interseccin representa el valor medio de la categora de
comparacin.
4. Los coeficientes anexos a las variables dictomas se conocen como coeficientes
de la interseccin diferencial, debido a que indican en que medida el valor de la
interseccin que se le asigna 1 vara del coeficiente de interseccin de la
categora de comparacin.
55
Curso: Econometra I
3.2 APLICACIONES
56
Curso: Econometra I
Genr/ AEV=DV*AE
Genr/AEM=DM*AE
Coefficient
Std. Error
t-Statistic
Prob.
75.41237
4.597165
0.208721
5.616567
0.656256
0.375814
13.42677
7.005138
0.555384
0.0000
0.0000
0.5832
C
EL
AE
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.694271
0.671625
7.361606
1463.218
-100.8761
30.65680
0.000000
108.0000
12.84657
6.925073
7.065192
6.969898
1.591648
De esta regresin se necesita la suma de cuadrados de los residuos (SCR), que toma el valor
de 1463.218 y que aparece resaltado en la estimacin anterior.
Modelo II: El gnero de los individuos afecta nicamente a los niveles autnomos del
salario.
Instrucciones: Quick/ Estimate equation/ wage dv dm el ae
Coefficient
Std. Error
t-Statistic
Prob.
57
Curso: Econometra I
DV
DM
EL
AE
82.49125
75.93863
4.689260
-0.095786
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.753742
0.725328
6.732787
1178.591
-97.63132
1.897346
5.862383
5.141099
0.601324
0.364562
14.07128
14.77090
7.798228
-0.262742
0.0000
0.0000
0.0000
0.7948
108.0000
12.84657
6.775421
6.962248
6.835189
Modelo III: El salario de los individuos est influenciado, tanto en sus niveles como en los
coeficientes asociados al gnero.
La estimacin de este modelo puede hacerse por dos vas alternativas. Por una parte,
podran estimarse dos regresiones por separado, una correspondiente a los varones
(observaciones 1 al 15) y otra correspondiente a las mujeres (observaciones 16 al 30). Por
otra parte, podra estimarse el modelo de forma conjunta, de acuerdo con la especificacin
del modelo III.
En el primer caso hay que estimar dos regresiones. Las instrucciones a seguir en la primera
de ellas son:
Instrucciones: Quick/ Estimate equation/ wage c el ae/sample 1 15
Coefficient
Std. Error
t-Statistic
Prob.
C
EL
AE
102.6836
5.555483
-1.742571
3.866359
0.346729
0.252336
26.55821
16.02257
-6.905747
0.0000
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.955502
0.948086
3.365734
135.9380
-37.81519
128.8379
0.000000
111.9333
14.77192
5.442026
5.583636
5.440517
2.204288
58
Curso: Econometra I
Coefficient
Std. Error
t-Statistic
Prob.
63.02514
2.843575
1.768156
1.215491
0.183090
0.080357
51.85160
15.53100
22.00366
0.0000
0.0000
0.0000
C
EL
AE
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.990356
0.988749
1.009037
12.21788
-19.74545
616.1703
0.000000
104.0667
9.512899
3.032727
3.174337
3.031219
2.256287
La SCR del modelo III se obtiene como suma de las SCR de las dos estimaciones
anteriores. Para ello debe ejecutarse, en la lnea de comandos, la siguiente operacin:
= 135.9380+ 12.21788=148.1559
En el segundo caso, si se estima de forma conjunta el modelo, las instrucciones a seguir
son:
Instrucciones: Quick/ Estimate equation/ wage dv elv aev dm elm aem
Coefficient
Std. Error
t-Statistic
Prob.
DV
ELV
AEV
DM
ELM
AEM
102.6836
5.555483
-1.742571
63.02514
2.843575
1.768156
2.854146
0.255955
0.186275
2.992942
0.450829
0.197867
35.97699
21.70492
-9.354846
21.05792
6.307436
8.936107
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.969044
0.962595
2.484585
148.1559
-66.52417
2.232038
108.0000
12.84657
4.834945
5.115184
4.924596
59
Curso: Econometra I
Puede comprobarse que la SRCIII obtenida en esta estimacin coincide con la suma de las
SCR de las regresiones anteriores. Asimismo, el valor de las estimaciones de los
parmetros coincide en un caso y en el otro.
Modelo IV: El gnero de los individuos afecta a los salarios a travs de las variables aos de
estudio y experiencia laboral.
Instrucciones: Quick/ Estimate equation/ wage c elv elm aev aem
Dependent Variable: WAGE
Method: Least Squares
Date: 08/15/10 Time: 16:08
Sample: 1 30
Included observations: 30
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
ELV
ELM
AEV
AEM
83.79523
5.906663
1.035201
-0.750007
1.122215
4.448393
0.545567
0.881904
0.333535
0.400682
18.83719
10.82666
1.173826
-2.248662
2.800762
0.0000
0.0000
0.2515
0.0336
0.0097
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.850436
0.826506
5.350932
715.8119
-90.15146
35.53821
0.000000
108.0000
12.84657
6.343430
6.576963
6.418140
1.762148
Una vez estimadas las regresiones se cuenta con la informacin necesaria para analizar la
estabilidad de los parmetros. En este sentido se plantean los contrastes de hiptesis que
permiten verificar dicha estabilidad.
a) Contraste para verificar la estabilidad total del modelo:
Ho : v m
H1 : v m
H o : v m
H1 : v m
Ho : v m
H1 : v m
Fexp
SCRI SCRIII
3
SCRIII
30 6
F243
60
Curso: Econometra I
A continuacin y para poder tomar una decisin acerca del contraste planteado, se calcula
la probabilidad a la derecha del estadstico experimental. Para ello, en la lnea de comandos
se ejecuta.
=@FDIST(71.009637,3,24)=4.45512441626E-12
Como esta probabilidad es menor de 0.05, que es el nivel de significacin elegido, el
estadstico experimental est situado en la regin de rechazo de la hiptesis nula, es decir,
existe diferencia entre los salarios de los varones y las mujeres.
b) Contraste para verificar la igualdad de ordenadas suponiendo igualdad en los
coeficientes.
Ho : v m
H1 : v m
H o : v m
Ho : v m
H1 : v m
H1 : v m
Fexp
SCRI SCRII
1
SCRII
30 4
F261
H o : v m
H1 : v m
Ho : v m
H1 : v m
Ho : v m
Fexp
SCRII SCRIII
2
SCRIII
30 6
H1 : v m
F242
61
Curso: Econometra I
Obsrvese que al incluir el termino independiente solo se considera una ficticia por
modalidad, DV1, AEV y ELV a fin de evitar la trampa de las ficticias o dictomas.
En este modelo se contempla la posibilidad de existencia de diferencias salariales entre
varones y mujeres, tanto en la ordenada en el origen como en los aos de estudio y
experiencia laboral tomando como individuo de referencia a las mujeres. Para estimar este
modelo las instrucciones a ejecutar son:
Instrucciones: Quick/ Estimate equation/ wage c dv ae aev el elv
Dependent Variable: WAGE
Method: Least Squares
Date: 08/15/10 Time: 16:59
Sample: 1 30
Included observations: 30
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
DV
AE
AEV
EL
ELV
63.02514
39.65845
1.768156
-3.510727
2.843575
2.711908
2.992942
4.135680
0.197867
0.271752
0.450829
0.518420
21.05792
9.589341
8.936107
-12.91884
6.307436
5.231097
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.969044
0.962595
2.484585
148.1559
-66.52417
150.2583
0.000000
108.0000
12.84657
4.834945
5.115184
4.924596
2.232038
62
Curso: Econometra I
Value
df
Probability
71.00961
213.0288
(3, 24)
3
0.0000
0.0000
Value
Std. Err.
39.65845
-3.510727
2.711908
4.135680
0.271752
0.518420
Este resultado permite comprobar, una vez ms, que si existen diferencias significativas en
los salaries por el hecho de ser varn o mujer, es decir, una vez contrastados los posibles
efectos diferenciales de las variables se comprueba que se rechaza la hiptesis nula, es decir,
que estos regresores si son significativos o relevantes en la explicacin del salario.
63
Curso: Econometra I
CAPITULO 4
PERTURBACIONES NO ESFERICAS:
HETEROSCEDASTICIDAD Y AUTOCORRELACION
Estas condiciones (que son parte de los supuestos del modelo lineal general) asumen que el
trmino de error o perturbacin puede resumirse en:
cov( xiui ) 0 (lo cual implica que las variables explicativas son no estocsticas).
E ( ') 2 I n
Cuando se cumplen estas dos condiciones se dice que los errores son esfricos. La
violacin del segundo supuesto da origen al problema de heteroscedasticidad e implica
que la varianza del trmino de error no es constante para cada observacin. Por otro lado,
si los elementos fuera de la diagonal de la matriz de varianzas y covarianzas de los errores
son distintos de cero, se viola el tercer supuesto y como resultado tendremos el problema
de autocorrelacin. Este problema significa que los trminos de error no son
independientes, es decir, el tamao del error para un periodo determinado afecta el valor
del periodo u observacin siguiente.
En general, a partir de la discusin anterior nos queda la impresin de que estos problemas
no deberan existir porque van a afectar las propiedades del estimador de mnimos
cuadrados ordinarios. De hecho, sabemos que si no se cumplen las condiciones de Gauss-
64
Curso: Econometra I
4.2 HETEROSCEDASTICIDAD
65
Curso: Econometra I
PIB
Arequipa
Piura
Chiclayo
Trujillo
Iquitos
Huancavelica
Hunuco
La Libertad
Lima
Ayacucho
Junn
Lambayeque
Cusco
Ica
Amazonas
Cajamarca
Puno
Ancash
6895665
1747221
1338540
1150586
1830265
660038
2980371
1846983
9511088
4949357
963305
2752518
7935591
1240645
840372
3251025
384298
135876
EMPLEO
1834.1
412.3
351.2
252.9
446.4
162.3
841.6
528.3
2222.9
1276.7
302.6
1012.8
1636
317
183.9
708.5
90.3
29.7
Mtodo grafico
Test de Golfeld-Quandt
Test de Breusch-Pagan
Test de White
Solucin
Primero abrimos el workfile llamado ht1.wf1, ahora para el anlisis de la
heteroscedasticidad es necesario estimar el modelo por MCO y obtener una serie de
residuos mnimo cuadrticos que se utilizaran para la realizacin de algunos test de
heteroscedasticidad.
Instrucciones: Quick/Estimate equation/ pib c empleo
Dependent Variable: PIB
Method: Least Squares
Date: 08/29/10 Time: 15:27
66
Curso: Econometra I
Sample: 1 18
Included observations: 18
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
EMPLEO
-118413.4
4167.111
187797.8
199.5353
-0.630536
20.88407
0.5372
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.964613
0.962401
532101.5
4.53E+12
-261.8035
436.1445
0.000000
2800764.
2744155.
29.31150
29.41043
29.32514
2.513420
Instrucciones: Genr
empleo2=empleo^2
r=resid;
Genr
r2=r^2;
Genr
absr=abs(r);
Genr
En primer lugar, se realiza la representacin grafica del producto interno bruto frente a la
variable empleo. Esta representacin permite observar que a niveles bajos de PIB existe
pequea variabilidad en la ocupacin y, sin embargo, la dispersin aumenta a medida que lo
hace el PIB.
Instrucciones: Quick/graph/ empleo pib /scatter
10,000,000
8,000,000
PIB
6,000,000
4,000,000
2,000,000
0
0
400
800
1,200
1,600
2,000
2,400
EMPLEO
67
Curso: Econometra I
En segundo lugar, se puede analizar tambin de forma grafica la relacin existente entre los
residuos y la variable explicativa: a valores elevados de la variable empleo le corresponden
valores tambin elevados de los residuos.
Instrucciones: Quick/graph/ empleo r /scatter
1,500,000
1,000,000
500,000
-500,000
-1,000,000
-1,500,000
0
400
800
1,200
1,600
2,000
2,400
EMPLEO
1.6E+12
R2
1.2E+12
8.0E+11
4.0E+11
0.0E+00
0
400
800
1,200
1,600
2,000
2,400
EMPLEO
b) Test de Goldfeld-Quandt
68
Curso: Econometra I
Fexp
SCR2
)/2 k
F((nncc)/2
k
SCR1
Este test requiere ordenar de forma ascendente todas las variables segn el orden
creciente de la variable que se supone causante de la heteroscedasticidad, variable
empleo. Para ello se dispone de un comando que las ordena automticamente, pero
como este es el nico test que lo requiere es necesario generar una serie de tendencia
que permita recolocar las series en su posicin original.
Instrucciones: Genr/ t=@trend(1)
La nueva serie toma valores correlativos empezando por el cero. Servir para reordenar
todas las variables una vez realizado el contraste. A continuacin, se procede a la
recolocacin de todas las variables segn el orden creciente de la variable que se supone
causa la heteroscedasticidad.
Instrucciones: Procs/Sort current page /empleo/ascending o sort empleo
Se obtienen dos submuestras con las primeras (n-c)/2 observaciones y las (n-c)/2
ltimas observaciones (normalmente c=n/3) y se ajustan dos regresiones por separado
para cada submuestra.
Instrucciones: Quick/ estimate equation / pib c empleo/ smpl 1 6
Coefficient
Std. Error
t-Statistic
Prob.
88887.67
3524.664
121839.2
629.5643
0.729549
5.598576
0.5061
0.0050
0.886827
0.858533
141817.5
8.04E+10
-78.47101
31.34406
0.004997
689079.2
377053.5
26.82367
26.75426
26.54580
1.844886
69
Curso: Econometra I
Coefficient
Std. Error
t-Statistic
Prob.
C
EMPLEO
-1554291.
5026.047
1129850.
730.6937
-1.375661
6.878459
0.2409
0.0023
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.922047
0.902559
854712.9
2.92E+12
-89.24836
47.31320
0.002341
5837432.
2738103.
30.41612
30.34671
30.13825
2.709093
70
Curso: Econometra I
Coefficient
Std. Error
t-Statistic
Prob.
C
EMPLEO
-0.023796
0.001461
0.683299
0.000726
-0.034825
2.013069
0.9727
0.0612
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.202092
0.152223
1.936041
59.97209
-36.37246
4.052445
0.061249
1.000025
2.102683
4.263607
4.362537
4.277248
1.119032
71
Curso: Econometra I
d) Test de White
3.698591
5.944912
9.806474
Prob. F(2,15)
Prob. Chi-Square(2)
Prob. Chi-Square(2)
0.0495
0.0512
0.0074
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 08/29/10 Time: 18:59
Sample: 1 18
Included observations: 18
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
EMPLEO
EMPLEO^2
-3.03E+11
1.44E+09
-512657.3
2.39E+11
6.56E+08
302565.4
-1.266662
2.195207
-1.694368
0.2246
0.0443
0.1109
R-squared
Adjusted R-squared
0.330273
0.240976
2.52E+11
5.29E+11
72
Curso: Econometra I
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
56.70234
56.85073
56.72280
1.230263
Correccin de la Heteroscedasticidad
De las regresiones anteriores se tiene aquella que, teniendo el coeficiente de regresin
significativamente distinto de cero, presente un coeficiente de determinacin mayor. Su
correspondiente variable explicativa da una idea de la forma de la Heteroscedasticidad.
Para solucionar el problema de la heteroscedasticidad, vemos que la varianza de la variable aleatoria
es proporcional a la raz cuadrada de la variable empleo, es decir la variable rempleo. De ello se
deduce:
rempleo * I
1 rempleo 1 * I
P ' P 1
P rempleo 1 * I rempleo 1/2 * I
Donde P es la matriz de transformacin, el cual servir para que la varianza sea homoscedastica, e I
es la matriz identidad.
Una vez conocida la matriz de transformacin, se puede premultiplicar el modelo y aplicar MCO al
modelo transformado. La variable aleatoria de perturbacin del modelo transformado, ya cumple
las especificaciones del modelo de regresin lineal clsico, y adems, los estimadores obtenidos son
los estimadores por MCG factibles. Se necesita en primer lugar generar esa matriz de
transformacin:
GENR / Rempleo =SQR (empleo)
GENR /R4empleo =SQR (Rempleo)
GENR/ IR4empleo=1/R4empleo
e) Estimacin por mnimos cuadrados ponderados
73
Curso: Econometra I
Coefficient
Std. Error
t-Statistic
Prob.
C
EMPLEO
-36343.78
4070.215
120156.1
184.8007
-0.302471
22.02489
0.7662
0.0000
Weighted Statistics
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.968070
0.966074
403036.6
2.60E+12
-256.8029
485.0958
0.000000
2218625.
1693343.
28.75588
28.85481
28.76952
2.473158
1690105.
2.048964
5.491868
8.897817
Prob. F(3,14)
Prob. Chi-Square(3)
Prob. Chi-Square(3)
0.1532
0.1391
0.0307
Test Equation:
Dependent Variable: WGT_RESID^2
Method: Least Squares
Date: 08/29/10 Time: 19:54
Sample: 1 18
Included observations: 18
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
WGT^2
EMPLEO^2*WGT^2
EMPLEO*WGT^2
-1.24E+12
2.81E+11
-720392.7
3.05E+09
8.15E+11
2.29E+11
501102.1
1.73E+09
-1.519519
1.227975
-1.437616
1.763590
0.1509
0.2397
0.1725
0.0996
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
0.305104
0.156197
2.76E+11
1.07E+24
-497.4903
2.048964
1.44E+11
3.01E+11
55.72114
55.91900
55.74843
1.323239
74
Curso: Econometra I
Prob(F-statistic)
La probabilidad que deja ala derecha del estadstico indica que no se puede rechazar la
hiptesis nula de varianza constante en toda la muestra, es decir, el modelo transformado
ya es homoscedastico.
4.3 AUTOCORRELACION
La tercera condicin de Gauss-Markov implica que el trmino de error para cada
observacin se determina independientemente de los valores que pueda arrojar en el resto
de observaciones de la muestra. Especficamente, la independencia de las perturbaciones
implica que su covarianza es cero (Cov (uiuj) = 0 para todo i j ). Cuando esta condicin
no se cumple se dice que el error presenta autocorrelacin. Los problemas asociados a la
presencia de autocorrelacin son similares a los que enfrentamos cuando los errores son
heteroscedsticos.
Los estimadores MCO se mantienen insesgados pero dejan de ser eficientes. Esto implica
que la varianza aumenta por lo que la volatilidad de los estimadores aumenta. Sin embargo,
en trminos de la estimacin en la prctica ocurre lo contrario. Dado que los programas
economtricos utilizan el estimador MCO, lo que ocurre es que calculan la varianza
siguiendo la frmula tradicional de MCO la cual nos da desviaciones estndar menores. Por
tanto, stas son usualmente subestimadas lo que conduce a una sobreestimacin de los
estadsticos-t y a problemas de inferencia dado que nuestras conclusiones seran errneas.
Con referencia al problema asociado a la eficiencia de los estimadores MCO, y al igual que
para el caso de heterocedasticidad, basta encontrar otro procedimiento para la estimacin
de los parmetros que arroje estimadores de menor varianza para descartar la eficiencia de
los estimadores MCO. En este sentido, y como alternativa a la estimacin MCO, la
estimacin por mnimos cuadrados generalizados arroja estimadores ms eficientes en el
sentido de presentar una menor varianza.
75
Curso: Econometra I
PIBPM
CP
1985
28200885
4498034
1986
32323992
4740221
1987
36143972
5159905
1988
40158739
5368137
1989
45044128
5813462
1990
50145195
6197776
1991
54927320
6543696
1992
59104986
6808095
1993
60952584
6971511
1994
64811535
6948140
1995
69780058
7074014
1996
73743261
7141101
1997
77896586
7239097
f)
Analisis graficos
Test de Durbin-Watson
Correlograma
Tets de Breusch-Godfrey
Sobre esta misma informacin, se propone especificar una nueva forma estableciendo una
relacin lineal del consumo pblico a partir del PIBPM y de un retardo del CP como
factores explicativos. Bajo esta formulacin, pruebe la presencia de autocorrelacin en las
perturbaciones.
En caso de detectar problemas de autocorrelacin, obtenga una estimacin MELI para los
parmetros del modelo.
Coefficient
Std. Error
t-Statistic
Prob.
C
PIBPM
3079706.
0.058374
237829.5
0.004282
12.94922
13.63260
0.0000
0.0000
76
Curso: Econometra I
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.944119
0.939039
239828.9
6.33E+11
-178.4002
185.8479
0.000000
6192553.
971351.1
27.75388
27.84079
27.73601
0.343122
400,000
300,000
E(-1)
200,000
100,000
0
-100,000
-200,000
-300,000
-400,000
-200,000
0 100,000
300,000
77
Curso: Econometra I
E
400,000
300,000
200,000
100,000
0
-100,000
-200,000
-300,000
-400,000
85
86
87
88
89
90
91
92
93
94
95
96
97
b) Test de Durbin-Watson
0.343122
78
Curso: Econometra I
Para este caso se ira seleccionando progresivamente 1,2, rezagos, hasta que el contraste
de significacin individual del ultimo retardo se situe en la regin de no rechazo de la
hiptesis nula.
Instrucciones: View/residual diagnostics/ serial correlation LM test/1 lags
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
Obs*R-squared
18.71771
8.473176
Prob. F(1,10)
Prob. Chi-Square(1)
0.0015
0.0036
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 08/29/10 Time: 21:12
Sample: 1985 1997
Included observations: 13
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
PIBPM
RESID(-1)
149133.7
-0.003342
0.974886
151175.4
0.002760
0.225334
0.986495
-1.210686
4.326396
0.3472
0.2539
0.0015
79
Curso: Econometra I
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
1.79E-11
229618.7
26.85279
26.98317
26.82600
1.278439
E-views ofrece tanto una salida del resultado final como la salida al completo de la
regresin auxiliar de los residuos de MCO en funcin de los regresores del modelo y de los
retardos elegidos de los mismos.
En esta primera opcin, se observa que el estadstico experimental para este test es:
n.R2=8.473176, con una probabilidad asociada de 0.0036 <0.05, que hace situarse a dicho
estadstico en regin critica y, por tanto, se rechaza la hiptesis de no autocorrelacin a un
95% de confianza. El test es dado por lo siguiente:
H0: no existe autocorrelacion
H1: existe autocorrelacion de orden p
2
X exp
n.R 2 X p2
10.11549
8.997396
Prob. F(2,9)
Prob. Chi-Square(2)
0.0050
0.0111
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 08/29/10 Time: 21:14
Sample: 1985 1997
Included observations: 13
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
80
Curso: Econometra I
C
PIBPM
RESID(-1)
RESID(-2)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
167332.3
0.003186
0.315142
0.394440
0.407994
-0.493088
3.859431
-1.085692
0.6928
0.6338
0.0039
0.3058
1.79E-11
229618.7
26.88357
27.05740
26.84784
1.956964
Al igual que ocurria en el caso anterior, el estadsticos del test de Breusch-Godfrey tiene
una probabilidad asociada de 0.0111<0.05, por tanto se rechaza la hiptesis nula, es decir
existe autocorrelacin. Por otro lado la probabilidad asociada al t experimental es de 0.3058
> 0.05, nose puede rechazar la hiptesis nula, por tanto este segundo rezago ya no es
significativo en el comportamiento de los residuos minimo cuadrticos. La conclusin de
este test es que existe autocorrelacin en las perturbaciones y que es de orden 1.
e) La especificacin alternativa propuesta en este apartado se formaliza mediante la siguiente
ecuacin:
Coefficient
Std. Error
t-Statistic
Prob.
C
PIBPM
CP(-1)
780684.3
-0.002714
0.934178
466190.2
0.010880
0.169258
1.674605
-0.249441
5.519250
0.1283
0.8086
0.0004
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.984426
0.980965
119205.9
1.28E+11
-155.5645
284.4366
0.000000
6333763.
864007.5
26.42741
26.54864
26.38253
1.618970
81
Curso: Econometra I
Test de h de Durbin
H0 : 0
No existe autocorrelacion
H1 : 0 1
n
AN (0,1)
1 n * var(b1)
La obtencin de los valores necesarios para construir el estadstico se realiza desde la salida de
regresin del modelo estimador por MCO:
r= 1-d/2 =1-1.618970/2=0.190515
var(b3)=(0.169258)2=0.028648271
h 0.190515*
12
0.808436
1 12*0.028648271
El estadstico teorico sigue una distribucin asinttica normal (0,1) que al 95% de confianza, en
contrastes de una sola cola es: ht=1,645, por tanto no se rechaza la hipotests nula.
Analisis con el test de Breusch-Godfrey
0.107581
0.159231
Prob. F(1,8)
Prob. Chi-Square(1)
0.7513
0.6899
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 08/29/10 Time: 21:15
Sample: 1986 1997
Included observations: 12
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
PIBPM
CP(-1)
RESID(-1)
98455.69
0.002360
-0.037549
0.136888
575638.5
0.013534
0.211913
0.417347
0.171037
0.174365
-0.177189
0.327996
0.8684
0.8659
0.8638
0.7513
82
Curso: Econometra I
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
6.98E-10
107825.8
26.58072
26.74235
26.52087
1.891146
Coefficient
Std. Error
t-Statistic
Prob.
C
PIBPM
AR(1)
5643278.
0.024402
0.839764
2788228.
0.029292
0.118191
2.023966
0.833054
7.105174
0.0736
0.4264
0.0001
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.984800
0.981422
117764.8
1.25E+11
-155.4185
291.5510
0.000000
Inverted AR Roots
.84
6333763.
864007.5
26.40308
26.52431
26.35820
1.484904
Esta estimacin muestra los resultados de la repeticin 12 veces del proceso de C-O para
83
Curso: Econometra I
conseguir la convergencia. Cabe destacar que la variable pibpm pasa a ser no significativa,
mientras que el proceso autorregresivo es significativo, con una probabilidad asociada de
0.0001.
El correlograma de los residuos de esta estimacin corrobora el diagnostico de bueno
comportamiento de la perturbacin:
Instrucciones: view/residual diagnostics/correlogram Q-statistic/10 lags
Cuando se acepta esta hiptesis se esta indicando que los residuos no estn
autocorrelacionados. En el presente acso, dado que la probabilidad es superior a 0.05 nos
indica que se ha corregido la autocorrelacin, ya que los residuos del nuevo modelo no la
presentan.
84
Curso: Econometra I
CAPITULO 5
MULTICOLINEALIDAD
5.1 RESUMEN TEORICO
La colinealidad est referida a la existencia de una sola relacin lineal entre las variables
explicativas y, por lo tanto, la multicolinealidad se refiere a la existencia de ms de una
relacin lineal. Es importante anotar que la multicolinealidad se refiere slo a relaciones
lineales entre las variables independientes y no a cualquier otro tipo de relacin, as pues, si
xi = xj2, entonces no existir multicolinealidad en el modelo. El problema de la
multicolinealidad est definido por el alto grado de intercorrelacin entre variables
explicativas. Dentro de las violaciones de los supuestos del modelo lineal general, la
multicolinealidad es un problema de grado y noterico como la heterocedasticidad o la
autocorrelacin, ms an, los estimadores obtenidos bajo multicolinealidad, conservan las
propiedades que los define como MELI.
Una cuestin importante que debe analizarse al estudiar los resultados de un modelo de
regresin es el grado de relacin lineal existente entre las observaciones de las variables
explicativas. A este respecto, las posibles situaciones son tres:
Multicolinealidad perfecta: se da cuando existe una relacin lineal exacta entre algunos o
todos los regresiores incluidos en el modelo.
Ortogonalidad: Supone la ausencia de relacin lineal entre algunos o todos los regresores
incluidos en el modelo (raramente ocurre esto).
Multicolinealidad imperfecta: consiste en la existencia de una relacin lineal fuerte entre los
regresores del modelo.
5.2 CONSECUENCIAS
Sensibilidad de los estimadores y sus errores estndar ante pequeos cambios en la muestra.
85
Curso: Econometra I
5.3 CORRECCION
Suprimir variables
Utilizacion de informacin adicional
Utilizacion de primeras diferencias
Empleo de cocientes o ratios entre las variables
Aumentar el tamao de muestra
No hacer nada
5.4 APLICACIONES
Ejercicio. Se dispone alguna informacin sobre ingresos de exportacin (inex), el
consumo (cons), los gastos de personal (gper) y los gastos de explotacin (gex) relativos al
sector de metalurgia y fabricacin de productos metalicos para algunos departamentos del
Per.
obs
Departamentos
INEX
CONS
GPER
GEX
Arequipa
302565
180236
51189
274346
Piura
107689
51850
27642
100310
Chiclayo
348540
165985
75735
330602
Trujillo
14619
7991
3813
13253
Iquitos
17812
8693
5356
16000
Huancavelica
117007
59046
30838
115951
Huanuco
134899
75042
30844
126969
La Libertad
74856
43100
17484
70744
Lima
761142
389019
193713
708598
10
Ayacucho
241131
118762
60946
225651
11
Junin
14817
7806
4242
13773
12
Lambayeque
186509
92236
43276
176606
13
Cusco
337445
194993
82411
323954
14
Ica
64181
36941
12675
59007
15
Amazonas
170364
102965
38456
168279
16
Cajamarca
1051196
568539
254043
1037175
17
Puno
50517
28624
10255
46462
86
Curso: Econometra I
Coefficient
Std. Error
t-Statistic
Prob.
C
CONS
GPER
GEX
3729.609
0.392848
0.663397
0.648393
3240.869
0.276641
0.415687
0.218018
1.150805
1.420067
1.595907
2.974033
0.2705
0.1791
0.1345
0.0108
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.998971
0.998734
9949.564
1.29E+09
-178.3315
1.589402
235017.0
279592.1
21.45077
21.64682
4207.203
0.000000
Deteccion de la colinealidad
a) Significacion global y significacin individual de los regresores
En primer lugar, puede observarse que se trata de un modelo globalmente bien estimado.
El estadstico F nos indica que las variables conjuntamente son significativas. Por otra
parte, el valor del coeficiente de determinacin R2 es elevado (0.998971) y al analizar la
significacin individual de las variables explicativas se puede comprobar que las variables
cons y gper no son significativas en la explicacin de los ingresos de explotacin. Cuando
estas dos caractersticas se presentan de forma simultanea (R2 y variables no significativas
individualmente), como ocurre en este caso, puede sospecharse acerca de la presencia de
colinealidad en el modelo.
b) Analisis de la matriz de correlaciones de los regresores
CONS
GPER
GEX
CONS
GPER
GEX
1.000000
0.990380
0.997769
0.990380
1.000000
0.995341
0.997769
0.995341
1.000000
87
Curso: Econometra I
Coefficient
Std. Error
t-Statistic
Prob.
C
GPER
GEX
2079.209
-0.639877
0.709049
3081.281
0.363360
0.091938
0.674787
-1.760998
7.712272
0.5108
0.1001
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.996352
0.995831
9612.225
1.29E+09
-178.3751
1.937222
125401.6
148861.9
21.33824
21.48528
1911.709
0.000000
88
Curso: Econometra I
Coefficient
Std. Error
t-Statistic
Prob.
C
CONS
GEX
-182.0407
-0.283398
0.407116
2083.114
0.160930
0.088371
-0.087389
-1.760998
4.606894
0.9316
0.1001
0.0004
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.992389
0.991302
6396.967
5.73E+08
-171.4525
1.812016
55465.76
68591.10
20.52382
20.67086
912.7659
0.000000
Coefficient
Std. Error
t-Statistic
Prob.
C
CONS
GPER
-1270.813
1.141627
1.480014
3958.333
0.148027
0.321261
-0.321048
7.712272
4.606894
0.7529
0.0000
0.0004
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.998229
0.997976
12196.85
2.08E+09
-182.4235
2.131833
223981.2
271088.6
21.81453
21.96157
3945.000
0.000000
89
Curso: Econometra I
toman estos coeficientes de determinacin son inferiores, pero muy prximos al de la regresin
inicial (0.998971), puede considerarse que, aunque no a un nivel preocupante, si existe colinealidad
entre los regresores del modelo.
d) Correccion de la colinealidad
Coefficient
Std. Error
t-Statistic
Prob.
C
CONSC
GPERC
GEXC
1.466301
-0.257027
-1.220936
1.379961
0.280286
0.142161
0.321050
0.132546
5.231453
-1.808005
-3.802943
10.41122
0.0002
0.0938
0.0022
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.997072
0.996397
0.241909
0.760758
2.284594
2.149958
12.37447
4.029936
0.201812
0.397863
1475.769
0.000000
90
Curso: Econometra I
Coefficient
Std. Error
t-Statistic
Prob.
C
GPERC
GEXC
1.154356
-0.795770
1.155360
0.238115
0.235620
0.049824
4.847894
-3.377348
23.18861
0.0003
0.0045
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.996336
0.995813
0.260775
0.952053
0.378003
1.713325
12.37447
4.029936
0.308470
0.455508
1903.527
0.000000
91