Você está na página 1de 22

Modelo

de regresin
lineal mltiple:
especificacin, estimacin y contraste

Toms del Barrio Castro


Miquel Clar Lpez
Jordi Suriach Caralt

PO1/85014/00170
FUOC P01/85014/00170 Modelo de regresin lineal mltiple

ndice

Introduccin .............................................................................................. 5

Objetivos...................................................................................................... 7

1. Introduccin a la econometra........................................................ 9
1.1. Qu es la econometra? ................................................................... 9
1.2. Variables, relaciones y parmetros.................................................... 10
1.3. La modelizacin economtrica. Fases de la investigacin
economtrica..................................................................................... 12
1.4. Objetivos de la modelizacin economtrica .................................... 14

2. El modelo de regresin lineal mltiple estndar ....................... 16


2.1. Especificacin.................................................................................... 16
2.2. Hiptesis bsicas del modelo de regresin lineal
mltiple estndar .............................................................................. 19
2.2.1. Hiptesis generales del modelo .............................................. 19
2.2.2. Hiptesis sobre el trmino de perturbacin ........................... 20
2.2.3. Hiptesis sobre las variables explicativas del modelo............ 23
2.2.4. Hiptesis sobre los parmetros del modelo............................ 23
2.3. Estimacin para mnimos cuadrados ordinarios (MCO) ................. 23
2.3.1. Descripcin del mtodo de estimacin .................................. 24
2.3.2. Propiedades de los estimadores MCO de los j ...................... 28
2.4. Anlisis de los residuos y estimacin de u2 ..................................... 32
2.4.1. Propiedades de los residuos .................................................... 33
2.4.2. Estimacin de la varianza del trmino de perturbacin........ 35
2.5. Estimacin por mxima verosimilitud ............................................. 38
2.6. Medidas de la bondad del ajuste ...................................................... 40
2.7. Significacin de los parmetros del modelo .................................... 43
2.7.1 Significacin econmica.......................................................... 44
2.7.2 Significacin estadstica........................................................... 45
2.8. El modelo de regresin lineal mltiple en desviaciones
respecto a la media ........................................................................... 48
2.9. Prediccin.......................................................................................... 49
2.9.1. Prediccin puntual.................................................................. 50
2.9.2. Prediccin por intervalo ......................................................... 50

3. El modelo de regresin con restricciones lineales...................... 53


3.1. Contrastacin de restricciones lineales ............................................ 53
3.1.1. Formulacin matricial de las restricciones lineales................ 54
3.1.2. Metodologa para contrastar restricciones lineales:
estadstico de prueba .............................................................. 55
3.1.3. Un mtodo alternativo para contrastar restricciones
lineales .................................................................................... 58
FUOC P01/85014/00170 Modelo de regresin lineal mltiple

3.2. Estimacin restringida por mnimos cuadrados (MCR)................... 63


3.2.1. El estimador de mnimos cuadrados restringidos .................. 63
3.2.2. Propiedades del estimador restringido ................................... 64
3.2.3. Un ejemplo aclaratorio ........................................................... 65
3.3. Anlisis de la permanencia estructural. Contraste de Chow ........... 70
3.3.1. Introduccin ........................................................................... 70
3.2.2. Contraste de Chow de permanencia estructural.................... 71
3.3.3. Un caso particular: tamao insuficiente de una
de las submuestras .................................................................. 73
3.3.4. Limitaciones del contraste de Chow ...................................... 73 UW01/85014/00174
WEB
Encontraris otras actividades,
Glosario ....................................................................................................... 77 los ejercicios de
autoevaluacin y el
solucionario en la web de esta
asignatura.
Bibliografa ................................................................................................ 79
FUOC P01/85014/00170 5 Modelo de regresin lineal mltiple

Introduccin

Este mdulo didctico est formado por los tres apartados siguientes:

1) El primero es una introduccin que nos permitir ponernos en contacto


con los aspectos relacionados con la econometra. En concreto, veremos cu-
les son los fundamentos de la econometra, sus objetivos, qu tipo de pro-
blemas nos permite solucionar, y pondremos de manifiesto las relaciones que
tiene con otros mbitos de la economa.

2) En el segundo apartado introduciremos el modelo de regresin mltiple Veris aspectos avanzados de


!
los contenidos de esta introduccin
(MRLM), que ser la base de todos los aspectos que trataremos a lo largo de esta en la asignatura Econometra.

asignatura y de su continuacin. En concreto, veremos los contenidos siguientes:

a) La formulacin del MRLM.

b) Las hiptesis bsicas relativas al comportamiento de las diferentes partes


que lo integran: las variables (endgena y explicativas), los parmetros y el
trmino de perturbacin.

c) La estimacin de los parmetros desconocidos del modelo por los mto-


dos de mnimos cuadrados ordinarios (MCO) y mxima verosimilitud (MV).

d) Las propiedades de los estimadores cuando se cumplen las hiptesis bsicas.

e) Las medidas que nos permitirn cuantificar la bondad del ajuste y evaluar
el modelo.

f) La manera de obtener predicciones una vez que el modelo ya se ha for-


mulado, estimado y validado.

3) El tercer y ltimo apartado de este mdulo lo dedicaremos a estudiar los


aspectos relacionados con la contrastacin de restricciones lineales. Es en
este apartado, pues, donde presentaremos las herramientas que necesitare-
mos para contrastar hiptesis que se puedan formular sobre el comporta-
miento de los parmetros. En concreto, veremos los puntos siguientes:

a) Los tipos de restricciones lineales que podremos contrastar.

b) La manera de formularlos matricialmente.

c) Los estadsticos de prueba adecuados para comprobar si las hiptesis for-


muladas sobre los parmetros de la poblacin en forma de restricciones line-
ales se pueden considerar ciertas en el mbito de la poblacin o no.
FUOC P01/85014/00170 6 Modelo de regresin lineal mltiple

d) Los contrastes de significacin individual y global de parmetros que se


estudian en el segundo apartado, que no son ms que casos particulares de
los contrastes de restricciones lineales.

e) Los estimadores restringidos (aquellos que hacemos que cumplan las res-
tricciones lineales planteadas) y sus propiedades.

f) La manera de contrastar la permanencia estructural del modelo.


FUOC P01/85014/00170 7 Modelo de regresin lineal mltiple

Objetivos

Una vez trabajados los contenidos de este mdulo didctico, los estudiantes
tenis que ser capaces de:

1. Conocer las hiptesis bsicas que debe cumplir el modelo de regresin


mltiple que denominaremos modelo estndar.

2. Obtener los estimadores de mnimos cuadrados ordinarios y de mxima


verosimilitud de los parmetros desconocidos del modelo de regresin
mltiple, y conocer las propiedades que tienen cuando se cumplen las
hiptesis bsicas.

3. Cuantificar la bondad del ajuste del modelo.

4. Determinar cul de las variables exgenas contribuye ms a explicar el


comportamiento de la variable endgena, y contrastar la significacin
individual de un parmetro y la global del modelo.

5. Obtener la prediccin puntual y por intervalo de la variable endgena.

6. Expresar restricciones lineales matricialmente.

7. Poder contrastar cualquier restriccin lineal homognea de igualdad median-


te mtodos distintos.

8. Obtener los estimadores restringidos y conocer sus propiedades tanto si


partimos de la hiptesis de que las restricciones lineales planteadas son
ciertas como si partimos de que no lo son.

9. Saber cmo contrastar la permanencia estructural de los parmetros del


modelo.
FUOC P01/85014/00170 9 Modelo de regresin lineal mltiple

1. Introduccin a la econometra

El objetivo de este apartado es presentar las bases sobre las cuales se asienta la
metodologa economtrica. Por ello, en primer lugar, despus de una pequea
introduccin sobre cuestiones como, por ejemplo, el origen de la econometra y
qu es la econometra, presentamos toda una serie de conceptos bsicos y, cuan-
do nos hayamos familiarizado con ellos, abordaremos el cuerpo central del
mdulo: la modelizacin economtrica. Con esta finalidad, explicamos las dife-
rentes etapas que hay que seguir en todo estudio economtrico. Para acabar, pre-
sentamos los objetivos que se pueden alcanzar con un estudio de este tipo.

1.1. Qu es la econometra?

El nacimiento de la econometra, del mismo modo que otras disciplinas del


mbito de la ciencia econmica, se produce ante la necesidad de resolver toda
una serie de problemas con la informacin econmica existente. Esta apari-
cin se basa en el desarrollo de determinadas tcnicas que facilitan el anlisis
cuantificado de las relaciones econmicas.

El objetivo que persigue la econometra es encontrar y cuantificar las


relaciones econmicas empleando tcnicas basadas en los mtodos
inferenciales de la estadstica.

En concreto, en el nacimiento de la econometra confluyeron muchos facto-


res, entre los cuales destaca el planteamiento distinto que exista, durante las
dcadas de los aos veinte y treinta, del estudio de los ciclos econmicos. En
estos aos apareci un grupo de economistas preocupados por la colabora-
cin entre matemticos, estadsticos y economistas. Crean que la introduc-
cin de los mtodos matemticos en la investigacin, en las ciencias sociales Algunos
de los economistas
en general y en la economa en particular, permitira avanzar en su desarro-
llo. Adems, criticaban la no-consideracin de la teora econmica en los preocupados por la
colaboracin entre
modelos explicativos de los ciclos econmicos. Las aportaciones de estos matemticos, estadsticos y
economistas eran personajes
autores constituyeron el antecedente del anlisis econmico propuesto por la como R. Frisch, J. Tinbergen,
Comisin Cowles y por T. Haavelmo (1944), basado en el enfoque probabi- K. Pearson y J. Slutskij, entre
otros.
lstico que hay en las interrelaciones econmicas.

En la literatura podemos encontrar definiciones distintas de la econometra. Cmo se puede definir


la econometra?
Entre ellas, podemos destacar las dos siguientes:

1) Anlisis cuantitativo de los fenmenos econmicos reales, basado en el desarrollo


simultneo de la teora y la observacin que se relacionan mediante los mtodos de infe-
rencia adecuados.

P.A. Samuelson; T.C. Koopmans; M.H. Stone (1954).


FUOC P01/85014/00170 10 Modelo de regresin lineal mltiple

2) Rama de la economa relacionada con la estimacin emprica de las relaciones


econmicas. Emplea la teora econmica, incorporada en un modelo economtrico,
hechos, resumidos en datos, y estadstica terica, adecuada por las tcnicas econo-
mtricas para medir y contrastar empricamente determinadas relaciones entre varia-
bles econmicas, dando contenido emprico al razonamiento econmico.

M.D. Intrilligator (1978).

Atendiendo a todo lo que hemos dicho con anterioridad, podemos


sealar que los rasgos ms relevantes que caracterizan la econometra
son los siguientes: T.C. Koopmans, autor del manual
Econometric Theory (1992)

a) La econometra es la rama de la ciencia econmica que se ocupa del


anlisis cuantitativo de los fenmenos econmicos.

b) La econometra est relacionada con otras disciplinas como, por


ejemplo, la teora econmica, la estadstica y las matemticas.

c) La econometra se basa en un enfoque probabilstico de la realidad.

1.2. Variables, relaciones y parmetros

En todo modelo se distinguen dos tipos de variables: la variable endgena


(tambin llamada variable dependiente o variable que se debe explicar) y las varia-
bles explicativas (o variables independientes o variables exgenas).

La variable endgena es aquella cuyo comportamiento queremos


conocer y explicar. Las variables explicativas son aquellas que, de
acuerdo con los postulados de la teora econmica, permiten explicar
el comportamiento de la variable endgena. Dependiendo del nme-
ro de variables explicativas que se introducen, una o ms, el modelo se
denominar modelo simple o modelo mltiple.

As, por ejemplo, siguiendo el modelo keynesiano consumo-renta, el consu- Consultad el modelo keynesiano
!
consumo-renta en la asignatura
mo de los individuos depende de (se explica por) la renta de cada uno de Macroeconoma.

ellos. Por tanto, en este modelo, la variable endgena (aquello que queremos
conocer y explicar) es el consumo de los individuos, y la variable explicativa
(aquello que permite explicarlo) es la renta de los individuos. Se trata, pues,
de un modelo simple. Si partimos de la hiptesis de que, adems de la renta
de los individuos, el nmero de hijos tambin permite explicar las pautas de
comportamiento del consumo, tendremos dos variables explicativas y, por
tanto, estaremos ante un modelo mltiple.
FUOC P01/85014/00170 11 Modelo de regresin lineal mltiple

Ejemplo ilustrativo de un modelo simple y de un modelo mltiple

Con el fin de ilustrar un modelo simple utilizaremos la funcin keynesiana de consumo.


sta estipula que el consumo Ci de las unidades domsticas depende de su renta Yi.
Supongamos que en nuestro modelo simple la dependencia es lineal:

Ci 5 1 Yi .

La funcin anterior, tal y como se puede ver, es determinista. Nos dice, por ejemplo,
que para un nivel de renta Y1 el consumo ser C1 y que para un nivel de renta Y2 el
consumo ser C2.

Si tenemos en cuenta que el nmero de hijos Ni tambin permite explicar el consu-


mo, entonces tendremos un modelo mltiple, que puede ser el siguiente:

Ci 5 1 Yi 1 Ni .

Entre la variable endgena y las variables explicativas* existe, de acuerdo * De ahora en adelante
supondremos que trabajamos
con lo que hemos comentado en el prrafo anterior, una relacin de cau- con un modelo mltiple.
salidad que se caracteriza por el hecho de ser unidireccional: los compor-
tamientos de las variables explicativas causan (determinan, explican) el de
La relacin entre
la variable endgena. Precisamente la existencia de esta relacin de causa-
lidad es la que permite formular un modelo. No obstante, esta relacin que la variable endgena y las
variables explicativas no es
se establece entre las variables del modelo puede ser de muchos tipos: line- lineal o linealizable en todos
los casos. A veces, nos
al, cuadrtica, exponencial, logartmica, etc. En consecuencia, en el momen- encontraremos ante modelos
to de especificar el modelo hay que determinar (tambin de acuerdo con los no lineales, que tambin se
podran estudiar, pero que
postulados de la teora econmica) la forma funcional que adopta la rela- quedan fuera de los objetivos
de este material didctico.
cin entre la variable endgena y las explicativas. De todos modos, en el
mbito del modelo que estudiaremos supondremos que la relacin es line-
al y que, si no lo es, se puede linealizar mediante una transformacin ade-
cuada.

Adicionalmente, en todo modelo aparecen lo que denominaremos parme-


tros. Los parmetros, que estn asociados a cada variable explicativa, cuan-
tifican la relacin existente entre la variable endgena y cada una de las
variables explicativas. Son, por tanto, lo que se desconoce y se debe estimar.
FUOC P01/85014/00170 12 Modelo de regresin lineal mltiple

1.3. La modelizacin economtrica.


Fases de la investigacin economtrica

La econometra es la rama de la economa que tiene que ver con la esti-


macin emprica, con la cuantificacin de las relaciones econmicas:
a partir de los postulados que establece la teora econmica se especi-
fica un modelo economtrico, el cual, a partir de un conjunto de infor-
La modelizacin economtrica
macin estadstica (datos), se estima empleando tcnicas estadsticas y presenta tres fases: la especificacin, la
estimacin y el contraste.
economtricas con el fin de medir y contrastar empricamente deter-
minadas relaciones entre variables econmicas.
Las tcnicas
economtricas

no slo estn limitadas


En el cuadro siguiente presentamos grficamente en qu consiste el enfoque al mundo economicoempre-
sarial. Por el contrario, tam-
economtrico. Como podemos observar, de acuerdo con lo que hemos dicho bin son susceptibles de apli-
cacin no slo a otros campos
anteriormente, hay dos pilares bsicos que constituyen las materias primas en de las ciencias sociales (como
cualquier estudio economtrico: la teora y los hechos. la sociologa, la historia, etc.),
sino tambin
a otros mbitos (como la
educacin, la sanidad,
el medio ambiente, etc.).

Fuente: M.D. Intrilligator (1978, pg. 3)

1) El primer pilar, la teora, permite derivar un modelo (el modelo econmi-


co), que sintetiza la incgnita relevante sobre el fenmeno (la variable end-
gena) objeto de anlisis y del cual deriva el modelo economtrico que permi-
te medirlo y contrastarlo empricamente.
FUOC P01/85014/00170 13 Modelo de regresin lineal mltiple

Ejemplo de modelo econmico

Un ejemplo de aplicacin de un modelo sera tener el objetivo de explicar el comporta-


miento de la variable endgena cantidad demandada de un producto, Qi. La teora
econmica propondra el conjunto de variables que la explican a partir de las hiptesis
de competencia perfecta, oligopolio, etc. A partir, pues, de la teora econmica se podra
proponer un modelo econmico concreto que sintetizara la teora:

Q i 5 (Pi ,Pi ),

donde Pi sera el precio del bien y Pi , el precio de los productos sustitutivos. A partir de Consultad cmo se puede especificar
!
este modelo se podra especificar un modelo economtrico. un modelo economtrico en el
subapartado 2.1 de este mdulo didctico.

2) El otro pilar bsico, los hechos (sucesos del mundo real referidos al fen-
Ejemplos de tipos
meno que se investiga), se concreta en una serie de datos que pueden ser de de datos
corte transversal, si hacen referencia a distintos individuos en el mismo ins- Las observaciones (datos)
tante de tiempo, o de serie temporal, si se observan durante un periodo de correspondientes a las ventas
de un conjunto de empresas
tiempo determinado. referidas a un mismo periodo
(ao, trimestre, etc.)
constituyen un conjunto
Para garantizar la calidad de los datos es necesario, a veces, someterlos a un de datos de corte transversal.
Por otro lado, las ventas de
tratamiento previo (deflacin, enlace, interpolacin de datos ausentes, obten- una empresa realizadas, por
ejemplo, desde 1960 hasta
cin de la tendencia de la serie, etc.). Saber de qu informacin estadstica se 1997 constituyen una serie
dispone (de qu variables se tiene informacin) tambin condiciona el mode- temporal.

lo que se pueda proponer como idneo.

Una vez que se especifica el modelo y se dispone de la informacin estadsti-


ca convenientemente tratada, se llega a la etapa siguiente del trabajo econo-
mtrico: la etapa de estimacin. En esta etapa se requiere utilizar toda una
serie de tcnicas economtricas que, en general, puede decirse que son exten-
siones de los mtodos clsicos de estimacin empleados en cursos bsicos de
estadstica. El output de esta etapa de estimacin permite medir y contrastar Recordad las estimaciones del modelo
!
de regresin simple, que se han estudiado
en la asignatura Estadstica I.
las relaciones sugeridas por la teora econmica.

1.4. Objetivos de la modelizacin economtrica

En la literatura economtrica existe un consenso bastante generalizado en Consultad los objetivos de


!
la modelizacin economtrica
fijar como objetivos de la modelizacin economtrica el anlisis estructural, en el cuadro del subapartado 1.3
de este mdulo didctico.
la prediccin y la evaluacin de polticas. De todos modos, hay que tener pre-
sente que estos tres objetivos no son excluyentes entre s; por el contrario, un
estudio economtrico puede tener uno o dos de ellos o incluso los tres. Obser-
vad en qu consiste cada uno de estos objetivos: !
1) El anlisis estructural consiste en medir cuantitativamente las relaciones
econmicas entre las variables incluidas en el modelo. Asimismo, facilita la
comparacin de teoras rivales sobre un mismo fenmeno.

2) La prediccin no es ms que obtener los valores que determinadas varia-


bles tomarn fuera de la muestra. As pues, las predicciones son (pueden ser)
de gran utilidad para emprender determinadas acciones.
FUOC P01/85014/00170 14 Modelo de regresin lineal mltiple

3) La evaluacin de polticas es el uso de los modelos economtricos para


seleccionar entre polticas alternativas. En concreto, una posibilidad a menu-
do empleada por los policymakers (directores de la poltica econmica de una
empresa, de un estado, etc.) consiste en simular polticas alternativas y hacer
predicciones condicionadas a futuros valores de las variables explicativas rele-
vantes en cada alternativa.

Por ltimo, no queremos finalizar este apartado sin poner de manifiesto la


potencialidad del uso de los mtodos economtricos en el mundo empresa-
rial. Esto se debe a que los empresarios tienen que tomar sus decisiones en un
entorno de incertidumbre. Sin duda, cualquier mtodo que permita reducirla
favorecer esta tarea o, como mnimo, permitir llevarla a trmino con ms
elementos de juicio.

Pensad, por ejemplo, en un empresario que tiene dos alternativas: aumentar


su produccin en el prximo ejercicio o mantenerla en los niveles actuales.
Evidentemente, su experiencia puede resultar un elemento que se debe con-
siderar, pero basar su decisin final nicamente en este factor puede ser insu-
ficiente. Por lo tanto, si realiza un anlisis que le permita conocer el compor-
tamiento de su variable de inters (las ventas), podr tomar una decisin con
ms argumentos. Para hacerlo, puede especificar un modelo y plantear dis-
tintas hiptesis sobre el comportamiento que experimentarn las ventas de su
producto en el prximo ejercicio.
FUOC P01/85014/00170 15 Modelo de regresin lineal mltiple

2. El modelo de regresin lineal mltiple estndar

En este apartado estudiaremos la especificacin de un modelo de regresin * A partir de aqu abreviaremos


modelo de regresin lineal mltiple
lineal mltiple* estndar. Presentaremos las hiptesis bsicas y, a partir de usando la sigla MRLM.
stas, analizaremos los mtodos adecuados de estimacin de los parmetros
del modelo. A continuacin, se realizarn los contrastes estadsticos de signi-
ficacin de los parmetros y, finalmente, se estudiar la manera de llevar a
cabo predicciones una vez que ya se ha estimado el modelo.

2.1. Especificacin

En este apartado analizaremos un modelo de regresin que, tal como indica


el ttulo, presenta dos caractersticas importantes: !
1) Se trata de un modelo de regresin mltiple, lo cual supone que el com-
portamiento de una determinada variable, que denominaremos variable end-
gena, variable dependiente o variable que se debe explicar y que representaremos
con la letra Y, es causado y, por tanto, puede ser explicado adecuadamente, por
un conjunto de k variables que denominaremos explicativas (independientes o
exgenas) y que, en general, representaremos mediante la letra X. Es decir:

Y 5 (X1,X2,X3, ... ,Xk ). (2.1)

Es importante destacar que existe una relacin de causalidad unidireccional


entre las variables explicativas y la endgena, y no al revs; es decir, la varia-
ble Y es una funcin de las variables X1, , Xk.

Y 5 (X1,X2,X3, ... ,Xk ).


(2.2)

2) La segunda caracterstica del modelo de regresin que estudiaremos se refie-


re a la linealidad. Esto quiere decir que la relacin que hipotticamente existe
entre la variable endgena y las k explicativas es de tipo lineal; por lo tanto,
podemos expresar la variable dependiente como combinacin lineal de las
variables explicativas. Aunque no es estrictamente necesario, normalmente
especificaremos el MRLM incluyendo en las variables explicativas un trmino
independiente. As, a menudo se considera que la variable X1 es una constante
igual a la unidad:

X1 5 1. Como norma general


supondremos siempre que X1 5 1.

Por lo tanto, el MRLM queda del modo siguiente:

Y 5 1 1 2X2 1 3X3 1 ... 1 k Xk, (2.3)


FUOC P01/85014/00170 16 Modelo de regresin lineal mltiple

donde 1, 2, ..., k son los parmetros que supondremos constantes para el


conjunto de la muestra de datos analizada. Estos parmetros nos permitirn
medir la intensidad que tienen de media los efectos de las variaciones de las
variables explicativas sobre la variable endgena. Esta interpretacin de los
parmetros j, j 5 1, ..., k es inmediata si se toman derivadas parciales de la
variable endgena respecto a cada una de las variables explicativas:

Y
5 j ;j 5 2, ..., k. (2.4)
Xj

La relacin entre la variable endgena Y y las variables explicativas X, tal Observad la linealidad en los ejemplos
!
de modelo simple y modelo mltiple
como ya se ha visto hasta ahora, es determinista, es decir, no es aleatoria. No en el subapartado 1.2 de este mdulo
didctico.
obstante, en la realidad, no se cumple casi nunca que las relaciones entre las
variables econmicas sean de este tipo, sino que las relaciones de dependen-
cia tienen un cierto grado de aleatoriedad. Recordemos la funcin keynesia-
na de consumo, que estipula que el consumo de las unidades domsticas
depende de su renta:

Ci 5 1 Yi.

La funcin anterior es determinista, pero si preguntsemos a un conjunto


de agentes econmicos sobre sus niveles de renta y los recursos que desti-
nan al consumo, nos hallaramos con una situacin como la del grfico
siguiente:

Relacin funcional real


renta-consumo

El grfico nos dice que hay


otros condicionantes en la
decisin de consumo de los
agentes econmicos que no
quedan reflejados en la renta.
Esto se ve en el hecho de
que los puntos tienen una
determinada incertidumbre:
no se encuentran
exactamente sobre la recta,
sino que se sitan en algn
punto ms o menos prximo
a la recta.

En consecuencia, es necesario incluir algn trmino en el modelo de regre-


sin que capte esta aleatoriedad, ya que un modelo determinista no puede
explicar totalmente el comportamiento de la variable endgena. As, en un
modelo de regresin se introduce el trmino de perturbacin para recoger:

* Los regresores son las variables


a) Todas las dems variables que explican el comportamiento de la variable explicativas que se utilizan para
especificar el modelo.
endgena pero que no han quedado explicitadas como regresores*. Muchas
FUOC P01/85014/00170 17 Modelo de regresin lineal mltiple

de estas variables pueden ser pequeos factores de los cuales no se dispone de


datos, y se supone que su efecto conjunto sobre la variable endgena es nulo.

b) Un segundo factor contenido en el trmino de perturbacin es el mismo


comportamiento aleatorio que hay en la conducta humana en particular, y
en las relaciones econmicas y sociales en general.

c) El tercer factor lo constituyen los errores de medida en las variables inclui- * Los errores en la ecuacin
se pueden deber a una mala
das en el modelo y los errores en la ecuacin*. especificacin del modelo.

Pues bien, este trmino que incorporaremos se conoce con el nombre de tr-
mino de perturbacin y lo representaremos con la letra u.

Por lo tanto, cuando introducimos este trmino, el MRLM queda de la mane-


ra siguiente:
Y 5 1 1 2X2 1 3X3 1 ... 1 k Xk 1 u.
(2.5)

Parte determinista Parte aleatoria

Como ya hemos explicado, el trmino de perturbacin incorpora el efecto


conjunto de otras variables o comportamientos no explicitados en el mode-
lo, para los cuales su efecto individual no resulta relevante. Por tanto, el tr- * Si el trmino de perturbacin
fuese observable, se tratara
mino de perturbacin no es realmente observable*, por lo cual tendremos que como una variable explicativa
del modelo.
establecer una serie de hiptesis sobre su comportamiento. !
Nuestro objetivo es asignar valores numricos a los parmetros 1, 2, 3, ...,
k. Es decir, pretendemos estimar el modelo de manera que, al combinar los
valores de las estimaciones de los parmetros y los valores observados de las
variables explicativas, obtengamos unos valores de la variable endgena tan
cercanos a los valores reales observados de Y como sea posible.

Para poder hacer la estimacin, se debe disponer de un conjunto de observa-


ciones para cada una de las variables observables implicadas en el modelo, es
decir, para la variable endgena Y y para las k variables explicativas. Deno-
minaremos a las observaciones valores muestrales. Cuando trabajamos con
datos de corte transversal, empleamos el subndice i, mientras que, cuando
trabajamos con datos de serie temporal, utilizamos el subndice t. As pues,
podemos expresar el modelo del modo siguiente:

Corte transversal:

Yi 5 1 1 2X2i 1 3 X3i 1 ... 1 k Xki 1 ui i 5 1, 2, 3, ..., N.


(2.6)
Serie temporal:

Yi 5 1 1 2X2t 1 3X3t 1 ... 1 k Xkt 1 ut t 5 1, 2, 3, ..., T.


FUOC P01/85014/00170 18 Modelo de regresin lineal mltiple

Las ecuaciones anteriores expresan la relacin de dependencia entre la variable


endgena y las variables explicativas para la i-sima y la t-sima observaciones,
respectivamente. Si no se dice lo contrario, a lo largo de este mdulo supon-
dremos que, por defecto, estamos trabajando con datos de corte transversal. Si
desarrollamos esta ecuacin para los N individuos de la muestra, tendremos:

Y1 5 1 1 2X21 1 3X31 1 ... 1 j Xj1 1 ... 1 k Xk1 1 u1


Y2 5 1 1 2X22 1 3X32 1 ... 1 j Xj2 1 ... 1 k Xk2 1 u2
Y3 5 1 1 2X23 1 3X33 1 ... 1 j Xj3 1 ... 1 k Xk3 1 u3
A A A A A A A
Yi 5 1 1 2X 2i 1 3X 3i 1 ... 1 j X ji 1 ... 1 k X ki 1 ui (2.7)
A A A A A A A
YN 5 1 1 2X2N 1 3X3N 1 ... 1 j XjN 1 ... 1 k XkN 1 uN

donde, por ejemplo, Y1 representa el valor de la variable endgena para la pri-


mera observacin; Y2, el valor de la variable endgena para la segunda obser-
vacin, etc. Por lo tanto, en general, Yi es el valor de la variable endgena para
la i-sima observacin.

Xji representa el valor de la variable j-sima (j = 2, 3, , k) para la observacin


i-sima (i =1, 2, 3, , N). As, por ejemplo, X21 es el valor de la segunda varia-
ble explicativa en la primera observacin, X46 es el valor que toma la cuarta
variable explicativa para la sexta observacin, etc.

Puesto que trabajar con el sistema anterior es bastante pesado, ya que tene-
mos tantas ecuaciones como observaciones, lo expresaremos habitualmente
de manera matricial. Por lo tanto, la expresin 2.7 puede escribirse de la
manera siguiente:

Y = XB + U, (2.8)

donde Y es un vector de dimensin N, que contiene las observaciones de la


variable endgena:
Y1 1. observacin
Y2 2. observacin
Y3 3. observacin
Y5 A (2.9)
Yi i-sima observacin
A
YN N-sima observacin.

X es una matriz de dimensin N k que contiene los N valores que se han


observado para las k variables explicativas:

1 X21 X31 ... Xj1 ... Xk1


1 X22 X32 ... Xj2 ... Xk2
1 X23 X33 ... Xj3 ... Xk3
X5 A A A A A . (2.10)
1 X2i X3i ... Xji ... Xki
A A A A A
1 X2N X3N ... XjN ... XkN
FUOC P01/85014/00170 19 Modelo de regresin lineal mltiple

En la matriz anterior tenemos en cada columna las observaciones de la varia-


Observad que las dimensiones
ble explicativa correspondiente. Por ejemplo, en la primera columna est el de las matrices son las adecuadas
para realizar las operaciones.
trmino independiente; en la segunda columna, los valores de la variable X2,
etc. Por filas, tenemos las observaciones de cada individuo, correspondientes
a las k variables explicativas.

B es un vector de dimensin k, que contiene los k parmetros del modelo de


regresin:
1 1.er parmetro
2 2. parmetro
3 3.er parmetro
B5 A A
(2.11)
j j-simo parmetro
A A
k k-simo parmetro.

U es un vector de dimensin N, que contiene los N trminos de perturbacin,


asociados a cada una de las ecuaciones:

u1 1. observacin
u2 2. observacin
u3 3. observacin
U5 A A (2.12)
ui i-sima observacin
A A
uN N-sima observacin.

Hasta ahora, hemos especificado o formulado el modelo. A continuacin,


estudiaremos las hiptesis bsicas del MRLM.

2.2. Hiptesis bsicas del modelo de regresin lineal


mltiple estndar

En el MRLM que ya hemos formulado, es necesario que hagamos un conjun- Consultad la formulacin del MRLM
!
en el subapartado 2.1 de este mdulo
to de hiptesis bsicas para poder determinar las propiedades de los estima- didctico.

dores surgidos como resultado de la aplicacin de mtodos distintos de esti-


macin y el tipo de contraste que hay que realizar para saber la significacin
de los parmetros. Estudiaremos los cuatro grupos de hiptesis siguientes: las
hiptesis generales del MRLM, las hiptesis sobre el trmino de perturbacin,
las hiptesis sobre las variables explicativas del modelo, y las hiptesis sobre
los parmetros del modelo.

2.2.1. Hiptesis generales del modelo

Este conjunto de hiptesis se refiere al conjunto del modelo y, de hecho, ya Consultad la introduccin de las hiptesis
!
generales del modelo en el subapartado
se ha mencionado. Lo vemos a continuacin: 2.1 de este mdulo didctico.

1) El MRLM es estocstico, y la relacin de dependencia entre la variable end-


gena y las variables explicativas es lineal. Estas hiptesis pueden parecernos cier-
FUOC P01/85014/00170 20 Modelo de regresin lineal mltiple

tamente restrictivas, pero, como veremos a continuacin, no lo son. Hay nume-


El modelo
rosas relaciones no lineales entre variables que se pueden transformar, sin exce- de Cobb-Douglas
siva dificultad, en lineales. Simplemente hay que aplicar unas transformaciones
es intrnsecamente lineal,
sencillas a las variables implicadas en el modelo. Como ejemplo podemos con- ya que se ha podido
linealizar. Otros modelos
siderar la funcin de produccin de Cobb-Douglas, en la cual slo hay que no lineales son, adems,
intrnsecamente no lineales si
tomar logaritmos neperianos para obtener una expresin lineal: no se pueden linealizar. Un
ejemplo es yi 5 1 1e2xi.
Puesto que presentan un
Q i 5 ALi1K i2 R ln(Q i ) 5 ln(A) 1 1ln(L i ) 1 2ln(K i ). mayor grado de complejidad,
este tipo de modelos queda
fuera del anlisis de este
mdulo didctico.
2) Supondremos que disponemos de informacin estadstica suficientemen-
te amplia sobre el conjunto de variables del modelo. Es un requisito mnimo
que el nmero de observaciones sea mayor o igual que el nmero de par-
metros que hay que estimar. Es decir, los grados de libertad del modelo deben
ser iguales a cero o mayores (N 2 k $ 0). Sin embargo, tal como veremos ms
adelante, es deseable que se pueda tener un nmero relativamente elevado de
observaciones, con el fin de poder disponer de los grados de libertad sufi-
Consultad en el subapartado 2.3.2
!
cientes para garantizar la fiabilidad de los resultados obtenidos en los proce- una razn para la conveniencia de
tener un nmero relativamente elevado
de observaciones.
sos de estimacin y de contraste estadstico.

2.2.2. Hiptesis sobre el trmino de perturbacin

El conjunto de hiptesis que formularemos a continuacin hace referencia al Consultad el trmino de perturbacin
!
en el subapartado 2.1 de este mdulo
didctico.
comportamiento del trmino de perturbacin, que, como ya hemos dicho antes,
es la fuente de aleatoriedad del modelo y el trmino que incluye todas aquellas
variables o aspectos que puntualmente han tenido influencia en el comporta-
miento de la variable endgena. De todas maneras, este trmino por s solo no
tiene ningn poder explicativo sobre la evolucin de la variable endgena.

A continuacin, presentamos las hiptesis sobre el trmino de perturbacin:

1) Supondremos que la esperanza matemtica de los trminos de perturba- Recordad los conceptos de esperanza
!
matemtica y de varianza de una variable
cin es cero, es decir: aleatoria, tratados en el subapartado
1.2 del modulo Clculo de probabilidades
y ampliaciones de la asignatura
Estadstica II.

E[ui] 5 0 ;i 5 1, ..., N,

o, en notacin matricial:

u1 E[u1] 0
u2 E[u2] 0
u3 E[u3] 0
E[U ] 5 A 5 A 5 A 5 0 N 1. (2.13)
ui E[ui] 0
A A A
uN E[uN] 0
FUOC P01/85014/00170 21 Modelo de regresin lineal mltiple

Lo que se supone con esta hiptesis es que, por trmino medio, el efecto con-
junto de los factores incluidos en el trmino de perturbacin es nulo. Es decir,
que los efectos puntuales de las variables que no se consideran relevantes se
compensan entre s.

Como veremos ms adelante, la hiptesis anterior se cumplir siempre que el Con referencia a la correccin
!
del modelo, consultad las hiptesis
modelo est especificado correctamente, en el sentido de que todas las varia- sobre las variables explicativas en el
subapartado 2.2.3 de este mdulo
didctico.
bles relevantes, a la hora de explicar el comportamiento de la variable end-
gena, se han incorporado a la matriz X.

2) Supondremos que el trmino de perturbacin tiene varianza constante


para todas las observaciones. Esta propiedad se llama homoscedasticidad.

VAR[ui] 5 u2 ;i 5 1, ..., N. (2.14)

El incumplimiento de esta hiptesis, es decir, el hecho de que no todos los


Nota
trminos de perturbacin tengan la misma varianza, se conoce con el nom-
Para que exista
bre de heteroscedasticidad. heteroscedasticidad basta
con que uno de los trminos
de perturbacin tenga una
3) Adems de las hiptesis que hemos hecho sobre la esperanza y la varian- varianza distinta de la del
resto.
za, tambin se establecen hiptesis sobre la covarianza entre cada dos trmi-
nos de perturbacin. Recordemos que, segn el concepto de covarianza, tene-
mos lo siguiente:

COV[ui,uj] 5 E[(ui 2 E[ui])(uj 2 E[uj])].

Por lo tanto, dado que hemos supuesto que la esperanza matemtica del tr-
mino de perturbacin es E[u] = 0, a partir de la expresin anterior obtenemos
la expresin de la covarianza e imponemos que valga cero:

COV[ui,uj] 5 E[uiuj] 5 0 ;i,j 5 1, ..., N.

As pues, se supone que no hay autocorrelacin entre los distintos trminos


de perturbacin, es decir, se da por supuesto que los trminos de perturbacin
son independientes entre s.

COV[ui,uj] 5 0 ;i,j 5 1, ..., N. (2.15)

Si el trmino de perturbacin del modelo cumple las propiedades de homos-


cedasticidad y de ausencia de autocorrelacin, se dice que es esfrico. Cuan-
do el trmino de perturbacin presenta heteroscedasticidad o est autorrela-
cionado, o ambas cosas a la vez, se dice que es no esfrico.
FUOC P01/85014/00170 22 Modelo de regresin lineal mltiple

Por otro lado, cuando el trmino de perturbacin del modelo cumple las pro-
piedades de homoscedasticidad y de ausencia de autocorrelacin, decimos
que su matriz de varianzas y covarianzas es escalar. La forma general de la
matriz de varianzas y covarianzas es la siguiente: !
VAR[u1] COV[u1,u2] COV[u1,u3] ... COV[u1,uN]
COV[u2,u1] VAR[u2] COV[u2,u3] ... COV[u2,uN]
VAR[U ] 5 COV[u3,u1] COV[u3,u2] VAR[u3] ... COV[u3,uN] .
A A A A
COV[uN,u1] COV[uN,u2] COV[uN,u3] ... VAR[uN]

Y, teniendo en cuenta las frmulas 2.14 y 2.15, obtenemos la matriz de


varianzas y covarianzas siguiente:

u2 0 0 ... 0 1 0 0 ... 0
0 u2 0 ... 0 0 1 0 ... 0
VAR[U ] 5 0 0 2 ... 0 5 u2 0 0 1 ... 0 5 u2 IN,
u
A A A A A A A A
0 0 0 ... u2 0 0 0 ... 1

donde IN indica la matriz identidad de dimensin N N.

Matriz de varianzas y covarianzas

La matriz de varianzas y covarianzas del trmino de perturbacin tiene una serie de


caractersticas que son comunes a todas las matrices de varianzas y covarianzas:

a) Se trata de una matriz cuadrada, en nuestro caso de dimensin N N.

b) Es simtrica, ya que COV[ui,uj] 5 COV[uj,ui].

c) Es una matriz definida positiva, ya que los valores de los elementos de su diagonal
son varianzas (y, por tanto, positivos) y se puede comprobar que los menores de la
matriz tambin son definidos positivos.

Una manera alternativa de resumir las propiedades de homoscedasticidad y


de ausencia de autocorrelacin del trmino de perturbacin es la siguiente:

u2 ;i 5 j i,j 5 1, ..., N.
E[ui uj] 5 { 0 ;i j i,j 5 1, ..., N.
(2.16)

4) La ltima hiptesis que formularemos respecto al comportamiento del tr-


mino de perturbacin es que cada uno de los componentes se distribuyen
segn una ley normal.

Ley de distribucin
Para finalizar con las hiptesis relativas al trmino de perturbacin, normal

podemos ver que todas son susceptibles de ser resumidas en notacin Recordad la representacin
grfica de la funcin de
matricial en la expresin siguiente: densidad de una distribucin
normal con esperanza 0
U , N(0N1,u2 IN), y varianza 2, N(0,2).

y para cada componente del vector del trmino de perturbacin:

ui , N(0,u2 ) ;i 5 1, ..., N.

Você também pode gostar