Você está na página 1de 58

Material Docente Terico de

ECONOMETRIA I
Curso 2013-2014.

Tercer curso del grado de Administracin y Direccin de


Empresas (ADE)

Profesoras:
Yolanda Gonzlez Gonzlez
Carmen Lorenzo Lago

Econometra I

Curso 2013-2014

INDICE
Tema 1.- Conceptos fundamentales ................................................................... .1
Tema 2.-Modelo de Regresin lineal normal clsico ........................................ .5
Tema 3.-Contrastes y prediccin en el modelo de Regresin lineal normal clsico.13
Tema 4.- Variables ficticias...19
Tema 5.- Evaluacin del modelo de regresin lineal clsico....27
Tema 6.- Multicolinealidad33
Tema 7.- Heteroscedasticidad ...39
Anexos...54

Econometra I

Curso 2013-2014

TEMA 1. CONCEPTOS FUNDAMENTALES


1.1 Concepto de Econometra. Modelos econmicos y modelos economtricos
En sentido literal Econometra significa medicin de la economa.
A lo largo del tiempo se han formulado diversas definiciones del concepto de Econometra.
La primera, formulada por Frisch a finales de los aos 20, defina la Econometra como la
ciencia que combina la Teora Econmica, las Matemticas y la Estadstica, con el objeto
de medir los fenmenos econmicos. Entre las ms recientes podramos quedarnos con la
de Maddala que define la Econometra como la aplicacin de mtodos estadsticos y
matemticos al anlisis de los datos econmicos, con el propsito de dar un contenido
emprico a las teoras econmicas y verificarlas o refutarlas.
Podemos considerar que los objetivos de la Econometra son:

Explicar el comportamiento de una o de varias variables econmicas en funcin de


otras.
Predecir el comportamiento de las variables econmicas.
Contrastar hiptesis de inters econmico.

Modelos Econmicos y Modelos Economtricos


Un modelo econmico es la expresin matemtica simplificada de una determinada teora
econmica.
Ejemplos:
- Si queremos especificar que la cantidad demandada de un bien depende del precio de
dicho bien, podremos formular una funcin matemtica, lineal o no, entre la cantidad
demandada y el precio. As, si la relacin es lineal la funcin de demanda ser :
Dt = + Pt.
- El consumo segn la teora keynesiana es funcin de la renta por lo que la funcin de
consumo podra expresarse: Ct = + Rt.
Estos modelos son deterministas.
Un modelo economtrico es un modelo econmico con las especificaciones necesarias para
su tratamiento emprico. As, en el ejemplo de la funcin de demanda el modelo
economtrico sera Dt = + Pt + t y en la de consumo Ct = + Rt+ t, donde t es una
variable aleatoria. Con su introduccin el fenmeno econmico se concibe como un
fenmeno aleatorio. Esta variable que llamaremos perturbacin aleatoria dota al modelo
de un mayor realismo ya que con ella aceptamos la incertidumbre existente en cualquier
comportamiento social.
Otros motivos adicionales para incorporar la perturbacin aleatoria son:
- Imposibilidad de especificar todos los factores causales que intervienen en el fenmeno.
En el ejemplo del consumo: nmero de hijos, lugar de residencia, nivel cultural, etc.
- En ocasiones, aunque conozcamos todos los factores causales, algunos no sern
cuantificables o sern de cuantificacin difcil. En el ejemplo del consumo, los gustos
constituyen un factor que influye en el consumo, pero es de difcil cuantificacin.
- Recoger los posibles errores de observacin que podramos cometer.
1

Econometra I

Curso 2013-2014

1.2 El principio de causalidad en los modelos de regresin


Sin duda alguna, las tcnicas de regresin y correlacin son tal vez las ms utilizadas en
Estadstica y su aplicacin se extiende a mltiples campos. En el caso de la Economa, estas
tcnicas son especialmente adecuadas para encontrar las funciones que se deducen de las
relaciones deterministas de la Teora Econmica. As, por ejemplo, la funcin de consumo
propuesta por J.M. Keynes en su versin ms simple es una funcin lineal creciente de la
renta disponible:
C=+RD
siendo el consumo autnomo y la propensin marginal al consumo. Obviamente la
Teora Econmica no especifica los valores de y de , que adems pueden variar en el
tiempo y en el espacio. Si nosotros disponemos de los datos de renta y consumo relativos a
un conjunto ms o menos numeroso de familias, podremos estimar la funcin de consumo,
comprobar la validez del ajuste y, si se hace desde una perspectiva terica o probabilstica,
contrastar la hiptesis de que la propensin marginal, , es positiva y menor que uno, como
propone la Teora Econmica.
El sencillo ejemplo anterior pone en evidencia la adecuacin de las tcnicas de regresin
para estimar los modelos econmicos y contrastar las hiptesis. De hecho, la Econometra
clsica se podra considerar, en cierto modo y de manera muy limitada, como la aplicacin
del anlisis de regresin a la Teora Econmica.
Ahora bien, el uso masivo del anlisis de regresin y correlacin hace que ste sea un
campo abonado para cometer demasiados abusos. Gran parte de stos estn provocados por
la extralimitacin en las interpretaciones de las relaciones detectadas en el anlisis de
correlacin y concretadas en el de regresin. Estos anlisis ponen en evidencia nicamente
relaciones de correlacin que no tienen por qu explicarse necesariamente como relaciones
de causa-efecto. Describamos tres posibles situaciones:
- Si, a partir de los datos de consumo y renta disponible de un conjunto de familias,
estimamos la funcin de consumo y obtenemos, como cabe esperar, un valor alto del
coeficiente de determinacin, la teora econmica y el sentido comn nos confirman que la
relacin detectada es una relacin de causalidad: la renta es una causa del consumo. El
anlisis de correlacin cuantifica la intensidad de esta relacin de causalidad y el anlisis
de regresin la expresa matemticamente.
- Si tomamos los datos sobre la tasa de analfabetismo y el porcentaje de hogares
que dispone de televisin referidos a distintos pases, es seguro que encontraremos una alta
correlacin negativa que nos permitir plantear un modelo que explique la primera variable
a partir de la segunda (o la segunda en funcin de la primera?). Podramos concluir de
aqu que la televisin eleva el nivel cultural de los individuos? Por supuesto, esta deduccin
sera muy arriesgada. Ms bien hay que pensar que existe una tercera variable que
podramos llamar "desarrollo" y que podra venir medida en trminos de renta, producto
interior bruto, etc., que influye en las dos primeras. As, el desarrollo es la causa de que
decrezca la tasa de analfabetismo y crezca el porcentaje de hogares con televisin. Esta
situacin, una tercera variable que influye simultneamente en otras dos, es muy
comn. En el contexto de la regresin mltiple puede abordarse el problema aislando el
efecto de cada una de ellas.
- Un ejemplo clsico nos describir la tercera situacin, en la que la correlacin es

Econometra I

Curso 2013-2014

atribuible al azar. Un estudio1 realizado en la ciudad de Oldenburg en los aos 1930-1936


revel una fuerte correlacin positiva entre el nmero de nacimientos y el de cigeas
avistadas. Obviamente, esta relacin de correlacin es una relacin espuria ya que no es
una relacin de causalidad, sino sencillamente es una casualidad.
A pesar del problema que conlleva la utilizacin de situaciones de correlacin sin
causalidad, la literatura cientfica recoge muchas malas interpretaciones de anlisis de
regresin y correlacin en el sentido descrito. La sobrevaloracin de las tcnicas
cuantitativas, que parecen otorgar categora cientfica a cualquier anlisis, y la facilidad de
hacer muchos anlisis de regresin con muchas variables, tanto por las disponibilidades de
ordenadores y de programas estadsticos como por la accesibilidad a los grandes bancos de
datos, propician abusos en la utilizacin de estas tcnicas.
Por lo tanto, en cualquier anlisis de regresin es imprescindible, en primer lugar, razonar
con base en sentido comn y la teora y, a continuacin, ver si los datos nos confirman las
relaciones intuidas. Bien es verdad que la "regresin sin teora" nos puede hacer descubrir
relaciones inesperadas que, tras un estudio, puedan ser elevadas a la categora de causales.
1.3 Elementos constitutivos de un modelo economtrico
La forma general de presentar un modelo economtrico ser:
Yi =0 +1X1i +2X2i +3X3i +..+kXki +i
Los elementos constitutivos de un modelo economtrico son por tanto: parmetros y
variables.
Parmetros: son las constantes del modelo que nos permiten cuantificar las relaciones
entre las variables y que trataremos de estimar mediante mtodos estadsticos. Son los
coeficientes del modelo y recogen la estructura del modelo.
Variables: pueden ser de dos tipos: variables observables y variables no observables.
Variables observables: (Y, X1, X2, X3,..Xk). Pueden ser endgenas o predeterminadas

Variables endgenas: son aquellas cuyo comportamiento se pretende explicar con el


modelo. (Y). En el ejemplo del consumo sera C. En los modelos uniecuacionales
hay una sola variable endgena, que figura como variable dependiente o
regresando. En los modelos multiecuacionales hay tantas variables endgenas
como ecuaciones.
Variables predeterminadas: son las variables explicativas del modelo. (X1, X2,
X3,..Xk). En el ejemplo del consumo sera R. En los modelos uniecuacionales
figuran como variables independientes y se suelen llamar regresores. Pueden ser
variables exgenas puras o variables endgenas retardadas.
Variables exgenas puras: son las que se determinan fuera del modelo. En el
ejemplo R.
Variables endgenas retardadas: son variables endgenas pero que aparecen
en periodos de tiempo anteriores al del modelo. En el ejemplo Ct-1.

1
Datos recogidos en Ornithologischte Monatsbericht, 44, nm. 2, Jahrgang, 1936, Berln, y Statistiches Jahrbuch Deutscher
Gemeinden, 27-33, Jahrgang, 1932-1938. Gustav Fisher, Jena.

Econometra I

Curso 2013-2014
C t 0 1

R
t

V. exgena
pura

Ct 1

t 1T

V. endgena
retardada

Variables no observables: son variables para las cuales no podemos obtener observaciones.
Son variables aleatorias con propiedades probabilsticas bien definidas, que se denominan
perturbaciones aleatorias o trminos de error, ya que de alguna manera recoge el error
que cometemos en la especificacin del modelo.
1.4.-Etapas en la elaboracin de un modelo economtrico
1) Especificacin del modelo: se trata de expresar la relacin propuesta por la
Teora Econmica en un lenguaje matemtico, determinando las variables a introducir y la
funcin que las relaciona, as como las distintas hiptesis sobre todas las variables del
modelo.
2) Eleccin y tratamiento de los datos
Estas dos etapas van muy unidas pues especificamos el modelo y elegimos los datos
pero tambin la disposicin de los datos nos permite especificar mejor el modelo.
3) Estimacin: consiste en obtener estimadores de los parmetros a partir de los
datos disponibles.
4) Evaluacin y Contrastacin: En esta fase se realizan diferentes contrastes con
el fin de conocer si tanto las hiptesis estadsticas, como las econmicas son coherentes
con los datos disponibles.
5) Prediccin: en esta fase se obtienen valores futuros de la variable dependiente,
con base en valores conocidos de las variables explicativas.
1.5 Clasificacin de los datos
Para que el modelo economtrico sea operativo necesitamos conocer los valores
numricos de sus parmetros y para ello hemos de disponer de un conjunto de datos sobre
las variables.
Los datos pueden ser de tres tipos: datos temporales, datos de corte transversal y
datos de panel.
Datos temporales o series temporales: son observaciones de una variable, para
una unidad econmica a lo largo del tiempo. Ejemplos: datos de la Contabilidad Nacional,
indicadores de coyuntura mensuales o trimestrales, ventas de una empresa a lo largo del
tiempo, etc.
Datos atemporales o de corte transversal: son observaciones de una variable,
para distintas unidades econmicas en un momento de tiempo dado. Ejemplo: Encuesta de
Presupuestos Familiares (INE) en el perodo 90-91, en la que se ha entrevistado a ms de
20.000 familias.
Datos de panel: son observaciones de una variable para distintas unidades
econmicas a lo largo del tiempo, es decir, es la combinacin de datos temporales y de
corte transversal.

Econometra I

Curso 2013-2014

TEMA 2.-EL MODELO DE REGRESIN LINEAL NORMAL CLSICO (MRLNC)


2.1.- Especificacin del modelo
El objetivo de la regresin es tratar de explicar los cambios que se producen en una variable
(endgena) con base en los cambios que se producen en otra/s variable/s (explicativas), si
solo introducimos una variable explicativa el modelo se denomina de regresin simple
mientras que si introducimos ms de una variable se denomina de regresin mltiple. Esta
ltima nos permite analizar cmo afectan un grupo de variables, de forma conjunta, al
comportamiento de otra variable y estudiar de forma pormenorizada la influencia de cada
una de las variables explicativas en la variable objeto de estudio.
Especificamos el modelo de regresin mltiple como:

donde:

Forma escalar : Yi o 1 X 1i ..... k X ki i X i i

Forma matricial: Y X

Y1

Y2
Y= . ,

.
Y
N

1 X 11

1 X 12
.
X= .

.
.
1 X
1N

.
.
.
.
.

. X k1

. X k2
.
. ,

.
.
. X kN

para i =1.N

1

2
.

.

N

La especificacin requiere no solo plantear el modelo sino una serie de hiptesis sobre las
variables de dicho modelo y todo ello caracteriza el modelo de regresin clsico. Para
entender las hiptesis vamos a plantear el problema con un ejemplo con una sola variable
explicativa.
Ejemplo: Gujarati (2006, p. 133): Supongamos que estamos interesados en determinar
cunto se gasta por semana en lotera los individuos con un determinado nivel de renta.
Supongamos que se divide una poblacin de 100 jugadores en 10 clases de renta como se
ve en la siguiente tabla donde X=renta personal disponible semanal; Y=gasto en lotera
semanal. De tal forma que, con una renta disponible de, por ejemplo 225 $ semanales,
habr 10 personas que gastan una cantidad entre 12 y 33 $ semanales en lotera, y as
sucesivamente habr distintos gastos en lotera para distintos tipos de renta. Grficamente,
para todos los jugadores, sera lo siguiente:

100 125 150 175 200 225 250 275 300 325 350 375 400

Se pueden detectar una serie de caractersticas:

Distribucin conjunta: mayores ingresos mayor gasto


5

Econometra I

Curso 2013-2014

El gasto promedio aumenta al aumentar el nivel de ingresos


Relacin (X,Y) no es exacta: para un valor de X, no hay un nico valor del gasto

En este diagrama de dispersin se ve que cada valor de X tiene asociada una poblacin de
Y. Por otro lado el gasto medio (punto oscuro) aumenta a medida que aumenta el nivel de
renta. A este punto medio se le denomina los valores esperados condicionados. A la lnea
resultante de unir esos valores medios se le denomina lnea de regresin de la poblacin y
muestra el valor medio de la variable dependiente (gasto en lotera) correspondiente a cada
valor de la variable independiente (renta disponible)
Hiptesis Clsicas:

Linealidad en los parmetros


N 0, 2 I
o
Y N X , 2 I por tanto

o Y son variables iid.

Esto supone:
hiptesis de homoscedasticidad

a)
b)
perturbaciones

hiptesis de incorrelacin entre las

X no aleatoria
rg(X) = k+1 < N

Grfico de algunas hiptesis del modelo

2.2.- Estimacin del modelo y medidas de bondad del ajuste


2.2.1.- Estimacin Mnimo Cuadrtica Ordinaria

Objetivo: Obtener estimadores de los parmetros

y 2

Mtodo: Mnimos Cuadrados Ordinarios


Funcin Objetivo a minimizar: ei2 e ' e (Y X ) ' (Y X )

Y X
6

Econometra I

Curso 2013-2014

1
Aplicando las condiciones de mnimo2 se deduce el estimador MCO: MCO X ' X X ' Y

Propiedades del estimador de

Bajo estas hiptesis, se demuestra que el mtodo de mnimos cuadrados ordinarios,


proporciona estimadores de los coeficientes del modelo con las mejores propiedades
deseables. En concreto, es un estimador ELIO, es decir es un estimador lineal, insesgado
y ptimo en el sentido que es el de mnima varianza dentro de los estimadores lineales e
insesgados. Estas propiedades estn justificadas por el teorema de Gauss Markov. Adems
se conoce su distribucin exacta. En concreto:

Insesgado: E por ser X no aleatoria y E 0

1
E X ' X X ' E

Es ptimo: de mnima varianza dentro de la familia de estimadores lineales e insesgados.


1
Cuya matriz de varianzas covarianzas es3: 2 X ' X
Eficiente: de mnima varianza entre los insesgados. Alcanza la cota de Cramer Rao.

1
Distribucin finita: MCO N , 2 X ' X

Adems de las propiedades para muestras finitas tambin tiene buenas propiedades
asintticas. En concreto:
p lim N

Consistente4 :

e ' e Y ' Y Y ' X

'
'
'
X ' Y X ' X Y ' Y 2Y ' X X ' X

Condiciones de mnimo:
e ' e

1 Condicin :

2 Condicin :

2
e' e

e ' e

2 X ' Y 2 X ' X

MCO X ' X

1 X ' Y AY

sea definida positiva

'

X ' X

X 'Y

Sistema de ecuaciones normales

X'X

1 X ' Y

siendo A no aleatorio

2

A YY A ' A I A ' sustituyendo A:
X 'X

2
2
1
1
X ' X X ' X X ' X

Si se cumple P=

MCO

XX = lim N

. p.
c

o bien

X'X
N

; P 0 y finita, entonces:

p lim N

Econometra I

Curso 2013-2014
1

X ' X
a

N
N 0, 2 lim N

Asintticamente normal :

Asintticamente eficiente : La varianza asinttica alcanza la cota de Cramer-Rao.


Estimador de 2 y sus propiedades

Denotamos por S2 el estimador de la varianza de las perturbaciones 2

e' e
N K 1

Definimos S 2
Propiedades:

- Insesgado: E(S2) = 2
- Consistente:
p lim N S 2 2

Propiedades del estimador de

S S 2 X ' X

1
E S E S 2 X ' X

Insesgado :

2.2.2.- Descomposicin de la varianza

Yi Y

Yi 2 N Y

2
Yi Y 'Y Y e ' Y e Y 'Y e' e dado que: e Y Y Y Y e

Restando a ambos lados : N Y

Yi Y

Yi Y

e e
2

si Y Y

SCT=SCE+SCR
Coeficientes de determinacin R2 y de determinacin ajustado R 2 ...

R2 1
2

SCR SCE

SCT SCT

R 1

0 R 2 1

SCR / N k 1
N 1
2
1
1 R

SCT / N 1
N k 1

p lim N p lim N p lim N

ya que: p lim N

X '
N

X'X
N

1
p lim N

X '
N

Econometra I

Curso 2013-2014

Interpretacin: Si la relacin entre la variable dependiente y las variables independientes es


perfecta indicara que toda la variabilidad de la variable dependiente es explicada por los
regresores y por tanto no se cometeran errores. La suma de cuadrados residual ser cero y
la suma de cuadrados total coincidir con la de la regresin, por lo que el cociente entre
ambas valdr la unidad ( R 2 1 ). En el caso opuesto, en el que no exista ningn tipo de
relacin entre las variables, la suma de cuadrados total coincidir con la residual (la
regresin no explicar nada) y, por tanto, la suma de cuadrados debida a la regresin es
nula, dando lugar a R 2 = 0. Por tanto el R2 indica que parte de la variabilidad de Y explican
las variables independientes.
Coeficiente de determinacin corregido o ajustado R 2 :

El coeficiente de determinacin viene afectado por el nmero de variables independientes


que introducimos en el modelo, de tal modo que a medida que se incluyen ms variables
explicativas el R 2 siempre aumenta, aunque las variables introducidas no tengan ninguna
influencia en el comportamiento de la variable dependiente. Sin embargo, el coeficiente de
determinacin corregido introduce un factor de correccin para tener en cuenta este hecho.
Este coeficiente aumenta si la variable incluida es importante para explicar el
comportamiento de la variable dependiente pero se reduce en el caso de que la variable sea
superflua. A efectos de comparacin de modelos, este es el coeficiente que ha de ser
utilizado siempre que la variable endgena sea la misma. Por otro lado, el R2 ajustado no
est acotado pudiendo ser negativo.
EJEMPLO1: Supongamos que estamos interesados en estudiar el gasto sanitario (GSAN)
en funcin del gasto farmacutico (GFAR), ambas medidas en miles de euros, as como del
nmero de estancias ocurridas en centros hospitalarios (ESTANCIAS) y de la poblacin
mayor de 64 aos (MAYOR64) de la Comunidad Autnoma de Madrid, estas dos ltimas
medidas en miles de unidades, para los aos 1986 a 1995.
La estimacin por MCO con el programa Eviews es la siguiente:
Dependent Variable: GSAN
Method: Least Squares
Sample: 1986 1995
Included observations: 10
Variable

Coefficient

Std. Error

t-Statistic

Prob.

GFAR
ESTANCIAS
MAYOR64
C

0.068178
0.111178
3.910869
-2022.009

0.268874
0.041898
0.540548
222.7138

0.253570
2.653513
7.235013
-9.078960

0.8083
0.0379
0.0004
0.0001

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.991119
0.986679
31.33876
5892.709
-46.08382
2.187709

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

1014.976
271.5241
10.01676
10.13780
223.2031
0.000002

Interpretacin de los coeficientes:


El estimador del trmino independiente (o) representa el valor que tomara la variable
dependiente si las variables independientes fuesen igual a cero. Con frecuencia el trmino
independiente carece de interpretacin porque no tiene sentido plantearse que las
variables independientes tomen valor cero.
9

Econometra I

Curso 2013-2014

Los estimadores de los coeficientes de las variables representan el incremento de la


variable dependiente cuando las variables independientes aumentan en una unidad (cteris
pribus). As, en nuestro caso, hemos obtenido que si el gasto farmacutico aumenta en mil
euros el gasto sanitario aumentara en 68,178 euros si las dems variables no cambian. Si
aumenta en mil el nmero de estancias, el gasto sanitario aumentara en 111,2 euros si las
dems variables no cambian, y finalmente, si aumenta en mil personas la poblacin mayor
de 64 aos, el gasto sanitario aumentara en 3.911 euros si las dems variables no
cambian.
Estimador de las varianzas:

5892,709
982,1182 31,33876 2 A su raz cuadrada se le
10 3 1
llama el error estndar de la regresin (S.E. of regression en Eviews).
En nuestro ejemplo: el S 2

Por otro lado, las varianzas estimadas de los estimadores que forman la matriz S
aparecen en la columna Std. Error del cuadro.
Valoracin del ajuste:
Los resultados de Eviews de la tabla nos indican que el 991% de la variabilidad del gasto
sanitario viene explicado por las tres variables explicativas y los residuos solamente
explicaran el 09% restante por lo que en este caso, el ajuste sera muy bueno. Sin
embargo no siempre es fcil de determinar si el porcentaje es grande o pequeo.
Otra forma equivalente de valorar la calidad del ajuste que obtenemos es analizar las
distancias o diferencias entre los valores de la variable dependiente (en nuestro caso el
gasto sanitario) y las aproximaciones que hacemos de ellos mediante la ecuacin estimada.
Las mayores o menores diferencias que se den entre estos valores, es decir, los errores,
permitirn valorar la calidad del ajuste. La magnitud de los errores est relacionada con
el coeficiente de determinacin. A mayor R 2 (mayor relacin entre las variables) menores
errores cometidos. En el siguiente grfico estn representados no solo los errores, sino
tambin el valor real y estimado de la variable endgena.
1600
1400
1200
40

1000

20

800

600

-20
-40
-60
86

87

88

89

Residual

90

91

92

Actual

93

94

95

Fitted

Como se puede ver el ajuste es muy bueno, los errores son pequeos a excepcin del
correspondiente a la observacin 94 que supera el intervalo.

10

Econometra I

Curso 2013-2014

2.2.3- Estimadores mximo verosmiles de los parmetros

El mtodo de mxima verosimilitud consiste en hallar los estimadores que maximizan la


funcin de verosimilitud. La funcin de verosimilitud de la muestra es, simplemente, la
funcin de densidad conjunta de la muestra hacindola depender de los parmetros
desconocidos5.

Puesto que Y es una variable normal N-dimensional : Y N X , 2 I

X ' X 1 X ' Y

MV

MCO

2 e' e
N

MV

Propiedades de los estimadores


Bajo condiciones de regularidad se demuestra que los EMV tienen las siguientes
propiedades:

Asintticamente insesgados
Consistentes
Asintticamente eficientes
Asintticamente normal

Su funcin de densidad y, por lo tanto, la funcin de verosimilitud es:

f (Y )
2

2
2
e

dado que maximizar L ,


ln L
,

ln L
,

N
2

ln 2

N ln 2
2

(Y X )`(Y X )

es lo mismo que maximizar ln L , 2 ;


2
N
ln
2

1
2

2
N
ln
2

1
2

Y X ' Y X
YY 2Y ' X

' '
X X

Condiciones de mximo:

1 condicin: Se igualan a cero las primeras derivadas

ln L

por tanto

ln L

1
2

MV

MV

X ' Y X ' X

MV

MV

X' X

N
2

2 X ' Y 2 X ' X

2
MV

1 X ' Y MCO
2 (Y X

MV
2

'
) (Y X

2 (

2
MV

MV

)
0

2
MV

e' e
N

2 condicin: Se cumple que el hessiano evaluado en el mximo es una matriz definida negativa.
11

Econometra I

Curso 2013-2014

Invarianza

2.2.4.- Otras medidas de bondad del ajuste

a) Anlisis de la funcin de verosimilitud evaluada en los EMV de los parmetros


ln L , 2 N ln2 N ln 2 1
MV
2
2

2 2

Y X ' Y X
MV

MV

MV

ei2 N

2
N
N

ln L , ln 2 ln
2
2

N
2

No est acotado y est influido por el nmero de variables explicativas que introduzcamos
en el modelo. Cuanto mayor, mejor.
b) Criterio de Akaike AIC y Criterio de informacin bayesiano de Schwartz SBIC
AIC =

2
2(k 1)
ln L
N
N

SBIC =

2
(k 1) ln N
ln L
N
N

Cuanto menor sean estos estadsticos mejor ser la estimacin del modelo.
Ejemplo1: Las salidas del Eviews nos proporcionan estos valores, en nuestro caso, log
likelihood=-460838, AIC=1001 y SBIC=1014

12

Econometra I

Curso 2013-2014

TEMA 3.-CONTRASTES Y PREDICCIN EN EL MRLNC


3.1 - Contrastes de hiptesis sobre los parmetros. Forma general

Supongamos que queremos realizar cualquier restriccin lineal sobre los parmetros del
modelo. Por ejemplo sea el modelo:
Yi o 1 X 1i 2 X 2i 3 X 3i i

Y supongamos las siguientes restricciones sobre los parmetros:


a) 1 2 1
b) 2 0
c) 2 3 0
La pregunta que nos podemos hacer es cmo decidir si las restricciones sobre los
parmetros son vlidas? En definitiva, cmo contrastar cualquiera de estas restricciones?
La respuesta es mediante un test de una F que compara las sumas de cuadrados residuales
de dos modelos, el original y el modelo restringido, que no es ms que el modelo deducido
del modelo original al imponer la restriccin de los parmetros.
Por ejemplo si la hiptesis a contrastar fuese la restriccin a):
H o : 1 2 1

1 1 2

H 1 : 1 2 1
Introducimos esta restriccin en el modelo original (ecuacin 1):
Yi o 1 2 X 1i 2 X 2i 3 X 3i i

Reagrupando los trminos obtendramos el modelo restringido (ecuacin 2):


Yi X 1i o . 2 X 2i X 1i 3 X 3i i

Llamando a la suma de cuadrados residuales del modelo original e' e y a la del modelo
restringido e' r e r se demuestra que, bajo las hiptesis clsicas, el estadstico basado en la
diferencia entre estas dos sumas de cuadrados residuales se distribuye como una F:
e' r e r e ' e
S2 H

FNH k 1

Donde H es el nmero de restricciones que es igual o menor que K+1. Si el valor muestral
del estadstico es mayor que el valor crtico rechazamos Ho y si es menor no rechazamos
Ho.
3.1.1.- Contrastes de significacin individual y conjunta

Dos de los contrastes ms relevantes en un modelo economtrico son los de significacin


individual, que nos permiten tomar una decisin sobre que variables explicativas introducir
en un modelo y el de regresin conjunta, que nos permite analizar si en su conjunto los
regresores son estadsticamente significativos para explicar la variable endgena.
A)

Contraste de significacin de un regresor aislado:

Supongamos que estamos interesados en contrastar si cada una de las variables explicativas
13

Econometra I

Curso 2013-2014

del modelo es significativa, es decir si es una variable importante para explicar la variable
endgena. Pues bien, en estos contrastes nos planteamos si el parmetro asociado a cada
variable es igual a cero en la poblacin. Si el parmetro es distinto de cero, la variable a la
que est asociado es significativa para explicar el comportamiento de la variable
dependiente. Por el contrario, si el parmetro es igual a cero, la variable en principio, no
debera aparecer en el modelo por ser no significativa. Para realizar el contraste utilizamos
los estimadores de esos parmetros que obtenemos con la muestra con la que trabajamos.
En este caso la hiptesis a contrastar sera:
Ho : j 0
H1 : j 0

j 0,1,2...k

Este contraste se puede hacer a travs de la frmula general o bien deduciendo directamente
la distribucin del estadstico6 dando como resultado :

j
S

Ho

N k 1

Conclusin: Si el P-valor es 0.000 la probabilidad de equivocarme si rechazo la hiptesis


nula es del 0%, por lo que rechazo la hiptesis nula y por tanto la variable Xj es
significativa para explicar el comportamiento de la variable endgena.
B)

Contraste de significacin de la regresin:

Permite determinar si los regresores en su conjunto son significativos, es decir, si es


relevante la parte de la variabilidad total que viene explicada por la regresin.
1
0


Ho :



0


k

H1 :
SCE
S2 k

Ho

FNk k 1

o bien

R 2 ( N k 1)
1 R 2 k

Ho

FNk k 1

Si rechazamos la hiptesis nula estamos admitiendo que las variables explicativas incluidas
en el modelo tienen sus parmetros distintos de cero o lo que es lo mismo que la parte que

j N j ,
j

como

N 0,1

2
N k 1
N k 1

t N k 1

j j
Tipificamos:

por tanto:

j
S

N 0, 1

Por otro lado:

2
2

N k 1
N k 1

o
H

t N k 1

14

Econometra I

Curso 2013-2014

explica la regresin es significativa. Por otro lado, dada la relacin entre el estadstico F y
el R 2 , mediante este contraste estoy analizando si el R 2 es suficientemente elevado como
para considerar a las variables explicativas conjuntamente significativas para explicar los
cambios en la variable dependiente.
EJEMPLO1: El programa Eviews proporciona, en las salidas de la estimacin, tanto el
valor muestral del estadstico t que contrasta la significacin individual, como el del
estadstico F que contrasta la significacin de la regresin. En nuestro caso rechazamos la
hiptesis nula para las variables ESTANCIAS (p-valor=0,0379) y MAYOR 64 (pvalor=0,0004 ) por tanto estas dos variables son significativas mientras que para GFAR no
se rechaza la hiptesis nula (p-valor=0,808) por lo que no es significativa. Por otro lado,
el valor muestral del estadstico F rechaza claramente la hiptesis nula (p-valor=0,000)
por lo que la regresin es totalmente significativa.
3.2.- Prediccin
Objetivo: Obtener valores de observaciones fuera de la muestra que se ha utilizado en la
estimacin de la variable endgena. Para ello se requieren tres condiciones:

1) Buen comportamiento del modelo a lo largo del perodo muestral


2) Conocer lo ms exactamente posible los valores que tomarn las variables
explicativas en el perodo de prediccin.
3) Que el modelo mantenga la misma estructura en el perodo de prediccin que
en el muestral.
3.2.1.- Prediccin para un valor futuro:

Sea el modelo:

Yi X i' i que cumple las hiptesis clsicas, donde Yi X i'

Si esa relacin se mantiene para el perodo de prediccin : Y p X 'p p


La perturbacin cumplira las hiptesis clsicas, siendo Yp y X 'p los valores que toma
la variable endgena fuera de la muestra y el vector fila formado por los valores que toman
las variables explicativas.
Definimos:
Predictor: Yp X p

un estimador del valor a predecir.

Error de prediccin: f diferencia entre el predictor y lo que queremos predecir.

f es una variable aleatoria con media cero E f 0 y varianza: 2f E f E ( f )

dado que el predictor Yp es un estimador sesgado de Y p , para analizar su precisin


calculamos su ECM7:

1
'
Podemos comprobar que: f Yp Y p X p p X p X ' X X ' p
Y, por tanto:
7

15

Econometra I

Curso 2013-2014

ECM Yp E Yp Y p

E f 2f 2 (1 X 'p X ' X X p )

Y su estimador:
S 2f S 2 (1 X 'p X ' X X p )
1

Queremos predecir Predictor


Y p X 'p

Yp= X 'p +p

Valor individual

Esperanza

ECM

2 1 X 'p ( X ' X )1 X p

X 'p

3.2.2.- Evaluacin de la capacidad predictiva del modelo:

La capacidad predictiva se puede evaluar a partir de varios estadsticos. Los estadsticos


que computa EViews, suponiendo que el tamao del periodo de prediccin es n, son:
n

f j2

j 1

RECM

Raz del error cuadrtico medio:


n

j 1

fj

Error absoluto medio: EAM

Error absoluto medio del porcentaje de error: EAMP

Coeficiente de desigualdad de Theil:

n
1 n fj

n j 1 Y j

Y j Y j / n
n

j 1

j 1

2
Y j

0U1

/n

j 1

2
Yj

/n

Todos los estadsticos descritos hasta ahora indican una mejor capacidad predictiva del
modelo cuanto ms cercanos a cero sean, lo que permite comparar un determinado modelo
con otros alternativos.
Descomposicin del error cuadrtico medio de prediccin:
2
1 n

Y Yj
n j 1 j

Y Y

componente sesgo

S S

componente var ianza

2 1 rY Y SY SY

componente cov arianza

1
2
2
'
'
ECM Yp f E Yp Y p Yp Y p (1 X p X ' X
X p)

16

Econometra I

Curso 2013-2014

El cociente entre cada uno de los componentes en la suma total se denomina proporcin del
sesgo, proporcin de la varianza y proporcin de la covarianza.
Cada una de estas proporciones vara entre cero y uno, siendo su suma la unidad como es
de esperar. Los dos primeros miden, respectivamente, las diferencias entre la media y la
varianza de la serie predicha ( Y ) y las de la serie observada (Y) en el periodo de
prediccin. Por tanto, lo deseable es que su valor sea pequeo. La ltima proporcin mide
la parte residual o no sistemtica de los errores de prediccin, en donde debera recaer la
mayor parte del error total cometido.
EJEMPLO1: supongamos que estamos interesados en predecir cul sera el gasto sanitario
en el ao 1996 si el gasto farmacutico fuese de 980 mil euros, el nmero de estancias en
centros hospitalarios de 6000 y la poblacin mayor de 64 aos de la Comunidad de 800
personas.
Primer paso: analizamos la capacidad predictiva del modelo para los tres ltimos aos
estimando en primer lugar el modelo para el periodo 86-92, dando como resultado lo
siguiente:
Dependent Variable: GSAN
Method: Least Squares
Sample: 1986 1992
Included observations: 7
ESTANCIAS
GFAR
MAYOR64
C
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

Coefficient
-0.002401
0.076445
3.866079
-1440.483
0.996556
0.993112
13.55580
551.2790
-25.21473
289.3403
0.000343

Std. Error
t-Statistic
0.071194
-0.033725
0.240081
0.318416
0.679455
5.689971
575.1245
-2.504646
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

Prob.
0.9752
0.7710
0.0108
0.0873
875.0905
163.3292
8.347065
8.316157
7.965042
1.423676

En segundo lugar hacemos la prediccin para el periodo 93-95 para analizar la capacidad
predictiva. El cuadro siguiente muestra las opciones necesarias para la prediccin para el
periodo 1993-1995 y el nombre del predictor (gasanf)

17

Econometra I

Curso 2013-2014

El resultado es el siguiente:
1700
Forecast: GSANF
Actual: GSAN
Forecast sample: 1993 1995
Included observations: 3

1600
1500

Root Mean Squared Error


Mean Absolute Error
Mean Abs. Percent Error
Theil Inequality Coefficient
Bias Proportion
Variance Proportion
Covariance Proportion

1400
1300
1200
1100
1993

1994

68.49014
55.63407
4.101869
0.025372
0.014893
0.371708
0.613399

1995

GSANF

La U de Theil=0,02537 es muy pequea lo cual indica una buena capacidad predictiva,


adems, la proporcin de sesgo (0,01489) y la de varianza (0,371708) son tambin muy
pequeas mientras que la mayor proporcin recae en la covarianza (0,6134).
El siguiente paso consiste en predecir en el modelo original el valor del gasto sanitario
para el ao 1996.
En el cuadro siguiente se muestra las opciones necesarias para la prediccin, el nombre
del predictor (gasanf) el error estndar (SE) y el periodo que se quiere predecir (1996).

El resultado: gsanf=1840,566 y Sf=62,99136.


La varianza del error de prediccin es muy pequea respecto al predictor. Su coeficiente
de variacin es igual 0,034 <0,5 lo que indica que la prediccin es precisa.

18

Econometra I

Curso 2013-2014

TEMA 4: VARIABLES FICTICIAS


4.1.- Planteamiento

Las variables que hemos introducido como regresores en los temas precedentes son
variables de tipo cuantitativo. Sin embargo, en ocasiones existen factores de tipo cualitativo
que pueden ser relevantes para explicar el comportamiento de la variable endgena.
La inclusin de estos factores en un modelo economtrico, se realiza a partir de la
construccin de lo que se conoce como variables ficticias, variables dicotmicas o variables
dummy que toman dos valores arbitrarios, normalmente 1 y 0, que corresponden a las
modalidades del factor, aunque no necesariamente ya que podrn tomar otros valores o ms
de dos.
Pueden utilizarse para recoger:

Efectos temporales:
Efectos espaciales:
Efectos de tipo puramente cualitativo.
Otro tipo de efectos: efectos estacionales, funciones escalonadas, etc.

EJEMPLO2: Queremos explicar el absentismo laboral que sufre una empresa (ABSEN)
medida como los das que en el ltimo ao han faltado al trabajo cada uno de los
empleados, en funcin de los aos de antigedad en la empresa (ANTIGUE), del salario
mensual en euros (SALARIO) y del gnero de los trabajadores (D=1 si el empleado es
hombre y D=0 si es mujer)
1 hom bre
Di
0 mujer
4.2.- Formas de introducir un factor cualitativo en el modelo de regresin

Las variables ficticias se pueden construir e incorporar de forma que acten en el modelo de
tres modos distintos. La forma de incorporar los factores cualitativos en el modelo va a
depender del efecto que creemos que tiene ese factor sobre el comportamiento de la
variable dependiente. En el caso de un modelo de dos variables tendramos:
1.- Que afecte slo a la ordenada en el origen (Variables ficticias aditivas)
Si tenemos dos ecuaciones con la misma pendiente y diferente ordenada:
Yi=1 +Xi+i
Yi=2 +Xi+i
las dos ecuaciones se pueden expresar en una sola por medio de una variable ficticia:
Yi= 1 + Xi +Di +i
) X i i
1 Yi (
1

donde cuando Di
2
0 Y X
i
1
i
i

1+ = 2 = 2-1
El coeficiente de la variable ficticia nos mide el efecto diferencial entre las dos ordenadas
en el origen, es decir, el efecto diferencial del valor esperado de la variable dependiente por
19

Econometra I

Curso 2013-2014

presentar una de las caractersticas del factor cualitativo respecto al hecho de no


presentarla.
La hiptesis a contrastar si los dos modelos tienen la misma ordenada:
H0: =0
H1: 0
Si se rechaza la hiptesis nula indica que el efecto diferencial del valor esperado de la
variable es distinto si presenta una de las caractersticas del factor cualitativo respecto a no
presentarla.
En nuestro ejemplo, supongamos que el absentismo viene explicado en principio por el
salario y adems nos planteamos si el gnero de los trabajadores influye tambin sobre el
absentismo, los resultados son los siguientes:

La variable gnero es significativa (P-valor=0,021) lo cual indica que el efecto diferencial


del absentismo es diferente si el trabajador es hombre o mujer. Por otro lado tambin
podramos cuantificar ese efecto. Para las mujeres los das que han faltado al trabajo en el
ltimo ao fueron 12 mientras que para los hombres fueron 14.
2.- Que afecte slo a la pendiente (Variables multiplicativas o compuestas)
Si tenemos dos modelos con la misma ordenada en el origen y distinta pendiente:
Yi= +1Xi+i
Yi= +2Xi+i
las dos ecuaciones se pueden expresar en una sola por medio de una variable ficticia de la
forma:
Yi= +1 Xi + X i Di +i

Zi

1 Z i X i
donde cuando Di
0 Z i 0

1 ) X i i
1 Yi (

por tanto cuando Di


2
0 Y X
i
1 i
i

20

Econometra I

Curso 2013-2014

1+ = 2 = 2-1
El coeficiente de la variable ficticia nos mide el efecto diferencial entre las pendientes en
los dos grupos, es decir, la diferencia de la influencia de la variable explicativa sobre la
variable endgena por presentar una caracterstica respecto de no presentarla.
La hiptesis a contrastar si los dos modelos tienen la misma pendiente:
H0: =0
H1: 0
Si se rechaza la hiptesis nula indica la influencia de la variable explicativa sobre la
variable endgena es distinto si presenta una de las caractersticas del factor cualitativo
respecto a no presentarla.
En nuestro ejemplo, nos plantearamos si el efecto del salario sobre el absentismo laboral
de los hombres es el mismo que el de las mujeres. Los resultados son los siguientes:

En este supuesto la ficticia multiplicativa tambin es significativa (p-valor=0,0347) lo cual


indica que el efecto del salario sobre el absentismo es diferente en los hombres que en las
mujeres. Esto nos permitira cuantificar la diferencia entre la influencia del salario sobre el
absentismo en los hombres respecto a las mujeres.
En nuestro ejemplo, si aumenta el salario mensual disminuira el absentismo laboral en las
mujeres en 12 das mientras que en los hombres disminuira en 10 das.
3.- Que afecte a ambas (ordenada y pendiente)
Si tenemos dos modelos con diferente ordenada en el origen y diferente pendiente:
Yi=1 +1Xi+i
Yi=2 +2Xi+i
las dos ecuaciones se pueden expresar en una sola por medio de una variable ficticia de la
forma:
Yi= 1 +1 Xi +Di+ X i Di +i

Zi

21

Econometra I

Curso 2013-2014

) ( 1 ) X i i
1 Yi (
1

donde cuando Di
2
2
0 Yi 1 1 X i i
La hiptesis a contrastar si los dos modelos tienen la misma ordenada en el origen como la
misma pendiente:
0
H 0 :
0
0
H1 :
0

Contrastamos si conjuntamente son significativas:


Wald Test:
Equation: Untitled
Test Statistic
F-statistic
Chi-square

Value
2.839041
5.678082

df
(2, 44)
2

Probability
0.0692
0.0585

El p-valor asociado al valor muestral del estadstico F no rechaza la hiptesis nula por lo
que las ficticias no seran significativas conjuntamente ni tampoco individualmente. Esta
afirmacin est en contradiccin con los modelos anteriores, lo cual es indicativo de la
existencia de algn problema en el modelo, como veremos ms adelante.
Generalizacin:

A) Todos estos casos podran generalizarse para un modelo de k variables explicativas


Para el caso de Variables ficticias que afectan al trmino independiente:
k

Yi =1 +Di + j X ji +i
j 1

Para el caso de variables ficticias que afectan a la pendiente depender de la variable con la
que se relacione la ficticia. Si es X1:
22

Econometra I

Curso 2013-2014
k

Yi = +1X1i + j X ji +DiX1i +i
j 2

EJEMPLO2: En nuestro ejemplo, supongamos que adems del salario, influye la


antigedad en el absentismo laboral. Supongamos adems el caso ms general en el que
incluimos tanto una variable ficticia aditiva como dos multiplicativas. Ya que hay dos
variables cuantitativas (antigue y salario) se podrn plantear varias posibilidades: que
exista un efecto diferencial de los aos de antigedad sobre el absentismo debido al
distinto gnero de los trabajadores, o bien que el efecto diferencial venga dado por el
salario debido al distinto gnero de los trabajadores o ambas posibilidades. Supongamos
el caso ms general con ambas posibilidades, los resultados son los siguientes
El resultado sera el siguiente:

B) Supongamos ahora un factor cualitativo con m modalidades. Cmo lo


introduciramos)
Como regla general si tenemos m modalidades deberamos introducir m-1 variables
ficticias.
1) Si las variables ficticias afectan a la ordenada, el nmero de variables ficticias a
introducir depender de que el modelo tenga o no trmino constante. Si el modelo tiene
trmino constante e incluimos tantas variables ficticias aditivas como modalidades tiene el
factor, caemos en la trampa de las variables ficticias que consiste en que la primera
columna de la matriz X ser combinacin lineal exacta de las columnas que contienen las
observaciones de las variables ficticias, por tanto, rg(X)<k+1 |XX|=0 y no se puede
invertir la matriz XX.
La regla para evitar la trampa es la siguiente: si el factor posee m modalidades incluimos
m-1 variables ficticias en el modelo (si hay varios factores cualitativos la regla se aplica
para cada uno de ellos). En caso de que el modelo no tenga trmino constante, el nmero de
variables ficticias sera igual al nmero de modalidades que tuvisemos.
23

Econometra I

Curso 2013-2014

2) Si las variables ficticias afectan a la pendiente del modelo tambin hay que utilizar esa
regla para no caer en la trampa de las variables ficticias, pero en ese caso
independientemente de que el modelo tenga trmino constante o no, ya que es la columna
de la variable X la que es combinacin lineal de las columnas de las ficticias.
4.3.- Formas de introducir varios factores cualitativos en el modelo de regresin

En el modelo tambin podemos introducir a la vez varios factores cualitativos, cada uno
con diversas modalidades, y podemos analizar adems las interacciones que se producen
entre esos factores cualitativos.
La forma de introducir ms factores cualitativos es similar a la introduccin de uno de ellos
y se aplican tambin las reglas vistas acerca de cuntas variables ficticias introducir para un
factor con m modalidades y de cmo realizar los contrastes de hiptesis.
Ejemplo: Supongamos que queremos estimar un modelo de determinacin de salarios, para
lo cual disponemos de una muestra de N trabajadores e informacin sobre el salario que
reciben, su categora profesional (empleado, tcnico y directivo) y el gnero.
Yi =0+ 1E1i + 2E2i+ 3Gi +i
donde Yi es el salario
1 si el trabajador es mujer
Gi
0 si el trabajador es hombre
1 si el trabajador es tcnico
E1i
0 en otro caso
1 si el trabajador es directivo
E 2i
0 en otro caso
de esta forma el valor esperado de Yi en cada caso es:
Empleado

Tcnico

Directivo

Mujer

0+3

0+3+1

0+3+2

Hombre

0+1

0+2

La diferencia salarial entre hombres y mujeres viene dada por 3 independientemente de su


categora profesional. Est claro que si 3 es <0 implica que el salario de los hombres es
superior al de las mujeres para la misma categora profesional.
Por otro lado, un contraste de discriminacin salarial respecto al gnero sera:
H0: 3 = 0
H1: 3 0
Un contraste de diferencias salariales respecto a la categora profesional sera:

24

Econometra I

Curso 2013-2014

0
H 0 : 1
2 0
0
H1 : 1
2 0

Efectos interaccin

El modelo que acabamos de plantear recoge que el hecho de ser hombre o mujer no influye
en la diferencia salarial segn la categora profesional. Sin embargo, podramos estar
interesados en estudiar el efecto que tiene sobre el salario recibido el hecho de ser mujer o
hombre con cierta categora profesional. En este caso, el modelo tendra que incluir lo que
se llama efectos interaccin entre variables ficticias y se especificara de la siguiente forma:
Yi =0+ 1E1i + 2E2i+ 3Gi +4E1iGi+5E2iGi +i
Ahora, el valor esperado de Yi en cada caso es:
Empleado

Tcnico

Directivo

Mujer

0+3

0+3+1+4

0+3+2+5

Hombre

0+1

0+2

La diferencia salarial entre hombres y mujeres ya no viene dada nicamente por 3, sino
tambin por 4 o 5, dependiendo de su categora profesional.

25

Econometra I

Curso 2013-2014

26

Econometra I

Curso 2013-2014

TEMA 5: EVALUACIN DEL MODELO DE REGRESIN LINEAL CLSICO

Los supuestos o hiptesis que nos hemos planteado en el MRLC no tienen necesariamente
que cumplirse. El incumplimiento de alguna de las hiptesis del modelo clsico supone un
error en la especificacin del modelo economtrico. La especificacin de un modelo de
regresin consta de la formulacin de la ecuacin de regresin y de las afirmaciones o
supuestos acerca de los regresores y del trmino de perturbacin. En sentido amplio,
existir un error de especificacin siempre que sea incorrecta la formulacin de la ecuacin
o uno de los supuestos subyacentes (Kmenta, p.467). Veamos algunos de ellos.
5.1 Errores de especificacin en la seleccin de variables explicativas

Dos son los errores que podemos cometer en la seleccin de las variables explicativas, la
omisin de variables relevantes o la inclusin de variables irrelevantes en el modelo.
Omisin de variables relevantes: Omitimos por error del modelo una serie de variables que,
en realidad, deberan estar especificadas por ser todas ellas relevantes. Por ejemplo:
El modelo correctamente especificado es:
El modelo estimado (con omisin) es:

Yi= o+ 1 X1i+ 2 X2i+ ui


Yi= o+ 1 X1i+ i donde i = 2 X2i+ ui

En realidad, cuando cometemos un error de especificacin por omisin estamos planteando


un modelo restringido (bajo la restriccin 2 0 ) en el que la restriccin es falsa.
Consecuencias:
a) El estimador restringido es sesgado8 ya que E i 0 e inconsistente. Tambin
tiene menor varianza que el estimador del modelo correctamente especificado, sin
embargo, como es sesgado, la varianza no mide la precisin del estimador sino que
habra que calcular el ECM. En definitiva, no es ELIO ni consistente.
e' e
2
2
tambin es sesgado e inconsistente.
b) El estimador de , S1
N k1 1
c) Al ser S2 sesgado el estimador de la matriz de varianzas y covarianzas de 1 : S b1b1
tambin ser sesgado: E( S b1b1 ) 2 ( X 1' X 1 ) 1
no son vlidos .
d) Los contrastes de hiptesis habituales sobre
1
Retomamos nuestro EJEMPLO1: Supongamos que eliminamos del modelo la variable
MAYOR64 que era una variable significativa. El resultado sera el siguiente:

Salvo la excepcin de que los regresores sean ortogonales, es decir, estn totalmente incorrelacionados.

27

Econometra I

Curso 2013-2014

Como se puede ver el R 2 0,88897 es menor que el del modelo en el que se inclua la
variable MAYOR64 ( R 2 0,9866 ) y el AKaike y el SBIC son mayores por tanto estamos
cometiendo un error por omisin de esa variable por lo que los test de hiptesis no son
vlidos y los estimadores seran sesgados.
Inclusin de variables irrelevantes: Supongamos ahora, que por error, incluimos en .el
modelo una serie de variables que no son significativas. Es decir:
Modelo correctamente especificado:
Modelo estimado (con inclusin):

Yi= o+ 1 X1i+i
Yi= o+ 1 X1i+ 2 X2i+ i

En este caso se estima un modelo donde no se incluye la restriccin cierta 2 = 0. Los


estimadores del modelo estimado seguirn siendo ELIO y consistentes y tambin lo ser S2.
El problema, por tanto, no est en las propiedades de los estimadores sino en su eficiencia
comparada con los estimadores del modelo correctamente especificado. Siempre el
estimador mnimo cuadrtico restringido tiene siempre varianza ms pequea que el
mnimo cuadrtico ordinario sin restringir y, por lo tanto, en este caso ser ms eficiente.
Adems, los test de hiptesis son vlidos .
Volviendo a nuestro EJEMPLO 1, eliminamos la variable GFAR que no era significativa
con el fin de analizar si estaramos cometiendo un error de inclusin en el modelo anterior.
Los resultados son los siguientes:
Como se puede ver el R 2 0,98846 que es mayor que el del modelo en el que se inclua la
variable GFAR ( R 2 0,9866 ) y el AKaike y el SBIC son menores por tanto en el primer
modelo habra un error por inclusin de variable relevante aunque muy pequeo debido a
la diferencia tan pequea, por tanto si considero que Gfar es una variable que debera
estar en el modelo podra mantenerla.

28

Econometra I

Curso 2013-2014

5.2. Errores de especificacin en la forma funcional. Modelos no lineales

Una de las hiptesis clsicas que se realizan en el modelo de regresin es el de la forma


funcional lineal. La Teora Econmica a veces nos indica como es la relacin entre las
variables, pero otras veces tienen que ser los datos los que nos ayuden a decidir. La
especificacin incorrecta en la forma funcional genera estimadores sesgados e
inconsistentes.
Hay que tener en cuenta que hay varios tipos de modelos no lineales. Algunos pueden ser
tratados con las tcnicas vistas hasta ahora realizando algunas transformaciones y teniendo
en cuenta algunas diferencias (Ver el apndice 1 de este tema).
Deteccin de no linealidades en el modelo economtrico:
Contraste Reset de Ramsey:

Ramsey propuso una prueba general de errores de especificacin que puede ser aplicada
para la deteccin de no linealidades.
El contraste se basa en especificar un modelo alternativo al modelo inicial (Y=X+ ) de la
forma: Y=X+Z+u y contrastar la restriccin =0. En definitiva:
H 0 linealidad 0
H 1 No linealidad 0
Ramsey sugiere incluir en Z potencias de los valores estimados de la variable dependiente
(los cuales son, por supuesto, combinaciones lineales de potencias y productos cruzados de
las variables explicativas), de modo que: Z=( Y 2 ,Y 3 ,Y 4 ,.. )
No se incluye Y porque existe correlacin perfecta de esta variable con la matriz X y, por lo
tanto, el modelo no se podra estimar.
En nuestro EJEMPLO 1 Eviews proporciona la siguiente salida para el modelo
seleccionado:
Ramsey RESET Test:
F-statistic
Log likelihood ratio

0.800189
1.484525

Prob. F(1,5)
Prob. Chi-Square(1)

0.4120
0.2231

Por lo que no rechazamos la hiptesis nula de linealidad


29

Econometra I

Curso 2013-2014

5.3. Contraste sobre la estabilidad de los parmetros9

Hasta ahora hemos supuesto que en el modelo de regresin especificado los coeficientes se
mantienen constantes para todo el periodo muestral. Sin embargo, es posible que existan
submuestras para las que el comportamiento del modelo sea diferente, es decir, exista
cambio estructural.
Deteccin de cambio estructural:
a).- Contraste de estabilidad estructural de Chow

Si no hay cambio estructural (modelo restringido)


Yi 0 1 X 1i ... k X ki i i=1...N

Si hay cambio estructural a partir del periodo N1


Yi 01 11 X 1i ... k1 X ki 1i i=1...N1
Yi 02 12 X 1i ... k2 X ki 2 i i=N1+1...N (total N2 )

Hiptesis del contraste


01 02
1 2

H0 1 1

1 2
k k

01 02
2
1
H1 1 1

1 2
k k

Estadstico de contraste
(er' er - (e1' e1 e2' e2 )) / k 1
(e1' e1 e2' e2 ) / N 1 N 2 - 2k - 2

FNk11N 2 -2 k -2

Nota 1: Es necesario que las observaciones de ambas submuestras sean suficientes para
estimar los modelos, es decir, N1>k+1 y N2>k+1.
Nota 2: Una forma alternativa de llevar a cabo este contraste de Chow es mediante la
incorporacin de variables ficticias que recojan el cambio en los coeficientes del modelo.
5.4. No normalidad

La hiptesis de normalidad de la perturbacin aleatoria no se utiliza para la obtencin de los


estimadores MCO, por lo que dichos estimadores seguirn cumpliendo sus propiedades
aunque la perturbacin no sea normal. Sin embargo, bajo dicha hiptesis, los estimadores
de MCO coinciden con los estimadores MV, y bajo dicha hiptesis se construye todo el
proceso inferencial sobre los modelos economtricos analizados.
El inclumplimiento de la hiptesis de normalidad hace que el estimador MCO no cumpla
las propiedades que cumple adicionalmente por ser tambin el MV y que los estadsticos
utilizados para realizar los contrastes de hiptesis, y que seguan distribuciones derivadas
de la normal, como la t o la F, ya no seguirn, en general, distribuciones conocidas que nos
sirvan para llevar a cabo los contrastes de hiptesis. An as, los contrastes seguirn
teniendo validez asinttica.
9

Basado en Carrascal, U. y otros (2001). Anlisis economtrico con Eviews. Ed. RAMA.
30

Econometra I

Curso 2013-2014

Test de normalidad de Jarque-Bera

Este contraste analiza la normalidad de las perturbaciones a partir de la forma de la


distribucin de los residuos puesto que las perturbaciones son variables no observables.
Concretamente, examina sus discrepancias respecto a la curva campaniforme caracterstica
del modelo normal (distribucin simtrica y de kurtosis igual a 3)10.
El contraste plantea en la hiptesis nula la normalidad de la perturbacin, es decir:
H 0 Normalidad
H 1 No Normalidad
siendo el estadstico de Jarque-Bera:
d JB

2
N k 1 2 1
2
g1 g 2 3 2
6
4

Este estadstico adoptar valores pequeos si la distribucin observada de los residuos es


aproximadamente simtrica y mesocrtica (valores de g1 y g2-3 cercanos a cero). En otro
caso, a medida que se detectan asimetras (positivas o negativas) o desviaciones en la
kurtosis, aumenta su valor. Por lo tanto, aceptaremos H0 cuando dJB < 22 ( ) y
rechazaremos en caso contrario.
En nuestro EJEMPLO1, Eviews proporciona la siguiente salida: El coef de asimetra=0,6095 y el de curtosis=2,6564, muy prximos a cero y 3 respectivamente. Por otro lado el
valor muestral de estadstico de Jarque Bera dJB= 0,6683 con un p-valor de 0,716 por lo
que no se rechaza la hiptesis nula de normalidad
5
Series: Residuals
Sample 1986 1995
Observations 10

Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis

-6.85e-14
4.439314
30.83077
-51.36010
25.58799
-0.609461
2.656394

1
Jarque-Bera
Probability

0
-75

10

-50

-25

25

0.668264
0.715959

50

As, se definen los coeficientes de simetra g1 y de kurtosis g2::


Simetra

Kurtosis

N 3
e / N
i 1 i
g1
3/ 2
2
N
ei / N

i1

g2

g1=0 Distribucin simtrica

g2=3 Distribucin mesocrtica

g1>0 Distrib. con asimetra positiva

g2>3 Distrib. Leptocrtica

g1<0 Distrib. con asimetra negativa

g2<3 Distrib. Platicrtica

N 4
ei / N
i 1
N 2

e / N

i1 i

31

Econometra I

Curso 2013-2014

32

Econometra I

Curso 2013-2014

TEMA 6.- MULTICOLINEALIDAD


6.1.- Multicolinealidad perfecta e imperfecta

Una cuestin importante que debe analizarse al estudiar los resultados de un modelo de
regresin es el grado de relacin lineal existente entre las observaciones de las variables
explicativas, siendo tres las situaciones posibles con las que nos podemos encontrar.
Ortogonalidad: supone la ausencia de relacin lineal entre algunos o todos los regresores
incluidos en el modelo, es decir, implica incorrelacin entre los regresores. En economa
rara vez se da este supuesto.
Multicolinealidad perfecta: se da cuando existe una relacin lineal exacta entre algunos o
todos los regresores incluidos en el modelo.
Multicolinealidad imperfecta: consiste en la existencia de una relacin lineal fuerte entre
los regresores del modelo.
A continuacin vamos a analizar las consecuencias de la multicolinealidad centrndonos,
sobre todo, en la multicolinealidad imperfecta que es la situacin ms frecuente.
Multicolinealidad Perfecta: Cuando la relacin que liga a dos o ms variables explicativas
es una relacin lineal exacta, es decir, las columnas de la matriz X son linealmente
dependientes. En este caso se deja de cumplir la hiptesis clsica Rg(X) = k+1, de modo
que:

Rg(X) < k+1 XX= 0


Y por tanto los estimadores mnimos cuadrados ordinarios no se pueden calcular.
Es, en definitiva un grave problema pero fcilmente detectable, as que si conocemos la
relacin lineal entre las variables es muy fcil de corregir, bastar con eliminar una
cualquiera de las variables correlacionadas sin sufrir ninguna disminucin en la capacidad
explicativa o predictiva del modelo
La multicolinealidad normalmente, es un problema meramente muestral.
Multicolinealidad Imperfecta o fuerte: cuando la relacin entre las variables es muy
fuerte pero no perfecta, es decir, los coeficientes de correlacin lineal no son igual a 1 pero
se aproximan bastante. En este caso XX0 por lo tanto no existen razones, a priori, para
no poder estimar el modelo. En economa, la mayora de las variables explicativas estn, de
alguna manera correlacionadas. Por otro lado, cuando trabajamos con series temporales, la
mayora de las variables econmicas tienen una tendencia creciente, Granger y Newold
demostraron que basta con introducir una tendencia lineal en dos series temporales
independientes para que su correlacin aumente considerablemente, por tanto, la existencia
de esa tendencia puede ser la causa de un problema de multicolinealidad.

Los estimadores sern ELIO siempre que el modelo cumpla las hiptesis clsicas y
coincidirn con los mximo verosmiles, aunque en la prctica esto puede tener poco valor
debido a las consecuencias que este problema genera.

33

Econometra I

Curso 2013-2014

6.2.- Consecuencias de la multicolinealidad imperfecta:

1) Dificultad para interpretar los coeficientes, y por tanto, sus estimaciones. Los
coeficientes de regresin ( j ) se interpretan como el cambio que se produce en Yi al
variar Xji en una unidad, permaneciendo el resto de variables explicativas constantes.
Cuando existe multicolinealidad imperfecta es imposible suponer que el resto de las
variables permanecen constantes al existir altas correlaciones entre ellas. Por este
motivo, los parmetros pierden este significado y, por lo tanto, sus estimaciones.
2) La multicolinealidad afecta a la precisin de los estimadores ya que sus varianzas toman
valores grandes. Vamos a comprobarlo a partir de la varianza de un estimador que viene
dada por:
Var j

1 R

2
2
X j X 1

N S

2
Xj

y su estimador:

1 R

S2
2
X j X 1

N S

2
Xj

Las varianzas de los estimadores pueden ser grandes como consecuencia de:

Valores grandes del S2

Fuerte correlacin entre Xj y el resto de regresores: valores grandes de R X2 j X1

Poca variabilidad en Xj: S X2 j pequea

Tamao muestral pequeo

Esto implica que no siempre que las varianzas de los estimadores sean grandes ser como
consecuencia de la multicolinealidad, aunque cuando la haya las varianzas pueden tomar
valores ms grandes de lo que seran si no la hubiese.
3) Valores muestrales de los estadsticos t pequeos, lo que implica que es muy dificil
rechazar cualquier contraste de no singnificacin de las variables
4) No afecta al R2 ya que ste mide el efecto conjunto de todos los regresores sobre el
regresando y la multicolinealidad afecta a los valores individuales de los regresores, por
tanto la regresin podr ser significativa a pesar de la existencia de multicolinealidad.
5) Los puntos 3 y 4 nos pueden llevar a rechazar la significacin individual de todos los
regresores y sin embargo no rechazar la significacin conjunta de todos ellos.
6) Sensibilidad de los EMC a los pequeos cambios en las muestras, como la
incorporacin o eliminacin de unas pocas observaciones o a la eliminacin de una
variable aparentemente no significativa.
7) No afecta a las predicciones.
6.3.- Procedimientos para detectar la multicolinealidad

La simple lgica permite, algunas veces, saber si existe o no una relacin causal
entre ellas. Por ejemplo, si dos variables explicativas son la poblacin y el empleo,
el presupuesto nacional y el PNB, etc.

Grandes varianzas. Indicio poco fiable por s solo.

Altos coeficientes de correlacin lineal. Si el modelo tiene 2 regresores este


coeficiente es un buen indicio pero si tiene ms de dos regresores, los coeficientes
34

Econometra I

Curso 2013-2014

de correlacin altos son una condicin suficiente para la existencia de


multicolinealidad pero no necesaria, ya que sta puede existir aunque los
coeficientes de correlacin sean comparativamente bajos.

Coeficientes de correlacin mltiple entre los regresores grandes: R X2 j X1....

Estos coeficientes miden la correlacin que existe entre un regresor y todos los dems. Se
puede calcular como coeficiente de determinacin en la regresin auxiliar de cada regresor
frente a los otros.

Estadsticos t pequeos y F grandes

Factor de inflacin de la varianza. Se define como: FIV j

Puesto que 0 R X2 j X1 .... 1

1
1 R X2 j X1 .....

FIV j 1

Si las variables fuesen ortogonales R X2 j X 1 .... 0

FIV 1

R X2 j X 1 .... 1

Cuando

FIV

Si expresamos la varianza del estimador de un parmetro cualquiera como vimos antes


Var j

1 R

2
2
X j X 1 ... X k

N S

2
Xj

, el factor de inflacin de la varianza mide la influencia que

tiene la relacin entre Xj y las dems variables sobre la varianza de j . Cuanto mayor sea
este factor, mayor es la varianza del estimador.
El factor de inflacin de la varianza se puede interpretar como cociente de dos varianzas del
estimador:
o Su varianza real 2

o La varianza que tendra si hubiera ortogonalidad 2

Si hay ortogonalidad, el FIV vale uno, luego 2

ortog

ortog

2
N S X2 j

Si hacemos el cociente entre las dos varianzas tenemos

ortog

1 R

2
2
X j X 1 ... X k

N S X2 j

N S

2
Xj

1 R

1
2
X j X 1 ... X k

FIV

Esto nos permite interpretar este factor de la siguiente forma: Supongamos que
R X2 j X 1 .... 0.5 FIV 2 , es decir, la varianza de j es el doble del valor que tomara
en el caso de ortogonalidad entre los regresores. Si R X2 j X 1 .... 0.999 FIV 1000 , la
varianza es 1000 veces mayor que la que se tendra en caso de ortogonalidad (con el mismo
N , 2 , y S X2 j ).
35

Econometra I

Curso 2013-2014

6.4.- Soluciones a la multicolinealidad

Las soluciones ms frecuentes aunque no las nicas son:


1) Aumentar el tamao de la muestra. Esta podra ser una solucin siempre que la
multicolinealidad fuera un problema muestral.
2) Eliminacin de variables: Eliminar aquella o aquellas variables colineales. El
inconveniente de este mtodo es que podramos caer en graves problemas de errores de
especificacin por omisin. Este error sera tanto menor cuanto mayor fuese la correlacin
lineal entre la variable omitida y las incluidas y por tanto tambin ser menor el sesgo de
los estimadores.
3) Utilizacin de informacin a priori: Consiste en incorporar al modelo algn tipo
de informacin estableciendo restricciones sobre los parmetros del modelo.
4) Transformacin de variables: Si la multicolinealidad se presenta en modelos
con una muestra de series temporales la tendencia aproximadamente comn en los
regresores podra ser la principal causa del problema. En este caso una forma de eliminar
esa tendencia es trabajar con la series en primeras diferencias y de esa forma no solo se
eliminara la tendencia sino que la correlacin entre los regresores disminuira. Tambin se
podra trabajar con ratios.
Analizamos la posible existencia de multicolinealidad en nuestro EJEMPLO1. Es
razonable pensar que las variables gasto farmacutico y mayor de 64 aos estn muy
relacionadas. Por otro lado la variable GFAR no es significativa lo cual tampoco es muy
razonable. Empecemos por analizar los coeficientes de correlacin lineal entre los
regresores viendo la matriz de correlaciones:

ESTANCIAS

GFAR

MAYOR64

-0,202981

-0,084298

GFAR

-0,202981

MAYOR64

-0,084298

ESTANCIAS

0,951154

0,951154
1

Efectivamente como se puede apreciar el coeficiente de correlacin lineal entre las


variables GFAR y MAYOR64 es muy alto (0,95) por tanto esas variables estn
correlacionadas
Analizamos los coeficientes de correlacin mltiple:

36

Econometra I

Curso 2013-2014

2
RGFAR
:ESTANCIAS,MAYOR64. 0.9199

De igual forma para el resto de coeficientes:


2
RESTANCIAS
:GFAR,MAYOR64. 0.1653
2
RMAYOR
64:GFAR, ESTANCIAS 0.917

A la misma conclusin se llega con los coeficientes de correlacin mltiple. Mientras que
ESTANCIAS es una variable que est incorrelacionada con el resto, el gasto farmacutico
(GFAR) y mayor de 64 aos (MAYOR64) estn muy correlacionadas.

37

Econometra I

Curso 2013-2014

38

Econometra I

Curso 2013-2014

TEMA 7: HETEROSCEDASTICIDAD
7.1.- Planteamiento general

Una de las hiptesis bsicas del modelo de regresin lineal clsico,


Yi 0 1 X 1i 2 X 2i k X ki i

i 1,2, , N

o, en forma matricial, Y X es que la matriz de varianzas-covarianzas de las

perturbaciones es E ' 2 I , siendo I la matriz identidad. Esto es, las varianzas de las
perturbaciones son iguales (hiptesis de igualdad de varianzas u homoscedasticidad) y las
covarianzas entre las mismas son nulas (hiptesis de incorrelacin):
Var i 2

i 1,2,, N

Cov i , j 0 i , j 1,2,, N

ij

Si no se verifica cualquiera de las dos hiptesis, las varianzas no son constantes


(heteroscedasticidad) o las covarianzas no son todas nulas (autocorrelacin de las
perturbaciones), tendremos que,

E ' 2 donde I
Este modelo se conoce como Modelo de Regresin Lineal Generalizado (MRLG).
Por tanto, el problema de heteroscedasticidad se produce cuando las varianzas de las
perturbaciones son desiguales, esto es, Var i i2 cte i 1,2, ,... N y, por ello,
12 0

0 22
E '
.... ....
0
0

.... 0

.... 0
.... ....
.... N2

Si expresamos Var i i2 2 wi

i 1,2, ,... N , entonces

w1 0

0 w2
'
2
E , donde
.... ....

0 0

0
.... ....

.... wN
....
....

Para explicar mejor la diferencia entre heteroscedasticidad y homoscedasticidad, vamos a


analizar un modelo de regresin de dos variables en el que la variable dependiente Y es el
ahorro personal y la variable explicativa la renta personal disponible (X). La Figura 1a)
muestra que a medida que aumenta la renta personal disponible, tambin aumenta, de
media, el ahorro, pero la varianza del ahorro en torno a su valor medio permanece igual
para todos los niveles de renta personal disponible, (recurdese que la recta de regresin
poblacional muestra el valor medio de la variable dependiente para determinados valores de
la variable explicativa). Este es el caso de la homoscedasticidad o igual varianza.Sin
embargo, la Figura 1b) muestra que aunque el nivel medio de los ahorros aumenta a medida
que lo hace la renta personal disponible, la varianza del ahorro no permanece igual para
todos los niveles de renta sino que aumenta con la renta personal disponible. Este es el caso
de la heteroscedasticidad o varianza desigual. Dicho de otra manera la figura b) muestra
39

Econometra I

Curso 2013-2014

que la gente de rentas elevadas ahorra, de media, ms que la gente de rentas bajas, pero
tambin hay ms variabilidad en sus ahorros.
Figura 111

(a)Homoscedasticidad (igual varianza)

(b) Heteroscedasticidad (varianza desigual)

Simblicamente podemos expresar la heteroscedasticidad como:


Var(Y / X i ) Var i i2 2 wi

i 1,2, ,...N

Obsrvese el subndice de i2 , denota que la varianza de i ya no es constante sino que


vara con cada observacin.
Causas: La heteroscedasticidad se presenta, normalmente, cuando trabajamos con datos de
corte transversal. Por ejemplo, en modelos donde el ahorro es funcin del ingreso (a mayor
ingreso, ms posibilidades de seleccin respecto a la forma de disponer de dicho ingreso,
mayor probabilidad de que la varianza del ahorro aumente con el ingreso), estudios sobre
los beneficios de empresas (mayor varianza de los beneficios al aumentar el tamao de la
empresa) etc.

Tambin suele presentarse cuando en el modelo existen ciertos errores de especificacin,


por ejemplo, algn error de omisin, cambio estructural no incorporado,
Consecuencias de aplicar MCO a un modelo con heteroscedasticidad

Bajo los supuestos del MRLC los estimadores MCO son los mejores estimadores lineales, e
insesgados, pues son los que tienen varianza mnima: son ELIO y eficientes. En el caso de
que exista heteroscedasticidad (o autocorrelacin) en el modelo las principales
consecuencias son las siguientes:

11

Gujarati (2006): Principios de Econometra. McGraw Hill.


40

Econometra I

Curso 2013-2014

1) Los estimadores MCO siguen siendo lineales, insesgados, consistentes y con


distribucin normal pero ya no tienen varianza mnima. Esto es as incluso en grandes
muestras.
2) Las frmulas habituales para calcular las varianzas de los estimadores dejan de ser
correctas y suelen dar varianzas sesgadas.
La expresin habitual de la matriz de Var-Cov de MCO es 2 X ' X 1 sin embargo,
si existe heteroscedasticidad se demuestra que12

( X ' X ) 1 X ' X ( X ' X ) 1

El sesgo tambin se produce por el hecho de que el S 2 , el estimador convencional de 2 ,


ya no es un estimador insesgado y recurdese que S 2 interviene en el estimador de las
varianzas de los estimadores. S 2 tambin deja de ser consistente.
3) Los EMCO del vector paramtrico no coinciden con los EMV ya que E ' 2 I
4) Como consecuencia, los contrastes de hiptesis y los intervalos de confianza basados en
el la t y F ya no son fiables. Por tanto, existe la posibilidad de extraer conclusiones
errneas si se utilizan los procedimientos convencionales de contrastacin de hiptesis.
7.2.- Procedimientos para detectar la heteroscedasticidad:

La heteroscedasticidad, como la autocorrelacin, es un problema de las perturbaciones, que


son variables inobservables. Por tanto, para detectarla, vamos a utilizar los residuos de la
estimacin mnimo cuadrtica ordinaria, cuyos valores se pueden considerar como
estimaciones de las perturbaciones. Entre los mtodos de deteccin de la
heteroscedasticidad hay que distinguir los procedimientos grficos y los procedimientos
inferenciales.
Anlisis grfico de los residuos

Es un mtodo orientativo, til cuando no tenemos informacin sobre la existencia de


heteroscedasticidad, ni sobre la estructura de las varianzas de las perturbaciones, pero se
piensa que dicha varianza es funcin de algn regresor.

Diagrama de dispersin de los residuos con cada uno de los regresores, X ji . En el


eje de abcisas el regresor y los residuos, los residuos al cuadrado o su valor
absoluto, ei , ei2 o | ei | , en el eje de ordenadas.

Si dependiendo de los valores de X j , los residuos son significativamente distintos de


tamao, este hecho indicara que la dispersin de las perturbaciones depende del valor de
X j y, por tanto, sus varianzas no seran constantes. Esta circunstancia se visualiza muy
bien en un diagrama de dispersin entre el regresor y los residuos. La Figura 2 muestra una
forma habitual de heteroscedasticidad: como se observa, los residuos son mayores
(positivos o negativos) para valores grandes del regresor.

12

MCO X ' X

sustituyendo A:

1 X ' Y AY

2
siendo A no aleatorio Var Cov ( ) A Var Cov (Y ) A' A A'

Var Cov ( ) X ' X

1 X ' 2 X X ' X 1
41

Econometra I

Curso 2013-2014

Residuos

Figura 213

Variable explicativa X

Por su parte, un diagrama de dispersin entre un regresor y los residuos al cuadrado no slo
puede servir para mostrar indicios de heteroscedasticidad; en este caso, la forma de la nube
de puntos ( X ji , ei2 ) puede sugerir la forma funcional que presenta la heteroscedasticidad.
As, la nube de puntos de la Figura 3 indicara que ei2 depende lineal o cuadrticamente de
X ji . Dado que ei2 se puede considerar una estimacin de Var i , estimacin con un nico

valor muestral14, el grfico sugerira cual es el regresor culpable de la heteroscedasticidad y


la forma funcional de la misma. En este caso, Var i 2 X ji o Var i 2 X 2ji .

Residuos al cuadrado

Figura 315

V ariable explicativa X

La Figura 4 representa posibles patrones para ei2 y, por tanto, para Var i . As, la Figura
4c) siguiere una forma lineal, mientras que 4d) y 4e) cuadrtica. Por su parte 4a) refleja la
no existencia de heteroscedasticidad y la forma en el caso de 4b) es ms difcil de ajustar.

13

Gujarati (2006): Principios de Econometra. McGraw Hill.


Dado que la perturbacin i es inobservable, podemos considerar el residuo e i como una muestra de
tamao 1 de la variable i . Dado que E i 0 , entonces,
~
Va~
r i E ( i2 ) ei2
esto es, estimamos la media de las perturbaciones al cuadrado con la media de los cuadrados de la muestra de
residuos, pero como slo se dispone de un valor muestral, e i , esta media ser ei2 .
14

15

Gujarati (2006): Principios de Econometra. McGraw Hill.


42

Econometra I

Curso 2013-2014
Figura 416

Puede que la heteroscedasticidad no est provocada por un nico regresor, sino


conjuntamente por varios. En este caso, sera conveniente obtener el diagrama de dispersin
con la estimacin de la variable a explicar, Yi (que no es ms que una combinacin lineal
de los regresores) en el eje de abscisas, y los residuos, los residuos al cuadrado o su valor
absoluto en el eje de ordenadas. De esta manera, detectaramos la heteroscedasticidad
causada por los regresores conjuntamente.
Veamos estos grficos con un ejemplo:
EJEMPLO3: Una cadena de tiendas de calzado de vestir con 95 establecimientos de venta
al pblico en toda Espaa en el ao 2002, est interesada en saber cmo responden las
ventas de sus tiendas en funcin de la demanda de productos de calidad y de los gastos en
publicidad decorativa en cada una de ellas. Para medir la demanda de productos de
calidad utiliza el precio medio de venta en cada una de sus tiendas (PRECIO).
Las variables utilizadas son: VENTAS, PRECIO Y PUBLICIDAD.
El modelo estimado por MCO con el programa Eviews6 es el siguiente:

16

Gujarati (2006): Principios de Econometra. McGraw Hill.


43

Econometra I

Curso 2013-2014

Realizamos la representacin grfica de los residuos al cuadrado frente a cada una de las
variables explicativas:

En ambos diagramas se detecta claramente que para los valores grandes de los regresores
la variabilidad aumenta lo cual es indicativo de la existencia de heteroscedasticidad y su
patrn de comportamiento sugiere una relacin lineal. Por otro lado si realizamos el
diagrama de los residuos al cuadrado frente a la variable estimada (ventasf), el resultado
es:

Otra representacin grfica para detectar la heteroscedasticidad es el diagrama de


dispersin entre cada una de las variables explicativas, X ji , en el eje de abscisas y
la variable a explicar, Yi , en el eje de ordenadas.
44

Econometra I

Curso 2013-2014

En muchas ocasiones, el ajuste lineal entre Y y X j es ms o menos bueno (residuos


pequeos) para valores pequeos de X j , mientras que este ajuste empeora para valores
grandes de X j (residuos grandes). El siguiente grfico muestra este hecho para nuestro
ejemplo que pone en evidencia la heteroscedasticidad del modelo.

Pruebas estadsticas (contrastes de hiptesis)

La hiptesis nula en todas las pruebas es la hiptesis de homoscedasticidad, es decir,


varianzas constantes de las perturbaciones y la hiptesis alternativa presencia de,
heteroscedasticiad. As,

H o : Var i E i2 2

H1 : Var i 2

Por tanto, se trata de probar si el valor esperado de i2 se relaciona o no, con una o ms
variables explicativas y dado que este valor no es observable utilizaremos en su lugar ei2 .
De esta manera, si la Ho es falsa, ei2 ser cualquier funcin de una o ms variables
explicativas.
Con esta idea vamos a plantear (de los muchos que existen) varios contrastes que no slo
nos permitirn detectar la posible existencia (o no) de heteroscedasticidad sino que, en el
caso de que la haya, algunos permitirn darnos una idea sobre la forma que adopta la
misma.
Contraste asinttico de White

La idea del test17 se basa en ver si los residuos mnimo cuadrticos ordinarios al cuadrado
son de algn modo funcin de los regresores; en este caso, deduciramos que la varianza de
las perturbaciones son funcin de los regresores y, por tanto, no son constantes
(heteroscedasticidad). El test de White analiza la significacin de una regresin auxiliar
que trata de explicar los residuos al cuadrado de la regresin inicial, ei 2 , a partir de los
regresores, sus cuadrados y sus productos cruzados dos a dos.

17

Es un test asinttico basado en los multiplicadores de Lagrange.


45

Econometra I

Curso 2013-2014

La hiptesis a contrastar es:


H0: Homoscedasticidad
H1: Heteroscedasticidad
El procedimiento consiste:
1) Estimar por MCO la regresin auxiliar de los residuos MCO al cuadrado del
modelo de partida frente a cada uno de los regresores, cada uno de los regresores al
cuadrado y los productos cruzados de los regresores dos a dos.
2
2
k2( aux ) . Siendo R aux
el
2) Cuando N aumenta, se demuestra que N Raux

coeficiente de determinacin de la regresin auxiliar realizada en 1. La distribucin 2k ( aux )


tiene como grados de libertad el n de regresores de la regresin auxiliar excluido el
trmino constante.
Valores pequeos del estadstico indicaran que la regresin auxiliar no es
2
pequeo), que los residuos al cuadrado y, por tanto, las varianzas de las
significativa ( Raux
perturbaciones, no dependen de los regresores. De este modo, no se rechaza (acepta) la
homoscedasticidad. En cambio, valores grandes llevaran a rechazar la homoscedasticidad.
EJEMPLO3: Las salidas del programa Eviews6 nos proporciona la siguiente salida:

Como puede verse, el p-valor asociado al estadstico de White es igual a 0,0025 lo cual
indica que rechazamos la hiptesis nula y detecta claramente heteroscedaticidad.
Contrastes basados en regresiones

Estos contrastes siguen la misma idea del test de White y suponen que las varianzas de las
perturbaciones son funcin de una o varias variables, generalmente, variables explicativas
del modelo economtrico propuesto.
El procedimiento concreto de la prueba Breusch Pagan consiste en plantear regresiones de
los residuos al cuadrado en funcin de las variables explicativas. Es un test LM y al igual
46

Econometra I

Curso 2013-2014

2
k2( aux ) siendo k el nmero de
que en el de White se puede construir el estadstico N Raux
variables de la regresin auxiliar. Tambin se podra analizar la significacin conjunta de la
regresin. Las variables explicativas incluidas pueden aparecer en sus niveles o como
funciones de ellas, por ejemplo, al cuadrado, el inverso, etc.

La ventaja de este contraste es que permite detectar no slo la existencia de


heteroscedasticidad sino tambin la forma. Esto ltimo es importante para poder solucionar
el problema.
Veamos las salidas del Eviews en el EJEMPLO3:
Contraste de Breush-Pagan-Godfrey sobre las dos variables explicativas:

Rechaza la hiptesis nula por lo que detecta claramente heteroscedascidad


Contraste de Breush-Pagan-Godfrey sobre cada una de las dos variables explicativas:

Detecta que la varianza de las perturbaciones es una funcin del precio y por tanto no es
constante.
7.3.- Estimacin del modelo y prediccin
A) Mnimos cuadrados ponderados

Para ver en qu consiste el mtodo de Mnimos Cuadrados Ponderados (MCP) vamos a ver
intuitivamente por qu no son eficientes los estimadores de MCO. Para ello vamos a partir
de un modelo de dos variables representado en la Figura 5. La Figura 5a muestra una
poblacin hipottica (Y) frente a diversos valores de la variable (X). Como se comprueba,
la varianza de la distribucin de Y correspondiente a una determinada X no es constante, lo
47

Econometra I

Curso 2013-2014

que indica la presencia de heteroscedasticidad en el modelo. Supongamos que elegimos


aleatoriamente un valor Y para cada valor X. Las Y seleccionadas estn marcadas con un
punto y es la muestra representada en la Figura 5b a partir de la cual estimamos el modelo.
Como ya vimos en los primeros temas, si estimamos la recta de regresin poblacional a
partir de nuestra muestra seleccionada (Figura 5b) utilizando MCO, lo que hacemos es
minimizar la suma de los errores al cuadrado ei2
i

Es decir, cada error recibe la misma ponderacin independientemente de que provenga de


una poblacin con una varianza ms elevada o una varianza pequea (compara los puntos
Y1 e Yn). Esto no parece muy razonable. Lo ideal es que diramos ms ponderacin a las
observaciones provenientes de poblaciones con menor varianza (ms representativas de su
valor medio) que a las de varianza mayor (menos representativas de su valor medio). Esto
nos permitir estimar con mayor precisin la recta de regresin poblacional y es
precisamente lo que hace el Mtodo de Mnimos Cuadrados Ponderados, en el que
minimizamos
ei

MCP min
i

por tanto, damos ms peso a las observaciones con menor desviacin tpica y menos a las
que tienen una desviacin tpica mayor. Figura 518
Figura 5

Veamos cmo se obtienen los estimadores de MCP


Estimador de Aitken o de MCG o de MCP

Se obtiene minimizando la suma de los cuadrados de los residuos ponderados:


2

1
~
. El resultado es el siguiente: MCG X ' 1 X X ' 1Y

~
En la prctica, una forma alternativa de derivar el estimador MCG consiste en:
e
min i
i i

18

Gujarati (2006): Principios de Econometra. McGraw Hill.


48

Econometra I

Curso 2013-2014

Transformar el modelo de cara a que las varianzas de las perturbaciones del modelo
transformado sean constantes. Si eso se logra, el modelo transformado no presentar
problemas de heteroscedasticidad y ser un MRLC con lo que la estimacin por MCO
proporcionar los mejores estimadores, pudindose aplicar los procedimientos de inferencia
habituales. De este modo, los estimadores MCP son los estimadores MCO el modelo
transformado.
Por ejemplo, si partimos de un modelo con dos variables explicativas,
Yi 0 1 X 1i 2 X 2 i i ,

i 1,2, , N ,

con heteroscedasticidad ( Var i i2 2 wi ) los mejores estimadores (ELIO) son los


estimadores MCP. Para obtenerlos transformaremos dicho modelo dividindole por la raz
cuadrada de la varianza de las perturbaciones, es decir, por la desviacin tpica. El modelo
transformado resultante ser:

Yi
wi

wi

donde la perturbacin: vi

Var (vi ) Var (

wi

X 1i
wi

i
wi
)

....... k

X ki
wi

vi

cumple la hiptesis de homoscedasticidad,


1

( wi )

var( i )

2 wi
wi

2 cte

As, el modelo transformado no presenta el problema de la heteroscedasticidad (es un


MRLC) y los mejores estimadores se obtienen aplicando el mtodo MCO habitual. Los
estimadores MCO de o , 1 , 2 en este modelo transformado son los estimadores por
Mnimos Cuadrados Ponderados (MCP), llamados tambin de Mnimos Cuadrados
Generalizados; donde cada observacin de Y, X1 y X2 se pondera (es decir, se divide) por
la desviacin tpica ( i ). Las observaciones de distribuciones con mayor varianza (o
desviacin tpica) tienen menos peso que aquellas que provienen de distribuciones con
varianza menor. Como el modelo transformado es un MRLC los estimadores MCO (y, por
tanto, los MCP) sern ELIO y consistentes.
Obsrvese que lo que se hace para conseguir perturbaciones con igual varianza es tipificar
cada variable ( Z i ), esto es,
Vi Z i

i E ( i )

i
Var ( i )
i2

El problema radica en que normalmente wi ( o i2 ) no se conoce y por tanto este estimador


no se podra obtener. La solucin consiste en obtener una estimacin de la matriz y
obtener lo que se denomina el estimador de mnimos cuadrados generalizados factible:
~
1 X 1 X '
1Y
F X '

Donde se ha estimado la matriz de varianzas-covarianzas de las perturbaciones, es decir, se


han estimado los elementos de la diagonal principal, las varianzas de las perturbaciones.
El conocimiento de la autntica varianza de las perturbaciones es muy infrecuente. Por ello
es necesario plantearse cmo obtener un estimador de la matriz ? La respuesta es
49

Econometra I

Curso 2013-2014

recurrir a algn supuesto o hiptesis sobre i2 y transformar el modelo de regresin


original para que el modelo transformado cumpla el supuesto de homoscedasticidad.
A la hora de hacer supuestos o hiptesis sobre la forma de la heteroscedasticidad, los
grficos y contrastes desarrollados anteriormente sirven de gua. Las hiptesis ms
frecuentes consisten en suponer que las varianzas de las perturbaciones son proporcionales
a los valores absolutos de un determinado regresor, o bien a los cuadrados de los valores de
dicho regresor o de Y estimado. Es decir, la verdadera varianza es: Var i 2 wi
Como no se conoce, wi, se estima a travs de:
w i X ji

o bien w i X 2ji

o bien w i Yi 2

Partiendo de cualquiera de estos supuestos la forma de proceder es la misma que si la


varianza fuera conocida. As, si suponemos que Var i 2 wi y que w i X 2ji , el modelo
transformado vendr dado por:
Yi
X 2ji

1
X 2ji

X 1i

X 2ji

....... k

X ki
X 2ji

i
X 2ji

O lo que es lo mismo
Yi
X
X
1
o
1 1i ....... k ki vi
X ji
X ji
X ji
X ji
donde la perturbacin, vi
Var (vi ) Var (

i
X ji

i
X ji

Puede o no cumplir la hiptesis de homoscedasticidad,


1

( X ji ) 2

var( i )

2 wi
X 2ji

??

constante?

Estimando el modelo transformado por MCO, se obtienen los estimadores MCPF (Mnimos
cuadrados ponderados factibles). Pero las propiedades de dichos estimadores dependen de
que se haya utilizado un buen estimador (en general, consistente) de la matriz de varianzas
covarianzas de las perturbaciones (por tanto, de wi). En caso de que as fuera, en el modelo
transformado no habra heteroscedasticidad.
Por lo tanto, en este caso es necesario comprobar que el modelo transformado ya no tiene
heteroscedasticidad. Para ello se pueden utilizar los grficos y contrastes vistos
anteriormente. De esta manera, si podemos aceptar que en el modelo transformado la
perturbacin es homoscedstica, afirmaremos que hemos estimado correctamente la matriz
de varianzas covarianzas de las perturbaciones y, consecuentemente el estimador MCPF
tiene las propiedades asintticas del estimador MCP. En caso contrario, la estimacin
ponderada no mejora ninguna de las propiedades del EMCO del modelo original. De hecho,
si no se estima adecuadamente = 2 , el EMCGF no tiene ninguna propiedad.
Veamos la estimacin ponderada con el programa Eviews en nuestro EJEMPLO3
suponiendo en base al test de Breusch-Pagan-Godfrey que : Var i 2 precio i

50

Econometra I

Curso 2013-2014

Contrastamos si existe o no heteroscedasticidad en este modelo:

La conclusin es que no se rechaza la hiptesis nula de homoscedasticidad por tanto el


estimador factible sera consistente y asintticamente eficiente.
Sin embargo si hubisemos supuesto como hiptesis Var i 2 publicidad i

Rechazaramos la hiptesis nula y por tanto seguira existiendo heteroscedasticidad por lo


que el estimador factible no tendra ninguna propiedad.

51

Econometra I

Curso 2013-2014

B) Mnimos Cuadrados Ordinarios con la matriz de varianzas y covarianzas de White

A veces resulta difcil encontrar una hiptesis adecuada para la estructura de la varianza de
las perturbaciones ( i2 ). En estos casos la estimacin ponderada no proporciona mejores
estimadores que la aplicacin de MCO al modelo original. Por ello, en estas situaciones es
conveniente seguir estimando el modelo original por MCO pero calculando correctamente
los estimadores de las varianzas de los estimadores para que la inferencia realizada, a partir
de los resultados del modelo as estimado, sea vlida.
White ha desarrollado un procedimiento para calcular correctamente la desviacin tpica de
los estimadores MCO en presencia de heteroscedasticidad, que permite poder seguir
utilizando los test de la t y de la F, aunque slo son vlidos asintticamente, es decir, en
muestras grandes.
El estimador consistente de

1
1
de White es19: WHITE N X ' X V X ' X

En nuestro EJEMPLO3, la estimacin MCO con la matriz de White da el siguiente


resultado:

Como vemos los estimadores de los parmetros son los mismos que obtuvimos en la
estimacin de mnimos cuadrados ordinarios pero sus errores estndar son distintos y por
tanto, tambin los estadsticos t (que no eran vlidos en la estimacin de mnimos
cuadrados ordinario) que ahora son vlidos asintticamente.
C) Formas alternativas para corregir la heteroscedasticidad

Existen otras vas para solventar los problemas de heteroscedasticidad que no pasan por
cambiar el mtodo de estimacin sino que conllevan realizar transformaciones en los datos
para que la variabilidad se reduzca. Concretamente, la transformacin de los datos tomando
logaritmos y por tanto estimar el modelo denominado log-lineal que soluciona en muchos

19

donde

1
N

e12
X '



X , siendo ei el error mnimo cuadrtico ordinario.
2
eN
52

Econometra I

Curso 2013-2014

casos los problemas de heteroscedasticidad detectados. Otras posibilidades son deflacionar


las series (si es que son monetarias), trabajar en ratios o en tasas de crecimiento.
Veamos este supuesto en nuestro EJEMPLO3 transformando las series aplicando
logaritmos:

Veamos con el test de White si existe heteroscedasticidad:

Como vemos el estadstico de White es igual a 8,69 y el p-valor asociado es igual a 0,122
por lo tanto no rechazamos la hiptesis nula por lo que podemos concluir que en este
modelo no existe heteroscedasticidad.
Prediccin

A la hora de realizar una prediccin hay que tener en cuenta que lo que nos interesa es
Y
predecir la variable endgena del modelo original (Yi), no del transformado i
w
i
Eviews proporciona siempre la prediccin de la variable dependiente del modelo original.

53

Econometra I

Curso 2013-2014

54

Econometra I

Curso 2013-2014

Anexo 1.- Modelos no lineales

A) No linealidad en las variables:


* En las variables explicativas

Ej: Yt 0 1 e X 1 t 2 X 22t t . Basta con definir nuevas variables de la forma:


Z 1t e X 1t y Z 2 t X 22t

* En las variables explicadas

Ej: YtXt + 1lnYt = 2Xt + t. Sera imposible expresar Y como funcin de X y .


B) No linealidad en los parmetros:
1.b) Modelos intrnsecamente lineales

Son modelos fcilmente linealizables mediante sencillas transformaciones.


*
*
*
*
Ejs: Yt = 0 X t1 t lnYt = ln0 +1lnXt +lnt Yt 0 1 X t t

Funcin de produccin Cobb-Douglas: Qt AK t Lt t


lnQt = lnA +lnKt +lnLt+lnt Qt* K t* L*t t*
Se estima el modelo transformado y una vez conocidos los estimadores, se deshacen los
* ln

anti log
* e *0
cambios. As:
0

1 no hay que realizar ningn cambio


Interpretacin de los parmetros en los modelos no lineales
La hiptesis de linealidad del MRLC supone la existencia de una relacin lineal en los
parmetros, pero no significa que esa linealidad tenga que darse entre las variables. En
Economa, las relaciones entre las variables no siempre son lineales. As, por ejemplo, la
demanda de un producto no necesariamente est en relacin lineal directa con la renta, si el
incremento en la renta no supone un incremento equivalente en el consumo del producto.
Otras formas funcionales:
Modelo

Pendiente
1Y / X

Elasticidad20

Lineal en logaritmo

ln Yt 0 1 ln X 1t t

Semilog en Y

ln Yt 0 1 X 1t t

1Y

1 X (*)

Semilog en X

Yt 0 1 ln X 1t t

11 / X

11 / Y (*)

Recprocos

Yt 0 11 / X 1t t

11 / X 2

11 / XY (*)

(*) Indica que el coeficiente de la pendiente vara dependiendo del valor asumido para X, Y
o ambas. Cuando no se especifica ningn valor de X o Y, las elasticidades suelen medirse en los
valores medios de las variables.
Fuente: Gujarati (2006): Principios de Econometra, pg. 275.
20

La elasticidad de Y respecto a X recoge la variacin porcentual de Y ante una variacin porcentual de X, E

Y X
X Y

55

Econometra I

Curso 2013-2014

Propiedades de los estimadores


a) Si los parmetros no sufren transformacin, los estimadores conservan las
propiedades de MCO.
b) Si sufren transformaciones lineales (sumas y restas) los estimadores conservan
las propiedades de los estimadores de MCO pues la esperanza es un operador lineal.
c) Si se realizan transformaciones logartmicas, los estimadores no conservan las
propiedades finitas, pero dado que los estimadores de MCO coinciden con los de MV y
estos tienen la propiedad de la invarianza, se mantendran las asintticas.
Problemas con el coeficiente de determinacin
a) Si el regresando no sufre modificacin, el R2 encontrado para el modelo
transformado sirve tambin para medir la bondad del ajuste.
b) Pero si existe transformacin en el regresando, el R2 nos medir la bondad del
ajuste del modelo transformado, es decir, no nos medir la variabilidad de Y sino por
ejemplo del lnY.
2.b) Modelos intrnsecamente no lineales

Son aquellos modelos que no se pueden linealizar. Son de la forma:


Ejs. Yt = 1 X t2 + t

Funcin de produccin CES: Yt L p (1 ) K p

n/ p

Anexo 2.- Coeficientes Beta21

Los parmetros estimados de un modelo lineal son valores absolutos y dependen de las
unidades de medida en las que se expresen las variables del modelo.
Una variable no es ms importante que otra por tener un parmetro mayor. Esto ocurre
cuando, siendo ambos parmetros significativos, ambas variables estn medidas en las
mismas unidades.
Una solucin a este problema es calcular unos coeficientes estandarizados o coeficientes
beta a partir de la normalizacin de las variables (restarles su media y dividirles por su
desviacin tpica)

Yi Y
X X1
X Xk
1* 1i
... k* ki
ui
SY
S X1
S Xk
donde la relacin entre los coeficientes beta y los coeficientes estimados originales es:
SXj
*j j
.
SY

21

Pulido (2001): Modelos economtricos. Pirmide.


56

Você também pode gostar