Escolar Documentos
Profissional Documentos
Cultura Documentos
79
CAPTULO IV
Anlisis confirmatorio:
modelos de regresin espacial
CAPTULO IV.
ANLISIS CONFIRMATORIO: MODELOS DE
REGRESIN ESPACIAL
IV.1. Especificacin de los efectos espaciales en modelos de regresin
IV.1.1. Modelos de dependencia espacial o modelos espaciales dinmicos
IV.1.2. Modelos de heterogeneidad espacial
IV.2. Mtodos de estimacin y contraste en modelos de regresin espacial
IV.2.1. Estimacin y contrastes en el modelo bsico de regresin lineal.
IV.2.2. Estimacin y contrastes en modelos de dependencia espacial
IV.2.3. Estimacin y contrastes en modelos de heterogeneidad espacial
80
Dada la importancia y amplia difusin de este tipo de modelizacin, recomendamos al lector interesado la
lectura de Anselin (1988A) y Moreno y Vay (2000), donde se presentan las principales especificaciones de
los efectos espaciales en modelos de datos de panel: modelos SUR-espaciales, modelos de componentes del
error (MCE) y modelos de ecuaciones simultneas.
81
En los Apartados siguientes, se ampliar este tema incluyendo los mtodos de estimacin,
contrastacin y validacin ms frecuentemente citados en la literatura, para alguno de estos
modelos. Asimismo, en el Anexo I, se presentan algunos ejemplos de modelizacin
economtrica espacial aplicados a la economa y, en general, las ciencias sociales.
29
Esta exposicin intenta completar las tipologas propuestas por Anselin (1988A) y Florax y Folmer (1992)
que han sido presentadas, a su vez, por otros muchos autores, con algunas variaciones (ver por ejemplo,
Cerejeira, 1998; Moreno y Vay, 2000). La denominacin de los modelos se ha traducido del ingls teniendo
en cuenta los trabajos en espaol de Mur (1999) y, sobre todo, Moreno y Vay (2000).
82
83
y = Wy + u
u N 0, 2 I
donde y:
W:
:
u:
Eq. IV.1.1.
Esta formulacin describe una situacin en la que los valores de una variable (y) en
un punto geogrfico (i) estn condicionados por los valores que adopta dicha variable en
otro u otros puntos geogrficos (j), y viceversa, dando lugar a fenmenos de agrupamiento
de valores (altos/bajos) de dicha variable en determinadas zonas del espacio geogrfico.
Dicho en trminos estadsticos, la Cov(yi,yj) 0. La simultaneidad en la relacin de
dependencia entre yi, yj, que viene reflejada por una flecha de doble direccin en la Figura
IV.1.1., no tiene lugar en el mbito temporal, donde el fenmeno de autocorrelacin tiene
un carcter secuencial, no simultneo.
La especificacin de este modelo SAR(1) expresa la ausencia de aleatoriedad
espacial en una variable (y) de una manera muy bsica, sin considerar ningn tipo de
relacin causal, en la que otras variables exgenas (X) puedan ser explicativas de esta
peculiar distribucin de la variable endgena (y), como se ver en otro tipo de modelos
Modelo bsico de regresin lineal (MBRL)
u N 0, 2 I
siendo X:
:
Eq. IV.1.2.
84
El modelo del error espacial (spatial error model) es, con mucho, la especificacin
ms utilizada en los casos en que el MBRL resulta ineficaz como explicativo de un
fenmeno con autocorrelacin espacial. La existencia de ciertos factores o variables no
explcitamente considerados en el modelo trasladan hacia los trminos del error la
configuracin de agrupacin de valores (autocorrelacin) presente en la variable endgena.
Por eso, en la Figura IV.1.1., las relaciones simultneas de dependencia espacial existentes
entre valores de la variable endgena (y), representadas a travs de una flecha de doble
direccin, se trasladan de esta variable hacia el trmino de perturbacin aleatoria. Es decir,
el efecto de dependencia espacial en la variable endgena (y) es explicado, no slo por las
variables independientes presentes en el modelo, sino por otras que se encuentran ausentes
(dependencia espacial residual). En el Anexo I, se presentan bastantes ejemplos de este tipo
de modelos (por ejemplo, Anselin, 1988A; Haining, 1994, 1995; Moreno y Vay, 2000;
Baller et al., 2001; Ceccato et al., 2001; Sandberg y Johanson, 2001; Thomas, 2001).
Habitualmente, la distribucin de la perturbacin aleatoria suele especificarse como
un proceso autorregresivo de orden 1 o AR(1), como en el caso siguiente:
85
y = X + u
u = Wu +
Eq. IV.1.3.
N (0, I )
2
donde u:
:
:
N (0, 2 I )
Eq. IV.1.4.
Algunos autores (Cliff y Ord, 1981; Sneek y Rietveld, 1997; Mur, 1999; Anselin,
2001) proponen tambin la especificacin de procesos espaciales de medias mviles para el
trmino de la perturbacin aleatoria, demostrando que una especificacin incorrecta de la
perturbacin aleatoria como un proceso AR(1), en lugar de MA(1), produce estimadores
sesgados30. En este caso, el modelo del error espacial tendra la siguiente forma:
y = X + u
u = W +
N (0, 2 I )
Eq. IV.1.5.
Sneek y Rietveld (1997) atribuyen la impopularidad del modelo MA(1), frente a la especificacin AR(1), a
la mayor complejidad que presenta la estimacin de estos modelos, slo posible bajo ciertas restricciones. En
el Apartado siguiente, se expone, de forma resumida, la nueva taxonoma de modelos de regresin espacial
propuesta por Anselin (2001), en la que este autor presenta la especificacin de medias mviles como un
fenmeno de autocorrelacin local frente a la especificacin autorregresiva, considerada como global.
86
y = Wy + X + u
u N 0, 2 I
Eq. IV.1.6.
Al igual que en el modelo del error espacial, esta expresin puede tambin adoptar
una forma reducida que incluye la especificacin del modelo del error espacial (aunque en
una forma no anidada), de modo que el valor de la variable endgena (y) en un punto (i) se
encuentra afectado no slo por el valor de las variables exgenas en dicho punto (i), sino
tambin en el resto de localizaciones, a travs del multiplicador espacial (1 W)-1, tal
como se expresa en la Figura IV.1.1. con las flechas dobles que parten de los valores de la
variable exgena en los puntos (i,j) hacia los valores de yi, yj.
y = (I W ) X + (I W ) u
1
u N 0, 2 I
Eq. IV.1.7.
Existen en la literatura varios contrastes que se han definido para obtener una
correcta identificacin en situaciones de autocorrelacin espacial de la variable dependiente
no totalmente explicada por la relacin estructural del MBRL. En el caso de revelarse el
modelo del retardo espacial como el ms adecuado, se estara poniendo de manifiesto un
proceso de difusin espacial en la variable analizada, de forma que unos valores altos/bajos
de la variable endgena (y) en un lugar (i), realmente estaran incrementando la
probabilidad de ocurrencia de valores altos/bajos de la misma en lugares vecinos
(adquiriendo as un cierto carcter de prediccin temporal). ste sera, por ejemplo, el caso
expuesto en Baller et al. (2001) para la tasa de homicidios cometidos en los estados del Sur
de los EEUU (ver Anexo I).
N (0, ) ; ii = hi (Z ) ; hi > 0
donde y:
W1 :
Eq. IV.1.8.
87
= [ , 1 , 2 , , , ]
Eq. IV.1.9.
u N 0, 2 I
Eq. IV.1.10.
88
presentado en el Apartado III.2.3.2., de forma que se obtenga, por ejemplo, para la variable
endgena (y) espacialmente autocorrelacionada, otra variable (y*) sin tendencia espacial,
del modo siguiente:
W
y i i
y i =
Gi (d )
Eq. IV.1.11.
y = W1 y + X 1 + u
u N 0, 2 I
Eq. IV.1.12.
89
90
Debe advertirse tambin que la inclusin del retardo espacial Wy evita los
problemas de identificacin y estimacin que se produciran al tratar de recoger, con
insuficientes grados de libertad, la totalidad de interacciones existentes entre cada regin i y
sus vecinas.
y = X 1 + W 2 R 2 + u
u N 0, 2 I
Eq. IV.1.13.
y = W1 y + X 1 + W 2 R 2 + u
u N 0, 2 I
Eq. IV.1.14.
91
y = X 1 + u
u = W3 u +
N (0, I )
Eq. IV.1.15.
y = X 1 + u
u = 1W31u + 2W32 u +
N (0, I )
Eq. IV.1.16.
donde W31 , W32 son las matrices de interaccin espacial, correspondientes a la perturbacin
aleatoria, de orden 1 y 2 respectivamente.
Adems, como ya se ha expuesto, tambin podran derivarse procesos de medias
mviles en la perturbacin aleatoria, SMA(q). Por ejemplo, en Cliff y Ord (1981) se sugiere
un modelo sencillo de medias mviles en el trmino de error, SMA(1), que podra ser
tambin generalizable a rdenes superiores:
y = X 1 + u
u = W3 +
N (0, 2 I )
31
Eq. IV.1.17.
92
y ij = 0 + N ij 1 + S i 2 + S j 3 + u ij
u ij = i + j + ij
i = 1W i + 1 ; 1 N (0, 2
j = 2W j + 2 ; 2 N (0,
2
2
ij = 3W ij + ij ; N (0, 2 )
donde yij:
Nij:
Si:
Sj:
W:
Eq. IV.1.18.
flujo entre dos regiones i, j, para i = 1,...,N y j = 1,...,T regiones del grupo de
N regiones de origen y T regiones de destino, respectivamente.
variables relativas a redes o vas de comunicacin entre i, j (tiempo de viaje,
coste, frecuencia de desplazamientos, etc.)
variables socioeconmicas relativas a las regiones origen
variables socioeconmicas relativas a las regiones destino
matriz de pesos espaciales en la que cada elemento es una funcin de la
distancia existente entre las regiones i,j.
N (0, I )
Eq. IV.1.19.
93
y = W1 y + X 1 + u
y = W1 y + X 1 + + W3
u = W3 +
2
N 0, I
Eq. IV.1.20.
N (0, 2 I )
Eq. IV.1.21.
N (0, 2 I )
Eq. IV.1.22.
94
Los autores demuestran que la estimacin por MCG, as como el mtodo MV restringido,
son mejores que MCO y MV, respectivamente.
Anselin (2001E) formula una nueva taxonoma para aquellos modelos de regresin
que expresan externalidades (spillovers). Las externalidades espaciales constituyen un
fenmeno emergente en las ciencias sociales como, por ejemplo, la economa, a travs de
los modelos de interaccin espacial que introducen relaciones de interdependencia entre los
actores de un sistema, y tambin la sociologa o la poltica, con el renacimiento de los
estudios de la Escuela de Chicago sobre procesos de vecindad.
La verificacin de estas externalidades espaciales, la medida de su fuerza y
recorrido exigen la especificacin y estimacin de modelos de econometra espacial. Sin
embargo, aunque el concepto de dependencia espacial es fcil de captar, no resulta tan claro
saber exactamente la forma en que sta se produce y, por tanto, la especificacin concreta
del modelo (la identificacin de los parmetros a estimar).
Para ello, el autor parte de una forma reducida de los modelos de regresin, en la
que las externalidades (spillovers), se expresan como multiplicadores espaciales. Aunque
los modelos espaciales de regresin lineal suelen expresarse en la forma estructural, se
propugna, en este caso, la transformacin de la misma en su correspondiente forma
reducida, caracterizada porque, en la parte derecha de la ecuacin, slo se incluyen
variables exgenas, la perturbacin aleatoria o transformaciones espaciales de las mismas.
La gran innovacin de este enfoque estriba en la diferenciacin que se hace, en el
contexto de los modelos de regresin lineal, entre dependencia global y local (dependiendo
de que los procesos de dependencia espacial sean SAR o SMA, respectivamente)32, que dan
lugar a diversas especificaciones, segn que los retardos espaciales afecten a la variable
endgena (Wy), variables explicativas (WX) y/o la perturbacin aleatoria (Wu).
En un contexto prctico, es importante conocer hasta qu punto la influencia
ejercida sobre el valor de una variable en una localizacin geogrfica determinada depende
de circunstancias referentes a las localizaciones inmediatamente adyacentes a la misma
(dependencia local) o a todas las localizaciones del sistema espacial considerado
(dependencia global).
32
Debe advertirse que el punto de vista de la econometra espacial difiere del propio de la estadstica espacial
en su comprensin de los procesos autorregresivos (SAR) y de medias mviles (SMA), considerados en una
perspectiva de simultaneidad (la primera) frente al concepto de condicionalidad propio de la perspectiva
geoestadstica. En efecto, la estadstica espacial habla de procesos CAR, en los que el valor de variable en una
localizacin se encuentra condicionado a la presencia de valores (similares o diferentes) de la misma en
localizaciones vecinas, siendo este enfoque muy interesante en contextos de prediccin temporal. La
econometra espacial, por su parte, entiende los procesos SAR como explicativos de una estructura espacial
completa simultnea.
95
N (0, 2 I )
Eq. IV.1.23.
u = I W
Eq. IV.1.24.
{[
E (uu ') = E I W
Eq. IV.1.25.
[I W ]
= 1 + W + 2W 2 + ...
Eq. IV.1.26.
96
Eq. IV.1.27.
Se trata de modelos en los que se han omitido una o ms variables con dependencia
espacial, de forma que este efecto se traslada al trmino de la perturbacin aleatoria, que se
distribuye como un proceso autorregresivo (SAR). ste sera el caso, por ejemplo, del
efecto que produce la calidad del aire en un lugar (o en lugares cercanos a uno dado), en un
modelo de precios hednicos de la vivienda, cuando no se dispone de medidas precisas que
midan esta variable. Este efecto global de dependencia espacial, omitido del modelo, est
presente en la perturbacin aleatoria.
Los efectos globales, especificados como un proceso SAR en el trmino de error,
podran expresarse en forma reducida, a partir de la forma estructural ms conocida, del
modo siguiente:
y = X + I W
y = X + u
y = X + ( Wu + )
u = Wu +
N 0, 2 I
Eq. IV.1.28.
97
[I W ]( y X ) = [I W ][I W ]
y = Wy + X WX +
Eq. IV.1.29.
Eq. IV.1.30.
]
I)
y= I W
u N 0, 2
X + u
Eq. IV.1.31.
[I W ]y = X + [I W ]u
y = Wy + X + u Wu
Eq. IV.1.32.
Como puede observarse, este modelo tiene dos variables espacialmente retardadas,
la variable dependiente y la perturbacin aleatoria, dando lugar a un modelo SARMA, con
una nica restriccin paramtrica segn la cual el coeficiente autorregresivo de la variable
endgena espacialmente retardada es el nmero opuesto al coeficiente de medias mviles
correspondiente a la perturbacin aleatoria.
98
y= I W
X + I W
Eq. IV.1.33.
para que sea posible, tras las transformaciones pertinentes, la obtencin de la mas conocida
forma estructural del mismo:
y = Wy + X + u
Eq. IV.1.34.
y = I W1
X + I W 2
Eq. IV.1.35.
Por su parte, la correspondiente forma estructural asociada puede derivarse premultiplicando, a ambos lados de la igualdad, por los multiplicadores [I W1][I W2]:
[I W ][I W ]y = [I W ]X + [I W ]u
1
Eq. IV.1.36.
Eq. IV.1.37.
Eq. IV.1.38.
99
Eq. IV.1.39.
Tabla IV.1.1.
Forma estructural
Forma reducida
y = Wy + X WX +
y = X + I W
y = Wy + X + u Wu
y= I W
Ambos
y = W1 y + W2 y W1W2 y + X W2 X + u W1u
y = ( + ) Wy W 2 y + X WX + W
y = Wy + X + u
y = I W1
y= IW
X + u
X + I W 2
X + I W
N (0, 2 I )
Eq. IV.1.40.
100
siendo el parmetro espacial de medias mviles. A diferencia del modelo SAR, en este
caso, la forma reducida no incluye una matriz inversa, dado que, la expresin anterior es ya,
de hecho, una forma reducida. Precisamente, esta ausencia de matrices invertidas da lugar a
una matriz de covarianzas con una dimensin local:
_
_
_
Eq. IV.1.41.
Como puede observarse, los nicos elementos no nulos de esta matriz de varianzas
y covarianzas son aqullos no nulos tambin en la matriz W (o, de forma equivalente, W)
y WW. En el caso, por ejemplo, de W definida como una matriz de contigidades de
primer orden, los elementos no nulos seran los pares de localizaciones con relacin de
vecindad de primer (W, W) y segundo orden (WW), pero no mayor. Es decir, ms all de
estas dos bandas de vecindad, la covarianza espacial ser cero. sta es la razn por la que
se afirma que el recorrido del multiplicador espacial (I + W) de un proceso de medias
mviles SMA es local, inferior al mbito global del multiplicador SAR, (IW)-1.
Modelos de externalidades locales no modelizadas
Eq. IV.1.42.
Eq. IV.1.43.
Eq. IV.1.44.
y = X + WX + u
Eq. IV.1.45.
Como puede observarse, en este caso, la forma reducida coincide con la forma
estructural. Adems, debe advertirse que no es posible considerar un caso de dependencia
(externalidades) espacial local el modelo que incluye la variable endgena espacialmente
retardada, ya que la presencia de dicho retardo en el extremo derecho de la ecuacin (forma
estructural) da lugar a una forma reducida que incluye siempre un multiplicador espacial
global, tipo: [I W].
Modelos de externalidades locales modelizadas y no modelizadas
Eq. IV.1.46.
102
y = X + WX + + W y = (I + W )( X + )
Eq. IV.1.47.
Tabla IV.1.2.
Forma estructural
Forma reducida
y = X + (I + W )
y = X + + W
y = X 1 + WX 2 + u
y = X + WX + u
X
Ambos
y = X 1 + W1 X 2 + (I + W 2 )
y = X 1 + W1 X 2 + + W 2
y = (I + W )( X + )
y = X + WX + + W
Fuente: Anselin (2001E).
Eq. IV.1.48.
(I W )
Eq. IV.1.49.
prctico que los modelos presentados en las Tablas IV.1.1. y IV.1.2., sobre todo, debido a
la interaccin de dos matrices de pesos espaciales diferentes, W1 y W2.
Otra lnea de investigacin abierta sera la correspondiente a modelos hbridos que
combinaran externalidades globales, por ejemplo, en la matriz X de regresores, con otras de
tipo local, en la matriz de perturbaciones aleatorias, u, y viceversa. Ambos tipos de
modelos dan lugar a formas estructurales que incluyen la variable dependiente
espacialmente retardada, Wy, as como retardos espaciales, de orden superior a uno, tanto
en X como en u, con restricciones paramtricas no lineales.
As, en primer lugar, se considera un modelo con externalidades espaciales globales
en la matriz X y locales en u, que tiendra la siguiente forma reducida (suponiendo, para
simplificar, que la matriz de pesos espaciales es la misma en todos los casos):
y = (I W ) X + (I + W )
1
Eq. IV.1.50.
(I W )(y W ) = X
y = Wy + X + + ( )W W 2
Eq. IV.1.51.
Eq. IV.1.52.
(I W )( y X
WX 2 ) =
y = Wy + X 1 WX 1 + WX 2 W 2 X 2 +
Eq. IV.1.53.
Figura IV.1.3.
Poblacin C. Madrid
400 y ms hab.
Menos de 400 hab.
Nivel de renta
Alto
Bajo
La consideracin de la heterogeneidad espacial como un segundo efecto espacial, junto con la dependencia,
fue inicialmente propuesta por Anselin (1988A).
105
donde i2 :
Eq. IV.1.54.
Adems, a estas situaciones hay que aadir las causas habituales del problema
de heteroscedasticidad en los modelos de regresin lineal: omisin de variables
relevantes u otro tipo de especificacin errnea del modelo, que producen en el
trmino de la perturbacin aleatoria una varianza no constante.
Por ltimo, cabe sealar que algunas causas que provocan la heterogeneidad
espacial pueden tambin originar la aparicin de autocorrelacin espacial,
(especificaciones errneas o errores de medida, sobre todo), siendo necesaria la
contrastacin de ambos efectos conjuntamente (Anselin, 1988A).
N (0, ) ; ii = hi (Z ) ; hi > 0
Eq. IV.1.55.
107
y = X + u
Var (u i ) = i2 I
E [uu '] =
Eq. IV.1.56.
donde Var(u):
Z:
:
Eq. IV.1.57.
Eq. IV.1.58.
siendo i:
yi:
Xi:
i:
i.
fi( ):
Eq. IV.1.59.
Es decir, de este modelo se deriva que existe una relacin funcional concreta para
explicar el valor de la variable endgena en cada localizacin (i), producindose el llamado
problema de los parmetros incidentales (incidental parameter problem). Este problema
consiste en la imposibilidad evidente de estimar el grupo de N vectores de parmetros i
dada una muestra de N observaciones, ya que se carece de suficiente informacin en dicha
matriz de datos con la que poder obtener una estimacin para cada observacin espacial.
109
donde X i :
i:
Eq. IV.1.60.
i = + i
siendo :
i:
34
Eq. IV.1.61.
constante
perturbacin aleatoria de distribucin normal, con media nula y matriz de
E (u i ) = 0
u i = X i i
V (u i ) = X i i X i
Eq. IV.1.62.
i = ( i ) =
N (0, 2 I )
w (
j i
ij
)+ i
Eq. IV.1.63.
O tambin:
i =
w
j i
ij
j +i
Eq. IV.1.64.
correspondindose el subndice j con las unidades vecinas a i, definidas por los elementos
no nulos (wij) de la matriz W de pesos espaciales. Segn esto, la perturbacin aleatoria, ,
correspondiente al vector de parmetros cambiantes ( i), se distribuye como un proceso
espacial autorregresivo de orden uno, SAR(1), del modo siguiente:
= W +
= (I W )1
Eq. IV.1.65.
siendo la matriz inversa (I W)-1 que, para su ms fcil notacin se designar como aij, el
multiplicador espacial asociado al trmino autorregresivo que expresa tanto la naturaleza
conjunta (simultnea) de la dependencia espacial, como la existencia de una relacin
funcional entre ambas perturbaciones aleatorias que, en trminos de Anselin (2001E), es de
tipo global.
111
Eq. IV.1.66.
u i = a ij j X i
j =1
y = Wy + X + u
y = (I W ) X + (I W ) u
1
Eq. IV.1.67.
modelos (Casetti, 1986, 1997A y B; Casetti y Jones, 1988; Jones y Casetti, 1992)35. Una
formulacin general, consistira en considerar cada coeficiente de la regresin, j, como
funcin lineal de un conjunto de variables de expansin, z1, z2, ..., zm, del modo siguiente:
j = 0 j + 1 j z1 + 2 j z 2 + ... + mj z m
Eq. IV.1.68.
j = 0 + 1m j + 2 p j
siendo m:
p:
Eq. IV.1.69.
y = 0 + 1 x + u
y = 0 + ( 0 + 1 m + 2 p )x + u
y = 0 + 0 x + 1 (m x ) + 2 ( p x ) + u
Eq. IV.1.70.
Este modelo considera que la perturbacin aleatoria (u) es esfrica. Sin embargo, esto
puede no ser as en la prctica, debido a la dificultad de mantener la hiptesis de existencia
de una relacin exacta entre los coeficientes del modelo y las variables de expansin. De
rechazarse esta hiptesis, sera necesario considerar un trmino aleatorio en la expansin de
los coeficientes que, por ejemplo, en la anterior expresin simplificada, sera:
1 = 0 + 1m + 2 p +
N (0, 2 I )
Eq. IV.1.71.
En el Anexo I son interesantes los modelos de expansin espacial propuestos por Kristensen (1998),
Sandberg y Johanson (2001).
36
La coordenada de longitud es una medida de localizacin geogrfica, que suele medirse en grados hacia el
este/oeste del meridiano cero o de Greenwich. Sobre un mapa es posible dibujar las lneas de longitud como
lneas verticales (meridianos), perpendiculares al ecuador y con intereccin en ambos polos (no paralelas,
dada la forma esfrica de la Tierra), con un recorrido de 0,0 (meridiano cero) a +180,0 y 180,0. Suele ser
denominada coordenada X por determinar, en un eje horizontal, la localizacin este-oeste de un punto.
37
La coordenada de latitud es una medida de localizacin geogrfica, que suele medirse en grados sobre o
bajo el ecuador. En un mapa es posible dibujar las lneas de latitud como lneas horizontales (paralelos) con
un recorrido de 0,0 (ecuador) a +90,0 (polo norte) y 90,0 (polo sur). Suele ser denominada coordenada Y
por determinar, en un eje vertical, la localizacin norte-sur de un punto.
y = 0 + ( 0 + 1 m + 2 p + )x + u
y = 0 + 0 x + 1 (m x ) + 2 ( p x ) +
113
Eq. IV.1.72.
( )
N (0, )
u N 0, u2
Eq. IV.1.73.
suponiendo tambin independencia entre las perturbaciones aleatorias del modelo original
(u) y del modelo de expansin de los coeficientes (), cosa que puede mantenerse en la
prctica. Por ltimo, tambin cabe indicar que las variables de expansin pueden ser
cualquier conjunto de variables (espaciales y no espaciales), incluidas las expresiones
polinomiales propias de la superficie tendencial, como se ver a continuacin.
Eq. IV.1.74.
Se entiende por centroide el centro geogrfico de un polgono que, en la mayora de los casos, se encuentra
dentro de los lmites del mismo, a mitad de camino entre los extremos norte-sur, este-oeste de dicha regin.
Eq. IV.1.75.
i = [ X Wi X ]1 X Wi y
Eq. IV.1.76.
siendo Wi una matriz diagonal de orden (N,N) que, a diferencia del habitual mtodo de
mnimos cuadrados ponderados, es diferente para cada observacin (i). Fuera de la diagonal
principal de Wi, los elementos son nulos, mientras que en la diagonal principal se sitan las
ponderaciones wij obtenidas como una funcin de la distancia entre dicha observacin (i) y
el resto. Por ejemplo, en Fotheringham et al. (1997)39, se sugiere la siguiente
especificacin:
wij = e
siendo :
dij:
d ij2
Eq. IV.1.77.
115
Student o medidas de bondad del ajuste (R2), para cada localizacin geogrfica. Estas
ltimas resultan muy tiles para explorar la posibilidad de aadir nuevas variables
explicativas al modelo.
y = 0 + 1 f + u
u N 0, 2 I
donde y:
f:
0, 1:
u:
Eq. IV.1.78.
En el caso frecuente de que la variable tratamiento categrica (f) sea una variable
ficticia (dummy) binaria, formada por ceros y unos, el valor estimado para el trmino
constante (0) ser el valor medio de las regiones que muestren un 0 en la variable ficticia y
el coeficiente estimado para la misma (1), reflejar la diferencia entre la media anterior y
la derivada del subgrupo de regiones con valor 1 en la ficticia. De este modo, un valor alto
significativo en el coeficiente estimado 1 indicar la existencia de una fuerte discrepancia
entre las medias de las dos estructuras espaciales definidas, justificando un tratamiento
diferencial de ambos casos como consencuencia de la inestabilidad detectada.
Todos estos resultados estn totalmente condicionados al cumplimiento de las
hiptesis de homoscedasticidad y no autocorrelacin espacial en la perturbacin aleatoria
que, en caso de no cumplirse, producir estimaciones incorrectas, a no ser que el modelo
sea convenientemente reespecificado. Por ejemplo, en el caso de haberse contrastado en la
estimacin MCO la existencia de autocorrelacin espacial en la variable endgena, el
modelo SANOVA anterior podra ser especificado como un modelo del retardo espacial:
y = Wy + 0 + 1 f + u
u N 0, 2 I
Eq. IV.1.79.
y1 = X 1 1 + u 1
y2 = X 2 2 + u2
,
,
para d = 0
para d = 1
0 i ui
+
X j j u j
y = X + u
Eq. IV.1.80.
117
El proceso que se detalla, a continuacin, es llamado estrategia modelizadora clsica, propuesta por
Anselin, aunque existen tambin otros procedimientos (Florax y Folmer, 1992), como la metodologa Hendry,
que ha sido desarrollada por Florax et al., (1998, 2000). Ver tambin Moreno y Vay, 2000.
IV.2.2.) y/o modelos de heterogeneidad espacial (Apartado IV.2.3.), que habrn de ser
estimados a travs de procedimientos diferentes de los mnimos cuadrados ordinarios y
sobre los que habr que contrastar tambin la hiptesis nula de ausencia de efectos
espaciales.
IV.2.1.
u N 0, 2 I
Eq. IV.2.1.
Eq. IV.2.2.
Eq. IV.2.3.
119
consistentemente por el producto XSX, siendo S la matriz diagonal del cuadrado de los
residuos de la regresin.
El estimador consistente de la varianza de los coeficientes MCO en presencia de
heteroscedasticidad sera el siguiente:
Var (b ) = b = u2 [X ' X ] X ' SX [ X ' X ]
1
Eq. IV.2.4.
1
M 1 n
V (b ) =
b(i )
M i =1
M
1
b( j ) b(i )
M
j =1
b( j )
j =1
'
Eq. IV.2.5.
siendo M el nmero de muestras y b(i) el estimador MCO obtenido en una base de datos en
la que la observacin i-sima ha sido excluida41.
MacKinnon y White (1985) demostraron que la matriz de covarianzas puede ser calculada directamente
[]
como: V b =
N 1
N
[X ' X ]
'
*
X ' X N (X ' e e X )[X ' X ] , donde es la matriz diagonal formada
2
ei
por el cuadrado de los residuos ajustados,
, y e* es un vector formado por la raz cuadrada de los
1 K ii
elementos de la diagonal principal de *. Para un estudio ms profundo sobre los mtodos robustos en el
anlisis de regresin espacial, ver tambin Anselin, L (1990A).
[ ]
H 0 : E u i2 = 2
Eq. IV.2.6.
i2 = 2 f 0 + p Z Pi p
Eq. IV.2.7.
donde 2:
factor simple de escala
f:
forma funcional
0, p: parmetros
P variables para la observacin i.
ZPi:
Las formas funcionales ms comnmente utilizadas suelen ser las lineales (para la
heteroscedasticidad aditiva) y exponenciales (heteroscedasticidad multiplicativa). Las
variables Z incluidas en la especificacin de la heteroscedasticidad pueden ser cualquiera
de las variables. A menudo, suele resultar de utilidad la eleccin del rea de la variable
espacial o cualquier otra variable relacionada con su tamao (poblacin total, renta total).
42
Para una revisin ms completa, ver cualquier manual de econometra. Por ejemplo, Johnston (1984), Judge
et al. (1985), Green, W. (1990) o, en espaol, Pulido y Prez (2001).
121
E yi y j 0
43
E ui u j 0
Eq. IV.2.8.
El test BP equivale a la mitad de la suma de los cuadrados de la variable endgena en una regresin de
ei
2 1 sobre una constante y las variables Z. El test KB es la versin "estudentizada" de sta, en la que el
s ML
2
trmino s ML se sustituye por un estimador ms robusto del cuarto momento de dicha distribucin.
El test de White consiste en n veces el coeficiente de determinacin R2 de la regresin auxiliar de los
residuos al cuadrado (en la regresin por MCO) sobre los productos cruzados entre las variables explicativas.
En algunos casos, los cuadrados o productos cruzados de las variables estn ya incluidos como variables
explicativas en la regresin original, como en la especificacin de los modelos de superficie tendencial. En
estos casos, slo los productos cruzados nicos deberan incluirse, para evitar la multicolinealidad perfecta.
45
Ver ejercicios de simulacin en Anselin (1990A) y Anselin y Griffith (1988).
44
En trminos generales, los tests asintticos estn basados en diferentes medidas de la distancia que existe
entre un estimador MV no restringido (bajo la hiptesis alternativa) y el estimador MV restringido, que
satisface la hiptesis nula. Si la distancia entre ambos es demasiado grande, la restriccin no podr aceptarse
por lo que la hiptesis nula ser rechazada. As, por ejemplo, en el caso del test de Wald, el modelo que se
estima es el modelo completo, por lo que se usan las estimaciones no restringidas, mientras que el test de los
multiplicadores de Lagrange utiliza el modelo estimado bajo la hiptesis nula, es decir, la especificacin ms
123
sencilla. Por su parte, el test de la razn de verosimilitud utiliza ambas estimaciones, restringida y no
restringida.
I=
N
S0
( ) w e e
ij i
e
i =1
siendo N:
S0:
e:
2
i
N e' We
S e' e
Eq. IV.2.9.
n de observaciones
suma de los pesos espaciales
vector de residuos MCO (ver Cliff y Ord, 1972 y 1981, para la
obtencin de los momentos y otras cuestiones tcnicas).
N tr (MW )
S N K
Eq. IV.2.10.
E [I ]
donde tr:
M:
N
2
2
tr (MWMW ') + tr (MW ) + [tr (MW )]
S
=
(N K )(N K + 2)
Eq. IV.2.11.
C = Z + A
siendo C:
Z:
:
A:
125
Eq. IV.2.12.
K R=
Z Z
hR
Eq. IV.2.13.
LM ERR =
tr W W + W 2
2
donde s 2 = e' e
e:
Eq. IV.2.14.
Este contraste, que es tambin un test asinttico, se distribuye como una 2 con un
grado de libertad y funciona igual tanto para la hiptesis alternativa de errores
espacialmente autorregresivos como para medias mviles espaciales: HA(0, 0).
Tal como ponen de manifiesto Moreno y Vay (2000), existe una relacin entre los
tests I de Moran y LM-ERR de forma que, cuando la matriz W est estandarizada
por filas, puede afirmarse la siguiente relacin:
LM ERR =
(NI )2
tr W W + W 2
Eq. IV.2.15.
LM ERR(2) =
+
2
tr W1W1 + W1
tr W2W 2 + W 22
2
Eq. IV.2.16.
1 e'Wy
~
e'We
s 2 T1 RJ
s 2
LM EL =
~
T1 T12 RJ
con:
(RJ~ )
= T1 +
s2
Eq. IV.2.17.
127
T1 = tr W W + W 2
W:
matriz de pesos espaciales
WX: retardo espacial de los valores procedentes de la estimacin MCO de
y sobre X
Este estadstico, que se distribuye como una 2 con 1 grado de libertad, ha sido
calculado bajo el supuesto de que la matriz de pesos espaciales presente en el
trmino del error coincide con la utilizada para obtener el retardo espacial de la
variable endgena (ver en Anselin et al., 1996, una generalizacin de este supuesto).
e Wy
s2
LM LAG ~
RJ
Eq. IV.2.18.
LM LE =
~
RJ T1
Eq. IV.2.19.
e' Wy e' We
e' We
s2 s2
s2
+
SARMA =
~
T1
RJ T1
Eq. IV.2.20.
()
H H var H
donde u :
Eq. IV.2.21.
1
1
1
H = tr W2 B ' BW1 B + trW2W1 B
(3,1)
var :matriz de varianzas estimadas del vector de parmetros en el
][
[]
129
Este estadstico se distribuye como una 2 con 1 grado de libertad. Para mayores
detalles, ver Anselin et al. (1996) y Anselin y Florax (1995).
El rechazo de la hiptesis nula de ausencia de autocorrelacin y heterogeneidad
espacial en el MBRL, supone una re-especificacin del mismo, a travs de modelos que
incorporen estos efectos en la forma funcional. Por eso, a continuacin, se exponen los
mtodos de estimacin, y los contrastes sobre los efectos espaciales, tanto para los modelos
de dependencia espacial (Apartado IV.2.2.) como para los modelos de heterogeneidad
espacial (Apartado IV.2.3.).
IV.2.2.1.
Eq. IV.2.22.
=
+
...... ...... ... ...... ... ...
wN 1 wN 2 ... 0 yN u N
0
w y
21 1
......
wN 1 y1
w12 y2
0
......
wN 2 y2
... w1N y N u1
... w2 N yN u2
+
... ...... ... Eq. IV.2.23.
...
0 u N
Aunque este modelo es muy sencillo, recoge totalmente los efectos que produce
sobre los estimadores MCO la presencia de una variable dependiente desplazada. Por eso,
puede ser utilizado sin prdida de generalidad.
As, el estimador MCO del parmetro ( ) podra obtenerse como:
1
= [ y D y D ] y D y
Eq. IV.2.24.
= [ y D y D ]
[ y D y D ] + [ y D y D ]1 y D u =
1
= + [ y D y D ] y D u
1
Eq. IV.2.25.
Una vez obtenido el estimador MCO del parmetro espacial autorregresivo (), se
analizan las propiedades del mismo, pudindose demostrar que no son buenas, pues se trata
de un estimador sesgado e inconsistente, como se ver a continuacin.
-
Estimador sesgado:
E ( ) = E + [ y D y D ] y D u
1
Eq. IV.2.26.
El valor esperado del segundo sumando del trmino de la derecha no se anula, por
lo que los estimadores MCO son sesgados. Efectivamente, como en los modelos de
131
1
1
E [ y D u ] = y = (I W ) u = E W (I W ) u u = {Si = 0} = 0
y D = Wy
{[
Eq. IV.2.27.
Estimador inconsistente:
PLim[ y D y D ]
y y y u
y D u = 0 PLim D D D = 0
N
N N
Eq. IV.2.28.
1. PLim
Eq. IV.2.29.
y D u
1
1
1
= y D = W (I W ) u = PLim u W (I W ) u
N
N
N
Eq. IV.2.30.
{[
][
Cov( ) = E [( ) ( )'] = E [ y D y D ] y D u u y D [ y D y D ]
1
]}= [y y
D
]1
Eq. IV.2.31.
{[
][
Cov( ) = E [( )( )'] = E [ y D y D ] y D u u y D [ y D y D ]
1
= 2 [ y D y D ] y D y D [ y D y D ]
1
]}=
Eq. IV.2.32.
Como puede observarse, esta ltima expresin es superior anterior, por lo que queda
demostrada la ineficiencia de los estimadores MCO, en modelos con perturbacin aleatoria
espacialmente dependiente. Los modelos de dependencia espacial podran ser considerados,
desde este punto de vista, como casos particulares del modelo de regresin lineal con
matriz de covarianzas de la perturbacin aleatoria no escalar.
IV.2.2.2.
donde y:
Wy:
:
X:
Eq. IV.2.33.
:
u:
133
Eq. IV.2.34.
( y Wy X )( y Wy X )
N
N
ln (2 ) ln 2
Eq. IV.2.35.
2
2
2 2
( )
siendo i los valores propios de la matriz de pesos y el resto de la notacin como en el resto
del captulo. Para los detalles completos de la derivacin y aplicacin, ver Ord (1975),
Anselin (1980, 1988A) y Anselin y Hudak (1992).
Este expresin de optimizacin no lineal podra solucionarse, en el terreno aplicado
de otro modo, expresando los estimadores de los parmetros de la regresin () y la
varianza de la perturbacin aleatoria (2) en funcin del coeficiente autorregresivo (). La
sustitucin de estas expresiones en la funcin de verosimilitud da lugar a la funcin
concentrada de verosimilitud, con un nico parmetro, el coeficiente autorregresivo, que
tiene la siguiente forma:
LC =
N (e0 eL )(e0 eL )
ln
+ i ln (1 i )
N
2
Eq. IV.2.36.
Ver Anselin (1988, Captulo 6) para una discusin extensa sobre el multiplicador de Lagrange de Wald y el
test del cociente de verosimilitud (LR) en los modelos espaciales.
48
El test BP equivale a la mitad de la suma de los cuadrados de la variable endgena en una regresin de
ei
135
Los mtodos estadsticos clsicos se apoyan en modelos matemticos de naturaleza estocstica, de tal forma
que los resultados que de ellos se derivan requieren, en muchas ocasiones, complejos desarrollos analticos, lo
que ha supuesto un obstculo para su utilizacin comprensiva en muchas reas cientficas. Adems, dichos
desarrollos se basan en hiptesis que algunas veces no son soportadas por los datos o se obtienen resultados
asintticos que no son vlidos cuando el tamao muestral no es suficientemente elevado. Efron (1979)
introduce la metodologa bootstrap para estimar las distribuciones de algunos estadsticos cuando el tamao
muestral es pequeo o las expresiones de dichas distribuciones son analticamente intratables. Los mtodos
Eq. IV.2.37.
donde IV = 1
...
K ( K +1,1)
Q:
matriz de instrumentos (N,P), que incluye la matriz X de variables exgenas.
Puede demostrarse que este estimador es consistente y asintticamente eficiente.
Aunque, en el caso de contar con muestras pequeas, sus propiedades dependen muy
estrechamente de la eleccin de los instrumentos y no siempre tienen tratamiento
matemtico50. Un problema potencial de la estimacin VI es que el estimador del parmetro
autorregresivo () no tiene por qu encontrarse situado necesariamente dentro del intervalo
de valores aceptables mayores que la unidad, en valor absoluto lo que, de producirse, suele
poner de manifiesto la existencia de problemas de especificacin en el modelo.
En el esquema clsico (temporal) de los modelos de ecuaciones simultneas, los
instrumentos son las variables exgenas "excluidas". Sin embargo, en los modelos de
retardos espaciales no existe una nocin totalmente equivalente a sta y, por eso, se han
ofrecido mltiples sugerencias (ver en Anselin, 1988A, una visin general del tema). Hace
"bootstrap" (como el "jackknife" anteriormente presentado) se basan en la reproduccin de los datos
originales mediante un remuestreo, de forma que si las observaciones tuvieran, por ejemplo, una estructura de
dependencia, sta debera estar reflejada en los nuevos datos.
50
Ver Bowden y Turkington (1984), y ver tambin Anselin (1980, 1984, 1988A) para un tratamiento ms
detallado de su aplicacin a modelos de retardos espaciales.
137
unos aos, Kelejian y Robinson (1992) demostraron que las series de variables exgenas
espacialmente retardadas constituyen el conjunto de variables instrumentales ms
adecuado, siempre y cuando se trabaje con matrices de contigidades de uno o ms
rdenes. En la prctica, estas series pueden estar truncadas de forma que slo se incluyan
las variables explicativas con un retardo espacial de primer orden, lo que ocasionara que la
matriz Q contuviera tanto la matriz X como WX, siendo excluidos de esta ltima tanto el
trmino constante como cualesquiera otras variables que pudieran dar lugar a una pefecta
multicolinealidad.
El estimador bootstrap es un estimador robusto que aprovecha la aleatoriedad
presente en distintas muestras de datos, creadas de forma artificial, como base para la
inferencia estadstica, lo que produce diversos estimadores de los parmetros, medidas de
sesgo y varianza, as como la construccin de niveles de pseudo-significacin e intervalos
de confianza51. En el anlisis de regresin, hay dos procedimientos importantes que dan
lugar a estimadores "bootstrap": uno se basa en los residuos, mientras que el otro parte de
las observaciones representadas en un espacio multidimensional. Como se demuestra en
Anselin (1988A, 1990A), slo es aceptable el primero de ellos en modelos del retardo
espacial. El "bootstrap" se basa en un procedimiento propio de las ecuaciones simultneas,
sugerido por Freedman y Peters (1984A y B)52. En un primer paso, se lleva a cabo la
estimacin VI, que proporciona un estimador del vector de perturbaciones (u) en forma de
residuos:
e = y VI Wy X VI
Eq. IV.2.38.
y r = (I VI W )
( X VI
+ er )
Eq. IV.2.39.
51
Para ms detalles, consultar Efron (1982), Efron y Tibshirani (1986) y Lger et al. (1992).
FREEDMAN, D. y S. PETERS (1984a), "Bootstrapping a regression equation: some empirical results".
Journal of the American Statistical Association, 79; pp. 97-106.
FREEDMAN, D. y S. PETERS (1984b), "Bootstrapping an econometric model: some empirical results".
Journal of Business and Economic Statistics, 2; pp. 150-58.
52
y = X + u
u = Wu +
X:
:
u:
:
Wu:
:
Eq. IV.2.40.
Eq. IV.2.41.
( y WY ) = ( X WX ) + u
Eq. IV.2.42.
Ver una exposicin tcnica ms extensa sobre la capacidad relativa de los diversos estimadores sugeridos
en la literatura, en Anselin (1988, captulo 8).
139
siendo i los valores propios de la matriz de pesos y el resto de la notacin como en el texto principal. Para
una mayor consideracin del proceso de obtencin y aplicacin, ver Ord (1975), Anselin (1980), Anselin
(1988A, cap. 8) y Anselin y Hudak (1992).
55
LC = N 2 ln[ee N ] + iln[1 i ],
donde ee es la suma de los cuadrados de los residuos de la regresin de la variable espacialmente filtrada y
las variables explicativas: (y-WY), (X - WX). Para mayor detalle, ver Anselin (1980), Anselin (1988A) y
Anselin y Hudak (1992).
56
Este modelo se denomina como modelo Durbin por analoga con la especificacin similar para los modelos
de series temporales (para detalles tcnicos, ver Burridge, 1981; Bivand, 1984; Anselin, 1988A. La propuesta
de Durbin, en modelos de series temporales, consiste en trabajar con el modelo transformado de forma que,
Eq. IV.2.43.
con la misma notacin que anteriormente. Sin restricciones, este modelo sera:
Y = WY + X WX + u
Eq. IV.2.44.
Lo que hace especial a este modelo del factor comn es la restriccin no lineal
presente en los coeficientes del retardo espacial (), las variables explicativas () y las
variables explicativas espacialmente retardadas (). Para ser consistentes con la formulacin
del error espacial, los coeficientes de los trminos WX tendran que ser iguales al valor
negativo del producto del coeficiente del trmino Wy por los coeficientes de los trminos
de la matriz X. La expresin matemtica de esto mismo es lo que se conoce como hiptesis
del factor comn:
H0: =
Eq. IV.2.45.
Hay dos formas de contrastar esta hiptesis. Una de ellas, se lleva a cabo mediante
el contraste de Wald sobre el conjunto de restricciones no lineales derivadas del factor
comn. Este test se distribuye asintticamente como una 2 con tantos grados de libertad
como coeficientes tenga la regresin, sin incluir el trmino independiente. El test se calcula
a partir de una estimacin MV auxiliar del modelo del retardo espacial sin restricciones.
Otro modo de contrastar esta hiptesis consistira en obtener un test del cociente de
verosimilitud (LR) a partir de la maximizacin de la funcin de verosimilitud del modelo
del error espacial (es decir, el modelo con restricciones) y la verosimilitud del modelo del
error espacial sin restricciones. El test LR tambin se distribuye asintticamente como una
2 con los mismos grados de libertad con el contraste de Wald.
En alguna ocasin, las variables explicativas espacialmente retardadas WX dan
lugar a una multicolinealidad perfecta (por ejemplo, cuando se incluyen variables ficticias),
en cuyo caso no se podra calcular el contraste sobre la hiptesis del factor comn.
por ejemplo, en un modelo con tres variables explicativas en el que existe autocorrelacin espacial, el modelo
original se transforma del modo siguiente:
y i y i 1 = 1 (1 ) + 2 ( x 2i x 2i 1 ) + 2 ( x 3i x 3i 1 ) + 4 ( x 4i x 4i 1 ) + (u i u i 1 ) =
= 1 (1 ) + y i 1 + 2 x 2i 2 x 2i 1 + ..........
y i = 1 (1 ) + y i 1 + 2 x 2i 2 x 2i 1 + ... + K x Ki K x Ki 1 + u i
Este modelo debe ser estimado por MCO, aceptando como estimador de el coeficiente de la variable yi-1 de
forma que, con este valor de , se transforme el modelo original, estimando por MCO los parmetros del
y = X + u
Var (u i ) = i2
E [uu ] =
donde y:
X:
u:
Eq. IV.2.1.
La estimacin de este modelo puede llevarse a cabo a travs del mtodo de mnimos
cuadrados generalizados factibles (MCGF) y mxima-verosimilitud (MV), que se exponen
a continuacin.
El principio que est detrs de la estimacin MCGF del modelo del error
heterocedstico es la obtencin de estimadores consistentes para los elementos de la
varianza de la perturbacin aleatoria (). Estos estimadores podrn ser utilizados en la
expresin de los estimadores MCGF:
bMCGF = X 1 X
X 1Y
Eq. IV.2.2.
Como se ha expuesto en al Apartado IV.1.2., para que este modelo sea identificable,
la varianza no constante del trmino del error debe tener alguna estructura, como la
heteroscedasticidad aditiva (en la que la varianza de la perturbacin aleatoria se expresa
como una funcin lineal de un conjunto de variables explicativas), de coeficientes
aleatorios y de grupos.
1 = [Z Z ] Z e 2
1
Eq. IV.2.3.
2 = [Z D 2 Z ] Z D 2 e 2
1
Eq. IV.2.4.
donde D es una matriz diagonal de elementos Z1. En una tercera etapa, los estimadores 2
se utilizarn para construir un estimador consistente de la matriz , adoptando como
elementos de la diagonal principal de el producto de Z2- Esta matriz ser luego
utilizada para obtener los estimadores MCGF definitivos.
En el caso de la heteroscedasticidad de grupos (groupwise) la estimacin MCGF
es mucho ms sencilla. Los residuos de la regresin MCO se agrupan segn las estructuras
definidas por una variable indicador y, para cada grupo (g) la varianza de la perturbacin
aleatoria ( g2 ) es estimada como eg e g N g , donde eg es el vector de residuos del grupo g, y
Ng, el nmero de observaciones del grupo. Los estimadores de g2 se sustituyen entonces en
los propios elementos de la diagonal principal de para obtener los estimadores MCGF.
Cuando los trminos de la perturbacin aleatoria se distribuyen normalmente, el
procedimiento iterativo de MCGF puede demostrarse que es equivalente a la estimacin
MV57.
El contraste de heteroscedasticidad en este modelo, puede realizarse a travs del
test de Wald (W) y el cociente de verosimilitud (LR). En el caso de heteroscedasticidad
aditiva y coeficientes aleatorios, en los que el trmino constante puede identificarse con la
varianza homoscedstica, el test de Wald consistira en un contraste de significacin
conjunta del resto de coeficientes de la especificacin heteroscedstica, mientras que en el
caso de heteroscedaticidad de grupos (groupwise), este test sera un contraste sobre la
igualdad de las varianzas en cada grupo o estructura considerados. Por su parte, el test del
cociente de verosimilitud (LR) se calcula como el doble de la diferencia entre el logaritmo
57
La funcin matemtica del logaritmo de verosimilitud para el modelo del error heterocedstico tiene la
forma:
1.
2.
58
] [
LM LAG = e 1WY
1
] [D + Tr (W W + W )] ,
Eq. IV.2.5.
para todas las variables de expansin. En la regresin por MCO, este contraste consiste en
un estadstico F, con [M.(K-1), N-M(K-1)] grados de libertad, siendo M el nmero de
variables de expansin y K el nmero de variables explicativas del modelo inicial. En todos
los dems mtodos de estimacin, este test es un test asinttico de Wald, distribuido como
una 2 con [N.(K-1)] grados de libertad. Adems del contraste conjunto, tambin se incluye
un test sobre la significacin de la expansin para cada coeficiente del modelo inicial. Una
vez ms, este test ser un estadstico F para la estimacin MCO, con (M.N-M grados de
libertad, y un estadstico asinttico de Wald para el resto de mtodos (2 con M grados de
libertad).
59
Las diferentes ordenadas en el origen o trminos independientes pueden ser fcilmente considerados con la
inclusin de variables ficticias en la especificacin de la regresin.
estructuras existan. Las nuevas variables tendrn valor cero para todas las observaciones no
incluidas en la estructura correspondiente.
Existe un contraste aadido, el test de Chow espacial (Anselin, 1990) sobre la
estabilidad de los coeficientes de la regresin a travs de las estructuras identificadas, cuya
hiptesis nula es la estabilidad de los parmetros en todas las estructuras. Por ejemplo, para
el caso de 2 estructuras:
H 0 :1 = 2 y 1 = 2
Este contraste se realiza para todos los coeficientes conjuntamente, as como para
cada coeficiente por separado. Se trata de un test basado en el conocido test de Chow
(1960) en modelos temporales. El estadstico de Chow espacial se distribuye como una F
con (K,N-MK) grados de libertad. Este contraste se basa en un estadstico de Wald (W)
asinttico, distribuido como una 2 con (M-1*K) grados de libertad (ver, por ejemplo,
White, 1980, y MacKinnon y White, 1985).
En la Tabla IV.2.1., se resumen los mtodos de estimacin y contrastes presentados
en este Apartado.
Modelo
MBRL
Mtodo de
estimacin
MCO
Contrastes de dependencia
Retardo espacial
Residuos
LM-LAG
LM-LE
I de Moran
Kelejian y
Robinson (K-R)
LM-ERR
LM-EL
SARMA
LM-LAG,
Contrastes de
heteroscedasticidad
Breusch-Pagan (BP)
Koenker-Bassett (KB)
W de Wald
LR
LM-LAG
LM-ERR
Breusch-Pagan (BP)
MCG
MV
W de Wald
LR
LM-ERR
Breusch-Pagan (BP)
MCO-robustos LM-LAG
MCGF
MV
LM-ERR
W de Wald
LR
Modelo de
superficie
tendencial
MCO
(otros, segn
especificacin)
Modelo
Mtodo de
estimacin
Contrastes de dependencia
Retardo espacial
Residuos
Contrastes de
heteroscedasticidad
Modelo de
parmetros
aleatorios
MCO
MCO-robustos
Test F de inestabilidad
W de Wald
Modelo de
regresiones
cambiantes
MCO
(otros, segn
especificacin)
Chow espacial