Você está na página 1de 68

CAPTULO IV.

ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

79

CAPTULO IV

Anlisis confirmatorio:
modelos de regresin espacial

En el Captulo anterior, se presentaron los efectos de dependencia y heterogeneidad


espacial, que son fenmenos propios de los datos espacialmente distribuidos, as como, en
concreto, la especificacin y contrastes de dependencia o autocorrelacin espacial sobre una
variable geogrfica. Ahora, en el presente Captulo, se analiza la presencia de dichos efectos
de dependencia y heterogeneidad espacial en el contexto de los modelos de regresin lineal,
sus consecuencias sobre la especificacin (Apartado IV.1), estimacin y contraste, as como
estrategias para la seleccin de modelos (Apartado IV.2.). El correcto tratamiento de los
efectos espaciales en el proceso de modelizacin espacial constituye el denominado anlisis
confirmatorio de datos.
El esquema del captulo es el siguiente:

CAPTULO IV.
ANLISIS CONFIRMATORIO: MODELOS DE
REGRESIN ESPACIAL
IV.1. Especificacin de los efectos espaciales en modelos de regresin
IV.1.1. Modelos de dependencia espacial o modelos espaciales dinmicos
IV.1.2. Modelos de heterogeneidad espacial
IV.2. Mtodos de estimacin y contraste en modelos de regresin espacial
IV.2.1. Estimacin y contrastes en el modelo bsico de regresin lineal.
IV.2.2. Estimacin y contrastes en modelos de dependencia espacial
IV.2.3. Estimacin y contrastes en modelos de heterogeneidad espacial

80

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

IV.1. ESPECIFICACIN DE LOS EFECTOS ESPACIALES EN


MODELOS DE REGRESIN
En el Apartado II.1., se defina la econometra espacial, con palabras de Anselin
(2001D), como la parte de la econometra que se ocupa del tratamiento de la interaccin
espacial (autocorrelacin espacial) y la estructura espacial (heterogeneidad espacial) en los
modelos de regresin de corte transversal y de datos de panel. Es decir, que podra decirse
que la principal caracterstica de la econometra espacial consistira en el modo como los
efectos espaciales de dependencia y heterogeneidad espacial son tenidos en cuenta en el
contexto del anlisis de regresin, para evitar problemas de mala especificacin en los
modelos. Obviamente, esto implica que las propiedades del espacio geogrfico han sido
previamente especificadas matemticamente, por ejemplo, a travs de una matriz de pesos
espaciales.
Uno de los problemas ms importantes planteados en este campo de la modelizacin
espacial, ha sido la enorme variedad de especificaciones aplicadas a los procesos espaciales
propios, por ejemplo, de la ciencia regional. Podra dar la impresin de que cada modelo
particular necesita su propio esquema metodolgico, cuando afortunadamente, gracias a las
tcnicas economtricas, es posible agrupar estas especificaciones y realizar tipologas de
modelos espaciales, como las que se presentan a continuacin.
En primer lugar, el efecto de dependencia o autocorrelacin espacial puede (o no)
estar presente en la especificacin de un modelo de regresin lineal de dos formas, que han
sido denominadas como sustantiva o residual, ya sea como consecuencia de variables
sistemticas (endgena y/o exgenas) espacialmente autocorrelacionadas o por la existencia
de un esquema de dependencia espacial en el trmino de la perturbacin aleatoria,
respectivamente (Apartado IV.1.1). Por otro lado, el fenmeno de heterogeneidad espacial
debe tambin especificarse en un modelo cuando la inestabilidad estructural, propia de este
efecto, se manifieste como varianza no constante en los residuos de una regresin
(heteroscedasticidad) o como variacin en los coeficientes del modelo (inestabilidad
paramtrica) que, a su vez, puede ser continua o discreta, como se ver en el Apartado
IV.1.2. Adems, los efectos espaciales de autocorrelacin y heterogeneidad pueden ser
tambin especificados en otros esquemas economtricos, como los modelos de datos de
panel28, modelos multiecuacionales, modelos de variables truncadas, modelos no lineales,
cuya presentacin excede los objetivos de este trabajo y queda para futuros desarrollos.
En este Apartado, se exponen las principales especificaciones que han recibido los
efectos espaciales en el seno de los modelos de regresin espacial o espacio-temporal, con
el objetivo de ofrecer una visin general estructurada en tipologas de este tipo de modelos.
28

Dada la importancia y amplia difusin de este tipo de modelizacin, recomendamos al lector interesado la
lectura de Anselin (1988A) y Moreno y Vay (2000), donde se presentan las principales especificaciones de
los efectos espaciales en modelos de datos de panel: modelos SUR-espaciales, modelos de componentes del
error (MCE) y modelos de ecuaciones simultneas.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

81

En los Apartados siguientes, se ampliar este tema incluyendo los mtodos de estimacin,
contrastacin y validacin ms frecuentemente citados en la literatura, para alguno de estos
modelos. Asimismo, en el Anexo I, se presentan algunos ejemplos de modelizacin
economtrica espacial aplicados a la economa y, en general, las ciencias sociales.

IV.1.1. Modelos de dependencia espacial o modelos espaciales dinmicos


Los modelos de dependencia espacial, tambin denominados modelos espaciales
dinmicos, podran definirse como aquellos modelos de regresin lineal que consideran
explcitamente la existencia del efecto espacial de dependencia o autocorrelacin. El
anlisis y correccin de la dependencia espacial en un modelo es fundamental, tanto desde
el punto de vista estadstico como econmico (Pons y Viladecans, 1998). Por un lado, la
presencia de autocorrelacin espacial en un modelo, como se demostrar ms adelante,
invalida la inferencia estadstica derivada de la estimacin por el tradicional mtodo MCO
(mnimos cuadrados ordinarios). A su vez, desde una perspectiva econmica, el estudio del
efecto de dependencia espacial permite detectar fenmenos como externalidades o efectos
spillover (desbordamiento) en una determinada unidad espacial.
El efecto de dependencia espacial puede estar presente en un modelo en forma de
autocorrelacin espacial en alguna variable del mismo (endgena y/o exgenas) o tambin
como existencia de esquemas de dependencia espacial en el trmino de la perturbacin
aleatoria, situaciones que han sido denominadas, respectivamente, como dependencia
sustantiva (sustantive dependence) y dependencia residual (nuisance dependence). En
cualquiera de ambos esquemas, la inclusin del efecto de autocorrelacin espacial en un
modelo de regresin requiere de la utilizacin de una matriz de pesos espaciales, W, capaz
de recoger las influencias mtuas presentes entre las unidades espaciales de la muestra.
A continuacin, se presentan las dos taxonomas de modelos espaciales de regresin
lineal ms citadas en la literatura y que, como se observar, se complementan, as como una
tipologa para modelos de externalidades, recientemente propuesta por Anselin (2001E), en
la que se ampla el espectro y las posibilidades en este tipo de modelos29. Por tanto, en
primer lugar, se expone la tipologa sencilla, adoptada por muchos autores en la literatura,
que se asienta sobre 4 modelos explicativos de la dependencia espacial en un fenmeno a
investigar (modelo de regresin espacial autorregresivo, modelo bsico de regresin lineal,
modelo del error espacial y modelo del retardo espacial). Este enfoque se complementa con
otra tipologa ms completa que parte de un modelo general para descender a otros casos
particulares.

29

Esta exposicin intenta completar las tipologas propuestas por Anselin (1988A) y Florax y Folmer (1992)
que han sido presentadas, a su vez, por otros muchos autores, con algunas variaciones (ver por ejemplo,
Cerejeira, 1998; Moreno y Vay, 2000). La denominacin de los modelos se ha traducido del ingls teniendo
en cuenta los trabajos en espaol de Mur (1999) y, sobre todo, Moreno y Vay (2000).

82

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

IV.1.1.1. Primera taxonoma de Anselin


En la Figura IV.1.1., se presentan distintas formas de tratamiento del fenmeno de
dependencia espacial, presente en la variable endgena de un modelo de regresin lineal,
que dan lugar a las diversas especificaciones presentadas por Anselin (1988A).

Figura IV.1.1. Tratamiento de la dependencia espacial: primera tipologa de modelos

Fuente: Elaboracin propia, a partir de Baller et al. (2000).

Modelo autorregresivo de regresin espacial de orden 1, SAR(1)


Este modelo constituye la especificacin ms sencilla de dependencia espacial,
adecuado para expresar situaciones en las que los valores que adopta una variable
determinada dependen sistemticamente de la localizacin geogrfica de la misma. Este

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

83

comportamiento de la variable debe ser contrastado estadsticamente mediante las tcnicas


del AEDE (ver Apartado III.1.). En la Figura IV.1.1., se presenta, en primer lugar, este
modelo que podra expresarse de la siguiente manera:

y = Wy + u

u N 0, 2 I
donde y:
W:
:

u:

Eq. IV.1.1.

vector (N,1) de observaciones de la variable endgena


matriz de pesos espaciales de la variable endgena, siendo Wy el retardo
espacial de la variable endgena
coeficiente autorregresivo espacial (escalar), que recoge la intensidad de las
interdependencias entre las observaciones muestrales
perturbacin aleatoria ruido blanco.

Esta formulacin describe una situacin en la que los valores de una variable (y) en
un punto geogrfico (i) estn condicionados por los valores que adopta dicha variable en
otro u otros puntos geogrficos (j), y viceversa, dando lugar a fenmenos de agrupamiento
de valores (altos/bajos) de dicha variable en determinadas zonas del espacio geogrfico.
Dicho en trminos estadsticos, la Cov(yi,yj) 0. La simultaneidad en la relacin de
dependencia entre yi, yj, que viene reflejada por una flecha de doble direccin en la Figura
IV.1.1., no tiene lugar en el mbito temporal, donde el fenmeno de autocorrelacin tiene
un carcter secuencial, no simultneo.
La especificacin de este modelo SAR(1) expresa la ausencia de aleatoriedad
espacial en una variable (y) de una manera muy bsica, sin considerar ningn tipo de
relacin causal, en la que otras variables exgenas (X) puedan ser explicativas de esta
peculiar distribucin de la variable endgena (y), como se ver en otro tipo de modelos
Modelo bsico de regresin lineal (MBRL)

Existe la posibilidad de que no se produzca la dependencia espacial en una variable


o de que sta sea recogida correcta y totalmente por un grupo de regresores, a travs de una
relacin estructural, como en el caso del MBRL:
y = X + u

u N 0, 2 I

siendo X:
:

Eq. IV.1.2.

una matriz (K,N) de K variables exgenas y N observaciones


vector (K,1) de parmetros de las variables exgenas.

El MBRL ser la especificacin correcta para una variable que presenta


autocorrelacin espacial, slo en el caso de que este efecto espacial est totalmente
explicado por los valores de una o ms variables explicativas, es decir, por condicionantes
internos referidos a dicho lugar i. Por tanto, la inclusin en el modelo de un nmero (K) de

84

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

variables explicativas produce una ausencia de significatividad (a contrastar


estadsticamente) en la relacin espacial existente entre yi, yj, de forma que Cov(yi,yj) = 0.
Esta situacin implica tambin la ausencia de autocorrelacin espacial residual, siempre y
cuando se trate de un modelo en el que se hayan especificado correctamente los
determinantes estructurales de la variable endgena.
Por eso, en la Figura IV.1.1., se representa la estructura explicativa del modelo a
travs de flechas que, para cada valor de la variable endgena (y), parten de sus
correspondientes valores de las variables explicativas (X). En el Anexo I, se incluye una
experiencia de Ceccato et al. (2001), en la que los autores especifican un MBRL como
adecuado para explicar correctamente una variable con clara estructura de dependencia
espacial, como la delincuencia en los barrios de una ciudad sueca, a partir de un conjunto
de variables explicativas estructurales.
Sin embargo, en la mayor parte de las ocasiones, el MBRL es insuficiente para
explicar la estructura espacial de la variable endgena. En estos casos, la estimacin del
MBRL por el mtodo de mnimos cuadrados ordinarios (MCO) produce un efecto de
dependencia espacial, estadsticamente significativo, en la perturbacin aleatoria, debido a
la mala especificacin del mismo. En estos casos, se dice que el modelo tiene problemas de
autocorrelacin espacial, los cuales deben abordarse a travs de diversas especificaciones,
siendo las ms conocidas las correspondientes a la dependencia espacial residual (modelo
del error espacial) y dependencia espacial sustantiva (modelo del retardo espacial).
Modelo de regresin con dependencia espacial en la perturbacin aleatoria o
modelo del error espacial

El modelo del error espacial (spatial error model) es, con mucho, la especificacin
ms utilizada en los casos en que el MBRL resulta ineficaz como explicativo de un
fenmeno con autocorrelacin espacial. La existencia de ciertos factores o variables no
explcitamente considerados en el modelo trasladan hacia los trminos del error la
configuracin de agrupacin de valores (autocorrelacin) presente en la variable endgena.
Por eso, en la Figura IV.1.1., las relaciones simultneas de dependencia espacial existentes
entre valores de la variable endgena (y), representadas a travs de una flecha de doble
direccin, se trasladan de esta variable hacia el trmino de perturbacin aleatoria. Es decir,
el efecto de dependencia espacial en la variable endgena (y) es explicado, no slo por las
variables independientes presentes en el modelo, sino por otras que se encuentran ausentes
(dependencia espacial residual). En el Anexo I, se presentan bastantes ejemplos de este tipo
de modelos (por ejemplo, Anselin, 1988A; Haining, 1994, 1995; Moreno y Vay, 2000;
Baller et al., 2001; Ceccato et al., 2001; Sandberg y Johanson, 2001; Thomas, 2001).
Habitualmente, la distribucin de la perturbacin aleatoria suele especificarse como
un proceso autorregresivo de orden 1 o AR(1), como en el caso siguiente:

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

85

y = X + u
u = Wu +

Eq. IV.1.3.

N (0, I )
2

donde u:
:
:

perturbacin aleatoria distribuida segn un proceso AR(1)


parmetro autorregresivo (escalar) asociado al retardo espacial Wu
vector de perturbaciones aleatorias, ruido blanco.

Esta expresin puede transformarse sustituyendo la expresin autorregresiva de la


perturbacin aleatoria en el modelo, de forma que el valor que adopta la variable endgena
(y) en un punto (i) depende de los valores de la perturbacin aleatoria en todos los puntos
del sistema, a travs del multiplicador espacial (1 - W)-1:
y = X + (1 W )
1

N (0, 2 I )

Eq. IV.1.4.

Algunos autores (Cliff y Ord, 1981; Sneek y Rietveld, 1997; Mur, 1999; Anselin,
2001) proponen tambin la especificacin de procesos espaciales de medias mviles para el
trmino de la perturbacin aleatoria, demostrando que una especificacin incorrecta de la
perturbacin aleatoria como un proceso AR(1), en lugar de MA(1), produce estimadores
sesgados30. En este caso, el modelo del error espacial tendra la siguiente forma:
y = X + u
u = W +

N (0, 2 I )

Eq. IV.1.5.

siendo el parmetro (escalar) de medias mviles asociado al retardo espacial W.

Modelo mixto autorregresivo de regresin espacial o modelo del retardo


espacial
El modelo del retardo espacial (spatial lag model), resulta tambin adecuado para
aquellos casos en los que el MBRL resulta insuficiente como explicativo del fenmeno de
dependencia espacial presente en la variable endgena (y). A diferencia de los casos
anteriores, el modelo del retardo espacial incorpora la influencia de las variables omitidas a
travs de una variable dependiente espacialmente retardada, es decir, a travs de los valores
que, para cada punto i, adopta la variable endgena en un grupo de localizaciones vecinas,
de la manera siguiente:
30

Sneek y Rietveld (1997) atribuyen la impopularidad del modelo MA(1), frente a la especificacin AR(1), a
la mayor complejidad que presenta la estimacin de estos modelos, slo posible bajo ciertas restricciones. En
el Apartado siguiente, se expone, de forma resumida, la nueva taxonoma de modelos de regresin espacial
propuesta por Anselin (2001), en la que este autor presenta la especificacin de medias mviles como un
fenmeno de autocorrelacin local frente a la especificacin autorregresiva, considerada como global.

86

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

y = Wy + X + u

u N 0, 2 I

Eq. IV.1.6.

Al igual que en el modelo del error espacial, esta expresin puede tambin adoptar
una forma reducida que incluye la especificacin del modelo del error espacial (aunque en
una forma no anidada), de modo que el valor de la variable endgena (y) en un punto (i) se
encuentra afectado no slo por el valor de las variables exgenas en dicho punto (i), sino
tambin en el resto de localizaciones, a travs del multiplicador espacial (1 W)-1, tal
como se expresa en la Figura IV.1.1. con las flechas dobles que parten de los valores de la
variable exgena en los puntos (i,j) hacia los valores de yi, yj.
y = (I W ) X + (I W ) u
1

u N 0, 2 I

Eq. IV.1.7.

Existen en la literatura varios contrastes que se han definido para obtener una
correcta identificacin en situaciones de autocorrelacin espacial de la variable dependiente
no totalmente explicada por la relacin estructural del MBRL. En el caso de revelarse el
modelo del retardo espacial como el ms adecuado, se estara poniendo de manifiesto un
proceso de difusin espacial en la variable analizada, de forma que unos valores altos/bajos
de la variable endgena (y) en un lugar (i), realmente estaran incrementando la
probabilidad de ocurrencia de valores altos/bajos de la misma en lugares vecinos
(adquiriendo as un cierto carcter de prediccin temporal). ste sera, por ejemplo, el caso
expuesto en Baller et al. (2001) para la tasa de homicidios cometidos en los estados del Sur
de los EEUU (ver Anexo I).

IV.1.1.2. Taxonoma de Florax y Folmer


A partir de los citados modelos del retardo espacial y del error espacial (con
perturbaciones aleatorias autorregresivas de primer orden), es posible especificar otros
modelos que incluyan, por ejemplo, una o ms variables exgenas espacialmente retardadas
o combinaciones de los modelos anteriores (ver Figura IV.1.2.), tal como pusieron de
maniefiesto Florax y Folmer (1992). Todos estos modelos pueden expresarse de forma ms
general en el llamado modelo mixto regresivo de regresin espacial, con perturbaciones
aleatorias autorregresivas y heteroscedsticas, al que, de forma ms breve, nos
referiremos como modelo general de regresin espacial:
y = W1 y + X 1 + W 2 R 2 + u
u = W3 u +

N (0, ) ; ii = hi (Z ) ; hi > 0
donde y:
W1 :

Eq. IV.1.8.

vector (N,1) de observaciones de la variable endgena


matriz de pesos espaciales de la variable endgena, siendo W1y el retardo

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

87

espacial de la variable endgena


:
coeficiente autorregresivo espacial (escalar), que recoge la intensidad de las
interdependencias entre las observaciones muestrales
X:
matriz (K1,N) de K1 variables exgenas y N observaciones
R:
matriz (K2,N) de K2 variables exgenas espacialmente retardadas, que
pueden o no coincidir con las variables incluidas en X.
W2: matriz de pesos espaciales correspondiente a las variables exgenas
espacialmente retardadas, siendo W2R el retardo espacial de dichas exgenas
1, 2: vectores (K1,1) y (K2,1) de parmetros de las variables exgenas.
u:
vector (N,1) de perturbaciones aleatorias autorregresivas (de primer orden) y
heteroscedsticas, siendo los elementos de la diagonal principal de la matriz
de covarianzas () funcin de P+1 variables exgenas de Z
:
vector (P,1) asociado a los trminos no constantes de la matriz Z
W3: matriz de pesos espaciales de la perturbacin aleatoria u
:
parmetro autorregresivo (escalar) asociado al retardo espacial W3u
:
vector de perturbaciones aleatorias, ruido blanco.
La especificacin del modelo general de regresin espacial, como puede observarse,
considera tambin la existencia del fenmeno de heterogeneidad espacial, en forma de
heteroscedasticidad en la perturbacin aleatoria, concepto que ser ampliado en el Apartado
IV.1.2. La consideracin o no, en este modelo general, de la posibilidad de existencia de
alguna forma de dependencia espacial (por ahora, se excluye el anlisis de heterogeneidad
espacial), como se aprecia en la Figura IV.1.1., permite derivar del mismo otras
especificaciones particulares, a travs de la imposicin de restricciones en el siguiente
vector de parmetros:

= [ , 1 , 2 , , , ]

Eq. IV.1.9.

Modelo bsico de regresin lineal: = 2 = = = = 0.

Cuando en un modelo de regresin con datos geogrficamente distribuidos no se


produce ningn efecto espacial de dependencia (ni heterogeneidad) en la perturbacin
aleatoria, la especificacin ms adecuada, como ya se ha visto, coincide con el modelo
bsico de regresin lineal (MBRL):
y = X 1 + u

u N 0, 2 I

Eq. IV.1.10.

Algunos autores aconsejan anular el efecto de dependencia espacial, detectado a


travs de las tcnicas del AEDE en una o varias variables del modelo (endgena y/o
exgenas), a travs de mtodos de filtrado espacial, de forma que un modelo con problemas
de dependencia espacial pueda ser transformado en el MBRL, mediante el filtrado espacial
de las variables afectadas. En concreto, Getis (1995, 2002) propone una transformacin de
las variables con problemas de dependencia espacial a partir del estadstico Gi(d)

88

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

presentado en el Apartado III.2.3.2., de forma que se obtenga, por ejemplo, para la variable
endgena (y) espacialmente autocorrelacionada, otra variable (y*) sin tendencia espacial,
del modo siguiente:
W

y i i

y i =
Gi (d )

Eq. IV.1.11.

donde Wi = j wij (d ) , por lo que el cociente Wi/N-1 es la media o esperanza matemtica


del estadstico Gi. La diferencia y i y i sera una nueva variable que contiene los efectos
espaciales presentes en yi. Esta transformacin, aplicada a las variables afectadas, dara
lugar a nuevas variables (y*, xk*) sin problemas de autocorrelacin espacial que podran
formar parte de la especificacin de un MBRL (ver los modelos de disparidades regionales
y gasto pblico propuestos por este autor en el Anexo I).
Esta transformacin constituye tambin una solucin a situaciones de prediccinextrapolacin de datos espaciales en los que se necesite extrapolar un modelo del retardo
espacial a un mbito microterritorial, para el que no se dispone, obviamente, de la variable
endgena, ni por tanto, de su correspondiente retardo espacial.

Modelo mixto autorregresivo de regresin espacial o modelo del retardo


espacial: 2 = = = = 0.
Este conocido modelo es un caso de dependencia espacial sustantiva en el que la
variable endgena presenta autocorrelacin espacial:

y = W1 y + X 1 + u

u N 0, 2 I

Eq. IV.1.12.

Como puede observarse, la inclusin de la variable endgena espacialmente


retardada, como explicativa en el modelo, es semejante a la introduccin de variables
desfasadas en el modelo temporal, aunque con diferencias importantes (ver Kelejian y
Robinson, 1995; Anselin y Bera, 1998). Por ejemplo, mientras que en el caso temporal la
variable desplazada, yt-1, est incorrelacionada con la perturbacin aleatoria, ut (siempre
que, a su vez, no exista autocorrelacin temporal en los errores), la variable espacialmente
retardada Wyi, siempre estar correlacionada con ui (con independencia del esquema de
autocorrelacin de la perturbacin aleatoria), as como con los valores del trmino de error
en otras localizaciones del espacio. Por eso, a diferencia de lo que sucede en el mbito
temporal, el estimador mnimo-cuadrtico no ser consistente en este tipo de modelos
(Anselin, 1988A), como se expondr ms adelante.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

89

Figura IV.1.2. Segunda taxonoma de modelos de dependencia espacial

Fuente: Elaboracin propia.

Esta especificacin, como ya se ha expuesto, es la adecuada en casos en los que el


valor que adopta una variable en un punto o regin depende no slo de condicionantes
internos (valores de otras variables explicativas en el mismo punto o regin), sino tambin
del valor de esa misma variable en otras regiones vecinas, incumplindose as el principio
de independencia entre las observaciones muestrales (Moreno y Vay, 2000). Esto es lo que
Paelinck y Klaasen (1979) denominan como principio de alotopa que establece que, en
muchas ocasiones, las causas de fenmenos acaecidos en una determinada localizacin
deberan buscarse en otro lugar del espacio. Anselin y Bera (1998) tambin sealan la
necesidad de utilizar esta especificacin como elemento de correccin en casos en los que
se producen errores de escala, como el presentado en el Apartado III.2.1. para unidades
espaciales contiguas.

90

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

Debe advertirse tambin que la inclusin del retardo espacial Wy evita los
problemas de identificacin y estimacin que se produciran al tratar de recoger, con
insuficientes grados de libertad, la totalidad de interacciones existentes entre cada regin i y
sus vecinas.

Modelo mixto regresivo cruzado de regresin espacial: = = = = 0


En este modelo, el efecto de dependencia espacial es tambin sustantivo, dado que
se encuentra presente, en forma de retardo espacial, en una o varias variables exgenas del
modelo (no en la dependiente, como en el modelo del retardo espacial):

y = X 1 + W 2 R 2 + u

u N 0, 2 I

Eq. IV.1.13.

Esta especificacin sera adecuada, por ejemplo, en una funcin de produccin en la


que el nivel de produccin de una regin i viniera explicada por la disponibilidad del factor
trabajo en la propia regin (X) y en un conjunto de regiones vecinas a i (W2R). Las
variables exgenas desplazadas pueden ser tratadas de la misma manera que las dems
variables exgenas en lo que respecta a los procesos de estimacin y contraste, aunque
suelen ser fuente de multicolinealidad en el modelo.

Modelo mixto autorregresivo regresivo cruzado de regresin espacial:


= = = 0.
Esta especificacin es producto de la combinacin del modelo del retardo espacial y
del modelo mixto regresivo cruzado de regresin espacial, del modo siguiente:

y = W1 y + X 1 + W 2 R 2 + u

u N 0, 2 I

Eq. IV.1.14.

Siguiendo con el ejemplo mencionado de la funcin de produccin, en este caso, el


nivel de produccin en una regin i vendra explicado, no slo por la disponibilidad del
factor trabajo en dicha regin i (X) y en otras relaciondas con la misma (W2R), sino
tambin por el propio nivel de produccin existente en regiones vecinas (variable endgena
espacialmente retardada, W1y). En el Anexo I, Bloomestein (1985), Pace y Barry (1997) y
Van der Kruk (2001) presentan modelos de este tipo.
Un caso particular sera el llamado modelo Durbin espacial, anlogo al propuesto
para los modelos de series temporales, en el que los coeficientes de las variables exgenas
espacialmente retardadas (2) tienen que ser iguales al valor negativo del producto del
coeficiente de la variable endgena retardada () por los coeficientes correspondientes a las
variables exgenas (1). La expresin matemtica de esta restriccin es lo que se conoce
como hiptesis del factor comn (H0: 2 = 1).

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

91

Modelo de regresin con dependencia espacial en la perturbacin aleatoria o


modelo del error espacial: = 2 = = = 0.
En este tipo de modelos, el fenmeno de autocorrelacin espacial est nicamente
presente en la perturbacin aleatoria normalmente, como ya se ha indicado, en una forma
autorregresiva de orden 1, SAR(1).

y = X 1 + u
u = W3 u +

N (0, I )

Eq. IV.1.15.

La consideracin explcita de un esquema de dependencia espacial en el trmino de


la perturbacin aleatoria resulta adecuada cuando se omiten en un modelo variables que se
hallen correlacionadas espacialmente31, o tambin cuando se producen errores de medida.
La no esfericidad de las perturbaciones aleatorias descarta el mtodo de estimacin
mnimo-cuadrtico pues da lugar a coeficientes sesgados e ineficientes.
De esta expresin podran derivarse otras si, por ejemplo, se supone en el trmino
de la perturbacin aleatoria la existencia de estructuras autorregresivas de orden superior a
uno, por ejemplo, un SAR(2):

y = X 1 + u
u = 1W31u + 2W32 u +

N (0, I )

Eq. IV.1.16.

donde W31 , W32 son las matrices de interaccin espacial, correspondientes a la perturbacin
aleatoria, de orden 1 y 2 respectivamente.
Adems, como ya se ha expuesto, tambin podran derivarse procesos de medias
mviles en la perturbacin aleatoria, SMA(q). Por ejemplo, en Cliff y Ord (1981) se sugiere
un modelo sencillo de medias mviles en el trmino de error, SMA(1), que podra ser
tambin generalizable a rdenes superiores:

y = X 1 + u
u = W3 +

N (0, 2 I )
31

Eq. IV.1.17.

Obviamente, el trmino de la perturbacin aleatoria tambin estar correlacionado espacialmente cuando se


omita errneamente un retardo espacial en la variable endgena o en una o varias exgenas, porque la
dependencia espacial se trasladara directamente al trmino de error. En estos casos de dependencia espacial
sustantiva, la solucin pasara por inclusin en el modelo de la variable afectada espacialmente retardada.

92

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

donde es el coeficiente (escalar) de medias mviles espacial.


Una formulacin alternativa del modelo del error espacial sera el llamado modelo
de componentes del error espacialmente autorregresivo de orden 1 o MCE-SAR(1) de
Bolduc et al. (1992, 1995), especialmente recomendable para los modelos de flujos de viaje
(ver una aplicacin en el Anexo I). Este mtodo permite incluir las diversas causas de una
mala especificacin en un modelo a travs de la descomposicin de la perturbacin
aleatoria (u) como suma de tres elementos referidos a la localizacin del origen (i),
destino (j) y resto (ij), de la forma siguiente:

y ij = 0 + N ij 1 + S i 2 + S j 3 + u ij
u ij = i + j + ij

i = 1W i + 1 ; 1 N (0, 2
j = 2W j + 2 ; 2 N (0,

2
2

ij = 3W ij + ij ; N (0, 2 )
donde yij:
Nij:
Si:
Sj:
W:

Eq. IV.1.18.

flujo entre dos regiones i, j, para i = 1,...,N y j = 1,...,T regiones del grupo de
N regiones de origen y T regiones de destino, respectivamente.
variables relativas a redes o vas de comunicacin entre i, j (tiempo de viaje,
coste, frecuencia de desplazamientos, etc.)
variables socioeconmicas relativas a las regiones origen
variables socioeconmicas relativas a las regiones destino
matriz de pesos espaciales en la que cada elemento es una funcin de la
distancia existente entre las regiones i,j.

En este modelo, se supone que las perturbaciones aleatorias 1, 2, ij son esfricas y


no estn relacionadas unas con otras.

Modelo mixto autorregresivo de regresin espacial con perturbacin aleatoria


espacialmente autorregresiva: 2 = = = 0
Este modelo surge de la combinacin de los modelos del retardo espacial y del error
espacial, de la manera siguiente:
y = W1 y + X 1 + u
u = W3 u +

N (0, I )

Eq. IV.1.19.

La consideracin de dos matrices de pesos espaciales, W1 y W3, para los procesos


autorregresivos de la variable endgena y la perturbacin, respectivamente, implica que
ambos procesos pueden tener distinta estructura espacial. Aunque en la practica puedan no
existir importantes diferencias entre ambas matrices (Cerejeira, 1998), stas no deberan

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

93

coincidir totalmente para evitar problemas de identificacin en la estimacin por el mtodo


mximo-verosmil (Anselin, 1988A). O, en caso de coincidir totalmente, los coeficientes
y nicamente estaran identificados si la matriz X contiene, al menos, una variable
exgena (adems del trmino constante) y se imponen las restricciones no lineales
correspondientes (Moreno y Vay, 2000).

Modelo mixto autorregresivo de regresin espacial, con perturbaciones que


incorporan un esquema de dependencia de media mvil.
Se trata de un modelo en el que el efecto de dependencia espacial se encuentra
presente de forma autorregresiva en la variable dependiente y, siguiendo un esquema de
medias mviles, en las perturbaciones aleatorias. El caso ms sencillo sera el denominado
modelo SARMA(1,1), que tendra la forma siguiente:

y = W1 y + X 1 + u
y = W1 y + X 1 + + W3
u = W3 +

2
N 0, I

Eq. IV.1.20.

En este modelo, a diferencia de lo que sucede en el caso de una perturbacin


espacialmente autorregresiva, los parmetros escalares y estarn siempre identificados,
an cuando W1 = W3 = W.
Si este esquema se extendiera a rdenes superiores, se obtendra el modelo
SARMA(p,q) propuesto por Anselin y Bera (1998), que algunos autores denominan como
modelos SARMAX, debido a la presencia en los mismos de variables exgenas:

y = 1W11 y + 2W12 y + ... + p W1 p y + X 1 + + 1W31 + 2W32 + ... + qW3q

N (0, 2 I )

Eq. IV.1.21.

Las matrices de pesos espaciales utilizadas, W1 y W3, son matrices de interacciones


espaciales, que llevan expresado como superndice la potencia u orden de contigidad. En
estos casos, debe ponerse especial cuidado en evitar el problema de circularidad y
redundancia propio de las matrices de potencias superiores a uno.
Otros autores, reservan la denominacin SARMA exclusivamente para denominar
la estructura de dependencia propia de la perturbacin aleatoria que, como en el modelo
SARMA(1,1), propuesto por Basu y Reinsel (1994), se distribuye a la vez como un proceso
autorregresivo y de medias mviles, ambos de orden 1:
y = X + u
u = Wu + + W

N (0, 2 I )

Eq. IV.1.22.

94

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

Los autores demuestran que la estimacin por MCG, as como el mtodo MV restringido,
son mejores que MCO y MV, respectivamente.

IV.1.1.3. Taxonoma de modelos de externalidades espaciales

Anselin (2001E) formula una nueva taxonoma para aquellos modelos de regresin
que expresan externalidades (spillovers). Las externalidades espaciales constituyen un
fenmeno emergente en las ciencias sociales como, por ejemplo, la economa, a travs de
los modelos de interaccin espacial que introducen relaciones de interdependencia entre los
actores de un sistema, y tambin la sociologa o la poltica, con el renacimiento de los
estudios de la Escuela de Chicago sobre procesos de vecindad.
La verificacin de estas externalidades espaciales, la medida de su fuerza y
recorrido exigen la especificacin y estimacin de modelos de econometra espacial. Sin
embargo, aunque el concepto de dependencia espacial es fcil de captar, no resulta tan claro
saber exactamente la forma en que sta se produce y, por tanto, la especificacin concreta
del modelo (la identificacin de los parmetros a estimar).
Para ello, el autor parte de una forma reducida de los modelos de regresin, en la
que las externalidades (spillovers), se expresan como multiplicadores espaciales. Aunque
los modelos espaciales de regresin lineal suelen expresarse en la forma estructural, se
propugna, en este caso, la transformacin de la misma en su correspondiente forma
reducida, caracterizada porque, en la parte derecha de la ecuacin, slo se incluyen
variables exgenas, la perturbacin aleatoria o transformaciones espaciales de las mismas.
La gran innovacin de este enfoque estriba en la diferenciacin que se hace, en el
contexto de los modelos de regresin lineal, entre dependencia global y local (dependiendo
de que los procesos de dependencia espacial sean SAR o SMA, respectivamente)32, que dan
lugar a diversas especificaciones, segn que los retardos espaciales afecten a la variable
endgena (Wy), variables explicativas (WX) y/o la perturbacin aleatoria (Wu).
En un contexto prctico, es importante conocer hasta qu punto la influencia
ejercida sobre el valor de una variable en una localizacin geogrfica determinada depende
de circunstancias referentes a las localizaciones inmediatamente adyacentes a la misma
(dependencia local) o a todas las localizaciones del sistema espacial considerado
(dependencia global).

32

Debe advertirse que el punto de vista de la econometra espacial difiere del propio de la estadstica espacial
en su comprensin de los procesos autorregresivos (SAR) y de medias mviles (SMA), considerados en una
perspectiva de simultaneidad (la primera) frente al concepto de condicionalidad propio de la perspectiva
geoestadstica. En efecto, la estadstica espacial habla de procesos CAR, en los que el valor de variable en una
localizacin se encuentra condicionado a la presencia de valores (similares o diferentes) de la misma en
localizaciones vecinas, siendo este enfoque muy interesante en contextos de prediccin temporal. La
econometra espacial, por su parte, entiende los procesos SAR como explicativos de una estructura espacial
completa simultnea.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

95

1. Modelos de dependencia espacial global

La dependencia espacial global tiene lugar en modelos de regresin lineal en cuya


especificacin se incluye algn proceso autorregresivo espacial (SAR) en la perturbacin
aleatoria y/o en alguna variable estructural (y, X). El adjetivo global se refiere a que, en
la correspondiente matriz de covarianzas, intervienen todas las localizaciones del sistema.
Como es bien sabido, el fenmeno de autocorrelacin espacial en una variable (y) implica
que la correspondiente matriz de covarianzas Cov(yi,yj) 0. Es decir, un impacto producido
en dicha variable (y), en una localizacin geogrfica (i), supondr la transmisin del mismo
al resto de localizaciones a travs de un multiplicador espacial. Este fenmeno de difusin
espacial puede tener lugar en cualquier proceso autorregresivo presente en la perturbacin
aleatoria, la variable endgena y/o en cualquiera de las exgenas del modelo.
A continuacin, se ilustra este concepto a travs del conocido modelo de regresin
espacial con perturbacin aleatoria autorregresiva de orden 1, SAR(1), especificado en su
forma estructural de la siguiente manera:
u = Wu +

N (0, 2 I )

Eq. IV.1.23.

Este modelo puede tambin transformarse fcilmente en su forma reducida:

u = I W

Eq. IV.1.24.

siendo [I W]-1 el multiplicador espacial asociado al proceso autorregresivo.


Por tanto, la matriz de varianzas y covarianzas de la perturbacin aleatoria con
problemas de dependencia espacial, Cov(uu) = E(uu), se obtendra de la siguiente manera:
___
__
_

{[

E (uu ') = E I W

' [I W ]1 ' = 2 [I W ]1 [I W ]1 '

Eq. IV.1.25.

La naturaleza global de la estructura de dependencia espacial expresada por esta


matriz de covarianzas, se observa mejor a travs de una transformacin matemtica de la
misma que, gracias a la llamada expansin de Leontieff, permite obtener, de forma
desarrollada, la expresin de la matriz inversa [I W]-1 (sabiendo que, en la mayora de
los casos, tanto los elementos de la matriz de pesos espaciales estandarizada por filas como
< 1 ):

[I W ]

= 1 + W + 2W 2 + ...

Eq. IV.1.26.

Por tanto, la expresin completa de la matriz no escalar de varianzas y covarianzas


de la perturbacin aleatoria se obtiene a partir del producto de la expresin anterior y su

96

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

traspuesta (obtenida en la forma habitual, mediante la trasposicin de cada una de las


matrices), dando lugar a un sumatorio de productos de potencias sucesivas de la matriz W
de pesos espaciales, escaladas por potencias del vector autorregresivo :

Cov(uu ') = I + W + W '+ 2 W 2 + WW '+W 2 ' + ...

Eq. IV.1.27.

Es decir, para el caso de una matriz W de contigidad de primer orden, cada


potencia de la misma (W, W2, W3, etc.) implica un orden mayor de contigidad, dando
lugar, en torno a cada una de las localizaciones (i), a una expansin creciente en los lmites
de interrelacin. Es ms, las potencias tambin sucesivas de los parmetros autorregresivos
(siendo < 1 ) producen una cada progresiva del valor de las covarianzas a medida que
aumenta el orden de contigidad, tal como apunta la citada ley de Tobler (todo tiene que
ver con todo, pero las cosas cercanas tienen ms que ver entre s que las lejanas).

Como puede observarse, el carcter global del modelo SAR en la perturbacin


aleatoria consiste precisamente en esa relacin que se produce, de hecho, entre todas las
observaciones del sistema. Aunque en la prctica, para bajos valores de , la covarianza
tiende a cero tras un nmero relativamente pequeo de potencias, en teora al menos, la
matriz de covarianzas de la perturbacin aleatoria autorregresiva de primer orden (u) es una
matriz completa no nula.
A partir de esta exposicin, se presentan distintos modelos de dependencia espacial
global, segn que las externalidades globales se produzcan en la perturbacin aleatoria, las
variables explicativas o en ambos tipos de variables conjuntamente.
Modelos de externalidades globales no modelizadas

Se trata de modelos en los que se han omitido una o ms variables con dependencia
espacial, de forma que este efecto se traslada al trmino de la perturbacin aleatoria, que se
distribuye como un proceso autorregresivo (SAR). ste sera el caso, por ejemplo, del
efecto que produce la calidad del aire en un lugar (o en lugares cercanos a uno dado), en un
modelo de precios hednicos de la vivienda, cuando no se dispone de medidas precisas que
midan esta variable. Este efecto global de dependencia espacial, omitido del modelo, est
presente en la perturbacin aleatoria.
Los efectos globales, especificados como un proceso SAR en el trmino de error,
podran expresarse en forma reducida, a partir de la forma estructural ms conocida, del
modo siguiente:

y = X + I W
y = X + u
y = X + ( Wu + )
u = Wu +
N 0, 2 I

Eq. IV.1.28.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

97

A su vez, a partir de la forma reducida anterior, es posible, a su vez, derivar una


nueva forma estructural, que incluya las variables endgena y exgenas espacialmente
retardadas, que resulta interesante por coincidir con el llamado modelo Durbin espacial:
_
__
_
_

[I W ]( y X ) = [I W ][I W ]

y = Wy + X WX +

Eq. IV.1.29.

Como ya se ha indicado, el modelo Durbin espacial contiene K restricciones no


lineales, denominadas como restriccin del factor comn, segn la cual:

Eq. IV.1.30.

Modelos de externalidades globales modelizadas

Cuando las externalidades espaciales globales se consideran explcitamente en el


modelo, se producen especificaciones ms novedosas. ste sera el caso de variables
exgenas que afectan a la endgena a travs de un multiplicador espacial global, de forma
que el valor yi se encuentre afectado, no slo por el valor de Xi, sino tambin por el valor
de Xj. Por ejemplo, las tasas impositivas en algunos estados o regiones suelen establecerse
en funcin de la renta disponible local, as como de la renta de estados o regiones vecinos,
y de los vecinos de los vecinos, etc. (dimensin global). Por ahora, no se considerar la
posibilidad de existencia tambin de externalidades excluidas del modelo.
La introduccin en la especificacin del modelo de un multiplicador espacial global
(proceso autorregresivo de primer orden), afectando a la matriz de regresores, produce la
siguiente forma reducida:

]
I)

y= I W

u N 0, 2

X + u

Eq. IV.1.31.

De esta expresin puede derivarse la forma estructural, multiplicando en ambos


extremos de la igualdad por [I W]:

[I W ]y = X + [I W ]u
y = Wy + X + u Wu

Eq. IV.1.32.

Como puede observarse, este modelo tiene dos variables espacialmente retardadas,
la variable dependiente y la perturbacin aleatoria, dando lugar a un modelo SARMA, con
una nica restriccin paramtrica segn la cual el coeficiente autorregresivo de la variable
endgena espacialmente retardada es el nmero opuesto al coeficiente de medias mviles
correspondiente a la perturbacin aleatoria.

98

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

Modelos de externalidades globales modelizadas y no modelizadas

Cuando no existen, a priori, razones tericas que circunscriban las externalidades


globales al trmino de error o a las variables explicativas, el procedimiento a seguir, en
estos casos, sera la inclusin en el modelo de ambos tipos de externalidades. Esto es lo que
se produce, por ejemplo, en la forma reducida del modelo del retardo espacial (modelo
mixto autorregresivo de regresin espacial), aunque un aspecto interesante de esta
especificacin, que suele ignorarse, es que conlleva restricciones adicionales. En concreto,
la obtencin de la forma estructural del modelo del retardo espacial requiere de una
condicin en el parmetro autorregresivo , as como en la matriz de pesos espaciales: que
sean los mismos en la expresin del multiplicador espacial del trmino del error y los
regresores. Efectivamente, la forma reducida del modelo del retardo espacial slo puede
expresarse a travs de las citadas restricciones:

y= I W

X + I W

Eq. IV.1.33.

para que sea posible, tras las transformaciones pertinentes, la obtencin de la mas conocida
forma estructural del mismo:
y = Wy + X + u

Eq. IV.1.34.

Sin embargo, si se prescinde de las restricciones, puede obtenerse la forma reducida


de un modelo ms general, con diferentes parmetros y matrices de pesos espaciales para el
efecto spillover (externalidades) asociado a las matrices X y u, de la siguiente manera:

y = I W1

X + I W 2

Eq. IV.1.35.

Por su parte, la correspondiente forma estructural asociada puede derivarse premultiplicando, a ambos lados de la igualdad, por los multiplicadores [I W1][I W2]:

[I W ][I W ]y = [I W ]X + [I W ]u
1

Eq. IV.1.36.

y, tras algunos clculos:


y = W1 y + W 2 y W1W 2 y + X W 2 X + u W1u

Eq. IV.1.37.

Como puede observarse, se trata de un modelo SARMA, de orden superior a 1, con


varias restricciones en los parmetros. Esta forma estructural general podra simplificarse,
por ejemplo, exigiendo una nica expresin para la matriz de pesos espaciales:
y = ( + )Wy W 2 y + X WX + u Wu

Eq. IV.1.38.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

99

Otra simplificacin de este modelo consistira en considerar que las matrices de


pesos son ortogonales, es decir, que el producto W1W2 = W2 = 0, en cuyo caso se obtendra
un modelo SARMA(1,1) con un componente regresivo cruzado y restricciones adicionales
en los parmetros:
y = ( + )Wy + X WX + u Wu

Eq. IV.1.39.

A modo de conclusin, se presenta en la Tabla IV.1.1. un resumen de las principales


especificaciones de los modelos de dependencia (externalidades) espacial global, segn que
se trate de efectos considerados (X) o no (u), o ambas cosas a la vez, explcitamente en un
modelo de regresin lineal, tanto en la forma estructural como en la forma reducida (que
incluye el multiplicador espacial autorregresivo SAR). En todos estos casos, los efectos
espaciales producidos sobre una localizacin determinada (i) son debidos a circunstancias
referidas, no slo a las localizaciones inmediatamente adyacentes a la misma, sino a todo el
sistema espacial considerado (dependencia global).

Tabla IV.1.1.

Modelos de externalidades espaciales globales

Forma estructural

Forma reducida

y = Wy + X WX +

y = X + I W

y = Wy + X + u Wu

y= I W

Ambos

y = W1 y + W2 y W1W2 y + X W2 X + u W1u

y = ( + ) Wy W 2 y + X WX + W

y = Wy + X + u

y = I W1
y= IW

X + u

X + I W 2

X + I W

Fuente: Elaboracin propia.

2. Modelos de dependencia espacial local

La dependencia espacial local se produce en procesos espaciales de medias mviles


(SMA), tanto en la perturbacin aleatoria como en alguna variable estructural. El adjetivo
local se refiere, en este caso, a que el efecto de difusin del multiplicador espacial
derivado de estos procesos es mucho menor que en el caso global.
Este concepto se ilustrar a travs de otro conocido modelo de regresin espacial, en
este caso, con perturbacin aleatoria distribuida como un proceso de medias mviles de
orden 1, SMA(1):
u = + W

N (0, 2 I )

Eq. IV.1.40.

100

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

siendo el parmetro espacial de medias mviles. A diferencia del modelo SAR, en este
caso, la forma reducida no incluye una matriz inversa, dado que, la expresin anterior es ya,
de hecho, una forma reducida. Precisamente, esta ausencia de matrices invertidas da lugar a
una matriz de covarianzas con una dimensin local:
_
_
_

Cov(uu ') = E {(I + W ) ' (I + W )'} = 2 {(I + W )(I + W )'} =

= 2 I + (W + W ') + 2WW '

Eq. IV.1.41.

Como puede observarse, los nicos elementos no nulos de esta matriz de varianzas
y covarianzas son aqullos no nulos tambin en la matriz W (o, de forma equivalente, W)
y WW. En el caso, por ejemplo, de W definida como una matriz de contigidades de
primer orden, los elementos no nulos seran los pares de localizaciones con relacin de
vecindad de primer (W, W) y segundo orden (WW), pero no mayor. Es decir, ms all de
estas dos bandas de vecindad, la covarianza espacial ser cero. sta es la razn por la que
se afirma que el recorrido del multiplicador espacial (I + W) de un proceso de medias
mviles SMA es local, inferior al mbito global del multiplicador SAR, (IW)-1.
Modelos de externalidades locales no modelizadas

El efecto de dependencia espacial omitido en un modelo se traslada al trmino de la


perturbacin aleatoria que, en el caso local, se distribuye como un proceso espacial de
medias mviles (SMA), en el que, como se ha demostrado, no ser necesaria la solucin de
una forma reducida. Continuando con el ejemplo anteriormente expuesto de un modelo de
precios hednicos de la vivienda, en el que la calidad del aire en la prctica totalidad de
localizaciones del sistema afectaba a todos y cada uno de los puntos del mismo (efecto
global), es posible considerar tambin otras variables dficiles de cuantificar y, por tanto, no
incluidas expresamente en el modelo, con un efecto ms localizado en torno a cada punto
del sistema, como ruidos, olores, etc., circunscritos a no ms de dos rdenes de vecindad de
cada observacin.
La forma estructural de este tipo de modelos es el modelo del error espacial, en el
que la perturbacin aleatoria se distribuye como un proceso espacial de medias mviles:
y = X + u y = X + + W

u = + W N (0, 2 I )

Eq. IV.1.42.

Esta forma estructural es, a la vez, la forma reducida:


y = X + (I + W )

siendo [I + W] el multiplicador espacial local.

Eq. IV.1.43.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL 101

Modelos de externalidades locales modelizadas

Cuando las externalidades espaciales locales se consideran explcitamente en el


modelo, a travs de las variables exgenas, se produce el modelo mixto regresivo cruzado
de regresin espacial, adecuado para situaciones en las que el mbito de influencia de las
variables explicativas sobre la endgena, se circunscribe no slo a una localizacin dada,
sino tambin a las inmediatamente vecinas a ella. Es decir, se trata de un modelo en el que
una serie de variables explicativas se encuentra espacialmente retardada, WX, del modo
siguiente:
y = X 1 + WX 2 + u

Eq. IV.1.44.

En esta expresin, 2 es un vector (K1, 1) de regresores espacialmente retardados y


no un escalar, como , , . En este sentido, podra establecerse la restriccin de considerar
esta relacin de dependencia en las variables explicativas como comn a todas ellas, a
travs de un coeficiente comn () que las afectara por igual, de la forma siguiente:
_
_

y = X + WX + u

Eq. IV.1.45.

Como puede observarse, en este caso, la forma reducida coincide con la forma
estructural. Adems, debe advertirse que no es posible considerar un caso de dependencia
(externalidades) espacial local el modelo que incluye la variable endgena espacialmente
retardada, ya que la presencia de dicho retardo en el extremo derecho de la ecuacin (forma
estructural) da lugar a una forma reducida que incluye siempre un multiplicador espacial
global, tipo: [I W].
Modelos de externalidades locales modelizadas y no modelizadas

La especificacin de externalidades espaciales locales, tanto en la matriz X como en


u, es mucho ms simple que en el caso global, que daba lugar a procesos SARMA de
rdenes elevados. Ahora, el modelo contiene un trmino espacial regresivo cruzado (WX)
as como un proceso de medias mviles (SMA) en la perturbacin aleatoria que, en una
formulacin ms general, puede considerar diferentes parmetros y/o matrices de pesos
espaciales:
y = X 1 + W1 X 2 + u
y = X 1 + W1 X 2 + + W2
u = + W2

Eq. IV.1.46.

Esta expresin general puede ser tambin simplificada introduciendo la restriccin


de considerar, en lugar del vector 2 (diferente para cada variable exgena), un escalar de
efectos comunes a todas ellas (e igual a ), as como una matriz W comn, dando lugar al
siguiente modelo en forma reducida:

102

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

y = X + WX + + W y = (I + W )( X + )

Eq. IV.1.47.

A modo de conclusin, se presenta en la Tabla IV.1.2. un resumen de las principales


especificaciones de los modelos de dependencia (externalidades) espacial local, segn que
se trate de efectos considerados (X) o no (u), o ambas cosas a la vez, explcitamente en un
modelo de regresin lineal, tanto en la forma estructural como en la forma reducida (que
incluye el multiplicador espacial autorregresivo SMA). En todos estos casos, los efectos
espaciales producidos sobre una localizacin determinada (i) son debidos a circunstancias
referidas exclusivamente a las localizaciones inmediatamente adyacentes a la misma (efecto
local).

Tabla IV.1.2.

Modelos de externalidades espaciales locales

Forma estructural

Forma reducida

y = X + (I + W )

y = X + + W

y = X 1 + WX 2 + u
y = X + WX + u

X
Ambos

y = X 1 + W1 X 2 + (I + W 2 )

y = X 1 + W1 X 2 + + W 2

y = (I + W )( X + )

y = X + WX + + W
Fuente: Anselin (2001E).

Adems, el autor deja las puertas abiertas a nuevas especificaciones y anlisis ms


complejos que superan estos esquemas. Por ejemplo, la especificacin del ya presentado
modelo mixto autorregresivo de regresin espacial con perturbacin aleatoria
espacialmente autorregresiva no se adapta al esquema anterior de externalidades globaleslocales, dando lugar a una forma reducida ms compleja. Efectivamente, partiendo de la
forma estructural ya presentada:
y = W1 y + X + (I W2 )1
1
u = W2 u + u = (I W ) N 0, 2 I
y = W1 y + X + u

Eq. IV.1.48.

es posible derivar la siguiente forma reducida:


y = (I W1 ) X + (I W1 )
1

(I W )

Eq. IV.1.49.

Aunque este modelo incluye el conocido multiplicador espacial global, propio de


los procesos autorregresivos (SAR), la expresin obtenida para la dependencia espacial de
la perturbacin aleatoria es mucho ms compleja y difcil de interpretar en un contexto

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL 103

prctico que los modelos presentados en las Tablas IV.1.1. y IV.1.2., sobre todo, debido a
la interaccin de dos matrices de pesos espaciales diferentes, W1 y W2.
Otra lnea de investigacin abierta sera la correspondiente a modelos hbridos que
combinaran externalidades globales, por ejemplo, en la matriz X de regresores, con otras de
tipo local, en la matriz de perturbaciones aleatorias, u, y viceversa. Ambos tipos de
modelos dan lugar a formas estructurales que incluyen la variable dependiente
espacialmente retardada, Wy, as como retardos espaciales, de orden superior a uno, tanto
en X como en u, con restricciones paramtricas no lineales.
As, en primer lugar, se considera un modelo con externalidades espaciales globales
en la matriz X y locales en u, que tiendra la siguiente forma reducida (suponiendo, para
simplificar, que la matriz de pesos espaciales es la misma en todos los casos):
y = (I W ) X + (I + W )
1

Eq. IV.1.50.

Su correspondiente forma estructural sera la siguiente:

(I W )(y W ) = X

y = Wy + X + + ( )W W 2

Eq. IV.1.51.

Por ltimo, sera tambin posible considerar el caso contrario de externalidades


locales en la matriz X y globales en u, con la siguiente forma reducida:
y = X 1 + WX 2 + (I W )
1

Eq. IV.1.52.

siendo su correspondiente forma estructural la siguiente:

(I W )( y X

WX 2 ) =

y = Wy + X 1 WX 1 + WX 2 W 2 X 2 +

Eq. IV.1.53.

Queda para el futuro, el desarrollo de contrastes y mtodos de estimacin adecuados


que permitan la correcta especificacin de las externalidades globales y locales, as como el
desarrollo de paquetes informticos, asequibles a nivel de usuario, que implementen los
modelos presentados en esta taxonoma.

104 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

IV.1.2. Modelos de heterogeneidad espacial


El efecto de heterogeneidad espacial, que fue presentado en el Apartado III.1.3
como objeto de estudio de los mtodos grficos del AEDE, se expone en este Apartado con
una mayor profundidad conceptual, a travs de las distintas especificaciones propias de los
tipos de heterogeneidad espacial existentes.
La heterogeneidad espacial surge cuando se trabaja con unidades espaciales (pases,
regiones, municipios, secciones censales) en las que un fenmeno se distribuye de manera
distinta sobre el espacio, lo que suele ocurrir con situaciones del tipo centro-periferia,
norte-sur, este-oeste, etc., como podran ser los casos que se presentan en la Figura III.3.1,
as como en el anlisis de prediccin-extrapolacin de datos espaciales, que se presenta en
el Captulo V. Por eso, este efecto espacial suele estar directamente relacionado con la
localizacin geogrfica, el rea o cualquier otra caracterstica de las unidades espaciales
muestrales (Anselin, 1988A, Moreno y Vay, 2000). Segn Anselin (2001D)33, la
heterogeneidad espacial puede ser definida como inestabilidad estructural en forma de
varianza no constante de los residuos de una regresin (heteroscedasticidad) o en los
coeficientes del modelo, que es posible abordar mediante tcnicas de econometra
tradicional o con herramientas propias de econometra espacial.

Figura IV.1.3.

Ejemplos de heterogeneidad espacial en situaciones centro-periferia


(izquierda) y norte-Sur (derecha)

Poblacin C. Madrid
400 y ms hab.
Menos de 400 hab.

Nivel de renta
Alto
Bajo

Fuente: Elaboracin propia a partir del SIG MapInfo Professional.

Como el efecto de heterogeneidad espacial puede ser tratado utilizando tcnicas


economtricas tradicionales, los estudios sobre econometra espacial dedican una menor
33

La consideracin de la heterogeneidad espacial como un segundo efecto espacial, junto con la dependencia,
fue inicialmente propuesta por Anselin (1988A).

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

105

atencin a este tema que a la problemtica en torno a la autocorrelacin espacial. Sin


embargo, como indica Anselin (2001D), hay tres razones por las que se debera analizar
este efecto de heterogeneidad a travs de tcnicas propias de econometra espacial:
-

En primer lugar, la estructura que subyace en la inestabilidad espacial es de carcter


geogrfico, en el sentido de que la localizacin de las observaciones es fundamental
para determinar la forma o especificacin de dicha variabilidad. ste sera, por
ejemplo, el caso de la heteroscedasticidad de grupos (groupwise), que podra ser
modelizada a travs de tantos valores de la varianza de la perturbacin aleatoria
como distintos grupos geogrficos compactos puedan derivarse de los datos.

En segundo lugar, dado que la estructura es espacial, la heterogeneidad suele


producirse conjuntamente con el problema de autocorrelacin espacial, no siendo ya
adecuadas las herramientas de la econometra tradicional, dado que los contrastes
habituales de heteroscedasticidad pueden estar sesgados en un contexto espacial.

Por ltimo, en tercer lugar, en un modelo de regresin de corte transversal, ambos


efectos de autocorrelacin y heterogeneidad espacial pueden ser, desde una ptica
meramente observacional, totalmente equivalentes. As, por ejemplo, un cluster o
agrupamiento espacial (observado en localizaciones muy prximas) de los residuos
con valores extremos podra ser interpretado como un problema de heterogeneidad
espacial (heteroscedasticidad de grupos o groupwise), o tambin como un efecto
de autocorrelacin espacial. Por eso, deben estructurarse perfectamente ambos
efectos espaciales para identificar correctamente los parmetros de un modelo con
estos problemas y nunca considerar un aspecto independientemente del otro.

De la citada definicin que Anselin (2001D), se deduce que en un modelo de


regresin lineal pueden distinguirse diversas especificaciones para el efecto de
heterogeneidad espacial, segn que se manifieste como heteroscedasticidad o como
inestabilidad estructural paramtrica.
IV.1.2.2. Especificacin de la heteroscedasticidad espacial
La heteroscedasticidad consiste en la ausencia de estabilidad en la dispersin de un
fenmeno, como sucede muchas veces con los residuos de una regresin y puede
representarse como:
Var (u i ) = i2

donde i2 :

Eq. IV.1.54.

indica que la varianza de la perturbacin aleatoria es diferente para cada


observacin muestral (i).

Las causas de la existencia de heterogeneidad espacial en un modelo de regresin


seran las siguientes:

106 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

Utlizacin de datos procedentes de unidades espaciales irregulares, es decir, con


diferente rea o extensin territorial, como es el caso de las divisiones polticoadministrativas (pases, regiones, provincias, municipios, secciones censales,...).

Tratamiento de unidades geogrficas en las que un fenmeno se distribuye de


manera desigual en el espacio, sobre todo, cuando se utilizan datos de regiones
extremas (centro-periferia, norte-sur, este-oeste) o cuando se trabaja con datos
referidos tanto a antiguas reas metropolitanas como zonas de nuevo
asentamiento, provincias urbanas y provincias rurales, secciones censales del
centro de una ciudad y secciones del extrarradio, etc. (Anselin, 2001D).

Causas de tipo sociolgico, como la existencia de diversos gustos o actitudes de


la poblacin, o poltico, cuando en la zona analizada se producen diferentes
administraciones o polticas regionales que llevan a respuestas diferentes ante
un mismo estmulo (Moreno y Vay, 2000).

Adems, a estas situaciones hay que aadir las causas habituales del problema
de heteroscedasticidad en los modelos de regresin lineal: omisin de variables
relevantes u otro tipo de especificacin errnea del modelo, que producen en el
trmino de la perturbacin aleatoria una varianza no constante.

Por ltimo, cabe sealar que algunas causas que provocan la heterogeneidad
espacial pueden tambin originar la aparicin de autocorrelacin espacial,
(especificaciones errneas o errores de medida, sobre todo), siendo necesaria la
contrastacin de ambos efectos conjuntamente (Anselin, 1988A).

Como ya se expuso en el Apartado IV.1.1., el modelo general de regresin espacial


considera tambin la posibilidad de que la perturbacin aleatoria presente problemas de
heteroscedasticidad. Efectivamente, en la expresin formal del mismo:
y = W1 y + X 1 + W 2 R 2 + u
u = W3 u +

N (0, ) ; ii = hi (Z ) ; hi > 0

Eq. IV.1.55.

u es un vector (N,1) de perturbaciones aleatorias autorregresivas y heteroscedsticas, siendo


los elementos de la diagonal principal de la matriz de covarianzas () funcin de P+1
variables exgenas de Z y , un vector (P,1) asociado a los trminos no constantes de la
matriz Z.
Si se excluye de esta especificacin todas las referencias a la dependencia espacial,
se obtendr el modelo del error heteroscedstico, que es un caso caso particular de un
modelo de perturbaciones aleatorias no esfricas. En este modelo, la varianza de la
perturbacin aleatoria no es ya una constante, sino que vara con cada observacin:

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

107

y = X + u

Var (u i ) = i2 I
E [uu '] =

Eq. IV.1.56.

donde u es el vector de perturbaciones aleatorias (N,1), con varianza no constante para


cada observacin i, y matriz diagonal de varianzas y covarianzas .
Para que este modelo sea identificable, la varianza no constante debe tener alguna
estructura que, en el modelo general, queda ms o menos sin determinar y que podra
especificarse de tres formas, como heteroscedasticidad aditiva, de coeficientes aleatorios y
de grupos.
Modelo de heteroscedasticidad aditiva

En muchas ocasiones se recurre a una especificacin comn denominada aditiva,


en la que la varianza de la perturbacin aleatoria se expresa como una funcin lineal de un
conjunto de Z variables heteroscedsticas, que pueden coincidir o no con las variables
explicativas, que son las que, a su vez, producen los problemas de heteroscedasticidad en el
modelo, del modo siguiente:
Var (u ) = Z

donde Var(u):
Z:
:

Eq. IV.1.57.

vector columna de varianzas de la perturbacin aleatoria (N,1)


matriz (N,P) de variables heterocedsticas (en columnas)
correspondiente vector de coeficientes.

Normalmente, la primera variable es un trmino constante, de forma que un test


sencillo de heteroscedasticidad puede ser formulado como un contraste de significacin
conjunto del resto de coeficientes. La constante, en s misma, sera la varianza
homoscedstica de la perturbacin aleatoria. ste es el principio sobre el que se fundamenta
el contraste de Breusch-Pagan para la heteroscedasticidad.
Modelo de heteroscedasticidad de coeficientes aleatorios

En este modelo, la varianza de la perturbacin aleatoria es funcin, en concreto, del


cuadrado de Z variables explicativas del modelo (todas o parte de ellas), con problemas de
heteroscedasticidad y, por tanto, causantes de este problema en el modelo:
Var (u ) = Z 2

siendo Z el grupo de variables explicativas heteroscedsticas.

Eq. IV.1.58.

108 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

Modelo de heteroscedasticidad de grupos (groupwise)

En otras ocasiones, las Z variables heteroscedsticas, causantes de la no constancia


de la varianza de la perturbacin aleatoria en un modelo de regresin, se corresponden con
variables categricas, correspondientes a un determinado nmero de estructuras espaciales
o regmenes (pases ricos del norte, municipios de la periferia, etc.), que recogen un cambio
estructural en la muestra de observaciones. Es decir, en cada estructura o rgimen espacial,
la varianza del error es distinta, aunque constante dentro de cada una de ellas, por lo que se
podra llegar a concluir que la heteroscedasticidad detectada se halla causada por la
existencia de diversos regmenes espaciales.
En esta situacin, la varianza de la perturbacin aleatoria podra ser estimada
directamente a partir de los residuos de cada estructura espacial, siempre y cuando exista,
en cada una de ellas, un nmero suficiente de observaciones. Las estructuras espaciales se
construyen a partir de una variable indicador categrica que adopta valores enteros
diferentes para cada estructura. A diferencia de las otras dos especificaciones, en este
modelo no hay trmino constante.

IV.1.2.2. Modelos de inestabilidad paramtrica

La inestabilidad paramtrica espacial consiste en la falta de estabilidad sobre el


espacio (variabilidad espacial) del comportamiento de una variable en estudio. Es decir, en
este tipo de situaciones, tanto la forma funcional como los parmetros de una regresin
pueden variar segn la localizacin geogrfica siendo, por tanto, no homogneos en toda la
muestra de datos. Es probable que este efecto surja, por ejemplo, cuando se utilizan datos
de regiones extremas, como pueden ser las regiones ricas del norte europeo y las pobres del
sur, para explicar, por ejemplo, un fenmeno econmico en el que se produce un esquema
norte-sur o centro-periferia. Este problema, segn Moreno y Vay (2000) podra
formalizarse de la siguiente manera:
yi = f i (X i i + i )

siendo i:
yi:
Xi:
i:
i.
fi( ):

Eq. IV.1.59.

una observacin, donde i = 1, 2, ..., N puntos en el espacio geogrfico


variable dependiente en la localizacin i
vector (1,K) de K variables explicativas
vector (K,1) de parmetros asociados a las variables explicativas
perturbacin aleatoria
funcin correspondiente a la observacin i.

Es decir, de este modelo se deriva que existe una relacin funcional concreta para
explicar el valor de la variable endgena en cada localizacin (i), producindose el llamado
problema de los parmetros incidentales (incidental parameter problem). Este problema
consiste en la imposibilidad evidente de estimar el grupo de N vectores de parmetros i
dada una muestra de N observaciones, ya que se carece de suficiente informacin en dicha
matriz de datos con la que poder obtener una estimacin para cada observacin espacial.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

109

Esta situacin suele tambin denominarse heterogeneidad espacial extrema (Anselin,


1988A)34.
Por eso, para poder proceder con un anlisis de este tipo, ser necesaria una
especificacin ms simple de la variabilidad que sufre en el espacio un determinado
fenmeno. Es decir, ser necesario conocer de antemano la especificacin propia de la
variabilidad espacial del fenmeno a explicar y contrastar si dicha especificacin es
consistente con la informacin de los datos muestrales (LeSage, 1999). Adems, hay que
tener en cuenta que este fenmeno de inestabilidad estructural suele presentarse de dos
formas, discreta o continua (Anselin, 1999B), segn que los parmetros del modelo adopten
valores diferentes en cada observacin muestral o slo en un nmero limitado de regmenes
o estructuras espaciales, lo que originar modelos de diferente especificacin.

1. Modelos con inestabilidad paramtrica continua

En algunas ocasiones, los parmetros de un modelo de regresin experimentan una


deriva espacial continua. Es decir, los coeficientes asociados a las variables explicativas
pueden adoptar un valor diferente, o bien para cada observacin muestral, como en el
modelo de parmetros aleatorios (Hildreth-Houck, 1968), o bien segn unas variables de
expansin (auxiliares), que pueden ser o no espaciales, como en el modelo de expansin
espacial (Casseti, 1972, 1986, 1997A y B) o las regresiones ponderadas geogrficamente,
de Fotheringham et al. (1998) y Brudson et al. (1999).
Modelo espacial de parmetros aleatorios, de Hildreth-Houck

El caso de deriva espacial continua de los parmetros, propuesta por Hildreth y


Houck (1968), dara lugar a un modelo con la siguiente especificacin:
y i = X i i

donde X i :
i:

Eq. IV.1.60.

vector fila (1,K) de variables explicativas


vector columna (K,1) de coeficientes para cada observacin (i).

En el modelo de parmetros aleatorios, en concreto, se desconoce la forma


funcional de dicha variacin paramtrica, por lo que el vector i se estima como la suma de
dos elementos:

i = + i
siendo :
i:
34

Eq. IV.1.61.

constante
perturbacin aleatoria de distribucin normal, con media nula y matriz de

En el Captulo V, se presenta el problema de la prediccin-extrapolacin de datos espaciales como un caso


particular de la heterogeneidad extrema.

110 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

covarianzas que puede ser diagonal, en el caso particular de no existir


correlacin entre los trminos de error y los coeficientes de regresin del
modelo.
La sustitucin del vector de coeficientes en el modelo general da lugar al siguiente
modelo:
y i = X i + u i

E (u i ) = 0
u i = X i i
V (u i ) = X i i X i

Eq. IV.1.62.

Como puede observarse, el modelo de coeficientes aleatorios es, en realidad, un


caso particular de la heteroscedasticidad de coeficientes aleatorios, en el que la varianza de
las perturbaciones es funcin de las variables exgenas.
En este tipo de modelos, el efecto de dependencia espacial podra estar tambin
presente, por ejemplo, en forma de proceso espacial autorregresivo, SAR(1), en la
perturbacin aleatoria (i), definida inicialmente como ruido blanco, de forma que la
perturbacin general del modelo (ui) presenta, a la vez, autocorrelacin espacial y
heteroscedasticidad (ver Anselin, 1988A). Es decir, la dependencia espacial estara presente
en la desviacin que experimentan los parmetros (i) en torno a la media comn (), del
modo siguiente:

i = ( i ) =
N (0, 2 I )

w (
j i

ij

)+ i
Eq. IV.1.63.

O tambin:

i =

w
j i

ij

j +i

Eq. IV.1.64.

correspondindose el subndice j con las unidades vecinas a i, definidas por los elementos
no nulos (wij) de la matriz W de pesos espaciales. Segn esto, la perturbacin aleatoria, ,
correspondiente al vector de parmetros cambiantes ( i), se distribuye como un proceso
espacial autorregresivo de orden uno, SAR(1), del modo siguiente:

= W +

= (I W )1

Eq. IV.1.65.

siendo la matriz inversa (I W)-1 que, para su ms fcil notacin se designar como aij, el
multiplicador espacial asociado al trmino autorregresivo que expresa tanto la naturaleza
conjunta (simultnea) de la dependencia espacial, como la existencia de una relacin
funcional entre ambas perturbaciones aleatorias que, en trminos de Anselin (2001E), es de
tipo global.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

111

La expresin de la matriz de varianzas y covarianzas de la perturbacin aleatoria


general (u) ser compleja y puede obtienerse a partir de la especificacin de dicha
perturbacin, con problemas de heteroscedasticidad y autocorrelacin espacial:
u i = X i
N

Eq. IV.1.66.

u i = a ij j X i
j =1

siendo aij = (I W)-1.


Por un lado, los trminos de la varianza de la perturbacin aleatoria general, Var(ui),
sern funcin de la varianza constante de la perturbacin aleatoria esfrica ( 2 ), aunque
vern agravado su problema de heteroscedasticidad, debido a la presencia del multiplicador
espacial autorregresivo (aij). Por otro lado, los trminos de la covarianza de la perturbacin
general, Cov(ui), son no nulos debido a la existencia de autocorrelacin espacial entre los
errores pertenecientes a unidades espaciales distintas.
Es decir, la estimacin de un modelo espacial de parmetros aleatorios debe tener en
cuenta correctamente estas circunstancias en la perturbacin aleatoria pues, en caso
contrario, los estimadores podran no tener buenas propiedades. Como se expondr en el
Apartado IV.2.3., el mtodo de mnimos cuadrados ordinarios (MCO) no sera correcto, por
lo que habra que recurrir a la estimacin por mxima-verosimilitud (MV) o por mnimos
cuadrados generalizados (MCG) iterativos.
Una especificacin alternativa para la dependencia espacial sera la introduccin de
un retardo espacial de la variable endgena, como en el modelo del retardo espacial o
modelo de externalidades globales modelizadas y no modelizadas (ver Apartado IV.1.1.).

y = Wy + X + u

y = (I W ) X + (I W ) u
1

Eq. IV.1.67.

siendo el coeficiente espacial autorregresivo correspondiente a la variable dependiente.

Modelo de expansin espacial, de Casetti


En el caso del modelo de expansin espacial, originalmente propuesto por Casetti
(1972), la deriva continua en los parmetros se formula en funcin de un conjunto de
variables auxiliares, llamadas variables de expansin, que pueden ser de tipo no espacial
(Jones y Casseti, 1992; Moreno et al., 1997). Hace unos aos, este paradigma de la
expansin se ha extendido hasta llegar a ser un esquema general para el desarrollo de los

112 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

modelos (Casetti, 1986, 1997A y B; Casetti y Jones, 1988; Jones y Casetti, 1992)35. Una
formulacin general, consistira en considerar cada coeficiente de la regresin, j, como
funcin lineal de un conjunto de variables de expansin, z1, z2, ..., zm, del modo siguiente:

j = 0 j + 1 j z1 + 2 j z 2 + ... + mj z m

Eq. IV.1.68.

La sustitucin de los coeficientes expandidos en el modelo general, produce un


incremento de m nuevas variables en el mismo, consistentes en el producto de las variables
explicativas por cada una de las variables de expansin: xjz1, xjz2, etc. Cuando se demuestra
que los coeficientes de un modelo dependen directamente del espacio geogrfico, stos
podran expresarse como:

j = 0 + 1m j + 2 p j
siendo m:
p:

Eq. IV.1.69.

coordenada geogrfica de longitud (tendencia este-oeste)36


coordenada geogrfica de latitud (tendencia norte-sur)37

La sustitucin de los coeficientes en un modelo que, sin prdida de generalidad, slo


contiene una variable explicativa dara lugar a la siguiente especificacin:

y = 0 + 1 x + u

y = 0 + ( 0 + 1 m + 2 p )x + u

y = 0 + 0 x + 1 (m x ) + 2 ( p x ) + u

Eq. IV.1.70.

Este modelo considera que la perturbacin aleatoria (u) es esfrica. Sin embargo, esto
puede no ser as en la prctica, debido a la dificultad de mantener la hiptesis de existencia
de una relacin exacta entre los coeficientes del modelo y las variables de expansin. De
rechazarse esta hiptesis, sera necesario considerar un trmino aleatorio en la expansin de
los coeficientes que, por ejemplo, en la anterior expresin simplificada, sera:

1 = 0 + 1m + 2 p +

N (0, 2 I )

Eq. IV.1.71.

lo que dara lugar a un modelo diferente:


35

En el Anexo I son interesantes los modelos de expansin espacial propuestos por Kristensen (1998),
Sandberg y Johanson (2001).
36
La coordenada de longitud es una medida de localizacin geogrfica, que suele medirse en grados hacia el
este/oeste del meridiano cero o de Greenwich. Sobre un mapa es posible dibujar las lneas de longitud como
lneas verticales (meridianos), perpendiculares al ecuador y con intereccin en ambos polos (no paralelas,
dada la forma esfrica de la Tierra), con un recorrido de 0,0 (meridiano cero) a +180,0 y 180,0. Suele ser
denominada coordenada X por determinar, en un eje horizontal, la localizacin este-oeste de un punto.
37
La coordenada de latitud es una medida de localizacin geogrfica, que suele medirse en grados sobre o
bajo el ecuador. En un mapa es posible dibujar las lneas de latitud como lneas horizontales (paralelos) con
un recorrido de 0,0 (ecuador) a +90,0 (polo norte) y 90,0 (polo sur). Suele ser denominada coordenada Y
por determinar, en un eje vertical, la localizacin norte-sur de un punto.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

y = 0 + ( 0 + 1 m + 2 p + )x + u

y = 0 + 0 x + 1 (m x ) + 2 ( p x ) +

113

Eq. IV.1.72.

siendo = .x + u, una perturbacin aleatoria con problemas de heteroscedasticidad, dado


que su correspondiente varianza es funcin de la variable explicativa (x):
Var ( ) = 2 x 2 + u2

( )
N (0, )

u N 0, u2

Eq. IV.1.73.

suponiendo tambin independencia entre las perturbaciones aleatorias del modelo original
(u) y del modelo de expansin de los coeficientes (), cosa que puede mantenerse en la
prctica. Por ltimo, tambin cabe indicar que las variables de expansin pueden ser
cualquier conjunto de variables (espaciales y no espaciales), incluidas las expresiones
polinomiales propias de la superficie tendencial, como se ver a continuacin.

Modelo de superficie tendencial


Un modelo de superficie tendencial es un modelo de regresin espacial cuyas
variables explicativas son los elementos de un polinomio de las coordenadas terrestres de
longitud (m) y latitud (p), a travs de las cuales es posible conocer la localizacin exacta de
una observacin (i) en el espacio geogrfico como el par (mi,pi). En el caso de que dicha
observacin (i) no fuera un punto sino un polgono, tal como se define en el Apartado
II.1.2., este ltimo podra representarse a travs de su correspondiente centroide38.
Por ejemplo, un modelo de superficie tendencial de 2 orden tendra la siguiente
especificacin:
y = + 1m + 2 p + 3 m 2 + 4 p 2 + 6 m p + u

Eq. IV.1.74.

Como ya se ha indicado, las variables explicativas (m,p) se corresponden con las


coordenadas terrestres. Adems, es el trmino independiente, 1 a 6 son los coeficientes
de la regresin en cada trmino del polinomio, siendo u, la perturbacin aleatoria. Este
modelo es similar a los mtodos de ajuste de tendencias temporales, por lo que, al igual que
en estos casos, resulta particularmente til para eliminar tendencias espaciales de gran
escala. Otra aplicacin comn de este modelo consiste en la posibilidad de obtencin de
interpolaciones espaciales, dado que la superficie tendencial es funcin nicamente de una
localizacin de puntos (sus coordenadas), pudiendo conocerse los valores de prediccin
para cualquier localizacin para la que se conozcan sus coordenadas.
38

Se entiende por centroide el centro geogrfico de un polgono que, en la mayora de los casos, se encuentra
dentro de los lmites del mismo, a mitad de camino entre los extremos norte-sur, este-oeste de dicha regin.

114 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

Un aspecto a tener en cuenta al interpretar los resultados de la estimacin de este


tipo de modelos es el alto grado de multicolinealidad que suele producirse, debido a la gran
relacin funcional existente entre los distintos trminos del polinomio. Como consecuencia,
no debera utilizarse este modelo para otros fines fuera del alisado, filtrado o interpolacin
de datos (ver en el Anexo I los modelos propuestos por Lpez y Palacios, 2000; Lpez et
al., 2001).

Modelo de regresiones ponderadas geogrficamente (RPG), de Fotheringham,


Charlton y Brundsdon
El modelo RPG pretende tambin, como en los casos anteriores, recoger
adecuadamente el fenmeno de inestabilidad paramtrica continua sobre el espacio
geogrfico, mediante un modelo estimado por mnimos cuadrados ponderados, siendo los
pesos una funcin de la distancia entre cada punto y el resto. As, en el modelo siguiente:
yi = X i i + ui

Eq. IV.1.75.

el vector de parmetros ( i) es obtenido a travs de un mtodo de estimacin de mnimos


cuadrados ponderados, de la siguiente forma:

i = [ X Wi X ]1 X Wi y

Eq. IV.1.76.

siendo Wi una matriz diagonal de orden (N,N) que, a diferencia del habitual mtodo de
mnimos cuadrados ponderados, es diferente para cada observacin (i). Fuera de la diagonal
principal de Wi, los elementos son nulos, mientras que en la diagonal principal se sitan las
ponderaciones wij obtenidas como una funcin de la distancia entre dicha observacin (i) y
el resto. Por ejemplo, en Fotheringham et al. (1997)39, se sugiere la siguiente
especificacin:

wij = e
siendo :
dij:

d ij2

Eq. IV.1.77.

parmetro que expresa la cada exponencial de la distancia entre dos puntos


distancia entre los puntos i,j.

As construidos, los pesos (wij) de la matriz Wi, correspondientes al punto i, sern


mayores para aquellas localizaciones situadas ms prximas a i. Esto supone que cada
ecuacin del modelo mide las relaciones inherentes al modelo alrededor de cada punto i.
Asimismo, la posibilidad de obtener la desviacin estndar de las N estimaciones de los
parmetros del modelo permitir analizar el alcance de la no estacionariedad en las
relaciones entre X e y. Por otro lado, los autores sealan que con las RPG, no slo es
posible obtener diferentes estimadores, sino tambin distintos contrastes, como la t de
39

Ver en Anexo I un resumen de la aplicacin realizada por estos autores.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

115

Student o medidas de bondad del ajuste (R2), para cada localizacin geogrfica. Estas
ltimas resultan muy tiles para explorar la posibilidad de aadir nuevas variables
explicativas al modelo.

2. Modelos con inestabilidad paramtrica discreta


Por su parte, la inestabilidad paramtrica discreta (spatial regimes) es tambin un
caso de inestabilidad paramtrica que evita una estimacin global de coeficientes diferentes
para toda la muestra de datos (N), mediante la divisin de la misma en un nmero limitado
(s) de estructuras diferentes (siendo s < N), superando as el problema de los parmetros
incidentales o la falta de grados de libertad, con el fin de obtener estimaciones eficientes.
Pueden distinguirse dos especificaciones para la inestabilidad paramtrica discreta,
el modelo ANOVA espacial (SANOVA), aplicable ms bien en un contexto de anlisis
exploratorio univariante, y el modelo de regresiones cambiantes (switching regressions).

Modelo ANOVA espacial (SANOVA)


El anlisis espacial de la varianza, ANOVA espacial (Griffith, 1992), consiste en la
aplicacin del ANOVA tradicional al contexto espacial, con el objetivo de contrastar si la
media de una variable determinada difiere de forma significativa entre diferentes grupos de
datos (estructuras o regmenes espaciales). Por ejemplo, es evidente que la distribucin de
variables econmicas, como la renta disponible o el PIB, presenta medias diferentes en el
grupo de provincias espaolas localizadas en las dos submitades, norte y sur, peninsulares.
El SANOVA mide el grado en que estas diferencias en las medias por grupos o
zonas del espacio es, de hecho, significativo o puramente casual. En trminos propios, el
objetivo de este tipo de anlisis se centra en encontrar diferencias significativas en el valor
medio de una variable cuando sta es sometida a diferentes tratamientos que, en estos
casos, son de tipo geogrfico, por cuanto engloban diversas sub-zonas.
Este procedimiento parte de la especificacin del siguiente modelo de regresin:

y = 0 + 1 f + u

u N 0, 2 I
donde y:
f:
0, 1:
u:

Eq. IV.1.78.

variable dependiente (sometida a diferentes tratamientos espaciales)


variable categrica que define los diferentes tratamientos (estructuras)
coeficientes a estimar
perturbacin aleatoria esfrica.

En el caso frecuente de que la variable tratamiento categrica (f) sea una variable
ficticia (dummy) binaria, formada por ceros y unos, el valor estimado para el trmino
constante (0) ser el valor medio de las regiones que muestren un 0 en la variable ficticia y

116 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

el coeficiente estimado para la misma (1), reflejar la diferencia entre la media anterior y
la derivada del subgrupo de regiones con valor 1 en la ficticia. De este modo, un valor alto
significativo en el coeficiente estimado 1 indicar la existencia de una fuerte discrepancia
entre las medias de las dos estructuras espaciales definidas, justificando un tratamiento
diferencial de ambos casos como consencuencia de la inestabilidad detectada.
Todos estos resultados estn totalmente condicionados al cumplimiento de las
hiptesis de homoscedasticidad y no autocorrelacin espacial en la perturbacin aleatoria
que, en caso de no cumplirse, producir estimaciones incorrectas, a no ser que el modelo
sea convenientemente reespecificado. Por ejemplo, en el caso de haberse contrastado en la
estimacin MCO la existencia de autocorrelacin espacial en la variable endgena, el
modelo SANOVA anterior podra ser especificado como un modelo del retardo espacial:

y = Wy + 0 + 1 f + u

u N 0, 2 I

Eq. IV.1.79.

pudiendo producirse alteraciones, ms o menos importantes, en el valor y la significacin


de los estimadores de los parmetros 0, 1.
Modelo espacial de regresiones cambiantes (switching regressions)

Otra posibilidad de introducir la heterogeneidad en un modelo de regresin espacial


y evitar una estimacin global, sera una solucin de regresiones espaciales cambiantes o
switching regressions, al estilo de la propuesta por Quandt (1958), que estima tantos
valores para los coeficientes de una regresin como estructuras o regmenes espaciales se
establezcan en la muestra total de observaciones.
Por ejemplo, si se establecen 2 estructuras, siguiendo el valor de una variable
indicador (ficticia) s, tanto el trmino constante como el resto de parmetros del modelo
adoptarn 2 diferentes conjuntos de valores, segn la estructura:

y1 = X 1 1 + u 1
y2 = X 2 2 + u2

,
,

para d = 0
para d = 1

donde y1 y X1 son subconjuntos de variables dependientes y explicativas correspondientes a


la primera estructura, e y2 y X2 son los de la segunda estructura, siendo 1, 2 los
coeficientes de la regresin, y u1, u2 los vectores de las perturbaciones aleatorias. Este
modelo puede tambin expresarse, de una forma conjunta, de la siguiente manera:
yi X i
y = 0
j

0 i ui
+
X j j u j

y = X + u

Eq. IV.1.80.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

117

IV.2. MTODOS DE ESTIMACIN Y CONTRASTE DE LOS


EFECTOS ESPACIALES
Una parte muy importante de la literatura economtrica espacial est centrada en el
desarrollo de contrastes sobre los efectos de autocorrelacin y heterogeneidad espacial en
los modelos espaciales de regresin lineal, as como en la formulacin de estimadores
eficientes y consistentes para todo este tipo de modelos. Los estadsticos ms antiguos para
el contraste, en concreto, de autocorrelacin espacial son los tests de Moran y Geary,
propuestos por Cliff y Ord (1973, 1981). Adems, se han aadido tambin algunas
variantes espaciales de los contrastes de Wald, cociente de verosimilitud y multiplicador de
Lagrange, englobados en la teora de la mxima-verosimilitud (Anselin, 1988A).
En cuanto a los mtodos de estimacin, dada la demostrada invalidez, en presencia
de los efectos espaciales, de los estimadores mnimos cuadrados ordinarios, se ha optado
preferentemente por el mtodo de mxima-verosimilitud, como procedimiento homlogo a
los mnimos cuadrados generalizados en el contexto temporal (aunque, a diferencia de estos
ltimos, presenta problemas de falta de consistencia).
El anlisis confirmatorio espacial puede llevarse a cabo a travs de un proceso que
tiene por primera fase la especificacin del modelo propuesto como un modelo bsico de
regresin lineal (MBRL) sin efectos espaciales, que se estima por el mtodo de mnimos
cuadrados ordinarios (MCO). A continuacin, sobre la perturbacin aleatoria se aplican una
serie de contrastes de autocorrelacin y heterogeneidad espacial con el objeto de aceptar o
rechazar la hiptesis nula de ausencia de efectos espaciales (aunque tambin deben
contrastarse el resto de hiptesis bsicas, comunes al contexto temporal clsico, como la
normalidad de la perturbacin aleatoria y no multicolinealidad). La aceptacin de dicha
hiptesis nula supondr la aceptacin del MBRL y sus estimadores MCO, pero el rechazo
de la misma requerir de nuevas especificaciones del modelo (en un proceso de
feedback) que incluyan convenientemente los efectos espaciales, as como de otros
mtodos de estimacin (mxima-verosimilitud, mnimos cuadrados espaciales en dos
etapas, mtodo de los momentos, etc.), que produzcan buenas propiedades en los
estimadores.
En este Apartado40, se desarrollar con mayor detalle este proceso, propuesto por
Anselin (1995A, 1999B), que tiene su punto de partida en la especificacin, para un
fenmeno espacial determinado (produccin, precio de la vivienda, tasa de delitos, etc.), de
un modelo espacial de regresin lineal sin efectos espaciales (MBRL), que se estimar por
MCO y sobre el que se contrastarn las hiptesis nulas de ausencia de autocorrelacin y
heterogeneidad espacial en el mismo (Apartado IV.2.1.). El rechazo de dichas hiptesis
conducir a nuevas especificaciones, como los modelos de dependencia espacial (Apartado
40

El proceso que se detalla, a continuacin, es llamado estrategia modelizadora clsica, propuesta por
Anselin, aunque existen tambin otros procedimientos (Florax y Folmer, 1992), como la metodologa Hendry,
que ha sido desarrollada por Florax et al., (1998, 2000). Ver tambin Moreno y Vay, 2000.

118 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

IV.2.2.) y/o modelos de heterogeneidad espacial (Apartado IV.2.3.), que habrn de ser
estimados a travs de procedimientos diferentes de los mnimos cuadrados ordinarios y
sobre los que habr que contrastar tambin la hiptesis nula de ausencia de efectos
espaciales.

IV.2.1.

Estimacin y contrastes del modelo bsico de regresin lineal

El propsito general de todo anlisis de regresin lineal, tambin en el campo


espacial, es encontrar una relacin (lineal) entre una variable dependiente y un conjunto de
variables explicativas, que ya se ha expresado como:
y = X + u

u N 0, 2 I

Eq. IV.2.1.

La notacin es la misma que la utilizada en el Apartado IV.1., representando los


coeficientes de regresin desconocidos mediante la letra griega y la perturbacin aleatoria
inobservable, con la letra u. Adems, se designar con la letra b al coeficiente estimado por
la regresin, y el residuo (o diferencia entre los valores observados de la variable endgena
y los valores de prediccin) ser denominado con la letra e.

IV.2.1.1. Estimacin por el mtodo de mnimos cuadrados ordinarios


El mtodo de estimacin de mnimos cuadrados ordinarios (MCO), en ausencia de
efectos espaciales en el modelo, es capaz de encontrar un buen ajuste entre los valores de
prediccin (Xb) y los valores observados de la variable dependiente (y), siempre y cuando
se verifiquen ciertas hiptesis bsicas. Es decir, este mtodo puede llegar a producir
estimadores (b) lineales insesgados y ptimos (ELIO), para los parmetros tericos (),
minimizando la suma del cuadrado de los errores de prediccin, de la siguiente manera:
b = [X ' X ] X ' y
1

Eq. IV.2.2.

Cuando existen evidencias de la existencia de heteroscedasticidad en un modelo de


datos espaciales (problema que suele ser reconocido como muy especfico de los datos de
corte transversal), puede realizarse una inferencia robusta a partir de los estimadores MCO,
que permanecern insesgados, aun incluso en presencia de heteroscedasticidad, aunque su
varianza adoptara una forma ms compleja:
V (b ) = 2 [ X ' X ] X ' X [X ' X ]
1

Eq. IV.2.3.

siendo la matriz de covarianzas de las perturbaciones aleatorias, escalada de forma que su


traza es igual al tamao de la muestra (N). Una consecuencia importante debida a White
(1980) muestra que mientras la matriz , en s misma, no es estimable a no ser que se
lleven a cabo otras hiptesis aadidas, la expresin 2XX puede ser estimada

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

119

consistentemente por el producto XSX, siendo S la matriz diagonal del cuadrado de los
residuos de la regresin.
El estimador consistente de la varianza de los coeficientes MCO en presencia de
heteroscedasticidad sera el siguiente:
Var (b ) = b = u2 [X ' X ] X ' SX [ X ' X ]
1

Eq. IV.2.4.

Se ha demostrado que este estimador no es muy eficaz en situaciones con muestras


finitas, por lo que McKinnon y White (1985) sugieren una versin mejorada, llamada
varianza ajustada de White, que consiste en dividir el cuadrado de los residuos de la matriz
diagonal S por el factor de correccin (1 Kii), siendo Kii el elemento i-simo de la
diagonal principal de la matriz idempotente X[XX]-1X.
Un enfoque alternativo para estimar la matriz robusta de covarianzas de los
estimadores MCO, en presencia de heteroscedasticidad, sera el llamado mtodo Jacknife
(Efron, 1982), que consiste en un enfoque de remuestreo de forma que cada observacin es
excluida, por turnos, de la base de datos. La distribucin emprica de los estimadores MCO
obtenida para las M muestras constituye el fundamento para la estimacin de la varianza
por este mtodo:

1
M 1 n
V (b ) =
b(i )

M i =1
M

1
b( j ) b(i )

M
j =1

b( j )

j =1

'

Eq. IV.2.5.

siendo M el nmero de muestras y b(i) el estimador MCO obtenido en una base de datos en
la que la observacin i-sima ha sido excluida41.

IV.2.1.2. Contrastes de heteroscedasticidad

La heteroscedasticidad se produce cuando la perturbacin aleatoria carece de


varianza constante en todas las observaciones (homoscedasticidad). Por tanto, se rechaza la
hiptesis nula que presupone constancia en la varianza de la perturbacin aleatoria en un
modelo estimado por MCO. Cuando esto sucede, los estimadores MCO, aunque
insesgados, no sern ya los ms eficientes. Es ms, la inferencia basada en los estadsticos
habituales t de Student y F de Snedecor podra producir resultados engaosos y el ajuste de
41

MacKinnon y White (1985) demostraron que la matriz de covarianzas puede ser calculada directamente

[]

como: V b =

N 1
N

[X ' X ]

'
*
X ' X N (X ' e e X )[X ' X ] , donde es la matriz diagonal formada
2

ei
por el cuadrado de los residuos ajustados,
, y e* es un vector formado por la raz cuadrada de los
1 K ii
elementos de la diagonal principal de *. Para un estudio ms profundo sobre los mtodos robustos en el
anlisis de regresin espacial, ver tambin Anselin, L (1990A).

120 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

bondad R2 sera incorrecto. En el anlisis de datos espaciales, es frecuente encontrar este


problema sobre todo cuando se utilizan datos procedentes de unidades espaciales
irregulares (con reas diferentes); tambin se produce cuando hay diferencias regionales
sistemticas en las relaciones del modelo (por ejemplo, estructuras espaciales); o cuando
hay una deriva espacial continua en los parmetros de modelo (es decir, expansin
espacial), como se vio en el Apartado anterior. La presencia de cualquiera de estos efectos
espaciales invalidara cualquier modelo de regresin tradicional que los ignorase. Por tanto,
el indicio de heteroscedasticidad puede apuntar a la necesidad de incorporar ms
explcitamente los efectos espaciales, en forma de estructuras espaciales o expansin
espacial de los parmetros.
Hay muchos contrastes para la heteroscedasticidad en la literatura42, pero todos ellos
parten de la hiptesis nula de existencia de homoscedasticidad:

[ ]

H 0 : E u i2 = 2

Eq. IV.2.6.

La hiptesis alternativa consiste en que cada observacin tiene una perturbacin


aleatoria con varianza distinta, i2 . En muchos casos, esta definicin es demasiado general
para ser til. El grado de especificacin con la que la hiptesis alternativa de
heteroscedasticidad puede expresarse depender del conocimiento que tenga el investigador
de los factores que pueden causarla. Debe advertirse que si se tiene la sospecha de la
existencia de heteroscedasticidad en el modelo y de sus causas (por ejemplo, a partir de
consideraciones tericas), no debera especificarse un MBRL. Por el contrario, debera
considerarse explcitamente el modelo del error heteroscedstico o, como ya se ha indicado,
tambin podra introducirse un estimador robusto en presencia de heteroscedasticidad.
Una aproximacin comn en la especificacin de la hiptesis alternativa sera referir
la variabilidad de la varianza del error a un cierto nmero de variables, a travs de una
forma funcional que incluya una serie de parmetros (parmetros P):

i2 = 2 f 0 + p Z Pi p

Eq. IV.2.7.

donde 2:
factor simple de escala
f:
forma funcional
0, p: parmetros
P variables para la observacin i.
ZPi:
Las formas funcionales ms comnmente utilizadas suelen ser las lineales (para la
heteroscedasticidad aditiva) y exponenciales (heteroscedasticidad multiplicativa). Las
variables Z incluidas en la especificacin de la heteroscedasticidad pueden ser cualquiera
de las variables. A menudo, suele resultar de utilidad la eleccin del rea de la variable
espacial o cualquier otra variable relacionada con su tamao (poblacin total, renta total).
42

Para una revisin ms completa, ver cualquier manual de econometra. Por ejemplo, Johnston (1984), Judge
et al. (1985), Green, W. (1990) o, en espaol, Pulido y Prez (2001).

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

121

Los contrastes de heteroscedasticidad ms citados en la literatura economtrica


espacial, son el test del multiplicador de Lagrange, desarrollado por Breusch y Pagan
(1979), as como la versin "estudentizada" de este ltimo sugerida por Koenker (1981) y
Koenker y Bassett (1982). El que se utilicen uno u otro depende de la distribucin de la
perturbacin aleatoria que, cuando no es normal, produce resultados sesgados en el test de
Breusch-Pagan (BP), que se muestra dbil en modelos con muestras pequeas, por lo que
se aconseja la aplicacin del test de Koenker-Bassett (KB). Ambos tests son asintticos y
siguen una distribucin 2 con P grados de libertad, siendo P el nmero de variables Z
presentes en la especificacin de la heteroscedasticidad43.
Ambos contrastes, BP y KB, requieren de la especificacin exacta de las variables
que producen la heteroscedasticidad. Por eso, en los casos en que se disponga de poca
informacin previa sobre el tipo de heteroscedasticidad, puede utilizarse el test de White
(1980)44, capaz de detectar formas de heteroscedasticidad no especificadas expresamente.
Este test es tambin asinttico y sigue una distribucin 2.
Debe tenerse en cuenta que, en bastantes situaciones, se producen conjuntamente los
problemas de heteroscedasticidad y dependencia espacial. En estos caso, hay que tener en
cuenta que los tests de heteroscedasticidad son muy sensibles a la presencia de dependencia
espacial45. Es decir, puede ser que los tests indiquen la existencia de heteroscedasticidad en
el modelo y que ste no sea el verdadero problema, sino la presencia de dependencia
espacial (y tambin puede suceder lo contrario, como se ver ms adelante).

IV.2.1.3. Contrastes de autocorrelacin espacial

El fenmeno de autocorrelacin espacial en un modelo de regresin espacial puede


ser de tipo sustantivo o residual, segn que sean los valores de la variable dependendiente o
la perturbacin aleatoria, en cada localizacin, los que se encuentren correlacionados,
respectivamente, con las observaciones de la variable dependiente o perturbacin aleatoria
de otras localizaciones. La expresin matemtica general de esta doble situacin sera la
siguiente:

E yi y j 0
43

E ui u j 0

Eq. IV.2.8.

El test BP equivale a la mitad de la suma de los cuadrados de la variable endgena en una regresin de

ei

2 1 sobre una constante y las variables Z. El test KB es la versin "estudentizada" de sta, en la que el
s ML
2

trmino s ML se sustituye por un estimador ms robusto del cuarto momento de dicha distribucin.
El test de White consiste en n veces el coeficiente de determinacin R2 de la regresin auxiliar de los
residuos al cuadrado (en la regresin por MCO) sobre los productos cruzados entre las variables explicativas.
En algunos casos, los cuadrados o productos cruzados de las variables estn ya incluidos como variables
explicativas en la regresin original, como en la especificacin de los modelos de superficie tendencial. En
estos casos, slo los productos cruzados nicos deberan incluirse, para evitar la multicolinealidad perfecta.
45
Ver ejercicios de simulacin en Anselin (1990A) y Anselin y Griffith (1988).
44

122 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

para localizaciones vecinas i, j. Esta especificacin es demasiado general para permitir la


estimacin de potenciales interacciones de [N x (N 1)], para N observaciones. Por eso, ya
se ha indicado que la forma de la dependencia espacial adquiere una estructura a partir de la
matriz W de pesos espaciales que reduce el nmero de parmetros desconocidos a uno slo
(el coeficiente de asociacin espacial en un proceso autorregresivo espacial o de medias
mviles).
Las consecuencias de ignorar este efecto de autocorrelacin espacial en un modelo
de regresin, cuando se encuentra de hecho presente, depende de la forma de la hiptesis
alternativa. Como en el resto de contrastes, la hiptesis nula pone de manifiesto la ausencia
de una mala especificacin en un MBRL con errores homoscedsticos e incorrelacionados
aunque, como ya se ha indicado, podran presentarse dos modelos alternativos interesantes
segn que el fenmeno ignorado de dependencia espacial se encuentre presente en la
variable dependiente (modelo del retardo espacial) o en el trmino de la perturbacin
aleatoria (modelo del error espacial). Adems, como ya se ha expuesto anteriormente, el
trmino del error podra presentar una estructura de dependencia espacial autorregresiva
(SAR) y/o de medias mviles (SMA).
La hiptesis nula de ausencia de autocorrelacin espacial en la variable dependiente
o dependencia sustantiva, H0(=0), ignora la presencia de este efecto espacial que, de
existir, producira estimadores (b) sesgados, siendo incorrecta toda la inferencia realizada
sobre el MBRL. Es decir, se trata de una consecuencia parecida a la que se produce al
ignorar una variable explicativa significativa en el modelo de regresin.
Por su parte, la hiptesis nula de ausencia de autocorrelacin espacial en el trmino
de la perturbacin aleatoria o dependencia residual, H0(=0), supone incorrelacin en el
trmino de error del modelo. Las consecuencias de ignorar la dependencia espacial en la
perturbacin aleatoria son las mismas que en el caso de heteroscedasticidad: aunque los
estimadores MCO permanecen insesgados, resultan ineficientes al ignorar la correlacin
existente entre los trminos del error. Por tanto, toda la inferencia basada en los estadsticos
t de Student y F de Snedecor ser confusa y los indicadores de bondad del tipo R2,
incorrectos.
Existe una amplia batera de estadsticos espaciales para contrastar estos dos tipos
de estructuras espaciales (dependencia sustantiva y residual) en un modelo (Figura IV.2.1.).
Segn Moreno y Vay (2000), podran distinguirse dos grupos de contrastes de
dependencia espacial: los tests ad-hoc, que no presentan una hiptesis alternativa definida
(tests I de Moran y K-R), y los contrastes basados en las propiedades ptimas del estimador
mximo-verosmil (MV)46, que estn rigurosamente estructurados en trminos de una
46

En trminos generales, los tests asintticos estn basados en diferentes medidas de la distancia que existe
entre un estimador MV no restringido (bajo la hiptesis alternativa) y el estimador MV restringido, que
satisface la hiptesis nula. Si la distancia entre ambos es demasiado grande, la restriccin no podr aceptarse
por lo que la hiptesis nula ser rechazada. As, por ejemplo, en el caso del test de Wald, el modelo que se
estima es el modelo completo, por lo que se usan las estimaciones no restringidas, mientras que el test de los
multiplicadores de Lagrange utiliza el modelo estimado bajo la hiptesis nula, es decir, la especificacin ms

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

123

hiptesis nula y alternativa especficas (tests asintticos de Wald, razn de verosimilitud y


multiplicadores de Lagrange).
A continuacin, se presentan los contrastes de dependencia espacial ms utilizados
en la literatura, algunos de los cuales pertenecen al caso del error espacial y otros, al caso
del retardo espacial.

Figura IV.2.1. Mtodos de estimacin en presencia de dependencia espacial

Fuente: Elaboracin propia, a partir de Moreno y Vay (2000).

El test I de Moran, tal como fue definido matemticamente en el Apartado III.2.3.,


puede utilizarse para medir el efecto de autocorrelacin espacial en los residuos de
una regresin, sin distinguir entre estructuras autorregresivas () y/o de medias
mviles (). Este constraste se expresa del modo siguiente:

sencilla. Por su parte, el test de la razn de verosimilitud utiliza ambas estimaciones, restringida y no
restringida.

124 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

I=

N
S0

( ) w e e
ij i

e
i =1

siendo N:
S0:
e:

2
i

N e' We
S e' e

Eq. IV.2.9.

n de observaciones
suma de los pesos espaciales
vector de residuos MCO (ver Cliff y Ord, 1972 y 1981, para la
obtencin de los momentos y otras cuestiones tcnicas).

Como ya se ha expuesto, la inferencia se basa en un valor (z) estandarizado que se


distribuye asintticamente como una normal. Aunque la interpretacin de este
estadstico es la misma que en el caso general univariante, las expresiones para sus
correspondientes momentos de primer y segundo orden, necesarias para obtener este
valor (z) estandarizado, son ms complejas, como se ver a continuacin:
E [I ] =

N tr (MW )
S N K

Eq. IV.2.10.

E [I ]

donde tr:
M:

N
2
2
tr (MWMW ') + tr (MW ) + [tr (MW )]
S
=
(N K )(N K + 2)

Eq. IV.2.11.

traza de una matriz


1
matriz idempotente, M = I X [ X ' X ] X ' .

El test I de Moran de los residuos de la regresin, que se reduce a un simple test de


correlacin entre vecinos prximos en el espacio, es el contraste de autocorrelacin
espacial ms conocido, aunque es tambin poco fiable. Efectivamente, como se ha
demostrado en un gran nmero de experimentos de simulacin tipo Monte Carlo
(Anselin y Rey, 1991), este estadistico puede recoger tambin un cierto nmero de
errores de mala especificacin, como no normalidad y heteroscedasticidad, as como
los problemas de dependencia espacial en la variable endgena, no permitiendo
discernir entre ambos tipos de dependencia espacial (residual y/o sustantiva) en un
MBRL.
Otro contraste ad-hoc, til para la deteccin de dependencia espacial residual en
un modelo (autorregresiva y/o de medias mviles), es el test K-R de especificacin
robusta desarrollado por Kelejian y Robinson (1992). Este estadstico se obtiene a
partir de una regresin auxiliar en la que la variable dependiente est compuesta por
los productos cruzados de los residuos MCO de las observaciones que, segn la
matriz de pesos espaciales, podran estar afectadas de autocorrelacin espacial. Por
su parte, la matriz de variables explicativas estara formada por los productos
cruzados de las variables explicativas correspondientes a dichas observaciones, del
modo siguiente:

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

C = Z + A

siendo C:
Z:
:
A:

125

Eq. IV.2.12.

productos cruzados de los residuos MCO (e), siendo el trmino hsimo: C h = ei e j


productos cruzados de variables explicativas del MBRL, siendo el
trmino h-simo: Z h = X i X j
vector de coeficientes
perturbacin aleatoria de la regresin auxiliar.

Denominando al vector de residuos resultante, el estadstico K-R tiene la


siguiente expresin

K R=

Z Z

hR

Eq. IV.2.13.

donde hR es el nmero total de observaciones del vector auxiliar. Este estadstico se


distribuye segn una 2 con K grados de libertad, siendo K el nmero de variables
explicativas de X.
A diferencia de los tests I de Moran y multiplicador de Lagrange, el test K-R no
exige, como hiptesis previa, la normalidad en los trminos de la perturbacin
aleatoria. Por otra parte, es aplicable tanto en regresiones lineales como no lineales
y requiere de menos informacin acerca de la forma exacta de la matriz de pesos
espaciales. Sin embargo, se trata de un contraste para grandes muestras que puede
no tener mucha fuerza cuando se trabaja con pequeas bases de datos.
Adems, tal como se ha indicado, los contrastes de dependencia espacial ad-hoc, I
de Moran y K-R, no presuponen ningn esquema de dependencia espacial, ni en la
perturbacin aleatoria ni en la variable endgena, por lo que no resultan muy tiles a
la hora de discriminar entre la existencia de un esquema de autocorrelacin espacial
residual o sustantiva siendo, en este sentido, inferiores a los contrastes basados en el
multiplicador de Lagrange, que se presentan a continuacin.
El test LM-ERR, basado en el principio de los multiplicadores de Lagrange, fue
originalmente propuesto por Burridge (1980) y se expresa como:
e We
s2

LM ERR =
tr W W + W 2
2

donde s 2 = e' e
e:

Eq. IV.2.14.

el estimador MV de la varianza de la perturbacin aleatoria

vector de residuos de la estimacin MCO.

126 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

Este contraste, que es tambin un test asinttico, se distribuye como una 2 con un
grado de libertad y funciona igual tanto para la hiptesis alternativa de errores
espacialmente autorregresivos como para medias mviles espaciales: HA(0, 0).
Tal como ponen de manifiesto Moreno y Vay (2000), existe una relacin entre los
tests I de Moran y LM-ERR de forma que, cuando la matriz W est estandarizada
por filas, puede afirmarse la siguiente relacin:
LM ERR =

(NI )2

tr W W + W 2

Eq. IV.2.15.

siendo I el contraste I de Moran. Ambos contrastes son asintticamente equivalentes


aunque, a diferencia del test I de Moran, el test LM-ERR no requiere del cmputo
de los momentos de primer y segundo orden siendo, por ello, ms fcil su
implementacin.
Anselin (1994B) propone, adems, un nuevo contraste LM-ERR(2) que permite
contrastar la existencia de procesos autorregresivos o de medias mviles de orden 2,
del modo siguiente:
e W 2 e
e W1 e
s2
s2

LM ERR(2) =
+
2
tr W1W1 + W1
tr W2W 2 + W 22
2

Eq. IV.2.16.

siendo W1 y W2 las matrices de pesos espaciales de orden 1 y 2, respectivamente.


Este constraste, as definido, sigue una distribucin 2 con 2 grados de libertad,
dado que contrasta la significacin de los dos coeficientes autorregresivos/medias
mviles de forma simultnea. Como puede observarse, el contraste LM-ERR(2)
podra extenderse a rdenes superiores a 2 como la suma de los respectivos tests
unidireccionales, agregando los sumandos correspondientes.

El test LM-EL es un contraste de dependencia espacial de la perturbacin aleatoria,


similar al test LM-ERR, aunque robusto a una mala especificacin local de la
dependencia espacial como sera el caso de la existencia de una variable endgena
espacialmente retardada (Anselin et al., 1996). La hiptesis nula a contrastar sera,
en este caso, H0(=0, =0), robusto a 0, siendo su expresin formal la siguiente:

1 e'Wy
~
e'We
s 2 T1 RJ
s 2
LM EL =
~
T1 T12 RJ

con:

(RJ~ )

(WX )' M (WX )

= T1 +

s2

Eq. IV.2.17.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

127

T1 = tr W W + W 2
W:
matriz de pesos espaciales
WX: retardo espacial de los valores procedentes de la estimacin MCO de
y sobre X

Este estadstico, que se distribuye como una 2 con 1 grado de libertad, ha sido
calculado bajo el supuesto de que la matriz de pesos espaciales presente en el
trmino del error coincide con la utilizada para obtener el retardo espacial de la
variable endgena (ver en Anselin et al., 1996, una generalizacin de este supuesto).

Otro contraste derivado del multiplicador de Lagrange, es el test LM-LAG para


retardos espaciales de la variable endgena, propuesto por Anselin (1988A), slo
vlido bajo la hiptesis de normalidad y asinttico por naturaleza. Como su
homlogo LM-ERR, para una perturbacin aleatoria con problemas de dependencia
espacial, el test de retardos LM se distribuye como una variable 2 con 1 grado de
libertad. En este caso, la hiptesis nula a contrastar sera H0(=0). La expresin
matemtica del mismo es la siguiente

e Wy
s2

LM LAG ~
RJ

Eq. IV.2.18.

siendo y el vector (N,1) de observaciones de la variable dependiente. Como se ha


puesto de manifiesto en un gran nmero de experimentos de simulacin de Monte
Carlo, en Anselin y Rey (1991), el uso conjunto de los estadsticos LM-ERR y LMLAG proporciona la mejor ayuda para elegir uno de los dos modelos alternativos,
dependencia estructural o aleatoria, siempre que se cumpla la hiptesis de
normalidad. Cada contraste por separado posee la mxima capacidad sobre la otra
alternativa. En otras palabras, cuando ambos tests ofrecen valores altos (indicativos
de dependencia espacial significativa), el que tenga valor mximo (mxima
confianza) ser el que muestre la estructura correcta de dependencia espacial.
En cuanto al contraste de retardos, robusto a la presencia de dependencia local de
error espacial, el test LM-LE, su expresin matemtica es la siguiente:
e' W1 y e' W1 e
s2 s2

LM LE =
~
RJ T1

Eq. IV.2.19.

En este caso, la hiptesis nula a contrastar sera H0(=0), robusto a 0, 0. Esta


expresin, que sigue la misma notacin que en casos anteriores, est tambin
distribuida como una 2 con 1 grado de libertad y ha sido construida bajo el
supuesto de coincidencia entre las matrices de pesos espaciales correspondientes a

128 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

la variable endgena y la perturbacin aleatoria (aunque en Anselin et al., 1996, se


propone una generalizacin de esta restriccin).

Se ha propuesto tambin un contraste basado en el multiplicador de Lagrange capaz


de contrastar conjuntamente la presencia, en un modelo, de dependencia espacial
sustantiva y residual, siendo la hiptesis nula H0(==0) H0(==0). Se trata del
test SARMA multidireccional, idntico al LM conjunto para retardo espacial y
error espacial autorregresivo, de Anselin (1988A y B), exceptuando la restriccin
sobre las matrices de pesos espaciales (no siempre puede identificarse un proceso
con matrices de pesos idnticas tanto para el retardo como para el error). El
estadstico correspondiente es el siguiente:
2

e' Wy e' We
e' We
s2 s2
s2

+
SARMA =
~
T1
RJ T1

Eq. IV.2.20.

Este estadstico se distribuye como una 2 con 2 grados de libertad.

El test LM puede tambin formularse para contrastar la presencia de un retardo


espacial en la variable endgena de un modelo en el que la perturbacin aleatoria
presenta un esquema autorregresivo espacial. Este estadstico ha sido denominado
test LM-LAG y se expresa del modo siguiente:
LM

[u ' B' BW1 y ]2

()

H H var H

donde u :

Eq. IV.2.21.

vector de residuos de la estimacin mximo verosmil del modelo


obtenido bajo la hiptesis nula de no dependencia espacial sustantiva,
aunque con errores espacialmente autorregresivos.
1
y = X + (I W2 ) u
= ' , , 2
B = I W 2
1
H = trW12 + tr BW1 B 1 ' BW1 B 1 + 2 [BW1 X ]' [BW1 X ]

(BX )' BW1 X


2

1
1
1
H = tr W2 B ' BW1 B + trW2W1 B

(3,1)
var :matriz de varianzas estimadas del vector de parmetros en el

][

[]

modelo estimado bajo la hiptesis nula.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

129

Este estadstico se distribuye como una 2 con 1 grado de libertad. Para mayores
detalles, ver Anselin et al. (1996) y Anselin y Florax (1995).
El rechazo de la hiptesis nula de ausencia de autocorrelacin y heterogeneidad
espacial en el MBRL, supone una re-especificacin del mismo, a travs de modelos que
incorporen estos efectos en la forma funcional. Por eso, a continuacin, se exponen los
mtodos de estimacin, y los contrastes sobre los efectos espaciales, tanto para los modelos
de dependencia espacial (Apartado IV.2.2.) como para los modelos de heterogeneidad
espacial (Apartado IV.2.3.).

IV.2.2. Estimacin y contrastes de modelos de dependencia espacial

IV.2.2.1.

Mnimos cuadrados ordinarios y dependencia espacial

La dependencia espacial en los diversos modelos autorregresivos presenta muchas


similitudes con la ms familiar dependencia temporal. Por eso, podra resultar lgico que
las propiedades de los estimadores mnimos cuadrados ordinarios (MCO) en modelos con
variables retardadas y/o autocorrelacin temporal pudieran trasladarse directamente al caso
espacial.
Sin embargo, esto no es as, debido fundamentalmente a la naturaleza
multidireccional de la dependencia en el espacio, en contraste con el sentido bidireccional
de la dependencia temporal (del pasado hacia el futuro), tal como se ha presentado en los
Captulos anteriores. Por eso, se analizan previamente los efectos que el fenmeno de
autocorrelacin espacial, tanto en la variable dependiente como en la perturbacin aleatoria,
causan sobre las propiedades de los estimadores MCO en modelos de dependencia espacial.

Mnimos cuadrados ordinarios y variables dependientes desplazadas o


espacialmente retardadas
En econometra es bien sabido que los estimadores MCO, aunque sesgados,
permanencen consistentes en especificaciones con variables dependientes desplazadas,
siempre y cuando no exista autocorrelacin espacial en la perturbacin aleatoria. Por eso,
aunque las propiedades de los estimadores se ven afectadas en muestras pequeas, seguirn
siendo asintticamente insesgados. Sin embargo, en los modelos autorregresivos espaciales
los estimadores MCO son, como se ver a continuacin, sesgados e inconsistentes,
independientemente del comportamiento de la perturbacin aleatoria.
Consideremos, para ello, como en Anselin (1988A), el caso ms simple del modelo
espacial autorregresivo de primer orden, sin autocorrelacin espacial en la perturbacin
aleatoria:
y = Wy + u = y D + u

Eq. IV.2.22.

130 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

donde y(N,1): vector de observaciones de la variable dependiente.


:
coeficiente de la variable dependiente espacialmente retardada.
W(N,N): matriz de pesos espaciales simtrica, de orden (N,N), predefinida
yD:
matriz (W.Y) de observaciones de la variable dependiente
espacialmente desplazada.
u(N,1): vector de trminos de la perturbacin aleatoria, idntica e
independientemente distribuidos, con media ceroE(u) = 0 y matriz de
covarianzas escalar E(uu) = 2.
Expresado en forma matricial desarrollada, el modelo anterior tendra la siguiente
forma:
y1
y
2 =
...

yN

w12 ... w1N y1 u1


0
w
0 ... w2 N y2 u2
21

=
+
...... ...... ... ...... ... ...

wN 1 wN 2 ... 0 yN u N

0
w y
21 1
......

wN 1 y1

w12 y2
0
......
wN 2 y2

... w1N y N u1
... w2 N yN u2
+
... ...... ... Eq. IV.2.23.

...
0 u N

Aunque este modelo es muy sencillo, recoge totalmente los efectos que produce
sobre los estimadores MCO la presencia de una variable dependiente desplazada. Por eso,
puede ser utilizado sin prdida de generalidad.
As, el estimador MCO del parmetro ( ) podra obtenerse como:
1
= [ y D y D ] y D y

Eq. IV.2.24.

Sustituyendo el valor del vector y de la Eq.IV.2.22, en la Eq.IV.2.24:


1
= [ y D y D ] y D ( Wy + u ) = {y D = Wy} =

= [ y D y D ]

[ y D y D ] + [ y D y D ]1 y D u =
1
= + [ y D y D ] y D u
1

Eq. IV.2.25.

Una vez obtenido el estimador MCO del parmetro espacial autorregresivo (), se
analizan las propiedades del mismo, pudindose demostrar que no son buenas, pues se trata
de un estimador sesgado e inconsistente, como se ver a continuacin.
-

Estimador sesgado:

E ( ) = E + [ y D y D ] y D u
1

Eq. IV.2.26.

El valor esperado del segundo sumando del trmino de la derecha no se anula, por
lo que los estimadores MCO son sesgados. Efectivamente, como en los modelos de

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

131

series temporales, esto es debido a la naturaleza estocstica compleja del trmino


1
inverso [ y D y D ] , cuyos elementos son funcin de la variable dependiente (y, por
tanto, tambin de la perturbacin u). Es ms, mientras en los modelos temporales el
trmino E [ y D u ] = 0 , cuando no existe autocorrelacin en la perturbacin aleatoria,
en los modelos espaciales esto no es as, puesto que el trmino E [ y D u ] nicamente
se anula en el caso particular de que = 0:
y = Wy + u

1
1
E [ y D u ] = y = (I W ) u = E W (I W ) u u = {Si = 0} = 0

y D = Wy

{[

Eq. IV.2.27.

Estimador inconsistente:

Es bien sabido que, cuando el tamao de la muestra tiende a la poblacin total, se da


una coincidencia entre estimador y parmetro . En nuestro caso, el estimador
MCO ser consistente si en la Eq.IV.2.25. sucede que:

PLim[ y D y D ]

y y y u
y D u = 0 PLim D D D = 0
N
N N

Eq. IV.2.28.

Esto slo se cumple con 2 condiciones:


y D y D
=Q
N
N
y u
2. PLim D = 0
N
N

1. PLim

Eq. IV.2.29.

siendo Q una matriz finita y no singular.


Mientras que la primera condicin puede llegar a cumplirse a travs de restricciones
apropiadas para el valor de y en la estructura de la matriz de pesos espaciales (W),
la segunda condicin es imposible de obtener en la situacin espacial, salvo en el
caso de que = 0, por lo que el estimador MCO es inconsistente. Efectivamente:
PLim
N

y D u
1
1
1
= y D = W (I W ) u = PLim u W (I W ) u
N

N
N

Eq. IV.2.30.

En consecuencia, los estimadores MCO de los parmetros en modelos espaciales


son sesgados e inconsistentes, independientemente de las propiedades del trmino de error.

132 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

Mnimos cuadrados ordinarios y autocorrelacin espacial en la perturbacin


aleatoria
En este caso, se tendrn en cuenta los efectos que la autocorrelacin espacial de la
perturbacin aleatoria tienen sobre los estimadores MCO en el mismo modelo anterior
(Eq.IV.2.22.), cuya especificacin se correspondera entonces con el modelo mixtoautorregresivo con perturbacin aleatoria autorregresiva, segn la taxonoma de Florax y
Folmer (1992). Estos efectos son mayores que los que produce la autocorrelacin temporal
en el MBRL, pues los estimadores, aunque sesgados son, en este caso, tambin
ineficientes, dada la estructura no escalar de la matriz de varianzas de la perturbacin
aleatoria: E(uu) = 2, siendo los elementos de la matriz (ij) funcin de la variable
dependiente. Estas malas propiedades de los estimadores se demuestran mediante la
comparacin de las expresiones de las matrices de varianzas y covarianzas del parmetro
autorregresivo () en situacin de ausencia/presencia de autocorrelacin espacial en la
perturubacin aleatoria.
1. Ausencia de autocorrelacin espacial en la perturbacin aleatoria:

{[

][

Cov( ) = E [( ) ( )'] = E [ y D y D ] y D u u y D [ y D y D ]
1

]}= [y y
D

]1

Eq. IV.2.31.

2. Presencia de autocorrelacin espacial en la perturbacin aleatoria:

{[

][

Cov( ) = E [( )( )'] = E [ y D y D ] y D u u y D [ y D y D ]
1

= 2 [ y D y D ] y D y D [ y D y D ]
1

]}=

Eq. IV.2.32.

Como puede observarse, esta ltima expresin es superior anterior, por lo que queda
demostrada la ineficiencia de los estimadores MCO, en modelos con perturbacin aleatoria
espacialmente dependiente. Los modelos de dependencia espacial podran ser considerados,
desde este punto de vista, como casos particulares del modelo de regresin lineal con
matriz de covarianzas de la perturbacin aleatoria no escalar.

IV.2.2.2.

Modelo del retardo espacial

El modelo del retardo espacial o modelo mixto autorregresivo de regresin espacial


incluye la variable dependiente espacialmente retardada, Wy, como una variable explicativa
ms, del modo siguiente:
y = Wy + X + u

donde y:
Wy:
:
X:

Eq. IV.2.33.

vector de observaciones de la variable dependiente, de orden (N,1)


vector de retardos espaciales de la variable dependiente, de orden (N,1)
coeficiente espacial autorregresivo
matriz de observaciones de las variables explicativas, de orden (N,K)

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

:
u:

133

vector de parmetros correspondientes a las variables explicativas, (K,1)


vector de orden (N,1) de perturbaciones aleatorias normalmente distribuidas,
con media cero y varianzas constantes (homoscedsticas), 2.

La presencia de un retardo espacial es parecida a la inclusin de variables


endgenas en los sistemas de ecuaciones simultneas, en el contexto temporal clsico. Por
eso, este modelo suele ser llamado tambin modelo simultneo espacial autorregresivo
(Anselin, 1995A) Si el parmetro autorregresivo fuera conocido, el modelo podra
simplificarse, adoptando la forma de un MBRL cuya variable endgena es la endgena del
modelo inicial espacialmente filtrada (yWy), de un modo similar al filtro espacial de
Getis, anteriormente presentado (Getis, 1990, 1995), del siguiente modo:
y Wy = X + u

Eq. IV.2.34.

Sin embargo, lo habitual es que el coeficiente espacial autorregresivo () sea


desconocido, por lo que tenga que ser conjuntamente estimado con los dems parmetros
de regresin. La transformacin de la variable endgena a travs de su filtrado espacial,
permitira contralar el efecto de autocorrelacin espacial en el modelo, de forma que sea
posible conocer el grado de significatividad de las dems variables. Esta interpretacin de
la especificacin mixta regresiva espacial autorregresiva podra tambin llevarse a cabo de
otro modo, entendiendo la explcita inclusin del retardo espacial (Wy) como un aadido al
resto de variables explicativas que permita conocer el grado de dependencia espacial
existente en el modelo, a la par que se controla el efecto del resto de variables.
La consecuencia principal de la inclusin del retardo espacial (Wy) en la
especificacin de un modelo es que la prdida de consistencia de los estimadores MCO,
como sucede tambin en los sistemas de ecuaciones simultneas. En vez de utilizar MCO,
la estimacin debera basarse en el mtodo de mxima-verosimilitud (MV) que es, con
mucho, el ms utilizado, aunque puede estimarse vlidamente este modelo mediante
mtodos de variables instrumentales (VI), como los mnimos cuadrados espaciales en dos
etapas (MC2E) y el mtodo bootstrap. De todos ellos, se harn, a continuacin, algunas
observaciones.

a) Estimacin por el mtodo de mxima-verosimilitud (MV)


La estimacin MV del modelo de retardos espaciales se basa en la hiptesis de
normalidad de la perturbacin aleatoria. A partir de ella, puede obtenerse la funcin de
verosimilitud como una funcin no lineal de los parmetros que debe maximizarse. La
funcin de verosimilitud resultante tiene la siguiente forma:
L = i ln (1 i )

( y Wy X )( y Wy X )
N
N
ln (2 ) ln 2
Eq. IV.2.35.
2
2
2 2

( )

134 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

siendo i los valores propios de la matriz de pesos y el resto de la notacin como en el resto
del captulo. Para los detalles completos de la derivacin y aplicacin, ver Ord (1975),
Anselin (1980, 1988A) y Anselin y Hudak (1992).
Este expresin de optimizacin no lineal podra solucionarse, en el terreno aplicado
de otro modo, expresando los estimadores de los parmetros de la regresin () y la
varianza de la perturbacin aleatoria (2) en funcin del coeficiente autorregresivo (). La
sustitucin de estas expresiones en la funcin de verosimilitud da lugar a la funcin
concentrada de verosimilitud, con un nico parmetro, el coeficiente autorregresivo, que
tiene la siguiente forma:
LC =

N (e0 eL )(e0 eL )
ln
+ i ln (1 i )
N
2

Eq. IV.2.36.

siendo e0 y eL los residuos de la regresin MCO de la variable y sobre X y la variable Wy


sobre X, respectivamente. La simple bsqueda de valores de dar lugar rpidamente al
estimador MV. Los otros parmetros pueden obtenerse a partir de la estimacin MCO de la
variable (y - Wy) sobre X.
El mtodo MV dispone de un menor nmero de contrastes sobre los efectos
espaciales que el mtodo MCO, siendo los ms utilizados el test del multiplicador de
Lagrange (LM) y el test del cociente de verosimilitud (LR) que, por ser asintticos, pueden
dar a conclusiones inconsistentes en el caso de muestras pequeas47.
El contraste de heteroscedasticidad en el modelo del retardo espacial puede
realizarse a travs del test de Breusch-Pagan, basado en los residuos de la estimacin MV,
que es idntico a la formulacin utilizada en el MBRL48. Aunque de forma estricta este
contraste es incorrecto, dado que ignora la presencia de dependencia espacial en el modelo,
en la prctica suele utilizarse habitualmente sin muchos problemas.
En cuanto a los contrastes de dependencia espacial, el test LR del cociente de
verosimilitud sobre el coeficiente autorregresivo () se calcula como el doble de la
diferencia entre el logaritmo de verosimilitud del modelo de retardos espaciales y el
logaritmo de verosimilitud en el MBRL, con el mismo conjunto de variables explicativas
(para = 0). Este estadstico se distribuye como una variable 2 con 1 grado de libertad.
A pesar de que tanto el test LR, como el contraste de Wald (test t asinttico) y LMLAG son todos equivalentes asintticamente, tienden a ofrecer resultados distintos en
muestras finitas. En la mayora de las circunstancias, el orden de dichos estadsticos en
47

Ver Anselin (1988, Captulo 6) para una discusin extensa sobre el multiplicador de Lagrange de Wald y el
test del cociente de verosimilitud (LR) en los modelos espaciales.
48
El test BP equivale a la mitad de la suma de los cuadrados de la variable endgena en una regresin de

ei

2 1 sobre una constante y las variables heteroscedsticas Z.


s ML

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

135

trminos de su magnitud es la siguiente: W LR LM . Este orden implica que ser ms


fcil considerar significativo el coeficiente autorregresivo a partir de los resultados del test
de Wald, que del test LM. En algunos casos, estos 3 contrastes pueden alcanzar resultados
contradictorios; es decir, un test de Wald significativo (p = 0,01), un test LR marginalmente
significativo (p = 0,05) y un no significativo LM (p = 0,15). En estos casos, deberan
interpretarse los resultados con precaucin. Habitualmente, los resultados se ajustan al
orden anterior y, de no ser as, debera sospecharse de un error potencial en la significacin,
como por ejemplo, no normalidad en las perturbaciones aleatorias, no linealidad en la
relacin entre variables dependientes y explicativas o incorrecta eleccin de las variables
explicativas y/o la matriz de pesos espaciales.
Si el modelo de retardos espaciales especificado la especificacin correcta, entonces
no debera quedar en los residuos de la regresin ningn tipo de dependencia espacial. El
test del multiplicador de Lagrange para la autocorrelacin espacial de los errores LM-ERR
propuesto por Anselin (1988A), contrasta esta cuestin. Un resultado significativo en este
test sera indicativo de una mala especificacin de la matriz de pesos espaciales o de la
existencia de algn tipo de dependencia espacial no bien eliminada del modelo. En estos
casos, debera probarse con un modelo autorregresivo de mayor orden (en lugar del modelo
de retardos espaciales habitual), o tambin con nuevas especificaciones de la matriz de
pesos espaciales, o bien con una especificacin del modelo completamente distinta (por
ejemplo, un modelo del error espacial). Por otro lado, si la matriz de pesos utilizada en el
contraste no es la misma que la empleada para el retardo espacial, un valor significativo del
estadstico pondra de manifiesto la conveniencia de un modelo mixto-autorregresivo con
perturbacin aleatoria autorregresiva.

b) Estimacin por el mtodo de variables instrumentales (VI)


La estimacin de modelos con una variable dependiente espacialmente retardada
puede tambin llevarse a cabo mediante mtodos de variables instrumentales (VI), que
constituyen una alternativa ms robusta a la estimacin mximo-verosmil, pues no se exige
la hiptesis de normalidad en la distribucin de la perturbacin aleatoria. Suelen aplicarse,
en concreto, el procedimiento de mnimos cuadrados espaciales bietpicos y mtodos tipo
bootstrap.
El primero de ellos es una aplicacin directa, al modelo del retardo espacial, del
mtodo de estimacin VI llamado mnimos cuadrados bietpicos (MC2E). El segundo
procedimiento utiliza la estimacin con variables instrumentales para construir un
procedimiento tipo "bootstrap"49. Dado que se trata de mtodos robustos, no se ofrece
ningn tipo de contraste en ambos casos.
49

Los mtodos estadsticos clsicos se apoyan en modelos matemticos de naturaleza estocstica, de tal forma
que los resultados que de ellos se derivan requieren, en muchas ocasiones, complejos desarrollos analticos, lo
que ha supuesto un obstculo para su utilizacin comprensiva en muchas reas cientficas. Adems, dichos
desarrollos se basan en hiptesis que algunas veces no son soportadas por los datos o se obtienen resultados
asintticos que no son vlidos cuando el tamao muestral no es suficientemente elevado. Efron (1979)
introduce la metodologa bootstrap para estimar las distribuciones de algunos estadsticos cuando el tamao
muestral es pequeo o las expresiones de dichas distribuciones son analticamente intratables. Los mtodos

136 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

Como ya se ha expuesto en repetidas ocasiones, el modelo de retardos espaciales o


modelo mixto-autorregresivo de regresin espacial incluye una variable espacialmente
retardada (Wy) como una variable explicativa ms. Este retardo espacial y la matriz X de
regresores, a efectos de notacin, se llamar Z y ser una matriz de orden [N(K+1)]. El
estimador de las variables instrumentales (VI) o estimador MC2E aprovechar esta
caracterstica para la construccin de un instrumento adecuado para el retardo espacial que,
aunque consistente, no ser necesariamente muy eficiente, pero constituir la base para el
procedimiento "bootstrap".
El principio de la estimacin de variables instrumentales se basa en la existencia de
un conjunto de instrumentos, Q, que estn fuertemente correlacionados con las variables
originales, Z, aunque asintticamente incorrelacionados con la perturbacin aleatoria. Una
vez identificados estos instrumentos, se utilizarn en la construccin de una variable
"proxi" de las variables endgenas a partir de sus valores estimados en una regresin entre
los instrumentos y las variables exgenas. Esta "proxi" se utilizar, a continuacin, en un
modelo de regrsin estimado por MCO. Matemticamente, este proceso de MC2E da lugar
al siguiente estimador:

IV = (Z ' Q )(Q' Q )1 (Q' Z )

(Z ' Q )(Q' Q )1 Q' y

Eq. IV.2.37.



donde IV = 1
...

K ( K +1,1)
Q:
matriz de instrumentos (N,P), que incluye la matriz X de variables exgenas.
Puede demostrarse que este estimador es consistente y asintticamente eficiente.
Aunque, en el caso de contar con muestras pequeas, sus propiedades dependen muy
estrechamente de la eleccin de los instrumentos y no siempre tienen tratamiento
matemtico50. Un problema potencial de la estimacin VI es que el estimador del parmetro
autorregresivo () no tiene por qu encontrarse situado necesariamente dentro del intervalo
de valores aceptables mayores que la unidad, en valor absoluto lo que, de producirse, suele
poner de manifiesto la existencia de problemas de especificacin en el modelo.
En el esquema clsico (temporal) de los modelos de ecuaciones simultneas, los
instrumentos son las variables exgenas "excluidas". Sin embargo, en los modelos de
retardos espaciales no existe una nocin totalmente equivalente a sta y, por eso, se han
ofrecido mltiples sugerencias (ver en Anselin, 1988A, una visin general del tema). Hace
"bootstrap" (como el "jackknife" anteriormente presentado) se basan en la reproduccin de los datos
originales mediante un remuestreo, de forma que si las observaciones tuvieran, por ejemplo, una estructura de
dependencia, sta debera estar reflejada en los nuevos datos.
50
Ver Bowden y Turkington (1984), y ver tambin Anselin (1980, 1984, 1988A) para un tratamiento ms
detallado de su aplicacin a modelos de retardos espaciales.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

137

unos aos, Kelejian y Robinson (1992) demostraron que las series de variables exgenas
espacialmente retardadas constituyen el conjunto de variables instrumentales ms
adecuado, siempre y cuando se trabaje con matrices de contigidades de uno o ms
rdenes. En la prctica, estas series pueden estar truncadas de forma que slo se incluyan
las variables explicativas con un retardo espacial de primer orden, lo que ocasionara que la
matriz Q contuviera tanto la matriz X como WX, siendo excluidos de esta ltima tanto el
trmino constante como cualesquiera otras variables que pudieran dar lugar a una pefecta
multicolinealidad.
El estimador bootstrap es un estimador robusto que aprovecha la aleatoriedad
presente en distintas muestras de datos, creadas de forma artificial, como base para la
inferencia estadstica, lo que produce diversos estimadores de los parmetros, medidas de
sesgo y varianza, as como la construccin de niveles de pseudo-significacin e intervalos
de confianza51. En el anlisis de regresin, hay dos procedimientos importantes que dan
lugar a estimadores "bootstrap": uno se basa en los residuos, mientras que el otro parte de
las observaciones representadas en un espacio multidimensional. Como se demuestra en
Anselin (1988A, 1990A), slo es aceptable el primero de ellos en modelos del retardo
espacial. El "bootstrap" se basa en un procedimiento propio de las ecuaciones simultneas,
sugerido por Freedman y Peters (1984A y B)52. En un primer paso, se lleva a cabo la
estimacin VI, que proporciona un estimador del vector de perturbaciones (u) en forma de
residuos:

e = y VI Wy X VI

Eq. IV.2.38.

siendo y los estimadores VI obtenidos anteriormente. En la segunda etapa, se generan


los trminos de pseudo-errores mediante muestreo aleatorio (con reemplazamiento) a partir
del vector de residuos (e). Tal como demuestra Anselin (1988A, 1990A), se puede obtener
un vector de pseudo-observaciones de la variable dependiente, para cada conjunto de (er) de
los N residuos remuestrados, del modo siguiente:

y r = (I VI W )

( X VI

+ er )

Eq. IV.2.39.

siendo X el vector de variables exgenas fijas. Mediante el mtodo VI se obtiene un


estimador de y en cada conjunto de datos remuestrados, utilizando Wyr como retardo
espacial. Este procedimiento se repite un gran nmero de veces, por ejemplo R, generando
una distribucin de frecuencias emprica para los estimadores y . El estimador
"bootstrap" ser la media de esta distribucin de frecuencias emprica.

51

Para ms detalles, consultar Efron (1982), Efron y Tibshirani (1986) y Lger et al. (1992).
FREEDMAN, D. y S. PETERS (1984a), "Bootstrapping a regression equation: some empirical results".
Journal of the American Statistical Association, 79; pp. 97-106.
FREEDMAN, D. y S. PETERS (1984b), "Bootstrapping an econometric model: some empirical results".
Journal of Business and Economic Statistics, 2; pp. 150-58.
52

138 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

IV.2.2.3. Modelo del error espacial


El modelo del error espacial es un caso particular de modelos con perturbacin
aleatoria no esfrica, que no satisface los supuestos de homoscedasticidad (varianza
constante) y no autocorrelacin. La dependencia espacial en la perturbacin aleatoria puede
adoptar formas diversas. La especificacin de este modelo es el MBRL con perturbacin
autorregresiva espacial:

y = X + u
u = Wu +
X:
:
u:
:
Wu:
:

Eq. IV.2.40.

matriz de observaciones de las variables explicativas (N,K)


vector de coeficientes de la regresin (K,1)
vector de trminos de la perturbacin aleatoria (N,1)
coeficiente autorregresivo
retardo espacial de la perturbacin aleatoria
perturbacin aleatoria esfrica, con media nula y matriz de varianzas y
covarianzas 2I (homoscedasticidad y no autocorrelacin).

A consecuencia de la dependencia espacial, la perturbacin aleatoria no tiene ya una


matriz de varianzas y covarianzas diagonal, por lo que adoptar la siguiente forma:

E (uu ) = = 2 [(I W )' (I W )]

Eq. IV.2.41.

Si el coeficiente fuera conocido, los coeficientes de la regresin podran estimarse


a travs de un modelo MCO con variables espacialmente filtradas (y - Wy), (X - WX),
del modo siguiente:

( y WY ) = ( X WX ) + u

Eq. IV.2.42.

siendo Wy, WX las variables dependiente y explicativas desplazadas. En este caso, la


perturbacin aleatoria (u) es esfrica. Este mtodo es denominado mnimos cuadrados
generalizados (MCG). Sin embargo, el parmetro no suele ser conocido y debe ser
estimado conjuntamente con el resto de coeficientes de la regresin. En el caso de
autocorrelacin temporal, se han desarrollado algunos mtodos, como mnimos cuadrados
generalizados factibles o estimados (MCGF o MCGE), como el conocido estimador
Cochrane-Orcutt. Pero, debido a la simultaneidad propia de la naturaleza espacial de la
dependencia, en este caso, estos procedimientos no son aplicables al caso espacial, por lo
que debe llevarse a cabo un procedimiento completo de MV53.
Como ya se puso de manifiesto anteriormente, las consecuencias de ignorar la
dependencia espacial en la perturbacin aleatoria (dependencia espacial residual) no son tan
53

Ver una exposicin tcnica ms extensa sobre la capacidad relativa de los diversos estimadores sugeridos
en la literatura, en Anselin (1988, captulo 8).

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

139

importantes como las de ignorar la dependencia en el retardo espacial (dependencia


espacial sustantiva). El principal problema consiste en que los estimadores MCO resultan
ineficientes, aunque an permanecen insesgados. Los estimadores MV son consistentes y,
en la mayora de las ocasiones (incluyendo el caso espacial), tambin producen estimadores
insesgados para los parmetros de la regresin (aunque no para el llamado parmetro de
ruido). Como en el caso del modelo de retardo espacial, la estimacin MV del modelo del
error espacial se fundamenta en la hiptesis de normalidad de las perturbaciones aleatorias.
Establecido este supuesto, podr obtenerse una funcin de verosimilitud, que consiste en
una funcin de los parmetros no lineal a maximizar54.
Como se puso de manifiesto, los estimadores de los parmetros ( ) y la varianza de
las perturbaciones aleatorias (2) pueden expresarse en funcin de un valor del parmetro
autorregresivo (en el mtodo MCG). Una vez sustituidas estas expresiones en la funcin
de verosimilitud, podra encontrarse una funcin de verosimilitud concentrada que sea slo
funcin del parmetro autorregresivo , similar la obtenidad para el modelo del retardo
espacial55. Podra encontrarse un estimador MV del parmetro () a travs de un proceso
simple de bsqueda en el intervalo aceptable [1/min a 1/max], tambin como en el caso del
retardo espacial..
En cuanto a los contrastes de los efectos espaciales, se han formulado, tambin
para este modelo, el test de heteroscedasticidad de Breush-Pagan (del multiplicador de
Lagrange) y el contraste del cociente de verosimilitud (LR) para el coeficiente espacial
autorregresivo (). Adems, existe tambin un test LR y otro de Wald para la hiptesis del
factor comn, que es un contraste sobre la consistencia interna de la especificacin del error
espacial, como se ver ms adelante.
En cuanto a la autocorrelacin espacial, el contraste del cociente de verosimilitud
(LR) para el coeficiente espacial autorregresivo (), se calcula como el doble de la
diferencia entre el logaritmo de verosimilitud del modelo de error espacial y el logaritmo de
verosimilitud del MBRL, con el mismo conjunto de variables explicativas (siendo nulo el
parmetro ). Este contraste se distribuye como una 2 con 1 grado de libertad. El modelo
de error espacial podra transformarse dando lugar al llamado modelo mixto autorregresivo
regresivo cruzado de regresin espacial o modelo Durbin espacial del factor comn56 que,
54

La verosimilitud adopta la forma propia de una perturbacin aleatoria no esfrica:

L = iln (1 i ) N 2 ln (2 ) N 2 ln 2 ( y X )' (I W )' (I W )( y X ) 2 2 ,

siendo i los valores propios de la matriz de pesos y el resto de la notacin como en el texto principal. Para
una mayor consideracin del proceso de obtencin y aplicacin, ver Ord (1975), Anselin (1980), Anselin
(1988A, cap. 8) y Anselin y Hudak (1992).
55

La funcin de verosimilitud concentrada adopta la forma:

LC = N 2 ln[ee N ] + iln[1 i ],

donde ee es la suma de los cuadrados de los residuos de la regresin de la variable espacialmente filtrada y
las variables explicativas: (y-WY), (X - WX). Para mayor detalle, ver Anselin (1980), Anselin (1988A) y
Anselin y Hudak (1992).
56
Este modelo se denomina como modelo Durbin por analoga con la especificacin similar para los modelos
de series temporales (para detalles tcnicos, ver Burridge, 1981; Bivand, 1984; Anselin, 1988A. La propuesta
de Durbin, en modelos de series temporales, consiste en trabajar con el modelo transformado de forma que,

140 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

en la nueva taxonoma de Anselin (2001E), sera tambin un modelo de externalidades


globales no modelizadas (presentes en la perturbacin aleatoria):
y = Wy + X WX + u

Eq. IV.2.43.

con la misma notacin que anteriormente. Sin restricciones, este modelo sera:
Y = WY + X WX + u

Eq. IV.2.44.

Lo que hace especial a este modelo del factor comn es la restriccin no lineal
presente en los coeficientes del retardo espacial (), las variables explicativas () y las
variables explicativas espacialmente retardadas (). Para ser consistentes con la formulacin
del error espacial, los coeficientes de los trminos WX tendran que ser iguales al valor
negativo del producto del coeficiente del trmino Wy por los coeficientes de los trminos
de la matriz X. La expresin matemtica de esto mismo es lo que se conoce como hiptesis
del factor comn:
H0: =

Eq. IV.2.45.

Hay dos formas de contrastar esta hiptesis. Una de ellas, se lleva a cabo mediante
el contraste de Wald sobre el conjunto de restricciones no lineales derivadas del factor
comn. Este test se distribuye asintticamente como una 2 con tantos grados de libertad
como coeficientes tenga la regresin, sin incluir el trmino independiente. El test se calcula
a partir de una estimacin MV auxiliar del modelo del retardo espacial sin restricciones.
Otro modo de contrastar esta hiptesis consistira en obtener un test del cociente de
verosimilitud (LR) a partir de la maximizacin de la funcin de verosimilitud del modelo
del error espacial (es decir, el modelo con restricciones) y la verosimilitud del modelo del
error espacial sin restricciones. El test LR tambin se distribuye asintticamente como una
2 con los mismos grados de libertad con el contraste de Wald.
En alguna ocasin, las variables explicativas espacialmente retardadas WX dan
lugar a una multicolinealidad perfecta (por ejemplo, cuando se incluyen variables ficticias),
en cuyo caso no se podra calcular el contraste sobre la hiptesis del factor comn.

por ejemplo, en un modelo con tres variables explicativas en el que existe autocorrelacin espacial, el modelo
original se transforma del modo siguiente:

y i y i 1 = 1 (1 ) + 2 ( x 2i x 2i 1 ) + 2 ( x 3i x 3i 1 ) + 4 ( x 4i x 4i 1 ) + (u i u i 1 ) =
= 1 (1 ) + y i 1 + 2 x 2i 2 x 2i 1 + ..........

En trminos generales, este modelo se expresara como:

y i = 1 (1 ) + y i 1 + 2 x 2i 2 x 2i 1 + ... + K x Ki K x Ki 1 + u i

Este modelo debe ser estimado por MCO, aceptando como estimador de el coeficiente de la variable yi-1 de
forma que, con este valor de , se transforme el modelo original, estimando por MCO los parmetros del

) del modo siguiente:


nuevo modelo definido y calculando a partir de aqu los parmetros (
y i = 1 (1 ) + y i 1 + 2 x 2i 2 x 2i 1 + ... + K x Ki K x Ki 1 + u i

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL 141

IV.2.3. Estimacin y contrastes de modelos de heterogeneidad espacial

Como ya se ha indicado, en un modelo de regresin lineal pueden distinguirse


diversas especificaciones para el efecto de heterogeneidad espacial, segn que se manifieste
como heteroscedasticidad (modelo del error heteroscedstico) o como inestabilidad
paramtrica que puede ser, a su vez, continua (modelo de parmetros aleatorios, modelo de
superficie tendencial) o discreta (modelo espacial de regresiones cambiantes). Cada una de
estas formulaciones requiere de mtodos propios de estimacin y contraste que se exponen
a continuacin.

IV.2.3.1. Modelo del error heteroscedstico


El modelo del error heterocedstico es un caso particular del llamado modelo de
perturbaciones aleatorias no esfricas. La varianza de la perturbacin aleatoria no es ya una
constante, sino que vara con cada observacin:

y = X + u

Var (u i ) = i2
E [uu ] =
donde y:
X:
u:

Eq. IV.2.1.

vector de observaciones de la variable dependiente (N,1)


matriz de observaciones de las variables explicativas (N,K)
vector de perturbaciones aleatorias (N,1), con varianza i2 , para cada
observacin i, y matriz diagonal de varianzas y covarianzas .

La estimacin de este modelo puede llevarse a cabo a travs del mtodo de mnimos
cuadrados generalizados factibles (MCGF) y mxima-verosimilitud (MV), que se exponen
a continuacin.
El principio que est detrs de la estimacin MCGF del modelo del error
heterocedstico es la obtencin de estimadores consistentes para los elementos de la
varianza de la perturbacin aleatoria (). Estos estimadores podrn ser utilizados en la
expresin de los estimadores MCGF:

bMCGF = X 1 X

X 1Y

Eq. IV.2.2.

Como se ha expuesto en al Apartado IV.1.2., para que este modelo sea identificable,
la varianza no constante del trmino del error debe tener alguna estructura, como la
heteroscedasticidad aditiva (en la que la varianza de la perturbacin aleatoria se expresa
como una funcin lineal de un conjunto de variables explicativas), de coeficientes
aleatorios y de grupos.

142 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

Tanto para el caso de heteroscedasticidad aditiva como de coeficientes aleatorios,


los estimadores MCGF pueden obtenerse a travs de un procedimiento en tres etapas,
sugerido por Amemiya (1977, 1985), que parte de los residuos de una regresin MCO (e).
En una primera etapa, se realiza una regresin entre el cuadrado de los citados residuos (e2),
y las variables Z heteroscedsticas, que da lugar a un primer conjunto de estimadores 1:

1 = [Z Z ] Z e 2
1

Eq. IV.2.3.

En una segunda etapa, los estimadores de la varianza de la perturbacin aleatoria,


obtenidos a partir de los estimadores 1, se utilizarn para obtener unos estimadores MCGF
ms eficientes en una regresin del cuadrado de los residuos y las Z variables:

2 = [Z D 2 Z ] Z D 2 e 2
1

Eq. IV.2.4.

donde D es una matriz diagonal de elementos Z1. En una tercera etapa, los estimadores 2
se utilizarn para construir un estimador consistente de la matriz , adoptando como
elementos de la diagonal principal de el producto de Z2- Esta matriz ser luego
utilizada para obtener los estimadores MCGF definitivos.
En el caso de la heteroscedasticidad de grupos (groupwise) la estimacin MCGF
es mucho ms sencilla. Los residuos de la regresin MCO se agrupan segn las estructuras
definidas por una variable indicador y, para cada grupo (g) la varianza de la perturbacin
aleatoria ( g2 ) es estimada como eg e g N g , donde eg es el vector de residuos del grupo g, y
Ng, el nmero de observaciones del grupo. Los estimadores de g2 se sustituyen entonces en
los propios elementos de la diagonal principal de para obtener los estimadores MCGF.
Cuando los trminos de la perturbacin aleatoria se distribuyen normalmente, el
procedimiento iterativo de MCGF puede demostrarse que es equivalente a la estimacin
MV57.
El contraste de heteroscedasticidad en este modelo, puede realizarse a travs del
test de Wald (W) y el cociente de verosimilitud (LR). En el caso de heteroscedasticidad
aditiva y coeficientes aleatorios, en los que el trmino constante puede identificarse con la
varianza homoscedstica, el test de Wald consistira en un contraste de significacin
conjunta del resto de coeficientes de la especificacin heteroscedstica, mientras que en el
caso de heteroscedaticidad de grupos (groupwise), este test sera un contraste sobre la
igualdad de las varianzas en cada grupo o estructura considerados. Por su parte, el test del
cociente de verosimilitud (LR) se calcula como el doble de la diferencia entre el logaritmo

57

La funcin matemtica del logaritmo de verosimilitud para el modelo del error heterocedstico tiene la

forma:

L = N 2 [ln 2 ] 0,5 ln 0,5u 1u , donde es el determinante de la matriz de

covarianzas de la perturbacin no escalar y el resto de la notacin, como anteriormente.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL 143

de verosimilitud en el modelo deL error heterocedstico y el MBRL, con el mismo nmero


de variables.
En cuanto a la dependencia espacial, este efecto puede ser estimado a travs de los
contrastes LM-ERR (dependencia residual) y LM-LAG58 (dependencia sustantiva) que,
como se ha indicado, son contrases asintticos cuya distribucin sigue una 2 con 1 grado
de libertad.

IV.2.3.2. Modelos de inestabilidad paramtrica continua

Los modelos de inestabilidad paramtrica continua ms frecuentemente utilizados


son el modelo de superficie tendencial y el modelo de parmetros aleatorios de Casseti,
cuyos procedimientos de estimacin y contraste sobre los efectos espaciales se exponen a
continuacin.

1.

Modelo de superficie tendencial

Se trata de un modelo de regresin especial cuyas variables explicativas son los


elementos de un polinomio de las coordenadas terrestres (longitud/latitud) de las unidades
espaciales (l, m). Este modelo, expresado nicamente como funcin de las coordenadas,
puede se estimado por MCO. Pero, en este tipo de especificacin, podran implementarse
tambin otras formulaciones, como el modelo del retardo espacial, error espacial o error
heteroscedstico, debiendo emplearse, en estos casos, los mtodos de estimacin adecuados
anteriormente expuestos.

2.

Modelo de parmetros aleatorios

La variedad de la heterogeneidad espacial de los parmetros se expresa en forma de


variacin continua. La especificacin del modelo de regresin espacial puede dar lugar a 2
tipos de problemas que merecen alguna atencin.
-

58

Cuando se utilizan muchas variables, ser inevitable que se produzca un cierto


grado de multicolinealidad (por ejemplo, cuando hay superficie tendencial), lo
que complicara la interpretacin de los resultados de la regresin. Una de las
soluciones aportadas por Casetti y Jones (1988) evita este problema
reemplazando el conjunto original de variables de expansin por sus

Matemticamente, el test LM-LAG se expresa como:

] [

LM LAG = e 1WY
1

] [D + Tr (W W + W )] ,

siendo D = WXb ' WXb WXb ' X X ' X


X ' WXb , donde e son los residuos
de la estimacin MCGF, es la matriz de estimadores de las varianzas de las perturbaciones aleatorias, WXb
son los valores de prediccin espacialmente retardados y Tr es el operador traza de una matriz. Este test es
una extensin directa del contraste del retardo espacial expuesto anteriormente.

144 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

componentes principales obtenidos a travs del mtodo llamado de expansin


ortogonal.
-

Otro problema consiste en la heteroscedasticidad potencial que podra


producirse cuando no se especifica correctamente la expansin (Anselin, 1988 y
1992), lo que podra corregirse a travs de una estimacin por MCO robustos o
mediante los mtodos de estimacin del modelo del error heteroscedstico, que
no requerira modificaciones en la expansin.

Existe un contraste especial sobre la estabilidad de los coeficientes de regresin, en


forma de contraste sobre la significatividad conjunta de los coeficientes de expansin,
siendo la hiptesis nula la siguiente:
H0: 1K = 2K = ... = MK = 0

Eq. IV.2.5.

para todas las variables de expansin. En la regresin por MCO, este contraste consiste en
un estadstico F, con [M.(K-1), N-M(K-1)] grados de libertad, siendo M el nmero de
variables de expansin y K el nmero de variables explicativas del modelo inicial. En todos
los dems mtodos de estimacin, este test es un test asinttico de Wald, distribuido como
una 2 con [N.(K-1)] grados de libertad. Adems del contraste conjunto, tambin se incluye
un test sobre la significacin de la expansin para cada coeficiente del modelo inicial. Una
vez ms, este test ser un estadstico F para la estimacin MCO, con (M.N-M grados de
libertad, y un estadstico asinttico de Wald para el resto de mtodos (2 con M grados de
libertad).

IV.2.3.3. Modelo espacial de regresiones cambiantes


En muchos casos, la asuncin de una relacin fija entre las variables explicativas y
la variable dependiente, que se mantenga a lo largo de toda la base de datos, no es
sostenible, porque pueda producirse heterogeneidad en forma de distintos trminos
independientes y/o pendientes en la ecuacin de regresin para subconjuntos de datos59.
Este fenmeno es, a menudo, denominado en la literatura economtrica como inestabilidad
estructural o cambio estructural y puede expresarse en forma de regresiones cambiantes
(switching regressions), planteados por primera vez por Quandt (1958). Cuando los
diferentes subconjuntos de datos pertenecen a regiones o grupos de unidades espaciales, la
especificacin de regresiones cambiantes es denominada por Anselin (1988A) como
estructuras o regmenes espaciales (spatial regimes).
Estos modelos pueden resolverse estimando conjuntamente los coeficientes de todas
las estructuras, a partir de una matriz aumentada de observaciones de las variables
independientes, de dimensin (N,MK), siendo M el nmero de estructuras, mediante la
transformacin de cada una de las variables explicativas en tantas variables nuevas como

59

Las diferentes ordenadas en el origen o trminos independientes pueden ser fcilmente considerados con la
inclusin de variables ficticias en la especificacin de la regresin.

CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL 145

estructuras existan. Las nuevas variables tendrn valor cero para todas las observaciones no
incluidas en la estructura correspondiente.
Existe un contraste aadido, el test de Chow espacial (Anselin, 1990) sobre la
estabilidad de los coeficientes de la regresin a travs de las estructuras identificadas, cuya
hiptesis nula es la estabilidad de los parmetros en todas las estructuras. Por ejemplo, para
el caso de 2 estructuras:

H 0 :1 = 2 y 1 = 2
Este contraste se realiza para todos los coeficientes conjuntamente, as como para
cada coeficiente por separado. Se trata de un test basado en el conocido test de Chow
(1960) en modelos temporales. El estadstico de Chow espacial se distribuye como una F
con (K,N-MK) grados de libertad. Este contraste se basa en un estadstico de Wald (W)
asinttico, distribuido como una 2 con (M-1*K) grados de libertad (ver, por ejemplo,
White, 1980, y MacKinnon y White, 1985).
En la Tabla IV.2.1., se resumen los mtodos de estimacin y contrastes presentados
en este Apartado.

Tabla IV.2.1. Mtodos de estimacin y contrastes de efectos espaciales

Modelo
MBRL

Mtodo de
estimacin
MCO

Contrastes de dependencia
Retardo espacial
Residuos
LM-LAG
LM-LE

I de Moran
Kelejian y
Robinson (K-R)
LM-ERR
LM-EL
SARMA
LM-LAG,

Contrastes de
heteroscedasticidad
Breusch-Pagan (BP)
Koenker-Bassett (KB)

Modelo del retardo MV


espacial
VI-MC2E
VI-Bootstrap

W de Wald
LR
LM-LAG

LM-ERR

Breusch-Pagan (BP)

Modelo del error


espacial

MCG
MV

W de Wald
LR

LM-ERR

Breusch-Pagan (BP)

Modelo del error


heteroscedstico

MCO-robustos LM-LAG
MCGF
MV

LM-ERR

W de Wald
LR

Modelo de
superficie
tendencial

MCO
(otros, segn
especificacin)

146 CAPTULO IV. ANLISIS CONFIRMATORIO: MODELOS DE REGRESIN ESPACIAL

Modelo

Mtodo de
estimacin

Contrastes de dependencia
Retardo espacial
Residuos

Contrastes de
heteroscedasticidad

Modelo de
parmetros
aleatorios

MCO
MCO-robustos

Test F de inestabilidad
W de Wald

Modelo de
regresiones
cambiantes

MCO
(otros, segn
especificacin)

Chow espacial

Fuente: Elaboracin propia.

Você também pode gostar