Escolar Documentos
Profissional Documentos
Cultura Documentos
Apostila Econometria Espacial PDF
Apostila Econometria Espacial PDF
CURSO
DE
ECONOMETRIA ESPACIAL
APLICADA
Piracicaba, 2004
Curso de Econometria Espacial Aplicada
_____________________________________________________________________________
SOBRE O AUTOR
Foi pesquisador visitante, por meio de uma bolsa "sandwich" concedida pela CAPES,
no Regional Economics Applications Laboratory (REAL), da Universidade de Illinois (EUA)
em 2001-02. Na Universidade de Illinois, desenvolveu a sua tese de doutorado e realizou
estudos sobre Econometria Espacial. Foi aluno do Prof. Luc Anselin, da Universidade de
Illinois, assistindo aos cursos "Spatial Analysis" e "Spatial Econometrics".
CONTATOS DO AUTOR
Endereo comercial:
Departamento de Economia, Administrao e Sociologia, da ESALQ-USP
Av. Pdua Dias, 11 Cx. Postal 9
CEP 13418-900
Piracicaba SP
Tel.: (019) 3417-8726
(011) 9932-6377
Fax.: (019) 3434-5186
E-mails: ealmeida@esalq.usp.br
edu_simoes@hotmail.com
y = X + ~ N (0, I ) (1.1)
em que y a varivel dependente com n linhas, X uma matriz de variveis explicativas com n
linhas e k colunas, um vetor com k coeficientes de regresso e um vector com n termos
aleatrios de erro, seguindo uma distribuio normal. Os pressupostos subjacentes para esse
modelo clssico so os seguintes:
a) Uma funo linear de um conjunto especfico de variveis independentes relevantes, com
coeficientes fixos;
b) Termos aleatrios de erro tm mdia zero;
c) Todos os termos de erro tm a mesma varincia e no so correlacionados entre si (em
outros termos, os termos de erro so esfricos);
d) As observaes sobre as variveis independents podem ser fixas em amostras repetidas;
e) A matriz X tem pleno posto.
O pesquisador pode se considerar muito sortudo se o fenmeno estudado comportar-se
conforme os pressupostos do modelo clssico de anlise de regresso linear. O mundo real
1
De acordo com Anselin (2001b, p. 113), econometria espacial um subcampo da econometria que lida com as
complicaes causadas pela interao espacial (autocorrelao espacial) e pela estrutura espacial
(heterogeneidade espacial) em modelos de regresso para dados na forma de cross-section e painel de dados.
yi = f ( y j ) i = 1, K , n e i j (1.2)
yi yj
Nesse esquema, existe uma interao entre a varivel de interesse y da unidade espacial i
com a mesma varivel localizada na unidade espacial contgua a ela, denominada j.
Cabe aqui uma palavra de alerta. Dependncia espacial uma propriedade de funes de
densidade conjunta. Conseqentemente, difcil de se observar na prtica. Assim, procura-se
2
Segundo Boller et al. (2001, p. 566), heterogeneidade espacial refere-se situao em que coeficientes ou os
padres de erro variam sistematicamente atravs das reas geogrficas. De acordo com Le Sage,
heterogeneidade espacial refere-se variao em relaes atravs do espao.
#
#
# #
# #
#
#
#
# # # #
# #
# # #
# # #
# #
# # # #
# # # # #
#
# ##
#
# #
# # # #
# # #
#
# # #
#
# # # # #
# # # # #
# # # #
# # #
# # # # #
# #
# # # #
# #
# # # #
# #
# # ## #
# # # # #
# # #
# #
# # #
# #
#
# # # #
Mg_ferro_polyline.shp
# # #
#
Mg_hidro_region.shp
# # # #
#
#
#
#
# # # Mg_aero_point.shp
# # # #
# # #
# # #
# #
#
N
# # ##
#
W E
200 0 200 400 Miles
S
W E
200 0 200 400 Miles
S
O cerne da questo repousa na representatividade desse nico mapa. O que garante que
esse mapa representativo da populao de mapas que poderiam ter sido gerado? Perceba que
esse um problema parecido enfrentado tambm pela econometria de sries de tempo. Quais so
os pressupostos necessrios para se fazer a fim de poder considerar um nico mapa como
representativo de toda uma populao de mapas? Por essa caracterstica prpria do mecanismo
estocstico gerador de dados espaciais, isso coloca um problema de como fazer inferncia
estatstica.
A soluo encontra-se em considerar que o mecanismo estocstico gerador de dados
opera com uniformidade atravs do espao. Como a discusso envolver, portanto, mecanismos
geradores de dados que esto vinculados a processos estocsticos, vale a pena definir esse ltimo
conceito.
{yi : i D} (1.3)
em que y uma varivel de interesse associada varivel-ndice i que designa uma unidade
espacial, ou seja, uma locao no espao pertencente a um subconjunto fixo e finito D que, por
sua vez, pertence a d .
Para contornar esse problema e poder fazer inferncia estatstica, preciso impor certas
condies de estabilidade aos dados do mapa, restringindo o grau de dependncia e
heterogeneidade do processo estocstico espacial. Em outros termos, necessrio estabelecer a
noo de estacionariedade. A importncia disso repousa no fato de que, ao impor essa noo,
possvel considerar, no caso em tela, como se houvesse mltiplos mapas com a rea colhida per
capita para Minas Gerais. Na ausncia da estacionariedade, o nico mapa (a nica realizao do
processo estocstico espacial) seria considerado uma amostra no representativa da populao,
tornando invlida a anlise confirmatria implementada a posteriori.
A noo de estacionariedade permite expressar essas condies de regularidade em
termos do primeiro e segundo momentos da distribuio de probabilidades. Ela envolve a
imposio das seguintes restries variao dos dados extrados de um processo estocstico
espacial.
a) mdia constante: E(yi)=;
b) varincia constante: Var(yi)=y2
c) covarincia: Cov(yi, yj)=y2c().
c) covarincia como funo apenas da distncia relativa de duas regies Cov(yi, yj)=y2c(dij).
Note que agora, na definio da covarincia, aparece a funo c(.) que relaciona as
distncias das regies i e j, respectivamente dij. Tal noo de estacionariedade implica um
processo isotrpico, ou seja, a funo c(.) somente depende da distncia entre as regies e no da
direo de separao das duas regies. Para entender melhor esse conceito de isotropia,
considere a figura 2 abaixo.
100 Km
A B 100 Km
yi = A.Ki.Li(1-) (1.3)
n=9
n=36
3
Do ingls, modifiable areal unit problem (MAUP).
2.1. Introduo
Vimos no primeiro captulo que a dependncia ou a autocorrelao espacial significa que
o valor de uma varivel de interesse numa certa regio i depende do valor dessa varivel nas
regies vizinhas j. Isso pode ser expresso pela seguinte equao, medindo a covarincia dessas
variveis em regies distintas:
Cov( yi , y j ) = E ( yi y j ) E ( yi ) E ( y j ) 0 i = 1, K , n e i j (2.1)
2.2.1. Binria
A matriz binria de pesos espaciais pode ser construda segundo a idia da contiguidade,
cuja definio que duas regies so vizinhas, caso elas partilhem de uma fronteira fsica
comum. Com base nesse conceito de contiguidade, atribudo um valor unitrio na matriz a duas
regies vizinhas; caso contrrio, atribue-se um valor nulo.
Talvez a forma mais simples para definir uma matriz de pesos espaciais seja uma matriz
binria de vizinhana: se duas regies so vizinhas, ou seja, partilham de uma fronteira, atribue-
se o valor unitrio; caso contrrio, atribue-se o valor nulo. Formalmente:
1 se i e j so contguos
wij = (2.2)
0 se i e j no so contguos
Por conveno, wii=0, ou seja, nenhuma regio i pode ser vizinha dela mesma. Por que
convencionalmente os termos da diagonal principal da matriz W so nulos? Em resposta a isso,
alude-se facilidade computacional: uma vez que se calcula freqentemente o trao da matriz de
pesos espaciais, e como o trao definido como a somatria dos elementos da diagonal principal
da matriz, se esses forem nulos, o trao assumir, conseqentemente, o valor nulo tambm,
facilitando uma srie de contas.
1
Em vista disso, matriz de pesos espaciais e matriz de contiguidade so sinnimos.
2
Na situao em que apenas os vrtices so considerados como vizinhos, a conveno chamada de bispo (bishop).
A tabela abaixo mostra a matriz binria de pesos espaciais do Brasil segundo a conveno
rainha:
Tabela 2.1: Matriz Binria de Pesos Espaciais para as Regies Brasileiras (Conveno
Rainha)
N NE CO SE S
N 0 1 1 0 0
NE 1 0 1 1 0
CO 1 1 0 1 0
SE 0 1 1 0 1
S 0 0 0 1 0
1 se d ij d
wij = (2.3)
0 se d ij > d
wij
wijs = (2.4)
w
j
ij
w
j
s
ij =1 (2.5)
N NE CO SE S
N 0,000 0,500 0,500 0,000 0,000
NE 0,333 0,000 0,333 0,333 0,000
CO 0,333 0,333 0,000 0,333 0,000
SE 0,000 0,333 0,333 0,000 0,333
S 0,000 0,000 0,000 1,000 0,000
wij = f (d ij ) (2.6)
Os pesos espaciais so uma funo da distncia entre as regies i e j. Vale destacar que a
funo f pode assumir vrias especificaes, tais como:
wij = bd ij (2.9)
Um problema com esse tipo de matriz que o parmetro b , muitas vezes, determinado
arbitrariamente. Todavia, o principal problema com a conveno da distncia surge quando dij
aproxima-se de zero, wij torna-se muito grande, aproximando-se do infinito.
Uma alternativa estim-los junto do modelo. Todavia, isso impe uma dificuldade
representada pelo problema de identificao quando os pesos so no-lineares como na funo
de distncia inversa e na distncia exponencial. Como na especificao dos modelos os
parmetros espaciais multiplicam os pesos, os parmetros podem no ser identificados
separadamente, pois a sua interao multiplicativa.
bij
wij = (2.10)
d ij
b S
Claramente, temos que bRS < bSR. Isto , a proporo da fronteira comum entre as
unidades espaciais A e B com relao ao permetro de A (bRS) menor que a proporo dessa
fronteira comum no permetro de B (bSR). Isso obviamente acarreta que a matriz W com os
pesos Cliff-Ord no simtrica. Se no forem vizinhos, tem-se que bij=0 e, portanto, wij=0.
Uma desvantagem dessa matriz que necessrio obter valores para dois parmetros a e
b, e no apenas um. Ademais, os valores desses parmetros so, freqentemente, determinados
arbitrariamente. Se forem estimados, o problema da identificao, discutido acima, retorna.
1
wij = (2.11)
yi y j
A primeira matriz diz respeito matriz padronizada de pesos espaciais W da tabela 2.2. O
vetor refere-se ao PIB das regies Norte, Nordeste, Centro-Oeste, Sudeste e Sul. O ltimo vetor
apresenta a defasagem espacial do PIB macrorregional, isto , o PIB mdio das regies vizinhas.
A utilidade desse conceito para definir defasagens tanto na varivel dependente (Wy),
quanto na varivel independente (WX) e defasagem no termo de erro (Wu). A interpretao
sempre continua sendo a mdia nos vizinhos.
2.6. Concluses
A necessidade de se construir uma matriz de pesos espaciais surge a fim de pr uma
configurao na interao espacial. Existem vrios tipos de matrizes baseadas na contiguidade
geogrfica, tais como as matrizes binrias de vizinhana nas convenes rainha, torre e k
vizinhos mais prximos ou nas matrizes de distncia inversa.
As matrizes de pesos espaciais tambm podem ser construdas com base no conceito de
contiguidade scio-econmica. Com relao a esse tipo de matriz, preciso cuidado a respeito
do problema de endogeneidade e da distncia zero.
A escolha da matriz mais adequada deve respeitar certas propriedades desejveis e certas
particularidades do estudo em questo. Um procedimento simples apresentado neste captulo
pode auxiliar na seleo da matriz mais apropriada.
3.1. Introduo
Como j vimos no primeiro captulo, a interao no espao tem uma natureza
bidimensional, gerando efeitos espaciais que violam o vital pressuposto de que os erros so
esfricos. Alm do mais, desde que a heterocedasticidade resistente a vrios procedimentos
para corrigi-la, muito provvel que as suas fontes venham da intricada relao com a
dependncia espacial. Conforme destacado por Anselin e Bera (1998), em processos espaciais,
existe um imbricamento entre esses dois efeitos: heterogeneidade gera dependncia espacial e,
por sua vez, dependncia espacial pode tambm induzir heterogeneidade.
Essas caractersticas provocam srias dificuldades para identificar modelos
economtricos espaciais de forma apropriada. Em conseqncia, o trabalho de identificao pode
consumir muito tempo, transformando-se em tedioso, ou pior ainda, pode conduzir a modelos
inadequados.
Em vista disso, uma anlise exploratria de dados espaciais (AEDE) pode auxiliar a
superar tal problema de identificao, provendo claras dicas e indicaes sobre a existncia de
padres de associao espacial tanto em mbito global quanto local ou sobre a presena de
clusters nos dados, ou, ainda, sobre a influncia de observaes discrepantes (outliers). Assim,
fazer uma anlise exploratria precede uma boa modelagem economtrica espacial.
A AEDE uma coleo de tcnicas para a anlise estatstica de informao geogrfica,
com o intuito de descobrir padres espaciais nos dados e para sugerir hipteses, mas impondo a
menor estrutura possvel. A AEDE procura descrever distribuies espaciais, identificar
observaes discrepantes no espao, descobrir padres de associao espacial e sugerir clusters
espaciais. Assim, o objetivo primordial deixar os dados espaciais falarem por eles prprios.
Um ponto a se destacar que essa anlise mais apropriada para investigar variveis
espacialmente densas ou intensivas variveis que so divididas por algum indicador de
intensidade. Encontram-se na literatura diversas maneiras de definir um indicador de intensidade.
As formas mais comuns seriam variveis per capita, ou por rea, ou variveis divididas pela
W E
200 0 200 400 Miles
S
I =
n w ( y y )( y
ij i j y)
(3.1)
w ij ( y y) i
2
em que n o nmero de unidades espaciais, yi a varivel de interesse, wij o peso espacial para
o par de unidades espaciais i e j , medindo o grau de interao entre elas.
A estatstica de I de Moran um coeficiente de associao linear do tipo produto cruzado,
padronizado por dois termos (Odland, 1988, p. 10). O primeiro termo refere-se varincia dos
dados de interesse [(yi - y )2], ao passo que o segundo fornece a idia da configurao espacial
dos dados n/wij. Note ainda que somatria dupla significa que todos os elementos da matriz de
pesos espaciais W devem ser somados, denotando a densidade dessa matriz. Assim, a estatstica I
de Moran baseada nas somas de produtos cruzados de yi para regies vizinhas, segundo um
critrio de vizinhana dado pela matriz de pesos espaciais W.
c=
n 1 w ( y y )
ij i j
2
(3.2)
2 wij ( y y) i
2
Note que tambm tal medida assume uma forma de qualquer coeficiente de
autocorrelao: o numerador uma medida de covarincia entre yi, ao passo que o denominador
uma medida de varincia.
Posto que essa estatstica assume uma medida diferente de covarincia, a sua
interpretao muito distinta do coeficiente I de Moran. O valor de c de Geary situa-se entre 0 e
2, ao passo que o seu valor esperado (terico) 1. Valores menores que o seu valor esperado de
1
Para ver formalmente essa semelhana entre as duas frmulas, consulte Anselin (1988) e Anselin e Bera (1998).
Tabela 3.2: Estatstica c de Geary para rea Colhida per Capita em Minas Gerais
O valor de c de Geary para rea colhida per capita 0,57, altamente significante do ponto
de vista estatstico, tanto pela conveno rainha quanto torre. Como a estatstica c menor que o
valor esperado de 1, isso sugere evidncias de que a rea colhida per capita esteja positivamente
autocorrelacionada no espao. Esse resultado refora a evidncia de autocorrelao espacial
encontrada por meio da estatstica I de Moran.
z k' Wzl
I kl = (3.3)
z k' z k
z k' Wzl
I kl = (3.4)
n
2
Logo, temos que: z k = ( y k y ) / k .
Tabela 3.3: Estatstica I Multivariada para Densidade Rodoviria e rea Colhida per
Capita
Estatstica I E(I) Desvio-padro Probabilidade
0,1804 -0,0154 0,0607 0,008
Os resultados da inferncia indicam que existe uma pequena associao linear espacial
positiva (0,18) entre a densidade rodoviria pavimentada e a rea colhida per capita em nvel
microrregional, porm altamente significante do ponto de vista estatstico.
3
Os resultados desse exemplo foram obtidos usando o programa GeoDa.
( yi y ) wij (y j y )
j
Ii = (3.5)
(y y)
2
i /n
i
ou
I i = z i wij z j (3.6)
j
em que zi e zj so variveis padronizadas e a somatria sobre j tal que somente os valores dos
vizinhos j Ji so includos. O conjunto Ji abrange os vizinhos da observao i.
Sob o pressuposto da aleatorizao, o valor esperado da estatstica Ii dado por:
E[ I i ] = wi. (n 1) (3.7)
Mapa 3.2: Mapa de Disperso de Moran para rea Colhida per Capita
Tipo de Associao
Alto-Alto
Baixo-Baixo
Alto-Baixo
Baixo-Alto
W E
X 'Wy
b= (3.11)
X'X
O problema com o diagrama e o mapa de disperso de Moran que eles exibem clusters
tanto estatsticamente significantes quanto no. No h sentido levar em conta na anlise clusters
que no sejam estatisticamente significantes.
Como j vimos, podemos avaliar a associao linear espacial localizada pelo I de Moran
local, que pode ser avaliado sua significncia estatstica. Para cada observao computada um
Ii. Assim, temos n Ii e seus nveis de significncia. Tamanha quantidade de informao pode
confundir o pesquisador, se colocada em tabelas. Uma forma mais eficiente de apresentar esse
conjunto de estatsticas mape-las. O mapa de significncia 3.3 exibe as unidades espaciais
com estatsticas I local de Moran significantes para rea colhida per capita em Minas Gerais.
Nveis de Significncia
no significante
p = 0.05
p = 0.01
W E
Clusters
No significante
Alto-Alto
Baixo-Baixo
Alto-Baixo
W E
Note que existem dois principais clusters a respeito de rea colhida per capita em Minas
Gerais. O primeiro envolve oito microrregies localizadas no Tringulo ou no Noroeste (Arax,
Uberlndia, Uberaba, Paracatu, Passos, Patos de Minas, Patrocnio e Pium-), representando uma
regio caracterizada por uma agricultura moderna de grande propriedade, cujo destino so os
mercados externos. Era esperado que haja um agrupamento (cluster) do tipo Alto-Alto (AA) com
relao rea colhida nesta parte de Minas Gerais.
O outro agrupamento composto por seis microrregies (Belo Horizonte, Conceio do
Mato Dentro, Guanhes, Ipatinga, Itabira e Sete Lagoas) numa das partes mais urbanizadas do
Estado de Minas Gerais, onde a rea agricultvel muito reduzida. O destaque agrcola desta
parte a produo de alimentos (sobretudo, produtos hortifrutigranjeiros) para serem
consumidos pelos grandes centros urbanos e industriais que dominam o espao. Em
Mapa 3.6: Mapa de Clusters Multivariado para rea Colhida per Capita e Densidade
Rodoviria
Quartis
1o quartil
2o quartil
3o quartil
4o quartil
outliers superiores
W E
Um procedimento que permite identificar outliers de forma ampla foi proposto por
Almeida et al. (2004), usando o diagrama de disperso de Moran adaptado. De fato, como vimos,
o diagrama de disperso de Moran capaz de identificar quatro tipos de associaes espaciais, a
saber, AA, BB, AB e BA, dependendo do quadrante. Um outlier espacial definido como aquele
apresentando uma associao espacial extrema.
Outliers espaciais so determinados em termos de suas observaes vizinhas. Um outlier
AA uma observao cujo valor extremamente alto (maior que dois desvios-padres) em
comparao com os valores vizinhos que so altos tambm.
Um outlier BB uma observao cujo valor extremamente baixo com referncia a seus
valores vizinhos, que so tambm baixos. Um outlier AB uma observao cujo valor
extremamente alta com respeito a seus vizinhos, que so baixos. Finalmente, um outlier BA
uma observao cujo valor extremamente baixo com relao s observaes vizinhas, que so
altas.
As questes fundamentais so as seguintes: quo alto necessrio que um outlier seja a
fim de possa detectado? E como os outliers detectados influenciam a medida global de
autocorrelao espacial I de Moran?
Para detectar um outlier necessrio usar o diagrama de disperso de Moran adaptado. A
natureza da adaptao reside em desenhar linhas representando 2 desvios-padres nos quatro
quadrantes. Qualquer observao que cai fora da linha de dois desvios-padres horizontal e
vertical identificada como um outlier. O seu tipo ser determinada pela localizao do
quadrante em que ele se encontra. No primeiro quadrante, os outliers detectados so do tipo AA;
no segundo quadrante, os outliers identificados so do tipo BA; no terceiro quadrante, os outliers
so classificados como sendo BB; e finalmente, no quarto quadrante, os outliers detectados so
do tipo BA.
Na figura 3.3, ilustrado a deteco de um outlier do tipo AA, pois ele encontra-se no
primeiro quadrante.
LH HH
LL HL
3.8. Concluses
No campo da econometria espacial, freqentemente encontra-se uma dificuldade de
identificao de modelos mais apropriados. A anlise exploratria de dados espaciais (AEDE)
pode ser um instrumental relevante a fim de contornar tal dificuldade.
A fim de se evitar concluses enganosas, aconselhvel que se faa AEDE para variveis
intensivas e no para variveis extensivas. Algumas variveis intensivas podem ser construdas
dividindo a varivel de interesse pela rea ou pela populao.
4.1. Introduo
O modelo economtrico espacial que deve ser estimado depende dos aspectos que
envolvem o processo espacial subjacente ao fenmeno em estudo. Para compreender isso, vamos
voltar ao nosso exemplo da funo de produo agrcola em nvel microrregional para Minas
Gerais. Caso haja difuso de uma nova tcnica de cultivo, isso corresponde a um determinado
modelo. Se existir um espraiamento de longo alcance de uma populao de pragas para a qual
no permitido medir, corresponde a um outro modelo e assim por diante.
De qualquer modo, os componentes espaciais que sero incorporados no modelo a fim de
capturar esses aspectos do processo consubstanciam em termos de defasagem espacial como Wy,
WX e Wu. Isoladamente ou em conjunto num mesmo modelo, so esses componentes que daro
conta de representar o processo espacial subjacente. A ordem da matriz W inserida no modelo
pode representar caractersticas particulares do processo espacial em estudo.
Por propsitos didticos, comearemos nossa exposio pelo modelo que representa o
processo a-espacial, ou seja, em que no se leva em conta a influncia do espao em nenhuma de
suas dimenses.
Vamos considerar o modelo clssico de anlise de regresso linear, portanto, um processo
a-espacial, por excelncia. Formalmente:
y = X + (4.1)
yi yj
i j
y = Wy + (4.2)
y = Wy + X + (4.3)
Xi Xj
yi yj
ui uj
y = ( I W ) 1 X + ( I W ) 1 (4.4)
1
A restrio sobre o coeficiente de defasagem espacial a seguinte: -(1/max)< < +1, em que max o maior
autovalor de W (em valor absoluto). Para maiores detalhes, veja Anselin, 1988.
Note que (I - W) precisa ser no-singular para ser invertvel. No espao, Wy est, neste
caso, correlacionada com todos os i em todas as regies. Na expresso, (I - W)-1 representa
uma srie infinita que envolve os erros em todas as regies:
( I W ) 1 = ( I + W + 2W 2 + 3W 3 + L) (4.5)
Essa srie infinita pode ser considerada uma expanso de Leontief, que desempenha o
papel de um multiplicador espacial, ou seja, a funo dependente dos vizinhos de primeira,
segunda, terceira ordens etc. A conseqncia disso que a matriz (I-W)-1 plena, implicando
que cada regio correlacionada com todas as outras, mas de forma que a intensidade da
correlao decresce com a ordem da contiguidade (Anselin and Bera, 1998, p. 246). Portanto, o
alcance de um choque inovacional global no sentido de que ele propaga-se por todo o espao.
No epicentro de ocorrncia do choque, a sua intensidade maior e, medida que se distancia, tal
intensidade perde fora.
Vamos analisar mais detidamente a estrutura de varincia do modelo de defasagem
espacial:
A condio de matriz plena implica uma simultaneidade da interao espacial que traz
uma clara implicao no momento da estimao. Como ser visto no prximo captulo, esse tipo
de modelo precisa ser estimado por mxima verossimilhana (MV) ou pelo mtodo de variveis
instrumentais (VI).
A implicao direta quando no se insere Wy no modelo de defasagem espacial,
incorrendo-se numa falha de especificao da mesma natureza da omisso de varivel relevante.
O mtodo dos mnimos quadrados (MQO) no apropriado nesse caso, pois caso o modelo
economtrico de defasagem espacial for estimado por ele, as estimativas dos coeficientes sero
viesadas e inconsistentes (Anselin, 1988).
y = X + u
u = Wu + (4.7)
Xi Xj
yi yj
ui uj
Aps algumas manipulaes algbricas, a forma reduzida do modelo pode ser expressa
por:
Desde que < 1 , e assumindo matrizes de pesos espaciais padronizados,2 uma outra
[ I W ] 1 = I + W + 2W 2 + K (4.9)
2
Como definido no segundo captulo, uma matriz de pesos espaciais padronizados implica que a soma dos pesos de
uma linha tem de perfazer o valor unitrio. Formalmente: wij* = wij /
j
wij .
u = W + (4.11)
Assumindo que E(u) = E() = 0, o que implica uma nova estrutura de varincia-
covarincia:
Uma vez que o segundo termo do lado direito definido positivamente e o primeiro
termo , no mnimo, semidefinido positivamente, a matriz de varincia-covarincia definida
positivamente e, portanto, invertvel. Assim sendo, concluem Kelejian e Robinson (1995, p. 88),
problemas de singularidade na matriz de varincia-covarincia no afloram nessa variante do
modelo de erro auto-regressivo espacial.
u = W + (4.13)
em que o coeficiente de mdia mvel espacial, sendo que os termos restantes so como
definido antes. A interpretao para o coeficiente de mdia mvel espacial de que a influncia
de efeitos no modelados, por falta de dados medidos precisamente, tm um impacto localizado
sobre a vizinhana.
Convm observar que o erro composto pela inovao no local () e pela mdia dos
choques inovacionais dos locais vizinhos (W). A forma reduzida desse modelo a seguinte:
y = X + ( I W ) (4.14)
interessante ressaltar que agora no aparece na forma reduzida nenhum termo que
denote a expanso de Leontief. Conseqentemente, o alcance do choque inovacional, neste
modelo, local, no tendo impacto sobre todo o sistema, como nos dois modelos anteriores. Para
se observar at onde vai o impacto localizado necessrio analisar a matriz de varincia-
covarincia do erro deste modelo, que assume a seguinte forma:
E[u ' u ] = 2 [( I + W )( I + W )]
y = X + WX + (4.16)
Note que a especificao desse modelo envolve uma srie de transbordamentos espaciais.
Convm ainda observar que um vetor e no um escalar. Agora alguns elementos de podem
ser nulos de forma que algumas variveis X defasadas espacialmente no precisam ser includas
no modelo. A forma estrutural do modelo coincide com a forma reduzida e, na ausncia da
expanso de Leontief, os impactos de transbordamentos das regies vizinhas so localizados, no
afetando todo o sistema.
Xi Xj
yi yj
ui uj
Conforme destacado por Rey e Mantouri (1998), tal modelo pode ser estimado por MQO
sem incorrer em problemas para as estimativas. O aspecto importante a incluso do termo de
transbordamentos, quando houver justificativa terica, pois a sua ausncia provoca um vis nas
estimativas dos coeficientes da mesma natureza que o provocado pela varivel relevante omitida
na regresso.
Caso haja sugestes da teoria de que o fenmeno a ser estudado exerce um impacto alm
dos vizinhos diretos (de primeira ordem), possvel incluir efeito de transbordamento de ordens
superiores. A implementao dessa idia feita com a incluso de termos, como W2X, W3X, W4X,
etc. Intuitivamente, seria o caso da influncia de uma grande infraestrutura de transportes, por
exemplo, a construo de um porto de grande dimenso, que tenha um impacto global sobre toda
uma regio e no apenas localizado (como uma estrada vicinal).
Com efeito, uma extenso bvia desse modelo a seguinte:
y = X + W 1 X 1 + W 2 X 2 + K + W l X l + (4.17)
sendo que Wl a matriz de pesos espaciais de l-sima ordem. Obviamente, espera-se que os
coeficientes dos efeitos 1, 2 etc. tenham um amortecimento medida que a ordem do efeito de
transbordamento se eleve.
( I W ) y = ( I W ) X + ( I W )( I W ) 1 (4.18)
y = Wy + X WX + (4.19)
y = 1Wy + X 2 WX 3 + (4.20)
1 2 = 3
Uma vez que a forma reduzida no envolve nenhuma expanso de Leontief, o alcance do
impacto desse modelo local, ou seja, restrito aos vizinhos de primeira ordem. Posto que um
Xi Xj
yi yj
ui uj
y = W1 y + X + u (4.21)
u = W2u +
Esquematicamente:
yi yj
ui uj
Cabe notar que W1 e W2 podem ser matrizes diferentes, constituindo um caso mais geral.
Naturalmente, o caso em que W1=W2 particular. A forma reduzida revela que:
y = ( I W1 ) 1 X + ( I W1 ) 1 ( I W2 ) 1
ou
y = W1 y + W2 y W2W1 y + X W2 X + (4.22)
Por envolver claramente expanses de Leontief, o alcance dos efeitos global, afetando
todo o sistema. Pela expresso (4.22), possvel observar que esse modelo mais complexo em
sua especificao, engendrando srios problemas na identificao dos parmetros e . Por ter
uma natureza mista, a sua estimao por MQO implica em estimativas inconsistentes e
ineficientes.
4.2.7. Modelo Misto com defasagem e erro de mdia mvel de primeira ordem
Suponha agora que haja uma difuso de uma nova tcnica de produo,
concomitantemente com um efeito no modelado como a poluio na regio, afetando as regies
vizinhas mais prximas, mas no todo o sistema.
Um modelo sobre isso o que envolve uma defasagem espacial com um erro de mdia
mvel espacial, assim especificado:
y = W1 y + X + u
u = W2 + (4.23)
y = ( I W1 ) 1 X + ( I W2 ) (4.24)
Neste modelo, os efeitos no modelados nos erros so localizados, ao passo que os efeitos
modelados nas variveis explicativas apresentam um efeito global no sistema econmico. A sua
implicao para o processo de estimao o mesmo que o modelo anterior, ou seja, os
coeficientes estimados por MQO so ao mesmo tempo inconsistentes e ineficientes.
y = 1Wy + 2W 2 y + L + rW r y + WX 1 + W 2 X 2 + L + W t X t + u
u = 1Wu + 2W 2u + L + lW l u +
ou
u = 1W + 2W 2 + L + gW g + (4.25)
4.4. Concluses
Em suma, possvel ressaltar os principais aspectos de todos esses modelos
economtricos que tratam da autocorrelao espacial. O Quadro 1 fornece um resumo com os
principais aspectos abordados na exposio da tipologia dos modelos economtricos espaciais.
5.1. Introduo
Vamos supor que voc j identificou um modelo economtrico espacial para a sua funo
de produo agrcola em nvel municipal que voc deseja estimar. Vamos supor que o modelo
identificado tenha sido o modelo de defasagem espacial de primeira ordem ou um modelo de
erro espacial (autorregressivo ou de mdias mveis).
O problema agora como estim-lo? Uma idia inicial seria estimar por Mnimos
Quadrados Ordinrios (MQO), o mais adotado e consagrado estimador na econometria. Mas ser
que seria uma boa idia? Podemos adiantar que no. E por que no? Quais so as opes de
estimadores? Esse o assunto deste captulo.
y = Wy + (5.1)
Essa expresso ser zero, apenas se for zero, mas, nesse caso, no se trata mais de um
processo espacial. Qualquer outro valor assumido por a expresso acima ser diferente de zero,
significando que o estimador MQO para ser inconsistente.
Percebe-se com clareza que a varincia muito diferente da varincia estimada por MQO
[E(uu) = 2I].
No caso do modelo de erro de mdia mvel espacial, relembrando o captulo anterior, a
estrutura de varincia-covarincia dada por:
E[u ' u ] = 2 [( I + W )( I + W )]
1
[gi (x, ) E ( g i ( x, ))] (5.6)
n i
n( q ) N (0,V ) (5.7)
em que q a estimativa de .
Com o Teorema Central do Limite obtm-se a propriedade da normalidade assinttica,
que permite que construa testes para identificar e validar os modelos economtricos espaciais.
O problema da estimao de modelos economtricos espaciais envolve a otimizao de
uma funo log-verossimilhana altamente no-linear.
Seja o modelo de defasagem espacial misto:
y = Wy + X + ~ N (0, 2 I ) (5.8)
n n '
ln L = ln(2 ) ln( 2 ) + ln det( I W ) (5.9)
2 2 2 2
= y Wy X (5.10)
n n ( y Wy X )' ( y Wy X )
ln L = ln(2 ) ln( 2 ) + ln det( I W ) (5.11)
2 2 2 2
Vale a pena tecer alguns comentrios a respeito dos elementos da funo de mxima
verossimilhana. A funo de log-verossimilhana composta por trs elementos. O primeiro
elemento so as constantes n e . O segundo elemento a forma quadrtica nos termos de erro
(). Esses dois elementos so comuns em modelos economtricos a-espaciais.
O terceiro elemento o mais interessante e distintivo dos modelos economtricos
espaciais em comparao com modelos a-espaciais. Esse terceiro elemento refere-se ao
surgimento do determinante do jacobiano da transformao de dimenso igual ao tamanho da
amostra.
O Jacobiano uma relao entre y, que observado, e , que no observado. No
modelo de defasagem espacial, o termo aleatrio definido como:
= ( I W ) y X (5.12)
= f ( y) (5.13)
f
det = det( I W ) (5.14)
y
= y Wy X (5.15)
Observe que a estimativa MQO necessita da minimizao da soma dos quadrados dos
resduos com relao a . Todavia, a otimizao tem por referncia apenas o ltimo termo da
funo de log-verossimilhana (ver equao 5.11). Mais uma vez, percebe-se claramente que o
mtodo MQO no considera o jacobiano da transformao no seu procedimento de estimao.
Temos condies agora de mostrar que o vis do parmetro estimado b. Para isso, vamos
derivar as condies de primeira ordem:
( y Wy X )' ( y Wy X )
s2 = (5.18)
n
y = Wy + X + ~ (0, 2 I ) (5.8)
Observe que agora o termo de erro aleatrio no precisa seguir uma distribuio normal.
Na situao em que h endogeneidade, temos que:
E (Wy, ) 0 (5.19)
y = Z + (5.20)
Q' Z
p lim = H QZ (5.21)
n
Q' Q
p lim = H QQ (5.22)
n
Q'
p lim =0 (5.23)
n
Vamos definir que Z p = Q(Q' Q) 1 Q' como sendo a projeo de Z nas variveis de Q e
ou
Z = Z p ' Z (5.28)
n n 1
ln L = ln ln 2 + ln det( I W ) + ( y X )' ( I W )' ( I W )( y X )
2 2 2 2
(5.30)
b = [( X WX )' ( X WX )] ( X WX )' ( y Wy )
1
(5.31)
(e We)' (e We)
2 = (5.32)
n
y = X + u
= u Wu (5.34)
E[ ' / n] = 2 (5.35)
' = (u Wu )' (u Wu )
= u ' u 2u 'Wu + 2 u 'W 'Wu (5.38)
'W = (u Wu )'W (u Wu )
= u 'Wu 2u 'W 'WWu + 2 u 'W 'WWu (5.40)
1 2 1
E ( ' ) E (u ' Wu ) + 2 E (u ' W ' Wu ) = 2 (5.41)
n n n
1 1 2 1
E ( ' W ' W ) = E (u ' W ' Wu ) E (u ' W ' WWu) + 2 E (u ' W ' W ' WWu ) = 2 (5.42)
n n n n
1 1 2 1
E ( ' W ) = E (u ' Wu ) E (u ' WWu) + 2 E (u ' W ' WWu) (5.43)
n n n n
b = [( X WX )' ( X WX )] ( X WX )' ( y Wy )
1
(5.44)
sendo que:
2 =
(u Wu )' (u Wu )
n
u = y X
5.5. Concluses
Para estimar vrios modelos economtricos espaciais, o mtodo MQO pode no ser
apropriado. Para o modelo de defasagem espacial de primeira ordem, o coeficiente espacial
viesado e no consistente se estimado por MQO. J com relao ao modelo de erro
autorregressivo espacial, as estimativas MQO so no-viesadas e consistentes, porm so
ineficientes.
Como os dados so dependentes espacialmente, a teoria assinttica moderna desempenha
importante papel por intermdio da Lei dos Grandes Nmeros e do Teorema Central do Limite.
Uma soluo estimar usando o mtodo da mxima verossimilhana, desde que
garantida a propriedade da normalidade. O problema da estimao de modelos economtricos
espaciais envolve um problema computacional que no trivial: a otimizao de uma funo
6.1. Introduo
O teste de hipteses enfrenta o desafio de discriminar a autocorrelao espacial da
heterocedasticidade. Como vimos no captulo passado, esses dois efeitos, muitas vezes, esto
imbricados num nico processo estocstico espacial.1
O conjunto de testes para averiguar a presena de autocorrelao espacial til tanto para
servir de auxlio no momento de identificao do modelo economtrico espacial mais apropriado
quanto para a tarefa de validao ou diagnstico desse modelo. O problema do imbricamento
interfere nessas duas etapas, a identificao e a validao.
Os testes para detectar a autocorrelao espacial podem ser divididos em duas categorias:
testes gerais e testes especficos.
De um lado, os testes gerais so aqueles em que nenhuma indicao fornecida no
sentido de se detectar o tipo de autocorrelao espacial predominante na regresso, pois no so
baseados numa especificao explcita do processo estocstico gerador do erro. Desse modo, tal
categoria diz respeito aos testes cuja hiptese alternativa no refere-se a um modelo
economtrico espacial especfico.
De outro, existem os testes especficos, no quais fornecida uma indicao do tipo
predominante da autocorrelao remanescente na regresso, posto que se faz uma especificao
explcita do processo estocstico gerador do erro. Essa especificao uma tentativa de formular
a fonte da autocorrelao espacial. Ademais, essa categoria de teste pressupe a ausncia de
heterocedasticidade. Assim sendo, essa outra categoria refere-se a testes cuja hiptese alternativa
trata-se de um modelo economtrico espacial especfico.
Como ser visto posteriormente, o poder de um teste para detectar autocorrelao
espacial depende de uma srie de fatores, tais como o tamanho da amostra, a intensidade da
1
De acordo com Boller et al. (2001, p. 466), de um ponto de vista prtico, difcil distinguir dependncia espacial
da heterogeneidade espacial baseado nos resduos da regresso porque todos os diagnsticos tm poder contra
ambas as formas de m-especificao.
n e' We
I = (6.1)
S 0 e' e
em que e = y - Xb, sendo que b o estimador MQO para e S0 ijwij, representando um fator
de normalizao.
No caso em que a matriz W padronizada pela linha, S0 iguala-se a n. Dessa forma, o
teste I de Moran pode ser reescrito como:
e' We
I = (6.2)
e' e
Pela expresso, percebe-se que a estatstica I baseada nas somas de produtos cruzados
de resduos para regies vizinhas. A hiptese nula do teste assume que os resduos da regresso
estimada por MQO so distribudos aleatoriamente ao longo do espao. O critrio do teste que
I E(I )
z(I ) = (6.3)
Var ( I )
E ( I ) = tr ( MW ) /( n k ) (6.4)
Var ( I ) =
{tr (MWMW ' ) + tr (MW ) 2
+ [tr ( MW )]2 }
[E ( I )]
2
(6.5)
{(n k )(n k + 2)}
A principal vantagem desse teste a sua simplicidade computacional, uma vez que
apenas os resduos da regresso estimada por MQO so necessrios (Anselin, 2001, p. 114).
O teste I de Moran apresenta um alto poder contra a presena de autocorrelao espacial.
Existe, entretanto, um problema com esse teste referente ao seu poder. Isso porque, alm da
autocorrelao espacial nos resduos, o teste captura uma srie de problemas na regresso, tais
como a m especificao do modelo, a heterocedasticidade e a ausncia de normalidade nos
resduos.
A isso pode ser adicionado mais um problema. Para ser vlido, o teste I de Moran requer
que os resduos da regresso sejam normais. Porm, de acordo com Kelejian e Robinson (1998,
p. 391), na ausncia de heterocedasticidade, o teste I de Moran um teste que apresenta bom
C h = Z kh + h (6.6)
em que Ch= eiej, ou seja, um vetor 1 x hn de produtos cruzados dos resduos (ij), para os quais
no so zero para i < j (i e j so observaes contguas), enquanto que Zkh=Xki.Xkj o produto
cruzado das variveis explicativas; h o ndice para cada produto-cruzado. Os produtos-
cruzados so para todos os pares de observaes para os quais uma correlao no-nula
pressuposta, assim, perfazendo hn pares (Anselin, 1992). Formalmente:
Cov(u i , u j ) = ij = Z ij (6.7)
2
Segundo Anselin e Rey (1991, p. 124), o I de Moran sensvel escolha da matriz de pesos espaciais e presena
de no-normalidade nos erros.
3
Na apresentao do teste KR, vamos seguir a notao de Anselin (1992) e Anselin e Bera (1998).
H0: = 0
' Z ' Z
KR = (6.8)
'
hn
Sob a hiptese nula, essa estatstica converge em distribuio para uma qui-quadrado
com k graus de liberdade, sendo que k o nmero de variveis explicativas (ou o nmero de
colunas) contidas na matriz Z.
As vantagens desse teste global residem no fato de que no requerido o pressuposto de
normalidade dos resduos, ao contrrio do teste I de Moran. Ademais, o teste KR aplicvel a
regresses lineares e no-lineares. Cabe notar que, na frmula do teste, no necessrio
especificar nenhuma matriz de pesos espaciais, prescidindo deste tipo de informao.
Uma desvantagem do teste KR repousa no fato de que, uma vez que exibe caractersticas
assintticas, ele mais apropriado para grandes amostras. preciso cercar-se de extrema cautela
quando se usa para averiguar a presena de autocorrelao dos resduos para pequenas e mdias
amostras, pois seu poder baixo, como prvios estudos comprovaram.
Alm disso, esse teste perde poder pela alta quantidade de graus de liberdade (k), em
comparao com o teste I que segue tambm um qui-quadrado, contudo com apenas um grau de
liberdade.
Todavia, a principal desvantagem do teste KR aquela compartilhada com o teste I de
Moran: na condio de teste do tipo geral, quando estatisticamente significantes, ambos no
fornecem indicaes sobre a forma da autocorrelao espacial presente (defasagem ou erro).
L
d = (6.9)
2 ln L
Inf ( ) = E (6.10)
'
O ltimo passo avaliar o vetor escore e a matriz de informao para = 0. Por fim, a
estatstica de um teste de multiplicador de Lagrange dado por:
ML = d Inf 1 d (6.11)
H0: = 0
H1: 0
n n ( y Wy X )' ( y Wy X )
ln L = ln(2 ) ln( 2 ) + ln det( I W )
2 2 2 2
e'Wy
d = tr (I W ) W +
1
(6.12)
2
e'Wy
d = (6.13)
2
Numa etapa posterior, deriva-se o escore, ou seja, a derivada parcial dessa funo com
relao ao parmetro de defasagem espacial . Em seguida, avalia-se o escore sob a hiptese
nula (ou seja, para = 0). Alm disso, necessrio obter a matriz de informao.
[ ] [WX ][' WX ] ( X 'WX )'
tr W + W 'W +
2
2 2
Inf = (6.14)
( X 'WX )' (X ' X )
2 2
2
e'Wy
2
ML = s (6.15)
(WXb)' MWXb
2
+ tr[W 'W + W 2 ]
s
6.3.2. Teste ML
O outro teste especfico unidirecional, proposto originalmente por Burridge (1980), um
teste do tipo Multiplicador de Lagrange contra a autocorrelao espacial na forma do modelo de
erro autorregressivo espacial. A forma de calcul-lo segue os mesmos passos do anterior. Em
primeiro lugar, constri-se o logaritmo da funo de mxima verossimilhana para o modelo de
erro espacial. Em segundo lugar, deriva-se o vetor escore sob a hiptese nula que, nesse caso,
estabelecida como H0: = 0, assumindo que = 0.
Para esse teste especfico, As hipteses nula e alternativa so estabelecidas como:
H0: = 0
H1: 0
e'We
d = tr (I W ) W +
1
(6.16)
2
e'We
d = (6.17)
2
n / 2 4
(
tr W (I W )
1
)
Inf = 2
(
tr W (I W )
1
) tr [(W (I W ) )]+ tr{[W (I W ) ]' [W (I W ) ]}
1 1 1
(6.18)
2
Note que, para = 0, os elementos fora da diagonal dessa matriz igualam-se a zero,
enquanto o elemento diagonal reduz-se a tr[WW + W2].
Neste caso, a estatstica assume:
2
e' We
2
s
ML = (6.19)
[
tr W ' W + W 2 ]
y = Wy + X + Wu +
y = Wy + X + W + (6.20)
n n
ln L = ln (2 ) ln 2 + ln I W + ln I W
( y Wy X )' (I W )' (I W )( y Wy X )
2 2 2 2
(6.21)
2 2
e'Wy e'We e'We
2 2 2
=
LM
(WXb )' M (WXb ) + tr (WW + W 'W ) (6.22)
Esse teste segue uma distribuio qui-quadrado com dois graus de liberdade. Nesse ponto
surge o primeiro problema com tal teste, ou seja, esses dois graus de liberdade implicam um
perda de poder. O segundo problema refere-se prpria natureza especfica do teste, isto ,
quando a nula rejeitada, existe uma indefinio da fonte de erro espacial, fazendo com que o
pesquisador no fique sabendo se a fonte da autocorrelao no erro na forma autorregressivo
ou de mdia mvel.
[d T 2C 1d ]2
ML = *
(6.23)
(
[T 1 T 2C ] )
4
Assume-se que o processo estocstico espacial representado por uma nica matriz de pesos espaciais W (W1=W2).
[d d ]2
ML =
*
(6.26)
C
2 T
em que toda a notao permanece a mesma que no teste anterior. Tal teste distribudo conforme
um qui-quadrado com um grau de liberdade. O fator de correo do teste ML*r para a m
especificao local envolve o vetor escore d e a covarincia entre entre d e d na frmula.
Quanto a propriedades para pequenas amostras, segundo Anselin e Florax (1995), ML*
robusto tem um bom desempenho em termos de poder do teste. Anselin e Rey (1991)
encontraram que os testes para defasagem espacial so mais poderosos que os testes para erro
Wald = ~ N (0,1) (6.27)
(asy Var[ ])
Wald = ~ N (0,1) (6.28)
(asy Var [ ])
Note as estatsticas do teste seguem uma normal padronizada. Se a estatstica de Wald for
elevada ao quadrado segue uma distribuio qui-quadrado com um grau de liberdade.
[
RV = n ln MQO
2
ln defasagem
2
]+ 2i ln (1 i ) (6.29)
[
RV = n ln MQO
2
ln erro
2
]+ 2i ln (1 i ) (6.30)
1o passo: estime o modelo clssico de anlise de regresso linear por meio de MQO.
3o passo: caso ambos os testes no sejam significantes, use o modelo clssico como o modelo
mais apropriado. Caso contrrio, siga para o prximo passo.
4o passo: caso ambos sejam significantes, estime o modelo apontado como o mais significante
pelas verses robustas desses testes ML* e ML*. Por exemplo, se ML* > ML*, use o modelo
com a defasagem como o mais apropriado. Caso ML* > ML*, use o modelo de erro
autorregressivo espacial como o mais apropriado. Caso contrrio, siga para o prximo passo.
5o passo: se o teste ML* significante e o ML* no, adote o modelo de defasagem espacial.
Caso contrrio, v para o prximo passo.
6o passo: se o teste ML* significante e o ML* no, adote o modelo de erro espacial.
6.7. Concluses
O desenvolvimento dos testes seguiu uma trajetria de problema-soluo comum na
cincia. Os primeiro testes eram gerais que tinham como problema principal a incapacidade de
identificar a forma da autocorrelao espacial (defasagem ou erro), quando a hiptese nula era
rejeitada.
A soluo envolveu a construo de testes especficos que tinham a vantagem de
especificar a forma da autocorrelao espacial. O problema era a freqncia com que os testes de
multiplicador de Lagrange rejeitavam a hiptese nula. Quando tanto ML e ML rejeitavam com
tanta freqncia, o pesquisador fica sem indicaes para identificar o modelo. A soluo foi o
desenvolvimento dos testes de ML robustos com elevado poder.
Ao contrrio do que o senso comum poderia sugerir, o teste bidirecional MLlr no a
composio de ML e ML. O teste bidirecional pode ser decomposto pelo
ML = ML* + ML = ML + ML*
W > RV > ML
Caso esse ordenamento no seja respeitado, isso pode ser interpretado como uma
evidncia de problemas de m especificao do modelo.
7.1. Introduo
Na economia aplicada, segundo Anselin (1990, p. 185), comum assumir que a relao
de interesse estvel atravs do espao. A bem da verdade, a hiptese da homogeneidade
espacial, entendida como um processo no qual h as mesmas respostas, independente da
localizao ou da escala espacial, , sem dvida, herica no mundo real.
Para ver esse grau de herosmo, vamos voltar nossa funo de produo agrcola para
Minas Gerais. Um aspecto interessante a abordar a diversidade das caractersticas rurais das
regies de Minas Gerais, mesmo que de uma forma estilizada. A agropecuria feita em grandes
propriedades com direcionamento para o mercado, em especial para exportao, concentra-se no
Tringulo Mineiro/Alto Paranaba, Noroeste e Norte, com destaques na plantao de gros com a
ampla utilizao de insumos modernos. Essas duas regies tm o solo de cerrado e representam
uma explorao agrcola mais recente em comparao com as outras regies, em virtude do
avano da fronteira agrcola do Estado. J a agricultura das regies do Sul/Sudoeste e Oeste
caracterizada pela pequena propriedade e produo para o mercado, sobretudo interno.
Um conjunto de regies Zona da Mata, Campo das Vertentes, Vale do Mucuri e Vale
do Jequitinhonha tem por caracterstica a agricultura de subsistncia por meio de pequenas
propriedades. A regio do Vale do Rio Doce tambm ostenta uma agricultura de subsistncia,
porm ao lado de uma pecuria de mercado. As regies Central e Metropolitana de Belo
Horizonte tm uma taxa elevada de urbanizao, limitando o espao para a realizao de
atividades agrcolas. A despeito disso, sua vocao para a produo de hortifrutigranjeiros para
abastecer os seus mercados. Todavia, essas duas regies desempenham principalmente o papel
de serem o grande mercado consumidor para a produo agropecuria das outras regies do
Estado.
yi = f i ( X i + ui )
ui ~ (0, ) (7.1)
i2 0 L 0
0 i2 0 M
= (7.2)
M 0 i2 0
2
0 L 0 i
7.2.1. No intercepto
7.2.1.1.SANOVA
A tcnica ANOVA espacial tem por objetivo averiguar a existncia de diferena
significativa da mdia de uma varivel de interesse atravs de subconjuntos dos dados. Isso
consiste em regredir a varivel de interesse y contra variveis dummies (ou indicadores de
tratamento geogrfico), referentes a clusters, e um termo constante. Formalmente:
em que a mdia geral da regressso, um parmetro a ser estimado e REG uma dummy
ou um indicador de tratamento geogrfico, um termo de erro bem comportado.
Um valor altamente significante para o coeficiente REG indica que existe uma
discrepncia considervel entre a mdia de cada cluster com relao mdia geral representada
pela constante da regresso a. Se esse valor for positivo significa que a discrepncia para cima
da mdia geral; se for negativa, h uma discrepncia para baixo.
l1i -6,37
(-1,30)
l2i -10,17
(-2,54)**
2
l1i -0,07
(-1,26)
2
l2i -0,34
(-4,45)***
l1i.l2i 0,07
(0,75)
R2 ajust. 0,15
Nota: estatstica t em parnteses; * p<=0.1; ** p<=0.05 ; ***p<=0.01.
7.2.2. Na inclinao
7.2.2.1. Modelo de Regimes Espaciais
y 1 X1 0 L 0 1 u 1
M 0 O 0 M M M
= + (7.5)
M M 0 O 0 M M
y m 0 L 0 X m m u m
Note que o conjunto de dados foi dividido em m partes. Para isso, usa-se uma varivel
indicadora discreta. Assim, n=n1 + n2 + ... +nm.
Uma alternativa que a varincia do erro seja diferente em cada regime. Formalmente,
temos que:
12 I1 0 L 0
0 O 0 M
= (7.6)
M 0 O 0
0 L 0 m I m
2
H 0 : 1 = 2 = L = m
Outro teste adotado o teste Wald. Levando em considerao a mesma hiptese nula do
primeiro modelo, o teste Wald para a estabilidade estrutural assume a forma:
{
Wald = ( g ' b) g ' [var(b)] g
1
} ( g ' b)
1
(7.6)
em que g uma matriz k por 2k [Ik Ik], com Ik sendo uma matriz identidade de k por k.
O teste Wald distribudo como uma qui-quadrado (2) com (m - 1)*k graus de
liberdade.
Suponha que cada coeficiente de regresso dependa de uma funo linear de um conjunto
de m variveis de expanso:
1 = 0 + 1l1 + 2 l 2 (7.9)
y = + 0 x + 1l1 x + 2 l 2 x + (7.10)
O interessante nesse caso que com a especificao aleatria acarreta que ao problema
dos coeficientes variveis adicionada a heterocedasticidade no erro. Para ver isso, basta
substituir:
yi = + 0 xi + 1l1i xi + 2l2i xi + ui
ui = i + i xi (7.12)
Claramente a varincia no constante, pois varia com xi. Caso sejam relevantes, a
omisso das variveis de interao no modelo resulta em vis nas estimativas.
H 0 : l1k = l 2 k = K = l mk
Esse teste segue uma distribuio F com m.(k-1), n - m.(k-1) graus de liberdade para
regresses estimadas por MQO. Para outros mtodos de estimao, adota-se o teste Wald
assinttico, seguindo uma qui-quadrado com m.(k-1) graus de liberdade.
7.3.1. Modelos
Considere o seguinte modelo de erro heterocedstico:
y = X + u
i2 = Z (7.16)
em que Z uma matriz N por P com as variveis heterocedsticas como colunas e um vetor
de coeficientes.
Existem trs variantes do modelo de erro heterocedstico, a saber, em grupos (ou
regimes), genrico e com coeficiente aleatrios. A diferena entre eles reside na especificao da
matriz Z e na natureza contnua ou discreta da heterocedasticidade. Veremos cada um deles nas
prximas subsees.
O grande problema com o modelo de erro heterocedstico, em qualquer de suas variantes,
que a varincia estimada pode no ser positiva, como requerida pela teoria.
Vamos analisar os trs modelos de erro heterocedstico que estudaremos nesta apostila, a
saber, em grupos, genrica e de coeficientes aleatrios.
O modelo do erro heterocedstico em grupos (ou regimes) de natureza claramente
discreta. H a necessidade de se especificar um indicador categrico para discriminar os grupos
ou regimes nos dados.
As variveis heterocedsticas que compem a matriz Z so o indicador categrico discriminador
dos grupos ou regimes espaciais. Note que, pelo menos, uma varivel heterocedstica precisa ser
especificada.
Cabe observar que esse modelo no inclui constante, logo o teste Wald verifica a
igualdade da varincia em cada regime ou grupo.
A heterocedasticidade manifesta-se na forma de que a varincia do erro distingue atravs
dos regimes, porm, constante dentro do regime. A varincia estimada por meio dos resduos
para cada regime.
Para o modelo de erro heterocedstico em grupos, o teste Wald verifica a igualdade das
varincia em cada grupo (supondo g grupos):
H0: 21 = ... = 2g
y i = + xi i + u i
i = + i (7.17)
y i = + xi + u i + xi i (7.18)
1 = (Z ' Z ) Z ' e 2
1
(7.20)
(
2 = Z ' D 2 Z ) 1
Z ' D 2e 2 (7.21)
(
3 = Z ' 1Z ) 1
Z ' 1e 2 (7.22)
MLerro =
(e' We) 1 2
(7.23)
tr (W 'W + W ) 2
MLdefasagem =
(e' Wy ) 1 2
(7.24)
[D + tr (W 'W + W )] 2
(
em que D = (WXb )' 1 (WXb ) (WXb )' 1 X X ' 1 X )
1
X ' 1 (WXb ) .
MLHet _ Erro =
(e' 1
We )
2
(7.25)
T
(
T = tr WW + W ' 1W ) (7.26)
8.1. Introduo
Ao longo de nossa exposio um exemplo recorrente foi a construo de uma funo de
produo agrcola para Minas Gerais. Pudemos ilustrar vrias ferramentas de anlise, conceitos e
modelos com esse exemplo.
Chegou o momento de aplicarmos a anlise economtrica espacial para identificar e
estimar a funo de produo agrcola, bem como fazer o diagnstico dos resultados da
estimao.
8.2. Dados
A base de dados para a aplicao ilustrativa da funo de produo oriunda de vrias
fontes. Em primeiro lugar, como a teoria neoclssica da produo recomenda, todas as variveis
so medidas de quantum.
A varivel dependente a rea plantada de todas as culturas agrcolas, temporrias ou
permanentes, cuja fonte de dados a Pesquisa Agrcola Municipal do IBGE para o ano de 1996.
A explicao para se usar essa varivel aproximada deve-se que, em qualquer processo de
produo, mas principalmente na agricultura, a deciso sobre o uso dos insumos primrios e
intermedirios realizada antes que o bem seja efetivamente produzido. Quando os produtores
decidem adquirir uma certa quantidade de insumos, tal deciso embute um nvel planejado de
produo. Contudo, isso envolve um problema terico e prtico, pois o nvel planejado de
produo existe apenas na cabea dos produtores e no pode ser observado. Nesse sentido, na
agricultura, a rea plantada considerada a melhor proxy para o nvel planejado de produo.
As variveis independentes que compem a funo de produo so trabalho, capital e o
estoque de infraestrutura de transportes, a saber, a densidade rodoviria e a densidade ferroviria.
Vamos comear descrevendo a fonte de dados para os insumos primrios, trabalho e
capital. Convm notar que, de propsito, escolheu-se um perodo imediatamente anterior ao
W E
200 0 200 400 Miles
S
f 0,006 -0,005
(0,330) (-0,239)
[0,742] [0,812]
Wf 0,058
(1,513)
[0,136]
0,540
(4,157)
[0,000]
0,250
(3,007)
[0,003]
2
R ajust. 0,867 0,869 0,867 0,869 0,868 0,868 - -
MV -18,290 -15,867 -17,358 -17,538 -17,844 -18,350 -12,967 -14,781
AIC 48,581 49,735 48,716 47,076 47,688 46,700 35,935 41,562
SC 61,719 69,442 64,043 60,214 60,826 57,649 46,883 54,700
N 66 66 66 66 66 66 66 66
Notas: Em parnteses, encontram-se as estatsticas t para as regresses de (1) a (6); ou z para as regresses (7) e (8).
A Tabela 8.2 revela o diagnstico para todas as regresses estimadas por MQO. Sem
entrar em mincias, podem-se extrair certas regularidades presentes em todas as regresses. O
diagnstico revela que os erros so normais, o que nos permitir estimar posteriormente os
modelos espaciais pelo mtodo de Mxima Verossimilhana. Pelo teste de White, no h
evidncias de m especificao das diversas regresses. Pelos testes globais para detectar
dependncia espacial (teste I de Moran e o teste KR),1 h claras evidncias de que os erros esto
autocorrelacionados no espao. Pelos testes especficos do tipo da dependncia espacial (testes
do tipo multiplicador de Lagrange para defasagens e para o erro espacial, bem como suas verses
robustas),2 h indicaes de que a autocorrelao espacial assume a forma de erro auto-
regressivo.
Em termos de qualidade de ajuste, a melhor regresso estimada por MQO foi a de
nmero (6). Isso foi avaliado com base nos critrios de informao Akaike (AIC) e Schwartz
(SC). Os diagnsticos do modelo (6) indicam que no h problemas graves de
multicolinearidade, conforme isso pode ser apreciado pelo valor assumido do condition number.
Por indicao do teste Jarque-Bera, os erros so normais. Pelo teste Breusch-Pagan, no h
evidncias de erros heterocedsticos.
Quanto autocorrelao espacial, h claros sinais de que este problema est presente na
regresso. Os testes globais I de Moran e o teste de Kelejian-Robinson (KR) mostram
evidncias de que os erros esto autocorrelacionados espacialmente, apesar desses testes serem
incapazes de irem alm disso, isto , fornecendo subsdios de qual modelo economtrico espacial
seria mais apropriado para modelar tal latente autocorrelao. Podemos conseguir mais auxlio
com os testes especficos do tipo multiplicador de lagrange (ML). Com base neles, possvel
notar a alta significncia do teste ML(erro), indicando que os resduos da regresso seguem um
processo estocstico de erro auto-regressivo de primeira ordem. Essa evidncia reforada pela
1
Para uma descrio desses testes, veja Anselin (1988) e Kelejian e Robinson (1998).
2
Para uma descrio desses testes, consulte Anselin (1988) e Florax et al. (2002).
Diagnsticos MQO
(1) (2) (3) (4) (5) (6)
Condition number 39,861 112,087 97,477 87,788 97,477 36,506
2. LR 10,765 7,139
[0,001] [0,007]
b) Wald 3,535 -
[0,473] -
4. ML 2,793 7,850
[0,095] [0,005]
Nota: em colchetes, encontra-se a probabilidade.
8.4. Concluses
guisa de ilustrao do potencial da anlise economtrica espacial, foi feita uma
aplicao para a agricultura. A construo da funo de produo espacial agrcola para o Estado
de Minas Gerais envolveu a utilizao de todos os componentes discutidos anteriormente, a
saber, a desagregao regional, a incorporao de variveis intensivas, a especificao de
elementos de infraestrutura de transportes, a incluso de efeitos de transbordamento e a
estimao dos parmetros controlando para efeitos espaciais.
Os principais resultados desta aplicao apontaram que a densidade ferroviria no
apresenta efeito sobre a produo agrcola de Minas Gerais, apesar deste Estado apresentar a
maior rede ferroviria do pas. Alm de ser estatisticamente significante, a densidade rodoviria
pavimentada exibe um impacto sobre o desempenho produtivo maior que a densidade rodoviria
no-pavimentada. Nenhum efeito de transbordamento mostrou relevante na explicao da
produo agrcola. Como esperado, o fator capital apresenta a maior contribuio entre os
insumos, seguido pelo fator trabalho. Tal evidncia emprica um indicador do avano histrico
da mecanizao na agricultura mineira.
Messner, S. F. , Anselin, L, Baller, R. D., Hawkins, D. F., Deane, G., and Tolnay, S. E.
The Spatial Patterning of County Homicide Rates: an application of exploratory
spatial data analysis. Journal of Quantitative Criminology, 15(4): 423-450, 1999.
Messner, S. F. and Anselin, L. Spatial Analyses homicide with areal data. Mimeo,
University of Illinois, 2001.
Moran, P. The interpretation of statistical maps. Journal of the Royal Statistical Society
B, 10, pp. 243-251, 1948.
Paelinck, J. e Klaassen, L. Spatial Econometrics. Farnborough: Saxon House, 1979.
Tukey, J. W. Exploratory Data Analysis. Reading: Addison-Wesley, 1977.
Whittle, P. (1954). On stationary processes in the plane. Biometrika, vol. 41, pp. 434-449.