Você está na página 1de 24

Regress

ao N
ao Bayesiana

Renato Martins Assunc


ao
Departamento de Estatstica e Laboratorio de Estatstica Espacial
Universidade Federal de Minas Gerais - UFMG

Sum
ario
1 Regress
ao n
ao bayesiana
1.1 SAR model . . . . . . . . . . . . . . . . . . . . . .
1.2 O modelo autoregressivo condicional (CAR) . . . .
1.2.1 Equivalence between SAR and CAR models
1.3 Old Stuff - from SBE course . . . . . . . . . . . . .
1.4 Maximum likelihood estimation . . . . . . . . . . .
1.5 Confidence intervals and tests . . . . . . . . . . . .
1.6 Difficulties with non-normal data . . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

1
1
3
4
5
11
18
21

Captulo 1

Regress
ao n
ao bayesiana
Although a large number of model specifications for spatial processes have
been suggested in the literature(...), a fundamental distinction, with a significant impact on estimation and testing strategies, is the difference between
a simultaneous and a conditional spatial process.(...) Both models are most
often presented in a autoregressive form, i.e., where the value of a variable at
one point is related to its values in the rest of the spatial system(Anselin,
1988, pp 32-33).
The simultaneous autoregressive (SAR) model dates back to the
work of Whittle (1954).

1.1

SAR model

Vamos considerar uma grade finita composta de n stios D = {(xi , yi ) : i =


1, . . . , n} com observac
oes y = (z1 , . . . , yn ). O modelo mais comum e aquele
em que as observac
oes possuem distribuicao normal. A ideia e descrever a
observac
ao yi realizada no stio i decompondo-a em partes:
X
(yi = i ) +
Sij (yj j ) + i ,
(1.1.1)
j6=i

onde 1 , . . . , n s
ao independentes com distribuicao N (0, i ), i > 0, i =
1, . . . , n. Isto e, a observac
ao yi e a sua media i mais seu desvio em relacao
a esta media. Por sua vez, este desvio e uma soma ponderada dos desvios dos
1

NAO
BAYESIANA
CAPITULO 1. REGRESSAO

outros stios e um choque nao associado com explicacao conhecida. Os pesos


Sij refletem a estrutura espacial dos stios de modo que aqueles stios j mais
pr
oximos de i tendem a ter maior peso. Note que o somatorio ?? nao envolve
um termo Sii .
A express
ao ?? define yi em funcao dos outros elementos do vetor y. Entretanto, esses outros elementos j 6= i terao sua definicao envolvendo yi . Assim,
n
ao existe uma sequencia recursiva que gere os yi mas, pelo contrario, eles
s
ao determinados simultaneamente, dando origem ao nome do modelo. Esta
caracterstica do modelo SAR fica clara se visualizarmos ?? como um sistema
de equac
oes com Sii = 0, i = 1, . . . , n. Isto e, se denotarmos yi i por zi ,
ent
ao:
w1 = S11 z1 + S12 z2 + S13 z3 + + S1n zn + 1
z2 = S21 z1 + S22 z2 + S23 z3 + + S2n zn + 2
z3 = S31 z1 + S32 z2 + S33 z3 + + S3n zn + 3

zn = Sn1 z1 + Sn2 z2 + Sn3 z3 + + Snn zn + n


N
ao e
obvio que o sistema de equacoes acima possua solucao, isto e, que
exista uma distribuic
ao conjunta para o vetor z tal que cada coordenada possa
ser expressa por ??. Assim, somos levados `a questao: em que condicoes ??
define uma distribuic
ao de probabilidade para o vetor z ? Caso exista uma distribuic
ao satisfazendo todas as n equacoes, esta distribuicao e u
nica ? Para responder a estas perguntas, vamos reescrever o sistema de equacoes simultaneas
em notac
ao matricial.
Em notac
ao matricial, o modelo SAR e expresso da seguinte forma:
Z = S(Z ) + 

(1.1.2)

onde a matriz S e n n. Note que S nao precisa ser simetrica mas Sii = 0, i =
1, . . . , n. A partir de ??, obtemos
(I S)(Z ) = 
donde, se (I S) e invertvel,
Z = + (I S)1 

(1.1.3)

Z N (, (I S)1 (I S t )1 )

(1.1.4)

concluindo-se que

1.2. O MODELO AUTOREGRESSIVO CONDICIONAL (CAR)

Assim, temos o seguinte resultado: Resultado Suponha que


Exemplo 9 stios na forma de grade 3x3 com simetria do toro e movimento
do peao. Ent
ao, se

0 1 1 1 0 0 1 0 0
1 0 1 0 1 0 0 1 0

1 1 0 0 0 1 0 0 1

1 0 0 0 1 1 1 0 0

B = c A = 1/5
0 1 0 1 0 1 0 1 0
0 0 1 1 1 0 0 0 1

1 0 0 1 0 0 0 1 1

0 1 0 0 1 0 1 0 1
1 0 1 0 0 1 0 1 0
temos que
diag((IB)1 (IB t )1 ) = diag((IB)2 ) = (4.2, 3.8, 3.8, 3.7, 3.7, 3.7, 3.1, 3.6, 3.5).
Este vetor mostra as vari
ancias dos yi s e e surpreendente que, mesmo com
esse grau extremo de simetria, elas nao sejam iguais. Note que, se c 1/4 na
definicao de B acima, a matriz I B e singular ja que entao (I B) x = 0.
Aumentando para 25 stios na forma de grade 5x5 temos as variancias indo
de 2.1 a 2.7.

1.2

O modelo autoregressivo condicional (CAR)


yi |{yj , j 6= i} =

Bij yj + i

(1.2.5)

onde i N (0, i2 ).

1.2.1

Equivalence between SAR and CAR models

Os modelos CAR e SAR s


ao equivalentes no seguinte sentido: dado um
vetor Z com distribuic
ao de probabilidade seguindo o modelo SAR, existe um
modelo CAR correspondente que possui a mesma distribuicao. O contrario
tambem e v
alido.

NAO
BAYESIANA
CAPITULO 1. REGRESSAO

Resultado: Os modelos SAR e CAR sao equivalentes.


Prova: Vamos provar inicialmente que todo modelo SAR implica num modelo
CAR. Suponha que B e sao tais que existe (I B)1 com B ii = 0 e
i > 0, i = 1, . . . , n. Queremos encontrar C e M tais que existe (I C)1
com [M ]ii > 0, C ii = 0 e a matriz CM sendo simetrica.
Denote Q1 = (I B)1 (I B t )1 . A matriz Q1 e simetrica e
definida positiva e, por consequencia, a matriz Q = (I B t ) 1 (I B)
tambem e simetrica e definida positiva. Queremos (I C)1 M = Q1 , ou
seja, M 1 (I C) = Q, ou ainda, C = I M Q. Entretanto, precisamos de
ter C ii = 0. Tome ent
ao M = [diag(Q)]1 . Esta matriz esta bem definida pois
M ii > 0 j
a que, como Q1 e p.d., Q tambem e p.d. e assim, 0 < xt Q1 x para
todo vetor x. Em particular, se x e um vetor de zeros, exceto pela presenca de
um u
nico 1 na i-esima posicao, entao 0 < xt Q1 x = [Q1 ]ii . Dessa forma,

Qij /Qii , se i 6= j
[C]ij = [I M Q]ij =
0,
se i = j
Alem disso, (I C)1 M = Q1 , o que implica que C M e simetrica.
Vamos provar agora que todo modelo CAR implica num modelo SAR.
Suponha que C e M s
ao tais que existe (I C)1 com M ii > 0, C ii = 0
e CM sendo simetrica. Vamos mostrar que existem B e tais que existe
(I B)1 com
(I C)1 M = (I B)1 (I B t )1 ,
B ii = 0 e ii > 0, i = 1, . . . , n.
A decomposic
ao de Cholesky diz que se A e p.d. entao existe uma u
nica
matriz U triangular superior com elementos da diagonal positivos tal que A =
U t U . Como M 1 (IC) e p.d., seja U t U = M 1 (IC) a sua decomposicao
de Cholesky. Ent
ao U e triangular superior com Uii > 0. Assim, queremos
encontrar B e tais que
(U t U )1 = (I B)1 (I B t )1
Isto e, queremos

t  0.5

U t U = 0.5 (I B)

(I B)

1.3. OLD STUFF - FROM SBE COURSE

Tome U = 0.5 (I B), ou seja, B = I 0.5 U . Como B ii deve ser zero,


escolha [0.5 ]ii = [U ]1
coes sobre as matrizes sao validas
ii > 0. Todas as condi
com esta escolha e temos assim o SAR correspondente a esse CAR.
Usando basicamente as mesmas ideias acima, podemos mostrar que:
Resultado: Os modelos equivalentes SAR e CAR geram a classe das distribuicoes normais n-variadas.
Prova: Basta mostrar que toda matriz de covariancia definida positiva
pode ser escrita como as matrizes de um SAR e de um CAR repetindo os
passos acima.
Desse modo, qualquer vetor com distribuicao normal multivariada pode
ser representado na forma de uma distribuicao com estrutura espacial de um
SAR ou de um CAR.

1.3

Old Stuff - from SBE course

Suponha que E(Y = 0.


O modelo SAR (Simultaneous AutoRegression) supoe que:
Y W Y onde

 e vetor Nn (0) e e matriz diagonal 12 , 22 , . . . , n2 .
Distribuic
ao de Y edeterminadapelasoluca
osimult a neadosistemadeequacoesestoc
asticaslinearesacima
Assim, (I W ) Y 
Se (I W ) e inversvel,
Y (I W )1 
Modelo SAR - Distribuic
ao de Y
Se existe (I W )1 , o modelo SAR esta bem definido e
Y Nn (0V )
onde
V = (I W )1 (I W t )1

NAO
BAYESIANA
CAPITULO 1. REGRESSAO

Restric
ao em e na matriz de vizinhanca W no caso de modelo SAR: e necess
ario apenas que exista (I W )1
est
a restrito ao intervalo [1/min , 1/max ] onde min e max sao os autovalores
mnimo e m
aximo da matriz W
W n
ao precisa ser simetrica: i pode ser mais vizinho de j do que j de i.
Modelo SAR - Covari
ancia de Y

Cov(Y = V = (I W )1 (I W t )1
Em geral, a matriz de vizinhanca espacial W e esparsa: a maioria dos seus
elementos e igual a zero
No entanto, a matriz V sera cheia. Isto implica em correlacoes 6= 0 entre
localizac
oes distantes. Em geral, decai com distancia mas decaimento nao e
homogeneo (depende da posicao e da direcao)
Em geral, a diagonal de V nao sera constante, mesmo que Cov( = = 2 In ,
um m
ultiplo da identidade.
Assim, as observac
oes n
ao vem de um processo espacial estacionario.
Modelo SAR - Mais n
ao-estacionariedade espacial
Outra consequencia desagradavel: Cov(yi , yj ) nao sera invariante com a distancia
(vetorial) entre as
areas i e j
Isto ocorre mesmo que a matriz Wij seja constante com a distancia.
Isto tambem ocorre mesmo que = 2 In .
A principal raz
ao para a nao estacionariedade e que, num mapa tpico de
areas, n

ao existe homogeneidade de n
umero de vizinhos ou de ou de padrao
direcional de vizinhos.
Exemplo
Suponha uma grade regular com vizinhanca dada pelo movimento do peao.

1.3. OLD STUFF - FROM SBE COURSE

Considere 9
areas na forma de grade 3x3 com simetria do toro e movimento
do peao para a estrutura de vizinhanca.

Transformando um ret
angulo num toro

Exemplo - 2
Se || < 1/4 ent
ao existe (I W )1

NAO
BAYESIANA
CAPITULO 1. REGRESSAO

W = 1/5

0
1
1
1
0
0
1
0
0

1
0
1
0
1
0
0
1
0

1
1
0
0
0
1
0
0
1

1
0
0
0
1
1
1
0
0

0
1
0
1
0
1
0
1
0

0
0
1
1
1
0
0
0
1

1
0
0
1
0
0
0
1
1

0
1
0
0
1
0
1
0
1

0
0
1
0
0
1
1
1
0

A diagonal de V = Cov(Y e constante e igual a 3.70. A covariancia dos


vizinhos (de primeira ordem) e 2.84 e, para areas nao-vizinhas (ou de segunda
ordem), e igual a 2.49.
Exemplo - 3

Com esse grau extremo de simetria, a matriz de covariancia possui o padrao


estacion
ario.
Isto s
o acontece se o mapa for convertido em um toro

Sem a convers
ao para toro, as variancias nao sao constantes: 1.37, 1.60, 1.37, 1.60, 1.93, 1.60, 1.37, 1.
Covari
ancia entre vizinhos e 0.67 a menos que uma das areas seja a area 5
(central) quando ent
ao e 0.87
E da ? Dificuldades para usar argumentos assintoticos baseados em uma u
nica
realizac
ao de um processo estocastico sem poder usar estacionariedade
Mapa de MG dividido em n municpios: O que significa n ?
Esta dificuldade assint
otica nao aparece em outros tipos de dados espaciais
(superfcie contnua e processos pontuais)
Dificuldades para a estimacao de

1.3. OLD STUFF - FROM SBE COURSE

Numa
P serie AR(1)
P yt2 = yt1 + t com distribuicao normal, o estimador OLS
b = t yt yt1 / t yt e consistente e eficiente.
No caso espacial, considere o modelo SAR sem variaveis explicativas
= W + 
Entao o estimador OLS
b =t W/(t )
e inconsistente.
Estimac
ao deve ser por m
axima verossimilhanca: veremos mais tarde
Caso E(Y 6= 0
Seja E(Y =. Ent
ao modelo SAR fica
Y = W (Y ) + ousejaY + (I W )1 
Premultiplicando por (I W ) temos
Y W Y + onde
= (I- W ) e uma transformac
ao 1-1.
No modelo de regress
ao com covariaveis, faremos =
Isto e,
Y W Y X + 
Modelos SAR e CAR: reta 6= plano
Em series temporais, as duas especificacoes abaixo sao equivalentes:
a especificac
ao simult
anea
yt = yt1 + t
com t i.i.d. com V ar(t ) = 2

NAO
BAYESIANA
CAPITULO 1. REGRESSAO

10

e a especificac
ao condicional
E(yt |yt1 , yt2 , . . .) = yt1
e
V ar(yt |yt1 , yt2 , . . .) = 2
Esta equivalencia n
ao ocorre em modelos espaciais.
Suponha um mapa na forma de uma grade regular
Suponha um modelo SAR para os dados Y
Suponha uma matriz W binaria simetrica determinada pelo movimento de
pe
ao
Isto implica num modelo CAR equivalente
Isto e, distribuic
ao de Y podeserescritacomoumCAR.
Entretanto, o modelo CAR equiavalente ao SAR possui uma matriz W diferente da matriz W do modelo SAR.
Matriz W de CAR e muito mais cheia que a de SAR: nao-vizinhos no modelo
SAR (ou vizinhos de segunda e terceira ordem) sao vizinhos no modelo CAR.
SAR: Covari
ancia para W simetrica e [(I W )t (I W )]1 = [I 2W +
2 W 2 ]1
CAR: covari
ancia baseada numa matriz de vizinhanca W e igual a [I W ]1
Representac
ao SAR corresponde a modelo CAR com vizinhos de primeira e
segunda ordem.

1.4. MAXIMUM LIKELIHOOD ESTIMATION

11

Os modelos CAR e SAR s


ao equivalentes no seguinte sentido:
Dado um vetor Z com distribuic
ao conjunta de probabilidade seguindo o modelo SAR, existe um modelo CAR correspondente que possui a mesma distribuicao conjunta.
O contrario tambem e v
alido: modelos CAR sao expressos como modelos SAR.
Teorema: Os modelos equivalentes SAR e CAR geram a classe de todas as
distribuic
oes normais n-variadas.
No caso normal, decis
ao sobre qual modelo adotar (CAR vs SAR) passa a ser
ditada pela teoria subjacente ao problema, ou e uma questao de gosto, ou de
capacidade de interpretac
ao dos parametros.

1.4

Maximum likelihood estimation


Modelos de Regress
ao Espacial
SAR - Lag espacial
= W + X + onde
 i.i.d N (0, 2 ) e independente de X.
SAR - Spatial Error Model
= X +  W 
com i.i.d N (0, 2 ) e independente de X.

NAO
BAYESIANA
CAPITULO 1. REGRESSAO

12

No segundo modelo, espaco e meramente rudo (nuisance), Interesse principal e na estimacao de . Processo espacial de 
eapenasparalevaremcontaerr
Uma variac
ao de SAR com lag
SAR - Spatial Durbin Model
introduz defasagens espaciais nas variaveis exogenas

= W + (I 2 W )X + W + X W X(2 ) + 
onde i.i.dN(0, 2 ) e independente de X.
Caso Particular do modelo SAR de lag espacial
Mais Modelos de Regressao Espacial
CAR: Conditional Auto-Regressive Model.
Seja E(Yi ) = i =ti . Ent
ao a media condicional i|. = E(Yi | Y1 = y1 , . . . , Yn =
yn ) e vari
ancia condicional Vi|. = V ar(Yi | Y1 = y1 , . . . , Yn = yn ) sao dadas por

i|. = i + (Wi1 (y1 1 ) + . . . + Win (yn n ))


Vi|. =

i2

(1.4.6)
(1.4.7)

Temos
Y Nn X, (I W )1

onde e a matriz diagonal com os i2


Estimac
ao de e e
OLS: inconsistencia, vcio, ineficiencia
2SLS: inconsitencia (Keleijian and Prucha, 1997)
EMV: Condic
oes de regularidade ? Mas o que e assintotico ?

1.4. MAXIMUM LIKELIHOOD ESTIMATION

13

Duas abordagens:
Infill asymptotics: regiao geografica fica fixa mas unidades
amostrais aumentam ficando mais densas.

Expanding Domain Asymptotic: Areas


internasficam fixas
e aumenta-se o n
umero de areas na fronteira em todas as
direc
oes
Tratamento para reticulados regulares (imagens)
Neste caso, processos estacionarios podem ser assumidos.
Condic
oes suficientes: limitam n
umero de vizinhos na matriz
de pesos assegurando que nao crescem com o tamanho do
reticulado
Condicoes de regularidade para resultados assintoticos
Caso de reticulados irregulares (grafos - mapa usual) e mais complicado
Tratamento unificado apenas recentemente: Keleijian e Prucha (1998, 1999,
2001),
Definicao: Uma matriz
P linhas e colunas uniformemente limitadas em
P A possui
valor absoluto se i |Aij | e j |Aij | sao menores que constante C para todo
iej
Exemplo de condic
oes:
Os elementos da matriz de pesos W sao constantes conhecidas
e o posto de I W e n para todo || < 1.
As matrizes W e (I W )1 (I W t )1 sao linha-coluna
uniformemente limitadas em valor absoluto.
X e n
ao-estoc
astica e de posto completo.
limn n1 X t W t W X e finita e nao-singular
Estimac
ao OLS no modelo de lag espacial

NAO
BAYESIANA
CAPITULO 1. REGRESSAO

14
Considere o modelo

Y W + X + onde
1 , . . . , n i.i.d N (0, 2 ) e independentes de X.
Regress
ao com a vari
avel dependente defasada yt1 sendo usada como regressor: n
ao temos problemas com OLS se o erro t nao e correlacionado com
yt1 .
Isto ocorre se os erros t sao nao correlacionados.

Na situac
ao espacial, a presenca de W Y comoregressorinduzendogeneidadeindependentementeda
Como resultado, OLS sera inconsistente (Anselin e Bera, 1998).
Log-verossimilhanca do modelo de lag espacial
Considere o modelo
= W + X + onde
 i.i.d N (0, 2 ) e independente de X.
Ent
ao, existindo a inversa, temos
= (I W )1 X + (I W )1 
e a log-verossimilhanca e
n
1
l(, , 2 ) = log(2 2 ) + log |I W | 2 Q
2
2
onde
Q = (X)t (X)
EMV do modelo no modelo de lag espacial
O m
aximo u
nico da log-verossimilhanca e dado por:
b= X t X

1

X t (I W )

1.4. MAXIMUM LIKELIHOOD ESTIMATION

15

t
c2 = 1 (I W )t I X(X t X)1 X t  (I W )

e minimiza a express
ao
X
2

log(1 i ) + log
n

M 2t M W + 2 (W )t M W

onde M = I X(X t X)1 X t e i sao os autovalores de W


Estimac
ao de no modelo de lag espacial
A solucao pode ser encontrada por meio de um algoritmo de busca direta:
uma grade fina e colocada entre 1/(1) < 0 e 1/(n) > 0 e percorrida exaustivamente. Em cada valor da grade calcule a funcao que envolve e ache o
valor que a maximiza.
Pace e Barry (1997 e seguintes) mostraram que tecnicas de matrizes esparsas
podem ser usadas para estimar rapidamente em matrizes da ordem de 104
104 elementos.
Seus metodos est
ao implementados num pacote do MATLAB chamado spatial
econometrics
Pacote contem muitas outras funcionalidades: ver pagina de James LeSage
Matriz de informac
ao
A matriz de covari
ancia dos estimadores e dada pela inversa da matriz I de
informac
ao de Fisher avaliada no ponto de maximo.
Seja B = W (I W )1
e
=

X
i

i
1 i

2

n/2

tr(B)
0t
1
c2 tr(B t B) +
c2
I=

tr(B)
t X t B t BX
X t BX
c
2

t
t
0
X BX

X X

NAO
BAYESIANA
CAPITULO 1. REGRESSAO

16

Estimac
ao OLS no modelo de erros espaciais
Considere o modelo
= X +  W 
com i.i.d

N (0, 2 )

e independente de X.

Temos ent
ao
= X + (I W )1
Suponha quebe o estimador OLS usual de .
Ent
ao, como em series temporais, temos :
b e n
ao-viciado, consistente mas ineficiente (Anselin, 1988,
p.59)
OLS em 2 estagios (imitando procedimento de Cochrane-Orcutt,
1949) leva a estimadores inconsistentes (Kelejian e Prucha,
1997)
Eles mostraram que a funcao resposta do modelo espacial
autoregressivo associado com a tranformacao de CochraneOrcutt viola a condicao do posto de Amemiya (1985, p.246)
levando a problemas de identificacao para o parametro espacial.
Log-verossimilhanca do modelo de erros espaciais
Considere o modelo
= X +  W 
com i.i.d

N (0, 2 )

e independente de X.

Temos ent
ao
= X + (I W )1
A densidade conjunta de e obtida a partir daquela de
f () = (1/2 2 )n/2 exp t /(2 2 )

e como = (I W )ent
aoaverossimilhancade(t , , 2 ) e dada por
f ( = |I W |/(2 2 )n/2 exp (t(I W )t (I W )/(2 2 )

1.4. MAXIMUM LIKELIHOOD ESTIMATION

17

EMV no modelo de erros espaciais


O maximo u
nico da log-verossimilhanca e dado por:
b= X t (I W )t (I W )X

1

X t (I W )t (I W )

c2 = 1 (Xb)t (I W )t (I W ) (Xb)

n
e minimiza a express
ao
log(b
)

2X
log(1 i )
n
i

onde i s
ao os autovalores de W .
e encontrado por busca direta em (1/min , 1/max ).
Matriz de informac
ao do modelo de erros espaciais
A matriz de covari
ancia dos estimadores e dada pela inversa da matriz I de
informac
ao de Fisher avaliada no ponto de maximo.
Seja B = W (I W )1
e
=

X
i

i
1 i

2

Entao

n/2

tr(B)
0t
1
c2 (tr(B t B) )
I=

tr(B)

0t
c2

t
t
00

X (I W ) (I W ) X

NAO
BAYESIANA
CAPITULO 1. REGRESSAO

18

1.5

Confidence intervals and tests


Teste de dependencia espacial
Testes de presenca de auto-correlacao espacial em
Dados normais: I de Moran ou variantes (c de Geary,
etc.)
Dados de contagem ou proporcoes: Moran Bayesiano
emprico
Testes de autocorrelacao espacial em regressao
I de Moran para resduos de regressao
testes de metodos de momentos
Testes baseados em verossimilhanca
Testes de multiplicadores de Lagrange/escore
testes de Wald e razao de verossimilhanca baseados na
estimacao de MV do modelo espacial
Teste de presenca de auto-correlacao espacial em by
Sem covariaveis, mapa com com . Hipotese nula: i.i.d.
Existe evidencia de auto-correlacao espacial em
Defina = .
I de Moran: estatstica de teste e
I=

n t
W/(by t by)
S0

onde
S0 =

X
i6=j

Wij

1.5. CONFIDENCE INTERVALS AND TESTS

19

Se i.i.d. pode-se obter distribuicao assintotica: I N (1/(n


1), V ) onde V e dada por expressao envolvendo W e n
Express
ao de V depende do tipo de modelo amostral
modelo de superpopulacao para : dados sao i.i.d. normais
modelo de permutacao: e fixo nos valores observados e distribuicao de I e obtida asumindo que todas
as alocac
oes espaciais dos valores de sao igualmente
prov
aveis.
dados de taxas e proporcoes: Moran bayesiano emprico: Assunc
ao e Reis (1999)
Testes de Hip
otese em Modelos de Regressao
Existem dois tipos de testes de diagnostico para dependencia
espacial em modelos de regressao:
testes para dependencia espacial nos erros
testes para dependencia substantiva ??
Abordagens comuns sao aplicacoes baseadas no ndice I de
Moran e testes de multiplicadores de Lagrange baseados nos
resduos de uma regressao OLS.
Testes de Hip
otese
Duas hip
oteses: nula e alternativa
Hip
otese Nula: regressao linear usual.
Hip
oteses alternativas possveis:
modelo SAR de lag espacial
modelo SAR de erro espacial
SMA, SEC, representacao direta (nao falarei sobre esses)

20

NAO
BAYESIANA
CAPITULO 1. REGRESSAO
modelo CAR
Modelo restrito (nulo) e o mesmo para todas as alternativas
consideradas.
Problema: varios testes de ma-especificacao contra heterocedasticidade, forma functional, etc.
Teste para dependencia espacial nos erros: I de Moran
Sugerido por Moran (1950), esquecido e reavivado por Cliff
and Ord (1972).
Rode regressao linear simples Y X+eobtenhavetorderesduos.Aseguir, calcule

I=

n t
W/brt br
S0

onde e o vetor de resduos OLS e


S0 =

Wij

i6=j

Cliff e Ord (1972): Sob hipotese de normalidade dos erros esobahip


otesenula, assintoticamenteI
N (mI , V ) onde
ntr(M W )
mI =
(n k)S0
com M = In X (X t X)1 X t . Existe longa expressao para V dependendo de
X e W.
Similaridade com Durbin-Watson: DW =t A/(t ) onde

1 1 0
0 ... 0
0
0
1 2 1 0 . . . 0
0
0

0 1 2 1 . . . 0
0
0

.
.
. ... .
.
.
A= .
.
.
.
.
.
.
.
.
.
.

0
0
0
0 . . . 1 2 1
0
0
0
0 . . . 0 1 1

1.6. DIFFICULTIES WITH NON-NORMAL DATA

21

DW e UMP para alternativas unilateriais com distribuicao para o erro dada


por epsilont = t1 +ut (King, 1987, book Specification analysis in the linear
model
Propriedades
otimas de I de Moran como teste LM (localmente mais poderoso): Burridge (1981) mostrou que I e equivalente a estatstica de teste LM
para alternativa em que erros de regressao sao W .
Distribuic
ao EXATA de I de Moran
Tiefelsdorf e Boots (1995): distribuicao exata de I de Moran !
Sejam 1 , . . . , nk os autovalores nao nulos da matriz n n dada por M W =
(In X (X t X)1 X t ) W .
Eles mostraram que
Pnk

i Zi2
I Pi=1
nk 2
i=1 Zi
onde Z1 , . . . , Znk s
ao i.i.d. N (0, 1)
Valores crticos exatos para a distribuicao nula de I podem ser obtidos por
(difcil) integrac
ao numerica
Teste LM para dependencia espacial nos erros
Sugerido por Burridge (1980)

LM =

c2
W/

2

/tr(W 0 W + W 2 ) 2 (1)

c2 =0 /n e o EMV de 2 (SOB HO???)


onde e o vetor de resduos OLS e

1.6

Difficulties with non-normal data