Escolar Documentos
Profissional Documentos
Cultura Documentos
Geoestatistica APOSTILA
Geoestatistica APOSTILA
Fundamentos de Geoestatstica
PARTE I:
INTRODUC
AO
1. Estatstica Espacial:
Exemplos Basicos
300000
(a) Taxas de c
ancer por regi
oes administrativas
o estons de cinza correspondem a` variaca
timada do risco relativo de cancer coloretal em 36 zonas eleitorais da cidade de Birmingham, UK.
1.0
1.1
1.2
1.3
290000
285000
280000
275000
Northings (meters)
295000
0.9
395000
400000
405000
410000
Eastings (meters)
415000
420000
100
200
300
400
500
600
o no Estado do Parana
(b) Precipitaca
Medidas de chuva em 143 postos meteo
rologicos.
Medias historicas
para o perodo de Maio o seca).
Junho (estaca
Maiores detalhes: tese de Jacinta L. Zamboti
(2001).
200
300
400
500
600
700
800
140
100
N-S (km)
120
80
380
400
420
440
E-W (km)
460
util
modelos s
ao tipicamente definidos indiretamente a partir de condicionais
[Yi|Yj , j 6= i]
o espacial contnua
(b) Variaca
Estrutura basica.
Y (x) : x IR2
n
ao estocastica
(ex.
grade cobrindo
a regi
ao em estudo A) ou estocastica,
porem
independente do processo Y (x)
(c) Processo pontual espacial
Estrutura basica.
Conjunto contavel
de pon
N-S (km)
150
100
50
0
0
100
200
300
E-W (km)
medidas diarias
de chuva em 8 de Maio de
1986
dados do projeto:
Spatial Interpolation Comparison 97
ftp://ftp.geog.uwo.ca/SIC97/.
-2000
-3000
-4000
-5000
N-S
-1000
1000
-6000
-5000
-4000
-3000
E-W
-2000
-1000
avores
resposta 0/1: presenca ou ausencia
11000
10000
9000
YCOORD
12000
covariaveis:
di
ametro, umidade, sombreamento, cobertura do tronco, viva
4000
5000
6000
XCOORD
7000
presenca de malaria
no sangue da crianca
j
covariaveis
ao nvel de vilas:
o (coordenadas), presenca de
localizaca
ndice de vegetaca
o decentro de saude,
rivado de satelite
covariaveis
ao nvel de criancas:
idade, uso e tratamento de mosquiteiro
o oo
o oo
ooo
o
oo
oo
o
1500
o
oooo
o oooooooooo
o
ooo o
o
ooo
o
ooo oooooo
o ooo
Western
1400
N-S (km)
Central
Eastern
o oo o
o o oo oo
o o
o o
o
o o
ooo oo o
o o o o ooo o
oo oo
o ooo
o
o oo ooo oo
300
oo
o
oo ooo o
o ooooooooooo o
o
400
500
E-W (km)
600
estocastico
xi e tipicamente fixo. Se as localizaco es xi s
ao
400
300
400
500
600
700
800
300
200
100
150
200
200
250
500
400
Coord X
400
350
300
200
250
data
300
250
200
data
350
400
Coord X
200
300
400
500
Coord X
600
700
100
200
300
Coord Y
400
Coord Y
data
300
350
300
200
100
Coord Y
400
450
500
600
1200
1000
6000
800
5000
semivariance
600
4000
semivariance
3000
400
2000
200
1000
0
0
100
200
distance
300
400
100
200
distance
300
400
retirada de
variogramas para dados originais (esquerda) e apos
600
500
400
Coord Y
300
200
100
160
200
218
300
277
400
500
Coord X
336
600
395
700
100
200
Coord Y
300
400
500
600
800
135
200
310
300
485
400
500
Coord X
660
600
834
700
800
5. Quest
oes Centrais
Delineamento
quantas localizaco es?
quantas medidas?
o das localizaco
es?
configuraca
o?
o que deve-se medir em cada localizaca
Modelagem
modelo probabilstico para o sinal [S]
modelo de probabilidade condicional para
as medidas, [Y |S]
o
Estimaca
valores para parametros desconhecidos do
modelo
inferencias sobre os parametros ou
funco es destes
o
Predica
o condicional
avalia-se [T |Y ], a distribuica
o
aos dados do objetivo de predica
Geostatstica Tradicional:
o pa evita referencia explcita a` especificaca
rametrica dos modelos
variogramas como instrumento de inferencia
o e escolha)
(Matheron: estimaca
em geral usa-se estruturas complexas de variogramas
concentra-se em estimadores lineares
metodos e paradigmas especficos para:
o pontual (SK, OK, KTE, UK)
predica
o de funcionais n
predica
ao lineares (IK,
DK, ...)
o de densidades preditivas (IK,
estimaca
DK)
simulaco es das preditivas (SGSIM, SISIM,
...)
kriging menu
PARTE II:
DO MODELO
ESPECIFICAC
AO
GEOESTATISTICO
o de um
2. A caminho da especificaca
modelo especial
Perspectiva historica
- paradigmas para in
ferencia
(a) Modelos estatsticos:
o de dados
reduca
o e predica
o
escolha, estimaca
(b) Gauss e Legendre
estudos de astronomia
erros normais
discrepancia dados e modelo: min. quadrados
1o e 2o momentos
(c) Fisher e verossimilhanca
o da verossimilhanca
uso e interpretaca
o com min. quad.:
relaca
2l = 12 (yi i)2
maximo,
curvaturas, inferencia, etc
Royall, 1997
pragmatismo e delineamentos
(d) Inferencia: Model-based vs design-based
Perspectiva historica
- Modelos Lineares Genera
lizados
Modelo linear
Y = X +
pode ser escrito como:
Y N (, 2)
= X
e generalizado de 2 formas
Y Q(, ...)
= g() = X
n
ao mais requer
normalidade
vari
ancia constante
o com escala
preocupaca
verossimilanca em destaque
deviance: D() = l(y, y) l(y, )
extens
oes
modelagem de superdispers
ao
modelos mixtos
modelos hierarquicos
(multinvel)
inferencia Bayesiana
Yi : i = 1, ..., n
mutuamente independentes, com i = E[Yi]
Pk
o de ligaca
o co h(i) = j=1 fij j , com funca
nhecida h().
Modelo Linear Generalizado Mixto
Yi : i = 1, ..., n
mutuamente independentes, com i = E[Yi],
` ralizaco es de um conjunto de
conditional as
de variaveis
aleatorias
latentes Ui,
P
h(i) = Ui + kj=1 fij j ,
o de ligaca
o conhecida h().
para uma funca
A modelo espacial (geoestatstico)
Yi : i = 1, ..., n
mutuamente independentes, com i = E[Yi],
` realizaco es de um conjunto de
conditional as
de variaveis
aleatorias
latentes Ui,
Pp
h(i) = Ui + j=1 fij j ,
o de ligaca
o conhecida h(),
para uma funca
Ui = S(xi)
onde {S(x) : x IR2} e um processo es
tocastico
espacial.
Pk
h(i) = Ui + j=1 fij j ,
data
4.0 4.5 5.0 5.5 6.0 6.5 7.0
0.0
0.2
0.4
0.6
0.8
1.0
locations
3. O Modelo Gaussiano
o
4. Especificaca
o
correlaca
da
o
funca
A famlia de Matern
o de correlaca
o dada por
Funca
(u) = {21()}1(u/)K(x/)
e s
ao parametros
o de Bessel de ordem
K() denota funca
valida
para > 0 e > 0.
= 0.5: modelo exponencial
: modelo Gaussiano
de
1.0
correlation
0.8
0.6
0.4
0.2
0.0
0.0
0.2
0.4
0.6
0.8
1.0
distance
1.5
1.0
0.5
0.0
0.5
1.0
1.5
0.0
0.2
0.4
0.6
0.8
1.0
VARIOGRAMAS
o variograma de um processo Y (x) e a
o
funca
1
V (x, x0) = Var{Y (x) Y (x0)}
2
para o modelo linear Gaussiano, com u =
||x x0||,
V (u) = 2 + 2{1 (u)}
5. Extens
oes do modelo basico
(a) Modelos Gaussianos transformados
O modelo Gaussiano e claramente inapropriado para distribuico es assimetricas.
Certos dados podem indicar relaco es entre media e variancia, que violam o modelo
Gaussiano.
o Box Par
ametro extra da transformaca
Cox introduz certa flexibilidade.
O modelo fica ent
ao definido da forma:
assume-se Y M V N (F , 2V )
dados y = (y1, ..., yn), s
ao gerados por uma
o do modelo linear Gaussitransformaca
ano Y = h1
(Y ) tal que:
(
(yi ) 1
if 6= 0
Yi = h(Y ) =
log(yi) if = 0
1.0
0.1
1.0
0.1
0.5
0.3
0.
6
0.5
.7
0.0
0.7
0.0
0.6
0.5
0.4
0.5
0.4
0.3
0.5
0.2
0.2
0.1
1.0
1.0
0.2
0.4
0.6
0.5 0
0.8
0.0
0.5
0.3
0.5
0.7
0.5
0.5
1.0
1.0
0.5
1.0
0.5
1.0
contornos de correlaca
(esq.) e dois
modelos anisotropicos
(centro e dir.)
anisotropia geometrica:
possvel (e simples)
abordagem.
dois par
ametros extra: a
ngulo de anisotropia A e raz
ao de anisotropia R .
o e contraca
o/expans
rotaca
ao das coordenadas originais:
1
0
cos(A) sin(A)
(x10, x20) = (x1, x2)
0 1
sin(A) cos(A)
R
32
33
34
35
36
0.8
25
26
27
28
29
30
19
20
21
22
23
24
0.4
0.6
1.0
31
0.6
Isotropic Space
31
32
33
34
35
36
25
26
27
28
29
30
19
20
21
22
23
24
13
18
10
11
12
0.0
17
0.2
16
0.2
15
0.0
14
0.2
0.4
0.2
0.4
0.6
0.8
1.0
14
15
16
17
18
10
11
12
0.0
0.2
0.4
0.6
0.8
1.0
Isotropic Space
32
33
34
35
36
25
26
27
28
29
30
0.6
1.0
31
0.8
0.8
0.0
13
0.4
6
12
18
19
20
21
22
23
24
0.2
0.6
24
30
36
15
16
17
18
28
34
27
10
11
12
0.0
0.2
0.4
0.6
0.8
1.0
3
9
14
20
7
13
26
32
2
8
19
25
31
1.4
1.2
1.0
0.8
0.6
0.4
0.2
0.0
32
33
34
35
36
25
26
27
28
29
30
0.8
31
1.0
Isotropic Space
1.0
0.8
0.0
0.6
0.4
0.2
4
10
16
22
x
15
21
33
0.2
14
0.0
0.4
13
23
29
35
5
11
17
36
19
20
21
22
23
34
33
24
0.4
0.6
0.6
35
32
31
26
14
15
16
17
18
0.2
0.4
13
21
20
19
22
x
15
10
11
12
0.0
0.0
9
0.0
0.2
0.4
0.6
0.8
1.0
12
6
11
5
10
4
3
2
0.4
0.2
0.2
16
8
7
18
17
14
13
24
23
28
27
25
30
29
0.6
0.4
0.2
0.0
0.2
0.4
0.6
(c) Modelos n
ao estacionarios
Modelos com medias
n
ao constantes
k
X
j fj (x)
j=1
Variabilidade intrinsica:
pressuposto
mais fraco de estacionaridade (processo
do espaco geografico,
x.
preciso ter em mente o balanco entre a o
E
aumento da flexibilidade de modelos mais
gerais contra a sobre-modelagem de dados
o
esparsos, que leva a pobre identificaca
dos parametros.
PARTE III:
ESPACIAL
PREDIC
AO
o em processos estocasticos
1. Predica
o Geostatstica
2. Predica
o no Modelo Gaussiano
3. Predica
4. O que a krigagem faz com os dados?
o de Funcionais
5. Predica
o em processos estocasticos
1. Predica
General results for prediction
goal: predict the realised value of a (scalar)
r.v. T , using data y a realisation of a (vector)
r.v. Y .
predictor: of T is any function of Y , T = t(Y )
best choice: needs a criterion
MMSPE: the best predictor minimises
M SP E(T ) = E[(T T )2]
Theorem 1.
The minimum mean square error predictor of T
is
T = E(T |Y ).
Theorem 2.
(a) The prediction mean square error of T is
E[(T T )2] = EY [Var(T |Y )],
(the prediction variance is an estimate of the
MSPE).
(b) E[(T T )2] Var(T ), with equality if T and Y
are independent random variables.
Comments
We call T the least squares predictor for T ,
and Var(T |Y ) its prediction variance
Var(T ) Var(T |Y ) measures the contribution
of the data (exploiting dependence between
T and Y )
point prediction, prediction variance are
summaries
complete answer is the distribution [T |Y ]
not transformation invariant:
T the best predictor for T does NOT necessarily imply that g(T ) is the best predictor for
g(T ).
o Geostatstica
2. Predica
Suppose the target for prediction is T = S(x)
A predictor for T is a function T = T (Y )
The mean square prediction error (MSPE) is
M SP E(T ) = E[(T T )2]
The the predictor which minimises MSPE is
T = E[S(x)|Y ]
Two approaches:
Model-based geostatistics:
specify a probability model for [Y, T ]
choose T to minimise M SP E(T ) amongst
all functions T (Y )
Traditional (linear) geostatistics:
Assume that T is linear in Y , so that
n
X
T = b0(x) +
bi(x)Yi
i=1
Theorem 4. Let X = (X1, X2) be jointly multivariate Gaussian, with mean vector = (1, 2)
and covariance matrix
11 12
,
21 22
ie X MVN(, ). Then, the conditional distribution of X1 given X2 is also multivariate Gaussian, X1|X2 MVN(1|2, 1|2), where
1|2 = 1 + 121
22 (X2 2 )
and
1|2 = 11 121
22 21 .
2 0
r
2r 2I + 2R
(1)
(2)
Notes
1. Because the conditional variance does not
depend on Y , the prediction mean square error
is equal to the prediction variance.
2. Equality of prediction mean square error and
prediction variance is a special property of the
multivariate Gaussian distribution, not a general result.
3. In conventional geostatistical terminology,
T = S(x)
= +
n
X
wi(x)(Yi )
i=1
n
X
= {1
i=1
wi(x)} +
n
X
wi(x)Yi
i=1
predicted signal
0.0
0.2
0.4
0.6
0.8
1.0
locations
Predictions from 10 equally spaced data-points using exponential (solid line) or Matern of order 2 (dashed line) correlation functions.
0.5
predicted signal
0.0
0.5
1.0
1.5
2.0
2.5
0.0
0.2
0.4
0.6
0.8
1.0
locations
Predictions from 10 randomly spaced data-points using exponential (solid line) or Matern of order 2 (dashed line) correlation functions.
2.0
predicted signal
1.5
1.0
0.5
0.0
0.5
0.0
0.2
0.4
0.6
0.8
1.0
locations
predicted signal
1.5
1.0
0.5
0.0
0.5
0.0
0.2
0.4
0.6
0.8
1.0
locations
prediction variance
0.4
0.3
0.2
0.1
0.0
0.0
0.2
0.4
0.6
0.8
1.0
locations
Prediction variances from 10 randomly spaced datapoints using the Matern correlation function and different values of 2: 0 (solid line), 0.25 (dashed line) and
0.5 (thick dashed line).
= 0.05
prediction weights
0.2 0.0 0.2 0.4 0.6
=0
0.2
0.4
0.6
data locations
0.8
0.2
0.4
0.6
data locations
prediction weights
0.2 0.0 0.2 0.4 0.6
= 0.3
prediction weights
0.2 0.0 0.2 0.4 0.6
= 0.15
0.8
0.2
0.4
0.6
data locations
0.8
0.2
0.4
0.6
data locations
0.8
prediction weights
0.2 0.0 0.2 0.4 0.6
=1
0.2
0.4
0.6
data locations
0.8
0.2
0.4
0.6
data locations
0.8
=5
prediction weights
0.2 0.0 0.2 0.4 0.6
prediction weights
0.2 0.0 0.2 0.4 0.6
=2
0.2
0.4
0.6
data locations
0.8
0.2
0.4
0.6
data locations
0.8
prediction weights
0.0
0.4
0.8
2 = 0.1
prediction weights
0.0
0.4
0.8
2 = 0
0.2
0.4
0.6
data locations
0.8
0.2
0.4
0.6
data locations
prediction weights
0.0
0.4
0.8
2 = 0.5
prediction weights
0.0
0.4
0.8
2 = 0.25
0.8
0.2
0.4
0.6
data locations
0.8
0.2
0.4
0.6
data locations
0.8
o de Funcionais
5. Predica
Let T be any linear functional of S,
Z
T =
w(x)S(x)dx
A
Z Z
w(x)w(x0)Cov{S(x), S(x0)}dxdx0
Var[T |Y ] =
A
T =
w(x)S(x)dx
A
In words:
PARTE IV:
DE PARAMETROS
ESTIMAC
AO
implicaco es praticas:
qualquer vers
ao razoavel
do modelo linear Gaussiano tem pelo menos tres
par
ametros de covariancia
um volume da dados substancial pode ser
necessario
para estimar maior numero
de
par
ametros
a famlia Matern possui um parametro extra para determinar a suavidade do processo S(x)
o
Paradigmas para estimaca
Metodos Ad-hoc (baseados em variogramas)
calcule o variograma emprico
Otimos
sob as condico es declaradas
maior demanda computacional
podem n
ao ser robustos
o Bayesiana,
Implementaca
o e predica
o combinadas
estimaca
cada vez mais aceitos
o usando Variogramas
2. Estimaca
O variograma e definido por
1
V (x, x0) = Var{Y (x) Y (x0)}
2
se Y (x) e estacionario,
1
V (x, x0) = V (u) = E[{Y (x) Y (x0)}2]
2
onde u = ||x x0||
sugere uma estimativa emprica para V (u):
V (u) = average{[y(xi) y(xj )]2}
onde cada media e tomada entre todos os pares [y(xi), y(xj )] tal que ||xi xj || u
para processo com media n
ao constante a
tendencia pode ser removida:
defina ri = Yi (xi)
defina V (u) = average{(ri rj )2},
onde cada media e tomada entre todos os
pares (ri, rj )
semivariance
50000
100000
150000
50
100
distance
150
200
5000
semivariance
10000
15000
50
Variograma emprico
100
distance
150
200
semivariance
40
60
80
100
20
WLS 1
WLS 2
OLS
50
100
distance
150
200
6000
5000
4000
1000
800
600
400
2000
1000
3000
200
0
0
100
200
300
400
100
200
300
400
clui) variaca
de
larga escala.
variograma de resduos elimina esta
o
fonte de variaca
ii. Qu
ao instaveis
empricos?
s
ao
os
variogramas
1.0
0.8
Semi-variance
0.4
0.6
0.2
0.0
0.0
0.2
0.4
0.6
0.8
1.0
Distance
linha solida
mostra o variograma verdadeiro do processo
linha finas mostram variogramas
empricos de tres realizaco es do mesmo
processo (modelo)
as altas correlaco es entre V (u) para sucessivos u conferem uma suavidade enganadora
pratica
potencialmente perigoso devido as
correlaco es inerentes aos sucessivos Vk s
o baseada em objeto que e por si
v. estimaca
estimado
vi. e possivel ajustar o modelo diretamente
aos dados e n
ao ao variograma.
o por verossimilhanca
3. Estimaca
O modelo Gaussiano e dado por:
Yi|S N(S(xi), 2)
S(xi) = (xi) + Sc(xi)
o xi
de covariaveis
na localizaca
Y MVN(F , 2R + 2I)
o de verossimilhaca e :
e a funca
`(, , , , ) 0.5{log |( 2R + 2I)| +
(y F )0( 2R + 2I)1(y F )}.
o (numerica) produz as
para qual maximizaca
estimativas de maxima
verossimilhanca
Modelos Gaussianos transformados
A log-verossimilhanca e :
1
{log | 2V |
2
+(h(y) F )0{ 2V }1(h(y) F )}
n
X
1
+
log (yi)
`(, , ) =
i=1
para = (, , , ).
estimativas otimas
sob os pressupostos declarados
porem computacionalmente caros e podem
n
ao ser robustos
dificuldades computacionais para grande
numero
de dados
o
Implementaca
Bayesiana
combinando
o e predica
o tem sido cada vez
estimaca
mais aceita (ao menos entre estatsticos!).
Para famlia de Matern considere tomar em
um conjunto discreto {0.5, 1, 2, 3, ..., N }
o plug-in
4. Predica
Em geral o interesse esta em predizer
o do processo S() em um
o valor da realizaca
ponto
ou a media de S() em uma regi
ao
Z
T = |B|1 S(x)dx
B
onde os unicos
termos desconhecidos s
ao os
par
ametros do modelo
o plug-in consiste em substituir os
A predica
par
ametros por suas estimativas.
N-S (km)
150
100
50
0
0
100
200
300
E-W (km)
467 localizaco es
o em 8 de Maio 1986
medidas de precipitaca
dados s
ao valores inteiros com unidade de
medida igual a 1/10 mm
5 localizaco es com valores iguais a` zero.
log L
0.5 0.514 -2464.246
1 0.508 -2462.413
2 0.508 -2464.160
e valores da log-verossimilhanca log L
para
Estimativas de MV de
diferentes valores de .
-2463
-2463
-2463
-2464
-2464
-2465
-2465
-2466
-2466
0.40
-2465
-2464
0.50
0.60
0.40
-2466
0.50
0.60
0.40
0.50
0.60
direita: = 2.
o
transformaca
logartimica
ou
n
ao indicadas!
o s
transformaca
ao claramente NAO
120
Semi-variance
100
80
60
40
20
0
0
50
100
150
200
Distance
semivariograma emprico para dados transformados e variogramas
teoricos
com estimativas de MV para = 0.5 (linha interrompida),
= 1 (linha grossa), = 2 (linha fina).
2
log L
0.5 18.36 118.82 87.97 2.48 -2464.315
1 20.13 105.06 35.79 6.92 -2462.438
2 21.36 88.58 17.73 8.72 -2464.185
,
Maximum likelihood estimates ,
, and the corresponding va for different values of the Matern
lue of the likelihood function log L
parameter , for = 0.5
-2462.5
-2462.5
-2462.5
-2463.5
250
-2464.0
200
-2464.0
150
-2464.0
-2463.5
100
-2463.0
-2463.5
-2463.0
-2463.0
50
300
20
30
40
50
60
70
200
200
100
100
-100
0
100
100
200
300
200
400
500
300
-100
0
5000
100
10000
200
15000
300
o da percentagem da area
Predica
onde
Y (x) 200: A200 e de 0.4157
600
500
400
300
200
100
0
0.410
0.415
0.420
6. Outros topicos
e extens
oes
Maxima
verossimilhanca restrita (REML)
Verossimilhancas perfilhadas
o de modelos anisotropicos
Estimaca
o dos modelos
Validaca
Modelos n
ao estacionarios
calcula-se resduos Z = Y F .
(c) calcula-se
o
variograma
emprico
(dos resduos) que e utilizado para
o do modelo e estimaca
o de
formulaca
parametros
(d) reestima-se por GLS e usa-se modelo
o
ajustado para predica
Nota: krigagem universal ou krigagem
com tend
encia externa
variaca
n
ao estacionaria
diagnostico
(abordagem model-based)
ferramenta de inferencia (abordagem tradicional)
ambas abordagens anexam estimativas dos
parametros ao modelo como se fosse valores
verdadeiros.
o plug-in
Predica
usualmente produz boas estimativas pontuais de T = S(x)
o
em geral sub-estima variancia de predica
pode produzir estimativas inacuradas de
outras quantidades objetivo T
PARTE V:
INFERENCIA
BAYESIANA PARA O
MODELO GAUSSIANO
1. Infer
encia Bayesiana
2. Resultados para o modelo Gaussiano
3. Estudo de Caso: Dados da Suca
[T, |Y ]d
Z
2
N m ; V
The posterior is given by
[|Y ] N((V1 + F 0R1F )1(V1m + F 0R1y) ;
2 (V1 + F 0R1F )1)
2
N ; V
The predictive distribution is
Z
p(S |Y, 2, ) =
p(S |Y, , 2, ) p(|Y, 2, ) d.
with mean and variance given by
E[S |Y ] = (F0 r0V 1F )(V1 + F 0V 1F )1V1m +
h
i
0 1
0 1
1
0 1
1 0 1
r V + (F0 r V F )(V + F V F ) F V
Y
2
Var[S |Y ] = V0 r0V 1r+
i
0 1
1
0 1
0
0 1
1
(F0 r V F )(V + F V F ) (F0 r V F ) .
The predictive variance has three interpretable components: a priori variance, the reduction due to the data and the uncertainty in the
mean.
V corresponds to universal (or ordinary)
kriging.
21
2 np
(S ) 2 .
Algorithm 1:
(a) Discretise the distribution [|y], i.e. choose
a range of values for which is sensible for
the particular application, and assign a discrete uniform prior for on a set of values
spanning the chosen range.
(b) Compute the posterior probabilities on this
discrete support set, defining a discrete
posterior distribution with probability mass
function pr(|y),
say.
(c) Sample a value of from the discrete distribution pr(|y).
(d) Attach the sampled value of to the distribution [, 2|y, ] and sample from this distribution.
(e) Repeat steps (3) and (4) as many times as
required; the resulting sample of triplets
(, 2, ) is a sample from the joint posterior
distribution.
p(S , , 2, |Y ) d d 2 d
ZZZ
2
p s , , |y, d d 2 pr(|y) d
Z
=
Note:
(a) The algorithms are of the same kind to treat
and/or as unknown parameters.
(b) We specify a discrete prior distribution on a
multi-dimensional grid of values.
(c) This implies extra computational load (but
no new principles)
profile loglikelihood
563.5
562.5
profile loglikelihood
563.5
562.5
3. A Case Study:
data
60
80
120
15
20
25
0.00
Density
0.05
0.10
Density
0.000 0.005 0.010 0.015
0.15
200
400
2
600
800
20
40
60
80
100
10
10
20
30
15
40
20
50
25
60
70
30
80
35
50
100
150
200
200
400
2
600
800
250
200
Coords Y
100 150
50
0
50
Coords Y
100 150
200
250
294
437
100
150 200
Coords X
250
581
5297
10587
15876
100
150 200
Coords X
250
21165
50
150
50
50
300
350
50
300
350
50
Coords Y
100
150
200
250
0.1
0.5
0.9
100
150
200
Coords X
250
50
50
300
350
Coords Y
100
150
200
250
1
3
50
50
50
100
150
200
Coords X
250
300
350
0.015
0.000
0.005
density
0.010
Loc. 1
Loc. 2
Loc. 3
Loc. 4
100
200
300
rainfall
400
500
600
PARTE VI:
MODELOS LINEARES
GENERALIZADOS ESPACIAIS
0.0
0.3
0.6
Dados Positivos:
Dados Contagem:
Dados Binomial:
0.0
0.3
0.6
Examplos de Modelos
x1, . . . , xn posico es com observaco es
Poisson-log
[Y (xi) | S(xi)] e Poisson com densidade
f (z; ) = exp()z /z! z = 0, 1, 2, . . .
o: E[Y (xi) | S(xi)] = i = exp(S(xi))
ligaca
Binomial-logit
[Y (xi) | S(xi)] e binomial com densidade
r
(/r)z (1 /r)r z = 0, 1, . . . , r
f (z; ) =
z
o: i = E[Y (xi) | S(xi)] , S(xi) = log(i/(r
ligaca
i))
o de Verossimilhanca
Funca
Z
L() =
n
Y
IRn
2. Infer
encia para o modelo geoestatstico linear generalizado
o da verossimilhanca envolve
avaliaca
o numerica de multidimensional
integraca
metodos aproximados (ex Breslow and Clay
ton, 1993) tem acuracia
duvidosa
MCMC e possvel embora n
ao rotineira
Esquemas para MCMC
Ingredientes
Prioris para os parametros de regress
ao e
de covariancia
Dados: Y = (Y1, ..., Yn)
S = (S(x1), ..., S(xn))
S = todos outros S(x)
Estrutura de independencia condicional
S*
O modelo Poisson
Medidas basicas
s
ao contagens Yi em intervalos de tempo ti nas localizaco es xi (i =
1, ..., n)
estrutura dos dados sugere o modelo:
1000
0
10
-5000
-4000
-3000
-2000
-1000
-6000
-5000
-4000
-3000
-2000
-1000
10
15
-4000
-3000
-5000
-4000
-3000
-2000
-1000
1000
-6000
-5000
-2000
-1000
0.6
0.4
Survivor function
0.08
0.06
0.0
0.0
0.02
0.2
0.04
Density
0.10
0.8
0.12
1.0
0.14
o Bayesiana de funcionais n
Predica
ao lineao
res da superfcie de radiaca
10
20
30
40
Intensity level
50
60
10
15
20
Intensity level
O objetivo primario
e descrever a dependencia entre a prevalencia de parasitas
de malaria
e as covariaveis
medidas
em vilas
em indivduos
Particular interesse em saber se o ndice de
o derivado de medidas de satelite
vegetaca
pode ser utilizado como preditor da pre
valencia de malaria.
Covariaveis
das criancas
idade (dias)
sexo (F/M)
uso de mosquiteiro (nenhum, n
ao tratado e
tratado)
Covariaveis
das vilas:
o
localizaca
o (satelite)
indice de vegetaca
Modelo de regress
ao logstica
Yij = 0/1 presenca ou ausencia de parasitas
de malaria
na jth crianca da ith vila
fij = covariavel
da crianca
wi = covariavel
da vila
logit(P (Yij = 1|S())) = fij0 1 + wi02 + S(xi)
E razoavel
assumir infeco es condicionalmente
Analise exploratoria
ajuste modelo logstico padr
ao sem S(x) e/ou
U
calcule para cada vila:
Pni
Ni = j=1 Yij
Pni
i = j=1 Pij
Pni
2
i = j=1 Pij (1 Pij )
resduos de vila, ri = (Ni i)/i
derivar dados ri
semivariance
ajuste de par
ametros de covari
ancia
10
15
distance (km)
20
25
30
Analise model-based
= intercepto
1 = coeficiente para idade
2 = coeficiente uso de mosquiteiro
3 = coeficiente para mosquiteiro tratado
3 = coeficiente para indice de verde
4 = coeficiente para presenca de centro de
saude
1
2
3
4
5
2
2
2 proximo
de zero
Median
-1.696228
0.000676
-0.385772
-0.355632
0.020079
-0.322760
0.018630
0.740790
7.032258
0.830548
1600
-1.5
0.0
1.0
Kilometres
1500
Central
Eastern
1400
Western
300
400
500
600
Kilometres
0.8
0.4
0.0
0.2
Density
0.6
x = (452, 1493)
x = (520, 1497)
-4
-2
0
S(x)
solida
remota (452, 1493), linha interrompida
central (520, 1497)
2.0
3000
2500
1.0
Density
1.5
2000
1500
0
0.0
500
0.5
1000
Density
0.0004
0.0008
-1.0
-0.6
0.0
-0.5
beta_3
1.0
0.0
-1.0
0.5
Density
-1.0
-0.5
0.2
beta_2
1.5
beta_1
-0.2
0.0
o oo
o
o o o
o o
oo o
o
ooo oooo
o
ooo o o o o
o
oo
oo
o
o
o
o
o
o
o
o
o
o o
o
oo
o
oo
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o o
oo
o
o
o
ooo
o
o
oo
o
ooo
oo
o
o
o
o
o
o
o
oo
o
o
o
o
o
ooo
o
o o oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo o
o
o
o o
o
o
o
o
o
o
o
o
o
o
o
o
o ooo
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
ooo
o
o
o
o
o
o
oooo o o
o
o
ooo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
ooooo
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
ooo
o
o
o
o
o
oo o ooo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o oo o oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo o o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
ooo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o oooooo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
ooo
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo o
oo
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o o
o
o oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo ooo
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o ooo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
ooo
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
oo o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
ooo o o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
ooo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o o o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
ooooo o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo oo
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
oo
oo o
oo
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o o
o
o
o
oooo
o
o
o
o
o
o
o
o
o
o
oo
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
oo
o
oo
oo
o
o
o
o
o
o
o
o
oooooo
o
o
o
o
o
o
oooo
o
o
o
oo
o
o
o
o
o
o
oo
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
ooooo
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o oo o o
oooo
oo
o
o o
o
o
o
o
o
o
o
o
oo
o
o
oo
o
oo
o
o
o
o
o
o
o
ooo
ooo
o
o
o
o
o
o
o
o
o
o
o
o
o
ooooo
o
o
o o
oo o o
o ooo o
o
oo
oo
o oo
oo o
o oo o
o o
o
o
-1.0
beta_3
-0.6
-0.2
0.2
beta_2
1 = efeito de idade
2 = efeito de mosquiteiro n
ao tratado
3 = efeito adicional de tratamento de mosquiteiro
o
o
0
Residual
-2
oo
o
o
o
o
o
o
o
o
o
o o
o
o
o
o
o
o o
o
o
o
o
o
o
o
o
o
o
o o
-4
0.25
0.30
0.35
0.40
0.45
0.50
0.55
Fitted value
ri = rij / ni
checa adequacidade do modelo para pij
2.5
2.0
1.5
0.5
1.0
Variogram
10
20
30
40
50
60
Distance (km)
pij (1 pij )}
rij = (Yij pij )/ {
ri =
rij / ni
i)
logit(pij ) =
+ zij0 S(x
checa adequacidade do modelo para S(x)
geostatistico
mesmo
ne-
O modelo
cessario?
o
o
o
1
o
o
o oo
-1
E[U|data]
oo
o oo
o
o
o
-2
o
o
o
o
o
o
oo oo
o ooo
o
o
o
o
oo
oooo oo ooo
o
oo o o
o
o
o
o
-2
-1
E[S(x)|data]