Você está na página 1de 108

1

Estudos Ecolgicos
Anlise de dados
temporais e espaciais
Fev/2000
Marilia S Carvalho - DEMQS
Oswaldo G. Cruz - PROCC
Estrutura do curso Estrutura do curso
Semana 2 3 4 5 6
M
1
T
Estudos
Ecolgicos
S-Plus
Sries
Temporais -
Anlise
Exploratria
Modelagem
ARIMA
Modelos
Hierrquicos
M
Discusso
dos trabalhos
2
T
Padro de
Pontos
Geo-
estatstica
reas
Tempo-
Espao
*
Modelos
Bayesianos
l Aulas tericas
l Aulas prticas usando S-Plus (em micros e estaes RISC)
l Aulas demonstrativas: SIG/pacote estatsticoWinBugs
2
Estudos Ecolgicos - conceitos
l Um estudo ecolgico ou agregado focaliza a
comparao de grupos, ao invs de indivduos. A
razo subjacente para este foco que dados a
nvel individual da distribuio conjunta de duas
(ou talvez todas) variveis esto faltando
internamente nos grupos; neste sentido um estudo
ecolgico um desenho incompleto.
(Morgenstern, cap. Ecologic Studies - in Rothmans, Modern
Epidemiology, 2 Ed., 1998)
Estudos Ecolgicos - conceitos
l ... estudar sade no contexto ambiental. O
objetivo ambicioso: entender como o contexto
afeta a sade de pessoas e grupo atravs de
seleo, distribuio, interao, adaptao, e
outras respostas. Medidas de atributos do
indivduo no podem dar conta destes processos
[...] Sem medir estes contextos, nem padro de
mortalidade e morbidade, nem o espalhamento
epidmico, nem a transmisso sexual podem ser
explicados
(Susser, Am.J.Public Health, 1994;84:825-835)
3
Estudos Ecolgicos - conceitos
l Textos de Epidemiologia fazem uma avaliao
consistente sobre estudos ecolgicos: eles so tentativas
cruas de estimar correlaes em nvel individual. [...]
Examinar esta questo de uma perspectiva diferente -
como um problema geral de validade - mostrar que a
falcia ecolgica, conforme freqentemente usada,
encoraja trs noes interrelacionadas e falaciosas: (1)
que modelos em nvel individual so mais perfeitamente
especificados que os de nvel ecolgico, (2)que
correlaes ecolgicas so sempre substitutos para
correlaes de nvel individual, e (3) que variveis de
nvel de grupo no causam doena.
(Schwartz, Am.J.Public Health, 1994;84:819-824)
Estudos Ecolgicos - conceitos
l A Epidemiologia freqentemente definida em
termos do estudo da determinao da distribuio da
doena; mas no se deve esquecer que quanto mais
espalhada uma causa particular, menos ela contribui
para explicar a distribuio da doena.
l ...dois tipo de perguntas etiolgicas. A primeira
busca as causas dos casos, e a segunda as causas da
incidncia.
(Rose, G. Int.J.Epidemiol., 1985;14:32-38)
4
Estudos Ecolgicos - conceitos
l Aplicada etiologia, a viso centralizada no indivduo
leva ao uso do risco-relativo como a representao
bsica da fora etiolgica: ou seja, o risco em
indivduos expostos realtivo aos no-expostos. [...] Esta
pode ser geralmente a melhor medida de fora
etiolgica, mas no medida de [...] importncia em
sade pblica. (Rose, G. Int.J.Epidemiol., 1985;14:32-38)
Estudos Ecolgicos - conceitos
l rara a doena cuja taxa de incidncia no tenha
variado largamente, seja ao longo do tempo ou entre
populaes [...] Isto significa que as causas da
incidncia, desconhecidas que sejam, no so
inevitveis. [...] Mas identificar o agente causal pelos
mtodos tradicionais de caso-controle e coorte no ter
sucesso se no houver sufucientes diferenas na
exposio dentro da populao [...] Nestas
circunstncias tudo os que os mtodos tradicionais
fazem encontrr marcadores de susceptibilidade
individual. A chave deve ser buscada nas diferenas
entre populaes ou em mudanas nas populaes ao
longo do tempo. (Rose, G. Int.J.Epidemiol., 1985;14:32-38)
5
Estudos Ecolgicos - conceitos
l ... torna-se aparente que muitas das explicaes
convencionais dos determinantes da sade - porque
algumas pessoas so saudveis e outras no - so, na
melhor das hipteses seriamente incompletas, se no
simplesmente erradas. assim, infelizmente, porque as
sociedades modernas dedicam uma parte muito grande de
sua riqueza, esforo e ateno tentando manter ou
melhorar a sade dos indivduos que compem suaa
populaes. Estes esforos macios so primeiramente
canalizados para os sistemas de assistncia sade,
presumivelmente refletindo uma crena que receber uma
boa assistncia o mais importante determinante de
sade. (Evans,R.G.Why are some people healthy and others not)
As rvores
ou
a floresta?
6
As rvores
l Ao fazermos uma
regresso obtemos
uma correlao de
apenas 0,1469 entre
as duas variveis.
0 100 200 300 400
2
4
6
8
1
0
ex
t
t
0 100 200 300 400
2
4
6
8
1
0
ex
t
t
l Suponha os dados
abaixo, onde a
varivel X
representa um efeito
de exposio e a
varivel Y um taxa.
Os Bosques
l Ao estratificarmos os
dados evidencia-se
uma estrutura
0 100 200 300 400
2
4
6
8
1
0
ex
t
t
l Ao fazer uma
regresso em cada
grupo obtm-se
0 100 200 300 400
2
4
6
8
1
0
ex
t
t
l Vermelho r = -0,6760
l Amarelo r = -0,7469
l Verde r = - 0,6503
l Azul r = -0,5487
7
As Florestas
l O coeficiente de
correlao obtido e
r = 0,9938
0 100 200 300 400
2
4
6
8
1
0
ex
t
t
l Quatro pontos sob
os quais faremos
uma regresso
l Tirando-se a mdia
para cada grupo
iremos obter
0 100 200 300 400
2
4
6
8
1
0
ex
t
t
0 100 200 300 400
2
4
6
8
1
0
ex
t
t
Medidas - conceitos
l Medidas agregadas - sumrios de distribuio de observaes
colhidas a nvel individual, usualmente propores, mdias, ou
percentis da distribuio. (Ex: renda mdia do chefe da famlia; %
de chefes com renda abaixo de um salrio mnimo; mediana etria
de homens; idade onde 95% das crianas entram na escola)
l Medidas ambientais - caractersticas fsicas do meio onde vivem
ou trabalham os indivduos. Observar que para cada medida
ambiental existe um anlogo no nvel individual (medidas de
exposio ou dose) que varia entre os indivduos do grupo (Ex:
poluio do ar, intensidade de UV)
l Medidas globais - no existe anlogo individual (densidade
populacional; existncia de leis, acesso ao servio de sade, etc.)
8
Problemas prticos
l Numerador:
m subregistro
m duplicidade de registros
m georreferenciamento:
l no localizao
l informao incorreta
l preenchimento inadequado
m mudana na classificao ao longo do tempo
l Denominador:
m espaamento do censo
m migrao
m mudana de fronteiras (!!!!)
Problemas prticos
l Exposio:
m pode ocorrer em diversos lugares
m dificilmente mensurvel com preciso
m uso de proxy
m diferentes reas para medida de exposio e de efeito, e reas
no compatveis
m Informaes mais detalhadas (PNAD, amostra do censo) no
extrapolveis para populaes pequenas
l Anlise:
m migrao
m multicolinearidade
Fonte: Walter, S.D.Ecological Studies - discussion. In Int. Conf. on the
Analysis and Interpretation of Disease Clusters and Ecological Studies,
Londres, 16-17 de dezembro, 1999.
9
Sries Temporais
Anlise exploratria
O que
l Conjunto de observaes ordenadas no tempo
l Classificao:
mdiscretas:
l a unidade de tempo discreta, usualmente intervalos iguais
(dia, semanas epidemiolgicas); o ms no tem o mesmo
tamanho)
l Ex. mortalidade, notificaes
mcontnuas:
l a informao obtida por amostragem (discretizando em
intervalos iguais) ou acumulada por perodo
l Ex. temperatura, pluviosidade, partculas em suspenso.
10
Processo estocstico
l Um processo estocstico pode ser pensado de duas
formas:
m um conjunto de possveis trajetrias que poderiam ser
observadas;
m um conjunto de variveis aleatrias uma para cada tempo t
l Cada valor observado de uma trajetria um dos
possveis valores que poderiam ter sido observados, de
acordo com a distribuio de probabilidades da
respectiva varivel aleatria.
l Srie temporal o conjunto de observaes disponveis
para anlise - uma parte de uma trajetria entra muitas
que poderiam ter sido observadas
Exemplo
0 10 20 30 40 50
1
0
2
0
3
0
4
0
5
0
6
0
l Srie com a
mesma
estrutura:
cada srie
uma possvel
realizao do
mesmo
processo.
Trajetria ou srie temporal ou funo amostral
11
Notao e nomenclatura
l Utilizando o exemplo bitos por causa por local:
m Z(t) - bitos no instante t
0
50
100
150
200
250
300
350
400
1 13 25 37 49 61 73 85 97 109 121 133 145 157 169 181 193
t
Z
(t)
l Processo estocstico:
o conjunto de todas
as possveis
realizaes;
l Z
(n)
(t)-cada trajetria
l Z
(1)
(6)= 87
l Z
(2)
(6)= 52
l valor da medida de
cada srie no
instante t=6
A srie pode ser:
multidimensional (Ex. homicdios UFs do Sudeste)
multivariada (Ex. homicdios e acidentes)
Objetivos: anlise de sries temporais
Objetivo Exemplo
Descrio: verificar existncia de
tendncia, sazonalidade, ciclos.
Histogramas, boxplots, so ferramentas
da anlise exploratria descritiva
Identificar tendncia da AIDS;
sazonalidade da dengue visando
estabelecer melhor perodo de
interveno.
Estabelecimento de causalidade: estudo
da relao de causa-efeito
Vacina X sarampo; Mortalidade
por DIC X melhor assistncia
Classificao: identificao de padres A srie de leishmaniose
tegumentar igual visceral?
Controle: sistemas dinmicos,
caracterizados por uma entrada X(t),
uma srie de sada Z(t) e uma funo de
transferncia v(t)
Modelar a resposta a medidas
de controle de epidemia
12
Independncia
l Os mtodos usuais de anlise de dados tm como
pressuposto bsico a independncia dos eventos (casos).
Ou seja, a ocorrncia de um caso de doena em uma
dada pessoa independente da ocorrncia em outra
pessoa.
l Na anlise da incidncia de doenas (ou qq outro
indicador ecolgico) ao longo do tempo isso no
verdade: a incidncia em um determinado dia/ms ou
ano em geral correlacionada com a ocorrncia no
dia/ms/ano anterior.
l Esta correlao expressa em uma funo denominada
funo de autocorrelao.
Dependncia
l Classifica-se a dependncia quanto :
mSem dependncia serial: srie puramente aleatria ou
rudo branco
mMemria longa: a dependncia desaparece lentamente
(os valores de pontos no passado influenciam
momentos muito adiante no tempo - ex, doenas com
grande latncia)
mMemria curta: dependncia desaparece rapidamente
(doenas de alta infecciosidade e explosivas -
gripe, por ex.)
13
Funo de autocorrelao
l Para cada intervalo de tempo fixo j,
pode-se calcular a correlao amostral
entre os valores de Z
t
e Z
(t+j)
l Para cada intervalo de tempo fixo j,
pode-se calcular a correlao amostral
entre os valores de Z
t
e Z
(t+j).
O grfico
destes valores para cada j denomina-se
correlograma.
l O correlograma uma das principais
ferramentas de anlise exploratria e
modelagem das sries temporais, pois
indica em que medida cada valor em um
dado instante de tempo t se relaciona
com os valores em t+1, t+2,... t+j

N
t
t
N
t
j t t
j
Z Z
Z Z Z Z
r
1
2
1
1
) (
) )( (
1
A
u
t
o
c
o
r
r
e
l
a

o
Intervalos de tempo
Tratamento dos dados
l Intervalo amostral - somente se detecta fenmenos cuja
periodicidade maior que o intervalo amostral
(sazonalidade com dados anuais no detectvel)
l Estacionariedade:
m 1 ordem - mdia constante ao longo de todo o perodo
m 2 ordem - varincia constante ao longo de todo o perodo
l Transformaes - visam estabilizar a srie
m diferenas sucessivas
m estabilizar varincia (log)
l observaes perdidas ou irregulares - interpolao, etc.
l outliers - excluso, tratamento
l registros curtos - CUIDADO!
) 1 ( ) ( ) ( t Z t Z t Z
1
log log log


t t t
Z Z Z
14
Componentes
l A srie pode ser descrita como
sendo a soma dos componentes:
tendncia, sazonalidade, ciclicidade
e termo aleatrio.
N ..., 1,2, t , + + +
t t t t t
a C S T Z
) log( ) log( ) log( ) log(

t t t t
t t t t
a S T Z
a S T Z
+ +

Removendo as componentes T e S, supe-se que sobra?
Rudo branco;
cada a
t
determinado pelo a
(t-1)
- modelo AR
a varincia de a
t
determinada por a
(t-1)
- modelo MA
l Se a sazonalidade varia em conjunto
com a tendncia (aumenta de
amplitude quando aumenta a
tendncia), o modelo melhor
multiplicativo, que pode ser
transformado em aditivo usando log.
Tendncia e sazonalidade
l Estimar a tendncia ou a sazonalidade:
m ajustar polinmio, exponencial ou reta (paramtrico);
m suavizar (filtros - no paramtricos);
m diferenciar.
l Diferenas:
m pode-se diferenciar tantas vezes quanto necessrio at
estabilizar (no + que duas diferenas)
m para sazonalidade usa-se diferenciar com perodo igual ao da
sazonalidade
m no permite previso da tendncia ou sazonalidade, as retira
de sazonalida da perodo o s , ) ( ) ( ) ( s t Z t Z t Z
15
Alisamentos
l Mdias mveis:
m o tamanho da janela emprico
m perde-se k observaes
m para estudar sazonalidade usa-de janela de ordem s (o perodo
da sazonalidade)
m se k = N/2, ento a previso ser igual a mdia aritmtica dos
valores observados, o que o valor esperado para sries
inteiramente aleatrias
m no pode ser usado para previso se a srie no estacionria
k Z
k
Z
k
k j
j t t
2 ordem ,
1 2
1
*


+
+

Sries Temporais
Modelo Box & Jenkins
(ARIMA)
16
O que
l Mtodo de modelagem de sries temporais tratando
simultaneamente tendncia, sazonalidade, ciclicidade e
estrutura de dependncia serial.
l A dependncia serial influncia que um dado evento
no tempo recebe de pontos anteriores.
l O processo de modelagem feito em um ciclo iterativo
de 3 estgios (repetido at ...):
m identificao - anlise exploratria, baseada em grficos (dos
dados brutos, autocorrelao, autocorrelao parcial),
buscando identificar o tipo de modelo + adequado
m estimao - estimativa de termos e parmetros e seleo do
melhor modelo
m diagnstico - critrios de ajuste, parcimnia
Alguns processos estocsticos
l Processo aleatrio:
m seqncia de variveis aleatrias (a
t
)que so mutuamente
independentes e identicamente distribudas. Possui mdia e
varincia constantes e os coeficientes de correlao so iguais
a:
l Passeio aleatrio (random walk):
m Denomina-se passeio aleatrio quando a varivel aleatria Z
t

igual Z
t-1
mais um erro aleatrio
m quando logo,

'

t t

,... 2 , 1 se , 0
0 se , 1
k
k
k

logo
t
estacionrio
t t t
a Z Z +
1
1 1
0 a Z t

t
i
i t
a Z
1
17
Modelo AutoRegressivo - AR(p)
l Supondo que a varivel aleatria Z
t
linearmente
correlacionada com seus prprios valores defasados,
este um modelo autoregressivo geral de ordem p
, t = 1,2,..,p
l O objetivo estimar:
m a constante C - mdia do processo ou intercepto
m a ordem p do modelo - at onde vai a dependncia
m os parmetros de cada termo - peso de cada ponto passado
na determinao do ponto i
l Para estimar os parmetros de um AR a
estacionariedade de 1 e 2 ordens fundamental!!!
t p t p t t t
a Z Z Z C Z + + + + +

...
2 2 1 1
Funo de Autocorrelao - ACF
lPara cada intervalo de tempo
fixo k, pode-se calcular a
correlao amostral entre os
valores de Z
t
e Z
(t+k)
lPara cada intervalo de tempo
fixo k, pode-se calcular a
correlao amostral entre os
valores de Z
t
e Z
(t+k).
O grfico
destes valores para cada k
denomina-se correlograma.

N
t
t
N
t
k t t
k
Z Z
Z Z Z Z
r
1
2
1
1
) (
) )( (
18
Autocorrelao Parcial - PACF
l A correlao medida diretamente em t-1, t-2 at t-p a
funo de autocorrelao.
l Outra funo que pode ser calculada a funo de
autocorrelao parcial, onde o clculo da autocorrelao
entre os pontos feito excluindo o efeito dos pontos
intermedirios.
l No lag = 1, a ACF e a PACF so iguais.
l Na PACF somente existe correlao at o lag igual a
ordem do modelo - modelo de ordem 3 somente
apresenta valores de PACF at o 3 lag.
Condies de estacionariedade
l Uma srie estacionria quando suas propriedade no
variam ao longo do tempo. Em um processo AR, a
estacionariedade se reflete na estimao dos parmetros:
m AR de ordem 1:
m AR de ordem 2:
1
1
<
1
1
1
1 2
1 2
2
<
< +
<

19
Exemplos
l AR de ordem 1, com
1
= 0,8
Lag
A
C
F
0 5 10 15 20
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Series : ar1
Lag
P
a
r
tia
l
A
C
F
5 10 15 20
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
Series : ar1
Modelo de Mdias Mveis - MA(q)
l Independente do processo autoregressivo, cada elemento
da srie pode tambm ser afetado pelo erro passado -
processo Mdias Mveis
l Neste caso, o valor de Z correlaciona-se aos valores do
componente aleatrio de pontos anteriores (usa-se a
denominao choque aleatrio).
l Cada observao a soma de um componente aleatrio
a e uma combinao dos componentes aleatrios
anteriores.
t q t p t t t
a a a a C Z +

...
2 2 1 1
Por conveno os
termos em a so
escritos com sinais
negativos
20
l Atravs de substituies sucessivas pode-se
transformar um AR de ordem p em um MA de ordem
infinita: MA()
l Substituindo (2) em (1) e depois (3) em (1) e assim
sucessivamente, teremos:
l MA()
Invertibilidade
M
(3)
(2)
(1)
2 3 1 2
1 2 1 1
1 1

+
+
+
t t t
t t t
t t t
a Z Z
a Z Z
a Z Z

...
2
2
2 1 1
+ + +
t t t t
a a a Z
Condies de invertibilidade
l No modelo MA no h restrio sobre os
q
para que o
processo seja estacionrio, mas necessrio garantir a
invertibilidade.
l Existe uma dualidade entre processos de mdias mveis
e autoregressivo, onde a equao de MA pode ser
reescrita na forma AR (de ordem infinita). Para isso
algumas condies devem ser satisfeitas:
l MA(1) MA(2)
1
1
1
1 2
1 2
2
<
< +
<

1
1
<
21
Exemplo MA
l MA de ordem 1, = 0,8
Lag
A
C
F
0 5 10 15 20 25
-
0
.
4
-
0
.
2
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Series : ma1
Lag
P
a
r
tia
l
A
C
F
0 5 10 15 20 25
-
0
.
4
-
0
.
3
-
0
.
2
-
0
.
1
0
.
0
0
.
1
Series : ma1
Modelo ARMA(p,q)
l A importncia de um modelo ARMA est no fato de eu
uma srie estacionria pode ser descrito por um modelo
ARMA que envolve menos parmetros que um MA ou
AR puro.
l Cada observao definida por combinao linear de
observaes anteriores e combinao de componentes
aleatrios anteriores.
l Neste modelo misto, as duas condies -
estacionariedade e invertibilidade - so necessrias
q t p t t t p t p t t t
a a a a Z Z Z Z

+ + + + ... ...
2 2 1 1 2 2 1 1
22
Exemplo
l ARMA(1,1), parmetros: = 0,8 = 0,4
Lag
A
C
F
0 5 10 15 20
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Series : xxx
Lag
P
a
r
tia
l
A
C
F
5 10 15 20
-
0
.
1
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
Series : xxx
Modelo ARIMA(p,d,q)
l Para srie no estacionria necessrio utilizar o modelo
ARIMA - AutoRegressive Integrated Moving Average.
l Neste modelo se utiliza o mtodo de diferenas para obter
a estacionariedade da srie:
l O modelo ento passa a ser:
1
) 1 (


t t t t t
Z Z Z B Z W
t t
d
t t
q t q t t p t p t t
a B Z B B
a B W B
a a a W W W
) ( ) 1 )( (
) ( ) (
... ...
1 1 1 1



+ + +

operador de
deslocamento
(backshift)
23
Exemplo
l Srie no estacionria antes e aps diferenciao - d(1)
0 100 200 300 400 500
4
0
6
0
8
0
1
0
0
0 100 200 300 400 500
-
2
0
2
Exemplo
l ACF antes e aps diferenciao
Lag
A
C
F
0 5 10 15 20 25
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Series : yyy
Lag
A
C
F
0 5 10 15 20 25
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Series : diff(yyy)
24
Modelos sazonais - SARIMA
l Em epidemiologia comum haver sazonalidade. O seja,
considerando medidas mensais, pode-se esperar que a
srie dependa tambm dos termos Z
t-12
e talvez Z
t-24
:
SARIMA(p,d,q)x(P,D,Q).
t
s
t
d D
s
s
a B B C Z B B ) ( ) ( ) ( ) ( +
AR(p)
backshift
AR(P) - sazonal
backshift sazonal
diferenciao sazonal
diferenciao tendncia
Z
t
Mdia do processo
MA(q)
backshift
MA(Q) - sazonal
backshift sazonal
erro aleatrio
=
Processo de Modelagem
Identificao
Diagnstico
Modelagem
Satisfatrio?
No
Sim
Fim
Aps remover tendncia (se houver),
utiliza-se ACF e PACF para identificar
a possvel ordem do modelo.
A estimativa dos parmetros feita
por mxima verossimilhana
O diagnstico feito atravs dos
grficos de resduos, ACF dos
resduos, e outros indicadores de ajuste
O indicador de ajuste mais usado
o AIC (Akaike Information
Criteria) que colabora na
escolha do melhor modelo
25
Exemplo 1 - tendncia
l Tendncia - identificao e remoo
0 100 200 300 400 500
-
1
0
0
-
6
0
-
2
0
0 100 200 300 400 500
-
4
-
2
0
2
4
Lag
A
C
F
0 5 10 15 20 25
0
.
0
0
.
4
0
.
8
Series : ex
Lag
A
C
F
0 5 10 15 20 25
0
.
0
0
.
4
0
.
8
Series : diff(ex)
Exemplo 1 - identificao
l Identificao da ordem do modelo
Lag
A
C
F
0 5 10 15 20 25
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Series : diff(ex)
Lag
P
a
r
t
i
a
l

A
C
F
0 5 10 15 20 25
-
0
.
2
0
.
0
0
.
2
0
.
4
0
.
6
Series : diff(ex)
26
Exemplo 1 - modelagem 1
l Modelo de ARIMA(2,1,0) - (mxima verossimilhana)
0 100 200 300 400 500
-
3
-
1
0
1
2
3
Lag
A
C
F
0 5 10 15 20 25
0
.
0
0
.
4
0
.
8
ACF dos resduos
Srie dos resduos

1
= 0,87

2
= -0,20
AIC =
1410.81
loglike =
1406.81
Exemplo 1 - modelagem 2
l Modelo de ARIMA(1,1,1)

1
= 0,61

2
= -0.25
AIC =
1415.00
loglike =
1411.00
0 100 200 300 400 500
-
3
-
1
1
2
3
Lag
A
C
F
0 5 10 15 20 25
0
.
0
0
.
4
0
.
8
ACF dos resduos
Srie dos resduos

1
= 0,55

2
= -0.3
27
Exemplo 2 - tendncia
l Tendncia
0 100 200 300 400 500
-
2
0
0
2
0
4
0
0 100 200 300 400 500
-
4
-
2
0
2
4
Lag
A
C
F
0 5 10 15 20 25
0
.
0
0
.
4
0
.
8
Series : exma
Lag
A
C
F
0 5 10 15 20 25
0
.
0
0
.
4
0
.
8
Series : diff(exma)
Exemplo 2 - identificao
l Identificao da ordem do modelo
Lag
A
C
F
0 5 10 15 20 25
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Series : diff(exma)
Lag
P
a
r
tia
l
A
C
F
0 5 10 15 20 25
-
0
.
2
0
.
0
0
.
2
0
.
4
0
.
6
Series : diff(exma)
28
Exemplo 2 - modelagem
l Modelo de ARIMA(0,1,1)

1
= -0.80
AIC =
1419.63
loglike =
1417.63
0 100 200 300 400 500
-
3
-
1
0
1
2
3
Lag
A
C
F
0 5 10 15 20 25
0
.
0
0
.
4
0
.
8
ACF dos resduos
Srie dos resduos
Exemplo 2 - modelagem 2
l Modelo de ARIMA(1,1,1)

1
= 0,25

2
= -0.70
AIC =
1391.80
loglike =
1387.80
0 100 200 300 400 500
-
3
-
1
0
1
2
Lag
A
C
F
0 5 10 15 20 25
0
.
0
0
.
4
0
.
8
ACF dos resduos
Srie dos resduos

1
= 0,3

2
= -0.6
29
Exemplo 3 - tendncia
l Tendncia
0 100 200 300 400
1
0
0
0
2
0
0
0
3
0
0
0
4
0
0
0
Lag
A
C
F
0 5 10 15 20 25
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Series : exsa4
Exemplo 3 - diferenciando
l Removendo tendncia - diff=1
0 100 200 300 400
-
2
0
-
1
0
0
1
0
2
0
3
0
Lag
A
C
F
0 5 10 15 20 25
-
0
.
5
0
.
0
0
.
5
1
.
0
Series : diff(exsa4)
30
Exemplo 3 - identificao
l Identificao da ordem do modelo - dupla diferenciao ( 1 e 12)
0 100 200 300 400
-
6
0
4
0 5 10 15 20 25
0
.
0
0
.
6
Series : diff(diff(exsa4), 12)
Lag
0 5 10 15 20 25
-
0
.
2
0
.
4
Series : diff(diff(exsa4), 12)
Exemplo 3 - modelagem
l Modelo de ARIMA(1,1,0)*(1,1,0)
12

1
= 0,8

2
= 0
= 0,4
= 0

1
= 0,80

1
= 0,32

12
AIC =
1299,492
loglike =
1295,492
Plot of Standardized Residuals
0 100 200 300 400
-
3
-
1
1
2
3
ACF Plot of Residuals
A
C
F
0 5 10 15 20 25
0
.0
0
.4
0
.8

P-value for Goodness of Fit Statistic


Lag
p
-
v
a
lu
e
2 4 6 8 10
0
.0
0
.2
0
.4
0
.6
ARIMA Model Diagnostics: exsa4
31
Modelo de regresso em ST
l Modelo usual de regresso:
l Em sries temporais, pode-se us-los, porm com as
seguintes caractersticas:
m relao entre X e Y apresenta defasagem temporal;
m entre X e Y existe feedback
m o processo X ARIMA, e cada ponto NO pode ser tomado
com independente dos anteriores
m o processo de X e de Y so correlacionados apenas porque
apresentam estrutura temporal semelhante, sem valor
explicativo
l Como modelar?
t t t
N X C Y + +
0

Correlao cruzada
t t t
N X B C Y + + ) (
0

l Ou seja, modela-se a srie Y usando os pontos


anteriores de X, exatamente como na
modelagem anterior
l Analisar:
mo atraso
mfeedback
mcorrelao dos resduos, removida a estrutura
temporal
32
Outras aplicaes
l Anlise de interveno - vrios tipos de interveno
existem e pode-se modelar utilizando o ARIMA:
m pulso - um evento que aparece e desaparece instantaneamente
l o impacto na violncia de operao policial em uma favela
l uma catstrofe natural e as conseqncias nas sade
m degrau - um evento que sobe repentinamente e se mantm alto
durante um tempo
l o aumento na cobertura vacinal atravs de campanhas e seu
impacto na incidncia da doena
l Predio (forecast) - muito usado em econometria. O
intervalo de confiana aumenta rapidamente!
l Deteco de outliers - til na deteco epidmica
Vantagens e desvantagens
VANTAGENS
l Conceitualmente slido
l O mtodo de estimativa dos
parmetros permite calcular
o erro associado e
estabelecer intervalos de
confiana
l Permite estabelecer
relaes causais
considerando o tempo
DESVANTAGENS
l Modelar requer MUITA
experincia
l A previso em
epidemiologia no teve sua
utilidade demonstrada
l A escala usual dos SIS
mistura processo temporais
diferentes -
ESPAO/TEMPO!
33
Anlise de Dados Espaciais em Sade Anlise de Dados Espaciais em Sade
Conceitos Gerais Conceitos Gerais
H muitos e muitos anos atrs... H muitos e muitos anos atrs...
Snow, J ohn.
Localizao dos
casos de clera e
bombas dgua.
Londres, 1854
Fonte: Gilbert, E.W. Geographical Journal, 124:172:183
34
O que anlise espacial
l Anlise espacial: estudo quantitativo de fenmenos que so
localizados no espao.
l Anlise de dados espaciais: em oposio a anlise de dados em geral,
focaliza-se as tcnicas onde de considera explicitamente a
localizao espacial.
l Defini-se anlise estatstica espacial quando os dados so
espacialmente localizados e se considera explicitamente a possvel
importncia de seu arranjo espacial na anlise ou interpretao dos
resultados (Bailey & Gatrell, 1995).
l Neste curso sero abordadas basicamente as tcnicas estatsticas de
anlise espacial.
l Diversas operaes realizadas em um SIG so tambm chamadas
anlise espacial, mas no so objeto deste curso.
Quando usar
l quando o evento em estudo gerado por fatores
ambientais de difcil deteco a nvel do indivduo;
l na delimitao de reas homogneas segundo interveno
pretendida;
l quando o evento em estudo e os fatores relacionados tm
distribuio espacialmente condicionada;
l no estudo de trajetrias entre localidades.
OBS: O conjunto de tcnicas de otimizao, anlise de redes, rotas no
sero abordados neste curso
35
Dependncia espacial
l Quais as possveis implicaes de no considerar a localizao
espacial na modelagem?
l Independncia um pressuposto muito conveniente que faz grande
parte da teoria estatstica matemtica tratvel. Entretanto, modelos
que envolvem dependncia estatstica so freqentemente mais
realsticos. Duas classes de modelos que tem sido comumente usados
envolvem estruturas de correlao intraclasse e estruturas de
correlao serial. Estes oferecem pouca aplicabilidade a dados
espaciais, onde a dependncia est presente em todas as direes e
fica mais fraca a medida em que aumenta a disperso na localizao
dos dados. (Cressie,1991)
l O que aconteceria ao se estimar a associao entre duas variveis em
um estudo ecolgico ao no se considerar, por exemplo, a tendncia
espacial que ambas apresentassem????
l Sensibilidade, especificidade e preciso
l Proporo entre medidas em mapa e medidas reais
Desenho do estudo
escala
Resoluo
capacidade de distinguir pontos
adjacentes
Homogeneidade
caracterstica da distribuio
estatstica

Estabilidade presena de flutuao aleatria

Dado disponibilidade

36
Aplicaes - uma reviso recente
l Mapeamento de doenas: descrio do processo espacial
de distribuio das doenas, visando vigilncia, predio
de epidemias, etc.
l Estudos ecolgicos: estudar a relao entre incidncia de
doenas e potenciais fatores etiolgicos, seja no campo
da anlise exploratria visando definir hipteses
(formulao clssica), ou apontar medidas preventivas.
l Cluster: identificao de focos de doena ou avaliao de
aumento de risco ao redor de fonte suspeita de risco
ambiental.
l Avaliao e monitoramento ambiental: estimativa e
monitoramento da distribuio espacial de fatores
ambientais relevantes para a sade.
Tipos de dados
l Dados de casos (eventos) - processos pontuais:
usualmente se dispe da localizao pontual
(coordenadas) da residncia de casos de doena ou de
controles da populao de risco. Covariveis do
indivduo podem ser medidas.
l Dados de amostras pontuais - geoestatstica: medidas,
em geral de natureza ambiental, tomadas em locais
amostrados.
l reas - pode-se subdividir em dois sub-grupos:
m reas irregulares - em geral contagens de casos ou populaes em divises
administrativas, indicadores socioeconmicos
m reas regulares - medidas em grade regular, como nas imagens de satlite
37
Tipos de dados
l Trs tipos bsicos de dados:
m pontos
m espao contnuo
m reas.
l Eventualmente misturas de diferentes tipos esto
presentes em um mesmo estudo.
l Alguns mtodos somente so aplicveis a um tipo de
dado, outros a mais de um.
l Em algumas situaes pode-se converter o dado de uma
para outro tipo
Mapeamento de doenas
l O objetivo geral avaliar a variao geogrfica na
ocorrncia das doenas visando identificar diferenciais de
risco, orientar a alocao de recursos, levantar hipteses
etiolgicas.
l Os mtodos tem como objetivo produzir um mapa limpo,
sem o rudo gerado pela flutuao aleatria dos pequenos
nmeros, e controlando as diferenas na estrutura
demogrfica.
l So usualmente aplicados aos dados resultantes de
contagens de casos em reas administrativas - taxas.
l Tambm so aplicados a dados pontuais, usualmente
trabalhados sob forma de superfcies de risco, ou de risco
relativo.
38
Estudos ecolgicos
l Essencialmente modelos de regresso, onde se busca
explicar a variao na incidncia da doena atravs de
outras variveis.
l O modelo se complica pela necessidade de controlar
simultaneamente o processo espacial.
l Classicamente aplica-se a dados agregados em reas.
l Pode-se entretanto considerar tambm dados pontuais e
misturas de diferentes tipos de dados.
Cluster
l Cluster: qualquer agregado de eventos.
l Cluster em estatstica multivariada um resultado de
classificao onde se busca definir um grupamento de
semelhantes.
l Cluster espacial um agregado de eventos no espao ou
a ocorrncia de taxas semelhantes em rea prximas.
l O objetivo da deteco de cluster espacial estabelecer
a significncia de um sobre-risco em um determinado
espao ou tempo e espao.
39
Cluster (2)
l Estes cluster podem ser causados por diferentes fatores:
agentes infecciosos, contaminao ambiental localizada,
efeitos colaterais de tratamentos, etc.
l Os estudos podem estar dirigidos a buscar evidncia de
tendncia geral clusterizao, ou a um determinado e
predefinido agregado.
l Podem ser usados para pontos ou reas.
l indispensvel controlar para fatores como a
distribuio populacional e outras covariveis que
podem criar agregados.
Monitoramento ambiental
l Acompanhamento de potenciais fontes ambientais de
problemas de sade: poluentes qumicos, insolao
(Raios UV), vegetao, clima, etc.
l Os modelos estatsticos tem por objetivos fazer a
predio espacial ou espao-temporal. Estes processos
em geral tem forte correlao espacial e temporal
l O interesse pode estar voltado para predio de valores
extremos.
l A quantidade e disponibilidade de dados nesta rea vem
crescendo, com nfase particular para as imagens de
satlite, com resoluo e acessibilidade cada vez maior.
40
Anlise espacial - anlise exploratria
l descrio dos dados de forma a
contribuir para o desenvolvimento de
hipteses e modelos;
l caracterizam-se por poucos
pressupostos a priori e so resistentes a
valores aberrantes (tcnicas robustas);
l envolvem, alm da visualizao,
alguma manipulao dos dados, sendo
difcil estabelecer a fronteira entre
visualizao, anlise exploratria e
modelagem.
L-O
N

-
S
684000 686000 688000
7
.
4
7
4
*
1
0
^
6
7
.
4
7
7
*
1
0
^
6
a
aa
a
a
a
a
a
a
a
a
a
a
a
e
e
e
e
e
e
e
e
e
e
e
e
e
e
r
r
r
r
r
r
o
o
o
o
o
o
o
c
cc
c
c
c
cc
*
* *
*
**
*
*
*
*
*
*
*
*
*
*r r
a = analfabetismo
e = escolaridade
r = renda
o = gua
c = c.alugadas
* = esgoto
l grficos dinmicos - selecionar no mapa e analisar
estatstica, identificar outliers no mapa
l Ex: seleo de sub-regies, anlise de vizinhana.
Conceitos estatsticos fundamentais
l Estacionariedade
m as propriedades estatsticas da varivel independem de
sua localizao absoluta, ou seja, a mdia e a varincia
so constantes em qualquer sub-rea e a covarincia
entre dois pontos quaisquer depende somente de sua
localizao relativa;
l Isotropia
m se, alm de estacionrio, a covarincia depende somente
da distncia entre os pontos e no da direo entre eles.
l Processo de modelagem
m Transformaes visando obteno de estacionariedade;
m Ajuste de modelos.
41
Anlise de dados pontuais
(point pattern)
Introduo Introduo
l A anlise de padro de pontos, o tipo mais simples de anlise
de dados espaciais. Baseia-se na localizao dos eventos em
determinada rea a partir das coordenadas. O objetivo estudar a
disposio espacial dos pontos, a partir de suas coordenadas;
l O modelo bsico do banco de dados neste tipo de anlise :
Evento Coord X Coord Y
1 4,30 2,45
2 5,39 3,35
3 4,10 3,50
42
CACHOEIRINHA
ALVORADA
VIAMO
10
Quilmetros
N
5 0
GUABA
Anlise exploratria Anlise exploratria - mapa de pontos - mapa de pontos
l O tipo mais simples de
apresentao de dados
espaciais
l Permite comparar a posio
relativa dos eventos,
inclusive diversos tipos
l Muito usado para
localizao de prdios,
como centros de sade,
escolas, etc.
Santos, S.M.
Anlise exploratria - Anlise exploratria - quadrat quadrat
l quadrat: transforma o dado
em contagem de pontos por
rea
rea do Quadrat
Grande Pequena
reas em branco

Total de pontos por rea

Resoluo

Estabilidade

x
y
0 20 40 60 80 100
0
2
0
4
0
6
0
8
0
1
0
0
0 20 40 60 80 100
0
2
0
4
0
6
0
8
0
1
0
0
1
3
5
1 3
5 6 4
3
5
5
3
7
3 2
0
2
1
3
3
2
5
1 1 3

x
y
0 20 40 60 80 100
0
2
0
4
0
6
0
8
0
1
0
0
0 20 40 60 80 100
0
2
0
4
0
6
0
8
0
1
0
0
43
Padres Padres
0.0 0.2 0.4 0.6 0.8 1.0
-
0
.
5
0
.
0
0
.
5
1
.
0
1
.
5
0.0 0.2 0.4 0.6 0.0 0.2 0.4 0.6 0.8 1.0
-
0
.
5
0
.
0
0
.
5
1
.
0
1
.
5
-
0
.
5
0
.
0
0
.
5
1
.
0
1
.
5
Distribuio das distncias - total Distribuio das distncias - total
0.0 0.4 0.8 1.2
0
2
0
0
4
0
0
6
0
0
8
0
0
1
0
0
0
1
2
0
0
1
4
0
0
alea.distt
0.0 0.2 0.4 0.6 0.8
0
2
0
0
4
0
0
6
0
0
8
0
0
1
0
0
0
clu.distt
0.0 0.4 0.8 1.2
0
1
0
0
0
2
0
0
0
3
0
0
0
4
0
0
0
5
0
0
0
ssi.distt
44
Distribuio das distncias Distribuio das distncias - 1 vizinho - 1 vizinho
0.0 0.02 0.04 0.06
0
5
0
1
0
0
1
5
0
2
0
0
alea.dist
0.0 0.2 0.4
0
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
2
5
0
0
clu.dist
0.05 0.07 0.09
0
2
0
4
0
6
0
8
0
ssi.dist
Kernel Kernel
l Tcnica de alisamento que utiliza janela mvel e funo que d a
cada rea um peso varivel conforme a distncia.
l Foi desenvolvida originalmente para obter uma estimao alisada
da densidade de probabilidade uni ou multivariada, ou um
histograma alisado.
l Estimar a intensidade de
pontos dispostos no espao
semelhante a estimar
uma densidade de
probabilidade bivariada.
45
Kernel Kernel

,
_


n
1 i
i
2
) s s (
k
1
) s (

l(s) - valor estimado por rea;


t - largura da banda (fator de alisamento);
k ( )

- funo de ponderao kernel;
s - centro da rea; s
i
- local do ponto.

,
_



n
1 i
i
2
) s s (
k
1
) s (
1
) s (

l Deve-se fazer correo


para as bordas
l Calcula-se o volume sob o
Kernel que est de fato
dentro da regio de estudo
u
u
d
s
k s
R


,
_


) ( 1
) (
2
l Aplicando a correo das
bordas obtm-se um
estimador corrigido
Kernel Kernel
l A funo de alisamento
escolhida - Kernel - deve
ser simtrica origem
l Ex: Kernel qurtico
( )

'

contrrio caso , 0
1 u u para , u u 1
3
) u ( k
T T

,
_


i
k
2
i
2
h
1
1
) s (

46
Kernel Kernel
Largura da banda
Largura da banda
Agresses por adolescentes em
Cardiff
BAILEY & GATRELL, 1995
Causas Externas - Porto Alegre Causas Externas - Porto Alegre
Santos, S.M.
CACHOEIRINHA
ALVORADA
VIAMO
10
Quilmetros
N
5 0
GUABA
47
Vizinho mais prximo Vizinho mais prximo
l Kernel e quadrat permitem explorar a
variao da mdia do processo na regio de
estudo - propriedade de primeira ordem
l Para investigar propriedade de segunda
ordem necessrio observar as distncias
entre os eventos
l Dois tipos de distncias: evento-evento (W)
e ponto aleatrio-evento (X)
l O resultado desta funo emprica o
histograma das distncias para o vizinho
mais prximo - cada classe do histograma
uma contagem de eventos que ocorrem at
aquela distncia
( )
n
w w #
) w ( G
i

)
( )
m
x x #
) x ( F
i

)
W - evento-evento
X - ponto-evento
# - contagem de
pontos onde a
condio
acontece
n - total de eventos
m - total de pontos
aleatrios
Funo K Funo K
l A funes anteriores somente permitem analisar a distribuio
do vizinho mais prximo - pequena escala
l A funo K permite analisar as propriedades de segunda
ordem de um processo isotrpico
) (# E ) h ( K
# - o nmero de eventos esperados at distncia h
- intensidade ou mdia de eventos por unidade de rea
Sendo:
R - n esperado de eventos na rea R

2
R K(h) - n pares ordenados ordenados at a distncia h (por isso entra duas vezes)
d
i,j
a distncia entre os pares i e j
Empiricamente possvel obter a funo K.
48
Funo K - estimativa Funo K - estimativa
( )

j i
ij h
2
d I
R
1
) h ( K
)
( )

'

>

h d se 0
h d se 1
d I
ij
ij
ij h
onde
A funo K(h) , para cada distncia h, o somatrio do total de
pares cuja distncia menor de que h, vezes o inverso do total de
pares ordenados existente na regio R.
I
h
(d
ij
) uma funo indicador
Esta funo tambm necessita de
correo do efeito de borda
Funo K e Funo L Funo K e Funo L
A funo K(h) tem uma distribuio terica sob condies de
aleatoriedade, quando a probabilidade de ocorrncia de um evento
em qualquer ponto de R independente da ocorrncia de outros
eventos e igual em toda a superfcie.
Neste caso, o n de eventos a uma distncia h ser h
2
e K(h) =
h
2
No caso de distribuio regular, K(h) ser menor que h
2
Distribuio em cluster, K(h) ser maior que h
2
A funo L(h) permite comparar entre a funo K(h) e h
2
h
) h ( K
) h ( L

)
)
m Picos positivos indicam atrao espacial
cluster
m Vales negativos repulso espacial ou
regularidade
49
Funo L Funo L
H evidncia de cluster - todos os valores positivos
Maior em h = 10
Completa Aleatoriedade Espacial Completa Aleatoriedade Espacial
l Para testar se as distribuies observadas na anlise
exploratria so de fato significativas, necessrio
comparar com distribuies tericas ou simulaes que
representem a Completa Aleatoriedade Espacial Completa Aleatoriedade Espacial
l A hiptese de CAE CAE que o evento segue um processo
de Poisson homogneo sobre a regio estudada, e os
testes buscam verificar isso
l Outras modelos podem ser usados: processo de
Poisson heterogneo, processo de Cox, inibio
simples, etc.
50
Testes de Testes de cluster cluster espacial e espao-temporal espacial e espao-temporal
l So causas de cluster: fonte comum, contagiosidade,
acaso
l Para testar se este agregado acima de um valor
esperado, existem diversos testes:
m Knox - testa um nmero acima do esperado de pares de
casos excessivamente prximos (segundo critrio pr-
estabelecido) no espao ee no tempo;
m Mantel - pondera todos os pares pela sua distncia espao-
tempo;
m Cuzick-Edwards - caso-controle onde a coincidncia de
casos vizinhos aumenta o peso, e a juno controle-controle
ou caso-controle tem peso zero; este teste permite
considerar a variao populacional.
Variao da populao Variao da populao
l O alisamento Kernel permite estimar eventos por
unidade de rea, sem considerar a populao
l Pode-se estimar populao por unidade de rea, e
fazer a razo dos dois obtendo uma estimativa alisada de
eventos por populao eventos por populao
j
m
1 j
'
j
2
'
y
) s s (
k
1
) s (

,
_


- estimativa populao p/ unidade
de rea
- largura de banda
y
j
- populao em cada ponto
Usa-se atribuir ao centride do setor censitrio ou ao centro
populacional o nmero de habitantes de toda a rea
51
Variao da populao - taxa Variao da populao - taxa
j
m
1 j
'
j
2
n
1 i
i
2
y
) s s (
k
1
) s s (
k
1
) s (

,
_

,
_


)
l A criao da taxa a diviso dos alisamentos:
eventos p/ unidade de rea
populao p/unidade de rea
Pode-se usar outro evento como estimador da populao a risco
Pode-se usar diferentes larguras de
banda (em geral maior no denominador
para estabilizar +)
Exemplo Exemplo
cncer de
laringe
cncer de
pulmo
kernel cncer de pulmo
casos de cncer de laringe
BAILEY & GATRELL, 1995
x
52
DEM
SELVIN et al, 1996
Investigao de
cluster de
cncer de mama
em S.Francisco
Fonte especfica Fonte especfica
l Cluster ao redor de um ponto ou uma linha
l Compara-se a ocorrncia de n excessivo de casos
em relao populao a partir de uma funo de
decaimento em relao possvel fonte
2
2
h
1
'
e 1 ) ; h ( f
) ; h ( f ) s ( ) s (

+

(s) - estimativa do evento p/ unidade de
rea
- parmetro que indica a razo entre
casos e controles
(s) - estimativa populao p/ unidade de
rea
f - funo da distncia para a fonte
- parmetros a
estimar que
descrevem como a
incidncia varia em
torno da fonte
53
Anlise de dados Anlise de dados espacialmente espacialmente contnuos contnuos
(geoestatstica)
l Na anlise de padro de pontos, o interesse na localizao dos
eventos. Na anlise de dados espacialmente contnuos, o objetivo
entender a distribuio espacial dos valores de um atributo de
toda a regio estudada, a partir de medidas realizadas em pontos
amostrados. As coordenadas dos pontos, neste caso, apenas a
localizao onde a varivel foi mensurada;
l A estrutura do banco de dados :
Amostra Coord X Coord Y Var1
(C)
Var2
(ppm)
Var3
(p/10
5
hab)
1 4230 2245 32
0,50 1,7
2 4239 2235 25
1,45 2,6
3 4210 2350 28
5,87 80,6
Introduo
54
Visualizao
CRESSIE, 1991 - Fig. 2.2 , pag. 34
Visualizao - mapas de smbolos
Fig. 5.5 Proporcional symbol map of Venice groundwater, 1973 BAILEY & GATRELL, 1995
55
Anlise exploratria: contorno
BAILEY & GATRELL, 1995
Mapas de contorno e 3D
L-O
N
-
S
684000 686000 688000
7
.
4
7
4
*
1
0
^
6
7
.
4
7
7
*
1
0
^
6
-1
-1
-1
-1
-1
-1
-1
-1 -1
0
0
0
0
0
0
0
0
1
1
1
1
1
1
2
2
-1 1 2 3
684000
685000
686000
687000
688000
X
7
.4
7
5
e
6
7
.4
7
6
e
6
7
.4
7
7
e
6
7
.4
7
8
e
6
7
.4
7
9
e
6
Y
-
2
-
1

0
1
2
3
Z
CARVALHO, M.S..,1997
56
Continuidade: mapas de contorno e 3D
l as curvas de contorno, ou isolinhas, delimitam reas onde a
varivel tem a mesma grandeza
l no mapa 3D utilizada uma projeo tridimensional onde a
varivel em estudo representada no eixo Z, perpendicular aos
eixos X e Y das coordenadas de representao espacial,
obtendo-se uma superfcie em forma de cordilheira, com
picos e vales representado os diversos valores encontrados em
dada rea geogrfica;
l se for feito um corte em um determinado valor de Z do mapa 3D
a visualizao em duas dimenses o mapa de contorno;
l este mapas so construdos por interpolao de valores medidos
em diversos pontos;
l poucos programas fazem este tipo de mapa.
Modelagem 1
l modela-se a varivel segundo sua distribuio em
larga escala (tendncia) e pequena escala (relao
com os pontos vizinhos);
l o primeiro passo transformar a varivel buscando
aproximar sua distribuio de uma normal,
utilizando transformaes (log, exp,...);
l em seguida se estuda a estacionariedade: tendncia,
outliers, anisotropia.
57
Tendncia e outliers
l localizao de valores extremos nos mapas
l grficos de mdias e medianas segundo linhas
e colunas dos pontos amostrados - permite
identificar a flutuao das medidas ao longo
de duas direes, permitindo detectar
tendncia ou valores aberrantes
l saltos no valor das variveis em pequena
distncia
Grfico de mdias e medianas direcionais
CARVALHO, M.S..,1997


o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
renda(std)
l
i
n
h
a
s
-1 0 1 2
0
1
0
2
0
3
0
4
0
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
oo
o
o
o
oo
o
o
o
o
o
o
o
o
o
o
o
oo
o
o
o
col unas
r
e
n
d
a
(
s
t
d
)
0 10 20 30 40
-
1
0
1
2
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
xx
x
xx
x
x
x
x
x
x
x
x
xxx
x
x
x
o = Medi ana RENDA(std)
x = Mdi a RENDA(st d)
ILHA, coordenadas regul ari zadas, excl udos Aeroporto e Fundo
58
Mapa de grandes diferenas
L-O
N
-
S
684000 686000 688000
7
.
4
7
4
*
1
0
^
6
7
.
4
7
7
*
1
0
^
6
a
aa
a
a
a
a
a
a
a
a
a
a
a
e
e
e
e
e
e
e
e
e
e
e
e
e
e
r
r
r
r
r
r
o
o
o
o
o
o
o
c
cc
c
c
c
cc
*
* *
*
**
*
*
*
*
*
*
*
*
*
*r r
a = analfabetismo
e = escolaridade
r = renda
o = gua
c = c.alugadas
* = esgoto
LEGENDA
CARVALHO, M.S..,1997
Relao entre os pontos - pequena escala


) j , i (
2
j i
) v v (
) h ( N 2
1
) h (
g(h) - valor calculado do semi-variograma amostral para cada intervalo (h)
entre pares de pontos;
N(h) - total de pares que tem entre si a mesma distncia (h);
v
i
- valor da varivel medida em i e j
l Variograma amostral:
l Autocovarincia:
2
1
j , i
n
1 k
k j i
v
n
1
v v
) h ( N
1
) h ( Cov

1
]
1

l Autocorrelao: autocovarincia normalizada


pela varincia total.
59
Variograma
intervalos (lags):
tolerncia:
BAILEY & GATRELL, 1995
ISAACS & SHRIVASTAVA, 1989
Variograma
Vari ograma
g
a
m
m
a
0 500 1500 2500
0
.
0
0
.
4
0
.
8
1
.
2
Correl ograma
r
h
o
0 500 1500 2500
-
1
.
0
0
.
0
0
.
5
1
.
0
Covar i ogr ama
c
o
v
0 500 1500 2500
-
0
.
2
0
.
2
0
.
6
distncia
g
a
m
m
a
0 500 1500 2500
0
.
0
0
.
2
0
.
4
distncia
r
h
o
0 500 1500 2500
-
1
.
0
0
.
0
0
.
5
1
.
0
distncia
c
o
v
0 500 1500 2500
0
.
0
0
.
0
5
0
.
1
0
Dados Originais, com tendncia
Retirada a tendncia
RENDA, Ilha, 1991
CARVALHO, M.S..,1997
60
Estacionariedade de 2 ordem
CARVALHO, M.S..,1997
Intervalos entre Pares - at 500m.
g
a
m
m
a
1 2 3 4 5
0
1
2
3
4
101,102
83,97
15,19
127,128
127,188
I dent i f i caao de cont rast es
nuvem do var i ogr ama
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
g
a
m
m
a
o
o
o
o
o
o
o
o o
o
o o o o
o o o o o
o
0 5 10 15 20 25
o - Mdia
- Mediana
Raiz quadrada
das di ferenas entre pares
Intervalos entre Pares - at 3000m.
l identificar diferenas aberrantes (utilizando o variograma)
entre pares de valores mensurados
Modelagem 2 - tendncia
l A tendncia pode ser
modelada atravs de
polinmios ou
alisamentos locais
l O peso das observaes
diminui medida em
que se afasta do ponto
estimado, sendo ento
uma regresso local
ponderada.
L-O
R
E
N
D
A

Eixo X
N-S

Eixo Y
L-O A
N
A
L
F
A
B
E
T
I
S
M
O

N-S

SE-NO
R
E
N
D
A

SO-NE

SE-NO
A
N
A
L
F
A
B
E
T
I
S
M
O

SO-NE

Coordenadas Originais
Rotao 45
61
Modelagem 2 - loess
Contorno da Tendncia
SE-NO
S
O
-
N
E
-1 1 4
l Ao invs de se calcular
a mdia em cada janela,
se estima, por mnimos
quadrados, os
parmetros de um
plano.
l Depois de modelada, se
retira a tendncia e
examina os resduos
Isotropia
l Quando a variabilidade espacial de um fenmeno em
estudo a mesma em todas as direes, diz-se que o
fenmeno ISOTRPICO
O
N
S
L O
N
S
L
Imagem nvel de cinza Imagem nvel de cinza Composio Colorida Composio Colorida
62
Anisotropia
l Quando a variabilidade espacial de um fenmeno em
estudo no a mesma em todas as direes, diz-se que o
fenmeno ANISOTRPICO.
Imagem nvel de cinza Imagem nvel de cinza Composio Colorida Composio Colorida
O
N
S
L O
N
S
L
Modelagem 3 - anisotropia
l Se houver anisotropia, necessrio corrig-la
d0=657.689
0.01
0.02
0.03
0.04
0
500 1000 1500 2000
d0=608.8824
45
d0=640.853
90
d0=707.0784
0.01
0.02
0.03
0.04
135
500 1000 1500 2000
Distncia
g
a
m
m
a
63
Modelagem 4 - variograma
l Somente ento possvel modelar a variao em
pequena escala atravs de ajuste de uma funo ao
variograma amostral
l Modelando como se d a relao entre os pontos
prximos possvel interpolar o valor da varivel em
qualquer ponto, e investigar a relao entre diversas
variveis que ocorrem de forma contnua na regio
l os principais parmetros a serem ajustados so:
Ajuste do variograma
Ajuste de modelo Gaussiano
0 500 1000 2000
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4Patamar
Alcance
Pepita
Distncia (m)
g
a
m
m
a
m funo da curva: esfrica,
gaussiana ou exponencial;
m patamar (sill): valor mximo
atingido;
m alcance (range): distncia at
onde existe correlao entre os
pontos;
m pepita (nugget): valor inicial, que
representa a diferena medida
onde a distncia tende a 0.
CARVALHO, M.S..,1997
64
Modelos de variograma
ISAACS & SHRIVASTAVA, 1989
Modelos de variograma
EQUAO OBSERVAES

'

,
_

contrrio caso , 1
se , 5 , 0 5 , 1
) (
3
a h
a
h
a
h
h
comportamento linear
prximo origem
( ) exp h
h
a

_
,
1
3
atinge o plateau
assintoticamente, na
prtica, considera-se o
valor de a onde o
variograma atinge 95%
do plateau.
( ) exp h
h
a

_
,
1
3
2
2
tambm assinttico, com
crescimento parablico
prximo origem
65
Variaes nos modelos de variograma

,
_

,
_



10
h 3
exp 1 10 ) h (

'

,
_

,
_

0 = h se , 0 ou

10
3
exp 1 5 5
) (
h
h
Efeito Pepita
Variaes nos modelos de variograma
Modelo

,
_

,
_



10
3
exp 1 10 ) (
h
h

,
_

,
_



2
10
3
exp 1 10 ) (
h
h
66
Variaes nos modelos de variograma
Alcance

,
_

,
_



10
3
exp 1 10 ) (
h
h

,
_

,
_



100
15
exp 1 10 ) (
h
h
Interpolando: Krigeagem
l a krigeagem (kriging) o mtodo para interpolao de qualquer
ponto, utilizando os pontos vizinhos e relacionando-os atravs
do modelo de variograma;
l a krigeagem atribui pesos diferentes conforme a distncia entre o
ponto a ser estimado e os pontos amostrados:
(s) - valor estimado

j
- medidas nos pontos j
- matriz de pesos, estimada a partir do modelo do
variograma


n
1 j
j j
) . ( ) s (

1 (122.0)
2 (183.0)
3 (148.0)
4 (160.0)
5 (176.0)
1
2
3
4
5
0.225
0.066
0.351
0.128
0.107
67
Interpolando: Krigeagem
l O kriging denominado blue - best linear unbiesed
estimator pela forma como calculada a matriz de pesos
l No ponto onde houve medida o kriging garante com que o
valor medido seja mantido
l O kriging permite estimar o erro padro associado ao
modelo
l A tendncia deve ser reincorporada, sendo possvel
tambm estimar simultaneamente tendncia e variao em
pequena escala atravs da krigeagem universal
l Neste caso a tendncia s pode ser modelada com
polinmios
Krigeagem
Interpolao
L-O
N
-
S
684000 686000 688000
7
.
4
7
4
*
1
0
^
6
7
.
4
7
7
*
1
0
^
6
-1 0 1 2 3
Erro Padro
L-O
684000 686000 688000
7
.
4
7
4
*
1
0
^
6
7
.
4
7
7
*
1
0
^
6
0.2 0.5 0.8
CARVALHO, M.S..,1997
68
Krigeagem
Imagem da variabilidade espacial Imagem da variabilidade espacial
das propores de nascidos com das propores de nascidos com
Apgar Apgar bom, no Municpio do RJ, bom, no Municpio do RJ,
proveniente da proveniente da Krigeagem Krigeagem..
Imagem da varincia de Imagem da varincia de
krigeagem krigeagem
relativa as propores de relativa as propores de
nascidos com nascidos com Apgar Apgar bom, no bom, no
Municpio do RJ. Municpio do RJ.
-
+
-
+
Dados: DOrsi,l.1995 Anlise: equipe SPRING/INPE, 1999
Potencialidade
l aplicaes mais indicadas:
m ambiente e sade;
m identificao de caractersticas de ocupao do solo e
imagem de satlite.
l preciso X facilidade;
l mtodos alternativos:
m alisamentos no paramtricos;
m interpolao linear simples.
l outros recursos:
m co-variograma e co-krigeagem;
m anlise multivariada.
69
Anlise de reas Anlise de reas
Introduo
l Na anlise de reas, ao invs de variar continuamente no
espao, o atributo estudado apresenta valor constante sendo
medida de sntese;
l O objetivo no a predio para pontos no mensurados,
mas a deteco e explicao de padres e tendncias
observados nas reas;
l rea definida por um polgono cuja forma pode ser
complexa bem como as relaes de vizinhana;
l O modelo bsico do banco de dados:
Local Casos Populao Med/ 1000
hab.
Rio Bom 41 3209 5,4
Serra Verde 320 16897 2,6
Poo Fundo 67 2569 1,3
70
AP-5
AP-3
AP-4
AP-2
AP-1
BAIRRIO by AvgOfPapgabom
0.44to 0.64 (31)
0.64to 0.7 (30)
0.7 to 0.75 (30)
0.75to 0.78 (27)
0.78to 0.83 (30)
Forma de representao: Mapa de Padro
DRSI,E., 1996
Proporo de RN com ndice de APGAR bom
AP-5
AP-3
AP-4
AP-2
AP-1
BAIRRIO by AvgOfPapgabom
0.44 to 0.518 (4)
0.518to 0.596 (17)
0.596to 0.674 (27)
0.674to 0.752 (51)
0.752to 0.83 (49)
Proporo de RN com ndice de APGAR bom
Forma de representao: Mapa de Padro
71
Mortalidade por
Homicdios:
trinios 79-81,
90-92
Estado do Rio de
J aneiro
CRUZ,O.G.,1996
Pontos de corte
Minas Gerais
Esprito Santo
Rio de Janeiro
So Paulo
SUD by AvgOfMedicos
1Dot = 1
SUD by AvgOfRenda
24666.72 to 24666.72 (1)
24666.72 to 47373.1522879932 (187)
47373.1522879932 to 85144.6297995853 (650)
85144.6297995853 to 122916.107311177 (385)
122916.107311177to 160687.58482277 (165)
160687.58482277 to 267661.4 (59)
Renda X mdicos/hab
Anlise exploratria bivariada - Pontos
72
CRUZ,O.G., 1996
Anlise exploratria bivariada: Smbolos
Anlise exploratria - alisamentos
l Mdias mveis:

n
j
j i
n
j
i j i
i
w
y w
1
,
1
,

w
i,j
a ponderao obtida da matriz de vizinhana
y
i
o valor do atributo na rea
l Polimento pela mediana (median polish):
j i j i j i
y
, ,
+ + +
Y
i,j
o valor do atributo na rea, que
pode ser decomposto em:
- mdia global da rea

i
- efeito em linhas

i
- efeito em colunas

ij
- erro alatrio
Equivale anlise de varincia
onde os grupos so as linhas e as
colunas, mas utilizando
medianas ao invs de mdias
73
Entidades
ou
Superfcies ?
CRUZ,O.G.,1996
Interpolao em reas
Kernel
Triangulao
74
Interpolao LOESS com janela de 30% dos pontos
Interpolao em reas
Kernel de reas
l Utiliza-se para reas alocando o valor do atributo a um
ponto da rea - centride geomtrico, populacional

,
_

,
_

n
j
i
n
j
i
i
s s
k
y
s s
k
s
1
1
) (

m Para o kernel de populao, cada ponto


receber o atributo p
i
(populao) alisado
pela funo k, e largura de banda
m No kernel de um atributo contnuo (por ex.,
indicadores), inclui-se no denominador o
kernel da distribuio dos centrides das
reas
m Obtm-se portanto a mdia do atributo na
regio e no uma contagem de eventos por
unidade de rea
m Correo para efeitos de borda

,
_

n
j
i
i
p
s s
k s p
1
) (

75
Mapa de probabilidades
BAILEY & GATRELL, 1995

,
_

i
i
i i
n
y
n

y para
!
y para
!
i
i

'

<

i
i e
i
i e
y x
i
x
i
y x
i
x
i
i
x
x
p

)
)
)
)
)
)
Estimativa da
mdia em i
p
i
a
probabilidade
de encontrar
o valor y
i
em
cada rea
0 5
Km
10
Baixo (p<0,05) (7)
Baixo (NS) (37)
Mdio (p<0,05) (5)
Mdio (NS) (80)
Pouco Alto (p<0,05) (14)
Pouco Alto (NS) (3)
Alto (p<0,05) (7)
Alto (NS) (0)
S
N
L O Tx e significncia (bairros)
Legenda
Mapa de probabilidades
Campos, 1996
Mortalidade posneonatal (taxa e significncia)
Rio de J aneiro, 1995
76
l diz-se que existe um cluster entre reas quando reas com
valores semelhantes ocorrem prximas no espao;
l ou quando existe uma quantidade excessiva de eventos
na mesma rea
l so causas de cluster: fonte comum, contagiosidade,
acaso;
l para testar se este agregado acima de um valor
esperado, existem diversos testes que procuram verificar
a medida da autocorrelao espacial, testando se
significativa:
l os resultados de qualquer destes mtodos depende
diretamente dos pesos da matriz de vizinhana.
Cluster em reas
l utiliza-se matriz W , onde cada elemento w
ij
representa medida
de proximidade espacial entre as reas A
i
e A
j
;
l a escolha de w
ij
depende do tipo de dado, de regio, dos
mecanismos particulares da dependncia espacial;
l vizinhos podem ser de primeira ordem, segunda at n.
Matriz de vizinhana
w
ij


'

1
0
w
ij


'

1
0
w
ij


'

1
0
centride de A
i
o mais prximo de A
j
caso contrrio
centride de A
i
dentro de distncia especificada de A
j
(buffer)
caso contrrio
w
l
l
ij
ij
i

A
i
tem fronteira comum com A
j

caso contrrio
l
ij
o comprimento da fronteira comum entre com A
i
e A
j
e

l
i
o permetro de A
i
Possveis
Critrios:
77
Matriz de vizinhana
Testes de Cluster
mW
ij
a matriz de
vizinhana
mRelaciona-se auto-
correlao
mMdia suposta constante:
processo estacionrio
Moran I
( ) ( )
( )

,
_

,
_



j i
ij
n
i
i
n
i
j i
n
j
ij
w y y
y y w N
C
1
2
1
2
1
2
1
m Relaciona-se ao
variograma
m Outros testes: Moran
Ipop, Assuno
Geary C

,
_

,
_



j i
ij
N
i
i
N
i
N
j
j i ij
w y y
y y y y w N
I
1
2
1 1
) (
) )( (
y
78
Funo de autocorrelao
Moran no lag k
l Desta forma se constri a funo de autocorrelao para
cada lag
l A significncia estatstica pode ser calculada por
permutao ou, caso a varivel tenha distribuio
normal, por teste Z

,
_

,
_



j i
k
ij
N
i
i
N
i
N
j
j i
k
ij
k
w y y
y y y y w N
I
) (
1
2
1 1
) (
) (
) (
) )( (
So Paulo
Minas Gerais
Km.
0 100 200
Esprito
Santo
Rio de Janeiro
LEGENDA
classes (n de municpios)
0,95 a 1,906 (28)
1,906 a 2,862 (209)
2,862 a 3,818 (460)
3,818 a 4,774 (223)
4,774 a 5,73 (64)
0 bitos (448)
N
L
S
O
Capitais
CARVALHO & CRUZ,1998
Taxa mortalidade por
homicdios (Log)
Sudeste, 1991
Autocorrelao
79
Correlograma
-0.2
0.0
0.2
0.4
0.6
ES
0 100 200 300 400 500 600
MG
RJ
-0.2
0.0
0.2
0.4
0.6
SP
0 100 200 300 400 500 600
di stnci a
a
u
t
o
-
c
o
r
r
e
l
a

o
Correlograma
da taxa
mortalidade
por
homicdios
por UF
Indicadores locais
l Permitem encontrar os bolses de dependncia
espacial no evidenciados nos ndices globais
l permitem identificar:
m agrupamentos de objetos com valores semelhantes (cluster)
m objetos anmalos
m existncia de mais de um processo espacial
l A significncia estatstica tambm calculada por
permutaes e supe-se normalidade da varivel.
l Existem dois ndices locais:
m LISA (Anselin, 1996)
m ndice G
i
e G
i
*
(Getis e Ord, 1992)
80
Indicadores Locais
l Z
i
- desvio de i em relao a mdia global
l Z
j
- mdia dos desvios dos vizinhos de i
l Mdia constante: processo estacionrio
l Significncia semelhante a I - permutao ou
normalidade
LISA - Indicador local de autocorrelao espacial

N
i
i
j
j ij i
i
z
z w z
I
1
2
Indicadores Locais
( )
( )
j i
y
y d w
d G
n
j
j
n
i
j ij
i

,
1
1
l No numerador: somatrio de todos os valores de todos
os vizinhos dentro de distncia d ponderados por W
ij
l G
i
*
inclui tambm o ponto i no clculo
l Valores positivos: cluster de valores altos;
negativos: cluster baixo
l Interpretao mais direta que o LISA
Estatstica G
81
Inc 89
0
0 - 1
1 - 5
5 - 10
10 - 20
20 - 1000
Mapa LISA
Incidncia de
Hansenase
So Paulo,
1989
Moran I = 0.07185
Local Moran
-3 - -2
-2 - -1
-1 - 1
1 - 2
2 - 6
Mapa LISA
Incidncia de
Hansenase -
LISA
So Paulo,
1989
82
Modelos de regresso NO espacial
l Na investigao sobre causas de diferenas entre reas
possvel utilizar modelos multivariados no espaciais (estudos
ecolgicos clssicos).
i k k i
x x y + + + + ...
1 1 0
l As hiptese bsicas deste
modelo so:
m As variveis explicativas so
linearmente independentes;
m E ()=0
m V()=

2
m ~ (0,

2
)
y - estimativa da var. resposta;

i
- coeficiente de regresso;
x
k
varivel explicativa;
erro aleatrio
l Embora teis, se existir forte tendncia ou correlao
espacial, os resultados sero influenciados, apresentando
associao estatstica onde no existem (e vice-versa).
Modelos de regresso espacial
l Novamente o objetivo modelar simultaneamente a
variao em larga escala e em pequena escala.
+
i i
Z
Z
i
- processo espacial

i
- Estimativa da mdia em i
~ N(0,), onde a matriz de covarincia das variveis aleatrias nos
locais
l A variao na mdia - larga escala - pode ser
modelada em funo das coordenadas (superfcie de
tendncia)
l Em pequena escala ajusta-se um modelo
autorregressivo ou de mdias mveis
83
Modelo de superfcie de tendncia
l Pode-se incluir no modelo de regresso comum as
coordenadas geogrficas de cada ponto como variveis
independentes, inclusive ao quadrado e seus produtos -
neste caso se modela a superfcie de tendncia.
i i i i i i i i
y y y x x x + + + + +
2
02 01 11
2
20 10
Modelos de regresso espacial - SAR
l Suponha que a varivel y
i
depende dos valores da
varivel independente nas reas vizinhas a i:


+ + + + +
j
j i i k k i i
x w x x y
, , 1 1 0
...
- parmetro de associao entre o valor da varivel explicativa
nas reas vizinhas e a varivel resposta;
W
i
- conjunto de reas adjacentes i
l Suponha que a varivel y
i
autocorrelacionada:


+ + + + +
j
j i i k k i i
y w x x y
, , 1 1 0
...
- parmetro da funo de autocorrelao
84
Modelos de regresso espacial - CAR
Onde:
o erro tem matriz de covarincia igual a
2
V
V uma matriz no diagonal que descreve a dependncia espacial
dos erros
+ + + +
i k k i i
x x y
, , 1 1 0
...
l A medida que aumenta a complexidade, a estimativa de
cada componente isolado do modelo torna-se impossvel
l Utiliza-se ento os modelos CAR (Conditional
Autorregressive) que so modelos de regresso com erros
espacialmente correlacionados
Modelagem Bayesiana
l Basicamente tcnicas de mapeamento de doenas onde se
incorpora o conhecimento a priori do investigador
l A principal caracterstica procurar identificar o processo
que gerou aqueles dados, e no apenas a realizao os
dados, filtrando a variabilidade aleatria
l Para isso incorpora-se informao das reas vizinhas:
vizinhos so parecidos
l O mais utilizado mtodo de estimativa - Markov Chain
Monte Carlo (MCMC) - atravs de simulaes permite
estimar no s o valor esperado da distribuio da varivel
estudada em cada rea, mas outros parmetros tambm.
85
Ex: Bayesiano emprico
BAILEY & GATRELL, 1995
Taxa bruta de mortalidade infantil
Alisamento Bayesiano emprico
da mortalidade infantil
Ex: Hansenase em Olinda
Setores censitrios ordenados segundo decis de indicador de carncia (z)
0
10
20
30
40
50
60
70
80
1 2 3 4 5 6 7 8 9 10
z taxa renda
86
Renda X Hansenase
Indicador de renda: % chefes com renda < 1 salrio mnimo
-
50.00
100.00
150.00
200.00
250.00
1 8 15 22 29 36 43 50 57 64 71 78 85 92 99 106 113 120 127 134 141 148 155 162 169 176 183 190 197 204 211 218 225 232 239
Depriv. Ind. Crude Rate
Ex: Hansenase em Olinda
Depi vati on Index
0.7 - 9.7
9.7 - 18. 7
18. 7 - 27.7
27. 7 - 36.7
36. 7 - 45.7
45. 7 - 54.7
54. 7 - 63.7
63. 7 - 72.7
72. 7 - 81.7
81. 7 - 90.7
N
E W
S
Indicador de renda
87
Alisamento Bayesiano
0 - 50
50 - 100
100 - 150
150 - 200
200 - 250
250 - 300
300 - 350
350 - 400
400 - 450
450 - 500
500 -
1100
Bayesiano - no informado
0 - 50
50 - 100
100 - 150
150 - 200
200 - 250
250 - 300
300 - 350
350 - 400
400 - 450
450 - 500
500 -
1100
88
Bayesiano - Dado Censurado
0 - 50
50 - 100
100 - 150
150 - 200
200 - 250
250 - 300
300 - 350
350 - 400
400 - 450
450 - 500
500 -
1100
Ex: Bayesiano
0
200
400
600
800
1000
1200
1400
1 10 19 28 37 46 55 64 73 82 91 100 109 118 127 136 145 154 163 172 181 190 199 208 217 226 235
RATE1
RATE2
RATE3
Estimated rates ordered according to the
poverty index
Begi n of censori ng
89
Linhas
So Paulo
Minas Gerais
Km
0 100 200
Esprito
Santo
Rio de Janeiro
LEGENDA
classes (n de municpios)
4,214 a 5,28 (35)
3,148 a 4,214 (287)
2,082 a 3,148 (536)
1,016 a 2,082 (253)
-0,05 a 1,016 (23)
0 bitos (298)
N
L
S
O
Capitais
Taxa mortalidade por
acidentes de trnsito (Log)
Sudeste, 1991
Fluxo
0 5
Km
10
35
17.5
3.5
A (28)
B (58)
C (36)
D (7)
E (24)
S
N
L O
na Ra de resi dnci a
Grupo soci oeconmi co
= 35
(bai rros)
bi tos ocorri dos na Vol ume do fl uxo entre
resi dnci a e ocorrnci a
crianas
Legenda
Campos, 1996
Fluxo entre RA de residncia e RA do bito (mortalidade posneonatal)
Rio de J aneiro, 1995
90
Modelos Espao-Tempo
Modelos Espao-Tempo Modelos Espao-Tempo
l O interesse na distribuio espao-temporal esteve presente
desde os primrdios da epidemiologia
l Entretanto s recentemente tem sido utilizadas tcnicas que
permitem a incorporao das dimenses tempo, espao e
somente muito recentemente a interao espao-tempo.
91
Modelos de difuso das doenas Modelos de difuso das doenas
Simulao por multi-agentes
Difuso Espacial Difuso Espacial
l Difuso - dispersar a partir de um centro, disseminar,
propagar, espalhar.
l Em geografia utiliza-se 2 conceitos
m Difuso por expanso - quando um material, uma informao,
etc... se espalha de um local p/ o outro, permanecendo (ou at
mesmo se intensificando) na regio inicial. Ex: doena
transmissvel
m Difuso por realocao - quando o material difundido deixa a
rea original e se move p/ novas reas. Ex: Movimentos
migratrios
92
Difuso Espacial Difuso Espacial
l Difuso por expanso tambm pode ocorrer atravs de
uma seqncia de classes locais - neste caso
denominado espalhamento hierrquico (ex: moda, bens
de consumo), que tendem a passar por classes sociais
diferentes e se irradia a partir das grandes metrpoles.
l Difuso em cascata um caso particular onde a difuso
sempre se d dos grandes centros p/ os menores.
Difuso Espacial Difuso Espacial
l Na geografia houve um grande interesse por modelos de
difuso desde a dcada do inicio do sculo, e se
intensificou a partir da dcada de 50 com o trabalho
pioneiro de Hgerstrand. Um dos principais interesses
dos gegrafos eram os modelos de difuso de inovaes
tecnolgicas.
l Na epidemiologia por outro lado, devido a influencia de
Ross e Hamer, os modelos compartimentais foram mais
utilizados.
93
Espacializando Espacializando a difuso das doenas a difuso das doenas
l O principal desafio como introduzir as dimenses espao e
tempo na modelagem da difuso das doenas transmissveis .
l Qual o impacto do espao e da interao espao-tempo?
l Eles so capazes de mudar parmetros inferidos para a interao
das populaes envolvidas?
l So capaz de trazer novidades na anlise e interpretao de
resultados?
l Quais os possveis modelos e maneiras de incorporar o espao e
tempo ?
Processo de difuso das doenas
l Sob o ponto de vista da Ecologia, mais especificamente da
dinmica de populaes uma doena transmissvel, o resultado
da interao entre pelo menos 2 espcies (parasita X hospedeiro).
l Tambm na ecologia os modelos de crescimento populacional,
interao entre espcies, competio etc... apesar de utilizarem o
tempo em suas equaes de crescimento (Lotka-Volterra) no
incorporam a dimenso espao.
l A introduo do espao nos modelos, mesmo com uma nica
espcie, e capaz de alterar a inferncia a respeito da dinmica
desta espcie.
94
Modelos de difuso de doenas Modelos de difuso de doenas
l No incio do sculo XX surgiram os primeiros modelos de
transmisso de doenas , que consideravam que o curso de uma
epidemia deveria depender do nmero de suscetveis, das taxas
de contato entre os indivduos infectados e suscetveis e do
nmero de infectados.
l A partir da diversos modelos determinsticos foram empregados
modelando parmetros de epidemias.
l medida em que o interesse se volta para pequenas populaes
e eventos raros, foram introduzidos modelos estocsticos.
Modelos de difuso das doenas
l No entanto, a medida que se adiciona variveis (por exemplo,
estrutura etria, populaes de vetor) esses modelos se tornam
muito complexos, dificultando ou impossibilitando uma soluo
analtica.
l Neste contexto pode-se empregar mtodos numricos ou
simulaes na estimao parmetros, no entanto a incluso do
espao e tempo inviabilizam a convergncia mesmo p/ essa
classe de modelos
l Os avanos recentes na modelagem espao-temporal empregam
modelos bayesianos (MCMC) espao-temporais.
95
Modelagem Estatstica Espao-temporal
Modelagem Estatstica Espao-temporal
96
Anlise de Dados Espaciais em Sade: Anlise de Dados Espaciais em Sade:
avanos recentes no Brasil avanos recentes no Brasil
Modelo Integrado de Anlise Espacial Modelo Integrado de Anlise Espacial
Malha Viria
reas
Equipamentos
Servios
Urbanos
I magem
Satlite Sade
Anlise
Cluster
Camadas
Trajetrias
Busca
SIG
Base Cartogrfica
Eventos de Sade
Georeferenciamento
SI M
SI NASC SI VAN
Censo
SI GAB
Estatstica
Sistemas
Espacial
Correlograma
Kriging
Inteligentes
Fuzzy
Celular Automata
Agregao
97
Geoprocessamento e SIG - definies Geoprocessamento e SIG - definies
Geoprocessamento Geoprocessamento - processamento digital de dados geogrficos,
incluindo qualquer tipo de manipulao de informaes geogrficas,
da imagem de satlite restituio de fotos areas.
SIG SIG - sistema digital de captura, armazenamento, recuperao,
anlise e apresentao de dados espaciais.
Georeferenciamento Georeferenciamento - localizao de informaes no geogrficas
(por ex. eventos em sade) em base cartogrfica. Pode ser feito em
diversas escalas - municpio, bairro, estado, setor censitrio - e de
diversas formas.
SIG - Sistema de Informaes Geogrficas SIG - Sistema de Informaes Geogrficas
l Sistema constitudo de "hardware" e "software" que permite
armazenar, gerenciar e editar bases cartogrficas e acopl-las a dados
no grficos, realizando anlises espaciais e apresentando
graficamente os resultados.
l A estrutura de dados grficos armazena informaes sobre localizao,
escala, dimenso, etc. A estrutura de dados no-grficos informa sobre
os objetos ou ligaes entre eles.
l A base grfica pode ser vetorial ou matricial (raster).
l Estruturas vetoriais podem ser armazenadas de duas formas:
m espaguete - todas as feies do mapa so arquivadas como sucesso de pontos
(lista de coordenadas), linha a linha (tpica de CAD). Este tipo no permite
reconhecer a relao espacial entre os objetos
m topolgica - permite mais facilmente a anlise de dados, pois armazena, alm do
componente locacional e dos atributos dos dados, informaes sobre a
interligao entre os objetos.
98
Anlise espacial - funes do SIG Anlise espacial - funes do SIG
l Operaes caractersticas de SIGs:
interseo de linhas - anlise de redes,
otimizao de rotas;
pontos pertencentes a reas -
georeferenciamento, densidade;
operaes de camadas - tratamento
simultneo de diversas
informaes;
buffer - rea de
influncia.
ll Atributos dos
dados no SIG:
vizinhana
conectividade
distncia.
Cartografia - produo de mapas Cartografia - produo de mapas
l A elaborao de mapas envolve diversas tcnicas, mais ou menos
sofisticadas, desde o simples esboo rascunhado por um agente de sade na
Regio Amaznica, at tcnicas sofisticadas utilizando satlites e
arquivamento digital.
l O processo de mapeamento formal comea com o sensoriamento remoto -
informao do terreno coletada distncia. Dois tipos de mtodos so
usados: fotografias areas e imagens de satlites.
l As imagens obtidas com qualquer mtodo so interpretadas a partir de
outras informaes, de contexto (por exemplo, uma linha com estruturas de
casas dos dois lados deve ser uma rodovia, e no um rio ou fenda
geolgica) ou de campo. O trabalho de campo pode ser feito atravs de
inspees pontuais, onde se visita determinado ponto para obter
informaes especficas, ou sistematicamente por amostragem.
Dependendo do detalhamento da informao, o trabalho de campo pode ser
uma das atividades mais custosas de toda a elaborao dos mapas.
99
Cartografia - Cartografia - aerofotogrametria aerofotogrametria
l E a tecnologia mais tradicional de mapeamento sistemtico, e
envolve vos especiais quanto trajetria e altitude, onde so tiradas
fotos com cmeras e angulao apropriadas, em sucesso, com
distncia conhecida e rea de superposio definida rigorosamente.
Este tipo de tcnica permite recuperar o relevo, atravs da
comparao entre as imagens de superposio a partir de ngulos
diferentes e conhecidos, de forma semelhante viso estereoscpica
do olho humano. Os mapas elaborados a partir destes dados podem
ter grande resoluo, e, como so fotografias utilizam toda a faixa
visvel simultaneamente, do azul ao vermelho, tambm o infra-
vermelho prximo.
l a tcnica que permite o desenho de cartas urbanas com grande
resoluo (1:2.000). O custo e tempo de execuo so muito
elevados.
Cartografia - imagem de satlite Cartografia - imagem de satlite
l As imagens de satlite so obtidas a partir de equipamentos colocados
em rbita a partir de 640Km., que enviam uma sucesso de imagens
digitais para uma rede de recepo distribuda em diversos pontos de sua
trajetria. O satlite tem uma rbita absolutamente regular, passa sobre o
mesmo ponto exatamente mesma hora, com o sol mesma altura e
sombreamento mantido, garantindo uma repetitividade rigorosa.
l Diversos satlites cobrem o Brasil: os mais usados so o Landsat5 Landsat5 e o
Spot Spot.
l As imagens so gravadas em diferentes canais de acordo com o
comprimento de onda, incluindo alm da faixa visvel uma de infra-
vermelho (calor). A resoluo varia de 30m. no Landsat 5 10m. no
Spot, quando utilizadas vrias bandas. Assim, considerando que uma rua
normal tem 17m., as imagens do Landsat no permitem mapear cidades,
exceto como grandes manchas e suas principais vias. J existem satlites
comerciais com resoluo de 1m.
100
Bases grficas - escala Bases grficas - escala
l Mapa: abrange grandes extenses, portanto em escalas pequenas
l Carta: regies menores, escalas mdias (carta do Estado da Bahia)
l Planta: regies ainda menores (por ex. 1:2.000), escalas grandes
(planta de uma cidade)
l Razo entre medidas no mapa e medidas reais:
m 1:2.000 1 cm. no mapa equivale a 2.000 cm. no local (20m.)
m escala pequena: razo pequena, logo quando o denominador grande
l A escala pode ser apresentada sob forma numrica ou grfica:
m 1:2.000 - representao numrica
m escala grfica:
a
b
c
100 50 0 100 200 300
M
Desenvolvimento recente da anlise espacial Desenvolvimento recente da anlise espacial
Como as tcnicas necessrias anlise espacial tm origem em
diferentes disciplinas e os dados so produzidos por diversas fontes, a
construo de projetos de anlise espacial depende da constituio de
um amplo frum de instituies, onde o setor sade essencialmente
usurio das informaes, ainda que possa representar papel articulador.
Nacionalmente, o Comit Tcnico Interinstitutional de
Geoprocessamento e Dados Espaciais (CTI-GEO) da Rede
Interagencial de Informaes para a Sade (RIPSA) vem trabalhando
no sentido de articular os diversos setores de produtores e usurios de
dados espaciais.
Os avanos recentes esto relacionados construo de bases
cartogrficas, incorporao do georreferenciamento aos Sistemas de
Informao em Sade, possibilidade de utilizao de novos (para a
Sade) SIGs e ao crescimento da capacidade analtica.
101
Bases Cartogrficas Bases Cartogrficas
l Disponibilizao da malha municipal oficial do Brasil:
m CD-ROM do DECAR/IBGE;
m no formato do TabWin (http://www.datasus.gov.br)
l Digitalizao dos mapas topogrficos no IBGE
l Base Territorial do Censo 2000 Vertente Urbana - criao de
biblioteca CAD com a malha censitria dos 1058 municpios com mais
de 25.000 habitantes (75% da populao brasileira) pronta em dezembro
de 1999:
m escala 1:5.000;
m com hidrografia bsica, quadras, toponmia, principais edificaes
l Malha censitria rural praticamente pronta, porm no h integrao
entre as diferentes escalas.
l Disponibilizao a ser discutida em conjunto MS/IBGE.
Georreferenciamento: rea mnima Georreferenciamento: rea mnima
l Caractersticas necessrias:
m Maior homogeneidade possvel, quanto a situao (rural/urbana), ocupao do
espao urbano (favela/rea urbanizada) e demais indicadores socioeconmicos
m Continuidade das feies espaciais, sem interrupo por acidentes geogrficos ou
construes
m Continuidade histrica
l Props-se o setor censitrio do Censo 2000, como tendo potencialmente
estas caractersticas.
l Outros nveis de agregao de dados podem ser construdos, atravs da
combinao de setores censitrios.
l O uso dessa unidade espacial mnima de referncia permitir tambm o
acompanhamento histrico dos municpios desmembrados, sendo
necessrio para isso que se busque manter os limites dos setores
censitrios.
102
Georreferenciamento - SIS Georreferenciamento - SIS
l A base cadastral de endereos para georreferenciar os dados dos SIS para
setor censitrio ser o Cadastro de Segmentos de Logradouros por Setor
Censitrio, componente da base territorial do Censo 2000.
l Os sistemas de informaes de bases nacionais devero permitir o
georreferenciamento para setor censitrio, utilizando este cadastro e
formato de entrada de endereo compatvel com o fornecido/acordado com
o IBGE.
l Este formato poder ser alterado pelos municpios que dispuserem de
outros cadastros e mtodos de localizao. Por isso, o DATASUS
incorporar o georreferenciamento sob a forma de um mdulo separado,
disponibilizando, caso solicitado, o programa fonte.
l O teste deste mdulo ser feito possivelmente em Campinas, Porto Velho
e Goinia
Georreferenciamento - SIS Georreferenciamento - SIS
l Considera-se que georreferenciar os SIS para setor censitrio utilizando
o cadastro do IBGE ser um avano, ainda que a utilizao de cadastro
localmente gerados tenha provavelmente melhores resultados. Entre os
problemas considerados, que devero receber particular ateno esto:
m Atualizao apenas decenal (ou nas contagens rpidas no meio do
perodo)
m Incompatibilidade deste sistema com as formas de endereamento usadas
pela populao de reas faveladas, de expanso, rural e invases
m Qualidade precria de preenchimento dos endereos nos registros de sade
103
Georreferenciamento: solues locais Georreferenciamento: solues locais
l Atualizao dos cadastros localmente, em parceria com o IBGE, e
utilizando o potencial do setor sade e sua relao com as
comunidades.
l Desenvolvimento de mtodos de georreferenciamento em reas
faveladas (e similares) atravs de identificao de grupamentos de
setores favelados contguos com o mesmo endereo urbano de
referncia entrada da favela, associao de moradores, comisso de
luz.
l Integrao SIG e o Programa de Agentes Comunitrios de Sade
(PACS)/Programa de Sade da Famlia (PSF), aproveitando as
informaes geradas por estes programas na localizao de populaes
de risco - a experincia do Ju/Caruaru.
Software - mapeamento bsico Software - mapeamento bsico
l A funo de cartograma desenvolvida no TAB-WIN (DATASUS)
possibilita a anlise exploratria dos dados dos SIS.
104
Software - anlise espacial Software - anlise espacial
l Considerando o alto custo dos aplicativos comerciais de
mapeamento e a necessidade de desenvolver nos municpios
habilidades de anlise espacial, se desenvolvem parcerias com
autores de software no comerciais:
m SPRING - INPE (http://www.dpi.inpe.br/)
m SIG-EPI - COPPE/UFRJ
l Alm disso alguns software estatsticos de domnio pblico tem
funes de anlise espacial desenvolvidas:
m R (http://www.ci.tuwien.ac.at/R/)
m WIN-BUGS
(http://www.mrc-bsu.cam.ac.uk/bugs/winbugs/contents.shtml)
Anlise Anlise espacial espacial
l Potenciais inovaes
m mapas animados - espao & tempo;
m GAM (geographic analysis machine), etc.
l Integrao estatstica/SIG
m Exportao automtica de camadas do SIG para o software
estatstico e importao dos resultados da anlise;
l Mtodos inteligentes e SIG
m Lgica difusa (fuzzy);
m Cellular automata;
m Tcnicas de otimizao (redes neurais, algoritmos genticos,
simulated annealing).
105
CONASEMS e RIPSA CONASEMS e RIPSA
Visando orientar a utilizao dos recursos dos
Sistemas de Informaes Geogrficas - SIG SIG -
para a gesto da sade, foi lanada esta
publicao voltada para os Secretrios
Municipais de Sade.
Outro documento, mais completo, incluindo
modelos de licitao para aquisio de bases
cartogrficas est em fase de preparao.
Recursos - Internet Recursos - Internet
l lista de discusso sobre anlise de dados espaciais em sade:
m http://www.ensp.fiocruz.br/servicos/ades-l.html
l lista nacional de discusso sobre geoprocessamento:
m http://www.lampada.uerj.br/fgeorj
l lista da OMS:
m HEALTH-GIS@who.ch
l pginas para navegar:
m http://www.geocities.com/Tokyo/Flats/7335/medical_geography.html
m http://curie.ei.jrc.it/ai-geostats.htm
l CTI-GEO da RIPSA:
m e-mail: georipsa@procc.fiocruz.br
m http://www.procc.fiocruz.br/~marilia/
106
Marilia S Carvalho
Escola Nacional de Sude Pblica/FIOCRUZ
http://www.procc.fiocruz.br/~marilia/
marilia@procc.fiocruz.br
Oswaldo Gonalves Cruz
Programa de Computao Cientfica/FIOCRUZ
http://www.procc.fiocruz.br/~oswaldo/
oswaldo@procc.fiocruz.br
Anlise de dados espaciais em sade
Navegue:
http://www.procc.fiocruz.br/ades/
Bibliografia
As principais referncias para estudos ecolgicos so:
Editorial (1994), AJPH, 84(15):715-716
SCHWARTZ (1994), The fallacy of Ecological fallacy: the potencial misuse of a concept
and the consequences. AJPH, 84(15):819-824
SUSSER (1994), The logic in ecological: I The logic of analysis. AJPH, 84(15):825-829
SUSSER (1994), The logic in ecological: II The logic of design. AJPH, 84(15):830-835
EVANS 1 Captulo do livro Why are some people healthy and others not ?
ROSE (1985) Bol. Epidemiol. OPS, 6(3):1-8, 1985 ou Sick Individuals and Sick
Population. Int. J . Epidemiology 14:32-38
Morgenstern, H. (1998) Ecologic Studies. In Rothman, K.J . & Greenland, S. Modern
epidemiology, 2 Edio
Para anlise de sries temporais:
Martinez-Schnell, B. & Zaidi, A. (1989) Time series analysis of injuries, Statistics in
Medicine, 8:1497-1508.
Morettin,P.A. & Toloi, C.M.C. (1987) Previso de Sries Temporais. Atual Editora, 2
Edio.
Morettin,P.A. & Toloi, C.M.C. (1987) Sries Temporais. Atual Editora, 2 Edio. (verso
reduzida, sem modelagem ARIMA)
Diggle, P. (1990) Time Series : A Biostatistical Introduction. Oxford Statistical Science
Series, No. 5 (ISBN: 0198522266 )
Para anlise espacial:
Bailey, T.C. & Gatrell, A. (1995) Interactive Spatial Data Analysis, Longman Scientific &
Technical.
Cressie, N.A.C. (1991) Statistics for Spatial Data, J ohn Wiley, Chichester.
Haining, R. (1990) Spatial Data Analysis in the Social and Environmental Sciences,
Cambridge University Press.
Isaaks, E. H. and Srivastava, R. M. (1989) An Introduction to Applied Geostatistics, Oxford
University Press, Oxford.
Cmara, G (org.). Geoprocessamento: Teoria e Aplicaes. Livro em preparao,
disponvel on line em http://www.dpi.inpe.br/ ~gilberto/livro/
Os trabalhos nacionais apresentados e os dados utilizados nos exerccios foram,
na maioria, provenientes de trabalhos de tese de diversos pesquisadores:
Eleonora dOrsi (1996). Perfil de nascimentos e condies scio-econmicas no Municpio
do Rio de Janeiro: uma anlise espacial. Tese de mestrado aprovada pela Escola
Nacional de Sade Pblica/Fundao Oswaldo Cruz. (orientao de Marilia S Carvalho
e Maria Zulmira de Arajo Hartz).
Enirtes Caetano Prates de Melo (1996) Heterogeneidade do padro da doena isqumica
do corao na Regio Sudeste - Brasil: mortalidade e utilizao de servios
hospitalares. Tese de mestrado aprovada na ENSP/FIOCRUZ. (orientao de Marilia S
Carvalho e Maria Zulmira de Arajo Hartz).
Marilia S Carvalho (1997) Identificao de reas segundo risco: uma anlise espacial.
Tese de doutorado aprovada pela COPPE/UFRJ , orientao de Flvio F. Nobre.
(http://www.procc.fiocruz.br/~marilia/)
Mirian Carvalho de Souza (em curso) - O problema da escala na anlise de dados
espaciais - aplicaes em epidemiologia. Tese em andamento na ENSP/FIOCRUZ,
orientao de Marilia S Carvalho e Oswaldo G. Cruz.
Oswaldo Gonalves Cruz (1996) Homicdios no Estado do Rio de J aneiro: anlise da
distribuio espacial e sua evoluo. Tese de mostrado aprovada pela FSP/USP,
orientao de Maria Lcia Lebro. (http://www.procc.fiocruz.br/~oswaldo/)
Simone Maria dos Santos (1999) Anlise da distribuio espacial das nmortes violentas em
Porto Alegre, no ano de 1996, e do seu contexto social. Tese de mestrado aprovada pela
Escola Nacional de Sade Pblica/Fundao Oswaldo Cruz. (O projeto foi selecionado
em concurso promovido pela OPAS para financiamento de projetos de pos-graduao na
Amrica Latina e Caribe - orientao de Marilia S Carvalho e Christovam Barcellos).
Tatiana Campos (1997) Perfil de nascimentos e bitos infantis: a busca da assistncia.
Tese de mestrado aprovada pela Escola Nacional de Sade Pblica/Fundao Oswaldo
Cruz. (orientao de Marilia S Carvalho e Christovam Barcellos)