Você está na página 1de 118

Max Sousa de Lima

Mtodos Adaptativos para Deteco de Clusters no


Espao-tempo

Belo Horizonte - MG
Agosto / 2011

Max Sousa de Lima

Mtodos Adaptativos para deteco de Clusters no


Espao-tempo

Tese apresentada ao Departamento de Estatstica do Instituto de Cincias Exatas da Universidade Federal de Minas Gerais, como requisito
parcial para obteno do ttulo de Doutor em
Estatstica.

Orientador:

Prof.Dr. Luiz Henrique Duczmal

Universidade Federal de Minas Gerais


Instituto de Cincias Exatas
Departamento Estatstica
Programa de Ps-Graduao em Estatstica

Belo Horizonte  MG
Agosto / 2011

s mulheres de minha vida,


A minha me pelo exemplo de vida que me representa.
A minha eterna namorada e esposa Milena pelos anos de amor e dedicao.
A minha lha Gabriela, razo da minha alegria e viver.

ii

Agradecimentos

Deus pela fora, sade e famlia que me concedeu.


Aos meus pais pela educao que me deram e que mesmo na diculdade sempre souberam

cuidar de mim com muito amor e carinho.


Aos meus irmos que mesmo distante sempre me apoiaram nos momentos em que precisei.
Ao meu orientador Luiz Duczmal, pelo incentivo, pela pacincia, mas acima de tudo pela

oportunidade de desenvolver com ele este trabalho.


Aos meus is escudeiros no doutorado, Rodrigo e Markus.
Aos meus amigos Fabio, Carlito, Luciano e Ronaldo cear, pela convivncia e tambm

por terem me suportado nos momentos mais difceis.


A todos os meus professores e colegas de doutorado.
Ao Departamento de Estatstica da UFMG pela oportunidade.
A minha professora, orientador e amiga de graduao Maria Ivanilde por acreditar no

meu potencial e ser a maior incentivadora da minha carreira acadmica.


A Fundao de Amparo Pesquisa do Estado do Amazonas-FAPEAM, pelo apoio

nanceiro.

iii

Resumo
Nesta tese de doutorado, ns desenvolvemos novos mtodos baseados em uma abordagem
adaptativa para deteco e monitoramento estatstico de mudanas no padro espao-temporal de
um processo estocstico. Essencialmente desenvolvemos: Razo de Verossimilhana Adaptativa,
Fator de Bayes Adaptativo e processo a posterioi adaptativo. O Foco das aplicaes a deteco
de cluster emergentes no espao-tempo, onde a classe dos possveis candidadatos a cluster
excessivamente grande o que pode dicultar a performance de qualquer mtodo desenvolvido com
este propsito. Nossos resultados mostraram que a abordagem adaptativa melhora os mtodos
em dois aspectos. Primeiro aumenta a velocidade na deteco e segundo diminui o espao dos
candidatos a cluster tornando o algoritmo mais eciente. A vantagem da abordagem adaptativa
no espao dos cluster que a cada tempo precisamos avaliar um nmero pequeno de candidatos
e ainda assim controlamos a taxa de falsos alarmes. Os mtodos propostos so aplicados a dados
reais e vrios estudos com dados simulados tambm so conduzidos. Os resultados destes estudos
sugerem que a abordagem adaptativa bastante eciente para solucionar o problema de deteco
de cluster emergentes.

Resumo

iv

Abstract
New adaptive based methods to the detection and statistical monitoring of changes in the
spatial-temporal pattern of a stochastic process are developed in this thesis. Namely, this study
focuses on the following methodologies: Adaptive Likelihood Ratio, Adaptive Bayes Factor,
and Adaptive Posterior Process. The applications aim to detect emerging space-time clusters,
where the collection of possible cluster candidates is excessively large, which could result in a
very inecient method. Results are presented, showing that the adaptive approach improves the
performance in two aspects: rst, decreasing the computation to detect emerging clusters at each
time, and second, reducing the size of the candidate clusters conguration space. Using the
adaptive approach, the evaluation of only a relatively small number of candidates is necessary.
Additionally, the false alarm rate can be controlled. Real data and simulated data are used
to demonstrate the usefulness and the practicality of the methods. Those results conrm the
theoretical advantages of the proposed methodologies to detect emerging clusters.

vi

Sumrio
Lista de Figuras

p. x

Lista de Tabelas

p. xii

1 Introduo

p. 1

1.1 Aspectos Gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p. 1

1.2 Justicativa e Importncia do Trabalho . . . . . . . . . . . . . . . . . . . . . .

p. 4

1.3 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p. 4

1.4 Estrutura do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p. 5

2 Conceitos e mtodos para a deteco de mudanas ou cluster no espao,


tempo e espao-tempo
2.1 Deteco de clusters no espao . . . . . . . . . . . . . . . . . . . . . . . . . . .

p. 6
p. 6

2.1.1

Mtodo GAM-Geographical Analysis Machine . . . . . . . . . . . . . . .

p. 7

2.1.2

Mtodo de Besag e Newel . . . . . . . . . . . . . . . . . . . . . . . . . .

p. 8

2.1.3

Mtodo de Cuzick e Edwards . . . . . . . . . . . . . . . . . . . . . . . .

p. 9

2.1.4

Mtodo de Varredura Espacial-Scan Espacial . . . . . . . . . . . . . . .

p. 9

2.1.5

Mtodo Bayesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 11

2.2 Deteco de mudanas no tempo . . . . . . . . . . . . . . . . . . . . . . . . . . p. 12


2.2.1

Mtodo de Somas Cumulativas (CUSUM) . . . . . . . . . . . . . . . . . p. 14

2.2.2

Mtodos de Shiryaev(S) e Shiryaev-Roberts (SR) . . . . . . . . . . . . . p. 14

2.2.3

Mistura da Razo de Verossimilhanas (MRV) . . . . . . . . . . . . . . . p. 15

2.2.4

Mtodos Adaptativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 16

2.2.5

Mtodo Bayesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 17

2.3 Deteco de mudanas no espao-tempo . . . . . . . . . . . . . . . . . . . . . . p. 18

Sumrio

vii

2.3.1

Formulao do Problema de deteco de clusters no Espao-Tempo . . . p. 18

2.3.2

Estatstica Scan espao-tempo . . . . . . . . . . . . . . . . . . . . . . . . p. 19

2.3.3

Estatstica Scan espao-tempo baseada no valor esperado . . . . . . . . p. 21

2.3.4

Scan espao-tempo baseada no teste escore . . . . . . . . . . . . . . . . p. 21

3 Algumas Abordagens para Deteco de Cluster no Espao-Tempo Usando


A Razo de Verossimilhana Adaptativa

p. 24

3.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 24
3.2 Formulao, Notao, LR e ALR para deteco de clusters no espao-tempo . . p. 24
3.2.1

Formulao do problema de deteco de cluster no espao-tempo . . . . p. 24

3.2.2

Notao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 25

3.2.3

Deteco de clusters no espao-tempo usando LR . . . . . . . . . . . . . p. 26

3.2.4

LR Adaptativa para deteco de clusters no espao-tempo . . . . . . . . p. 30

3.2.5

Representao Espacial dos Clusters . . . . . . . . . . . . . . . . . . . . p. 31

3.2.6

Algoritmo para deteco de clusters emergentes no espao tempo . . . . p. 33

3.3 Aplicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 33
3.4 Extenses para abordagem Adaptativa no espao dos clusters . . . . . . . . . . p. 37
3.5 Estudo com dados simulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 40
3.5.1

Performance dos mtodos . . . . . . . . . . . . . . . . . . . . . . . . . . p. 40

3.5.2

Resultados obtidos na simulao . . . . . . . . . . . . . . . . . . . . . . p. 41

3.6 Discusso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 43

4 Fator de Bayes Adaptativo para deteco de cluster no espao-tempo

p. 45

4.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 45
4.2 Anlise Sequencial de Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 45
4.2.1

Distribuies preditivas e Fator de Bayes . . . . . . . . . . . . . . . . . . p. 45

4.2.2

Fator de Bayes Local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 47

4.3 Deteco de cluster no espao-tempo via Fator de Bayes Adaptativo . . . . . . p. 48


4.3.1

Tempo de alarme para deteco de cluster no espao-tempo . . . . . . . p. 48

Sumrio

viii

4.3.2

Probabilidade de um falso alarme para o MAX-FB . . . . . . . . . . . . p. 49

4.3.3

Fator de Bayes Adaptativo . . . . . . . . . . . . . . . . . . . . . . . . . p. 50

4.4 Estrutura Geral dos Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 52


4.4.1

Modelo Padro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 52

4.4.2

Modelo Alternativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 54

4.5 Representao Espacial do cluster . . . . . . . . . . . . . . . . . . . . . . . . . . p. 56


4.6 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 60
4.7 Uma aplicao a dados reais: Deteco de cluster de Hansenase no AmazonasBrasil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 64
4.7.1

Anlise explorarria dos dados . . . . . . . . . . . . . . . . . . . . . . . p. 64

4.7.2

Aplicao do Fator de Bayes Adaptativo para os dados de Hansenase . p. 65

4.8 Resultados da Aplicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 67


4.9 Estudo com dados simulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 68
4.9.1

Dados Simulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 68

4.9.2

Anlise dos resultados obtidos com dados simulados . . . . . . . . . . . p. 71

4.10 Discusso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 73

5 Deteco de clusters emergentes via anlise a posteriori adaptativa

p. 75

5.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 75
5.2 Construo hierrquica do modelo . . . . . . . . . . . . . . . . . . . . . . . . . p. 75
5.3 Distribuies a posteriori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 77
5.4 Tempo de alarme baseado no processo a posteriori . . . . . . . . . . . . . . . . p. 80
5.5 Deteco de cluster emergente usando processo a posteriori adaptativo . . . . . p. 84
5.6 Escolha da distribuio a priori para regio e ponto de mudana . . . . . . . . . p. 85
5.7 Aplicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 87
5.7.1

Anlise dos dados de cncer da tireide . . . . . . . . . . . . . . . . . . p. 88

5.7.2

Obteno do processo a posteriori adaptativo . . . . . . . . . . . . . . . p. 91

5.7.3

Anlise dos resultados da aplicao . . . . . . . . . . . . . . . . . . . . . p. 92

Sumrio

ix

5.8 Estudo com dados simulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 95


5.8.1

Dados simulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 95

5.8.2

Anlise dos resultados obtidos com dados simulados . . . . . . . . . . . p. 96

5.9 Discusso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 97

6 Concluso
Referncias Bibliogrcas

p. 99
p. 101

Lista de Figuras
2.1 Exemplo visual do uso do mtodo GAM mostrando clusters de reas por emaranhados de crculos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p. 8

2.2 Examplo visual do uso do mtodo de Varredura Espacial - Scan circular . . . . p. 10


2.3 Examplo visual do uso do mtodo de Varredura espacial-temporal - Scan espaotempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 21
3.1 Mapa do Novo Mxico. Fonte: US Census. . . . . . . . . . . . . . . . . . . . . . p. 34
3.2 Monitoramento on-line usando MAX, MIX and WEIGHT-ALR com B(threshold)=20
p. 37
3.3 Comparao do monitoramento On-line usando o MAX-ALR com GMAX-ALR
em (a) e MIX-ALR com GMIX-ALR em (b) com B(threshold)=20. . . . . . . . p. 39
3.4 Amostra de uma simulao do processo para GMIX and GWEIGHT-ALR na
escala logartmica com log(B)=(threshold)=log(20). . . . . . . . . . . . . . . . . p. 43
3.5 Histograma Bivariado para o GMIX-ALR: Sensitividade (Sensitivity) versus
atraso (Delay) em (A) e Valor Predito Positivo (PPV-Positive Predicted Value)
versus Delay(atraso) em (B). . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 43
3.6 Histograma Bivariado para o WEIGHT-ALR: Sensitividade (Sensitivity) versus
atraso (Delay) em (A) e Valor Predito Positivo (PPV-Positive Predicted Value)
versus Delay(atraso) em (B). . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 43
4.1 Uma possvel representao para as densidades preditivas em relao aos mod-

elos padro e alternativo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 57


4.2 Exemplo de uma Elipse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 58
4.3 Formato de Clusters que podem ser detectados . . . . . . . . . . . . . . . . . . p. 58
4.4 Coeciente de Deteco de Hansenase (por 10000 ml hab) no Estado do Ama-

zonas(em azul), segundo o ms, nas cidades: Manaus(em verde), Humait (em
vermelho) e Itacoatiara (em preto) . . . . . . . . . . . . . . . . . . . . . . . . . p. 65
4.5 Mapa do Estado do Amazonas com os municpios espacialmente representados
pelas coordenadas de seus centrides. . . . . . . . . . . . . . . . . . . . . . . . . p. 66

Lista de Figuras

xi

4.6 Monitoramento on-line usando Fator de Bayes Sequencial Adaptativo com janela
w = 3, = 0, 05

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 68

4.7

cluster detectado usando o Fator de Bayes Sequncial Eliptico

t [15, 17]

. . . . . . . . . . . . p. 68

4.8

cluster detectado usando o Fator de Bayes Sequncial Eliptico

t [16, 18]

. . . . . . . . . . . . p. 69

4.9 Mapa do Novo Mxico. Fonte: US Census. . . . . . . . . . . . . . . . . . . . . . p. 70


4.10 Mximo do Fator de Bayes Adaptativo em (A), Cardinalidade J n de n em (B)
para 1000 simulaes do processo sobre o modelo padro com = 0.2; Mximo
do Fator de Bayes Adaptativo em (C), Cardinalidade J n de n em (D) para
1000 simulaes do processo sobre o modelo padro com = 0.4 . . . . . . . . . p. 71
4.11 Histograma Bivariado para o Fator de Bayes Adaptativo com = 0.2: Sensitividade versus atraso e Valor Predito Positivo versus atraso . . . . . . . . . . . p. 73
4.12 Histograma Bivariado para o Fator de Bayes Adaptativo com = 0.4: Sensitividade versus atraso e Valor Predito Positivo versus atraso . . . . . . . . . . . p. 73
4.13 Distribuies Preditivas e Padro aps o ponto de mudana nas reas que compe o cluster: Chaves em (A), Eddy em (B), Lea em (C) e Otero em (D). . . . p. 74
5.1 Uma Classe de clusters com formato circular e tamanho varivel . . . . . . . . . p. 86
5.2 Mapa do Novo Mxico. Fonte: US Census. . . . . . . . . . . . . . . . . . . . . . p. 88
5.3 funo de densidade weibull (f.d), funo de densidade do mximo de m-variveis
weibull (f.d. max), Funo de distribuio weibull (F.d), Funo de distribuio
do mximo de m-variveis weibull (F.d. max), 1-Funo de distribuio weibull
(1-F.d), 1-Funo de distribuio do mximo de m-variveis weibull (1-F.d. max) p. 90
5.4 A esquerda: Mxima probabilidade a posteriori adaptativa para m=2, ponto
k=15 e regio da mudana; A direita: Mxima probabilidade a posteriori adaptativa para m=8, ponto k=19 e regio da mudana. . . . . . . . . . . . . . . . . p. 94
5.5 Em (A): Mxima probabilidade a posteriori adaptativa para m=2, 4 e 8; Em
(B) Razo valor observado por valor esperado xt (sl )/et (sl ), t k = 1, 2, ..., n
para as regies do cluster emergente detectado e considerado signicativo . . . p. 94
5.6 Amostra de uma simulao do processo a posteriori adaptativo para distribuies
de referncia Weibull e Uniforme com: = 2, B=0.5, m=2,4,8 . . . . . . . . . . p. 96

xii

Lista de Tabelas
3.1

Deteco de clusters emergentes de casos de cncer da tireide em homens que ocorreram no Novo
Mxico, usando o MIX-ALR e WEIGHT-ALR nos ltimos cinco anos.

. . . . . . . . . . . . . p. 37

3.2 Valores estimados para Sensitividade (SSC), Valor Predito Positivo (VPP) e
Atraso (ADD) com diferentes valores para t,j , diferentes taxas aceitveis de
alarmes falsos () usando o GMIX e GWEIGHT-ALR. . . . . . . . . . . . . . . p. 42
4.1 Interpretao do Fator de Bayes (Kass e Raftery, 1995) . . . . . . . . . . . . . . . . p. 52
4.2 Percentual de rea de uma elipse que tambm parte de qualquer outra elipse com o
mesmo centro, forma e tamanho,porm com quantidades (#) diferentes de ngulos . . p. 59

4.3 Valores estimados para Sensitividade (SSC), Valor Predito Positivo (VPP)
e Atraso (ADD) com diferentes valores para , diferentes probabilidades de
alarmes falsos () usando o Fator de Bayes Adaptativo Eliptico com janela w=3. p. 72
5.1 Valores para p de acordo com o valor de w e p0 = 0.5. . . . . . . . . . . . . . . p. 91
5.2 Valores estimados para Sensitividade (SSC), Valor Predito Positivo (VPP)
e Atraso (ADD) usando o processo a posteriori adaptativo com janela w=6,
diferentes valores para e duas distribuies para G0 : Weibull(2,1.414) e Uni(0,2) p. 97

1 Introduo

1.1 Aspectos Gerais


Mtodos estatsticos aplicados anlise de dados, obtidos periodicamente pelos sistemas de
vigilncia(em sade pblica, crime ou ambiental) so importantes para detectar cluster de eventos, os quais podem indicar uma rpida mudana no padro dos dados observados. Geralmente,
um cluster uma inesperada aglomerao de eventos no espao, tempo ou no espao-tempo.
Quando o perodo de vigilncia pr-especicado e os eventos so avaliados de acordo com sua
distribuio espacial, um cluster (cluster espacial) representado por um sub-conjunto de localizaes espaciais da regio em estudo onde a taxa de ocorrncia de tais eventos elevada de
forma siginicativa. Se o espao ignorado, representamos o cluster pelo grupo (ou sequncia)
de observaes que causam uma mudana no padro temporal dos dados. No entanto, se o espao e o tempo so monitorados simultaneamente, um cluster espao-temporal identicado por
um par (localizaes espaciais, intervalo de tempo) para o qual ocorreu a mudana. Deteco
de cluster tem sido o foco de uma variedade de sistemas de vigilncia: Sistema de vigilncia
em crimes (Gorr and Harries, 2003) para detectar cluster emergentes de eventos relacionados a
algum tipo de crime; Sistema de vigilncia em doenas para monitorar dados de sade pblica
como por exemplo visitas em hospitais (Sabhnani et al., 2005) ou cluster de casos de doenas
(Kulldor, 2001); Sistemas de monitoramento ambiental para detectar altos nveis de poluio
no ar e gua (Ailamaki et al., 2003) ou detectar cluster emergentes de queimadas em orestas
(Tuia et al., 2008).
Na escala espacial, o problema de deteco de clusters abordado atravs de testes de
hipteses. Nestes testes, primeiramente assumido que a regio em estudo dividido em l reas
contguas. A hiptese nula de que a taxa de ocorrncia dos eventos constante sobre toda a
regio. A hiptese alternativa de que existe uma elevada taxa em alguma sub-regio conexa de
tamanho menor ou igual a l. A localizao e o tamanho do cluster so assumidos desconhecidos.
Logo, existem 2l 1 subconjuntos de reas candidatos a cluster dentre os quais teremos que
vericar quais so clusters conexos. Muitos testes baseados em algoritmos computacionalmente
intensivos, (Turnbull et al., 1990; Cuzick and Edwards, 1990; Besag and Newell, 1991; Walter,
1994; Tango, 1995; Kulldor, 1997;Held and Raber, 2000; Patil and Tallie 2003; Duczmal and

1.1 Aspectos Gerais

Assuno, 2004; Tango, 2005; Kulldor et all., 2006; Gangon and Klayton, 2007; Duczmal et
all., 2007),tm sido desenvolvidos para detectar e estimar a localizao do cluster. Estes mtodos
no levam em considerao a incerteza sobre o tamanho e localizao do cluster.
Na escala temporal, a deteco de uma mudana na taxa de ocorrncia dos eventos em um

cluster (grupo) de observaes pode ser realizada usando mtodos desenvolvidos para monitoramento de processos industriais como por exemplo o mtodo CUSUM (Page, 1954), ShiryayevRoberts (Roberts, 1966) ou mistura de razes de verossimilhanas (Pollak, 1987). Uma boa
reviso sobre estes mtodos e suas variaes pode ser vista em Lai (1995). Usualmente esses
mtodos assumem que no estado de controle do processo, existe uma taxa padro conhecida 0
de eventos, e sob a suposio de um ponto de mudana no processo, a taxa muda para 1 tambm
assumida conhecida. Na prtica essas suposies nunca so satisfeitas e uma alternativa usar
mtodos adaptativos (Lorden e Pollak, 2005; Tartakovsky, 2006) ou dinmicos (West, 1986).
Na escala espao-temporal, a deteco de cluster pode ser entendido como um problema
de deteco de regio e ponto de mudana no espao-tempo. Estatsticamente este problema
descrito da seguinte forma: Denote por S uma regio de estudo particionado em L-reas Al
contguas identicadas por um ponto sl . Onde, por exemplo, S um mapa e sl representa o
centride do polgono que delineia a rea Al . Consider sobre S o monitoramento (ou a vigilncia)
estatstico(a) de um processo estocstico X = {Xt (sl ), t = 1, 2, ... e l = 1, 2, ...L}. A cada
tempo discreto t 1 observamos um vetor L-variado Xt = (Xt (s1 ), Xt (s2 ), ..., Xt (sL ))0 , em
que Xt (sl ) representa alguma valor observado na l-sima rea. Sejam = {sl S : sl }
um conjunto conexo de localizaes espaciais em S , Hn = {X1 , ..., Xn } o conjunto de dados
acumulados at o instante n. O objetivo da monitoramento vericar se existe algum cluster
emergente em S . O interesse detectar um cluster que comeou em um tempo desconhecido
k n e que est presente at o estgio atual n. O cluster no espao-tempo expresso em funo

de uma mudana no padro da distribuio do sub-processo {Xt (sl ) X : sl , t k} tal que


n,k = {sl S : sl } [k, n] representa o cluster no espao-tempo tambm chamado de cluster

emergente.
Para solucionar o problema de deteco de cluster emergente no espao-tempo alguns mtodos tm sido propostos. Kulldor(2001) usa a estatstica scan espao-tempo para monitoramento
de casos de doenas. No entanto, essa estatstica no controla adequadamente o erro tipo I, para
todas as anlises sequenciais realizadas. Rogerson(2001), props o uso de uma estatstica de
Knox local (Knox, 1963) combinada com mtodos de somas cumulativas (CUSUM) usando aproximaes pela distribuio normal para monitoramento de cluster em processos pontuais. Marshall(2007) discute vrios problemas ao se ultilizar estas aproximaes e sugere que este mtodo
no seja usado. Variantes da Estatstica Scan espao-temporal so apresentadas em Neill (2006).
Sonesson (2007) usa a estatstica CUSUM para deteco de cluster no espao-tempo em dados
de rea. Porter (2007) ultiliza verses adptativas dos mtodos CUSUM e Shiryayev-Roberts

1.1 Aspectos Gerais

para deteco de mudanas no espao-tempo em processos de Poisson Homogneo. Assuno


e Corra (2009) monitoram a funo de intensidade de um processo de Poisson heterogneo no
espao-tempo atravs da estatstica de Shiryayev-Roberts. Lima e Duczmal(2009,2011) propem
o Fator de Bayes Cumulativo para monitoramento e deteco de cluster em dados de rea com
taxa padro conhecida. Tango (2010) Usa uma estatstica scan combinada com um teste score
para deteco de cluster no espao-tempo em uma janela temporal varivel.
No geral, poucos mtodos para deteco e monitoramento de clusters tm sido propostos
com o intuito de desenvolver um sistema de vigilncia que soe um alarme assim que um cluster
no espao-tempo seja detectado. Uma reviso dos mtodos sugeridos na literatura para deteco
seqencial de mudanas no monitoramento de dados de sade pblica na escala temporal
apresentada por Sonesson e Bock (2003). Frisen (2003) discute as propriedades timas de um
bom sistema de vigilncia e refora a necessidade de mtodos estatsticos e sistemas apropriados
para a deteco prospectiva de cluster no espao-tempo de forma rpida e eciente.
A escassez de mtodos para monitoramento e deteco de cluster no espao tempo, pode
ser justicada pelo fato que para detectar qualquer mudana inesperada na taxa de certos tipos
de eventos, faz-se necessria uma anlise repetida de dados acumulados ao longo do tempo e,
qualquer mtodo desenvolvido tem que ser ajustado para o problema de t (2l 1) comparaes
no espao-tempo, para cada tempo t. Para isso, neste trabalho ns desenvolvemos novos mtodos
para deteco de cluster e que podem ser usados como ferramenta auxiliar em sistemas de vigilncia em que o foco principal a deteco de cluster emergentes no espao-tempo. Os mtodos
desenvolvidos nesta trabalho so baseados em uma abordagem adaptativa para os parmetros.
Em essncia isso signica que os parmetros desconhecidos so estimados a cada tempo t com
os dados acumulados at o instante anterior t 1. bvio que a medida que aumentamos a
classe de candidatos a cluster e o tempo de vigilncia, ns aumentamos o nmero de teste mtiplos no espao-tempo. No entanto, ao aplicamos uma estimao adptativa tambm no espao
dos clusters, melhoramos os mtodos de deteco em pelo menos dois aspectos: 1) aumento
na velocidade de deteco; 2) diminui o espao dos cluster tornando o algoritmo mais rpido
e eciente. A vantagem da abordagem adaptativa no espao dos cluster que a cada tempo
precisamos avaliar poucos candidatos e ainda assim controlamos a taxa de falsos alarmes. Ao
combinarmos tcnicas de vigilncia na escala temporal com estimao adaptativa e algortmos
para deteco de cluster espacial, ns propomos uma vigilncia no espao-tempo usando: Razo
de verossimilhana adaptativa, Fator de Bayes Adaptativo, distribuio a posteriori adaptativa.
Os mtodos desenvolvidos neste trabalho no requerem o uso de simulaes de Monte Carlo para
validar a signicncia estatstica do procedimento. Fato esse que comum aos procedimentos
existentes na literatura e pode tornar a anlise muito demorada dependendo do tamanho da
partio da regio em estudo.

1.2 Justicativa e Importncia do Trabalho

1.2 Justicativa e Importncia do Trabalho


Devido ao avano computacional, tm surgido um grande interesse na construo de sistemas
de informaes governamentais que funcionem como uma importante ferramenta de auxlio no
controle da administrao pblica. Um exemplo o e-siga (Sistema de Informaes Governamental do Amazonas). O e-siga um sistema on-line operacional que permite, entre outros recursos,
o acompanhamento dos problemas epidemiolgicos e monitoramento em tempo real dos fatores
adversos a sade do amazonense. nesse sentido, e tendo em vista o crescente interesse pelo estudo de agregados (cluster) espao-temporais de doenas, que ns propomos novas metodologias
para deteco e vigilncia de clusters em mapas de doenas, criminalidade, etc.... Uma lacuna na
literatura, que justica apresentao deste trabalho, a ausncia de uma sistematizao crtica
que amplie o horizonte de aplicaes dos mtodos de deteco de clusters para alm da investigao etiolgica de doenas raras, ou endmicas, e oriente o investigador na escolha da deciso
mais adequado aos seus objetivos.

1.3 Objetivos
Esta tese de doutorado teve como objetivo geral o estudo dos mtodos estatsticos para
deteco de clusters no espao-tempo, assim como o desenvolvimento de novos mtodos. Como
objetivos especcos tivemos:
1. Desenvolvimento de um novo mtodo estatstico baseado em estatstica bayesiana ou clssica para deteco e vigilncia de cluster no espao-tempo em dados de rea e processos
pontuais.
2. Utilizar o mtodo desenvolvido como parte de um sistema de vigilncia em alguns tipos de
eventos como, por exemplo, os casos de Hansenase no estado do Amazonas.
Com o desenvolvimento destas novas metodologias para deteco de cluster no espao-tempo,
esperamos dar as seguintes contribuies:
Estabelecer novas metodologias tcnico-cientcas para vigilncia no espao-tempo de even-

tos.
Desenvolvimento de mtodos estatsticos que ajudem e identiquem rapidamente as reas

prioritrias onde ocorram clusters de eventos para que aes preventivas sejam tomadas o
mais rpido possvel.

1.4 Estrutura do Trabalho

1.4 Estrutura do Trabalho


No Captulo 2 apresentamos uma breve reviso sobre o problema de deteco de cluster no
espao, tempo e no espao-tempo. Alguns mtodos "clssicos"na literatura so descritos. Uma
denio formal e a questo de como avaliar a perfomance de um mtodo para a deteco de

cluster no espao-tempo tambm discutida. No Captulo 3, Ao combinarmos algoritmos usados para deteco de clusters espaciais com tcnicas de estimao adaptativa, ns generalizamos
para detco de clusters no espao-tempo algumas funes de monitoramento baseadas na razo
de verossilhana e que antes eram usadas para monitoramento somente na escala temporal. No
Captulo 4, ns extendemos para deteco de cluster no espao-tempo com janela temporal variavvel o Fator de Bayes Sequncial. Neste caso ns impomos tambm uma estimao adaptativa
no espao dos cluster e realizamos uma varredura no espao-tempo atravs de cilindros com base
eliptica. No Captulo 5, incorporamos a incerteza sobre a localizao espacial e sobre o tempo
de mudana atravs de uma distribuio a priori para o cluster, e realizamos uma anlise a

posteriori no espao-tempo para deteco de cluster emergentes. Finalmente estabecemos nossas


concluses no Captulo 6.

2 Conceitos e mtodos para a deteco de


mudanas ou cluster no espao, tempo e
espao-tempo

2.1 Deteco de clusters no espao


A anlise de clusters espaciais tem recebido uma ateno considervel em diversas reas do
conhecimento. O objetivo bsico em um problema de deteco de cluster determinar automaticamente regies do espao onde tenha ocorrido uma mudana no esperada no padro espacial
do processo estocstico observado. Essas mudanas no padro espacial podem corresponder a
uma variedade de fenmenos, dependendo do campo de aplicao como, por exemplo, deteco
de cluster de doenas, de estrelas ou galxias, de focos de queimadas em orestas, de incidncias
de algum tipo de crime, de alguma espcie de animais.
Os estudos de clusters so baseados em localizaes de eventos (processo pontual) ou agregado de eventos(dados de rea). Em ambos os casos a heterogeneidade da populao estudada
assumida conhecida e em certas situaes algumas medidas de covariveis tambm podem ser incorporadas. Um processo pontual pode ser transformado em dados de rea. Por isso, nosso foco
so processos espaciais modelados como processos medidos em reas (ou dados de reaa). Neste
caso, supomos que existe um processo estoctico X(s) = {X(sl ) : l = 1, 2, ..., L}. Onde X(si ) a
realizao do processo na rea Al completamente identicada por um ponto sl S = {s1 , ..., sL }.
Tipicamente, S um mapa particionado em L reas e sl (no necessariamente) o centro do
polgono que delinea a rea Al .
Os mtodos usuais utilizados para a deteco de clusters espaciais so baseados em testes
de hipteses, utilizam algoritmos computacionamente intensivos que procuram identicar um
conjunto conexo de localizaes (ou rea geogrcas) com uma ocorrncia de eventos acima (ou
abaixo) do esperado sem pr-especicar quais e quantas reas so. A hiptese nula do teste
representa a completa aleatoriedade espacial dos eventos implicando que a taxa de ocorrncia
unitria de eventos (por pessoa, animal, rvore) a mesma em todas as reas de modo que
o nmero esperado de eventos em um local proporcional ao nmero de pessoas (ou animais,

2.1 Deteco de clusters no espao

rvores) habitando neste local. Geralmente, sob a hiptese nula


H0 : X(sl ) P oisson(N (sl )).

Onde uma taxa de ocorrncia global dos eventos e N (sl ) representa o nmero total da
populao em risco habitando em Al .
Muitos mtodos para a deteco de clusters espaciais tm sido desenvolvidos com diferentes
propsitos. Uns avaliam a existncia de um cluster global, sem especicar sua localizao. Outros
determinam a localizao e avaliam a signicncia estatistica do cluster. Estes mtodos usam
tcnicas computacionalmente intensivas como permutao aleatria, Monte Carlo, etc. Os mais
usuais, entre estes mtodos, assumem que temos a disposio um mapa S de reas , cada uma
com populao de risco e um certo nmero de eventos observados. Eles utilizam janelas espaciais
que superpe conjuntos conexos, com algum formato geomtrico (crculo, quadrado, elipse), sobre
as reas de estudo e contam o nmero de eventos que ocorrem nas regies cujos os centrides
caem dentro de cada janela espacial. Um problema comum na deteco de cluster o ajuste para
mltiplas comparaes. Este problema acontece quando listados todas os conjuntos conexos que
em princpio podem representar um cluster (ou candidadto a cluster) e para cada um deles
testado se sua taxa de ocorrncia de eventos difere de forma signicativa daquela associada com
o restante do mapa. Aqueles conjuntos em que o teste fosse signicativo seriam considerados
um agregado de taxa acima (ou) abaixo do esperado. Este procedimento inadequado para esta
situao pelo seguinte fato: suponha que vrios testes so realizados com nvel de signicncia
global . Ento, vrios teste sero signicativos mesmo que a hiptese nula seja verdadeira em
todos eles. Isto ocorre porque achamo que o valor usado individualmente continua o mesmo.
Na verdade, para o conjunto de todos os testes, este nvel de signicncia ser muito maior que
o valor nominal para os testes individuais. Esta situao s vlida, quando consideramos todos
os testes simultaneamente. O resultado da prtica desse fato que muitos falsos cluster seriam
detectados por este mtodo. Vejamos, agora, alguns mtodos para deteco de cluster.
2.1.1

Mtodo GAM-Geographical Analysis Machine

Para a deteco de cluster espacial, Openshaw et al. (1988) propuseram um mtodo computacionalmente intensivo com grande apelo visual chamado Geographical Analysis Machine,
abreviado por GAM. Neste mtodo, assuma que X(sl ) representa o nmero de eventos que
ocorrem na rea Al com o valor esperado, sob H0 dado por N (sl ). Associe os valores observados de cada rea aos seus centrides (centro do polgono que delineia a rea Al ) denotados por
sl . O procedimento

GAM usa o seguinte algortimo:

Selecione um raio r (por exemplo, r=1,2 ou 4 km).


Em cada centride sl xe um crculo Clr de raio r.

2.1 Deteco de clusters no espao


Calcule
Xlr =

L
X

X(sl )I{sl Clr }

e Nlr =

l=1

L
X

N (sl )I{sl Clr }

l=1

o nmero de eventos e o nmero total da populao em risco habitando no crculo Clr ,


onde I{B} a funo indicadora do evento B .
Calcule o valor-p, plr do teste assosiado a X(sl ), sob a hiptese nula, H0 : X(sl )
P oisson(N (sl )).
Desenhe o crculo Clr se plr 0.002
Repita o procedimento acima aumentando (ou escolhendo) outro raio para o crculo.

O resultado nal a identicao de clusters de reas por emaranhados de crculos sobrepostos


como mostrado na gura (2.1).

Figura 2.1: Exemplo visual do uso do mtodo GAM mostrando clusters de reas por emaranhados de crculos
Embora cada crculo seja julgado individualmente signicativo ao nvel 0.002, um nvel de
signicncia para todos os crculos simultaneamente no conhecido. O motivo o uso de testes
simultneos no independentes que, neste caso, so devidos a comparao de um imenso nmero
de crculos sobrepostos.
2.1.2

Mtodo de Besag e Newel

No mtodo GAM de Openshaw xa-se o raio r do crculo e calcula-se o valor-p sobre o


nmero de eventos que ocorrem no crculo Clr . Em termos gerais, no mtodo Besag e Newel
(1991) xa-se o nmero y de eventos que devem ser buscados e calcula-se o raio necessrio para
englob-los. No crculo resultante, calcula-se o p-valor e procedendo como o GAM, desenha
crculos signicativos (valor-p 0.002). Repete o procedimento variando o valor de y .
Para computar o valor-p, seja X =

l=1 N (sl ). Centrado em sl , assuma

que rea Al possui pelo menos um caso. Seja L a varivel aleatria que conta o nmero de outras

PL

l=1 X(sl )

eN=

PL

2.1 Deteco de clusters no espao

reas (ou centrides) necessrias para acumular os y primeiros casos mais prximos de sl . Seja l
e N o total da populao nessas l reas. Sob a hiptese nula (a mesma do
o valor observado de L
l

mtodo GAM), Xl o nmero de eventos nessas l reas segue uma distribuio de Poisson com
l) = 1 P (L
> l + 1) representa
valor esperado dado por Nl X/N . Agora, notando que P (L

1 menos probabilidade de as l primeiras reas possuam menos que y eventos. Ento o valor-p
para um crculo Cly centrados em sl contendo y eventos dado por,
ply = 1

y1
X

P (Xl = j) = 1

j=1

j=1

2.1.3

y1
X
(NX/N )j

j!

eNl X/N .

Mtodo de Cuzick e Edwards

Cuzick e Edwars(1990) zeram uma proposta que representa uma pequena variao em
relao aos mtodos de Besag e Newel (1991). Como em Besag e Newel (1991), inicia-se xando
o nmero de eventos y . A seguir, em torno do centride de cada rea Al que possui pelo menos um
evento, traa-se um crculo que vai se expandindo por aumentarmos o seu raio at que o crculo
contenha uma populao para qual espera-se observar y eventos. Depois, verica-se quantos
eventos Xl foram de fato observados e calcula-se a estatstica
Uy =

L
X

(Xl y)I{x(sl )>0} .

l=1

Cuzick e Edwards (1990) derivaram as frmulas dos momentos desta estatstica sob a hiptese
nula e mostraram que ela possui uma distribuio assintoticamente normal possibilitando assim
calcular o valor-p para o teste.
2.1.4

Mtodo de Varredura Espacial-Scan Espacial

Kulldor e Nagarwalla (1995) e Kulldor(1997) apresentam um mtodo que generaliza os


anteriores e permite resolver o problema de teste mltiplos. Denote por uma classe de subconjuntos conexos candidatos a formarem cluster. Neste texto, denimos = {sl S : sl }.
Suponha por exemplo que um crculo de raio r arbitrrio centrado em cada um dos L centrides sl . Em tese, existe um nmero innito de tais crculos mas, na prtica, estes crculos
podem ser restritos apenas aqueles centrados em si e com raios iguais as distncias (distncia
Euclidiana) entre si e o demais centrides. O motivo que crculos com raios ligeiramente diferentes vo conter, em geral as mesmas reas e portanto denem o mesmo possvel conjunto de
localizaes espaciais. A cardinalidade de pode ser reduzida se colocarmos um limite no raio
de modo que nenhum contenha mais do que uma certa porcentagem de centrides, tal como
20% de todos os centrides ou de toda a populao em risco.

2.1 Deteco de clusters no espao

10

O mtodo de varredura espacial de Kulldor, tambm conhecido como Scan, baseado na


razo de verossilhana generalizada. O parmetro neste caso (, p0 , p1 ) onde denota um
conjunto de localizaes espaciais, parametrizado pelo seu raio e coordenadas do centro, p0 a
probabilidade de ocorrer um evento em e p1 a probabilidade de ocorrer um evento no conjunto
/ }. As hipteses testadas so;
complementar de em S denotado por = {sl S : sl
H0 : p0 = p1 ,

para todo si S

H0 : p0 > p1 ,

para todo si

e
Observe que sob H0 a probabilidade de ocorrncia de um evento a mesma em qualquer rea.
Sejam, respectivamente, N () o nmero de indivduos e X() o nmero de eventos em , e
ainda, N e X o nmero total de indivduos e eventos na regio. A funo de verossimilhana
para o parmetro (, p0 , p1 ) dada por,
x()

L(, p0 , p1 ) = p0

xx()

(1 p0 )N ()x() p1

(1 p1 )N N ()x+x() .

A razo de verossimilhana generalizada para um xo


sup L(, p0 , p1 )

RV () =

p0 >p1

sup L(, p0 , p1 )

p0 , p1 (0, 1).

p0 =p1

Ento a estatstica Scan denida como T = maxRV (), e o cluster espacial estimado =

arg[maxRV ()]. A distribuio de T depende da distribuio da populao e difcil de ser

obtida analiticamente. Recetemente, algumas aproximaes tm sido propostas em alguns casos


particulares. Assim, a soluo proposta ultilizar mtodos de simulao de Monte Carlo para
obter a distribuio emprica de T condicionada no nmero total de eventos observados X .
Desta forma o valor-p emprico obtido aps um grande nmero de simulaes do processo (por
exemplo, 1000 vezes) sob a hiptese nula. Existem vrias extenses para este mtodo como por
exemplo: Scan Eliptico (Kulldorf et all, 2006 ), Scan irregular (tango e Takahashi, 2005). Uma
representao da varredura espacial realizada pela estatstica Scan mostrada na gura (2.2)

Figura 2.2: Examplo visual do uso do mtodo de Varredura Espacial - Scan circular

2.1 Deteco de clusters no espao


2.1.5

11

Mtodo Bayesiano

Os mtodos descritos anteriormente so usados para detectar um nico cluster, e no levam


em considerao a incerteza sobre a estrutura (forma e tamanho) do cluster. Com intuito de
solucionar este problema do ponto de Bayesiano, Gangnon e Clayton (2000) utilizam uma modelagem bayesiana para o problema de deteco de cluster. Basicamente, os autores assumem que
X(sl )|(sl ) P oisson((sl )N (sl )), em que a incerteza sobre (sl ) e o cluster descrita atravs

de uma distribuio de probabilidade. Suponha que o interesse detectar cluster atravs de


mudanas na distribuio do vetor ((s1 ), ..., (sL )). Ento uma abordagem bayesiana com distribuies a priori hierrquicas construda. Primeiramente, o espao divido em c + 1 grupos
com vrios componenetes ou reas. denote um desse grupos por grupo padro 0 (no sentido de
que estes componentes no formam um cluster) e os demais b grupos de clusters. Identique um
modelo com b cluters por um vetor = (1 , ..., L ) onde l = 0 se sl 0 e l = j se sl pertence
ao cluster j = 1, 2, ..., c.. Esta modelagem importante pois permite uma nica representao
para qualquer . Agora, dado um assuma que cada sl pertencente ao cluster j possui taxa de
eventos j e seja = (0 , 1 , ..., c ).
Assuma uma distribuio a priori permutvel para (1 , ..., c ). Mais especicamente, assuma
que 0 | gama(a0 , b0 ) e j | gama(a, b) onde gama(a,b) representa a distribuio gama
com mdia a/b e varincia a/b2 . Dado X(s) = (X(s1 ), X(s2 ), ..., X(sL )) e , 0 , 1 , ..., c so
independentes com distribuies
0 |X(s), gama(a0 + X0 , b0 + N0 )

e
j |X(s), gama(a + Xj , b + Nj ), j = 1, 2, ..., c.

onde, Xj =

PL

l=1 X(sl )I{l =j}

o nmero total de eventos no cluster j , Nj =

PL

l=1 N (sl )I{l =j}

o total de indivduos no cluster j , a verossimilhana marginal de X(s)| dada por,


Z
p(X(s)|) =

f (X(s)|)(|)d

onde f funo de densidade de X(s)| e a distribuio condicional de |. A distribuio


a priori para da forma

() exp

c
X

Sj ,

j=1

onde Sj escore para o cluster j dependendo somente das caractersticas(forma, tamanho) do

cluster. Desta forma a distribuio a posteriori de obtida por,


(|X(s)) p(X(s)|)().

um algoritmo de varredura no espao dos candidatos a cluster construdo e selecionamos o

2.2 Deteco de mudanas no tempo

12

modelo de cluster com mxima probabilidade a posteriori.

2.2 Deteco de mudanas no tempo


Deteco rpida de uma mudana na distribuio de uma sequncia (Xt )t1 de variveis (ou
vetores) aleatrios um problema muito importante em muitas reas, como controle de qualidade
e vigilncia epdemiolgica. Comeando com o trabalho pioneiro de Shewhart (1931), uma vasta
literatura foi produzida com este objetivo e vrios mtodos competitivos foram desenvolvidos.
Alm do mtodo de Shewhart, o CUSUM (Page, 1954) e Shiryayev-Roberts (Roberts, 1966) so
os mtodos mais conhecidos para detecco de uma mudana no tempo. Esses mtodos tm sido
extensivamente discutidos, e suas performances comparadas de acordo com algum critrio de
otimalidade (Lai, 1995; Srivastava e Wu,1993).
Para utilizar esses mtodos, realizamos um monitoramento estatstico de um processo estocstico {Xt : t = 1, 2, ...} com o objetivo de detectar uma mudana importante no processo, em
um tempo desconhecido k , to rpida e precisa quanto possvel. Especicamente, seja x1 , x2 , ...
uma sequncia de observaes do processo em monitoramento com densidade (ou funo de probabilidade) f (xt , xt1 , ..., x1 |). A cada tempo t deve-se discriminar entre dois estados do processo:
fora-de-controle ou sob-controle. A deteco de uma mudana no tempo fornecida atravs da
avaliao de todos os dados passados. O momento de mudana o primeiro ponto no tempo
para o qual existem evidncias sucientes de que uma mudana importante tenha ocorrido.
Matematicamente, o monitoramento feito usando uma funo de alarme t = t (x1 , ..., xt )
e um limite de controle B , tais que o tempo de alarme, , de uma possvel mudana dada por,
= min{t : t > B}.

Se t excede B , ento h uma indicao que o processo est no estado fora-de-controle e um


alarme soado. Se o processo est sob-controle, todos os alarmes so falsos. O valor de B
geralmente especicado de forma a minimizar a ocorrncia de alarmes falsos e t pode ser, por
exemplo, o max1kt logtk onde tk a razo de verossimilhana para as observaes entre os
tempos k e t, ou simplesmente o Fator de Bayes.
Em situaes de monitoramento, realizamos anlises repetidas sobre o estado do processo.
Desde que o processo pode eventualmente mudar durante o monitoramento, o nvel de signicncia e poder do teste no so medidas apropriadas para a avaliao. Algumas medidas especiais
tem sido sugeridas por vrios autores (Sonesson, 2007). Dentre elas temos:
1. ARL0 (average in-control run length): a principal medida utilizada para descrever a
performance do mtodo quando o processo est sob controle. Este denido como o
nmero mdio de observaes at que uma mudana no processo seja detectada, sob a

2.2 Deteco de mudanas no tempo

13

hiptese de que no houve nenhuma mudana. Quando o processo est sob controle, todos
os alarmes so falsos. A distribuio do alarme falso geralmente resumida pelo ARL0 ,
denido por
ARL0 = E0 [ ].

Em que E0 o valor esperado sobre a hiptese de que a mudana no ocorreu. A taxa


de falsos alarmes (FAR-False alarm rate) geralmente expressa por F AR = 1/ARL0 =
1/E0 [ ]. Quando o valor do ARL0 alto, teremos poucos alarmes falsos, mas pequenas

mudanas reais podem no ser muito bem detectadas. Da mesma forma, para valores
pequenos de ARL0 , as mudanas reais geralmente sero detectadas, mas alarmes falsos
tambm sero mais frequentes.
2. Delay (atraso): expressa a velocidade com que um mtodo detecta uma mudana no
processo. O atraso pode ser expresso de duas formas: CED (conditional expected delay) o tempo mdio de atraso at que o alarme soe dado que realmente ocorreu uma mudana
no processo, uma medida equivalente ao poder de deteco. Esta medida caracteriza
o comportamento de um processo fora de controle. uma medida pontual, depende do
ponto em que ocorreu a mudana, denido por
CED(k) = Ek [ | = k],

em que Ek o valor esperado sobre a hiptese de que ocorreu uma mudana no ponto
= k . Se possui uma distribuio de probabilidade, ento podemos considerar o atraso

esperado (ED-expected delay) que dado por,


ED =

( = k)P ( k)CED(k).

k=1

Existe uma extensa literatura estatstica sobre mtodos de monitoramento no tempo com
importantes aplicaes, onde o interesse a deteco rpida e, a preveno de vrios eventos
adversos ao intesse do processo em estudo. Nas sees seguintes, ns descreveremos alguns
deles. Uma lista de referncias sobre suas aplicaes em variados problemas envolvendo vigilncia
epidemiolgica podem ser encontrados em Sonesson and Book, 2003. Chamamos a ateno para
nossa notao sobre o tempo de alarme para os mtodos descritos a seguir. Por exemplo,
denotamos por CU SU M o tempo de alarme associado ao procedimento conhecido na literatura
como somas cumulativas ou mtodo CUSUM. A mesma notao feita para o tempo de alarme
dos outros procedimentos apresentados.
Considere nesta seo que {Xt }t1 uma sequncia de variveis aleatrias tal que para
t < , X1 , X2 , ...X1 so i.i.d com densidade completamente especicada f0 , e depois de ,

isto t , X , X+1 , ... so i.i.d com densidade, tambm completamente especicada, f1 .


chamado ponto de mudana e f1 a densidade da sequncia ps-mudana. Seja n o tempo

2.2 Deteco de mudanas no tempo

14

corrente e se no houve mudana na sequncia dizemos que > n e denotamos pelo evento
{ = }.
2.2.1

Mtodo de Somas Cumulativas (CUSUM)

O mtodo CUSUM para monitoramento do processo denido por (Page, 1954),


(
CUSUM = inf

n 1 : M ax

n
X

1kn

(2.1)

log(f1 (Xt )/f0 (Xt )) > BCUSUM

t=k

onde BCUSUM selecionado de modo que ARL0 (CU SU M ) = BCUSUM . Se no h mudanas denimos inf {} = . Quando f parcialmente especicada, pertencente a uma famlia paramtrica,
Lorden (1971) prope a generalizao do CUSUM,
(
GCUSUM = inf

n 1 : M ax Sup
1kn

n
X

)
log(f (Xt )/f0 (Xt )) > BGCUSUM

(2.2)

t=k

Neste caso, apenas propriedades assintticas podem ser derivadas, tal como, ARL0 (GCU SU M )
BCUSUM .
2.2.2

Mtodos de Shiryaev(S) e Shiryaev-Roberts (SR)

Shiryaev (1963, 1978), formula o problema de deteco sequencial de um ponto de mudana


em uma estrutura Bayesiana por descrever sua incerteza sobre atravs de uma distribuio a

priori geomtrica P ( = k) = p(1 p)k1 , k = 1, 2, ...., em que p a probabilidade de que ocorra


uma mudana no tempo = k. Assumindo uma perda com valor igual a c para um atraso na
deteco da mudana e uma perda igual a 1 para um falso alarme, Shiryaev mostra que a regra
de Bayes, no sentido que minimiza o risco de Bayes para o problema (que o valor esperado da
funo perda), soa um alarme de fora-de-controle, quando a probabilidade a posteriori de que
tenha ocorrido uma mudana, excede algum valor xado 0 < BS < 1. O tempo de alarme para
este procedimento dado por,
S = inf {n 1 : P ( n|X1 , ..., Xn ) > BS }

(2.3)

Pode ser mostrado (Pollak, 1985) que a probabilidade a posteriori de que tenha ocorrido uma
mudana at o tempo corrente n, dada por
P ( n|X1 , ..., Xn ) =

em que,
Sp,n =

n Y
n
X
k=1 t=k

Sp,n
,
Sp,n + p1

f1 (Xt )
.
(1 p)f0 (Xt )

2.2 Deteco de mudanas no tempo

15

de modo que o procedimento pode ser redenido, da seguinte forma


n
o
S
S = inf n 1 : Sp,n > B

Seja,
SRn = lim Sp,n =
p0

(2.4)

n Y
n
X
f1 (Xt )
k=1 t=k

f0 (Xt )

Roberts(1966) modica a regra (2.4) para,


(2.5)

SR = inf {n 1 : SRn > BSR }

Este procedimento chamado de Shiryaev-Roberts (SR). Observa-se nesse procedimento que


p 0 implica que no h mudanas no processo e isto causa uma contradio. No entanto, Pollak

(1985) mostra que este procedimento atinge, assintoticamente, o risco de Bayes quando p 0.
Borovkov (1998) mostra que este resultado pode ser obtido para uma classe de distribuies a

priori, na qual a geomtrica com parmetro p pequeno, mas p > 0, est inserida.
2.2.3

Mistura da Razo de Verossimilhanas (MRV)

Em vez de maximizar o logaritmo da razo de verossimilhana no procedimento CUSUM,


Pollak and Siegmund (1975) integram a razo de verossimilhanas com respeito a alguma distribuio de probabilidade H(). Especicamente, eles propem o procedimento chamado de
"mistura de razo de verossimilhanas", dado por
(
MRV = inf

n
Y
f (Xt )
f0 (Xt )

(Z

n 1 : M ax

1kn

BCUSUM

dH()

>e

(2.6)

t=k

Estes autores mostram que ARL0 (M LR ) eBCUSUM .


Pollak (1987) assume no procedimento Shiryaev-Roberts que f1 = f com desconhecido e
estende a regra de mistura de razo de verossimilhanas para o procedimento de Shiryaev-Roberts
denindo um novo procedimeto,
(
MRVSR = inf

n1:

(Z
n
X
k=1

n
Y
f (Xt )
f0 (Xt )

)
dH()

)
> BSR

(2.7)

t=k

Uma nota importante sobre as expresses (2.6) e (2.7) que se substituirmos a notao
f (Xi ) por f (Xt |) e dH() por h()d. Ento, para um k xo temos que
(Z
!
)
n
Y
f (Xi |)
h()d
f (Xt |0 )

t=k

(2.8)

2.2 Deteco de mudanas no tempo

16

representa do ponto de vista bayesiano o Fator de Bayes para compararmos os modelos


M0 : f (X|0 )
M1 : {f (X|), h()}.
2.2.4

Mtodos Adaptativos

bem conhecido na literatura,( veja por exemplo, Lai(1998)) que quando a sequncia
X1 , X2 , ... formada por variveis i.i.d., sob a hiptese de que no houve mudana a razo

de verossimilhanas dada por,

n
Y
f1 (Xt )
f0 (Xt )

(2.9)

t=k

um martingal com valor esperado igual a 1 para todo n k. Esta propriedade preservada
pela mistura de razo de verossimilhanas
(Z

n
Y
f (Xt )
f0 (Xt )

)
dH()

t=k

Isto permite mostrar que ARL0 (MLRSR ) BSR . No entanto, Lorden e Pollak (2005) argumentam
que difcil uma escolha para no caso multidimensional, ento eles sugerem uma abordagem
alternativa denindo,

n f
Y
t1 (Xt )

n,k =

t=k

f0 (Xt )

em que t1 um estimador para baseado nas observaes X1 , ..., Xt1 . Desde que t1 um
valor conhecido no tempo t, ento so vlidas as propriedades de (2.9). O mtodo adaptativo,
no sentido de que para cada tempo t, estimado com os dados obtidos at o tempo t 1. Desta
forma, so denidos dois novos procedimentos de vigilncia. O CUSUM-Adptatitivo (AdC) dado
por,

(
AdC = inf

n 1 : M ax

1kn

n
X

)
log(ft1 (Xt )/f0 (Xt )) > BCUSUM

(2.10)

t=k

e o Shiryaev-Robert Adptativo (ASR),


(
SRSR = inf

n1:

n
n f
X
Y
t1 (Xt )
k=1

i=k

f0 (Xt )

)
> BSR

(2.11)

Este ltimo tambm conhecido como Shiryaev-Robert-Robbins-Siegmund (SRSR), devido ao


fato que Robbins e Siegmund (1970) foram os primeiros a tratar esse problema em testes de
hipteses.

2.2 Deteco de mudanas no tempo


2.2.5

17

Mtodo Bayesiano

Nesta seo, ns apresentamos um mtodo bayesiano para a deteco de mudanas em


um grupo de observaes usando um Fator de Bayes seqencial (ou razo de verossimilhanas
preditivas). Este mtodo, proposto por West(1986), realiza o monitoramento de uma srie de
dados atravs da comparao entre as predies para o modelo padro contra as predies para
um modelo alternativo sendo estes modelos atualizados no tempo. A idia consiste em encarar
o problema de deteco de mudana no processo como um problema de comparao entre dois
modelos. Considere o processo {Xt : t = 1, 2, ...} em monitoramento com um modelo estatstico
padro M0 no sentido de que no h mudanas. Este modelo composto por:
M0 = {f (Xt |t ), g0 (t |Ht1 ), p0 (Xt |Ht1 )}

onde, f (Xt |t ) a densidade condicional para a distribuio de (Xt |t ); g0 (t |Ht1 ) representa a


distribuio a priori para t dado o histrico da srie Ht1 , com Ht = {Ht1 , xt }; p0 (Xt |Ht1 )
denota a densidade para a distribuio preditiva de Xt |Ht1 e,
Z
p0 (Xt |Ht1 ) =

f (Xt |t )g0 (t |Ht1 )dt .

Aps observar Xt = xt , a quantidade p0 (xt |Ht1 ) o valor da verossimilhana do modelo


padro e representa sua abilidade preditiva. Suponha que no tempo t, M0 comparado com um
modelo alternativo
M1 = {f (Xt |t ), g1 (t |Ht1 ), p1 (Xt |Ht1 )}.

Para vericar o ajuste preditivo dos modelos M0 e M1 , usamos a razo de verossimilhanas


preditivas ou Fator de Bayes (F B )
F Bt =

p1 (Xt |Ht1 )
.
p0 (Xt |Ht1 )

(2.12)

Um valor F B t > 1 implica em uma melhor performance preditiva de M1 indicando uma possvel
mudana no processo. Chamamos a ateno para o fato que em West(1986) o Fator de Bayes
denido como F B t = p0 (Xt |Ht1 )/p1 (Xt |Ht1 ). No entanto, para mantermos uma certa coerncia nas denies usadas neste texto, ns realizamos esta inverso na notao de West(1986).
Para deteco de mudanas no grupo formado pelas ltimas k observaes, West(1986) usa o
Fator de Bayes sequncial,
n
Y

F Bn,k = F Bn F Bn1 ...F Bnk+1 =

F Bt ,

k = 1, 2, ..., n.

t=nk+1

e o tempo de alarme pode ser denido como,



FB = inf


n 1 : M ax F Bn,k BF B .
1kn

2.3 Deteco de mudanas no espao-tempo

18

Maiores detalhes sobre propriedades, escolha das distribuies a priori para t e uma variedade
de aplicaes pode ser vista em West(1986) e West e Harrison(1986).

2.3 Deteco de mudanas no espao-tempo


Existem situaes para as quais h uma necessidade de se realizar por um longo perodo de
tempo uma vigilncia espacial (por exemplo, os sistemas de vigilncia discutimos na seo 1.1).
Neste caso, podemos aplicar conjuntamente as tcnicas descritas nas sees 2.1 e 2.2. Muitos
mtodos desenvolvidos para este propsito so de natureza retrospectiva, isto , avaliam evidncias em favor de cluster em um conjunto de dados com um nmero xo de eventos passados.
No entanto, com o surgimento de novos eventos, a maioria dos sistemas de vigilncia so constantemente atualizados e a ocorrncia de um aumento repentino na ocorrncia de certos tipos
de eventos em uma determinada regio geogrca pode indicar, por exemplo o incio de uma
epidemia ou surto se os eventos esto relacionados ocorrncia de algum tipo de doena. Neste
caso, o ideal seria usar um mtodo de monitoramento capaz de detectar este provvel cluster
emergente (tambm chamado de cluster no espao-tempo) o mais rpido possvel, independentemente de sua localizao e tamanho. Mtodos para este tipo de problema so de natureza
prospectiva, realizam anlises repetidas sobre o conjunto de dados e detectam cluster em tempo
real ou on-line. Ao mesmo tempo estes mtodos devem ajustar para problemas de testes mtiplos
realizados sobre o espao e o tempo. A extenso de mtodos de natureza puramente espacial
para detectar clusters emergentes, pode dicultar o problema de ajuste para teste mltiplos. Isso
porque ao usarmos a anlise repetida de dados acumulados ao longo do tempo, qualquer mtodo
desenvolvido tem que ser ajustado para o problema de t || comparaes no espao-tempo.
Onde || a cardinalidade do espao dos candidatos a cluters no espao. Para contornar este
fato, ns formulamos o problema de deteco de cluster emergente como um problema de deteco de ponto de mudana no espao-tempo e, ento, combinamos os mtodos de natureza
puramente temporal com os algoritmos para deteco de clusters espaciais formando assim uma
classe de mtodos para deteco de cluster emergentes.
2.3.1

Formulao do Problema de deteco de clusters no Espao-Tempo

Considere que a rea de estudo representada por um mapa S particionado em L-reas


Al contguas identicadas por um ponto sl . Vamos assumir a partir de agora que sl o cen-

tride do polgono que delineia a rea Al . Considere sobre S o monitoramento (ou a vigilncia)
estatstico(a) de um processo estocstico X = {Xt (sl ), t = 1, 2, ... e l = 1, 2, ...L}. A cada
tempo discreto t 1 observamos um vetor L-variado Xt = (Xt (s1 ), Xt (s2 ), ..., Xt (sL ))0 , em que
Xt (sl ) representa alguma valor observado na l-sima rea. Sejam = {sl S : sl } um con-

junto conexo de localizaes espaciais em S , Hn = {X1 , ..., Xn } o conjunto de dados acumulados

2.3 Deteco de mudanas no espao-tempo

19

at o instante n. O objetivo do monitoramento vericar se existe algum cluster emergente


em S . O interesse detectar um cluster que comeou em um tempo desconhecido k n e
que est presente at o estgio atual n. O cluster no espao-tempo expresso em funo de
uma mudana no padro da distribuio do sub-processo {Xt (sl ) X : sl , t k} tal que
n,k = {sl S : sl } [k, n] representa o cluster no espao-tempo tambm chamado de cluster

emergente.

Denio 1 Seja um tempo de alarme e um conjunto desconhecido de reas do mapa. Ento,


um procedimento para deteco e localizao do cluster no espao-tempo representado por um
representa o evento que uma possvel mudana ocorreu no
par (, ) onde { = < , = }

tempo e localizada em .
Pela denio 1, um algoritmo para deteco e localizao de um cluster no espao-tempo
tem que computar um par {, } baseado em Hn , e trs erros podem ocorrer:
1. Atraso: Se o cluster detectado e localizado corretamente ( = ) depois de tal que
o tempo de alarme para , verdadeiro. Ento o atraso na deteco localizada
[
].

2. Falso alarme: Se o tempo da mudana detectado < . Ento teremos uma deciso
nal incorreta com =
6 .
3. Falsa localizao: O cluster detectado e localizado depois de ( verdadeiro)
porm = mas 6= .
Dado estes erros, muito difcil (ou at impossvel) determinar um mtodo que possa minimizar
uma perda baseada nestes trs tipos de erros. Na prxima seo, apresentamos alguns mtodos
propostos na literatura que usam como medida de evidncia em favor do cluster emergente o valorp do teste que no ajustado para o problema de testes mltiplos. Estes testeS representam
extenses e variaes da estatstica Scan descrita na seo 2.1.4.
2.3.2

Estatstica Scan espao-tempo

Para detco de cluster emergente, Kulldor (2001) usa uma verso estendida da estatstica
Scan espacial descrita na seo 2.1.4. Para construir a estatstica de Kulldor(2001) considere
que o interesse a deteco de cluster em intervalo temporal Ik = [k, n], k = 1, 2, ..., n, onde n
chamado de tempo corrente ou atual. Assuma que Xt (sl ) P oisson (t (sl ) t (sl )), Onde
t (sl ) denota uma medida desconhecida de risco relativo na l-sima rea no tempo t e t (sl )

representa o nmero de eventos esperados condicional ao nmero total de eventos observados em

2.3 Deteco de mudanas no espao-tempo

20

S . Este valor esperado condicional geralmente expresso por t (sl ) = Nt (sl ), onde taxa

global de eventos e Nt (sl ) representa o total de indivduos em risco no tempo t na l-sima. Est
implcito neste modelo que o processo mutuamente independente no espao-tempo. Ou seja
eventos que ocorrem no tempo t so considerados independentes de qualquer outro evento que
tenha ocorrido no tempo t 1, mesmo que tenham ocorrido na mesma rea. Seja um conjunto
de localizaes espaciais, como denido na seo 2.3.1. Para a estatstica scan espao-tempo
assumido que,
t (sl ) =

(W ) = 0 se (sl , t) W = Ik ,

(W ) = 1 caso contrrio.

onde W denota todo o domnio de estudo no espao-tempo exceto W que representa uma janela
espao-temporal. As hipteses consideradas so que para todo W = Ik ,
H0 : 0 = 1

e H1 : 0 > 1 .

Para estas hipteses, a estatstica scan espao-tempo T baseada na razo de verossimilhana


generalizada sobre as hipteses nula e alternativa e sobre todo W , dada por (Kulldor, 2001):



X(W ) X(W ) X X(W ) XX(W )
= sup
(W )
X (W )
W W

 

X(W )
X X(W )
I
>
,.
(W )
X (W )


(2.13)

onde I{} a funo indicadora, X o nmero total de eventos observados no espao tempo e
X(W ) e (w) denotam, respectivamente, o nmero de eventos e o valor esperado para W dados

por:
X(W ) =

X
(sl ,t)W

Xt (sl ) e (W ) =

t (sl ).

(sl ,t)W

= I para o qual a razo de verossimilhana maximizada identicado como


O conjunto W
k

o cluster emergente mais provvel. Como no caso de deteco de clusters espaciais, a signicncia
estatstica do cluster detectado feita atravs da simulao de Monte Carlo da seguinte forma:
A cada tempo de anlise t, um conjunto (por exemplo, 1000 rplicas) de dados aleatrios so
gerados sob a hiptese H0 com os eventos simulados distribudos de forma independente no
espao e no tempo. Ento o valor-p emprico (Dwass, 1957) para o teste calculado e no
momento atual, um cluster emergente observado estatisticamente signicativo ao nvel se
seu valor-p menor que . Desta forma o ajuste feito somente para os cilindros W = Ik
atuais. No entanto se o monitoramento for continuado por um longo perodo de tempo, o teste
no controla corretamente o valor de para todas as anlises anteriores. Com isso o mtodo scan
espao-tempo para deteco de clusters emergentes pode apresentar alguns cilindros signicativos
mesmo que a hiptese nula seja verdadeira. Para entedermos uma varredura espao-temporal

2.3 Deteco de mudanas no espao-tempo

21

atravs de cilindros, considere a gura 2.3. Imagine uma pilha de mapas onde cada camada
da pilha representa um tempo diferente. A base da varredura do cilindro representa espao
geogrco formado pelo conjunto de localizaes espacias em e a altura do cilindro representa
o tempo.

Figura 2.3: Examplo visual do uso do mtodo de Varredura espacial-temporal - Scan espaotempo

2.3.3

Estatstica Scan espao-tempo baseada no valor esperado

A estatstica scan espo-tempo de kulldor (2001) usa um valor esperado t (sl ) condicional
que estimado com os dados do tempo atual. Neill et al.(2005) observou empiricamente que
este fato pode diminuir o poder do teste para detectar cluster grandes (com muitas localizaes
espaciais) e tambm esta estimativa no robusta na presena de tendncia temporal ou sazonalidade. Para corrigir este problema, Neill (2009) props o uma estatstica scan espao-tempo
baseada em uma janela temporal limitada Iw = [n w + 1, n] onde w o mximo valor pr
especicado para a altura do cluster. Assim, o scan espao-tempo baseado no valor esperado
usado em dois passo: 1) O valor esperado t (sl ) estimado para cada localizao espacial sl
com os dados acumulados at n w. 2) utiliza a estatstica scan espao-tempo sobre o intervalo
Iw = [n w + 1, n] para detectar mudanas no valor esperado (da o nome scan espao-tempo

baseado no valor esperado) em um conjunto . A vantagem deste procedimento que o valor


t (sl ) pode ser ajustado para possveis tendncias ou sazonalidades observadas na srie.
2.3.4

Scan espao-tempo baseada no teste escore

Considere, novamente, que o interesse a deteco de clusters emergentes em uma janela


temporal limitada Iw = [n w + 1, n]. Para corrigir um possvel problema de sobredisperso
temporal, Tango et al.(2010) derivam uma estattica scan espao-tempo baseada em um teste
escore usando a distribuio Binomial Negativa (BN). As hipteses consideradas so as seguintes:
H0 : Xt (sl ) BN (t (sl ), t (sl )) e H1 : Xt (sl ) BN (t (sl )t (sl ), t (sl ))

2.3 Deteco de mudanas no espao-tempo

22

onde,
(xt (sl ) + t (sl ))
P0 (Xt (sl )) = P (Xt (sl ) = xt (sl )) =
(t (sl ))xt (sl )!

t (sl )
t (sl ) + t (sl )

t (sl ) 

t (sl )
t (sl ) + t (sl )

xt (sl )

(2.14)

e por analogia,
(xt (sl ) + t (sl ))
P1 (Xt (sl )) =
(t (sl ))xt (sl )!

t (sl )
t (sl )t (sl ) + t (sl )

t (sl ) 

t (sl )t (sl )
t (sl )t (sl ) + t (sl )

xt (sl )

(2.15)

Propriedades para Xt (sl ) sob H0 so,


E0 (Xt (sl )) = t (sl ),

V0 (Xt (sl )) = t (sl ) + t (sl )2 /t (sl )) = t (sl )t (sl )

onde a sobredisperso temporal t (sl ) = 1 + t (sl )/t (sl ). O par (t (sl ), t (sl )) estimado
com os dados acumulados at o tempo n w e assumido conhecido em Iw = [n w + 1, n], o
parmetro t (sl ). Para detectar e localizar clusters emergentes, assumido que

t (sl ) =

h(u + W (t n + w)) se (sl , t) W = Iw

caso contrrio

onde h(u) denota o risco relativo no tempo t = n w um risco inicial. Depois do tempo n w
temos,

t (sl )
t

= W h0 (u).
t=nw

com h(.) denotando qualquer funo monotona crescente e satisfazendo, h(u) = 1 e o par (h0 (.),
h00 (.)) considerado nito. Deste modo o teste de hiptese ca a reduzido a testar sobre todos os

possveis conjuntos W = Iw as hipteses:


H0 : W = 0,

H1 : W > 0.

A verossimilhana para W expressa em funo de t (sl ) dada por


L(W ) =

Y Y

P1 (Xt (sl ))

tIw sl

P0 (Xt (sl )).

(sl ,t)W
/

Com P0 (Xt (sl )) e P1 (Xt (sl )) dados, respectivamente, em 2.14 e 2.15. A estatstica scan baseada
no teste escore para a hiptese nula H0 : W = 0 obtido da seguinte forma: 1) Encontra-se a
funo escore e a informao de Fisher observada no ponto W = 0, ou seja


logL(W )
U (0) =
W

2 logL(W )
J(0) = E
2
W


,
W =0


W =0

2.3 Deteco de mudanas no espao-tempo

23

2) Determine S(W ) = U (0)/ (J(0)). Ento a estatstica de teste ,


p

S = sup S(W )
W W

Pode-se mostar (Tango, 2010) que


P
S(W ) =

tIw

sl (Xt (sl )

qP

tIw

sl

t (sl ))(t n + w)/t (sl )

t (sl )(t n + w)2 /t (sl )

Para calcular o valor-p do teste use a aproximao (Tango, 2010) S N (0, 1).

24

3 Algumas Abordagens para Deteco de


Cluster no Espao-Tempo Usando A
Razo de Verossimilhana Adaptativa

3.1 Introduo
Uma forma possvel de monitoramento e deteco de cluster no espao-tempo, denir uma
ampla classe de possveis candidatos a cluster espacial e aplicar os mtodos de natureza puramente
temporal em cada um desses possveis candidatos. No entanto, este procedimento pode levar ao
problema de mltiplos testes e qualquer mtodo desenvolvido deve ser ajustado para as mltiplas
comparaes no espao-tempo. Com este propsito, ns desenvolvemos e apresentamos neste
captulo alguns novos mtodos baseados nas razes de verossimilhanas (LR) adaptativas para
a hiptese nula de ausncia de cluster contra a hiptese alternativa que reete a presena de
um cluster emergente na regio. Ao usarmos o fato de que a razo de verossimilhana adptativa
(ALR) preserva a estrutura martingal da razo de verossilhana regular, ns encontramos uma
cota superior para a taxa de falsos alarmes dos mtodos propostos que depende somente da
quantidade de candidatos avaliados. Isto implica que estes mtodos no requerem procedimentos
computacionais intensivos para determinao do ponto de corte que controla a taxa de alarmes
falsos e por isso podem ser aplicado para deteco de clusters emergentes em qualquer mapa.
Os mtodos desenvolvidos podem ser entendido como uma extenso para o espao-tempo dos
mtodos descritos na seo 4.4.2.

3.2 Formulao, Notao, LR e ALR para deteco de clusters


no espao-tempo
3.2.1

Formulao do problema de deteco de cluster no espao-tempo

Considere que a rea de estudo representada por um mapa S particionado em L-reas Al


contguas identicadas por um ponto sl . Assuma que sl o centride do polgono que delineia a
rea Al . Seja X = {Xt (sl ), t = 1, 2, ... e l = 1, 2, ...L} o processo sob vigilncia. A cada tempo
discreto t 1 observamos um vetor L-variado Xt = (Xt (s1 ), Xt (s2 ), ..., Xt (sL ))0 , em que Xt (sl )

3.2 Formulao, Notao, LR e ALR para deteco de clusters no espao-tempo

25

representa algum valor observado na l-sima rea. Sejam = {sl S : sl } um conjunto


conexo de localizaes espaciais em S , Hn = {X1 , ..., Xn } o conjunto de dados acumulados at
o instante n e f (Xt |t ) , ft (Xt ) uma funo de densidade conhecida para Xt , dado um valor
selecionado para o parametro t , para cada t, tal que t pertence a algum conjunto aberto do
espao nito dimensional. O objetivo da vigilncia vericar se existe um cluster emergente no
mapa. O interesse aqui, detectar um cluster que comeou em um tempo desconhecido n
e que est presente at o estgio atual n. O cluster no espao-tempo expresso em funo de
uma mudana no padro espao-temporal de eventos em que emerge depois de um tempo
desconhecido .
A deteco da mudana obtida atravs da avaliao dos dados em Hn sobre todos os
candidatos a cluster . O instante da mudana, o primeiro momento no tempo para o qual
existem evidncias sucientes de que uma mudana no padro de casos da doena tenha ocorrido.
Matematicamente, o monitoramento feito usando uma funo de alarme n = (Hn ) e um
limite de controle B , tais que o tempo de alarme, , de uma possvel mudana dada por,
(B) = min{n : n B}.

Se n excede B , ento h uma indicao de uma possvel mudana no processo e um alarme


soado. Se no h mudanas no processo, todos os alarmes so falsos. O valor de B especicado
de forma a minimizar a ocorrncia de alarmes falsos.
Em geral, representa alguma forma geomtrica regular como crculo (Kulldor, 1997), elipse
(kulldor et all, 2006) ou irregular (Duczmal and Assuno, 2004) de modo que a cardinalidade
de depende da forma e tamanho de . Essa cardinalidade, pode ser excessivamente grande, e
uma boa funo para monitoramento de clusters emergentes deve ser ajustada para o problema de
comparao mltiplas, ter um pequeno atraso na deteco e uma boa capacidade para localizar
corretamente todo ou pelo menos uma grande parte do cluster emergente.
3.2.2

Notao

Para uma notao conveniente neste captulo, denote o evento { > n} = { = },


= {1 , 2 , ..., J } onde cada j (j = 1, 2, ..., J ), denido em na seo 3.2.1, representa um

conjunto de localizaes espaciais em S com os j0 s todos distintos. Suponha que {Xt }


t=1 uma
sequncia de vetores independentes, com componentes multuamente independentes no sentido
de que Xt (sl ) independente de Xt (s0l ) quando l 6= l0 e, ainda, Xt (sl ) independente de Xt1 (sl ).
Estas suposies so sempre satisfeitas quando Xt um processo de Poisson em dados de reas
e tambm podem ser relaxadas para outros modelos probabilsticos. Introduza as hipteses:
H0 : = e Hk,j : = k, = j

3.2 Formulao, Notao, LR e ALR para deteco de clusters no espao-tempo

26

t : s S},
em que a hiptese H0 tal que o padro normal de eventos corresponde a t = {0,l
l

e sob Hk,j a distribuo dos eventos depois do tempo de mudana em j corresponde a t =


t : s } { t : s
t
t
{1,l
l
l / } , com 0,l e 1,l xados no tempo t. Isto , so conhecidos no tempo
0,l

t.
3.2.3

Deteco de clusters no espao-tempo usando LR

Sejam F0 e Fk,j distribuies de probabilidades que correspondem, respectivamente, as


hipteses H0 e Hk,j tal que sob F0 a densidade de Xt dada por

f0 (Xt ) =

ft (Xt (sl )),


0,l

para todo t 1.

sl S

e sob Fk,j , para qualquer 1 k < , a densidade de Xt

fk,j (Xt ) =

sl S

ft (Xt (sl ))

sl j

ft (Xt (sl ))

se t < k

0,l

1,l

sl
/ j

ft (Xt (sl )) se t k
0,l

Ou seja, se a mudana ocorre no conjunto de localizaes j no tempo = k, o padro de casos


t para t para todo s . Como os vetores so multuamente independentes e para
muda de 0,l
j
l
1,l

qualquer j
Y

ft (Xt (sl )) =

sl j

ft (Xt (sl )),


0,l

0,l

0,l

sl S

ft (Xt (sl ))

sl
/ j

temos que a razo de verossimilhaas (LR) para os dados Hn entre as hipteses Hk,j e H0 dada
por

j
LRn,k

Qn Q
t (Xt (sl ))
t=k
sl j f1,l
P(Hn |Hk,j )
=
= Qn Q
,
P(Hn |H0 )
t=k
sl j ft (Xt (sl ))

k n.

(3.1)

0,l

j
t , t ) xos, sob F a
Uma propriedade importante de LRn,k
, que para quaisquer j e (0,l
0
1,l
j
sequncia {LRn,k
, n k} um processo martingale com valor esperado igual a 1. Para mostrar
j
essa propriedade, observe primeiramente que LRn,k
pode ser escrita como

Qn
j
LRn,k

t=k

Q
Qn
t (Xt (sl ))
ft (Xt (sl )) sl
/ j f0,l
fk,j (Xt )
1,l
Qn Q
= Qt=k
n
t=k
sl S ft (Xt (sl ))
t=k f0 (Xt )

sl j

0,l

sejam E0 o valor esperado sobre F0 e


Q
jt =

sl j

Q
t (Xt (sl ))
ft (Xt (sl )) sl
/ j f0,l
1,l
Q
.
sl S ft (Xt (sl ))
0,l

3.2 Formulao, Notao, LR e ALR para deteco de clusters no espao-tempo

27

Note que para todo t,


Q
E0 [jt ] =

sl j

xt

Q
!
t (xt (sl ))
ft (xt (sl )) sl
/ j f0,l
1,l
Q
f0 (xt ) .
sl S ft (xt (sl ))

(3.2)

0,l

onde a soma em (3.2) realizada sobre todos os possveis valores para o vetor Xt . Mas,
Y

f0 (Xt ) =

ft (Xt (sl )).


0,l

sl S

de modo que,
E0 [jt ] =

X Y

ft (xt (sl ))

ft (xt (sl )) =

1,l

xt sl j

0,l

t k.

fk,j (xt ) = 1,

(3.3)

xt

sl
/ j

e pela mutua independncia dos vetores X0t s, segue que


"
j
E0 [LRn,k
]

= E0

n
Y

#
jt

t=k

n
Y

E0 [jt ] = 1.

t=k

Agora, temos que


(3.4)

j
j
jn+1 |Xn , ..., Xk ]
|Xn , ..., Xk ] = E0 [LRn,k
E0 [LRn+1,k
j
E0 [jn+1 |Xn , ..., Xk ]
= LRn,k
j
= LRn,k
E0 [jn+1 ] (pela independncia)

(por (3.3)).

j
,
= LRn,k

j
}nk um processo martingal com mdia 1. Esta
Portanto, por (3.3) e (3.4), segue que {LRn,k

propriedade de (3.1) ser importante na elaborao do procedimento desenvolvido para deteco


de clusters emergentes.
Para construrmos o algortimo para deteco e localizao do cluster, primeiramente denimos,
(3.5)

j
LRnj = max LRn,k
1kn

de modo que LRnj representa o mximo para a LR sobre todos os possveis pontos no tempo para
o qual tenha ocorrido uma mudana em j . Seja kj = arg[LRnj ], ento os possveis candidatos
a clusters emergentes so 1n,k1 , ..., Jn,kJ , e como estratgia para deteco considere os seguintes
procedimentos:
Procedimento 1: MAX-LR.
(
1 (B) = min n 1 : J 1

)
max

n,k
n,k1
,...,J J }

{1


j

LRn B

(3.6)

3.2 Formulao, Notao, LR e ALR para deteco de clusters no espao-tempo

28

Ou seja, o tempo de alarme, o primeiro momento no tempo tal que a estatstica


J 1

max

n,k1

{1

n,kJ

,...,J

 j
j
LRn = J 1 max max LRn,k
j 1kn

excede o valor B que controla a taxa de alarmes falsos (FAR). bom ressaltar que 1 (B)
uma natural escolha para deteco de clusters emergentes (Sonesson, 2007) pois diferentes
regies podero ter diferentes pontos de mudana. Note que o limite de controle B assumido igual para todos os candidatos a cluster emergente. O fato que o valor de B depende da
taxa de alarmes falsos e um valor B comum para todosos candidatos garante que esta taxa

h

seja igual para todos. Se existe um n tal que o evento J 1 max{n,k1 ,...,n,kJ } LRnj B
1

ocorre, estime o cluster emergente por

n,k

!
= arg J 1

max

n,k
n,k1
,...,J J }


j

LRn

{1

Caso contrrio, dena 1 (B) = para min{}. A escolha n,k baseada no fato de que,
se o cluster comeou no tempo k e terminou em n0 < n ele deveria ter sido detectado pelo
mtodo em n0 . Desde de que 1 (B) baseado no valor mximo de LRnj , ele denominado
MAX-LR.
Procedimento 2: MIX-LR.

X
1
j
2 (B) = min n 1 : J
LRn B .

(3.7)

j=1

Diferentemente de 1 (B), o procedimento 2 (B) no requer que todos os candidatos tenham


o mesmo limite de controle. Mais precisamente, 2 (B) baseado em uma mixtura de LRnj
com respeito distribuio de probabilidade j = P ( = j ) = J 1 e por isso denominado
MIX-LR. Note ainda que
J
X

LRnj =

j=1

1
2
J
max LRn,k
+ max LRn,k
+ ... + max LRn,k
.

1kn

1kn

1kn

(3.8)

1
2
J
= LRn,k
+ LRn,k
+ + LRn,k
.
1
2
J

onde kj = arg[LRnj ].
j
Ento, grandes valores de LRnj = max LRn,k
possuem maior contribuio para que soe o
1kn

alarme de modo que se existe um n tal que o evento J 1


o cluster por

n,kj = argmax J 1

J
X
j=1

Caso contrrio, dena 2 (B) = para min{}.

j
j=1 LRn B

PJ

LRnj .

ocorre, estime

3.2 Formulao, Notao, LR e ALR para deteco de clusters no espao-tempo

29

Procedimento 3: WEIGHT-LR

X
3 (B) = min n 1 :
wj LRnj B .

(3.9)

j=1

Caso contrrio, dena 3 (B) = para min{}. Onde wj so valores conhecidos, representam pesos de evidncias em favor do candidato a cluster n,kj e

PJ

j=1 wj

= 1. Neste caso

podemos usar a idia de atualizao de informao. Diferentes pesos podem ser atribudos
basedo na informao a prior que dispomos sobre todos os possveis candidatos. Os pesos
podem ser atualizados quando uma nova informao obtida. Observe que 2 (B) um
caso de particular de 3 (B) com wj = J 1 . Neste caso, o cluster emergente estimado por

n,kj = arg J 1

J
X

wj LRnj .

j=1

Observe que este cluster estimado pode ser diferente do obtido com o tempo de alarme 2.

Taxa de Falso Alarme para MAX, MIX and WEIGHT-RL


Os procedimentos para deteco e monitoramento de cluster no espao-tempo baseada
em (3.6), (3.7) e (3.9) representam um tempo aleatrio de alarme que dependem de Hn . Um
bom procedimento deve ter uma pequena taxa de alarmes falsos (FAR) e um pequeno atraso na
deteco do cluster. Seja E0 [ (B)] o valor esperado para (B) sobre F0 , temos que a FAR[ (B)]
expressa por (Tartakovsky, 2006),
FAR[ (B)] = 1/E0 [ (B)].

(3.10)

A quantidade FAR[ (B)] interpretada como a frequncia mdia de alarmes falsos.

Theorem 2 No tempo atual n, seja J xo e conhecido a cardinalidade de . Ento


FAR[i (B)] 1/B, com

i = 1, 2, 3.

(3.11)

Para mostrar (3.11), dena


jn =

n
X

j
LRn,k
,

j = 1, 2, ..., J

k=1

Note que jn a estatstica de Shiryayev-Roberts denida na seo 2.2.2 para cada j . Como sob
j
F0 a sequncia {LRn,k
, n k} um martingal com valor esperado igual a 1, temos que {(jn
P
n)}n1 um martingal com mdia zero. Isto implica que sob F0 a sequncia {J 1 Jj=1 jn

n}n1 tambm um martingal com mdia zero. Agora, considere dois outros procedimentos

3.2 Formulao, Notao, LR e ALR para deteco de clusters no espao-tempo

30

para deteco de clusters emergentes dados por,

X
4 (B) = min n 1 : J 1
jn B .

(3.12)

X
5 (B) = min n 1 :
wj jn B .

(3.13)

j=1

e,

j=1

Ento,

J
X
0 = E0
wj j5 (B) 5 (B) B E0 [5 (B)]
j=1

portanto E0 [5 (B)] B e por analogia E0 [4 (B)] B . No entanto, 1 (B) 4 (B) e 3 (B)


5 (B). Logo
E0 [1 (B)] E0 [4 (B)] B

e E0 [3 (B)] E0 [5 (B)] B

e por (3.10) obtemos


FAR[i (B)] 1/B, com i = 1, 2, 3.

Para mostrar que este resultado vlido tambm para 2 (B), basta observar que 2 (B) um
caso particular de 3 (B). O importante desse resultado apresentado no lema a seguir:

Lemma 3 Seja
i (B) ,

= { : FAR[ ] }, para algum 0 < < 1. Se B = 1/. Entao

i = 1, 2, 3.

onde 0 < < 1 a taxa aceitvel de alarmes falsos para o procedimento basedo em i (B).
Por exemplo, se o interesse detectar clusters emergentes usando o procedimento i (B) com uma
taxa de alarmes falsos inferior a 0.05, faa B = 20.
3.2.4

LR Adaptativa para deteco de clusters no espao-tempo


t , t ) conhecido, isso pode no
Embora na seo 3.2.3 ns assumimos que o par (0,l
1,l

t , t ) sobre todos os possveis 0 s


ocorer na prtica, pois uma especicao a priori para (0,l
j
1,l

praticamente impossvel. Para contornar este problema, usamos uma abordagem adapta[k,t1] [k,t1]
t , t )
tiva(Lorden and Pollak, 2005). Seja (0,l
, 1,l ) uma estimativa razovel para (0,l
1,l

baseado em {X1 = x1 , ..., Xt1 = xt1 } e dena a razo de verossimilhana adaptativa (ALR)
por

Qn

j
ALRn,k
= Qn

t=k

t=k

sl j

f[k,t1] (Xt (sl ))


1,l

sl j f[k,t1] (Xt (sl ))

(3.14)

0,l

[k,n] [k,n]
, 1,l ) no dependa de Xn temos que (Lorden and Pollak, 2003) sob F0 ,
Por requerer que (0,l

a sequncia
n
o
j
ALRn,k
,n k

(3.15)

3.2 Formulao, Notao, LR e ALR para deteco de clusters no espao-tempo

31

preserva a estrutura martingal de (3.1), de forma que o limite superior para a taxa de alarmes
falsos dado em (3.11) pode ser utilizado pelos procedimentos para deteco de clusters emergentes
representados por i (B) com i = 1, 2, 3. Onde o procedimento i (B) obtido atravs de i (B)
j
j
pela simples substituio de LRn,k
por ALRn,k
. O fato importante desta abordagem que para

cada valor xado do parmetro no tempo t, assumimos que o par (f[k,t1] , f[k,t1] ) uma boa
0,l

1,l

j
j
t , f t ) de modo que LR
aproximao para (f0,l
n,k aproximada por ALRn,k .
1,l

Desde de que i (B) funo da razo de verossimilhanas adaptativas (ALR), os mtodos


1 (B), 2 (B) e 3 (B) so denominados, respectivamente, MAX-ALR, MIX-ALR e WEIGHTt ,
ALR. Esses mtodos so adaptativos no sentido de que para cada tempo t, os parmetros (0,l
t ) so estimados com os dados obtidos at o tempo t 1. Essa abordagem adaptativa no
1,l

apenas um artifcio terico, pois adicionando a n-sima observao do vetor Xn na estimao de


n , podemos ultrapassar o limite superior dado em (3.11), necessitando de um maior nvel de
1,l

corte, o que evitaria qualquer ganho em tempo de deteco devido estimativa um pouco melhor
t , t ). Embora em (B) os valores para w sejam assumidos conhecidos, na prtica eles
de (0,l
3
j
1,l

so desconhecidos. Porm, dena wj[0] = wj[1] = J 1 e, para n 2, considere uma estimativa


adaptativa para wj dada por
[n1]

wj

[n2]

= (1 )wj

j
ALRn1
+  PJ
j
j=1 ALRn1

onde 0 <  1 um fator adptativo usado para aumentar a sensibilidade do mtodo quando
pequenas mudanas surgem em um passado bem recente. Desde de que wj conhecido no tempo
n, o procedimento

X
3 (B) = min n 1 :
wj ALRnj B .

(3.16)

j=1

tambm pertence a classe com wj subtitudo por wj[n1] . Note que sob esta formulao, os
pesos wj so atualizados sequencialmente a medida que dispomos de uma nova informao.
3.2.5

Representao Espacial dos Clusters

Em uma estrutura geral, considere que S = {s1 , s2 , ..., sL } um mapa particionado (como
na gura 3.1) em L reas conexas em que sl = (s1l , s2l ) um vetor de coordenadas geogrcas do
centride da l-sima rea. Para construirmos o espao dos clusters , primeiramente considere
uma matriz de adjacncias,

Il,j =

c se sc

se j = 1
o j-simo centride mais prximo de sl

3.2 Formulao, Notao, LR e ALR para deteco de clusters no espao-tempo

32

Suponha que a proximidade medida pela distncia Euclidiana entre os centrides sl e sc . Cada
linha desta matriz representa um vetor de adjacncias (l1 , l2 , ..., lL ) em que, l1 = j e nas outras
celas desta matriz, os elementos so alocados de acordo com a proximidade espacial em relao
ao centride sl . Por exemplo, suponha que L = 5. Se a linha 1 o vetor (1, 5, 4, 3, 2). Isto implica
que o centride s5 o segundo mais prximo de s1 , s4 o terceiro centride mais prximo de s1 e
assim sucessivamente. Nesta representao esta implicto que "todo centride o mais prximo
de si mesmo". Centrado em sl (que corresponde a l-sima linha de Il,j ), idenque um cluster por
um vetor li = (l[i,1] , l[i,2] , ..., l[i,L] ) construdo da seguinte forma:
1) Dena l[i,j] = 1 se l = j , i = 1, 2, ...L e j = 1, 2, ..., L.
2) Dena l[i,Il,j ] = 1, se sIl,j um dos j centrides mais prximos de sl e j i. Caso

contrrio faa l[i,Il,j ] = 0.


Por exemplo, suponha que S = {s1 , s2 , s3 , s4 , s5 } e que sua matriz de adjacncia tal que na linha
1 temos o vetor de adjacncias (s1 , s5 , s4 , s3 , s2 ). Ento, usando a representao para li , temos
11 = (1, 0, 0, 0, 0), 12 = (1, 0, 0, 0, 1), 13 = (1, 0, 0, 1, 1), 14 = (1, 0, 1, 1, 1) e 15 = (1, 1, 1, 1, 1).

Observe que a cada valor de j , li recebe o valor 1 no ndice do vizinho mais prximo de sl em sua
posio original no espao. Esta representao unica a menos do cluster lL que surge L vezes
diferenciado apenas pelo seu centride. Para vericarmos que de fato esta a representao
dos clusters, exemplicamos a formao da representao de 12 . Neste caso l = 1, i = 2 e
j = 1, 2, ..., L.
1) Quando j = 1, l = j e portanto 1[1,1] = 1
2) Quando j = 2. I1,2 =5, e s5 o segundo (i=2) centride mais prximo de sl e tambm,
j = 2 2 = i. Portanto, 1[1,5] = 1. Agora note que para todo j 3 temos que j > i.

Assim no satisfaz a condio j i implicando que as outras coordenadas de 12 so nulas.


Portanto 12 = (1, 0, 0, 0, 1).
Para formar a representao do cluster, este procedimento repetido para todo li , (l, i) =
1, 2, ..., L. Depois deste procedimento, a coleo de clusters no espao pode ser construda em
= {l : l, i = 1, 2, ..., L} O nmero total
dois passos: primeiro denimos uma classe auxiliar
i
L2 ; em seguida denimos
de cluster em
: (< l , l >) a}
= {li
i
i

(3.17)

onde (< . >) denota o produto interno entre dois vetores e a um valor xo, que representa uma
restrio na quantidade (tamanho do cluster) de localizaes espaciais em li . Esta restrio
imposta porque muitas vezes no h interesse em detectar clusters geogrcos com um nmero
de reas maior que a. Por exemplo, se a = L/2, ento o maior nmero de localizaes espaciais

3.3 Aplicao

33

em li exatamente L/2 e J = || = L2 /2. Como a distncia euclidiana usada como medida


de proximidade, ento a representao geomtrica de li um crculo cujo o raio igual rli =
max [d(sl , si )] onde d(.) a distncia euclidiana.

si li

3.2.6

Algoritmo para deteco de clusters emergentes no espao tempo

Aps a formulao da estrutura dos espao dos cluster, podemos usar o seguinte algoritmo
para deteco e monitoramento de cluster no espao tempo:

Algoritmo
1. no tempo n = 0, Escolher um centride no mapa.
2. Calcular as distncias para os outros centrides. Ordene estas distncias em ordem
crescente e depois guarde-as em um vetor de distncias (este vetor de distncias um
vetor de adjacncias).
3. Para cada centride do mapa repetir os passos 1 e 2 e ento construa a matriz de
adjacncias de acordo com a explicao dada na seo 3.2.5.
4. Escolher novamente um centride sl na regio. Centrado em sl contrua li , i =
1, 2, ..., L como explicado na seo 3.2.5.

5. Escolha um valor para a (por exemplo, a = L/4) e construa a classe


= {li : (< li , li >) a, (l, i) = 1, 2, ..., L}

6. Para cada n 1 especique um valor para e calcule o par (f (ALRn ), B), onde f
qualquer funo de monitoramento descrita na seo 3.2.4.
7. Se f (ALRn ) B , declare que existe um cluster emergente no mapa e o estime
pelo argmax [f (ALRn )] como dado na seo 3.2.3 . Caso contrrio, incremente uma
unidade no tempo e volte ao passo 6.

3.3 Aplicao
Para um melhor entendimento do funcionamento dos mtodos propostos eles so aplicados a um conjunto de dados reais. Os dados so referentes ao nmero de casos de cncer da
tireide em homens que ocorreram no Novo Mxico durante o perodo de tempo 1973-1992. Os
dados usados nesta anlise (Kulldor, 2001) foram agregados em 32 reas. A incidncia de casos
de 2.4 para cada grupo de 100000 pessoas-ano no Novo Mxico, porm variando entre as reas
de acordo com idade e raa. O objetivo desta anlise a deteco de clusters emergentes de
cncer da tireide na regio do Novo Mxico cujo a partio apresentado na gura 3.1.

3.3 Aplicao

34

O modelo de cluster emergente


Assuma que Xt = (Xt (s1 ), ..., Xt (sL ))0 um processo de Poisson. Em que Xt (sl ) o
nmero observado de casos e t (sl ) o nmero de casos esperados, no tempo t na l-sima rea Al
identicada por seu centride sl representada espacialmente na gura 3.1 com l = 1, 2, ..., L = 32.
Nesta aplicao, usamos como o espao dos cluster dado em (3.17) com a = L/4 = 32/4 = 8.
De modo que J = L2 /4 = 256.

Figura 3.1: Mapa do Novo Mxico. Fonte: US Census.


Sob H0 temos
f0 (Xt ) =

t (sl )Xt (sl ) exp{t (sl )}/Xt (sl )!,

t1

sl S

e sob Hk,j
fk,j (Xt ) =


Xt (sl )

Y
I{tk,sl j }
I{tk,sl j }
exp t (sl )t,j
/Xt (sl )!.
t (sl )t,j
sl S

Onde I{A} a funo indicadora do evento A . Ou seja, sob a ausncia de cluster Xt (sl ) tem
valor esperado t (sl ) para todo sl S e t 1, e depois de um tempo desconhecido = k,
1 k n, o processo muda para um novo estado com nvel mdio t,j t (sl ) em um conjunto
j . A quantidade t,j > 1 representa o risco relativo ou a intensidade da mudana na regio do
t = (s ) e t = (s ). Usando (3.14) ,a LR adaptativa
cluster j . Observe, ainda, que 0,l
t,j t l
t l
1,l

entre os tempos k e n para processo dada por


ALRjn,k =

n 
Y


[k,t1] Xt (j)

[k,t1]

exp{j

[k,t1]

(j

1)}.

(3.18)

t=k

onde,
Xt (j) =

X
sl

Xt (sl ) t (j) =

t (sl ).

sl j

[k,t1]
e ([k,t1]
, j
) representam as estimativas para (t (j), t,j ) que dependem dos dados atravs
j

3.3 Aplicao

35

de {X1 = x1 , ..., Xt1 = xt1 }.

Escolha das Estimativas


Observa-se que t (j) = E0 [Xt (j)] representa o valor esperado para o nmero de casos
que ocorrem no tempo t em j sob a suposio que no existe cluster emergente, ou seja, no
depende de k. Ento, para t > 1, uma estimativa razovel para t (j) dada por,
[k,t1]
j

[t1]
j

1
=
t1

t1
X

!
Nm (j)m

m=1

t1
1 X [m]
,
j .
t1

(3.19)

m=1

Onde, Nm (j) representa a populao em risco em j no tempo m e m uma estimativa no


tempo m para taxa global da doena.
Para ajustarmos o nmero de casos esperados por idade e sexo, dena xm,i,r (sl ) como sendo
o nmero de casos que ocorreram no tempo m(1 m t 1) entre as pessoas na classe
de idade i pertencente a raa r na l-sima rea, e Nm,i,r (sl ) a respectiva populao em risco.
Ento, a estimativa para taxa global de casos em todo o mapa referente a classe de idade i na
raa r no tempo m dada por m,i,r =

sl S

xm,i,r (sl )/

sl S

Nm,i,r (sl ). Logo m,i,r (sl ) =

Nm,i,r (sl )m,i,r representa uma estimativa para o nmero de casos esperados no tempo m na

classe de idade i e raa r sob a hiptese de que no existe cluster no espao-tempo. Portanto,
uma estimativa para o nmero total de casos esperados na l-sima rea no tempo m dado por
[m] (sl ) =

P P
i

m,i,r (sl ) e consequentemente j

[m]

sl j

[m] (sl ).

Para obtermos uma estimativa para t,j , notamos que sob Hk,j , o estimador de mxima
verossimilhana de t,j dado por Xt (j)/t (j) e quando t,j = j este estimador dado por
Pt

m=k

Xm (j)/

Pt

m=k

m (j). Logo, a estimativa de mxima verossimilhana para t,j baseada

em {X1 = x1 , ..., Xt1 = xt1 }


[k,t1]
j

n
o
[t1]
= max 1, xt1 (j)/j

ou

[k,t1]
j

= max 1,

t1
X

xm (j)/

m=k

t1
X

)
[m]
j

m=k

quando t,j = j . No entanto, consideramos como estimativa para t,j uma verso suavizada da
estimativa de mxima verossimilhana dada por
[k,t1]

n
o
[k,t1]
[k,t1]
= max 1, x
j
/
j
.

Onde para t > k


[k,t1]

x
j

[k,t2]

= xt1 (j) +
xj

[k,t1]

[t1]

= j

[k,t2]

+
j

[k,t1]
[k,k1]
Caso contrrio, x[k,t1]
=
j
= 0 e j
= 1. A quantidade 0 1 um parmetro de
j

3.3 Aplicao

36

suavizao. Note que se = 0,


[k,t1]

n
o
[t1]
= max 1, xt1 (j)/j

e quando = 1,

(
[k,t1]
j

= max 1,

t1
X
m=k

xm (j)/

t1
X

)
[m]
j

m=k

A suavizao introduzida para reduzir o efeito das observaes de um passado muito distante na
estimativa atual de t,j . Quando pequeno, poucas observaes contribuiro para a estimativa
de t,j de modo que usamos = 0.8.

Resultados Obtidos
Ao aplicarmos os mtodos propostos para deteco e vigilncia de clusters de cncer,
obtemos o grco de monitoramento apresentado na gura (3.2) com valor de B igual a 20 e
 = 0.8. Neste caso, a taxa de alarmes falsos para qualquer um dos mtodos no mximo

0.05. No grco, o MAX-ALR no ultrapassa o valor de B em nenhum momento e por isso


essa estatstica no dispara um alarme. Os procedimentos MIX-ALR e WEIGHT-ALR soam um
alarme no tempo n = 1992. O WEIGHT-ALR mais sensvel a mudanas. O efeito do valor 
pode ser observado nos pontos de picos da funo de alarme WEIGHT-ALR. Observa-se, ainda,
que no tempo t=1990, o valor do MIX-ALR igual 9.92 e para o WEIGHT-ALR o valor obtido foi
18.99. Estes valores no ultrapassam o limite de controle representado por B=20. Usando o MIXALR, o cluster mais provvel [1980,1990] . onde = {LosAlamos, RioArriba, SantaF e, T aos}
representa a localizao espacial do cluster(ver gura 3.1) e o intervalo [1980, 1990] representa a
parte temporal. O valor da razo de verossilhana adaptativa foi 308.29 com um risco relativo
estimado adptativamente por [1980,1990]
= 2.27. Para o WEIGHT-ALR, a parte espacial do

cluster estimada por = {LosAlamos, M ora, Sandoval, SantaF e} com uma parte temporal
[1986, 1990], ALR = 48.01 e

[1986,1990]
j

dois cluster que representada por

= 2.89. Observe que existe uma interseco entre esses

[1986,1990]

= {LosAlamos, SantaF e}[1986,1980] . Na prtica, o

MIX-ALR e o WEIGHT-ALR representam uma soma sobre vrios candidatos a clusters que so
possvelmente correlacionados. Uma sntese dos resultados obtidos para os ltimos cinco perodos
de vigilncia apresentada na tabela 3.2. O importante so os resultados referentes ao tempo
atual denotado por n = 1992. O valor obtido para o MIX-ALR (WEIGHT-ALR) no tempo atual
42.672 (59.529) que um grande valor quando B=20. Neste caso a regio que dispara o alarme
estimada por = {LosAlamos}. O tempo estimado de incio do cluster k{LosAlamos} = 1987.
Ento o cluster no espao-tempo estimado representado por {LosAlamos}[1992,1987] . O cluster
estimado pela Estatistica Scan em Kulldor(2001) {LosAlamos}[1992,1989] . Note que embora a
localizao espacial seja a mesma, o tempo de durao do cluster diferente.

3.4 Extenses para abordagem Adaptativa no espao dos clusters

Tabela 3.1:

37

Deteco de clusters emergentes de casos de cncer da tireide em homens que ocorreram no Novo Mxico,
usando o MIX-ALR e WEIGHT-ALR nos ltimos cinco anos.

Alarm Function

MIX-ALR

WEIGHT-ALR

[k,n1]

Most likely cluster( )

years([k,n])

ARLn

SantaFe

[1980,1988]

2.34

7.41

LosAlamos, Mora, Sandoval, SantaFe

[1986,1989]

2.29

159.42

LosAlamos, RioArriba, SantaFe, Taos

[1980,1990]

2.27

308.29

LosAlamos, RioArriba, SantaFe, Taos

[1980,1991]

2.23

331.15

LosAlamos

[1987,1992]

6.98

866.88

Mora, SantaFe, Taos

[1979,1988]

2.16

5.87

LosAlamos, Mora, Sandoval, SantaFe

[1986,1989]

2.29

159.42

LosAlamos, Mora, Sandoval, SantaFe

[1986,1990]

2.89

48.01

LosAlamos, RioArriba, SantaFe, Taos

[1980,1991]

2.23

331.15

LosAlamos

[1987,1992]

6.98

866.88

Figura 3.2: Monitoramento on-line


B(threshold)=20

usando

MAX,

MIX

and

WEIGHT-ALR

com

3.4 Extenses para abordagem Adaptativa no espao dos clusters


Uma grande diculdade na utilizao dos procedimentos MAX e MIX-ALR a cardinalidade
J do conjunto . Quanto mais exvel em termos de forma geomtrica e tamanho for a classe ,

melhor ser a estimativa do cluster mas, maior ser sua cardinalidade. Isto implica que os valores
obtidos para o MAX e MIX-ALR sero pequenos de modo que o alarme pode no soar mesmo na
presena de um cluster emergente no mapa. Para solucionar este problema, ns recomendamos
o uso de uma abordagem adaptativa tambm no espao dos clusters .
Para elaborarmos esta abordagem considere uma classe inicial de distintos candidatos a
cluster 0 = l , l = 1, 2, ..., L com cardinalidade J 0 . Onde l = {l1 , ..., lL }. Por exemplo, l
pode representar o conjunto de todos os crculos centrados em sl cujo raio cresce continuamente

3.4 Extenses para abordagem Adaptativa no espao dos clusters

38

at que contenha 50% das localizaes espaciais do mapa. Para todo n > 1, dena
[n1]

j
= {lj : ALRn1
C,

j = 1, 2, ...L} e [n1] = l

[n1]

, l = 1, 2, ..., L.

para algum valor C > 1, ento no tempo atual n, a varredura espacial para deteco de cluster
emergente realizada sobre os candidatos pertencente a classe [n1] 0 que possui cardinalidade J [n1] . O fato que se no tempo n 1 a razo de verossimilhana adaptativa
l

j
ALRn1
=

P(Hn1 |Hk,lj )
1kn1 P(Hn1 |H0 )
max

possui valor menor ou igual a C , ento ela deve ser retirada da anlise no tempo n e [n1]
funciona como uma estimativa para o espao dos clusters no tempo n 1. Quando [n1]
=
l
para todo l, dena arbitrariamednte [n1] = 0 . Ou seja, quando no tempo n 1 nenhum lj
l

j
possuir ALRn1
maior que C , o processo de varredura espacial deve ser inicializada no tempo n

com todos os candidatos. Note que a cada n, J [n1] J 0 . Em particular, quando


[n1]

lj
= {lj : lj = argmax[ALRn1
]}

temos que J [n1] L e [n1] representa a estimativa de mxima verossimilhana adaptativa


para com os dados acumulados at o tempo n 1 de forma que no tempo n precisamos avaliar
no mximo L candidatos.
Agora como estratgia para deteco de cluster emergente use as verses generalizadas do
MAX, MIX e WEIGHT-ALR com tempo de alarme dado por:
GMAX-ALR.
(
1 (B) = min n 1 :
GMIX-ALR.

max
ALRnj B
J [n1] {lj [n1] }

1
2 (B) = min n 1 : [n1]

X
{lj

[n1] }

ALRnj B

(3.20)

(3.21)

: GWEIGHT-ALR

X
lj
3 (B) = min n 1 :
wlj ALRn B .

{ [n1] }

(3.22)

lj

Como [n1] conhecido no tempo n, a relao expressa na equao (3.10) preservada


por estes procedimentos. Para usarmos estas novas funes de monitoramento, ns usamos o
seguinte algoritmo:

Algoritmo

3.4 Extenses para abordagem Adaptativa no espao dos clusters

39

1. no tempo n = 0, Escolher um centride no mapa.


2. Calcular as distncias para os outros centrides. Ordene estas distncias em ordem
crescente e depois memoriza-las em um vetor de distncias (este vetor de distncias
um vetor de adjacncias).
3. Para cada centride do mapa repetir os passos 1 e 2 e ento construa a matriz de
adjacncias de acordo com a explicao dada na seo 4.6.
4. Escolher novamente um centride sl na regio. Centrado em sl contrua li , i =
1, 2, ..., L como explicado na seo 4.6.

5. Escolha um valor para a (por exemplo, a = L/4) e construa a classe


0 = {li : (< li , li >) a, (l, i) = 1, 2, ..., L}

6. Para cada n 1, atualizamos a classe n1 como explicado nesta seo. Especicamos um valor para e calcule o par (f(ALRn ), B). Onde f qualquer funo de
monitoramento descrita nesta seo: GMAX-ALR, GMIX-ALR ou GWEIGHT-ALR.
7. Se f(ALRn ) B , declare que existe um cluster emergente no mapa e o estime
pelo argmax [f (ALRn )] como dado na seo 3.2.3 . Caso contrrio, incremente uma
unidade no tempo e volte ao passo 6.
Para compararmos as funes de alarme GMAX e GMIX-ALR com MAX e MIX-ALR,
respectivamente, ns usamos estas funes na aplicao descrita na seo 3.3. Usamos [n1]
=
l
lj
]}. Nota-se na gura 3.3(a) que neste caso, o GMAX-ALR dispara
{lj : lj = argmax[ALRn1

um alarme no tempo atual enquanto que o MAX-ALR no dispara. Quando comparamos o


GMIX com o MIX, observamos que o alarme disparado pelo GMIX mais pronunciado de modo
que podemos concluir que a abordagem adaptativa no espao do cluster torna as funes de
alarme mais sensveis na deteco do cluster emergente.

Figura 3.3: Comparao do monitoramento On-line usando o MAX-ALR com GMAX-ALR em


(a) e MIX-ALR com GMIX-ALR em (b) com B(threshold)=20.

3.5 Estudo com dados simulados

40

3.5 Estudo com dados simulados


Neste estudo com dados simulados, usamos o modelo de cluster emergente ultilizado na
seo 3.3. Consideramos como populao em risco, Nt (sl ), a populao de homens residentes
no ano de 1992 nas 32 (L=32) reas do Novo Mxico como descrito em Kulldor(2001). Sobre
esta populao em risco ns simulamos um processo de Poisson com casos simulados para um
perodo de monitoramento n = 20 e 1000 rplicas do processo foram geradas. A parte espacial
do cluster alocado no mapa formado por 4 reas, j = {Chaves, Eddy, Lea, Otero}. Este
um cluster com populao mediana em relao ao mapa. Quando simulamos um processo sem

cluster assumimos que t (sl ) = 0 Nt (sl ), t = 1, 2, ...10. Onde 0 uma taxa de referncia global
para a doena. Para o processo com um cluster emergente, quando t = 11, ..., 20, supomos um
cluster em j com valor esperado t,j t (sl ) para todo sl em j . Observe que o incio do cluster
o ponto k = 11. Em nossas simulaes usamos:
Sob a hiptese H0 , E0 [Xt (sl )] = 0 Nt (sl ) para todo sl S e t 1, de modo que o nmero

de casos esperados na q-sima simulao para a rea Al proporcional a populao em


risco em Al .
Sob a hiptese Hk,j , consideramos os seguintes casos:
O parmetro t,j assume os valores {1.50, 2.00} para todo sl j e 11 t 20. Ou

seja, sob a hiptese de que existe um cluster emergente no mapa, a intensidade de


casos em j 50% e 100% maior em relao ao restante do mapa. Usamos tambm
t,j = 1.3t11+1 . Neste caso o risco cresce monotonicamente.
Usamos 0 = 0.0001 (taxa de um caso para cada 10000 habitantes) e = 0.05, 0.01.
3.5.1

Performance dos mtodos

Dado qualquer mapa e forma geomtrica para , quando H0 : = verdadeira a taxa


de alarmes falsos FAR[ (B)] dos procedimentos propostos so controlados por (3.11).
Quando a hiptese Hk,j : = k, = j verdadeira e o tempo de alarme k com a

localizao estimada do cluster dada por (parte espacial de n,k ), pode ocorrer que contenha
localizaes que no pertenam a j ou deixe de incluir localizaes que pertencen a j de modo
que o evento { = j } pode ocorrer raramente. Ento, denimos duas medidas para avaliarmos
a preciso do cluster detectado:
Sensitividade Condicional de um alarme SSCk,j [ ]- representada pela proporo de local-

izaes espaciais pertecentes a j que foram corretamente localizadas pelo cluster detectado

3.5 Estudo com dados simulados

41

dado que k. Esta medida estimada por,


PQ  #{(q) j } 
q=1

#{j }

I{ k}

PQ

q=1 I{ k}

Valor Predito Positivo Condicional de um alarme VPPk,j [ ]- a proporo de localizaes


espaciais presentes em que pertencem a j dado que k. Estime essa medida por,
PQ  #{(q) j } 
q=1

#{(q) }

I{ k}

PQ

q=1 I{ k}

Em que (q) o estimador de j obtido na q-sima simulao, IA a funo indicadora do evento


A e #{A} representa a cardinalidade do evento A.

As medidas, SSCk,j [ ] e VPPk,j [ ], avaliam o desempenho do mtodo em relao a localizao espacial estimada dado que o alarme verdadeiro. Se = j temos que SSCk,j [ ] =
VPPk,j [ ] = 1.

Quando j temos SSCk,j [ ] VPPk,j [ ] e se j implica em

SSCk,j [ ] VPPk,j [ ]. O ideal que estas medidas sejam prximas de 1 indicando que o

cluster localizado prximo do verdadeiro.


A rapidez com que o mtodo detecta o cluster pode ser descrita pelo atraso localizado que
representado pelo tempo mdio de atraso at que o alarme soe dado que realmente existe um

cluster emergente no mapa (condicional average detection delay). Esta medida expressa por
ADDk,j [ ] = E( k|Hk,j , k).

que pode ser estimada por,


PQ
k,j [ ] =
ADD

q=1 ( k)I{ q =j , k}
.
PQ
q = , k}
I
{
q=1
j

Independente da localizao estimada para o cluster, podemos usar o atraso mdio, que pode ser
estimado por

PQ

ADD[
]=

3.5.2

q=1 ( k)I{ k}
.
PQ
q=1 I{ k}

Resultados obtidos na simulao

Os resultados para as medidas de perfomance esto descritos na tabela 3.2. e so apresentados apenas para os mtodos GMIX e GWEIGHT-ALR. Pois estes obtiveram melhor de ) na deteco
sempenho nas simulaes. Como esperado, em ambos os mtodos o atraso (ADD

decresce e a preciso na localizao cresce quando aumenta o valor de t,j . Por exemplo, quando
t,j = 2, = 0.05 o atraso estimado para o GWEIGHT-ALR (GMIX) igual a 2.366 (2.490)

3.5 Estudo com dados simulados

42

que pode ser considerado pequeno, pois o cluster foi detectado logo no seu incio. A preciso na
localizao medida pela SSC 0.791 (0.871) enquanto que o VPP=0.719 (0.718). Observe na
tabela que a SSC > 0.7 e o VPP > 0.6 . A SSC sempre maior que o VPP implicando que o

cluster localizado tende a ser maior que o verdadeiro cluster, porm com uma boa preciso.
De uma forma geral, o GWEIGHT-ALR mais rpido (possui menor atraso) porm menos
preciso (possui menor SSC). O fato que se o GMIX demora mais tempo para soar o alarme e
ento, ele realmente deveria ser mais preciso pois com o passar do tempo o cluster vai cando mais
evidente. Uma visualizao da relao atraso versus preciso mostrada atravs de histogramas
bivariados nas guras 3.5 e 3.6. Nestas guras pode-se observar que mesmo quando o atraso
baixo a sensitividade e o valor predito positivo so elevados. Uma amostra do funcionamento
on-line do GMIX e GWEIGHT-ALR com dados simulados apresentado na gura (3.4).
Tabela 3.2: Valores estimados para Sensitividade (SSC), Valor Predito Positivo (VPP) e Atraso
(ADD) com diferentes valores para t,j , diferentes taxas aceitveis de alarmes falsos
() usando o GMIX e GWEIGHT-ALR.
Medidas de Perfomance

= 0.05

t,j

SSC

VPP

ADD

1.50

0.791

0.644

4.914

2.00

0.871

0.718

2.490

1.3t11+1

0.861

0.750

3.198

1.50

0.864

0.722

6.049

2.00

0.910

0.765

3.076

1.3t11+1

0.921

0.814

3.604

1.50

0.729

0.616

4.197

2.00

0.791

0.664

2.366

1.3t11+1

0.805

0.681

3.017

1.50

0.811

0.687

5.289

2.00

0.861

0.719

2.830

1.3t11+1

0.885

0.755

3.406

GMIX-ALR
= 0.01

= 0.05

GWEIGHT-ALR
= 0.01

3.6 Discusso

43

Figura 3.4: Amostra de uma simulao do processo para GMIX and GWEIGHT-ALR na escala
logartmica com log(B)=(threshold)=log(20).

Figura 3.5: Histograma Bivariado para o GMIX-ALR: Sensitividade (Sensitivity) versus atraso
(Delay) em (A) e Valor Predito Positivo (PPV-Positive Predicted Value) versus Delay(atraso) em (B).

Figura 3.6: Histograma Bivariado para o WEIGHT-ALR: Sensitividade (Sensitivity) versus


atraso (Delay) em (A) e Valor Predito Positivo (PPV-Positive Predicted Value) versus Delay(atraso) em (B).

3.6 Discusso
Neste captulo desenvolvemos novos mtodos para a vigilncia estatstica em mapas
de doenas em que o foco principal a deteco de clusters emergentes no espao-tempo. Ao
combinarmos tcnicas de vigilncia na escala temporal com estimao adaptativa e algortmos

3.6 Discusso

44

para a deteco de clusters espaciais de doenas, ns propusemos uma vigilncia no espao-tempo


baseada no uso da razo de verossimilhana adaptativa (ALR). Em essncia a ALR uma razo
de verossimilhana genuna e por isso preserva a propriedade martingal de modo que os mtodos
desenvolvidos neste captulo no requerem o uso de simulaes de Monte Carlo para validar a
signicncia estatstica do procedimento. Fato esse que comum aos procedimentos existentes
na literatura e pode tornar a anlise muito demorada dependendo do mapa em estudo.
Na estimao adaptativa dos parmetros ns usamos uma verso suavizada no tempo do
estimador de mxima verossimilhana, isto permite que possamos dar mais pesos aos dados
mais recentes diminuindo a inuncia de possveis clusters histricos nos dados atuais. Uma
caracterstica importante desta abordagem adaptativa que apesar de assumirmos independncia
mutua entre os vetores aleatrios, podemos capturar a dependncia espacial e temporal atravs
da estimativa. Para detectar cluster emergentes ns usamos trs funes de alarme: O mximo
sobre todas as ALR's, mistura de ALR's e ALR ponderada. Um exemplo onde os parmetros
so desconhecidos usado para ilustrar os mtodos propostos. Os resultados obtidos nesta
aplicao foram similares aos obtidos pela usual Estatstica Scan(Kulldor 2001) o que refora
a boa abilidade dos mtodos propostos em detectar cluster emergentes.
A medida que aumentamos a classe de candidatos a cluster ns observarmos algumas diculdades na deteco. Por isso aplicamos uma estimao adptativa tambm no espao dos clusters.
Esta nova abordagem melhorou os mtodos propostos em dois aspectos. Primeiro aumentou a velocidade na deteco e segundo diminui o espao dos cluster tornando o algoritmo mais eciente.
A vantagem da abordagem adaptativa no espao dos clusters que a cada tempo precisamos
avaliar no mximo L candidatos e, ainda assim, controlamos a taxa de falsos alarmes.
Embora analiticamente seja virtualmente impossvel obter propriedades estatsticas destes
mtodo no que tange ao atraso e preciso na deteco. Empiricamente, atravs de um simples
estudo com dados simulados, obtivemos resultados altamente satisfatrios que podem ser raticados ou no atravs de estudos comparativos com outros mtodos. Estes estudos comparativos
no foram abordados aqui devido diculdade tcnica de obtermos a taxa de alarmes falsos e
um limite de controle adequado para os mtodos competitivos, quando o valor esperado sobre
a hiptese nula desconhecida e a intensidade da mudana variam com o tempo. Tambm no
foram considerados neste trabalho outros aspectos de um sistema de vigilncia que so de vital
importncia para prossionais que o utilizam, por exemplo: qualidade e processamento dos dados, custo de um sistema de vigilncia e possiveis perdas nanceiras ocasionads por uma ao
desnecessria devido a um falso alarme.

45

4 Fator de Bayes Adaptativo para deteco


de cluster no espao-tempo

4.1 Introduo
No contexto no-bayesiano, a deteco de mudana no espao-tempo, tem sido abordada
na literatura atravs de teste de hipteses. Uma suposio implicita nestes testes que o processo
observado composto por componentes mutuamente independentes no espao-tempo. Porm,
esses componentes podem ser correlacionados, no-estacionrios ou ambos. Isto implica que as
propriedades obtidas para estes testes podem estar sendo violadas. Neste caso, uma alternativa
usar procedimentos bayesianos que possam acomodar esses problemas.
Do ponto de vista bayesiano os testes de hipteses so encarados como um problema de
comparao de dois modelos M0 e M1 , onde cada modelo pode representar, por exemplo, uma
hiptese estatstica de mudana ou no-mudana no padro dos dados observados. Uma forma
conveniente de resumir a evidncia nos dados em favor de um dos modelos atravs do uso do
fator de Bayes. Este tem sido usado por Gangnon e Klayton (2007) para deteco de mudanas
no espao e por West(1986) em monitoramento na escala temporal. Neste captulo, ns propomos o uso de um Fator de Bayes seqencial local para deteco de mudanas no espao-tempo.
Estas mudanas so detectadas atravs da comparao entre as densidades preditivas para o
modelo padro, contra as preditivas para um conjunto de modelos alternativos. Estes modelos
so atualizados no tempo. Essencialmente, os modelos alternativos possuem forma similar ao
modelo padro porm, permitem mudanas nos valores dos parmetros que caracterizam o modelo padro. A abordagem apresentada neste captulo, pode ser entendida como uma extenso da
abordagem de West(1986) discutida resumidamente na seo 2.2.5.

4.2 Anlise Sequencial de Modelos


4.2.1

Distribuies preditivas e Fator de Bayes

Seja S uma regio em estudo particionada em L-reas contguas indexadas pelo ponto
sl . Usualmente, S um mapa (de muncipios, bairros, etc...) e sl o centride do polgono que

4.2 Anlise Sequencial de Modelos

46

delineia a rea. Considere sob S o processo estocstico no espao-tempo Xt = {Xt (sl ) : t


{1, 2, ...}, l = 1, 2, ..., L} com valor observado xt , onde t representa um perodo ou um ponto no

tempo. Sejam = {sl S : sl } um conjunto conexo de localizaes espaciais com o forma


e tamanho conhecidos e = {1 , 2 , ..., J } uma classe destes conjuntos onde os j0 s so todos
distintos. Aps observar o processo n vezes, denote o histrico do processo at n por Hn1 ,
Hn = {Hn1 , xn , In } e informao inicial H0 . Onde, In contm toda informao adicional alm

daquela obtida com as observaes do processo. Por exemplo, In pode incluir valores de possveis
covriaveis conhecidas. Caso a nica informao adicional obtida em cada tempo n seja xn , ento
Hn = {Hn1 , xn }.

Assuma que sob condies normais de funcionamento, o processo Xt representado estatisticamente por um modelo padro (ou de referncia) para Xt dado por:
Mt,0 = {f (Xt | t ), g0 ( t |Ht1 ), p0 (Xt |Ht1 )}.

Este modelo envolve: (a) A distribuio de Xt com densidade condicional


f (Xt | t ) =

f (Xt (sl )|t (sl ))

sl S

dependendo de um parmetro t = (t (s1 ), ..., t (sL )), ou seja, os componentes de Xt so condicionalmente independentes; (b) Uma distribuio a priori para t ,
g0 ( t |Ht1 ) =

(l)

gt,0 (t (sl )|Ht1 (l)).

sl S

Dado o histrico da srie Ht1 = sl S Ht1 (l) os componentes de t so condicionalmente


independentes; (c) Uma distribuio (ou densidade) preditiva p0 (Xt |Ht1 ) para Xt dada por
Z
p0 (Xt |Ht1 ) =

f (Xt | t )g0 ( t |Ht1 )d t .

(4.1)

Onde a integral realizada sobre o espao paramtrico para t .


Aps observar Xt = xt , a quantidade p0 (xt |Ht1 ) o valor da verossimilhana do modelo
padro e representa sua abilidade preditiva. Suponha que no tempo t xamos um e Mt,0
comparado com um modelo alternativo
Mt, = {f (Xt | t ), g ( t |Ht1 ), p (Xt |Ht1 )}.

pertencente a uma classe M = {Mt, , }, e que possui densidade preditiva p (xt |Ht1 ). O
modelo Mt, construdo de modo a representar uma possvel mudana na distribuio do subprocesso {Xt (sl ) Xt : t k, sl j } para algum par (k, ) desconhecido. Ns chamamos esta
)
indicando
mudana de cluster no espao-tempo (ou cluster emergente) e o denotamos por (k,

que a mudana ocorreu no conjunto (ou grupo) de localizaes espacias = {sl S : sl }

4.2 Anlise Sequencial de Modelos

47

emergindo a partir do tempo k.


Para vericar o ajuste preditivo dos modelos Mt,0 e Mt, , usamos a razo de verossimilhanas
preditivas ou Fator de Bayes (FB)
FBt () =

p (xt |Ht1 )
.
p0 (xt |Ht1 )

(4.2)

Um valor FBt () > 1 implica uma melhor performance preditiva de Mt, indicando uma possvel
mudana no processo.
4.2.2

Fator de Bayes Local

Como o interesse detectar mudanas localizadas no espao-tempo aps um ponto de


mudana k n, necessrio considerar um grupo formado pelas mais recentes n k + 1 observaes consecutivas em algumas localizaes especcas. Para isso, assuma que sob Mt, com
ponto de mudana em um tempo k, a distribuio a priori para t do tipo lei de potncia
expressa por

I({tk,sl })

g ( t |Ht1 ) g0 ( t |Ht1 )t,

(4.3)

Onde I({A}) a funo indicadora do evento A e t, um valor positivo. Logo, se t < k temos
F Bt () = 1 e para t k ,
R
f (Xt | t )g ( t |Ht1 )d t
p (xt |Ht1 )
=R
FBt () =
p0 (xt |Ht1 )
f (Xt | t )g0 ( t |Ht1 )d t

e pela independncia condional dos componentes de t obtemos


(l)
(l)
t, d (s )
t l
sl ct, f (Xt (sl )|t (sl ))gt,0 (t (sl )|Ht1 (l))
,
RQ
(l)
sl f (Xt (sl )|t (sl ))gt,0 (t (sl )|Ht1 (l))dt (sl )

RQ
FBt () =
Q
=

(l)

sl

pt, (Xt (sl )|Ht1 (l))

sl

pt,0 (Xt (sl )|Ht1 (l))

(l)

Onde,
(l)
pt, (Xt (sl )|Ht1 (l))

(l)

t k.

Z
=

(4.4)

ct, f (Xt (sl )|t (sl ))gt,0 (t (sl )|Ht1 (l))t, dt (sl )

(l)

(4.5)

(l)

(4.6)

(l)

pt,0 (Xt (sl )|Ht1 (l)) =

f (Xt (sl )|t (sl ))gt,0 (t (sl )|Ht1 (l))dt (sl )

e c(l)
t, uma constante de normalizao.
Observe que quando t k, FBt () depende somente dos dados observados em . O valor
t, explicado na seo 4.4.2. Para cada , o fator de Bayes FBt () similar ao descrito em

West (1986). Agora, para uma sequencia de observaes x1 , ..., xn , n 1, denote por P0 (P0 ) a
densidade (distribuio) preditiva conjunta sob {Mn,0 }n1 e Pk, (Pk, ) densidade(distribuio)

4.3 Deteco de cluster no espao-tempo via Fator de Bayes Adaptativo

48

preditiva conjunta para {Mn, }n1 com ponto de mudana em um tempo k n. Ento a razo
de verossimilhana preditiva conjunta dada por
Pk, (xn , ..., x1 |H0 )
P0 (xn , ..., x1 |H0 )
Pk, (xn |xn1 , ..., x1 , H0 )Pk, (xn1 , ..., x1 |H0 )
=
P0 (xn |x1 , ..., xn1 , H0 )P0 (xn1 , ..., x1 |H0 )
p (xn |Hn1 )Pk, (xn1 , ..., x1 |H0 )
=
p0 (xn |Hn1 )P0 (xn1 , ..., x1 |H0 )
n
Y
= FBn () FBn1,k () =
FBt ().

FBn,k () =

(4.7)

t=k

FBn,k () uma funo que pode ser usada para localizar possveis mudanas nas mais recentes
n k + 1 observaes no conjunto de localizaes espaciais. Uma propriedade importante de
FBn,k (), que para quaisquer xo, sob a distribuio preditiva P0 a sequncia {FBn,k (), n
k} um martingal de valor esperado igual a 1. Para mostrar essa propriedade, observamos que

se E0 um valor esperado sob P0 , ento


E0 [FBn,k ()|Hn1 ] = E0 [FBn () FBn1,k ()|Hn1 ]
= FBn1,k ()E0 [FBn ()|Hn1 ].

Z 
p (xn |Hn1 )
p0 (xn |Hn1 )dxn .
= FBn1,k ()
p0 (xn |Hn1 )
Z
= FBn1,k () p (xn |Hn1 )dxn = FBn1,k ().

(4.8)

e ainda,
Z 

E0 [FBn,k ()] =
Z
=

Pk, (x1 , ..., xn |H0 )


P0 (x1 , ..., xn |H0 )


P0 (xn , ..., x1 |H0 )dx1 dxn

Pk, (x1 , ..., xn |H0 )dx1 dxn = 1.

(4.9)

de modo que {FBn,k (), n k} um martingal de mdia 1.

4.3 Deteco de cluster no espao-tempo via Fator de Bayes Adaptativo


4.3.1

Tempo de alarme para deteco de cluster no espao-tempo

Para construrmos uma regra para deteco e localizao do cluster no espao-tempo,


primeiramente assumimos que o interesse a deteco de mudanas em uma janela temporal de
comprimento xo w n e denimos
FBn = max

max

FBn,k ().

nw+1kn

4.3 Deteco de cluster no espao-tempo via Fator de Bayes Adaptativo

49

Como estratgia para a deteco considere o tempo de alarme dado por


= (B ) = min {n 1 : FBn B } .

(4.10)

Ou seja, o tempo de alarme, o primeiro momento no tempo tal que a estatstica FBn excede
o valor B que controla a probabilidade (ou a taxa) de alarmes falsos. Na linguagem de
anlise sequncial n w + 1 pode ser interpretado como o maior valor permitido para o atraso
na deteco da mudana. Um exemplo para esta situao a deteco de clusters emergentes
de doenas infecciosas onde uma epidmia pode ser evitada se o cluster for detectado em um
intervalo de tempo com comprimento menor ou igual a w 1. Note que o limite de controle
B assumido igual para todos os candidatos a clusters emergentes. O fato que o valor de
B depende da probabilidade (ou taxa) de alarmes falsos e um valor B comum para todos

os
 candidatos garante que esta taxa seja igual para todos. Se existe um n tal que o evento
max max FBn,k () B ocorre, estime o cluster no espao-tempo por
nw+1kn

n,k


= arg max max FBn,k () .
nwkn

Caso contrrio, dena = para min{}. A escolha n,k baseada no fato de que, se o cluster
comeou no tempo k e terminou em n0 < n ele deveria ter sido detectado pelo mtodo em n0 .
Desde de que baseado no valor mximo de FBn,k (), ele denominado MAX-FB.
4.3.2

Probabilidade de um falso alarme para o MAX-FB

O procedimento para deteco e monitoramento de cluster no espao-tempo descrito em


(4.10), representa um tempo aleatrio de alarme que depende de Hn , e de uma janela temporal de
comprimento w. Um bom procedimento deve ter uma pequena probabilidade de alarmes falsos
e um pequeno atraso na deteco do cluster. Para o mtodo MAX-FB ns usamos a seguinte
medida de um falso alarme restrito,(Lai,1995):
(4.11)

P0 ( + w 1)

Esta medida signica que se a sequncia de modelos {Mt,0 , t } adequada para os dados,
ento a probabilidade de um falso alarme em qualquer janela temporal de comprimento w
menor ou igual a um nvel pr-especicado 0 < < 1.

Theorem 4 Para cada n seja J a cardinalidade de e = {


para algum valor xo 0 < < 1. Se

= 2Jw/. Entao

: P0 ( + w 1) },

Este teorema nos diz que se um nvel aceitvel para a probabilidade de um falso alarme e se o
interesse detectar mudanas emergentes na sequncia {Mt,0 } usando o procedimento MAX-FB

4.3 Deteco de cluster no espao-tempo via Fator de Bayes Adaptativo

50

com um nvel de alarme falso inferior a 0.05, faa B = 2Jw/0.05. Para provar o teorema 4,
observamos que = {1 , 2 , ..., J } e o evento

max

max

FBn,k (j ) B

j nw+1kn

ocorre, se An,k (j) , {FBn,k (j ) B } ocorre para algum n k e j = 1, 2, ...J . Como sob a
distribuio preditiva P0 a sequncia {FBn,k (j ), n k} um martingal de valor esperado igual
a 1 para todo j = 1, 2, ..., J . Ento,
P0 (An,k (j)) 1/B

e

P0 max

max

FBn,k (j ) B

j nw+1kn


= P0

J
[

n
[

j=1 k=nw+1

J
X

n
X

An,k (j)

P0 (An,k (j)) .

j=1 k=nw+1

Consequetemente, para algum n + w 1 e j = 1, 2, ..., J temos


P0 ( + w 1)

J
X

+w1
X

P0 (An,k (j)) 2Jw/B .

j=1 k=w+1

Agora se B = 2Jw/ obtemos,


P0 ( + w 1) .
4.3.3

Fator de Bayes Adaptativo

A cada n , uma grande diculdade que pode tornar invivel a utilizao do procedimentos
MAX-FB a cardinalidade J da classe M = {Mn, , }, pois esta igual a cardinalidade de
. Quanto mais exvel em termos de forma geomtrica e tamanho for a classe , melhor ser a

estimativa da localizao espacial do cluster porm, maior ser o valor de J . Se pequeno e J


razoavelmente grande, ento pode ocorrer B = (2Jw/) de modo que mesmo na presena
de um cluster no espao-tempo o alarme pode no soar, ou soar com grande atraso. Com o
objetivo de solucionar este problema, ns recomendamos o uso de uma abordagem adaptativa
na classe M.
Para elaborarmos a abordagem adaptativa, considere uma classe inicial (0) = l , l =
1, 2, ..., L com cardinalidade J (0) , onde l = {1l , ..., jl }. Neste caso, jl um conjunto de

localizaes espaciais com centro em sl . Por exemplo, jl pode representar um caminho aleatrio

4.3 Deteco de cluster no espao-tempo via Fator de Bayes Adaptativo

51

em S partindo de sl em qualquer direo. Para n > 1, denote


(n1)
l


= arg

max

max

jl l nwkn1


[FBn1,k (jl )] ,

(4.12)

e
(n1)

(n1) = {1

(n1)

, ..., L

}.

Seja
n
o
(n1)
(n1)
(n) = l
(n1) : FBn1 (l
) > C

para alguma constante C 1. Se no existe um l(n1) tal que FBn1 (l(n1) ) > C , dena
(n) = (n1) . Finalmente, construa a classe de modelos alternativos por
M(n) = {Mn,l , l (n) }.

com cardinalidade J (n) L. Note que neste caso, se l = ln1 n . Ento usando (4.7) e
(4.12),
pl (xn |Hn1 )Pk,l (xn1 , ..., x1 |H0 )
p0 (xn |Hn1 )P0 (xn1 , ..., x1 |H0 )


Pk,l (xn1 , ..., x1 |H0 )
n1
max
= FBn (l ) max
P0 (xn1 , ..., x1 |H0 )
l (n1) nwkn1

FBn,k (l ) =

(4.13)

= FBn (ln1 )FBn1,k (ln1 ).

Ou seja, a classe Mn formada por todos os modelos Mn,l com maior densidade preditiva no
tempo n 1, dentre todos os modelos que so construdos a partir do ponto sl , (l = 1, 2, ..., L)
e ainda, a anlise sequncial sobre os dados acumulados ao longo do tempo repetida somente
sobre estes modelos. Aps observar (x1 , ..., xn ) considere F BA como o Fator de Bayes Adaptativo
para comparar a perfomance preditiava de Mn,l versus Mn,0 dado por
FBAn,k (ln1 ) =

pn1 (xn |Hn1 )Pk,n1 (xn1 , ..., x1 |H0 )


l

p0 (xn |Hn1 )P0 (xn1 , ..., x1 |H0 )

como n1 = n1 (xn1 , ..., x1 ) mensurvel a (x1 , ..., xn1 ) e portanto conhecido no tempo n,
temos que FBAn,k preserva a propriedade martingal de FBn,k para qualquer conjunto . Agora,
denimos
FBAn = max
n

max

FBAn,k ().

nw+1kn

e como estratgia para deteco de cluster emergente considere o tempo de alarme dado por
n
o
= (B (n) ) = min n 1 : FBAn B (n) .

(4.14)

Se B (n) = 2J (n) w/ ento . Para mostra que , no teorema 4 substitua J por J (n)
e use o fato que FBAn,k preserva a propriedade martingal de FBn,k .
Esta abordagem adaptativa no sentido que a classe M(n) e o limite de controle B (n) so

4.4 Estrutura Geral dos Modelos

52

construdos com dados obtidos at o tempo n 1. A vantagem desta abordagem que o uso
do Fator de Bayes Adaptativo previne que a cada n, avaliaes desnecessrias sobre modelos
com pobre perfomance preditiva no tempo anterior, tornando rpido o algortimo de busca sobre
cluster emergentes e diminuindo o atraso na deteco uma vez que diminui a cardinalidade de .
Um guia para a escolha de C usar a escala para o Fator de Bayes descrita em Kass e Raftery
(1995). Em uma anlise no sequencial, ou seja a tempo xo, se (J +1) modelos, M0 , M1 , ..., MJ ,
esto sendo considerados e M1 , ..., MJ so comparadas com M0 , Kass e Raftery (1995) sugeriram
a seguinte interpretao:
Tabela 4.1: Interpretao do Fator de Bayes (Kass e Raftery, 1995)
Interpretao do Fator de Bayes
FB

log(F B)

Evidncia contra M0

(0, 1]

(, 0]

Negativa

(1, 3]

(0, 1]

Fraca

(3, 20]

(1, 3]

Positiva

(20, 150]

(3, 5]

Forte

(150, )

(5, )

Muito Forte

Usando esta escala ns usamos C = 3 que parece um valor razovel para uma anlise
preliminar no espao . Em nossas simulaes apresentadas no nal deste captulo este valor
considerado adequado para nossa aplicao.
Por m, aps a anlise dos dados, se um alarme de cluster for disparado, estime o cluster
emergente pelo par (n , k(n )), onde:
n = max

max

FBAn (l )

(4.15)

max


n

FBAn,k ( )

(4.16)

l (n) nw+1kn

e
k(n ) = arg


nw+1kn

4.4 Estrutura Geral dos Modelos


4.4.1

Modelo Padro

Para construrmos o modelo padro Mt,0 , assumimos que no tempo t, o processo observado sob condies normais de funcionamento. Seja Xt (sl ) a varivel aleatria de interesse
medida em sl e suponha que a sua densidade condicional a t (sl ) pertencente a famlia expo-

4.4 Estrutura Geral dos Modelos

53

nencial dada por:


f (Xt (sl )|t (sl )) = u(Xt (sl ), t (sl ))
exp {t (sl ) [Xt (sl )t (sl ) q(t (sl ))]} .

(4.17)

com parametro natural desconhecido t (sl ) e parmetro de preciso conhecido t (sl ). Esta famlia
de densidades tem a seguinte propriedade:
E0 [Xt (sl )|t (sl )] =

e
V0 [Xt (sl )|t (sl )] =

q(t (sl ))
= q 0 (t (sl ))
t (sl )

1
1 2 q(t (sl ))
=
q 00 (t (sl ))
2
t (sl ) t (sl )
t (sl )

(4.18)

onde E0 e V0 representam, respectivamente, o valor esperado e a varincia de uma varivel


aleatria sob o modelo Mt,0 . Considere uma funo monotona
z(t (sl )) = q 0 (t (sl ))

(4.19)

Esta dene uma transformao 1 a 1 t (sl ) = z(t (sl )) (com inversa t (sl ) = z 1 (t (sl )) )
do espao do parmetro t (sl ) em um outro conjunto E R que representa o espao do
valor mdio para a distribuio condicional de [Xt (sl )|t (sl )]. Introduzindo t (sl ) em (4.18),
expressamos a varincia da distribuio de [Xt (sl )|t (sl )] como uma funo do valor mdio,
tambm chamada funo de varincia, atravs de
V (t (sl )) = q 00 (z 1 [t (sl )]).

(4.20)

Uma famlia na distribuio exponencial com parmetro natural unicamente determinada por
sua funo de varincia e vice-versa (Morris, 1982). Isto , dada uma funo de varincia temse uma classe de distribuies correspondenetes. Para entender a importncia da funo de
varincia em nosso modelo padro, suponha que
(l)

gt,0 (t (sl )|Ht1 (l)) = v(at (sl ), bt (sl ))


exp {bt (sl ) [at (sl )t (sl )/bt (sl ) q(t (sl ))]} .

(4.21)

(l)
Ou seja, gt,0
(t (sl )|Ht1 (l)) a densidade a priori de uma distribuio conjugada (Migon e

Gamermam, 1999) para t (sl ). Esta densidade a priori ser denotada por (t (sl )|Ht1 (l))
P C[at (sl ), bt (sl )] e, completamente especicada pois o par [at (sl ), bt (sl )] assumido conhecido

e funo de Ht1 (l). Assuma neste trabalho que V (t (sl )) uma funo no mximo quadrtica,
distribuies que satisfazem esta suposio so: Normal, Gama, Poisson, Binomial e Binomial
negativa. Ento, o par [at (sl ), bt (sl )] tem uma simples interpretao em termos de t (sl ) =
z(t (sl )) (Gutires e Smith, 1995):
E0 [t (sl )|Ht1 (l)] = at (sl )/bt (sl ),

4.4 Estrutura Geral dos Modelos

54

e
b1
t (sl ) =

V0 (t (sl )|Ht1 (l))


E0 [V0 (t (sl ))|Ht1 (l)]

(4.22)

com t (sl ) = E0 [Xt (sl )|t (sl )] (veja refer). O parmetro b1


t (sl ) conhecido na rea de engenharia de qualidade como relao sinal/rudo.
Agora, combinando (4.17) e (4.21) temos que a densidade preditiva de Xt (sl ), veja a expresso (4.6),

(l)

pt,0 (Xt (sl )|Ht1 (l)) =

(l)

f (Xt (sl )|t (sl ))gt,0 (t (sl )|Ht1 (l))dt (sl )

= u(Xt (sl ), t (sl ))v(at (sl ), bt (sl ))


Z

exp {[at (sl ) + t (sl )Xt (sl )]t (sl ) [bt (sl ) + t (sl )]q(t (sl ))} dt (sl )
=

u(Xt (sl ), t (sl )) v(at (sl ), bt (sl ))


.
v([at (sl ) + t (sl )Xt (sl )], [bt (sl ) + t (sl )])

(4.23)

Esta a forma da densidade preditiva que serve de base para avaliar o ajuste da distribuio
[Xt (sl )|Ht1 (l)] sob o modelo padro Mt,0 . Temos, ainda,
E0 [Xt (sl )|Ht1 (l)] = E0 ([E0 [Xt (sl )|t (sl )]|Ht1 (l)) = E0 [t (sl )|Ht1 (l)] = at (sl )/bt (sl ).

e
V0 [Xt (sl )|Ht1 (l)] = E0 (V0 [Xt (sl )|t (sl )]|Ht1 (l))
+ V0 (E0 [Xt (sl )|t (sl )]|Ht1 (l))

Combinando (4.18) com (4.20) obtemos em termos de t (sl ),





1
V0 [Xt (sl )|Ht1 (l)] = E0
V0 (t (sl )|Ht1 (l)) + V0 (t (sl )|Ht1 (l))
t (sl )


1
= E0
V0 (t (sl )|Ht1 (l)) + b1
t (sl )E0 [V0 (t (sl ))|Ht1 (l)]
t (sl )


1
1
=
+
E0 [V0 (t (sl ))|Ht1 (l)].
t (sl ) bt (sl )

a qual equivalente em termos de t (sl )



V0 [Xt (sl )|Ht1 (l)] =

4.4.2

1
1
+
t (sl ) bt (sl )

E0 [q 00 (t (sl ))|Ht1 (l)].

Modelo Alternativo

Observa-se na expresso para a varincia da distribuio de [Xt (sl )|Ht1 (l)], que esta
1
depende da distribuio a priori atravs de bt (sl ); a quantidade 1
t (sl ) + bt (sl ) representa uma

4.4 Estrutura Geral dos Modelos

55

medida de preciso da densidade preditiva que tem valor esperado at (sl )/bt (sl ). Logo xando
mt = at (sl )/bt (sl ) e decrescendo bt (sl ) obtemos uma densidade preditiva mais difusa e crescendo
bt (sl ) o efeito reverso. Ento, uma densidade preditiva apropriada para deteco de mudanas

em Mt,0 depois de um tempo k em algum conjunto , pode ser construda por substituir em
(4.23) bt (sl ) por outro valor menor que bt (sl ) para todo t k e sl . Esta substituio
feita diretamente por usarmos a distribuio a priori do tipo lei de potncia dada em (4.3)
com 0 < t, < 1. Para esta distribuio a priori em (4.3) obtemos a densidade preditiva para
[Xt (sl )|Ht1 (l)] sob o modelo Mt, por pt, (Xt (sl )|Ht1 (l)) em (4.5). Neste caso a distribuio
(l)

priori em (4.21) substituida por


(4.24)

(l)

gt, (t (sl )|Ht1 (l)) = v(t, at (sl ), t, bt (sl ))


exp {t, bt (sl ) [at (sl )t (sl )/bt (sl ) q(t (sl ))]} .

que representa a distribuio a priori para t (sl )|Ht1 (l) sob Mt, . Combinando (4.17) com
(4.24) obtenha que,
Z

(l)

pt, (Xt (sl )|Ht1 (l)) =

(l)

f (Xt (sl )|t (sl ))gt, (t (sl )|Ht1 (l))dt (sl )

= u(Xt (sl ), t (sl ))v(t, at (sl ), t, bt (sl ))


Z

exp {[t, at (sl ) + t (sl )Xt (sl )]t (sl ) [t, bt (sl ) + t (sl )]q(t (sl ))}
=

u(Xt (sl ), t (sl )) v(t, at (sl ), t, bt (sl ))


.
v([t,j at (sl ) + t (sl )Xt (sl )], [t, bt (sl ) + t (sl )])

(4.25)

Neste caso a densidade (4.25) obtida pela substituio do par [at (sl ), bt (sl )] por [t, at (sl ), t, bt (sl )]
em (4.23). Por usar este fato, obtenha diretamente que,
Ek, [Xt (sl )|Ht1 (l)] = E0 [Xt (sl )|Ht1 (l)] = at (sl )/bt (sl ).

e

1
1
Vk,j [Xt (sl )|Ht1 (l)] =
+
E0 [q 00 (t (sl ))|Ht1 (l)]
t (sl ) t, bt (sl )
> V0 [Xt (sl )|Ht1 (l)], para 0 < t, < 1.


(4.26)

Onde Ek, e Vk,j representam, respectivamente, o valor esperado e a varincia de uma varivel
aleatria sobre o modelo Mt, para t k. Nota-se ento que: 1) o valor esperado para as
distribuies preditivas o mesmo sob os modelos Mt,0 e Mt, . 2) O spread
da densidade preditiva sob Mt, maior que a preciso
sob Mt,0 . Isto signica que
(l)
pt,0 (Xt (sl )|Ht1 (l))

(l)
pt, (Xt (sl )|Ht1 (l))

1
t (sl )

1
bt (sl )

1
t (sl )

1
t, bt (sl )

da distribuio preditiva

pode ter a forma de uma verso suavizada de

(ver gura 4.1). Deste modo, a densidade preditiva do modelo alternativo

Mt, d maior probabilidade a regies no favorecidas pela densidade do modelo padro Mt,0 e

ser mais difusa em regies com alta densidade preditiva sob Mt,0 . Para que a distribuio a

4.5 Representao Espacial do cluster

56

priori t (sl ))|Ht1 (l) seja completamente especicada sobre o modelo Mt, precisamos especicar
o valor de t, . Para isso suponha inicialmente que para cada sl determinanos um valor t,l .
Ento usamos

1 X
t,l
||

t, =

sl

onde || representa a cardinalidade de . A quantidade t,l calculada como em West (1986) e


dada por,
t,l = /[1 + (1 )(bt (sl )/t (sl ))]

para algum 0 < < 1 xo. Esta escolha implica que a preciso relativa entre as densidades
preditivas sob os modelos padro e alternativo constante no tempo e expressa por


1
t (sl )

1
t (sl )

1
t,l bt (sl )

1
bt (sl )

 =

1
.

(4.27)

Notando que neste caso,




1
t (sl )

Vk,j [Xt (sl )|Ht1 (l)]


= 
V0 [Xt (sl )|Ht1 (l)]

1
t (sl )

1
t,l bt (sl )

1
bt (sl )

E0 [q 00 (t (sl ))|Ht1 (l)]

E0 [q 00 (t (sl ))|Ht1 (l)]

1
.

(4.28)

Ento podemos dizer que o desvio padro preditivo em Mt, um fator 1/ vezes maior que
o desvio padro preditivo em Mt,0 . Para (0.11, 0.44) este fator pertence ao intervalo (1.5, 3)
West(1986) tem recomendado valores no intervalo (0.1, 0.3) e ns usamos = 0.2 de modo que

1/ 2. Para nalizar esta seo, combinamos (4.25) com (4.23) e (4.4), obtemos que para

qualquer com estrutura de modelo de cluster dado nesta seo o Fator de Bayes expresso por:
FBt () =

Y
sl

u(Xt (sl ), t (sl )) v(t, at (sl ), t, bt (sl ))


v([t,j at (sl ) + t (sl )Xt (sl )], [t, bt (sl ) + t (sl )])

v([at (sl ) + t (sl )Xt (sl )], [bt (sl ) + t (sl ))]
u(Xt (sl ), t (sl )) v(at (sl ), bt (sl ))
Y v(t, at (sl ), t, bt (sl ))
v(at (sl ), bt (sl ))

sl

v([at (sl ) + t (sl )Xt (sl )], [bt (sl ) + t (sl )])
v([t,j at (sl ) + t (sl )Xt (sl )], [t, bt (sl ) + t (sl )])

t k.

(4.29)

4.5 Representao Espacial do cluster


Para contrurmos um algoritmo para a deteco e localizao do cluster, primeiramente
reconhecemos que a noo de um conjunto de localizaes espacias inerentemente vaga e
carece de qualquer denio a priori. Pode no haver verdadeiro no sentido de um verdadeiro
valor do parmetro. Por exemplo, pode ser denido como um conjunto de zonas circulares

4.5 Representao Espacial do cluster

57

Figura 4.1: Uma possvel representao para as densidades preditivas em relao aos modelos
padro e alternativo.
como as denidas na seo 2.1 (Openshaw et al.,1988; Besag e Newel, 1991; Kulldor, 1997).
No entanto, a mudana pode ter ocorrido em um conjunto de localizaes espaciais com formato
irregular igual ao descrito em Duczmal and Assuno (2004). Na prtica, um conjunto
determinado por uma estimativa ou aproximao fornecida pelos dados. Quanto mais exvel,
em termos de formato geomtrico for a classe , melhor ser essa aproximao. Essa exibilidade
pode torna a cardinalidade de excessivamente grande, mas ao usarmos a abordagem adaptativa
na classe ns podemos controlar o valor de sua cardinalidade o que permite o uso de outros
algoritmos para a representao espacial do cluster. Por isso neste captulo ns usamos uma
representao elptica (Kulldor et al., 2006) para a localizao espacial do cluster
Para construo de considere que possui forma, tamanho e direo desconhecida. Uma
classe de representaes geomtricas pode ser denida atravs de elipses. Primeiramente
observe a gura 4.2. Esta gura apresenta uma elipse com orientao arbitrria centrada em
um ponto especifco s, que representa o centride de uma rea do mapa. Nesta elipse temos os
seguintes elementos:
a e b so os semi-eixos da elipse. "a" o semi-eixo maior e "b" o menor.
"e" a excentricidade.
F1 e F2 so os focos dessa elipse.

Uma elipse centrada em um ponto s pode ser unicamente denida por trs parmetros:
excentricidade, "e", parmetro de forma; ngulo=% , dene a direo da elipse; o tamanho

4.5 Representao Espacial do cluster

58

Figura 4.2: Exemplo de uma Elipse


mensurado pelo semi-eixo maior a = . Em uma elipse, temos que e2 = 1 (a/b)2 de modo
que o parmetro = a/b dene a forma da elipse. Quando grande a elipse longa e
estreita, quando = 1 temos um crculo. O parmetro % o ngulo entre a linha horizontal e
o semi-eixo maior da elipse. Em um mapa ns podemos construir innitas elipses. No entanto,
ns consideramos apenas um conjunto nito de elipses centradas em cada centride sl . Em cada
ponto sl ns podemos construir vrias elipses com forma (), tamanho ( ) e direo (%) diferente.
Ento, seja lj uma elipse centrada em sl com parmetros (j , j , %j ), desde que conheamos as
coordenadas geogrcas de sl e os pontos extremos do mapa, os valores (j , j , %j ) esto todos
bem denidos de modo que a representao de lj nica. Na gura gura 4.3 apresentamos
algumas formas geomtricas de cluster que podem ser detectadas: C1 e C3 so elipses com
orientaes diferentes e C2 tem um formato aproximadamente circular.

Figura 4.3: Formato de Clusters que podem ser detectados


Uma observao importante, que para cada forma eliptca podemos construir um grande
nmero de diferentes ngulos. Para uma elipse com forma mais compacta, tal que = 1.5, os
centrides includos em uma elipse no mudam com uma suave mudana no valor do ngulo
%, ou seja vrias elipses representaro o mesmo cluster. No extremo, os centrides das regies

includas na elipse com = 1 (elipse=circulo) no dependem do ngulo. Para uma longa e

4.5 Representao Espacial do cluster

59

estreita elipse ( grande e pequeno), uma pequena mudana no ngulo resutar em muitos
conjuntos com centrides diferentes. Desta maneira, parece lgico que devemos usar uma grande
coleo de ngulos quando grande e pequeno. Neste caso podemos fazer um renamento
a priori no espao dos cluster para avaliar suaves valores para o parmetro %. Podemos calcular,
por exemplo, o percentual de interseco entre duas elipses centradas no mesmo ponto sl , com
os mesmos parmetros de forma e tamanho porm, com ngulos e quantidades de ngulos
diferentes. A partir deste renamento, podemos eliminar as elipses que possuem valores de % que
no so de interesse cientifco, ou no fazem sentido serem avaliados. Na tabela 4.2, por exemplo
apresentado o percentual de rea de uma elipse que tambm parte de qualquer outra elipse com
o mesmo centro (sl ), forma () e tamanho ( ), porm com quantidades (#) diferentes de ngulos.
Segundo a sugesto apresentada em Kulldor(2006), usaremos o nmero de ngulos escolhidos
de forma que duas elipses de mesma forma, centro e tamanho, com ngulos consecutivos tenham
interseco de no minmo 70% de suas reas. Assim (ver tabela 4.2) tomamos dois ngulos para
elipses com = 1.5, seis ngulos para elipses com = 2.0, etc...
Tabela 4.2: Percentual de rea de uma elipse que tambm parte de qualquer outra elipse com o mesmo
centro, forma e tamanho,porm com quantidades (#) diferentes de ngulos
parmetro de forma

de ngulo

1.5

2.0

4.0

6.0

8.0

2 (90 )

75

59

31

21

16

4 (45 )

82

67

41

29

22

87

77

52

38

30

9 (20 )

91

84

64

50

41

12 (15 )

93

88

71

59

49

15 (12 )

94

90

76

65

56

18 (10 )

95

92

80

70

62

24 (7.5 )

95

94

85

77

70

30 (6 )

97

95

88

81

75

98

95

90

84

79

45 (4 )

98

97

92

87

83

99

98

94

90

87

90 (2 )

99

98

96

94

91

100

99

98

97

96

100

100

99

98

98

6 (30

36 (5

60 (3

180(1

360(0.5 )

4.6 Exemplo

60

4.6 Exemplo
Para entendermos melhor a estrutura dos modelos discutidos na seo 4.4.1, suponha que
monitoramos o processo {Yt (sl ) : l = 1, 2, ..., L e t = 1, 2, ...} com realizao yt = (yt (sl ), yt (sl ), ..., yt (sl ))0 .
Em que, yt (sl ) representa o nmero de casos observados de uma determinada doena no tempo
t em sl . Para a distribuio do nmero de casos, assumimos que,
(Yt (sl )|t (sl )) P oisson (et (sl ) t (sl ))

(4.30)

com,
f (yt (sl )|t (sl )) = (yt (sl )!)

et (sl )

yt (sl )




yt (sl )
exp et (sl )
logt (sl ) t (sl )
.
et (sl )

identicando os termos em (4.17) temos que


t (sl )) = et (sl )),

t (sl )) = logt (sl ),

Xt (sl ) = Yt (sl )/et (sl ),

q(t (sl )) = exp{t (sl )} = t (sl ).



u(Xt (sl ), et (sl )) = (Yt (sl )!)1 , et (sl )Yt (sl ) .

Notamos ainda que pelas denies em (4.19) e (4.20) obtemos que a mdia de (Xt (sl )|t (sl ))
t (sl ) = z(t (sl )) = q 0 (t (sl )) = exp{t (sl )} = t (sl )

de forma similar obtemo que a funo de varincia


V (t (sl )) = q 00 (z 1 [t (sl )]) = t (sl ).

Neste modelo, et (sl ) assumido conhecido e representa a contagem esperada da doena no


tempo t em sl e, t = (t (s1 ), t (s2 ), ..., t (sL ))0 um vetor de riscos relativos no tempo t.
Condicional ao processo {t }, {Yt } um processo de Poisson no espao-tempo. A idia deste
modelo, que em cada rea as observaes utuam em torno de uma mdia et (sl ). Porm, essa
mdia est sujeita a variaes que so quanticadas por t (sl ). Se a doena est sob-controle
sobre toda a regio em estudo S , esperamos que seu risco relativo seja prximo de 1, tal que
a distribuio a apriori para (t (sl )|Dt1 ) deve estar concentrada no intervalo (1 , 1 + )
para algum pequeno valor  apresentando poucas variaes. Caso contrrio, para um processo
realizado sobre um possvel surto ou epidmia, estas variaes so maiores e uma distribuio a

priori mais dispersa apropriada para a deteco de possveis mudanas.


A distribuio a priori padro para t (sl ) = logt (sl ) , de acordo com a expresso (4.21)

4.6 Exemplo

61

(l)

gt,0 (t (sl )|Ht1 (l)) = v(at (sl ), bt (sl ))


exp {bt (sl ) [at (sl )logt (sl )/bt (sl ) t (sl )]} .

(4.31)

Usando para (t (sl )|Ht1 (l)) uma distribuio a priori padro na famlia conjugada Gama(at (sl )+
1, bt (sl )) com mdia [at (sl ) + 1]/bt (sl ) e varincia [at (sl ) + 1]/b2t (sl ) obtemos que,
(l)

gt,0 (t (sl )|Ht1 (l)) = v(at (sl ) + 1, bt (sl ))


exp {bt (sl ) [at (sl )logt (sl )/bt (sl ) t (sl )]} .

(4.32)

que tem a mesma estrutura de (4.31). Ento, a priori para o modelo alternativo descrita em
4.24 pode ser aplicada usando uma distribuio a priori para t (sl ) ou t (sl ). No primeiro, caso os
parmetros (at (sl ), bt (sl )) da distribuio a priori padro so subtituidos por (t, at (sl ), t, bt (sl )).
No segundo caso, a substituio feita por (t, (at (sl ) + 1), t, bt (sl )). O segundo caso usado
at o nal desta seo. Usando, ento, a distribuio a priori para (t (sl )|Ht1 (l)), obtemos que
o valor esperado e a varincia para distribuio preditiva de Xt (sl ) = Yt (sl )/et (sl ) sob o modelo
padro so:

E0 (Xt (sl )|Ht1 (l)) = E0 E0
=



Yt (sl )
|t (sl ) |Dt1
et (sl )

1
[at (sl ) + 1]
E0 (et (sl )t (sl )|Ht1 (l)) = E0 (t (sl )|Ht1 (l)) =
.
et (sl )
bt (sl )

e,


 

 

Yt (sl )
Yt (sl )
V0 (Xt (sl )|Ht1 (l)) = E0 V0
|t (sl ) |Dt1 + V0 E0
)|t (sl ) |Dt1
et (sl )
et (sl )
1
=
E0 [t (sl )|Dt1 ] + V0 [t (sl )|Dt1 ]
et (sl )


[at (sl ) + 1] [at (sl ) + 1]
1
1
[at (sl ) + 1]
+
+
.
(4.33)
=
=
2
et (sl )bt (sl )
et (sl ) bt (sl
bt (sl )
bt (sl )

Substituindo os parmetros (at (sl ) + 1, bt (sl )) da distribuio a priori padro por (t, (at (sl ) +
1), t, bt (sl )) na distribuio a priori alternativa, obtenha diretamente que:
Ek, [Xt (sl )|Ht1 (l)] = E0 [Xt (sl )|Ht1 (l)] =

[at (sl ) + 1]
.
bt (sl )

e


1
1
Vk,j [Xt (sl )|Ht1 (l)] =
+
et (sl ) t, bt (sl )
> V0 [Xt (sl )|Ht1 (l)],

Note agora que,

[at (sl ) + 1]
bt (sl )
para 0 < t, < 1.

(4.34)

4.6 Exemplo

62

1
et (sl )

Vk,j [Xt (sl )|Ht1 (l)]


= 
V0 [Xt (sl )|Ht1 (l)]

1
et (sl )

1
t,l bt (sl )

1
bt (sl )

 =

1
.

(4.35)

Ento, comparando 4.27, 4.28 e 4.35, conclua que usando a distribuio a priori para t (sl ) ou
t (sl ) o resultado da anlise no se altera.

Para calcularmos o Fator de Bayes, usamos o fato que (t (sl )|Ht1 (l)) gamma(at (sl ) +
1, bt (sl )). Ento
(l)

bt (sl )[at (sl )+1]


([at (sl ) + 1])
exp {bt (sl ) [at (sl )logt (sl )/bt (sl ) t (sl )]} .

gt,0 (t (sl )|Ht1 (l)) =

(4.36)

identique que a funo v(at (sl ) + 1, bt (sl )) dada em 4.36 igual a


v(at (sl ) + 1, bt (sl )) =

bt (sl )[at (sl )+1]


.
([at (sl ) + 1])

(4.37)

Substituindo 4.37 em 4.29 com t (sl )) = et (sl )) e Xt (sl ) = Yt (sl )/et (sl ). Obtemos que Fator de
Bayes em 4.29 igual a
FBt () =

Y P G (t, bt (sl ), t, at (sl ))


.
P G0 (bt (sl ), at (sl ))

(4.38)

sl

ondeP G(., .), denota a distribuio Poisson-Gama com densidade abaixo.


(t, [at (sl ) + 1] + Yt (sl ))
P G (t, bt (sl ), t, at (sl )) =
(t, [at (sl ) + 1])Yt (sl ))!

Yt (sl )
et (sl )

t, bt (sl ) + et (sl )

t, bt (sl )
t, bt (sl ) + et (sl )

t, [at (sl )+1]

e,
([at (sl ) + 1] + Yt (sl ))
P G (bt (sl ), at (sl )) =
([at (sl ) + 1])Yt (sl ))!

Yt (sl )
et (sl )

bt (sl ) + et (sl )

bt (sl )
bt (sl ) + et (sl )

[at (sl )+1]

Ento, neste caso, aps observar uma sequncia de vetores (y1 , ..., yn ), comparar a sequncia
de modelos {Mn,0 }n1 com a sequncia {Mn, }n1 equivalente a comparar uma sequncia de
razes de densidades preditivas na famlia de densidades Poisson-Gama.
Agora assuma que no tempo inicial a classe de conjuntos de localizaes espaciais igual a
0 . Ento, aps observar o processo n vezes e atualizar n como explicado na seo 4.3.3. O

4.6 Exemplo

63

Fator de Bayes Adaptativo dado pela expresso 4.13 igual a


FBAn,k (ln1 ) = FBn (ln1 )

n1
Y
t=k



P G t,n1 bt (sl ), t,n1 at (sl )
l

P G0 (bt (sl ), at (sl ))

sl ln1

com funo de alarme,


FBAn = max

max

FBAn,k (ln1 ).

ln1 n nw+1kn

(4.39)

e, tempo de alarme
n
o
= (B (n) ) = min n w : FBAn B (n) .

(4.40)

com B (n) = 2J (n) w/, para algum par (w, ) xo. Aps o cmputo destas quantidades, use
o algoritmo seguinte para a deteco de mudanas no espao-tempo, usando o fato que tem
representao elptica.

Algoritmo para a deteco de clusters emergentes no espao tempo


1. no tempo n = 0, Escolher um centride no mapa.
2. Calcular as distncias para os outros centrides. Ordene estas distncias em ordem
crescente e depois memoriza-las em um vetor de distncias (este vetor de distncias
um vetor de adjacncias).
3. Para cada centride do mapa repetir os passos 1 e 2 e ento construa a matriz de
adjacncias de acordo com a explicao dada na seo 3.2.5.
4. Escolher novamente um centride sl na regio. Centrado em sl contrua elipses (lj )
da seguinte forma:
? O semi-eixo maior (j ) da c-sima elipse lj igual a distncia d(sl , sc ) entre os

centrides sl e sc . Essas distncias j esto armazenadas na matriz de adjacncias


denida no passo 3.
? dena 0 ej < 1 um valor de excentricidade para elipse lj e encontre j atravs

da relao e2j = 1 2
j . Quando ej = 0, temos que lj um crculo. O semi-eixo
menor da elipse 1
j j .
? o ngulo %j da elipse lj denido como o ngulo entre a linha horizontal leste-

oeste e o eixo maior da elipse.


5. Escolha um valor para c (por exemplo, c = L/4) e construa
0 = {li : (< li , li >) c, l = 1, 2, ..., L; i = 1, 2, ...L nang nex}.

Onde nang e nex representam, respectivamente, o nmero de ngulos e de excntricidade utilizados. Neste caso, c o maior nmero de localizaes espaciais em li que
possui semi-eixo maior ( ) igual a d(sl , sc ).

4.7 Uma aplicao a dados reais: Deteco de cluster de Hansenase no Amazonas-Brasil

64

6. Para cada n 1 atualize a classe de subconjuntos de localizaes espacias n como


explicado na seo 4.3.3 e calcule o par (FBAn , B (n) ).
7. Se FBAn B (n) , declare que existe um cluster emergente no mapa e o estime pelo
par (n , k(n )) dados respectivamente em 4.15 e 4.16. Caso contrrio incremente uma
unidade no tempo e volte ao passo 6.

4.7 Uma aplicao a dados reais: Deteco de cluster de Hansenase


no Amazonas-Brasil
Para ilustrarmos a utilizao do mtodo proposto para deteco de cluster emergentes em
problemais reais, ns realizamos uma aplicao usando os dados de registros de novos casos
de Hansenase em menores de 15 anos no Estado do Amazonas no perodo de janeiro de 2008 a
dezembro de 2009. Embora, esses casos de hansenase tenham ocorrido a tempo xado no pasado
e uma anlise retrospectiva seja uma escolha mais adequada, ns usaremos estes dados em uma
anlise prospectiva considerando dezembro de 2009 como tempo atual de vigilncia. O total de
novos casos observados no perodo em estudo foram 1287 com uma taxa mensal de 0.16 casos
para cada 10 mil habitantes. Os dados contm informaes dos novos casos de Hansenase para
os 62 municpios do estado. A hansenase uma doena infecto-contagiosa, por isso passvel de
ser transmitida de pessoa para pessoa. uma doena endemica no estado, porm pode evoluir
para uma epidemia. Esta doena est relacionada com as condies de vida da populao e seu
acompanhamento epidemiolgico realizado por meio do coeciente de deteco de novos casos.
Este coeciente obtido dividindo-se o total de novos casos pela populao em risco e depois
multiplicando o resultado por 10000 habitantes. O coeciente de deteco em menores de 15 anos
um indicador que reete a gravidade do nvel endmico da hansenase e a exposio precoce ao
Mycobacterium leprae, por isso h um interesse maior em sua vigilncia.
4.7.1

Anlise explorarria dos dados

No acompanhamento epidemiolgico, parmetros usados pela secretreia estadual de sade


(Imbiriba, 2009), estabecem como hiperendmico um coeciente de deteco acima de 4 por
10000 habitantes; muito alto, um coeciente entre (4, 2); alto: (2, 1); mdio ou normal: (1,
0.2) e baixo: menor que 0.2. Analisando a Figura 4.4, observamos que de uma forma geral, o
Estado do Amazonas encontra-se em um perodo no endmico. No entanto, este padro no
replicado para os seus municpios. Por exemplo, ao observarmos a Figura4.4 notamos uma
grande variao no coeciente de deteco entre as cidades de Manaus, Humait e Itacoatiara.
Manaus aparentemente, possue uma grande variao no padro de casos durante este perodo e
o mesmo ocorre na cidade de Itacoatiara. Na cidade de Humait parece ter surgido um cluster
emergente no ms 12. Este tipo de doena (como a Hansenase) muito comum na maioria dos

4.7 Uma aplicao a dados reais: Deteco de cluster de Hansenase no Amazonas-Brasil

65

municpios uma vez que ela est associada a condies de vida da populao, de modo que a
nvel local os componentes de uma srie temporal, como tendncia e sazonalidade podem ser
ignorados na anlise.

Figura 4.4: Coeciente de Deteco de Hansenase (por 10000 ml hab) no Estado do Amazonas(em azul), segundo o ms, nas cidades: Manaus(em verde), Humait (em vermelho) e Itacoatiara (em preto)

4.7.2

Aplicao do Fator de Bayes Adaptativo para os dados de Hansenase

Seja Xt (sl ) o nmero de novos casos da doena, Hansenase, no tempo t = 1, 2, ..., n =


24 (jan/2008 a dez/2009) na l-sima rea Al identicada por seu centride sl . Al representa

um municpio do Estado do Amazonas, com l = 1, 2, ..., L = 62. Cada um destes municpios


representado espacialmente pelas coordenadas geogrcas de seu centride, apresentados na
gura 4.5. Os dados de populao e coordenadas geogrcas foram obtidos na Secretaria de
Planejamento do Estado do Amazonas-SEPLAN.
Assuma que Yt = (Yt (s1 ), ..., Yt (sL ))0 um processo de Poisson de contagem em dados de
rea no espao-tempo tal que Yt (sl ) P oisson(et (sl )t (sl ). Onde, et (sl ) assumido conhecido
e representa a contagem esperada da doena no tempo t em sl e, t = (t (s1 ), t (s2 ), ..., t (sL ))0
um vetor de riscos relativos no tempo t para cada municpio. Ento o Fator de Bayes F Bt ()
dado pela expresso 4.38 onde tem representao espacial dada na seo 4.5. Para aplicar o
mtodo de monitoramento no espao-tempo, primeiro precisamos determinar o nmero de casos
esperados em cada municpio do mapa. Em mapeamento de doena, o nmero de casos esperados
pode ser calculado atravs de uma padronizao externa (ajustando uma taxa padro conhecida
de casos pela populao em risco) ou padronizao interna (usando os dados observados para

4.7 Uma aplicao a dados reais: Deteco de cluster de Hansenase no Amazonas-Brasil

66

Figura 4.5: Mapa do Estado do Amazonas com os municpios espacialmente representados pelas
coordenadas de seus centrides.
estimar o valor esperado), veja por exemplo, Banerjee et al, (2004). Geralmente a abordagem
via padronizao externa a melhor (Zhou e Lawson, 2008) pois evita o uso dos dados corrente
para estimarmos quantidades que em teoria deveriam ser conhecidas. Uma forma de usar a
padronizao interna sem utilizar os dados correntes usar mtodos (como o Fator de Bayes usado
aqui) com janela temporal w que permitem que o valor esperado et (sl ), quando desconhecido,
possa ser estimado com os dados observados no intervalo de tempo t = 1, 2, ..., n w. Este tipo
de abordagem muito importante principalmente quando a srie de dados observada possui,
por exemplo, tendncia ou sazonalidade o que no o caso dos dados de Hasenase e portanto,
usamos ento uma padronizao interna tal que et (sl ) = Nt (sl ) tw , t w. Ou seja, o nmero
de casos esperados et (sl ) proporcional a populao em risco e ajustado por um fator tw o
qual representa uma taxa de referncia global no mapa obtida com os dados acumulados at o
tempo t w. Para todo usamos
Pt

t =

T =1
s S YT (sl )
.
Pt P l
T =1
sl S NT (sl )

(l)
No tempo t e municpio l = 1, 2, ..., 62, uma distribuio a priori gt,0
(t (sl )|Ht1 (l)) e um

mecanismo de evoluo do tempo t 1 para o tempo t faz-se necessrio para o incio do monitoramento via Fator de Bayes. A distribuio para (t (sl )|Ht1 (l)) na famlia conjugada (ver
seo 4.6) uma distribuio Gama. A suposio de uma distribuio Gama para os riscos relativos, tem sido considerada por vrios autores como uma suposio adequada (Martuzzi e Hills,
1995), pois alm de unimodal ela pode tomar uma grande variedade de formas regulares podendo,
por exemplo, acomodar assimetria da distribuio. Para o mecanismo de evoluo temporal,
assuma mais especicamente que a relao entre t (sl ) e t1 (sl ) da forma multiplicativa
t (sl ) =

t (sl )
t1 (sl ),
m

0 < m 1,

Beta(mat1 (sl ), (1 m)bt1 (sl )).

(4.41)

4.8 Resultados da Aplicao

67

Assumindo que o processo t (sl ) independente de t1 (sl ) obtenha diretamente que E(t (sl )|Ht1 (l)) =
t1 (sl ) e ainda (west e Harrisson, 1997) (t1 (sl )|Ht1 (l)) Gama(at1 (sl ), bt1 (sl )) implica

que (t (sl )|Ht1 (l)) Gama(at (sl ), bt (sl )) com


at (sl ) = mat1 (sl ) e bt (sl ) = mbt1 (sl )

fornecendo a estrutura conjugada necessria para o cmputo do Fator de Bayes a cada tempo t.
Essencialmente, m controla a passagem de informao dos dados do tempo t 1 para o tempo
t. Grandes valores de m (prximo de 1) garantem uma maior passagem de informao entre

os perodos de tempo tal que para uma abordagem adaptativa com janela temporal w pequena
importante que quase toda informao contida na janela seja avaliada de modo que usamos
m = 0.9 e tambm, a0 (sl ) = b0 (sl ) = 100 implicando em uma distribuio priori inicial com

mdia 1 pouca variabilidade.

4.8 Resultados da Aplicao


Ao aplicarmos o mtodo proposto, Fator de Bayes Adaptativo (FBA) para a deteco e
vigilncia de clusters de casos de hansenase em menores de 15 anos no estado do Amazonas no
perodo 2008-2009, obtemos o grco de monitoramento na escala logartmica apresentado na
gura ?? com janela temporal w = 3 e probabilidade aceitvel de alarmes falsos = 0.05. Neste
grco, no tempo t = 16 o valor do logaritmo do FBA igual a 14.220 e ultrapassa o limite
de controle log(B16 ) = 7.67. Neste momento o mtodo soa um alarme na localizao espacial
mostrado na gura 4.7. Este cluster persiste at o tempo t=17 com log(FBA) = 27.567 e tempo
de mudana estimado em 15, de modo que o cluster emergente estimado com os dados at o tempo
t=17 igual a [15, 17] onde representado pelo conjunto de regies marcadas na gura
4.7. Observe o formato geomtrico do conjunto de localizaoes espaciais que indica claramente
o carater eliptco do algoritmo. Prosseguindo a anlise no tempo observamos a indicao de um
novo tempo de alarme t = 18. Neste caso a localizao espacial do cluster mostrada na gura
4.8. Observe novamente o carter eliptco do conjunto de localizaes espaciais que pertencem
ao cluster. Existe neste cluster uma certa desconexicidade isto deve-se ao fato que o semi-eixo
menor desta elipse no tem o tamanho suciente para incorporar o centride da regio vizinha
mostrada no mapa e, isto cria uma certa desconexicidade no cluster. Este fato cria um problema
apenas de representao do cluster e no altera a anlise dos dados. Estes clusters identicados
no passado so chamados de clusters histricos com tempo nal t = 18. Aps este tempo estes

clusters no mais existem e os dados sucessivos no trazem mais informaes relevantes. Aps
continuarmos o monitoramento no tempo observamos que no momento atual n = 24 no existe
indicao de qualquer mudana na distribuio do processo espao-temporal.

4.9 Estudo com dados simulados

68

Figura 4.6: Monitoramento on-line usando Fator de Bayes Sequencial Adaptativo com janela
w = 3, = 0, 05

Figura 4.7:

cluster detectado usando o Fator de Bayes Sequncial Eliptico

t [15, 17]

4.9 Estudo com dados simulados


4.9.1

Dados Simulados

Para ilustrar a aplicao e avaliar a performance do mtodo proposto para a deteco de

cluster no espao-tempo, ns realizamos um estudo com dados simulados com o objetivo de


detectar mudanas na variao do risco de ocorrncias de casos de uma doena sobre o espaotempo. O estudo conduzido de forma similar ao descrito em 3.5 com poucas modicaes.
Consideramos como populao em risco, Nt (sl ), a populao de homens residentes no ano de 1992
nas 32 (L=32) reas do Novo Mxico como descrito em Kulldor(2001). Sobre esta populao
em risco ns simulamos um processo de Poisson
Yt = (Yt (s1 ), ..., Yt (sL ))0

4.9 Estudo com dados simulados

Figura 4.8:

69

cluster detectado usando o Fator de Bayes Sequncial Eliptico

t [16, 18]

condicional a um outro processo de risco relativo


t = (t (s1 ), t (s2 ), ..., t (sL ))0

tal que E(Yt (sl )|t (sl ) = et (sl ) t (sl ) com et (sl ) representando o nmero de casos esperados em
sl no tempo t, e dado por et (sl ) = 0 Nt (sl ). 0 uma taxa de referncia global para a doena.

Os casos so simulados para um perodo de monitoramento t = 1, 2, ..., n = 20 e 1000 rplicas


do processo foram geradas. A parte espacial do cluster alocado no mapa formado por 4 reas,
= {Chaves, Eddy, Lea, Otero} que podem ser idencadas na gura 5.2. Este um cluster com

populao mediana em relao ao mapa. Quando simulamos um processo sem cluster assumimos
que sob o modelo padro {t } realizao de um processo Gama tal que,
t (sl ) Gama(100, 100), t = 1, 2, ..., 20 e l = 1, 2, ..., 32.

Esta distribuio a priori, produz uma pequena variao no risco sobre todo o mapa tal que o
valor esperado de Yt (sl ) esta prximo de et (sl ). Para o modelo de cluster emergente denimos
um risco alternativo por t (sl ) = t (sl ) I{t11,sl } . para valores de = 1.5, 2, 3. Note que
neste caso o ponto de mudana k = 12. Usamos, ainda, 0 = 0.0001 (taxa de um caso para
cada 10000 habitantes); probabilidade de falso alarme = 0.05, 0.01; uma janela temporal de
tamanho w = 3 e = 0.2, 0.4. Isto gera um total de 11 cenrios diferentes sobre o modelo
de cluster e 2 cenrios diferentes ( = 0.2, 0.4) sobre o modelo padro. Obviamente este total
de cenrios muito pequeno em relao a classe de todos possveis. No entanto representam
parmetros(, , ) comumente utilizados em outros estudos de simulao de alguns trabalhos j
existentes na literatura (Zhou e Lawson, 2008; Tango et al, 2010). Aps gerarmos estes cenrios
aplicamos o Fator de Bayes usando o algoritmo descrito na seo 4.6 com mecanismo de evoluo
temporal dado em 4.41.

4.9 Estudo com dados simulados

70

O algorItmo descrito em na seo 4.6 usado da seguinte forma: usamos quatro valores
(1,1.5,2,4) para o parmetro de forma da elipse e ento escolhemos os ngulos de modo que
duas elipses de mesma forma, centro e tamanho, com ngulos consecutivos tenham interseco
de no minmo 70% de suas reas. Assim (ver tabela 4.2), quando = 1.5 usamos 2 ngulos de
90 graus, = 2 usamos 6 ngulos de 60 graus, = 4 usamos 12 ngulos de 15 graus. Para = 1
a representao geomtrica do cluster simplesmente um crculo, ou seja usamos apenas um
ngulo. Como descrito na seo 4.5 usamos o fato que a excentricidade, "e"da elipse satisfaz a
relao e2 = 1 (a/b)2 = 1 2 de modo que desta relao podemos obter o valor das quatro
excentricidades usadas. Neste caso, para cada sl e parmetro de forma xo, a cardinalidade de
0l no passo 5 do algoritmo dado em 4.6 igual a
Jl0 = L nmero de ngulos nmero de excentricidades
= L nmero de ngulos # de parmetros de forma usados.

Ento, o nmero total de clusterS avaliados inicialmente


32 1 + 32 2 + 32 6 + 32 12 = 672

isto signica que, neste caso com L = 32, em cada sl podemos construir 672 conjuntos de
localizaes espaciais com formato eliptco. Logo o nmero total de subconjuntos eliptcos
igual 32 672 = 21504. Usamos um valor de c dado no passo 5 do algoritmo proposto igual a
c = L/4, teremos, ento, que o nmero total de subconjunto avaliados no passo inicial 5376.

No entanto a partir da primeira atualizao da classe n o nmero de subconjuntos avaliados


reduz a 32. E isso o ganho ao se utilizar a abordagem adaptativa.
Para nalizar, em cada rplica do processo gerado, avaliamos as seguintes medidas de perfomance: Sensitividade Condicional de um alarme SSC; Valor Predito Possitivo Condicional de
um alarme VPP; atraso na deteco ADD. Todas estas medidas de avaliao foram propostas
por Lima e Duczmal (2011) e esto descritas na seco 3.5.1.

Figura 4.9: Mapa do Novo Mxico. Fonte: US Census.

4.9 Estudo com dados simulados


4.9.2

71

Anlise dos resultados obtidos com dados simulados

Ns apresentamos nesta seo o resultdo da aplicao do Fator de Bayes para os cenrios


simulados descrito na seo 4.9. Na gura 4.10 apresentamos os resultados para a distribuio do
mximo do Fator de Bayes adaptativo, e da cardinalidade J n de n para valores de = 0.2, 0.4.
Um valor de = 0.2(0.4) signica um desvio padro preditivo do modelo alternativo 2,23 (1.58)
vezes maior em relao ao modelo padro. Observando a gura 4.10 nota-se claramente que
praticamente no h mudana na distribuio do Mximo do Fator de Bayes quando modicamos
o valor de . O percentl de ordem 85, em ambas as distribuies do Mximo , aproximadamente,
representado pelo valor 3 que ns usamos como um valor razovel para C , dado na seo 4.3.3.

Figura 4.10: Mximo do Fator de Bayes Adaptativo em (A), Cardinalidade J n de n em (B)


para 1000 simulaes do processo sobre o modelo padro com = 0.2; Mximo
do Fator de Bayes Adaptativo em (C), Cardinalidade J n de n em (D) para 1000
simulaes do processo sobre o modelo padro com = 0.4
Os resultados para as medidas de performance esto descritos na tabela 4.3. Nota-se, na
) na deteco decresce a Sensitividade (SSC) na localizao cresce e
tabela que o atraso (ADD

o Valor predito positivo (PPV) diminui quando aumentammos o valor de . A SSC sempre
maior que o VPP implicando que o cluster localizado tende a ser maior que o verdadeiro cluster,
porm com uma boa preciso Por exemplo, quando = 2, = 0.05 e = 0.2 o atraso estimado
igual a 1.429, que pode ser considerado muito pequeno, pois o cluster foi detectado logo no seu
incio. A preciso na localizao medida pela SSC 0.746 enquanto que o VPP=0.724.
De uma forma geral, o mtodo bastante rpido (possui pequeno atraso) e possui uma boa
preciso. Uma outra observao interessante que, quando usamos um valor de = 0.4 os
resultados quase no se alteram. Uma visualizao da relao atraso versus preciso mostrada

4.9 Estudo com dados simulados

72

atravs de histogramas bivariados nas guras 4.11 e 4.12. Nestas guras pode-se observar que o
atraso baixo a Sensitividade e o Valor predito positivo so relativamente bons. Uma amostra
das densidades preditivas na regio do cluster alocado articialmente no mapa mostrado na
gura 4.13. Nesta gura possvel observar que a preditiva alternativa uma verso suavizada
da preditiva padro.
Tabela 4.3: Valores estimados para Sensitividade (SSC), Valor Predito Positivo (VPP) e Atraso
(ADD) com diferentes valores para , diferentes probabilidades de alarmes falsos ()
usando o Fator de Bayes Adaptativo Eliptico com janela w=3.
Medidas de Performance

= 0.05

SSC

VPP

ADD

1.50

0.608

0.781

1.989

2.00

0.746

0.724

1.429

3.0

0.838

0.681

1.195

1.50

0.598

0.778

2.159

2.00

0.759

0.733

1.508

3.0

0.850

0.689

1.206

1.50

0.605

0.751

1.889

2.00

0.740

0.723

1.410

3.0

0.800

0.678

1.190

1.50

0.590

0.770

2.140

2.00

0.750

0.732

1.500

3.0

0.850

0.680

1.202

= 0.2

= 0.01

= 0.05

= 0.4

= 0.01

4.10 Discusso

73

Figura 4.11: Histograma Bivariado para o Fator de Bayes Adaptativo com = 0.2: Sensitividade
versus atraso e Valor Predito Positivo versus atraso

Figura 4.12: Histograma Bivariado para o Fator de Bayes Adaptativo com = 0.4: Sensitividade
versus atraso e Valor Predito Positivo versus atraso

4.10 Discusso
A proposta deste captulo o desenvolvimento de um novo mtodo para deteco e monitoramento de clusters emergentes. Ns desenvolvemos e descrevemos uma abordagem Bayesiana,
baseada em um Fator Bayes Adaptativo com janela temporal limitada, e usamos uma estrutura
de cluster onde o espao representado por subconjutos de localizaes espaciais com formato
eliptico. Trs importantes caractersticas do mtodo proposto so: 1) A utilizao de uma janela
temporal w que permite a estimao, de qualquer parmetro de interesse, usando dados histricos
pertencentes ao conjunto de tempos t = 1, 2, ....t w; 2) Uma abordagem adaptativa no espao
dos cluster que permite tornar o algoritmo de varredura no espao-tempo "relativamente"rpido.
3) ajusta automaticamente o limite de controle para a funo de alarme, mantendo constante
a probabilidade de um falso alarme e, ainda, tornando o atraso na deteco muito pequeno. A
forma explcita da distribuio preditiva tambm muito importante neste caso, pois permite
analiticamente a obteno de todas as quantidades de interesse para cada tempo de monitoramento e qualquer rea do mapa em estudo.

4.10 Discusso

74

Figura 4.13: Distribuies Preditivas e Padro aps o ponto de mudana nas reas que compe
o cluster: Chaves em (A), Eddy em (B), Lea em (C) e Otero em (D).
Este mtodo desenvolvido, pode ser entendido como uma verso espao-temporal do Fator de
Bayes Sequncial descrito em West(1986) e por isso tambm pode ser extendido para os modelos
analisados em West e Harrison (1986). Alm da abordagem adaptativa, outras diferenas desse
mtodo de monitoramento espao-temporal em relao aos existentes na literatura so: uma
possvel incorporao na anlise de alguns componentes de uma srie temporal como tendncia e
sazonalidade; controle adequado da probabilidade de um falso alarme; no requer o uso de testes
baseados em simulao de Monte Carlo para validar a signicncia estatstica dos resutados. Uma
desvantagem utilizao de distribuies a priori somente na famlia conjugada de distribuies.

75

5 Deteco de clusters emergentes via


anlise a posteriori adaptativa

5.1 Introduo
Os algortmos desenvolvidos anteriormente para a deteco de clusters emergentes no levam
em considerao a incerteza sobre o formato, tamanho e tempo de nicio do mesmo. De uma
maneira implcita, a busca realizada por estes algortmos supe que todos os candidatos a cluster
emergente so equiprovveis. Por isso, neste captulo abordamos o problema da deteco de

clusters emergentes usando um processo a posteriori adaptativo. Este processo construdo a


partir da distribuio conjunta a posteriori de que tenha ocorrido uma mudana no conjunto
de localizaes no tempo = k. Ou seja, avaliamos diretamente o evento { = j , =
k}. Ns apresentamos uma estrutura geral de distribuio a priori para parte espacial (regio

da mudana) e temporal (ponto de mudana) do cluster emergente e mostramos tambm, que


esta abordagem minimiza a perda esperada a posteriori baseada em uma combinao linear da
probabilidade de um falso alarme com a probabilidade de uma falsa localizao.

5.2 Construo hierrquica do modelo


Considere, novamente, S como a regio em estudo. Seja X = {Xt (sl ), t = 1, 2, ... e l =
1, 2, ...L} o processo sob vigilncia. A cada tempo discreto t 1 observamos um vetor L-variado
Xt = (Xt (s1 ), Xt (s2 ), ..., Xt (sL ))0 , em que Xt (sl ) representa algum valor observado em um ponto
sl S . Sejam = {sl S : sl } um conjunto conexo de localizaes espaciais em S ,
Hn = {X1 , ..., Xn } o conjunto de dados acumulados at o instante n e f (Xt | t ) uma funo

de densidade conhecida para Xt , dado um valor selecionado para o parametro t , para cada
t, tal que t = (t (s1 ), t (s2 ), ..., t (sL ))0 pertence a algum conjunto aberto do espao nito

dimensional. O objetivo da vigilncia vericar se existe um cluster emergente no mapa. O


interesse aqui, detectar um cluster que comeou em um tempo desconhecido n e que est
presente at o estgio atual n. O cluster no espao-tempo expresso em funo de uma mudana
no padro espao-temporal de eventos em que emerge depois de um tempo desconhecido .
Para a deteco do cluster e estimao do par (, ) considere uma abordagem bayesiana

5.2 Construo hierrquica do modelo

76

hierrquica construda da seguinte forma:


1. Assuma que (Xt |t ) tem densidade
Y

f (Xt | t ) =

f (Xt (sl )|t (sl )).

sl S

ou seja, dado o processo {t } os componentes de Xt so condicionalmente independentes.


I{t,s }
l

2. Suponha que (t |, ) tem funo de distribuio G(t |, ) = [G0 (t )]mt,

, para

alguma funo de distribuio G0 (t ) e mt, > 1 inteiro, conhecidos.


3. Considere que e so a priori independentes tal que a densidade a priori conjunta para
o par (, ) dada por ( = k, = j ) = (k) (j) , k = 1, 2, , , ... e j = 1, 2, ..., J .
Neste trabalho, G0 (t ) representa uma distribuio de referncia no seguinte sentido:
Se no h mudanas no padro espao-temporal do processo {Xt }, ento o processo { t }

tem funo de distribuio G0 (t ).


Para a interpretao de mt, , assuma que
G0 ( t ) =

G0 (t (sl )).

sl S

Ento,

G( t | = k, = j ) =

sl
/ j

G0 (t (sl ))

sl S

se t k 1

G0 (t (sl ))

mt,j
sl j [G0 (t (sl ))]

se t k, sl j

ou seja, depois da mudana no tempo = k, os componentes de t tais que sl


/ j possuem distribuio de referncia G0 . Enquanto que os componentes tais que sl j possuem a distribuio
do mximo de mt,j -variveis aleatrias com distribuio G0 , isto implica que para todo sl j ,
t (sl ) possui distribuio estocasticamente maior que o t (sl ) tal qual sl
/ j . Para termos uma

idia de quanto esta grandeza estocstica, notamos que se Z1 uma varivel aleatria com
funo de distribuio F (z1 ) e Z2 tem funo de distribuio F m (z2 ), ento
Z

z2

P(Z1 < Z2 ) =

Fazendo a mudana de varivel Yi = F (zi ) U (0, 1),


Z

1 Z y2

P(Z1 < Z2 ) =


d[y1 ]

(5.1)

d[F (z1 )]d[F m (z2 )].

d[y2m ]

i = 1, 2, obtemos,
Z
=
0

y2 d[y2m ] =

m
m+1

de modo que podemos escolhe m de acordo com a grandeza estocstica desejada.

5.3 Distribuies a posteriori

77

5.3 Distribuies a posteriori


Para deteco do par (, ) consider uma anlise a posteriori conjunta. Primeiramente pela
independncia condicional, denote para t k 1,
Z
P0 (Xt ) = P0 (Xt | = k, = j ) = f (Xt | t )dG( t | = k, = j ),
Z
=
f (Xt | t )dG0 ( t )
Z Y
=
f (Xt (sl )|t (sl ))dG0 (t (sl ))

tk1

s S

l
YZ

(5.2)

f (Xt (sl )|t (sl ))dG0 (t (sl )).

sl S

e usando o fato que


Y

f (Xt (sl )|t (sl )) =

sl S

f (Xt (sl )|t (sl ))

f (Xt (sl )|t (sl )).

sl j

sl
/ j

denote, quando t k e = j
Z
Pj (Xt ) = Pj (Xt | = k, = j ) = f (Xt | t )dG( t | = k, = j ), t k, sl j
Z Y
Y
=
f (Xt (sl )|t (sl ))dG0 (t (sl ))
f (Xt (sl )|t (sl ))d[G0 (t (sl ))]mt,j
sl j

sl
/ j

Y Z

f (Xt (sl )|t (sl ))dG0 (t (sl ))

sl
/ j

Y Z

(5.3)

f (Xt (sl )|t (sl ))d[G0 (t (sl ))]mt,j .

sl j

Aps observar o processo n-vezes e combinando (5.2) com (5.3) temos que,
(k1)n

f (X1 , X2 , ..., Xn | = k, = j ) =

P0 (Xt )

t=1

onde denimos, a b = min{a, b}, a b = max{a, b} e

n
Y

Pj (Xt )

(5.4)

t=k1

Qn

t>n Pj (Xt )

= 1. Note que se a mudana

ocorreu no tempo = k n, temos que min{(k 1), n} = k 1 e o max{k, 1} = k de modo


que, (5.4) igual a,
(k1)

f (X1 , X2 , ..., Xn | = k, = j ) =

P0 (Xt )

t=1

n
Y

Pj (Xt )

(5.5)

t=k

caso contrrio, se a mudana ainda no ocorreu tal que k > n temos,


f (X1 , X2 , ..., Xn | = k, = j ) =

n
Y
t=1

P0 (Xt )

(5.6)

5.3 Distribuies a posteriori

78

Usando a distribuio a priori para o par (, ) dada na seo 5.2, obtenha que a distribuio a

posteriori conjunta de (, ) representada por

( = k, = j |Hn ) =

onde
f (Hn ) =

J X
n
X

Q
(k) (j) n
t=1 P0 (Xt )
f (Hn )
Q(k1)
Q
(k) (j) t=1 P0 (Xt ) n
t=k Pj (Xt )
f (Hn )

(k1)

(k) (j)

P0 (Xt )

t=1

i=1 k=1

n
Y

Pj (Xt ) +

t=k

se k > n

(5.7)

se k n, = j

(k)

n
Y

P0 (Xt ).

t=1

k=n+1

Agora, multiplique o denominador e o numerador de (5.7) por


1
t=1 P0 (Xt )

Qn

e obtenha que,

( = k, = j |Hn ) =

(k) (j)
Qn
P

(k)
(i)

i=1
k=1
t=k F Bt (i)+ k=n+1 (k)
Q
(k) (j) n
F Bt (j)
Qn t=k
P
PJ Pn

(k)
(i)
F
B

t (i)+ k=n+1 (k)

i=1
k=1
t=k
PJ

se k > n

Pn

onde
F Bt (j) =

(5.8)

se k n, = j

Pj (Xt )
, t k.
P0 (Xt )

(5.9)

Notando em (5.2) que


YZ

f (Xt (sl )|t (sl ))dG0 (t (sl )) =

sl S

Y Z

f (Xt (sl )|t (sl ))dG0 (t (sl ))

sl
/ j

Y Z

f (Xt (sl )|t (sl ))dG0 (t (sl )).

sl j

Obtenha que
Pj (Xt ) Y
F Bt (j) =
=
P0 (Xt )
sl j

f (X (s )| (s ))d[G0 (t (sl ))]mt,j


R t l t l
,t k
f (Xt (sl )|t (sl ))d[G0 (t (sl ))]

(5.10)

que depende somente do sub-processo Xt (j) = {Xt (sl ) : t k, sl j }. Em uma estrutura geral
computamos F Bt (j) da seguinte forma:
1. Para computarmos a integral

f (Xt (sl )|t (sl ))d[G0 (t (sl ))]mt,j , assumimos que G0 (t (sl ))

contnua e fazemos a mudana de varivel


Y = G0 (t (sl )) U (0, 1) t (sl ) = G1
0 (y)

5.3 Distribuies a posteriori

79

de modo que
Z
f (Xt (sl )|t (sl ))d[G0 (t (sl ))]

mt,j

Z
=
0

mt,j
f (Xt (sl )|G1
]
0 (y))d[y

mt,j 1
f (Xt (sl )|G1
dy
0 (y))mt,j y
0


= EZ f (Xt (sl )|G1
(5.11)
0 (z)) ,

onde, Z Beta(mt,j , 1),

s l j .

2. Se a expresso de f (Xt (sl )|G1


0 (z)) analiticamente complicada, duas abordagens podem
ser usadas para determinar EZ f (Xt (sl )|G1
0 (z)) .


(a) Gere Q valores z1 , z2 , ..., zQ de uma distribuio Beta(mt,j , 1) e use a aproximao


Q


1 X
EZ f (Xt (sl )|G1
(z))

f (Xt (sl )|G1


0
0 (zq )).
Q

(5.12)

q=1

Quanto maior o valor de Q, mais precisa ser esta abordagem. Mesmo se L for
razoavelmente grande esta abordagem no torna o algoritmo de busca por cluster
emergente muito demorado, pois exige apenas a gerao de uma matriz L Q de
valores.
(b) Aproximar EZ f (Xt (sl )|G1
0 (z)) usando o mtodo Delta, de modo que






EZ f (Xt (sl )|G1
f (Xt (sl )|G1
0 (z)) z=E(Z)
0 (z))
= [f (Xt (sl )|G1
0 (z))]z=mt,j /(mt,j +1) .

3. Obviamente a quantidade

(5.13)

f (Xt (sl )|t (sl ))d[G0 (t (sl ))] obtida com mt,j = 1.

Para detectarmos possveis mudanas considere o processo a posteriori n = {n (0), n (j)}n1


com j = 1, 2, ..., J . Onde,
n (0) = P( > n|Hn ) e n (j) = P( n, = j |Hn ).

Ou seja, depois de observar o processo n vezes, n (0) a probabilidade de que a mudana no


tenha ocorrido antes ou at o estgio atual n. Enquanto que n (j) a probabilidade a posteriori
conjunta de que tenha ocorrido uma mudana depois de e que est presente at o tempo atual
no conjunto = j que representa a regio da mudana. Observe que
n (j) =

n
X
k=1

( = k, = j |Hn ) e n (0) =

X
X
j=1 k=n+1

( = k, = j |Hn ).

(5.14)

5.4 Tempo de alarme baseado no processo a posteriori

80

Se a distribuio a priori para truncada em algum valor k0 = k0 (n, w) = n w + 1, usamos


para deteco de mudanas o processo a posteriori con janela temporal limitada w, denotado por
n,w = {n (0), n,w (j)}nk0 (n,w)

Onde
n,w (j) = P(n w + 1 n, = j |Hn ) =

com j = 1, 2, ..., J.
n
X

( = k, = j |Hn ).

k=nw+1

O valor k0 (n, w) = n w + 1 reete o momento a partir do qual o pesquisador teria interesse


em detectar uma mudana no padro do processo no espao-tempo. Notamos que k0 (n, n) = 1 e
k0 (n, 1) = n. Por exemplo, se o interesse detectar um cluster que tenha emergido a pelo menos

7 perodos de tempo (7 dias, meses, etc,...), ento k0 (n, 6) = n 7 e w=6. Claramente, quando
w = n temos o processo a posteriori dado em 5.14.

5.4 Tempo de alarme baseado no processo a posteriori


Um teste sequncial usado para a deteco de cluster emergente (cluster no espao-tempo)
pode ser representado por um para = (, d) onde um tempo de alarme (ou tempo de parada)
e d = d(X1 , X2 , ..., X ) uma funo de deciso assumindo valores no conjunto J = {1, 2, ..., J},
tal que d = j implica tomar uma deciso em favor de j de modo que
{ < , d = j} = {

existe um cluster emergente no conjunto j }.

Considere um algoritmo para a deteco e localizao de um cluster no espao-tempo para


computar o par {, d} baseado em Hn e que tenta minimizar os seguintes erros:
1. falso alarme: Se o tempo de alarme < . Ento teremos uma deciso nal incorreta
com d = j . Denote por a0d a perda incorrida no evento { < , d = j}. Ento a perda
esperada por um falso alarme E[a0d I{ <} ].
2. falsa localizao: O cluster detectado e localizado depois de de modo que o tempo
de alarme verdadeiro e d = j porm, = i com j i = . Denote por ad a
perda incorrida no evento { , d = j, = i}. Ento a perda esperada por uma falsa
localizao E[ad I{ } ].
Aps observar o processo n-vezes, n 1, seja o tempo de alarme (ou tempo de parada) e
R(|H ) a funo risco de Bayes a posteriori associada a . Ento
R(|H ) = E[a0d I{ <} |H ] + E[ad I{ } |H ].

(5.15)

onde o valor esperado realizado sobre a distribuio a posteriori para (, ). Agora, considere

5.4 Tempo de alarme baseado no processo a posteriori

81

uma classe de estratgias de deteco sequncial dada por:


= { = (, d) :

mesurvel a (X1 , ..., X ) e d = d(X1 , X2 , ..., X ) J }.

onde denota a sigma-lgebra. Ento, para todo , temos que


R(|H ) =

J
X

I{ <,d=j}

j=1

J
X

aij (i).

(5.16)

i=0

Equanto a formulao do risco de Bayes dada em (5.15) expressa em termos dos valores para
as variveis aleatrias no observveis (, ). A expresso (5.16) da uma verso para o risco
de Bayes baseado na distribuio a posteriori conjunta de (, ). Para provar (5.16), usamos
I{AB} = I{A} I{B} e observamos que o evento { = n, d = j} mensurvel a (X1 , ..., Xn ).

Agora,
E[a0d I{ <} |H ] =

J
X

E[a0d I{ <,d=j} |H ] =

j=1

J
X

a0j E[I{ <,d=j} |H ]

j=1

mas
E[I{ <,d=j} |H ] =
=

X
n=1

E[I{ =n,d=j,>n} |Hn ] =

E[I{ =n,d=j} I{>n} |Hn ]

n=1

I{ =n,d=j} E[I{>n} |Hn ] =

n=1

= limM

I{ =n,d=j} n (0)

n=1
M
X

I{ =n,d=j} (0) = limM I{ M,d=j} (0)

n=1

(5.17)

= I{ <,d=j} (0).

e portanto,
E[a0d I{ <} |H ] =

J
X

a0j I{ <,d=j} (0)

(5.18)

j=1

Onde usamos tambm, limM { M } =

M =1 {

M } = { < } (Ross, 1983). Temos

ainda, que
E[ad I{ } |H ] =

J X
J
X
j=1 i=1

E[ad I{ ,d=j,=i} |H ] =

J X
J
X
j=1 i=1

aij E[I{ ,d=j,=i} |H ]

5.4 Tempo de alarme baseado no processo a posteriori

82

mas,
E[I{ ,d=j,=i} |H ] =
=

X
n=1

E[I{ =n,d=j,n,=i} |Hn ] =

E[I{ =n,d=j} I{n,=i} |Hn ]

n=1

I{ =n,d=j} E[I{n,=i} |Hn ] =

n=1

I{ =n,d=j} n (i)

n=1

= limM

M
X

I{ =n,d=j} (i) = limM I{ M,d=j} (i)

n=1

(5.19)

= I{ <,d=j} (i).

Logo,
E[ad I{ } |H ] =

J X
J
X

(5.20)

aij I{ <,d=j} (i).

j=1 i=1

Substituindo (5.18) e (5.20) em (5.15) obtenha que


R(|H ) =

J
X

a0j I{ <,d=j} (0) +

j=1

J
X

J X
J
X

aij I{ <,d=j} (i)

j=1 i=1

"
I{ <,d=j} a0j (0) +

j=1

J
X

#
aij (i) =

J
X

i=1

I{ <,d=j}

j=1

J
X

aij (i).

i=0

(5.21)
Para construrmos o tempo de alarme, denimos as funes,
u(y) = min[uj (y)] onde uj (y) =
jJ

J
X

y(i)aij ,

j J.

i=0

Ento, para todo = (, d) ,


R(|H ) = R((, d)|H ) =

J
X

I{ <,d=j}

j=1

= I{ <}

J
X

J
X

aij (i)

i=0

I{d=j} uj ( )

j=1

(5.22)

I{ <} u( ) = R(, d).

Onde o evento I{ <} dene uma regra de deciso d e, d qualquer ndice d = j tal uj ( ) =



u( ). Ou seja, minimizar o risco de Bayes a posteriori consiste em escolher j = arg min[uj ( )] .
jJ

Desta forma a deciso tima depende do valor do processo , somente no estgio em que o alarme
disparado. Note que,
uj ( ) =

J
X
i=0

aij (i) = a0j (0) +

J
X
i=1

aij (i)

5.4 Tempo de alarme baseado no processo a posteriori

83

Assuma, que a0j = 1 e aij = 1 I{0} (j i) a perda 0-1, ento


uj ( ) = (0) +

J
X

(i) (j)

i=1

= (0) + (1 (0)) + (j) = 1 (j).

De modo que sob a perda 0-1, a deciso tima escolher o conjunto j com a maior probabilidade
a posteriori. Ento, seja 0 < B < 1 e
= { : R(|Hn ) 1 B}

com
Dena como estratgia para deteco de cluster emergente um procedimento = (
, d)

tempo de alarme,
= min{n 1 : max[n (j)] > B}
jJ

(5.23)




. Note nesta estratgia que [ (j)] > B e obtenha em

e d = j = arg max[n (j)] . ento


jJ

5.23 que u( ) = 1( ) 1B e ainda, a localizao espacial do cluster obtida diretamente


por j = j . Para estimarmos o tempo de incio do cluster (a parte temporal), notamos por (5.14)
que
(j) =

( = k, = j |H )

k=1

= ( = 1, = j |H1 ) + ( = 2, = j |H2 ) + + ( = , = j |H ).

Grandes valores de ( = k, = j |H ) possuem maior contribuio para que o alarme dispare,


de forma que
k = arg[ max ( = k, = j |H )]
1k

(5.24)

um estimador para o incio do cluster.


Notando que para todo w xo (w n), que o evento { = k0 (n, w), d = j} mensurvel a
(X1 , ..., Xn ) e usando o fato que

= I{ <,d=j} ,w (j). Denindo


como estratgia para deteco de cluster emergente um procedimento w = (
w , dw ) com tempo
P

n=w I{ =k0 (n,w),d=j} n,w (j)

de alarme,
w = min{n w : max[n,w (j)] > B}
jJ

(5.25)

. O fato que, com w xado, o raciocnio para


e dw = j = arg max[n,w (j)] . ento w
jJ

o processo n,w anlago ao desenvolvido para o processo n .

5.5 Deteco de cluster emergente usando processo a posteriori adaptativo

84

5.5 Deteco de cluster emergente usando processo a posteriori


adaptativo
Nesta seo usamos a equivalncia { = j } = { = j} e discutimos a abordagem adaptativa para o processo n que pode ser extendida diretamente para o processo n,w pela simples
substituio de n (j) por n,w (j). Para elaborarmos um processo a posteriori adaptativo, considere uma classe inicial de candidatos a parte espacial do cluster emergente representada por
(0) = l , l = 1, 2, ..., L com cardinalidade J (0) . Onde l um processo estocstico com espao

de estados {l1 , ..., lj }. Para n > 1, denote l(n1) como o estado do processo l no tempo n 1,
onde

(
(n1)
l
j

= arg



max n1 (lj ) , j = 1, 2, ..., Jl

lj l

(5.26)

onde l identica sl e j identica o j -simo candidadto centrado em sl . Agora, dena


(n1)

(n1) = {1
j

(n1)

, ..., L
j

e, no tempo n construa um novo processo (n) com espao de estados


n
o
(n1)
(n1)
(n) = l
(n1) : n1 (l
) > B , l = 1, 2, ..., L
j

para alguma constante 0 < B < 1, obviamente B < B . Se no existe um l(n1)


tal que

(n1)

n1 (l

por

) > B dena (n) = (n1) . Finalmente, construa o processo a posteriori adaptativo


= {
n (0),
n ( (n1) )}n1

l
j

com lj = 1, 2, ..., |(n) |.

(5.27)

onde |(n) | denota a cardinalidade de (n) . Para deteco de cluster emergente usamos o tempo
de alarme
= min{n 1 :

max
(n1)
l
(n)

(n1)

n (
[
l
j

)] > B}

(5.28)

e funo de deciso d = lj , onde lj identica l(n1) tal que,

(n1)

= arg

max
(n1)
l
(n)

(n1)

n (
[
l
j

)] .

Para uma anlise "objetiva", ns usamos B = 1/(J 0 ) este valor signica que a priori, qualquer
subconjunto de localizaes espaciais tem a mesma probabilidade de representar a parte espacial
do cluster emergente.

5.6 Escolha da distribuio a priori para regio e ponto de mudana

85

5.6 Escolha da distribuio a priori para regio e ponto de mudana


Desde que o interesse em nosso trabalho encontrar clusters localizados e no uma possvel
mudana global na regio em estudo, razovel supor, por exemplo, que pequenos clusters
(conjuntos com poucas localizaes espaciais ou poucas reas) so mais provveis que um cluster
grande (conjuntos com muitas localizaes espaciais ou muitas reas). Outra questo de interesse,
pode ser a deteco de pequenos cluster com uma certa tendncia espacial. Baseado neste
pensamento, ns usamos a idia de modelo de cluster descrita em Gangnon e Clayton (2000)
(veja novamente, seo 2.1.5) e construmos uma classe = {1 , ..., J } de candidatos com uma
estrutura probabilstica associada que depende somente das caractersticas geomtricas (forma,
tamanho e direo) de . Especicamente, seja sl uma localizao espacial na rea em estudo e
lj um candidato a parte espacial do cluster emergente com parmetros de forma (lj ), tamanho

(lj ) e direo (%lj ) conhecidos. Ento, para a distribuio de lj denimos


(lj ) = c exp{p1 (lj )E(lj ) p2 (lj )E(lj ) p3 (lj )E(%lj )}

(5.29)

em que E(lj ), E(lj ), E(%lj ) so, respectivamente, escores de tamanho, forma e direo do clus-

ter, a terna (p1 (lj ), p2 (lj ), p3 (lj )) so valores no negativos representamdo pesos de importncia
e
c=

exp{p1 (lj )E(lj ) p2 (lj )E(lj ) p3 (lj )E(%lj )},

lj

uma constante de normalizao. Estas distribuies a priori so importantes para reetir a


incerteza sobre a estrutura do cluster. e podemos deni-las baseado em alguns critrios, como
os listados a seguir(estes so apenas algumas sugestes):
1. um cluster pequeno mais provvel que um cluster grande. Isto preserva a similaridade
espacial.
2. um cluster em formato circular mais provvel que um irregular. Podemos supor que no
existe tendncia espacial.
3. um cluster eliptico mais provvel desde que o interesse seja detectar uma tendncia
espacial.
4. uma rea com pequena populao tem menos chance de pertencer ao cluster, pois suas
taxas so muito instveis.
Por exemplo a gura 5.1 apresenta uma classe de candidatos a parte espacial clusters com
formato geomtrico circular, porm com tamanho varivel. Em cada ponto sl arbitrrio da
regio em estudo podemos centrar um crculo e aumentar seu raio. Para esta classe ns podemos

5.6 Escolha da distribuio a priori para regio e ponto de mudana

86

assumir que E(lj ) igual ao raio de lj , rlj . Observe que rlj grande (lj ) diminui, tornando um

cluster pequeno mais provvel (situao 1). Desde de que a forma est xada (formato circular)
tomamos E(lj ), pois E(lj ) > 0 penaliza a forma do clusters. Notando que o formato circular
independe da direo, tomamos E(%lj ). Para escolher p1 (lj ), podemos proceder da seguinte
forma: sejam lj e lj dois candidatos a cluster tal que rlj = 2 e rlj = 3. Ento, obtemos que
(lj )
= ep1 (lj )
(lj )

p1 (lj ) = log

(lj )
(lj )

tal que p1 (lj ) reete pesos de preferncia na escala logartmica. Por exemplo, ns podemos supor
que ao aumentarmos o raio (aumentamos o tamanho do cluster) em uma unidade de distncia
(por exemplo, 1Km) ocorra uma perda de similaridade espacial entre o centro do cluster e as
reas da borda do cluster, tal que lj seja (devido a perda de similaridade espacial de lj ) 10%
mais provvel que lj . Ento escolhemos p1 (lj ) = log(1, 1)
= 0, 1. A escolha p1 (lj ) = 1 implica
que crculos com mesmo raio possuem a mesma probabilidade de ser a verdadeira parte espacial
do cluster emergente.
Em geral, diferentes funes escore para cada parte espacial do cluster emergente podem
ser usadas para reetir diferentes crenas a priori sobre a estrutura do cluster. Especicaes
apropriadas requerem o conhecimento de um expert sobre o padro dos eventos em questo.
Quando E(lj ) = E(lj ) = E(%lj ) = 0, teremos uma distribuio a priori uniforme no espao
dada por (lj ) = 1/||,

lj , onde || a cardinalidade de .

Figura 5.1: Uma Classe de clusters com formato circular e tamanho varivel

5.7 Aplicao

87

A distribuio a priori para o ponto de incio do cluster emergente (parte temporal) baseada
numa verso truncada da distribuio geomtrica. Assumimos que
( = k) = (k) = p(1 p)k(nw+1) ,

k = n w + 1, n w + 2, ....

(5.30)

onde w n uma janela temporal de valor pr-especicado. Obviamente quando w = n temos


a distribuio geomtrica usual com
(k) = p(1 p)k1 ,

(5.31)

k = 1, 2, ....

Em uma anlise puramente temporal, a distribuio geomtrica dada em (5.31) foi usada pela
primeira vez por Shiryaev (1963) como distribuio a priori para um provvel ponto de mudana.
Recentemente, esta distribuio tem sido usada para monitorar mudanas no tempo de chegada
em um processo de Poisson em vrias categorias com taxa de chegada conhecida (Brown, 2008) e
desconhecida (Brown, 2009). Uma classe mais geral de distribuies a priori, no qual a geomtrica
est inserida, usada para monitoramento de mudanas na escala temporal tem sido apresentada
em Borovkov(1998). Um grande problema ao usr-mos esta abordagem a especicao de p.
Na escala temporal, Frisn and Wessman (1999), Sonesson and Bock (2003), tem recomendado
o uso de pequenos valores para p (por exemplo p = 0.20) de modo que os resultados possam
ser comparados com o mtodo da razo de verossimilhana (veja, 2.2.2). Pequenos valores de
p indicam que a probabilidade de uma mudana pequena. Ns assumimos que no tempo n

a probabilidade a priori que no tenha ocorrida uma mudana p0 . Desta forma, p satisfaz a
equao,
P( > n) = p0

mas,
P( > n) =

p(1 p)k(nw+1) = (1 p)n+w

k=n+1

p(1 p)k1

k=n+1
n+w

= (1 p)

(1 p) = (1 p) .

1/w . Para
ento obtenha p = 1 p1/w
0 . Uma escolha natural p0 = 1/2 de modo que p = 1 0.5

esta escolha, a probabilidade a priori de que no tenha ocorrido mudana no ponto k maior
que 0.5.

5.7 Aplicao
Para ilustrar a utilizao do mtodo para deteco de cluster no espao-tempo baseado em
um processo a posteriori, ns avaliamos o conjunto de dados referente aos casos de cncer da
tireide em homens que ocorreram no Novo Mxico durante o perodo de tempo 1973-1992. Este
conjunto de dados foi descrito e utilizado na seo 3.3 desta tese e tm sido usado por alguns

5.7 Aplicao

88

pesquisadores (Kulldor, 2001; Lima e Duczmal, 2011) como um banco de dados teste para
avaliar a performance de um mtodo proposto para a deteco de cluster emergente.
5.7.1

Anlise dos dados de cncer da tireide

A regio de estudo o mapa apresentado na gura 5.2 representando as 32 reas do Novo


Mxico (l = 1, 2, ..., L = 32). Para a construo do mtodo, seja Xt = (Xt (s1 ), ..., Xt (sL ))0 o
processo sob monitoramento, em que Xt (sl ) representa o nmero de casos cncer da tireide
no tempo t na rea Al identicada por sl que representa o centride da rea. assumimos que
condicional a t = (t (s1 ), t (s2 ), ..., t (sL ))0 , o vetor Xt = (Xt (s1 ), ..., Xt (sL ))0 um processo
de Poisson tal que (Xt (sl )|t (sl )) P oisson (et (sl ) t (sl )) com et (sl ), assumido conhecido,
representando a contagem esperada da doena no tempo t em sl , variando entre as reas de
acordo com idade e raa. A quantidade t (sl )) uma medida de risco relativo (em relao ao
mapa) de ocorrncia de um caso de cncer da tireide no tempo t em Al . Se a doena est sobcontrole no mapa, esperamos que esta medida de risco seja prximo de 1 com pequenas variaes.

Figura 5.2: Mapa do Novo Mxico. Fonte: US Census.

Determinao do valor de et (sl )


Para determinarmos o valor de et (sl ), usamos uma padronizao interna ajustada por idade
e raa. Especicamente, dena xT,i,r (sl ) como sendo o nmero de casos que ocorreram no
tempo T (1 T t) entre as pessoas na classe de idade i pertencente a raa r na l-sima
rea, e NT,i,r (sl ) a respectiva populao em risco. Ento, a estimativa para taxa global de
casos em todo o mapa referente a classe de idade i na raa r no tempo T dada por T,i,r =
P

sl S

xT,i,r (sl )/

sl S

NT,i,r (sl ). Logo eT,i,r (sl ) = NT,i,r (sl )T,i,r representa uma estimativa

para o nmero de casos esperados no tempo T na classe de idade i e raa r sob a suposio de
que no existe cluster no espao-tempo. Portanto, uma estimativa para o nmero total de casos

5.7 Aplicao

89

esperados na l-sima rea no tempo T dado por eT (sl ) =


tw
1 X
et (sl ) =
eT (sl ),
tw

P P
i

r eT,i,r (sl )

e, nalmente usamos,

t w + 1.

T =1

Escolha das distribuies a priori


1. Distribuio a priori para t (sl ): Supomos que
 
 
t (sl ) a
.
G0 (t (sl )) = 1 exp
b

Obviamente, os {t (sl ) : l = 1, 2, ..., L e t 1} so assumidos independentes com distribuio comum W eibull(a, b) onde a e b so, respectivamente, os parmetros de forma
e escala dessa distribuio. A distribuio W eibull(a, b) surge, neste captulo, como uma
distribuio alternativa em relao ao uso de uma distribuio na famlia conjugada (ver
seo 4.6), pois ela pode tomar uma grande variedade de formas regulares podendo, por
exemplo, acomodar assimetria da distribuio. Esta distribuio, possui
Moda(t (sl )) = b

a1
a

1/a

, a > 1 e b > 0.

e
Varincia = b2 ((1 + 2/a) ((1 + 1/a))2 )
Em que (.) denota a funo gama. Em problemas de deteco de cluster emergente,
razovel supor que, se no existem mudanas no processo espao-temporal em monitoramento, os {t (sl ) : l = 1, 2, ..., L e t 1} surgem de forma aleatria a partir de uma
distribuio comum. Desta forma, quando o processo esta sob-controle, pode-se interpretar
a M oda(t (sl )) como sendo o valor mais provvel para o risco relativo de ocorrncia de um
caso de cncer da tireide em uma rea escolhida ao acaso no mapa. Observe que, se

b=

a1
a

1/a
,

ento a M oda(t (sl )) = 1.

Logo, sobre esta escolha para b, podemos selecionar o valor a de modo a obtermos pequenas
variaes em torno de 1 para a distribuio de t (sl ). Como escolha apropriada, ns usamos
o par (a, b) = (2, 1.414) que fornece M oda = 1 e pouca variao (veja gura 5.3). Agora,
seja
1/a
y = G0 (t (sl )) G1
,
0 (y) = b (log(1 y))

0 < y < 1.

e
f (Xt (sl )|t (sl )) = (Xt (sl )!)1 (et (sl )t (sl ))Xt (sl ) exp{et (sl )t (sl )}

5.7 Aplicao

90

ento,

Xt (sl )
1
1/a
f (Xt (sl )|G1
(y))
=
(X
(s
)!)
e
(s
)b(log(1

y))
t l
t l
0
exp{et (sl )[b(log(1 y))1/a ]}.

(5.32)

Usamos como grandeza estocstica desejada m = 2, 4, 8, computamos a expresso (5.12)


e obtemos o valor de F Bt (j) em (5.10). O comportamento da distribuio a priori, do
mximo de m-variveis aleatrias com distribuio G0 e 1 Gm
0 so mostrados na gura
5.3.

Figura 5.3: funo de densidade weibull (f.d), funo de densidade do mximo de m-variveis
weibull (f.d. max), Funo de distribuio weibull (F.d), Funo de distribuio do
mximo de m-variveis weibull (F.d. max), 1-Funo de distribuio weibull (1-F.d),
1-Funo de distribuio do mximo de m-variveis weibull (1-F.d. max)
2. Distribuio a priori para : Para compararmos nossos resultados com os obtidos em
Kulldor (2001) e Lima e Duczmal (2011). Ns supomos que tem formato geomtrico
circular, porm com tamanho varivel como mostrado na gura 5.1. Em cada ponto sl
arbitrrio do mapa ns centramos um crculo e aumentamos seu raio rlj at que contenha
todos os outros centrides. Nesta formulao no existe restrio ao tamanho do crculo
de modo que temos um total inicial de crculos igual a L2 = 322 . Usando um simples
algoritmo para eliminao de crculos com as mesmas localizaes espaciais, obtemos um
total de
J 0 = 743

(5.33)

5.7 Aplicao

91

crculos distintos. Usando p1 (lj ) = 1 a expresso (5.29) simplica em,


onde c =

(lj ) = c exp(rlj ),

exp(rli ).

(5.34)

li

A escolha p1 (lj ) = 1 implica que crculos com mesmo raio possuem a mesma probabilidade
a priori de ser a verdadeira parte espacial do cluster emergente. Para obteno do raio rlj ,
realizamos um reescalonamento nas distncias entre os centrides do mapa. Centrado em
sl , seja d(sl , sl0 ) a distncia de sl a qualquer outro ponto s0l do mapa e M ax(sl ) a maior
l , sl0 ) = d(sl , sl0 )/M ax(sl ). Usando d(s
l , sl0 ) como
distncia observada, ento denimos d(s

medida de similaridade espacial construmos de acordo com a explicao dada na seo


3.2.5 e computamos a expresso (5.34).
3. Distribuio a priori para : A distribuio para baseada numa verso truncada da
distribuio geomtrica discutida na seo 5.6. Ou seja,
( = k) = (k) = p(1 p)k(nw+1) ,

k = n w + 1, n w + 2, ....

(5.35)

onde w n a janela temporal de valor pr-especicado. Usamos w = 6 que representa o


mesmo valor usado em Kulldor (2001). Como discutido na seo 5.6 p satisfaz a equao
1/w

p = 1 p0

onde p0 a probabilidade a priori que no tenha ocorrido uma mudana at

o tempo n. A tabela 5.1 apresenta alguns valores para p de acordo com o valor de w e
p0 = 0.5 que o valor usado nesta aplicao.

Tabela 5.1: Valores para p de acordo com o valor de w e p0 = 0.5.


P( > n)

p0 = 0.5

5.7.2

0.21

0.16

0.13

0.11

0.09

0.08

Obteno do processo a posteriori adaptativo

Para obtermos a distribuio do processo a posteriori adaptativo, usamos (5.8) combinada


com a abordagem adaptativa desenvolvida na seo 5.5. Como a distribuio a priori para

5.7 Aplicao

92

truncada em n w + 1 com w = 6, obtemos por (5.8) que para todo n 5 k n, = j ,


Q
(k) (lj ) nt=k F Bt (lj )
Pn
Qn
P
( = k, = lj |Hn ) = P
l n
k=n5 (k) (li )
t=k F Bt (li ) +
k=n+1 (k)
i

e pela substituio dos termos descritos na seo 5.7.1, temos:


1. (k) = p(1 p)k(n5) dada em (5.35) com com p = 1 0.51/6 .
2.

k=n+1 (k)

= P( > n) = p0 = 0.5 (valor assumido nesta aplicao).

3. n (lj ) = cn exp(rlj ) (priori no tempo n)dada em (5.34) com cn =

li ( n) exp(rli )

4. Combinando 5.10 com 5.12, aproximamos F Bt (lj ) por,


F Bt (lj )

PQ

sl lj

1
q=1 fm (Xt (sl )|G0 (zq ))
.
PQ
1
q=1 f1 (Xt (sl )|G0 (zq ))

onde z1 , z2 , ..., zQ so Q = 1000 valores gerados de uma distribuio Beta(m, 1). O ndice
em f1 (.) signica que m = 1 e fm (.) dada em (5.32) substituindo y por zq .
Desta forma,
n
X

n,w (lj ) = P(n w + 1 n, = lj |Hn ) =

( = k, = lj |Hn ).

(5.36)

k=nw+1

dada pela expresso (com w = 6),


Pn

1
q=1 fm (Xt (sl )|G0 (zq ))
sl lj PQ f1 (Xt (s )|G1 (zq ))
l
q=1
0
PQ
1
Q
Q
f
(X
(s
)|G
m
t
l
n
q=1
0 (zq ))
0.51/6 )(0.51/6 )k(n5) exp(rli ) t=k sl l PQ
1
f1 (Xt (s )|G (zq ))
i

1/6 )(0.51/6 )k(n5) exp(r )


lj
k=n5 (1 0.5

li (n)

Pn

k=n5 (1

Qn

t=k

PQ

q=1

+ 0.5/cn

(5.37)

Obviamente,
n (0) = 1

X
li

n,w (lj ).

(n)

Como em (5.33) temos J 0 = 743 obtemos da seo 5.5 que B = 1/743 0.0013. Agora,
usamos um limite de controle B = 0.5 e aplicamos o processo a posteriori adaptativo nos cojunto
de dados de cncer da tireide (Kulldor, 2001) e os resultados obtidos so apresentados e
discutidos na prxima seo.
5.7.3

Anlise dos resultados da aplicao

Os resultados mais importantes envolvendo a aplicao do mtodo de monitoramento proposto, baseado na Mxima Probabilidade a Posteriori (MPA) conjunta de um possvel tempo
de mudana em alguma regio do mapa, so apresentados nas guras 5.4 e 5.5. A gura 5.4

5.7 Aplicao

93

apresenta o funcionamento da funo de alarme baseada na mxima probabilidade a posteriori


adaptativa para m=2, m=8 e tambm o tempo, a regio e as observaes que provocaram a
mudana no padro espao-temporal do processo. Para m=2, observa-se que quando t = 15 a
MAP cresce e atinge o maior valor 0.443 no tempo nal de monitoramento n=20 na sub-regio
do mapa formada pelas reas (ver, gura 5.4): Los Alamos, Rio Arriba, Taos e Santa F. A rea
central do cluster Rio Arriba. Todos os pontos marcados (por *) no grco so provenientes de
de modo que o cluster emergente detectado representado geomtricamente por um cilindro
[15, 20] de base e altura [15,20]. Obviamente, que usando um limite de controle B = 0.5,

este cluster no dispara o alarme e portanto no considerado signicativo. Ainda na gura


5.4, quando m=8, observa-se uma sequncia crescente de valores a partir do ponto t = 18 at o
tempo atual n = 20. Nesta sequncia de pontos no tempo, a mxima probabilidade a posteriori
assume, respectivamente, os valores 0.584, 0.882 e 0.958, mostrando claramente a presena de
um cluster emergente signicativo que comea no tempo de mudana k = 18 e reas pertencentes
ao cluster (ver, gura 5.4): Los Alamos, Rio Arriba e Taos. Este cluster emergente geometricamente representado pelo cilindro [18, 20] de base e altura [18,20]. Este est contido
em [15, 20] que foi o cilindro obtido com m=2. Na gura 5.5, Apresentamos conjuntamente,
o comportamento da mxima probabilidade a posteriori para m=2,4 e 8 em (A), e tambm, a
razo prospectiva para os casos observados por casos esperados nas reas que compem o cluster
signicativo. A razo prospectiva calculada por
n X
X
Xt (sl )
, k = 1, 2, ..., n.
et (sl )
t=k sl

Os valores observados para esta razo, mostram que nos ltimos dois perodos de tempo (t =
19, 20) esta razo foi superior para todas as reas pertencentes ao cluster indicando um aumento

no risco relativo relativo de ocorrncia de um caso da doena.


Analisando este mesmo conjunto de dados, a estatstica scan espao-tempo de Kulldor
(2001) detectou o cluster emergente [17, 20] ( = {LosAlamos}) com um valor-p=0.016.
Lima e Duczmal (2011) usando uma funo de alarme baseada na razo de verossimilhana
adaptativa detectam o cluster emergente [16, 20] com razo de verossimilhana adaptativa
em favor do cluster igual a 42.672. Obviamente, uma probabilidade a posteriori igual a 0.958
mais conclusiva.

5.7 Aplicao

94

Figura 5.4: A esquerda: Mxima probabilidade a posteriori adaptativa para m=2, ponto k=15
e regio da mudana; A direita: Mxima probabilidade a posteriori adaptativa para
m=8, ponto k=19 e regio da mudana.

Figura 5.5: Em (A): Mxima probabilidade a posteriori adaptativa para m=2, 4 e 8; Em (B)
Razo valor observado por valor esperado xt (sl )/et (sl ), t k = 1, 2, ..., n para as
regies do cluster emergente detectado e considerado signicativo

5.8 Estudo com dados simulados

95

5.8 Estudo com dados simulados


5.8.1

Dados simulados

Para avaliar a performance do mtodo baseado em um processo a posteriori para a deteco


de cluster no espao-tempo, realizamos um estudo com dados simulados com o objetivo de
detectar mudanas na distribuio do risco de ocorrncias de casos de uma doena sobre o espaotempo. Consideramos como populao em risco, Nt (sl ), a populao de homens residentes no
ano de 1992 nas 32 (L=32) reas do Novo Mxico como descrito em Kulldor(2001). Sobre esta
populao em risco ns simulamos um processo de Poisson
Xt = (Xt (s1 ), ..., Xt (sL ))0

condicional a um outro processo de risco relativo


t = (t (s1 ), t (s2 ), ..., t (sL ))0

tal que E(Xt (sl )|t (sl ) = et (sl ) t (sl ) com et (sl ) representando o nmero de casos esperados em
sl no tempo t. e dado por et (sl ) = 0 Nt (sl ). 0 uma taxa de referncia global para a doena.

Os casos so simulados para um perodo de monitoramento t = 1, 2, ..., n = 20 e 1000 rplicas


do processo foram geradas. A parte espacial do cluster alocado no mapa formado por 4 reas,
= {chaves, Eddy, Lea, Otero} que podem ser identicadas na gura 5.2. Este um cluster com

populao mediana em relao ao mapa. Quando simulamos um processo sem cluster assumimos
que sob o modelo padro {t }, realizao de um processo Gama tal que,
t (sl ) Gama(100, 100), t = 1, 2, ..., 20 e l = 1, 2, ..., 32.

Esta distribuio a priori produz uma pequena variao no risco sobre todo o mapa tal que o
valor esperado de Xt (sl ) esta prximo de et (sl ). Para o modelo de cluster emergente denimos
um risco alternativo por t (sl ) = t (sl ) I{t11,sl } . onde t (sl ) o valor gerado da distribuio
de referncia Gama(100,100) e = 1.5, 2, 3. Observa-se que neste caso o ponto de mudana
k = 12. Usamos, ainda, 0 = 0.0001 (taxa de um caso para cada 10000 habitantes); uma
janela temporal de tamanho w = 6. Para detectarmos o cluster no espao tempo, ns usamos
G0 W eibull(2, 1.414) e G0 U nif (0, 2). Isto gera um total de 18 cenrios diferentes sobre o

modelo de cluster e sobre estes cenrios ns aplicamos como funo de monitoramento a expresso
5.37 e calculamos as medidas de performance: Sensitividade Condicional de um alarme SSC;
Valor Predito Possitivo Condicional de um alarme VPP; atraso na deteco ADD. descritas
na seco 3.5.1. Uma observao importante, que embora o processo {t } seja gerado de uma
distribuio Gama, usamos como distribuies de referncia as distribuies Uniforme e Weibull.

5.8 Estudo com dados simulados


5.8.2

96

Anlise dos resultados obtidos com dados simulados

Os resultados para as medidas de perfomance esto descritos em termos de mdias na tabela


) na deteco decresce tornando-se muito pequeno
5.2. Nota-se, na tabela que o atraso (ADD

quando aumentamos o valor de e m. A SSC sempre menor que o VPP implicando que o

cluster localizado tende a ser menor que o verdadeiro cluster, porm com uma boa preciso. Isto
deve ocorrer como efeito da distribuio a priori para a parte espacial do cluster que favorece de
uma maneira mais forte os clusters com pequenas reas (pois as distncias entre seus centrides
so mais prximas). Por exemplo, quando = 2, m = 8 e G0 W eibull o atraso estimado
igual a 0.581, que pode ser considerado muito pequeno, pois o cluster foi detectado logo no seu
incio. A preciso na localizao medida pela SSC 0.907 enquanto que o VPP=0.946.
De uma forma geral, o mtodo bastante rpido (possui pequeno atraso), possui uma boa
preciso e aparentemente parece ser robusto no sentido de que mesmo usando uma distribuio
a priori diferente da verdadeira, os resultados obtidos foram satisfatrios. Uma amostra do
funcionamento on-line do mtodo com dados simulados apresentado na gura 5.6. Nesta gura
observamos que quando m cresce a mxima probabilidade a posteriori se aproxima de 1.

Figura 5.6: Amostra de uma simulao do processo a posteriori adaptativo para distribuies de
referncia Weibull e Uniforme com: = 2, B=0.5, m=2,4,8

5.9 Discusso

97

Tabela 5.2: Valores estimados para Sensitividade (SSC), Valor Predito Positivo (VPP) e Atraso
(ADD) usando o processo a posteriori adaptativo com janela w=6, diferentes valores
para e duas distribuies para G0 : Weibull(2,1.414) e Uni(0,2)
Medidas de Perfomance

SSC

VPP

ADD

1.50

0.571

0.634

3.785

2.00

0.510

0.742

3.462

3.00

0.341

0.679

2.917

1.50

0.940

0.953

2.950

Weibull(2,1.414) m = 4 2.00

0.907

0.941

1.478

3.00

0.805

0.928

1.224

1.50

0.933

0.958

1.845

2.00

0.907

0.946

0.581

3.00

0.877

0.897

0.463

1.50

0.741

0.779

3.170

2.00

0.781

0.813

3.000

3.00

0.639

0.823

2.602

1.50

0.846

0.887

2.884

2.00

0.819

0.835

1.257

3.00

0.847

0.883

0.915

1.50

0.816

0.873

2.553

2.00

0.809

0.833

0.933

3.00

0.800

0.807

0.384

m=2

m=8

m=2

Unif(0,2)

m=4

m=8

5.9 Discusso
Neste captulo desenvolvemos um novo mtodo para deteco e monitoramento de clus-

ters emergentes. Ao incorporarmos na anlise, atravs de distribuies a priori, a incerteza na

5.9 Discusso

98

localizao espacial e no ponto de mudana no tempo, ns realizamos um monitoramento no


espao-tempo baseado na mxima probabilidade a posteriori conjunta de que tenha ocorrido
uma mudana no padro de eventos no espao-tempo. Esta nova metologia uma combinao
dos seguintes mtodos descritos nas sees 2.2 e 2.1: Shiryaev-Roberts, usado para deteco
de mudanas na escala temporal; e o mtodo Bayesiano de Gangnon e Clayton (2000), usado
para a deteco de mudanas no padro espacial de eventos. Mostramos que esta abordagem
minimiza uma perda esperada a posteriori representada por uma combinao de uma perda por
um falso alarme e uma falsa localizao. Desenvolvemos uma estrutura geral de distribuies a

priori para a parte espacial do cluster que levam em considerao o tamanho, forma e direo do
cluster. Para identicar possveis mudanas na taxa de ocorrncias de eventos, ns elaboramos
uma abordagem alternativa em relao ao uso de distribuies na famlia conjugada (descritas na
seo 4.4), baseada em mudanas na funo de distribuio a priori. Essas mudanas so capituradas por uma distribuio que estocasticamente maior do que a considera como distribuio
padro (ou distribuio de referncia). Resultados mostrados em nossas simulaes mostraram
uma certa robustez no mtodo na presena de distribuies a priori mal especicada. Em nossa
aplicaes obtivemos resultados mais conclusivos que os apresentados em Kulldor (2001) e Lima
e Duczmal (2011).

99

6 Concluso

Nesta tese de doutorado foram desenvolvidos vrios mtodos para a deteco de mudanas
no espao-tempo que podem ser usados em uma variedade de sistemas de vigilncia: Sistema
de vigilncia em crimes; Sistema de vigilncia em sade pblica; Sistemas de monitoramento
ambiental. O foco principal a deteco de clusters no espao-tempo.
Ao combinarmos tcnicas de vigilncia estatstica no domnio do tempo com estimao adaptativa e algortmo para deteco de cluster espacial com representao geomtrica circular, ns
desenvolvemos um mtodo de monitoramento no espao-tempo baseada no uso da Razo de
Verossimilhana Adaptativa (ALR). Em essncia a ALR uma razo de verossimilhana genuna
e por isso preserva a propriedade martingal de modo que os mtodos baseados na ALR no requerem o uso de testes de Monte Carlo para validar a signicncia estatstica do procedimento
o que tornou bastante rpido e eciente o algortmo desenvolvido para deteco do tempo e
localizao da mudana.
Ao considerarmos a possvel observao de processos espao-temporais compostos por componentes correlacionados, no-estacionrios ou com localizao espacial da mudana com um
formato no circular, Ns desenvolvemos, para a deteco de clusters emergentes nestes tipos
de processos, uma abordagem Bayesiana baseada em um Fator Bayes Adaptativo com janela
temporal limitada e usamos uma estrutura de cluster onde o espao representado por subconjuntos de localizaes espaciais com formato eliptico. Trs importantes caractersticas observadas
nesse novo mtodo so: 1) A utilizao de uma janela temporal w que permite a estimao, de
qualquer parmetro de interesse, usando dados histricos pertencentes ao conjunto de tempos
t = 1, 2, ....t w; 2) Uma abordagem adaptativa no espao dos cluster que permite tornar o algo-

ritmo de varredura no espao-tempo "relativamente"rpido. 3) ajusta automaticamente o limite


de controle para a funo de alarme mantendo constante a probabilidade de um falso alarme e,
ainda, tornando o atraso na deteco muito pequeno.
Ao incorporarmos na anlise, atravs de distribuies a priori, a incerteza na localizao
espacial e no ponto de mudana no tempo combinada com algortmos para deteco de cluster
espacial, ns realizamos um monitoramento no espao-tempo baseada na probabilidade a poste-

riori conjunta de que tenha ocorrido uma mudana no padro de eventos de um determinado

6 Concluso

100

fenmeno em estudo em uma sub-regio do mapa a um tempo desconhecido. Neste caso foi
usada como funo de alarme, a mxima probabilidade a posteriori conjunta (MAP), que torna
mais simples a interpretao da abordagem adaptativa em termos de probabilidades a posteriori.
Mostramos que esta abordagem minimiza uma perda esperada a posteriori representada por uma
combinao de uma perda por um falso alarme e uma falsa localizao. Desenvolvemos uma estrutura geral de distribuies a priori para a parte espacial do cluster que levam em considerao
o tamanho, forma e direo do cluster.
Embora analiticamente, tenha sido impossvel obter propriedades dos mtodo desenvolvidos
no que tange ao atraso e preciso na deteco, empiricamente, atravs de alguns simples estudo
com dados articiais, obtivemos resultados altamente satisfatrios, que podem ser raticados
ou no atravs de estudos comparativos com outros mtodos. Estes estudos comparativos no
foram abordados aqui devido algumas diculdades tcnicas. Uma importante observao nos
resultados e simulaes que a performance dos mtodos propostos sugerem que a abordagem
adaptativa na classe dos subconjuntos de localizaes espaciais muito efetiva em um monitoramento simultneo no espao-tempo.

101

Referncias Bibliogrcas
Assuno, R., Corra, T (2009). Surveillance to detect emerging space-time clusters
Computational Statistics and Data Analysis, 53, 2817-2830.
Ailamaki, A., Faloutsos, C., Fischbeck, P (2003). An environmental sensor network to determine
drinking water quality and security SIGMOD Record, 32, 47-52.
Banerjee S, Carlin B.P, Gelfand A.E (2004). Hierarchical Modeling and Analysis for Spatial
Data. Chapmam Hall, Boca Raton, FL
Besag, J. and Newell. J (1991). The detection of cluster in rare diseases. J.R. Statist. Soc. A,
154, 143-155.
Borovkov, A.A., (1998). Asymptotically optimal solutions in the change-point problem. Theory
Probab. Appl, 43, 539-561.
Brown,M. (2008). Monitoring a Poisson process in several categories subject to changes in the
arrival rates Statistics and Probability Letters 78,2637-2643.
Brown,M. (2008). Bayesian Detection of Changes of a Poisson Process Monitored at Discrete
Time Points Where the Arrival Rates are Unknown Sequential Analysis 27,68-77.
Cuzick, J. and Edwards, R (1990). Spatial clustering for inhomogeneos populations. Journal of
Royal Statistical Society. B, 52, 73-104.
Duczmal, L.H., Assuno, R.M., (2004). A simulated annealing strategy for the detection of
arbitrary shaped spatial clusters. Computational Statistics and Data Analysis, 45, 269-286.
Duczmal, L., Canado, A.L., Takahashi, R.H., Bessegato, L.F. (2007). A genetic algorithm for
irregularly shaped spatial scan statistics. Computational Statistics and Data Analysis 52, 43-52.
Dwass, M., (1957). Modied randomization test for nonparametric hypotheses. Ann. Math.
Statist, 28, 181-187.
Frisn, M. and Wessman, P. (1999). Evaluations of likelihood ratio methods for surveillance:
dierences and robustness Communs Statist. Simuln Computn 28, 597-622.
Gangnon, R.D., Clayton, M. K. (2007). Cluster detection using Bayes factors from
overparameterized cluster models. Environ Ecol Stat, 14, 69-82.
Gutierez, P. E, and Smith A.F.M, (1995). Conjugate Parametrizations for Natural Exponential
Families. Journal of the American Statistical Association 90, 1347-1356.
Kass, R.E and Adrian, E.R. (1995). Bayes Factors Journal of the American Statistical
Association 90,430, 773-795.
Knorr-Held, L., Raer G., (2000). Bayesian detection of clusters and discontinuities in disease
maps. Biometrics, 56, 13-21.
Kulldor, M., (1997) A spatial scan statistic. Communs Statist. Theory Meth., 26, 1481-1496.

Referncias Bibliogrcas

102

Kulldor, M., (2001) Prospective time periodic geographical disease surveillance using a scan
statistic. Journal of Royal Statistical Society, A., 164, 61-72.
Kulldor, M., Huang, Lan., Pickle, Linda., Duczmal, L. (2006). An Elliptic Spatial Scan
Statistic. Statistics In Medicine, 25, 3929-3943.
Gorr, W., Harries, R. (2003). Introduction to crime forecasting. International Journal of
Forecasting, 19, 551-555.
Imbiriba, E.N.B, Neto,A.L.S, Souza, W.V, Pedrosa, V., Cunha, M.G, Garnelo, L. (2009).
Social inequality, urban growth and leprosy in Manaus: a Spatial appoach. Rev Saude Publica,
43,4, 656-665.
Lai, T.L., (1995). Sequential change point detection in quality control and dynamical systems.
Journal of Royal Statistical Society, A., 57, 613-658.
Lai, T.L., (1998). Information bounds and quick detection of parameter changes in stochastic
systems. IEEE Trans. Inform. Theory., 44, 2917-2929.
Lima, M.S, Duczmal, L.H, (2009) Endemic Disease Surveillance Using Bayes Factor.
International Society for Disease Surveillance Eighth Annual Conference, Miami, EUA
Lima, M.S, Duczmal, L.H., (2011). Surveillance and Detection of Space-Time Clusters using
Adaptive Bayes Factor. in: Cancer Clusters. Editor: Bradley D. Germanno, Series: Cancer
Etiology, Diagnosis and Treatments, Nova Science Publishers, ISBN: 978-1-61209-516-5
Lima, M.S, Duczmal, L.H, (2011) Adaptive Likehood Ratio Approaches for the Detection of
Space-Time Disease Clusters submited
Lorden, G., Pollak M., (2005). Nonanticipating estimation applied to sequential analysis and
changepoint detection. Annals of Statistics, 33, 1422-1454.
Marshall, J.B., Spitzner, D.J., Woodall, W.H., (2007). Use of the local Knox statistic for the
prospective monitoring of disease occurrences in space and time. Statistics in Medicine., 26,
1576-1593.
Migon, H.S. and Gamermam, D. (1999). Statistical Inference: An Integrated Approch. Hodder
Arnold, London
Morris, C.N (1982). Natural Exponential Families with Quadratic Variance Functions. Annals
of Statistics ., 10, 65-80.
Neill, D.B, Moore, A.W., Sabhnani, M.R., (2005). Detecting elongated disease clusters.
Morbidity and Mortality Weekly Supplement on Syndromic Surveillance, Report, 54, 197.
Neill, D.B, (2006). Detection of Spatial and Spatio-Temporal Clusters. Ph.D. Thesis, University
Pittsburgh.
Neill, D.B, (2009). Expectation-based scan statistics for monitoring spatial time. International
Journal of Forecasting 25, 498-517.
Openshaw, S., Craft, A.W., Charlton, M., and Birch, J.M., (1988). Investigation of leukaemia
cluster by use of a geographical analysis machine. Lancet, 1, 272-273.
Page, E. S., (1954). Continuous inspection schemes. Biometrika, 41, 100-115.
Patil, G.P., Taillie, C., (2003). Geographic and network surveillance via scan statistics for
critical area detection. Statistical Science, 18, 457-465.

Referncias Bibliogrcas

103

Pavlov, I.V., (2003). Sequential Procedure of Testing Composite Hypotheses with Applications
to the Kiefer-Weiss. Theory Prob. Appl, 35, 280-292.
Pollak, M., Siegmund. D., (1975) Aproximations to the expected sample size of certain
sequential test. Annals of Statistics, 3, 1267-1282.
Pollak, M. (1985) Optimal detection of a change in distribution. Annals of Statistics, 13,
206-227.
Pollak, M. (1987) Average run lengths of an optimal method of detecting a change in
distribution. Annals of Statistics, 15, 749-779.
Porter,D.M, (2007) Some Adaptive approaches for space-time anomaly detection. First
International Workshop in Sequential Methodologies, IWSM.
Roberts, S. W. (1966) A comparison of some control chart procedures. Technometrics., 8
411-430.
Sabhnani, M., Neiil, D.B., Moore, A. W., Tsui, F.C., (2005). Detecting anomalous clustersin
pharmacy retail data. In Proceedings of the KDD, workshop on data mining methods for
anomaly detection 2005, 58-61.
Shiryayev, A.N., (1986). On optimum methods in quickest detection problems. Theory Probab.
Appl., 8, 22-46.
Shiryayev. A.N, (1978). Optimal Stopping Rules. In: Springer-Verlag, New york
Sonesson, C., Bock, D., (2003). A review and discussion of prospective statistical surveillance
in public health. Journal of Royal Statistical Society, A., 166, 5-21.
Sonesson, C., (2007). A CUSUM framework for detection of space time disease clusters using
scan statistic. Statistics in Medicine., 26, 4770-4789.
Tartakovsky, A.G., Rozovskii, L.R., Blazek, R.B., Kim, H. (2006). Detection of intrusions in
information systems by sequential change-point methods. Statistical Methodology., 3, 252-293 .
Tango, T. (1995). A class of tests for detecting general and focused clustering of rare diseases.
Statistics in Medicine., 14, 2323-2334.
Tango, T., Takahashi, K., (2005). A exibly shaped spatial scan statistic for detecting clusters.
International Journal of Health Geography, 4, 4-11.
Tango, T., Takahashi, K., Kohriyama, Kazuaki. (2010). A Space-Time Scan Statistic for
Detecting Emerging Outbreaks Biometrics, 4, 1-10.
Tuiia, D., Lasaponarab, R., Telescab, L., Kanevskia, M., (2008). Emergence of spatio-temporal
patterns in forest-re sequences. Physica A, 387, 3271-3280.
Turnbull, B.W., Iwano, E.J.,Burnett,W.S., HOWE, H.L, and Clark,L.L (1990). Monotoring for
Cluster of disease: Aplication to leukemia incidence in upstate New York. American J. epidem,
88, 132, S136-S143.
Walter, S.D. (1994). A simple test for spatial patter in regional health data. Statistics in
Medicine., 13, 1037-1044.
West, M., (1986). Bayesian Model monitoring. Journal of Royal Statistical Society, B., 48,
70-78.

Referncias Bibliogrcas

104

West, M. and Harrison, P.J. (1986). Monitoring and Adaptation in Bayesian Forecasting
Models Journal of the American Statistical Association 81,395, 741-750.
West, M. and Harrison, P.J. (1997). Bayesian Forecasting and Dynamic Models Springer-Verlag
New York, Second Edition
Zhou, H. and Lawson, A.B, (2008). EWMA smoothing and Bayesian spatial modeling for
health surveillance Statistics in Medicine 48
Ross,S.M (1983). Stochastic Processes. Wiley Series in Probability and Mathematical Statistics:
Probability and Mathematical Statistics. John Wiley Sons Inc., New York, 1983. Lectures in
Mathematics, 14.