Você está na página 1de 124

MINISTRIO DA SADE

FUNDAO OSWALDO CRUZ

VOLUME

Srie B. Textos Bsicos de Sade

Braslia - DF
2007
2007 Ministrio da Sade.
Todos os direitos reservados. permitida a reproduo parcial ou total desta obra, desde que
citada a fonte e que no seja para venda ou qualquer fim comercial.
A responsabilidade pelos direitos autorais de textos e imagens desta obra da rea tcnica.
A coleo institucional do Ministrio da Sade pode ser acessada, na ntegra, na Biblioteca Virtual
em Sade do Ministrio da Sade: http://www.saude.gov.br/bvs

Srie B. Textos Bsicos de Sade


Srie Capacitao e Atualizao em Geoprocessamento em Sade; 3

Tiragem: 1. edio 2007 1.200 exemplares

Elaborao, distribuio e informaes: Equipe Tcnica da Elaborao:


Ana Lcia S. S. Andrade IPTSP/UFGO
MINISTRIO DA SADE Antnio Miguel V. Monteiro DPI/INPE
Secretaria de Vigilncia em Sade Christovam Barcellos CICT/FIOCRUZ
Departamento de Anlise de Situao em Sade Eugnio P. Lisboa CGVS/SMSPOA
Esplanada dos Ministrios, bloco G Lisiane M.W.Acosta CGVS/SMSPOA
Edifcio Sede, 1. andar, sala 134 Maria Cristina de Mattos Almeida SMSA/PBH
CEP: 70058-900, Braslia DF Maria Regina Varnieri Brito CNVANT/SMS/POA
E-mail: svs@saude.gov.br Marilia S Carvalho ENSP/FIOCRUZ
Home page: http://www.saude.gov.br/svs Marina Atanaka dos Santos ISC/UMG
Oswaldo Gonalves Cruz PROCC/FIOCRUZ
Fundao Oswaldo Cruz Reinaldo Souza dos Santos ENSP/FIOCRUZ
Instituto de Comunicao e Informao Rui Flores CGVS/SMSPOA
Cientfica e Tecnolgica em Sade Simonne Almeida e Silva IPTSP/UFGO
Avenida Brasil 4365, Manguinhos, Simone M. Santos CICT/FIOCRUZ
Rio de Janeiro, RJ, CEP 21045-900 Virginia Ragoni M. Correia DPI/INPE
Home page: www.fiocruz.br Wayner V. Souza CpqAM/FIOCRUZ

Reviso Tcnico-pedaggica
Grcia Maria de Miranda Gondim
Coordenao Executiva do projeto Simone M. Santos
Walter Massa Ramalho Reviso de Portugus:
Christovam Barcellos
Itamar Jos de Oliveira
Mnica M. F. Magalhes
Simone M. Santos Ilustrao da capa, Programao Visual e
Direo de Arte:
Vera Lucia Fernandes de Pinho

Fotos da capa:
Peter Ilicciev / Banco de Imagens / Fiocruz

Tratamento de Imagens e Fotografias:


Impresso no Brasil / Printed in Brazil Os autores

Ficha Catalogrfica

Brasil. Ministrio da Sade. Secretaria de Vigilncia em Sade. Fundao Oswaldo Cruz.

Introduo Estatstica Espacial para a Sade Pblica / Ministrio da Sade, Fundao Oswaldo Cruz; Simone M. Santos, Wayner V.
Souza, organizadores. - Braslia : Ministrio da Sade, 2007.
120 p. : il. (Srie B. Textos Bsicos de Sade) (Srie Capacitao e Atualizao em Geoprocessamento em Sade; 3)

ISBN 978-85-334-1427-3

1. Estatstica espacial. 2. Vigilncia em Sade. 3. Anlise espacial. 4. Sade pblica. I. Simone M. Santos (Org.) II. Wayner V. Souza
(Org.) III.Ttulo. IV. Srie.

NLM W 26.55.14

Catalogao na fonte Coordenao-Geral de Documentao e Informao Editora MS OS 2007/1136

Ttulos para indexao:


Em ingls: Spatial Statistics Introduction for Public Health
Em espanhol: Introducin a la Estadstica Espacial en la Salud Pblica
AUTORES

Ana Lcia S. S. Andrade


Mdica, doutora em Sade Pblica, professora titular do Departamento de Sade Coletiva
do Instituto de Patologia Tropical e Sade Pblica da Universidade Federal de Gois.

Antnio Miguel Vieira Monteiro


Engenheiro, doutor em Engenharia da Computao, tecnologista snior da Diviso de
Processamento de Imagens e Coordenador do Programa Espao e Sociedade do Instituto
Nacional de Pesquisas Espaciais.

Christovam Barcellos
Gegrafo, Sanitarista, doutor em Geocincias, pesquisador titular do Departamento de
Informaes em Sade do Centro de Informao Cientfica e Tecnolgica da Fundao
Oswaldo Cruz.

Eugnio P. Lisboa
Mdico, Secretaria Municipal de Sade de Porto Alegre.

Lisiane M.W.Acosta
Enfermeira, especialista em Enfermagem em Sade Pblica, mestranda em Epidemiologia,
profissional da Equipe de Vigilncia das Doenas Transmissveis da CGVS da Secretaria
Municipal de Sade de Porto Alegre.

Maria Cristina de Mattos Almeida


Mdica Veterinria, mestre em Sade Pblica, epidemiologista da Gerncia de Epidemiologia
e Informao da Secretaria Municipal de Sade de Belo Horizonte.

Maria Regina Varnieri Brito


Mdica, especialista em Sade Pblica e em Demografia, mestre em Sade Pblica
(Epidemiologia). Mdica da Equipe de Eventos Vitais e Coordenadora do Ncleo de Vigilncia
de Agravos No Transmissveis da Secretaria Municipal de Sade de Porto Alegre.

Marilia S Carvalho
Mdica, mestre em Sade Pblica, doutora em Engenharia Biomdica, ps-doutorado em
Estatstica, pesquisadora titular do Departamento de Epidemiologia e Mtodos Quantitativos
da Escola Nacional de Sade Pblica Srgio Arouca da Fundao Oswaldo Cruz.

Marina Atanaka dos Santos


Enfermeira, doutora em Sade Pblica, docente do Departamento de Sade Coletiva do
Instituto de Sade Coletiva da Universidade Federal de Mato Grosso.

Oswaldo G. Cruz
Bilogo, mestre em Sade Pblica, doutor em Engenharia Biomdica, pesquisador do
Programa de Computao Cientfica da Fundao Oswaldo Cruz.

Reinaldo Souza dos Santos


Bilogo, doutor em Sade pblica, pesquisador associado do Departamento de Endemias Samuel
Pessoa da Escola Nacional de Sade Pblica Srgio Arouca da Fundao Oswaldo Cruz.

Rui Flores
Mdico, Sanitarista, Secretaria Municipal de Sade de Porto Alegre.

Simone Maria dos Santos (organizadora)


Mdica, especialista em Sade Coletiva, mestra e doutoranda em Sade Pblica
(Epidemiologia), pesquisadora colaboradora do Departamento de Informaes em Sade
do Centro de Informao Cientfica e Tecnolgica da Fundao Oswaldo Cruz.

Simonne Almeida e Silva


Mdica, especialista em Medicina Preventiva e Social mestra e doutora em Medicina
Tropical (Epidemiologia). Professora adjunta do Departamento de Sade Coletiva do Instituto
de Patologia Tropical e Sade Pblica da Universidade Federal de Gois.

Wayner V. Souza (organizador)


Estatstico, mestre e doutor em Sade Pblica, tecnologista snior e docente do
Departamento de Sade Coletiva do Centro de Pesquisas Aggeu Magalhes da Fundao
Oswaldo Cruz
Prefcio

O rpido desenvolvimento de tecnologias para anlise de dados no


espao geogrfico tem oferecido possibilidades inovadoras ao estudo da
situao de sade e de suas tendncias, propiciando melhor compreenso
dos fatores socioeconmicos e ambientais, entre outros, que determinam
as condies de vida e o estado de sade da populao.
A apropriao desse instrumental pelo setor sade sumamente
importante no Brasil, onde acentuadas desigualdades se evidenciam no
apenas entre as grandes regies, os estados e os municpios, mas tambm
no interior destas reas, sobretudo nos espaos urbanos. Sobrepondo-se
ao mosaico de situaes diferenciadas que caracteriza o territrio brasileiro,
as transformaes demogrficas observadas nas ltimas dcadas
potencializam a dinmica de distribuio de doenas e agravos, bem como
de demanda e acesso aos servios.
Tudo isso implica enormes desafios para a organizao e a atuao do
setor sade, impondo crescente necessidade de dados sistematizados e
de informaes para anlise crtica, apresentadas oportunamente e de
forma adequada apreenso e uso pelas instncias decisrias. A
visualizao espacial dos problemas de sade e da forma como eles
evoluem, correlacionadas aos seus determinantes e s medidas de
interveno que so propostas e colocadas em prtica, constitui instrumento
poderoso e complementar a outros modelos de anlise com este fim.
No contexto brasileiro do setor sade, tal propsito envolve considervel
esforo de apropriao das tecnologias disponveis e de desenvolvimento de
estratgias que viabilizem o seu uso, em sintonia com processos de
modernizao gerencial da rea de informao e informtica em sade na
rede de servios. O seu mximo aproveitamento requer mecanismos efetivos
de articulao institucional e intersetorial em todas as esferas do Sistema
Prefcio

nico de Sade (SUS), que promovam a harmonizao de iniciativas e a


mobilizao dos recursos humanos existentes, em torno de objetivos comuns.
Nesse sentido, os ncleos especializados do Ministrio da Sade tm
prestado, de maneira notvel, a contribuio ao seu alcance, exercendo
com denodo e eficincia a funo de desenvolver instrumentos apropriados
e de promover iniciativas de capacitao e atualizao de profissionais do
SUS nas tcnicas de geoprocessamento em sade. Este terceiro livro da
srie representa, portanto, um novo marco importante no processo de
aperfeioar a gesto da sade no Brasil.

Joo Baptista Risi Junior


Consultor da Organizao Pan-Americana de Sade
rea tcnica de Informao para polticas de sade
Apresentao

Para alm dos mapas coroplticos (temticos) o que pretende o livro


Introduo Estatstica Espacial para a Sade Pblica, mostrando ao leitor
os primeiros passos dos pressupostos estatsticos nas abordagens espaciais.
As tcnicas estatsticas apresentadas ampliam as anlises de modo a permitir
a realizao de inferncias e de testes de hipteses geradas pelos
profissionais de sade pblica para responder questes sobre a distribuio
de eventos no seu dia-a-dia.
Esse esforo de traduo da estatstica para uma linguagem acessvel,
pela reduo das notaes e terminologias estatsticas e identificao de
conceitos fundamentais dos pressupostos de uso destas tcnicas, uma
meta direcionada aos profissionais do SUS. A crescente demanda por maior
capacidade analtica dos seus tcnicos, e o desafio de transformao da
exploso de dados disponveis em informaes teis pode ser acompanhada
pelo refinamento das anlises. Essa traduo de linguagem, que no trivial,
foi executada com sucesso graas experincia do corpo autoral desta
publicao. Participam como autores deste volume um grupo de especialistas
(docentes, pesquisadores e tcnicos de servios de sade) envolvido com o
desenvolvimento da rea no Brasil, e que h vrios anos vem utilizando e
propondo tcnicas de anlise espacial aplicadas sade.
Contribuindo nesse esforo, grupos de pesquisadores vm produzindo
Sistemas de Informao Geogrfica com pacotes aplicados anlise espacial,
que apresentam caractersticas animadoras como: a facilidade da interface; a
gerao de bancos de dados geogrficos; a possibilidade de incorporar pequenos
aplicativos denominados de plug-in; e, especialmente o fato de possuir
bibliotecas abertas para desenvolvedores externos. O aplicativo TerraView,
desenvolvido pelo Instituto Nacional de Pesquisas Espaciais, instituio parceira
e atuante na rea, o ambiente computacional de referncia, tambm neste
volume. Como alguns procedimentos ainda no esto disponveis no TerraView,
no momento desta edio, lanou-se mo de outros softwares compatveis e
gratuitos, como o SatScan e o CrimeStat, para execuo de algumas tcnicas.
Apresentao

O primeiro captulo possibilita um passeio introdutrio por conceitos da


Anlise de Dados Espaciais a partir de conceitos da estatstica geral para a
estatstica espacial, de forma suave e encadeada, buscando interagir com o
leitor por meio de exemplos cotidianos da realidade brasileira.
Os dois captulos que seguem tratam de facetas especficas da natureza
cartogrfica da representao das informaes disponveis os pontos e os
polgonos (reas). Os autores abordam as limitaes e as possibilidades de anlise
estatstica espacial adequada aos indicadores, de acordo com sua topologia.
Complementando o contedo terico, trs exerccios dirigidos so
apresentados para a aplicao prtica do aprendizado. Os problemas
abordados tm base na experincia das atividades de Vigilncia em Sade.
Os bancos de dados necessrios para a execuo das anlises propostas
esto disponveis para download no endereo do projeto descrito abaixo.
Ao tratar desta publicao, tentamos contemplar o pblico com uma
apresentao fundamentada em tcnicas estatsticas, focando nas estimaes
e especialmente nas interpretaes. Por meio da adequao da linguagem,
esperamos ter alcanado os objetivos expostos, cativando o leitor e
estimulando suas incurses nesse universo de tcnicas estatsticas. Gostaria
ainda de expressar a grande felicidade na participao em um projeto de
desenvolvimento que toma corpo como uma rede que rene saberes e
especialmente prticas que permitem viabilizar a aplicao dos
desenvolvimentos da geotecnologia sade no Brasil. Assim, como este projeto
de construo permanente, o TerraView est sempre disponibilizando
ferramentas novas (www.dpi.inpe.br), e o projeto de Capacitao e Atualizao
em Geoprocessamento em Sade (www.capacita.geosade.cict.gov.br)
oferecer produtos voltados para aplicaes no setor sade. Participe, entre
em contato, siga os exerccios e boa sorte!

Walter M. Ramalho
Coordenao Executiva do projeto de Capacitao e
Atualizao em Geoprocessamento para a Sade Pblica
Sumrio
Captulo 1: Conceitos Bsicos em Anlise de Dados Espaciais em Sade ... 1 3

1.1 - Estudos Ecolgicos ....................................................................................................... 15

1.2 - Estatstica Espacial ...................................................................................................... 17


Principais Aplicaes ................................................................................................... 20
Tipos de Dados ............................................................................................................ 21
A Pontos ................................................................................................................... 21
B reas ..................................................................................................................... 22
Conceitos Estatsticos Fundamentais ......................................................................... 23
A Dependncia espacial ........................................................................................... 23
B Estacionariedade .................................................................................................... 25

Captulo 2: Anlise de Dados em Forma de Pontos ..................................... 29

2.1 - Princpios de Anlise Espacial de Eventos com Representao por Pontos .................. 31

2.2 - Anlise Espacial de Eventos .......................................................................................... 33


Visualizao de Dados Espaciais ................................................................................ 33
Anlise Exploratria de Dados Espaciais ..................................................................... 33
Modelagem de Dados Espaciais .................................................................................. 33

2.3 - Anlise de Padres de Dados com Representao por Pontos .................................... 34

2.4 Anlises Baseadas na Distncia entre Pontos .............................................................. 38


Anlise de Aglomerados Hierrquicos ........................................................................... 39
A Distncia limiar ...................................................................................................... 40
B Nmero mnimo de pontos ..................................................................................... 41
C Tamanho da elipse ................................................................................................ 41

2.5 Anlise da Densidade de Pontos .................................................................................. 44

2.6 - Avaliao de Aglomerados considerando a Distribuio da Populao .......................... 48


Deteco de Aglomerados pelaTcnica Estatstica Scan ............................................. 51
Estimativa Kernel considerando a Populao ............................................................... 54

2.7 - Interpolao de Dados Pontuais .................................................................................... 56


Sumrio

Captulo 3: Anlise Espacial de Dados de reas .......................................... 61

3.1 - Mtodos para Espacializao e Tratamento Estatstico de Indicadores ........................... 63


Instabilidade em Pequenas reas ................................................................................. 63
Matriz de Vizinhana .................................................................................................... 65

3.2 - Mtodos de Suavizao Espacial .................................................................................... 66


Mdia Mvel Espacial ................................................................................................... 66
Estimador Bayesiano Emprico ...................................................................................... 66
Autocorrelao Espacial ................................................................................................ 69

3.3 - Anlise da Estrutura Espacial ......................................................................................... 71


Anlise da Estrutura Espacial - Estatstica de Moran ..................................................... 71
Anlise da Estrutura Espacial - Estatstica-Funo LISA ................................................ 72
Anlise da Estrutura Espacial - Mtodos Inteiramente Bayesianos ................................ 73
Anlise da Estrutura Espacial - Mtodo de Markov Chain-Monte Carlo .......................... 75

3.4 - Tcnicas de Anlise de Dados Pontuais Aplicadas a reas ............................................. 78

Anexos: Exerccios ......................................................................................... 83

Exerccio 1: Vigilncia e ateno sade de gestantes HIV positivas: construo de


indicadores com operaes entre camadas ...................................................... 85

Exerccio 2: Distribuio dos acidentes de trnsito em Belo Horizonte, MG. ........................ 97

Exerccio 3: Anlise espacial da distribuio de casos de malria no Estado de


Mato Grosso em 2000 e 2003 ......................................................................... 105

Referncias Bibliogrficas ......................................................................... 117

Links teis para download de aplicativos recomendados .......................... 1 1 9


1

Conceitos Bsicos
em Anlise de
Dados Espaciais
em Sade

Marilia S Carvalho

Oswaldo G. Cruz

Wayner V. Souza

Antnio Miguel V. Monteiro


Captulo 1:
Conceitos Bsicos em Anlise de Dados Espaciais em Sade

1.1 - Estudos Ecolgicos


pg. 15

1.2 - Estatstica Espacial


pg. 17

Principais Aplicaes
pg. 20
A- Pontos
Tipos de Dados
pg. 21 B- reas

Conceitos Estatsticos A- Dependncia espacial


Fundamentais pg. 23 B- Estacionariedade

14
1.1 - Estudos Ecolgicos

O estudo dos padres de distribuio geogrfica das doenas e suas


relaes com fatores socioambientais constitui-se no objeto do que hoje
chamamos de Epidemiologia Geogrfica, que tem se constitudo em campo
de aplicao e desenvolvimento de novos mtodos de anlise. Esse
desenvolvimento tem sido viabilizado pela crescente disponibilidade e
desenvolvimento de tcnicas e recursos de computao eletrnica, que tambm
tornou possvel o desenvolvimento de Sistemas de Informaes Geogrficas
com base na cartografia digital, que vm sendo utilizados em anlise de dados
espaciais em sade.
As tcnicas de anlise espacial se adequam s necessidades dos estudos
ecolgicos, que utilizam reas geogrficas como unidade usual de observao.
No caso particular da anlise espacial da ocorrncia de doenas, onde se
dispe de dados referidos a uma rea geogrfica, deve-se dar ateno especial
ao pressuposto bsico de que taxas e indicadores epidemiolgicos de uma
doena, calculados para um determinado perodo, so uma nica realizao
de um processo que probabilstico e que se procura identificar.
A opo por estudos epidemiolgicos do tipo ecolgico pode ser logicamente
adequada para o entendimento da variao do risco de adoecer entre diferentes
grupos populacionais. A correta compreenso das dimenses envolvidas nos
estudos de nvel ecolgico e de nvel individual, alm das relaes entre eles,
possibilita explorar o potencial da abordagem ecolgica em sade pblica,
mediante o emprego de ferramentas de anlise apropriadas que permitam
controlar possveis fatores de confuso e evitar vieses de anlise,
principalmente os clssicos, como os de produzir inferncias cruzadas, ou
seja, de um nvel para outro.
Inferncias enviesadas sero produzidas no s quando se extrapolam
resultados do nvel ecolgico para o individual (falcia ecolgica), mas tambm
quando ocorre o oposto, do nvel individual para o ecolgico (falcia atomstica),
desconsiderando-se os efeitos de grupo. Apesar de no se dever considerar
essas duas abordagens como antagnicas, a anlise da variabilidade do
risco no nvel ecolgico fundamental para a compreenso dos determinantes
sociais e ambientais do processo sade-doena, onde, particularmente, a
condio socioeconmica dos grupos populacionais desempenha papel
preponderante na explicao das condies de sade desses grupos. Nesse
sentido, uma importante abordagem do ponto de vista ecolgico considerar
o espao como fator multidimensional de estratificao de populaes, o que

15
CAPTULO 1 - Conceitos Bsicos em Anlise de Dados Espaciais em Sade

permite visualizar espacialmente, de forma articulada, as distribuies da


doena e do risco, entendido como situao coletiva e definido sob
diferentes abordagens. Alm disso, pode propiciar ao Sistema de
Vigilncia em Sade Pblica compreender a dinmica e identificar
diferenas e causas das diferenas na ocorrncia das doenas nos
diversos subconjuntos da populao.

QUADRO 1.1 Classificao dos Estudos Epidemiolgicos

TIPO POSIO DO INVESTIGADOR REFERNCIA TEMPORAL DENOMINAO

Transversal Estudos Ecolgicos


Observacional
Agregado Longitudinal Estudos de tendncia ou Sries Temporais

Interveno Longitudinal Ensaios comunitrios

Transversal Inquritos

Observacional Estudos Prospectivos (Coorte)


Individual Longitudinal
Estudos Retrospectivos (Caso-Controle)

Interveno Longitudinal Ensaios Clnicos

Essa abordagem possibilita no s a vigilncia dos indivduos de risco,


mas tambm uma viso antecipada do risco coletivo, coerentemente com o
entendimento de que as conseqncias dos processos endmicos e das
intervenes de sade pblica nos vrios grupos sociais devem ser analisadas
a partir de uma perspectiva ecolgica. Tal perspectiva deve considerar a
dinmica evolutiva dos processos sociais e buscar identificar causas da
incidncia das doenas em grupos populacionais e no as causas da doena
no indivduo. Cada vez mais, trabalhos vm sendo desenvolvidos utilizando
uma abordagem espacial e produzindo anlises integradas da associao
dos eventos de sade com indicadores e/ou variveis socioambientais, com
vistas a suprir as necessidades de um Sistema de Vigilncia em Sade.
As fontes de informao para essas variveis e as abordagens para
construo desses indicadores, principalmente aqueles capazes de medir
ndices de carncia social, variam e vm sendo objeto de estudos e debates
que podem contribuir para superar desigualdades e iniqidades em sade.
Em muitos casos essas informaes so provenientes dos censos
demogrficos, disponibilizadas no nvel dos setores censitrios, possibilitando
anlises para este nvel ou nveis mais agregados, como bairros, distritos e
municpios. No caso dos indicadores ambientais especificamente, as
informaes so obtidas junto a institutos municipais ou estaduais de meio

16
1.1 - Estudos Ecolgicos

ambiente ou planejamento urbano, oriundas de levantamentos de campo,


levantamentos areos ou de imagens de satlite.
A ttulo de exemplo, apresentamos na figura 1.1, um mapa temtico
representando as taxas mdias de incidncia de tuberculose, segundo setores
censitrios do Municpio de Olinda-PE, para o perodo 1996-2000 e outro
representando a mdia de moradores por domiclio, para estes mesmos
setores censitrios de Olinda, segundo o Censo Demogrfico de 2000.

FIGURA 1.1 Olinda: taxa mdia de incidncia de tuberculose no perodo 1996-2000, e mdia de moradores por domiclio em 2000,
segundo setores censitrios.

Tuberculose - Olinda Olinda - Censo Demogrfico 2000


N N

Incidncia 1996-2000 Moradores por Domiclio


0 42.2 2.1 3.1
42.2 86.0 3.1 3.4
86.0 142.2 3.4 3.6
142.2 215.9 3.6 3.8
215.9 390.1 3.8 4.2
Setores Censitrios Setores Censitrios

2 0 2 4 Kilometers 2 0 2 4 Kilometers

Fontes: SINAN e Censo Demogrfico 2000 - IBGE.

Pode-se observar, mesmo que apenas por inspeo visual, uma coincidncia
entre vrios setores com altas taxas de incidncia e altas concentraes de
moradores por domiclio. Essa associao espacial entre o indicador escolhido
e a incidncia de tuberculose no casual, dado que altas mdias de
moradores por domiclio apontam para carncia social, alm de se constituir
em fator facilitador da transmisso da doena.

1.2 Estatstica Espacial

Denomina-se estatstica espacial o ramo da estatstica que permite


analisar a localizao espacial de eventos. Ou seja, alm de identificar,
localizar e visualizar a ocorrncia de fenmenos que se materializam no
espao, tarefas possiblitadas pelo uso dos SIG, utilizando-se a estatstica
espacial possvel modelar a ocorrncia destes fenmenos, incorporando,
por exemplo, os fatores determinantes, a estrutura de distribuio espacial
ou a identificao de padres.
17
CAPTULO 1 - Conceitos Bsicos em Anlise de Dados Espaciais em Sade

SNOW

Londres, 1854. Regio sul, subdistrito de St. Saviour em Southwark.


Localidade, parquia de Christchurch. Entre os dias 9 de julho e 5 de
agosto. Livro de Registros Gerais.

1. n. 34, Charlotte Street, 29 de julho, um coronheiro, 29 anos, Clera


Asitica, 18 horas. Atendimento de gua feito por Lambeth Water
Company.
2. n. 45, Gravel Lane, 1 de agosto, a viva de um fazendeiro, 48 anos,
Clera, 12 horas. Atendimento de gua feito por Southwark and
Vauxhall Company.
3. n. 1, Alpha Place, 1 de agosto, o escrevente de um advogado, 57
anos, Clera, 24 horas. Atendimento de gua feito por Southwark
and Vauxhall.
4. ...

Ver o debate do Lancet, June 23, 1855, reproduzido em:

http://www.ph.ucla.edu/epi/snow/reactionandcommitteeaction.html.

Se tomarmos o exemplo descrito no Box acima, v-se que o mdico ingls


John Snow, reconhecendo que os casos de clera ocorriam em certas
localizaes, fez uso direto dos mapas de Londres (Figura 1.2). Ele localizou
os casos encontrados no registro de bitos, utilizando o endereo das
residncias e os poos de proviso de gua existentes naquelas ruas. Se
fosse hoje, John Snow s publicaria os resultados de seu estudo e fecharia a
bomba de gua de Broad Street (Figura 1.3), se pudesse comprovar
estatisticamente que esta bomba era responsvel pela propagao da
epidemia de clera. (ver o site http://www.ph.ucla.edu/epi/snow.html)

FIGURA 1.2 Mapa do Clera Soho, FIGURA 1.3 Bomba de gua de Broad
Londres. Street, Londres.

Que tipo de estatstica deveria ser


usada?

As tcnicas estatsticas mais usadas (por


exemplo, o teste chi-quadrado), so
baseadas em pressupostos que
dificultam, ou mesmo impedem, seu uso
quando a pergunta relaciona-se a
problemas onde a localizao espacial
relevante.

Essas so as questes de fundo que


iremos abordar neste livro.

18
1.2 - Estatstica Espacial

Usamos a estatstica nos estudos em sade para modelar a realidade.


Modelos so simplificaes da realidade usadas para entender um sistema,
estudar seu funcionamento, buscar causas de fenmenos, avaliar intervenes,
prever desfechos. Segundo Box (1979) todos os modelos esto errados,
alguns modelos so teis, ou seja, no existe modelo certo, mas modelos
que servem a algum propsito.
Quando ento so teis os modelos estatsticos na anlise espacial?
Quando queremos estudar a sade e os fatores relacionados sade no
contexto ambiental. A idia entender, estimar e modelar como esse contexto
afeta a sade das pessoas, seja o contexto derivado de fatores
socioeconmicos, da oferta de servios de sade, do ambiente fsico ou cultural.
Sem medir esses contextos, nem padro de mortalidade e morbidade, nem o
espalhamento epidmico, ou o risco de uma fonte de contaminao ambiental
podem ser explicados e ter seu efeito estimado.
A denominao estatstica espacial surge em oposio s tcnicas
estatsticas comuns nos estudos em sade testes do tipo chi-quadrado,
regresso mltipla, anlise de aglomerados, por exemplo quando se
necessita focalizar explicitamente a localizao espacial, quando necessrio
considerar a possvel importncia de seu arranjo espacial na anlise e
interpretao de resultados. Isso porque um dos pressupostos mais gerais
na estatstica, que permite estimar diversas estatsticas o da independncia
entre as observaes: o que se mede em um indivduo no est associado ao
medido em outro indivduo, exceto pelos possveis fatores comuns que
desejamos exatamente descobrir.

O teste Chi-Quadrado (ler qui-quadrado) nos diz em que medida os valores


observados de duas variveis categricas se desviam do valor esperado,
caso as duas variveis no estivessem correlacionadas. Quanto maior o
chi-quadrado, mais significante a relao entre as duas.

A regresso linear um mtodo para se estimar o valor esperado de


uma varivel dependente dado o valor de um varivel independente.
chamada linear porque se considera que a relao da resposta s
variveis uma funo linear de alguns parmetros. Quando se ajusta
para mais de uma varivel independente chamada regresso mltipla.

Na anlise de aglomerados, freqentemente chamada de anlise de


cluster, o objetivo separar um conjunto de objetos em grupos conforme
um padro de similaridade, medida a partir de um conjunto de variveis.
Esse padro de similaridade estabelecido em um espao n-
dimensional dado pelas variveis medidas para cada observao.

19
CAPTULO 1 - Conceitos e Arquitetura de Sistemas de Informaes Geogrficas

Entretanto, quando olhamos para o espao, esse pressuposto pouco


realstico, pois todas as coisas so parecidas, mas coisas mais prximas se
parecem mais que coisas mais distantes (Tobler, 1979). Esse simples fato,
que todos conhecemos, tem implicaes diretas para abordagem quantitativa
baseada na teoria e tcnicas estatsticas que aplicamos usualmente sobre
nossas observaes. Por uma razo muito simples, e que s vezes
esquecemos: as tcnicas de anlise estatstica no-espaciais que utilizamos
para nossos dados tm como pressuposto fundamental que as observaes
em anlise representam pedaos de evidncia independentes sobre as
associaes que estamos descrevendo e modelando.
Ou, generalizando, a maior parte das ocorrncias, sejam estas naturais ou
sociais, se relacionam, seja em sinergia ou antagonismo, e esta relao se
enfraquece com a distncia. E esta a especificidade deste ramo da estatstica:
tcnicas que permitem modelar os fenmenos cuja distribuio afetada pela
sua localizao geogrfica e pela sua relao com seus vizinhos.

Principais Aplicaes

As principais reas de aplicao da estatstica espacial so o mapeamento


de doenas, os estudos ecolgicos, a identificao de aglomerados espaciais
(cluster) e o monitoramento de problemas ambientais.
O mapeamento de doenas consiste na descrio do processo de
distribuio espacial, visando a avaliar a variao geogrfica na sua ocorrncia
para identificar diferenciais de risco, orientar a alocao de recursos e levantar
hipteses etiolgicas. Os mtodos tm como objetivo produzir um mapa limpo,
sem o rudo gerado pela flutuao aleatria dos pequenos nmeros, e
controlando as diferenas na estrutura demogrfica.
Os estudos ecolgicos visam a estudar a relao entre incidncia de
doenas e potenciais fatores etiolgicos, que expliquem as diferenas na
incidncia de determinado evento de sade. Do ponto de vista estatstico,
esses estudos consistem, essencialmente, em modelos de regresso,
onde se busca explicar a variao na incidncia da doena por meio de
outras variveis. O modelo estatstico se complica pela necessidade de
controlar, simultaneamente, o processo espacial, variveis explicativas e
variveis de confuso.
Um cluster espacial : qualquer agregado de eventos que no seja
meramente casual, cuja identificao foco de pesquisas na rea de
estatstica espacial. Estes aglomerados podem ser causados por diferentes
fatores, tais como agentes infecciosos, contaminao ambiental localizada,
efeitos colaterais de tratamentos, cada problema destes com peculiaridades
e tcnicas particulares.

20
1.2 - Estatstica Espacial

A avaliao e monitoramento ambiental visam a estimar a distribuio


espacial de fatores ambientais relevantes para a sade, acompanhando
potenciais fontes ambientais de problemas de sade, tais como poluentes
qumicos, insolao (Raios UV), vegetao, clima, entre outros. Nesse caso,
em geral, os modelos estatsticos tm por objetivos fazer a predio espacial
ou espao-temporal de processos com forte correlao espacial e temporal.
Esse tipo de tcnica no ser objeto deste livro.

Tipos de Dados

Da mesma forma que o SIG tem diferentes funes dependendo do tipo de


dado, algumas tcnicas estatsticas so mais apropriadas para um ou outro
tipo de dado. Basicamente, so dois tipos que utilizamos: (A) dados que so
atributos de pontos, ou (B) dados atributos de reas.

A Pontos

O tipo mais simples o dado de ponto. Nesse caso temos a localizao


pontual (coordenadas) de algum evento, o mais comum o da residncia de
um caso de doena. importante observar que o que aleatrio, ou seja, o
que ser analisado estatisticamente, a localizao. A pergunta associada a
esse tipo de dado sempre o ONDE, mesmo quando outras co-variveis do
indivduo so medidas.
O melhor exemplo novamente a investigao da epidemia de clera em
Londres, 1854. John Snow localizou as residncias de cada caso de clera, a
idade, profisso e outras variveis de interesse, e, mais importante, a fonte da
gua utilizada e a localizao dos locais de captao de cada companhia.
Suponhamos ento que fossemos ns a fazer a pesquisa.
Duas perguntas so importantes. A primeira busca analisar a distribuio
espacial dos casos de clera, verificando se esto distribudos
homogeneamente na cidade, ou ao contrrio, concentram-se em alguns locais
em detrimento de outros. Vale lembrar que na poca a teoria miasmtica era
dominante, com suporte do Dr. William Farr, que publicou estudo atribuindo
aos locais mais baixos, onde os miasmas se concentram, as maiores taxas
de mortalidade por clera.
A segunda pergunta busca estimar o efeito de cada companhia de gua
sobre a mortalidade. Esse foi um dos aspectos analisados que de fato definiu
os rumos da pesquisa. Se fosse hoje, poderamos analisar simultaneamente
a localizao geogrfica e a companhia de gua, o que no era possvel na
poca. John Snow considerou que os casos eram amostras independentes, o
que no to verdadeiro. Clera tambm se transmite de pessoa a pessoa,
diretamente ou atravs de objetos contaminados, embora a magnitude da
contaminao pela gua seja muito maior.
21
CAPTULO 1 - Conceitos e Arquitetura de Sistemas de Informaes Geogrficas

As tcnicas de anlise de dados de pontos sero abordadas no Captulo 2.

B reas

Outro tipo de dado o proveniente de reas geogrficas com limites


definidos, usualmente divises poltico-administrativas. So as contagens
de casos ou bitos de alguma doena ou os indicadores provenientes do
censo demogrfico.
importante observar a escala em que esses dados so coletados e
analisados. Em geral, quanto maior a rea geogrfica, mais misturada a
populao onde ocorre o processo em estudo. Municpios, muito
freqentemente, so compostos por diferentes populaes, com diferentes
caractersticas e riscos sade, por exemplo, englobando populaes rurais
e urbanas, diferentes nveis sociais, acesso a servios de sade ou problemas
ambientais. No outro extremo, os setores censitrios tm populao mais
semelhante do ponto de vista socioeconmico e demogrfico. Ou seja, a
capacidade de diferenciar geograficamente regies diminui com o tamanho
da rea e respectiva populao residente.
Entretanto, quando consideramos pequenas reas, a disponibilidade do
dado comea a ser mais complicada. Informaes socioeconmicas por setor
censitrio so obtidas facilmente, mas contagens de bitos j so de obteno
mais difcil. Alm disso, quanto menor a rea, mais raros so os eventos
Flutuao aleatria dos indicadores observveis, o que origina excessiva flutuao aleatria dos indicadores e
todos os problemas da decorrentes.
Como o prprio nome indica, significa
que o indicador est variando Dados de reas so os mais analisados na rea da sade, embora tenham
aleatoriamente, sem qualquer padro sua importncia freqentemente subestimada por receio da denominada
explicvel. Ou seja: se em uma rea falcia ecolgica, que pode ser definida como uma tentativa de estimar
rural nasceram 5 crianas em um dado associaes entre indivduos a partir de dados agregados. Por exemplo, ao
ano e uma faleceu no primeiro ano de
analisar o problema dos atropelamentos, observamos que as taxas so
vida, a mortalidade infantil seria 1/5, ou
maiores nos municpios mais ricos. Nunca poderamos concluir que os
seja, 200 por 1000 nascidos vivos.
indivduos mais ricos que so atropelados, o que no seria verdade, mas
Entretanto, um epidemiologista sensato,
antes de divulgar nmero to grave, sim, que nos municpios mais ricos, h mais carros, e estes atropelam os
lembraria que entre 5 recm-natos, um pedestres, que so em geral crianas dos estratos mais pobres da populao.
bito pode ser simplesmente ocasionado Entretanto, tambm modelos em nvel individual podem ser mal
por algum acaso, no sendo justo julgar especificados. Cabe ressaltar que existem dois tipos de perguntas etiolgicas.
as condies de sade do municpio
A primeira busca as causas dos casos, e a segunda as causas da incidncia,
somente por este dado. Porque
sendo rara a doena cuja taxa de incidncia no tenha variado largamente,
populao no denominador do indicador
seja ao longo do tempo ou entre populaes. As tcnicas de anlise de dados
muito pequena, o estimador fica
instvel, flutua aleatoriamente. de reas sero apresentadas no Captulo 3.
H uma terceira situao que so os pontos de localizao de amostras,
muito utilizados na anlise Geoestatstica. Nesse caso, o dado uma medida
obtida em um ponto do espao amostrado, portanto, apesar de ser atribuda

22
1.2 - Estatstica Espacial

ao ponto, a informao do dado referente rea amostrada (geralmente um


espao contnuo, sem delimitao explcita). Esse ponto, alm de uma
coordenada geogrfica, possui um atributo na forma de um valor medido. Por
exemplo, um ponto de coleta meteorolgica onde temos uma amostra de
variveis que ocorrem de uma forma contnua, amostradas num determinado
ponto. Esse tipo de dado o mais freqentemente utilizado em variveis
ambientais. As tcnicas mais usuais na anlise desse tipo de dados so voltadas
para a predio espacial, ou seja, para estimar valores da varivel em locais
onde no houve medida a partir das mensuraes feitas. Uma das tcnicas
mais utilizadas para a predio denominada krigagem. Neste livro no iremos
abordar esse tipo de tcnica. Para maiores detalhes ver Cmara et al., 2004.

Conceitos Estatsticos Fundamentais

Ainda que cada um desses objetivos deva ser tratado com tcnicas
estatsticas especficas, alguns conceitos estatsticos fundamentais definem
os problemas metodolgicos tratados pela estatstica espacial. O
entendimento da noo de: (A) dependncia espacial e (B) estacionariedade,
orientam a identificao de pressupostos a serem assumidos por diferentes
tcnicas estatsticas.

A Dependncia espacial

O primeiro destes conceitos a noo de dependncia espacial e sua


quantificao atravs de funes como a de autocorrelao espacial.

A Autocorrelao espacial uma medida geral da associao espacial


existente no conjunto dos dados. Seu valor varia de 1 a 1. Valores
prximos de zero, indicam a inexistncia de autocorrelao espacial
significativa entre os valores dos objetos e seus vizinhos. Valores positivos
para o ndice, indicam autocorrelao espacial positiva, ou seja, o valor
do atributo de um objeto tende a ser semelhante aos valores dos seus
vizinhos. Valores negativos para o ndice, por sua vez, indicam
autocorrelao negativa.

Correlograma uma representao grfica da autocorrelao, em funo


da distncia, ou seja, indicando em que medida cada dado em uma
determinada distncia se relaciona com os demais dados.

Os mtodos bsicos aqui so voltados para obter evidncias da estrutura


de dependncia espacial, ou seja, autocorrelao espacial que uma medida
da estrutura de Dependncia Espacial. Caso haja evidncia de estrutura
espacial, o postulado de independncia das amostras, base da maior parte
dos procedimentos de inferncia estatstica, invlido, sendo necessrio
levar em conta, explicitamente, o espao na formulao e estimativas dos
modelos estatsticos.
23
CAPTULO 1 - Conceitos e Arquitetura de Sistemas de Informaes Geogrficas

Dados espaciais no formam um conjunto de amostras independentes.

Uma importante diferena em relao a dados sem essa peculiaridade


que cada observao no traz uma informao independente, e o conjunto
de todas as observaes utilizado integralmente para descrever o
padro do fenmeno estudado.

O correlograma uma representao grfica das autocorrelaes de um


conjunto de dados em uma determinada distncia.

FIGURA 1.4 Autocorrelao Espacial.

Minas Gerais
auto-correlao

Esprito
Santo
So Paulo

Rio de Janeiro

distncia

Pode-se notar na figura 1.4 que a autocorrelao nos quatro estados da


regio sudeste apresentam diferentes padres. No RJ a autocorrelao decai
rapidamente, na medida que a distncia aumenta, em SP a autocorrelao
decai mais lentamente, no ES a autocorrelao decai voltando a subir, fato que
pode ser interpretado pela existncia de cluster locais, ou ainda o pequeno
nmero de municpios existente nas maiores distncias do correlograma. O
estado de MG apresenta um padro de correlao prximo a zero, ou seja,
aparentemente existe uma completa aleatoriedade espacial.
Duas questes estatsticas devem levar em considerao a presena de
dependncia espacial: a identificao de padres espaciais e a anlise do
efeito de algum fator de risco sobre um desfecho controlando para a localizao
geogrfica. Para a identificao de padres espaciais (Figura 1.5), precisamos
estimar a presena, forma e intensidade da dependncia espacial. Diversos
mtodos foram desenvolvidos para essa finalidade, entre os quais
apresentaremos alguns testes para verificar afastamentos da completa
aleatoriedade espacial, outros que permitem identificar fontes suspeitas de
risco sade, e outros ainda que localizam as regies com concentrao de
casos acima de um valor esperado.

24
1.2 - Estatstica Espacial

Espacialmente aleatria qualquer ocorrncia cuja distribuio espacial


no apresente qualquer padro espacial detectvel. Observe os grficos abaixo.
No primeiro, os pontos esto distribudos aleatoriamente. No segundo esto
aglomerados (clusterizados), e no terceiro distribudos de forma regular, ou
seja, no aleatria.

FIGURA 1.5 Padres de distribuio espacial de pontos.

Aleatrio Aglomerado Regular

Para a anlise de efeito, o que se est discutindo qual seria o efeito da


presena de dependncia espacial ao fazer, por exemplo, um modelo de
regresso linear mltipla. Suponhamos, por exemplo, um estudo onde se
deseja estimar o efeito da densidade demogrfica sobre a taxa de homicdios
em cada municpio da Regio Sudeste. Um modelo simples de regresso
permitiria estimar essa relao, se considerssemos que a ocorrncia da
violncia em cada municpio independe dos demais. S que no . Ignorar
essa dependncia levar a superestimar o efeito da varivel independente,
pois cada municpio analisado contm menos informao do que em situao
de independncia. Na verdade, no considerar essa questo pode afetar
seriamente os resultados obtidos de qualquer modelo estatstico.

B Estacionariedade

O outro conceito fundamental denominado estacionariedade. Se a mdia


do processo cuja ocorrncia espacializada estudamos no aproximadamente
constante em toda a regio, dizemos que o processo no apresenta
estacionariedade de primeira ordem. Esse conceito fica mais claro quando
pensamos em uma srie temporal: quando a mdia aumenta (ou diminui) ao
longo do tempo, dizemos que h uma tendncia a aumentar (ou diminuir). No
espao a mesma idia. Apenas, em vez de termos uma linha no tempo,
temos uma superfcie no espao.
Observe que pode ser difcil avaliar a estacionariedade, pois a flutuao
aleatria usual dificulta a visualizao (Figura 1.6). Porm identificar esta

25
CAPTULO 1 - Conceitos e Arquitetura de Sistemas de Informaes Geogrficas

questo importante, no s porque afeta os estimadores estatsticos, mas


principalmente porque esta variao da mdia no espao pode ser importante
para a sade pblica.

FIGURA 1.6 Exemplos de anlise da estacionariedade numa Srie Temporal.

A B

A No estacionariedade de 1 ordem.
Varincia constante.
Mdia varia no processo.

B No estacionariedade de 2 ordem.
Varincia diferente ao longo do processo.
Mdia constante.

C Estacionrio.
Varincia e Mdia so constantes.

Vimos a no estacionariedade de primeira ordem, ou seja, a mdia variando


no espao. Porm, da mesma forma que ao longo do tempo a varincia pode
ser no estacionria, ou seja, no temos estacionariedade de segunda ordem.
Nesse caso, a variabilidade em determinadas regies difere. Usualmente,
temos estacionariedade de primeira e segunda ordem, pois quando a mdia
no varia, tambm a varincia na sub-regio se mantm.

26
1.2 - Estatstica Espacial

At agora conceituamos estacionariedade de forma muito similar s sries


temporais. Porm h um aspecto que exclusivo da estatstica espacial: a
isotropia (Figura 1.7). Um processo isotrpico quando seu comportamento
igual em todas as direes. Ou seja, quando a dependncia espacial igual
na direo Norte-Sul ou Leste-Oeste. Um exemplo de processo anisotrpico
a densidade populacional do Brasil. A diminuio de densidade na direo
Leste-Oeste, ou em direo ao interior do pas, mais intensa do que quando
se caminha na direo do Sul ao Norte. A fora da dependncia espacial decai
mais rapidamente nesse eixo do que acompanhando o litoral.

FIGURA 1.7 Isotropia e Anisotropia.

Os conceitos apresentados neste captulo descreveram um conjunto bsico


de propriedades inerentes aos dados espaciais que de acordo com suas
caractersticas fazem com que devam ser analisados de forma diferenciada.
Nos prximos captulos sero apresentadas algumas das principais tcnicas
que podem ser aplicadas na anlise de dados espaciais em sade.

27
2

Anlise de Dados
em Forma de Pontos

Christovam Barcellos

Simonne Almeida e Silva

Ana Lcia S. S. de Andrade


Captulo 2:
Anlise de Dados em Forma de Pontos

2.1 - Princpios de Anlise Espacial de


Eventos com Representao por Pontos pg. 31

2.2 - Anlise Espacial de Eventos


pg. 33

Visualizao de Dados Espaciais


pg. 33

Anlise Exploratria de Dados


Espaciais pg. 33

Modelagem de Dados Espaciais pg. 33

2.3 - Anlise de Padres de Dados


com Representao por Pontos pg. 34

2.4 - Anlises Baseadas na


Distncia entre Pontos pg. 38

A- Distncia limiar
Anlise de Aglomerados Hierrquicos B- Nmero mnimo de pontos
pg. 39
C- Tamanho da elipse

2.5 - Anlise da Densidade de Pontos


pg. 44

2.6 - Avaliao de Aglomerados


considerando a Distribuio da Populao pg. 48

Deteco de Aglomerados
pelaTcnica Estatstica Scan pg. 51

Estimativa Kernel considerando a


Populao pg. 54

2.7 - Interpolao de Dados Pontuais


pg. 56
2.1 Princpios de Anlise Espacial de Eventos
com Representao por Pontos

Uma das formas mais tradicionais de se elaborar mapas de interesse para


a Sade Pblica a representao de eventos de sade em forma de pontos.
O uso de pontos para localizao de eventos, no momento da construo da
base de dados geogrfica e durante o procedimento de anlise, minimiza
problemas associados com as barreiras impostas pela delimitao de reas
administrativas artificiais.
A aplicao de anlise de padro de pontos, assim como dos mtodos
baseados em SIG, oferecem uma grande flexibilidade para delinear a
distribuio espacial dos eventos comparado com as abordagens tradicionais
da epidemiologia, que requerem delimitaes de reas usualmente
arbitrrias. A localizao pontual de eventos fundamental para possibilitar a
avaliao de seu padro espacial sem a necessidade de unidade de
agregao de rea predeterminada.
O exemplo mais tradicional desse tipo de abordagem o mapa da clera
em Londres feito por John Snow. Recordando as hipteses dessa
investigao, era preciso mostrar que as mortes por clera se concentravam
em torno do poo de gua da Broad Street (Figura 2.1). O mapa bastante
evidente e foi fcil mostrar essa associao entre gua e clera. Mas em
diversos outros casos do nosso dia-a-dia de Vigilncia em Sade, o padro
espacial dos pontos no to claro e precisamos usar tcnicas de anlise
espacial para demonstrar e testar os padres.

Durante a epidemia de clera na Inglaterra de 1850 a 1860, John


Snow produziu diversos mapas para avaliar sua hiptese sobre a
t r a n s m i s s o d a c l e r a ( S n o w, 1 9 9 9 ) . U m d o s m a pa s m a i s
conhecidos mostra poos de abastecimento de gua e as
residncias de pessoas que morreram por clera num bairro de
Londres. O mapa mostra uma concentrao de pontos que
representam mortes por clera, demonstrando um padro de
distribuio espacial. medida que se afasta do centro do mapa,
diminui a concentrao desses pontos. No centro do mapa existe
uma maior densidade de pontos que na periferia. Esse padro
pode indicar a presena de uma fonte comum de exposio.
CAPTULO 2 - Anlise de Dados em Forma de Pontos

FIGURA 2.1 Localizao de poos de gua e mortes por clera em Londres 1854
(Baseado em Snow, 1999).

Os eventos em sade so ocorrncias que tm um interesse especial para


a Vigilncia em Sade e que, em geral, tm uma dimenso espacial, isto ,
podem ser representados em mapas como pontos. Os acidentes de trnsito,
casos de sarampo, internaes por algum agravo que pode ser usado como
evento sentinela, todos estes eventos podem ser representados nos mapas
como pontos. Se esses eventos estiverem concentrados no espao bem
provvel que exista uma determinao espacial deste evento e que encontrando
os locais com maior concentrao, temos uma pista para identificar fatores
ambientais, sociais ou ligados prpria assistncia sade que podem ser
objeto de ao da Vigilncia em Sade.
Devemos lembrar que esses eventos nem sempre precisam ser
negativos. Poderamos dispor em um mapa os pontos que representam o
endereo de crianas que foram vacinadas. Onde os pontos estiverem mais
concentrados pode indicar reas onde a cobertura da vacinao est melhor.
Se tivermos uma lista de endereos de Organizaes No-governamentais
(ONG) que atuam na promoo de sade e colocarmos estes dados no
mapa, podemos obter pontos indicando onde estas ONG desenvolvem
atividades. Os locais com maior concentrao de pontos podem representar
reas melhor trabalhadas.

32
2.1 - Princpios de Anlise Espacial de Eventos com Representao por Pontos

No caso do John Snow e de outros em que os pontos representam eventos,


podemos utilizar tcnicas de anlise exploratria de dados espaciais (ESDA)
para avaliar a distribuio dos pontos no espao. A anlise espacial de eventos
deve ser realizada levando-se em conta os trs grupos de mtodos: (a)
visualizao; (b) explorao; e, (c) modelagem (Bailey e Gatrell, 1995).

2.2 Anlise Espacial de Eventos

Visualizao de Dados Espaciais

O principal objetivo da visualizao de dados espaciais verificar a


demonstrao grfica de dados para avaliar padres especficos de
distribuio. O mapa o modo classicamente usado para visualizar esses
dados. Com o advento de ferramentas de SIG, essa abordagem se transformou
em algo relativamente rpido, simples e interativo. Dados pontuais, por exemplo,
podem ser apresentados em mapas de pontos, da mesma forma como mapas
temticos (coroplticos) podem ser utilizados para a visualizao de dados de
rea. O mapa de John Snow um bom exemplo de um instrumento de
visualizao de dados espaciais. Naquele caso no foi utilizada nenhuma
tcnica de estatstica.

Anlise Exploratria de Dados Espaciais

Por sua vez a aplicao de mtodos exploratrios de dados espaciais implica


a busca de uma descrio dos eventos apresentados, tentando gerar hipteses
ou mesmo modelos apropriados. Pode-se nesse caso usar ferramentas do
SIG para medir distncias e calcular densidades para permitir descrever os
padres espaciais de forma mais clara. O resultado da anlise exploratria
pode ser um mapa ou mesmo alguns grficos mais convencionais. Na maioria
das vezes, os mtodos usados enfatizam a visualizao grfica possibilitando
a identificao de padres, inter-relaes, ou mesmo observaes atpicas.

Modelagem de Dados Espaciais

A modelagem de dados espaciais, por outro lado, utiliza mtodos que


especificam modelos estatsticos e tentam estimar parmetros. Preocupa-se
com os fenmenos estocsticos, ou seja, aqueles que so sujeitos incerteza,
ou influenciados pelas leis de probabilidade. Desse modo, so usados

33
CAPTULO 2 - Anlise de Dados em Forma de Pontos

mtodos de anlise que consideram a probabilidade de ocorrncia de um


evento em relao a um conjunto de outros eventos localizados no espao, ou
seja, uma nuvem de pontos.
A diferenciao entre visualizar, explorar e modelar dados um ponto
importante, mas suas delimitaes no esto bem definidas, uma vez que
existe uma inter-relao entre estes mtodos, os quais esto ligados num
processo interativo. Essa diferenciao depende basicamente do grau de
manipulao dos dados que o mtodo aplicado envolve. Essas abordagens
so normalmente acompanhadas de interpretao intuitiva, e tm como objetivo
determinar uma impresso inicial da rea de estudo e de qualquer padro
bvio presente. No entanto, como ressaltam Bailey e Gatrell (1995), deve-se
estar atento para o fato de que a interpretao intuitiva, do que possa ser um
padro aleatrio, pode ser ambgua. A tendncia atual mesclar mtodos de
visualizao e exploratrios devido semelhana entre eles. Na prtica a
mescla dos dois procedimentos tem sido muito utilizada, e a denominao
visualizao-exploratria tem sido empregada.
Nesse contexto, utiliza-se uma integrao dos procedimentos de
visualizao, ou seja, das ferramentas usadas para mapear dados
espacialmente georreferenciados com os procedimentos exploratrios, que
analisam os dados na tentativa de detectar padres, identificar aglomerados,
etc. Dependendo do fenmeno representado, seja ele, padro de pontos,
superfcie contnua ou dados de rea, deve-se utilizar mtodos de anlise
apropriados para cada situao.

2.3 Anlise de Padres de Dados com


Representao por Pontos

De acordo com Bailey e Gatrell (1995), o padro de pontos considerado o


modo mais simples de representar dados espaciais. definido como uma
base de dados contendo uma srie de localizao de pontos, numa
determinada regio de estudo, onde ocorreu o evento de interesse. Em sua
apresentao mais simples, esses dados espaciais contm apenas as
coordenadas dos eventos.
Esse o caso dos mapas que mostram pontos como eventos de sade,
como o de John Snow e de outros como a investigao de hepatite A no
Municpio de Macap (AP), conforme observado na figura 2.2. Esses dados
foram obtidos com base na notificao de casos, usando-se o Sistema

34
2.3 - Anlise de Padres de Dados com Representao por Pontos

Nacional de Agravos de Notificao (SINAN). A localizao de casos foi feita


atravs do registro de coordenadas geogrficas no local de residncia,
utilizando-se um GPS (Neri, 2004).

FIGURA 2.2 Distribuio de casos de hepatite A no Municpio de Macap, de 1999 a


2003 (Neri, 2004).

Esse mapa mostra a localizao de 933 pontos que representam o local de


residncia de casos de hepatite A, em Macap, nos anos de 2000 e 2001.
Assim como no caso da clera, a hepatite A de transmisso fecal-oral e as
reas com maior incidncia da doena podem ter problemas com a qualidade
da gua consumida pela populao ou com o destino de esgotos domsticos.
Interessa para a Vigilncia em Sade, portanto, apontar locais em que existe
maior intensidade de transmisso para agir sobre estas reas. No uma
tarefa fcil nesse caso apontar reas de maior incidncia.

35
CAPTULO 2 - Anlise de Dados em Forma de Pontos

A pergunta que se deve responder neste caso se existe um padro


espacial de distribuio de pontos. Pensando em um teste estatstico, a
pergunta seria reformulada para o padro da distribuio de pontos
diferente do aleatrio?. Devemos ento diferenciar os tipos de distribuio
que so esperados quando se trabalha com eventos de sade: aglomerado,
regular e aleatrio (Figura 2.3).

FIGURA 2.3 Tipologia de distribuio padro de pontos.

A - Aglomerado B - Regular C - Aleatrio

Se os riscos esto concentrados no espao, espera-se um padro de pontos que mostre uma aglomerao
(Figura 2.3 A). Esse padro tambm chamado de agrupado ou clusterizado, usando-se uma expresso
do ingls. Esse padro diferente do regular (Figura 2.3 B) e do aleatrio (Figura 2.3 C).

No padro regular (Figura 2.3 B) existe uma distncia mdia entre os pontos que tende a ser constante.
Os pontos esto espalhados em todo o espao, mas mantendo uma regularidade entre eles. como se
a distribuio de pontos tivesse sido planejada para que um ponto no estivesse muito longe do outro.
Na prtica de sade pblica este padro pouco comum. Um dos casos em que esse padro pode
ocorrer a localizao de unidades bsicas de sade dentro de uma cidade. Se um dos critrios para a
localizao desses servios for, por exemplo, que os usurios devem encontrar uma unidade bsica a
menos de 1 km de sua casa, h uma tendncia de se espalhar homogeneamente essas unidades no
espao. O mesmo pode acontecer com amostras ambientais ou armadilhas para o monitoramento de
infestao por mosquitos (ovitrampas), que so distribudas propositalmente no espao de forma regular.

J o padro aleatrio (Figura 2.3 C) no tem nenhum modelo de distribuio. Ele ocorre por um completo
acaso. Nessa ltima situao, existe uma mescla de distribuio aglomerada e uniforme (Ward e
Carpenter, 2000).

36
2.3 - Anlise de Padres de Dados com Representao por Pontos

Imagine uma doena que no fortemente determinada por nenhum fator


social ou ambiental, como a diabetes. Como os fatores de risco da doena
(por exemplo, a predisposio gentica e hbitos alimentares) esto em
geral espalhados no espao, a distribuio espacial dos casos da doena
vai tender a um padro aleatrio. Mesmo nesses casos, como a diabetes,
uma tarefa da Vigilncia em Sade procurar associaes e padres que
possam servir para identificar populaes mais vulnerveis. Se existe uma
fonte comum de exposio a riscos, o padro de distribuio de pontos
tender a ser aglomerado.
As tcnicas de anlise espacial permitem identificar reas com
concentrao aparentemente alta de eventos e possibilitam avaliar se o
aparente aglomerado de casos ocorreu ou no ao acaso. De acordo com
Besag e Newell (1991) e Lawson e Kulldorf (1999), os testes estatsticos
utilizados em anlise espacial podem ser agrupados em duas grandes
categorias:
a) testes globais e
b) testes focais.
Os testes globais compreendem a maioria dos testes para identificao
de aglomerados espaciais de doenas, em que todos os casos so
processados. Esses procedimentos testam a presena de aglomerados sem
ter a habilidade de identificar a localizao dos mesmos (trabalham com o
conjunto total dos pontos mapeados). Dessa forma, testam a hiptese de
que no existe aglomerado na regio contra a hiptese alternativa de que
existe conglomerado sem especificar sua localizao.
Os testes focais, ou locais, para a identificao de aglomerados so usados
quando se tem uma fonte primria pr-definida, ou seja, verificam a existncia
de aglomerados em regies definidas a priori, antes da observao do evento.
Testam a presena de aglomerados em reas especficas, como por exemplo,
em torno de um foco suspeito de risco aumentado para uma doena. So
especialmente teis quando existe forte suspeita de um agente etiolgico.
Os testes de deteco de aglomerados podem ser considerados uma
terceira categoria na qual possvel identificar o local da ocorrncia do
aglomerado e, alm disso, testar sua significncia estatstica. Testes globais
e testes de deteco de aglomerados complementam-se e tm uma boa
aplicao no estudo espacial de aglomerados em diversos cenrios
epidemiolgicos.
Existem diversas tcnicas disponveis de anlise exploratria espacial
para detectar e mapear reas quentes ou aglomerados. Dentre elas,
destacam-se a tcnica de Kernel e a estatstica espacial scan, que
constituem ferramentas amplamente utilizadas em anos recentes, na rea
de sade e ambiente.

37
CAPTULO 2 - Anlise de Dados em Forma de Pontos

2.4 Anlises Baseadas na Distncia entre


Pontos

Uma maneira de avaliar os padres espaciais de pontos e detectar a


existncia de aglomerados medir a mdia da distncia entre os pontos. No
padro aglomerado a distncia mdia entre pontos pequena, j nos padres
aleatrio e regular a distncia entre pontos grande. As distncias entre pontos
so medidas facilmente em um SIG, j que o sistema guarda as coordenadas
de cada ponto.

A chamada distncia euclidiana calculada pela equao:

d = { ( x 1 x 2 )2 + ( y 1 y 2 ) 2 }

Onde o ponto 1 tem coordenadas x1 e y1, e o ponto 2 tem coordenadas x2 e y2.

A tabela abaixo mostra a estatstica de distncia entre pontos dos casos da


figura 2.3.

DISTNCIA MDIA DESVIO PADRO DA


(em metros) DISTNCIA (em metros)
Aglomerado 358 688

Regular 1094 321

Aleatrio 890 643

Pode-se observar que o padro aglomerado tem a menor distncia mdia


entre pontos, o que indica uma concentrao de pontos no espao estudado,
mas um grande desvio padro. O padro regular, como o prprio nome indica,
tem uma grande distncia mdia entre os pontos, mas um pequeno desvio,
indicando a homogeneidade da distribuio. J o padro aleatrio tem uma
grande distncia mdia entre pontos e grande desvio padro.

38
2.4 - Anlises Baseadas na Distncia entre Pontos

Essas estatsticas de distncia entre pontos podem servir para uma srie
de tcnicas usadas para a deteco de aglomerados de pontos. A anlise de
aglomerados (cluster) um termo genrico usado em um grande nmero de
tcnicas que tentam determinar se uma base de dados composta por grupos
distintos (Everitt, 1974). De modo geral a anlise de aglomerados um mtodo
de classificao que utiliza a caracterstica de certos objetos com o intuito de
agrup-los.

Anlise de Aglomerados Hierrquicos

Nas tcnicas de aglomerados hierrquicos, por exemplo, a deteco inicia-


se com os eventos separados e procede-se a unio das observaes mais
semelhantes em grupos, com base em critrios pr-definidos.
No aglomerado hierrquico (hierarchical cluster), a distncia entre vizinhos
mais prximos freqentemente usada como medida de dissimilaridade.
Existem diversos tipos de medidas de distncias mtricas disponveis, mas a
distncia euclidiana a mais comumente usada por ser bastante fcil e intuitiva.
Na anlise hierrquica de aglomerados, a menor distncia entre dois objetos
primeiramente identificada e estes objetos so agrupados em um novo
aglomerado. As distncias entre esses aglomerados so calculadas, e estes
por sua vez, podem ser agrupados num prximo nvel. Segundo Bailey e Gatrell
(1995), a anlise de hierarquia de aglomerados um mtodo exploratrio de
estatstica multivariada usado para identificar agrupamento de objetos que
pode identificar a localizao espacial destes eventos.
Dentre os mtodos hierrquicos mais utilizados est o de vizinhos mais
prximos. A rotina de aglomerados hierrquicos de vizinhos mais prximos
(Nearest Neighbor Hierarchical Clustering NNHC), implementada pelo
programa Crimestat 2.0 (Levine, 2002), uma rotina de agrupamento de
distncia que une pontos com base em sua proximidade espacial. Ou seja,
agrupa casos incidentes que esto espacialmente prximos.
De forma geral, a rotina identifica aglomerados vizinhos de primeira ordem
os quais representam os pontos que esto mais prximos do que a distncia
limiar proposta, e que tenham pelo menos o nmero mnimo de pontos
determinados. Na seqncia da anlise, os aglomerados de primeira ordem
so tratados como pontos individuais que podem ser agrupados em
aglomerados de segunda ordem e assim sucessivamente at que se atinja
um nico aglomerado ou que as condies estabelecidas no sejam mais
atendidas. Esses aglomerados so identificados por meio de elipses que
delimitam um grupo de pontos contidos nos aglomerados. O processo de
unificao dos aglomerados identificados pela tcnica de aglomerados
hierrquicos de vizinhos mais prximos pode ser graficamente representado,
de forma espacial, atravs de mapas, ou ainda de forma no espacial por
39
CAPTULO 2 - Anlise de Dados em Forma de Pontos

meio de rvore hierrquica, tambm chamada de dendograma, como na figura


a seguir.

FIGURA 2.4 Dendograma de representao grfica dos vrios passos do processo


hierrquico de aglomerado. A utilizao dessa forma de apresentao evidencia a
ligao entre os eventos e os aglomerados identificados em seus diversos nveis.

Aglomerado de 3 ordem

Aglomerado de 2 ordem

Aglomerado de 1 ordem

Eventos individuais

Com base no grau de similaridade destes eventos ou nas suas


caractersticas compartilhadas eles vo sendo agrupados, inicialmente em
um primeiro aglomerado, identificado como de primeira ordem. A partir desse
ponto cada aglomerado passa a ser identificado como se fosse um evento
isolado, e de acordo com as premissas preestabelecidas vo sendo agrupados
at alcanar o ltimo aglomerado possvel ou at que as condies
estabelecidas no sejam mais atendidas.
Ao se conduzir uma anlise hierrquica de vizinhos prximos devem ser
definidos os seguintes parmetros:
a) a distncia limiar, que a probabilidade de selecionar um par ao acaso;
b) o nmero mnimo de pontos necessrios para constituir um aglomerado e
c) o tamanho da elipse que vai ser utilizada para identificar o local de
ocorrncia desses aglomerados.

A Distncia limiar

Se apenas pares de eventos estivessem sendo agrupados, ento a distncia


limiar seria o parmetro de maior importncia a ser considerado. Utilizando-se
o valor padro definido pelo programa (p < 0,5), aproximadamente metade dos
pares seria selecionada ao acaso se os dados obedecessem a uma distribuio
randmica. Contudo, uma vez que, alm da distncia limiar, utiliza-se o nmero
mnimo de eventos na construo da rotina de anlise, a chance de encontrar
aglomerados com este nmero mnimo de pontos menor. A escolha dos valores
dessa distncia limiar vai depender do objetivo do estudo. Para intervenes
centradas numa localizao particular, o uso de uma distncia limiar pequena
pode ser apropriado; por outro lado, a identificao de reas mais amplas, em
algumas situaes, pode ser melhor que a seleo de microambientes.

40
2.4 - Anlises Baseadas na Distncia entre Pontos

B Nmero mnimo de pontos

O nmero de eventos mnimos para definir um aglomerado de suma


importncia na identificao dos grupos, uma vez que o programa desconsidera
a localizao do ponto inicial se o aglomerado no congrega este nmero
mnimo de pontos. Em geral o critrio do nmero mnimo de pontos mais
crtico do que a distncia limiar, embora a ltima tambm possa influenciar os
resultados. Levine (2002) sugere que a investigao pode ser realizada com
diferentes critrios at que se encontre o critrio que melhor se adapte
situao estudada.

C Tamanho da elipse

Por sua vez, a definio do tamanho da elipse a ser utilizada na visualizao


dos aglomerados identificados tambm influenciada pelo objetivo do estudo.
A rotina presente no aplicativo disponibiliza a escolha de valores que vo de
um a dois desvios padres. A utilizao de elipses construdas com base em
um desvio padro pode no ser o mais adequado para a visualizao do
evento em escala regional. Mais uma vez, o investigador deve balancear a
necessidade de identificar, de forma acurada, a localizao do aglomerado
versus a necessidade de facilitar a adequada visualizao da rea estudada.

O aglomerado hierrquico de vizinhos mais prximos, alm de ser um mtodo


exploratrio de anlise espacial, pode ser combinado com uma simulao de
Monte Carlo. Esse mtodo simula uma srie de dados de acordo com um
modelo prvio de modo a testar a existncia de aglomerados que sejam
estatisticamente significativos. Nessa situao, pode ser ento classificado
como um mtodo de modelagem de padro espacial de pontos, uma vez que
utiliza tcnicas para testar hipteses comparando a distribuio observada a
um modelo particular, o de aleatoriedade espacial completa (AEC). O modelo
padro para a AEC de que os eventos seguem um processo homogneo de
Poisson na rea estudada, ou seja, os eventos so independentes e
uniformemente distribudos na regio. Isso significa dizer que: (a) qualquer evento
tem a mesma probabilidade de ocorrer em qualquer posio da regio sob
estudo, e (b) a posio de qualquer evento independente da posio de outro
evento, ou seja, os eventos no interagem uns com os outros.
A AEC o primeiro passo na testagem da hiptese de que as observaes
se distribuem de forma regular, aglomerada ou aleatria. De forma conceitual,
a distncia limiar define a probabilidade de dois pontos serem agrupados ao
acaso. O teste de significncia estatstica avalia o intervalo de confiana em
torno da distncia dos vizinhos de primeira ordem. Se a probabilidade 5%,
ento aproximadamente 5% de todos os pares de casos seriam identificados
numa distribuio aleatria.

41
CAPTULO 2 - Anlise de Dados em Forma de Pontos

No entanto, a rotina hierrquica de vizinhos prximos leva em conta outros


parmetros, e a probabilidade de distribuio levando em conta estes
parmetros no conhecida. Nesse sentido, necessria uma simulao
de Monte Carlo considerando apenas os aglomerados hierrquicos de
primeira ordem.

Vantagens e desvantagens da tcnica de aglomerados hierrquicos de vizinhos mais prximos

A tcnica de aglomerados hierrquicos de vizinhos mais prximos determina se existem aglomerados (ex: reas
quentes) na distribuio dos eventos utilizando-se um critrio quantitativo. A identificao de aglomerados feita
pelo desenho de elipses que marcam locais com maior concentrao de pontos que o esperado segundo um
modelo de aleatoriedade.

Dentre as vantagens da tcnica ressalta-se:


a) habilidade para identificar reas onde exista concentrao de eventos;
b) pode ser aplicada para qualquer base de dados, independente da sua abrangncia (ex: municpio ou distrito
urbano); e
c) a ligao entre os diversos aglomerados encontrados pode ser visualizada por meio de grupos segundo nveis
de hierrquicos, ou seja, considerando diferentes escalas de aglomerados de eventos que podem ser identificadas
por esta tcnica.

A principal desvantagem que essa tcnica usa dados absolutos e pode produzir uma falsa impresso da
existncia de grupamentos, uma vez que no considera dados populacionais. Esses aglomerados podem ser
conseqncias da prpria tendncia de concentrao de populao em determinados locais com mais recursos.
Alm disso, o tamanho da rea estudada dependente do tamanho da amostra, uma vez que o intervalo de
confiana em torno da distncia mdia aleatria utilizado como um dos critrios. Uma outra desvantagem a
existncia de um certo grau de arbitrariedade, uma vez que o nmero mnimo de eventos a compor um aglomerado
definido pelo investigador, da mesma forma como a definio da probabilidade a ser empregada.

Nas pesquisas e prticas de Vigilncia em Sade a utilizao dessa tcnica


tem sido usada crescentemente. A maioria dos exemplos disponveis de sua
aplicao encontra-se na identificao de reas de maior ocorrncia de crimes
(Levine, 2002).

O Crimestat um aplicativo gratuito desenvolvido pelo professor Ned


Levine para o Instituto de Justia dos Estados Unidos, para avaliar a
incidncia de crimes em reas urbanas daquele pas. Esse programa
pode tambm ser usado para identificar padres de distribuio de
eventos de sade. O programa possui diversas rotinas de anlise espacial
de pontos como a funo K, estimadores kernel, anlise espao-temporal
por teste de Knox, e outros.

Como entrada de dados, o programa aceita arquivos em dbf que tenham


as coordenadas (em qualquer sistema de projeo) e exporta os
resultados como um texto ou como objetos cartogrficos em formato
shp. Por exemplo, as elipses que marcam os aglomerados identificados
pelo aplicativo so criadas em formato shp e facilmente importadas
para um programa de SIG. Como esses formatos so os mesmos
empregados pelo Terraview, o Crimestat pode ser usado como aplicativo
Fonte: http://www.icpsr.umich.edu/CRIMESTAT/ auxiliar para anlise e teste de hipteses que no podem se feitas em
outros programas.

42
2.4 - Anlises Baseadas na Distncia entre Pontos

Retomando-se o exemplo da distribuio de casos de hepatite A em


Macap, temos a identificao de alguns aglomerados de casos: um grande
aglomerado de segunda ordem na rea sul da cidade e dez aglomerados
de primeira ordem espalhados pela cidade, principalmente nos bairros do
sul (Figura 2.5). Esses aglomerados so marcados por uma elipse que
produzida pelo prprio aplicativo Crimestat em formato shp (shape). Este
formato pode ser facilmente importado pelo programa Terraview.

FIGURA 2.5 Casos de hepatite A e aglomerados de primeira ordem (em forma


de pequenas elipses vermelhas) e de segunda ordem (em forma de uma grande
elipse laranja).

43
CAPTULO 2 - Anlise de Dados em Forma de Pontos

2.5 Anlise da Densidade de Pontos

Dentre os procedimentos para estimar densidade de eventos, a estimativa


Kernel a mais conhecida e a mais utilizada, desempenhando um papel
importante no contexto epidemiolgico (Gatrell et al., 1996) para identificar a
concentrao de casos.
A estimativa Kernel uma tcnica de interpolao exploratria que gera uma
superfcie de densidade para a identificao visual de reas quentes. Entende-
se a ocorrncia de uma rea quente como uma concentrao de eventos que
indica de alguma forma a aglomerao em uma distribuio espacial.
uma tcnica estatstica, de interpolao, no paramtrica, em que uma
distribuio de pontos ou eventos transformada numa superfcie contnua
de risco para a sua ocorrncia. Esse procedimento permite filtrar a variabilidade
de um conjunto de dados, sem, no entanto, alterar de forma essencial as suas
caractersticas locais (Bailey e Gatrell, 1995). O estimador Kernel no um
mtodo de deteco de aglomerados por si, mas, um mtodo para explorar e
mostrar o padro de pontos de dados em sade, e til a partir do momento
em que gera uma superfcie contnua a partir de dados pontuais (Cromley e
McLafferty, 2002).
O estimador Kernel produz uma superfcie contnua, com densidades
calculadas em todas as localizaes, desta forma, o investigador no precisa
definir de forma arbitrria onde cortar a rea quente, isto , uma densidade
a partir da qual se considera que os pontos formam um aglomerado (Levine,
2002). Contudo, importante ressaltar que a interpretao dos resultados
obtidos mediante a anlise Kernel subjetiva e depende do conhecimento
prvio da rea de estudo. A tcnica apresenta, como uma das maiores
vantagens, a rpida visualizao de reas que merecem ateno, alm de no
ser afetada por divises poltico-administrativas. Portanto o estimador de
intensidade uma boa alternativa para se avaliar o comportamento dos padres
de pontos em uma determinada rea de estudo, sendo considerado muito til
para fornecer uma viso geral da distribuio de primeira ordem dos eventos
(Carvalho e Cmara, 2002).
Originalmente a estimativa Kernel foi desenvolvida para se obter uma estimativa
suavizada de uma probabilidade univariada ou multivariada com base na amostra
de uma observao, ou seja, um histograma suavizado. A estimativa de
intensidade de uma distribuio de pontos muito semelhante estimativa de
probabilidade de densidade bivariada (bivariate probability density).

44
2.5 - Anlise da Densidade de Pontos

Para a aplicao da estimativa Kernel, necessria a definio de dois


parmetros bsicos, que podem ser visualizados na figura 2.6:
a) raio de influncia ( ) que define a vizinhana do ponto a ser interpolado
e controla o alisamento da superfcie gerada. o raio de um disco, centrado
em s, que uma localizao na regio R, no qual pontos si vo contribuir para
a estimativa da funo de intensidade;
b) uma funo de estimao k (Kernel) com propriedades de suavizao
do fenmeno. Os Kernel normal ou qurtico so os mais comumente utilizados.
Se s representa uma localizao em R e s1 ,.... sn so as localizaes das n
observaes, ento a intensidade (s), em s estimada por:

n
1 (s si )
(s) =
i=1 2

Onde k uma funo de densidade bivariada escolhida, ou seja, a funo


de estimao ou de alisamento, conhecida como Kernel. O parmetro
conhecido como raio de influncia ou largura da banda e determina o grau de
suavizao da superfcie de sada. A funo bidimensional ajustada sobre os
eventos considerados compondo uma superfcie cujo valor ser proporcional
intensidade dos eventos por unidade de rea.

FIGURA 2.6 Passos para o clculo de densidade de pontos segundo a tcnica de


Kernel (Cmara et al., 2002).

Camada de pontos Grade de Intensidade Superfcie de Sada

Ponto a ser estimado (s) Raio de Influncia ( )

A escolha da funo Kernel (se quadrtica, normal, triangular ou uniforme) a


ser utilizada no um ponto crtico, contudo, a escolha do raio de influncia
crucial, produzindo significantes alteraes da estimativa final.
Essa funo (Figura 2.6) realiza a contagem dos eventos dentro de uma
regio de influncia, ponderando-os pela distncia, de cada um, a uma
localizao de interesse (Cmara et al., 2002). Do ponto de vista visual, quando
se aplica o estimador de intensidade sobre uma grade de localizaes na
rea R, pode-se pensar numa funo tridimensional que visita cada ponto s

45
CAPTULO 2 - Anlise de Dados em Forma de Pontos

na grade. A distncia para cada evento observado si , que cai na rea de


influncia, medida e contribui para a estimativa de intensidade em s de
acordo com sua distncia de s.
O resultado da estimativa Kernel para o caso da hepatite A em Macap
mostrado na figura 2.7, a seguir.

FIGURA 2.7 Casos de hepatite A e superfcie de densidade, segundo a tcnica de Kernel em Macap (Dados de Neri, 2004).

Pode-se observar que existem casos distribudos em toda a cidade, mas


estes casos esto mais concentrados na rea central-sul (bairros de Buritizal
e Congos) e na central-norte (Perptuo Socorro). Essa j uma indicao de
riscos que pode ser usada para se atuar sobre determinantes da hepatite A.
Como estamos trabalhando em um ambiente de Sistema de Informaes
Geogrficas (SIG), que tem diversas funcionalidades, podemos usar este
sistema para identificar o nome dos bairros com maior intensidade de
transmisso e as caractersticas sociais e demogrficas destes bairros.

46
2.5 - Anlise da Densidade de Pontos

Grade regular de representao do Kernel

O arquivo gerado pela tcnica de kernel uma grade com n colunas por
m linhas, criando n x m clulas. Quanto maior o nmero de clulas,
maior a resoluo da figura gerada. A definio desse parmetro afeta a
quantidade de memria que vai ser usada para armazenar os resultados.
O uso de uma grande quantidade de colunas pode gerar uma sobrecarga
de processamento no programa e computador.

Essa grade uma maneira de representar a superfcie contnua com as


estimativas de densidade de pontos. Cada uma destas clulas tem como
atributo o valor estimado da densidade de pontos. Observe que o mapa
temtico gerado tem uma legenda que mostra variaes a partir de um
nmero muito pequeno. Os valores representam a quantidade de pontos
encontrados em uma unidade de rea. No caso do mapa de Macap,
onde se trabalhou com o sistema de coordenadas UTM em unidades de
metros, os valores esto em eventos por metro quadrado.

Na figura 2.8 simularam-se dois padres de suavizao variando os valores


do raio de influncia. Raio de influncia mais amplo, como o utilizado na figura
2.8 B, gera uma suavizao maior, com superfcie mais homognea, enquanto
a suavizao produzida por valores pequenos da largura da banda gera um
nmero maior de reas quentes na regio de estudo (Figura 2.8 A).

FIGURA 2.8 Simulao de resultados de Kernel:


A- alisamento produzido por valor pequeno de raio de B- alisamento produzido pelo emprego de valor maior do raio

influncia ( = 200 m);
de influncia ( = 1000 m).

A escolha do padro de suavizao de importncia fundamental na


estimativa da densidade dos eventos e depende do objetivo do estudo e do
tipo de evento estudado. Para identificar reas especficas e de menor
abrangncia para atuao, valores menores de raio de influncia podem ser
mais indicados (ex: doenas transmitidas por insetos), contudo esta abordagem
pode gerar reas mltiplas e pulverizadas de atuao. Se o objetivo identificar
reas mais abrangentes para otimizar intervenes, a largura da banda mais

47
CAPTULO 2 - Anlise de Dados em Forma de Pontos

ampla torna-se a melhor opo. Se o objetivo do estudo explorar os dados


para a formulao de hipteses, diferentes raios de influncia devem ser
empregados (Silverman, 1986). Na prtica, para o clculo do estimador Kernel,
o investigador pode experimentar diferentes valores de gerando assim
variaes de intensidade at encontrar o padro que melhor se adapte regio
estudada refletindo a densidade local dos eventos (Bailey e Gatrell, 1995;
Cromely e McLafferty, 2002).

2.6 Avaliao de Aglomerados considerando


a Distribuio da Populao

Os mtodos descritos anteriormente, baseados na distncia entre pontos e


na densidade de pontos no espao, podem ser utilizados para avaliar uma
aglomerao destes pontos, indicando reas onde estes pontos se
concentram. Nesses casos, o que se busca responder pergunta: os pontos
tm uma distribuio espacialmente condicionada? Ou, a distribuio dos
pontos diferente do que se esperaria de um padro aleatrio?

O grande problema das tcnicas de deteco de aglomerados que os


pontos de eventos de sade tendem a ter uma distribuio espacial
semelhante distribuio da populao. Todos os eventos de sade o
nascimento, a infeco, a vacinao, o adoecimento, a internao, a morte
se manifestam em pessoas. Essas pessoas no esto distribudas
aleatoriamente no espao. Essa distribuio determinada por fatores
histricos e socioeconmicos. Por isso, ao se trabalhar com registros de
sade para avaliar riscos, deve-se estimar a probabilidade de um evento
ocorrer, ponderada pela distribuio da populao.

A pergunta nesse caso passa a ser: a distribuio espacial dos pontos


diferente da distribuio da populao? E a melhor forma de responder
pergunta construir taxas, onde o numerador o nmero de eventos de sade
e o denominador a populao de referncia.
A forma mais usual de se considerar a distribuio da populao na avaliao
de riscos a agregao de dados demogrficos e de sade em unidades
espaciais discretas, isto , em reas pr-concebidas, para posteriormente
calcular indicadores epidemiolgicos. Essa estratgia apresenta srias
limitaes, como a desconsiderao das interaes entre as unidades espaciais
e a instabilidade dos indicadores criados em pequenas reas (King, 1979).

48
2.6 - Avaliao de Aglomerados considerando a Distribuio da Populao

Se dispusermos de dados em forma de pontos, podemos construir diversas


totalizaes de conjuntos de eventos dentro de vrios tipos de reas, a partir
da agregao destes dados. A figura 2.9 mostra um conjunto de dados originais
que podem ser usados para avaliar uma situao em que se quer identificar
aglomerados de pontos com taxas de incidncia altas. Os eventos de sade
so representados por pontos e os dados de populao so atributos dos
setores censitrios, que so pequenos polgonos.

FIGURA 2.9 Eventos de sade (pontos) e setores censitrios (polgonos) usados para o clculo de taxas por meio de tcnicas de
anlise espacial.

O caso mais simples de construo de taxas a partir de pontos quando se


tem uma fonte suspeita de riscos. Essa era exatamente a situao do estudo
de John Snow que tentava mostrar que existia um risco maior de morrer por
clera nos moradores em torno do poo de gua da Broad Street. Tambm a
situao de muitas investigaes que vm sendo feitas em vigilncia ambiental
em sade, em que existe uma suspeita de aumento de casos de doenas,
leucemia, por exemplo, em torno de usinas nucleares, depsitos de lixo txico
ou incineradores.
Uma soluo analtica para esse problema apontar a fonte suspeita no
mapa, criar uma rea de influncia (buffer) em torno desta fonte suspeita,
calcular a taxa de incidncia do agravo sade dentro da rea de influncia e
fora dela. A maneira que se faz isso dentro de um ambiente SIG bastante

49
CAPTULO 2 - Anlise de Dados em Forma de Pontos

simples. Uma vez delimitada a rea de influncia, contamos quantos eventos


existem dentro da rea (pontos dentro do polgono) e qual a populao total
dentro da rea (soma das populaes de polgonos pequenos dentro de
polgonos maiores).

rea de influncia (buffer)

Existem vrias formas de se construir reas de influncia. A mais simples


um crculo em torno de um ponto. Mas poderamos tambm criar vrios
crculos concntricos em torno desse ponto, com raios de 500, 1.000,
2.000 e 5.000 metros, por exemplo (Figura 2.10). As reas de influncia
podem ser tambm criadas em torno de linhas e de polgonos.

FIGURA 2.10 reas de influncia em torno de uma fonte suspeita de risco.

Ao construir taxas de incidncia dentro de cada uma dessas reas de


influncia, podemos avaliar se os riscos decaem com o aumento da
distncia da fonte suspeita. Nem sempre a fonte suspeita um ponto no
mapa. Em algumas situaes muito comuns, essa fonte pode ser uma
linha. Uma estrada pode ser uma fonte de riscos de contaminao do ar
para a populao em torno. Tambm pode representar um risco maior
de morte por acidentes de trnsito para as pessoas que moram perto.

No segundo livro desta srie mostrou-se como construir reas de influncia


usando o Terraview. Dentro dessa rea de influncia podem-se calcular taxas
contando-se o nmero de eventos e a populao total.

50
2.6 - Avaliao de Aglomerados considerando a Distribuio da Populao

Existem tcnicas estatsticas que permitem avaliar se as taxas de incidncia


dentro e fora da rea de influncia so significativamente diferentes, como se
ver a seguir. Mas em diversos outros casos, do cotidiano de Vigilncia em
Sade, no existe uma fonte suspeita. Quando se avalia a dengue, por exemplo,
no se sabe a priori onde esto essas fontes de risco, que podem ser focos do
vetor. Esse tambm o caso da distribuio da hepatite A. Gostaramos que as
tcnicas de anlise espacial apontassem onde esto essas fontes de risco,
que ainda no conhecemos.
Existe uma tcnica, recentemente desenvolvida, que avalia as taxas de
incidncia por meio de um crculo que caminha no espao, mudando o raio e
a posio do seu centro. Essa tcnica faz uma varredura (scan em ingls) do
espao estudado, procurando localizar um crculo no local onde haja uma taxa
de incidncia muito grande, dentro, e muito baixa, fora deste crculo.
A maioria dos mtodos estatsticos, para anlise de aglomerados de dados
pontuais, descritiva: conseguem detectar a localizao do aglomerado sem
fazer inferncias estatsticas, ou por outro lado, conseguem fazer inferncias
sem ter a habilidade de detectar a localizao do aglomerado. Essa uma
diferena bsica da estatstica espacial scan a qual possui a habilidade de
realizar ambos os procedimentos, de tal forma que, uma vez que a hiptese
nula rejeitada consegue-se localizar a rea especfica do mapa que causou
a rejeio (Kulldorff, 1997).

Deteco de Aglomerados pela Tcnica Estatstica Scan

O mtodo leva em conta a distribuio populacional irregular que influencia


a distribuio destes pontos sob a hiptese nula. A estatstica espacial scan
definida por uma janela geogrfica circular que se move atravs da rea de
interesse, ou seja, uma estatstica de varredura onde, o crculo capaz de
incluir diferentes conjuntos de reas vizinhas. Considera-se uma rea como
includa no crculo se o seu centride est contido na janela. O raio de cobertura
da janela pode variar de zero a um valor mximo, de forma que a janela nunca
inclua mais que 50% da populao total. Com isso, a janela flexvel em
tamanho e localizao. Para cada localizao e tamanho da janela de varredura
verificado se existe uma taxa elevada dentro do crculo quando comparada
com a regio externa a este crculo.
A tcnica cria um conjunto com infinito nmero de crculos distintos. Cada
um deles podendo conter uma srie diferente de regies vizinhas com a
possibilidade de conter um aglomerado de eventos. Cada crculo geogrfico
criado inclui um conjunto de localizaes ou reas administrativas, e tratado
como um aglomerado em potencial.
Para cada janela, o mtodo testa a hiptese nula frente hiptese alternativa
que existe um risco elevado de ocorrncia de eventos dentro desta janela em
51
CAPTULO 2 - Anlise de Dados em Forma de Pontos

comparao com o exterior. comparado o nmero de casos dentro da janela


com o nmero de casos esperados se os casos estivessem aleatoriamente
distribudos no espao.
A funo de verossimilhana maximizada para todas as janelas e, aquela
com a mxima verossimilhana, considerada como o aglomerado mais
provvel. Ou seja, o aglomerado que tem a menor probabilidade de ter ocorrido
ao acaso. A razo de verossimilhana para essa janela constitui a estatstica
mxima da razo de verossimilhana. A sua distribuio sob a hiptese nula
obtida por meio da repetio desta anlise num grande nmero aleatrio de
replicaes do teste geradas sob a hiptese nula.
Alm do aglomerado mais verossmil, o mtodo tambm identifica
aglomerados secundrios com altos valores de verossimilhana. Alguns
desses aglomerados podem estar relacionados ao aglomerado mais
verossmil tendo reas de sobreposio. Aglomerados secundrios que esto
localizados em outras regies da rea de estudo so de interesse especial e
so definidos como aglomerados que no se sobrepem ao aglomerado de
maior verossimilhana.
Dois tipos diferentes de modelos probabilsticos podem ser considerados
quando se aplica a estatstica espacial scan: (A) Bernoulli, e (B) Poisson.
A No modelo Bernoulli, cada unidade de medida corresponde a uma
entidade ou indivduo que pode ter qualquer um dos dois status: casos ou
no casos. Isso pode representar pessoas com ou sem a doena, ou ainda,
pessoas com diferentes estgios de doenas, podendo significar casos e
controles de uma populao em geral. Os indivduos em quaisquer dessas
situaes so identificados como pontos e sua localizao constitui o processo
pontual, ou ainda, os eventos podem ser agregados para reas pr-
determinadas (bairros, municpios, distritos, etc.).
B No modelo Poisson, o nmero de eventos em cada rea considerado
como distribudo de acordo com a populao sob risco conhecida. Sob a
hiptese nula o nmero esperado de casos em cada rea proporcional ao
tamanho de sua populao. O modelo Poisson requer a contagem de casos e
populao para cada regio de localizao dos eventos (ex: bairros, municpios,
distritos, etc.), assim como o conhecimento das coordenadas geogrficas
para cada uma destas localizaes.
Para qualquer um dos modelos descritos, Bernoulli ou Poisson, a
estatstica scan ajusta para a densidade populacional irregular presente em
praticamente todas as populaes, e a anlise condicionada ao nmero
total de casos observados.
A escolha de qual dos modelos deve ser utilizado, Bernoulli ou Poisson,
depende do tipo de dado disponvel. Para dados binrios, o modelo Bernoulli
o indicado, por outro lado, para dados em forma de contagens de eventos o
modelo Poisson o indicado (Kulldorff, 2003).

52
2.6 - Avaliao de Aglomerados considerando a Distribuio da Populao

Vantagens e desvantagens da estatstica Scan

Comparada com outros mtodos estatsticos espaciais, a FIGURA 2.11 Resultado do teste Scan dos casos de
estatstica scan apresenta vantagens que a torna indicada na hepatite A de Macap. Eventos de sade (pontos),
bairros (polgonos) e crculos mostrando reas com
localizao de aglomerados: (a) pode ser ajustada para a
maior incidncia de hepatite A.
densidade populacional; (b) pode ser ajustada por variveis
de confuso; (c) sua aplicao minimiza vis de pr-seleo,
uma vez que procura por aglomerados sem especificar seu
tamanho e localizao; (d) o teste estatstico de razo de
verossimilhana leva em conta testagens mltiplas
informando um nico valor de p ao testar a hiptese nula
(Kuldorff et al., 1997).

Por outro lado, uma das principais desvantagens do mtodo


consiste no fato de que os aglomerados so sempre
definidos como crculos. Nessa situao, se uma rea de
baixa ocorrncia de casos est rodeada por reas com maior
nmero de casos, ela ser sempre includa no aglomerado,
apesar de poder apresentar caractersticas diferentes
(Sankoh et al., 2001). Ou seja, existe a tendncia de identificar
um aglomerado maior do que ele , uma vez que regies
onde nenhum caso foi registrado podem ser incorporadas
na identificao do aglomerado.

O resultado da tcnica de varredura scan para o caso da


hepatite A em Macap mostrado na figura 2.11.

Para proceder a anlise com a tcnica estatstica scan, utiliza-se o aplicativo


SatScan. Adicionalmente, o aplicativo permite a padronizao de taxas por meio
do ajuste pela estrutura etria da populao. Alm disso, a estatstica scan
incorpora a possibilidade de aplicao de mtodos multivariados de anlise
que levam em conta a convergncia de variveis potencialmente de confuso.

O Satscan, um aplicativo gratuito


desenvolvido pelos professores
Martin Kulldorff, do Instituto de
Cncer dos Estados Unidos e Dr.
Farzad Mostashari, do Department
of Health and Mental Hygiene da
Cidade de Nova Iorque.

A entrada de dados no programa


feita com arquivos em dbf, csv ou
txt, que tenham as coordenadas
(em qualquer sistema de pro-
jeo) e exporta os resultados
como um arquivo de texto (txt) que
Fonte: http://www.satscan.org/
contm as coordenadas do centro
do aglomerado e seu raio nas mesmas unidades em que foram entrados os dados (metros, quilmetros ou
graus). Esses dados podem ser convertidos em um objeto cartogrfico que pode ser disposto no Terraview.
Desse modo, o Satscan pode ser usado como aplicativo auxiliar para anlise e teste de hipteses que no
podem se feitas em outros programas.

53
CAPTULO 2 - Anlise de Dados em Forma de Pontos

Estimativa Kernel considerando a Populao

Podemos usar a tcnica de Kernel para avaliar a distribuio espacial dos


eventos, considerando tambm a distribuio da populao. uma maneira
grfica de se obter uma estimativa de taxa de incidncia. A anlise mais
simplificada consiste na comparao visual de mapas suavizados para cada
um dos processos (Santos et al., 2001). Contudo, outras abordagens devem
ser consideradas.
O estimador Kernel nico apresenta como desvantagem o fato de no levar
em conta a distribuio populacional onde os eventos esto inseridos. Se a
populao se distribusse uniformemente na regio, ento um Kernel nico de
eventos seria suficiente. Contudo, uma vez que isso raramente ocorre, mtodos
que levem em conta essa populao devem, tambm, ser considerados.
Nesse cenrio epidemiolgico assume-se que a intensidade de eventos vai
variar com a densidade populacional (Bailey e Gatrell, 1995).
Para se construir um mapa de densidade demogrfica num SIG como o
Terraview, deve-se dispor de um conjunto de dados de populao como
atributos de uma unidade espacial. Os municpios do Brasil so unidades
espaciais que possuem dados de populao, no s o total, mas tambm
fracionada por faixa etria, sexo, renda e nvel de instruo. Dentro de reas
urbanas a melhor fonte de dados de populao o setor censitrio.
O estimador Kernel, como referido, avalia os eventos tendo o ponto como
unidade de anlise. Levando-se em conta que o dado populacional agrupado
e a unidade mnima oficial de agrupamento o setor censitrio, ao atribuir-se
ao centride dessa regio o dado populacional conhecido, tem-se a
possibilidade de estimar a intensidade desse processo (populao) usando-
se uma funo Kernel. Com essa abordagem, Kelsall e Diggle (1995)
consideram o problema da estimativa da variao espacial do risco relativo
equivalente estimativa da razo de duas densidades bivariadas. A razo
entre as duas funes ser a intensidade do risco (Carvalho e Cmara, 2002)
e o mapa produzido a partir dessa razo ser um mapa de risco relativo (Sabel
et al., 2000).
O mtodo baseado no clculo da densidade de casos (nmero de casos
por rea), produzindo uma superfcie de probabilidades onde reas com casos
mais prximos apresentam maior risco, cujo denominador utilizado para a taxa
, em uma outra camada, a densidade de pessoas (habitantes por rea, ou
simplesmente a densidade demogrfica) tambm como uma superfcie contnua.
Se conseguirmos, agora, dividir o kernel do nmero de eventos pelo kernel
de populao teremos a distribuio das taxas de incidncia. A unidade do
kernel de eventos nmero de casos por metro quadrado. A unidade do kernel
de populao nmero de habitantes por metro quadrado. A diviso desses
dois valores resultaria em nmero de casos por habitante, que a unidade de
taxa de incidncia.
54
2.6 - Avaliao de Aglomerados considerando a Distribuio da Populao

A figura 2.12 mostra a estimativa de distribuio de casos de hepatite A e de


populao em Macap usando a tcnica de Kernel. A unidade espacial utilizada
o setor censitrio, e a varivel usada para estimativa a populao total.

FIGURA 2.12 Superfcie de densidade de casos (a) e de populao (b) calculados usando-se a tcnica de Kernel.
A B

No Terraview e no Crimestat possvel se construir um Kernel dual, ou uma


razo de Kernel, que seja calculado utilizando-se a razo entre duas variveis.
A primeira varivel ser o nmero de eventos, que est relacionada camada
de casos (pontos), e a segunda varivel ser a populao, que um atributo
da camada setor censitrio. O resultado para a anlise de casos de hepatite A
em Macap pode ser visto na figura 2.13.

FIGURA 2.13 Superfcie da taxa de incidncia de hepatite A em Macap calculada


utilizando-se a tcnica de Kernel.

55
CAPTULO 2 - Anlise de Dados em Forma de Pontos

Pode-se observar uma grande variabilidade dos valores obtidos para as


taxas. Algumas das reas com maiores valores situam-se nas periferias da
cidade, inclusive fora dos seus limites. reas em vermelho, denotando altas
taxas esto localizadas fora dos limites dos bairros (polgonos no mapa). Isso
acontece devido extrapolao da estimativa de kernel, chamado efeito de
borda. Somente os valores de taxas contidos nos limites da regio de estudo
podem ser considerados, isto , as taxas s podem ser calculadas dentro de
reas onde existem dados de populao. Nesse caso, podem ser apontados
aglomerados na rea sul (bairro de Buritizal) e nordeste (bairro do Perptuo
Socorro) da Cidade de Macap.

2.7 Interpolao de Dados Pontuais

Esta abordagem tambm se aplica na comparao entre dois processos


espaciais (ex: casos/controles; homens/mulheres) (Kelsall e Diggle, 1995).
Essa estratgia particularmente interessante quando no dispomos de
dados de populao, ou quando estamos trabalhando com inquritos ou
amostras. Nesse caso, podemos comparar a distribuio espacial de casos
com o total de amostras. Imagine um inqurito sobre tuberculose em que
algumas pessoas com a doena (sorteadas aleatoriamente no espao) so
perguntadas sobre o abandono do tratamento. A resposta a essa pergunta
(sim ou no, portanto uma varivel dicotmica) deve ser convertida em um
valor numrico (1 ou 0). A densidade de respostas sim em relao ao total de
respostas fornece uma estimativa de proporo de abandono do tratamento
representada no espao.
Essa tcnica foi usada em Goinia para avaliar a distribuio espacial da
soroprevalncia de dengue. Cada pessoa sorteada no inqurito foi localizada
no trecho de rua, conforme o endereo anotado no momento da visita. A
soropositividade de dengue foi obtida por exame em laboratrio a partir de
amostras de sangue. A varivel soropositividade foi dicotomizada
(transformada em 0 ou 1, pontos vermelho e verde no mapa) e foi calculado
o Kernel usando-se como atributo o valor da soropositividade (Figura 2.14).

56
2.7 - Interpolao de Dados Pontuais

No mapa ao lado observa-se a rea FIGURA 2.14 Estimativa da distribuio espacial de prevalncia de dengue em
Goinia (Marteli et al., 2004).
perifrica da cidade, principalmente no
sudeste com altas taxas de prevalncia
de dengue.
Em alguns casos, principalmente
nas avaliaes de qualidade
ambiental, as variveis no so
dicotmicas. Por exemplo, os
resultados da anlise de amostras de
gua mostram uma variao gradual
dos valores de cloro, flor, turbidez e
outros parmetros usados para o
controle e vigilncia. Essas variveis
so chamadas contnuas e podem ser
usadas em uma tcnica de Kernel.
Nesse caso, a resposta grfica da
tcnica uma grade com valores
interpolados da varivel selecionada.
O exemplo a seguir (Figura 2.15)
mostra o resultado de tcnica de
Kernel aplicada qualidade da gua
FIGURA 2.15 Interpolao de valores de flor na rede de distribuio de gua no Rio
no Rio de Janeiro. Cada ponto no de Janeiro, usando-se a estimativa Kernel (Barcellos et al., 1998).

mapa mostra um local de coleta de


amostra para avaliao da qualidade.
A varivel usada para avaliar a
qualidade da gua nesse caso foi a
concentrao de flor (em mg/l).
Essa uma tcnica muito utilizada
para se obter interpolaes de dados
no espao. As interpolaes so
importantes para se avaliar a
distribuio espacial de um processo
contnuo no espao, baseadas em
amostras pontuais deste processo.
Isso se d principalmente para os
processos ambientais, em que se
espera que variem suavemente no
espao e que tenham uma forte
dependncia espacial. No caso do
controle da qualidade da gua, obvio
57
CAPTULO 2 - Anlise de Dados em Forma de Pontos

que no se dispe de recursos para se amostrar todas as residncias existentes


em uma cidade. Os mtodos de interpolao permitem que se estime essa
qualidade em reas no amostradas.

Outros recursos de um SIG

O trabalho de localizar e testar os possveis aglomerados de pontos pode ser feito dentro de um SIG ou usando-
se um outro programa que importe dados deste SIG e exporte resultados para este SIG. O programa Terraview
tem sido aperfeioado para incorporar diversas ferramentas de anlise espacial que podem ser usadas com
esse fim. Outras ferramentas esto disponveis em programas gratuitos, como o R, Crimestat e Satscan.

Depois de identificar esses aglomerados ainda h muito a fazer. A Vigilncia em Sade deve procurar entender
como e por que estas reas, destacadas pelos mtodos estatsticos, diferem das outras. Um trabalho importante
nesta etapa retornar os resultados estatsticos para o SIG para verificar o que caracteriza essas reas. Isso pode
ser feito atravs da confeco de mapas temticos sobre as condies socioeconmicas, por setor censitrio.

A figura abaixo mostra a proporo de domiclios sem banheiro nos setores censitrios (em tons de verde). Sobre
esta camada so mostrados os aglomerados de casos de hepatite A segundo o mtodo do vizinho mais prximo
(em pequenas elipses vermelhas).

Fonte: Neri, 2004.

58
2.7 - Interpolao de Dados Pontuais

Tambm podem ser adicionadas novas camadas de informao que auxiliem a interpretao dos resultados
estatsticos, como a localizao de unidades bsicas de sade, de crregos e rios, etc.

Outro recurso importante avaliar a rea identificada pelos mtodos estatsticos por meio de outras fontes de
informao. A figura abaixo mostra a mesma rea ao sul da Cidade de Macap segundo o programa Google Earth.

Fonte: http://earth.google.com/intl/pt/

Nesse programa, pode-se entrar com as coordenadas de um local em que se deseja visualizar a imagem de
satlite. Com instrumentos de medio de distncia se pode calcular um raio de 1 km em torno deste ponto,
identificado como o centro do aglomerado de casos. Usando-se esse recurso pode-se visualizar que grande
parte das casas dentro desse raio est em reas de favelas de palafitas, com ms condies de saneamento.

59
3

Anlise Espacial
de Dados de reas

Wayner V. Souza

Marilia S Carvalho

Oswaldo G. Cruz

Virginia Ragoni
Captulo 3:
Anlise Espacial de Dados de reas

3.1 - Mtodos para Espacializao e


Tratamento Estatstico de Indicadores pg. 63

Instabilidade em Pequenas reas


pg. 63

Matriz de Vizinhana
pg. 65

3.2 - Mtodos de Suavizao Espacial


pg. 66

Mdia Mvel Espacial


pg. 66

Estimador Bayesiano Emprico


pg. 66

Autocorrelao Espacial
pg. 69

3.3 - Anlise da Estrutura Espacial


pg. 71

Anlise da Estrutura Espacial -


Estatstica de Moran
pg. 71

Anlise da Estrutura Espacial -


Estatstica-Funo LISA
pg. 72

Anlise da Estrutura Espacial -


Mtodos Inteiramente Bayesianos
pg. 73

Anlise da Estrutura Espacial -


Mtodo de Markov Chain-Monte Carlo
pg. 75

3.4 - Tcnicas de Anlise de Dados Pontuais


Aplicadas a reas pg. 78
3.1 Mtodos para Espacializao e
Tratamento Estatstico de Indicadores

Instabilidade em Pequenas reas

As taxas brutas, como de incidncia e de mortalidade, so os estimadores


de risco mais simples e mais usados para o mapeamento da ocorrncia de
doenas e agravos, e so calculados como a razo entre o nmero de casos
ou bitos ocorridos na rea e o nmero de pessoas expostas nesta rea. Um
grande problema associado ao uso de taxas brutas, porm, a alta
instabilidade que elas possuem para expressar o risco de um evento quando
ele raro e a populao da regio de ocorrncia pequena.
As grandes flutuaes que ocorrem com essas taxas podem nada ter a ver
com o fenmeno e sim com a ocorrncia de um ou dois casos do evento a
mais ou a menos numa determinada localidade, causando variaes abruptas
nas taxas brutas se a sua populao for pequena, este efeito no ocorre em
grandes populaes.
A figura 3.1 mostra a disperso das taxas de Acidentes de Transporte (CID-
BR) versus o logaritmo natural da Populao para todos os municpios do Brasil
no ano de 2004. Observe a forma de funil e a grande variabilidade encontrada
nos municpios com populaes de cerca de 3.000 habitantes (log N = 8).

FIGURA 3.1 Taxas de mortalidade por acidentes de transporte nos municpios


brasileiros em 2004, segundo tamanho populacional.

Taxas de mortalidade por Acidentes de Transporte


Brasil 2004
300
Taxa p/ 100.000 hab.

200
100
0

8 10 12 14 16
Log da Populao

Fonte: DATASUS.
CAPTULO 3 - Anlise Espacial de Dados de reas

Pode-se observar melhor esse fenmeno construindo um boxplot com os


mesmos dados, em intervalos da populao como pode ser visto na figura 3.2.
Cerca de 25% dos municpios brasileiros possuem menos de 5.000 habitantes.
Assim sendo, podemos, com freqncia, ser levados a falsas interpretaes e
concluses ao analisarmos mapas de taxas brutas.
A figura 3.3 mostra o mapa da taxa de acidentes de transporte por 100.000
habitantes para o ano de 2004 nos municpios do Brasil. Pode-se observar,
que por simples inspeo visual, no possvel identificar um padro de
ocorrncia do evento, principalmente por estarmos representando taxas
sujeitas a variaes conforme demonstrado nas figuras 3.2 e 3.3.

FIGURA 3.2 Taxas de mortalidade por acidentes de transporte FIGURA 3.3 Mapa temtico das taxas de mortalidade por
nos municpios brasileiros em 2004, segundo faixas de tamanho acidentes de transporte nos municpios brasileiros em 2004.
populacional.

Boxplot das Taxas de mortalidade por


Acidentes de Transporte Brasil - 2004

30
0
Taxa por 100.000 hab.

20
0

10
0

<5 5-10 10-50 50-100 100-1.000 >1.000


Populao X 1.000

Fonte: DATASUS. Log da Populao Fonte: DATASUS.

FIGURA 3.4 Taxas de mortalidade mdia por acidentes de Figura 3.5 - Mapa temtico das taxas mdias de mortalidade
transporte nos municpios brasileiros em 2002, 2003 e 2004, por acidentes de transporte nos municpios brasileiros em 2002,
segundo faixas de tamanho populacional. 2003 e 2004.
Boxplot das Taxas trienal de mortalidade por
Acidentes de Transporte Brasil - 2002 a 2004

30
0
Taxa por 100.000 hab.

20
0

10
0

<5 5-10 10-50 50-100 100-1.000 >1.000


Populao X 1.000

Fonte: DATASUS. Fonte: DATASUS.

64
3.1 - Mtodos para Espacializao e Tratamento Estatstico de Indicadores

O Estimador por Mdias Mveis Temporais uma das maneiras de se


contornar o problema. Uma das mais freqentes a utilizao da mdia trienal,
ou seja, usa-se a mdia de casos no perodo de 3 anos para cada municpio,
obtendo-se assim uma estabilizao das taxas. A figura 3.4 mostra a mdia
trienal da taxa dos Acidentes de Transporte para os anos de 2002, 2003 e
2004, representados na mesma escala que a figura 3.2. Note que o efeito funil
ainda existe, mas que houve uma grande reduo da variabilidade das taxas
nos municpios de populaes menores.
Olhando no mapa da figura 3.5, que utiliza a mesma escala da figura 3.3,
podemos notar a suavizao introduzida.
Existem outras maneiras de se lidar com esse problema, as quais sero
discutidas a seguir. A base para esses mtodos consiste na criao de uma
matriz de vizinhana.

Matriz de Vizinhana
Um procedimento necessrio para a analise de dados de rea a construo
de uma matriz de vizinhana, tambm conhecida como matriz de distncia,
matriz de conectividade ou matriz de proximidade. Essa matriz de conectividade
indica a relao espacial de cada rea com as demais. Essa matriz pode ser
composta, por exemplo, apenas pela lista de vizinhos de cada municpio; ou a
distncia entre municpios ligados por estradas; ou ainda a conectividade
ponderada pelo comprimento da fronteira comum.
A figura 3.6 apresenta os municpios do Estado de Roraima, a partir dos
quais foi construda uma matriz baseada na vizinhana, por meio da atribuio
de valores: 1 para os municpios que possuem fronteiras em comum, e 0 para
os municpios que no compartilham fronteiras.
A matriz de vizinhana referente ao mapa da figura 3.6 pode ser vista na figura 3.7.
Observe, por exemplo, que a capital Boa Vista tem 7 vizinhos e que o
municpio de Uiramut no extremo norte tem apenas 2 vizinhos.

FIGURA 3.6 Mapa do Estado de Roraima com FIGURA 3.7 Matriz de Vizinhana para os municpios do Estado de Roraima.
diviso por municpios.
So Joo da Baliza
Rorainpolis
Alto Alegre

Normandia

Pacaraima
Caracara
Boa Vista

Uiramut
Caroebe

So Luiz
Iracema

Mucaja
Amajari

Bonfim

Cant

Amajari 1 1 0 0 0 0 0 0 0 1 0 0 0 0
Alto Alegre 1 1 0 0 0 0 1 1 0 0 0 0 0 0
Boa Vista 1 1 1 1 0 0 0 1 1 1 0 0 0 0
Bonfim 0 0 1 1 1 0 0 0 1 0 0 0 0 0
Cant 0 0 1 1 1 0 1 1 0 0 0 0 0 0
Caracara 0 0 0 1 1 1 1 0 0 0 1 1 1 0
Caroebe 0 0 0 0 0 1 0 0 0 0 0 1 0 0
Iracema 0 1 0 0 1 1 0 1 0 0 0 0 0 0
Mucaja 0 1 1 0 1 0 0 1 0 0 0 0 0 0
Normandia 0 0 1 1 0 0 0 0 0 1 0 0 0 1
Pacaraima 1 0 1 0 0 0 0 0 0 1 0 0 0 1
Rorainpolis 0 0 0 0 0 1 0 0 0 0 0 1 1 0
So Joo da Baliza 0 0 0 0 0 1 1 0 0 0 0 1 1 0
So Luiz 0 0 0 0 0 1 0 0 0 0 0 1 1 0
Uiramut 0 0 0 0 0 0 0 0 0 1 1 0 0 0

Fonte: DATASUS.

65
CAPTULO 3 - Anlise Espacial de Dados de reas

3.2. Mtodos de Suavizao Espacial

Mdia Mvel Espacial

Quando se estabiliza a taxa de ocorrncia de um evento utilizando o mtodo


de mdias mveis, o valor atribudo a cada rea igual soma dos eventos
nos vizinhos dividida pela populao total (somadas as populaes de todas
as reas). Nesse caso, as reas com maior populao tm mais peso na
estimativa desse indicador. Entretanto, a rea do municpio central e a de seus
vizinhos recebem o mesmo peso sem ser possvel atribuir pesos distintos
entre os municpios.

Estimador Bayesiano Emprico

Outra forma de suavizar a flutuao associada s pequenas reas usando-


se o mtodo denominado estimador bayesiano emprico. Nesse caso,
supomos que a taxa real i , que de fato expressa a fora de ocorrncia do
evento na rea i, uma varivel aleatria com mdia i e varincia i2.
O melhor estimador dessa taxa uma combinao linear entre a taxa
observada (eventos/populao) na rea i e um valor mdio i ponderados por
um fator wi da seguinte forma:

i = wi ti + (1 wi ) i

Essa mdia usada na ponderao pode ser a taxa mdia da regio toda
de estudo, quando chamamos o mtodo de bayesiano emprico global, ou
pode ser a mdia dos vizinhos, mtodo ao qual chamaremos de bayesiano
emprico local.
O fator de ponderao wi tanto menor quanto menor a populao em
estudo da i sima rea, e reflete o grau de confiana a respeito de cada taxa.
Contrariamente, se confiamos bastante no valor estimado da taxa (populaes
maiores), wi se aproxima de 1 (um), e, conseqentemente, o peso (1- wi ) da
mdia dos vizinhos se aproxima de 0 (zero).
Para o caso de populaes reduzidas, a confiana na taxa observada diminui
e a estimativa da taxa se aproxima de nosso modelo a priori (ou seja, se
aproxima de i ).
Regies com populaes muito baixas tero uma correo maior, e regies
populosas tero pouca alterao em suas taxas. Logo i ser estimado, quando
n for pequeno, com maior peso da mdia da vizinhana, no caso do estimador
local ou da taxa geral da regio no caso do estimador global.
66
3.2 - Mtodos de Suavizao Espacial

Chamamos o mtodo de bayesiano emprico porque a mdia e a varincia


sero estimadas a partir dos dados, considerando que cada valor observado
apenas uma realizao de um mesmo processo de mdia i e varincia i2 .
Estimar a mdia fcil:

= yi
n i
, onde yi a contagem do
evento em cada rea e ni a populao. No caso da suavizao bayesiana local,
esta a taxa do evento entre os vizinhos. No caso global a taxa da regio
toda. A varincia, da mesma forma, estimada com base na varincia das
taxas de cada rea em relao mdia i .
Voltando ento ao fator de ponderao wi , este a varincia da taxa entre os
vizinhos dividida pela soma desta varincia com uma frao da mdia i / ni :

i2
wi =
i
i2 + ni

Observe que quando a populao ni muito grande, o elemento somado ao


denominador se aproxima de zero, e o fator de ponderao fica igual a um. Ou
seja, os vizinhos no influenciam o valor estimado da taxa. O que faz todo o sentido.

interessante observar na figura 3.9, comparando com a figura 3.8, que


no h mais bairros com taxa igual a zero. Isso significa que os locais com 0
(zero) casos, muito provavelmente, no tinham populao suficiente para
que os casos aparecessem. Por outro lado, a maior taxa agora 13,59 em
vez de 144,33 por 100.000 habitantes dadas as suavizaes dos valores
originais, evidenciada no mapa. Alm disso, diversos bairros mudaram de
classe. O mais importante que os dados agora refletem melhor o risco real
de deteco de casos de hansenase, e no a presena de flutuao aleatria.
Cabe lembrar que reas que tm apenas um vizinho no se beneficiam
muito dessa tcnica, pois somente este vizinho contribuir para estimar
o indicador.
Alguns cuidados so essenciais na hora de calcular o estimador
bayesiano, particularmente o tipo (critrio) de matriz de vizinhana adotada.
Pode-se adotar critrios de vizinhana por adjacncia (como no exemplo
acima), por distncia (entre centrides, por exemplo), por quantidade (5
polgonos mais prximos, por exemplo), etc.

67
CAPTULO 3 - Anlise Espacial de Dados de reas

FIGURA 3.8 Recife: Taxas de deteco mdia de hansenase em menores de 15 anos,


para o perodo 1993-1997, por bairro.

Fonte: SES-PE, 1998.

FIGURA 3.9 Recife: Taxas de deteco mdia obtidas por mtodo bayesiano
emprico local, em menores de 15 anos, para o perodo 1993-1997, por bairro.

Fonte: SES-PE, 1998.

68
3.2 - Mtodos de Suavizao Espacial

Autocorrelao Espacial

A estrutura de dependncia entre os valores observados nas vrias reas


do fenmeno em estudo analisada pela funo de autocorrelao espacial.
Autocorrelao, como o prprio nome indica, mede a correlao da prpria
varivel, e, sendo espacial, no espao. A correlao de uma varivel com ela
mesma, medida no mesmo local, ser sempre 1 (UM). Entretanto, a correlao
de uma varivel com ela mesma, porm medida nas reas vizinhas, ter um
valor que varia entre -1 e 1 (como qualquer medida de correlao). Quanto
mais prximo de 1 (UM), maior a semelhana entre vizinhos. O valor 0 (zero)
indica inexistncia de correlao, e valores negativos indicam dessemelhana.
Vejamos como isso funciona:
Em primeiro lugar, como a funo TABELA 3.1 Matriz de vizinhana espacial por adjacncia e Taxas de Mortalidade
Infantil (/1000 Nascidos Vivos) - Exemplo
de autocorrelao espacial, pre-
cisamos utilizar a matriz de vizinhana, MUNICPIO gua Bebedouro Cacimba Nascente Poo TMI
Santa
como no exemplo ao lado (Tabela 3.1),
onde consideramos vizinhos os gua Santa 0 1 0 1 1 22,3

municpios que partilham de fronteira


Bebedouro 1 0 0 1 0 26,5
comum. Nesse caso, a matriz
simtrica: valor 1 (UM) quando so
Cacimba 0 0 0 0 1 18,4
vizinhos e 0 (ZERO) caso contrrio.
O valor do indicador em estudo,
Nascente 1 1 0 0 0 23,0
nesse exemplo, a taxa de mortalidade
infantil (TMI), est apresentado na
Poo 1 0 1 0 0 20,7
ltima coluna da tabela. A mdia e a
varincia apresentadas no so Mdia das Taxas (y) 22,18
parmetros globais, simplesmente
so parmetros calculados para a Varincia das Taxas 7,17
distribuio das taxas dos municpios.
A funo de correlao usual compara valores de duas variveis. A funo
de autocorrelao a correlao do valor do indicador comparado aos valores
do mesmo indicador nos municpios vizinhos. Assim, matematicamente, a
funo expressa como:

n n

1
w
i=1 j=1 ij
(y i y)(y j y)
1= n n x
VAR(y)
w
i=1 j=1 ij

sendo wij o indicador de vizinhana (no nosso exemplo 0 ou 1), yi o valor do


indicador na rea i e yj o valor em j, y a mdia e VAR( y ) a varincia das taxas.

69
CAPTULO 3 - Anlise Espacial de Dados de reas

Traduzindo os somatrios e produtos em palavras, temos no numerador


que, sempre que i e j forem vizinhas (1 na matriz acima), somamos o produto
do desvio das reas i e j em relao ao valor mdio y . No denominador temos
simplesmente a varincia do indicador.
Na tabela 3.2 apresentamos o clculo da funo de autocorrelao para
nosso exemplo. Na ltima coluna, o valor registrado cada parcela que entra
no somatrio. Observe que quando os municpios no so vizinhos, a
contribuio deles nula para o clculo do indicador.

TABELA 3.2 Auxlio ao clculo da autocorrelao espacial.

DUPLAS DE MUNICPIOS Vizinhana Taxa em i Taxa em j w x(y -y)x(y -y)


ij i j
( W ij) ( yi ) ( yj )

gua Santa x Bebedouro 1 22,3 26,5 0,518

gua Santa x Cacimba 0 22,3 18,4 0,000

gua Santa x Nascente 1 22,3 23,0 0,098

gua Santa x Poo 1 22,3 20,7 -0,178

Bebedouro x Cacimba 0 26,5 18,4 0,000

Bebedouro x Nascente 1 26,5 23,0 3,542

Bebedouro x Poo 0 26,5 20,7 0,000

Cacimba x Nascente 0 18,4 23,0 0,000

Cacimba x Poo 1 18,4 20,7 5,594

Nascente x Poo 0 23,0 20,7 0,000

SOMA 5 9,576

Ao compararmos essa tabela com a matriz de vizinhana pode-se verificar


que as somas obtidas referem-se apenas a uma parte dela (inferior ou superior),
com relao diagonal principal. Como a matriz simtrica, as somas que
procuramos sero exatamente o dobro das aqui obtidas. Portanto:

n n

wi=1 j=1 ij
= 2 x 5 = 10

n n

w (y y)(y y) = 2 x 9,576 = 19,152


i=1 j=1
ij i j

n n

1
w (y y)(y y)
i=1 j=1 ij i j
1 19,152
1= n n x = X = 0,267
VAR(y) 10 7,17
w
i=1 j=1 ij

70
3.2 - Mtodos de Suavizao Espacial

Pode-se tambm adotar outra forma de vizinhana, por exemplo, por


distncia. Na coluna de vizinhana, w ij passa a ser um valor contnuo,
resultante do produto da distncia por 1 ou 0, conforme sejam ou no vizinhas
as reas consideradas.
Poderamos considerar alm de vizinhos de primeira ordem, ou vizinhos
diretos, os vizinhos de segunda ordem. O vizinho k de j ser vizinho de
segunda ordem de i, se i e j forem vizinhos.
Em nosso exemplo, o valor da funo de autocorrelao, quando
consideramos apenas vizinhos de primeira ordem, ou vizinhos diretos,
0,267. O valor da funo de autocorrelao, para vizinhos diretos,
denominado estatstica I de Moran, e utilizado como teste para verificar a
presena de cluster espacial, necessitando para tanto calcular a significncia
do valor encontrado.

3.3. Anlise da Estrutura Espacial

Anlise da Estrutura Espacial - Estatstica de Moran

O conceito de estacionariedade aplicado a reas geogrficas significa que


a mdia do processo medido em estudo no constante em todas as subreas.
Um bom exemplo de dado no estacionrio a incidncia cncer de pele
do tipo basocelular, que aumenta com: (a) a insolao, e conseqentemente
diminui conforme aumenta a latitude; (b) com a cor da pele da populao,
sendo mais freqente em populao de pele mais branca; e (c) com a
presena de buracos da camada de oznio, que diminuem a proteo contra
os raios ultravioleta. Ou seja, fatores que fazem com que haja uma clara
tendncia espacial.
O teste de Moran para deteco de padro de distribuio de eventos em
cluster no deve ser usado quando o dado no estacionrio. Uma das formas
de avaliar se o dado ou no estacionrio, alm de olhar atentamente o mapa
em busca de padres, utilizar a funo de autocorrelao espacial
considerando vizinhos de diversas ordens. Quando o dado no estacionrio
a funo decresce muito lentamente.
Uma observao importante dessa funo que, se houver uma variao
na mdia conforme a subrea geogrfica, por exemplo, aumentando com a
latitude, os valores da estatstica sero muito grandes. Isso porque ao
comparar valores do indicador nos municpios com a mdia global (o
numerador), se dois municpios esto do mesmo lado da rea geogrfica, os
desvios em relao ao global sero na mesma direo positiva ou negativa

71
CAPTULO 3 - Anlise Espacial de Dados de reas

e quanto mais afastados da mdia, mais contribuiro para a estatstica.


Um processo estocstico (aleatrio) estacionrio quando sua distribuio
de probabilidade a mesma em qualquer ponto do tempo ou local. Por
exemplo, se medirmos a taxa de mortalidade por cncer de pulmo, nos
municpios do Brasil poderemos afirmar que a mdia e a varincia em cada
estado aproximadamente constante.

Anlise da Estrutura Espacial - Estatstica-Funo LISA

Outra abordagem para a anlise da estrutura espacial a funo LISA, ou


funo de autocorrelao local. Da mesma forma que podemos utilizar o mtodo
bayesiano emprico global e local, pode-se estimar a autocorrelao de primeira
ordem, global Moran, e local LISA. Nesse caso, em vez de utilizar o indicador
global, utiliza-se o valor do indicador na subrea composta por vizinhos.
Essa estatstica interessante, pois permite comparar o valor de cada municpio
com seus vizinhos. Em geral se utiliza o indicador normalizado, ou seja, a diferena
entre a mdia global e o valor em cada municpio, dividida pelo desvio padro, de
forma que a unidade do indicador passa a ser unidades de desvio padro de
afastamento da mdia. Essa tcnica permite visualizar graficamente, atravs do
diagrama de espalhamento de Moran, o grau de similaridade entre vizinhos.
FIGURA 3.10 Diagrama de
Espalhamento de Moran. Colocando-se no eixo X o valor do indicador do municpio i normalizado e no eixo
Y o valor da estatstica de Moran somente entre os vizinhos de i, cada quadrante do
grfico (Figura 3.10) pode ser interpretado como:
Q1 (valores positivos, mdias positivas) e Q2 (valores negativos, mdias
negativas): indicam pontos de associao espacial positiva, no sentido que
uma localizao possui vizinhos com valores semelhantes;
Q3 (valores positivos, mdias negativas) e Q4 (valores negativos, mdias
positivas): indicam pontos de associao espacial negativa, no sentido que
uma localizao possui vizinhos com valores distintos.
De forma similar aos indicadores globais, a significncia do ndice local de
Moran ( Ii ) deve ser avaliada, utilizando-se hiptese de normalidade ou
simulao de distribuio por permutao aleatria nos valores dos atributos
(Anselin, 1995).
Uma vez determinada a significncia estatstica de Moran (Ii) muito til
gerar um mapa indicando as regies que apresentam correlao local
significativamente diferente do resto dos dados.
Esse mapa denominado por Anselin (1995) de LISA MAP.
Na gerao do LISA MAP, os ndices locais Ii so classificados como:
no significantes;
com significncia de 95% (1,96 sd), 99% (2,54 sd) e 99,9% (3,2 sd).

72
3.3 - Anlise da Estrutura Espacial

Na figura 3.11, o primeiro mapa FIGURA 3.11 Indicadores Locais de Autocorrelao Espacial.
mostra indicadores de qualidade de
vida no municpio de So Paulo. No
segundo mapa, as reas em verde
tm alta correlao entre vizinhos,
isto os indicadores se parecem.
Nas reas em azul claro, h uma
pequena correlao entre indica-
dores de reas vizinhas e nas reas
em branco, as reas se parecem
menos. Isso quer dizer que no
municpio de So Paulo existem trs
grandes reas homogneas: uma no sul e outra na zona leste da cidade,
com baixos ndices de qualidade de vida, e uma rea central com melhores
ndices de qualidade de vida.

Anlise da Estrutura Espacial - Mtodos Inteiramente


Bayesianos

A anlise da distribuio espacial de eventos de sade visa a identificar seu


padro espacial, por meio de mapas de risco, relativos s unidades territoriais
de anlise, de forma a apontar as reas de maior gravidade do problema e
facilitar o planejamento de intervenes de Sade Pblica. Para tal, pode-se
utilizar o mtodo bayesiano completo para estimao da funo de densidade
de probabilidade do risco relativo analisado espacialmente, levando em
considerao co-fatores socioeconmicos e ambientais, alm de indicadores
de ateno sade e/ou de efetividade das aes de controle que interferem
no processo, como forma de resolver as questes relativas incorporao do
espao como categoria de anlise, aqui levantadas.
Assim, a abordagem bayesiana prope que o nmero de casos ocorridos
em cada uma das n reas geogrficas, y = ( y1 , y2 , ....., yn ), so realizaes
de uma varivel aleatria y = (y1 , y2 , ....., yn ) com distribuio de Poisson
e com mdia = ( 1 , 2 , ..., n ).
Sob a hiptese de no haver diferenas entre as taxas de incidncia, no
espao, pode-se estimar o vetor e = ( e1 , e2 , ..., en ), de casos esperados
para cada rea, pela simples aplicao da taxa mdia de incidncia do
municpio, unidade da federao (UF), ou pas populao de cada uma destas
reas, no perodo de estudo.
Sendo assim, podemos definir o risco relativo para a ocorrncia do evento
em cada rea i ( i ), como:
i
i = ei

73
CAPTULO 3 - Anlise Espacial de Dados de reas

O modelo bayesiano estima esses riscos, considerando a possvel


influncia de co-fatores socioeconmicos e ambientais, de ateno sade
e/ou de efetividade das aes de controle.
i
Dado isso e a expresso i = ei , podemos escrever que i
= ei i
ou, aplicando-se uma transformao logartmica, log(i ) = log(ei ) + log( i ),
onde log(i ) o logaritmo neperiano do risco relativo, para cada rea e que
pode ser modelado como:

log(i ) = 0 + 1 xi1 + 2 xi2 + ... + k xik + i + vi

onde 0 a constante do modelo e os j ( j = 1, 2..., k) so os


parmetros que refletiro a influncia de cada co-fator sobre o risco relativo; xij
( j = 1, 2..., k) o vetor de co-fatores referente a cada rea ii ; i representa
a componente aleatria espacialmente estruturada do risco relativo e v i o
componente aleatrio no-espacial.
Sinteticamente, podemos dizer que o risco relativo modelado por meio de
um modelo log-linear, onde so consideradas duas componentes aleatrias:
uma espacial e outra no-espacial.
Portanto temos:

k
log(i ) = log (ei ) + 0 + j xj + i + vi
j=1

onde o componente vi um efeito aleatrio no-espacial que permitir,


analisando-se sua distribuio, interpretar se as variveis explicativas includas
no modelo so suficientes na explicao do fenmeno, tal qual nos modelos
de regresso clssicos.
O componente i um efeito aleatrio que representa um residual de risco
relativo espacialmente estruturado, que pode ter sua estrutura definida usando-
se um modelo auto-regressivo condicional normal (CAR-Normal) dado por:

Wij j
p (i /ji ) ~ N j i ,
Wij
j i

j i
Wij

onde wij sendo igual a 1 se os setores i e j forem adjacentes e 0 em caso


contrrio, o que significa dizer que foram considerados vizinhos os setores
censitrios adjacentes.
O modelo utilizado para definio da estrutura dosi um modelo auto-
regressivo condicional normal, dado que o efeito aleatrio espacial ( i ) de

74
3.3 - Anlise da Estrutura Espacial

uma determinada rea est condicionado to somente aos efeitos aleatrios


de sua vizinhana ( j ; j i), atravs de uma relao linear. Por conseguinte,
i tem distribuio normal com mdia igual mdia de sua vizinhana e
desvio padro inversamente proporcional ao tamanho desta vizinhana.
Para implementao do modelo utiliza-se o mtodo de simulao MCMC
(Markov Chain-Monte Carlo) usando-se o programa WinBugs (http://www.mrc-
bsu.cam.ac.uk/bugs/winbugs/contents.shtml), que gera amostras da
distribuio de p ( / y ), que a distribuio conjunta a posteriori de , e
v, dadas as observaes y.

Anlise da Estrutura Espacial - Mtodo de Markov


Chain-Monte Carlo

Define-se um processo Markoviano como um processo estocstico que


represente observaes de um sistema, obedecendo a certas leis de
probabilidade com o seguinte princpio: a probabilidade de o sistema estar,
num determinado estado, no momento t2 , pode ser deduzida a partir do
conhecimento do seu estado num momento anterior t1, e no depende da
histria do sistema antes do momento t1.
Os processos de Markov podem ser classificados no s pelo seu parmetro,
mas tambm pelo conjunto de valores possveis do processo estocstico, que
pode ser contnuo ou discreto. Os processos de Markov, em que o conjunto de
valores possveis discreto, so chamados de cadeias de Markov.
Sendo assim, dado um conjunto discreto de variveis aleatrias
X = ( X 0 , X 1 , .... X m-1 , X m , ... , X n ) , pode-se dizer que:

P ( Xm = xm / X0 = x0 , X1 = x1 , ... , Xm-1 = xm-1 ) = P ( Xm = xm / Xm-1 = xm-1 )

A obteno dos vrios resultados desse processo estocstico (valores da varivel


aleatria X ) se d, ento, por simulao, usando-se o mtodo de Monte Carlo.
Nesse modelo, o que se necessita obter so os valores mdios dos riscos
relativos ( i ) para cada setor censitrio, que por sua vez modelado em
funo de co-fatores que so ponderados pelos parmetros j . Ento temos
de obter os valores mdios de cada j , por simulao, assumindo que os j
tm uma distribuio a priori pouco informativa, no caso uma distribuio
Normal, com mdia igual a zero e varincia muito grande, dado que o objetivo
da modelagem dos i rejeitar a hiptese nula, H0 : j = 0.
O mtodo de Monte Carlo consiste, ento, na gerao, atravs de nmeros
aleatrios da distribuio de probabilidade a priori adotada, de N (nmero de
simulaes) valores para cada j , ou seja, j1 , j2 , ....., jN . Assim, a varivel
j+ = j1+ j2 + ..... + jN tem, pelo teorema do limite central, distribuio
aproximadamente Normal com mdia igual a N x m e varincia igual a N x s2,
onde m e s so, respectivamente, a mdia e a varincia dos jk .
75
CAPTULO 3 - Anlise Espacial de Dados de reas

N
jk
Sendo assim, a varivel j = k=1 ter distribuio Normal com mdia
N
igual a m e desvio padro igual a s .
N

Teorema do Limite Central

Sejam X1 , X2 , X3 , ... , Xn variveis aleatrias independentes e

identicamente distribudas com mdia finita e varincia 0 < 2 <


n
Xi
e seja X = i=1 , ento X N ; n .
n

Procedimento idntico deve ser adotado, com o mesmo mtodo de simulao,


para obteno dos parmetros e v includos na modelagem dos i .
A ttulo de exemplo, tomemos o caso da tuberculose em Olinda no perodo
1996-2000. Os dados referentes ao perodo so apresentados na tabela 3.3.

TABELA 3.3 Casos de tuberculose notificados e georreferenciados em Olinda, 1996-2000.

ANO Total de casos Referenciados por Proporo Populao Incidncia por


notificados setor censitrio georreferenciada ajustada para o 100.000 hab.
(%) meio do perodo
1996 433 366 84,5 349.243 124,0

1997 411 339 82,5 353.783 116,2

1998 419 360 85,9 358.381 116,9

1999 381 320 84,0 363.039 104,9

2000 340 293 86,2 367.758 92,5

TOTAL 1984 1678 84,6 358.381 110,7

FIGURA 3.12 Taxas de Incidncia Mdia de Tuberculose por 100.000 habitantes em


No perodo de 1996 a 2000, foram
Olinda, 1996-2000.
registrados 1.984 novos casos de
tuberculose em residentes no
Municpio de Olinda, resultando em
uma taxa de incidncia mdia
superior a 1,0 caso novo para cada
1.000 habitantes, o que representa
quase o dobro da mdia nacional.
Incidncia 1996-2000
O mapa de padro de incidncia
0.0 42.2
42.2 86.0 segundo setores censitrios
86.0 142.2 apresentado na figura 3.12, ao lado.
142.2 215.9
215.9 390.1
Setores Censitrios

76
3.3 - Anlise da Estrutura Espacial

Variveis explicativas e modelo

O modelo empregado foi:

log ( i ) = log ( ei ) + 0 + 1 log ( x1 ) + 2 log (1+ x2 ) +

3 log (1+ x3 ) + 4 log (1+ x4 ) + 5 log (1+ x5 ) + i + vi


onde:
x1 : mdia de habitantes por domiclio no setor;
x2 : porcentual de chefes de famlia sem instruo ou com menos de um
ano de instruo, por setor;
x3 : porcentual de chefes de famlia sem rendimento ou com renda inferior a
um salrio mnimo mensal, por setor;
x4 : nmero de casos de retratamento no setor;
x5 : nmero de domiclios com mais de um caso no perodo, por setor.

Assim, o risco relativo foi estimado no modelo como:

k
(0 + j xj + i + vi i)
i = e j=1

Dessa forma, pode-se calcular a medida de efeito de cada co-varivel, na


magnitude do risco relativo, como sendo igual exponencial do respectivo j .
A etapa final relativa modelagem consiste na anlise de convergncia
dos modelos, que a verificao da estabilidade das estimativas produzidas
por mtodos de simulao, como o MCMC, e pode ser efetuada com emprego
da rotina BOA (bayesian output analysis, disponvel em www.mrc-
bsu.cam.ac.uk/bugs) executada pelo software S-PLUS.
FIGURA 3.13 Riscos Relativos para a ocorrncia da tuberculose
Existe um grande elenco de mtodos de anlise de em Olinda, segundo setores censitrios, com emprego de Mtodo
Bayesiano Completo.
convergncia, disponvel na literatura especializada. Aqui
foi utilizado o de Heidelberger & Welch (Brooks, 1998),
que consiste em testar a hiptese nula de que os
valores obtidos por simulao, para cada varivel,
formam um processo estacionrio. A rejeio da
hiptese nula indica a necessidade de produzir-se um
nmero maior de simulaes para o modelo.

Resultados

Pode-se observar os riscos relativos estimados pelo


modelo na figura 3.13. Esses riscos so, em realidade,
uma representao probabilstica do risco de ocorrncia
da tuberculose, ou seja, uma identificao do processo
estocstico gerador do risco, livre da interferncia de
flutuaes aleatrias.

77
CAPTULO 3 - Anlise Espacial de Dados de reas

FIGURA 3.14 Olinda: Setores Censitrios com risco relativo para Esses resultados permitem analisar e identificar
a ocorrncia da tuberculose igual ou maior que 150%.
formas realistas de enfrentamento do problema diante
da escassez de recursos, por vezes presente,
conforme exemplificado na figura 3.14. Pode-se, por
exemplo, no mbito do SIG, selecionar reas com risco
relativo maior do que 1,5 (150%) como forma de
identificar reas prioritrias para intensificao de
aes de vigilncia e controle.
As reas assinaladas (em vermelho) correspondem
a 47 setores censitrios que totalizaram 629 casos
de tuberculose, no perodo 1996-2000 (37,5% do total),
tendo uma populao de 59.587 habitantes (16,6%
do total), o que implica uma incidncia mdia anual
de 211,1 por 100.000 habitantes.

3.4. Tcnicas de Anlise de Dados Pontuais


Aplicadas a reas

Na anlise espacial de taxas epidemiolgicas e eventos de sade


referidos a reas geogrficas, pode-se estar interessado na produo de
mapas de superfcies contnuas como forma de produzir uma visualizao
menos fragmentada da distribuio do evento, identificando as reas
quentes. Para tal, pode-se adotar tcnicas at aqui descritas como
apropriadas anlise de dados pontuais (como o estimador de intensidade
Kernel, por exemplo), obviamente cercando-se de alguns cuidados no que
diz respeito interpretao dos resultados.
A ttulo de exemplo, usaremos os dados de uma coorte de casos de
tuberculose, notificados entre 2003 e 2005 na Cidade do Recife, gentilmente
cedidos pelo Prof. Ricardo Ximenes, da Universidade Federal de Pernambuco,
que coordena o Projeto de Pesquisa que coletou os dados.
Nesse exemplo, foram usadas as informaes sobre setor censitrio e
bairro de residncia de 1.092 desses casos, permitindo o clculo das
densidades de incidncia para cada um desses nveis de agregao.
Na figura 3.15 apresentamos o mapa da Cidade do Recife, com suas divises
administrativas segundo bairros e distritos sanitrios, e na figura 3.16, o mapa
clssico de padro das taxas de incidncia calculadas para os bairros.

78
3.4 - Tcnicas de Anlise de Dados Pontuais Aplicadas a reas

FIGURA 3.15 Recife Diviso de bairros (polgonos delimitados FIGURA 3.16 Mapa de padro de incidncia de tuberculose
em preto) e distritos sanitrios (polgonos delimitados em azul). segundo bairros Coorte 2003-2005.

A adoo de tcnicas de anlise de dados pontuais referida pode ser feita


identificando-se as coordenadas geogrficas do centride de cada polgono
(bairro ou setor censitrio), atribuindo-se a esta localizao os casos ocorridos
na rea, assim como sua populao. Note-se que ao adotarmos tal
procedimento, estaremos incluindo uma fonte de erro, por atribuirmos todas
as ocorrncias de uma determinada rea a um nico ponto, que seu centride.
Esse erro seria possivelmente menor se atribussemos essas ocorrncias ao
centride populacional do polgono, o que no o mais comum, devido a
dificuldades de se obter mapas de densidade populacional. O mais usual
atribuir as ocorrncias ao centride geogrfico do polgono, o que remete a
uma discusso de escala, visando a controlar tal erro.
Temos ento que analisar a questo da escala que desejamos trabalhar
(bairro ou setores), alm de outra que se refere ao tipo de intensidade que
queremos estimar (casos ou incidncia).
As figuras 3.17 e 3.18 mostram mapas de Kernel apresentando as
intensidades de incidncia e de casos, respectivamente, adotando-se o bairro
como unidade de anlise.

FIGURA 3.17 Mapa de Kernel de incidncia de tuberculose FIGURA 3.18 Mapa de Kernel de casos de tuberculose
segundo bairros. segundo bairros.

79
CAPTULO 3 - Anlise Espacial de Dados de reas

Analisando-se esses mapas podemos identificar que, exceto a regio noroeste


da cidade (que sempre se apresenta como rea crtica para a ocorrncia da
tuberculose), existem diferenas importantes entre o mapa de intensidade de
incidncia e de casos. Se quisermos analisar a gravidade do problema, em
termos de risco de adoecer, temos que utilizar o mapa que fornece a intensidade
da incidncia (Figura 3.16), por considerar os tamanhos das populaes sob
risco, que no caso dos bairros do Recife apresentam variaes importantes. Por
outro lado, se estamos adicionalmente interessados em planejar a infraestrutura
de vigilncia e assistncia, tambm deve ser observado o mapa que fornece
informao sobre intensidade de casos (Figura 3.18).
Nas figuras 3.19 e 3.20, apresentamos as mesmas abordagens, agora
considerando o setor censitrio como unidade de anlise. Nesse caso as
diferenas entre os dois mapas j no so to marcantes, dado que tal unidade
geogrfica constituda pelo IBGE com tamanhos populacionais com pouca
variao, na maioria das vezes.

FIGURA 3.19 Mapa de Kernel de incidncia de tuberculose FIGURA 3.20 Mapa de Kernel de casos de tuberculose
segundo setores censitrios (polgonos no representados). segundo setores censitrios (polgonos no representados).

Por fim, nas figuras 3.21 A e 3.21 B, comparamos os mapas de intensidade


de incidncia segundo bairros e segundo setores censitrios, respectivamente.
Pode-se notar, novamente, a menos da regio noroeste da cidade, diferenas
importantes entre os dois mapas, decorrentes da questo da heterogeneidade
da distribuio espacial do evento, dentro de uma unidade geogrfica de anlise
de maior tamanho.
Quando adotamos o setor censitrio como unidade de anlise, estamos
tentando melhor apreender essa heterogeneidade, identificando os subgrupos
populacionais submetidos a um maior risco de adoecer, embora pagando o
preo da instabilidade de taxas calculadas para pequenas reas. Essa uma
questo central quando estamos diante da deciso sobre que escala adotar.

80
3.4 - Tcnicas de Anlise de Dados Pontuais Aplicadas a reas

FIGURA 3.21 Mapa de Kernel de incidncia por bairros (A) versus incidncia por setor (B).
A B

Deve-se ainda salientar mais uma vez que a abordagem aqui apresentada
pode resultar em anlises enviesadas, dado que atribumos ao centride
geogrfico do polgono todas as ocorrncias de interesse. O centro geogrfico
da rea nem sempre coincide com o centride populacional, ponto este ao
qual estaria mais correto atribuirmos as ocorrncias. Em face dessa questo,
a adoo do setor censitrio como unidade de anlise tem a vantagem de
introduzir vieses menores, em grande parte de nossas reas urbanas, visto
que as diferenas de localizao entre esses dois centrides so minimizadas
devido ao menor tamanho geogrfico dos setores.

81
EXERCCIO 1: Vigilncia e ateno sade de gestantes HIV positivas:
construo de indicadores com operaes entre camadas.

Autores: Lisiane M. W. Acosta, Maria Regina V. Brito, Eugnio P.


Lisboa, Rui Flores e Christovam Barcellos

EXERCCIO 2: Distribuio dos acidentes de trnsito em Belo Horizonte, MG.


Autora: Maria Cristina Mattos

EXERCCIO 3: Anlise espacial da distribuio de casos de malria no Estado de


Mato Grosso em 2000 e 2003.

Autores: Marina Atanaka dos Santos e Reinaldo Souza-Santos


Anexos:
EXERCCIOS

Exerccio 1: Vigilncia e ateno sade


de gestantes HIV positivas:
construo de indicadores com
operaes entre camadas.
pg. 85

Exerccio 2: Distribuio dos acidentes de


trnsito em Belo Horizonte, MG.

pg. 97

Exerccio 3: Anlise espacial da distribuio de


casos de malria no Estado de
Mato Grosso em 2000 e 2003.
pg. 105

84
Exerccio 1 : Vigilncia e ateno sade de
gestantes HIV positivas:
construo de indicadores com
operaes entre camadas

I - Introduo
A possibilidade concreta dos servios de sade atuarem na preveno da
transmisso vertical do vrus HIV um dos mais importantes avanos no
controle da epidemia da Aids. O grande marco para essas aes foi o estudo
desenvolvido pelo AIDS Clinical Trial Group (ACTG-076) que, em 1994,
comprovou as estratgias que decrescem a transmisso vertical chegando
a nveis de 1 a 2 % enquanto que, sem qualquer interveno, seriam de 25 a
30 %. No Brasil, esses conhecimentos j foram incorporados s polticas
pblicas. O Programa Nacional de DST/AIDS do Ministrio da Sade (MS)
priorizou o controle da transmisso vertical incidindo na rede de sade por
meio de capacitaes, fornecimento de insumos e estabelecendo o agravo
gestante HIV e criana exposta como de notificao compulsria em todo o
territrio nacional no ano de 2000.
Esse esforo de minimizar a transmisso vertical do HIV pressupe a
articulao entre aes de ateno bsica sade e a vigilncia da sade
com base no princpio de territorializao, em reas de responsabilidade dos
servios de sade. A territorializao dos servios de sade uma premissa
bsica do Sistema nico de Sade (SUS). Os territrios das reas de atuao
das unidades bsicas de sade (UBS), como agregados espaciais, podem
ser avaliados atravs de indicadores sociodemogrficos, epidemiolgicos, de
recursos, de cobertura, e outros que contribuem para anlise de situao de
sade e permitem o monitoramento e avaliao de aes de sade.
O Brasil possui vrios sistemas de informao e se destaca
internacionalmente pela transparncia dos mesmos, em especial pelos dados
do DATASUS, que disponibiliza vrias informaes em sade. Entre todos os
sistemas de informao, sero utilizados para este exerccio os que auxiliam
para anlise espacial da incidncia de nascidos vivos expostos ao vrus HIV
pela gestao/parto e associao com indicadores de assistncia sade e
caractersticas populacionais.
Utilizando-se os dados do censo por setores censitrios do municpio, que
compem os territrios das unidades de sade, fornecidos pelo Instituto
Brasileiro de Geogrfica e Estatstica (IBGE), tem-se os dados populacionais.

85
ANEXOS - Exerccios

O Sistema Nacional de Nascidos Vivos (SINASC) tem condies de informar


o nmero de nascidos vivos, alm de outras variveis como: escolaridade da
me, tipo de parto, realizao ou no de pr-natal, peso no nascimento e outros.
O Sistema de Informao dos Agravos de Notificao (SINAN) possui os
dados de morbidade de agravos de notificao que podem ser
georreferenciados pelos endereos de residncia para obterem-se os casos
por unidades de sade. No caso de vigilncia epidemiolgica de gestantes
HIV positivas e crianas expostas, tem-se escolaridade materna, perodo de
deteco do HIV na me, realizao de pr-natal, nmero de consultas
realizadas, uso de anti-retrovirais na gestao, parto da criana, aleitamento
materno, acompanhamento da criana e se a mesma se tornou infectada pelo
HIV ou no.

II - Exerccio
Considerando que o objetivo da vigilncia epidemiolgica no somente
a coleta de dados, mas tambm a sua anlise e a avaliao das polticas
assistenciais e criao de novas estratgias de ao, vamos neste exerccio
determinar:
a) A incidncia de gestantes HIV positivas e crianas expostas das reas de
atuao dos servios de ateno bsica sade.
b) Alguns indicadores sociodemogrficos e de ateno sade nessas reas.
c) A correlao entre incidncia de HIV com indicadores sociodemogrficos
e de ateno sade.

Sero utilizados neste exerccio os seguintes dados:


NOME DOS DADO GRFICO ATRIBUTOS FONTE DE INFORMAO
ARQUIVOS

Area_US_region rea de atuao das unidades Cdigo da rea Secretaria Municipal de Sade
bsicas de sade (UBS) (polgonos)

Gest_HIV_point Local de residncia de gestantes HIV Nmero de registro SINAN (SUS)


positivas (ponto)

Nascidos_point Local de residncia dos nascidos Nmero da DN, local de SINASC (SUS)
(ponto) nascimento e nmero de
consultas pr-natal

SC_2000_region Setor censitrio de 2000 (polgonos) Cdigo do setor, tipo de setor, Censo Demogrfico (IBGE)
populao total e nmero de
domiclios

Observao: Para que as pessoas e as reas no sejam identificadas, foram excludos dos bancos de dados
todos os campos de identificao. Tambm foram alterados o sistema de projeo e a localizao exata dos
pontos que pudessem ser usados para localizar pessoas e servios. Manter o sigilo das informaes deve ser uma
preocupao de todos os que trabalham com bancos de dados de sade.

86
Exerccio 1: Vigilncia e ateno sade de gestantes HIV positivas: construo de indicadores com operaes entre camadas

A visualizao e anlise do banco de dados deve ser feita utilizando-se o


aplicativo geogrfico TerraView. Portanto, necessrio instalar a verso mais
recente desse aplicativo. A aquisio do arquivo de instalao, do manual e do
tutorial do TerraView pode ser feita na pgina (www.dpi.inpe.br/terraview) da
Diviso de Processamento de Imagens do Instituto Nacional de Pesquisas
Espaciais DPI/INPE.

O exerccio tem os seguintes passos:


1. Inicialmente, necessrio executar (abrir) o aplicativo TerraView. Esse
procedimento pode ser feito clicando em Iniciar > Programas > TerraView3x
> TerraView3x ou atravs do cone de atalho TerraView 3x, na rea de trabalho.
2. Em seguida, a tela inicial do TerraView ser apresentada. Crie um novo
banco de dados, clicando no cone . Opte por criar (em vez de conectar),
escolha um diretrio (sugerimos c:\curso\exerc1) e um nome para o banco de
dados (por exemplo, HIV_US).
3. Abrindo as camadas de dados: No Menu Arquivo > Importar Dados:
a) em Arquivo, localize e selecione os arquivos de mapas (Area_US_region;
Gest_HIV_point, Nascidos_point e SC_2000_region);
b) para selecionar a chave de ligao do mapa com os dados, clique
Selecionar Coluna e selecione a coluna adequada;
c) clique OK para concluir a importao. Repita essa operao para cada
arquivo de mapa.
4. Cada camada (ou tema) ser disposta em uma vista. Coloque cada camada
(ou tema) na mesma vista clicando e arrastando os temas para cima. Escolha
os melhores padres de visualizao FIGURA 1.1 Visualizao dos dados de interesse para anlise da transmisso vertical
para cada camada (ou tema). Isso de HIV (rea de atuao das unidades bsicas de sade, local de residncia de gestantes
HIV positivas, local de residncia dos nascidos vivos, setor censitrio de 2000).
deve ser feito clicando com o boto
direito do mouse em Visual-Default.
Como sugesto, deixe a camada de
reas de atuao (Area_US_region)
em cima de setores censitrios
(SC_2000_region) e ligeiramente
transparente. Coloque as camadas de
pontos (Gest_HIV_point e Nascidos_
point) em cima das de polgonos com
padres diferentes para que se
visualize os dois tipos de eventos
(notificao de gestante HIV positiva
e nascido vivo).
5. Na barra de ferramentas,
pressione o boto Desenhar . O
resultado mostrado na figura 1.1
ao lado.

87
ANEXOS - Exerccios

Observe a superposio entre estas camadas. Existem grandes reas


com pequenas quantidades de pontos de nascimentos, provavelmente
indicando que uma rea de baixa densidade demogrfica. Os limites dos
setores censitrios no coincidem com os limites de reas de atuao.
Que outros padres voc consegue identificar atravs desse mapa?

Para anlise, foram selecionados os seguintes indicadores:

Proporo de setores de favelas: razo entre o nmero de setores


censitrios caracterizados como sub-normais durante o censo de 2000 e
o nmero total de setores censitrios das reas das UBS.

Prevalncia de HIV em Nascidos Vivos: razo entre o nmero de


nascidos vivos expostos ao HIV pela gestao e parto (dados do SINAN) e
o nmero de nascidos vivos (dados do SINASC) nas reas das UBS.

Taxa bruta de natalidade: razo entre o nmero de nascidos vivos


(SINASC) e a populao total nas reas das UBS (Censo demogrfico).

Proporo de nascidos vivos sem pr-natal: razo entre o nmero de


nascidos vivos sem nenhuma consulta de pr-natal e o total de nascidos
vivos nas reas das UBS (SINASC).

O grande desafio que temos para calcular esses indicadores que eles
se referem a unidades espaciais dispares, isto , no coincidentes.
Devemos transferir os dados de uma camada para outra, no nosso caso os
polgonos de reas de abrangncia.

Para obter esses indicadores, ser necessrio calcular:

O nmero de setores censitrios do tipo sub-normal (tipo 1 segundo


os dados do censo) existentes na rea de abrangncia da unidade de sade;

O nmero total de setores censitrios existentes na rea de abrangncia


da unidade de sade;

A populao total dos setores censitrios contidos na rea de


abrangncia da unidade de sade;

O nmero total de nascidos vivos ocorridos na rea de abrangncia da


unidade de sade;

O nmero total de gestantes HIV positivas existentes na rea de


abrangncia da unidade de sade;

O nmero de nascidos vivos sem exames pr-natal ocorridos na rea


de abrangncia da unidade de sade.

6. Para identificar os setores censitrios do tipo sub-normal devemos


realizar uma Consulta por Atributos. Clique com o boto direito do mouse
no tema SC_2000_region.

88
Exerccio 1: Vigilncia e ateno sade de gestantes HIV positivas: construo de indicadores com operaes entre camadas

FIGURA 1.2 Seleo de setores censitrios tipo 1 (sub-normal). Consulta por atributos.

7. Agora selecione o atributo Tipo e coloque como valor do atributo 1, ou


escreva a expresso Tipo = 1. Clique em Nova consulta. Ficaro marcados os
setores do tipo sub-normal tanto no mapa como na tabela. Observe que
esto marcados 69 dos 431 setores.

FIGURA 1.3 Resultado da seleo de setores censitrios tipo 1.

89
ANEXOS - Exerccios

8. O prximo passo adicionar essa informao s reas de abrangncia


de unidades de sade. Para isso faremos uma operao geogrfica chamada
de atribuir dado por localizao (coletar dados). Clique com o boto direito do
mouse sobre a vista, que contm os temas Area_US_region e
SC_2000_region.

FIGURA 1.4 Contagem de setores censitrios, total e tipo 1 e soma das populaes.
Atribuir dados por localizao.

9. Selecione como tema para atribuir dados para Area_US_region e tema


para atribuir dados de SC_2000_region, isto , os setores censitrios. Como
atributo de sada precisamos somente das variveis SC_2000_region.SETOR:
COUNT, isto , o nmero total de setores censitrios (de todos os tipos), a
varivel SC_2000_region.TIPO: SUM, isto , a soma dos setores censitrios
do tipo 1 (os setores censitrios do tipo 0 no sero contados) e a varivel
SC_2000_region.POP_T: SUM, isto , a soma da populao total dos setores
censitrios. Selecionamos a relao espacial intercepta, quer dizer, usando
todos os setores que esto totalmente ou parcialmente contidos dentro dos
limites das reas de abrangncia. O programa adiciona trs novas colunas
com o valor da quantidade de setores censitrios total e do tipo 1, e a populao
total nos polgonos de rea de abrangncia da unidade de sade.
10. Para facilitar o trabalho de operaes entre variveis, podemos mudar
o nome das novas variveis. Isso pode ser feito clicando-se com o boto
direito do mouse sobre a coluna. Clique na opo modificar nome da coluna.

90
Exerccio 1: Vigilncia e ateno sade de gestantes HIV positivas: construo de indicadores com operaes entre camadas

Mude os nomes das variveis para:

NOME GERADO PELO PROGRAMA NOVO NOME

SC_2000_region.SETOR: COUNT N_setores

SC_2000_region.TIPO: SUM Setores_favela

SC_2000_region.POP_T: SUM Pop2000

11. Agora podemos repetir esse procedimento para coletar dados do tema
Nascidos_Point. O prximo passo adicionar essa informao s reas de
abrangncia de unidades de sade. Para isso repetimos a operao geogrfica
de atribuir dado por localizao (coletar dados). Selecione como tema para
atribuir dados para Area_US_region e tema para atribuir dados de
Nascidos_Point, isto , os nascidos vivos. Como atributo de sada selecione a
varivel Nascidos_Point.NUMERODN: COUNT, isto , o nmero total de nascidos.
Selecionamos a relao espacial dentro, a nica possibilidade de relao, j
que se trata de uma coleo de pontos dentro de um conjunto de polgonos.

FIGURA 1.5 Contagem de nascidos vivos em reas de abrangncia. Atribuir dados


por localizao.

O programa adiciona uma nova coluna com o valor da quantidade de


nascidos vivos nos polgonos de rea de abrangncia da unidade de sade.
Mude o nome dessa nova varivel para N_Nascidos.

91
ANEXOS - Exerccios

12. Para se obter o nmero de nascidos vivos sem exames pr-natal


devemos selecionar o conjunto de nascidos com atributo consultas
categoria 1. Para isso, devemos realizar uma Consulta por Atributos e
clicar com o boto direito do mouse no tema Nascidos_Point. Agora
selecione o atributo Consultas e coloque como valor do atributo 1, ou
escreva a expresso Consultas = 1. Clique em Filtrar. Ficaro marcados os
nascidos sem pr-natal tanto no mapa quanto na tabela. Dos 4.064
nascidos, 170 foram marcados. Esta uma seleo do conjunto de
nascidos que deve ser salva como um novo tema (ou camada). Para isso,
clique no tema Nascidos_Point com o boto direito do mouse e selecione
criar tema a partir de tema. Aparecer a janela seguinte em que voc deve
dar um nome para esse novo tema (sem_prenatal, por exemplo) e
selecionar somente os objetos consultados.

FIGURA 1.6 Criao de um novo tema por consulta. Seleo de nascidos vivos sem
pr-natal.

Novamente faremos a operao geogrfica de atribuir dado por


localizao (coletar dados). Selecione como tema para atribuir dados para
Area_US_region e tema para atribuir dados de Sem_prenatal, isto , os
nascidos vivos sem consultas pr-natal. Como atributo de sada selecione
a varivel Nascidos_ Point.NUMERODN: COUNT.

92
Exerccio 1: Vigilncia e ateno sade de gestantes HIV positivas: construo de indicadores com operaes entre camadas

FIGURA 1.7 Contagem de nascidos vivos sem pr-natal nas reas de abrangncia.

O programa adiciona mais uma coluna com o valor da quantidade de


nascidos que no tiveram exames de pr-natal presentes nos polgonos
de rea de abrangncia da unidade de sade. Mude o nome dessa nova
varivel para N_Nascidos_ sempnatal.
13. A ltima varivel necessria
para construir os indicadores o
nmero de gestantes HIV positivas FIGURA 1.8 Contagem de gestantes HIV-positivas nas reas de abrangncia. Atribuir
dados por localizao.
existentes na rea de abrangncia da
unidade de sade. Para isso, fazemos
a operao geogrfica de atribuir
dado por localizao (coletar dados).
Selecione como tema para atribuir
dados para Area_US_region e tema
para atribuir dados de Gest_HIV_
point. Como atributo de sada
selecione a varivel Gest_HIV_
point.REGISTRO: COUNT. O programa
adiciona mais uma coluna com o valor
da quantidade de gestantes HIV
positivas nos polgonos de rea de
abrangncia da unidade de sade.
Mude o nome dessa nova varivel para
N_gest_HIVpos.
93
ANEXOS - Exerccios

Agora temos todos os dados que precisamos para calcular os indicadores.


Recordando:

INDICADOR COMPONENTES CLCULO

Proporo de setores Nmero de setores censi- Setores_favela *100 /


de favelas trios sub-normais / N_setores
nmero total de setores
censitrios.

Prevalncia de HIV Nmero de gestantes HIV N_gest_HIVpos *100 /


em Nascidos Vivos: positivas / Nmero de N_Nascidos
nascidos vivos.

Taxa bruta de Nmero de nascidos vivos N_Nascidos *100 /


natalidade / Populao total. Pop2000

Proporo de nascidos Nmero de nascidos vivos N_Nascidos_sempnatal


vivos sem pr-natal sem pr-natal / Total de *100 / N_Nascidos
nascidos vivos.

Esses clculos so realizados criando-se nova coluna na tabela


rea_US_region. Na tabela, clique com o boto direito do mouse em adicionar
coluna e d um nome para a coluna do indicador proporo de favelas (por
exemplo, prop_favela).

FIGURA 1.9 Criao de novas colunas para clculo de indicadores. Adicionar coluna.

14. Sobre essa coluna nova clique com o boto direito do mouse em alterar
dados da coluna e escreva (com ajuda dos botes disponveis na janela) a
expresso Setores_favela / N_setores. Faa a mesma operao para calcular
os demais indicadores (adicione colunas e altere os dados dessa coluna).
94
Exerccio 1: Vigilncia e ateno sade de gestantes HIV positivas: construo de indicadores com operaes entre camadas

FIGURA 1.10 Clculo de indicadores usando operaes entre duas colunas


existentes na tabela.

15. A primeira fase de anlise desse conjunto de indicadores deve ser a


visualizao, isto , criar mapas temticos que permitam analisar a distribuio
desses indicadores. Sobre o tema Area_US_region clique em editar legenda.

FIGURA 1.11 Criao de mapas temticos para visualizao de indicadores. Edio


de legenda.

Obtemos o seguinte mapa:


95
ANEXOS - Exerccios

FIGURA 1.12 Criao de mapas temticos para visualizao de indicadores. Edio de legenda.

Explore visualmente os indicadores obtidos e identifique reas que devem


ser priorizadas para aes de ateno e preveno sade. Para anlise da
associao estatstica entre os indicadores pode ser utilizada a correlao
no-paramtrica e calculado o coeficiente de Spearman para avaliar a
associao entre pares de variveis. Num programa de estatstica, pode ser
usado um modelo de regresso mltipla que relacione a prevalncia de HIV
em gestantes como varivel dependente, com os demais indicadores como
variveis independentes. Isso pode ajudar a explicar que determinantes esto
atuando sobre os riscos de transmisso vertical do HIV.
O aspecto mais importante deste exerccio, no entanto, a possibilidade
completamente nova de se criar indicadores atravs de operaes entre
camadas em um ambiente de SIG. Esse tipo de clculo impossvel de ser
obtido por meio de bancos de dados convencionais.

96
Exerccio 2 : Distribuio dos acidentes de
trnsito em Belo Horizonte, MG.

I - Introduo

Os acidentes de trnsito so atualmente um dos agravos de maior impacto


na sade da populao brasileira, tanto pelos bitos quanto pelas internaes
e seqelas deixadas em suas vtimas. Ocupam a segunda posio entre as
causas externas de mortalidade no pas.
As anlises dos acidentes de trnsito devem servir para orientar medidas
de preveno e controle desses agravos. Para o municpio, a localizao pontual
de diferentes eventos relacionados a este tema (acidentes, pontos de apoio
para as unidades mveis de atendimento pr-hospitalar, servios de urgncia
etc.) constitui-se num valioso material para avaliao e planejamento de aes
preventivas tanto para o servio de sade quanto para os rgos de trnsito.
Pode orientar medidas de controle do trfego, indicar falha na sinalizao de
vias ou apontar melhores locais para os pontos de apoio das ambulncias.
Uma fonte de informao para este propsito o registro dos atendimentos
aos acidentados pelo Servio de Atendimento Mvel de Urgncia (SAMU), que
tem o objetivo de reduzir o nmero de bitos, o tempo de internao em hospitais
e as seqelas decorrentes da falta de socorro precoce.

II Exerccio

Neste exerccio, vamos analisar o padro de distribuio dos acidentes de


trnsito em Belo Horizonte, buscando identificar reas crticas, ou seja, reas
de maior intensidade deste tipo de acidentes.

n Conjunto de dados:
Atendimentos a acidentados no trnsito (atendimentos.*)
Estes dados representam parte dos atendimentos pr-hospitalares aos
acidentados no trnsito, realizado pelo Servio de Atendimento Mvel de
Urgncia (SAMU) da Secretaria Municipal de Sade de Belo Horizonte, ocorridos
no perodo de janeiro a abril de 2006. Correspondem aos registros de
atendimentos que levaram liberao de uma unidade de atendimento mvel.
So registros de pacientes atendidos, deste modo, vrios atendimentos
podem corresponder a um mesmo acidente.

97
ANEXOS - Exerccios

Em Belo Horizonte, os atendimentos do SAMU so georreferenciados ao


endereo do local do atendimento. Quando os chamados so referentes a
ocorrncias em via pblica, como caso dos acidentes de trnsito, estes so
referenciados ao endereo em frente ou mais prximo ao local do evento.
Os atendimentos para os quais no foi possvel fazer o georreferenciamento
foram suprimidos deste exemplo.
Tipo de dado: pontos

Acidentes de trnsito (acidentes.*)


Correspondem aos acidentes referentes aos atendimentos acima. uma
consolidao daqueles dados, contendo o nmero de vtimas atendidas em cada
ocorrncia. Seguem os mesmos critrios quanto ao seu georreferenciamento.
Tipo de dado: pontos

Pontos de apoio (ambulancias.*)


Correspondem aos pontos de apoio das ambulncias do SAMU,
representadas pelas 15 Unidades de Suporte Bsico (USB) e 03 Unidades de
Suporte Avanado (USA).
Tipo de dado: pontos

Portas de entrada para atendimento s urgncias (unid_urgencia.*)


Representam as 11 principais portas de entrada da urgncia do SUS-BH,
tanto para traumas quanto para urgncias clnicas.
Tipo de dado: pontos

Limite municipal (belohorizonte.*)


Representa o limite do Municpio de Belo Horizonte.
Tipo de dado: polgono

Principais vias de trnsito (ppvias.*)


Correspondem s vias que promovem a ligao entre diferentes bairros ou
setores da cidade, onde a intensidade de veculos e a velocidade no trnsito
so maiores.
Tipo de dado: linha.

n Sobre os dados:
1) Estes dados se destinam a ilustrar os exerccios do Programa de
Capacitao e Atualizao em Abordagens do Espao em Anlises de Sade
Pblica. So dados parciais, sujeitos a alterao.
2) Foram utilizados dados do Sistema de Informaes Geogrficas,
gerenciado pela Empresa de Informtica e Informao de Belo Horizonte
(Prodabel). O georreferenciamento dos dados pontuais do foi feito por meio da
camada de endereos.
3) Todos os temas camadas esto suprimidos em sete milhes de unidades
no eixo das coordenadas Y.

98
Exerccio 2: Distribuio dos acidentes de trnsito em Belo Horizonte, MG.

O Banco de Dados no TerraView (TransitoBH.mdb) foi formado pelas


camadas importadas a partir dos arquivos shape.

n Problema:
Identificar locais de maior densidade de acidentes de trnsito no municpio
a partir do registro de atendimentos do SAMU.
A identificao de locais onde haja uma aglomerao de acidentes pode
ajudar na identificao de locais crticos, propiciando o direcionamento das
medidas de controle de trnsito (sinalizao, radares etc.) e orientando a
locao de equipamentos mveis para atendimento aos acidentados.

Em primeiro lugar, deveremos conhecer os dados, avaliar sua


completitude, cobertura e qualidade tanto dos dados tabulares quanto
dos dados geogrficos. Dependendo da maneira de obteno das
coordenadas dos dados pontuais, podem ocorrer falhas durante o
processamento. Dados obtidos por GPS podem conter perdas devido a
falhas na recepo de sinal dos satlites, no captando as coordenadas.
Quando os dados so georreferenciados a uma base geogrfica
especfica, como o caso de nosso exemplo para os atendimentos pelo
SAMU, alguns endereos podem no ser encontrados, caso a base esteja
incompleta. Essas perdas devero ser criticadas, pois podem estar
concentradas em alguma regio ou em um determinado tipo de acidente.

1. Abra o banco de dados TransitoBH.mdb, conhea os planos de informao.


Verifique seus atributos.

99
ANEXOS - Exerccios

Os acidentes podem ser mapeados e mapas temticos podem ser


elaborados segundo caracterstica da vtima ou do acidente. Nota-se a
concentrao de acidentes em algumas reas, especialmente na parte central
do municpio. Podemos verificar alguns pontos enfileirados, que esto
localizados ao longo de algumas vias. Entretanto, deve-se ter cautela na
interpretao desses mapas de pontos. Alguns acidentes que ocorram num
mesmo local, por exemplo, em um cruzamento perigoso, podem registrar as
mesmas coordenadas. Da, um local com 10 eventos pode ser representado
da mesma forma que um outro local onde haja apenas uma ocorrncia. A
simples visualizao de pontos subjetiva e pode no detectar padres da
distribuio dos eventos.

Vamos agora construir um mapa de Kernel para estimar a intensidade dos


acidentes de trnsito.
2. Ative o tema atendimentos na vista Transito.
3. V ao menu Anlise > Mapa de Kernel para escolher os parmetros a
serem utilizados.
a) Regio de Suporte: escolha Grade sobre a regio
b) Opo de Grade: escolha 50 colunas e Tema belohorizonte
c) Em Resultados: nomeie o plano (por exemplo k_atendimentos)
d) Em Conjunto de Dados marque o tipo de evento (ponto) e o tema a ser
analisado (atendimentos). No selecione a opo Com Atributo.
e) Em Algoritmo selecione a Funo qurtica e Clculo da densidade.
Selecione a opo Adaptativo.
4. Execute.

100
Exerccio 2: Distribuio dos acidentes de trnsito em Belo Horizonte, MG.

Ser gerado um novo plano k_atendimentos. Obseve as reas de maior


concentrao.
A regio central da cidade apresenta a rea de maior intensidade quando
consideramos os diversos tipos de acidentes (Figura 2.1).

FIGURA 2.1 Superfcie de densidade dos diversos tipos de acidentes.

Parmetros do Kernel
Tema de Eventos: atendimentos
Raio adaptativo
Clculo: Densidade
Funo: Qurtico

Valores de Kernel
-0.000000000000001 ~ 0.000002484762000
0.000002484762000 ~ 0.000004969524000
0.000004969524000 ~ 0.000007454286000
0.000007454286000 ~ 0.000009939048000
0.000009939048000 ~ 0.000012423810000
0.000012423810000 ~ 0.000014908572000
0.000014908572000 ~ 0.000017393334000
0.000017393334000 ~ 0.000019878096000
0.000019878096000 ~ 0.000022362858000
0.000022362858000 ~ 0.000024847620001

101
ANEXOS - Exerccios

Agora, vamos trabalhar apenas


os acidentes com bicicleta.
Para isso vamos adicionar um
novo tema a partir da seleo:
TIPOACID = ACIDENTE DE
BICICLETA
5. Adicione um novo tema
acidentes, entretanto desmarque a
opo Selecionar Todos os Objetos.
Isso lhe permitir fazer a seleo
acima.
6. Nomeie este novo tema como
ac_bicicleta, adicionando-o vista
Transito.

Agora voc pode fazer um mapa de Kernel, apenas para esse tipo de acidente.
7. Repita os procedimentos do item 3 para os acidentes de bicicleta. Observe
as reas de maior concentrao desse tipo de acidente (Figura 2.2).

FIGURA 2.2 Superfcie de densidade de acidentes de bicicleta.

Parmetros do Kernel
Tema de Eventos: ac_bicicleta
Raio adaptativo
Clculo: Densidade
Funo: Qurtico

Valores de Kernel
0.000000006076408 ~ 0.000000178490868
0.000000178490868 ~ 0.000000350905327
0.000000350905327 ~ 0.000000523319786
0.000000523319786 ~ 0.000000695734245
0.000000695734245 ~ 0.000000868148704
0.000000868148704 ~ 0.000001040563164
0.000001040563164 ~ 0.000001212977623
0.000001212977623 ~ 0.000001385392082
0.000001385392082 ~ 0.000001557806541
0.000001557806541 ~ 0.000001730221001

102
Exerccio 2: Distribuio dos acidentes de trnsito em Belo Horizonte, MG.

A escolha do mtodo e dos parmetros da anlise deve ser feita de acordo


com os objetivos propostos. A deteco mais detalhada dos acidentes pode
ser de grande valor para os rgos gestores do trnsito e para os servios de
sade do municpio.
Experimente novas anlises variando o nmero de colunas (clulas). Por
exemplo: 100 colunas. Quanto maior o nmero de colunas, maior a resoluo
do mapa gerado.
Varie tambm o raio. Para isso, desmarque a opo Adaptativo nos
parmetros do mapa de Kernel e atribua diferentes valores para o raio. Quanto
maior o raio, mais suavizada ser a superfcie estimada. Experimente utilizar
um raio de 1.000 metros.
Pode-se ainda ponderar a estimativa utilizando atributos, como o nmero de
vtimas, um escore de gravidade, ou o tempo decorrido at a chegada do socorro.
A sobreposio de outros temas ajuda a caracterizar os locais de maior
intensidade, como por exemplo: as vias de trfego intenso, a localizao das
ambulncias do SAMU e as portas de entrada para trauma.
Experimente sobrepor os pontos de apoio das ambulncias sobre um mapa
de Kernel dos acidentes (Figura 2.3).

FIGURA 2.3 Superfcie de densidade dos diversos tipos de acidentes e pontos de


apoio das ambulncias.

103
ANEXOS - Exerccios

n Consideraes:
Nos exemplos aqui demonstrados, realizamos alguns procedimentos
exploratrios, buscando evidenciar reas crticas quanto ocorrncia de
acidentes de trnsito, que podem subsidiar propostas para a melhoria da
segurana no trnsito.
No devemos, entretanto, desconsiderar que o SAMU atende outros tipos
de traumas e urgncias clnicas, e todo este conjunto que determina o
planejamento deste servio.

104
Exerccio 3 : Anlise espacial da distribuio
de casos de malria no Estado
de Mato Grosso em 2000 e
2003.

I - Introduo

No contexto malrico e das propostas de organizao dos servios de sade


descentralizados, especialmente no Setor de Vigilncia em Sade, a
identificao das reas geogrficas e grupos populacionais que esto expostos
ao maior risco de malria constitui-se em etapa importante para a elaborao
de programas de controle, monitoramento e de avaliao em nveis local,
regional e nacional. Os mtodos de anlise espaciais so particularmente
teis para a criao ou delimitao de reas homogneas, definio de critrios
de monitoramento e avaliao para uma determinada interveno,
estabelecimento de prioridades para planejamento e alocao de recursos
(Cruz, 1996). Considerando o processo de descentralizao, a unidade de
anlise importante a escala do municipal. No entanto, a ocorrncia da doena
muitas vezes no se restringe aos limites definidos poltico-adminis-
trativamente. Dessa forma, questes como a existncia de padro de
distribuio da malria considerando o municpio e os municpios vizinhos, e
a relao entre a ocorrncia da malria no municpio e aqueles circunvizinhos
passam a assumir relevncia na identificao de reas homogneas para
definio de estratgias de interveno.

II Exerccio

Neste exerccio faremos a anlise espacial dos casos de malria notificados


pelos municpios do Estado de Mato Grosso, durante o ano de 2000 e 2003. O
objetivo do mesmo apresentar tcnicas e respectivos procedimentos para o
desenvolvimento da anlise dos dados espaciais e visualizao de reas em
mapas. Com isso, espera-se apresentar uma metodologia que auxilie no
encontro de reas homogneas para auxiliar os gestores na definio de
reas prioritrias para aplicao de recursos e planejamento de intervenes,
de acordo com as caractersticas especficas de cada rea.
105
ANEXOS - Exerccios

Para a realizao deste exerccio, os seguintes dados foram utilizados, direta


ou indiretamente:

Malha de municpios de Mato Grosso limites (polgonos) dos


municpios, de ano 1997 e 2001.
Formato: vetorial (extenses: .shp, .dbf e .shx).
Fonte: Instituto Brasileiro de Geografia e Estatstica IBGE. Outro formato
(.bna) disponibilizado pelo DATASUS. Esclarecemos que as duas malhas so
necessrias devido criao de novos municpios, especialmente em 2000.
Dessa maneira, para a anlise da IPA (Incidncia Parasitria Anual) de 2000
ser utilizada a malha digital de 1997, e para a IPA de 2003, a malha de 2001.

Populao de 2000 populao residente nos municpios do estado.


Formato: tabular (extenso: .xls).
Fonte: Instituto Brasileiro de Geografia e Estatstica IBGE. Censo
Demogrfico 2000.

Populao em 2003 estimativa da populao residente nos


municpios de Mato Grosso, em 2003.
Formato: tabular (extenso: .xls).
Fonte: Instituto Brasileiro de Geografia e Estatstica IBGE. Estimativa
Populacional Municipal de 2002.

Incidncia Parasitria Anual (IPA) calculada com base nas lminas


positivas notificadas pelos municpios para os anos de 2000 e 2003, dividida
pela respectiva populao e multiplicado por mil.
Formato: tabular (extenso .xls).
Fonte: lminas positivas por municpios de 2000, dados obtidos na Secretaria
do Estado de Mato Grosso, armazenados no Sistema de Informaes de Malria
(SISMAL); os de 2003 foram obtidos no Sistema de Informaes de Vigilncia
Epidemiolgica Malria (SIVEP-Malria), da Secretaria de Vigilncia em Sade
do Ministrio da Sade. Neste exerccio, as IPA de 2000 e 2003 j esto
calculadas, dispostas em planilha (extenso: ...xls e ... csv).

n Banco de dados:
Os dados adquiridos foram importados e organizados em um banco do tipo
Access criado pelo aplicativo TerraView. Para facilitar a conduo do exerccio,
disponibilizamos o banco de dados (IPA_MT00-03) e as informaes necessrias
ao desenvolvimento das atividades, no stio www.geocapacita.cict.fiocruz.br.
A visualizao e anlise do banco de dados deve ser feita por meio do aplicativo
geogrfico TerraView, sendo, portanto, necessrio instalar a verso mais recente
deste aplicativo. A aquisio do arquivo de instalao, do manual e do tutorial do
TerraView pode ser feita (www.dpi.inpe.br/terraview) da Diviso de Processamento
de Imagens do Instituto Nacional de Pesquisas Espaciais DPI/INPE.
106
Exerccio 3: Anlise espacial da distribuio de casos de malria no Estado de Mato Grosso em 2000 e 2003.

A - Abrindo o banco e visualizando os dados:


1. Inicialmente, executar (abrir) o aplicativo TerraView;
2. Conectar o banco de dados na barra de ferramentas;
3. Selecionar o banco de dados IPA_MT00-03.mdb;
4. Visualiza-se o mapa e a tabela de atributos conforme apresentado na
figura 3.1;
5. Importar dados mapa2001.bna;
6. Importar dados MT1997.bna;
7. Na rvore Vista/tema selecionar tema mapa2001.bna, importar a tabela
IPAMT03 (arquivo .csv; importante lembrar que o tipo de varivel deve
ser alterado e confirmado quando necessrio);
8. Criar tabela externa IPAMT03;
9. Conectar tabela externa IPAMT03;
10. Na rvore Vista/tema selecionar tema MT1997.bna, importar a tabela
IPAMT00 (arquivo .csv);
11. Criar tabela externa IPAMT00;
12. Conectar tabela externa IPAMT00.

FIGURA 3.1 Visualizao dos dados do banco IPA_MT00-03.mdb no TerraView.

A malha dos municpios do Estado de Mato Grosso ser apresentada na


janela de visualizao de mapas e os dados tabulares, referentes ao tema
mapa MT2001, sero mostrados na tabela de atributos. A descrio dos dados
dessa tabela a seguinte:
IBGE_CODE cdigo (IBGE) de identificao dos municpios;
IBGE_NAME nome dos municpios;
107
ANEXOS - Exerccios

MUNIC - nome dos municpios da tabela externa conectada;


CODMUN - cdigo (IBGE) de identificao dos municpios da tabela externa;
IPA03 IPA (Incidncia Parasitria Anual) de 2003, na tabela externa;
No tema MT1997, encontra-se a IPA, na tabela externa, do ano 2000 (IPA00).

ANALISANDO OS DADOS

A definio de vizinhana aqui adotada levou em conta os municpios que


compartilham a mesma fronteira sendo, neste caso, considerados como
vizinhos de primeira ordem. A primeira questo a ser verificada se a
IPA observada em um municpio possui correlao com os valores das
IPAs apresentadas pelos municpios vizinhos, considerando o estado.
Para verificar essa correlao optou-se pelo clculo dos ndices de Moran
Global e Local.

B Calculando ndices de Moran Global e Local.


Para se conhecer os ndices de Moran Global e Local das IPAs de 2000 e
2003, efetue os seguintes passos, apresentados na figura 3.2:
1. Na rvore de vistas/temas, selecione e habilite o tema MT1997;
2. Desloque o cursor de apontamento para Anlise na tela de
visualizao aberta e clique. Selecione a opo Estatstica espacial;
3. Na janela da Estatstica Espacial, selecionar do tema o atributo IPA00;
4. Selecionar o ndice de Moran Global (caso tenha interesse em detectar
indcios de correlao espacial da IPA dos municpios em relao aos
seus vizinhos, considerando o estado como um todo);
5. Em ndice de Moran Global, selecionar o nvel de significncia, neste
caso optou-se por 99;
6. Em ndice de Moran Local, selecionar o ndice de Moran Local (LISA);
7. Selecionar o nvel de significncia, 99 para o ndice de Moran Local;
8. Nomear o prefixo da coluna a ser gerada, como por exemplo IPA00;
9. Executar.

Nesta operao o TerraView calcula a matriz de vizinhana (proximidade)


automaticamente, levando em considerao os polgonos (municpios)
contguos.

Repetir a seqncia anterior selecionando o mapa2001.bna e o atributo


IPA03. Nomear a coluna gerada como IPA03.

108
Exerccio 3: Anlise espacial da distribuio de casos de malria no Estado de Mato Grosso em 2000 e 2003.

FIGURA 3.2 Etapas da execuo de clculos dos ndices de Moran, na anlise


espacial, no TerraView.
2
3

1
7

O ndice de Moran Global da IPA obtido foi igual a 0,223582 (p-valor = 0,01)
em 2000 e 0,184715 (p-valor = 0,02) em 2003. Neste exerccio, o valor de I
encontrado foi maior que 0 (zero), o que indica evidncia de autocorrelao
espacial positiva, isto , as reas tendem a ser similares entre si quanto
varivel IPA. No entanto, por fornecer um nico valor, como medida de
associao espacial para todo o conjunto de dados, necessrio decompor
este ndice global de associao espacial e examinar padres numa escala
de maior detalhe para evidenciar agrupamentos (leia-se municpios) de
incidncia de malria semelhantes (clusters) e/ou discrepantes (outliers).
Inicialmente, vamos realizar anlise visual no mapa temtico para verificar a
existncia de padro espacial construdo a partir de estratificao de risco de
transmisso. O Programa Nacional de Controle da Malria PNCM caracteriza
as reas do pas de acordo com os seguintes estratos:
reas de baixo risco de transmisso regies, estados ou municpios
com taxa de incidncia de lmina positiva menor que 10 por 1.000 habitantes,
no perodo de um ano;
reas de mdio risco de transmisso regies, estados ou municpios
com taxa de incidncia de lmina positiva maior ou igual a 10 e menor que 50
lminas positivas por 1.000 habitantes, no perodo de um ano;

109
ANEXOS - Exerccios

reas de alto risco de transmisso regies, estados ou municpios


com taxa de incidncia maior ou igual a 50 lminas positivas por 1.000
habitantes, no perodo de um ano.

C Estratificando para mapa temtico.


Para a visualizao do mapa temtico recorrendo a estratificao anterior, utiliza-
remos Editar Legenda, conforme os passos a seguir, apresentados na figura 3.3:
1. Na rvore de vistas/temas, selecione e habilite o tema MT1997;
2. Pressione o boto direito do mouse e selecione Editar legenda;
3. Em Parmetro de Agrupamento:
a) Selecionar o modo Passos Iguais;
b) Selecionar o atributo IPAMT00.IPA00;
c) Definir por 4 fatias e preciso 2;
4. Escolher 4 cores;
5. Aplicar.
6. Modificar os agrupamentos para:
Na definio do primeiro intervalo, a) De 0.00 para 0.01;
correspondente aos municpios sem b) De 0.01 para 10.00;
notificao, utilizamos os seguintes c) De 10.00 para 50.00;
valores: De = 0.00 e Para = 0.01.
d) De 50.00 para 160.00;
Fizemos isso porque o TerraView no
7. Executar;
considera o valor apresentado na janela
para, mas sim o imediatamente anterior 8. Pode-se, clicando com o mouse esquerdo, renomear a legenda e/ou

a este. Por isso, se for digitado 0.00 o alterar o visual. Pode-se renomear a legenda conforme exemplo abaixo:
programa no selecionar nenhum a) Sem notificao;
registro com valor 0.00. Faa um teste! b) Baixo Risco;
c) Mdio Risco;
d) Alto Risco;
9. Salvar tela de visualizao em arquivo .bmp.

FIGURA 3.3 Mapa temtico segundo distribuio de IPA por municpios, Mato Grosso.

Aripuan

Nova Ubirat

IPA
Alto Risco
Brasnorte Mdio Risco
Baixo Risco
IPA por municpios, 2000. Sem notificao IPA por municpios, 2003.

110
Exerccio 3: Anlise espacial da distribuio de casos de malria no Estado de Mato Grosso em 2000 e 2003.

Observa-se na figura 3.3, que a ocorrncia da malria est dispersa, porm


os municpios com maior nmero de notificaes esto localizados na regio
norte do estado. Na regio sul, h municpios que no apresentam casos nos
dois anos estudados. O que chama ateno o Municpio de Nova Ubirat,
que em 2000 no notificou nenhum caso e em 2003 passa a figurar como
municpio de alto risco de transmisso. Desempenho contrrio observado
em Brasnorte, que passa de alto risco para nenhuma notificao.
A distribuio de casos por estratos de risco nos indica em 2000 a existncia
de 9 municpios classificados como de mdio risco e 3 municpios de alto
risco. Essa configurao modificada em 2003, com a existncia de 8
municpios de mdio risco e 1 de alto risco. O Municpio de Aripuan foi
desmembrado em Municpios de Colniza, Rondolndia e Aripuan. Esta rea
aparentemente manteve o quadro de mdio risco, exceto Rondolndia. Essa
descrio ilustra a mobilidade existente na demarcao dos contornos
territoriais definidos poltico-administrativamente. E, no nosso caso, a adoo
de municpios como unidade de anlise requer precauo principalmente
quando se busca acompanhar/monitorar o comportamento e a dinmica da
endmica ao longo do tempo.
O mapa temtico j nos indica que a distribuio espacial da malria no
estado no ocorre de forma homognea. A heterogeneidade observada
visualmente reafirma a necessidade de aprofundar a anlise em maior escala.
Assim, aps a localizao e classificao dos municpios do estado por estratos
de risco, questiona-se:

Ser que os casos de malria, apresentados pelos municpios, tm


relao com os casos de malria dos vizinhos? Ou vice-versa?

Para responder a essa questo escolhemos o ndice de Moran Local, mais


especificamente o Box Map, como recurso para a identificao/localizao de
reas homogneas constitudas por municpios com associao espacial.
Esse construdo com base nos valores normalizados (valores dos atributos
IPA subtrados de sua mdia e divididos pelo desvio-padro), no qual o
atributo foi classificado conforme sua posio em relao aos quadrantes do
Diagrama de Espalhamento de Moran, recebendo uma cor correspondente
quando gerado o mapa (Cmara, Carvalho, Cruz & Correa, 2004). Dessa forma,
classificamos os municpios de acordo com sua localizao nos quadrantes
do Diagrama de Espalhamento de Moran, em reas de agrupamentos de
municpios homogneos, consideradas como: quadrante 1 (+ / +) e quadrante
2 ( / ) para reas de associao espacial positiva, e quadrante 3 (+ / ) ou
quadrante 4 ( / +) para reas de associao espacial negativa.
O quadrante 1 (+ / +) indica que h presena de municpio com valor positivo
da IPA normalizada e possui a mdia dos valores normalizados dos municpios
vizinhos tambm positiva, isto , ambos os valores so positivos; o quadrante

111
ANEXOS - Exerccios

2 ( / ) localiza os municpios com valor negativo da IPA normalizada e possui


a mdia dos valores normalizados dos municpios vizinhos tambm negativos,
isto , ambos os valores so negativos. Dessa forma, os quadrantes 1 e 2 (Q1
e Q2) indicam reas de associao espacial positivas, levando-se em conta
que o municpio possui vizinhos com valores semelhantes (Cmara, Carvalho,
Cruz & Correa, 2004).
O quadrante 3 (+ / ) indica municpio com valor positivo da IPA normalizada e
possui a mdia dos valores normalizados dos municpios vizinhos negativos e;
quadrante 4 ( / +) distribui os municpios com valor negativo da IPA normalizada
e possui a mdia dos valores normalizados dos municpios vizinhos com valor
positivo. Tanto o quadrante 3 (Q3) como o 4 (Q4) no acompanham a tendncia
global e indicam reas de associao espacial negativas, considerando que
numa localizao h vizinhos com valores distintos, considerada como regio
de transio entre os dois regimes espaciais, no caso os municpios dos
quadrantes 1 e 2 (Cmara, Carvalho, Cruz & Correa, 2004).
Adotou-se, com base no mapa gerado pelo Box Map, quatro reas distintas
de prioridade para o controle da malria:
rea de maior prioridade para controle: municpios agregados no
quadrante Q1 (+ / +);
rea de menor prioridade para controle: municpios agregados no
quadrante Q2 ( / );
rea de prioridade intermediria para controle: municpios agregados no
quadrante Q3 (+ / );
rea de prioridade intermediria para controle: municpios agregados no
quadrante Q4 ( / +).

Antes de gerar um novo mapa importante que seja criado um novo


tema com as mesmas informaes. Dessa forma no perdemos o mapa
temtico gerado na etapa anterior.

D Visualizando o Box Map.


Para a visualizao do Box Map execute os passos a seguir, o resultado
apresentado na figura 3.4:
1. Marque o tema MT1997 e clique com o boto esquerdo do mouse para
acionar o menu;
2. Na rvore de vistas/temas, selecione e habilite o tema MT1997;
3. Clique em Criar tema a partir de tema (tenha certeza de que estejam
selecionadom todos os objetos) e nomear como Box00;
4. Para a visualizao do mapa Box Map, pressione o boto direito do mouse
e selecione Editar legenda;
5. Em Parmetro de Agrupamento:
a) Selecionar o modo Valor nico;
112
Exerccio 3: Anlise espacial da distribuio de casos de malria no Estado de Mato Grosso em 2000 e 2003.

b) Selecionar o atributo MT1997.IPA00BoxMap;


c) Definir por preciso 1;
d) Escolher 4 cores;
Aplicar.
6.Modificar os valores e os rtulo para:
a) Valor = 1, rtulo = Q(+ / +);
b) Valor = 2, rtulo = Q( / );
c) Valor = 3, rtulo = Q(+ / );
d) Valor = 4, rtulo = Q( / +);
7. Executar;
8. Pode-se, clicando com o mouse esquerdo, renomear a legenda e/ou
alterar o visual. Pode-se renomear a legenda conforme exemplo abaixo:
a) rea de maior prioridade;
b) rea de menor prioridade;
c) rea de prioridade intermediria Q3;
d) rea de prioridade intermediria Q4;
9.Salvar tela de visualizao em arquivo .bmp.

FIGURA 3.4 Box Map da ocorrncia da IPA nos municpios de Mato Grosso.

Apiacs Nova Bandeirante


Juruena
Unio do Sul

Feliz Natal

Gacha do Norte

Paranatinga

Nova Ubirat

Vera

IPA, BOXMAP
Q (+/+)
Q (/)
Q (+/)
Box Map, IPA de 2000, MT. Q (/+) Box Map, IPA de 2003, MT.

Na figura 3.4 observa-se que 10 municpios em 2000 foram classificados


como de alta prioridade para controle e 14 em 2003. Pelo ndice de Moran
Local, os municpios de Apiacs e Feliz Natal passaram de rea de prioridade
intermediria Q3 para rea de maior prioridade Q1, isto , apresentavam em
2000, IPA acima da mdia que seus vizinhos, e em 2003 ambos (os municpios
e seus vizinhos) apresentaram os valores positivos. Destacam-se tambm
municpios de prioridade intermediria Q4 (IPA normalizada menor que seus
vizinhos) em 2000, modificarem o status para municpios de maior prioridade.
113
ANEXOS - Exerccios

Os municpios de prioridade intermediria (seja ela Q3 ou Q4), esto em sua


maioria entre os de menor e maior prioridade e so conhecidos como reas
de transio. Esta visualizao destaca reas de transio, de maior ou menor
prioridade, e possibilita monitorar a dinmica do evento e definio de
estratgias de interveno adequadas a especificidades locais, considerando
a vizinhana.
O Moran Map foi construdo para visualizar no interior de cada rea de
prioridade identificada pelo Box Map, reas ou municpios onde a
dependncia espacial mais pronunciada, destacando reas de
autocorrelao espacial estatisticamente significante. O Moran Map a
representao do ndice de Moran Local, onde os municpios so
classificados em 4 quadrantes (Q + / +, Q / , Q + / e Q / +) e municpios
no-significantes estatisticamente (Cmara, Carvalho, Cruz & Correa, 2004).
Os municpios de Q + / + so considerados como reas crticas de ocorrncia
de malria.

E Visualizando o Moran Map.


Para a visualizao do mapa Moran Map, utilizaremos Editar Legenda,
execute os passos a seguir, o resultado apresentado na figura 3.5:
1. Na rvore de vistas/temas, selecione e habilite o tema MT1997;
2. Pressione o boto direito do mouse e selecione Editar legenda;
3. Em Parmetro de Agrupamento:
a) Selecionar o modo Valor nico;
b) Selecionar o atributo MT1997.IPA00MoranMap;
c) Definir por preciso 1;
d) Escolher 5 cores;
4. Aplicar.
5. Modificar os valores e os rtulos para:
a) Valor = 0, rtulo = no significante
b) Valor = 1, rtulo = Q(+ / +);
c) Valor = 2, rtulo = Q( / );
d) Valor = 3, rtulo = Q(+ / );
e) Valor = 4, rtulo = Q( / +);
6. Executar;
7. Pode-se, clicando com o mouse esquerdo, renomear a legenda e/ou
alterar o visual. Pode-se renomear a legenda conforme exemplo abaixo:
a) No Significante
b) rea de maior prioridade;
c) rea de menor prioridade;
d) rea de prioridade intermediria Q3;
e) rea de prioridade intermediria Q4;
8. Salvar tela de visualizao em arquivo.bmp.

114
Exerccio 3: Anlise espacial da distribuio de casos de malria no Estado de Mato Grosso em 2000 e 2003.

Na visualizao do padro local gerado pelo Moran Map notamos


agrupamentos de autocorrelao espacial local estaticamente significante,
apontando-os como o local onde a dependncia espacial ainda mais
pronunciada, seja de rea de maior prioridade, menor prioridade ou prioridade
intermediria. A importncia da sua utilidade para monitoramento ou
estratificao de reas de risco reside na identificao de municpios crticos,
no caso de reas de maior risco.

FIGURA 3.5 Moran Map da ocorrncia da IPA nos municpios de Mato Grosso.

Moran Map, IPA


Q (+/+)
Q (/)
Moran Map, IPA de 2000, MT. Q (+/) Moran Map, IPA de 2003, MT.
Q (/+)

O recurso para estratificao de prioridade utilizando o Box Map propicia


estabelecer metas que considerem a incidncia do municpio principal e de
seus vizinhos. Essas metas necessitariam ser diferenciadas de acordo com
as reas ou agrupamentos de prioridade. Dessa forma, a curto prazo, (metas
anuais) poderia-se estabelecer as seguintes metas:
os municpios localizados na rea intermediria de prioridade Q3
determinariam como meta a reduo da IPA para valores prximos ou menores
que a mdia de seus vizinhos;
os municpios localizados na rea intermediria de prioridade Q4 teriam a
meta de reduzir a IPA para valores prximos media dos municpios de menor
prioridade e, empenhar esforos para no sofrer a influncia de seus vizinhos
e aumentar a IPA;
os municpios localizados na rea de maior prioridade estabeleceriam como
objetivo reduzir a IPA, procurando se aproximar aos valores apresentados pelos
municpios vizinhos localizados na rea intermediria de prioridade Q4, ou reduzir
a IPA para valores prximos mdia dos municpios de menor prioridade;
os municpios localizados na rea de menor prioridade estabeleceriam
como meta a eliminao de casos autctones e reforariam o sistema de
vigilncia e controle da malria na deteco precoce de casos importados.
115
116
Referncias Bibliogrficas

Bailey TC, Gatrell AC, 1995. Interactive spatial data analysis. 1 ed. Longman Group Limited,
Essex, 413 pp.

Barcellos C, Barbosa KC, Pina MF, Magalhes MMAF, Paola JCMD, Santos SM, 1998.
Interrelacionamento de dados ambientais e de sade: Anlise de risco sade
aplicada ao abastecimento de gua no Rio de Janeiro utilizando Sistemas de
Informaes Geogrficas, Cadernos de Sade Pblica, 14(3) 597-605

Barcellos C, Acosta LMW, Lisboa EP, Brito MRV, Flores R, 2006. Estimativa da prevalncia
de HIV em gestantes em micro-reas de Porto Alegre atravs de tcnicas de anlise
espacial. Revista de Sade Pblica, 40(5): 928 - 930.

Besag J, Newell J, 1991. The detection of clusters in rare diseases. J. R. Stat. Soc. A,
154: 143-155.

Box, GEP. 1979. Robustness is the strategy of scientific model building. In Robustness in
Statistics, (Launer, RL & Wilkinson, GN, eds), pp. 201-236, Academic Press, New
York, NY.

Cmara G, Monteiro AMV, Druck S, Carvalho MS, 2002. Anlise espacial e


geoprocessamento. In S Druck, MS Carvalho, G Cmara and AMV Monteiro, Anlise
espacial de dados geogrficos. Disponvel em http://www.dpi.inpe.br/gilberto/livro/
analise/. Acessado em 17 de setembro de 2003.

Cmara G, Carvalho MS, Cruz OG, Correa V, 2004. Anlise espacial de reas. In. Embrapa
Cerrados. Anlise espacial de dados geogrficos. Planaltina, DF: Embrapa; 2004.
p.157-209.

Carvalho MS, Cmara G, 2002. Anlise de eventos pontuais. In S Druck, MS Carvalho, G


Cmara and AMV Monteiro, Anlise espacial de dados geogrficos. Disponvel em
http://www.dpi.inpe.br/gilberto/livro/analise/.Acessado em 17 de setembro de 2003.

Cavalcante MS, 2004. Transmisso Vertical do HIV em Fortaleza: Revelando a Situao


Epidemiolgica em uma Capital do Nordeste. RBGO: Revista da Federao Brasileira
das Sociedades de Ginecologia e Obstetrcia/FEBRASCO., V.6, n.2, So Paulo.

Cromley EK, McLafferty SL, 2002. GIS and Public Health. 1 ed. The Gulford Press,New
York, 340 pp.

Everitt B, 1974. Cluster Analysis. Heinemann Educational Books, London.

Gatrell AC, Bailey TC, 1996. Interactive spatial data analysis in medical geography. Soc
Sci Med, 42: 843-855.

Kelsall JE, Diggle PJ, 1995. Non-parametric estimation of spatial variation in relative risk.
Stat Med, 14: 2335-2342.

117
Referncias bibliogrficas

King PE, 1979. Problems of spatial analysis in geographical epidemiology. Social Science
& Medicine, 13: 249-252.

Kulldorff M, 1997. A spatial scan statistic. Commun. Statist. - Theory Meth, 26: 1481-1496.

Kulldorff M, 2003. SaTScanTM user Guide for version 3.1. Disponvel em http://
www.satscan.org. Acessado em 21 de junho de 2003.

Lawson AB, Kulldorff M, 1999. A review of cluster detection methods. In AB Lawson, A


Biggeri, D Bhning, E Lesaffre, JF Viel and R Bertollini, Disease mapping and risk
assessment for public health, John Wiley and Sons, Chichester. p. 99-110.

Levine N, 2002. CrimeStat: A spatial statistics program for the analysis of crime incident
locations. Ned Levine & Associates, Houston, TX, and the National Institute of Justice.
Washington, DC.

MS (Ministrio da Sade), 2002. Boletim Epidemiolgico da AIDS/Ministrio da Sade.


Coordenao Nacional de DST e Aids. Ano XVI, n 01, 14 a 52 semanas
epidemiolgicas abril a dezembro 2002. Braslia. http://www.opas.org.br/sistema/
arquivos/matriz.pdf Acessado em 27/out/2004.

MS (Ministrio da Sade), 2003. Vigilncia em Sade. Dados e Indicadores Selecionados


2003. Braslia.

Neri SHA, 2004. A utilizao das ferramentas de geoprocessamento para identificao


de comunidades expostas a hepatite A nas reas de ressacas dos municpios de
Macap e Santana (AP). Dissertao de mestrado. COPPE/UFRJ. Rio de Janeiro

Rede Interagencial de Informao para a Sade (RIPSA), 2002. Indicadores bsicos de


sade no Brasil: conceitos e aplicaes. Braslia: OPAS, 2002.

Sabel CE, Gatrell AC, Loytonen M, Maasilta P, Jokelainen M, 2000. Modelling exposure
opportunities: estimating relative risk for motor neurone disease in Finland. Soc Sci
Med, 50: 1121-1137.

Sankoh OA, Ye Y, Sauerborn R, Muller O, Becher H, 2001. Clustering of childhood mortality


in rural Burkina Faso. Int J Epidemiol, 30: 485-492.

Santana R, Dhalia C, Barreira D, Barbosa A, PAZ, Cardoso A, 2002. Implantao da


vigilncia epidemiolgica de gestantes HIV+ e crianas expostas. Revista Brasileira
de Epidemiologia, Suplemento Especial; Comunicaes Coordenadas p.73, Curitiba.

Santos SM, Barcellos C, Carvalho MS, Flores R, 2001. Deteco de aglomerados espaciais
de bitos por causas violentas em Porto Alegre, Rio Grande do Sul, Brasil, 1996. Cad
Sade Pblica, 17: 1141-1151.

Silverman BW, 1986. Density estimation for statistics and data analysis. Chapman and
Hall, London.

SMS (Secretaria Municipal de Sade de Porto Alegre). PR-SABER: Informaes de


Interesse Sade. Volume 4 n 3 , dezembro de 1999, Porto Alegre.

Snow J, 1999. Sobre a Maneira de Transmisso do Clera. Rio da Janeiro/So Paulo:


ABRASCO/HUCITEC.

Tobler, WR, 1979. Cellular geography. Philosophy in geography, pp. 379-386.

Ward MP, Carpenter TE, 2000. Techniques for analysis of disease clustering in space and
in time in veterinary epidemiology. Prev Vet Med 45: 257-284.

118
Links teis para download de aplicativos
recomendados

Crimestat - http://www.icpsr.umich.edu/CRIMESTAT/

Google Earth - http://earth.google.com/intl/pt/

SatScan - http://www.satscan.org/

TerraView - http://www.dpi.inpe.br/terraview/index.php

WinBugs - http://www.mrc-bsu.cam.ac.uk/bugs/winbugs/contents.shtml

119
Outros ttulos da srie: CAP ACIT
CAPACIT AO E A
ACITAO TU
ATU ALIZAO EM GEOPROCESSAMENTO EM SADE
TUALIZAO

VOLUME 1 Abordagens Espaciais na Sade Pblica


Organizadores: Simone M. Santos e Christovam Barcellos

VOLUME 2 Sistemas de Informaes Geogrficas e Anlise Espacial


na Sade Pblica
Organizadores: Simone M. Santos e Reinaldo Souza-Santos

VOLUME 3 Introduo Estatstica Espacial para a Sade Pblica


Organizadores: Simone M. Santos e Wayner V. Souza

MAIS INFORMAES: Secretaria de Vigilncia em Sade


Ministrio da Sade
Esplanada dos Ministrios
edifcio sede, Bloco E, 1 andar
Braslia - DF CEP 70.058-900
e-mail: svs@saude.gov.br
Tel: (61) 3315.3777

Visite nosso site:


www.capacita.geosaude.cict.fiocruz.br
Esta obra foi produzida no Rio de Janeiro pelo Departamento de Programao Visual
ICICT Fiocruz, em outubro de 2007. A composio empregou as tipologias Arial,
Arial Narrow, Arial Black e Zapf Humanist 601. O papel utilizado para miolo o
Couch fosco L2 - 95 g/m2. E, para a capa, Supremo Alto Alvura 275 g/m2.

122
123

Você também pode gostar