Você está na página 1de 124

MINISTRIO DA SADE FUNDAO OSWALDO CRUZ

VOLUME

Srie B. Textos Bsicos de Sade Braslia - DF 2007

2007 Ministrio da Sade. Todos os direitos reservados. permitida a reproduo parcial ou total desta obra, desde que citada a fonte e que no seja para venda ou qualquer fim comercial. A responsabilidade pelos direitos autorais de textos e imagens desta obra da rea tcnica. A coleo institucional do Ministrio da Sade pode ser acessada, na ntegra, na Biblioteca Virtual em Sade do Ministrio da Sade: http://www.saude.gov.br/bvs Srie B. Textos Bsicos de Sade Srie Capacitao e Atualizao em Geoprocessamento em Sade; 3 Tiragem: 1. edio 2007 1.200 exemplares Elaborao, distribuio e informaes: MINISTRIO DA SADE Secretaria de Vigilncia em Sade Departamento de Anlise de Situao em Sade Esplanada dos Ministrios, bloco G Edifcio Sede, 1. andar, sala 134 CEP: 70058-900, Braslia DF E-mail: svs@saude.gov.br Home page: http://www.saude.gov.br/svs Fundao Oswaldo Cruz Instituto de Comunicao e Informao Cientfica e Tecnolgica em Sade Avenida Brasil 4365, Manguinhos, Rio de Janeiro, RJ, CEP 21045-900 Home page: www.fiocruz.br Equipe Tcnica da Elaborao: Ana Lcia S. S. Andrade IPTSP/UFGO Antnio Miguel V. Monteiro DPI/INPE Christovam Barcellos CICT/FIOCRUZ Eugnio P. Lisboa CGVS/SMSPOA Lisiane M.W.Acosta CGVS/SMSPOA Maria Cristina de Mattos Almeida SMSA/PBH Maria Regina Varnieri Brito CNVANT/SMS/POA Marilia S Carvalho ENSP/FIOCRUZ Marina Atanaka dos Santos ISC/UMG Oswaldo Gonalves Cruz PROCC/FIOCRUZ Reinaldo Souza dos Santos ENSP/FIOCRUZ Rui Flores CGVS/SMSPOA Simonne Almeida e Silva IPTSP/UFGO Simone M. Santos CICT/FIOCRUZ Virginia Ragoni M. Correia DPI/INPE Wayner V. Souza CpqAM/FIOCRUZ Reviso Tcnico-pedaggica Grcia Maria de Miranda Gondim Simone M. Santos Reviso de Portugus: Itamar Jos de Oliveira Ilustrao da capa, Programao Visual e Direo de Arte: Vera Lucia Fernandes de Pinho Fotos da capa: Peter Ilicciev / Banco de Imagens / Fiocruz Tratamento de Imagens e Fotografias: Os autores

Coordenao Executiva do projeto Walter Massa Ramalho Christovam Barcellos Mnica M. F. Magalhes Simone M. Santos

Impresso no Brasil / Printed in Brazil Ficha Catalogrfica Brasil. Ministrio da Sade. Secretaria de Vigilncia em Sade. Fundao Oswaldo Cruz.

Introduo Estatstica Espacial para a Sade Pblica / Ministrio da Sade, Fundao Oswaldo Cruz; Simone M. Santos, Wayner V. Souza, organizadores. - Braslia : Ministrio da Sade, 2007. 120 p. : il. (Srie B. Textos Bsicos de Sade) (Srie Capacitao e Atualizao em Geoprocessamento em Sade; 3) ISBN 978-85-334-1427-3 1. Estatstica espacial. 2. Vigilncia em Sade. 3. Anlise espacial. 4. Sade pblica. I. Simone M. Santos (Org.) II. Wayner V. Souza (Org.) III.Ttulo. IV. Srie.

NLM W 26.55.14
Catalogao na fonte Coordenao-Geral de Documentao e Informao Editora MS OS 2007/1136

Ttulos para indexao: Em ingls: Spatial Statistics Introduction for Public Health Em espanhol: Introducin a la Estadstica Espacial en la Salud Pblica

AUTORES
Ana Lcia S. S. Andrade Mdica, doutora em Sade Pblica, professora titular do Departamento de Sade Coletiva do Instituto de Patologia Tropical e Sade Pblica da Universidade Federal de Gois. Antnio Miguel Vieira Monteiro Engenheiro, doutor em Engenharia da Computao, tecnologista snior da Diviso de Processamento de Imagens e Coordenador do Programa Espao e Sociedade do Instituto Nacional de Pesquisas Espaciais. Christovam Barcellos Gegrafo, Sanitarista, doutor em Geocincias, pesquisador titular do Departamento de Informaes em Sade do Centro de Informao Cientfica e Tecnolgica da Fundao Oswaldo Cruz. Eugnio P. Lisboa Mdico, Secretaria Municipal de Sade de Porto Alegre. Lisiane M.W.Acosta Enfermeira, especialista em Enfermagem em Sade Pblica, mestranda em Epidemiologia, profissional da Equipe de Vigilncia das Doenas Transmissveis da CGVS da Secretaria Municipal de Sade de Porto Alegre. Maria Cristina de Mattos Almeida Mdica Veterinria, mestre em Sade Pblica, epidemiologista da Gerncia de Epidemiologia e Informao da Secretaria Municipal de Sade de Belo Horizonte. Maria Regina Varnieri Brito Mdica, especialista em Sade Pblica e em Demografia, mestre em Sade Pblica (Epidemiologia). Mdica da Equipe de Eventos Vitais e Coordenadora do Ncleo de Vigilncia de Agravos No Transmissveis da Secretaria Municipal de Sade de Porto Alegre. Marilia S Carvalho Mdica, mestre em Sade Pblica, doutora em Engenharia Biomdica, ps-doutorado em Estatstica, pesquisadora titular do Departamento de Epidemiologia e Mtodos Quantitativos da Escola Nacional de Sade Pblica Srgio Arouca da Fundao Oswaldo Cruz. Marina Atanaka dos Santos Enfermeira, doutora em Sade Pblica, docente do Departamento de Sade Coletiva do Instituto de Sade Coletiva da Universidade Federal de Mato Grosso. Oswaldo G. Cruz Bilogo, mestre em Sade Pblica, doutor em Engenharia Biomdica, pesquisador do Programa de Computao Cientfica da Fundao Oswaldo Cruz. Reinaldo Souza dos Santos Bilogo, doutor em Sade pblica, pesquisador associado do Departamento de Endemias Samuel Pessoa da Escola Nacional de Sade Pblica Srgio Arouca da Fundao Oswaldo Cruz. Rui Flores Mdico, Sanitarista, Secretaria Municipal de Sade de Porto Alegre. Simone Maria dos Santos (organizadora) Mdica, especialista em Sade Coletiva, mestra e doutoranda em Sade Pblica (Epidemiologia), pesquisadora colaboradora do Departamento de Informaes em Sade do Centro de Informao Cientfica e Tecnolgica da Fundao Oswaldo Cruz. Simonne Almeida e Silva Mdica, especialista em Medicina Preventiva e Social mestra e doutora em Medicina Tropical (Epidemiologia). Professora adjunta do Departamento de Sade Coletiva do Instituto de Patologia Tropical e Sade Pblica da Universidade Federal de Gois. Wayner V. Souza (organizador) Estatstico, mestre e doutor em Sade Pblica, tecnologista snior e docente do Departamento de Sade Coletiva do Centro de Pesquisas Aggeu Magalhes da Fundao Oswaldo Cruz

Prefcio

O rpido desenvolvimento de tecnologias para anlise de dados no espao geogrfico tem oferecido possibilidades inovadoras ao estudo da situao de sade e de suas tendncias, propiciando melhor compreenso dos fatores socioeconmicos e ambientais, entre outros, que determinam as condies de vida e o estado de sade da populao. A apropriao desse instrumental pelo setor sade sumamente importante no Brasil, onde acentuadas desigualdades se evidenciam no apenas entre as grandes regies, os estados e os municpios, mas tambm no interior destas reas, sobretudo nos espaos urbanos. Sobrepondo-se ao mosaico de situaes diferenciadas que caracteriza o territrio brasileiro, as transformaes demogrficas observadas nas ltimas dcadas potencializam a dinmica de distribuio de doenas e agravos, bem como de demanda e acesso aos servios. Tudo isso implica enormes desafios para a organizao e a atuao do setor sade, impondo crescente necessidade de dados sistematizados e de informaes para anlise crtica, apresentadas oportunamente e de forma adequada apreenso e uso pelas instncias decisrias. A visualizao espacial dos problemas de sade e da forma como eles evoluem, correlacionadas aos seus determinantes e s medidas de interveno que so propostas e colocadas em prtica, constitui instrumento poderoso e complementar a outros modelos de anlise com este fim. No contexto brasileiro do setor sade, tal propsito envolve considervel esforo de apropriao das tecnologias disponveis e de desenvolvimento de estratgias que viabilizem o seu uso, em sintonia com processos de modernizao gerencial da rea de informao e informtica em sade na rede de servios. O seu mximo aproveitamento requer mecanismos efetivos de articulao institucional e intersetorial em todas as esferas do Sistema

Prefcio

nico de Sade (SUS), que promovam a harmonizao de iniciativas e a mobilizao dos recursos humanos existentes, em torno de objetivos comuns. Nesse sentido, os ncleos especializados do Ministrio da Sade tm prestado, de maneira notvel, a contribuio ao seu alcance, exercendo com denodo e eficincia a funo de desenvolver instrumentos apropriados e de promover iniciativas de capacitao e atualizao de profissionais do SUS nas tcnicas de geoprocessamento em sade. Este terceiro livro da srie representa, portanto, um novo marco importante no processo de aperfeioar a gesto da sade no Brasil.

Joo Baptista Risi Junior


Consultor da Organizao Pan-Americana de Sade rea tcnica de Informao para polticas de sade

Apresentao

Para alm dos mapas coroplticos (temticos) o que pretende o livro Introduo Estatstica Espacial para a Sade Pblica, mostrando ao leitor os primeiros passos dos pressupostos estatsticos nas abordagens espaciais. As tcnicas estatsticas apresentadas ampliam as anlises de modo a permitir a realizao de inferncias e de testes de hipteses geradas pelos profissionais de sade pblica para responder questes sobre a distribuio de eventos no seu dia-a-dia. Esse esforo de traduo da estatstica para uma linguagem acessvel, pela reduo das notaes e terminologias estatsticas e identificao de conceitos fundamentais dos pressupostos de uso destas tcnicas, uma meta direcionada aos profissionais do SUS. A crescente demanda por maior capacidade analtica dos seus tcnicos, e o desafio de transformao da exploso de dados disponveis em informaes teis pode ser acompanhada pelo refinamento das anlises. Essa traduo de linguagem, que no trivial, foi executada com sucesso graas experincia do corpo autoral desta publicao. Participam como autores deste volume um grupo de especialistas (docentes, pesquisadores e tcnicos de servios de sade) envolvido com o desenvolvimento da rea no Brasil, e que h vrios anos vem utilizando e propondo tcnicas de anlise espacial aplicadas sade. Contribuindo nesse esforo, grupos de pesquisadores vm produzindo Sistemas de Informao Geogrfica com pacotes aplicados anlise espacial, que apresentam caractersticas animadoras como: a facilidade da interface; a gerao de bancos de dados geogrficos; a possibilidade de incorporar pequenos aplicativos denominados de plug-in; e, especialmente o fato de possuir bibliotecas abertas para desenvolvedores externos. O aplicativo TerraView, desenvolvido pelo Instituto Nacional de Pesquisas Espaciais, instituio parceira e atuante na rea, o ambiente computacional de referncia, tambm neste volume. Como alguns procedimentos ainda no esto disponveis no TerraView, no momento desta edio, lanou-se mo de outros softwares compatveis e gratuitos, como o SatScan e o CrimeStat, para execuo de algumas tcnicas.

Apresentao

O primeiro captulo possibilita um passeio introdutrio por conceitos da Anlise de Dados Espaciais a partir de conceitos da estatstica geral para a estatstica espacial, de forma suave e encadeada, buscando interagir com o leitor por meio de exemplos cotidianos da realidade brasileira. Os dois captulos que seguem tratam de facetas especficas da natureza cartogrfica da representao das informaes disponveis os pontos e os polgonos (reas). Os autores abordam as limitaes e as possibilidades de anlise estatstica espacial adequada aos indicadores, de acordo com sua topologia. Complementando o contedo terico, trs exerccios dirigidos so apresentados para a aplicao prtica do aprendizado. Os problemas abordados tm base na experincia das atividades de Vigilncia em Sade. Os bancos de dados necessrios para a execuo das anlises propostas esto disponveis para download no endereo do projeto descrito abaixo. Ao tratar desta publicao, tentamos contemplar o pblico com uma apresentao fundamentada em tcnicas estatsticas, focando nas estimaes e especialmente nas interpretaes. Por meio da adequao da linguagem, esperamos ter alcanado os objetivos expostos, cativando o leitor e estimulando suas incurses nesse universo de tcnicas estatsticas. Gostaria ainda de expressar a grande felicidade na participao em um projeto de desenvolvimento que toma corpo como uma rede que rene saberes e especialmente prticas que permitem viabilizar a aplicao dos desenvolvimentos da geotecnologia sade no Brasil. Assim, como este projeto de construo permanente, o TerraView est sempre disponibilizando ferramentas novas (www.dpi.inpe.br), e o projeto de Capacitao e Atualizao em Geoprocessamento em Sade (www.capacita.geosade.cict.gov.br) oferecer produtos voltados para aplicaes no setor sade. Participe, entre em contato, siga os exerccios e boa sorte!
Walter M. Ramalho
Coordenao Executiva do projeto de Capacitao e Atualizao em Geoprocessamento para a Sade Pblica

Sumrio
Captulo 1: Conceitos Bsicos em Anlise de Dados Espaciais em Sade ... 1 3
1.1 - Estudos Ecolgicos ....................................................................................................... 15 1.2 - Estatstica Espacial ...................................................................................................... 17 Principais Aplicaes ................................................................................................... 20 Tipos de Dados ............................................................................................................ 21 A Pontos ................................................................................................................... 21 B reas ..................................................................................................................... 22 Conceitos Estatsticos Fundamentais ......................................................................... 23 A Dependncia espacial ........................................................................................... 23 B Estacionariedade .................................................................................................... 25

Captulo 2: Anlise de Dados em Forma de Pontos ..................................... 29


2.1 - Princpios de Anlise Espacial de Eventos com Representao por Pontos .................. 31 2.2 - Anlise Espacial de Eventos .......................................................................................... 33 Visualizao de Dados Espaciais ................................................................................ 33 Anlise Exploratria de Dados Espaciais ..................................................................... 33 Modelagem de Dados Espaciais .................................................................................. 33 2.3 - Anlise de Padres de Dados com Representao por Pontos .................................... 34 2.4 Anlises Baseadas na Distncia entre Pontos .............................................................. 38 Anlise de Aglomerados Hierrquicos ........................................................................... 39 A Distncia limiar ...................................................................................................... 40 B Nmero mnimo de pontos ..................................................................................... 41 C Tamanho da elipse ................................................................................................ 41 2.5 Anlise da Densidade de Pontos .................................................................................. 44 2.6 - Avaliao de Aglomerados considerando a Distribuio da Populao .......................... 48 Deteco de Aglomerados pelaTcnica Estatstica Scan ............................................. 51 Estimativa Kernel considerando a Populao ............................................................... 54 2.7 - Interpolao de Dados Pontuais .................................................................................... 56

Sumrio

Captulo 3: Anlise Espacial de Dados de reas .......................................... 61


3.1 - Mtodos para Espacializao e Tratamento Estatstico de Indicadores ........................... 63 Instabilidade em Pequenas reas ................................................................................. 63 Matriz de Vizinhana .................................................................................................... 65 3.2 - Mtodos de Suavizao Espacial .................................................................................... 66 Mdia Mvel Espacial ................................................................................................... 66 Estimador Bayesiano Emprico ...................................................................................... 66 Autocorrelao Espacial ................................................................................................ 69 3.3 - Anlise da Estrutura Espacial ......................................................................................... 71 Anlise da Estrutura Espacial - Estatstica de Moran ..................................................... 71 Anlise da Estrutura Espacial - Estatstica-Funo LISA ................................................ 72 Anlise da Estrutura Espacial - Mtodos Inteiramente Bayesianos ................................ 73 Anlise da Estrutura Espacial - Mtodo de Markov Chain-Monte Carlo .......................... 75 3.4 - Tcnicas de Anlise de Dados Pontuais Aplicadas a reas ............................................. 78

Anexos: Exerccios ......................................................................................... 83


Exerccio 1: Vigilncia e ateno sade de gestantes HIV positivas: construo de indicadores com operaes entre camadas ...................................................... 85 Exerccio 2: Distribuio dos acidentes de trnsito em Belo Horizonte, MG. ........................ 97 Exerccio 3: Anlise espacial da distribuio de casos de malria no Estado de Mato Grosso em 2000 e 2003 ......................................................................... 105

Referncias Bibliogrficas ......................................................................... 117

Links teis para download de aplicativos recomendados .......................... 1 1 9

Conceitos Bsicos em Anlise de Dados Espaciais em Sade

Marilia S Carvalho Oswaldo G. Cruz Wayner V. Souza Antnio Miguel V. Monteiro

Captulo 1: Conceitos Bsicos em Anlise de Dados Espaciais em Sade

1.1 - Estudos Ecolgicos


pg. 15

1.2 - Estatstica Espacial


pg. 17

Principais Aplicaes Tipos de Dados Conceitos Estatsticos Fundamentais

pg. 20 A- Pontos pg. 21 B- reas A- Dependncia espacial pg. 23 B- Estacionariedade

14

1.1 - Estudos Ecolgicos

O estudo dos padres de distribuio geogrfica das doenas e suas relaes com fatores socioambientais constitui-se no objeto do que hoje chamamos de Epidemiologia Geogrfica, que tem se constitudo em campo de aplicao e desenvolvimento de novos mtodos de anlise. Esse desenvolvimento tem sido viabilizado pela crescente disponibilidade e desenvolvimento de tcnicas e recursos de computao eletrnica, que tambm tornou possvel o desenvolvimento de Sistemas de Informaes Geogrficas com base na cartografia digital, que vm sendo utilizados em anlise de dados espaciais em sade. As tcnicas de anlise espacial se adequam s necessidades dos estudos ecolgicos, que utilizam reas geogrficas como unidade usual de observao. No caso particular da anlise espacial da ocorrncia de doenas, onde se dispe de dados referidos a uma rea geogrfica, deve-se dar ateno especial ao pressuposto bsico de que taxas e indicadores epidemiolgicos de uma doena, calculados para um determinado perodo, so uma nica realizao de um processo que probabilstico e que se procura identificar. A opo por estudos epidemiolgicos do tipo ecolgico pode ser logicamente adequada para o entendimento da variao do risco de adoecer entre diferentes grupos populacionais. A correta compreenso das dimenses envolvidas nos estudos de nvel ecolgico e de nvel individual, alm das relaes entre eles, possibilita explorar o potencial da abordagem ecolgica em sade pblica, mediante o emprego de ferramentas de anlise apropriadas que permitam controlar possveis fatores de confuso e evitar vieses de anlise, principalmente os clssicos, como os de produzir inferncias cruzadas, ou seja, de um nvel para outro. Inferncias enviesadas sero produzidas no s quando se extrapolam resultados do nvel ecolgico para o individual (falcia ecolgica), mas tambm quando ocorre o oposto, do nvel individual para o ecolgico (falcia atomstica), desconsiderando-se os efeitos de grupo. Apesar de no se dever considerar essas duas abordagens como antagnicas, a anlise da variabilidade do risco no nvel ecolgico fundamental para a compreenso dos determinantes sociais e ambientais do processo sade-doena, onde, particularmente, a condio socioeconmica dos grupos populacionais desempenha papel preponderante na explicao das condies de sade desses grupos. Nesse sentido, uma importante abordagem do ponto de vista ecolgico considerar o espao como fator multidimensional de estratificao de populaes, o que

15

CAPTULO 1 - Conceitos Bsicos em Anlise de Dados Espaciais em Sade

permite visualizar espacialmente, de forma articulada, as distribuies da doena e do risco, entendido como situao coletiva e definido sob diferentes abordagens. Alm disso, pode propiciar ao Sistema de Vigilncia em Sade Pblica compreender a dinmica e identificar diferenas e causas das diferenas na ocorrncia das doenas nos diversos subconjuntos da populao.

QUADRO 1.1 Classificao dos Estudos Epidemiolgicos

TIPO

POSIO DO INVESTIGADOR REFERNCIA TEMPORAL


Transversal Observacional

DENOMINAO
Estudos Ecolgicos Estudos de tendncia ou Sries Temporais Ensaios comunitrios Inquritos Estudos Prospectivos (Coorte)

Agregado Interveno

Longitudinal Longitudinal Transversal Observacional

Individual

Longitudinal Estudos Retrospectivos (Caso-Controle) Interveno Longitudinal Ensaios Clnicos

Essa abordagem possibilita no s a vigilncia dos indivduos de risco, mas tambm uma viso antecipada do risco coletivo, coerentemente com o entendimento de que as conseqncias dos processos endmicos e das intervenes de sade pblica nos vrios grupos sociais devem ser analisadas a partir de uma perspectiva ecolgica. Tal perspectiva deve considerar a dinmica evolutiva dos processos sociais e buscar identificar causas da incidncia das doenas em grupos populacionais e no as causas da doena no indivduo. Cada vez mais, trabalhos vm sendo desenvolvidos utilizando uma abordagem espacial e produzindo anlises integradas da associao dos eventos de sade com indicadores e/ou variveis socioambientais, com vistas a suprir as necessidades de um Sistema de Vigilncia em Sade. As fontes de informao para essas variveis e as abordagens para construo desses indicadores, principalmente aqueles capazes de medir ndices de carncia social, variam e vm sendo objeto de estudos e debates que podem contribuir para superar desigualdades e iniqidades em sade. Em muitos casos essas informaes so provenientes dos censos demogrficos, disponibilizadas no nvel dos setores censitrios, possibilitando anlises para este nvel ou nveis mais agregados, como bairros, distritos e municpios. No caso dos indicadores ambientais especificamente, as informaes so obtidas junto a institutos municipais ou estaduais de meio

16

1.1 - Estudos Ecolgicos

ambiente ou planejamento urbano, oriundas de levantamentos de campo, levantamentos areos ou de imagens de satlite. A ttulo de exemplo, apresentamos na figura 1.1, um mapa temtico representando as taxas mdias de incidncia de tuberculose, segundo setores censitrios do Municpio de Olinda-PE, para o perodo 1996-2000 e outro representando a mdia de moradores por domiclio, para estes mesmos setores censitrios de Olinda, segundo o Censo Demogrfico de 2000.
FIGURA 1.1 Olinda: taxa mdia de incidncia de tuberculose no perodo 1996-2000, e mdia de moradores por domiclio em 2000, segundo setores censitrios. Tuberculose - Olinda
N

Olinda - Censo Demogrfico 2000


N

Incidncia 1996-2000 0 42.2 42.2 86.0 86.0 142.2 142.2 215.9 215.9 390.1 Setores Censitrios

Moradores por Domiclio 2.1 3.1 3.1 3.4 3.4 3.6 3.6 3.8 3.8 4.2 Setores Censitrios

4 Kilometers

4 Kilometers

Fontes: SINAN e Censo Demogrfico 2000 - IBGE.

Pode-se observar, mesmo que apenas por inspeo visual, uma coincidncia entre vrios setores com altas taxas de incidncia e altas concentraes de moradores por domiclio. Essa associao espacial entre o indicador escolhido e a incidncia de tuberculose no casual, dado que altas mdias de moradores por domiclio apontam para carncia social, alm de se constituir em fator facilitador da transmisso da doena.

1.2 Estatstica Espacial

Denomina-se estatstica espacial o ramo da estatstica que permite analisar a localizao espacial de eventos. Ou seja, alm de identificar, localizar e visualizar a ocorrncia de fenmenos que se materializam no espao, tarefas possiblitadas pelo uso dos SIG, utilizando-se a estatstica espacial possvel modelar a ocorrncia destes fenmenos, incorporando, por exemplo, os fatores determinantes, a estrutura de distribuio espacial ou a identificao de padres.

17

CAPTULO 1 - Conceitos Bsicos em Anlise de Dados Espaciais em Sade

SNOW Londres, 1854. Regio sul, subdistrito de St. Saviour em Southwark. Localidade, parquia de Christchurch. Entre os dias 9 de julho e 5 de agosto. Livro de Registros Gerais. 1. n. 34, Charlotte Street, 29 de julho, um coronheiro, 29 anos, Clera Asitica, 18 horas. Atendimento de gua feito por Lambeth Water Company. 2. n. 45, Gravel Lane, 1 de agosto, a viva de um fazendeiro, 48 anos, Clera, 12 horas. Atendimento de gua feito por Southwark and Vauxhall Company. 3. n. 1, Alpha Place, 1 de agosto, o escrevente de um advogado, 57 anos, Clera, 24 horas. Atendimento de gua feito por Southwark and Vauxhall. 4. ... Ver o debate do Lancet, June 23, 1855, reproduzido em: http://www.ph.ucla.edu/epi/snow/reactionandcommitteeaction.html.

Se tomarmos o exemplo descrito no Box acima, v-se que o mdico ingls John Snow, reconhecendo que os casos de clera ocorriam em certas localizaes, fez uso direto dos mapas de Londres (Figura 1.2). Ele localizou os casos encontrados no registro de bitos, utilizando o endereo das residncias e os poos de proviso de gua existentes naquelas ruas. Se fosse hoje, John Snow s publicaria os resultados de seu estudo e fecharia a bomba de gua de Broad Street (Figura 1.3), se pudesse comprovar estatisticamente que esta bomba era responsvel pela propagao da epidemia de clera. (ver o site http://www.ph.ucla.edu/epi/snow.html)
FIGURA 1.2 Mapa do Clera Soho, Londres. FIGURA 1.3 Bomba de gua de Broad Street, Londres.

Que tipo de estatstica deveria ser usada? As tcnicas estatsticas mais usadas (por exemplo, o teste chi-quadrado), so baseadas em pressupostos que dificultam, ou mesmo impedem, seu uso quando a pergunta relaciona-se a problemas onde a localizao espacial relevante. Essas so as questes de fundo que iremos abordar neste livro.

18

1.2 - Estatstica Espacial

Usamos a estatstica nos estudos em sade para modelar a realidade. Modelos so simplificaes da realidade usadas para entender um sistema, estudar seu funcionamento, buscar causas de fenmenos, avaliar intervenes, prever desfechos. Segundo Box (1979) todos os modelos esto errados, alguns modelos so teis, ou seja, no existe modelo certo, mas modelos que servem a algum propsito. Quando ento so teis os modelos estatsticos na anlise espacial? Quando queremos estudar a sade e os fatores relacionados sade no contexto ambiental. A idia entender, estimar e modelar como esse contexto afeta a sade das pessoas, seja o contexto derivado de fatores socioeconmicos, da oferta de servios de sade, do ambiente fsico ou cultural. Sem medir esses contextos, nem padro de mortalidade e morbidade, nem o espalhamento epidmico, ou o risco de uma fonte de contaminao ambiental podem ser explicados e ter seu efeito estimado. A denominao estatstica espacial surge em oposio s tcnicas estatsticas comuns nos estudos em sade testes do tipo chi-quadrado, regresso mltipla, anlise de aglomerados, por exemplo quando se necessita focalizar explicitamente a localizao espacial, quando necessrio considerar a possvel importncia de seu arranjo espacial na anlise e interpretao de resultados. Isso porque um dos pressupostos mais gerais na estatstica, que permite estimar diversas estatsticas o da independncia entre as observaes: o que se mede em um indivduo no est associado ao medido em outro indivduo, exceto pelos possveis fatores comuns que desejamos exatamente descobrir.

O teste Chi-Quadrado (ler qui-quadrado) nos diz em que medida os valores observados de duas variveis categricas se desviam do valor esperado, caso as duas variveis no estivessem correlacionadas. Quanto maior o chi-quadrado, mais significante a relao entre as duas. A regresso linear um mtodo para se estimar o valor esperado de uma varivel dependente dado o valor de um varivel independente. chamada linear porque se considera que a relao da resposta s variveis uma funo linear de alguns parmetros. Quando se ajusta para mais de uma varivel independente chamada regresso mltipla. Na anlise de aglomerados, freqentemente chamada de anlise de cluster, o objetivo separar um conjunto de objetos em grupos conforme um padro de similaridade, medida a partir de um conjunto de variveis. Esse padro de similaridade estabelecido em um espao ndimensional dado pelas variveis medidas para cada observao.

19

CAPTULO 1 - Conceitos e Arquitetura de Sistemas de Informaes Geogrficas

Entretanto, quando olhamos para o espao, esse pressuposto pouco realstico, pois todas as coisas so parecidas, mas coisas mais prximas se parecem mais que coisas mais distantes (Tobler, 1979). Esse simples fato, que todos conhecemos, tem implicaes diretas para abordagem quantitativa baseada na teoria e tcnicas estatsticas que aplicamos usualmente sobre nossas observaes. Por uma razo muito simples, e que s vezes esquecemos: as tcnicas de anlise estatstica no-espaciais que utilizamos para nossos dados tm como pressuposto fundamental que as observaes em anlise representam pedaos de evidncia independentes sobre as associaes que estamos descrevendo e modelando. Ou, generalizando, a maior parte das ocorrncias, sejam estas naturais ou sociais, se relacionam, seja em sinergia ou antagonismo, e esta relao se enfraquece com a distncia. E esta a especificidade deste ramo da estatstica: tcnicas que permitem modelar os fenmenos cuja distribuio afetada pela sua localizao geogrfica e pela sua relao com seus vizinhos.

Principais Aplicaes
As principais reas de aplicao da estatstica espacial so o mapeamento de doenas, os estudos ecolgicos, a identificao de aglomerados espaciais (cluster) e o monitoramento de problemas ambientais. O mapeamento de doenas consiste na descrio do processo de distribuio espacial, visando a avaliar a variao geogrfica na sua ocorrncia para identificar diferenciais de risco, orientar a alocao de recursos e levantar hipteses etiolgicas. Os mtodos tm como objetivo produzir um mapa limpo, sem o rudo gerado pela flutuao aleatria dos pequenos nmeros, e controlando as diferenas na estrutura demogrfica. Os estudos ecolgicos visam a estudar a relao entre incidncia de doenas e potenciais fatores etiolgicos, que expliquem as diferenas na incidncia de determinado evento de sade. Do ponto de vista estatstico, esses estudos consistem, essencialmente, em modelos de regresso, onde se busca explicar a variao na incidncia da doena por meio de outras variveis. O modelo estatstico se complica pela necessidade de controlar, simultaneamente, o processo espacial, variveis explicativas e variveis de confuso. Um cluster espacial : qualquer agregado de eventos que no seja meramente casual, cuja identificao foco de pesquisas na rea de estatstica espacial. Estes aglomerados podem ser causados por diferentes fatores, tais como agentes infecciosos, contaminao ambiental localizada, efeitos colaterais de tratamentos, cada problema destes com peculiaridades e tcnicas particulares.

20

1.2 - Estatstica Espacial

A avaliao e monitoramento ambiental visam a estimar a distribuio espacial de fatores ambientais relevantes para a sade, acompanhando potenciais fontes ambientais de problemas de sade, tais como poluentes qumicos, insolao (Raios UV), vegetao, clima, entre outros. Nesse caso, em geral, os modelos estatsticos tm por objetivos fazer a predio espacial ou espao-temporal de processos com forte correlao espacial e temporal. Esse tipo de tcnica no ser objeto deste livro.

Tipos de Dados
Da mesma forma que o SIG tem diferentes funes dependendo do tipo de dado, algumas tcnicas estatsticas so mais apropriadas para um ou outro tipo de dado. Basicamente, so dois tipos que utilizamos: (A) dados que so atributos de pontos, ou (B) dados atributos de reas.

A Pontos
O tipo mais simples o dado de ponto. Nesse caso temos a localizao pontual (coordenadas) de algum evento, o mais comum o da residncia de um caso de doena. importante observar que o que aleatrio, ou seja, o que ser analisado estatisticamente, a localizao. A pergunta associada a esse tipo de dado sempre o ONDE, mesmo quando outras co-variveis do indivduo so medidas. O melhor exemplo novamente a investigao da epidemia de clera em Londres, 1854. John Snow localizou as residncias de cada caso de clera, a idade, profisso e outras variveis de interesse, e, mais importante, a fonte da gua utilizada e a localizao dos locais de captao de cada companhia. Suponhamos ento que fossemos ns a fazer a pesquisa. Duas perguntas so importantes. A primeira busca analisar a distribuio espacial dos casos de clera, verificando se esto distribudos homogeneamente na cidade, ou ao contrrio, concentram-se em alguns locais em detrimento de outros. Vale lembrar que na poca a teoria miasmtica era dominante, com suporte do Dr. William Farr, que publicou estudo atribuindo aos locais mais baixos, onde os miasmas se concentram, as maiores taxas de mortalidade por clera. A segunda pergunta busca estimar o efeito de cada companhia de gua sobre a mortalidade. Esse foi um dos aspectos analisados que de fato definiu os rumos da pesquisa. Se fosse hoje, poderamos analisar simultaneamente a localizao geogrfica e a companhia de gua, o que no era possvel na poca. John Snow considerou que os casos eram amostras independentes, o que no to verdadeiro. Clera tambm se transmite de pessoa a pessoa, diretamente ou atravs de objetos contaminados, embora a magnitude da contaminao pela gua seja muito maior.

21

CAPTULO 1 - Conceitos e Arquitetura de Sistemas de Informaes Geogrficas

As tcnicas de anlise de dados de pontos sero abordadas no Captulo 2.

B reas
Outro tipo de dado o proveniente de reas geogrficas com limites definidos, usualmente divises poltico-administrativas. So as contagens de casos ou bitos de alguma doena ou os indicadores provenientes do censo demogrfico. importante observar a escala em que esses dados so coletados e analisados. Em geral, quanto maior a rea geogrfica, mais misturada a populao onde ocorre o processo em estudo. Municpios, muito freqentemente, so compostos por diferentes populaes, com diferentes caractersticas e riscos sade, por exemplo, englobando populaes rurais e urbanas, diferentes nveis sociais, acesso a servios de sade ou problemas ambientais. No outro extremo, os setores censitrios tm populao mais semelhante do ponto de vista socioeconmico e demogrfico. Ou seja, a capacidade de diferenciar geograficamente regies diminui com o tamanho da rea e respectiva populao residente. Entretanto, quando consideramos pequenas reas, a disponibilidade do dado comea a ser mais complicada. Informaes socioeconmicas por setor censitrio so obtidas facilmente, mas contagens de bitos j so de obteno mais difcil. Alm disso, quanto menor a rea, mais raros so os eventos Flutuao aleatria dos indicadores Como o prprio nome indica, significa que o indicador est variando aleatoriamente, sem qualquer padro explicvel. Ou seja: se em uma rea rural nasceram 5 crianas em um dado ano e uma faleceu no primeiro ano de vida, a mortalidade infantil seria 1/5, ou seja, 200 por 1000 nascidos vivos. Entretanto, um epidemiologista sensato, antes de divulgar nmero to grave, lembraria que entre 5 recm-natos, um bito pode ser simplesmente ocasionado por algum acaso, no sendo justo julgar as condies de sade do municpio somente por este dado. Porque populao no denominador do indicador muito pequena, o estimador fica instvel, flutua aleatoriamente. observveis, o que origina excessiva flutuao aleatria dos indicadores e todos os problemas da decorrentes. Dados de reas so os mais analisados na rea da sade, embora tenham sua importncia freqentemente subestimada por receio da denominada falcia ecolgica, que pode ser definida como uma tentativa de estimar associaes entre indivduos a partir de dados agregados. Por exemplo, ao analisar o problema dos atropelamentos, observamos que as taxas so maiores nos municpios mais ricos. Nunca poderamos concluir que os indivduos mais ricos que so atropelados, o que no seria verdade, mas sim, que nos municpios mais ricos, h mais carros, e estes atropelam os pedestres, que so em geral crianas dos estratos mais pobres da populao. Entretanto, tambm modelos em nvel individual podem ser mal especificados. Cabe ressaltar que existem dois tipos de perguntas etiolgicas. A primeira busca as causas dos casos, e a segunda as causas da incidncia, sendo rara a doena cuja taxa de incidncia no tenha variado largamente, seja ao longo do tempo ou entre populaes. As tcnicas de anlise de dados de reas sero apresentadas no Captulo 3. H uma terceira situao que so os pontos de localizao de amostras, muito utilizados na anlise Geoestatstica. Nesse caso, o dado uma medida obtida em um ponto do espao amostrado, portanto, apesar de ser atribuda

22

1.2 - Estatstica Espacial

ao ponto, a informao do dado referente rea amostrada (geralmente um espao contnuo, sem delimitao explcita). Esse ponto, alm de uma coordenada geogrfica, possui um atributo na forma de um valor medido. Por exemplo, um ponto de coleta meteorolgica onde temos uma amostra de variveis que ocorrem de uma forma contnua, amostradas num determinado ponto. Esse tipo de dado o mais freqentemente utilizado em variveis ambientais. As tcnicas mais usuais na anlise desse tipo de dados so voltadas para a predio espacial, ou seja, para estimar valores da varivel em locais onde no houve medida a partir das mensuraes feitas. Uma das tcnicas mais utilizadas para a predio denominada krigagem. Neste livro no iremos abordar esse tipo de tcnica. Para maiores detalhes ver Cmara et al., 2004.

Conceitos Estatsticos Fundamentais


Ainda que cada um desses objetivos deva ser tratado com tcnicas estatsticas especficas, alguns conceitos estatsticos fundamentais definem os problemas metodolgicos tratados pela estatstica espacial. O entendimento da noo de: (A) dependncia espacial e (B) estacionariedade, orientam a identificao de pressupostos a serem assumidos por diferentes tcnicas estatsticas.

A Dependncia espacial
O primeiro destes conceitos a noo de dependncia espacial e sua quantificao atravs de funes como a de autocorrelao espacial. A Autocorrelao espacial uma medida geral da associao espacial existente no conjunto dos dados. Seu valor varia de 1 a 1. Valores prximos de zero, indicam a inexistncia de autocorrelao espacial significativa entre os valores dos objetos e seus vizinhos. Valores positivos para o ndice, indicam autocorrelao espacial positiva, ou seja, o valor do atributo de um objeto tende a ser semelhante aos valores dos seus vizinhos. Valores negativos para o ndice, por sua vez, indicam autocorrelao negativa. Correlograma uma representao grfica da autocorrelao, em funo da distncia, ou seja, indicando em que medida cada dado em uma determinada distncia se relaciona com os demais dados. Os mtodos bsicos aqui so voltados para obter evidncias da estrutura de dependncia espacial, ou seja, autocorrelao espacial que uma medida da estrutura de Dependncia Espacial. Caso haja evidncia de estrutura espacial, o postulado de independncia das amostras, base da maior parte dos procedimentos de inferncia estatstica, invlido, sendo necessrio levar em conta, explicitamente, o espao na formulao e estimativas dos modelos estatsticos.

23

CAPTULO 1 - Conceitos e Arquitetura de Sistemas de Informaes Geogrficas

Dados espaciais no formam um conjunto de amostras independentes. Uma importante diferena em relao a dados sem essa peculiaridade que cada observao no traz uma informao independente, e o conjunto de todas as observaes utilizado integralmente para descrever o padro do fenmeno estudado. O correlograma uma representao grfica das autocorrelaes de um conjunto de dados em uma determinada distncia.

FIGURA 1.4 Autocorrelao Espacial.

Esprito Santo So Paulo Rio de Janeiro

auto-correlao

Minas Gerais

distncia

Pode-se notar na figura 1.4 que a autocorrelao nos quatro estados da regio sudeste apresentam diferentes padres. No RJ a autocorrelao decai rapidamente, na medida que a distncia aumenta, em SP a autocorrelao decai mais lentamente, no ES a autocorrelao decai voltando a subir, fato que pode ser interpretado pela existncia de cluster locais, ou ainda o pequeno nmero de municpios existente nas maiores distncias do correlograma. O estado de MG apresenta um padro de correlao prximo a zero, ou seja, aparentemente existe uma completa aleatoriedade espacial. Duas questes estatsticas devem levar em considerao a presena de dependncia espacial: a identificao de padres espaciais e a anlise do efeito de algum fator de risco sobre um desfecho controlando para a localizao geogrfica. Para a identificao de padres espaciais (Figura 1.5), precisamos estimar a presena, forma e intensidade da dependncia espacial. Diversos mtodos foram desenvolvidos para essa finalidade, entre os quais apresentaremos alguns testes para verificar afastamentos da completa aleatoriedade espacial, outros que permitem identificar fontes suspeitas de risco sade, e outros ainda que localizam as regies com concentrao de casos acima de um valor esperado.

24

1.2 - Estatstica Espacial

Espacialmente aleatria qualquer ocorrncia cuja distribuio espacial no apresente qualquer padro espacial detectvel. Observe os grficos abaixo. No primeiro, os pontos esto distribudos aleatoriamente. No segundo esto aglomerados (clusterizados), e no terceiro distribudos de forma regular, ou seja, no aleatria.
FIGURA 1.5 Padres de distribuio espacial de pontos. Aleatrio Aglomerado Regular

Para a anlise de efeito, o que se est discutindo qual seria o efeito da presena de dependncia espacial ao fazer, por exemplo, um modelo de regresso linear mltipla. Suponhamos, por exemplo, um estudo onde se deseja estimar o efeito da densidade demogrfica sobre a taxa de homicdios em cada municpio da Regio Sudeste. Um modelo simples de regresso permitiria estimar essa relao, se considerssemos que a ocorrncia da violncia em cada municpio independe dos demais. S que no . Ignorar essa dependncia levar a superestimar o efeito da varivel independente, pois cada municpio analisado contm menos informao do que em situao de independncia. Na verdade, no considerar essa questo pode afetar seriamente os resultados obtidos de qualquer modelo estatstico.

B Estacionariedade
O outro conceito fundamental denominado estacionariedade. Se a mdia do processo cuja ocorrncia espacializada estudamos no aproximadamente constante em toda a regio, dizemos que o processo no apresenta estacionariedade de primeira ordem. Esse conceito fica mais claro quando pensamos em uma srie temporal: quando a mdia aumenta (ou diminui) ao longo do tempo, dizemos que h uma tendncia a aumentar (ou diminuir). No espao a mesma idia. Apenas, em vez de termos uma linha no tempo, temos uma superfcie no espao. Observe que pode ser difcil avaliar a estacionariedade, pois a flutuao aleatria usual dificulta a visualizao (Figura 1.6). Porm identificar esta

25

CAPTULO 1 - Conceitos e Arquitetura de Sistemas de Informaes Geogrficas

questo importante, no s porque afeta os estimadores estatsticos, mas principalmente porque esta variao da mdia no espao pode ser importante para a sade pblica.
FIGURA 1.6 Exemplos de anlise da estacionariedade numa Srie Temporal.

A No estacionariedade de 1 ordem. Varincia constante. Mdia varia no processo. B No estacionariedade de 2 ordem. Varincia diferente ao longo do processo. Mdia constante. C Estacionrio. Varincia e Mdia so constantes.

Vimos a no estacionariedade de primeira ordem, ou seja, a mdia variando no espao. Porm, da mesma forma que ao longo do tempo a varincia pode ser no estacionria, ou seja, no temos estacionariedade de segunda ordem. Nesse caso, a variabilidade em determinadas regies difere. Usualmente, temos estacionariedade de primeira e segunda ordem, pois quando a mdia no varia, tambm a varincia na sub-regio se mantm.

26

1.2 - Estatstica Espacial

At agora conceituamos estacionariedade de forma muito similar s sries temporais. Porm h um aspecto que exclusivo da estatstica espacial: a isotropia (Figura 1.7). Um processo isotrpico quando seu comportamento igual em todas as direes. Ou seja, quando a dependncia espacial igual na direo Norte-Sul ou Leste-Oeste. Um exemplo de processo anisotrpico a densidade populacional do Brasil. A diminuio de densidade na direo Leste-Oeste, ou em direo ao interior do pas, mais intensa do que quando se caminha na direo do Sul ao Norte. A fora da dependncia espacial decai mais rapidamente nesse eixo do que acompanhando o litoral.
FIGURA 1.7 Isotropia e Anisotropia.

Os conceitos apresentados neste captulo descreveram um conjunto bsico de propriedades inerentes aos dados espaciais que de acordo com suas caractersticas fazem com que devam ser analisados de forma diferenciada. Nos prximos captulos sero apresentadas algumas das principais tcnicas que podem ser aplicadas na anlise de dados espaciais em sade.

27

Anlise de Dados em Forma de Pontos

Christovam Barcellos Simonne Almeida e Silva Ana Lcia S. S. de Andrade

Captulo 2: Anlise de Dados em Forma de Pontos

2.1 - Princpios de Anlise Espacial de Eventos com Representao por Pontos

pg. 31

2.2 - Anlise Espacial de Eventos


pg. 33

Visualizao de Dados Espaciais Anlise Exploratria de Dados Espaciais

pg. 33

pg. 33

Modelagem de Dados Espaciais pg. 33

2.3 - Anlise de Padres de Dados com Representao por Pontos

pg. 34

2.4 - Anlises Baseadas na Distncia entre Pontos

pg. 38 A- Distncia limiar Anlise de Aglomerados Hierrquicos pg. 39 B- Nmero mnimo de pontos C- Tamanho da elipse

2.5 - Anlise da Densidade de Pontos


pg. 44

2.6 - Avaliao de Aglomerados considerando a Distribuio da Populao

pg. 48

Deteco de Aglomerados pelaTcnica Estatstica Scan pg. 51

Estimativa Kernel considerando a Populao pg. 54

2.7 - Interpolao de Dados Pontuais


pg. 56

2.1 Princpios de Anlise Espacial de Eventos com Representao por Pontos

Uma das formas mais tradicionais de se elaborar mapas de interesse para a Sade Pblica a representao de eventos de sade em forma de pontos. O uso de pontos para localizao de eventos, no momento da construo da base de dados geogrfica e durante o procedimento de anlise, minimiza problemas associados com as barreiras impostas pela delimitao de reas administrativas artificiais. A aplicao de anlise de padro de pontos, assim como dos mtodos baseados em SIG, oferecem uma grande flexibilidade para delinear a distribuio espacial dos eventos comparado com as abordagens tradicionais da epidemiologia, que requerem delimitaes de reas usualmente arbitrrias. A localizao pontual de eventos fundamental para possibilitar a avaliao de seu padro espacial sem a necessidade de unidade de agregao de rea predeterminada. O exemplo mais tradicional desse tipo de abordagem o mapa da clera em Londres feito por John Snow. Recordando as hipteses dessa investigao, era preciso mostrar que as mortes por clera se concentravam em torno do poo de gua da Broad Street (Figura 2.1). O mapa bastante evidente e foi fcil mostrar essa associao entre gua e clera. Mas em diversos outros casos do nosso dia-a-dia de Vigilncia em Sade, o padro espacial dos pontos no to claro e precisamos usar tcnicas de anlise espacial para demonstrar e testar os padres.

Durante a epidemia de clera na Inglaterra de 1850 a 1860, John Snow produziu diversos mapas para avaliar sua hiptese sobre a t r a n s m i s s o d a c l e r a ( S n o w, 1 9 9 9 ) . U m d o s m a pa s m a i s conhecidos mostra poos de abastecimento de gua e as residncias de pessoas que morreram por clera num bairro de Londres. O mapa mostra uma concentrao de pontos que representam mortes por clera, demonstrando um padro de distribuio espacial. medida que se afasta do centro do mapa, diminui a concentrao desses pontos. No centro do mapa existe uma maior densidade de pontos que na periferia. Esse padro pode indicar a presena de uma fonte comum de exposio.

CAPTULO 2 - Anlise de Dados em Forma de Pontos FIGURA 2.1 Localizao de poos de gua e mortes por clera em Londres 1854 (Baseado em Snow, 1999).

Os eventos em sade so ocorrncias que tm um interesse especial para a Vigilncia em Sade e que, em geral, tm uma dimenso espacial, isto , podem ser representados em mapas como pontos. Os acidentes de trnsito, casos de sarampo, internaes por algum agravo que pode ser usado como evento sentinela, todos estes eventos podem ser representados nos mapas como pontos. Se esses eventos estiverem concentrados no espao bem provvel que exista uma determinao espacial deste evento e que encontrando os locais com maior concentrao, temos uma pista para identificar fatores ambientais, sociais ou ligados prpria assistncia sade que podem ser objeto de ao da Vigilncia em Sade. Devemos lembrar que esses eventos nem sempre precisam ser negativos. Poderamos dispor em um mapa os pontos que representam o endereo de crianas que foram vacinadas. Onde os pontos estiverem mais concentrados pode indicar reas onde a cobertura da vacinao est melhor. Se tivermos uma lista de endereos de Organizaes No-governamentais (ONG) que atuam na promoo de sade e colocarmos estes dados no mapa, podemos obter pontos indicando onde estas ONG desenvolvem atividades. Os locais com maior concentrao de pontos podem representar reas melhor trabalhadas.

32

2.1 - Princpios de Anlise Espacial de Eventos com Representao por Pontos

No caso do John Snow e de outros em que os pontos representam eventos, podemos utilizar tcnicas de anlise exploratria de dados espaciais (ESDA) para avaliar a distribuio dos pontos no espao. A anlise espacial de eventos deve ser realizada levando-se em conta os trs grupos de mtodos: (a) visualizao; (b) explorao; e, (c) modelagem (Bailey e Gatrell, 1995).

2.2 Anlise Espacial de Eventos

Visualizao de Dados Espaciais


O principal objetivo da visualizao de dados espaciais verificar a demonstrao grfica de dados para avaliar padres especficos de distribuio. O mapa o modo classicamente usado para visualizar esses dados. Com o advento de ferramentas de SIG, essa abordagem se transformou em algo relativamente rpido, simples e interativo. Dados pontuais, por exemplo, podem ser apresentados em mapas de pontos, da mesma forma como mapas temticos (coroplticos) podem ser utilizados para a visualizao de dados de rea. O mapa de John Snow um bom exemplo de um instrumento de visualizao de dados espaciais. Naquele caso no foi utilizada nenhuma tcnica de estatstica.

Anlise Exploratria de Dados Espaciais


Por sua vez a aplicao de mtodos exploratrios de dados espaciais implica a busca de uma descrio dos eventos apresentados, tentando gerar hipteses ou mesmo modelos apropriados. Pode-se nesse caso usar ferramentas do SIG para medir distncias e calcular densidades para permitir descrever os padres espaciais de forma mais clara. O resultado da anlise exploratria pode ser um mapa ou mesmo alguns grficos mais convencionais. Na maioria das vezes, os mtodos usados enfatizam a visualizao grfica possibilitando a identificao de padres, inter-relaes, ou mesmo observaes atpicas.

Modelagem de Dados Espaciais


A modelagem de dados espaciais, por outro lado, utiliza mtodos que especificam modelos estatsticos e tentam estimar parmetros. Preocupa-se com os fenmenos estocsticos, ou seja, aqueles que so sujeitos incerteza, ou influenciados pelas leis de probabilidade. Desse modo, so usados

33

CAPTULO 2 - Anlise de Dados em Forma de Pontos

mtodos de anlise que consideram a probabilidade de ocorrncia de um evento em relao a um conjunto de outros eventos localizados no espao, ou seja, uma nuvem de pontos. A diferenciao entre visualizar, explorar e modelar dados um ponto importante, mas suas delimitaes no esto bem definidas, uma vez que existe uma inter-relao entre estes mtodos, os quais esto ligados num processo interativo. Essa diferenciao depende basicamente do grau de manipulao dos dados que o mtodo aplicado envolve. Essas abordagens so normalmente acompanhadas de interpretao intuitiva, e tm como objetivo determinar uma impresso inicial da rea de estudo e de qualquer padro bvio presente. No entanto, como ressaltam Bailey e Gatrell (1995), deve-se estar atento para o fato de que a interpretao intuitiva, do que possa ser um padro aleatrio, pode ser ambgua. A tendncia atual mesclar mtodos de visualizao e exploratrios devido semelhana entre eles. Na prtica a mescla dos dois procedimentos tem sido muito utilizada, e a denominao visualizao-exploratria tem sido empregada. Nesse contexto, utiliza-se uma integrao dos procedimentos de visualizao, ou seja, das ferramentas usadas para mapear dados espacialmente georreferenciados com os procedimentos exploratrios, que analisam os dados na tentativa de detectar padres, identificar aglomerados, etc. Dependendo do fenmeno representado, seja ele, padro de pontos, superfcie contnua ou dados de rea, deve-se utilizar mtodos de anlise apropriados para cada situao.

2.3 Anlise de Padres de Dados com Representao por Pontos


De acordo com Bailey e Gatrell (1995), o padro de pontos considerado o modo mais simples de representar dados espaciais. definido como uma base de dados contendo uma srie de localizao de pontos, numa determinada regio de estudo, onde ocorreu o evento de interesse. Em sua apresentao mais simples, esses dados espaciais contm apenas as coordenadas dos eventos. Esse o caso dos mapas que mostram pontos como eventos de sade, como o de John Snow e de outros como a investigao de hepatite A no Municpio de Macap (AP), conforme observado na figura 2.2. Esses dados foram obtidos com base na notificao de casos, usando-se o Sistema

34

2.3 - Anlise de Padres de Dados com Representao por Pontos

Nacional de Agravos de Notificao (SINAN). A localizao de casos foi feita atravs do registro de coordenadas geogrficas no local de residncia, utilizando-se um GPS (Neri, 2004).

FIGURA 2.2 Distribuio de casos de hepatite A no Municpio de Macap, de 1999 a 2003 (Neri, 2004).

Esse mapa mostra a localizao de 933 pontos que representam o local de residncia de casos de hepatite A, em Macap, nos anos de 2000 e 2001. Assim como no caso da clera, a hepatite A de transmisso fecal-oral e as reas com maior incidncia da doena podem ter problemas com a qualidade da gua consumida pela populao ou com o destino de esgotos domsticos. Interessa para a Vigilncia em Sade, portanto, apontar locais em que existe maior intensidade de transmisso para agir sobre estas reas. No uma tarefa fcil nesse caso apontar reas de maior incidncia.

35

CAPTULO 2 - Anlise de Dados em Forma de Pontos

A pergunta que se deve responder neste caso se existe um padro espacial de distribuio de pontos. Pensando em um teste estatstico, a pergunta seria reformulada para o padro da distribuio de pontos diferente do aleatrio?. Devemos ento diferenciar os tipos de distribuio que so esperados quando se trabalha com eventos de sade: aglomerado, regular e aleatrio (Figura 2.3).

FIGURA 2.3 Tipologia de distribuio padro de pontos. A - Aglomerado B - Regular C - Aleatrio

Se os riscos esto concentrados no espao, espera-se um padro de pontos que mostre uma aglomerao (Figura 2.3 A). Esse padro tambm chamado de agrupado ou clusterizado, usando-se uma expresso do ingls. Esse padro diferente do regular (Figura 2.3 B) e do aleatrio (Figura 2.3 C). No padro regular (Figura 2.3 B) existe uma distncia mdia entre os pontos que tende a ser constante. Os pontos esto espalhados em todo o espao, mas mantendo uma regularidade entre eles. como se a distribuio de pontos tivesse sido planejada para que um ponto no estivesse muito longe do outro. Na prtica de sade pblica este padro pouco comum. Um dos casos em que esse padro pode ocorrer a localizao de unidades bsicas de sade dentro de uma cidade. Se um dos critrios para a localizao desses servios for, por exemplo, que os usurios devem encontrar uma unidade bsica a menos de 1 km de sua casa, h uma tendncia de se espalhar homogeneamente essas unidades no espao. O mesmo pode acontecer com amostras ambientais ou armadilhas para o monitoramento de infestao por mosquitos (ovitrampas), que so distribudas propositalmente no espao de forma regular. J o padro aleatrio (Figura 2.3 C) no tem nenhum modelo de distribuio. Ele ocorre por um completo acaso. Nessa ltima situao, existe uma mescla de distribuio aglomerada e uniforme (Ward e Carpenter, 2000).

36

2.3 - Anlise de Padres de Dados com Representao por Pontos

Imagine uma doena que no fortemente determinada por nenhum fator social ou ambiental, como a diabetes. Como os fatores de risco da doena (por exemplo, a predisposio gentica e hbitos alimentares) esto em geral espalhados no espao, a distribuio espacial dos casos da doena vai tender a um padro aleatrio. Mesmo nesses casos, como a diabetes, uma tarefa da Vigilncia em Sade procurar associaes e padres que possam servir para identificar populaes mais vulnerveis. Se existe uma fonte comum de exposio a riscos, o padro de distribuio de pontos tender a ser aglomerado. As tcnicas de anlise espacial permitem identificar reas com concentrao aparentemente alta de eventos e possibilitam avaliar se o aparente aglomerado de casos ocorreu ou no ao acaso. De acordo com Besag e Newell (1991) e Lawson e Kulldorf (1999), os testes estatsticos utilizados em anlise espacial podem ser agrupados em duas grandes categorias: a) testes globais e b) testes focais. Os testes globais compreendem a maioria dos testes para identificao de aglomerados espaciais de doenas, em que todos os casos so processados. Esses procedimentos testam a presena de aglomerados sem ter a habilidade de identificar a localizao dos mesmos (trabalham com o conjunto total dos pontos mapeados). Dessa forma, testam a hiptese de que no existe aglomerado na regio contra a hiptese alternativa de que existe conglomerado sem especificar sua localizao. Os testes focais, ou locais, para a identificao de aglomerados so usados quando se tem uma fonte primria pr-definida, ou seja, verificam a existncia de aglomerados em regies definidas a priori, antes da observao do evento. Testam a presena de aglomerados em reas especficas, como por exemplo, em torno de um foco suspeito de risco aumentado para uma doena. So especialmente teis quando existe forte suspeita de um agente etiolgico. Os testes de deteco de aglomerados podem ser considerados uma terceira categoria na qual possvel identificar o local da ocorrncia do aglomerado e, alm disso, testar sua significncia estatstica. Testes globais e testes de deteco de aglomerados complementam-se e tm uma boa aplicao no estudo espacial de aglomerados em diversos cenrios epidemiolgicos. Existem diversas tcnicas disponveis de anlise exploratria espacial para detectar e mapear reas quentes ou aglomerados. Dentre elas, destacam-se a tcnica de Kernel e a estatstica espacial scan, que constituem ferramentas amplamente utilizadas em anos recentes, na rea de sade e ambiente.

37

CAPTULO 2 - Anlise de Dados em Forma de Pontos

2.4 Anlises Baseadas na Distncia entre Pontos

Uma maneira de avaliar os padres espaciais de pontos e detectar a existncia de aglomerados medir a mdia da distncia entre os pontos. No padro aglomerado a distncia mdia entre pontos pequena, j nos padres aleatrio e regular a distncia entre pontos grande. As distncias entre pontos so medidas facilmente em um SIG, j que o sistema guarda as coordenadas de cada ponto. A chamada distncia euclidiana calculada pela equao: d = { ( x 1 x 2 )2 + ( y 1 y 2 ) 2 } Onde o ponto 1 tem coordenadas x1 e y1, e o ponto 2 tem coordenadas x2 e y2.

A tabela abaixo mostra a estatstica de distncia entre pontos dos casos da figura 2.3. DISTNCIA MDIA (em metros)
Aglomerado Regular Aleatrio 358 1094 890

DESVIO PADRO DA DISTNCIA (em metros)


688 321 643

Pode-se observar que o padro aglomerado tem a menor distncia mdia entre pontos, o que indica uma concentrao de pontos no espao estudado, mas um grande desvio padro. O padro regular, como o prprio nome indica, tem uma grande distncia mdia entre os pontos, mas um pequeno desvio, indicando a homogeneidade da distribuio. J o padro aleatrio tem uma grande distncia mdia entre pontos e grande desvio padro.

38

2.4 - Anlises Baseadas na Distncia entre Pontos

Essas estatsticas de distncia entre pontos podem servir para uma srie de tcnicas usadas para a deteco de aglomerados de pontos. A anlise de aglomerados (cluster) um termo genrico usado em um grande nmero de tcnicas que tentam determinar se uma base de dados composta por grupos distintos (Everitt, 1974). De modo geral a anlise de aglomerados um mtodo de classificao que utiliza a caracterstica de certos objetos com o intuito de agrup-los.

Anlise de Aglomerados Hierrquicos


Nas tcnicas de aglomerados hierrquicos, por exemplo, a deteco iniciase com os eventos separados e procede-se a unio das observaes mais semelhantes em grupos, com base em critrios pr-definidos. No aglomerado hierrquico (hierarchical cluster), a distncia entre vizinhos mais prximos freqentemente usada como medida de dissimilaridade. Existem diversos tipos de medidas de distncias mtricas disponveis, mas a distncia euclidiana a mais comumente usada por ser bastante fcil e intuitiva. Na anlise hierrquica de aglomerados, a menor distncia entre dois objetos primeiramente identificada e estes objetos so agrupados em um novo aglomerado. As distncias entre esses aglomerados so calculadas, e estes por sua vez, podem ser agrupados num prximo nvel. Segundo Bailey e Gatrell (1995), a anlise de hierarquia de aglomerados um mtodo exploratrio de estatstica multivariada usado para identificar agrupamento de objetos que pode identificar a localizao espacial destes eventos. Dentre os mtodos hierrquicos mais utilizados est o de vizinhos mais prximos. A rotina de aglomerados hierrquicos de vizinhos mais prximos (Nearest Neighbor Hierarchical Clustering NNHC), implementada pelo programa Crimestat 2.0 (Levine, 2002), uma rotina de agrupamento de distncia que une pontos com base em sua proximidade espacial. Ou seja, agrupa casos incidentes que esto espacialmente prximos. De forma geral, a rotina identifica aglomerados vizinhos de primeira ordem os quais representam os pontos que esto mais prximos do que a distncia limiar proposta, e que tenham pelo menos o nmero mnimo de pontos determinados. Na seqncia da anlise, os aglomerados de primeira ordem so tratados como pontos individuais que podem ser agrupados em aglomerados de segunda ordem e assim sucessivamente at que se atinja um nico aglomerado ou que as condies estabelecidas no sejam mais atendidas. Esses aglomerados so identificados por meio de elipses que delimitam um grupo de pontos contidos nos aglomerados. O processo de unificao dos aglomerados identificados pela tcnica de aglomerados hierrquicos de vizinhos mais prximos pode ser graficamente representado, de forma espacial, atravs de mapas, ou ainda de forma no espacial por

39

CAPTULO 2 - Anlise de Dados em Forma de Pontos

meio de rvore hierrquica, tambm chamada de dendograma, como na figura a seguir.


FIGURA 2.4 Dendograma de representao grfica dos vrios passos do processo hierrquico de aglomerado. A utilizao dessa forma de apresentao evidencia a ligao entre os eventos e os aglomerados identificados em seus diversos nveis.

Aglomerado de 3 ordem

Aglomerado de 2 ordem Aglomerado de 1 ordem

Eventos individuais

Com base no grau de similaridade destes eventos ou nas suas caractersticas compartilhadas eles vo sendo agrupados, inicialmente em um primeiro aglomerado, identificado como de primeira ordem. A partir desse ponto cada aglomerado passa a ser identificado como se fosse um evento isolado, e de acordo com as premissas preestabelecidas vo sendo agrupados at alcanar o ltimo aglomerado possvel ou at que as condies estabelecidas no sejam mais atendidas. Ao se conduzir uma anlise hierrquica de vizinhos prximos devem ser definidos os seguintes parmetros: a) a distncia limiar, que a probabilidade de selecionar um par ao acaso; b) o nmero mnimo de pontos necessrios para constituir um aglomerado e c) o tamanho da elipse que vai ser utilizada para identificar o local de ocorrncia desses aglomerados.

A Distncia limiar
Se apenas pares de eventos estivessem sendo agrupados, ento a distncia limiar seria o parmetro de maior importncia a ser considerado. Utilizando-se o valor padro definido pelo programa (p < 0,5), aproximadamente metade dos pares seria selecionada ao acaso se os dados obedecessem a uma distribuio randmica. Contudo, uma vez que, alm da distncia limiar, utiliza-se o nmero mnimo de eventos na construo da rotina de anlise, a chance de encontrar aglomerados com este nmero mnimo de pontos menor. A escolha dos valores dessa distncia limiar vai depender do objetivo do estudo. Para intervenes centradas numa localizao particular, o uso de uma distncia limiar pequena pode ser apropriado; por outro lado, a identificao de reas mais amplas, em algumas situaes, pode ser melhor que a seleo de microambientes.

40

2.4 - Anlises Baseadas na Distncia entre Pontos

B Nmero mnimo de pontos


O nmero de eventos mnimos para definir um aglomerado de suma importncia na identificao dos grupos, uma vez que o programa desconsidera a localizao do ponto inicial se o aglomerado no congrega este nmero mnimo de pontos. Em geral o critrio do nmero mnimo de pontos mais crtico do que a distncia limiar, embora a ltima tambm possa influenciar os resultados. Levine (2002) sugere que a investigao pode ser realizada com diferentes critrios at que se encontre o critrio que melhor se adapte situao estudada.

C Tamanho da elipse
Por sua vez, a definio do tamanho da elipse a ser utilizada na visualizao dos aglomerados identificados tambm influenciada pelo objetivo do estudo. A rotina presente no aplicativo disponibiliza a escolha de valores que vo de um a dois desvios padres. A utilizao de elipses construdas com base em um desvio padro pode no ser o mais adequado para a visualizao do evento em escala regional. Mais uma vez, o investigador deve balancear a necessidade de identificar, de forma acurada, a localizao do aglomerado versus a necessidade de facilitar a adequada visualizao da rea estudada. O aglomerado hierrquico de vizinhos mais prximos, alm de ser um mtodo exploratrio de anlise espacial, pode ser combinado com uma simulao de Monte Carlo. Esse mtodo simula uma srie de dados de acordo com um modelo prvio de modo a testar a existncia de aglomerados que sejam estatisticamente significativos. Nessa situao, pode ser ento classificado como um mtodo de modelagem de padro espacial de pontos, uma vez que utiliza tcnicas para testar hipteses comparando a distribuio observada a um modelo particular, o de aleatoriedade espacial completa (AEC). O modelo padro para a AEC de que os eventos seguem um processo homogneo de Poisson na rea estudada, ou seja, os eventos so independentes e uniformemente distribudos na regio. Isso significa dizer que: (a) qualquer evento tem a mesma probabilidade de ocorrer em qualquer posio da regio sob estudo, e (b) a posio de qualquer evento independente da posio de outro evento, ou seja, os eventos no interagem uns com os outros. A AEC o primeiro passo na testagem da hiptese de que as observaes se distribuem de forma regular, aglomerada ou aleatria. De forma conceitual, a distncia limiar define a probabilidade de dois pontos serem agrupados ao acaso. O teste de significncia estatstica avalia o intervalo de confiana em torno da distncia dos vizinhos de primeira ordem. Se a probabilidade 5%, ento aproximadamente 5% de todos os pares de casos seriam identificados numa distribuio aleatria.

41

CAPTULO 2 - Anlise de Dados em Forma de Pontos

No entanto, a rotina hierrquica de vizinhos prximos leva em conta outros parmetros, e a probabilidade de distribuio levando em conta estes parmetros no conhecida. Nesse sentido, necessria uma simulao de Monte Carlo considerando apenas os aglomerados hierrquicos de primeira ordem. Vantagens e desvantagens da tcnica de aglomerados hierrquicos de vizinhos mais prximos A tcnica de aglomerados hierrquicos de vizinhos mais prximos determina se existem aglomerados (ex: reas quentes) na distribuio dos eventos utilizando-se um critrio quantitativo. A identificao de aglomerados feita pelo desenho de elipses que marcam locais com maior concentrao de pontos que o esperado segundo um modelo de aleatoriedade. Dentre as vantagens da tcnica ressalta-se: a) habilidade para identificar reas onde exista concentrao de eventos; b) pode ser aplicada para qualquer base de dados, independente da sua abrangncia (ex: municpio ou distrito urbano); e c) a ligao entre os diversos aglomerados encontrados pode ser visualizada por meio de grupos segundo nveis de hierrquicos, ou seja, considerando diferentes escalas de aglomerados de eventos que podem ser identificadas por esta tcnica. A principal desvantagem que essa tcnica usa dados absolutos e pode produzir uma falsa impresso da existncia de grupamentos, uma vez que no considera dados populacionais. Esses aglomerados podem ser conseqncias da prpria tendncia de concentrao de populao em determinados locais com mais recursos. Alm disso, o tamanho da rea estudada dependente do tamanho da amostra, uma vez que o intervalo de confiana em torno da distncia mdia aleatria utilizado como um dos critrios. Uma outra desvantagem a existncia de um certo grau de arbitrariedade, uma vez que o nmero mnimo de eventos a compor um aglomerado definido pelo investigador, da mesma forma como a definio da probabilidade a ser empregada. Nas pesquisas e prticas de Vigilncia em Sade a utilizao dessa tcnica tem sido usada crescentemente. A maioria dos exemplos disponveis de sua aplicao encontra-se na identificao de reas de maior ocorrncia de crimes (Levine, 2002). O Crimestat um aplicativo gratuito desenvolvido pelo professor Ned Levine para o Instituto de Justia dos Estados Unidos, para avaliar a incidncia de crimes em reas urbanas daquele pas. Esse programa pode tambm ser usado para identificar padres de distribuio de eventos de sade. O programa possui diversas rotinas de anlise espacial de pontos como a funo K, estimadores kernel, anlise espao-temporal por teste de Knox, e outros. Como entrada de dados, o programa aceita arquivos em dbf que tenham as coordenadas (em qualquer sistema de projeo) e exporta os resultados como um texto ou como objetos cartogrficos em formato shp. Por exemplo, as elipses que marcam os aglomerados identificados pelo aplicativo so criadas em formato shp e facilmente importadas para um programa de SIG. Como esses formatos so os mesmos empregados pelo Terraview, o Crimestat pode ser usado como aplicativo auxiliar para anlise e teste de hipteses que no podem se feitas em outros programas.

Fonte: http://www.icpsr.umich.edu/CRIMESTAT/

42

2.4 - Anlises Baseadas na Distncia entre Pontos

Retomando-se o exemplo da distribuio de casos de hepatite A em Macap, temos a identificao de alguns aglomerados de casos: um grande aglomerado de segunda ordem na rea sul da cidade e dez aglomerados de primeira ordem espalhados pela cidade, principalmente nos bairros do sul (Figura 2.5). Esses aglomerados so marcados por uma elipse que produzida pelo prprio aplicativo Crimestat em formato shp (shape). Este formato pode ser facilmente importado pelo programa Terraview.
FIGURA 2.5 Casos de hepatite A e aglomerados de primeira ordem (em forma de pequenas elipses vermelhas) e de segunda ordem (em forma de uma grande elipse laranja).

43

CAPTULO 2 - Anlise de Dados em Forma de Pontos

2.5 Anlise da Densidade de Pontos

Dentre os procedimentos para estimar densidade de eventos, a estimativa Kernel a mais conhecida e a mais utilizada, desempenhando um papel importante no contexto epidemiolgico (Gatrell et al., 1996) para identificar a concentrao de casos. A estimativa Kernel uma tcnica de interpolao exploratria que gera uma superfcie de densidade para a identificao visual de reas quentes. Entendese a ocorrncia de uma rea quente como uma concentrao de eventos que indica de alguma forma a aglomerao em uma distribuio espacial. uma tcnica estatstica, de interpolao, no paramtrica, em que uma distribuio de pontos ou eventos transformada numa superfcie contnua de risco para a sua ocorrncia. Esse procedimento permite filtrar a variabilidade de um conjunto de dados, sem, no entanto, alterar de forma essencial as suas caractersticas locais (Bailey e Gatrell, 1995). O estimador Kernel no um mtodo de deteco de aglomerados por si, mas, um mtodo para explorar e mostrar o padro de pontos de dados em sade, e til a partir do momento em que gera uma superfcie contnua a partir de dados pontuais (Cromley e McLafferty, 2002). O estimador Kernel produz uma superfcie contnua, com densidades calculadas em todas as localizaes, desta forma, o investigador no precisa definir de forma arbitrria onde cortar a rea quente, isto , uma densidade a partir da qual se considera que os pontos formam um aglomerado (Levine, 2002). Contudo, importante ressaltar que a interpretao dos resultados obtidos mediante a anlise Kernel subjetiva e depende do conhecimento prvio da rea de estudo. A tcnica apresenta, como uma das maiores vantagens, a rpida visualizao de reas que merecem ateno, alm de no ser afetada por divises poltico-administrativas. Portanto o estimador de intensidade uma boa alternativa para se avaliar o comportamento dos padres de pontos em uma determinada rea de estudo, sendo considerado muito til para fornecer uma viso geral da distribuio de primeira ordem dos eventos (Carvalho e Cmara, 2002). Originalmente a estimativa Kernel foi desenvolvida para se obter uma estimativa suavizada de uma probabilidade univariada ou multivariada com base na amostra de uma observao, ou seja, um histograma suavizado. A estimativa de intensidade de uma distribuio de pontos muito semelhante estimativa de probabilidade de densidade bivariada (bivariate probability density).

44

2.5 - Anlise da Densidade de Pontos

Para a aplicao da estimativa Kernel, necessria a definio de dois parmetros bsicos, que podem ser visualizados na figura 2.6: a) raio de influncia ( ) que define a vizinhana do ponto a ser interpolado e controla o alisamento da superfcie gerada. o raio de um disco, centrado em s, que uma localizao na regio R, no qual pontos si vo contribuir para a estimativa da funo de intensidade; b) uma funo de estimao k (Kernel) com propriedades de suavizao do fenmeno. Os Kernel normal ou qurtico so os mais comumente utilizados. Se s representa uma localizao em R e s1 ,.... sn so as localizaes das n observaes, ento a intensidade
n

(s), em s estimada por:

(s) =
i=1

(s si )

Onde k uma funo de densidade bivariada escolhida, ou seja, a funo de estimao ou de alisamento, conhecida como Kernel. O parmetro

conhecido como raio de influncia ou largura da banda e determina o grau de suavizao da superfcie de sada. A funo bidimensional ajustada sobre os eventos considerados compondo uma superfcie cujo valor ser proporcional intensidade dos eventos por unidade de rea.
FIGURA 2.6 Passos para o clculo de densidade de pontos segundo a tcnica de Kernel (Cmara et al., 2002).

Camada de pontos

Grade de Intensidade

Superfcie de Sada

Ponto a ser estimado (s)

Raio de Influncia (

A escolha da funo Kernel (se quadrtica, normal, triangular ou uniforme) a ser utilizada no um ponto crtico, contudo, a escolha do raio de influncia crucial, produzindo significantes alteraes da estimativa final. Essa funo (Figura 2.6) realiza a contagem dos eventos dentro de uma regio de influncia, ponderando-os pela distncia, de cada um, a uma localizao de interesse (Cmara et al., 2002). Do ponto de vista visual, quando se aplica o estimador de intensidade sobre uma grade de localizaes na rea R, pode-se pensar numa funo tridimensional que visita cada ponto s

45

CAPTULO 2 - Anlise de Dados em Forma de Pontos

na grade. A distncia para cada evento observado si , que cai na rea de influncia, medida e contribui para a estimativa de intensidade em s de acordo com sua distncia de s. O resultado da estimativa Kernel para o caso da hepatite A em Macap mostrado na figura 2.7, a seguir.
FIGURA 2.7 Casos de hepatite A e superfcie de densidade, segundo a tcnica de Kernel em Macap (Dados de Neri, 2004).

Pode-se observar que existem casos distribudos em toda a cidade, mas estes casos esto mais concentrados na rea central-sul (bairros de Buritizal e Congos) e na central-norte (Perptuo Socorro). Essa j uma indicao de riscos que pode ser usada para se atuar sobre determinantes da hepatite A. Como estamos trabalhando em um ambiente de Sistema de Informaes Geogrficas (SIG), que tem diversas funcionalidades, podemos usar este sistema para identificar o nome dos bairros com maior intensidade de transmisso e as caractersticas sociais e demogrficas destes bairros.

46

2.5 - Anlise da Densidade de Pontos

Grade regular de representao do Kernel O arquivo gerado pela tcnica de kernel uma grade com n colunas por m linhas, criando n x m clulas. Quanto maior o nmero de clulas, maior a resoluo da figura gerada. A definio desse parmetro afeta a quantidade de memria que vai ser usada para armazenar os resultados. O uso de uma grande quantidade de colunas pode gerar uma sobrecarga de processamento no programa e computador. Essa grade uma maneira de representar a superfcie contnua com as estimativas de densidade de pontos. Cada uma destas clulas tem como atributo o valor estimado da densidade de pontos. Observe que o mapa temtico gerado tem uma legenda que mostra variaes a partir de um nmero muito pequeno. Os valores representam a quantidade de pontos encontrados em uma unidade de rea. No caso do mapa de Macap, onde se trabalhou com o sistema de coordenadas UTM em unidades de metros, os valores esto em eventos por metro quadrado.

Na figura 2.8 simularam-se dois padres de suavizao variando os valores do raio de influncia. Raio de influncia mais amplo, como o utilizado na figura 2.8 B, gera uma suavizao maior, com superfcie mais homognea, enquanto a suavizao produzida por valores pequenos da largura da banda gera um nmero maior de reas quentes na regio de estudo (Figura 2.8 A).
FIGURA 2.8 Simulao de resultados de Kernel: A- alisamento produzido por valor pequeno de raio de influncia ( = 200 m);

B- alisamento produzido pelo emprego de valor maior do raio de influncia ( = 1000 m).

A escolha do padro de suavizao de importncia fundamental na estimativa da densidade dos eventos e depende do objetivo do estudo e do tipo de evento estudado. Para identificar reas especficas e de menor abrangncia para atuao, valores menores de raio de influncia podem ser mais indicados (ex: doenas transmitidas por insetos), contudo esta abordagem pode gerar reas mltiplas e pulverizadas de atuao. Se o objetivo identificar reas mais abrangentes para otimizar intervenes, a largura da banda mais

47

CAPTULO 2 - Anlise de Dados em Forma de Pontos

ampla torna-se a melhor opo. Se o objetivo do estudo explorar os dados para a formulao de hipteses, diferentes raios de influncia devem ser empregados (Silverman, 1986). Na prtica, para o clculo do estimador Kernel, o investigador pode experimentar diferentes valores de

gerando assim

variaes de intensidade at encontrar o padro que melhor se adapte regio estudada refletindo a densidade local dos eventos (Bailey e Gatrell, 1995; Cromely e McLafferty, 2002).

2.6 Avaliao de Aglomerados considerando a Distribuio da Populao

Os mtodos descritos anteriormente, baseados na distncia entre pontos e na densidade de pontos no espao, podem ser utilizados para avaliar uma aglomerao destes pontos, indicando reas onde estes pontos se concentram. Nesses casos, o que se busca responder pergunta: os pontos tm uma distribuio espacialmente condicionada? Ou, a distribuio dos pontos diferente do que se esperaria de um padro aleatrio? O grande problema das tcnicas de deteco de aglomerados que os pontos de eventos de sade tendem a ter uma distribuio espacial semelhante distribuio da populao. Todos os eventos de sade o nascimento, a infeco, a vacinao, o adoecimento, a internao, a morte se manifestam em pessoas. Essas pessoas no esto distribudas aleatoriamente no espao. Essa distribuio determinada por fatores histricos e socioeconmicos. Por isso, ao se trabalhar com registros de sade para avaliar riscos, deve-se estimar a probabilidade de um evento ocorrer, ponderada pela distribuio da populao.

A pergunta nesse caso passa a ser: a distribuio espacial dos pontos diferente da distribuio da populao? E a melhor forma de responder pergunta construir taxas, onde o numerador o nmero de eventos de sade e o denominador a populao de referncia. A forma mais usual de se considerar a distribuio da populao na avaliao de riscos a agregao de dados demogrficos e de sade em unidades espaciais discretas, isto , em reas pr-concebidas, para posteriormente calcular indicadores epidemiolgicos. Essa estratgia apresenta srias limitaes, como a desconsiderao das interaes entre as unidades espaciais e a instabilidade dos indicadores criados em pequenas reas (King, 1979).

48

2.6 - Avaliao de Aglomerados considerando a Distribuio da Populao

Se dispusermos de dados em forma de pontos, podemos construir diversas totalizaes de conjuntos de eventos dentro de vrios tipos de reas, a partir da agregao destes dados. A figura 2.9 mostra um conjunto de dados originais que podem ser usados para avaliar uma situao em que se quer identificar aglomerados de pontos com taxas de incidncia altas. Os eventos de sade so representados por pontos e os dados de populao so atributos dos setores censitrios, que so pequenos polgonos.
FIGURA 2.9 Eventos de sade (pontos) e setores censitrios (polgonos) usados para o clculo de taxas por meio de tcnicas de anlise espacial.

O caso mais simples de construo de taxas a partir de pontos quando se tem uma fonte suspeita de riscos. Essa era exatamente a situao do estudo de John Snow que tentava mostrar que existia um risco maior de morrer por clera nos moradores em torno do poo de gua da Broad Street. Tambm a situao de muitas investigaes que vm sendo feitas em vigilncia ambiental em sade, em que existe uma suspeita de aumento de casos de doenas, leucemia, por exemplo, em torno de usinas nucleares, depsitos de lixo txico ou incineradores. Uma soluo analtica para esse problema apontar a fonte suspeita no mapa, criar uma rea de influncia (buffer) em torno desta fonte suspeita, calcular a taxa de incidncia do agravo sade dentro da rea de influncia e fora dela. A maneira que se faz isso dentro de um ambiente SIG bastante

49

CAPTULO 2 - Anlise de Dados em Forma de Pontos

simples. Uma vez delimitada a rea de influncia, contamos quantos eventos existem dentro da rea (pontos dentro do polgono) e qual a populao total dentro da rea (soma das populaes de polgonos pequenos dentro de polgonos maiores). rea de influncia (buffer) Existem vrias formas de se construir reas de influncia. A mais simples um crculo em torno de um ponto. Mas poderamos tambm criar vrios crculos concntricos em torno desse ponto, com raios de 500, 1.000, 2.000 e 5.000 metros, por exemplo (Figura 2.10). As reas de influncia podem ser tambm criadas em torno de linhas e de polgonos.
FIGURA 2.10 reas de influncia em torno de uma fonte suspeita de risco.

Ao construir taxas de incidncia dentro de cada uma dessas reas de influncia, podemos avaliar se os riscos decaem com o aumento da distncia da fonte suspeita. Nem sempre a fonte suspeita um ponto no mapa. Em algumas situaes muito comuns, essa fonte pode ser uma linha. Uma estrada pode ser uma fonte de riscos de contaminao do ar para a populao em torno. Tambm pode representar um risco maior de morte por acidentes de trnsito para as pessoas que moram perto.

No segundo livro desta srie mostrou-se como construir reas de influncia usando o Terraview. Dentro dessa rea de influncia podem-se calcular taxas contando-se o nmero de eventos e a populao total.

50

2.6 - Avaliao de Aglomerados considerando a Distribuio da Populao

Existem tcnicas estatsticas que permitem avaliar se as taxas de incidncia dentro e fora da rea de influncia so significativamente diferentes, como se ver a seguir. Mas em diversos outros casos, do cotidiano de Vigilncia em Sade, no existe uma fonte suspeita. Quando se avalia a dengue, por exemplo, no se sabe a priori onde esto essas fontes de risco, que podem ser focos do vetor. Esse tambm o caso da distribuio da hepatite A. Gostaramos que as tcnicas de anlise espacial apontassem onde esto essas fontes de risco, que ainda no conhecemos. Existe uma tcnica, recentemente desenvolvida, que avalia as taxas de incidncia por meio de um crculo que caminha no espao, mudando o raio e a posio do seu centro. Essa tcnica faz uma varredura (scan em ingls) do espao estudado, procurando localizar um crculo no local onde haja uma taxa de incidncia muito grande, dentro, e muito baixa, fora deste crculo. A maioria dos mtodos estatsticos, para anlise de aglomerados de dados pontuais, descritiva: conseguem detectar a localizao do aglomerado sem fazer inferncias estatsticas, ou por outro lado, conseguem fazer inferncias sem ter a habilidade de detectar a localizao do aglomerado. Essa uma diferena bsica da estatstica espacial scan a qual possui a habilidade de realizar ambos os procedimentos, de tal forma que, uma vez que a hiptese nula rejeitada consegue-se localizar a rea especfica do mapa que causou a rejeio (Kulldorff, 1997).

Deteco de Aglomerados pela Tcnica Estatstica Scan


O mtodo leva em conta a distribuio populacional irregular que influencia a distribuio destes pontos sob a hiptese nula. A estatstica espacial scan definida por uma janela geogrfica circular que se move atravs da rea de interesse, ou seja, uma estatstica de varredura onde, o crculo capaz de incluir diferentes conjuntos de reas vizinhas. Considera-se uma rea como includa no crculo se o seu centride est contido na janela. O raio de cobertura da janela pode variar de zero a um valor mximo, de forma que a janela nunca inclua mais que 50% da populao total. Com isso, a janela flexvel em tamanho e localizao. Para cada localizao e tamanho da janela de varredura verificado se existe uma taxa elevada dentro do crculo quando comparada com a regio externa a este crculo. A tcnica cria um conjunto com infinito nmero de crculos distintos. Cada um deles podendo conter uma srie diferente de regies vizinhas com a possibilidade de conter um aglomerado de eventos. Cada crculo geogrfico criado inclui um conjunto de localizaes ou reas administrativas, e tratado como um aglomerado em potencial. Para cada janela, o mtodo testa a hiptese nula frente hiptese alternativa que existe um risco elevado de ocorrncia de eventos dentro desta janela em

51

CAPTULO 2 - Anlise de Dados em Forma de Pontos

comparao com o exterior. comparado o nmero de casos dentro da janela com o nmero de casos esperados se os casos estivessem aleatoriamente distribudos no espao. A funo de verossimilhana maximizada para todas as janelas e, aquela com a mxima verossimilhana, considerada como o aglomerado mais provvel. Ou seja, o aglomerado que tem a menor probabilidade de ter ocorrido ao acaso. A razo de verossimilhana para essa janela constitui a estatstica mxima da razo de verossimilhana. A sua distribuio sob a hiptese nula obtida por meio da repetio desta anlise num grande nmero aleatrio de replicaes do teste geradas sob a hiptese nula. Alm do aglomerado mais verossmil, o mtodo tambm identifica aglomerados secundrios com altos valores de verossimilhana. Alguns desses aglomerados podem estar relacionados ao aglomerado mais verossmil tendo reas de sobreposio. Aglomerados secundrios que esto localizados em outras regies da rea de estudo so de interesse especial e so definidos como aglomerados que no se sobrepem ao aglomerado de maior verossimilhana. Dois tipos diferentes de modelos probabilsticos podem ser considerados quando se aplica a estatstica espacial scan: (A) Bernoulli, e (B) Poisson. A No modelo Bernoulli, cada unidade de medida corresponde a uma entidade ou indivduo que pode ter qualquer um dos dois status: casos ou no casos. Isso pode representar pessoas com ou sem a doena, ou ainda, pessoas com diferentes estgios de doenas, podendo significar casos e controles de uma populao em geral. Os indivduos em quaisquer dessas situaes so identificados como pontos e sua localizao constitui o processo pontual, ou ainda, os eventos podem ser agregados para reas prdeterminadas (bairros, municpios, distritos, etc.). B No modelo Poisson, o nmero de eventos em cada rea considerado como distribudo de acordo com a populao sob risco conhecida. Sob a hiptese nula o nmero esperado de casos em cada rea proporcional ao tamanho de sua populao. O modelo Poisson requer a contagem de casos e populao para cada regio de localizao dos eventos (ex: bairros, municpios, distritos, etc.), assim como o conhecimento das coordenadas geogrficas para cada uma destas localizaes. Para qualquer um dos modelos descritos, Bernoulli ou Poisson, a estatstica scan ajusta para a densidade populacional irregular presente em praticamente todas as populaes, e a anlise condicionada ao nmero total de casos observados. A escolha de qual dos modelos deve ser utilizado, Bernoulli ou Poisson, depende do tipo de dado disponvel. Para dados binrios, o modelo Bernoulli o indicado, por outro lado, para dados em forma de contagens de eventos o modelo Poisson o indicado (Kulldorff, 2003).

52

2.6 - Avaliao de Aglomerados considerando a Distribuio da Populao

Vantagens e desvantagens da estatstica Scan Comparada com outros mtodos estatsticos espaciais, a estatstica scan apresenta vantagens que a torna indicada na localizao de aglomerados: (a) pode ser ajustada para a densidade populacional; (b) pode ser ajustada por variveis de confuso; (c) sua aplicao minimiza vis de pr-seleo, uma vez que procura por aglomerados sem especificar seu tamanho e localizao; (d) o teste estatstico de razo de verossimilhana leva em conta testagens mltiplas informando um nico valor de p ao testar a hiptese nula (Kuldorff et al., 1997). Por outro lado, uma das principais desvantagens do mtodo consiste no fato de que os aglomerados so sempre definidos como crculos. Nessa situao, se uma rea de baixa ocorrncia de casos est rodeada por reas com maior nmero de casos, ela ser sempre includa no aglomerado, apesar de poder apresentar caractersticas diferentes (Sankoh et al., 2001). Ou seja, existe a tendncia de identificar um aglomerado maior do que ele , uma vez que regies onde nenhum caso foi registrado podem ser incorporadas na identificao do aglomerado. O resultado da tcnica de varredura scan para o caso da hepatite A em Macap mostrado na figura 2.11. Para proceder a anlise com a tcnica estatstica scan, utiliza-se o aplicativo SatScan. Adicionalmente, o aplicativo permite a padronizao de taxas por meio do ajuste pela estrutura etria da populao. Alm disso, a estatstica scan incorpora a possibilidade de aplicao de mtodos multivariados de anlise que levam em conta a convergncia de variveis potencialmente de confuso. O Satscan, um aplicativo gratuito desenvolvido pelos professores Martin Kulldorff, do Instituto de Cncer dos Estados Unidos e Dr. Farzad Mostashari, do Department of Health and Mental Hygiene da Cidade de Nova Iorque. A entrada de dados no programa feita com arquivos em dbf, csv ou txt, que tenham as coordenadas (em qualquer sistema de projeo) e exporta os resultados como um arquivo de texto (txt) que Fonte: http://www.satscan.org/ contm as coordenadas do centro do aglomerado e seu raio nas mesmas unidades em que foram entrados os dados (metros, quilmetros ou graus). Esses dados podem ser convertidos em um objeto cartogrfico que pode ser disposto no Terraview. Desse modo, o Satscan pode ser usado como aplicativo auxiliar para anlise e teste de hipteses que no podem se feitas em outros programas.
FIGURA 2.11 Resultado do teste Scan dos casos de hepatite A de Macap. Eventos de sade (pontos), bairros (polgonos) e crculos mostrando reas com maior incidncia de hepatite A.

53

CAPTULO 2 - Anlise de Dados em Forma de Pontos

Estimativa Kernel considerando a Populao


Podemos usar a tcnica de Kernel para avaliar a distribuio espacial dos eventos, considerando tambm a distribuio da populao. uma maneira grfica de se obter uma estimativa de taxa de incidncia. A anlise mais simplificada consiste na comparao visual de mapas suavizados para cada um dos processos (Santos et al., 2001). Contudo, outras abordagens devem ser consideradas. O estimador Kernel nico apresenta como desvantagem o fato de no levar em conta a distribuio populacional onde os eventos esto inseridos. Se a populao se distribusse uniformemente na regio, ento um Kernel nico de eventos seria suficiente. Contudo, uma vez que isso raramente ocorre, mtodos que levem em conta essa populao devem, tambm, ser considerados. Nesse cenrio epidemiolgico assume-se que a intensidade de eventos vai variar com a densidade populacional (Bailey e Gatrell, 1995). Para se construir um mapa de densidade demogrfica num SIG como o Terraview, deve-se dispor de um conjunto de dados de populao como atributos de uma unidade espacial. Os municpios do Brasil so unidades espaciais que possuem dados de populao, no s o total, mas tambm fracionada por faixa etria, sexo, renda e nvel de instruo. Dentro de reas urbanas a melhor fonte de dados de populao o setor censitrio. O estimador Kernel, como referido, avalia os eventos tendo o ponto como unidade de anlise. Levando-se em conta que o dado populacional agrupado e a unidade mnima oficial de agrupamento o setor censitrio, ao atribuir-se ao centride dessa regio o dado populacional conhecido, tem-se a possibilidade de estimar a intensidade desse processo (populao) usandose uma funo Kernel. Com essa abordagem, Kelsall e Diggle (1995) consideram o problema da estimativa da variao espacial do risco relativo equivalente estimativa da razo de duas densidades bivariadas. A razo entre as duas funes ser a intensidade do risco (Carvalho e Cmara, 2002) e o mapa produzido a partir dessa razo ser um mapa de risco relativo (Sabel et al., 2000). O mtodo baseado no clculo da densidade de casos (nmero de casos por rea), produzindo uma superfcie de probabilidades onde reas com casos mais prximos apresentam maior risco, cujo denominador utilizado para a taxa , em uma outra camada, a densidade de pessoas (habitantes por rea, ou simplesmente a densidade demogrfica) tambm como uma superfcie contnua. Se conseguirmos, agora, dividir o kernel do nmero de eventos pelo kernel de populao teremos a distribuio das taxas de incidncia. A unidade do kernel de eventos nmero de casos por metro quadrado. A unidade do kernel de populao nmero de habitantes por metro quadrado. A diviso desses dois valores resultaria em nmero de casos por habitante, que a unidade de taxa de incidncia.

54

2.6 - Avaliao de Aglomerados considerando a Distribuio da Populao

A figura 2.12 mostra a estimativa de distribuio de casos de hepatite A e de populao em Macap usando a tcnica de Kernel. A unidade espacial utilizada o setor censitrio, e a varivel usada para estimativa a populao total.
FIGURA 2.12 Superfcie de densidade de casos (a) e de populao (b) calculados usando-se a tcnica de Kernel. A B

No Terraview e no Crimestat possvel se construir um Kernel dual, ou uma razo de Kernel, que seja calculado utilizando-se a razo entre duas variveis. A primeira varivel ser o nmero de eventos, que est relacionada camada de casos (pontos), e a segunda varivel ser a populao, que um atributo da camada setor censitrio. O resultado para a anlise de casos de hepatite A em Macap pode ser visto na figura 2.13.
FIGURA 2.13 Superfcie da taxa de incidncia de hepatite A em Macap calculada utilizando-se a tcnica de Kernel.

55

CAPTULO 2 - Anlise de Dados em Forma de Pontos

Pode-se observar uma grande variabilidade dos valores obtidos para as taxas. Algumas das reas com maiores valores situam-se nas periferias da cidade, inclusive fora dos seus limites. reas em vermelho, denotando altas taxas esto localizadas fora dos limites dos bairros (polgonos no mapa). Isso acontece devido extrapolao da estimativa de kernel, chamado efeito de borda. Somente os valores de taxas contidos nos limites da regio de estudo podem ser considerados, isto , as taxas s podem ser calculadas dentro de reas onde existem dados de populao. Nesse caso, podem ser apontados aglomerados na rea sul (bairro de Buritizal) e nordeste (bairro do Perptuo Socorro) da Cidade de Macap.

2.7 Interpolao de Dados Pontuais

Esta abordagem tambm se aplica na comparao entre dois processos espaciais (ex: casos/controles; homens/mulheres) (Kelsall e Diggle, 1995). Essa estratgia particularmente interessante quando no dispomos de dados de populao, ou quando estamos trabalhando com inquritos ou amostras. Nesse caso, podemos comparar a distribuio espacial de casos com o total de amostras. Imagine um inqurito sobre tuberculose em que algumas pessoas com a doena (sorteadas aleatoriamente no espao) so perguntadas sobre o abandono do tratamento. A resposta a essa pergunta (sim ou no, portanto uma varivel dicotmica) deve ser convertida em um valor numrico (1 ou 0). A densidade de respostas sim em relao ao total de respostas fornece uma estimativa de proporo de abandono do tratamento representada no espao. Essa tcnica foi usada em Goinia para avaliar a distribuio espacial da soroprevalncia de dengue. Cada pessoa sorteada no inqurito foi localizada no trecho de rua, conforme o endereo anotado no momento da visita. A soropositividade de dengue foi obtida por exame em laboratrio a partir de amostras de sangue. A varivel soropositividade foi dicotomizada (transformada em 0 ou 1, pontos vermelho e verde no mapa) e foi calculado o Kernel usando-se como atributo o valor da soropositividade (Figura 2.14).

56

2.7 - Interpolao de Dados Pontuais

No mapa ao lado observa-se a rea perifrica da cidade, principalmente no sudeste com altas taxas de prevalncia de dengue. Em alguns casos, principalmente nas avaliaes de qualidade

FIGURA 2.14 Estimativa da distribuio espacial de prevalncia de dengue em Goinia (Marteli et al., 2004).

ambiental, as variveis no so dicotmicas. Por exemplo, os

resultados da anlise de amostras de gua mostram uma variao gradual dos valores de cloro, flor, turbidez e outros parmetros usados para o controle e vigilncia. Essas variveis so chamadas contnuas e podem ser usadas em uma tcnica de Kernel. Nesse caso, a resposta grfica da tcnica uma grade com valores interpolados da varivel selecionada. O exemplo a seguir (Figura 2.15) mostra o resultado de tcnica de Kernel aplicada qualidade da gua no Rio de Janeiro. Cada ponto no mapa mostra um local de coleta de amostra para avaliao da qualidade. A varivel usada para avaliar a qualidade da gua nesse caso foi a concentrao de flor (em mg/l). Essa uma tcnica muito utilizada para se obter interpolaes de dados no espao. As interpolaes so importantes para se avaliar a distribuio espacial de um processo contnuo no espao, baseadas em amostras pontuais deste processo. Isso se d principalmente para os processos ambientais, em que se espera que variem suavemente no espao e que tenham uma forte dependncia espacial. No caso do controle da qualidade da gua, obvio
FIGURA 2.15 Interpolao de valores de flor na rede de distribuio de gua no Rio de Janeiro, usando-se a estimativa Kernel (Barcellos et al., 1998).

57

CAPTULO 2 - Anlise de Dados em Forma de Pontos

que no se dispe de recursos para se amostrar todas as residncias existentes em uma cidade. Os mtodos de interpolao permitem que se estime essa qualidade em reas no amostradas.

Outros recursos de um SIG O trabalho de localizar e testar os possveis aglomerados de pontos pode ser feito dentro de um SIG ou usandose um outro programa que importe dados deste SIG e exporte resultados para este SIG. O programa Terraview tem sido aperfeioado para incorporar diversas ferramentas de anlise espacial que podem ser usadas com esse fim. Outras ferramentas esto disponveis em programas gratuitos, como o R, Crimestat e Satscan. Depois de identificar esses aglomerados ainda h muito a fazer. A Vigilncia em Sade deve procurar entender como e por que estas reas, destacadas pelos mtodos estatsticos, diferem das outras. Um trabalho importante nesta etapa retornar os resultados estatsticos para o SIG para verificar o que caracteriza essas reas. Isso pode ser feito atravs da confeco de mapas temticos sobre as condies socioeconmicas, por setor censitrio. A figura abaixo mostra a proporo de domiclios sem banheiro nos setores censitrios (em tons de verde). Sobre esta camada so mostrados os aglomerados de casos de hepatite A segundo o mtodo do vizinho mais prximo (em pequenas elipses vermelhas).

Fonte: Neri, 2004.

58

2.7 - Interpolao de Dados Pontuais

Tambm podem ser adicionadas novas camadas de informao que auxiliem a interpretao dos resultados estatsticos, como a localizao de unidades bsicas de sade, de crregos e rios, etc. Outro recurso importante avaliar a rea identificada pelos mtodos estatsticos por meio de outras fontes de informao. A figura abaixo mostra a mesma rea ao sul da Cidade de Macap segundo o programa Google Earth.

Fonte: http://earth.google.com/intl/pt/

Nesse programa, pode-se entrar com as coordenadas de um local em que se deseja visualizar a imagem de satlite. Com instrumentos de medio de distncia se pode calcular um raio de 1 km em torno deste ponto, identificado como o centro do aglomerado de casos. Usando-se esse recurso pode-se visualizar que grande parte das casas dentro desse raio est em reas de favelas de palafitas, com ms condies de saneamento.

59

Anlise Espacial de Dados de reas

Wayner V. Souza Marilia S Carvalho Oswaldo G. Cruz Virginia Ragoni

Captulo 3: Anlise Espacial de Dados de reas

3.1 - Mtodos para Espacializao e Tratamento Estatstico de Indicadores

pg. 63

Instabilidade em Pequenas reas Matriz de Vizinhana

pg. 63 pg. 65

3.2 - Mtodos de Suavizao Espacial


pg. 66

Mdia Mvel Espacial Estimador Bayesiano Emprico Autocorrelao Espacial

pg. 66 pg. 66 pg. 69

3.3 - Anlise da Estrutura Espacial


pg. 71 Anlise da Estrutura Espacial Estatstica de Moran Anlise da Estrutura Espacial Estatstica-Funo LISA Anlise da Estrutura Espacial Mtodos Inteiramente Bayesianos pg. 73 Anlise da Estrutura Espacial Mtodo de Markov Chain-Monte Carlo pg. 75 pg. 72 pg. 71

3.4 - Tcnicas de Anlise de Dados Pontuais Aplicadas a reas pg. 78

3.1 Mtodos para Espacializao e Tratamento Estatstico de Indicadores

Instabilidade em Pequenas reas

As taxas brutas, como de incidncia e de mortalidade, so os estimadores de risco mais simples e mais usados para o mapeamento da ocorrncia de doenas e agravos, e so calculados como a razo entre o nmero de casos ou bitos ocorridos na rea e o nmero de pessoas expostas nesta rea. Um grande problema associado ao uso de taxas brutas, porm, a alta instabilidade que elas possuem para expressar o risco de um evento quando ele raro e a populao da regio de ocorrncia pequena. As grandes flutuaes que ocorrem com essas taxas podem nada ter a ver com o fenmeno e sim com a ocorrncia de um ou dois casos do evento a mais ou a menos numa determinada localidade, causando variaes abruptas nas taxas brutas se a sua populao for pequena, este efeito no ocorre em grandes populaes. A figura 3.1 mostra a disperso das taxas de Acidentes de Transporte (CIDBR) versus o logaritmo natural da Populao para todos os municpios do Brasil no ano de 2004. Observe a forma de funil e a grande variabilidade encontrada nos municpios com populaes de cerca de 3.000 habitantes (log N = 8).

FIGURA 3.1 Taxas de mortalidade por acidentes de transporte nos municpios brasileiros em 2004, segundo tamanho populacional. Taxas de mortalidade por Acidentes de Transporte Brasil 2004

Taxa p/ 100.000 hab.

100

200

300

10

12 Log da Populao

14

16

Fonte: DATASUS.

CAPTULO 3 - Anlise Espacial de Dados de reas

Pode-se observar melhor esse fenmeno construindo um boxplot com os mesmos dados, em intervalos da populao como pode ser visto na figura 3.2. Cerca de 25% dos municpios brasileiros possuem menos de 5.000 habitantes. Assim sendo, podemos, com freqncia, ser levados a falsas interpretaes e concluses ao analisarmos mapas de taxas brutas. A figura 3.3 mostra o mapa da taxa de acidentes de transporte por 100.000 habitantes para o ano de 2004 nos municpios do Brasil. Pode-se observar, que por simples inspeo visual, no possvel identificar um padro de ocorrncia do evento, principalmente por estarmos representando taxas sujeitas a variaes conforme demonstrado nas figuras 3.2 e 3.3.
FIGURA 3.2 Taxas de mortalidade por acidentes de transporte nos municpios brasileiros em 2004, segundo faixas de tamanho populacional.
Boxplot das Taxas de mortalidade por Acidentes de Transporte Brasil - 2004

FIGURA 3.3 Mapa temtico das taxas de mortalidade por acidentes de transporte nos municpios brasileiros em 2004.

30 0
Taxa por 100.000 hab.

20 0

10 0

0 <5 5-10 10-50 50-100 100-1.000 >1.000

Populao X 1.000

Fonte: DATASUS.

Log da Populao

Fonte: DATASUS.

FIGURA 3.4 Taxas de mortalidade mdia por acidentes de transporte nos municpios brasileiros em 2002, 2003 e 2004, segundo faixas de tamanho populacional.
Boxplot das Taxas trienal de mortalidade por Acidentes de Transporte Brasil - 2002 a 2004

Figura 3.5 - Mapa temtico das taxas mdias de mortalidade por acidentes de transporte nos municpios brasileiros em 2002, 2003 e 2004.

30 0
Taxa por 100.000 hab.

20 0

10 0

0 <5 5-10 10-50 50-100 100-1.000 >1.000

Populao X 1.000

Fonte: DATASUS.

Fonte: DATASUS.

64

3.1 - Mtodos para Espacializao e Tratamento Estatstico de Indicadores

O Estimador por Mdias Mveis Temporais uma das maneiras de se contornar o problema. Uma das mais freqentes a utilizao da mdia trienal, ou seja, usa-se a mdia de casos no perodo de 3 anos para cada municpio, obtendo-se assim uma estabilizao das taxas. A figura 3.4 mostra a mdia trienal da taxa dos Acidentes de Transporte para os anos de 2002, 2003 e 2004, representados na mesma escala que a figura 3.2. Note que o efeito funil ainda existe, mas que houve uma grande reduo da variabilidade das taxas nos municpios de populaes menores. Olhando no mapa da figura 3.5, que utiliza a mesma escala da figura 3.3, podemos notar a suavizao introduzida. Existem outras maneiras de se lidar com esse problema, as quais sero discutidas a seguir. A base para esses mtodos consiste na criao de uma matriz de vizinhana.

Matriz de Vizinhana
Um procedimento necessrio para a analise de dados de rea a construo de uma matriz de vizinhana, tambm conhecida como matriz de distncia, matriz de conectividade ou matriz de proximidade. Essa matriz de conectividade indica a relao espacial de cada rea com as demais. Essa matriz pode ser composta, por exemplo, apenas pela lista de vizinhos de cada municpio; ou a distncia entre municpios ligados por estradas; ou ainda a conectividade ponderada pelo comprimento da fronteira comum. A figura 3.6 apresenta os municpios do Estado de Roraima, a partir dos quais foi construda uma matriz baseada na vizinhana, por meio da atribuio de valores: 1 para os municpios que possuem fronteiras em comum, e 0 para os municpios que no compartilham fronteiras. A matriz de vizinhana referente ao mapa da figura 3.6 pode ser vista na figura 3.7. Observe, por exemplo, que a capital Boa Vista tem 7 vizinhos e que o municpio de Uiramut no extremo norte tem apenas 2 vizinhos.
FIGURA 3.6 Mapa do Estado de Roraima com diviso por municpios. FIGURA 3.7 Matriz de Vizinhana para os municpios do Estado de Roraima.
So Joo da Baliza

Rorainpolis

Alto Alegre

Normandia

Pacaraima

Caracara

Boa Vista

Amajari Alto Alegre Boa Vista Bonfim Cant Caracara Caroebe Iracema Mucaja Normandia Pacaraima Rorainpolis So Joo da Baliza So Luiz Uiramut 1 1 0 0 0 0 0 0 0 1 0 0 0 0

1 1 0 0 0 0 1 1 0 0 0 0 0 0

1 1 1 1 0 0 0 1 1 1 0 0 0 0

0 0 1 1 1 0 0 0 1 0 0 0 0 0

0 0 1 1 1 0 1 1 0 0 0 0 0 0

0 0 0 1 1 1 1 0 0 0 1 1 1 0

0 0 0 0 0 1 0 0 0 0 0 1 0 0

0 1 0 0 1 1 0 1 0 0 0 0 0 0

0 1 1 0 1 0 0 1 0 0 0 0 0 0

0 0 1 1 0 0 0 0 0 1 0 0 0 1

1 0 1 0 0 0 0 0 0 1 0 0 0 1

0 0 0 0 0 1 0 0 0 0 0 1 1 0

0 0 0 0 0 1 1 0 0 0 0 1 1 0

0 0 0 0 0 1 0 0 0 0 0 1 1 0

Fonte: DATASUS.

65

Uiramut

So Luiz

Caroebe

Mucaja

Iracema

Amajari

Bonfim

Cant

0 0 0 0 0 0 0 0 0 1 1 0 0 0

CAPTULO 3 - Anlise Espacial de Dados de reas

3.2. Mtodos de Suavizao Espacial

Mdia Mvel Espacial


Quando se estabiliza a taxa de ocorrncia de um evento utilizando o mtodo de mdias mveis, o valor atribudo a cada rea igual soma dos eventos nos vizinhos dividida pela populao total (somadas as populaes de todas as reas). Nesse caso, as reas com maior populao tm mais peso na estimativa desse indicador. Entretanto, a rea do municpio central e a de seus vizinhos recebem o mesmo peso sem ser possvel atribuir pesos distintos entre os municpios.

Estimador Bayesiano Emprico


Outra forma de suavizar a flutuao associada s pequenas reas usandose o mtodo denominado estimador bayesiano emprico. Nesse caso,

i , que de fato expressa a fora de ocorrncia do evento na rea i, uma varivel aleatria com mdia i e varincia i2.
supomos que a taxa real O melhor estimador dessa taxa uma combinao linear entre a taxa observada (eventos/populao) na rea i e um valor mdio um fator wi da seguinte forma:

i ponderados por

i = wi ti + (1 wi ) i
Essa mdia usada na ponderao pode ser a taxa mdia da regio toda de estudo, quando chamamos o mtodo de bayesiano emprico global, ou pode ser a mdia dos vizinhos, mtodo ao qual chamaremos de bayesiano emprico local. O fator de ponderao wi tanto menor quanto menor a populao em estudo da i sima rea, e reflete o grau de confiana a respeito de cada taxa. Contrariamente, se confiamos bastante no valor estimado da taxa (populaes maiores), wi se aproxima de 1 (um), e, conseqentemente, o peso (1- wi ) da mdia dos vizinhos se aproxima de 0 (zero). Para o caso de populaes reduzidas, a confiana na taxa observada diminui e a estimativa da taxa se aproxima de nosso modelo a priori (ou seja, se aproxima de

i ).

Regies com populaes muito baixas tero uma correo maior, e regies populosas tero pouca alterao em suas taxas. Logo i ser estimado, quando

n for pequeno, com maior peso da mdia da vizinhana, no caso do estimador


local ou da taxa geral da regio no caso do estimador global.

66

3.2 - Mtodos de Suavizao Espacial

Chamamos o mtodo de bayesiano emprico porque a mdia e a varincia sero estimadas a partir dos dados, considerando que cada valor observado apenas uma realizao de um mesmo processo de mdia i e varincia Estimar a mdia fcil:

i2 .

= yi

, onde yi a contagem do

evento em cada rea e ni a populao. No caso da suavizao bayesiana local, esta a taxa do evento entre os vizinhos. No caso global a taxa da regio toda. A varincia, da mesma forma, estimada com base na varincia das taxas de cada rea em relao mdia

i . i / ni :

Voltando ento ao fator de ponderao wi , este a varincia da taxa entre os vizinhos dividida pela soma desta varincia com uma frao da mdia

wi =

i2 i2 +

i
ni

Observe que quando a populao ni muito grande, o elemento somado ao denominador se aproxima de zero, e o fator de ponderao fica igual a um. Ou seja, os vizinhos no influenciam o valor estimado da taxa. O que faz todo o sentido.

interessante observar na figura 3.9, comparando com a figura 3.8, que no h mais bairros com taxa igual a zero. Isso significa que os locais com 0 (zero) casos, muito provavelmente, no tinham populao suficiente para que os casos aparecessem. Por outro lado, a maior taxa agora 13,59 em vez de 144,33 por 100.000 habitantes dadas as suavizaes dos valores originais, evidenciada no mapa. Alm disso, diversos bairros mudaram de classe. O mais importante que os dados agora refletem melhor o risco real de deteco de casos de hansenase, e no a presena de flutuao aleatria. Cabe lembrar que reas que tm apenas um vizinho no se beneficiam muito dessa tcnica, pois somente este vizinho contribuir para estimar o indicador. Alguns cuidados so essenciais na hora de calcular o estimador bayesiano, particularmente o tipo (critrio) de matriz de vizinhana adotada. Pode-se adotar critrios de vizinhana por adjacncia (como no exemplo acima), por distncia (entre centrides, por exemplo), por quantidade (5 polgonos mais prximos, por exemplo), etc.

67

CAPTULO 3 - Anlise Espacial de Dados de reas FIGURA 3.8 Recife: Taxas de deteco mdia de hansenase em menores de 15 anos, para o perodo 1993-1997, por bairro.

Fonte: SES-PE, 1998.

FIGURA 3.9 Recife: Taxas de deteco mdia obtidas por mtodo bayesiano emprico local, em menores de 15 anos, para o perodo 1993-1997, por bairro.

Fonte: SES-PE, 1998.

68

3.2 - Mtodos de Suavizao Espacial

Autocorrelao Espacial
A estrutura de dependncia entre os valores observados nas vrias reas do fenmeno em estudo analisada pela funo de autocorrelao espacial. Autocorrelao, como o prprio nome indica, mede a correlao da prpria varivel, e, sendo espacial, no espao. A correlao de uma varivel com ela mesma, medida no mesmo local, ser sempre 1 (UM). Entretanto, a correlao de uma varivel com ela mesma, porm medida nas reas vizinhas, ter um valor que varia entre -1 e 1 (como qualquer medida de correlao). Quanto mais prximo de 1 (UM), maior a semelhana entre vizinhos. O valor 0 (zero) indica inexistncia de correlao, e valores negativos indicam dessemelhana. Vejamos como isso funciona: Em primeiro lugar, como a funo de autocorrelao espacial, precisamos utilizar a matriz de vizinhana, como no exemplo ao lado (Tabela 3.1), onde consideramos vizinhos os municpios que partilham de fronteira comum. Nesse caso, a matriz simtrica: valor 1 (UM) quando so vizinhos e 0 (ZERO) caso contrrio. O valor do indicador em estudo, nesse exemplo, a taxa de mortalidade infantil (TMI), est apresentado na ltima coluna da tabela. A mdia e a varincia apresentadas no so parmetros globais, simplesmente so parmetros calculados para a distribuio das taxas dos municpios. A funo de correlao usual compara valores de duas variveis. A funo de autocorrelao a correlao do valor do indicador comparado aos valores do mesmo indicador nos municpios vizinhos. Assim, matematicamente, a funo expressa como:
Varincia das Taxas 7,17 Cacimba Nascente 0 1 0 1 0 0 0 0 1 0 18,4 23,0 Bebedouro 1 0 0 1 0 26,5 gua Santa TABELA 3.1 Matriz de vizinhana espacial por adjacncia e Taxas de Mortalidade Infantil (/1000 Nascidos Vivos) - Exemplo MUNICPIO gua Santa 0 Bebedouro Cacimba Nascente Poo TMI

22,3

Poo

20,7

Mdia das Taxas (y)

22,18

1=

w
i=1 j=1

w
i=1 j=1

ij

(y i y)(y j y)

VAR(y)

ij

sendo wij o indicador de vizinhana (no nosso exemplo 0 ou 1), yi o valor do indicador na rea i e yj o valor em j, y a mdia e VAR( y ) a varincia das taxas.

69

CAPTULO 3 - Anlise Espacial de Dados de reas

Traduzindo os somatrios e produtos em palavras, temos no numerador que, sempre que i e j forem vizinhas (1 na matriz acima), somamos o produto do desvio das reas i e j em relao ao valor mdio y . No denominador temos simplesmente a varincia do indicador. Na tabela 3.2 apresentamos o clculo da funo de autocorrelao para nosso exemplo. Na ltima coluna, o valor registrado cada parcela que entra no somatrio. Observe que quando os municpios no so vizinhos, a contribuio deles nula para o clculo do indicador.
TABELA 3.2 Auxlio ao clculo da autocorrelao espacial. DUPLAS DE MUNICPIOS Vizinhana Taxa em i Taxa em j w x(y -y)x(y -y) ij i j ( W ij) ( yi ) ( yj ) 1 0 1 1 0 1 0 0 1 0 5 22,3 22,3 22,3 22,3 26,5 26,5 26,5 18,4 18,4 23,0 26,5 18,4 23,0 20,7 18,4 23,0 20,7 23,0 20,7 20,7 0,518 0,000 0,098 -0,178 0,000 3,542 0,000 0,000 5,594 0,000 9,576

gua Santa x Bebedouro gua Santa x Cacimba gua Santa x Nascente gua Santa x Poo Bebedouro x Cacimba Bebedouro x Nascente Bebedouro x Poo Cacimba x Nascente Cacimba x Poo Nascente x Poo SOMA

Ao compararmos essa tabela com a matriz de vizinhana pode-se verificar que as somas obtidas referem-se apenas a uma parte dela (inferior ou superior), com relao diagonal principal. Como a matriz simtrica, as somas que procuramos sero exatamente o dobro das aqui obtidas. Portanto:
n n

w
i=1 j=1 n n i=1 j=1 ij
i j

ij

= 2 x 5 = 10

w (y y)(y y) = 2 x 9,576 = 19,152 w (y y)(y y)


i=1 j=1 ij
i j

1=

w
i=1 j=1

x
ij

VAR(y)

1 19,152 X 10 7,17

= 0,267

70

3.2 - Mtodos de Suavizao Espacial

Pode-se tambm adotar outra forma de vizinhana, por exemplo, por distncia. Na coluna de vizinhana, w ij passa a ser um valor contnuo, resultante do produto da distncia por 1 ou 0, conforme sejam ou no vizinhas as reas consideradas. Poderamos considerar alm de vizinhos de primeira ordem, ou vizinhos diretos, os vizinhos de segunda ordem. O vizinho k de j ser vizinho de segunda ordem de i, se i e j forem vizinhos. Em nosso exemplo, o valor da funo de autocorrelao, quando consideramos apenas vizinhos de primeira ordem, ou vizinhos diretos, 0,267. O valor da funo de autocorrelao, para vizinhos diretos, denominado estatstica I de Moran, e utilizado como teste para verificar a presena de cluster espacial, necessitando para tanto calcular a significncia do valor encontrado.

3.3. Anlise da Estrutura Espacial

Anlise da Estrutura Espacial - Estatstica de Moran


O conceito de estacionariedade aplicado a reas geogrficas significa que a mdia do processo medido em estudo no constante em todas as subreas. Um bom exemplo de dado no estacionrio a incidncia cncer de pele do tipo basocelular, que aumenta com: (a) a insolao, e conseqentemente diminui conforme aumenta a latitude; (b) com a cor da pele da populao, sendo mais freqente em populao de pele mais branca; e (c) com a presena de buracos da camada de oznio, que diminuem a proteo contra os raios ultravioleta. Ou seja, fatores que fazem com que haja uma clara tendncia espacial. O teste de Moran para deteco de padro de distribuio de eventos em cluster no deve ser usado quando o dado no estacionrio. Uma das formas de avaliar se o dado ou no estacionrio, alm de olhar atentamente o mapa em busca de padres, utilizar a funo de autocorrelao espacial considerando vizinhos de diversas ordens. Quando o dado no estacionrio a funo decresce muito lentamente. Uma observao importante dessa funo que, se houver uma variao na mdia conforme a subrea geogrfica, por exemplo, aumentando com a latitude, os valores da estatstica sero muito grandes. Isso porque ao comparar valores do indicador nos municpios com a mdia global (o numerador), se dois municpios esto do mesmo lado da rea geogrfica, os desvios em relao ao global sero na mesma direo positiva ou negativa

71

CAPTULO 3 - Anlise Espacial de Dados de reas

e quanto mais afastados da mdia, mais contribuiro para a estatstica. Um processo estocstico (aleatrio) estacionrio quando sua distribuio de probabilidade a mesma em qualquer ponto do tempo ou local. Por exemplo, se medirmos a taxa de mortalidade por cncer de pulmo, nos municpios do Brasil poderemos afirmar que a mdia e a varincia em cada estado aproximadamente constante.

Anlise da Estrutura Espacial - Estatstica-Funo LISA


Outra abordagem para a anlise da estrutura espacial a funo LISA, ou funo de autocorrelao local. Da mesma forma que podemos utilizar o mtodo bayesiano emprico global e local, pode-se estimar a autocorrelao de primeira ordem, global Moran, e local LISA. Nesse caso, em vez de utilizar o indicador global, utiliza-se o valor do indicador na subrea composta por vizinhos. Essa estatstica interessante, pois permite comparar o valor de cada municpio com seus vizinhos. Em geral se utiliza o indicador normalizado, ou seja, a diferena entre a mdia global e o valor em cada municpio, dividida pelo desvio padro, de forma que a unidade do indicador passa a ser unidades de desvio padro de afastamento da mdia. Essa tcnica permite visualizar graficamente, atravs do
FIGURA 3.10 Diagrama de Espalhamento de Moran.

diagrama de espalhamento de Moran, o grau de similaridade entre vizinhos. Colocando-se no eixo X o valor do indicador do municpio i normalizado e no eixo

Y o valor da estatstica de Moran somente entre os vizinhos de i, cada quadrante do


grfico (Figura 3.10) pode ser interpretado como: Q1 (valores positivos, mdias positivas) e Q2 (valores negativos, mdias negativas): indicam pontos de associao espacial positiva, no sentido que uma localizao possui vizinhos com valores semelhantes; Q3 (valores positivos, mdias negativas) e Q4 (valores negativos, mdias positivas): indicam pontos de associao espacial negativa, no sentido que uma localizao possui vizinhos com valores distintos. De forma similar aos indicadores globais, a significncia do ndice local de Moran ( Ii ) deve ser avaliada, utilizando-se hiptese de normalidade ou simulao de distribuio por permutao aleatria nos valores dos atributos (Anselin, 1995). Uma vez determinada a significncia estatstica de Moran (Ii) muito til gerar um mapa indicando as regies que apresentam correlao local significativamente diferente do resto dos dados. Esse mapa denominado por Anselin (1995) de LISA MAP. Na gerao do LISA MAP, os ndices locais Ii so classificados como: no significantes; com significncia de 95% (1,96 sd), 99% (2,54 sd) e 99,9% (3,2 sd).

72

3.3 - Anlise da Estrutura Espacial

Na figura 3.11, o primeiro mapa mostra indicadores de qualidade de vida no municpio de So Paulo. No segundo mapa, as reas em verde tm alta correlao entre vizinhos, isto os indicadores se parecem. Nas reas em azul claro, h uma pequena correlao entre indicadores de reas vizinhas e nas reas em branco, as reas se parecem menos. Isso quer dizer que no municpio de So Paulo existem trs

FIGURA 3.11 Indicadores Locais de Autocorrelao Espacial.

grandes reas homogneas: uma no sul e outra na zona leste da cidade, com baixos ndices de qualidade de vida, e uma rea central com melhores ndices de qualidade de vida.

Anlise da Estrutura Espacial - Mtodos Inteiramente Bayesianos


A anlise da distribuio espacial de eventos de sade visa a identificar seu padro espacial, por meio de mapas de risco, relativos s unidades territoriais de anlise, de forma a apontar as reas de maior gravidade do problema e facilitar o planejamento de intervenes de Sade Pblica. Para tal, pode-se utilizar o mtodo bayesiano completo para estimao da funo de densidade de probabilidade do risco relativo analisado espacialmente, levando em considerao co-fatores socioeconmicos e ambientais, alm de indicadores de ateno sade e/ou de efetividade das aes de controle que interferem no processo, como forma de resolver as questes relativas incorporao do espao como categoria de anlise, aqui levantadas. Assim, a abordagem bayesiana prope que o nmero de casos ocorridos em cada uma das n reas geogrficas, y = ( y1 , y2 , ....., yn ), so realizaes de uma varivel aleatria y = (y1 , y2 , ....., yn ) com distribuio de Poisson e com mdia

= ( 1 , 2 , ..., n ).

Sob a hiptese de no haver diferenas entre as taxas de incidncia, no espao, pode-se estimar o vetor e = ( e1 , e2 , ..., en ), de casos esperados para cada rea, pela simples aplicao da taxa mdia de incidncia do municpio, unidade da federao (UF), ou pas populao de cada uma destas reas, no perodo de estudo. Sendo assim, podemos definir o risco relativo para a ocorrncia do evento em cada rea i ( i ), como:

i =

i
ei

73

CAPTULO 3 - Anlise Espacial de Dados de reas

O modelo bayesiano estima esses riscos, considerando a possvel influncia de co-fatores socioeconmicos e ambientais, de ateno sade e/ou de efetividade das aes de controle.

= ei i ou, aplicando-se uma transformao logartmica, log(i ) = log(ei ) + log( i ), onde log(i ) o logaritmo neperiano do risco relativo, para cada rea e que
Dado isso e a expresso

i =

i
ei

, podemos escrever que

pode ser modelado como:

log(i ) = 0 + 1 xi1 + 2 xi2 + ... + k xik + i + vi


onde

0 a constante do modelo e os j ( j = 1, 2..., k) so os

parmetros que refletiro a influncia de cada co-fator sobre o risco relativo; xij

( j = 1, 2..., k) o vetor de co-fatores referente a cada rea ii ; i representa


a componente aleatria espacialmente estruturada do risco relativo e v i o componente aleatrio no-espacial. Sinteticamente, podemos dizer que o risco relativo modelado por meio de um modelo log-linear, onde so consideradas duas componentes aleatrias: uma espacial e outra no-espacial. Portanto temos:

log(i ) = log (ei ) + 0 + j xj + i + vi


j=1

onde o componente vi um efeito aleatrio no-espacial que permitir, analisando-se sua distribuio, interpretar se as variveis explicativas includas no modelo so suficientes na explicao do fenmeno, tal qual nos modelos de regresso clssicos. O componente

i um efeito aleatrio que representa um residual de risco

relativo espacialmente estruturado, que pode ter sua estrutura definida usandose um modelo auto-regressivo condicional normal (CAR-Normal) dado por:

p (i /ji ) ~ N

i Wij j j
j i

Wij

i Wij j

onde wij sendo igual a 1 se os setores i e j forem adjacentes e 0 em caso contrrio, o que significa dizer que foram considerados vizinhos os setores censitrios adjacentes.

i um modelo autoregressivo condicional normal, dado que o efeito aleatrio espacial ( i ) de


O modelo utilizado para definio da estrutura dos

74

3.3 - Anlise da Estrutura Espacial

uma determinada rea est condicionado to somente aos efeitos aleatrios de sua vizinhana ( j ; j i), atravs de uma relao linear. Por conseguinte,

i tem distribuio normal com mdia igual mdia de sua vizinhana e


desvio padro inversamente proporcional ao tamanho desta vizinhana. Para implementao do modelo utiliza-se o mtodo de simulao MCMC (Markov Chain-Monte Carlo) usando-se o programa WinBugs (http://www.mrcbsu.cam.ac.uk/bugs/winbugs/contents.shtml), que gera amostras da distribuio de p (

/ y ), que a distribuio conjunta a posteriori de , e

v, dadas as observaes y.

Anlise da Estrutura Espacial - Mtodo de Markov Chain-Monte Carlo


Define-se um processo Markoviano como um processo estocstico que represente observaes de um sistema, obedecendo a certas leis de probabilidade com o seguinte princpio: a probabilidade de o sistema estar, num determinado estado, no momento t2 , pode ser deduzida a partir do conhecimento do seu estado num momento anterior t1, e no depende da histria do sistema antes do momento t1. Os processos de Markov podem ser classificados no s pelo seu parmetro, mas tambm pelo conjunto de valores possveis do processo estocstico, que pode ser contnuo ou discreto. Os processos de Markov, em que o conjunto de valores possveis discreto, so chamados de cadeias de Markov. Sendo assim, dado um conjunto discreto de variveis aleatrias

X = ( X 0 , X 1 , .... X m-1 , X m , ... , X n ) , pode-se dizer que: P ( Xm = xm / X0 = x0 , X1 = x1 , ... , Xm-1 = xm-1 ) = P ( Xm = xm / Xm-1 = xm-1 )
A obteno dos vrios resultados desse processo estocstico (valores da varivel aleatria X ) se d, ento, por simulao, usando-se o mtodo de Monte Carlo. Nesse modelo, o que se necessita obter so os valores mdios dos riscos relativos ( i ) para cada setor censitrio, que por sua vez modelado em

j . Ento temos de obter os valores mdios de cada j , por simulao, assumindo que os j
funo de co-fatores que so ponderados pelos parmetros tm uma distribuio a priori pouco informativa, no caso uma distribuio Normal, com mdia igual a zero e varincia muito grande, dado que o objetivo da modelagem dos

i rejeitar a hiptese nula, H0 : j = 0.

O mtodo de Monte Carlo consiste, ento, na gerao, atravs de nmeros aleatrios da distribuio de probabilidade a priori adotada, de N (nmero de simulaes) valores para cada

j , ou seja, j1 , j2 , ....., jN . Assim, a varivel

j+ = j1+ j2 + ..... + jN tem, pelo teorema do limite central, distribuio


aproximadamente Normal com mdia igual a N x m e varincia igual a N x s2, onde m e s so, respectivamente, a mdia e a varincia dos

jk .
75

CAPTULO 3 - Anlise Espacial de Dados de reas

N s . igual a m e desvio padro igual a N


Teorema do Limite Central

Sendo assim, a varivel

k=1

jk

ter distribuio Normal com mdia

Sejam X1 , X2 , X3 , ... , Xn variveis aleatrias independentes e identicamente distribudas com mdia e seja X =
i=1

finita e varincia 0 < 2 <

Xi

, ento X

N ; n .

Procedimento idntico deve ser adotado, com o mesmo mtodo de simulao, para obteno dos parmetros

e v includos na modelagem dos i .

A ttulo de exemplo, tomemos o caso da tuberculose em Olinda no perodo 1996-2000. Os dados referentes ao perodo so apresentados na tabela 3.3.
TABELA 3.3 Casos de tuberculose notificados e georreferenciados em Olinda, 1996-2000. ANO Total de casos notificados 433 411 419 381 340 1984 Referenciados por setor censitrio 366 339 360 320 293 1678 Proporo georreferenciada (%) 84,5 82,5 85,9 84,0 86,2 84,6 Populao ajustada para o meio do perodo 349.243 353.783 358.381 363.039 367.758 358.381 Incidncia por 100.000 hab. 124,0 116,2 116,9 104,9 92,5 110,7

1996 1997 1998 1999 2000 TOTAL

FIGURA 3.12 Taxas de Incidncia Mdia de Tuberculose por 100.000 habitantes em Olinda, 1996-2000.

No perodo de 1996 a 2000, foram registrados 1.984 novos casos de tuberculose em residentes no Municpio de Olinda, resultando em uma taxa de incidncia mdia superior a 1,0 caso novo para cada 1.000 habitantes, o que representa quase o dobro da mdia nacional.

Incidncia 1996-2000 0.0 42.2 42.2 86.0 86.0 142.2 142.2 215.9 215.9 390.1 Setores Censitrios

O mapa de padro de incidncia segundo setores censitrios apresentado na figura 3.12, ao lado.

76

3.3 - Anlise da Estrutura Espacial

Variveis explicativas e modelo O modelo empregado foi:

log ( i ) = log ( ei ) + 0 + 1 log ( x1 ) + 2 log (1+ x2 ) +

3 log (1+ x3 ) + 4 log (1+ x4 ) + 5 log (1+ x5 ) + i + vi


onde:

x1 : mdia de habitantes por domiclio no setor; x2 : porcentual de chefes de famlia sem instruo ou com menos de um
ano de instruo, por setor;

x3 : porcentual de chefes de famlia sem rendimento ou com renda inferior a


um salrio mnimo mensal, por setor;

x4 : nmero de casos de retratamento no setor; x5 : nmero de domiclios com mais de um caso no perodo, por setor.
Assim, o risco relativo foi estimado no modelo como:

i = e

(0 + j xj + i + vi i)
j=1

Dessa forma, pode-se calcular a medida de efeito de cada co-varivel, na magnitude do risco relativo, como sendo igual exponencial do respectivo

j .

A etapa final relativa modelagem consiste na anlise de convergncia dos modelos, que a verificao da estabilidade das estimativas produzidas por mtodos de simulao, como o MCMC, e pode ser efetuada com emprego da rotina BOA (bayesian output analysis, disponvel em www.mrcbsu.cam.ac.uk/bugs) executada pelo software S-PLUS. Existe um grande elenco de mtodos de anlise de convergncia, disponvel na literatura especializada. Aqui foi utilizado o de Heidelberger & Welch (Brooks, 1998), que consiste em testar a hiptese nula de que os valores obtidos por simulao, para cada varivel, formam um processo estacionrio. A rejeio da hiptese nula indica a necessidade de produzir-se um nmero maior de simulaes para o modelo. Resultados Pode-se observar os riscos relativos estimados pelo modelo na figura 3.13. Esses riscos so, em realidade, uma representao probabilstica do risco de ocorrncia da tuberculose, ou seja, uma identificao do processo estocstico gerador do risco, livre da interferncia de flutuaes aleatrias.
FIGURA 3.13 Riscos Relativos para a ocorrncia da tuberculose em Olinda, segundo setores censitrios, com emprego de Mtodo Bayesiano Completo.

77

CAPTULO 3 - Anlise Espacial de Dados de reas FIGURA 3.14 Olinda: Setores Censitrios com risco relativo para a ocorrncia da tuberculose igual ou maior que 150%.

Esses resultados permitem analisar e identificar formas realistas de enfrentamento do problema diante da escassez de recursos, por vezes presente, conforme exemplificado na figura 3.14. Pode-se, por exemplo, no mbito do SIG, selecionar reas com risco relativo maior do que 1,5 (150%) como forma de identificar reas prioritrias para intensificao de aes de vigilncia e controle. As reas assinaladas (em vermelho) correspondem a 47 setores censitrios que totalizaram 629 casos de tuberculose, no perodo 1996-2000 (37,5% do total), tendo uma populao de 59.587 habitantes (16,6% do total), o que implica uma incidncia mdia anual de 211,1 por 100.000 habitantes.

3.4. Tcnicas de Anlise de Dados Pontuais Aplicadas a reas

Na anlise espacial de taxas epidemiolgicas e eventos de sade referidos a reas geogrficas, pode-se estar interessado na produo de mapas de superfcies contnuas como forma de produzir uma visualizao menos fragmentada da distribuio do evento, identificando as reas quentes. Para tal, pode-se adotar tcnicas at aqui descritas como apropriadas anlise de dados pontuais (como o estimador de intensidade Kernel, por exemplo), obviamente cercando-se de alguns cuidados no que diz respeito interpretao dos resultados. A ttulo de exemplo, usaremos os dados de uma coorte de casos de tuberculose, notificados entre 2003 e 2005 na Cidade do Recife, gentilmente cedidos pelo Prof. Ricardo Ximenes, da Universidade Federal de Pernambuco, que coordena o Projeto de Pesquisa que coletou os dados. Nesse exemplo, foram usadas as informaes sobre setor censitrio e bairro de residncia de 1.092 desses casos, permitindo o clculo das densidades de incidncia para cada um desses nveis de agregao. Na figura 3.15 apresentamos o mapa da Cidade do Recife, com suas divises administrativas segundo bairros e distritos sanitrios, e na figura 3.16, o mapa clssico de padro das taxas de incidncia calculadas para os bairros.

78

3.4 - Tcnicas de Anlise de Dados Pontuais Aplicadas a reas FIGURA 3.15 Recife Diviso de bairros (polgonos delimitados em preto) e distritos sanitrios (polgonos delimitados em azul). FIGURA 3.16 Mapa de padro de incidncia de tuberculose segundo bairros Coorte 2003-2005.

A adoo de tcnicas de anlise de dados pontuais referida pode ser feita identificando-se as coordenadas geogrficas do centride de cada polgono (bairro ou setor censitrio), atribuindo-se a esta localizao os casos ocorridos na rea, assim como sua populao. Note-se que ao adotarmos tal procedimento, estaremos incluindo uma fonte de erro, por atribuirmos todas as ocorrncias de uma determinada rea a um nico ponto, que seu centride. Esse erro seria possivelmente menor se atribussemos essas ocorrncias ao centride populacional do polgono, o que no o mais comum, devido a dificuldades de se obter mapas de densidade populacional. O mais usual atribuir as ocorrncias ao centride geogrfico do polgono, o que remete a uma discusso de escala, visando a controlar tal erro. Temos ento que analisar a questo da escala que desejamos trabalhar (bairro ou setores), alm de outra que se refere ao tipo de intensidade que queremos estimar (casos ou incidncia). As figuras 3.17 e 3.18 mostram mapas de Kernel apresentando as intensidades de incidncia e de casos, respectivamente, adotando-se o bairro como unidade de anlise.
FIGURA 3.17 Mapa de Kernel de incidncia de tuberculose segundo bairros. FIGURA 3.18 Mapa de Kernel de casos de tuberculose segundo bairros.

79

CAPTULO 3 - Anlise Espacial de Dados de reas

Analisando-se esses mapas podemos identificar que, exceto a regio noroeste da cidade (que sempre se apresenta como rea crtica para a ocorrncia da tuberculose), existem diferenas importantes entre o mapa de intensidade de incidncia e de casos. Se quisermos analisar a gravidade do problema, em termos de risco de adoecer, temos que utilizar o mapa que fornece a intensidade da incidncia (Figura 3.16), por considerar os tamanhos das populaes sob risco, que no caso dos bairros do Recife apresentam variaes importantes. Por outro lado, se estamos adicionalmente interessados em planejar a infraestrutura de vigilncia e assistncia, tambm deve ser observado o mapa que fornece informao sobre intensidade de casos (Figura 3.18). Nas figuras 3.19 e 3.20, apresentamos as mesmas abordagens, agora considerando o setor censitrio como unidade de anlise. Nesse caso as diferenas entre os dois mapas j no so to marcantes, dado que tal unidade geogrfica constituda pelo IBGE com tamanhos populacionais com pouca variao, na maioria das vezes.
FIGURA 3.19 Mapa de Kernel de incidncia de tuberculose segundo setores censitrios (polgonos no representados). FIGURA 3.20 Mapa de Kernel de casos de tuberculose segundo setores censitrios (polgonos no representados).

Por fim, nas figuras 3.21 A e 3.21 B, comparamos os mapas de intensidade de incidncia segundo bairros e segundo setores censitrios, respectivamente. Pode-se notar, novamente, a menos da regio noroeste da cidade, diferenas importantes entre os dois mapas, decorrentes da questo da heterogeneidade da distribuio espacial do evento, dentro de uma unidade geogrfica de anlise de maior tamanho. Quando adotamos o setor censitrio como unidade de anlise, estamos tentando melhor apreender essa heterogeneidade, identificando os subgrupos populacionais submetidos a um maior risco de adoecer, embora pagando o preo da instabilidade de taxas calculadas para pequenas reas. Essa uma questo central quando estamos diante da deciso sobre que escala adotar.

80

3.4 - Tcnicas de Anlise de Dados Pontuais Aplicadas a reas FIGURA 3.21 Mapa de Kernel de incidncia por bairros (A) versus incidncia por setor (B). A B

Deve-se ainda salientar mais uma vez que a abordagem aqui apresentada pode resultar em anlises enviesadas, dado que atribumos ao centride geogrfico do polgono todas as ocorrncias de interesse. O centro geogrfico da rea nem sempre coincide com o centride populacional, ponto este ao qual estaria mais correto atribuirmos as ocorrncias. Em face dessa questo, a adoo do setor censitrio como unidade de anlise tem a vantagem de introduzir vieses menores, em grande parte de nossas reas urbanas, visto que as diferenas de localizao entre esses dois centrides so minimizadas devido ao menor tamanho geogrfico dos setores.

81

EXERCCIO 1: Vigilncia e ateno sade de gestantes HIV positivas:


construo de indicadores com operaes entre camadas. Autores: Lisiane M. W. Acosta, Maria Regina V. Brito, Eugnio P. Lisboa, Rui Flores e Christovam Barcellos

EXERCCIO 2: Distribuio dos acidentes de trnsito em Belo Horizonte, MG.


Autora: Maria Cristina Mattos

EXERCCIO 3: Anlise espacial da distribuio de casos de malria no Estado de


Mato Grosso em 2000 e 2003. Autores: Marina Atanaka dos Santos e Reinaldo Souza-Santos

Anexos: EXERCCIOS

Exerccio 1: Vigilncia e ateno sade de gestantes HIV positivas: construo de indicadores com operaes entre camadas.
pg. 85

Exerccio 2: Distribuio dos acidentes de trnsito em Belo Horizonte, MG.


pg. 97

Exerccio 3: Anlise espacial da distribuio de casos de malria no Estado de Mato Grosso em 2000 e 2003.
pg. 105

84

Exerccio 1 : Vigilncia e ateno sade de gestantes HIV positivas: construo de indicadores com operaes entre camadas

I - Introduo A possibilidade concreta dos servios de sade atuarem na preveno da transmisso vertical do vrus HIV um dos mais importantes avanos no controle da epidemia da Aids. O grande marco para essas aes foi o estudo desenvolvido pelo AIDS Clinical Trial Group (ACTG-076) que, em 1994, comprovou as estratgias que decrescem a transmisso vertical chegando a nveis de 1 a 2 % enquanto que, sem qualquer interveno, seriam de 25 a 30 %. No Brasil, esses conhecimentos j foram incorporados s polticas pblicas. O Programa Nacional de DST/AIDS do Ministrio da Sade (MS) priorizou o controle da transmisso vertical incidindo na rede de sade por meio de capacitaes, fornecimento de insumos e estabelecendo o agravo gestante HIV e criana exposta como de notificao compulsria em todo o territrio nacional no ano de 2000. Esse esforo de minimizar a transmisso vertical do HIV pressupe a articulao entre aes de ateno bsica sade e a vigilncia da sade com base no princpio de territorializao, em reas de responsabilidade dos servios de sade. A territorializao dos servios de sade uma premissa bsica do Sistema nico de Sade (SUS). Os territrios das reas de atuao das unidades bsicas de sade (UBS), como agregados espaciais, podem ser avaliados atravs de indicadores sociodemogrficos, epidemiolgicos, de recursos, de cobertura, e outros que contribuem para anlise de situao de sade e permitem o monitoramento e avaliao de aes de sade. O Brasil possui vrios sistemas de informao e se destaca internacionalmente pela transparncia dos mesmos, em especial pelos dados do DATASUS, que disponibiliza vrias informaes em sade. Entre todos os sistemas de informao, sero utilizados para este exerccio os que auxiliam para anlise espacial da incidncia de nascidos vivos expostos ao vrus HIV pela gestao/parto e associao com indicadores de assistncia sade e caractersticas populacionais. Utilizando-se os dados do censo por setores censitrios do municpio, que compem os territrios das unidades de sade, fornecidos pelo Instituto Brasileiro de Geogrfica e Estatstica (IBGE), tem-se os dados populacionais.

85

ANEXOS - Exerccios

O Sistema Nacional de Nascidos Vivos (SINASC) tem condies de informar o nmero de nascidos vivos, alm de outras variveis como: escolaridade da me, tipo de parto, realizao ou no de pr-natal, peso no nascimento e outros. O Sistema de Informao dos Agravos de Notificao (SINAN) possui os dados de morbidade de agravos de notificao que podem ser georreferenciados pelos endereos de residncia para obterem-se os casos por unidades de sade. No caso de vigilncia epidemiolgica de gestantes HIV positivas e crianas expostas, tem-se escolaridade materna, perodo de deteco do HIV na me, realizao de pr-natal, nmero de consultas realizadas, uso de anti-retrovirais na gestao, parto da criana, aleitamento materno, acompanhamento da criana e se a mesma se tornou infectada pelo HIV ou no. II - Exerccio Considerando que o objetivo da vigilncia epidemiolgica no somente a coleta de dados, mas tambm a sua anlise e a avaliao das polticas assistenciais e criao de novas estratgias de ao, vamos neste exerccio determinar: a) A incidncia de gestantes HIV positivas e crianas expostas das reas de atuao dos servios de ateno bsica sade. b) Alguns indicadores sociodemogrficos e de ateno sade nessas reas. c) A correlao entre incidncia de HIV com indicadores sociodemogrficos e de ateno sade. Sero utilizados neste exerccio os seguintes dados: NOME DOS ARQUIVOS
Area_US_region

DADO GRFICO

ATRIBUTOS

FONTE DE INFORMAO

rea de atuao das unidades bsicas de sade (UBS) (polgonos) Local de residncia de gestantes HIV positivas (ponto) Local de residncia dos nascidos (ponto)

Cdigo da rea

Secretaria Municipal de Sade

Gest_HIV_point

Nmero de registro

SINAN (SUS)

Nascidos_point

Nmero da DN, local de nascimento e nmero de consultas pr-natal Cdigo do setor, tipo de setor, populao total e nmero de domiclios

SINASC (SUS)

SC_2000_region

Setor censitrio de 2000 (polgonos)

Censo Demogrfico (IBGE)

Observao: Para que as pessoas e as reas no sejam identificadas, foram excludos dos bancos de dados todos os campos de identificao. Tambm foram alterados o sistema de projeo e a localizao exata dos pontos que pudessem ser usados para localizar pessoas e servios. Manter o sigilo das informaes deve ser uma preocupao de todos os que trabalham com bancos de dados de sade.

86

Exerccio 1: Vigilncia e ateno sade de gestantes HIV positivas: construo de indicadores com operaes entre camadas

A visualizao e anlise do banco de dados deve ser feita utilizando-se o aplicativo geogrfico TerraView. Portanto, necessrio instalar a verso mais recente desse aplicativo. A aquisio do arquivo de instalao, do manual e do tutorial do TerraView pode ser feita na pgina (www.dpi.inpe.br/terraview) da Diviso de Processamento de Imagens do Instituto Nacional de Pesquisas Espaciais DPI/INPE. O exerccio tem os seguintes passos: 1. Inicialmente, necessrio executar (abrir) o aplicativo TerraView. Esse procedimento pode ser feito clicando em Iniciar > Programas > TerraView3x > TerraView3x ou atravs do cone de atalho TerraView 3x, na rea de trabalho. 2. Em seguida, a tela inicial do TerraView ser apresentada. Crie um novo banco de dados, clicando no cone dados (por exemplo, HIV_US). 3. Abrindo as camadas de dados: No Menu Arquivo > Importar Dados: a) em Arquivo, localize e selecione os arquivos de mapas (Area_US_region; Gest_HIV_point, Nascidos_point e SC_2000_region); b) para selecionar a chave de ligao do mapa com os dados, clique Selecionar Coluna e selecione a coluna adequada; c) clique OK para concluir a importao. Repita essa operao para cada arquivo de mapa. 4. Cada camada (ou tema) ser disposta em uma vista. Coloque cada camada (ou tema) na mesma vista clicando e arrastando os temas para cima. Escolha os melhores padres de visualizao para cada camada (ou tema). Isso deve ser feito clicando com o boto direito do mouse em Visual-Default. Como sugesto, deixe a camada de reas de atuao (Area_US_region) em cima de setores censitrios (SC_2000_region) e ligeiramente transparente. Coloque as camadas de pontos (Gest_HIV_point e Nascidos_ point) em cima das de polgonos com padres diferentes para que se visualize os dois tipos de eventos (notificao de gestante HIV positiva e nascido vivo). 5. Na barra de ferramentas, pressione o boto Desenhar . O resultado mostrado na figura 1.1 ao lado.
FIGURA 1.1 Visualizao dos dados de interesse para anlise da transmisso vertical de HIV (rea de atuao das unidades bsicas de sade, local de residncia de gestantes HIV positivas, local de residncia dos nascidos vivos, setor censitrio de 2000).

. Opte por criar (em vez de conectar),

escolha um diretrio (sugerimos c:\curso\exerc1) e um nome para o banco de

87

ANEXOS - Exerccios

Observe a superposio entre estas camadas. Existem grandes reas com pequenas quantidades de pontos de nascimentos, provavelmente indicando que uma rea de baixa densidade demogrfica. Os limites dos setores censitrios no coincidem com os limites de reas de atuao. Que outros padres voc consegue identificar atravs desse mapa? Para anlise, foram selecionados os seguintes indicadores: Proporo de setores de favelas: razo entre o nmero de setores censitrios caracterizados como sub-normais durante o censo de 2000 e o nmero total de setores censitrios das reas das UBS. Prevalncia de HIV em Nascidos Vivos: razo entre o nmero de nascidos vivos expostos ao HIV pela gestao e parto (dados do SINAN) e o nmero de nascidos vivos (dados do SINASC) nas reas das UBS. Taxa bruta de natalidade: razo entre o nmero de nascidos vivos (SINASC) e a populao total nas reas das UBS (Censo demogrfico). Proporo de nascidos vivos sem pr-natal: razo entre o nmero de nascidos vivos sem nenhuma consulta de pr-natal e o total de nascidos vivos nas reas das UBS (SINASC). O grande desafio que temos para calcular esses indicadores que eles se referem a unidades espaciais dispares, isto , no coincidentes. Devemos transferir os dados de uma camada para outra, no nosso caso os polgonos de reas de abrangncia. Para obter esses indicadores, ser necessrio calcular: O nmero de setores censitrios do tipo sub-normal (tipo 1 segundo os dados do censo) existentes na rea de abrangncia da unidade de sade; O nmero total de setores censitrios existentes na rea de abrangncia da unidade de sade; A populao total dos setores censitrios contidos na rea de abrangncia da unidade de sade; O nmero total de nascidos vivos ocorridos na rea de abrangncia da unidade de sade; O nmero total de gestantes HIV positivas existentes na rea de abrangncia da unidade de sade; O nmero de nascidos vivos sem exames pr-natal ocorridos na rea de abrangncia da unidade de sade. 6. Para identificar os setores censitrios do tipo sub-normal devemos realizar uma Consulta por Atributos. Clique com o boto direito do mouse no tema SC_2000_region.

88

Exerccio 1: Vigilncia e ateno sade de gestantes HIV positivas: construo de indicadores com operaes entre camadas FIGURA 1.2 Seleo de setores censitrios tipo 1 (sub-normal). Consulta por atributos.

7. Agora selecione o atributo Tipo e coloque como valor do atributo 1, ou escreva a expresso Tipo = 1. Clique em Nova consulta. Ficaro marcados os setores do tipo sub-normal tanto no mapa como na tabela. Observe que esto marcados 69 dos 431 setores.

FIGURA 1.3 Resultado da seleo de setores censitrios tipo 1.

89

ANEXOS - Exerccios

8. O prximo passo adicionar essa informao s reas de abrangncia de unidades de sade. Para isso faremos uma operao geogrfica chamada de atribuir dado por localizao (coletar dados). Clique com o boto direito do mouse sobre a vista, que contm os temas Area_US_region e SC_2000_region.
FIGURA 1.4 Contagem de setores censitrios, total e tipo 1 e soma das populaes. Atribuir dados por localizao.

9. Selecione como tema para atribuir dados para Area_US_region e tema para atribuir dados de SC_2000_region, isto , os setores censitrios. Como atributo de sada precisamos somente das variveis SC_2000_region.SETOR: COUNT, isto , o nmero total de setores censitrios (de todos os tipos), a varivel SC_2000_region.TIPO: SUM, isto , a soma dos setores censitrios do tipo 1 (os setores censitrios do tipo 0 no sero contados) e a varivel SC_2000_region.POP_T: SUM, isto , a soma da populao total dos setores censitrios. Selecionamos a relao espacial intercepta, quer dizer, usando todos os setores que esto totalmente ou parcialmente contidos dentro dos limites das reas de abrangncia. O programa adiciona trs novas colunas com o valor da quantidade de setores censitrios total e do tipo 1, e a populao total nos polgonos de rea de abrangncia da unidade de sade. 10. Para facilitar o trabalho de operaes entre variveis, podemos mudar o nome das novas variveis. Isso pode ser feito clicando-se com o boto direito do mouse sobre a coluna. Clique na opo modificar nome da coluna.

90

Exerccio 1: Vigilncia e ateno sade de gestantes HIV positivas: construo de indicadores com operaes entre camadas

Mude os nomes das variveis para: NOME GERADO PELO PROGRAMA


SC_2000_region.SETOR: COUNT SC_2000_region.TIPO: SUM SC_2000_region.POP_T: SUM

NOVO NOME
N_setores Setores_favela Pop2000

11. Agora podemos repetir esse procedimento para coletar dados do tema Nascidos_Point. O prximo passo adicionar essa informao s reas de abrangncia de unidades de sade. Para isso repetimos a operao geogrfica de atribuir dado por localizao (coletar dados). Selecione como tema para atribuir dados para Area_US_region e tema para atribuir dados de Nascidos_Point, isto , os nascidos vivos. Como atributo de sada selecione a varivel Nascidos_Point.NUMERODN: COUNT, isto , o nmero total de nascidos. Selecionamos a relao espacial dentro, a nica possibilidade de relao, j que se trata de uma coleo de pontos dentro de um conjunto de polgonos.

FIGURA 1.5 Contagem de nascidos vivos em reas de abrangncia. Atribuir dados por localizao.

O programa adiciona uma nova coluna com o valor da quantidade de nascidos vivos nos polgonos de rea de abrangncia da unidade de sade. Mude o nome dessa nova varivel para N_Nascidos.

91

ANEXOS - Exerccios

12. Para se obter o nmero de nascidos vivos sem exames pr-natal devemos selecionar o conjunto de nascidos com atributo consultas categoria 1. Para isso, devemos realizar uma Consulta por Atributos e clicar com o boto direito do mouse no tema Nascidos_Point. Agora selecione o atributo Consultas e coloque como valor do atributo 1, ou escreva a expresso Consultas = 1. Clique em Filtrar. Ficaro marcados os nascidos sem pr-natal tanto no mapa quanto na tabela. Dos 4.064

nascidos, 170 foram marcados. Esta uma seleo do conjunto de nascidos que deve ser salva como um novo tema (ou camada). Para isso, clique no tema Nascidos_Point com o boto direito do mouse e selecione criar tema a partir de tema. Aparecer a janela seguinte em que voc deve dar um nome para esse novo tema (sem_prenatal, por exemplo) e selecionar somente os objetos consultados.

FIGURA 1.6 Criao de um novo tema por consulta. Seleo de nascidos vivos sem pr-natal.

Novamente faremos a operao geogrfica de atribuir dado por localizao (coletar dados). Selecione como tema para atribuir dados para Area_US_region e tema para atribuir dados de Sem_prenatal, isto , os nascidos vivos sem consultas pr-natal. Como atributo de sada selecione a varivel Nascidos_ Point.NUMERODN: COUNT.

92

Exerccio 1: Vigilncia e ateno sade de gestantes HIV positivas: construo de indicadores com operaes entre camadas FIGURA 1.7 Contagem de nascidos vivos sem pr-natal nas reas de abrangncia.

O programa adiciona mais uma coluna com o valor da quantidade de nascidos que no tiveram exames de pr-natal presentes nos polgonos de rea de abrangncia da unidade de sade. Mude o nome dessa nova varivel para N_Nascidos_ sempnatal. 13. A ltima varivel necessria para construir os indicadores o nmero de gestantes HIV positivas existentes na rea de abrangncia da unidade de sade. Para isso, fazemos a operao geogrfica de atribuir dado por localizao (coletar dados). Selecione como tema para atribuir dados para Area_US_region e tema para atribuir dados de Gest_HIV_ point. Como atributo de sada selecione a varivel Gest_HIV_ point.REGISTRO: COUNT. O programa adiciona mais uma coluna com o valor da quantidade de gestantes HIV positivas nos polgonos de rea de abrangncia da unidade de sade. Mude o nome dessa nova varivel para N_gest_HIVpos.
FIGURA 1.8 Contagem de gestantes HIV-positivas nas reas de abrangncia. Atribuir dados por localizao.

93

ANEXOS - Exerccios

Agora temos todos os dados que precisamos para calcular os indicadores. Recordando: INDICADOR
Proporo de setores de favelas

COMPONENTES
Nmero de setores censitrios sub-normais / nmero total de setores censitrios. Nmero de gestantes HIV positivas / Nmero de nascidos vivos. Nmero de nascidos vivos / Populao total. Nmero de nascidos vivos sem pr-natal / Total de nascidos vivos.

CLCULO
Setores_favela *100 / N_setores

Prevalncia de HIV em Nascidos Vivos:

N_gest_HIVpos *100 / N_Nascidos

Taxa bruta de natalidade Proporo de nascidos vivos sem pr-natal

N_Nascidos *100 / Pop2000 N_Nascidos_sempnatal *100 / N_Nascidos

Esses clculos so realizados criando-se nova coluna na tabela rea_US_region. Na tabela, clique com o boto direito do mouse em adicionar coluna e d um nome para a coluna do indicador proporo de favelas (por exemplo, prop_favela).
FIGURA 1.9 Criao de novas colunas para clculo de indicadores. Adicionar coluna.

14. Sobre essa coluna nova clique com o boto direito do mouse em alterar dados da coluna e escreva (com ajuda dos botes disponveis na janela) a expresso Setores_favela / N_setores. Faa a mesma operao para calcular os demais indicadores (adicione colunas e altere os dados dessa coluna).

94

Exerccio 1: Vigilncia e ateno sade de gestantes HIV positivas: construo de indicadores com operaes entre camadas FIGURA 1.10 Clculo de indicadores usando operaes entre duas colunas existentes na tabela.

15. A primeira fase de anlise desse conjunto de indicadores deve ser a visualizao, isto , criar mapas temticos que permitam analisar a distribuio desses indicadores. Sobre o tema Area_US_region clique em editar legenda.
FIGURA 1.11 Criao de mapas temticos para visualizao de indicadores. Edio de legenda.

Obtemos o seguinte mapa:

95

ANEXOS - Exerccios FIGURA 1.12 Criao de mapas temticos para visualizao de indicadores. Edio de legenda.

Explore visualmente os indicadores obtidos e identifique reas que devem ser priorizadas para aes de ateno e preveno sade. Para anlise da associao estatstica entre os indicadores pode ser utilizada a correlao no-paramtrica e calculado o coeficiente de Spearman para avaliar a associao entre pares de variveis. Num programa de estatstica, pode ser usado um modelo de regresso mltipla que relacione a prevalncia de HIV em gestantes como varivel dependente, com os demais indicadores como variveis independentes. Isso pode ajudar a explicar que determinantes esto atuando sobre os riscos de transmisso vertical do HIV. O aspecto mais importante deste exerccio, no entanto, a possibilidade completamente nova de se criar indicadores atravs de operaes entre camadas em um ambiente de SIG. Esse tipo de clculo impossvel de ser obtido por meio de bancos de dados convencionais.

96

Exerccio 2 : Distribuio dos acidentes de trnsito em Belo Horizonte, MG.

I - Introduo Os acidentes de trnsito so atualmente um dos agravos de maior impacto na sade da populao brasileira, tanto pelos bitos quanto pelas internaes e seqelas deixadas em suas vtimas. Ocupam a segunda posio entre as causas externas de mortalidade no pas. As anlises dos acidentes de trnsito devem servir para orientar medidas de preveno e controle desses agravos. Para o municpio, a localizao pontual de diferentes eventos relacionados a este tema (acidentes, pontos de apoio para as unidades mveis de atendimento pr-hospitalar, servios de urgncia etc.) constitui-se num valioso material para avaliao e planejamento de aes preventivas tanto para o servio de sade quanto para os rgos de trnsito. Pode orientar medidas de controle do trfego, indicar falha na sinalizao de vias ou apontar melhores locais para os pontos de apoio das ambulncias. Uma fonte de informao para este propsito o registro dos atendimentos aos acidentados pelo Servio de Atendimento Mvel de Urgncia (SAMU), que tem o objetivo de reduzir o nmero de bitos, o tempo de internao em hospitais e as seqelas decorrentes da falta de socorro precoce. II Exerccio Neste exerccio, vamos analisar o padro de distribuio dos acidentes de trnsito em Belo Horizonte, buscando identificar reas crticas, ou seja, reas de maior intensidade deste tipo de acidentes. Conjunto de dados: Atendimentos a acidentados no trnsito (atendimentos.*) Estes dados representam parte dos atendimentos pr-hospitalares aos acidentados no trnsito, realizado pelo Servio de Atendimento Mvel de Urgncia (SAMU) da Secretaria Municipal de Sade de Belo Horizonte, ocorridos no perodo de janeiro a abril de 2006. Correspondem aos registros de atendimentos que levaram liberao de uma unidade de atendimento mvel. So registros de pacientes atendidos, deste modo, vrios atendimentos podem corresponder a um mesmo acidente.

97

ANEXOS - Exerccios

Em Belo Horizonte, os atendimentos do SAMU so georreferenciados ao endereo do local do atendimento. Quando os chamados so referentes a ocorrncias em via pblica, como caso dos acidentes de trnsito, estes so referenciados ao endereo em frente ou mais prximo ao local do evento. Os atendimentos para os quais no foi possvel fazer o georreferenciamento foram suprimidos deste exemplo. Tipo de dado: pontos Acidentes de trnsito (acidentes.*) Correspondem aos acidentes referentes aos atendimentos acima. uma consolidao daqueles dados, contendo o nmero de vtimas atendidas em cada ocorrncia. Seguem os mesmos critrios quanto ao seu georreferenciamento. Tipo de dado: pontos Pontos de apoio (ambulancias.*) Correspondem aos pontos de apoio das ambulncias do SAMU, representadas pelas 15 Unidades de Suporte Bsico (USB) e 03 Unidades de Suporte Avanado (USA). Tipo de dado: pontos Portas de entrada para atendimento s urgncias (unid_urgencia.*) Representam as 11 principais portas de entrada da urgncia do SUS-BH, tanto para traumas quanto para urgncias clnicas. Tipo de dado: pontos Limite municipal (belohorizonte.*) Representa o limite do Municpio de Belo Horizonte. Tipo de dado: polgono Principais vias de trnsito (ppvias.*) Correspondem s vias que promovem a ligao entre diferentes bairros ou setores da cidade, onde a intensidade de veculos e a velocidade no trnsito so maiores. Tipo de dado: linha. Sobre os dados: 1) Estes dados se destinam a ilustrar os exerccios do Programa de Capacitao e Atualizao em Abordagens do Espao em Anlises de Sade Pblica. So dados parciais, sujeitos a alterao. 2) Foram utilizados dados do Sistema de Informaes Geogrficas, gerenciado pela Empresa de Informtica e Informao de Belo Horizonte (Prodabel). O georreferenciamento dos dados pontuais do foi feito por meio da camada de endereos. 3) Todos os temas camadas esto suprimidos em sete milhes de unidades no eixo das coordenadas Y.

98

Exerccio 2: Distribuio dos acidentes de trnsito em Belo Horizonte, MG.

O Banco de Dados no TerraView (TransitoBH.mdb) foi formado pelas camadas importadas a partir dos arquivos shape. Problema: Identificar locais de maior densidade de acidentes de trnsito no municpio a partir do registro de atendimentos do SAMU. A identificao de locais onde haja uma aglomerao de acidentes pode ajudar na identificao de locais crticos, propiciando o direcionamento das medidas de controle de trnsito (sinalizao, radares etc.) e orientando a locao de equipamentos mveis para atendimento aos acidentados. Em primeiro lugar, deveremos conhecer os dados, avaliar sua completitude, cobertura e qualidade tanto dos dados tabulares quanto dos dados geogrficos. Dependendo da maneira de obteno das coordenadas dos dados pontuais, podem ocorrer falhas durante o processamento. Dados obtidos por GPS podem conter perdas devido a falhas na recepo de sinal dos satlites, no captando as coordenadas. Quando os dados so georreferenciados a uma base geogrfica especfica, como o caso de nosso exemplo para os atendimentos pelo SAMU, alguns endereos podem no ser encontrados, caso a base esteja incompleta. Essas perdas devero ser criticadas, pois podem estar concentradas em alguma regio ou em um determinado tipo de acidente. 1. Abra o banco de dados TransitoBH.mdb, conhea os planos de informao. Verifique seus atributos.

99

ANEXOS - Exerccios

Os acidentes podem ser mapeados e mapas temticos podem ser elaborados segundo caracterstica da vtima ou do acidente. Nota-se a concentrao de acidentes em algumas reas, especialmente na parte central do municpio. Podemos verificar alguns pontos enfileirados, que esto localizados ao longo de algumas vias. Entretanto, deve-se ter cautela na interpretao desses mapas de pontos. Alguns acidentes que ocorram num mesmo local, por exemplo, em um cruzamento perigoso, podem registrar as mesmas coordenadas. Da, um local com 10 eventos pode ser representado da mesma forma que um outro local onde haja apenas uma ocorrncia. A simples visualizao de pontos subjetiva e pode no detectar padres da distribuio dos eventos.

Vamos agora construir um mapa de Kernel para estimar a intensidade dos acidentes de trnsito. 2. Ative o tema atendimentos na vista Transito. 3. V ao menu Anlise > Mapa de Kernel para escolher os parmetros a serem utilizados. a) Regio de Suporte: escolha Grade sobre a regio b) Opo de Grade: escolha 50 colunas e Tema belohorizonte c) Em Resultados: nomeie o plano (por exemplo k_atendimentos) d) Em Conjunto de Dados marque o tipo de evento (ponto) e o tema a ser analisado (atendimentos). No selecione a opo Com Atributo. e) Em Algoritmo selecione a Funo qurtica e Clculo da densidade. Selecione a opo Adaptativo. 4. Execute.

100

Exerccio 2: Distribuio dos acidentes de trnsito em Belo Horizonte, MG.

Ser gerado um novo plano k_atendimentos. Obseve as reas de maior concentrao. A regio central da cidade apresenta a rea de maior intensidade quando consideramos os diversos tipos de acidentes (Figura 2.1).
FIGURA 2.1 Superfcie de densidade dos diversos tipos de acidentes.

Parmetros do Kernel Tema de Eventos: atendimentos Raio adaptativo Clculo: Densidade Funo: Qurtico Valores de Kernel -0.000000000000001 0.000002484762000 0.000004969524000 0.000007454286000 0.000009939048000 0.000012423810000 0.000014908572000 0.000017393334000 0.000019878096000 0.000022362858000 ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ 0.000002484762000 0.000004969524000 0.000007454286000 0.000009939048000 0.000012423810000 0.000014908572000 0.000017393334000 0.000019878096000 0.000022362858000 0.000024847620001

101

ANEXOS - Exerccios

Agora, vamos trabalhar apenas os acidentes com bicicleta. Para isso vamos adicionar um novo tema a partir da seleo: TIPOACID = ACIDENTE DE BICICLETA 5. Adicione um novo tema acidentes, entretanto desmarque a opo Selecionar Todos os Objetos. Isso lhe permitir fazer a seleo acima. 6. Nomeie este novo tema como ac_bicicleta, adicionando-o vista Transito.

Agora voc pode fazer um mapa de Kernel, apenas para esse tipo de acidente. 7. Repita os procedimentos do item 3 para os acidentes de bicicleta. Observe as reas de maior concentrao desse tipo de acidente (Figura 2.2).

FIGURA 2.2 Superfcie de densidade de acidentes de bicicleta.

Parmetros do Kernel Tema de Eventos: ac_bicicleta Raio adaptativo Clculo: Densidade Funo: Qurtico Valores de Kernel 0.000000006076408 0.000000178490868 0.000000350905327 0.000000523319786 0.000000695734245 0.000000868148704 0.000001040563164 0.000001212977623 0.000001385392082 0.000001557806541 ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ 0.000000178490868 0.000000350905327 0.000000523319786 0.000000695734245 0.000000868148704 0.000001040563164 0.000001212977623 0.000001385392082 0.000001557806541 0.000001730221001

102

Exerccio 2: Distribuio dos acidentes de trnsito em Belo Horizonte, MG.

A escolha do mtodo e dos parmetros da anlise deve ser feita de acordo com os objetivos propostos. A deteco mais detalhada dos acidentes pode ser de grande valor para os rgos gestores do trnsito e para os servios de sade do municpio. Experimente novas anlises variando o nmero de colunas (clulas). Por exemplo: 100 colunas. Quanto maior o nmero de colunas, maior a resoluo do mapa gerado. Varie tambm o raio. Para isso, desmarque a opo Adaptativo nos parmetros do mapa de Kernel e atribua diferentes valores para o raio. Quanto maior o raio, mais suavizada ser a superfcie estimada. Experimente utilizar um raio de 1.000 metros. Pode-se ainda ponderar a estimativa utilizando atributos, como o nmero de vtimas, um escore de gravidade, ou o tempo decorrido at a chegada do socorro. A sobreposio de outros temas ajuda a caracterizar os locais de maior intensidade, como por exemplo: as vias de trfego intenso, a localizao das ambulncias do SAMU e as portas de entrada para trauma. Experimente sobrepor os pontos de apoio das ambulncias sobre um mapa de Kernel dos acidentes (Figura 2.3).
FIGURA 2.3 Superfcie de densidade dos diversos tipos de acidentes e pontos de apoio das ambulncias.

103

ANEXOS - Exerccios

Consideraes: Nos exemplos aqui demonstrados, realizamos alguns procedimentos exploratrios, buscando evidenciar reas crticas quanto ocorrncia de acidentes de trnsito, que podem subsidiar propostas para a melhoria da segurana no trnsito. No devemos, entretanto, desconsiderar que o SAMU atende outros tipos de traumas e urgncias clnicas, e todo este conjunto que determina o planejamento deste servio.

104

Exerccio 3 : Anlise espacial da distribuio de casos de malria no Estado de Mato Grosso em 2000 e 2003.

I - Introduo No contexto malrico e das propostas de organizao dos servios de sade descentralizados, especialmente no Setor de Vigilncia em Sade, a identificao das reas geogrficas e grupos populacionais que esto expostos ao maior risco de malria constitui-se em etapa importante para a elaborao de programas de controle, monitoramento e de avaliao em nveis local, regional e nacional. Os mtodos de anlise espaciais so particularmente teis para a criao ou delimitao de reas homogneas, definio de critrios de monitoramento e avaliao para uma determinada interveno, estabelecimento de prioridades para planejamento e alocao de recursos (Cruz, 1996). Considerando o processo de descentralizao, a unidade de anlise importante a escala do municipal. No entanto, a ocorrncia da doena muitas vezes no se restringe aos limites definidos poltico-administrativamente. Dessa forma, questes como a existncia de padro de distribuio da malria considerando o municpio e os municpios vizinhos, e a relao entre a ocorrncia da malria no municpio e aqueles circunvizinhos passam a assumir relevncia na identificao de reas homogneas para definio de estratgias de interveno.

II Exerccio Neste exerccio faremos a anlise espacial dos casos de malria notificados pelos municpios do Estado de Mato Grosso, durante o ano de 2000 e 2003. O objetivo do mesmo apresentar tcnicas e respectivos procedimentos para o desenvolvimento da anlise dos dados espaciais e visualizao de reas em mapas. Com isso, espera-se apresentar uma metodologia que auxilie no encontro de reas homogneas para auxiliar os gestores na definio de reas prioritrias para aplicao de recursos e planejamento de intervenes, de acordo com as caractersticas especficas de cada rea.

105

ANEXOS - Exerccios

Para a realizao deste exerccio, os seguintes dados foram utilizados, direta ou indiretamente: Malha de municpios de Mato Grosso limites (polgonos) dos municpios, de ano 1997 e 2001. Formato: vetorial (extenses: .shp, .dbf e .shx). Fonte: Instituto Brasileiro de Geografia e Estatstica IBGE. Outro formato (.bna) disponibilizado pelo DATASUS. Esclarecemos que as duas malhas so necessrias devido criao de novos municpios, especialmente em 2000. Dessa maneira, para a anlise da IPA (Incidncia Parasitria Anual) de 2000 ser utilizada a malha digital de 1997, e para a IPA de 2003, a malha de 2001. Populao de 2000 populao residente nos municpios do estado. Formato: tabular (extenso: .xls). Fonte: Instituto Brasileiro de Geografia e Estatstica IBGE. Censo Demogrfico 2000. Populao em 2003 estimativa da populao residente nos municpios de Mato Grosso, em 2003. Formato: tabular (extenso: .xls). Fonte: Instituto Brasileiro de Geografia e Estatstica IBGE. Estimativa Populacional Municipal de 2002. Incidncia Parasitria Anual (IPA) calculada com base nas lminas positivas notificadas pelos municpios para os anos de 2000 e 2003, dividida pela respectiva populao e multiplicado por mil. Formato: tabular (extenso .xls). Fonte: lminas positivas por municpios de 2000, dados obtidos na Secretaria do Estado de Mato Grosso, armazenados no Sistema de Informaes de Malria (SISMAL); os de 2003 foram obtidos no Sistema de Informaes de Vigilncia Epidemiolgica Malria (SIVEP-Malria), da Secretaria de Vigilncia em Sade do Ministrio da Sade. Neste exerccio, as IPA de 2000 e 2003 j esto calculadas, dispostas em planilha (extenso: ...xls e ... csv).

Banco de dados: Os dados adquiridos foram importados e organizados em um banco do tipo Access criado pelo aplicativo TerraView. Para facilitar a conduo do exerccio, disponibilizamos o banco de dados (IPA_MT00-03) e as informaes necessrias ao desenvolvimento das atividades, no stio www.geocapacita.cict.fiocruz.br. A visualizao e anlise do banco de dados deve ser feita por meio do aplicativo geogrfico TerraView, sendo, portanto, necessrio instalar a verso mais recente deste aplicativo. A aquisio do arquivo de instalao, do manual e do tutorial do TerraView pode ser feita (www.dpi.inpe.br/terraview) da Diviso de Processamento de Imagens do Instituto Nacional de Pesquisas Espaciais DPI/INPE.

106

Exerccio 3: Anlise espacial da distribuio de casos de malria no Estado de Mato Grosso em 2000 e 2003.

A - Abrindo o banco e visualizando os dados: 1. 2. 3. 4. 5. 6. 7. Inicialmente, executar (abrir) o aplicativo TerraView; Conectar o banco de dados na barra de ferramentas; Selecionar o banco de dados IPA_MT00-03.mdb; Visualiza-se o mapa e a tabela de atributos conforme apresentado na figura 3.1; Importar dados mapa2001.bna; Importar dados MT1997.bna; Na rvore Vista/tema selecionar tema mapa2001.bna, importar a tabela IPAMT03 (arquivo .csv; importante lembrar que o tipo de varivel deve ser alterado e confirmado quando necessrio); 8. 9. Criar tabela externa IPAMT03; Conectar tabela externa IPAMT03; IPAMT00 (arquivo .csv); 11. Criar tabela externa IPAMT00; 12. Conectar tabela externa IPAMT00.
FIGURA 3.1 Visualizao dos dados do banco IPA_MT00-03.mdb no TerraView.

10. Na rvore Vista/tema selecionar tema MT1997.bna, importar a tabela

A malha dos municpios do Estado de Mato Grosso ser apresentada na janela de visualizao de mapas e os dados tabulares, referentes ao tema mapa MT2001, sero mostrados na tabela de atributos. A descrio dos dados dessa tabela a seguinte: IBGE_CODE cdigo (IBGE) de identificao dos municpios; IBGE_NAME nome dos municpios;

107

ANEXOS - Exerccios

MUNIC - nome dos municpios da tabela externa conectada; CODMUN - cdigo (IBGE) de identificao dos municpios da tabela externa; IPA03 IPA (Incidncia Parasitria Anual) de 2003, na tabela externa; No tema MT1997, encontra-se a IPA, na tabela externa, do ano 2000 (IPA00). ANALISANDO OS DADOS A definio de vizinhana aqui adotada levou em conta os municpios que compartilham a mesma fronteira sendo, neste caso, considerados como vizinhos de primeira ordem. A primeira questo a ser verificada se a IPA observada em um municpio possui correlao com os valores das IPAs apresentadas pelos municpios vizinhos, considerando o estado. Para verificar essa correlao optou-se pelo clculo dos ndices de Moran Global e Local. B Calculando ndices de Moran Global e Local. Para se conhecer os ndices de Moran Global e Local das IPAs de 2000 e 2003, efetue os seguintes passos, apresentados na figura 3.2: 1. Na rvore de vistas/temas, selecione e habilite o tema MT1997; 2. Desloque o cursor de apontamento para Anlise na tela de visualizao aberta e clique. Selecione a opo Estatstica espacial; 3. Na janela da Estatstica Espacial, selecionar do tema o atributo IPA00; 4. Selecionar o ndice de Moran Global (caso tenha interesse em detectar indcios de correlao espacial da IPA dos municpios em relao aos seus vizinhos, considerando o estado como um todo); 5. Em ndice de Moran Global, selecionar o nvel de significncia, neste caso optou-se por 99; 6. Em ndice de Moran Local, selecionar o ndice de Moran Local (LISA); 7. Selecionar o nvel de significncia, 99 para o ndice de Moran Local; 8. Nomear o prefixo da coluna a ser gerada, como por exemplo IPA00; 9. Executar. Nesta operao o TerraView calcula a matriz de vizinhana (proximidade) automaticamente, levando em considerao os polgonos (municpios) contguos. Repetir a seqncia anterior selecionando o mapa2001.bna e o atributo IPA03. Nomear a coluna gerada como IPA03.

108

Exerccio 3: Anlise espacial da distribuio de casos de malria no Estado de Mato Grosso em 2000 e 2003. FIGURA 3.2 Etapas da execuo de clculos dos ndices de Moran, na anlise espacial, no TerraView. 2 3

4 5

6 1 7 8

O ndice de Moran Global da IPA obtido foi igual a 0,223582 (p-valor = 0,01) em 2000 e 0,184715 (p-valor = 0,02) em 2003. Neste exerccio, o valor de I encontrado foi maior que 0 (zero), o que indica evidncia de autocorrelao espacial positiva, isto , as reas tendem a ser similares entre si quanto varivel IPA. No entanto, por fornecer um nico valor, como medida de associao espacial para todo o conjunto de dados, necessrio decompor este ndice global de associao espacial e examinar padres numa escala de maior detalhe para evidenciar agrupamentos (leia-se municpios) de incidncia de malria semelhantes (clusters) e/ou discrepantes (outliers). Inicialmente, vamos realizar anlise visual no mapa temtico para verificar a existncia de padro espacial construdo a partir de estratificao de risco de transmisso. O Programa Nacional de Controle da Malria PNCM caracteriza as reas do pas de acordo com os seguintes estratos: reas de baixo risco de transmisso regies, estados ou municpios com taxa de incidncia de lmina positiva menor que 10 por 1.000 habitantes, no perodo de um ano; reas de mdio risco de transmisso regies, estados ou municpios com taxa de incidncia de lmina positiva maior ou igual a 10 e menor que 50 lminas positivas por 1.000 habitantes, no perodo de um ano;

109

ANEXOS - Exerccios

reas de alto risco de transmisso regies, estados ou municpios com taxa de incidncia maior ou igual a 50 lminas positivas por 1.000 habitantes, no perodo de um ano. C Estratificando para mapa temtico. Para a visualizao do mapa temtico recorrendo a estratificao anterior, utilizaremos Editar Legenda, conforme os passos a seguir, apresentados na figura 3.3: 1. Na rvore de vistas/temas, selecione e habilite o tema MT1997; 2. Pressione o boto direito do mouse e selecione Editar legenda; 3. Em Parmetro de Agrupamento: a) Selecionar o modo Passos Iguais; b) Selecionar o atributo IPAMT00.IPA00; c) Definir por 4 fatias e preciso 2; 4. Escolher 4 cores; 5. Aplicar. 6. Modificar os agrupamentos para: Na definio do primeiro intervalo, correspondente aos municpios sem notificao, utilizamos os seguintes valores: De = 0.00 e Para = 0.01. Fizemos isso porque o TerraView no considera o valor apresentado na janela para, mas sim o imediatamente anterior a este. Por isso, se for digitado 0.00 o programa no selecionar nenhum registro com valor 0.00. Faa um teste! a) De 0.00 para 0.01; b) De 0.01 para 10.00; c) De 10.00 para 50.00; d) De 50.00 para 160.00; 7. Executar; 8. Pode-se, clicando com o mouse esquerdo, renomear a legenda e/ou alterar o visual. Pode-se renomear a legenda conforme exemplo abaixo: a) Sem notificao; b) Baixo Risco; c) Mdio Risco; d) Alto Risco; 9. Salvar tela de visualizao em arquivo .bmp.
FIGURA 3.3 Mapa temtico segundo distribuio de IPA por municpios, Mato Grosso.
Aripuan Nova Ubirat

IPA Brasnorte Alto Risco Mdio Risco Baixo Risco Sem notificao

IPA por municpios, 2000.

IPA por municpios, 2003.

110

Exerccio 3: Anlise espacial da distribuio de casos de malria no Estado de Mato Grosso em 2000 e 2003.

Observa-se na figura 3.3, que a ocorrncia da malria est dispersa, porm os municpios com maior nmero de notificaes esto localizados na regio norte do estado. Na regio sul, h municpios que no apresentam casos nos dois anos estudados. O que chama ateno o Municpio de Nova Ubirat, que em 2000 no notificou nenhum caso e em 2003 passa a figurar como municpio de alto risco de transmisso. Desempenho contrrio observado em Brasnorte, que passa de alto risco para nenhuma notificao. A distribuio de casos por estratos de risco nos indica em 2000 a existncia de 9 municpios classificados como de mdio risco e 3 municpios de alto risco. Essa configurao modificada em 2003, com a existncia de 8 municpios de mdio risco e 1 de alto risco. O Municpio de Aripuan foi desmembrado em Municpios de Colniza, Rondolndia e Aripuan. Esta rea aparentemente manteve o quadro de mdio risco, exceto Rondolndia. Essa descrio ilustra a mobilidade existente na demarcao dos contornos territoriais definidos poltico-administrativamente. E, no nosso caso, a adoo de municpios como unidade de anlise requer precauo principalmente quando se busca acompanhar/monitorar o comportamento e a dinmica da endmica ao longo do tempo. O mapa temtico j nos indica que a distribuio espacial da malria no estado no ocorre de forma homognea. A heterogeneidade observada visualmente reafirma a necessidade de aprofundar a anlise em maior escala. Assim, aps a localizao e classificao dos municpios do estado por estratos de risco, questiona-se: Ser que os casos de malria, apresentados pelos municpios, tm relao com os casos de malria dos vizinhos? Ou vice-versa? Para responder a essa questo escolhemos o ndice de Moran Local, mais especificamente o Box Map, como recurso para a identificao/localizao de reas homogneas constitudas por municpios com associao espacial. Esse construdo com base nos valores normalizados (valores dos atributos IPA subtrados de sua mdia e divididos pelo desvio-padro), no qual o atributo foi classificado conforme sua posio em relao aos quadrantes do Diagrama de Espalhamento de Moran, recebendo uma cor correspondente quando gerado o mapa (Cmara, Carvalho, Cruz & Correa, 2004). Dessa forma, classificamos os municpios de acordo com sua localizao nos quadrantes do Diagrama de Espalhamento de Moran, em reas de agrupamentos de municpios homogneos, consideradas como: quadrante 1 (+ / +) e quadrante 2 ( / ) para reas de associao espacial positiva, e quadrante 3 (+ / ) ou quadrante 4 ( / +) para reas de associao espacial negativa. O quadrante 1 (+ / +) indica que h presena de municpio com valor positivo da IPA normalizada e possui a mdia dos valores normalizados dos municpios vizinhos tambm positiva, isto , ambos os valores so positivos; o quadrante

111

ANEXOS - Exerccios

2 ( / ) localiza os municpios com valor negativo da IPA normalizada e possui a mdia dos valores normalizados dos municpios vizinhos tambm negativos, isto , ambos os valores so negativos. Dessa forma, os quadrantes 1 e 2 (Q1 e Q2) indicam reas de associao espacial positivas, levando-se em conta que o municpio possui vizinhos com valores semelhantes (Cmara, Carvalho, Cruz & Correa, 2004). O quadrante 3 (+ / ) indica municpio com valor positivo da IPA normalizada e possui a mdia dos valores normalizados dos municpios vizinhos negativos e; quadrante 4 ( / +) distribui os municpios com valor negativo da IPA normalizada e possui a mdia dos valores normalizados dos municpios vizinhos com valor positivo. Tanto o quadrante 3 (Q3) como o 4 (Q4) no acompanham a tendncia global e indicam reas de associao espacial negativas, considerando que numa localizao h vizinhos com valores distintos, considerada como regio de transio entre os dois regimes espaciais, no caso os municpios dos quadrantes 1 e 2 (Cmara, Carvalho, Cruz & Correa, 2004). Adotou-se, com base no mapa gerado pelo Box Map, quatro reas distintas de prioridade para o controle da malria: rea de maior prioridade para controle: municpios agregados no quadrante Q1 (+ / +); rea de menor prioridade para controle: municpios agregados no quadrante Q2 ( / ); rea de prioridade intermediria para controle: municpios agregados no quadrante Q3 (+ / ); rea de prioridade intermediria para controle: municpios agregados no quadrante Q4 ( / +). Antes de gerar um novo mapa importante que seja criado um novo tema com as mesmas informaes. Dessa forma no perdemos o mapa temtico gerado na etapa anterior.

D Visualizando o Box Map. Para a visualizao do Box Map execute os passos a seguir, o resultado apresentado na figura 3.4: 1. Marque o tema MT1997 e clique com o boto esquerdo do mouse para acionar o menu; 2. Na rvore de vistas/temas, selecione e habilite o tema MT1997; 3. Clique em Criar tema a partir de tema (tenha certeza de que estejam selecionadom todos os objetos) e nomear como Box00; 4. Para a visualizao do mapa Box Map, pressione o boto direito do mouse e selecione Editar legenda; 5. Em Parmetro de Agrupamento: a) Selecionar o modo Valor nico;

112

Exerccio 3: Anlise espacial da distribuio de casos de malria no Estado de Mato Grosso em 2000 e 2003.

b) Selecionar o atributo MT1997.IPA00BoxMap; c) Definir por preciso 1; d) Escolher 4 cores; Aplicar. 6.Modificar os valores e os rtulo para: a) Valor = 1, rtulo = Q(+ / +); b) Valor = 2, rtulo = Q( / ); c) Valor = 3, rtulo = Q(+ / ); d) Valor = 4, rtulo = Q( / +); 7. Executar; 8. Pode-se, clicando com o mouse esquerdo, renomear a legenda e/ou alterar o visual. Pode-se renomear a legenda conforme exemplo abaixo: a) rea de maior prioridade; b) rea de menor prioridade; c) rea de prioridade intermediria Q3; d) rea de prioridade intermediria Q4; 9.Salvar tela de visualizao em arquivo .bmp.
FIGURA 3.4 Box Map da ocorrncia da IPA nos municpios de Mato Grosso.
Apiacs Juruena Nova Bandeirante Unio do Sul

Feliz Natal

Gacha do Norte

Paranatinga

Nova Ubirat Vera IPA, BOXMAP Q (+/+) Q (/) Q (+/) Q (/+)

Box Map, IPA de 2000, MT.

Box Map, IPA de 2003, MT.

Na figura 3.4 observa-se que 10 municpios em 2000 foram classificados como de alta prioridade para controle e 14 em 2003. Pelo ndice de Moran Local, os municpios de Apiacs e Feliz Natal passaram de rea de prioridade intermediria Q3 para rea de maior prioridade Q1, isto , apresentavam em 2000, IPA acima da mdia que seus vizinhos, e em 2003 ambos (os municpios e seus vizinhos) apresentaram os valores positivos. Destacam-se tambm municpios de prioridade intermediria Q4 (IPA normalizada menor que seus vizinhos) em 2000, modificarem o status para municpios de maior prioridade.

113

ANEXOS - Exerccios

Os municpios de prioridade intermediria (seja ela Q3 ou Q4), esto em sua maioria entre os de menor e maior prioridade e so conhecidos como reas de transio. Esta visualizao destaca reas de transio, de maior ou menor prioridade, e possibilita monitorar a dinmica do evento e definio de estratgias de interveno adequadas a especificidades locais, considerando a vizinhana. O Moran Map foi construdo para visualizar no interior de cada rea de prioridade identificada pelo Box Map, reas ou municpios onde a dependncia espacial mais pronunciada, destacando reas de autocorrelao espacial estatisticamente significante. O Moran Map a representao do ndice de Moran Local, onde os municpios so classificados em 4 quadrantes (Q + / +, Q / , Q + / e Q / +) e municpios no-significantes estatisticamente (Cmara, Carvalho, Cruz & Correa, 2004). Os municpios de Q + / + so considerados como reas crticas de ocorrncia de malria. E Visualizando o Moran Map. Para a visualizao do mapa Moran Map, utilizaremos Editar Legenda, execute os passos a seguir, o resultado apresentado na figura 3.5: 1. Na rvore de vistas/temas, selecione e habilite o tema MT1997; 2. Pressione o boto direito do mouse e selecione Editar legenda; 3. Em Parmetro de Agrupamento: a) Selecionar o modo Valor nico; b) Selecionar o atributo MT1997.IPA00MoranMap; c) Definir por preciso 1; d) Escolher 5 cores; 4. Aplicar. 5. Modificar os valores e os rtulos para: a) Valor = 0, rtulo = no significante b) Valor = 1, rtulo = Q(+ / +); c) Valor = 2, rtulo = Q( / ); d) Valor = 3, rtulo = Q(+ / ); e) Valor = 4, rtulo = Q( / +); 6. Executar; 7. Pode-se, clicando com o mouse esquerdo, renomear a legenda e/ou alterar o visual. Pode-se renomear a legenda conforme exemplo abaixo: a) No Significante b) rea de maior prioridade; c) rea de menor prioridade; d) rea de prioridade intermediria Q3; e) rea de prioridade intermediria Q4; 8. Salvar tela de visualizao em arquivo.bmp.

114

Exerccio 3: Anlise espacial da distribuio de casos de malria no Estado de Mato Grosso em 2000 e 2003.

Na visualizao do padro local gerado pelo Moran Map notamos agrupamentos de autocorrelao espacial local estaticamente significante, apontando-os como o local onde a dependncia espacial ainda mais pronunciada, seja de rea de maior prioridade, menor prioridade ou prioridade intermediria. A importncia da sua utilidade para monitoramento ou estratificao de reas de risco reside na identificao de municpios crticos, no caso de reas de maior risco.
FIGURA 3.5 Moran Map da ocorrncia da IPA nos municpios de Mato Grosso.

Moran Map, IPA Q (+/+) Q (/) Q (+/) Q (/+)

Moran Map, IPA de 2000, MT.

Moran Map, IPA de 2003, MT.

O recurso para estratificao de prioridade utilizando o Box Map propicia estabelecer metas que considerem a incidncia do municpio principal e de seus vizinhos. Essas metas necessitariam ser diferenciadas de acordo com as reas ou agrupamentos de prioridade. Dessa forma, a curto prazo, (metas anuais) poderia-se estabelecer as seguintes metas: os municpios localizados na rea intermediria de prioridade Q3 determinariam como meta a reduo da IPA para valores prximos ou menores que a mdia de seus vizinhos; os municpios localizados na rea intermediria de prioridade Q4 teriam a meta de reduzir a IPA para valores prximos media dos municpios de menor prioridade e, empenhar esforos para no sofrer a influncia de seus vizinhos e aumentar a IPA; os municpios localizados na rea de maior prioridade estabeleceriam como objetivo reduzir a IPA, procurando se aproximar aos valores apresentados pelos municpios vizinhos localizados na rea intermediria de prioridade Q4, ou reduzir a IPA para valores prximos mdia dos municpios de menor prioridade; os municpios localizados na rea de menor prioridade estabeleceriam como meta a eliminao de casos autctones e reforariam o sistema de vigilncia e controle da malria na deteco precoce de casos importados.

115

116

Referncias Bibliogrficas

Bailey TC, Gatrell AC, 1995. Interactive spatial data analysis. 1 ed. Longman Group Limited, Essex, 413 pp. Barcellos C, Barbosa KC, Pina MF, Magalhes MMAF, Paola JCMD, Santos SM, 1998. Interrelacionamento de dados ambientais e de sade: Anlise de risco sade aplicada ao abastecimento de gua no Rio de Janeiro utilizando Sistemas de Informaes Geogrficas, Cadernos de Sade Pblica, 14(3) 597-605 Barcellos C, Acosta LMW, Lisboa EP, Brito MRV, Flores R, 2006. Estimativa da prevalncia de HIV em gestantes em micro-reas de Porto Alegre atravs de tcnicas de anlise espacial. Revista de Sade Pblica, 40(5): 928 - 930. Besag J, Newell J, 1991. The detection of clusters in rare diseases. J. R. Stat. Soc. A, 154: 143-155. Box, GEP. 1979. Robustness is the strategy of scientific model building. In Robustness in Statistics, (Launer, RL & Wilkinson, GN, eds), pp. 201-236, Academic Press, New York, NY. Cmara G, Monteiro AMV, Druck S, Carvalho MS, 2002. Anlise espacial e geoprocessamento. In S Druck, MS Carvalho, G Cmara and AMV Monteiro, Anlise espacial de dados geogrficos. Disponvel em http://www.dpi.inpe.br/gilberto/livro/ analise/. Acessado em 17 de setembro de 2003. Cmara G, Carvalho MS, Cruz OG, Correa V, 2004. Anlise espacial de reas. In. Embrapa Cerrados. Anlise espacial de dados geogrficos. Planaltina, DF: Embrapa; 2004. p.157-209. Carvalho MS, Cmara G, 2002. Anlise de eventos pontuais. In S Druck, MS Carvalho, G Cmara and AMV Monteiro, Anlise espacial de dados geogrficos. Disponvel em http://www.dpi.inpe.br/gilberto/livro/analise/.Acessado em 17 de setembro de 2003. Cavalcante MS, 2004. Transmisso Vertical do HIV em Fortaleza: Revelando a Situao Epidemiolgica em uma Capital do Nordeste. RBGO: Revista da Federao Brasileira das Sociedades de Ginecologia e Obstetrcia/FEBRASCO., V.6, n.2, So Paulo. Cromley EK, McLafferty SL, 2002. GIS and Public Health. 1 ed. The Gulford Press,New York, 340 pp. Everitt B, 1974. Cluster Analysis. Heinemann Educational Books, London. Gatrell AC, Bailey TC, 1996. Interactive spatial data analysis in medical geography. Soc Sci Med, 42: 843-855. Kelsall JE, Diggle PJ, 1995. Non-parametric estimation of spatial variation in relative risk. Stat Med, 14: 2335-2342.

117

Referncias bibliogrficas

King PE, 1979. Problems of spatial analysis in geographical epidemiology. Social Science & Medicine, 13: 249-252. Kulldorff M, 1997. A spatial scan statistic. Commun. Statist. - Theory Meth, 26: 1481-1496. Kulldorff M, 2003. SaTScanTM user Guide for version 3.1. Disponvel em http:// www.satscan.org. Acessado em 21 de junho de 2003. Lawson AB, Kulldorff M, 1999. A review of cluster detection methods. In AB Lawson, A Biggeri, D Bhning, E Lesaffre, JF Viel and R Bertollini, Disease mapping and risk assessment for public health, John Wiley and Sons, Chichester. p. 99-110. Levine N, 2002. CrimeStat: A spatial statistics program for the analysis of crime incident locations. Ned Levine & Associates, Houston, TX, and the National Institute of Justice. Washington, DC. MS (Ministrio da Sade), 2002. Boletim Epidemiolgico da AIDS/Ministrio da Sade. Coordenao Nacional de DST e Aids. Ano XVI, n 01, 14 a 52 semanas epidemiolgicas abril a dezembro 2002. Braslia. http://www.opas.org.br/sistema/ arquivos/matriz.pdf Acessado em 27/out/2004. MS (Ministrio da Sade), 2003. Vigilncia em Sade. Dados e Indicadores Selecionados 2003. Braslia. Neri SHA, 2004. A utilizao das ferramentas de geoprocessamento para identificao de comunidades expostas a hepatite A nas reas de ressacas dos municpios de Macap e Santana (AP). Dissertao de mestrado. COPPE/UFRJ. Rio de Janeiro Rede Interagencial de Informao para a Sade (RIPSA), 2002. Indicadores bsicos de sade no Brasil: conceitos e aplicaes. Braslia: OPAS, 2002. Sabel CE, Gatrell AC, Loytonen M, Maasilta P, Jokelainen M, 2000. Modelling exposure opportunities: estimating relative risk for motor neurone disease in Finland. Soc Sci Med, 50: 1121-1137. Sankoh OA, Ye Y, Sauerborn R, Muller O, Becher H, 2001. Clustering of childhood mortality in rural Burkina Faso. Int J Epidemiol, 30: 485-492. Santana R, Dhalia C, Barreira D, Barbosa A, PAZ, Cardoso A, 2002. Implantao da vigilncia epidemiolgica de gestantes HIV+ e crianas expostas. Revista Brasileira de Epidemiologia, Suplemento Especial; Comunicaes Coordenadas p.73, Curitiba. Santos SM, Barcellos C, Carvalho MS, Flores R, 2001. Deteco de aglomerados espaciais de bitos por causas violentas em Porto Alegre, Rio Grande do Sul, Brasil, 1996. Cad Sade Pblica, 17: 1141-1151. Silverman BW, 1986. Density estimation for statistics and data analysis. Chapman and Hall, London. SMS (Secretaria Municipal de Sade de Porto Alegre). PR-SABER: Informaes de Interesse Sade. Volume 4 n 3 , dezembro de 1999, Porto Alegre. Snow J, 1999. Sobre a Maneira de Transmisso do Clera. Rio da Janeiro/So Paulo: ABRASCO/HUCITEC. Tobler, WR, 1979. Cellular geography. Philosophy in geography, pp. 379-386. Ward MP, Carpenter TE, 2000. Techniques for analysis of disease clustering in space and in time in veterinary epidemiology. Prev Vet Med 45: 257-284.

118

Links teis para download de aplicativos recomendados

Crimestat - http://www.icpsr.umich.edu/CRIMESTAT/

Google Earth - http://earth.google.com/intl/pt/

SatScan - http://www.satscan.org/

TerraView - http://www.dpi.inpe.br/terraview/index.php

WinBugs - http://www.mrc-bsu.cam.ac.uk/bugs/winbugs/contents.shtml

119

Outros ttulos da srie:

CAPACIT ACITAO ATU TUALIZAO CAPACITAO E ATU ALIZAO EM GEOPROCESSAMENTO EM SADE

VOLUME 1

Abordagens Espaciais na Sade Pblica


Organizadores: Simone M. Santos e Christovam Barcellos

VOLUME 2

Sistemas de Informaes Geogrficas e Anlise Espacial na Sade Pblica


Organizadores: Simone M. Santos e Reinaldo Souza-Santos

VOLUME 3

Introduo Estatstica Espacial para a Sade Pblica


Organizadores: Simone M. Santos e Wayner V. Souza

MAIS INFORMAES:

Secretaria de Vigilncia em Sade Ministrio da Sade Esplanada dos Ministrios edifcio sede, Bloco E, 1 andar Braslia - DF CEP 70.058-900 e-mail: svs@saude.gov.br Tel: (61) 3315.3777

Visite nosso site: www.capacita.geosaude.cict.fiocruz.br

Esta obra foi produzida no Rio de Janeiro pelo Departamento de Programao Visual ICICT Fiocruz, em outubro de 2007. A composio empregou as tipologias Arial, Arial Narrow, Arial Black e Zapf Humanist 601. O papel utilizado para miolo o Couch fosco L2 - 95 g/m2. E, para a capa, Supremo Alto Alvura 275 g/m2.

122

123

Você também pode gostar