Você está na página 1de 45

9 4

INPE-12830-PRE/8120

CAPTULO 1

REPRESENTAO COMPUTACIONAL DE DADOS GEOGRFICOS

Gilberto Cmara

Bancos de dados geogrficos

INPE So Jos dos Campos 2005

1 Representao computacional de dados geogrficos


Gilberto Cmara

1.1 Introduo Este captulo examina os problemas bsicos de representao computacional de dados geogrficos, e esclarece questes da seguinte natureza: Como representar os dados geogrficos no computador? Como as estruturas de dados geomtricas e alfanumricas se relacionam com os dados do mundo real? Que alternativas de representao computacional existem para dados geogrficos? Em seu livro Olhos de Madeira, Carlo Ginzburg nos traz um fascinante ensaio sobre a origem da palavra representao. A origem do termo remonta ao sculo XIII, chamando-se reprsentation aos manequins de cera exibidos junto ao cadver dos reis franceses e ingleses durante as cerimnias funerrias (Ginzburg, 2001). Enquanto o soberano era velado, a presena do manequim era um testemunho transcendncia do rei e a sua presena futura no mundo dos mortos. O manequim tinha a funo de lembrar aos presentes que o rei havia assumido uma outra forma e que uma nova vida se iniciava para o morto. Nesta nova forma, apesar de morto o rei continuaria presente para seus sditos (re + prsentation). Assim, desde a sua origem a palavra representao est associada a uma forma abstrata de descrio do mundo. O uso do manequim como representao do soberano morto apenas um exemplo do problema mais geral da construo de abstraes que descrevem o mundo. Para explicar como funcionam os bancos de dados geogrficos, este captulo descreve o processo de transformar aos conceitos abstratos de espao

1 Representao computacional de dados geogrficos

geogrfico no referindo ao espao computacionalmente representado. Para exemplificar, consideremos alguns problemas: Uma cientista social deseja entender e quantificar o fenmeno da excluso social numa grande cidade brasileira, atravs de mapas de excluso/incluso social, gerados a partir de dados censitrios (Sposati, 1996). Uma ecloga pretende estudar os remanescentes florestais da Mata Atlntica, atravs de estudos de fragmentao obtidos a partir de interpretao de imagens de satlite (Pardini et al., 2005). Uma pedloga pretende determinar a distribuio de propriedades do solo numa rea de estudo, a partir de um conjunto de amostras de campo (Bnisch et al., 2004). O que h de comum nesses casos? A especialista lida com conceitos de sua disciplina (excluso social, fragmentos, distribuio de propriedades do solo) e precisa de representaes que traduzam estes conceitos para o computador. Aps esta traduo, ela poder compartilhar os dados de seu estudo, inclusive com pesquisadores de outras disciplinas. 1.2 Descrio geral de sistemas de informao geogrfica O termo sistemas de informao geogrfica (SIG) aplicado para sistemas que realizam o tratamento computacional de dados geogrficos. A principal diferena de um SIG para um sistema de informao convencional sua capacidade de armazenar tanto os atributos descritivos como as geometrias dos diferentes tipos de dados geogrficos. Assim, para cada lote num cadastro urbano, um SIG guarda, alm de informao descritiva como proprietrio e valor do IPTU, a informao geomtrica com as coordenadas dos limites do lote. A partir destes conceitos, possvel indicar as principais caractersticas de SIGs: Inserir e integrar, numa nica base de dados, informaes espaciais provenientes de meio fsico-bitico, de dados censitrios, de cadastros urbano e rural, e outras fontes de dados como imagens de satlite, e GPS.

Descrio geral de sistemas de informao geogrfica

Oferecer mecanismos para combinar as vrias informaes, atravs de algoritmos de manipulao e anlise, bem como para consultar, recuperar e visualizar o contedo da base de dados geogrficos. Os componentes de um SIG esto mostrados na Figura 1.1. No nvel mais prximo ao usurio, a interface homem-mquina define como o sistema operado e controlado. Esta interface pode ser tanto baseada na metfora da mesa de trabalho (Kuhn e Frank, 1991) (Richards e Egenhofer, 1995) (Cmara, 1999), como adaptada ao ambiente de navegao da Internet (Kraak e Brown, 2001), quanto baseada em linguagens de comando como Spatial SQL (Egenhofer, 1994) e LEGAL (Cmara, 1995). No nvel intermedirio, um SIG deve ter mecanismos de processamento de dados espaciais. A entrada de dados inclui os mecanismos de converso de dados (Hohl, 1998). Os algoritmos de consulta e anlise espacial incluem as operaes topolgicas (Egenhofer e Franzosa, 1991), lgebra de mapas (Tomlin, 1990), estatstica espacial (Druck et al., 2004), modelagem numrica de terreno (Li et al., 2004) e processamento de imagens (Mather, 2004). Os mecanismos de visualizao e plotagem devem oferecer suporte adequado para a apreenso cognitiva dos aspectos relevantes dos dados pesquisado (MacEachren, 2004) (Tufte, 1983) (Monmonier, 1993). No nvel mais interno do sistema, um sistema de gerncia de bancos de dados geogrficos oferece armazenamento e recuperao dos dados espaciais e seus atributos. Cada sistema, em funo de seus objetivos e necessidades, implementa estes componentes de forma distinta, mas todos os subsistemas citados devem estar presentes num SIG.

1 Representao computacional de dados geogrficos

Interface

Entrada e Integr. Dados

Consulta e Anlise Espacial

Visualizao Plotagem

Gerncia Dados Espaciais

Banco de Dados Geogrfico

Figura 1.1 Arquitetura de sistemas de informao geogrfica.

Do ponto de vista da aplicao, o uso de sistemas de informao geogrfica (SIG) implica em escolher as representaes computacionais mais adequadas para capturar a semntica de seu domnio de aplicao. Do ponto de vista da tecnologia, desenvolver um SIG significa oferecer o conjunto mais amplo possvel de estruturas de dados e algoritmos capazes de representar a grande diversidade de concepes do espao. Como o presente livro est focado nos diferentes aspectos relacionados com a tecnologia de bancos de dados geogrficos, discutiremos em maior detalhe a questo de gerncia de dados espaciais. Leitores interessados nos demais aspectos de um SIG podero consultar as referncias acima. 1.3 Traduzindo a informao geogrfica para o computador Para abordar o problema fundamental da Geoinformao, que a produo de representaes computacionais do espao geogrfico, usamos o paradigma dos quatro universos, proposto inicialmente por Gomes e Velho (1995) e adaptado para a geoinformao por Cmara (1995). Este paradigma distingue quatro passos entre o mundo real e sua realizao computacional (ver Figura 1.2).

Traduzindo a informao geogrfica para o computador

Figura 1.2 Paradigma dos quatro universos.

No primeiro passo, nossas percepes do mundo real so materializadas em conceitos que descrevem a realidade e respondem a questes como: Que classes de entidades so necessrias para descrever o problema que estamos estudando? (Smith, 2003). Criamos assim o universo ontolgico, onde inclumos os conceitos da realidade a serem representados no computador, como os tipos de solo, elementos de cadastro urbano, e caracterizao das formas do terreno. O segundo universo (o universo formal) inclui modelos lgicos ou construes matemticas que generalizam os conceitos do universo ontolgico e do resposta pergunta: Quais so as abstraes formais necessrias para representar os conceitos de nosso universo ontolgico? Estas abstraes incluem modelos de dados e lgebras computacionais. Exemplos: o modelo entidade-relacionamento (Chen, 1976) e o modelo OMT (Rumbaugh et al., 1991). O caso especfico de modelos dados geogrficos tratado em maior detalhe nos captulos 3 e 4 deste livro e inclui o modelo OMT-G (Davis et al., 2002). A questo de linguagens tratada no Captulo 5. O terceiro universo o universo estrutural, onde as diversas entidades dos modelos formais so mapeadas para estruturas de dados geomtricas e alfanumricas, e algoritmos que realizam operaes. Neste universo, respondemos a questes como: Quais so os tipos de dados e algoritmos necessrios para representar os modelos e as lgebras do universo formal? As estruturas de dados so os elementos bsicos de construo dos sistemas computacionais, e sero discutidas em maior detalhe neste captulo. Aspectos do universo estrutural descritos no livro incluem arquiteturas de SGBD (Captulo 8), converso de dados (Captulo 9), interoperabilidade (Captulo 10) e disseminao de dados na Internet (Captulo 11).

1 Representao computacional de dados geogrficos

O universo de implementao completa o processo de representao computacional. Neste universo, realizamos a implementao dos sistemas, fazendo escolhas como arquiteturas, linguagens e paradigmas de programao. Neste livro, as questes de implementao discutidas incluem geometria computacional (Captulo 2), mtodos de acesso (Captulo 6), processamento de consultas (Captulo 7), alm da descrio detalhada da biblioteca TerraLib (Captulos 12 a 14). O paradigma dos quatro universos uma forma de compreendermos que a transposio da realidade para o computador requer uma srie complexa de mediaes. Primeiro, precisamos dar nomes s entidades da realidade. Depois, geramos modelos formais que as descrevem de forma precisa. A seguir, escolhemos as estruturas de dados e algoritmos que melhor se adaptam a estes modelos formais. Finalmente, fazemos a implementao num suporte computacional apropriado. Nas prximas sees, examinaremos em detalhe cada um destes universos. 1.4 O universo ontolgico Ontologia o campo da filosofia cujo objetivo descrever os tipos e estruturas de entidades, eventos, processos e relaes que existem no mundo real (Smith, 2003). Sua gnese remonta a Aristteles, mas o interesse recente por ontologias em sistemas de informao decorre principalmente da necessidade de compartilhar informao de forma eficiente para um pblico cada vez mais interdisciplinar. Um sistema de informao pode ser concebido como um mecanismo de comunicao entre duas partes: o produtor e o usurio. Para que funcione, necessrio que haja uma concordncia entre os conceitos das partes. Numa perspectiva mais geral, seu sucesso depende da existncia de uma comunidade que compartilhe as definies utilizadas para constru-lo. Por exemplo, considere o caso de um estudo sobre segregao em reas urbanas. Existem diferentes conceitos de segregao na literatura sociolgica (Caldeira, 2000) (Massey e Denton, 1993) (Torres, 2004) (White, 1983). Para construir um sistema de informao que permita o estudo da segregao urbana, preciso que o produtor de informao defina qual dos diferentes conceitos estar sendo

O universo ontolgico

representado, como esta representao ser construda, e como o usurio pode compreender as caractersticas e limitaes desta representao. Deste modo, o problema fundamental de um sistema de informao definir o conjunto de conceitos a ser representado. Se quisermos que estes conceitos sejam compartilhados por uma comunidade interdisciplinar, fundamental que os conceitos utilizados sejam devidamente explicitados. Assim, surge a pergunta: Qual o papel dos conceitos na representao do mundo? A melhor forma de responder baseando-se na perspectiva realista (Searle, 1998): 1. A realidade existe independentemente das representaes humanas. 2. Ns temos acesso ao mundo atravs de nossos sentidos e de nossos instrumentos de medida. 3. As palavras em nossa linguagem podem ser usadas para referir-se a objetos do mundo real. 4. Nossas afirmaes so verdadeiras ou falsas dependendo de sua correspondncia aos fatos do mundo. 5. Algumas afirmaes em nossa linguagem dizem respeito a uma realidade externa e independente (h neve no topo do Monte Evereste). Outras afirmaes dizem respeito a convenes socialmente construdas (este papel uma certido de nascimento). Como nos ensina Searle (1993), esta perspectiva tem conseqncias importantes sobre nossa concepo do mundo: Apesar de termos representaes mentais e lingsticas do mundo sob a forma de crenas, experincias, afirmaes, teorias, etc., h um mundo, l fora, totalmente independente destas representaes. A rbita elptica dos planetas relativamente ao Sol e a estrutura do tomo de hidrognio so inteiramente independentes das representaes que os seres humanos tm de tais fenmenos. J coisas como o dinheiro, a propriedade, o casamento e os governos so criados e sustentados pelo comportamento cooperativo humano. Na sua maior parte, o mundo existe independentemente da linguagem (princpio 1) e uma das funes da linguagem representar como so as coisas no mundo (princpio 3). Um aspecto crucial no qual a realidade e a linguagem entram em contato marcado pela noo de verdade. Em

1 Representao computacional de dados geogrficos

geral, as afirmaes so verdadeiras na medida em que representam com preciso uma caracterstica da realidade que existe independentemente da afirmao (princpio 4).. O projeto de um sistema de informao requer, como passo inicial, a escolha das entidades a ser representados e, se possvel, a descrio organizada destas entidades por meio de conceitos. Esta descrio forma uma ontologia de aplicao, definida como um conjunto de conceitos compartilhados por uma comunidade (Gruber, 1995). Para os dados geogrficos, uma geo-ontologia tem dois tipos bsicos de conceitos: (a) conceitos que correspondem a fenmenos fsicos do mundo real; (b) conceitos que criamos para representar entidades sociais e institucionais (Smith e Mark, 1998) (Fonseca et al., 2003). Chamamos o primeiro tipo de conceitos fsicos e o segundo de conceitos sociais (Tabela 1.1). Embora todos os conceitos resultem do uso compartilhado da linguagem, h uma diferena entre conceitos que se referem ao mundo fsico (A Amaznia possui uma floresta tropical) e aqueles que resultam de convenes humanas (Esta uma reserva indgena). Nossa geo-ontologia diferencia entre conceitos associados a entidades que pode ser individualizadas e identificadas nominalmente (caso de lagos e lotes) e aquelas que variam de forma contnua no espao (caso de poluio).
Tabela 1.1 Tipos de conceitos associados a entidades geogrficas Realidade fsica Entidades individualizveis Entidades com variao contnua indivduos bona fide (e.g., montanha) topografias fsicas (e.g., poluio) Realidade social indivduos fiat (e.g., lote) topografias sociais (e.g., segregao)

Os conceitos fsicos podem ser subdivididos em: Conceitos associados a entidades individualizveis, que possuem uma fronteira bem definida a partir de diferenciaes qualitativas ou descontinuidades na natureza. Designados como indivduos bona fide

O universo ontolgico

(do latim boa f), sua existncia decorre de nossa necessidade de dar nomes aos elementos do mundo natural. Por exemplo, embora a a superfcie da Terra apresente uma variao contnua no espao, nossa percepo do espao depende da associao de nomes especiais a variaes bem definidas no terreno. Da nascem conceitos como montanha, vale e desfiladeiro. Conceitos associados a entidades que tem variao contnua no espao, associadas aos fenmenos do mundo natural, no estando a princpio limitadas por fronteiras. Chamamos estes conceitos de topografias fsicas, onde o termo topografia est associado a qualquer grandeza que varia continuamente. Exemplos incluem temperatura, altimetria, declividade e poluio. Os conceitos sociais podem ser subdivididos em: Conceitos que descrevem entidades individuais criadas por leis e por aes humanas. Estas entidades possuem uma fronteira que as distingue do seu entorno e tem uma identidade nica. Sua existncia depende usualmente de um registro legal. Designadas como indivduos fiat (do latim fazer), incluem conceitos como lotes, municpios e pases. Conceitos descrevendo entidades que tm variao contnua no espao, associadas a convenes sociais. Tome-se o caso de pobreza, conceito socialmente definido que ocorre no espao de forma ininterrupta (em cada lugar h algum tipo diferente de pobreza). Chamamos estes conceitos de topografias sociais. Exemplos incluem: excluso social, segregao urbana, desenvolvimento humano. Uma geo-ontologia um conjunto de conceitos e um conjunto de relaes semnticas e espaciais entre estes termos. Cada conceito tem um nome, uma definio e um conjunto de atributos. O conjunto das relaes semnticas inclui as relaes de sinonmia, similaridade, e hiponmia (tambm dito especializao: hospital um tipo de prdio). Por exemplo: rio: Curso de gua natural, de extenso mais ou menos considervel, que se desloca de um nvel mais elevado para outro mais baixo,

10

1 Representao computacional de dados geogrficos

aumentando progressivamente seu volume at desaguar no mar, num lago, ou noutro rio. riacho: rio pequeno, mais volumoso que o regato e menos que a ribeira relao semntica: um riacho um rio. (hiponmia). O conjunto de relaes espaciais inclui as relaes topolgicas como pertinncia e adjacncia, relaes direcionais como ao norte de, e relaes informais como no corao de ou perto de. Por exemplo: afluente: curso de gua que desgua em outro curso de gua, considerado principal. relao espacial: um afluente est conectado a um rio. Na maior parte dos sistemas de informao atuais, as ontologias de aplicao no esto explicitadas, o que reduz o potencial de compartilhamento da informao. Com o advento da Internet, que permite a disseminao de dados forma ampla e para um pblico heterogneo, a necessidade de explicitar as ontologias utilizadas tornouse ainda mais premente. A explicitao das ontologias de aplicao est na base das propostas recentes da Web Semntica (Berners-Lee et al., 2001) e de propostas de padres como OWL. Como resultado de pesquisas recentes, j temos vrios sistemas disponveis na Internet para criao e gesto de ontologias, como o Proteg (Noy et al., 2001). Para dados geogrficos, o consrcio OGC (Open Geospatial Consortium) props o formato GML como mecanismo de descrio de ontologias geogrficas. Fazemos uma descrio mais detalhada do tema nos Captulos 9 e 10 deste livro. 1.5 O universo formal O universo formal representa um componente intermedirio entre os conceitos do universo ontolgico e as estruturas de dados e algoritmos computacionais. Como os computadores trabalham com estruturas matemticas, a passagem direta de conceitos informais da ontologia de aplicao para estruturas de dados poderia gerar decises inconsistentes. No universo formal, buscamos estabelecer um conjunto de entidades lgicas que agrupem os diferentes conceitos da ontologia de aplicao da

O universo formal

11

forma mais abrangente possvel. Adicionalmente, neste universo definimos ainda como sero associados valores aos diferentes conceitos; ou seja, como podemos medir o mundo real. Deste modo, o universo formal tem duas partes: (a) como medir o mundo real (teoria da medida); (b) como generalizar os conceitos da ontologia em entidades formais abrangentes. Estas duas partes sero discutidas a seguir. 1.5.1 Atributos de dados geogrficos: teoria da medida Para representar dados geogrficos no computador, temos de descrever sua variao no espao e no tempo. Em outras palavras, precisamos poder a perguntas como: qual o valor deste dado aqui e agora?. Isto requer uma compreenso dos processos de mensurao da realidade, de forma consistente com os dois primeiros princpios de Searle (1998): a realidade existe independentemente das representaes humanas e ns temos acesso ao mundo atravs de nossos sentidos e de nossos instrumentos de medida. O processo de medida consiste em associar nmeros ou smbolos a diferentes ocorrncias de um mesmo atributo, para que a relao dos nmeros ou smbolos reflita as relaes entre as ocorrncias mensuradas. Por exemplo, podemos medir a poluio numa cidade atravs de sensores localizados em diferentes locais. Cada um destes sensores nos dar uma medida diferente. Esta atribuio denominada escala de medida. A referncia geral mais importante sobre escalas de medidas o trabalho de Stevens (1946), que prope quatro escalas de mensurao: nominal, ordinal, intervalo e razo. Os nveis nominal e ordinal so temticos, pois a cada medida atribudo um nmero ou nome associando a observao a um tema ou classe. A escala nominal classifica objetos em classes distintas sem ordem inerente, como rtulos que podem ser quaisquer smbolos. As possveis relaes entre os valores so identidade (a = b) e dessemelhana (a b). Um exemplo a cobertura do solo, com rtulos como floresta, rea urbana e rea agrcola.

12

1 Representao computacional de dados geogrficos

Figura 1.3 Exemplos de medida nominal (mapa geolgico) e medida ordinal (mapa de classes de declividade) .

A escala ordinal introduz a idia de ordenao, caracterizando os objetos em classes distintas que possuem uma ordem natural (por exemplo 1 ruim, 2 bom, 3 timo ou 0-10%, 11-20%, mais que 20%). A distncia definida entre os elementos no significativa. Nesta escala so evidenciadas as relaes < ou >, isto implica que para todo a e b, as relaes a < b, a > b ou a = b so possveis. Um exemplo a aptido agrcola de solos, com rtulos como muito apto, apto, pouco apto, e inapto (ver Figura 1.3). As medidas temticas no esto associadas magnitude do fenmeno. Quando o estudo necessita de uma descrio mais detalhada, que permita comparar intervalo e ordem de grandeza entre eventos, recorrese aos nveis de medidas denominados de numricos, onde as regras de atribuio de valores baseiam-se em uma escala de nmeros reais. Existem dois nveis de medidas baseados em escalas de nmeros reais: escala por intervalo e o escala por razo. A escala por intervalo possui um ponto zero arbitrrio, uma distncia proporcional entre os intervalos e uma faixa de medidas entre [-,]. A temperatura em graus Celsius exemplo de medida por intervalo, onde o ponto zero corresponde a uma

O universo formal

13

conveno (a fuso do gelo em gua). Por ter uma referncia zero arbitrria, valores medidos no nvel por intervalo no podem ser usados para estimar propores. Operaes aritmticas elementares (adio e subtrao) so vlidas, porm multiplicao e diviso no so apropriadas. Por exemplo, dados a e b, pode-se ter a = b + c, onde c a diferena entre a e b em alguma unidade padro. Assim, a temperatura em So Paulo pode ser c graus mais baixa do que a temperatura em Campos de Jordo. A escala de razo permite um tratamento mais analtico da informao, pois nela o ponto de referncia zero no arbitrrio, mas determinado por alguma condio natural. Sua faixa de valores limitada entre [0,]. Nesta escala existe um ponto zero absoluto que no pode ser alterado e um intervalo arbitrrio com distncias proporcionais entre os intervalos. Nmeros negativos no so permitidos, pois o nmero zero representa ausncia total daquilo que est sendo medido. Por exemplo, na descrio de atributos como peso e volume de objetos no h valores negativos. No caso de temperatura em graus Kelvin, a condio natural o ponto de repouso dos tomos da matria, a partir do qual no se consegue temperaturas menores. Este ponto o zero absoluto para temperatura, zero graus Kelvin. O fato de ponto de referncia zero ser absoluto permite afirmaes tais como a duas vezes mais pesado que b. Desta forma, dado a e b pode-se ter a = c x b, onde c indica o nmero de vezes que b vai at a, a relao de a para b. Operaes matemticas de adio, subtrao, multiplicao e diviso so suportadas nesta escala. A Tabela 1.2 apresenta um resumo das escalas de medidas, destaca a caracterstica principal, apresenta algumas operaes admitidas e exemplos para cada uma delas.
Tabela 1.2 Tipos de medidas de dados geogrficos Escala Nominal Caractersticas Descrio Exemplos Operaes possveis

Tipo de solo, vegetao, Seleo, uso do solo Comparao

14

1 Representao computacional de dados geogrficos

Ordinal

Ordem

Classes de declividade, aptido de uso Altimetria Renda, populao, taxa de natalidade

Mediana, Mximo, Mnimo Diferena, Soma Operaes aritmticas

Intervalo Distncia Razo Valores absolutos

1.5.2 Espao absoluto e espao relativo Antes de considerar os diferentes modelos formais para dados geogrficos, necessrio analisarmos brevemente os conceitos de espao absoluto e espao relativo. Esta distino decorre da possibilidade de representarmos no computador a localizao dos objetos no espao ou apenas o posicionamento relativo entre eles, como ilustrado na Figura 1.4. Nesta figura, mostramos esquerda os distritos da cidade de So Paulo, identificados por suas fronteiras. Neste caso, trata-se de uma representao no espao absoluto, na qual as coordenadas das fronteiras devem corresponder s estabelecidas na legislao. Do lado direito, mostramos um grafo com as conexes dos distritos, que formam uma rede (repetimos a imagem dos distritos por razes de melhor legibilidade da figura). No modelo de redes, a localizao exata de cada distrito no armazenada, pois a rede s captura as relaes de adjacncia. Dizemos ento que a rede de conexes dos distritos um modelo de espao relativo.

O universo formal

15

Figura 1.4 Dualidade entre espao absoluto e espao relativo. esquerda, distritos de So Paulo com suas fronteiras. direita, grafo mostrando a rede de conectividade entre os distritos (espao relativo). O mapa da esquerda foi repetido por razes de melhor legibilidade.

A distino entre espao absoluto e espao relativo de grande importncia para a Geografia. Milton Santos (Santos, 1985) refere-se ao espao dos fixos e ao espao dos fluxos. Castells (1999) fala em espao de lugares e espaos de fluxos. Vejam o que Helen Couclelis comenta a respeito do tema: Espao absoluto, tambm chamado cartesiano, um container de coisas e eventos, uma estrutura para localizar pontos, trajetrias e objetos. Espao relativo, ou leibnitziano, o espao constitudo pelas relaes espaciais entre coisas (Couclelis, 1997). Uma das escolhas bsicas que fazemos na modelagem dos fenmenos geogrficos definir se utilizaremos representaes no espao absoluto ou no espao relativo. Esta escolha depende primordialmente do tipo de anlise que queremos realizar. Usualmente, consultas espaciais que envolvem dois tipos de entidades (quais os rios que cruzam esta estao ecolgica?) requerem a representao no espao absoluto. O mesmo vale para questes de lgebra de mapas (reas inaptas tem declividade maior que 15% ou solos arenosos). Quando os procedimentos de anlise

16

1 Representao computacional de dados geogrficos

envolvem apenas as relaes de conectividade (como chegar na estao de metr Clnicas, partindo da estao Liberdade? ou qual a mdia da mortalidade infantil de meus vizinhos?) podemos utilizar representaes no espao relativo. Quando falamos em entidades como estradas, linhas de transmisso, conexes de gua e esgoto, cadeias de mercado e linhas de comunicao, o espao relativo na maioria das vezes plenamente adequado. 1.5.3 Modelos no espao absoluto: geo-campos e geo-objetos Existem dois modelos formais para entidades geogrficos no espao absoluto: geo-campos e geo-objetos. O modelo de geo-campos enxerga o espao geogrfico como uma superfcie contnua, sobre a qual variam os fenmenos a serem observados. Por exemplo, um mapa de vegetao associa a cada ponto do mapa um tipo especfico de cobertura vegetal, enquanto um mapa geoqumico associa o teor de um mineral a cada ponto. O modelo de geo-objetos representa o espao geogrfico como uma coleo de entidades distintas e identificveis, onde cada entidade definida por uma fronteira fechada. Por exemplo, um cadastro urbano identifica cada lote como um dado individual, com atributos que o distinguem dos demais. Definio 1.1. Geo-Campo. Um geo-campo representa um atributo que possui valores em todos os pontos pertencentes a uma regio geogrfica. Um geo-campo gc uma relao gc = [R, A, f], onde R 2 uma partio conexa do espao, A um atributo cujo domnio D(A), e a funo de atributo f: R A tal que, dado p R, f(p) = a, onde a D(A). A noo de geo-campo decorre da definio fsica associada (segundo o Aurlio, campo um conjunto de valores de uma grandeza fsica que, numa regio do espao, dependem s das coordenadas dos pontos pertencentes a essa regio). Em outras palavras, para cada ponto do espao, um campo ter um valor diferente. Definio 1.2 Geo-Objeto. Um geo-objeto uma entidade geogrfica singular e indivisvel, caracterizada por sua identidade, suas fronteiras, e seus atributos. Um geo-objeto uma relao go = [id, a1,...an, G], onde id um identificador nico, G um conjunto de parties 2D conexas e

O universo formal

17

distintas {R1,...,Rn} do espao 2, e ai so os valores dos atributos A1,..., An. Note-se que um geo-objeto pode ser composto por diferentes geometrias, onde cada geometria tem uma fronteira fechada (e.g., o Japo com suas diferentes ilhas). Um exemplo de geo-campo (uma imagem IKONOS da cidade do Rio de Janeiro) e de um conjunto de geo-objetos (os distritos dessa cidade) apresentado na Figura 1.5. A varivel associada imagem a reflectncia do solo, medida pelo sensor ptico do satlite. Os geo-objetos associados aos distritos de So Paulo so mostrados numa gradao de tons de cinza, cuja intensidade proporcional ao ndice de excluso social (Sposati, 1996); quanto mais escuro, mais o distrito possui moradores em situao de excluso social. Os dados na Figura 1.3 acima (geologia e declividade) tambm so exemplos de geo-campos. A Figura 1.5 tambm ilustra uma questo importante: existem diferenas fundamentais entre geo-campos e geo-objetos? Ou seriam apenas duas maneiras de ver o mesmo tipo de dado? Considere os retngulos desenhados no interior das duas representaes mostradas. Na figura esquerda, o interior do retngulo tem as mesmas propriedades do geocampo que o contm. Para cada ponto interior ao retngulo, podemos recuperar o valor do atributo (neste caso, a reflectncia da imagem). Verificamos que uma partio espacial genrica de um geo-campo compe outro geo-campo com as mesmas propriedades.

18

1 Representao computacional de dados geogrficos

Figura 1.5 Exemplo de geo-campo (imagem IKONOS do Rio de Janeiro) e de conjunto de geo-objetos (distritos da cidade de So Paulo).

Considere agora a figura da direita (distritos de So Paulo). O interior do retngulo mostrado no define mais um conjunto de geo-objetos com as mesmas propriedades do conjunto completo. O retngulo intercepta parcialmente alguns objetos. Como cada objeto nico e no pode ser dividido sem perder suas caractersticas originais, verificamos que uma partio espacial genrica de um conjunto de geo-objetos no compe outro conjunto de geo-objetos com as mesmas propriedades. A diferena essencial entre um geo-campo e um geo-objeto o papel da fronteira. A fronteira de um geo-campo uma diviso arbitrria relacionada apenas com nossa capacidade de medida. Na Figura 1.5, os limites da imagem correspondem apenas a eventuais limitaes do instrumento sensor e no do fenmeno medido. Assim, o geo-campo pode ser divido em partes e ainda assim manter sua propriedade essencial (que sua funo de atributo). Por contraste, um geo-objeto essencialmente definido por sua fronteira, que o separa do mundo exterior; ele no pode ser dividido e manter suas propriedades essenciais. Dentro da fronteira, todas as propriedades do objeto so constantes. Tomemos um distrito de So Paulo, como a S, que tem um cdigo nico de identificao no censo do

O universo formal

19

IBGE. Se dividirmos a S em duas partes, precisamos de dois novos cdigos de identificao para caracterizar os dois novos distritos. O exame da Figura 1.5 ilustra outra propriedade dos geo-objetos. bastante comum lidarmos com um conjunto de geo-objetos que representam uma partio consistente do espao; isto , os recobrimentos espaciais destes objetos no se interceptam e eles possuem o mesmo conjunto de atributos. Estas caractersticas fazem com que possamos agrupar estes objetos numa coleo. Definio 1.3 Coleo de geo-objetos. Uma coleo de geo-objetos relao cgo = [id, o1,...on, A1,..., An], onde id um identificador nico, e o1,...on so geo-objetos que possuem os atributos A1,..., An. Usualmente, se Ri for a regio geogrfica associada a oi, temos Ri Rj = , i j. Deste modo, uma coleo rene geo-objetos cujas fronteiras no se interceptam, e tm o mesmo conjunto de atributos. O uso de colees de geo-objetos bastante freqente em bancos de dados geogrficos, pois muito conveniente tratar geo-objetos similares de forma consistente. Por exemplo, falamos dos distritos da cidade de So Paulo, dos municpios do estado do Cear, e das reservas indgenas da Amaznia. A idia de colees de geo-objetos ainda til para propormos um modelo orientado-a-objetos para dados geogrficos, discutido a seguir. 1.5.4 Modelos no espao relativo: redes O modelo de redes concebe o espao geogrfico como um conjunto de pontos no espao (chamados de ns), conectados por linhas (chamados arcos), onde tanto os ns quanto os arcos possuem atributos. Os fenmenos modelados por redes incluem fluxo de pessoas ou materiais, conexes de influncia, linhas de comunicao e acessibilidade. Um dos atrativos do modelo de redes que o suporte matemtico para este modelo (a teoria de grafos) uma rea de pesquisa consolidada (Bondy e Murty, 1976) (Gross e Yelen, 1998). O problema que deu incio teoria dos grafos foi uma questo espacial. Em 1736, o matemtico Leonard Euler vivia na cidade de Knigsberg (na poca parte da Prssia; hoje chamada Kaliningrad e pertencente Rssia) onde haviam duas ilhas prximas no meio da

20

1 Representao computacional de dados geogrficos

cidade, cruzadas por sete pontes (ver Figura 1.6 esquerda). Euler se perguntou se havia uma maneira de fazer um circuito fechado (sair e voltar para um mesmo lugar), cruzando cada uma das pontes apenas uma vez. Ele construiu um grafo equivalente (ver Figura 1.6 direita) e demonstrou que o problema era insolvel.

Figura 1.6 As sete pontes de Knigsberg e o grafo equivalente. Definio 1.4 Redes. Uma rede uma estrutura geogrfica que tem como suporte um grafo G = [N, A, ], onde N um conjunto de ns, A um conjunto de arcos (arestas), e (a)=(u,v) uma funo de incidncia que associa cada arco a A a um par de ns (u, v) N. No caso geogrfico, os ns podem estar associados a uma localizao (x,y) do espao para fins de referncia. Como os ns de uma rede so abstraes de entidades existentes no espao, eles podem estar associados aos seus atributos descritivos. Por exemplo, na rede mostrada na Figura 1.4, cada n est associado a um distrito de So Paulo, e poderia ter diferentes atributos que descrevem este distrito. Tambm os arcos de uma rede podem ter propriedades, como o custo de percorrimento de um n a outro. As propriedades mensurveis das redes incluem operaes diretas computveis sobre a topologia do grafo, como qual o caminho timo entre dois ns. Tambm podemos computar operaes matemticas que envolvem apenas as relaes de conectividade, como os indicadores locais de autocorrelao espacial (veja-se a respeito, Druck et al., 2004).

O universo formal

21

A definio de redes pode ser estendida para considerar o caso de conexes bidirecionais, como no caso de redes de transporte, onde as relaes entre os ns no so simtricas, pois os fluxos em sentidos opostos podem ser diferentes. A Figura 1.7 ilustra uma rede simples e uma rede com conexes bidirecionais.

Figura 1.7 Exemplos de redes simples e de redes com conexes bidirecionais.

Os modelos de rede tm grande utilidade em problemas de geoinformao, incluindo assuntos como gerenciamento de servios como gua, esgoto, eletricidade e telefonia. Para maiores referncias, deve-se consultar Birkin et al (1996) e Godin (2001). 1.5.5 Um modelo orientado-a-objetos para dados geogrficos As sees anteriores nos permitem apresentar um modelo orientado-aobjetos que apresenta uma verso unificada dos dados geogrficos, com base nos conceitos bsicos de geo-campo, coleo de geo-objetos e rede. Para fins de organizao lgica, o modelo considera a existncia de uma classe genrica, chamada de plano de informao (ou layer), que uma generalizao destes dois conceitos. O conceito de plano de informao captura uma caracterstica comum essencial dos trs conceitos bsicos: cada instncia deles referente a uma localizao no espao e tem um identificador nico. Assim, o uso do conceito de plano de informao permite organizar o banco de dados geogrfico e responder a perguntas como: Quais so os dados presentes no banco, qual o modelo associado a cada um e qual a regio geogrfica associada? Adicionalmente, como cada

22

1 Representao computacional de dados geogrficos

geo-campo est associado a uma nica funo de atributo, ele pode ser especializado em geo-campo temtico (associado a medidas nominais ou ordinais) e geo-campo numrico (associados a medidas por intervalo ou por razo). Com estes seis conceitos, construmos um modelo formal bsico para dados geogrficos, mostrado na Figura 1.8.

Figura 1.8 Modelo OO bsico para dados geogrficos.

O modelo mostrado na Figura 1.8 serve de base para a maioria dos modelos de dados orientados-a-objetos adotados atualmente em geoinformao: O software SPRING (Cmara et al., 1996) inclui os conceitos de rede, geo-campo numrico e geo-campo temtico, coleo de geo-objetos (chamada de mapa cadastral). Os geo-campos numricos admitem as imagens como caso particular. No ArcGIS (ESRI, 2000), a coleo de geo-objetos chamada de features (feies). Os geo-campos numricos so chamados de surfaces (superfcies), e as imagens tambm so modeladas como caso particular de geo-campos numricos. As redes (networks) tambm so includas. No modelo OpenGIS (OGC, 1998), os geo-campos so chamados de coverage, e a coleo de objetos chamada de feature collection. O modelo OpenGIS no tem o conceito explcito de layer, mas

Do universo ontolgico ao universo formal

23

considera que as vises de feature collection e coverage so complementares. Na TerraLib (vide Captulo 12 deste livro), o conceito de plano de informao (layer) um conceito usado para organizar a informao no banco de dados. Os conceitos de geo-campos e de colees de geoobjetos so implcitos. Como se trata de uma biblioteca, os designers da TerraLib quiseram permitir diferentes alternativas de projeto de sistema. 1.6 Do universo ontolgico ao universo formal Para passar do universo ontolgico para o universo formal, precisamos responder pergunta: como os conceitos da ontologia de aplicao so formalizados? Colocando o problema de forma mais geral: Que critrios deve satisfazer um conceito para que seja utilizvel em estudos quantitativos associados geoinformao? Tais critrios so: O conceito deve ser passvel de ser associado a propriedades mensurveis. Estas propriedades devem ser medidas no territrio e devem permitir diferenciar as diferentes localizaes. Os resultados quantitativos e os modelos matemticos utilizados devem ser validados em estudos de campo, que devem incluir dimenses objetivas e subjetivas do fenmeno em questo. Para representar um conceito genrico como excluso social, precisamos definir precisamente quais atributos caracterizam a excluso social e como podemos medi-los no territrio. Esta caracterizao realiza a passagem do universo ontolgico para o universo formal. Com base em conceitos bem estabelecidos e associados a medidas quantitativas no espao, podemos construir territrios digitais. O processo pode ser resumido na Figura 1.9.

24

1 Representao computacional de dados geogrficos

Domnios do Conhecimento Modelos Inferenciais Hipteses Testveis

Teorias

Conceitos Qualitativos

Territrios Digitais

Figura 1.9 Relao entre a construo dos territrios digitais e as teorias disciplinares (cortesia de Silvana Amaral Kampel).

Os especialistas desenvolvem teorias gerais sobre os fenmenos, que incluem o estabelecimento de conceitos organizadores de sua pesquisa (como excluso ou vulnerabilidade). Para passar destas teorias para a construo computacional, necessrio que o especialista formule modelos inferenciais quantitativos. Estes modelos devem ser submetidos a testes de validao e de corroborao, atravs dos procedimentos de anlise quantitativa. Os resultados numricos podem ento dar suporte ou ajudar a rejeitar conceitos qualitativos. Aps definir como que atributos mensurveis sero associados ao conceito, o projetista do sistema de informao dever decidir se este conceito ser modelado no espao absoluto ou no espao relativo. A deciso deve-se dar essencialmente em funo das propriedades que queremos medir. Se a localizao exata fundamental, ou se precisamos saber o valor do fenmeno em todos os pontos da regio de estudo, ento necessrio usar os modelos de espao absoluto. Se o fluxo e as conexes so essenciais, ento podemos usar o modelo de rede. Se precisamos dos dados expressos no espao absoluto, ento devemos escolher ainda qual o modelo apropriado (geo-campo ou geo-objeto). Para isto, a deciso depende essencialmente do papel da fronteira. Se as fronteiras so parte essencial das entidades modeladas, estamos tratando com indivduos e no com topografias (vide Tabela 1.1) e o modelo de

Universo estrutural

25

geo-objetos o mais adequado. Seno, usaremos os modelos de geocampos. 1.7 Universo estrutural As estruturas de dados utilizadas em bancos de dados geogrficos podem ser divididas em duas grandes classes: estruturas vetoriais e estruturas matriciais. 1.7.1 Estruturas de dados vetoriais As estruturas vetoriais so utilizadas para representar as coordenadas das fronteiras de cada entidade geogrfica, atravs de trs formas bsicas: pontos, linhas, e reas (ou polgonos), definidas por suas coordenadas cartesianas, como mostrado na Figura 1.10.

Figura 1.10 Representaes vetoriais em duas dimenses.

Um ponto um par ordenado (x, y) de coordenadas espaciais. O ponto pode ser utilizado para identificar localizaes ou ocorrncias no espao. So exemplos: localizao de crimes, ocorrncias de doenas, e localizao de espcies vegetais. Uma linha um conjunto de pontos conectados. A linha utilizada para guardar feies unidimensionais. De uma forma geral, as linhas esto associadas a uma topologia arco-n, descrita a seguir. Uma rea (ou polgono) a regio do plano limitada por uma ou mais linhas poligonais conectadas de tal forma que o ltimo ponto de uma linha seja idntico ao primeiro da prxima. Observe-se tambm que a fronteira do polgono divide o plano em duas regies: o interior e o exterior. Os polgonos so usados para representar unidades

26

1 Representao computacional de dados geogrficos

espaciais individuais (setores censitrios, distritos, zonas de endereamento postal, municpios). Para cada unidade, so associados dados oriundos de levantamentos como censos e estatsticas de sade. 1.7.2 Vetores e topologia: o caso dos geo-objetos A topologia a parte da matemtica na qual se investigam as propriedades das configuraes que permanecem invariantes nas transformaes de rotao, translao e escala. No caso de dados geogrficos, til ser capaz de determinar relaes como adjacncia (vizinho de), pertinncia (vizinho de), interseco, e cruzamento. Objetos de rea podem ter duas formas diferentes de utilizao: como objetos isolados ou objetos adjacentes. O caso de objetos isolados bastante comum em SIG urbanos, e ocorre no caso em que os objetos da mesma classe em geral no se tocam. Por exemplo, edificaes, piscinas, e mesmo as quadras das aplicaes cadastrais ocorrem isoladamente, no existindo segmentos poligonais compartilhados entre os objetos. Finalmente, temos objetos adjacentes, e os exemplos tpicos so todas as modalidades de diviso territorial: bairros, setores censitrios, municpios e outros. Neste caso, pode-se ter o compartilhamento de fronteiras entre objetos adjacentes, gerando a necessidade por estruturas topolgicas. Estes tambm so os casos em que recursos de representao de buracos e ilhas so mais necessrios. Quando queremos armazenar as estruturas de dados do tipo polgono no caso de objetos adjacentes, temos uma deciso bsica a tomar: guardamos as coordenadas de cada objeto isoladamente, e assim duplicamos as fronteiras em comum com outros objetos, ou armazenamos cada fronteira comum uma nica vez, indicando a que objetos elas esto associadas? No primeiro caso chamado de polgonos sem topologia e o segundo, de topologia arco-n-polgono, comparados na Figura 1.11.

Universo estrutural

27

Figura 1.11 Polgonos sem topologia ( esquerda) e topologia arco-npolgono ( direita). (Fonte: Ravada, 2003).

Figura 1.12 Topologia arco-n-polgono. A topologia arco-n-polgono, como mostrado na Figura 1.12, requer trs listas separadas. Os pontos inicial e final de cada linha so chamados de ns. Para cada n, armazenamos as linhas nele incidentes. Para cada linha, armazenamos os ns inicial e final, permitindo assim que a linha esteja associada a um sentido de percorrimento; guardamos ainda os dois polgonos separados por cada linha ( esquerda e direita, considerando o sentido de percorrimento). Para cada polgono, guardamos as linhas que definem sua fronteira.

28

1 Representao computacional de dados geogrficos

1.7.3 Vetores e topologia: o caso das redes Objetos de linha podem ter variadas formas de utilizao. Analogamente aos objetos de rea, podemos ter objetos de linha isolados, em rvore e em rede. Objetos de linha isolados ocorrem, por exemplo, na representao de muros e cercas em mapas urbanos. Objetos de linha organizados em uma rvore podem ser encontrados nas representaes de rios e seus afluentes, e tambm em redes de esgotos e drenagem pluvial. E podem ser organizados em rede, nos casos de redes eltricas, telefnicas, de gua ou mesmo na malha viria urbana e nas malhas rodoviria e ferroviria. No caso das redes, fundamental armazenar explicitamente as relaes de adjacncia, utilizamos a topologia arco-n. Um n pode ser definido como o ponto de interseco entre duas ou mais linhas, correspondente ao ponto inicial ou final de cada linha. Nenhuma linha poder estar desconectada das demais para que a topologia da rede possa ficar totalmente definida. Para exemplificar, considere-se a Figura 1.13, que mostra um exemplo de como a topologia arco-n pode ser armazenada.

Figura 1.13 Estrutura de dados para topologia arco-n no Oracle Spatial SGBD (Fonte: Ravada, 2003).

Universo estrutural

29

1.7.4 Vetores e topologia: o caso dos dados 2,5 D Uma das possibilidades associadas a dados vetoriais a associao de valores que denotem a variao espacial de uma grandeza numrica. No caso mais simples, associamos a cada localizao no espao um valor numrico de atributo. Neste caso, como os valores de localizao esto no plano e o valor adicional descreve uma superfcie sobre este plano. Os dados resultantes so chamados de dimenso dois e meio, pois no se tratam estritamente de dados tridimensionais, pois o suporte espacial ainda so localizaes 2D. A Figura 1.14 ilustra exemplo de dados de dimenso 2,5.

Figura 1.14 Exemplo de dado com dimenso 2,5 (cortesia de Renato Assuno).

A maneira mais comum de armazenar estes dados atravs de estruturas matriciais (vide prxima seo). Temos trs alternativas que usam estruturas vetoriais: Conjunto de amostras esparsas 2,5D, constitudo de pares ordenados (x,y,z), onde (x,y) uma localizao no plano e z um valor numrico de atributo. Conjunto de isolinhas (curvas de nvel), que so linhas s quais esto associados valores numricos. As isolinhas no se cruzam, e so entendidas como estando empilhadas umas sobre as outras. A malha triangular ou TIN (do ingls triangular irregular network) uma estrutura do tipo vetorial com topologia do tipo n-arco e

30

1 Representao computacional de dados geogrficos

representa uma superfcie atravs de um conjunto de faces triangulares interligadas. A malha triangular a estrutura vetorial mais utilizada para armazenar dados 2,5D. Cada um dos trs vrtices da face do tringulo armazenados as coordenadas de localizao (x, y) e o atributo z, com o valor de elevao ou altitude. Em geral, nos SIGs que possuem pacotes para MNT, os algoritmos para gerao da malha triangular baseiam-se na triangulao de Delaunay com restrio de regio. Quanto mais equilteras forem as faces triangulares, maior a exatido com que se descreve a superfcie. O valor de elevao em qualquer ponto dentro da superfcie pode ser estimado a partir das faces triangulares, utilizando-se interpoladores. A Figura 1.15 mostra uma superfcie tridimensional e a grade triangular correspondente.

Figura 1.15 Superfcie e malha triangular correspondente. (cortesia de Larcio Namikawa ).

1.7.5 Hierarquia de representaes vetoriais Para um entendimento mais detalhado das representaes vetoriais em GIS, deve-se inicialmente precisar o que se entende por primitivas geomtricas: coordenadas 2D, coordenadas 2,5D, n 2D, n 2,5D, n de rede, arcos, arcos orientados, isolinhas e polgonos. Dada uma regio R 2, pode-se definir:

Universo estrutural

31

Uma coordenada 2D um objeto composto por uma localizao singular (xi, yj) R; COORDENADA_2,5D Uma coordenada 2,5D um objeto composto por uma localizao singular (xi, yj, z), onde (xi, yj) R; PONTO2D Um ponto 2D um objeto que possui atributos descritivos e uma coordenada 2D; LINHA2D Uma linha 2D possui atributos e inclui um conjunto de coordenadas 2D;
ISOLINHA uma

COORDENADA_2D

isolinha contm uma linha 2D associada a um valor

real (cota); um arco orientado contm uma linha 2D associada a uma orientao de percorrimento; N2D um n 2D inclui uma coordenada2D (xi, yi) R e uma lista L de linhas 2D (trata-se da conexo entre duas ou mais linhas, utilizada para manter a topologia da estrutura); N REDE um n de rede contm um n 2D e uma lista de arcos orientados; N 2,5D um n 2,5D instncia desta classe contm uma coordenada 2,5D (xi, yi, zi) e um lista L de linhas 2D (trata-se da conexo entre trs ou mais linhas de uma grade triangular); POLGONO um polgono pode ser armazenado como uma lista de coordenadas 2D (caso dos geo-objetos sem topologia) ou por uma uma lista de linhas 2D e uma lista de ns 2D (caso de topologia arcon-polgono). Uma vez definidas as primitivas geomtricas vetoriais, pode ser estabelecida a hierarquia de representaes geomtricas vetoriais, como mostrado na Figura 1.16, onde distinguem-se os relacionamentos de especializao -um (is-a), incluso de uma instncia parte-de (partof), incluso de um conjunto de instncias conjunto-de (set-of) e incluso de uma lista de identificadores de instncias lista-de (list-of).
ARCO ORIENTADO

32

1 Representao computacional de dados geogrficos

Figura 1.16 Hierarquia de classes para estruturas vetoriais.

Distinguimos os seguintes tipos de estruturas de dados vetoriais: 2D uma instncia desta classe um conjunto de pontos 2D utilizados para guardar localizaes isoladas no espao (p.ex. no caso de poos de petrleo); CONJUNTO DE ISOLINHAS uma instncia desta classe um conjunto de linhas, onde cada linha possui uma cota e as linhas no se interceptam; SUBDIVISO PLANAR para uma regio geogrfica R qualquer, uma subdiviso planar contm um conjunto Pg de polgonos que no se sobrepem; GRAFO ORIENTADO uma instncia desta classe uma representao composta de um conjunto de n de rede e de um conjunto de arco orientado 2D;
CONJUNTO DE PONTOS

Universo estrutural

33

uma instncia desta classe contm um conjunto de ns 2,5D e um conjunto L de linhas 2D tal que todas as linhas se interseptam, mas apenas em seus pontos iniciais e finais; MAPA PONTOS 2,5D uma instncia desta classe um conjunto de coordenadas 2,5D. Trata-se de um conjunto de amostras 2,5D.
MALHA TRIANGULAR

1.7.6 Representao matricial As estruturas matriciais usam uma grade regular sobre a qual se representa, clula a clula, o elemento que est sendo representado. A cada clula, atribui-se um cdigo referente ao atributo estudado, de tal forma que o computador saiba a que elemento ou objeto pertence determinada clula. Nesta representao, o espao representado como uma matriz P(m, n) composto de m colunas e n linhas, onde cada clula possui um nmero de linha, um nmero de coluna e um valor correspondente ao atributo estudado e cada clula individualmente acessada pelas suas coordenadas. A representao matricial supe que o espao pode ser tratado como uma superfcie plana, onde cada clula est associada a uma poro do terreno. A resoluo do sistema dada pela relao entre o tamanho da clula no mapa ou documento e a rea por ela coberta no terreno, como mostrado na Figura 1.17.

Figura 1.17 Estrutura matricial.

A estrutura matricial pode ser utilizada para representar diferentes tipos de dados:

34

1 Representao computacional de dados geogrficos

Grade regular: representao matricial de dimenso dois e meio na qual cada elemento da matriz est associado a um valor numrico, como mostra a Figura 1.18 esquerda. Matriz temtica: representao matricial 2D na qual cada valor da matriz um cdigo correspondente uma classe do fenmeno estudado, como mostra a Figura 1.18 direita.

Figura 1.18 esquerda, grade regular com valores de temperatura em graus Celsius e, direita, matriz temtica com dados classificados (1 = 15-20 graus, 2 = 20-25 graus, 3 = 25-35 graus).

1.7.7 Espaos celulares: generalizao de estruturas matriciais Um espao celular uma estrutura matricial generalizada onde cada clula est associada a vrios tipos de atributos. Os espaos celulares tm vrias vantagens sobre estruturas matriciais simples. Usando matrizes com um nico atributo (como o caso dos dados mostrados na Figura 1.18), um fenmeno espao-temporal complexo precisa de vrias matrizes separadas para ser representado, o que resulta em maior dificuldade de gerncia e de interface. Num espao celular, a mesma clula est associada a diferentes informaes, com ganhos significativos de manuseio dos dados. Os espaos celulares so muito convenientes para armazenamento em bancos de dados objeto-relacionais. Toda a estrutura de um espao

Universo estrutural

35

celular pode ser armazenada numa nica tabela, o que faz o manuseio dos dados ser bem mais simples que os dados vetoriais ou mesmo que os dados matriciais indexados. Aplicaes como lgebra de mapas e modelagem dinmica ficam mais simples de implementar e operar. Um exemplo de espao celular mostrado na Figura 1.19, onde mostramos uma parte de um banco de dados onde h um espao celular onde a Amaznia foi dividida em clulas de 25 x 25 km2; cada uma delas est associada a diferentes atributos socioeconmicos e ambientais (na Figura 1.19, o atributo visualizado umidade mdia nos trs meses mais secos do ano). Os espaos celulares ainda no so estruturas de dados comuns nos bancos de dados geogrficos, e atualmente apenas a TerraLib tem suporte para este tipo de estrutura (vide Captulo 12). Com a nfase crescente dos SIG em modelos dinmicos, podemos prever que esta estrutura ser futuramente amplamente disponvel nas diferentes implementaes de bancos de dados geogrficos.

Figura 1.19 Espao celular com a Amaznia dividida em clulas de 25 x 25 km2; o atributo visualizado umidade mdia nos trs meses mais secos do ano (cortesia: Ana Paula Dutra de Aguiar).

36

1 Representao computacional de dados geogrficos

1.8 Do universo formal para o universo estrutural A passagem do universo formal (geo-campos, geo-objetos e redes) para o universo estrutural no unvoca. Para cada tipo de entidade do modelo formal, h diferentes possibilidades de uso de estruturas de dados, a saber: Geo-objetos: como as fronteiras so elementos essenciais, so usualmente armazenados em estruturas poligonais, com as opes polgonos sem topologia ou topologia arco-n-polgono. Redes: como a topologia parte essencial, as redes devem ser armazenadas como um grafo orientado. Geo-campos numricos: podem ser armazenados como amostras 2,5D, malhas triangulares ou grades regulares. Geo-campos temticos: admitem o armazenamento como estruturas vetoriais (polgonos) ou matriciais (matrizes temticas). Os diferentes compromissos de armazenamento para as entidades do modelo formal so discutidos a seguir. Note-se que um espao celular (discutido na Seo 1.7.7) pode guardar uma combinao arbitrria de geo-campos numricos e temticos. 1.8.1 Estruturas de dados para geo-objetos A escolha entre estruturas topolgicas ou no-topolgicas para geoobjetos em bancos de dados geogrficos depende tambm do suporte oferecido pelo SGBD. Nos SIG cujas estruturas de dados geomtricas so manuseadas fora do SGBD (como o SPRING e o Arc/Info), comum a escolha da topologia arco-n-polgono. No caso dos bancos de dados geogrficos, a maneira mais simples de armazenar geo-objetos guardando cada um deles separadamente, o que implica em estruturas no-topolgicas. Esta forma de trabalho foi sancionada pelo consrcio Open GIS e suportada pelos diferentes SGBDs (Oracle, PostgreSQL, mySQL). No entanto, vrias aplicaes requerem o uso da topologia arco-n-polgono, e alguns SGBDs com suporte espacial j esto incluindo esta opo, com o Oracle Spatial (Ravada, 2003).

Do universo formal para o universo estrutural

37

1.8.2 Estruturas de dados para geo-campos temticos Geo-campos temticos admitem tanto a representao matricial quanto a vetorial. Para a produo de cartas e em operaes onde se requer maior preciso, a representao vetorial mais adequada. As operaes de lgebra de mapas so mais facilmente realizadas no formato matricial. No entanto, para um mesmo grau de preciso, o espao de armazenamento requerido por uma representao matricial substancialmente maior. Isto ilustrado na Figura 1.20.

Figura 1.20 Geo-campo temtico em estruturas vetorial e matricial.

A Tabela 1.3 apresenta uma comparao entre as vantagens e desvantagens de armazenamento matricial e vetorial para geo-campos temticos. Esta comparao leva em conta os vrios aspectos: relacionamentos espaciais, anlise, armazenamento. Nesta tabela, o formato mais vantajoso para cada caso apresentado em destaque. O armazenamento de geo-campos temticos em estruturas vetoriais uma herana da cartografia, onde limites entre classes temticas eram desenhados com preciso em mapas. No entanto, sabemos que estes limites so imprecisos, na grande maioria dos casos. Assim, como nos ensina Peter Burrough, as estruturas matriciais so mais adequadas: Os limites desenhados em mapas temticos (como solo, vegetao, ou geologia) raramente so precisos e desenha-los como linhas finas muitas vezes no representa adequadamente seu carter. Assim, talvez

38

1 Representao computacional de dados geogrficos

no nos devamos preocupar tanto com localizaes exatas e representaes grficas elegantes. Se pudermos aceitar que limites precisos entre padres de vegetao e solo raramente ocorrem, ns estaramos livres dos problemas de erros topolgicos associados como superposio e interseo de mapas(Burrough, 1986).
Tabela 1.3 Comparao entre estruturas vetoriais e matriciais para mapas temticos Aspecto Armazenamento Algoritmos Escalas de trabalho Vetorial Por coordenadas (mais eficiente) Problemas com erros geomtricos Adequado tanto a grandes quanto a pequenas escalas Representao indireta de fenmenos contnuos lgebra de mapas limitada Matricial Requer mais espao de armazenamento Processsamento mais rpido e eficiente. Mais adequado para pequenas escalas (1:25.000 e menores) Representa melhor fenmenos com variao contnua no espao Simulao e modelagem mais fceis

Anlise, Simulao e Modelagem

1.8.3 Estruturas de dados para geo-campos numricos Para geo-campos numricos, a escolha bsica se d entre malhas triangulares e grades regulares. As demais estruturas de dados (amostras 2,5D e isolinhas) so formatos intermedirios, utilizados para entrada ou sada de dados, mas no adequadas para anlise. As malhas triangulares so normalmente melhores para representar a variao do terreno, pois capturam a complexidade do relevo sem a necessidade de grande quantidade de dados redundantes. As grades regulares tm grande redundncia em terrenos uniformes e dificuldade de adaptao a relevos de natureza distinta no mesmo mapa, por causa da grade de amostragem fixa.

Universo de implementao

39

Para o caso de variveis geofsicas e para operaes como visualizao 3D, as grades regulares so preferveis, principalmente pela maior facilidade de manuseio computacional. A Tabela 1.4 resume as principais vantagens e desvantagens de grades regulares e malhas triangulares.
Tabela 1.4 Estruturas para geo-campos numricos Malha triangular Vantagens Melhor representao de relevo complexo Incorporao de restries como linhas de crista Complexidade de manuseio Grade regular Facilita manuseio e converso Adequada para dados noaltimtricos Representao relevo complexo Clculo de declividade

Problemas

1.8.4 Representaes computacionais de atributos de objetos Entende-se por atributo qualquer informao descritiva (nomes, nmeros, tabelas e textos) relacionada com um nico objeto, elemento, entidade grfica ou um conjunto deles, que caracteriza um dado fenmeno geogrfico. Nos bancos de dados geogrficos, os atributos de objetos geogrficos so armazenados em relaes convencionais. As representaes geomtricas destes objetos podem ser armazenadas na mesma tabela que os atributos ou em tabelas separadas, mas ligadas por identificadores nicos. Estes aspectos so discutidos em maior detalhe nos captulos 3, 5, e 8 deste livro. 1.9 Universo de implementao No universo de implementao, so tomadas as decises concretas de programao e que podem admitir nmero muito grande de variaes. Estas decises podem levar em conta as aplicaes s quais o sistema voltado, a disponibilidade de algoritmos para tratamento de dados geogrficos e o desempenho do hardware. Neste livro, aspectos do universo de implementao so tratados em diferentes captulos:

40

1 Representao computacional de dados geogrficos

Os algoritmos de geometria computacional para problemas como ponto-em-polgono, simplificao de linhas e interseco de linhas e polgonos so tratados no Captulo 2. Os problemas de indexao espacial, que representam um componente determinante no desempenho total do sistema, so abordados no Captulo 6. As questes de processamento e otimizao de consultas espaciais so discutidas no Captulo 7. Uma discusso detalhada dos SGBDs com suporte espacial apresentada no Captulo 8. Os Captulo 12 a 14 apresentam a biblioteca TerraLib, um ambiente para construo de aplicativos geogrficos. 1.10 Leituras suplementares Este Captulo apresentou uma viso geral dos diferentes aspectos envolvidos com a representao computacional dos dados geogrficos, que o grande objetivo dos bancos de dados geogrficos. Para uma viso geral de geoinformao sob o ponto de vista da Cincia da Computao, a referncia mais atualizada Worboys e Duckham (2004). O livro de Druck et al (2004) apresenta uma discusso sobre as questes de anlise espacial de dados geogrficos. Sobre o tema de bancos de dados geogrficos, os livros de Rigaux et al (2002) e Shekar e Chawla (2002) so leituras complementares a este livro. A coletnea editada por Sellis et al (2003) apresenta um conjunto de artigos excelentes sobre os problemas emergentes de bancos de dados espao-temporais.

Referncias

41

Referncias
BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The Semantic Web. Scientific American, v. May, 2001. BIRKIN, M.; CLARKE, G.; CLARKE, M. P.; WILSON, A. Intelligent GIS : Location Decisions and Strategic Planning. New York: John Wiley, 1996. BONDY, J. A.; MURTY, U. S. R. Graph Theory with Applications. London: The Macmillan Press LTD, 1977. BNISCH, S.; ASSAD, M. L.; CMARA, G.; MONTEIRO, A. M. Representao e Propagao de Incertezas em Dados de Solos: I - Atributos Numricos. Revista Brasileira de Cincia do Solo, v. 28, n.1, p. 33-47, 2004. BURROUGH, P. Principles of Geographical Information Systems for Land Resources Assessment. Oxford, England, Oxford University Press, 1986. CALDEIRA, T. Cidade de Muros: Crime, Segregao e Cidadania em So Paulo (City of Walls: Crime, Segregation and Citizenship in Sao Paulo). So Paulo: Edusp, 2000. CMARA, G. Modelos, Linguagens e Arquiteturas para Bancos de Dados Geogrficos.So Jos dos Campos, SP: Instituto Nacional de Pesquisas Espaciais (INPE), 1995.Ph.D., 1995. CMARA, G.; SOUZA, R.; FREITAS, U.; GARRIDO, J. SPRING: Integrating Remote Sensing and GIS with Object-Oriented Data Modelling. Computers and Graphics, v. 15, n.6, p. 13-22, 1996. CMARA, G. S., R.C.M.; MONTEIRO, A.M.V.; PAIVA, J.A.C; GARRIDO, J. Handling Complexity in GIS Interface Design. In: I Brazilian Workshop on Geoinformatics. SBC, Campinas, SP, 1999. CASTELLS, M. A Sociedade em Rede. So Paulo: Paz e Terra, 1999. CHEN, P. S. S. The Entity-Relationship Model: Towards a Unified View of Data. ACM Transactions on Database Systems, v. 1, n.1, p. 9-36, 1976. COUCLELIS, H. From Cellular Automata to Urban Models: New Principles for Model Development and Implementation. Environment and Planning B: Planning and Design, v. 24, p. 165-174, 1997. DAVIS, C.; BORGES, K.; LAENDER, A. OMT-G: An Object-Oriented Data Model for Geographic Applications. GeoInformatica, v. 3, n.1, 2002.

42

1 Representao computacional de dados geogrficos

DRUCK, S.; CARVALHO, M. S.; CMARA, G.; MONTEIRO, A. M. V. Anlise Espacial de Dados Geogrficos. Braslia: EMBRAPA (ISBN 857383-260-6), 2004. EGENHOFER, M. Spatial SQL: A Query and Presentation Language. IEEE Transactions on Knowledge and Data Engineering, v. 6, n.1, p. 86-95, 1994. EGENHOFER, M.; FRANZOSA, R. Point-Set Topological Spatial Relations. International Journal of Geographical Information Systems, v. 5, n.2, p. 161-174, 1991. ESRI, 2000, Modelling Our World : The ESRI Guide to Geodatabase Design, Redlands, CA. FONSECA, F.; DAVIS, C.; CAMARA, G. Bridging Ontologies and Conceptual Schemas in Geographic Applications Development. Geoinformatica, v. 7, n.4, p. 355-378, 2003. GODIN, L. GIS in Telecommunications. Redlands, CA: ESRI Press, 2001. GINZBURG, C. Olhos de Madeira: Nove Reflexes sobre a Distncia. So Paulo: Companhia das Letras, 2001. GOMES, J.; VELHO, L. Abstraction Paradigms for Computer Graphics. The Visual Computer, v. 11, n.5, p. 227-239, 1995. GROSS, J.; YELLEN, J. Graph Theory and Its Applications. Boca Raton, FL: CRC Press, 1998. GRUBER, T. R. Toward Principles for the Design of Ontologies Used for Knowledge Sharing. Int. Journal of Human-Computer Studies, v. 43, p. 907-928, 1995. HOHL, P. GIS Data Conversion: Strategies, Techniques, and Management. Clifton Park, NY: OnWorld Press, 1998. KRAAK, M.-J.; BROWN, A., eds., 2001, Web Cartography. London, Taylor and Francis. KUHN, W.; FRANK, A., 1991. A Formalization of Metaphors and ImageSchemas in User Interfaces. In: MARK, D.; FRANK, A., eds., Cognitive and Linguistic Aspects of Geographic Space: Dordrecht, Kluwer Academic Publishers, p. 419-434. LI, Z.; ZHU, Q.; GOLD, C. Digital Terrain Modeling: Principles and Methodology. London: Taylor and Francis, 2004. MACEACHREN, A. M. How Maps Work : Representation, Visualization, and Design. New York: Guilford Press, 2004.

Referncias

43

MASSEY, D. S.; DENTON, N. A. American Apartheid: Segregation and the Making of the Underclass. Cambridge: Harvard University Press, 1993. MATHER, P. M. Computer Processing of Remotely-Sensed Images : An Introduction (3rd ed). New York: John Wiley, 2004. MONMONIER, M. Mapping It Out: Expository Cartography for the Humanities and Social Sciences. Chicago: University of Chicago Press, 1993. NOY, N. F.; SINTEK, M.; DECKER, S.; CRUBEZY, M.; FERGERSON, R. W.; MUSEN, M. A. Creating Semantic Web Contents with Protege-2000. IEEE Intelligent Systems, v. 16, n.2, p. 60-71, 2001. OGC, 1998, The OpenGIS Specification Model: The Coverage Type and Its Subtypes, Wayland, MA, Open Geospatial Consortium. PARDINI, R.; SOUZA, S.; BRAGANETO, R.; METZGER, J.-P. The role of forest structure, fragment size and corridors in maintaining small mammal abundance and diversity in an Atlantic forest landscape. Biological Conservation, v. 124, p. 253-266, 2005. RAVADA, S. Topology Management in Oracle Spatial 10g. Dagstuhl Seminar on Computational Cartography and Spatial Modelling, 2003. http://www.dagstuhl.de/03401/Materials/. RICHARDS, J.; EGENHOFER, M. A Comparison of Two DirectManipulation GIS User Interfaces for Map Overlay. Geographical Systems, v. 2, n.4, p. 267-290, 1995. RIGAUX, P.; SCHOLL, M.; VOISARD, A. Spatial Databases with Application to GIS. San Francisco: Morgan Kaufman, 2002. RUMBAUGH, J.; BLAHA, M.; PREMERLANI, W.; EDDY, F.; LORENSEN, W. Object-Oriented Modeling and Design. Englewood Cliffs, NJ: Prentice-Hall, 1991. SANTOS, M. Espao e Mtodo. So Paulo: Nobel, 1985. SEARLE, J. R. Rationality and Realism, What is at Stake? Ddalus, v. 122, n.4, 1993. SEARLE, J. R. Mind, Language and Society. New York: Basic Books, 1998. SELLIS, T.; FRANK, A. U.; GRUMBACH, S.; GUTING, R. H.; KOUBARAKIS, M., eds., 2003, Spatio-Temporal Databases: The Chorochronos Approach: Berlin, Springer. SHEKHAR, S.; CHAWLA, S. Spatial Databases: A Tour. New York: Prentice-Hall, 2002.

44

1 Representao computacional de dados geogrficos

SMITH, B., 2003. Ontology and Information Systems. In: ZALTA, E. N., ed., The Stanford Encyclopedia of Philosophy. The Metaphysics Research Lab, Center for the Study of Language and Information.: Stanford, Stanford University. SMITH, B.; MARK, D. Ontology and Geographic Kinds. In: International Symposium on Spatial Data Handling. Vancouver, Canada, 1998. p. 308320. SPOSATI, A. Mapa de Excluso/Incluso Social de So Paulo. So Paulo: EDUC, 1996. STEVENS, S. S. On the theory of scales of measurement. Science, v. 103, n.2684, p. 677-680, 1946. TOMLIN, C. D. Geographic Information Systems and Cartographic Modeling. Englewood Cliffs, NJ: Prentice-Hall, 1990. TORRES, H. Segregao residencial e polticas pblicas: So Paulo na dcada de 1990 (Spatial segregation and public policies: So Paulo in the 1990s). Revista Brasileira de Cincias Sociais (Brazilian Social Sciences Journal), v. 54, p. 41-56, 2004. TUFTE, E. The Visual Display of Quantitative Information. Chesire, CT: Graphics Press, 1983. WHITE, M. J. The measurement of spatial segregation. American Journal of Sociology, v. 88, p. 1008-1018, 1983. WORBOYS, M. F.; DUCKHAM, M. GIS - A Computing Perspective (2nd edition). Boca Raton: CRC Press, 2004.