Você está na página 1de 9

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

APLICAO DA TECNOLOGIA DE SISTEMAS DE SUPORTE DECISO NO PLANEJAMENTO URBANO MUNICIPAL: UMA PROPOSTA PARA O MUNICPIO DE MACA Alan Carvalho Galante (UCAM) (1) Jorge Lus Nunes e Silva Brito (UERJ) (2)
Rua Anita Peanha, n 100 - Parque So Caetano - Campos dos Goytacazes/RJ alancarvalho@gmail.com

(1) Universidade Cndido Mendes - Campos (UCAM)

Programa de Ps-Graduao em Engenharia da Computao Geomtica Rua So Francisco Xavier, 524 Maracan Rio de Janeiro RJ CEP 20559-900 jnunes@uerj.br

(2)Universidade do Estado do Rio de Janeiro

RESUMO
O municpio de Maca representa uma das maiores economias do Estado do Rio de Janeiro. Com o uso da tecnologia da informao possvel criar uma ferramenta poderosa que d suporte no processo de tomada de deciso do municpio, ajudando na melhoria da qualidade de vida de seus habitantes. Baseado nesta idia, o uso de Sistema de Suporte Deciso permite fornecer diferentes tipos de informao sobre reas do municpio, como sade e educao. Para a unio de todas as informaes usada a tecnologia de datawarehouse e para as consultas so usadas em conjunto as tecnologias de OLAP e SIG. Com essas tecnologias unidas foi possvel construir uma ferramenta automatizada de auxlio ao processo decisrio do municpio de Maca. Palavras chaves: Suporte a Deciso, Sistemas de Gesto do Conhecimento; Datawarehouse; On-line Analytical Processing (OLAP); Sistema de Informao Geogrfica (SIG)

ABSTRACT
The Maca County is one of the greatest economy of the state of Rio de Janeiro. With the use of the information technology is possible to create a powerful tool for supporting the decision making processing for this County, aiding the process of improvement of life quality. For that one, intends to use a Decision Support System able to give different kind of information of County areas, like health and education. For the union of all information the datawarehouse technology will be used. For query implementation the technologies of OLAP and GIS are used together. Therefore, those technologies together make a powerful tool for aiding the decision making process of the Maca County. Keywords: Decision Support System, Knowledge-Management System; DataWarehouse, On-line Analytical Processing(OLAP); GIS

1 INTRODUO O objetivo deste artigo projetar um Sistema de Suporte Deciso (SSD) que integre as tecnologias de Datawarehouse (DW), On-line Analytical Processing (OLAP) e SIG (Sistema de Informao Geogrfica) para o auxlio nas tomadas de deciso no mbito do municpio de Maca.

Segundo Elmasri e Navathe (2001), um Sistema de Suporte Deciso um sistema que leva dados aos decisores de alto nvel de uma organizao para apoiar decises complexas e importantes. O SSD possui conhecimentos especficos sobre o assunto e, mediante as normas de avaliao introduzidas pelo usurio, apresenta soluo otimizada para o problema em questo, auxiliando o processo decisrio. Pode-se destacar entre os SSD: o Datawarehouse, o On-line

Revista de Sistemas de Informao Analytical Processing (OLAP) e os Sistemas de Informao Geogrfica. Segundo Inmon (1992) Datawarehouse corresponde a uma coleo de dados orientada por assuntos, integrada, no voltil, variante no tempo, e que tem por objetivo dar suporte aos processos de tomada de deciso. O Datawarehouse orientado por assunto porque contm informaes sobre temas especficos importantes para a empresa, tais como: produtos, vendas e clientes. A integrao possibilita a obteno de bases de dados diferentes, tanto tecnologicamente quanto geograficamente, num mesmo repositrio de dados, de forma que a rea gerencial da empresa tenha uma viso no somente deste ou daquele setor, mas da organizao como um todo. A no volatilidade se refere ao fato de que o Datawarehouse recebe apenas uma carga de dados inicial e ento fica pronto somente para consultas. A atualizao peridica e incremental, de acordo com uma poltica pr-definida em funo de seu propsito. A variabilidade no tempo se refere ao fato de que o propsito do Datawarehouse mostrar de que forma as informaes contidas nele se comportam em funo do tempo. OLAP se refere a um conjunto de ferramentas que, de forma amigvel e flexvel, fornece ao usurio acesso e anlise de dados ad-hoc, permitindo que datawarehouses sejam usados efetivamente para anlise on-line, provendo respostas rpidas e interativas em consultas analticas complexas. Com o DW, o OLAP capaz de aplicar suas tcnicas de agregao, organizao e sumarizao em grandes volumes de dados, provendo ainda uma visualizao on-line com o uso de ferramentas grficas. No contexto deste artigo, o SIG ser entendido como um Sistema de Suporte Deciso que tem como principal caracterstica de anlise o dado geogrfico. Para isso, a tecnologia SIG utiliza-se de um conjunto de disciplinas e tcnicas como geografia, cartografia, sensoriamento remoto, fotogrametria, modelagem de dados, etc. As tcnicas utilizadas em SIG so denominadas de geoprocessamento. Num SIG, os dados so organizados em camadas ou planos de informao. Aronoff (1995) conceituou camada de dados como um conjunto de caractersticas e atributos geogrficos relacionadas logicamente. Desta forma, pode-se encontrar camadas do tipo rodoviria, ferroviria, hidrogrfica, distritos, bairros, ruas, etc. Para Navathe e Elmasri (2001) um SIG deve ser capaz de realizar as seguintes operaes espaciais: interpolao, interpretao, anlise de proximidade, processamento de imagens e anlises de rede. Um dos fatores com que se deve ter muita cautela no tratamento das informaes, segundo Dias et. al. (2005) a preservao dos dados individuais.

n. 01 Jan./Jun. 2008

Para resolver esse problema usa-se a agregao dos dados, neste caso, dados geogrficos. 2 O MUNICPIO DE MACA O municpio de Maca est localizado na regio Norte Fluminense, interior do estado do Rio de Janeiro, distando 182 quilmetros da capital. Este municpio teve grande projeo nacional aps a instalao da sede da Petrobrs, que trouxe para a regio um grande nmero de empresas prestadoras de servios na rea petrolfera. Graas aos recursos provenientes principalmente dos royalties e da presena da Petrobrs, Maca hoje considerado o quarto municpio em qualidade de vida no Estado, tendo, portanto, grande potencial para investimentos. Localizado entre duas importantes capitais de Estado, Rio de Janeiro e Vitria, Maca conta com boas malhas rodoviria e ferroviria, um aeroporto e um porto - hoje operado pela Petrobrs. Maca tem como acessos principais a BR-101 e a Rodovia Amaral Peixoto (RJ 106). Estima-se sua populao em cerca de 132.461 habitantes, de acordo com o Censo Demogrfico realizado em 2000 pelo Instituto Brasileiro de Geografia e Estatstica (IBGE). A Prefeitura de Maca atualmente encontrase organizada administrativamente em rgos e Unidades, dentre elas: Gabinete do Prefeito, Gabinete do Vice Prefeito, Gerncia Municipal, Procuradoria Geral, Secretarias Municipais, Guarda Municipal de Maca, etc. Cada rgo ou Unidade Administrativa possui a liberdade de desenvolver ou contratar empresas para o desenvolvimento de sistemas para o controle e gerenciamento de suas atividades cotidianas. Alm das informaes j existentes em seus rgos ou Unidades Administrativas, a Prefeitura Municipal, com o propsito de levantar dados especficos, avaliar os servios prestados pela Administrao Municipal e direcionar os futuros investimentos do governo, desenvolveu um programa denominado Maca Cidado. Alm desse programa, a Prefeitura Municipal est desenvolvendo o Projeto Geo-Maca, que tem como propsito adequar o Municpio de Maca s novas tecnologias no trato das informaes e georreferenciar as informaes municipais. O Programa Maca Cidado consiste em uma pesquisa de campo realizada pela prpria prefeitura, cujo propsito o levantamento de informaes sobre a populao, com o objetivo de enriquecer as informaes vindas do IBGE. Este programa foi motivado pela necessidade da Prefeitura de Maca obter de sua populao informaes sobre diversos temas, tais como: educao, sade, infraestrutura, trabalho e renda, esporte e lazer, indicadores sociais, indicadores urbanos, territrio, diviso administrativa, dados domiciliares e dados demogrficos. A consolidao dos dados desses

Revista de Sistemas de Informao diversos temas serve como base para elaborao de estrutura de dados (tabelas) capazes de identificar as carncias e necessidades da populao. A proposta do projeto Geo-Maca a de adequar o municpio de Maca s novas tecnologias no trato da informao. Trata-se de um Sistema de Informaes Cartogrficas (SIC), que tem como proposta georreferenciar as informaes do municpio, de modo que se obtenha uma base cartogrfica digital com a estrutura territorial da regio, a partir da base de setores censitrios do IBGE e do programa MacaCidado. Com o projeto Geo-Maca ficam disponibilizados um conjunto de Mapas, com a Estrutura Territorial e Administrativa do Municpio, alm de Mapas Temticos. 3 O SSD DE MACA Para o desenvolvimento do SSD, foram usados os dados das Unidades Administrativas do municpio, do Projeto Maca Cidado e do Projeto Geo-Maca. Quanto s reas de atuao ou de interesse imediato foram selecionadas a Sade e a Educao, por terem sido julgadas como as reas de maior interesse pela Prefeitura Municipal. As informaes sobre sade provm do Projeto Maca Cidado (dados da populao) e da Secretaria de Sade (Postos de Sade). As informaes sobre a Educao so oriundas do Projeto Maca Cidado (dados da populao) e da prpria Secretaria Municipal de Educao (Escolas). Alm dessas informaes, tambm foram usados os cadastros mobilirio e imobilirio que tambm foram retirados do Projeto Maca Cidado. Todas essas informaes foram unidas atravs do Projeto GeoMaca, que tem vrias dessas informaes georreferenciadas. Desta forma, o SSD estar atendendo ao propsito de trazer tona as necessidades da populao e os resultados j obtidos pelos programas implantados. 4 A DIVISO GEOGRFICA DO MUNICPIO A menor unidade de anlise a ser usada neste trabalho o setor censitrio que, para o Instituto Brasileiro de Geografia e Estatstica (IBGE), corresponde capacidade de levantamento do recenseador, variando por regio em torno de 200 a 400 domiclios. Uma viso da estratgia para a modelagem do espao geogrfico macaense apresentada na figura 1. Pode-se considerar o Bairro como um conjunto de Setores Censitrios, que tambm possuiria informaes sobre tendncias to importantes quanto o Setor Censitrio. Com esta camada geogrfica possvel obter informaes importantes acerca da populao macaense. Pelos dados informados pela prefeitura, o municpio de Maca possui hoje 27 bairros.

n. 01 Jan./Jun. 2008

Setores Administrativos Destaque: Setor Azul

Bairros do Setor Azul Destaque: Bairro Glria

Setores Censitrios do Bairro da Glria

Fig. 1 - Representao do espao geogrfico do municpio de Maca Uma outra camada geogrfica importante administrativamente para o municpio de Maca denomina-se Setor Administrativo. Esta foi criada para facilitar a administrao do municpio. Trata-se dos setores gerenciais dos quais existem 10 setores nomeados por cores. 5 Modelagem do SSD 5.1 Modelando as dimenses geogrficas agregveis Entende-se por dimenso geogrfica agregvel a toda aquela dimenso do modelo multidimensional do Datawarehouse que possui ligao direta com a tabela fato e, alm disso, possui algum atributo geogrfico. Usando a UML, as trs camadas geogrficas so representadas conforme a figura 2, onde um Bairro composto de vrios setores censitrios, e um setor administrativo composto de vrios bairros. Conforme o tratamento usado no Projeto Geo-Maca, considera-se todas as trs camadas como figuras geomtricas do tipo polgono. Alm disso, usa-se o conceito de esteretipos para representar o tipo de figura geomtrica que cada classe representa. Para se evitar complexidades no modelo do Datawarehouse e evitar degeneraes nas dimenses, que poderiam tornar o modelo pouco eficiente em termos de consulta, foi adotada a unio de todas as classes em uma nica classe como recurso para a construo do modelo fsico da dimenso geogrfica, conforme pode ser visto na figura 3. Apesar desse recurso gerar repetio de uma mesma informao vrias vezes nesta classe, deve-se destacar que o propsito de um DW no a facilidade de incluso e excluso como em um modelo para sistemas transacionais, e sim a eficincia das consultas.

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008 entre a dimenso geogrfica e a classe geogrfica no agregvel o posicionamento geogrfico. No modelo usado para o DW implementado para a Prefeitura de Maca, foram usadas as seguintes classes geogrficas no agregveis: escola e UnidadeSade. As Escolas e as Unidades de Sade esto sendo consideradas do tipo ponto. Essas duas classes esto associadas ao modelo atravs da dimenso geogrfica denominada setorcensitario. 5.3 Modelando agregveis as dimenses no geogrficas

Alm das dimenses geogrficas agregveis, das dimenses geogrficas no agregveis e da tabela fato, existem as dimenses que esto ligadas tabela fato e que no possuem nenhuma relao direta com o espao geogrfico. Essas dimenses sero explicadas a seguir. A dimenso condicaomoradia serve para exibir as condies nas quais o cidado est morando no municpio, tais como: a moradia possui filtro de gua, saneamento bsico, etc? A dimenso tempo, pertinente a praticamente todos os DW, existe nesse modelo com o propsito de armazenar o tempo em que as informaes foram carregadas na base de dados. Com essa dimenso ser possvel avaliar as mudanas no municpio ao longo do tempo. A dimenso trabalho exibe as informaes do cidado no que se refere a sua caracterstica trabalhista, tais como: se trabalha, se funcionrio pblico, etc. A dimenso educacao abrange caractersticas do ponto de vista dos estudos do cidado, tais como se ele estuda, qual o grau de escolaridade, etc. A dimenso queixasistemasaude, exibe quais as principais queixas que um cidado possui em relao rea de sade do municpio. Na dimenso problemasaude, esto representadas as informaes referentes aos problemas de sade dos muncipes. Na dimenso deficienciafisica, esto representados os dados referentes as deficincias fsicas mais comuns entre os muncipes. 5.4 O Modelo Multidimensional Fig. 3 - Modelo Fsico das Classes Geogrficas Outro ponto que merece destaque o surgimento de trs atributos: setorcensitariogeo, bairrogeo e setoradministrativogeo. Estes trs atributos correspondem ao armazenamento em banco de dados dos polgonos referentes a cada um setorcensitario. 5.2 Modelando as dimenses geogrficas no agregveis Consideram-se como classes geogrficas no agregveis as classes que no tm ligao direta com a tabela fato do modelo multidimensional. Essas classes, na verdade, estaro associadas a uma dimenso que seja geogrfica, uma vez que a chave de ligao A figura 4 exibe o modelo multidimensional fsico, onde se deve dar destaque tabela fato (indivduo) que tem como sua chave primria as chaves de todas as dimenses agregveis do modelo e a quantidade de pessoas, que corresponde a um contador, quando da ocorrncia de indivduos com as mesmas caractersticas.

Fig. 2 - Representao com UML do espao geogrfico do municpio de Maca

setorcensitario setorcensitario_ID : VARCHAR setorcensitariogeo : POLYGON qtdescolaprivadasetorcensitario : INTEGER qtdunidadesaudesetorcensitario : INTEGER qtdescolapublicasetorcensitario : INTEGER nomebairro : VARCHAR qtdescolaprivadabairro : INTEGER qtdunidadesaudebairro : INTEGER qtdescolapublicabairro : INTEGER bairrogeo : POLYGON qtdunidadesaudesetoradm : INTEGER qtdescolapublicasetoradm : INTEGER setoradministrativ ogeo : POLYGON qtdescolaprivadasetoradm : INTEGER nomesetoradm : VARCHAR

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

Fig. 4 - Modelo Multidimensional Fsico 5.5 Tecnologia utilizada na implementao do SSD Para o emprego do SSD h a necessidade do uso de tecnologias que implementam Datawarehouse, OLAP e SIG de maneira integrada. Uma das preocupaes para a construo dessa ferramenta foi no uso de softwares livre, uma vez que poderia ser provado que qualquer municpio ou empresa capaz de fazer um trabalho de tamanha importncia a baixo custo. O PostgreSQL corresponde a um banco de dados objeto-relacional Espacial, ou seja, um banco de dados capaz de armazenar dados convencionais e dados geogrficos. Quanto aos dados geogrficos, este Sistema de Gerncia de Banco de Dados (SGBD) capaz no s de armazenar estes tipos de dados, mas tambm de executar funes geogrficas sobre esses dados. O PostgreSQL se tornou um banco de dados muito interessante para ser utilizado neste trabalho uma vez que, alm de todas essas capacidades ditas anteriormente, uma ferramenta de distribuio gratuita o que viabiliza o seu uso no s para a aplicao corrente mas tambm para muitas aplicaes do mesmo tipo. O PostgreSQL um SGBD desenvolvido para funcionar tambm em ambientes Linux. Isto proporciona mais uma grande economia na implantao de um sistema com um banco de dados como este, uma vez que o Linux um sistema operacional gratuito e livre com grande aceitao no mercado nos dias de hoje. Este reconhecimento se d em termos de funcionalidades, gerenciamento de redes de computadores e facilidade na interface com o usurio no que se refere ao uso nas estaes de trabalho. Na verdade, o PostgreSQL no possui nativamente todos os tipos e operaes geogrficas contempladas pelo Open GIS, que segundo Buhler e Mckee (2003) uma organizao internacional responsvel pela criao de novas padronizaes tcnicas e comerciais para garantir interoperabilidade em SIG, buscando criar uma especificao de software e novas estratgias empresariais a fim de tornar os sistemas de geoprocessamento abertos e integrar completamente os dados geogrficos e as operaes necessrias para manipul-los. Esses tipos e operaes so implementados atravs de uma extenso do PostgreSQL conhecida por PostGIS. Logo, este implementa as definies do OpenGIS para a SQL, permitindo desta forma que a SQL tenha funes sobre tipos geogrficos. Uma deficincia do PostgreSQL a ausncia de uma ferramenta OLAP integrada ao mesmo. Para isso, foi utilizado neste projeto o PostGeoOLAP que uma ferramenta desenvolvida numa dissertao de mestrado da Universidade Cndido Mendes, cujo propsito, segundo Colonese (2004) a possibilidade de tornar mais simples a modelagem e implementao de um sistema de suporte deciso que integre caractersticas analticas de um Datawarehouse e geogrficas de um SIG, fazendo com que tais conceitos possam coexistir no mesmo modelo, tanto em nvel conceitual quanto em nvel da implementao e, mais

Revista de Sistemas de Informao ainda, que possa ser o mais direto possvel tal mapeamento entre os citados nveis de abstrao. Na verdade, o PostGeoOLAP uma ferramenta OLAP que permite consultas espaciais sobre dimenses geogrficas. No existe sumarizao sobre os dados geogrficos, ou seja, no contemplada a possibilidade de se ter uma tabela fato com dados geogrficos. Temse apenas dimenses (sejam agregveis ou no agregveis) com este tipo de caracterstica. Uma dificuldade dessa ferramenta o tratamento dos dados. Deve haver um primeiro momento onde os dados armazenados no SGBD devem ser tambm armazenados no banco de dados multidimensional (PostgreSQL). Existe tambm um segundo momento, em que os mapas devem estar preparados, dentro de uma ferramenta denominada Planet GIS. Esta ferramenta gratuita, com um potencial geogrfico, mas com pouca ajuda disponvel sobre como utiliz-la. As principais caractersticas do software Planet GIS so: interpretao dos principais formatos de troca (SHP, MIF, DXF, DGN, FEA, SDL, E00), aquisio e edio de todos os tipos de entidades geogrficas, inclusive no formato raster; produo de mapas com grande potencial esttico, criao de mapas temticos de acordo com os atributos desejados, edio e visualizao de atributos vinculados com um banco de dados, vinculao das entidades geogrficas a uma tabela em diversos tipos de banco de dados, possibilitando exibir caractersticas completas de cada entidade. De posse de toda a tecnologia necessria para a criao do SSD, o prximo passo a migrao para o Datawarehouse dos dados vindos da Prefeitura Municipal de Maca. 5.6 A gerao do Banco de Dados Multidimensional A base de dados relacional foi gerada normalmente, atravs de um script com comandos SQL (DDL), de forma a gerar as tabelas e ndices num banco de dados denominado dwprefeitura. importante lembrar que, para agilizar o processo de consultas, foram criados ndices para cada atributo de cada tabela. Cada tabela possui um nmero de ndices sempre igual ao nmero de atributos mais um, pois alm de existir um para cada atributo, tambm existe a chave primria. Os dados convencionais das dimenses agregveis foram retirados do Projeto Maca Cidado. Estes dados foram disponibilizados pela prefeitura, em Microsoft SQL Server. Para alimentar o modelo multidimensional, fez parte deste trabalho o desenvolvimento de um software que realizou todo o procedimento de limpeza, formatao dos dados e armazenamento. Este software realiza uma interao com pessoas identificadas no Projeto Maca Cidado, oriundos da base de dados da Prefeitura de Maca, observando suas caractersticas em todas as dimenses do modelo do Datawarehouse (Condio de Moradia, Caracterstica, Trabalho, Educao, Sade, Queixa do

n. 01 Jan./Jun. 2008 Sistema de Sade, Deficincia Fsica). Caso essa pessoa possua alguma caracterstica que ainda no tenha sido armazenada em alguma dimenso, ele cria aquela caracterstica no modelo multidimensional para s ento armazenar na tabela fato todas as chaves estrangeiras dessas dimenses e atribuir quantidade de pessoas com aquelas caractersticas o valor 1. Quanto migrao das dimenses geogrficas no agregveis, houve duas preocupaes: o tratamento das informaes geogrficas e das informaes no-geogrficas ou transacionais. As informaes no-geogrficas foram provenientes dos rgos responsveis, que disponibilizaram os dados, no formato Microsoft Excel, sem nenhum referenciamento geogrfico, tendo este sido realizado neste trabalho. As informaes sobre as escolas macaenses foram disponibilizadas pela prefeitura no formato Microsoft Excel, contendo as seguintes informaes: Nome da escola, Endereo e foco de ensino da escola (educao infantil, pr-escolar, ensino fundamental, etc.). Essas informaes estavam presentes em trs planilhas distintas, uma das quais apresentava dados de escolas particulares, outra de escolas pblicas municipais e outra de escolas pblicas estaduais. Manualmente, foi gerada uma planilha nica com todas as escolas e criado um atributo que identificava qual o tipo de escola (pblico municipal, pblico estadual ou particular). Nesta mesma planilha, foi feita uma anlise sobre os focos de ensino das escolas e identificados os seguintes atributos: adultos, creche, maternal, prescolar, fundamental 1a. Srie, Fundamental 1a. a 4a. Srie, Fundamental 5a. a 8a. srie, Ensino Mdio, Tcnico e Educao Especial. Desta forma, foi feita uma leitura linha a linha de cada escola, atribuindo-se sim ou no para cada uma dessas caractersticas. Uma vez formada essa planilha contendo 138 registros, bastou usar a prpria aplicao do Microsoft Excel para exportar os dados para o PostgreSQL usando o ODBC para acessar os dados no servidor de banco de dados. O procedimento usado no tratamento dos dados das Unidades de Sade no foi diferente do adotado em relao s Escolas. As informaes foram disponibilizadas numa planilha do Microsoft Excel constando o nome da Unidade de Sade, o tipo (Ambulatrios Especializados, Ncleos de Ateno Sade, Unidades de Sade da Famlia e Unidades Bsicas de Sade, Mista, Coordenadorias, Laboratrios, Ambulatrios, Hospitais), se ou no associada ao SUS e o endereo. Para a exportao da planilha disponibilizada pela prefeitura foi usada a ferramenta de exportao de dados do Microsoft Excel que, atravs de um driver ODBC, levou os 62 registros para o modelo multidimensional. O prximo passo correspondeu transformao dos endereos que estavam registrados nas planilhas em pontos do espao geogrfico para que esses dados estivessem georreferenciados. Como a menor granularidade geogrfica usada no modelo deste trabalho o setor

Revista de Sistemas de Informao censitrio, a preocupao era que as escolas e unidades de sade estivessem posicionadas corretamente dentro do setor censitrio respectivo. Usando os mapas disponibilizados pela Prefeitura Municipal de Maca, o software Planet GIS e as localizaes das dimenses no-agregveis dadas no formato convencional de endereo, cada escola e unidade de sade foram locadas manualmente uma a uma no mapa, gerando, mais duas camadas geogrficas: UnidadesSaude e Escolas. O modelo do mapa usado no software Planet GIS passou a possuir cinco camadas geogrficas distintas: Setor Administrativo, Bairro, Setor Censitrio, Escolas e Unidades de Sade. Os trs primeiros foram disponibilizados pela Prefeitura Municipal de Maca no formato ArcView Shape File, enquanto que os dois subseqentes foram locados e inseridos manualmente integrando um nico arquivo no formato do software Planet GIS. O prximo passo foi levar as informaes geogrficas geradas no Planet GIS para o Datawarehouse. Para isso, foi usada uma ferramenta do Planet GIS que exporta uma camada geogrfica para o formato de banco de dados Dbase IV. Dois arquivos Dbase foram gerados, um com as Unidades de Sade e outro com as Escolas. Nestes arquivos, consta o nome de cada ponto e os valores de X e Y, correspondentes ao posicionamento geogrfico planimtrico em coordenadas cartesianas. Usando o Visual Basic 6.0, foi criado um programa que le esses arquivos e gera um arquivo texto com comandos SQL capaz de criar uma tabela e preencher essa tabela com o nome e o ponto geogrfico usando os X e Ys existentes no arquivo no formato Dbase IV. Uma vez executados esses comandos SQL, duas tabelas temporrias foram geradas no PostgreSQL com as informaes necessrias. Com uma operao SQL simples foi possvel a atualizao das dimenses noagregveis escola e unidadesaude usando os nomes como chave de comparao para ambas. Faltou ainda migrar a dimenso geogrfica agregvel: a dimenso setorcensitario. Esta dimenso migrou em trs etapas: os dados convencionais genricos, os dados geogrficos dos polgonos de cada setor e os totalizadores das dimenses geogrficas noagregveis. Para a migrao dos dados convencionais foi usada a base de dados disponibilizada pela prefeitura em Microsoft SQL Server, em trs tabelas diferentes. Para a gravao dos dados no modelo multidimensional foi utilizada a ferramenta de exportao do prprio SQL Server, via ODBC. Setor Administrativo, Setor Censitrio e Bairro so dimenses geogrficas do tipo polgono. Os mapas geogrficos de cada um foram disponibilizados no formato ArcView Shape File pela Prefeitura Municipal de Maca, oriundos do Projeto Geo-Maca. contidas Para incorporar as informaes geogrficas nesses arquivos ao Banco de Dados

n. 01 Jan./Jun. 2008 multidimensional, foi usado o aplicativo shp2pgsql do prprio PostGeo, capaz de, a partir de um arquivo shape, criar um arquivo com comandos SQL para construir e povoar uma tabela no PostgreSQL e com os dados contidos no formato ArcView Shape. Trs arquivos com comandos SQL foram criados: um para Bairro, outro para Setor Administrativo e mais um para Setor Censitrio. Esses comandos SQL, executados no PostgreSQL, geraram tabelas temporrias. Deste ponto, apenas foram executados comandos SQL de atualizao que comparavam a tabela temporria com a tabela setorcensitario. Primeiro, foram migrados os Setores Censitrios, comparando a tabela temporria com a tabela setorcensitario atravs da chave setorcensitario_id. Depois, foram migrados os Bairros, comparando a tabela temporria com a tabela setorcensitario, atravs da chave nomebairro. Por fim, foram migrados os Setores Administrativos, comparando-se a tabela temporria com a tabela setorcensitario atravs da chave nomesetoradministrativo. Os atributos setorcensitariogeo, bairrogeo e setoradmgeo foram instanciados com o polgono que materializa a sua imagem geomtrica. A ltima etapa da atualizao dos Setores Censitrios a atualizao dos valores referentes s dimenses geogrficas no agregveis. Na verdade, esses totalizadores existem somente para agilizar o processo de consulta. Para isso, foram utilizadas funes geogrficas presentes no PostgreSQL atravs da extenso PostGeo, que associam os pontos das Escolas e Unidade de Sade com os Setores Censitrios, Bairros e Setores Administrativos. 5.7 A preparao do cubo OLAP O prximo passo a configurao do cubo OLAP na ferramenta PostGeoOLAP, que foi denominado pmm. Neste cubo foram adicionadas as dimenses com a preocupao na definio dos nveis de consolidao que se pode ter ao longo de cada dimenso. Esta operao denominada hierarquizao. O software define como Item Numrico todo atributo da tabela fato sobre o qual sero realizadas operaes, tais como: soma, mdia, etc. No caso do cubo pmm, a tabela fato possui um nico item numrico que denominado quantidadepessoas. Este atributo representa a quantidade de pessoas que possuem uma determinada caracterstica. Sobre esse atributo o cubo deve ser capaz de realizar operaes de soma. Depois de definida a tabela fato, passou-se a definir as dimenses agregveis, juntamente com as hierarquias internas de cada dimenso. Por exemplo, na dimenso setorcensitario foram definidos os atributos relativos a setor administrativo como de nvel hierrquico mais alto, os de bairro como de nvel

Revista de Sistemas de Informao hierrquico intermedirio e o nvel mais baixo com os atributos de setor censitrio. Aps a definio da tabela fato e das dimenses, o prximo passo a definio das dimenses geogrficas no agregveis (escola e unidadesaude). Em seguida, realizam-se as pragregaes, baseado na operao definida (soma sobre o atributo quantidadepessoas), em todas as dimenses com suas devidas hierarquias. Isto permite que o software desenvolvido realize a gerao de tabelas com as previses de consultas sobre os dados para agilizar o processo de busca de informaes do usurio. De posse dessas pr-agregaes realizadas, a ferramenta OLAP espacial est pronta para a realizao de consultas online para a validao e busca de informao para o gestor municipal. 6 TESTES E ANLISES DE RESULTADOS Sero abordadas neste item algumas consultas, com o propsito de validar o SSD proposto. Para isso foram levantadas algumas questes junto Prefeitura de Maca para poder dar mais autenticidade e valor aos testes aqui realizados. Para responder a cada questo, primeiramente sero explicados quais atributos de cada dimenso esto envolvidos e, em seguida, apresentada a resposta dada pelo sistema. 6.1 Quantidade de pessoas que possuem mais de 45 anos e esto desempregadas, por Setor Administrativo. Para a realizao desta consulta, esto envolvidas as dimenses caracterstica, trabalho, setorcensitario, alm da tabela fato.

n. 01 Jan./Jun. 2008 operao de totalizao. O resultado pode ser visto na figura 5. 6.2 Quantidade de brancos e outras raas, que estejam cursando o 3o grau, estejam ou no trabalhando. Esta uma consulta que envolve a tabela fato e as dimenses educacao, caracteristica e trabalho. A afirmativa que esto trabalhando e os que no esto trabalhando deve ser vista como uma forma de agrupamento do resultado pelo atributo trabalho da dimenso trabalho. Alm desse agrupamento, entendese que as raas tambm so formas de agrupamento. Desta forma, devem ser exibidos no resultado os atributos quantidadepessoa da tabela fato, o atributo trabalha da dimenso trabalho e o atributo cor_raca da dimenso caracterstica, conforme a figura a seguir.

Fig. 6 - Pessoas cursando o 3o grau por raa e por estar ou no trabalhando 6.3 Quantidade de pessoas que recebem educao especial e moram a mais de 1000 metros de alguma Unidade de Ensino Pblico. Esta consulta exige alguns cuidados envolvendo a tabela fato e as dimenses escola, setorcensitario e educacao, uma vez que somente o seu enunciado no traz todos os filtros realmente existentes. Usa-se o atributo cursoquefrequenta para informar que devem ser envolvidas nesta consulta somente as pessoas que recebem educao especial. Na busca das pessoas que moram a 1000 metros de alguma unidade de ensino pblico h duas dimenses envolvidas: a dimenso agregvel setorcensitario e a dimenso no-agregvel escola. Sobre o atributo geogrfico setorcensitariogeo realiza-se a operao de comparao de distncia sobre o atributo escolageo da dimenso escola, desde que as escolas possuam o atributo educacaoespecial verdadeiro e o atributo tipoadministracao seja diferente de particular. O resultado desta consulta pode ser visto na figura 7.

Fig. 5 - Pessoas com mais de 45 anos, desempregadas por Setor Administrativo. Sobre a dimenso caracteristica deve-se informar que o atributo idade deve ser maior que 45 anos. Sobre a dimenso trabalho, deve-se informar que trabalha possui o valor lgico falso. Na dimenso setorcensitario no ser realizada qualquer seleo, exceto a escolha do atributo nomesetoradm para a exibio, j que assim ser realizado o agrupamento dos dados. Finalmente, na tabela fato, selecionado o atributo quantidadepessoas para a realizao da

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008 um valor muito maior informao. SIG, OLAP e Datawarehouse juntos podem trazer informaes mais precisas e completas ao tomador de deciso; o georreferenciamento das escolas e unidades de sade do municpio que at o momento da realizao deste trabalho ainda no estava disponvel pelo Projeto GeoMaca; o uso de uma ferramenta de interface amigvel para o usurio que no tem necessidade de conhecimento tecnolgico para a busca de informao que at ento seria de difcil acesso e baseada em conhecimento profundo de informtica.

Fig. 7 - Setores Censitrios que possuem pessoas com educao especial morando a mais de 1Km de alguma Unidade de Ensino Pblico 7 CONCLUSO importante salientar que o sistema de elevado potencial de aplicaes pblicas no que se refere ao uso pelo administrador municipal. Para coloc-lo em prtica, basta dar aos administradores municipais um treinamento que o deixe envolvido com as nomenclaturas usadas nos atributos e tambm para o aprendizado no uso do PostGeoOLAP. Uma dificuldade no emprego desta ferramenta est na migrao dos dados, uma vez que qualquer alterao realizada nos dados do Projeto Maca Cidado repercutir em mudanas na ferramenta de migrao dos dados. Mas esse um trabalho transparente ao usurio final. O importante, neste tipo de ferramenta, a facilidade para este usurio do sistema que no necessita ter conhecimentos profundos de informtica para ter as suas informaes em mos. As consultas realizadas destinam-se somente validao do sistema desenvolvido. Espera-se que, com o uso dirio, os usurios apresentem mais necessidades que um sistema com tamanha flexibilidade capaz de lhes oferecer. Espera-se que a pesquisa possa apresentar diversas contribuies, dentre as quais pode-se destacar: os benefcios para o municpio de Maca, em particular, que ter nas mos de seus administradores uma ferramenta capaz de responder muitas das perguntas das quais eles necessitavam de respostas de forma rpida, prtica e eficiente; mostrar que um Sistema de Suporte a Deciso tem grande importncia no mbito municipal, principalmente na organizao de informaes espalhadas, para que decises a favor do municpio e de seus habitantes sejam tomadas de forma mais inteligente, precisa e consciente; a utilizao de ferramentas de distribuio gratuita no desenvolvimento de um Sistema de Suporte Deciso, tentando colocar essa tecnologia cada vez mais disponvel para as mais diversas empresas, sejam de pequeno ou de grande porte, pblica ou privada; a integrao de ferramentas de suporte deciso, dando

8 REFERNCIA BIBLIOGRFICA Aronoff, S. Geographic Information Systems: A Management Perspective. WDL Publications, Ottawa, Canad, 1995. Buehler, K.; Mckee, , L. The OpenGIS Reference. Disponvel em: http://www.opengis.org/info/orm/03-040.doc. ltimo acesso: Setembro de 2003. Colonese, G, 2004. Uma Ferramenta Aberta de Desenvolvimento Integrado de Sistemas de Informao para Processamento Analtico e Geogrfico. Tese de Mestrado, Universidade Cndido Mendes, Campos dos Goytacazes, Brasil, 2004. Dias, T.L.; Oliveira, M.P.G., Cmara, G., S, M. de. Problemas de Escala e a Relao rea-Indivduo em Anlise Espacial de Dados Censitrios. Disponvel em: http://www.ip.pbh.gov.br/sum0401.html. ltimo acesso: Maio, 2005. Inmon, W.H. Building the Data Warehouse, Wiley, 1992. Navathe, S.B. Elmasri, R. Fundamental of Database Systems, Addison-Wesley, 2001. R. Kimball. The Datawarehousing Toolkit. John Wiley & Sons, Nova York, Estados Unidos, 1996. OpenGIS Simple Specifications for SQL Revision 1.1. OpenGis Project Document 99-049. Publicado em 05/05/1999. PlanetGIS guide, verso http://www.planetgis.co.za/. 20/10/2003. 2.29. Disponvel em ltimo acesso em:

PostGIS online documentation, 0.8 version. Disponvel em: http://postgis.refractions.net/. ltimo acesso: 05/02/2004. PostGreSQL 7.4 documentation. Disponvel em http://www.postgresql.org. ltimo acesso: 05/02/2004.

Você também pode gostar