Você está na página 1de 14

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

Uma Ferramenta em Software Livre para o Desenvolvimento de Sistemas de Suporte Deciso


Giovanni Colonese1, Rodrigo Soares Manhes1,2, Sahudy Montenegro Gonzlez2, Alan Carvalho Galante1, Rogrio Atem de Carvalho3, Asterio Kiyoshi Tanaka4 Faculdade Salesiana Maria Auxiliadora (FSMA) Universidade Candido Mendes Campos (UCAM-Campos) 3 Centro Federal de Educao Tecnolgica de Campos (CEFET-Campos) 4 Universidade Federal do Estado do Rio de Janeiro (UNIRIO)
2 1

colonese@lagosnet.com.br, rmanhaes@cefetcampos.br, alancarvalho@gmail.com, sahudy@ucam-campos.br, ratem@cefetcampos.br, tanaka@uniriotec.br

Resumo. Este trabalho descreve PostGeoOlap, uma ferramenta livre e de cdigo aberto para suporte deciso que integra tecnologias OLAP (On-Line Analytical Processing) e SIG (Sistemas de Informao Geogrfica) em uma nica aplicao. Alm de descrever a ferramenta e seu ambiente, procurou-se demonstrar como esta pode ser empregada na obteno de um efetivo suporte deciso sobre uma plataforma de baixo custo, adequada para uso em pequenas e mdias empresas e unidades pblicas de pequeno porte.
1. Introduco As tecnologias da chamada terceira revoluo industrial, a revoluo da microeletrnica iniciada com a inveno do transistor, tm transformado a face do planeta. Embora diferentes autores discordem das suas conseqncias, consenso o entendimento de que a generalizao do microcomputador e o avano das telecomunicaes impulsionam o mundo a um novo patamar [1]. Neste contexto, a informao adquire um imenso valor, seja para, em se tratando de empresas, estar em melhores condies para a concorrncia com seus pares, seja para, falando-se do setor pblico ou organizaes sem fins lucrativos, melhor desempenhar suas tarefas e atender as demandas de seu pblico-alvo. Assim, percebe-se que a informao est, cada vez mais, moldando a maneira como a sociedade trabalha, produz e pensa [1]. Especificamente no que tange ao setor de tecnologia da informao, as diversas instituies tm acumulado grandes quantidades de dados em seus sistemas. Estes dados, porm, para significar algo mais do que meros cadastros e registros operacionais, precisam tomar a forma, mais til e adequada, de informao. Para isto, surgiram os Sistemas de Suporte Deciso, que integram tecnologias como data warehousing, data mining, OLAP (On-Line Analytical Processing), SIG (Sistemas de Informao Geogrfica), KDD (Knowledge Discovery in Databases) e IR (Information Retrieval), entre outras. O objetivo final destas tecnologias permitir ao decisor, normalmente algum que atua nos nveis estratgico ou ttico de uma instituio, visualizar, sob vrias perspectivas, diversos tpicos pertinentes sua rea de atuao. A capacidade de anlise de dados agregados e integrados a partir de diversas fontes faz do data warehouse (DW) e de uma aplicao OLAP que lhe fornea processamento analtico ferramentas indispensveis aos decisores, permitindo observaes e anlises em tempo real do domnio de atuao sob diversas perspectivas. A estas tecnologias, somam-se os SIGs, que utilizam mapas para prover a seus usurios a anlise de

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

dados que possuam atributos referentes ao posicionamento espacial, algo praticamente indispensvel para quem possui alguma dimenso espacial em seu domnio de atuao [2]. Inicialmente tecnologias distintas, OLAP/DW e SIG tm, nos ltimos anos, sido alvo de esforos de inmeros pesquisadores, empreendendo trabalhos no sentido de sua integrao e unificao, de forma a que os Sistemas de Suporte Deciso possam contar, de modo unvoco, com funcionalidades de processamento analtico sobre dados convencionais e geogrficos. Neste contexto, propomos uma ferramenta livre de suporte deciso, chamada PostGeoOlap, que trate as tecnologias OLAP e SIG de forma integrada desde o incio. PostGeoOlap faz parte do projeto GeoOlap, que prope uma tcnica para modelagem de aplicaes desde sua concepo inicial, nas quais a coexistncia entre conceitos espaciais e temporais essencial. O objetivo da ferramenta PostGeoOlap permitir a construo de sistemas de suporte deciso onde, desde a fase de modelagem conceitual, seja possvel tratar aspectos analticos e geogrficos [3]. Assim, PostGeoOlap uma ferramenta que realiza consultas analticas sobre um data warehouse contendo dimenses com atributos geogrficos, no contemplando operaes OLAP automatizadas. 1.1. Trabalhos Relacionados H vrios trabalhos relacionados ao projeto GeoOlap e ferramenta PostGeoOlap. Estes trabalhos possuem diferentes abordagens em relao integrao de tecnologias OLAP e SIG. O projeto GeoMiner [4] permite operaes OLAP em cubos com dados georeferenciados e o projeto MapCube [5] prope operaes sobre um cubo que podem retornar mapas. Ambas as propostas prevem processamento analtico de mapas, mas sem a utilizao de um SIG. Os projetos GOAL (Geographical Information On-Line Analysis) [6], SIGOLAP [7] e GOLAPA (Geographic On-Line Analytical Processing Architecture) [8] no utilizam um modelo unificado com conceitos analticos e geogrficos, mas tratam estas duas tecnologias separadamente, propondo mdulos de integrao que mapeiam requisies e dados de um lado a outro. Os trabalhos em [9], [10] e [11] so os mais prximos abordagem trazida neste artigo (embora ns no consideremos atributos geogrficos nas medidas), mas no propem qualquer tcnica de modelagem de sistemas como um todo, desde seu nvel conceitual, como faz o projeto GeoOlap. 1.1. Motivao Como fato que o custo de aquisio ou licenciamento de sistemas de suporte deciso como aplicaes OLAP ou SIG proibitivo a pequenas e mdias empresas, a presente iniciativa torna acessveis a um pblico muito maior estas tecnologias, normalmente restritas esfera das grandes organizaes. No setor pblico, cujos custos com tecnologia da informao em boa parcela so creditados a licenciamentos de software, tambm possui grande importncia uso do Software Livre, no sentido da economia de recursos, da independncia de fornecedores e, principalmente, da melhoria das condies sociais e da qualidade de vida das populaes, seguramente resultantes da honesta utilizao das citadas tecnologias de suporte deciso. importante frisar que principalmente em pases pobres ou ditos em desenvolvimento como o Brasil, ainda mais importante a adoo de software sem restries de uso ou distribuio e de cdigo aberto, como instrumento para a democratizao da tecnologia e da informao [12, 13]. A configurao atual da economia mundial tem por caracterstica a concentrao da tecnologia na esfera das grandes empresas e corporaes, at que esta se torne obsoleta e, s ento, seja repassada s pequenas e mdias empresas e aos pases ditos em desenvolvimento . Neste sentido, o Software Livre um instrumento de democratizao tecnolgica, indo na contramo destas tendncias centralizadoras, na medida em que permite que o acesso s

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

tecnologias mais recentes seja simultneo para pequenas e grandes organizaes, para pases pobres e ricos. Num contexto mais localizado, pode-se facilmente vislumbrar a imensa gama de projetos envolvendo suporte deciso baseado em OLAP e SIG que empresas e instituies que antes no possuam acesso a tais tecnologias, principalmente devido aos custos proibitivos de licenciamento, podero desenvolver com o apoio do PostGeoOlap A ferramenta vem sendo utilizada em uma empresa distribuidora de publicaes de editoras nacionais, em pontos de venda no Norte Fluminense, e, no contexto de gesto municipal, em aplicaes espaciais nos municpios de Maca RJ [14], e Cachoeiro do Itapemirim ES. Outras aplicaes esto sendo consideradas e propostas, inclusive internacionalmente, a partir da incluso do projeto no PGFoundry, a incubadora de projetos do SGBD PostGreSQL, no endereo http://postgeoolap.projects.postgresql.org. 2. Descrio da Ferramenta PostGeoOlap uma ferramenta para a criao de solues OLAP espaciais sobre o SGBD PostGreSQL e o PostGIS, sua extenso espacial. O nome PostGeoOlap tem origem na integrao entre funcionalidades geogrficas, tecnologia OLAP e PostGreSQL. 2.1. Princpios de Projeto Para a construo da ferramenta PostGeoOlap, adotou-se o paradigma de Software Livre como princpio de projeto. Assim, todas as APIs, frameworks e softwares de persistncia de dados utilizados neste projeto so open-source. Deste modo, pode-se atingir um dos objetivos do projeto, que prover uma plataforma de baixo custo para OLAP espacial, permitindo a pequenas e mdias organizaes o desenvolvimento de aplicaes de data warehousing e SIG, o que outrora, lhes seria proibido devido aos altssimos custos de licenciamento de solues proprietrias para estes fins. Para o projeto de PostGeoOLAP adotou-se ROLAP (Relational OLAP) como modelo de armazenamento do data warehousing para obter as vantagens da maturidade da tecnologia de SGBDs objeto-relacionais, que possuem a capacidade de armazenar tanto dados convencionais quanto geogrficos e usar funes de agregao e funes espaciais sobre eles, alm de permitir a adio customizada de funcionalidades. Assim, ambas as pesquisas, geogrficas ou analticas convencionais, sero processadas e respondidas pelo SGBD PostGreSQL e todos os dados, desde o nvel base at as agregaes, sero mantidos no modelo relacional. 2.2. Modelo e Arquitetura O diagrama de classes na Figura 1 representa os metadados utilizados pelo PostGeoOlap para a manuteno dos dados no data warehouse. A classe Esquema representa o banco de dados (database) no PostGreSQL que contm o data warehouse de interesse. A classe Cubo representa um hipercubo, ou, no nvel do usurio, cada perspectiva de negcio pela qual um Esquema pode ser analisado. A classe Tabela representa todas as relaes existentes no data warehouse. A classe Dimensao uma subclasse de Tabela e se refere a todos os componentes de um cubo, tanto tabelas fato quanto dimenses. A classe Atributo representa os dados existentes em cada Tabela. O auto-relacionamento indica que um atributo convencional est funcionando como rtulo para um ou mais atributos geogrficos. A classe Agregacao representa as vrias hierarquias para os atributos de uma dimenso. A classe ItemHierarquia aloca cada Atributo a uma Hierarquia.

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

Figura 1. Modelo conceitual do PostGeoOlap. O SGBD PostGreSQL utilizado pelo PostGeoOlap para a realizao das funes convencionais de agregao padro SQL (e.g. sum, max, min, avg, count) e todas as funes geogrficas definidas pelo Open Geospatial Consortium, nas especificaes OpenGIS [15]. 2.2 Funcionalidades Os casos de uso do PostGeoOlap esto resumidos na Tabela 1. Os casos de uso Criar esquema, Criar cubo e Adicionar dimenso trabalham na construo da estrutura dos cubos que sero verificados e processados pelo PostGeoOlap. Aps a definio do esquema e do cubo, com a adio das dimenses, a ferramenta est pronta para o processamento do cubo. Nesta operao, explicitada pelo caso de uso Processar cubo, o desempenho das pesquisas no cubo inferido e, caso caia para abaixo de um patamar mnimo pr-estabelecido, a aplicao cria uma nova estrutura de agregao representada por uma tabela. A agregao realizada em trs passos: a) criao da tabela que conter os dados agregados; b) transferncia dos dados agregados para a nova tabela; c) e criao dos ndices para a nova tabela, utilizando estruturas de rvore-B para atributos convencionais e GiST (Generalized Search Tree) [16] para os atributos espaciais. Ambas as estruturas de indexao so oferecidas pelo PostGreSQL.

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

CASO DE USO Criar esquema Criar cubo

Adicionar dimenso

Processar cubo

Adicionar dimenso no agregvel

DESCRIO Cria uma conexo com um banco de dados (database) no PostGreSQL e persiste os metadados necessrios. Cria um cubo dentro de um esquema, selecionando uma tabela fato e definindo seus itens numricos e as operaes desejadas sobre estes itens. Cria uma perspectiva para a anlise dos dados contidos na tabela fato previamente definida, selecionando uma das tabelas relacionadas ao esquema. Tambm define a hierarquia dos atributos da dimenso, atribuindo um nvel numrico para cada um. Verifica a massa de dados referenciada pelo cubo e tenta inferir o desempenho de consultas em tempo de execuo. As consultas avaliadas como tendo um baixo desempenho so otimizadas atravs de agregaes. Isto permite que o cubo possa ser analisado atravs de qualquer das dimenses, dentro de um tempo de resposta aceitvel. Cria uma dimenso que, apesar de no constituir uma perspectiva de anlise e, assim, no participando do processamento do cubo, serve como referncia para comparaes geogrficas com outras dimenses que possuam atributos geogrficos.

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

Analisar dados

Oferece uma interface visual que permita a seleo de atributos para consulta utilizando restries convencionais e/ou geogrficas. Os resultados so visualizados tanto na forma tabular quanto na forma cartogrfica, caso necessrio. Tabela 1. Lista de casos de uso do PostGeoOlap

2.3. Sistema Gerenciador de Banco de Dados utilizado O SGBD utilizado pelo PostGeoOlap o PostgreSQL, que corresponde a um banco de dados objeto-relacional Espacial, ou seja, um banco de dados capaz de armazenar dados convencionais e dados geogrficos. Quanto aos dados geogrficos este SGBD capaz no s de armazenar estes tipos de dados, mas tambm de executar funes geogrficas sobre esses dados. O PostgreSQL se tornou um banco de dados muito interessante para ser utilizado neste trabalho uma vez que, alm de todas essas capacidades ditas anteriormente, uma ferramenta de distribuio gratuita o que viabiliza o seu uso no s para a aplicao corrente mas tambm para muitas aplicaes do mesmo tipo. O PostgreSQL um SGBD desenvolvido para funcionar tambm em ambientes Linux. Isto proporciona mais uma grande economia na implantao de um sistema com um banco de dados como este, uma vez que o Linux um sistema operacional gratuito e livre com grande aceitao no mercado nos dias de hoje. Este reconhecimento se d em termos de funcionalidades, gerenciamento de redes de computadores, e facilidade na interface com o usurio no que se refere ao uso nas estaes de trabalho. Na verdade, o PostgreSQL no possui nativamente todos os tipos e operaes geogrficas contempladas pelo OpenGIS, que uma organizao internacional responsvel pela criao de novas padronizaes tcnicas e comerciais para garantir interoperabilidade em SIG, buscando criar uma especificao de software e novas estratgias empresariais, a fim de tornar os sistemas de geoprocessamento abertos e integrar completamente os dados geogrficos e as operaes necessrias para manipul-los. Esses tipos e operaes so implementados atravs de uma extenso do PostGreSQL conhecida por PostGIS. Logo, este implementa as definies do OpenGIS para a SQL, permitindo desta forma que a SQL tenha funes sobre tipos geogrficos. 2.4. Visualizao e Tratamento de Mapas Para a visualizao e tratamento de mapas e dados geogrficos, foi necessria a incluso, na ferramenta, de algum tipo de biblioteca ou componente que pudesse realizar estas funes. JUMP (acrnimo recursivo para JUMP Unified Mapping Platform) uma aplicao GUI (Graphical User Interface) para visualizao e processamento de dados espaciais, incorporando funcionalidades existentes em muitos outros SIGs direcionados a anlise e manipulao de dados geoespaciais. O JUMP tambm oferece um framework altamente extensvel para o desenvolvimento e a execuo de aplicaes customizadas de processamento de dados espaciais. Esta ltima caracterstica interessa diretamente ao desenvolvimento do projeto PostGeoOlap, pois neste se utilizam classes de visualizao e processamento de dados geogrficos fornecidas pelo framework JUMP. O JUMP dispe, assim, de uma API (Application Programming Interface) que possibilita pleno acesso, via programao, a todas as funes, visualizao de mapas e operaes espaciais. As consultas espaciais realizadas pelo PostGeoOlap, deste modo, utilizam-se de classes de visualizao e processamento do JUMP para apresentar os resultados, cartograficamente, ao usurio. O JUMP inteiramente escrito na linguagem Java, sendo distribudo atravs da licena GPL (General Public License), o que o torna tambm aderente aos conceitos do Software Livre. Em termos de compatibilidade, JUMP aderente s especificaes do OpenGIS, atravs do uso de classes de um co-projeto, o JTS Topology Sute (JTS), que fornece funcionalidades de predicados espaciais, operaes topolgicas, e outras caractersticas, implementando a especificao OpenGIS de Feies Simples para SQL [15].

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

O JUMP implementa, tambm, um vasto conjunto de funcionalidades e as oferece inteiramente ao acesso programtico, tais como rotulao por atributo com resoluo de conflitos, colorizao por atributo, estatsticas por camada, estatsticas por feio, operaes geomtricas como interseo, unio, diferena e diferena simtrica, sobreposio de mapas, validao geomtrica e outras. Posteriormente, a empresa responsvel pelo desenvolvimento do JUMP descontinuou o projeto, que, por ser Software Livre, pde ter seu desenvolvimento levado adiante pela comunidade, sob o nome de OpenJUMP. 3. Estudo de Caso Nesta seo ser apresentado um estudo de caso de aplicao do modelo de integrao e da ferramenta propostos no presente trabalho, com vistas a produzir do zero um novo sistema de suporte deciso que integre funcionalidades analticas e geogrficas, desde o nvel mais alto de concepo, destinado ao auxlio tomada de deciso nos setores de Educao e Sade da Prefeitura e Maca. O municpio de Maca est localizado na regio Norte do estado do Rio de Janeiro, distando 182 quilmetros da capital. Este municpio teve grande projeo nacional aps a instalao da sede da Petrobrs, que trouxe para a regio um grande nmero de empresas prestadoras de servios na rea petrolfera. Graas aos recursos provenientes principalmente dos royalties e da presena da Petrobrs, Maca hoje considerado o quarto municpio em qualidade de vida no Estado, tendo, portanto, grande potencial para investimentos. Localizado entre duas importantes capitais de Estado, Rio de Janeiro e Vitria, Maca conta com boas malhas rodoviria e ferroviria, um aeroporto e um porto - hoje operado pela Petrobrs. Maca tem como acessos principais a BR-101 e a Rodovia Amaral Peixoto (RJ 106). Estima-se sua populao em cerca de 132.461 habitantes de acordo com o Censo Demogrfico realizado em 2000 pelo Instituto Brasileiro de Geografia e Estatstica (IBGE). 3.1. O Projeto Geo-Maca Para o desenvolvimento do SSD, foram usados os dados das Unidades Administrativas do municpio, do Projeto Maca Cidado e do Projeto Geo-Maca. Quanto s reas de atuao ou de interesse imediato foram selecionadas a Sade e a Educao, por terem sido julgadas como as reas de maior interesse pela Prefeitura Municipal. As informaes sobre sade provem do Projeto Maca Cidado (dados da populao) e da Secretaria de Sade (Postos de Sade). As informaes sobre a Educao so oriundas do Projeto Maca Cidado (dados da populao) e da prpria Secretaria Municipal de Educao (Escolas). Alm dessas informaes, tambm foram usados os cadastros mobilirio e imobilirio que tambm foram retirados do Projeto Maca Cidado. Todas essas informaes foram unidas atravs do Projeto Geo-Maca, que tem vrias dessas informaes georreferenciadas. Desta forma, o SSD estar atendendo ao propsito de trazer tona as necessidades da populao e os resultados j obtidos pelos programas implantados. 3.2. A diviso geogrfica do Municpio A menor unidade de anlise a ser usada neste trabalho o setor censitrio, que para o Instituto Brasileiro de Geografia e Estatstica (IBGE) corresponde capacidade de levantamento do recenseador, variando por regio em torno de 200 a 400 domiclios. Uma viso da estratgia para a modelagem do espao geogrfico macaense apresentada na figura 1. Pode-se considerar o Bairro como um conjunto de Setores Censitrios, que tambm possuiria informaes sobre tendncias to importantes quanto o Setor Censitrio. Com esta camada geogrfica possvel obter informaes importantes cerca da populao macaense. Pelos dados informados pela prefeitura, o municpio de Maca possui hoje 27 bairros. Uma outra camada geogrfica importante administrativamente para o municpio de Maca denomina-se Setor Administrativo. Esta foi criada para facilitar a administrao do municpio. Trata-se dos setores gerenciais dos quais existem 10 setores, nomeados por cores.

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

3.3. Modelagem do SSD Nesta seo, ser mostrada a modelagem do Sistema de Suporte Deciso.

3.3.1. Modelando as dimenses geogrficas agregveis


Entende-se por dimenso geogrfica agregvel toda dimenso do modelo multidimensional do data warehouse que possui ligao direta com a tabela fato e, alm disso, possui algum atributo geogrfico. Usando a UML, as trs camadas geogrficas so representadas conforme a Figura 2, onde um Bairro composto de vrios setores censitrios, e um setor administrativo composto de vrios bairros. Conforme o tratamento usado no Projeto Geo-Maca, consideram-se todas as trs camadas como figuras geomtricas do tipo polgono. Alm disso, usa-se o conceito de esteretipos para representar o tipo de figura geomtrica que cada classe representa. Outro ponto que merece destaque o surgimento de trs atributos: setorcensitariogeo, bairrogeo e setoradministrativogeo. Estes trs atributos correspondem ao armazenamento em banco de dados dos polgonos referentes a cada um setorcensitario. 3.3.2 Modelando as dimenses geogrficas no agregveis Consideram-se como classes geogrficas no agregveis as classes que no tm ligao direta com a tabela fato do modelo multidimensional. Essas classes, na verdade, estaro associadas a uma dimenso que seja geogrfica, uma vez que a chave de ligao entre a dimenso geogrfica e a classe geogrfica no agregvel o posicionamento geogrfico. No modelo usado para o DW implementado para a Prefeitura de Maca, foram usadas as seguintes classes geogrficas no agregveis: escola e UnidadeSade. As Escolas e as Unidades de Sade esto sendo consideradas do tipo ponto. Essas duas classes esto associadas ao modelo atravs da dimenso geogrfica denominada setorcensitario.

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

Figura 2. Representao com UML do espao geogrfico do municpio de Maca

setorcensitario setorcensitario_ID : VARCHAR setorcensitariogeo : POLYGON qtdescolaprivadasetorcensitario : INTEGER qtdunidadesaudesetorcensitario : INTEGER qtdescolapublicasetorcensitario : INTEGER nomebairro : VARCHAR qtdescolaprivadabairro : INTEGER qtdunidadesaudebairro : INTEGER qtdescolapublicabairro : INTEGER bairrogeo : POLYGON qtdunidadesaudesetoradm : INTEGER qtdescolapublicasetoradm : INTEGER setoradministrativ ogeo : POLYGON qtdescolaprivadasetoradm : INTEGER nomesetoradm : VARCHAR

Figura 3. Modelo fsico das classes geogrfico

3.3.3 Modelando as dimenses no geogrficas agregveis Alm das dimenses geogrficas agregveis, as dimenses geogrficas no agregveis e a tabela fato, existem as dimenses que esto ligadas tabela fato e que no possui nenhuma relao direta com o espao geogrfico. Essas dimenses sero explicadas a seguir. A dimenso condicaomoradia serve para exibir as condies nas quais o cidado est morando no municpio, tais como a moradia possui filtro de gua, saneamento bsico, etc. A dimenso tempo, pertinente praticamente todos os DW, existe nesse modelo com o propsito de armazenar o tempo em que as informaes foram carregadas na base de dados. Com essa dimenso ser possvel avaliar as mudanas no municpio ao longo do tempo. A dimenso trabalho exibe as informaes do cidado no que se refere a sua caracterstica trabalhista, tais como: se trabalha, se funcionrio pblico, etc. A dimenso educacao, abrange caractersticas do ponto de vista de estudos do cidado, tais como se ele estuda, qual o grau de escolaridade, etc. A dimenso queixasistemasaude, exibe quais as principais queixas que um cidado possui em relao rea de sade do municpio. Na dimenso problemasaude, esto representadas as informaes referentes aos problemas de sade dos muncipes. Na dimenso deficienciafisica, esto representados os dados referentes as deficincias fsicas mais comuns entre os muncipes. 3.3.4 O Modelo Multidimensional A figura 4 exibe o modelo multidimensional fsico, onde se deve dar destaque a tabela fato (indivduo) que tem como sua chave primria as chaves de todas as dimenses agregveis do modelo e a quantidade de pessoas, que corresponde a um contador, quando da ocorrncia de indivduos com as mesmas caractersticas.

3.3.5 A preparao do cubo OLAP

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

O prximo passo a configurao do cubo OLAP na ferramenta PostGeoOLAP, que foi denominado pmm. Neste cubo foram adicionadas as dimenses, com a preocupao na definio dos nveis de consolidao que se pode ter ao longo de cada dimenso. Esta operao denominada hierarquizao. O software define como Item Numrico todo atributo da tabela fato sobre o qual sero realizadas operaes, tais como: soma, mdia, etc. No caso do cubo pmm, a tabela fato possui um nico item numrico que denominado quantidadepessoas. Este atributo representa a quantidade de pessoas que possuem uma determinada caracterstica. Sobre esse atributo o cubo deve ser capaz de realizar operaes de soma.

Figura 4. Modelo Multidimensional Fsico


Depois de definida a tabela fato, passou-se a definir as dimenses agregveis, juntamente com as hierarquias internas de cada dimenso. Por exemplo, na dimenso setorcensitario foram definidos os atributos relativos a setor administrativo como de nvel hierrquico mais alto, os de bairro como de nvel hierrquico intermedirio e o nvel mais baixo com os atributos de setor censitrio. Aps a definio da tabela fato e das dimenses, o prximo passo a definio das dimenses geogrficas no agregveis (escola e unidadesaude). Em seguida, realizam-se as pragregaes, baseado na operao definida (soma sobre o atributo quantidadepessoas), em todas as dimenses com suas devidas hierarquias. Isto permite que o software desenvolvido realize a gerao de tabelas com as previses de consultas sobre os dados para agilizar o processo de busca de informaes do usurio. De posse dessas pr-agregaes realizadas, a ferramenta OLAP espacial est pronta para a realizao de consultas on-line para a validao e busca de informao para o gestor municipal. 3.4. Testes e Anlise dos Resultados

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

Sero abordadas neste item algumas consultas, com o propsito de validar o SSD proposto. Para isso foram levantadas algumas questes junto Prefeitura de Maca, para poder dar mais autenticidade e valor aos testes aqui realizados. Para responder cada questo, primeiramente sero explicados quais atributos de cada dimenso esto envolvidos e, em seguida, apresentada a resposta dada pelo sistema. 3.4.1. Quantidade de pessoas que possuem mais de 45 anos e esto desempregadas, por Setor Administrativo. Para a realizao desta consulta, esto envolvidas as dimenses caracterstica, trabalho, setorcensitario, alm da tabela fato.

Fig. 5 - Pessoas com mais de 45 anos, desempregadas por Setor Administrativo.


Sobre a dimenso caracteristica deve-se informar que o atributo idade deve ser maior que 45 anos. Sobre a dimenso trabalho, deve-se informar que trabalha possui o valor lgico falso. Na dimenso setorcensitario no ser realizada qualquer seleo, exceto a escolha do atributo nomesetoradm para a exibio, j que assim ser realizado o agrupamento dos dados. Finalmente, na tabela fato, selecionado o atributo quantidadepessoas para a realizao da operao de totalizao. O resultado pode ser visto na figura 5. 3.4.2 Quantidade de brancos e outras raas, que estejam cursando o 3o grau, estejam ou no trabalhando Esta uma consulta que envolve a tabela fato e as dimenses educacao, caracteristica e trabalho. A afirmativa que esto trabalhando e os que no esto trabalhando deve ser vista como uma forma de agrupamento do resultado pelo atributo trabalha da dimenso trabalho. Alm desse agrupamento, entende-se que as raas tambm so formas de agrupamento. Desta forma, devem ser exibidos no resultado os atributos quantidadepessoa da tabela fato, o atributo trabalha da dimenso trabalho e o atributo cor_raca da dimenso caracterstica, conforme a figura a seguir.

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

Fig. 6 - Pessoas cursando o 3o grau por raa e por estar ou no trabalhando 3.4.3 Quantidade de pessoas que recebem educao especial e moram a mais de 1000 metros de alguma Unidade de Ensino Pblico. Esta consulta exige alguns cuidados envolvendo a tabela fato e as dimenses escola, setorcensitario e educacao, uma vez que somente o seu enunciado no traz todos os filtros realmente existentes. Usa-se o atributo cursoquefrequenta para informar que devem ser envolvidas nesta consulta somente as pessoas que recebem educao especial. Na busca das pessoas que moram a 1000 metros de alguma unidade de ensino pblico tm-se duas dimenses envolvidas: a dimenso agregvel setorcensitario e a dimenso no-agregvel escola. Sobre o atributo geogrfico setorcensitariogeo realiza-se a operao de comparao de distncia sobre o atributo escolageo da dimenso escola, desde que as escolas possuam o atributo educacaoespecial verdadeiro e o atributo tipoadministracao seja diferente de particular. O resultado desta consulta pode ser visto na figura 7.

Fig. 7 - Setores Censitrios que possuem pessoas com educao especial morando a mais de 1Km de alguma Unidade de Ensino Pblico 4. Concluses Uma ferramenta OLAP em Software Livre com suporte manipulao de dados geogrficos, tal qual se prope aqui, possui um elevado potencial de aplicaes no setor pblico, no que se refere ao uso pelo administrador municipal. Alm disto, uma das principais caractersticas de uma ferramenta de suporte deciso, a facilidade de uso, oferecida pelo PostGeoOlap, dispensando conhecimentos profundos de informtica. O presente trabalho traz as seguintes contribuies: a demonstrao da utilizao de ferramentas de distribuio gratuita no desenvolvimento de um Sistema de Suporte Deciso, demonstrando que esta tecnologia est disponvel para as mais diversas empresas, sejam de pequeno ou de grande porte, pblicas ou privadas; a integrao, desde o nvel conceitual, de diferentes tecnologias de suporte a deciso, como SIG e OLAP. Estas tecnologias, juntas, permitem ao decisor um alcance analtico bem maior do que permitiram caso utilizadas de modo isolado.

Revista de Sistemas de Informao

n. 01 Jan./Jun. 2008

Referncias [1] CASTELLS, Manuel. A Era da Informao: Economia, Sociedade e Cultura. Volume 1: A Sociedade em Rede. So Paulo: Paz e Terra, 1999. [2] CMARA, Gilberto; DAVIS, Clodoveu. Conceitos Bsicos da Cincia da Geoinformao. In: CMARA, Gilberto et al. Introduo Cincia da Geoinformao. Disponvel em http://www.dpi.inpe.br/gilberto/livro/introd, acesso em 30/04/2006. So Jos dos Campos: DPI/INPE, 2001. [3] COLONESE, Giovanni. Uma Ferramenta para Integrao de Sistemas de Bancos de Dados Analticos e Geogrficos. Dissertao de Mestrado. Campos dos Goytacazes: Universidade Candido Mendes, 2004. [4] STEFANOVIC, Nebojsa. Design and Implementation of On-Line Analytical Processing (OLAP) of Spatial Data. Dissertao de Mestrado. Belgrado, Iugoslvia: Universidade de Belgrado, 1997. [5] SHEKHAR, Shashi et al. MapCube: A Visualization Tool for Spatial Data Warehouse. In: MILLER, Harvey; HAN, Jiawei (orgs.). Geographic Data Mining and Knowledge Discovery. Taylor and Francis, 2001. [6] KOUBA, Zdenk; MATOUEK, Kamil.; MIKOVSK, Petr. On Data Warehouse and GIS Integration. In: Proceedings of 11th International Conference on Database and Expert Systems Applications (DEXA 2000). Greenwich, Inglaterra, 2000. [7] FERREIRA, Ana Cristina F.; CAMPOS, M.L.; TANAKA, Asterio K. An Architecture for Spatial and Dimensional Analysis Integration. In: Proceedings of World Multiconference of Systemics, Cybernetics and Informatics 2001. Vol. XIV, Computer Science Engineering, Part II, p. 392-395. Orlando, EUA: SCI, 2001. [8] FIDALGO, R. N.; TIMES, V. C.; SOUZA, F. F. GOLAPA: Uma Arquitetura Aberta e Extensvel para Integrao entre GIS e OLAP. In: Anais do III Workshop Brasileiro de Geoinformtica. Rio de Janeiro:GeoInfo, 2001. [9] RIVEST, Sonia; BDARD, Yvan; MARCHAND, Pierre. Toward Better Support for Spatial Decision Making: Defining the Characteristics of Spatial On-Line Analytical Processing (SOLAP). In: Geomatica. Volume 55, n 4. 2001. [10] HAN, Jiawei; STEFANOVIC, Nebojsa; KOPERSKI, Krzysztof. Selective Materialization: An Efficient Method for Spatial Cube Construction. In: Proceedings of Pacific-Asia Conference on Knowledge Discovery and Data Mining, 1998. [11] PAPADIAS, Dimitris et al. Efficient OLAP Operations in Spatial Data Warehouses. In: Proceedings of the 7th International Symposium on Advances in Spatial and Temporal Databases, pgs. 443-459. ACM Records, 2001. [12] SILVEIRA, Srgio A. Incluso Digital, Software Livre e Globalizao Contra-Hegemnica. Disponvel em http://www.softwarelivre.gov.br/softwarelivre/artigos/ artigo_02, acesso em 08/04/2006. SoftwareLivre.gov.br, 2003. [13] BRANCO, Marcelo. Software Livre. Disponvel em http://www.vecam.org/edm/ article.php3?id_article=55, acesso em 09/08/2005. Enjeux de Mots, 2005. [14] GALANTE, Alan C. Sistema de Suporte Deciso no Planejamento Urbano Municipal : Um Estudo de Caso no Municpio de Maca. Dissertao de Mestrado. Campos dos Goytacazes: Universidade Candido Mendes, 2004. [15] OPENGIS Consortium Inc. OpenGIS Simple Features Specification for SQL: Revision 1.1. OpenGIS Project Document 99-049. Disponvel em http://www.opengeospatial.org/ docs/99-049.pdf, acesso em 11/04/2006. OpenGIS Consortium, 1999. [16] HELLERSTEIN, Joseph; NAUGHTON, Jeffrey; PFEFFER, Avi. Generalized Search Trees for Database Systems. In: Proceedings of 21st International Conference on Very Large Databases (VLDB95), pgs. 562-573. Zurich, Sua: Morgan Kaufmann, 1995.