Você está na página 1de 8

Modelagem Relacional e Multidimensional: uma anlise envolvendo Sistemas de Apoio a deciso

Rita Cristina Galarraga Berardi, Flvia Braga de Azambuja, Ana Marilza Pernas, Rodrigo Coelho Barros Departamento de Informtica Universidade Federal de Pelotas (UFPEL) Caixa Postal 354 - 96010-900 Capo do Leo RS Brasil
{ritacgb, azambuja, marilza, rbarros.ifm}@ufpel.edu.br

Abstract. This paper presents the characteristics of the relational and multidimensional models, their main differences and cases in which each model is used. Initially it presents the specific functionalities of each model and, at the same time, makes a comparative sample between them. Lastly, it presents the case study of the Database existent at city hall of Pelotas, where its been identified the need of a specific decision support system, having the multidimensional database as its best option due to the activities the system will have to attend. Resumo. Este trabalho apresenta as caractersticas dos modelos relacional e multidimensional, suas principais diferenas e mostra os casos em que cada tipo comumente utilizado. Inicialmente mostra as funcionalidades especficas de cada tipo e, paralelamente, realiza um comparativo entre os dois modelos. Por fim mostra o estudo de caso do Banco de Dados da Prefeitura Municipal de Pelotas, onde identificou-se um sistema especfico de apoio deciso (SAD) com o modelo multidimensional como melhor alternativa devido s funes que o sistema deveria cumprir.

1. Introduo
O tratamento estratgico de informaes, hoje em dia, pode ser visto como uma prtica poderosa no mundo dos negcios. No entanto, alm de conhecer as informaes preciso saber a melhor forma de obt-las, trat-las e disponibiliz-las. Identificou-se a necessidade de uma anlise sobre os modelos relacional e multidimensional, reconhecendo vantagens e desvantagens de sua utilizao, para que uma base de dados seja modelada de forma que viabilize o mais otimizado tratamento aos dados. De nada adianta para uma organizao ter um grande volume de dados sem que estes estejam organizados de forma a agregar valor. Agregar valor em uma instituio significa transformar dados em informaes teis. A modelagem dimensional uma abordagem que pode dar sentido a esta montanha de dados [DOMENICO 2001]. O foco deste trabalho est em apresentar as caractersticas dos modelos relacional e multidimensional, suas diferenas, e mostrar os casos em que cada tipo comumente utilizado. Como etapa inicial, sero mostradas as caractersticas de cada modelo e, paralelamente, ser feito um comparativo entre eles. Na seqncia, ser

apresentado um estudo de caso dirigido, atravs do qual possvel notar as vantagens da deciso da utilizao de uma modelagem multidimensional quando se tem um volume muito grande de dados e se busca um tratamento estratgico, como em ambientes de apoio deciso (SAD).

2. Modelagem Relacional e Multidimensional


Os Sistemas de Apoio Deciso (SAD) so sistemas Informatizados interativos que proporcionam ao usurio um acesso fcil a modelos decisrios e dados a fim de dar apio a atividades de tomada de deciso. Para que a arquitetura do SAD esteja de acordo com as necessidades dos usurios existe uma preocupao com relao anlise, extrao e armazenamento da base de dados, bem como a organizao destes dados aos usurios de forma que eles possam aproveitar ao mximo as informaes desta base [ANNES,2006]. Faz-se necessrio um estudo sobre os modelos existentes para modelar a base de dados. 2.1 Modelo Relacional Segundo Elmasri (2000), o modelo relacional representa o banco de dados como uma coleo de relaes. Informalmente, cada relao se assemelha a uma tabela de valores, ou, at certo ponto, a um arquivo de registros. Os bancos de dados deste tipo suportam processamento de transaes on-line (OLTP), que incluem inseres, atualizaes e excluses, ao mesmo tempo que suportam requisitos de informaes sobre consultas. So otimizados para processar consultas que podem afetar uma pequena parte do banco de dados, bem como transaes que lidam com incluses ou atualizaes de algumas tuplas por relao, a serem processadas. [ELMASRI 2000]. Para tornar o armazenamento e o acesso a dados em disco mais fceis, os modelos relacionais so gerenciados por um Sistema Gerenciador de Banco de Dados (SGBD), o que traz muitas vantagens e facilidades relacionados ao projeto, administrao e utilizao de um grande banco de dados utilizado por vrios usurios. Um SGBD eficiente proporciona maior segurana e controle ao banco de dados relacional, como por exemplo, atravs da aplicao de controle de redundncias, restrio de acesso no-autorizado, restrio de integridade e inconsistncia de dados atravs de normalizao, representao de relacionamentos complexos entre os dados, entre outras funcionalidades. Devido a estas caractersticas que o SGBD proporciona ao modelo relacional, as bases de dados relacionais tornaram-se a mais apropriadas para sistemas que precisam desses tipos de controles, por serem acessadas por um grupo de usurios com permisso de alterao, acesso, consulta e insero. Estes sistemas so definidos como operacionais, pois tratam dados de transaes operacionais dirias das organizaes. O modelo relacional garante a reduo de vrios problemas aos dados com a utilizao das regras de normalizao, porm, no garantido que todo o tipo de sistema necessite de toda esta estrutura de controle. Um projeto OLTP totalmente normalizado para um sistema de controle de pedidos, por exemplo, pode envolver dezenas de tabelas e tornar muito difcil o processo de obteno de informaes a partir destas tabelas. Isso porque o modelo relacional j foi desenvolvido para atender aos sistemas operacionais e

a normalizao evita redundncias de tal forma que no haja preocupao com o sincronismo de dados nas operaes de atualizao, facilitando a manuteno da integridade desses dados nas tabelas [UNICAMP 1998]. Por todas as caractersticas apresentadas, o modelo relacional um tipo de modelo eficiente para sistemas que manipulam dados operacionais, no entanto, no representa a modelagem mais apropriada para um sistema SAD que se utiliza apenas de duas funes bsicas: carga e acesso aos dados, podendo at prejudicar o desempenho das funes que um sistema deste tipo deve cumprir. O que deve se compreender que a utilizao total e fiel do tipo de modelagem relacional no a mais otimizada, porm adotar o modelo multidimensional no significa que no sejam utilizadas tabelas relacionais em momento algum do projeto dimensional. Pode ocorrer uma aplicao hbrida das funes, tendo uma viso multidimensional dos dados, representados fisicamente por tabelas relacionais. 2.2. Modelagem Multidimensional A modelagem multidimensional uma tcnica de concepo e visualizao de um modelo de dados de um conjunto de medidas que descrevem aspectos comuns de negcios. utilizada especialmente para sumarizar e reestruturar dados e apresent-los em vises que suportem a anlise dos valores desses dados [MACHADO 2004]. Partindo de uma grande quantidade de dados, com a tcnica de modelagem multidimensional possvel alcanar um nvel de organizao diferente das tcnicas de anlise por transao, que se baseiam em entidades, decomposies funcionais e relacionamentos [UNICAMP 2006]. O tipo de modelo abordado no trabalho o estrela, por ser mais utilizado. Existe uma grande tabela dominante no centro do esquema. Esta tabela central a nica no esquema que se comunica com as outras tabelas, atravs de mltiplas junes. As outras tabelas se conectam tabela central atravs de uma nica juno. A tabela central denominada tabela de fatos (fact table) e as outras so as tabelas de dimenses (dimension tables) (KIMBALL, 1996). A tabela de fatos onde as medidas numricas do negcio so armazenadas. Cada uma dessas medidas obtida da interseco de todas as dimenses. Cada fato representa um item, uma transao ou um evento de negcio e que utilizado na anlise de uma organizao. As tabelas dimenses so os elementos que participam de um fato, determinam um contexto de um assunto de negcios, por exemplo, um banco de dados que analisa as vendas de produtos, as dimenses que participam desse fato geralmente so Tempo, Localizao, Cliente e Vendedores. Outro tipo de modelo multidimensional o floco de neve, o qual consiste em uma extenso do modelo estrela em que cada ponta da estrela passa a ser o centro de outras estrelas. Apesar deste modelo apresentar vantagens, Kimball (1996) no aconselha a transformao de modelos estrela para floco de neve, devido ao irrelevante impacto em termos de ganho de espao de armazenamento. O banco de dados multidimensional d suporte e aperfeioa manipulaes matemticas (quantidade total vendida em determinado espao de tempo), financeiras (clculos com valores, converses financeiras), estatsticas e de tempo (quantos dias h

entre duas datas, por exemplo), assim como somatrio de valores referentes a nveis de uma hierarquia de dados (data, ms, semestre, ano) [MACHADO 2004]. Por estas caractersticas especficas que este tipo de modelo vem ao encontro do que se busca na gesto de negcio, bem como responder a alguns questionamentos referentes ao desempenho de determinados assuntos durante um espao de tempo, alm de buscar cenrios para anlise estratgica de decises. Portanto a modelagem multidimensional, com todas suas caractersticas e especificidades de tratamento dos dados, a modelagem mais utilizada e apropriada para sistemas SAD, os quais proporcionam integrao mxima e rpida dos dados para responder perguntas complexas a partir dos dados. 2. 2. 1 A Tecnologia de Data Warehousing No contexto de tecnologias para construo de ambientes SAD destaca-se a tecnologia de Data Warehousing a qual consiste basicamente no processo de extrair informaes de Banco de Dados distintos, integrar e armazenar estas informaes de uma forma ntegra e possibilitar consultas rpidas e inteligentes sobre a base de dados gerada [SCHLTTGEN 2006]. Entende-se ento que, por este comportamento, esta uma tecnologia adequada quando se pretende alcanar um modelo tipicamente de uso estratgico e que se utiliza de grandes quantidades de dados. O Data Warehouse proporciona uma slida e concisa integrao dos dados de uma organizao, para a realizao de anlises gerenciais estratgicas de seus principais processos de negcio, procurando integrar e consolidar as informaes de fontes internas, na maioria das vezes heterogneas, e fontes externas, sumarizando, filtrando e limpando esses dados, preparando-os para anlise e suporte deciso [MACHADO 2004]. A modelagem de dados para Data Warehouse completamente diferente da utilizada em sistemas operacionais. O simples mapeamento do modelo de dados transacional para um banco de dados especfico e a insero de dados histricos no representa a efetiva construo de um Data Warehouse. A adoo desta estratgia no possibilita a manipulao eficiente desses dados, pois as forma de tratamento de dados transacionais totalmente diferente da forma de tratamento de dados histricos. De acordo com Machado (2004), a maioria das tcnicas de modelagem concorda que a aplicao completa da teoria relacional no apropriada para o Data Warehouse. Com o advento do Data Warehouse necessitou-se de uma tcnica que suportasse o ambiente de anlise multidimensional dos dados. Entretanto, o modelo relacional pode ser usado para ambientes de Data Warehouse com tcnica para modelagem multidimensional especfica, como veremos em seguida. 2. 2. 2 Tecnologia OLAP Analistas usam Data Warehouses para extrair informaes de negcios que facilitam a tomada de decises. Este interativo processo de suporte a deciso chamado OLAP (On-line Analytical Processing) diferentemente das aplicaes convencionais para transaes OLTP (On-line Transaction Processing). As ferramentas OLAP so as aplicaes s quais os usurios finais tm acesso para extrair os dados de suas bases e construir os relatrios capazes de responder s questes gerenciais.

Aplicaes de tecnologia OLAP requerem uma viso dos dados baseada em diferentes perspectivas, dimenses e assim apresentam uma viso multidimensional dos dados aos usurios [GUPTA 2006]. Quando a Base de Dados pode ser visualizada como um cubo de 3, 4 ou at 5 ou mais dimenses, as pessoas podem se imaginar partindo e fatiando em cubos cada uma das dimenses [KIMBALL 1996].

3. Estudo de Caso: Banco de Dados da Prefeitura Municipal de Pelotas


A Coordenadoria para Desenvolvimento Local e Regional, implantada no ano de 2005 pela Prefeitura de Pelotas, empreendeu esforos e props debates com a comunidade no sentido de: reunir dados capazes de traar um perfil realista e abrangente da realidade atual, que permitam quantificar e qualificar as diferentes dimenses da vida comunitria; organizar estes dados em forma de apresentao capaz de estimular investidores internos e externos; examinar, discutir e priorizar estratgias capazes de possibilitar a desejada acelerao no processo de desenvolvimento [FETTER 2005]. A Prefeitura Municipal de Pelotas preparou um conjunto de dados, na forma de apresentao de slides, como mostra a Figura 1, para oferecer aos empresrios e interessados em investir na regio o maior nmero de informaes possvel sobre os segmentos da sociedade, como sade, educao, trnsito e aspectos naturais como clima, geografia, entre outros. A partir destes dados, os investidores poderiam tomar a deciso de investir ou no na cidade, dependendo dos ndices apresentados referentes sua respectiva rea de interesse. Para a construo deste documento, buscaram informaes a partir de bases de dados j existentes, on-line ou no, automatizadas ou no, coletando ainda dados de forma emprica, tentando agrupar dados que, apesar de no organizados, foram julgados pertinentes pela administrao da cidade.

Figura 1: Uma tela do Banco de Dados inicial da Prefeitura

Atravs destas pesquisas, se obteve um grande aglomerado de dados, de forma organizada, mas no adequada para buscas objetivas de informao, como quando se utiliza bancos de dados automatizados. Estes dados estavam dispostos na forma de textos longos e tabelas estatsticas de onde eram gerados grficos. No entanto, o Banco de Dados que a Prefeitura conseguiu construir no era o ideal frente s necessidades. A forma de armazenamento era crtica, uma vez que

arquivos slides com grande nmero de informaes, como textos, imagens, grficos, so arquivos que por sua forma dificultam o armazenamento e portabilidade destes dados. Devido a estas dificuldades, a Prefeitura motivou-se a obter uma soluo para os problemas, atravs de um Sistema de Informao de Apoio a Deciso (SAD) e disponibiliz-lo da forma mais fcil e rpida possvel a Web. Com o objetivo de suprir a infra-estrutura necessria para que os empresrios e investidores pudessem analisar a realidade social da regio de Pelotas, foram propostas pesquisas para definir quais as tcnicas de Bancos de Dados melhor se adequavam a fim de modelar um sistema de informaes que abrangesse todos os requisitos referentes aos objetivos da Prefeitura. A partir do tratamento adequado, os dados deveriam estar mais organizados e possibilitariam a busca de informaes relevantes sobre a cidade e a regio atravs da aplicao de tcnicas de descoberta de conhecimento em Bancos de Dados junto a esse sistema [FAVARETTO 2006]. 3.1 Tecnologias aplicadas ao sistema de apoio a deciso Tendo em vista a grande quantidade de dados que a Prefeitura possua sobre os vrios segmentos da sociedade, e que os usurios deste sistema buscariam informaes sobre diferentes assuntos, integrando-os das mais diversas e complexas formas, definiu-se a necessidade de utilizar a tcnica de Data Warehousing e a modelagem multidimensional. Outro fator que contribuiu para esta definio foi o aspecto temporal que estas aplicaes permitem, uma vez que os dados que a Prefeitura de Pelotas possua eram atualizados em um perodo de tempo relativamente grande com relao ao tempo levado para atualizao das bases operacionais. O volume de dados que a Prefeitura disponibilizava era suficientemente grande para no considerar a modelagem relacional como alternativa e tambm o aspecto investigativo de anlise seria prejudicado. A partir desta definio foram feitas vrias passagens pelos slides a fim de eliminar os dados que no eram armazenveis, como grficos, sendo estes gerados automaticamente por recursos de programao, de forma automtica sobre o sistema. Desta forma, foi possvel realizar a modelagem das dimenses e fatos do modelo estrela, escolhido para a modelagem, como mostra a Figura 2.

Figura 2: Modelo multidimensional do tipo estrela. Adaptado de Kimball (1996)

Dentro das abordagem OLAP existentes, a utilizada a HOLAP em que as tabelas so relacionais e a anlise realizada atravs dos cubos multidimensional, caracterizando assim uma abordagem hbrida.

Figura 3: Cubo com as dimenses Nvel de Ensino,Rede de Ensino e Tempo.

A Figura 3 ilustra um dos cubos modelados para a Prefeitura, onde cada ponto do cubo contm valores do Fato Matrcula. Os valores so a quantidade de matrculas por nvel de ensino nas redes escolares em um determinado ano.

4. Concluso
Ao longo deste artigo foram apresentadas caractersticas dos modelos relacional e multidimensional, analisando os tipos de sistema em que cada modelo era mais adequado. Percebeu-se com estudos e pesquisa que modelagem de dados, para aplicao de tecnologias na gesto de dados, precisa ser especfica e apropriada ao objetivo do usurio final. No caso em que foi estudado, o da Prefeitura Municipal de Pelotas, o usurio final um investidor que busca informaes integradas e rpidas, caracterizando assim um Sistema de Informao de Apoio Deciso. No desenvolvimento do estudo de caso da Prefeitura, se evidenciou o fato de que as empresas realmente tm interesse em obter dados sobre assuntos relevantes, mas que reunir estes dados em sua totalidade pode provocar conseqncias que realmente comprometem a usabilidade estratgica dos mesmos. Com base no comparativo entre os dois modelos, foi possvel concluir que para um ambiente SAD, como o que a prefeitura objetivava, com busca de informao analtica e rpida, em grande quantidade, a modelagem multidimensional com a tcnica de Data Warehouse foi definida como a mais otimizada e completa. Referncias Annes, Ricardo, Sistemas de Apoio Deciso, disponvel http://pucrs.campus2.br/~annes/sad2.html>. Acesso em 30 julho de 2006. em <

Domenico, J.A. (2001), Definio de um ambiente Data Warehouse em uma instituio de ensino superior, Dissertao (Mestrado em Engenharia de Produo) Programa de Ps-graduao em Engenharia de Produo, UFSC, Florianpolis. Elmasri, R. e Navathe, S.B. (2005), Sistemas de Bancos de Dados, 4 ed. Addison Wesley Longman, Inc Favaretto, F. e Rhoden, C.A., Consideraes sobre atividades de identificao, localizao e tratamento de dados na construo de um Data Warehouse, disponvel em http://www.deinfo.uepg.br/~iconged/Artigos/Artigo_05.pdf. Acesso em 02 maio de 2006. Fetter, Adolfo Jr. (2005) Estratgia(s) para Atrair Investimentos em Pelotas. Gupta, H., Harinarayan, V., Rajaraman, A. e Ullman, J.D. Index Selection for OLAP, disponvel em<http://citeseer.ist.psu.edu/gupta97index.html>. Acesso em 02 maio de 2006. Harinarayan, V., Rajaraman, A. e Ullman, J.D. Implementing Data Cubes Efficiently, disponvel em<http://citeseer.ist.psu.edu/harinarayan96implementing.html>. Acesso em 05 maio de 2006. Kimball, R. (1996), The Data Warehouse Toolkit., John Wiley & Sonns, Inc Laudon, K. C.(2004), Sistemas de Informaes Gerencias, 5 ed. So Paulo Machado, F.N.R. (2004), Tecnologia e Projeto de Data Warehouse, 1 ed. So Paulo Revista da UNICAMP, Anlise Multidimensional. Informativo Tcnico no. 54(16/09/98), disponvel em: <http://www.revista.unicamp.br/infotec/informacao/inf54.htm>. Acesso em: 09 maio de 2006 Schlttgen, Alexandre, Aspectos Temporais de um Data Warehouse, disponvel em <www.inf.ufrgs.br/~clesio/cmp151/cmp15120011/artigo_alexandre.doc>. Acesso em 28 maio de 2006 Zhuge, Y., Garcia-Molina, H., Hammer, J. e Widom, Jennifer. View Maintenance in a Warehousing Environment, disponvel em <http://citeseer.ist.psu.edu/zhuge95view.html>. Acesso em: 09 maio de 2006

Você também pode gostar