Você está na página 1de 8

Modelagem Relacional e Multidimensional: uma anlise

envolvendo Sistemas de Apoio a deciso


Rita Cristina Galarraga Berardi, Flvia Braga de Azambuja, Ana Marilza Pernas,
Rodrigo Coelho Barros
Departamento de Informtica Universidade Federal de Pelotas (UFPEL)
Caixa Postal 354 - 96010-900 Capo do Leo RS Brasil
{ritacgb, azambuja, marilza, rbarros.ifm}@ufpel.edu.br

Abstract. This paper presents the characteristics of the relational and


multidimensional models, their main differences and cases in which each
model is used. Initially it presents the specific functionalities of each model
and, at the same time, makes a comparative sample between them. Lastly, it
presents the case study of the Database existent at city hall of Pelotas, where
its been identified the need of a specific decision support system, having the
multidimensional database as its best option due to the activities the system
will have to attend.
Resumo. Este trabalho apresenta as caractersticas dos modelos relacional e
multidimensional, suas principais diferenas e mostra os casos em que cada
tipo comumente utilizado. Inicialmente mostra as funcionalidades
especficas de cada tipo e, paralelamente, realiza um comparativo entre os
dois modelos. Por fim mostra o estudo de caso do Banco de Dados da
Prefeitura Municipal de Pelotas, onde identificou-se um sistema especfico
de apoio deciso (SAD) com o modelo multidimensional como melhor
alternativa devido s funes que o sistema deveria cumprir.

1. Introduo
O tratamento estratgico de informaes, hoje em dia, pode ser visto como uma prtica
poderosa no mundo dos negcios. No entanto, alm de conhecer as informaes
preciso saber a melhor forma de obt-las, trat-las e disponibiliz-las.
Identificou-se a necessidade de uma anlise sobre os modelos relacional e
multidimensional, reconhecendo vantagens e desvantagens de sua utilizao, para que
uma base de dados seja modelada de forma que viabilize o mais otimizado tratamento
aos dados.
De nada adianta para uma organizao ter um grande volume de dados sem que
estes estejam organizados de forma a agregar valor. Agregar valor em uma instituio
significa transformar dados em informaes teis. A modelagem dimensional uma
abordagem que pode dar sentido a esta montanha de dados [DOMENICO 2001].
O foco deste trabalho est em apresentar as caractersticas dos modelos
relacional e multidimensional, suas diferenas, e mostrar os casos em que cada tipo
comumente utilizado. Como etapa inicial, sero mostradas as caractersticas de cada
modelo e, paralelamente, ser feito um comparativo entre eles. Na seqncia, ser

apresentado um estudo de caso dirigido, atravs do qual possvel notar as vantagens da


deciso da utilizao de uma modelagem multidimensional quando se tem um volume
muito grande de dados e se busca um tratamento estratgico, como em ambientes de
apoio deciso (SAD).

2. Modelagem Relacional e Multidimensional


Os Sistemas de Apoio Deciso (SAD) so sistemas Informatizados interativos que
proporcionam ao usurio um acesso fcil a modelos decisrios e dados a fim de dar apio
a atividades de tomada de deciso. Para que a arquitetura do SAD esteja de acordo com
as necessidades dos usurios existe uma preocupao com relao anlise, extrao e
armazenamento da base de dados, bem como a organizao destes dados aos usurios de
forma que eles possam aproveitar ao mximo as informaes desta base
[ANNES,2006]. Faz-se necessrio um estudo sobre os modelos existentes para modelar
a base de dados.
2.1 Modelo Relacional
Segundo Elmasri (2000), o modelo relacional representa o banco de dados como uma
coleo de relaes. Informalmente, cada relao se assemelha a uma tabela de valores,
ou, at certo ponto, a um arquivo de registros.
Os bancos de dados deste tipo suportam processamento de transaes on-line
(OLTP), que incluem inseres, atualizaes e excluses, ao mesmo tempo que
suportam requisitos de informaes sobre consultas. So otimizados para processar
consultas que podem afetar uma pequena parte do banco de dados, bem como transaes
que lidam com incluses ou atualizaes de algumas tuplas por relao, a serem
processadas. [ELMASRI 2000].
Para tornar o armazenamento e o acesso a dados em disco mais fceis, os
modelos relacionais so gerenciados por um Sistema Gerenciador de Banco de Dados
(SGBD), o que traz muitas vantagens e facilidades relacionados ao projeto,
administrao e utilizao de um grande banco de dados utilizado por vrios usurios.
Um SGBD eficiente proporciona maior segurana e controle ao banco de dados
relacional, como por exemplo, atravs da aplicao de controle de redundncias,
restrio de acesso no-autorizado, restrio de integridade e inconsistncia de dados
atravs de normalizao, representao de relacionamentos complexos entre os dados,
entre outras funcionalidades.
Devido a estas caractersticas que o SGBD proporciona ao modelo relacional, as
bases de dados relacionais tornaram-se a mais apropriadas para sistemas que precisam
desses tipos de controles, por serem acessadas por um grupo de usurios com permisso
de alterao, acesso, consulta e insero. Estes sistemas so definidos como
operacionais, pois tratam dados de transaes operacionais dirias das organizaes.
O modelo relacional garante a reduo de vrios problemas aos dados com a
utilizao das regras de normalizao, porm, no garantido que todo o tipo de sistema
necessite de toda esta estrutura de controle. Um projeto OLTP totalmente normalizado
para um sistema de controle de pedidos, por exemplo, pode envolver dezenas de tabelas
e tornar muito difcil o processo de obteno de informaes a partir destas tabelas. Isso
porque o modelo relacional j foi desenvolvido para atender aos sistemas operacionais e

a normalizao evita redundncias de tal forma que no haja preocupao com o


sincronismo de dados nas operaes de atualizao, facilitando a manuteno da
integridade desses dados nas tabelas [UNICAMP 1998].
Por todas as caractersticas apresentadas, o modelo relacional um tipo de
modelo eficiente para sistemas que manipulam dados operacionais, no entanto, no
representa a modelagem mais apropriada para um sistema SAD que se utiliza apenas de
duas funes bsicas: carga e acesso aos dados, podendo at prejudicar o desempenho
das funes que um sistema deste tipo deve cumprir.
O que deve se compreender que a utilizao total e fiel do tipo de modelagem
relacional no a mais otimizada, porm adotar o modelo multidimensional no
significa que no sejam utilizadas tabelas relacionais em momento algum do projeto
dimensional. Pode ocorrer uma aplicao hbrida das funes, tendo uma viso
multidimensional dos dados, representados fisicamente por tabelas relacionais.
2.2. Modelagem Multidimensional
A modelagem multidimensional uma tcnica de concepo e visualizao de um
modelo de dados de um conjunto de medidas que descrevem aspectos comuns de
negcios. utilizada especialmente para sumarizar e reestruturar dados e apresent-los
em vises que suportem a anlise dos valores desses dados [MACHADO 2004].
Partindo de uma grande quantidade de dados, com a tcnica de modelagem
multidimensional possvel alcanar um nvel de organizao diferente das tcnicas de
anlise por transao, que se baseiam em entidades, decomposies funcionais e
relacionamentos [UNICAMP 2006].
O tipo de modelo abordado no trabalho o estrela, por ser mais utilizado. Existe
uma grande tabela dominante no centro do esquema. Esta tabela central a nica no
esquema que se comunica com as outras tabelas, atravs de mltiplas junes. As outras
tabelas se conectam tabela central atravs de uma nica juno. A tabela central
denominada tabela de fatos (fact table) e as outras so as tabelas de dimenses
(dimension tables) (KIMBALL, 1996).
A tabela de fatos onde as medidas numricas do negcio so armazenadas.
Cada uma dessas medidas obtida da interseco de todas as dimenses. Cada fato
representa um item, uma transao ou um evento de negcio e que utilizado na anlise
de uma organizao. As tabelas dimenses so os elementos que participam de um fato,
determinam um contexto de um assunto de negcios, por exemplo, um banco de dados
que analisa as vendas de produtos, as dimenses que participam desse fato geralmente
so Tempo, Localizao, Cliente e Vendedores.
Outro tipo de modelo multidimensional o floco de neve, o qual consiste em
uma extenso do modelo estrela em que cada ponta da estrela passa a ser o centro de
outras estrelas. Apesar deste modelo apresentar vantagens, Kimball (1996) no
aconselha a transformao de modelos estrela para floco de neve, devido ao irrelevante
impacto em termos de ganho de espao de armazenamento.
O banco de dados multidimensional d suporte e aperfeioa manipulaes
matemticas (quantidade total vendida em determinado espao de tempo), financeiras
(clculos com valores, converses financeiras), estatsticas e de tempo (quantos dias h

entre duas datas, por exemplo), assim como somatrio de valores referentes a nveis de
uma hierarquia de dados (data, ms, semestre, ano) [MACHADO 2004]. Por estas
caractersticas especficas que este tipo de modelo vem ao encontro do que se busca na
gesto de negcio, bem como responder a alguns questionamentos referentes ao
desempenho de determinados assuntos durante um espao de tempo, alm de buscar
cenrios para anlise estratgica de decises.
Portanto a modelagem multidimensional, com todas suas caractersticas e
especificidades de tratamento dos dados, a modelagem mais utilizada e apropriada
para sistemas SAD, os quais proporcionam integrao mxima e rpida dos dados para
responder perguntas complexas a partir dos dados.
2. 2. 1 A Tecnologia de Data Warehousing
No contexto de tecnologias para construo de ambientes SAD destaca-se a
tecnologia de Data Warehousing a qual consiste basicamente no processo de extrair
informaes de Banco de Dados distintos, integrar e armazenar estas informaes de
uma forma ntegra e possibilitar consultas rpidas e inteligentes sobre a base de dados
gerada [SCHLTTGEN 2006]. Entende-se ento que, por este comportamento, esta
uma tecnologia adequada quando se pretende alcanar um modelo tipicamente de uso
estratgico e que se utiliza de grandes quantidades de dados.
O Data Warehouse proporciona uma slida e concisa integrao dos dados de
uma organizao, para a realizao de anlises gerenciais estratgicas de seus principais
processos de negcio, procurando integrar e consolidar as informaes de fontes
internas, na maioria das vezes heterogneas, e fontes externas, sumarizando, filtrando e
limpando esses dados, preparando-os para anlise e suporte deciso [MACHADO
2004].
A modelagem de dados para Data Warehouse completamente diferente da
utilizada em sistemas operacionais. O simples mapeamento do modelo de dados
transacional para um banco de dados especfico e a insero de dados histricos no
representa a efetiva construo de um Data Warehouse. A adoo desta estratgia no
possibilita a manipulao eficiente desses dados, pois as forma de tratamento de dados
transacionais totalmente diferente da forma de tratamento de dados histricos.
De acordo com Machado (2004), a maioria das tcnicas de modelagem concorda
que a aplicao completa da teoria relacional no apropriada para o Data Warehouse.
Com o advento do Data Warehouse necessitou-se de uma tcnica que suportasse o
ambiente de anlise multidimensional dos dados. Entretanto, o modelo relacional pode
ser usado para ambientes de Data Warehouse com tcnica para modelagem
multidimensional especfica, como veremos em seguida.
2. 2. 2 Tecnologia OLAP
Analistas usam Data Warehouses para extrair informaes de negcios que facilitam a
tomada de decises. Este interativo processo de suporte a deciso chamado OLAP
(On-line Analytical Processing) diferentemente das aplicaes convencionais para
transaes OLTP (On-line Transaction Processing). As ferramentas OLAP so as
aplicaes s quais os usurios finais tm acesso para extrair os dados de suas bases e
construir os relatrios capazes de responder s questes gerenciais.

Aplicaes de tecnologia OLAP requerem uma viso dos dados baseada em


diferentes perspectivas, dimenses e assim apresentam uma viso multidimensional dos
dados aos usurios [GUPTA 2006]. Quando a Base de Dados pode ser visualizada como
um cubo de 3, 4 ou at 5 ou mais dimenses, as pessoas podem se imaginar partindo e
fatiando em cubos cada uma das dimenses [KIMBALL 1996].

3. Estudo de Caso: Banco de Dados da Prefeitura Municipal de Pelotas


A Coordenadoria para Desenvolvimento Local e Regional, implantada no ano de 2005
pela Prefeitura de Pelotas, empreendeu esforos e props debates com a comunidade no
sentido de: reunir dados capazes de traar um perfil realista e abrangente da realidade
atual, que permitam quantificar e qualificar as diferentes dimenses da vida
comunitria; organizar estes dados em forma de apresentao capaz de estimular
investidores internos e externos; examinar, discutir e priorizar estratgias capazes de
possibilitar a desejada acelerao no processo de desenvolvimento [FETTER 2005].
A Prefeitura Municipal de Pelotas preparou um conjunto de dados, na forma de
apresentao de slides, como mostra a Figura 1, para oferecer aos empresrios e
interessados em investir na regio o maior nmero de informaes possvel sobre os
segmentos da sociedade, como sade, educao, trnsito e aspectos naturais como clima,
geografia, entre outros. A partir destes dados, os investidores poderiam tomar a deciso
de investir ou no na cidade, dependendo dos ndices apresentados referentes sua
respectiva rea de interesse. Para a construo deste documento, buscaram informaes
a partir de bases de dados j existentes, on-line ou no, automatizadas ou no, coletando
ainda dados de forma emprica, tentando agrupar dados que, apesar de no organizados,
foram julgados pertinentes pela administrao da cidade.

Figura 1: Uma tela do Banco de Dados inicial da Prefeitura

Atravs destas pesquisas, se obteve um grande aglomerado de dados, de forma


organizada, mas no adequada para buscas objetivas de informao, como quando se
utiliza bancos de dados automatizados. Estes dados estavam dispostos na forma de
textos longos e tabelas estatsticas de onde eram gerados grficos.
No entanto, o Banco de Dados que a Prefeitura conseguiu construir no era o
ideal frente s necessidades. A forma de armazenamento era crtica, uma vez que

arquivos slides com grande nmero de informaes, como textos, imagens, grficos, so
arquivos que por sua forma dificultam o armazenamento e portabilidade destes dados.
Devido a estas dificuldades, a Prefeitura motivou-se a obter uma soluo para os
problemas, atravs de um Sistema de Informao de Apoio a Deciso (SAD) e
disponibiliz-lo da forma mais fcil e rpida possvel a Web.
Com o objetivo de suprir a infra-estrutura necessria para que os empresrios e
investidores pudessem analisar a realidade social da regio de Pelotas, foram propostas
pesquisas para definir quais as tcnicas de Bancos de Dados melhor se adequavam a fim
de modelar um sistema de informaes que abrangesse todos os requisitos referentes aos
objetivos da Prefeitura.
A partir do tratamento adequado, os dados deveriam estar mais organizados e
possibilitariam a busca de informaes relevantes sobre a cidade e a regio atravs da
aplicao de tcnicas de descoberta de conhecimento em Bancos de Dados junto a esse
sistema [FAVARETTO 2006].
3.1 Tecnologias aplicadas ao sistema de apoio a deciso
Tendo em vista a grande quantidade de dados que a Prefeitura possua sobre os vrios
segmentos da sociedade, e que os usurios deste sistema buscariam informaes sobre
diferentes assuntos, integrando-os das mais diversas e complexas formas, definiu-se a
necessidade de utilizar a tcnica de Data Warehousing e a modelagem
multidimensional. Outro fator que contribuiu para esta definio foi o aspecto temporal
que estas aplicaes permitem, uma vez que os dados que a Prefeitura de Pelotas
possua eram atualizados em um perodo de tempo relativamente grande com relao ao
tempo levado para atualizao das bases operacionais. O volume de dados que a
Prefeitura disponibilizava era suficientemente grande para no considerar a modelagem
relacional como alternativa e tambm o aspecto investigativo de anlise seria
prejudicado.
A partir desta definio foram feitas vrias passagens pelos slides a fim de
eliminar os dados que no eram armazenveis, como grficos, sendo estes gerados
automaticamente por recursos de programao, de forma automtica sobre o sistema.
Desta forma, foi possvel realizar a modelagem das dimenses e fatos do modelo estrela,
escolhido para a modelagem, como mostra a Figura 2.

Figura 2: Modelo multidimensional do tipo estrela. Adaptado de Kimball (1996)

Dentro das abordagem OLAP existentes, a utilizada a HOLAP em que as


tabelas so relacionais e a anlise realizada atravs dos cubos multidimensional,
caracterizando assim uma abordagem hbrida.

Figura 3: Cubo com as dimenses Nvel de Ensino,Rede de Ensino e Tempo.

A Figura 3 ilustra um dos cubos modelados para a Prefeitura, onde cada ponto
do cubo contm valores do Fato Matrcula. Os valores so a quantidade de matrculas
por nvel de ensino nas redes escolares em um determinado ano.

4. Concluso
Ao longo deste artigo foram apresentadas caractersticas dos modelos relacional e
multidimensional, analisando os tipos de sistema em que cada modelo era mais
adequado.
Percebeu-se com estudos e pesquisa que modelagem de dados, para aplicao de
tecnologias na gesto de dados, precisa ser especfica e apropriada ao objetivo do
usurio final. No caso em que foi estudado, o da Prefeitura Municipal de Pelotas, o
usurio final um investidor que busca informaes integradas e rpidas, caracterizando
assim um Sistema de Informao de Apoio Deciso.
No desenvolvimento do estudo de caso da Prefeitura, se evidenciou o fato de que
as empresas realmente tm interesse em obter dados sobre assuntos relevantes, mas que
reunir estes dados em sua totalidade pode provocar conseqncias que realmente
comprometem a usabilidade estratgica dos mesmos.
Com base no comparativo entre os dois modelos, foi possvel concluir que para
um ambiente SAD, como o que a prefeitura objetivava, com busca de informao
analtica e rpida, em grande quantidade, a modelagem multidimensional com a tcnica
de Data Warehouse foi definida como a mais otimizada e completa.
Referncias
Annes, Ricardo, Sistemas de Apoio Deciso, disponvel
http://pucrs.campus2.br/~annes/sad2.html>. Acesso em 30 julho de 2006.

em

<

Domenico, J.A. (2001), Definio de um ambiente Data Warehouse em uma instituio


de ensino superior, Dissertao (Mestrado em Engenharia de Produo) Programa
de Ps-graduao em Engenharia de Produo, UFSC, Florianpolis.
Elmasri, R. e Navathe, S.B. (2005), Sistemas de Bancos de Dados, 4 ed. Addison
Wesley Longman, Inc
Favaretto, F. e Rhoden, C.A., Consideraes sobre atividades de identificao,
localizao e tratamento de dados na construo de um Data Warehouse, disponvel
em http://www.deinfo.uepg.br/~iconged/Artigos/Artigo_05.pdf. Acesso em 02 maio
de 2006.
Fetter, Adolfo Jr. (2005) Estratgia(s) para Atrair Investimentos em Pelotas.
Gupta, H., Harinarayan, V., Rajaraman, A. e Ullman, J.D. Index Selection for OLAP,
disponvel em<http://citeseer.ist.psu.edu/gupta97index.html>. Acesso em 02 maio de
2006.
Harinarayan, V., Rajaraman, A. e Ullman, J.D. Implementing Data Cubes Efficiently,
disponvel em<http://citeseer.ist.psu.edu/harinarayan96implementing.html>. Acesso
em 05 maio de 2006.
Kimball, R. (1996), The Data Warehouse Toolkit., John Wiley & Sonns, Inc
Laudon, K. C.(2004), Sistemas de Informaes Gerencias, 5 ed. So Paulo
Machado, F.N.R. (2004), Tecnologia e Projeto de Data Warehouse, 1 ed. So Paulo
Revista da UNICAMP, Anlise Multidimensional. Informativo Tcnico no.
54(16/09/98), disponvel em:
<http://www.revista.unicamp.br/infotec/informacao/inf54.htm>. Acesso em: 09 maio
de 2006
Schlttgen, Alexandre, Aspectos Temporais de um Data Warehouse, disponvel em
<www.inf.ufrgs.br/~clesio/cmp151/cmp15120011/artigo_alexandre.doc>. Acesso em
28 maio de 2006
Zhuge, Y., Garcia-Molina, H., Hammer, J. e Widom, Jennifer. View Maintenance in a
Warehousing Environment, disponvel em
<http://citeseer.ist.psu.edu/zhuge95view.html>. Acesso em: 09 maio de 2006

Você também pode gostar