Você está na página 1de 2

ESTUDO DE FERRAMENTAS DE OLAP E DATA WAREHOUSE

1
Marcelo Pereira Silveira , Mikael de Souza Fernandes¹, Pablo Tondolo de Vargas¹ &
Gustavo Zanini Kantorski ²
1
Acadêmicos do Curso de Sistemas de Informação - ULBRA, Santa Maria, RS
e-mail: marcelosisinfo@gmail.com, mikael@cpd.ufsm.br, pablotdv@gmail.com
² Professor do Curso de Sistema de Informação - ULBRA, Santa Maria, RS
e-mail: gustavoz@cpd.ufsm.br

1. INTRODUÇÃO
Cada vez mais as empresas têm a necessidade de analisar e visualizar os dados
corporativos independente de onde estejam, tanto em suas casas como no escritório do
trabalho, de uma forma cada vez mais rápida, dinâmica, consistente e que facilite a
tomada de decisão para a sua empresa.
O conceito de Online Analytical Processing (OLAP) tem por finalidade processar
grandes quantidades de dados em tempo real. Segundo Kimball (1998), OLAP é um
termo inventado para descrever uma abordagem dimensional para suporte à decisão,
através de uma analise dinâmica e multidimensional dos dados.
Englobado nestes conceitos encontra-se o servidor Mondrian: ferramenta open
source atualmente na versão 2.4, desenvolvida pela Pentaho BI Project.
O Mondrian aplica as tradicionais operações OLAP em XML Schemas. Para definir
as consultas na devida base dados, o Mondrian utiliza-se de uma outra tecnologia
padrão: MDX (Multidimensional Expressions), linguagem semelhante à SQL (Structured
Query Language), criada pela Microsoft, introduzida na ferramenta SQL Server OLAP
Services fazendo parte da especificação OLE DB/OLAP API. Porém o Mondrian não tem
um visualizador dos dados multidimensionais, podendo assim ser integrado como uma
API em outras ferrametas como o caso do JPivot.
Este resumo tem como objetivo analisar e estudar ferramentas abertas para a
realizacao de consultas OLAP e data warehouse.

2. OLAP
Conforme Fortulan & Filho (2005), ao longo do tempo, os bancos de dados foram
desenvolvidos para fins de processamentos de dados operacionais e analíticos, havendo
maior ênfase no primeiro caso, ainda que ambos tivessem usuários com diferentes
necessidades. Uma vez compreendida essa diferença, foram criados bancos de dados
separados para fins analíticos, chamados de Data Warehouse (DW).
O DW é utilizado para armazenar informações e o OLAP para recuperá-las, ambos
são especializados para exercer suas funções de forma eficiente. As duas tecnologias
são complementares de modo que um bom DW é planejado com produção de relatórios
em mente. Desta forma, para explorar o DW completamente é necessário o OLAP que irá
extrair e alavancar totalmente as informações nele contidas (ANZANELLO, 2005, p. 5).
Tomando por exemplo um sistema de uma típica vídeo locadora usa-se uma base
de dados com informações operacionais: dados do cliente, como endereço, nome e CPF;
informações sobre o produto (vídeo), título, descrição, gênero; e por fim os registros das
locações, contendo detalhes referente ao locatário (cliente), vídeo, data e valor.
Entretanto para o nível gerencial do referido sistema tal base de dados não
representa informações pertinente à tomada de decisão. Sendo necessário formular um
DW para esta base de dados através do conceito de multidimensionalidade ou cubo de
dados.
Cubo de dados é uma estrutura multidimensional que expressa à forma na qual os
tipos de informações se relacionam entre si. É formado pela tabela de fatos e pelas
tabelas de dimensão que a circundam e representam possíveis formas de visualizar e
1/2
consultar os dados. O cubo armazena todas as informações relacionadas a um
determinado assunto, de maneira a permitir que sejam montadas várias combinações
entre elas, resultando na extração de várias visões sobre o mesmo tema (HOKAMA et al.
2004, p. 49).
Logo, um cubo de dados representando o exemplo citado acima (sistema de vídeo
locadora), seria compreendido por dimensões e tabela de fatos, em que o primeiro
consiste respectivamente a gêneros, vídeos e clientes; e por conseguinte a tabela de
fatos seria locações.
De acordo com Hokama et al. (2004), a tabela de fatos é sempre esparsa, ou seja,
possui um número relativamente pequeno de todas as combinações possíveis de valores
de chaves.
Segundo Barbieri (2001), as tabelas de dimensão têm uma relação de 1:N com a
tabela de fatos, logo, possuem um número de registros bem menor. Possuem inúmeras
colunas de informação e uma chave primária, que acaba participando das tabelas de
fatos, como parte de sua chave múltipla.

3. MONDRIAN
O Mondrian é uma ferramenta que está incorporada em uma outra de análise
OLAP chamada de JPivot, sendo disposta como uma ferramenta Web J2EE, com
implementação padrão para rodar em servidor Web Apache Tomcat. O Mondrian,
executa as consultas e as retorna. Este retorno, porém, não tem uma saída definida. A
visualização das consultas retornadas depende de outro software, como por exemplo, o
Jpivot. Que não passa de uma tag library, que possibilita a visualização dos dados em
uma forma multidimensional.

4. CONCLUSÃO
Este resumo engloba as tecnologias Data Warehouse (DW) que tem o papel
fundamental para a tomada de decisão, Online Analytical Processing (OLAP) que
baseado no DW aplica metodologias de multidimensionalidade e manipulação da mesma
e em ferramantas de visualização dos dados multidimensionais o JPivot em conjunto do
Mondrian.

REFERÊNCIAS BIBLIOGRÁFICAS
FORTULAN, Marcos Roberto; FILHO, Eduardo Vila Gonçalves. Uma proposta de
aplicação de Business Intelligence no chão-de-fábrica. São Carlos, SP: 2005.
(Disponível em: www.scielo.br/pdf/gp/v12n1/a06v12n1.pdf. Acesso em: Setembro de
2007).
ANZANELLO, Cynthia Aurora. OLAP conceitos e utilização. Instituto de Informática,
UFRGS. (Disponível em:
www.inf.ufrgs.br/~clesio/cmp151/cmp15120021/artigo_cynthia.pdf . Acesso em: Setembro
de 2007).
HOKAMA, Daniele Del Bianco et al. A modelagem de dados no ambiente Data
Warehouse. São Paulo: 2004. 121 p. Projeto de Diplomação (Bacharelado em Sistemas
de Informação) - Faculdade de Computação e Informática, Universidade Presbiteriana
Mackenzie.
BARBIERI, Carlos. Business Intelligence: modelagem e tecnologia. Rio de Janeiro:
Axcel Books, 2001. 424 p.
KIMBALL, Ralph; et al. The Data Warehousing Lifecycle Toolkit: expert methods for
designing, developing, and deploying data warehouses. New York: John Wiley &
Sons, 1998. 771p.

2/2