Você está na página 1de 7

OLAP Conceitos e Utilizao

Cynthia Aurora Anzanello1


1

Instituto de Informtica Universidade Federal do Rio Grande do Sul (UFRGS)


Caixa Postal 15.064 91.501-970 Porto Alegre RS Brasil
cynthia@procergs.rs.gov.br

Resumo. O uso da tecnologia da informao possibilitou o armazenamento de


grande volume de dados em meio magntico, gerando a necessidade de recuper-los
e analis-los. As aplicaes On-Line Transaction Processing (OLTP) atendem,
apenas a manipulao de dados operacionais, o que no era suficente para apoiar o
usurio na tomada de decises estratgicas. A partir dos requisitos dos usurios e de
tecnologias existentes, foram elaborados conceitos e desenvolvidas solues que
alavancassem o processo de Business Inteligence (BI). A primeira das solues foi a
linguagem APL, base utilizada no desenvolvimento de aplicaes On-line Analytical
Processing (OLAP). O armazenamento dos dados para atender s necessidades
destas aplicaes, conforme atestou E.F.Codd, no seria solucionado por bancos de
dados relacionais. Desta forma, novos conceitos de armazenamento de informaes
foram implementados atravs de bancos de dados nomeados de Data Warehouse
(DW). Hoje o usurio j tem todas estas tecnologias implementadas por vrios
fornecedores. Alm do suporte para a tomada de deciso estratgica, surgiu a
necessidade de aplicao de heurstica para obter informaes que direcionem o
futuro dos negcios, e estas esto sendo implementadas atravs de ferramentas de
Data Mining (DM).
Abstract. The use of Information Tecnology enabled the storage of a vast volume of
data in magnetic environment creating the need to recover and analyse them. The
On-Line Transaction Processing (OLTP) applications only supplied the operational
data manipulation, which was not enough to support the users when taking strategic
decisions. Based on users requeriments and existing technology, concepts were
conceived and solutions were developed to lever the Business Inteligence (BI)
process. The first solution was APL language, wich was the fundamental basis used
in the On-Line Analytical Processing (OLAP) applications development. Storing data
to supply the need of these applications according to E.F. Codd wouldnt be solved
just by relational data base. This way, new concepts of information storage were
implemented through the data base named Data Warehouse (DW). Nowadays the
user has all these technologies implemented by several suppliers. Besides given
support to strategic decision taking, the need for heuristics applications arised to
obtain information that will drive the future of businesses and, these applications,
are being implemented through of Data Mining (DM).

1. Introduo
Para poder compreender o que e o que no OLAP, neste artigo se far descrio de sua
origem, seus conceitos, o contexto em que se insere, as arquiteturas de armazenamento
utilizadas, ferramentas com suas funes bsicas e sua ligao com DW e DM. Alm disto,
mostrar como o OLAP prov apoio ao usurio final na tomada de deciso estratgica e suas
tendncias.

2. Origem
A base da anlise Multidimensional para OLAP no nova. De fato, ela remonta a 1962, com a
publicao do livro A Programming Language, de Ken Iverson [1]. A IBM desenvolveu e
implementou a primeira linguagem com anlise multidimensional, no fim da dcada de 60,
chamada de APL. Definida matematicamente, baseada em smbolos gregos, utilizadas por
usurios finais e grande consumidora de recursos, foi amplamente utilizada nas dcadas de 80 e
90 em aplicaes de negcio. Acompanhando a evoluo dos sistemas, na dcada de 90,
introduziu-se uma nova classe de ferramentas no mercado, que foi batizada de OLAP. As
ferramentas de OLAP possuem a maioria dos conceitos introduzidos pela linguagem APL,
porm, com maior integrao na utilizao dos dados fontes. Existe um grupo de empresas que
desenvolveru e ainda desenvolve engine de OLAP e arquiteturas nela baseada como a IBM, a
Computer Associates, MicroSoft, MicroStrategy, Cognos, IRI, Oracle, entre outras.

3. Multdimensionalidade
O termo OLAP foi citado pela primeira vez por E.F.Codd, quando ele definiu doze regras que
estas aplicaes deveriam atender. A viso conceitual multidimensional dos negcios de uma
empresa foi umas das regras citadas, a qual se tornou a caracterstica fundamental no
desenvolvimento destas aplicaes. A viso multidimensional consiste de consultas que
fornecem dados a respeito de medidas de desempenho, decompostas por uma ou mais
dimenses dessas medidas. Podendo tambm serem filtradas pela dimenso e/ou pelo valor da
medida. As vises multidimensionais fornecem as tcnicas bsicas para clculo e anlise
requeridos pelas aplicaes de BI. Para se obter a viso multidimensional necessrio
compreender outras caractersticas:
Cubo uma estrutura que armazena os dados de negcio em formato multidimensional,
tornando-os mais fcil de analisar.
Dimenso uma unidade de anlise que agrupa dados de negcio relacionados. As
dimenses se tornam cabealho de colunas e linhas, como exemplo linhas de produto,
regies de venda ou perodos de tempo.
Hierarquia composta por todos os nveis de uma dimenso, podendo ser balanceada ou
no. Na hieraquia balanceada os nveis mais baixo so equivalentes, porm, isto no ocorre
nas hierarquias no balanceadas onde a equivalncia hierrquica no existe. Por exemplo,
em uma dimenso geogrfica o nvel pas no possui o subnvel Estado para um
determinado membro e possui para outro. No caso especfico pode-se citar o pas
Liechtenstein que no possui Estado e o Brasil, que possui uma srie de Estados.
Membro um subconjunto de uma dimenso. Cada nvel hierrquico tem membros
apropriados aquele nvel. Por exemplo, em uma dimenso geogrfica existe o nvel e seus
membros.
Nvel
Membros
Regio
sia, Amrica do Sul, Amrica do Norte
Pases
China, Brasil, USA
Estados/Provncias
Yunna, Piau, California
Medida uma dimenso especial utilizada para realizar comparaes. Ela inclue membros
tais como: custos, lucros ou taxas.

4. Definio de OLAP
A aplicao OLAP soluciona o problema de sntese, anlise e consolidao de dados, pois o
processamento analtico online dos dados. Tem capacidade de vizualizaes das infomaes a
partir de muitas perspectivas diferentes, enquanto matm uma estrutura de dados adequada e

eficiente. A visualizao realizada em dados agregados, e no em dados operacionais porque


a aplicao OLAP tem por finalidade apoiar os usurios finais a tomar decises estratgicas. Os
dados so apresentados em termos de medidas e dimenso, a maior parte das dimenses
hierrquica. Considerando as aplicaes bancrias utilizadas diariamente no controle de contas
correntes, na qual so efetuados saques ou depsitos pelos correntistas, se tem o exemplo
tpico de sistema de OLTP. O interesse destes usurios criar, atualizar e recuperar
informaes sobre registros individuais. J para o Gerente de Conta Correntes os requisitos de
uso de informaes dos dados das contas tem por finalidade a anlise global de contas correntes
com diversas vises. Por exemplo, o Gerente de Contas pode requer uma anlise sobre o
desempenho de contas correntes que tenham cheque especial e tenham utilizado o valor
mximo dos mesmos em um determinado perodo de tempo em algumas regies. Obter a
resposta a esta consulta mais complexa fazendo uso de ferramentas relacionais padro, no
fornece soluo requerida. Analisando as limitaes do uso de ferramentas relacionais padro,
E.F. Codd disse: Ter um RDBMs no significa ter a nirvana instantnea de suporte a deciso.
Mesmo com tantas possibilidades que os RDBMs tm oferecido aos usurios, eles nunca
pretenderam fornecer poderosas funes de sntese, anlise e consolidao de dados.
(Computerworld, 1993) [2].
Como se pode observar as aplicaes OLAP diferem das aplicaes OLTP no que se refere aos
requisitos funcionais e de desempenho, conforme apresentado na Tab 1.
CARACTERSTICAS

OLTP

OLAP

Operao Tpica

Atualizao

Anlise

Telas

Imutvel

Definida pelo Usurio

Nvel de Dados

Atomizado

Altamente Sumarizado

Idade dos Dados

Presente

Histrico, Atual e Projetado

Recuperao

Poucos
registros

Muitos registros

Orientao

Registro

Arrays

Modelagem

Processo

Assunto

Tab.1.: As caractersticas marcantes que diferenciam os sistemas OLAP e OLTP

4.1 Soluo OLAP


O OLAP mais do que uma aplicao uma soluo de ambiente, integrao e modelagem de
dados. A maioria dos dados de uma aplicao OLAP, so originrias de outros sistemas e
fontes de dados. Para formular a topologia e o projeto de uma soluo OLAP multidimensional
as seguintes perguntas devem ser feitas: Quando ?, O qu ?, Onde ? e Quem ?. Essas perguntas
formam a base de todos os arrays multidimensionais. A obteno dos dados originrios das
respostas so destinados aos DW e, da, possivelmente para um ou vrios Data Marts (DMs).
Os DMs so subconjunto de informaes dos DWs, segmentado para uma determinada rea ou
assunto, visando aumentar a velocidade na consulta de informaes.
Durante o projeto de OLAP, conforme os requisitos do usurio, poder haver a necessidade de
integrao de dados de plataformas diferentes e solues de conectividade devem ser
planejadas. Alm disto, a modelagem dos dados outra preocupao importante para que as
respostas esperadas s consultas complexas, possam ser fornecidas com a flexibilidade e com a
performance adequada aos requisitos dos usurios. O armazenamento dos dados ou ser feito
em um RDBMS ou em um banco de dados mutidimensional (MDDB). A modelagem para o

armazenamento dos dados deve considerar as vantagens, desvantagens e aplicapilidade


oferecidas por cada tipo. Os modelos relacionais normalizados atendem basicamente ao
processamento de poucos registros, sendo de baixa performance na agregao da informao.
Os Modelos Star Schema so ligeiramente normalizados, composto por dois tipos bsicos de
tabelas, de fatos e dimenso. A tabela de fatos a tabela central normalizada, que representa as
transaes contendo os valores que esto sendo analisados e as chaves estrangeiras das tabelas
de dimenso. J o modelo Snow Flakes uma variao do modelo Star, com vises ajustadas
para o enfoque desejado, no qual as tabelas de dimenso tambm so normalizadas. E os
Modelos Multidimensionais so os cubos que visam a performance, com as informaes
fortemente agregadas.
A escolha da ferramenta de OLAP no deve ser uma das primeiras tarefas em um projeto de
dsenvolvimento de uma aplicao OLAP. O mais interessante iniciar com a obteno dos
dados, sua modelagem, armazenamento e, a sim, se proceda a escolha da ferramenta de OLAP.

4.2 Arquiteturas
Conforme o mtodo de armazenamento de dados utilizado para uma aplicao OLAP, ser
elaborada a arquitetura da aplicao. Os mtodos de armazenamento de dados, so MOLAP,
ROLAP, DOLAP e HOLAP. Cada um deles tem uma funo especfica e deve ser utilizada
quando melhor atender s necessidades de anlise pela ferramenta de OLAP.
No MOLAP (Multidimensional On-Line Analytical Processing) os dados so armazenados de
forma multidimensional, sua implementao varia de acordo com a sua ferramenta de OLAP,
mas freqentemente implementado em um banco de dados relacional, porm no na terceira
forma normal. Alm disto o acesso aos dados ocorre diretamente no banco de dados do servidor
multidimensional. Os gerenciadores de banco de dados tm um limite prtico quanto ao
tamanho fsico de dados que eles podem manipular. As restries de armazenamento e
desempenho limitaro o tamanho do banco de dados, no esquecendo o limite das dimenses
que tambm restrigem sua manipulao. A complexidade que existe no processo de carga de
um banco de dados multidimensional, pode acarretar a demora no processo. O processo de
carga complexo devido a srie de clculos que devem ser realizados para agregar os dados s
dimenses e preencher as estruturas do banco. Depois do processo concludo, ainda realizado
uma srie de mencanismos para melhorar a capacidade de pesquisa.
J no ROLAP ( Relational On-Line Analytical Processing) os dados so armazenados no
modelo relacional como tambm suas consultas so processadas pelo gerenciador do banco
relacional.
Por outro lado, o DOLAP ( Desktop On-Line Analytical Processing) uma variao que existe
para fornecer portabilidade dos dados. A vantagem que oferece esta arquitetura a reduo do
trfico na rede.
A arquitetura mais recente a HOLAP ( Hybrid On-Line Analytical Processing), na qual ocorre
uma combinao entre ROLAP e MOLAP. A vantagem que com a mistura de tecnologias
pode-se extrair o que h de melhor de cada uma, a alta performance do MOLAP e a
escalabilidade do ROLAP.

4.3 Ferramentas
Atualmente, existem muitas ferramentas de OLAP no mercado e mudanas tm ocorrido em
um ritmo acelerado. Na maioria das ferramentas observa-se a existncia de dois componentes:
a ferrramenta do administrador e a ferramenta do usurio final. O componente do
administrador usado para administrar e gerar os cubos de dados a serem acessados., enquanto

o componente do usurio final, tem acesso aos dados para extra-los de suas bases de dados,
com os quais geram relatrios capazes de responder as suas questes gerenciais. As
ferramentas surgiram juntamente com os sistemas de apoio a deciso para fazerem a extrao e
anlise dos dados contidos nos DW e DMs. Algumas das caractersticas destas ferramentas:

Consultas ad-hoc: geradas pelos usurios finais de acordo com os suas necessidades
de cruzar informaes de uma forma no vista e que o levem a descoberta do que
procuram. Segundo Inmom so consultas com acesso casual nico e tratamento de
dados segundo parmetros nunca antes utilizado de forma iterativa e heurstica.[3]

Slice and Dice: possibilita a alterao da perspectiva de viso. Serve para modificar a
posio de uma informao, trocar linhas por colunas de maneira facilitar a compreenso
dos usurios e girar o cubo sempre que houver necessidade.

Drill down/up: consiste em realizar explorao em diferentes nveis de detalhes da


informao. Com drill down dividi-se um item de resumo em seus componentes
detalhados, como por exemplo ano, semestre trimestre, mensal e dirio.

Alm das principais caractersticas apresentadas necessrios que estas aplicaaes forneam
vrios modelos de visualizao em uma variedade de formatos, e no apenas em simples
tabelas, sendo muitas vezes apresentados atravs de grficos.

5. Ligao do DW e OLAP
O DW utilizado para armazenar informaes e o OLAP para recuper-las, ambos so
especializados para exercer suas funes de forma eficiente. As duas tecnologias so
complementares de modo que um bom DW planejado com produo de relatrios em mente.
Desta forma, para explorar o DW completamente necessrio o OLAP que ir extrair e
alavancar totalmente as informaes nele contidas.

6. Ligao do Data Mining e OLAP


O OLAP e Data Mining so partes integrantes de todo e qualquer processo de suporte
deciso. Ainda, nos dias de hoje, a maioria dos sistemas de OLAP tem o foco no provimento de
acesso aos dados multidimensionais, enquanto os sistemas de DM lidam com a anlise de
influncia para os dados de uma nica dimenso. As grandes empresas como a IBM, Oracle
esto liberando verses de seus RDBMS que possuem ferramentas de OLAP e DM. Quando os
usurios possuem ferramentas de OLAP e no de minerao de dados, eles gastam boa parte de
seu tempo fazendo as tarefas pertinentes a um DM, como classificaes e predies das
informaes recebidas

7. Tendncias
O JOLAP um esforo da Java Community Process (JCP) de projetar uma API Java para
servidores e aplicaes OLAP, aderentes ao ambiente Java 2Plataform Enterprise Edition
(J2EE). Ela est sendo especificada para suportar a criao e manuteno de dados e metadados
OLAP, independente de fornecedor. JOLAP baseada em uma forte generalizao, orientada a
objeto e nos conceitos de OLAP. Este modelo suporta conceitos referentes a trs reas que so
chave para as aplicaes OLAP, metadados, dados e pesquisas. As especificaes no
descrevem a estratgia de implementao. Os fornecedores como a IBM, ORACLE, Microsoft,
Sun, entre outros fazem parte deste grupo e j esto desenvolvendo solues baseadas nestas
especificaes. Pacotes Java esto sendo propostos como extenso do padro JOLAP, so eles:
javax.olap, javax.olap.metadata, javax.olap.data e javx.olap.query.

reas diversas tm se utilizado de aplicaes OLAP para tomar decises estratgicas entre elas
a rea da sade, finaceira, marketing e at mesmo as de informaes geogrficas. Como o
descrito por Simon Plante, engenheiro do Ministrio do Trabalho do Canada: Em 1999, o
ministrio dos Transporte do Canada de Quebec iniciou, em colaborao com o centro de
pesquisa da Universidade de Laval, um novo projeto de pesquisa. Os objetivos eram de
experimentar as possibilidades de anlise de domnios de planificao da infra-estruturas de
rotas com a ajuda de uma aplicao de OLAP e de uma aplicao Sistema de Informaes
Geogrficas (SIG), para analisar a seguraa e a mobilidade das estradas do Canada. Com a
combinao da tecnologia SIG e de OLAP, houve a obteno de uma ferramenta muito
poderosa, nomeada de SOLAP. Com efeito, est combinao permite localizar, sobre uma carta
geogrfica, as informaes correspondentes comnsultados por intermdio de OLAP e viceversa. Os usurios do SOLAP podem navegar atarvs dos dados, adotando duas abordagens
diferentes: uma a partir da interface de OLAP e outra atravs do SIG. Pelos resultados obtidos
possvel crer que em um futuro prximo ele ser aplicado em outras reas.[4]
O artigo de Jiawei Han, da Univerisidade Simon Fraser University, British Columbia, Canada
apresenta o conceito de On-Line Analytical Mining (OLAM), no qual descrito o seguinte:
Nosso trabalho tem sido focado na integrao das tecnologias de DM e OLAP e no
desenvolvimeno escalvel, integrado de funes mltiplas de DM. O sistema de DM,
DBMiner, tem sido desenvolvido para minerao interativa de mltiplos nveis de
conhecimento em grandes RBDMS e DW..[5] A implementao de OLAM, apoir os usurios
a realizarem minerao de dados interativos. Existe uma arquitetura proposta para este fim o
desenvolvimento de uma engine de OLAM. Alm disto, as pesquisas tm se estendido para
DM espacial, DM multimidia, DM texto e DM Web.

8. Concluso
As tecnologias de armazenamento, recuperao e anlise de dados estratgicos tm evoluido
em sincronia, pois elas so complementares uma das outras. As ferramentas OLAP trabalham
de modo interativo, permitindo que a partir de uma resposta o usurio faa outros
questionamentos, ou seja, o usurio consiga analisar o porqu dos resultados obtidos Alm
disto, uma grande gama de fornecedores esto investindo no desenvolvimento de aplicativos
OLAP, pois cada vez mais se faz necessrio analisar as informaes que alavanquem os
negcios das empresa com rapidez e eficincia.
OLAP um conceito de interface com o usurio, no se trata de uma tecnologia de
armazenamento de dados, mas de uma soluo, uma soluo de ambiente, integrao e
modelagem de dados.
OLAP como DM fazem partem do espectro das ferramentas de BI.
Na utilizao de OLAP no existe a melhor estratgia. A melhor estratgia ser definida pelos
requistos de seu aplicativo.

9. Referncias
[1] Nigel Pendse, www.olapreport.com/origins.htm, July 20,2002.
[2] Michael Corey, Michael Abbey, Ian Abramson e Ben Taub, ORACLE 8i, 2001
www.pilotsw.com/new/olap_white.htm.
[3] W.H.Inmom e R.D.H Hackthom,Using DataWarehouse New York, John Wilwy &
Son, Inc, 1994.
[4] Simon Plante, www.pqqq.gouv.qc.ca/geoinfo/num/dec01_2.htm. Dcembre 2001

[5] Jiawei Han Intelligent Database Systems Research Laboratory School of Computing
Science, Simon Fraser University, British Columbia, Canada V5A 1S6 URL:
http://db.cs.sfu.ca/ (for research group) http://db.cs.sfu.ca/DBMiner (for system)

Você também pode gostar