Você está na página 1de 68

UNIVERSIDADE DO EXTREMO SUL CATARINENSE - UNESC

CURSO DE PS-GRADUAO ESPECIALIZAO EM

MBA GERENCIAMENTO DE BANCO DE DADOS

RENATO CRAMER

ESTUDO ANALTICO DE FERRAMENTAS OPEN SOURCE

PARA AMBIENTES OLAP

CRICIMA, AGOSTO DE 2006


1

RENATO CRAMER

ESTUDO ANALTICO DE FERRAMENTAS OPEN SOURCE

PARA AMBIENTES OLAP

Monografia apresentada Diretoria de Ps-


Graduao da Universidade do Extremo Sul
Catarinense- UNESC, para a obteno do ttulo
de especialista em Gerenciamento de Banco
de Dados.

Orientador: Prof. M.Sc. Rafael Gasto Coimbra


Ferreira.

CRICIMA, AGOSTO DE 2006


2

Dedico minha querida Me.


3

RESUMO

O objetivo principal deste trabalho foi apresentar o estado atual das ferramentas
open source para ambientes OLAP, oferecendo informaes relevantes para os
profissionais da rea de informtica que desejam utilizar estas tecnologias. Foi
dedicada uma grande parte do mesmo para apresentao terica dos conceitos, de
OLTP a OLAP. Isso justifica-se pelo fato de que a grande maioria dos profissionais
de informtica, principalmente os desenvolvedores, trabalham somente com
sistemas OLTP, muitas vezes desconhecendo as tecnologias de Data Warehouse e
OLAP. Por este motivo tambm foram descritas as reas de aplicao e os
benefcios do OLAP. Houve uma preocupao em selecionar as ferramentas que
pudessem oferecer uma soluo OLAP prxima das necessidades dos
desenvolvedores, por exemplo, possuindo servidor e cliente OLAP e rodando nos
sistemas operacionais mais difundidos, ou seja, Windows e Linux. Por estes motivos
esta pesquisa foi basicamente descritiva quanto aos objetivos. Alm disso, teve
como idia principal que os dados operacionais dos sistemas OLTP sejam
transformados em informaes nos sistemas OLAP, como excelentes ferramentas
que so, para o apoio tomada de deciso de gestores e executivos.

Palavras-chave: Business Intelligence; OLAP; Modelagem Multidimensional; Open


Source.
4

LISTA DE ILUSTRAES

Figura 1 Arquitetura Funcional de um DW...........................................................19

Figura 2 Viso de um Tesseract..........................................................................28

Figura 3 Cubo tridimensional produtos, meses e revendas.................................29

Figura 4 Star Schema..........................................................................................30

Figura 5 Entidades do Ambiente DW...................................................................32

Figura 6 Snowflake Schema................................................................................33

Figura 7 Volume de Vendas por Regio..............................................................35

Figura 8 Volume de Vendas da Regio Sul.........................................................35

Figura 9 Slice por Produto ...................................................................................36

Figura 10 Dice por Revenda e Tempo.................................................................37

Figura 11 Drill Across ..........................................................................................37

Figura 12 Pivoting................................................................................................38
5

LISTA DE TABELAS

Tabela 1 Comparao entre atividades de processamento de informaes

operacionais e baseadas em anlise, orientadas a deciso...................................15

Tabela 2 Diferenas entre um Data Mart e um Data Warehouse ........................22

Tabela 3 Ferramentas Descartadas ....................................................................53

Tabela 4 Caractersticas da ferramenta Pentaho BI .........................................58


6

LISTA DE ABREVIATURAS E SIGLAS

DBMS Database Management System ou Sistema de Gerenciamento de Banco de

Dados

SGBD Sistema de Gerenciamento de Banco de Dados

SGBDR Sistema de Gerenciamento de Banco de Dados Relacional

TI Tecnologia da Informao
7

SUMRIO

1 INTRODUO ....................................................................................................10

1.1 Tema ................................................................................................................10

1.2 Delimitao do Tema......................................................................................10

1.3 Problema .........................................................................................................11

1.4 Objetivos .........................................................................................................11

1.4.1 Objetivo Geral ..............................................................................................11

1.4.2 Objetivos Especficos .................................................................................11

1.5 Justificativa .....................................................................................................12

2 CONCEITOS E TERMINOLOGIA .......................................................................13

2.1 Open Source ...................................................................................................13

2.2 Flat File ............................................................................................................13

2.3 OLTP ................................................................................................................14

2.4 Business Intelligence (BI) ..............................................................................15

3 DATA WAREHOUSE ..........................................................................................17

3.1 Caractersticas ................................................................................................17

3.1.1 Orientado ao Assunto .................................................................................18

3.1.2 Integrado ......................................................................................................18

3.1.3 No Voltil ....................................................................................................18

3.1.4 Variante no Tempo ......................................................................................18

3.2 Granularidade .................................................................................................19

3.3 Arquitetura Funcional ....................................................................................19

3.3.1 rea Interna .................................................................................................20


8

3.3.2 rea Externa.................................................................................................21

3.4 Data Mart .........................................................................................................22

4 OLAP...................................................................................................................23

4.1 O que OLAP? ...............................................................................................23

4.2 O Modelo Multidimensional ...........................................................................24

4.2.1 Fatos .............................................................................................................25

4.2.2 Dimenses ...................................................................................................25

4.2.3 Membros e Hierarquias ...............................................................................26

4.2.4 Medidas ........................................................................................................27

4.2.5 Cubos de Dados ..........................................................................................27

4.2.6 Star Schema .................................................................................................30

4.2.7 Surrogate Key ..............................................................................................31

4.2.8 Snowflake Schema ......................................................................................33

4.3 Recursos OLAP ..............................................................................................34

4.3.1 Drill Down e Roll Up ....................................................................................34

4.3.2 Slice and Dice ..............................................................................................36

4.3.3 Drill across ...................................................................................................37

4.3.4 Pivoting ........................................................................................................38

4.3.5 Ranking ........................................................................................................38

4.4 Bancos de Dados Multidimensionais ...........................................................39

4.5 Servidor e Cliente OLAP ................................................................................40

4.6 Arquiteturas OLAP .........................................................................................41

4.6.1 ROLAP ..........................................................................................................42

4.6.2 MOLAP..........................................................................................................43

4.6.3 HOLAP ..........................................................................................................43


9

4.6.4 DOLAP ..........................................................................................................44

4.6.5 WOLAP .........................................................................................................45

4.7 Benefcios do OLAP .......................................................................................46

4.8 reas de Aplicao para OLAP .....................................................................47

5 CRITRIOS PARA AVALIAO DE FERRAMENTAS OLAP ..........................49

5.1 As 12 Regras de Codd....................................................................................49

5.2 O Teste FASMI ................................................................................................50

5.3 Caractersticas Selecionadas ........................................................................51

5.3.1 Recursos OLAP ...........................................................................................52

5.3.2 Linguagens...................................................................................................52

5.3.3 Gerais ...........................................................................................................52

6 FERRAMENTAS OPEN SOURCE PARA AMBIENTES OLAP..........................53

6.1 Ferramentas Selecionadas ............................................................................54

6.1.1 Pentaho - Business Intelligence.................................................................54

6.1.2 Mondrian ......................................................................................................55

6.1.3 JPivot............................................................................................................56

7 METODOLOGIA..................................................................................................57

7.1 Tipo de Pesquisa ............................................................................................57

7.1.1 Abordagem...................................................................................................57

7.1.2 Objetivos ......................................................................................................57

8 APRESENTAO E ANLISE DOS DADOS....................................................58

9 CONCLUSO .....................................................................................................59

REFERNCIAS ......................................................................................................61

ANEXOS ................................................................................................................64
10

1 INTRODUO

O presente trabalho visa apresentar o estado atual das ferramentas open

source para ambientes OLAP, analisando as caractersticas e funcionalidades

especficas de cada ferramenta, com embasamento terico de conceitos

reconhecidos de autoridades no assunto.

Sero analisadas exclusivamente as ferramentas que possurem servidor

e cliente OLAP.

Como resultado, esta pesquisa pretende oferecer informaes relevantes

para os profissionais da rea de informtica que desejam utilizar a tecnologia OLAP

com ferramentas open source.

1.1 Tema

OLAP - Online Analytical Processing (Processamento analtico em tempo

real).

1.2 Delimitao do Tema

Ferramentas open source para ambientes OLAP.


11

1.3 Problema

No h, de forma explcita e sistematizada, a identificao e

caracterizao de ferramentas open source para ambientes OLAP.

1.4 Objetivos

A seguir sero apresentados o objetivo geral e os objetivos especficos

deste trabalho.

1.4.1 Objetivo Geral

Conhecer as ferramentas Open Source para ambientes OLAP e suas

caractersticas especficas.

1.4.2 Objetivos Especficos

Possibilitar operaes e atividades de anlise para diversos tipos de

negcios atravs de ferramentas open source.

Viabilizar o desenvolvimento de sistemas para suporte tomada de

deciso atravs de custos acessveis.


12

1.5 Justificativa

O suporte tomada de deciso baseado em ferramentas OLAP

comerciais possui um custo elevado, que para a maioria das pequenas e mdias

empresas torna-se proibitivo.

Identificar ferramentas open source para ambientes OLAP capazes de

atender os principais requisitos que tais ambientes exigem tornar possvel para

muitas destas empresas a implementao de sistemas para suporte tomada de

deciso.

Tal possibilidade de implementao ser maior para empresas que

possuem equipe prpria de desenvolvimento de sistemas de informao.


13

2 CONCEITOS E TERMINOLOGIA

O objetivo deste captulo apresentar conceitos relacionados tecnologia

OLAP e esclarecer parte da terminologia utilizada nesse trabalho.

2.1 Open Source

A Open Source Initiative (OSI) uma corporao sem fins lucrativos

dedicada a administrar e promover a definio de software open source. A definio,

alm da exigncia da disponibilidade de acesso ao cdigo fonte dos programas,

contm alguns critrios para a distribuio do software, descritos no ANEXO A - The

Open Source Definition.

2.2 Flat File

Um Flat File, que pode ser traduzido como arquivo plano, um tipo de

arquivo usado para armazenamento de dados.

Uma definio para Flat File pode ser encontrada em WIKIPEDIA

CONTRIBUTORS (2006. Flat file database):

Um flat file um arquivo contendo registros, geralmente um registro por


linha. Os campos podem simplesmente ter uma largura fixa com
preenchimento ou serem delimitados por espao em branco ou tabulaes
ou vrgulas (CSV) ou outros caracteres. Uma formatao extra pode ser
necessria para distinguir um espao interno de um delimitador. No
existem relacionamentos estruturais. Os dados so planos como em uma
folha de papel, em contraste com modelos mais complexos tal como um
banco de dados relacional.
14

Uma outra definio para Flat File, que complementa a anterior,

mencionada em Chapple (2006):

Flat files so arquivos de dados que contm registros sem relacionamentos


estruturados. necessrio um conhecimento adicional para interpretar
estes arquivos, tal como as propriedades de formato do arquivo. SGBDs
modernos usam uma abordagem mais estruturada para administrao de
arquivos (tal como a definida pela SQL) e portanto tm uma estrutura de
armazenamento mais complexa.

2.3 OLTP

OLTP o acrnimo de Online Transaction Processing (Processamento

de Transaes em Tempo Real). uma categoria de software utilizado no nvel

operacional, para armazenar dados detalhados das transaes de negcios de uma

organizao conforme as mesmas ocorrem. Uma aplicao OLTP possui vrios

usurios concorrentes inserindo, alterando e excluindo dados em tempo real.

As aplicaes OLTP atendem a manipulao de dados operacionais,

sendo incapazes de efetuarem anlises complexas para apoiar o usurio na tomada

de decises estratgicas.

O conceito de OLTP exemplificado, citando brevemente o contraste com

OLAP, em Garcia-Molina (2001, p. 654):

Em geral, as consultas de apoio deciso usadas em aplicativos de OLAP


examinam quantidades muito grandes de dados, ainda que os resultados
das consultas sejam pequenos. Em contraste, cada uma das operaes
comuns de bancos de dados, como depsitos bancrios ou reservas de
passagens areas, toca apenas uma poro minscula do banco de dados;
esse ltimo tipo de operao chamado freqentemente OLTP (On-Line
Transaction Processing).

Erik Thomsen, na tabela a seguir (Tabela 1), resume as diferenas entre

as atividades de sistemas operacionais e aquelas baseadas em anlise, orientadas


15

a deciso.

Tabela 1 Comparao entre atividades de processamento de informaes

operacionais e baseadas em anlise, orientadas a deciso.

ATIVIDADES OPERACIONAIS ATIVIDADES BASEADAS EM ANLISE,


ORIENTADAS A DECISO
Mais freqentes Menos freqentes
Mais previsveis Menos previsveis
Menores quantidades de dados Maiores quantidades de dados acessados
acessados por consulta por consulta
Consulta principalmente de dados Consulta principalmente de dados derivados
primitivos
Exige principalmente dados atuais Exige dados passados, presentes e
projetados
Pouca ou nenhuma derivao Muitas derivaes complexas
complexa
Fonte: Thomsen (2002, p. 13).

Na medida em que uma organizao acumula dados operacionais com o

passar do tempo, os mesmos podem ser utilizados para suportar tomadas de

decises estratgicas, em nvel de gerncia. Os dados detalhados das transaes

de negcios de uma organizao devem passar por um processo de transformao

para atender este tipo de demanda de informaes, resultando em conhecimento

estratgico, que auxilia os diversos nveis de uma organizao na tomada de

decises.

2.4 Business Intelligence (BI)

O Business Intelligence, que pode ser traduzido como Inteligncia de

Negcios ou Inteligncia Empresarial, uma classe de tecnologias e ferramentas

voltadas para atender o nvel gerencial das organizaes, transformando dados em


16

informaes significativas. Wayne Eckerson conceitua Business Intelligence, em

Eckerson (2002), como: Os processos, tecnologias e ferramentas necessrias para

transformar dados em informao, informao em conhecimento, e conhecimento

em planos que conduzem aes de negcio lucrativas.

Entre estas tecnologias e ferramentas encontram-se Data Warehouses,

ferramentas OLAP, e outras, como Decision Support Systems (DSS), Executive

Information Systems (EIS), Data Mining e Knowledge Management, por exemplo.


17

3 DATA WAREHOUSE

O objetivo deste captulo fornecer as informaes necessrias a

respeito da tecnologia de Data Warehouse que sero utilizadas no prximo captulo,

que trata especificamente sobre OLAP.

Os Data Warehouses (DWs) possuem uma arquitetura com o objetivo de

oferecer acesso a dados para anlises complexas, descoberta de conhecimento e

tomada de deciso. No Data Warehouse no existem controles necessrios de

bancos de dados tradicionais que suportam processamento de transaes em tempo

real (OLTP), que inclui inseres, atualizaes e excluses, ao mesmo tempo que

suportam requisies de consultas. Data Warehouses so projetados para suportar

extrao, apresentao de dados e processamento eficientes, para finalidades

analticas e de tomada de deciso.

A utilizao inicial da expresso Data Warehouse atribuda a William

H. Inmon. A expresso caracterizada em Inmon (2002, p. 31): "Um data

warehouse uma coleo de dados orientados ao assunto, integrados, no-volteis

e variantes no tempo, para fornecer suporte s decises de gerentes".

3.1 Caractersticas

A seguir sero explicadas brevemente as caractersticas de um Data

Warehouse.
18

3.1.1 Orientado ao Assunto

Significa que as informaes so armazenadas e se relacionam em

grupos de assuntos de interesse de uma organizao, focando as principais

atividades de negcio.

3.1.2 Integrado

Significa que as informaes provenientes dos sistemas operacionais de

uma organizao so consolidadas, de forma que sejam consistentes e tenham um

nico significado, ou seja, so codificadas de uma nica forma.

3.1.3 No Voltil

Significa que as informaes so carregadas em massa no Data

Warehouse e no sofrem atualizaes como nos sistemas OLTP, sendo

disponibilizadas somente para consultas.

3.1.4 Variante no Tempo

Significa que as informaes do Data Warehouse sempre esto

associadas a um ponto no tempo, compondo sries histricas.


19

3.2 Granularidade

A granularidade em um Data Warehouse se refere ao nvel de

detalhamento das informaes armazenadas, ou seja, quanto mais detalhadas as

informaes, menor a granularidade do Data Warehouse.

A granularidade afeta o volume de informaes armazenadas e os tipos

de consultas que podem ser respondidas aos usurios: quanto menor o nvel de

granularidade, mais informaes sero armazenadas, e maior o detalhamento

possvel das consultas dos usurios; por outro lado, um alto nvel de granularidade

possui um volume menor de informaes armazenadas e permite maior rapidez nas

respostas das consultas, porm limita as mesmas quanto ao seu detalhamento.

3.3 Arquitetura Funcional

A arquitetura funcional de um Data Warehouse divide-se basicamente em

duas grandes reas: interna e externa, conforme ilustrado a seguir:

Figura 1 Arquitetura Funcional de um DW.

Fonte: Ferreira (2004, p. 25).


20

3.3.1 rea Interna

A rea interna composta pelas fontes externas de dados, staging area,

armazenamento de dados do DW e metadados.

As fontes externas armazenam os dados de origem que abastecem o DW,

geralmente provenientes de sistemas OLTP legados. Os dados tambm podem

estar armazenados em flat files ou em algum outro meio.

A staging area uma rea intermediria de armazenamento entre as

fontes externas e o DW, nela os dados so preparados, limpos e integrados para

posterior carga no DW.

O armazenamento de dados, ou repositrio do DW contm as

informaes j consolidadas e disponveis para serem utilizadas pela rea externa,

sendo que os dados so carregados em massa.

Os metadados contm dados sobre os dados do DW, ou seja, so

informaes que descrevem um conjunto de dados. Geralmente so armazenados

em um repositrio fora do alcance dos usurios. Algumas das informaes contidas

nos metadados so descritas em Imhoff, Galemmo e Geiger (2003, p. 403):

Ele fornece definies para dados, os clculos usados, informao sobre de


onde os dados vieram (quais sistemas fontes), o que foi feito com ele
(transformaes, rotinas de limpeza, algoritmos de integrao, etc.), quem
est usando ele, quando o usam, quais as mtricas de qualidade existem
para vrias partes de dados, e assim por diante.

Na rea interna ocorre o processo de Extrao, Transformao e Carga,

denominado ETL (Extraction, Transformation and Load). Este processo dividido em

etapas e responsvel pela integridade, qualidade e consolidao das informaes

provenientes das fontes externas at o armazenamento do DW. Este processo


21

ocorre na carga inicial e nas atualizaes peridicas dos dados do Data Warehouse,

sendo que a periodicidade das atualizaes deve levar em considerao o volume

de dados e de processamento envolvido.

A ETL um fator crtico de sucesso na implantao de um Data

Warehouse. Deve-se atribuir uma importncia fundamental a este processo na fase

de projeto de um DW, pois conforme citado em Inmon (2002, p. 295): "O processo

de integrao e transformao de dados tipicamente consome at 80% dos recursos

de desenvolvimento. Esta informao reiterada por Eckerson e White (2003, p. 4):

De acordo com a maioria dos profissionais, o trabalho de projeto e desenvolvimento

com ETL consome de 60% a 80% de um projeto inteiro de BI.

Um processo de ETL mal projetado ou executado pode arruinar

completamente a implantao de um DW em uma empresa, tanto pelos recursos e

custos necessrios, como pela qualidade das informaes fornecidas para a rea

externa, ou seja, para os usurios analistas, tomadores de deciso.

O valor da qualidade de uma informao pode ser medido comparando-se

os resultados das aes tomadas a partir de uma informao exata com os

resultados obtidos atravs de uma informao equivocada.

3.3.2 rea Externa

Na rea externa encontram-se os metadados e as aplicaes e

ferramentas de acesso aos dados, possibilitando consultas ad hoc e relatrios

especficos. Consultas ad hoc so consultas circunstanciais, no programadas,

pertinentes a um determinado momento de anlise. Na rea externa localizam-se as

ferramentas OLAP alm de outras, como por exemplo, Data Mining e Relatrios

Analticos.
22

3.4 Data Mart

Um Data Mart uma diviso lgica de um Data Warehouse que atende a

uma rea especfica de negcio de uma organizao. Um Data Mart no um

pequeno Data Warehouse, mas uma unidade lgica de um DW, podendo ser

qualificado como um Data Warehouse departamental. Uma organizao pode

construir vrios Data Marts ao longo do tempo, e vincul-los a um Data Warehouse

da empresa inteira.

Um conceito de Data Mart citado em Inmon, Tederman e Imhoff (2001,

p. 11):

Os data marts so estruturas moldadas pelos dados granulares encontrados


no data warehouse corporativo. Os data marts pertencem aos
departamentos especficos dentro de uma empresa geralmente finanas,
contabilidade, vendas ou marketing e so moldados pelos requerimentos
dos departamentos. Conseqentemente, o design de cada data mart
nico.

A grande maioria dos DWs atualmente em produo, na realidade, so

Data Marts.

Algumas diferenas entre um Data Mart e um Data Warehouse so

relacionadas na tabela a seguir, conforme Inmon (1999, p. 4):

Tabela 2 Diferenas entre um Data Mart e um Data Warehouse.


DATA MART DATA WAREHOUSE
Departamental Corporativo
Alto nvel de granularidade Baixo nvel de granularidade
Estrutura star-join Estrutura normalizada
Pequena quantidade de dados Grande quantidade de dados histricos
histricos
Tecnologia otimizada para acesso e Tecnologia otimizada para armazenamento e
anlise gerenciamento de grandes volumes de dados
Cada departamento possui uma Estrutura adequada ao entendimento
estrutura diferente corporativo de dados
Altamente indexado Levemente indexado
Fonte: Inmon (1999, p. 4).
23

4 OLAP

O objetivo deste captulo apresentar a tecnologia OLAP e seus

conceitos, a modelagem multidimensional, os recursos e as arquiteturas OLAP,

fornecendo o embasamento necessrio para o prximo captulo, que trata dos

critrios para avaliao de ferramentas OLAP.

4.1 O que OLAP?

OLAP o acrnimo de Online Analytical Processing (Processamento

analtico em tempo real). Foi criado em 1993 por Edgar F. Codd, que tambm criou o

Modelo Relacional, utilizado por Sistemas Gerenciadores de Banco de Dados

Relacionais (SGBDRs).

Basicamente uma classe de tecnologias projetada para anlise de

dados multidimensionais, muito utilizada nos sistemas de suporte deciso,

permitindo avaliar sries histricas de dados.

Em Codd, Codd e Saley (1993), quando da criao do termo OLAP,

citada a limitao das ferramentas disponveis na poca e proposta a anlise de

dados multidimensionais:

As ferramentas de consultas/relatrios e as planilhas eletrnicas tm sido


extremamente limitadas nas formas pelas quais os dados (j recuperados
do SGBD) podem ser agregados, resumidos, consolidados, somados,
visualizados e analisados. A carncia mais notada tem sido a capacidade
para consolidar, visualizar e analisar dados de acordo com mltiplas
dimenses, de maneira que faa sentido para um ou mais analistas
especficos em um determinado ponto no tempo. Este requisito chamado
anlise de dados multidimensionais. Talvez um melhor e mais genrico
nome para este tipo de funcionalidade online analytical processing
(OLAP), em que a anlise de dados multidimensionais apenas uma de
suas caractersticas.
24

Em janeiro de 1995, THE OLAP COUNCIL (1995), um conselho para

padronizar a tecnologia OLAP, publica sua conceituao do termo:

O online analytical processing (OLAP) uma categoria de tecnologia de


software que possibilita que os analistas, gerentes e executivos tenham
entendimento sobre os dados de forma rpida, consistente, e com acesso
interativo a uma ampla variedade de vises possveis de informaes que
foram transformadas a partir de dados brutos para refletir a
dimensionalidade real da empresa como entendida pelo usurio.

4.2 O Modelo Multidimensional

A modelagem de dados descreve e representa de uma forma abstrata os

dados de uma organizao. Data Warehouses e ferramentas OLAP se utilizam do

modelo de dados multidimensional, e apresentam informaes na forma de cubos de

dados (Data Cubes).

Um conceito de modelo multidimensional pode ser encontrado em Imhoff,

Galemmo e Geiger (2003, p. 400):

Um modelo dimensional uma forma de modelagem de dados que


acondiciona os dados de acordo com consultas e processos especficos do
negcio. Os objetivos so a compreensibilidade dos usurios de negcio e o
desempenho de consultas multidimensionais.

A respeito dos benefcios da modelagem multidimensional, h uma breve

descrio em Abell (2002, p. 11):

Os benefcios da modelagem multidimensional so dois. De um lado, ela


torna os esquemas de dados mais compreensveis para os usurios finais, e
por outro lado, ela permite usar armazenamento especfico e tcnicas de
acesso que melhoram o desempenho de queries. A maneira para obter
estes benefcios a simplificao dos esquemas de dados, de forma que
eles s contenham as coisas essenciais (i.e. um fato para ser analisado e
suas dimenses de anlise). Estes esquemas so prximos da concepo
de dados dos analistas, e sugerem um tipo especfico de queries, de forma
que o sistema pode ser personalizado facilmente para resolv-las com bons
tempos de resposta.
25

O relacionamento entre modelos multidimensionais e OLAP citado em

Kimball e Ross (2002, p. 466):

Os modelos dimensionais so a base de muitos aprimoramentos de


desempenho de DBMS, inclusive agregaes e mtodos de indexao
avanados. Tambm so a base do desenvolvimento incremental e
distribudo do data warehouse atravs do uso de dimenses e fatos em
conformidade e a base lgica de todos os sistemas OLAP.

A seguir sero apresentados brevemente os principais elementos do

modelo de dados multidimensional.

4.2.1 Fatos

Um fato um conjunto de itens de dados contextualizados e mensurados

em termos numricos, que representam transaes ou eventos de negcio,

demonstrando a evoluo do mesmo no decorrer do tempo.

No modelo multidimensional um fato representado por uma tabela fato

(Fact Table). Uma tabela fato constituda de valores quantitativos e numricos e

representa um assunto do DW.

Um conceito de tabela fato citado em Imhoff, Galemmo e Geiger (2003,

p. 401): Uma tabela fato a tabela dentro de um modelo dimensional que contm

as medidas e mtricas de interesse.

4.2.2 Dimenses

Dimenses armazenam as descries textuais das dimenses do

negcio. No modelo multidimensional uma dimenso representada por uma tabela


26

dimenso (Dimension Table).

Um conceito de tabela dimenso citado em Imhoff, Galemmo e Geiger

(2003, p. 400):

Uma tabela dimenso um conjunto de tabelas de referncia que provem


a base para restringir e agrupar consultas para a informao em uma tabela
fato dentro de um modelo dimensional. A chave da tabela dimenso
tipicamente uma parte da chave concatenada da tabela fato, e a tabela
dimenso contm informao descritiva e hierrquica.

4.2.3 Membros e Hierarquias

As definies a seguir, de membros e hierarquias, assinalam a

possibilidade de haver uma classificao dos dados dentro de uma dimenso.

Um membro de uma dimenso definido em THE OLAP COUNCIL

(1995):

Um membro de uma dimenso um nome ou identificador discreto usado


para identificar uma posio e descrio de um item de dado dentro de uma
dimenso. Por exemplo, janeiro de 1989 ou primeiro semestre de 1993
so exemplos tpicos de membros de uma dimenso Tempo. Atacado,
Varejo, etc., so exemplos tpicos de membros de uma dimenso Canal de
Distribuio.

Uma hierarquia de uma dimenso caracterizada tambm em THE OLAP

COUNCIL (1995):

Quaisquer membros de uma dimenso podem ser organizados com base


em relacionamentos pai-filho, tipicamente onde um membro pai representa
a consolidao dos membros que so seus filhos. O resultado uma
hierarquia, e os relacionamentos pai/filho so relacionamentos hierrquicos.

Em uma dimenso geogrfica, por exemplo, podem existir hierarquias de

Logradouro, Bairro, Cidade, Estado e Regio.


27

4.2.4 Medidas

Medidas so as caractersticas especficas e mensurveis de um fato,

relevantes para anlises.

Um conceito de medida citado em Imhoff, Galemmo e Geiger (2003,

p. 403):

Uma medida um termo da modelagem dimensional que se refere a


valores, geralmente numricos, que medem algum aspecto do negcio.
Medidas residem em tabelas fato. Os termos dimensionais medida e
atributo, juntos, so equivalentes ao uso do termo atributo da modelagem
relacional.

Fatos, Dimenses e Medidas so inter-relacionados na modelagem

multidimensional, como citado em Singh (2001, p. 146):

Na modelagem, as estruturas de dados so organizadas para descrever


medies e dimenses. Medies fornecem os dados numricos
coletados que ficam armazenados na tabela de fatos central. As dimenses
so os parmetros do negcio que definem cada transao. So
armazenadas em tabelas satlites vinculadas tabela de fatos central. Por
exemplo, os dados armazenados em tabelas de fatos incluem dados de
vendas, estoque, assinaturas de peridicos, despesas e margem bruta.
Tabelas tpicas incluem dados de tempo, geografia, conta e produto.

4.2.5 Cubos de Dados

Os cubos de dados so estruturas nas quais os usurios finais fazem

anlises de dados multidimensionais, ou seja, navegam e exploram os mesmos,

extraindo informaes e conhecimento a partir dos dados.

Uma definio para cubos de dados encontrada em Kay (2005):

Um cubo de dados um tipo de matriz multidimensional que permite que os


usurios explorem e analisem uma coleo de dados de muitas
perspectivas diferentes, geralmente considerando trs fatores (dimenses)
de cada vez.
28

A metfora visual de um cubo com trs dimenses fcil de se entender,

ao passo que com mais dimenses se torna difcil, conforme citado em Thomsen

(2002, p. 56): Tentar usar um cubo como base para visualizao de quatro ou mais

dimenses pode se tornar rapidamente muito complicado.

Um cubo com mais de trs dimenses chamado de hipercubo

(Hypercube) ou tesseract, um termo matemtico para designar um cubo com quatro

dimenses. A dificuldade de entendimento de uma metfora visual com mais de trs

dimenses pode ser percebida pela viso de um tesseract na figura 2.

Figura 2 Viso de umTesseract

Fonte: Thomsen (2002, p. 57).

Como exemplo, ser considerado uma empresa que comercializa

determinados produtos e possui revendas em diversas cidades, de diversas regies

do pas. A demanda dos clientes atendida pelas revendas, de acordo com a

localizao do cliente e a rea de cobertura das revendas. Uma representao das

vendas desta empresa atravs de um cubo poderia ser a da figura 3.


29

Figura 3 Cubo tridimensional: produtos, meses e revendas

Fonte: Do autor.

Neste exemplo apresentado um cubo de trs dimenses. Poderiam ser

adicionados os clientes - mais uma dimenso - mas se teria um hipercubo de quatro

dimenses, no entendido to facilmente.

Uma unidade de dados representada em cada clula do cubo,

localizada atravs da interseo das dimenses. Por exemplo, observando o cubo

pode-se verificar que o valor das vendas do produto D pela revenda 1 no ms de

maro 200.

A relao entre anlise multidimensional e estrutura de dados citada

brevemente em Ballard et al. (2006, p. 86):

A anlise multidimensional tornou-se uma forma popular de estender as


capacidades de consultas e relatrios. Isto , melhor do que submeter
mltiplas queries, os dados so estruturados para possibilitar acesso fcil e
rpido para responder as questes que os usrios tipicamente perguntam.

A estruturao dos dados para possibilitar acesso fcil e rpido aos

mesmos pode ser percebida no Star Schema, que ser visto a seguir.
30

4.2.6 Star Schema

Conforme citado em Thomsen (2002, p. 638), um Star Schema :

Um arranjo de tabelas em um banco de dados relacional onde uma tabela


de fatos central conectada a um conjunto de tabelas de dimenso, uma
por dimenso. O nome star vem da representao diagramtica normal
desse esquema, com a tabela de fatos no centro e cada tabela de dimenso
mostrada ao seu redor, como as pontas em uma estrela.

Ralph Kimball caracteriza um Star Schema em Kimball (2002, p. 459),

como: Representao genrica de um modelo dimensional em um banco de dados

relacional em que uma tabela de fatos com uma chave composta unida a vrias

tabelas de dimenso, cada uma com uma chave primria.

Um Star Schema tambm conhecido por Star-Join, Star-Join Schema e

Modelo Star Schema.

Para o exemplo, o Star Schema poderia ser o exibido na figura 4.

Figura 4 Star Schema.

Fonte: Do autor.
31

Neste modelo est representado o armazenamento de dados em tabelas,

relacionando o fato da venda com suas dimenses produto, cliente, revenda e

tempo.

4.2.7 Surrogate Key

Surrogate keys so componentes das entidades de um DW com o

objetivo principal de identificar unicamente os registros de tabelas fato e dimenso.

Por exemplo, com a possibilidade de existirem mltiplas fontes externas

de dados, existe tambm a possibilidade de que uma determinada informao

possua identificadores diferentes nas vrias fontes externas.

As surrogate keys garantem a unicidade de identificadores por todo o

ambiente do DW, e via de regra so inteiros, que ocupam pouco espao e

possibilitam joins mais rpidos do que outros tipos de dados.

A seguir sero apresentadas trs definies para surrogate keys.

Uma definio citada em Imhoff, Galemmo e Geiger (2003, p. 406):

Uma surrogate key uma chave substituta que geralmente um valor


numrico arbitrrio atribudo pelo processo de carga ou pelo sistema de
banco de dados. A vantagem da surrogate key que ela pode ser
estruturada de forma que seja sempre nica por toda a extenso de
integrao para o data warehouse.

Outra definio encontrada em DM Review (2006. Glossary: Surrogate

Key):

Uma surrogate key uma parte nica, um identificador estabelecido


artificialmente para uma entidade. A atribuio de uma surrogate key um
caso especial de dados derivados - aquele onde a chave primria
derivada. Uma forma comum de derivar valores para uma surrogate key
atribuir valores inteiros seqencialmente.

Denis Howe define surrogate keys, em Howe (2004):


32

Uma chave primria nica gerada pelo SGBDR que no derivada de


quaisquer dados no banco de dados e cujo nico significado funcionar
como a chave primria. Uma surrogate key freqentemente um nmero
seqencial, mas no obrigado que seja. Ter a chave independente de
todas as outras colunas isola os relacionamentos do banco de dados das
alteraes nos valores de dados ou do projeto do banco de dados e garante
unicidade. Alguns projetistas de banco de dados usam surrogate keys
religiosamente apesar da adequabilidade de outras chaves candidatas. De
qualquer forma, se uma boa chave j existe, o acrscimo de uma surrogate
key somente diminuir a velocidade de acesso, especialmente se ela for
indexada.

Seguindo do Star Schema para um projeto de banco de dados,

detalhando as tabelas dimenso e fato, o modelo de entidades do ambiente DW

poderia ser ilustrado conforme a figura 5.

Figura 5 Entidades do Ambiente DW.

Fonte: Do autor.
33

As dimenses Revenda e Cliente esto desnormalizadas em relao s

informaes de Logradouro, Bairro, Cidade, Estado e Regio. Esta tcnica garante

melhor desempenho na recuperao dos dados por evitar joins, operao cara para

SGBDs relacionais. Como ponto fraco, comparado ao Snowflake Schema, o volume

de informaes armazenadas maior, por haver muita redundncia de dados.

4.2.8 Snowflake Schema

O Snowflake Schema uma extenso do Star Schema, e tem por

caracterstica principal a normalizao das dimenses. No exemplo, o Snowflake

Schema poderia ser o exibido na figura 6.

Figura 6 Snowflake Schema.

Fonte: Do autor.
34

As dimenses Revenda e Cliente esto normalizadas em relao s

informaes de Logradouro, Bairro, Cidade, Estado e Regio. Esta tcnica garante

uma otimizao do espao necessrio para o armazenamento de dados, porm o

desempenho na recuperao dos mesmos inferior por serem necessrios mais

joins do que no Star Schema.

4.3 Recursos OLAP

A seguir sero definidos e exemplificados os principais recursos OLAP, ou

seja, operaes realizadas com cubos de dados que possibilitam visualizaes

OLAP.

4.3.1 Drill Down e Roll Up

Drill Down e Roll Up so operaes onde a visualizao dos dados

percorre as hierarquias de uma dimenso, ou seja, h uma navegao entre nveis

de maior para menor granularidade e vice-versa.

O recurso Drill Down definido em THE OLAP COUNCIL (1995):

Drill down/up uma tcnica analtica especfica atravs da qual o usurio


navega entre nveis de abrangncia de dados a partir do mais resumido (up)
para o mais detalhado (down). Os caminhos de navegao podem ser
definidos pelas hierarquias dentro de dimenses ou outros relacionamentos
que podem ser dinmicos dentro ou entre dimenses. Por exemplo, na
visualizao de dados de vendas da Amrica do Norte, uma operao drill-
down na dimenso Regio mostraria Canad, o leste e o oeste dos Estados
Unidos. Um drill-down mais alm sobre o Canad poderia mostrar Toronto,
Vancouver, Montreal, etc.

Como exemplo, ser considerado o volume de vendas de uma empresa

por regio nos ltimos cinco anos, ilustrado na figura 7.


35

Volume de Vendas
Regio 2002 2003 2004 2005 2006
Centro-Oeste 23 22 25 24 28
Nordeste 20 28 26 25 25
Norte 15 18 22 19 16
Sudeste 25 22 29 30 35
Sul 30 22 25 35 38

Figura 7 Volume de Vendas por Regio.

Fonte: Do autor.

Uma operao de Drill Down sobre a regio sul poderia detalhar as

informaes de vendas por estados desta regio. O resultado poderia ser como o

ilustrado na figura 8.

Volume de Vendas
Estado 2002 2003 2004 2005 2006
Paran 8 5 6 9 11
Rio Grande do Sul 12 10 11 14 15
Santa Catarina 10 7 8 12 12

Figura 8 Volume de Vendas da Regio Sul.

Fonte: Do autor.

O recurso Drill Down tambm chamado de Roll Down por alguns

autores.

O recurso Roll Up o caminho oposto do Drill Down, ou seja, ocorre a

partir de uma informao detalhada para uma informao sumarizada. Por exemplo,

uma consulta de volume de vendas poderia ser feita por Cidade e logo aps ser

resumida por Estado e depois por Regio.

O recurso Roll Up tambm chamado de Drill Up por alguns autores.


36

4.3.2 Slice and Dice

O termo Slice conceituado em Ballard et al. (2006, p. 87): O termo slice

na terminologia mutidimensional usado para definir um membro ou um grupo de

membros que so separados (de TODAS as outras dimenses) e ento avaliado

atravs de todas as dimenses.

Ou seja, quando se faz um slicing, os membros ou grupo de membros

escolhidos de uma dimenso so resumidos atravs de todas as outras dimenses.

Uma operao de Slicing sobre um grupo de membros da dimenso

produto poderia ter o resultado como o ilustrado na figura 9. Neste exemplo, so

apresentados dois membros isolados da dimenso produto (Produtos B e D) e os

totais de vendas correspondentes, resumidos por todas as revendas, clientes e

datas.

Volume de Vendas
Produto Total de Vendas
Produto B 2.200
Produto D 812
Total 3.012

Figura 9 Slice por Produto.

Fonte: Do autor.

O termo Dice conceituado em Ballard et al. (2006, p. 88):

O conceito de dicing significa que voc coloca mltiplos membros de uma


dimenso sobre um eixo e ento coloca mltiplos membros de uma
dimenso diferente sobre um outro eixo. Isto permite que voc veja a inter-
relao de membros de dimenses diferentes. Dicing a anlise de inter-
relaes entre dimenses diferentes ou seus membros.

Uma operao de Dicing com os membros da dimenso revenda em um


37

eixo e os membros da dimenso tempo em outro eixo, poderia ter como resultado o

ilustrado na figura 10.

Volume de Vendas
2006
Revenda
Janeiro Fevereiro Maro
Revenda 1 250 300 280
Revenda 2 280 310 305
Revenda 3 212 220 231
Revenda 4 300 340 330
Total 1.042 1.170 1.146

Figura 10 Dice por Revenda e Tempo.

Fonte: Do autor.

4.3.3 Drill across

O recurso Drill Across conceituado em Ballard et al. (2006, p. 92): Drill-

across um mtodo onde voc faz um drill de uma dimenso para outra. Voc deve

definir o caminho do drill-across. Esta funo freqentemente usada em ROLAP.

Uma operao de Drill Across, tomando como base a figura 10 e trocando

a dimenso revenda pela dimenso produto com relao Revenda 1, poderia ter

como resultado o ilustrado na figura 11.

Volume de Vendas Revenda 1


2006
Revenda
Janeiro Fevereiro Maro
Produto A 75 85 81
Produto B 65 78 72
Produto C 59 73 80
Produto D 51 64 47
Total 250 300 280

Figura 11 Drill Across

Fonte: Do autor.
38

Neste exemplo pode-se ver um detalhamento de produtos vedidos pela

Revenda 1 no primeiro trimestre de 2006.

4.3.4 Pivoting

O significado do recurso Pivoting (tambm conhecido como Rotate)

apresentado em Ballard et al. (2006, p. 89): Pivoting em modelagem

multidimensional significa trocar linhas com colunas e vice-versa [...] simplesmente

uma forma rpida de ver os mesmos dados de uma perspectiva diferente.

Uma operao de Pivoting, tomando como base o Volume de Vendas da

Regio Sul (ilustrado na figura 8), poderia ter como resultado o ilustrado na figura 12.

Volume de Vendas
Estado
Ano Paran Rio Grande do Sul Santa Catarina
2002 8 12 10
2003 5 10 7
2004 6 11 8
2005 9 14 12
2006 11 15 12

Figura 12 Pivoting.

Fonte: Do autor.

4.3.5 Ranking

O recurso Ranking conceituado em DWBRASIL (2003): A opo de

ranking permite agrupar resultados por ordem de maiores/menores, baseado em

objetos numricos (Medidas). Esta opo impacta somente uma tabela direcionada
39

(relatrio) no afetando a pesquisa (Query).

Ou seja, uma operao simples de classificao ascendente ou

descendente das informaes de acordo com uma medida escolhida em uma

visualizao, podendo ser escolhido o nmero de itens que a classificao ter.

4.4 Bancos de Dados Multidimensionais

Ralph Kimball caracteriza um banco de dados multidimensional em

Kimball (2002, p. 450), como: Banco de dados em que os dados so apresentados

em cubos de dados, em oposio a tabelas em uma plataforma de banco de dados

relacional.

W. H. Inmon, destaca a relao entre SGBDs Multidimensionais e Data

Warehouses em Inmon (2002, p. 182):

Uma das tecnologias freqentemente discutidas no contexto do data


warehouse o processamento de SGBDs multidimensionais (algumas
vezes chamado de processamento OLAP). SGBDs multidimensionais, ou
data marts, fornecem um sistema de informao com a estrutura que
permite a uma organizao ter acesso muito flexvel a dados, para fazer
slice and dice de dados de qualquer nmero de formas, e para explorar
dinamicamente o relacionamento entre dados resumidos e detalhados.
SGBDs multidimensionais oferecem flexibilidade e controle ao usurio final,
e como tal eles ajustam-se bem em um ambiente de sistemas de suporte
deciso.

Erik Thomsen comenta brevemente sobre o uso de bancos de dados

relacionais e multidimensionais no OLAP, em Thomsen (2002, p. 7):

[...] os produtos de bancos de dados relacionais so muito mais equipados


para lidar com as quantidades imensas de dados, normalmente associadas
a iniciativas corporativas de data warehouse. Bancos de dados
multidimensionais so muito mais bem equipados para oferecer clculos
rpidos e em estilo dimensional (embora [...] os bancos de dados SQL
estejam evoluindo para o suporte mais eficiente aos clculos em estilo
OLAP.
40

As estruturas fsicas de armazenamento de dados de um banco de dados

multidimensional, conhecidas por arrays multidimensionais, so diferentes das

estruturas utilizadas em bancos de dados relacionais (que dominam grande parte do

mercado hoje), justamente para prover as necessidades de multidimensionalidade

dos dados.

A linguagem MDX (Multidimensional Expressions), usada em bancos de

dados multidimensionais, a equivalente multidimensional da SQL, usada em

bancos de dados relacionais. Sua origem descrita em WIKIPEDIA

CONTRIBUTORS (2006. Multidimensional Expressions):

A MDX foi primeiramente introduzida como parte do OLEDB para a


especificao OLAP da Microsoft em 1997. A especificao foi rapidamente
seguida pela liberao comercial do Microsoft OLAP Services 7.0 em 1998,
e depois pelo Microsoft Analysis Services. Apesar de que no era um
padro aberto, mas particularmente uma especificao de propriedade da
Microsoft, ela foi adotada pela ampla extenso de fornecedores OLAP.

4.5 Servidor e Cliente OLAP

Um servidor OLAP definido em THE OLAP COUNCIL (1995):

Um servidor OLAP um mecanismo de manipulao de dados multiusurio


de alta capacidade projetado para suportar e operar sobre estruturas de
dados multidimensionais. Uma estrutura multidimensional organizada de
forma que cada item de dado localizado e acessado baseado na
interseo dos membros de dimenses que o definem. O projeto do servidor
e da estrutura de dados so otimizados para rpida recuperao de
informaes ad-hoc em qualquer orientao, e tambm para rapidez,
clculos flexveis e transformao de dados brutos baseados em
relacionamentos que consistem de frmulas. O servidor OLAP pode ou
preparar fisicamente as informaes multidimensionais processadas para
dar rpidos e consistentes tempos de resposta para usurios finais, ou pode
povoar suas estruturas de dados em tempo real a partir de bancos de dados
relacionais ou outros, ou oferecer uma opo de ambos. Dado o estado
atual de tecnologia e o requisito de usurio final para rpidos e consistentes
tempos de resposta, preparar os dados multidimensionais no servidor OLAP
freqentemente o mtodo preferido.
41

Ou seja, um servidor OLAP processa e atende requisies que envolvem

clculos, consolidao e recuperao de informaes multidimensionais. Essas

informaes podem estar armazenadas em bancos de dados multidimensionais,

relacionais ou ambos. No caso de um banco de dados multidimensional, o prprio j

incorpora a funo de servidor OLAP. Em um banco de dados relacional

necessrio um servidor OLAP que acesse as informaes do mesmo. A abordagem

quanto ao armazenamento OLAP ser ilustrada neste trabalho no tpico seguinte

sobre arquiteturas OLAP.

Uma caracterstica interessante presente em servidores OLAP o

Multipass SQL, que conceituado em Kimball (1997):

[...] a ferramenta de consulta deve quebrar o relatrio em um nmero de


queries simples que so processadas separadamente pelo SGBD. A
ferramenta de consulta ento automaticamente combina os resultados das
queries separadas de uma forma inteligente. Quebrar uma nica requisio
complexa em vrias requisies pequenas chamado multipass SQL. [...]
multipass SQL d ao navegador agregado uma oportunidade de aumentar a
velocidade do relatrio, porque cada requisio SQL atmica simples e
facilmente analizada pelo navegador agregado.

Um cliente OLAP definido em THE OLAP COUNCIL (1995):

Aplicaes de usurios finais que podem requerer slices de servidores


OLAP e prover exibies bidimensionais ou multidimensionais, modificaes
de usurios, selees, classificaes, clculos, etc para propsitos de
visualizao e navegao. Clientes OLAP podem ser to simples como um
programa de planilha eletrnica recuperando um slice para favorecer o
trabalho de um usurio instrudo em planilhas eletrnicas ou to altamente
funcional como uma modelagem financeira ou uma aplicao de anlise de
vendas.

4.6 Arquiteturas OLAP

Erik Thomsen, autor reconhecido em OLAP, destaca a origem do termo e

sua utilizao pelos vendedores de ferramentas OLAP em Thomsen (2002, p. 7):


42

Como se o termo de marketing OLAP no fosse suficiente, muitos


vendedores e alguns eruditos do setor se sentiram compelidos
especialmente entre 1995 e 1998 a criar variantes, normalmente na forma
de uma nica consoante acrescentada na frente do termo OLAP, para
distinguir seu tipo de letra de OLAP dos outros.

Thomsen refere-se proliferao de termos derivados do OLAP para

descrever arquiteturas OLAP, como ROLAP, MOLAP, HOLAP, DOLAP e WOLAP.

Estes termos derivados sero abordados brevemente a seguir.

4.6.1 ROLAP

ROLAP o acrnimo de Relational OLAP (OLAP Relacional).

A arquitetura ROLAP consiste de um servidor OLAP que acessa dados

armazenados em um banco de dados relacional. Um dos pontos positivos desta

arquitetura o fato de que a tecnologia de bancos de dados relacionais

estabelecida e madura, e seus maiores fornecedores estenderam seus produtos

com a finalidade de fornecer um melhor suporte ao OLAP. Isso comeou a acontecer

por volta de 1994, conforme citado em Powell (2006): Em 1994, [...] foi tambm

nesta poca que os fornecedores de SGBDs reconheceram que suporte a deciso

era diferente de OLTP e comearam a implementar reais capacidades OLAP em

seus bancos de dados. O prprio padro SQL99 ANSI/ISO determina algumas

extenses OLAP. Quanto aos pontos negativos, a mesma SQL deixa a desejar tanto

no desempenho quanto no conjunto de funes para anlises multidimensionais

(extenses OLAP).

Uma definio para ROLAP encontrada em DM REVIEW (2006.

Glossary: ROLAP):
43

Um produto que prov anlise multidimensional de dados, agregados e


metadados armazenados em um SGBDR. O processamento
multidimensional pode ser feito dentro do SGBDR, de um servidor em uma
camada intermediria ou no cliente. Um ROLAP comercial aquele de um
fornecedor independente que pode funcionar com qualquer SGBDR padro.

4.6.2 MOLAP

MOLAP o acrnimo de Multidimensional OLAP (OLAP

Multidimensional).

Uma definio para MOLAP pode ser encontrada em WIKIPEDIA

CONTRIBUTORS (2006. MOLAP):

MOLAP uma alternativa para a tecnologia ROLAP (OLAP Relacional).


Enquanto ambas ferramentas analticas ROLAP e MOLAP so projetadas
para permitir anlise de dados atravs do uso de um modelo de dados
multidimensional, o MOLAP difere significativamente por requerer a pr-
computao e armazenamento de informaes no cubo a operao
conhecida como processamento. O MOLAP guarda estes dados em um
armazenamento de arrays multidimensionais otimizado, em vez de um
banco de dados relacional (i.e. em ROLAP).

Na arquitetura MOLAP os dados so armazenados em um banco de

dados multidimensional, que propriamente executa a funo de servidor OLAP.

4.6.3 HOLAP

HOLAP o acrnimo de Hybrid OLAP (OLAP Hbrido).

O conceito de HOLAP encontrado em DM REVIEW (2006. Glossary:

HOLAP): Um produto que pode prover anlise multidimensional simultaneamente

de dados armazenados em um banco de dados multidimensional e em um SGBD

Relacional. Tornou-se uma arquitetura popular para servidor OLAP.

Ou seja, HOLAP uma tecnologia mista de ROLAP e MOLAP que tira


44

proveito do melhor de cada uma delas: a escalabilidade do ROLAP e o alto

desempenho do MOLAP.

4.6.4 DOLAP

DOLAP o acrnimo de Desktop OLAP (OLAP Desktop).

Uma breve explanao sobre DOLAP pode ser encontrada em Howson

(2002):

Ferramentas DOLAP criam dinamicamente um micro cubo ou no PC cliente,


ou em uma instalao na internet, ou em um servidor de aplicao em uma
camada intermediria. Para criar o micro cubo, os usurios lanam uma
query SQL usando uma viso de negcios do data warehouse. A ferramenta
DOLAP ento envia os resultados de volta para o desktop e os formata em
um cubo. O formato de micro cubo permite aos usurios executar certas
funes tais como drill-down que historicamente s eram disponveis com
cubos MOLAP. Ele tambm permite aos usurios lanar instrues SQL
complexas, combinando dados de diferentes tabelas fato ou at mesmo
planilhas eletrnicas, ainda assim apresentando aos usurios um
documento perfeitamente consistente. O principal benefcio desta
abordagem sobre o MOLAP a flexibilidade; os usurios no tem que
definir suas requisies de informaes antes do tempo de uma forma
precisa como acontece com o MOLAP. Alm disso, um banco de dados
relacional pode armazenar mais dados do que cubos MOLAP, dando
liberdade aos usurios para analisar grandes conjuntos de dados. O
aspecto negativo so os tempos de resposta mais lentos e clculos
multidimensionais limitados.

Ou seja, h uma diminuio da carga de trabalho do SGBD do data

warehouse, pois o processamento feito nas mquinas cliente e no no servidor. Ao

servidor compete garantir a integridade dos dados e atualizar os cubos de dados

existentes.

Esta arquitetura tambm til para usurios mveis, pois no necessita

de uma conexo permanente com o DW.

Um fator a ser considerado o tamanho do micro cubo, pois se for muito

grande as consultas e anlises podem tornar-se demoradas ou at mesmo a


45

mquina cliente pode no suportar a carga de trabalho.

4.6.5 WOLAP

WOLAP o acrnimo de Web OLAP (OLAP Web).

WOLAP refere-se simplesmente a uma interface Web para acessar a

aplicao OLAP, ou seja, os dados OLAP so acessveis a partir de um Web

browser.

Com relao ao que foi exposto anteriormente, a respeito dos

mecanismos de armazenamento e acesso a dados, pode-se constatar que a SQL

utilizada nas arquiteturas ROLAP e HOLAP, como tambm pode-se observar a

utilizao de bancos de dados multidimensionais nas arquiteturas MOLAP e HOLAP.

Alm disso, clientes OLAP com processamento multidimensional possivelmente

estaro presentes nas arquiteturas ROLAP e WOLAP, e certamente na arquitetura

DOLAP.

A respeito de alguns debates na comunidade de Tecnologia da

Informao sobre qual arquitetura OLAP seria mais indicada, e sobre a adio de

letras ao termo OLAP, h uma meno em Thomsen (2002, p. 7):

Infelizmente, fazer a pergunta o que melhor, MOLAP ou ROLAP? faz to


pouco sentido quanto perguntar o que melhor, um carro ou um barco?
Obviamente, isso depende do que voc est tentando fazer atravessar
uma cidade ou um lago e tambm das suas restries. A existncia do
debate ROLAP versus MOLAP baseada na falsa premissa de que a
escolha binria. Na moda, a integrao das capacidades
multidimensionais e das capacidades relacionais melhor descrita por um
espectro de possibilidades, onde as noes de ROLAP puro e MOLAP puro
so limites inatingveis e tericos. [...] a maioria das organizaes precisa de
alguma mistura de capacidades que, se precisasse de uma qualificao por
letra, seria HOLAP. Mas, como qualquer conhecimento apropriado de OLAP
distinguiria entre a linguagem ou aspectos lgicos do OLAP e sua
implementao fsica, tal conhecimento apropriado do OLAP revela que,
fisicamente, ele pode ser de qualquer espcie. Assim, o conceito do H j
est includo nas caractersticas fsicas do OLAP e nenhuma espcie de
letra adicional necessria.
46

4.7 Benefcios do OLAP

Um dos maiores benefcios do OLAP justamente o suporte para

tomadas de deciso atravs do fornecimento de informaes de forma rpida e

precisa, com alta flexibilidade e desempenho. Com as informaes extradas a partir

dos dados corporativos e atravs de formas simples e intuitivas de navegao,

pesquisa e visualizao, os executivos so capazes de analisar vrios cenrios,

fazer anlises what if (o que acontece se), consultas ad hoc, predies e

descobrir tendncias. Isso pode determinar a competitividade e sucesso de uma

empresa.

Na terceira pesquisa chamada The OLAP Survey, foram destacados

alguns benefcios obtidos com a utilizao do OLAP, relatados em Pendse (2006):

Relatrios mais rpidos ou mais precisos

Melhores decises de negcios atravs de anlises mais completas ou

oportunas

Satisfao dos clientes aumentada atravs da melhoria da qualidade de

produtos e/ou servios

Economia de outros custos (que no de TI) (e.g. inventrio, desperdcio,

financiamento)

Rendimentos aumentados atravs de melhores anlises de vendas e

marketing

Economia de pessoal em departamentos comerciais

Custos externos de TI reduzidos (suporte de hardware, assessoria ou

licenciamento de software)

Economia de pessoal em TI
47

4.8 reas de Aplicao para OLAP

Algumas aplicaes para OLAP so descritas em Reinschmidt e

Franoise (2000):

Aplicaes OLAP abrangem uma variedade de funes organizacionais.


Departamentos financeiros usam OLAP para aplicaes tais como
oramento, atividades baseadas em custos (destinao de verbas), anlise
de desempenho financeiro e modelagem financeira. Anlise de vendas e
previses so duas das aplicaes OLAP encontradas em departamentos
de vendas. Entre outras aplicaes, departamentos de marketing usam
OLAP para anlise de pesquisa de mercado, previso de vendas, anlise de
promoes, anlise de clientes e segmentao mercado/cliente. Aplicaes
OLAP tpicas para manufatura incluem planejamento de produo e anlise
de defeitos.

Nigel Pendse enumera algumas aplicaes para OLAP em PENDSE

(2005. OLAP applications):

Marketing e Anlise de vendas

Anlise de Clickstream

Database marketing

Oramento

Relatrios e consolidao financeiros

Management reporting

EIS

Balanced scorecard

Anlise de Rentabilidade

Anlise de Qualidade

Ralph Kimball ilustra a criao de modelos multidimensionais com estudos

de caso e aborda algumas reas de aplicao para OLAP em Kimball e Ross (2002):
48

Vendas a varejo

Estoque

Compras

Gerenciamento de Pedidos

Gerenciamento de relacionamento com o cliente (CRM)

Contabilidade

Gerenciamento de recursos humanos

Servios financeiros

Telecomunicaes e utilitrios

Transporte

Educao

Assistncia mdica

Comrcio eletrnico

Seguro
49

5 CRITRIOS PARA AVALIAO DE FERRAMENTAS OLAP

O objetivo deste captulo apresentar os critrios conhecidos para

avaliao de ferramentas OLAP, finalizando com a seleo das caractersticas para

a anlise das ferramentas open source, motivo deste trabalho.

5.1 As 12 Regras de Codd

Edgar F. Codd foi quem definiu os primeiros critrios, suas famosas 12

Regras para avaliar produtos OLAP em Codd, Codd e Salley (1993):

1. Viso Conceitual Multidimensional

2. Transparncia

3. Acessibilidade

4. Desempenho Coerente de Relatrio

5. Arquitetura Cliente-Servidor

6. Dimensionalidade Genrica

7. Tratamento Dinmico de Matriz Esparsa

8. Suporte para Multiusurio

9. Operaes Irrestritas de Dimenso Cruzada

10. Manipulao de Dados Intuitiva

11. Relatrios Flexveis

12. Dimenses e Nveis de Agregao Ilimitados


50

Quando da publicao de suas 12 regras para OLAP, Codd era um

pesquisador contratato por uma empresa que possua um produto OLAP e notou-se

uma parcialidade das mesmas em relao ao produto. Por esse motivo, suas 12

regras (s quais posteriormente foram adicionadas mais 6) foram muito criticadas.

Houveram alegaes de que eram especficas demais e tambm que no podiam

ser atendidas por sistemas que poderiam ser considerados OLAP.

Este assunto abordado em WIKIPEDIA CONTRIBUTORS (2006.

OLAP):

O primeiro produto que executava queries OLAP foi o Express da empresa


IRI, que foi liberado em 1970 (e adquirido pela Oracle em 1995). Porm, o
termo no apareceu at 1993 quando foi cunhado por Ted Codd, que havia
sido descrito como o pai do banco de dados relacional. Mas o artigo de
Codd foi financiado pela antiga Arbor Software (agora Hyperion Solutions),
como uma espcie de golpe de marketing: a companhia havia liberado seu
prprio produto OLAP Essbase um ano antes. Como resultado, as doze
regras de processamento analtico online de Codd eram explcitas em sua
referncia ao Essbase. Houve alguma controvrsia como conseqncia
disso, e quando a Computerworld descobriu que Codd era pago pela Arbor,
ela retratou o artigo.

5.2 O Teste FASMI

O teste FASMI de Nigel Pendse uma alternativa s 12 regras de Codd,

conforme relatado em Pendse (2005. What is OLAP?):

Nossa definio projetada para ser curta e fcil de lembrar 12 regras ou


18 caractersticas so demais para a maioria das pessoas levar em suas
cabeas; ns estamos satisfeitos em ser capazes de resumir a definio
OLAP em simplesmente cinco palavras chave: Fast Analysis of Shared
Multidimensional Information ou FASMI para abreviar.

Dessa forma, a sigla FASMI apresenta cinco caractersticas para OLAP,

descritas brevemente a seguir e relatadas em PENDSE (2005. What is OLAP?):

Fast significa que o sistema deve apresentar respostas aos usurios


51

dentro de aproximadamente cinco segundos, com as anlises mais simples no

demorando mais de um segundo e pouqussimas anlises demorando mais de vinte

segundos.

Analysis significa que o sistema pode suportar qualquer lgica de

negcio e anlise estatstica que relevante para a aplicao e para o usurio e que

possam ser feitas com suficiente facilidade pelo usurio final.

Shared significa que o sistema implementa todas as condies de

segurana para a confidencialidade, e se mltiplos acessos de escrita no

necessrios, existe um bloqueio de atualizaes concorrentes em um nvel

apropriado.

Multidimensional o requisito chave. O sistema deve prover uma viso

conceitual multidimensional dos dados, incluindo total suporte a hierarquias e

mltiplas hierarquias, certamente a maneira mais lgica para anlise de negcios e

organizaes.

Information - So todos os dados e informaes derivadas necessrias,

sempre que ela seja relevante para a aplicao. A medio da capacidade de vrios

produtos em termos de quantos dados eles poder tratar, e no de quantos

gigabytes eles podem armazenar.

5.3 Caractersticas Selecionadas

A seguir sero descritas as caractersticas que sero verificadas nas

ferramentas open source para ambientes OLAP, divididas em trs categorias.


52

5.3.1 Recursos OLAP

Ser verificada a existncia ou no dos seguintes recursos OLAP:

Drill Down e Roll UP;

Slice and Dice;

Drill Across;

Pivoting;

Ranking.

5.3.2 Linguagens

Sero verificadas as seguintes caractersticas relativas linguagens:

Linguagem MDX Verificao se a ferramenta implementa ou no a

MDX;

Consultas ad hoc Verificao da possibilidade de execuo ou no;

Multipass SQL Verificao de existncia ou no (aplicvel para ROLAP

e HOLAP);

Suporte a Java Verificao da existncia ou no;

Suporte a JDBC Verificao da existncia ou no.

5.3.3 Gerais

Sero verificadas as seguintes caractersticas gerais:

Suporte a Hierarquias Verificao da existncia ou no;

Acesso Multiusurio Verificao se permite acesso multiusurio ou no;

Arquitetura OLAP Verificao da arquitetura OLAP das ferramentas.


53

6 FERRAMENTAS OPEN SOURCE PARA AMBIENTES OLAP

Conforme relatado na introduo deste trabalho, as ferramentas

analisadas devem obrigatoriamente possuir servidor e cliente OLAP.

As ferramentas foram selecionadas principalmente atravs do

SourceForge.net, o maior repositrio de projetos de software open source da

internet, e tambm atravs de pesquisas na prpria internet. A data de fechamento

desta seleo foi 18/07/2006. O SourceForge.net foi consultado atravs da URL

http://sourceforge.net/search/?type_of_search=soft&words=olap.

A amostragem foi feita considerando-se o percentual de atividade da

ferramenta no repositrio, com um limite mnimo desejado no inferior a 90%.

As ferramentas devem rodar pelo menos nos sistemas operacionais

Windows e Linux. Este aspecto importante devido portabilidade das aplicaes

que possam ser desenvolvidas com estas ferramentas.

Considerando estes requisitos, foram descartadas deste trabalho algumas

ferramentas que no atendem aos mesmos. Estas ferramentas e o motivo principal

do descarte esto relacionados na tabela a seguir (Tabela 3).

Tabela 3 Ferramentas Descartadas

FERRAMENTA / SITE DO PROJETO MOTIVO DO DESCARTE


BEE
No roda em Windows
http://sourceforge.net/projects/bee
BIRT Project - Business Intelligence and
Ferramenta voltada para gerao de
Reporting Tools
relatrios e no para OLAP
http://www.eclipse.org/birt/phoenix/
gratis OLAP (gOLAP) Atividade muito baixa no
http://sourceforge.net/projects/golap SourceForge.net: 12,49%
Hydracube
No possui cliente OLAP
http://sourceforge.net/projects/hydracube
54

JasperReports - Java Reporting


No possui servidor OLAP
http://sourceforge.net/projects/jasperreports
JMagallanes Olap and Report
No possui servidor OLAP
http://sourceforge.net/projects/jmagallanes
OpenI: Web-based BI Application for OLAP
No possui servidor OLAP
http://sourceforge.net/projects/openi
OpenOLAP for MySQL
No possui cliente OLAP
http://sourceforge.net/projects/r-kajiyama
PALO - Open Source MOLAP
No possui cliente OLAP
http://www.opensourceolap.org/
pocOLAP - the little OLAP project
No possui servidor OLAP
http://sourceforge.net/projects/pocolap
Rubik
No possui servidor OLAP
http://sourceforge.net/projects/rubik
XML-OLAP No possui desenvolvimento ativo
http://sourceforge.net/projects/xml-olap desde 02/06/2005
Fonte: Do autor.

6.1 Ferramentas Selecionadas

Somente uma ferramenta foi selecionada: Pentaho - Business

Intelligence. A ferramenta Pentaho possui um mdulo chamado Pentaho Analysis

que incorpora o servidor OLAP Mondrian e o cliente OLAP JPivot. Por este motivo,

sero analisadas como uma nica ferramenta.

A seguir sero apresentadas algumas caractersticas relevantes desta

ferramenta e seus dois componentes principais para OLAP, coletadas no repositrio

SourceForge.net.

6.1.1 Pentaho - Business Intelligence

Descrio do projeto: Uma completa plataforma de BI que inclui

relatrios, anlises (OLAP), dashboards, data mining e ETL. Use-a como uma sute

completa ou como componentes individuais que so acessveis via web services.

Classificada como nmero 1 em BI open source.


55

Atividade no repositrio: 99,95%;

Status de desenvolvimento: 4 - Beta, 5 - Produo/Estvel;

Sistema Operacional: Independente de SO (Escrita em uma linguagem

interpretada);

Linguagem de Programao: Java, JavaScript, JSP, XSL

(XSLT/XPath/XSL-FO);

Interface de Usurio: Java SWT, Eclipse, Web-based;

Licena: Mozilla Public License 1.1 (MPL 1.1);

Categoria: Enterprise, Data Warehousing, ERP, OLAP;

Site do Projeto: http://sourceforge.net/projects/pentaho.

6.1.2 Mondrian

Descrio do projeto: Mondrian um banco de dados OLAP escrito em

Java. Ele implementa a linguagem MDX, a XML for Analysis e as especificaes

JOLAP. Ele l a partir de SQL e outras fontes de dados, e agrega dados em uma

memria cache.

Atividade no repositrio: 99,87%;

Status de desenvolvimento: 5 - Produo/Estvel;

Sistema Operacional: (Nenhum listado);

Linguagem de Programao: Java;

Interface de Usurio: (Nenhuma listada);

Licena: Common Public License;

Categoria: Database Engines/Servers, Enterprise, OLAP;

Site do Projeto: http://sourceforge.net/projects/mondrian.


56

6.1.3 JPivot

Descrio do projeto: Um cliente OLAP baseado em JSP. JPivot uma

biblioteca customizada JSP que desenha uma tabela e grfico OLAP. Os usurios

podem executar tpicas navegaes OLAP como drill down e slice and dice. Ele usa

Mondrian e XMLA como seus engines OLAP;

Atividade no repositrio: 99,03%;

Status de desenvolvimento: 5 - Produo/Estvel;

Sistema Operacional: Independente de SO (Escrita em uma linguagem

interpretada);

Linguagem de Programao: Java;

Interface de Usurio: Web-based;

Licena: Common Public License;

Categoria: Front-Ends, Dynamic Content, Financial, Software

Development;

Site do Projeto: http://sourceforge.net/projects/jpivot.


57

7 METODOLOGIA

Este captulo descreve a metodologia utilizada neste trabalho de

pesquisa.

7.1 Tipo de Pesquisa

Os itens seguintes descrevem o tipo desta pesquisa, quanto abordagem

e aos objetivos.

7.1.1 Abordagem

A pesquisa possui uma abordagem qualitativa considerando-se que a

mesma prope-se a identificar e caracterizar seus objetos de pesquisa. Tambm

uma pesquisa aplicada visto que seus objetos sero operacionalizados na prtica.

7.1.2 Objetivos

Quanto a seus objetivos, de acordo com Thomsen (2002, p. 543) no

captulo Orientaes multidimensionais, esta pesquisa descritiva:

A finalidade destas orientaes descrever as principais reas da


funcionalidade multidimensional em termos de categorias de especialidade
que qualquer ferramenta precisa oferecer e em termos das caractersticas
que as ferramentas podem ou no oferecer.
58

8 APRESENTAO E ANLISE DOS DADOS

As caractersticas analisadas da nica ferramenta open source que possui

servidor e cliente OLAP, que possui uma atividade no SourceForge.net no inferior a

90% e que roda nos sistemas operacionais Windows e Linux so exibidas na tabela

a seguir (Tabela 4).

Tabela 4 Caractersticas da ferramenta Pentaho BI.

CARACTERSTICA RESULTADO
Recursos OLAP
Drill Down e Roll UP Sim
Slice and Dice Sim
Drill Across No
Pivoting Sim
Ranking Sim
Linguagens
Linguagem MDX Sim
Consultas ad hoc Sim (MDX Query Editor)
Multipass SQL Sim
Suporte a Java Sim
Suporte a JDBC Sim
Gerais
Suporte a Hierarquias Sim (Agregao)
Acesso Multiusurio Sim
Arquitetura OLAP ROLAP
Fonte: Do autor.
59

9 CONCLUSO

O panorama atual de ferramentas OLAP proprietrias mostra

fornecedores e produtos estabelecidos, maduros e consistentes. Sendo que os

principais fornecedores de SGBDs proprietrios oferecem ferramentas OLAP e

estenderam seus produtos para um melhor suporte ao OLAP, tudo isso j a alguns

anos.

Tais caractersticas ainda no esto presentes nas ferramentas OLAP

open source. Como exemplo pode-se citar a ferramenta Pentaho BI que no suporta

o recurso OLAP Drill-across, que uma operao OLAP bsica. No site da

ferramenta observa-se que este recurso est a mais de um ano para ser

implementado. Quanto extenso dos SGBDs open source para um melhor suporte

ao OLAP a cena se repete. Existem alguns movimentos isolados iniciais, como o

caso do SGBD Bizgres, que uma extenso do PostgreSQL para um melhor

suporte a Data Warehouse.

Observa-se uma expectativa da comunidade de TI sobre ferramentas

open source no s para OLAP, mas para Business Intelligence de uma maneira

geral, e tambm que est havendo um movimento dos desenvolvedores open

source nesse sentido; mas tambm observa-se que h um grande caminho a

percorrer at chegar ao estgio atual das ferramentas proprietrias.

Atravs deste estudo tambm possvel concluir que vrias ferramentas

no oferecem uma soluo completa (ou algo prximo disso) para OLAP, mas

somente alguns componentes, como servidor ou cliente OLAP. A prpria ferramenta

Pentaho BI incorporou dois projetos open source independentes Mondrian e JPivot


60

para montar sua soluo OLAP, chamada de Pentaho Analysis.

No repositrio SourceForge.net tambm encontram-se ferramentas OLAP

com baixssimo percentual de atividade, ou ento com pouqussimos

desenvolvedores trabalhando em alguns projetos.

Por tudo que foi visto, pode-se afirmar que as ferramentas open source

para ambientes OLAP ainda esto em um estgio de desenvolvimento um tanto

quanto inconsistente, e que os profissionais de TI que desejam usufruir de seus

benefcios ainda tero um tempo de espera pela frente at que as mesmas estejam

em um patamar mais slido.


61

REFERNCIAS

ABELL, Alberto. YAM: A Multidimensional Conceptual Model. 2002. 179 f. Tese


(Programa de Doctorat de Software) Universitat Politcnica de Catalunya,
Barcelona.

BALLARD, Chuck et al. Dimensional Modeling: In a Business Intelligence


Environment. International Business Machines Corporation (IBM Corp.), 2006.
Disponvel em: <http://www.redbooks.ibm.com/redbooks/pdfs/sg247138.pdf>.
Acesso em: 06 jun. 2006.

CHAPPLE, Mike. Databases Glossary: Flat File. About, Inc., 2006. Disponvel em:
<http://databases.about.com/cs/administration/g/flatfile.html>. Acesso em: 02 maio
2006.

CODD, E. F.; CODD, S. B.; SALLEY, C. T. Providing OLAP to User-Analysts: An


IT Mandate. E. F. Codd & Associates, 1993. Disponvel em:
<http://dev.hyperion.com/resource_library/white_papers/providing_olap_to_user_anal
ysts.pdf>. Acesso em: 10 out. 2005.

DM REVIEW. Glossary: HOLAP. DM Review and SourceMedia, Inc., 2006.


Disponvel em: <http://www.dmreview.com/resources/glossary.cfm?keywordId=H>.
Acesso em 18 jul. 2006.

DM REVIEW. Glossary: ROLAP. DM Review and SourceMedia, Inc., 2006.


Disponvel em: <http://www.dmreview.com/resources/glossary.cfm?keywordId=R>.
Acesso em 18 jul. 2006.

DM REVIEW. Glossary: Surrogate Key. DM Review and SourceMedia, Inc., 2006.


Disponvel em: <http://www.dmreview.com/resources/glossary.cfm?keywordId=S>.
Acesso em 18 jul. 2006.

DWBRASIL. OLAP. 2003. Disponvel em:


<http://www.dwbrasil.com.br/html/olap.html>. Acesso em 11 jul. 2006.

ECKERSON, Wayne. A New Old Market. The Data Warehouse Institute, 2002.
Disponvel em: <http://www.tdwi.org/research/display.aspx?id=6475>. Acesso em 05
abr. 2006.

ECKERSON, Wayne; WHITE, Colin. Evaluating ETL and Data Integration


Platforms. The Data Warehouse Institute, 2003. Disponvel em:
<http://download.101com.com/tdwi/research_report/2003ETLReport.pdf>. Acesso
em 06 abr. 2006.

FERREIRA, Rafael. G. C. Data Warehouse e Sistema OLAP. Porto Alegre: [s/e],


2004. (mimeo)
62

GARCIA-MOLINA, Hector; ULLMAN, J. D.; WIDOM, Jennifer. Implementao de


Sistemas de Bancos de Dados. Traduo de Vandenberg D. de Souza. Rio de
Janeiro: Campus, 2001. 685 p.

HOWE, Denis. Surrogate Key Definition. Learnthat.com, 2004. Disponvel em:


<http://www.learnthat.com/define/view.asp?id=7032>. Acesso em 04 maio 2006.

HOWSON, Cindi. MOLAP and DOLAP: Apples and Oranges. The Data Warehouse
Institute, 2002. Disponvel em:
<http://www.askcindi.com/TDWI_DOLAP_MOLAP07_02.htm>. Acesso em 12 jul.
2006.

IMHOFF, Claudia; GALEMMO, Nicholas; GEIGER, J. G. Mastering Data


Warehouse Design: Relational and Dimensional Techniques. Indianapolis: Wiley
Publishing, Inc., 2003. 438 p.

INMON, W. H. Building the Data Warehouse. Third Edition. New York: John Wiley
& Sons, Inc., 2002. 412 p.

______. Data Mart Does Not Equal Data Warehouse. DM Review, 1999.
Disponvel em: <http://dmreview.com/article_sub.cfm?articleId=1675>. Acesso em 05
abr. 2006.

INMON, W. H.; TEDERMAN, R. H.; IMHOFF, Claudia. Data Warehouse: Como


transformar informaes em oportunidades de negcios. Traduo de Melissa
Kassner. So Paulo: Berkeley Brasil, 2001. 266 p.

KAY, Russell. Data Cubes. Computerworld Inc., 2005. Disponvel em:


<http://www.computerworld.com/databasetopics/data/story/0,10801,91640,00.html>.
Acesso em 25 abr. 2006.

KIMBALL, Ralph. Features for Query Tools. Miller Freeman, Inc., 1997. Disponvel
em: <http://www.dbmsmag.com/9702d05.html>. Acesso em 21 jul. 2006.

KIMBALL, Ralph; ROSS, Margy. The Data Warehouse Toolkit: Guia completo para
modelagem dimensional. Traduo de Ana Beatriz Tavares e Daniela Lacerda. 2. ed.
Rio de Janeiro: Campus, 2002. 494 p.

OPEN SOURCE INITIATIVE. The Open Source Definition. Version 1.9. 2006.
Disponvel em: <http://www.opensource.org/docs/definition.php>. Acesso em 27 fev.
2006.

PENDSE, Nigel. OLAP applications. Londres: The OLAP Report, 2005. Disponvel
em: <http://www.olapreport.com/Applications.htm>. Acesso em 13 jul. 2006.

______. What is OLAP? Londres: The OLAP Report, 2005. Disponvel em:
<http://www.olapreport.com/fasmi.htm>. Acesso em 10 out. 2005.
63

______. Drilling Into OLAP Benefits. DM Review and SourceMedia, Inc., 2006.
Disponvel em: <http://www.dmreview.com/article_sub.cfm?articleId=8174>. Acesso
em 13 jul. 2006.

POWELL, Ron. A 10 Year Journey. DM Review and SourceMedia, Inc., 2006.


Disponvel em: <http://www.dmreview.com/article_sub.cfm?articleId=3003>. Acesso
em 18 jul. 2006.

REINSCHMIDT, Joerg; FRANCOISE, Allison. Business Intelligence Certification


Guide. IBM Corp., 2000. Disponvel em:
<http://www.redbooks.ibm.com/redbooks/pdfs/sg245747.pdf>. Acesso em 14 jul.
2006.

SINGH, H. S. Data Warehouse: Conceitos, Tecnologias, Implementao e


Gerenciamento. Traduo de Monica Rosemberg. So Paulo: Makron Books, 2001.
382 p.

THE OLAP COUNCIL. OLAP and OLAP Server Definitions. 1995. Disponvel em:
<http://dssresources.com/glossary/olaptrms.html>. Acesso em 17 out. 2005.

THOMSEN, Erik. OLAP: Construindo sistemas de informaes multidimensionais.


Traduo de Daniel Vieira. 2. ed. Rio de Janeiro: Campus, 2002. 708 p.

WIKIPEDIA CONTRIBUTORS. Flat file database. Wikipedia, The Free


Encyclopedia, 2006. Disponvel em: <http://en.wikipedia.org/wiki/Flat_file_database>.
Acesso em: 18 jul. 2006.

WIKIPEDIA CONTRIBUTORS. MOLAP. Wikipedia, The Free Encyclopedia, 2006.


Disponvel em: <http://en.wikipedia.org/wiki/MOLAP>. Acesso em 18 jul. 2006.

WIKIPEDIA CONTRIBUTORS. Multidimensional Expressions. Wikipedia, The


Free Encyclopedia, 2006. Disponvel em:
<http://en.wikipedia.org/wiki/Multidimensional_Expressions>. Acesso em: 18 jul.
2006.

WIKIPEDIA CONTRIBUTORS. OLAP. Wikipedia, The Free Encyclopedia, 2006.


Disponvel em: <http://en.wikipedia.org/wiki/Olap>. Acesso em: 18 jul. 2006.
64

ANEXOS
65

ANEXO A - The Open Source Definition

A definio do termo open source encontrada em OPEN SOURCE

INITIATIVE (2006):

1. Redistribuio Livre

A licena no deve restringir qualquer parte de vender ou dar o software

como um componente de uma distribuio de software agregado contendo

programas de vrias fontes diferentes. A licena no deve exigir direitos autorais ou

outro pagamento para tal venda.

2. Cdigo Fonte

O programa deve incluir o cdigo fonte e permitir a distribuio do mesmo,

tambm na forma compilada. Onde alguma forma de um produto no distribuda

com o cdigo fonte, devem existir, bem publicados, os meios de obteno do cdigo

fonte, que no sejam mais do que uma reproduo razovel de melhor custo, por

download pela internet sem pagamento algum. O cdigo fonte deve ser a forma

preferida pela qual um programador modificar o programa. Cdigo fonte

deliberadamente confuso no permitido. Formas intermedirias tais como a sada

de um pr-processador ou tradutor no so permitidas.

3. Trabalhos Derivados

A licena deve permitir modificaes e trabalhos derivados, e deve

permitir que os mesmos sejam distribudos sob os mesmos termos da licena do

software original.

4. Integridade do Cdigo Fonte do Autor

A licena pode restringir o cdigo fonte de ser distribudo na forma

modificada somente se a licena permitir a distribuio de arquivos de correes


66

com o cdigo fonte para o propsito de modificar o programa em tempo de

construo. A licena deve permitir explicitamente a distribuio de software

construdo a partir de cdigo fonte modificado. A licena pode exigir trabalhos

derivados para produzir um nome ou nmero de verso diferente do software

original.

5. Nenhuma Discriminao Contra Pessoas ou Grupos

A licena no deve discriminar contra qualquer pessoa ou grupo de

pessoas.

6. Nenhuma Discriminao Contra rea de Aplicao

A licena no deve restringir qualquer um de fazer uso do programa em

uma rea especfica de aplicao. Por exemplo, ela no pode restringir o programa

de ser usado em um negcio ou de ser usado para pesquisa gentica.

7. Distribuio de Licena

Os direitos anexados ao programa devem ser aplicados a todos para

quem o programa redistribudo sem a necessidade de execuo de uma licena

adicional para aquelas partes.

8. A Licena No Deve Ser Especfica para um Produto

Os direitos anexados ao programa no devem depender de partes do

programa de uma distribuio de software particular. Se o programa extrado desta

distribuio e usado ou distribudo dentro dos termos da licena do programa, todas

as partes para quem o programa redistribudo devem ter os mesmo direitos como

aqueles que so concedidos em conjuno com a distribuio de software original.

9. A Licena No Deve Restringir Outro Software

A Licena no deve estabelecer restries sobre outro software que

distribudo junto com o software licenciado. Por exemplo, a licena no deve insistir
67

que todos os outros programas distribudos na mesma mdia devem ser software

open source.

10. A Licena Deve Ser Tecnologicamente Neutra

Nenhum fornecimento da licena pode ser estabelecido sobre qualquer

tecnologia individual ou estilo de interface.

Você também pode gostar