Escolar Documentos
Profissional Documentos
Cultura Documentos
LAGES (SC)
2008
MARCELO FEIJÓ VARGAS
LAGES (SC)
2008
MARCELO FEIJÓ VARGAS
BACHAREL EM SISTEMAS DE
INFORMAÇÃO
BANCA EXAMINADORA:
Prof. Edson Roberto Souza Paes, M.Sc. Prof. Juliana Aparecida Piccoli Branco,
UNIPLAC M.Sc.
UNIPLAC
Prof. Wilson Castello Branco Neto, Dr. Prof. Angelo Augusto Frozza, M.Sc.
Professor de TCC Coordenador de Curso
LISTA DE ILUSTRAÇÕES
The BI, also known as Business Intelligence, is a set of technologies used to provide
information and knowledge on a company including tools like Customer Relationship
Management (CRM), Data Mining, Data Warehouse, among others. Data Warehouse
(DW) is a tool whose design and administration are focused on databases that support
decision making. Its goal is to organize corporate data as so to give subsidies of
information for managers and executives in a database parallel to the transactional
systems of a company. The DW has limited applications in companies of medium and
small size, mainly due to the high cost of commercial applications. However, with the
emergence of tools that can be obtained for free (or low-cost), the medium and small
businesses start to benefit from the use of this technology. The present study attempts
to demonstrate the feasibility of developing a DW from tools distributed as free
software. In order to achieve this, the Pentaho is used as a free software package for
DW development and it is studied by means of a case study. With this work, it is
expected to help companies to adopt a posture more focused on information
management and on the creation of competitive strategies.
1 INTRODUÇÃO ........................................................................................................11
1.1 Apresentação ...........................................................................................................11
1.2 Descrição do problema ............................................................................................13
1.3 Justificativa ..............................................................................................................13
1.4 Objetivo geral ..........................................................................................................15
1.5 Objetivos específicos ...............................................................................................15
1.6 Metodologia .............................................................................................................15
2 DATA WAREHOUSE .............................................................................................17
2.1 Conceitos e características de Data Warehouse ......................................................17
2.2 Modelagem dimensional .........................................................................................18
2.3 Etapas para a criação de um DW .............................................................................21
2.4 Extração, transformação e carga..............................................................................23
2.5 On-line Analytical Processing - OLAP ...................................................................25
2.6 Operações básicas em Data Warehouse ..................................................................25
2.7 Conclusão ................................................................................................................27
3 PLATAFORMA PENTAHO DE BUSINESS INTELLIGENCE ........................29
3.1 Processos e definições .............................................................................................29
3.2 Licenças e formas de obtenção do Pentaho ............................................................30
3.3 Arquitetura ...............................................................................................................31
3.4 Instalação .................................................................................................................33
3.5 Multi-Dimensional Expressions - MDX..................................................................35
3.6 Conclusão ................................................................................................................36
4 CRIAÇÃO DE UM DATA WAREHOUSE COM PENTAHO ...........................37
4.1 Sistema transacional ................................................................................................37
4.2 Arquitetura proposta ................................................................................................39
4.3 Modelagem dimensional .........................................................................................39
4.4 Modelo Estrela .........................................................................................................42
4.5 Processo de ETL ......................................................................................................44
4.6 Configuracao do servidor de aplicação ...................................................................51
4.7 Configuração do Cubo .............................................................................................52
4.8 Visualização do Data Warehouse ...........................................................................61
4.9 Conclusão ................................................................................................................69
5 CONSIDERAÇÕES FINAIS ...................................................................................71
REFERÊNCIAS BIBLIOGRÁFICAS ......................................................................73
BIBLIOGRAFIA COMPLEMENTAR .....................................................................75
APÊNDICES ................................................................................................................76
11
1 INTRODUÇÃO
1.1 Apresentação
pequeno porte, principalmente devido ao alto custo das mesmas. Por outro lado, com o
surgimento de ferramentas que podem ser obtidas gratuitamente (ou a custos
reduzidos), as médias e pequenas empresas começam a se beneficiar da utilização
dessa tecnologia.
Conhecer mais sobre essas tecnologias permite aos administradores descobrir
novas maneiras de criar diferenciais para uma empresa em uma economia globalizada,
deixando-os mais seguros para definirem metas e adotarem diferentes estratégias em
uma organização. Assim, eles conseguem visualizar, antes de seus concorrentes, novos
mercados e oportunidades, além de atuar de maneiras diferentes conforme o perfil de
seus consumidores.
Este Trabalho de Conclusão de Curso (TCC) contribui no sentido de analisar
algumas ferramentas computacionais que podem auxiliar nos processos de tomada de
decisões, por intermédio de Data Warehouses.
O presente trabalho está dividido em cinco capítulos. Este primeiro capítulo
faz a apresentação do tema do trabalho, seguida da definição do problema e da
justificativa desta pesquisa. Os objetivos gerais e específicos também são relacionados,
finalizando com a descrição da metodologia a ser seguida para o desenvolvimento da
pesquisa e para alcançar os objetivos. O segundo capítulo descreve conceitos de DW,
além de dar ênfase à apresentação da ferramenta Pentaho, bem como sua
configuração. No terceiro capítulo é apresentada a descrição de um estudo de caso,
para o qual são abordadas as fontes de informação OLTP (On-line Transaction
Processing), o modelo dimensional OLAP (On-line Analytical Processing) e o
processo de Extração, Transformação e Carga (ETC) dos dados. O quarto capítulo
apresenta a implementação do estudo de caso e disponibiliza a análise de dados para
validação do usuário final. Por fim, no quinto capítulo são registradas as considerações
finais e após, as referências bibliográficas que nortearam o desenvolvimento deste
TCC.
13
1.3 Justificativa
1.6 Metodologia
2 DATA WAREHOUSE
permite um acesso de alta performance”. Essa é uma técnica antiga usada para criar
bancos de dados simples e compreensíveis.
Um modelo dimensional é composto, basicamente, pela tabela de fatos e
pelas tabelas de dimensões (Figura 1). A tabela de fatos traz o resultado da consulta,
ou seja, os valores de medição representando transações ou eventos referentes aos
negócios da organização e que podem ser passíveis de análise. Uma dimensão pode
agregar sob nomes distintos, um conjunto de itens com características e posições
próprias, tais como meses e trimestres em relação a um período anual (FROZZA,
2006).
entra a parte de filtragem, que é transformar os dados para um padrão definido, que no
exemplo pode ser F ou M.
Drill Down
A operação Drill Down é utilizada para solicitar uma visão mais
detalhada de um conjunto de dados. Conforme Machado (2004), quando
26
Drill Up
Conforme Machado (2004), com a capacidade de Drill up o usuário pode
navegar do nível de maior detalhe até o mais alto nível de maior
sumarização de dados.
FIGURA 4 - Drill-Down
(FONTE: CARUSO, 2007)
FIGURA 5 - Drill Up
(FONTE: CARUSO, 2007)
2.7 Conclusão
3.3 Arquitetura
3.4 Instalação
1
XMLA é um padrão que permite que aplicações cliente se comuniquem com bases de dados dimensionais ou
OLAP. A transmissão das mensagens é feita utilizando padrões da Internet, como HTTP e SOAP.
36
3.6 Conclusão
O sistema OLTP contém uma tabela saída que faz o controle de saídas,
relacionando veículos, produtos por cliente e município.
A título de informação técnica, o hardware e software utilizados para
desenvolver o estudo do banco de dados OLTP são:
Hardware:
PC (Notebook) com processador Turion X2, de 1,66 GHz, e 1 GB de
memória RAM, HD 120GB.
Software:
Sistema operacional: Microsoft Windows XP Service Pack 2;
Banco de dados: FireBird 2.0.
FIGURA 17 - Kettle
banco OLTP;
b) Database lookup: busca-se o preço do produto na tabela Sortimento;
c) Database lookup: busca-se o transportador do produto na tabela Veiculo;
d) Rename Values: renomeiam-se os valores conforme definido para a tabela
Fatos;
e) Calculate: faz-se o cálculo da quantidade de produtos transportados e o
valor total das vendas;
f) Buscar datas: busca-se o campo data_data na dimensão TEMPO;
g) Compara campos data: comparam-se os campos data_data (dimensão
TEMPO) e data (OLTP), para associar cada linha com o respectivo
registro na dimensão TEMPO;
h) Add sequence: adiciona-se uma sequência (id) para cada linha da tabela
Fatos;
i) Select values: selecionam-se apenas os atributos necessários para serem
carregados na tabela de Fatos;
j) Combination lookup/update: escreve-se na tabela Fato SAIDA os dados
resultantes da transformação.
3 <description>dw_tcc</description>
4 <res-ref-name>jdbc/dw_tcc</res-ref-name>
5 <res-type>javax.sql.DataSource</res-type>
6 <res-auth>Container</res-auth>
7 </resource-ref>
8 ...
f) Para criar uma nova dimensão, clica-se com o botão direito e seleciona-se
Add Dimension;
g) Seleciona-se a chave estrangeira adequada para a dimensão e atribui-se
um nome (Figura 26);
55
é ralizada com o Pentaho Design Studio, que é um ambiente gráfico para a construção
e teste de documentos Action Sequence.
O Design Studio é baseado no Eclipse, que é uma IDE open source para
desenvolvimento de projetos. O Eclipse fornece uma série de vantagens, incluindo a
capacidade de integrar diferentes ferramentas comuns, embora mantendo a reutilização
de componentes existentes, bem como uma enorme economia no tempo de
desenvolvimento.
O arquivo XACTION é um documento XML, que contém a estrutura de
como o Analysis deve mostrar os dados, indica qual arquivo XML do Mondrian (cubo)
é utilizado e quais ferramentas são disponibilizadas.
As instruções abaixo devem ser seguidas para criar um arquivo XACTION:
b) Depois do projeto ter sido criado, clica-se com o botão direito em cima
do projeto. Seleciona-se BI Plataform/New Action Sequence. Em File
Name, coloca-se o nome do cubo (o mesmo nome usado para criar o
arquivo .mondrian.xml) como nome_cubo.xaction e em template,
seleciona-se a opção Create an Analysis View e clica-se em Finish
(Figura 31);
51 </action-outputs>
52 <component-definition>
53 <title>Analysis View</title>
54 <viewer>Pivot</viewer>
55 <options>
56 <personal/>
57 <cube-nav/>
58 <mdx-edit/>
59 <sort-conf/>
60 <spacer/>
61 <level-style/>
62 <hide-spans/>
63 <properties/>
64 <non-empty/>
65 <swap-axes/>
66 <spacer/>
67 <drill-member/>
68 <drill-position/>
69 <drill-replace/>
70 <drill-thru/>
71 <spacer/>
72 <chart/>
73 <chart-conf/>
74 <spacer/>
75 <print-conf/>
76 <print-pdf/>
77 <spacer/>
78 <excel/>
79 </options>
80 <query><![CDATA[default]]></query>
81 <model><![CDATA[pentaho-demo\pentaho-
82 solutions\samples\analysis\tcc.mondrian.xml]]></model>
83 <jndi><![CDATA[dw_tcc]]></jndi>
84 </component-definition>
85 <action-name>Pivot View</action-name>
86 <logging-level>DEBUG</logging-level>
87 </action-definition>
88
89 </actions>
90 </action-sequence>
FIGURA 34 - MDX
63
m) Drill Through: adiciona uma seta indicativa nos Fatos apresentados para
possível visualização mais específica do usuário (Figura 44);
q) Print This Page Via PDF: gera um documento em formato PDF com a
tabela em questão (Figura 48);
69
4.9 Conclusão
5 CONSIDERAÇÕES FINAIS
não foram utilizados neste trabalho. Neste estudo de caso real, podem-se encontrar
situações não previstas aqui, como a necessidade de mais de um cubo no DW,
retratando processos de negócios diferentes, além de prováveis problemas de
modelagem de bancos de dados transacionais.
Para estudos mais avançados, a plataforma Pentaho BI também disponibiliza
ferramentas para a realização de processos de mineração dos dados (Data Mining). O
estudo destas ferramentas abre outras frentes para descoberta do conhecimento em
bancos de dados corporativos.
73
REFERÊNCIAS BIBLIOGRÁFICAS
HEINRICHS, J. H.; LIM, J. Integrated web-based data mining tolls with business
models for knowledge management. Decision Support Systems, v. 35, n. 1, p. 103-
112, 2003.
KIMBALL, R. Data Warehouse Toolkit. São Paulo: Makron Books, 1997. 388 p.
SHIGUNOV, F. Uma Aplicação OLAP sobre a Web para Análise dos Dados do
Vestibular da UFSC e Diretrizes para a sua Integração com GIS. 2007. 88 f.
Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) -
Departamento de Informática e Estatística, Universidade Federal de Santa Catarina -
UFSC, Florianópolis.
BIBLIOGRAFIA COMPLEMENTAR
APÊNDICES
Feito isso, precisa-se criar uma entrada (input) para a transformação. Neste
exemplo, a entrada é a tabela CLIENTES utilizada para armazenar os dados dos
clientes.
No lado esquerdo da tela, em Core Objects> Input> Table Input arrastando o
step Table input para o espaço vazio, ao lado direito. Feito isso, pode editar o step,
dando dois cliques sobre ele. Escolha a conexão com o banco fonte que importa os
dados através do botão Get SQL select statement.
Neste exemplo, a tabela de clientes conta com os campos IDCLIENTE,
NOME e BAIRRO.
A qualquer momento é possível clicar no botão Preview para verificar se os
dados obtidos da tabela estão de acordo com o esperado. Isto ajuda a encontrar erros
de configuração e corrigi-los rapidamente, evitando que os mesmos causem um efeito
dominó na transformação criada.
IDCLIENTE, NOME e BAIRRO. A aba Update Fields, não está marcado atualização
para IDCLIENTE, para que não haja a duplicação de ids.
APÊNDICE C - ARTIGO
1 Apresentação
O Data Warehouse (DW) é uma ferramenta no contexto do Business Intelligence (BI). O BI,
também conhecido por Inteligência de Negócios ou Inteligência Empresarial, é o conjunto de
tecnologias orientadas a disponibilizar informação e conhecimento em uma empresa e inclui
ferramentas como Customer Relationship Management (CRM), Data Mining, Data
Warehouse, entre outras.
As ferramentas de Business Intelligence (BI) são bastante difundidas entre empresas
de grande porte, porém, têm aplicação limitada em empresas de médio e pequeno porte,
principalmente devido ao alto custo das mesmas. Por outro lado, com o surgimento de
89
ferramentas que podem ser obtidas gratuitamente (ou a custos reduzidos), as médias e
pequenas empresas começam a se beneficiar dessa tecnologia para a tomada de decisão.
Neste trabalho busca-se: a) demonstrar a viabilidade de desenvolvimento de um DW a
partir de ferramentas distribuídas como software livre; b) escolher um pacote de software
livre para desenvolvimento de DW; c) demonstrar o uso pacote do software através de um
estudo de caso.
A estrutura deste artigo apresenta, inicialmente, uma visão geral do trabalho. Na etapa
seguinte, apresentou-se a ferramenta Pentaho, sua descrição e arquitetura. Na terceira etapa
foi descrito um estudo de caso e foram abordadas as fontes de informação OLTP (On-line
Transaction Processing) e o processo de Extração, Transformação e Carga (ETC) dos dados
referentes a este estudo de caso. A última etapa consistiu no processo de implementar o DW e
a interface OLAP, disponibilizando os recursos para análise de dados.
Quando uma organização precisa tomar uma decisão é indispensável ter dados
corretos e disponíveis para consulta. Para conseguir isso, ela deve tratar e consolidar as
informações armazenadas nos sistemas e fontes de dados que apóiam seu negócio em um
repositório centralizado, criando “uma única versão da verdade”, limpa e confiável (processo
ETL). Depois, pessoas que entendem do negócio da empresa devem ter acesso a esse
repositório e, usando ferramentas de visualização e exploração de dados, interpretá-los para
finalmente tomar uma decisão [TEMATEC, 2008].
O conjunto destes componentes de softwares, dados, operações e processos usados
para atender uma necessidade específica, para tomar uma decisão, são chamados de solução.
A Pentaho Inc. integrou e promoveu o desenvolvimento de várias ferramentas open
source que fornecem os recursos necessários para criação de soluções de BI. Esse conjunto é
conhecido por Pentaho Open BI Suite e inclui ferramentas para consolidar dados de fontes
diversas, criar interfaces visuais para exploração desses dados e montar soluções para
necessidades específicas [TEMATEC, 2008].
90
a) Arquitetura
O projeto Pentaho BI é constituído de um conjunto completo de ferramentas de BI e
bibliotecas que fornecem funcionalidades de BI aos desenvolvedores. É uma solução com
suporte a relatórios, análises, data mining e workflow, através de uma série de componentes
que podem ser distribuídos juntos ou separados [PENTAHO, 2007].
O servidor roda de acordo com o padrão de servidores Java, tais como Apache
TomCat e JBoss. Ele utiliza um método de desenvolvimento, distribuição e suporte que torna
possível o modelo de negócios open source [PENTAHO, 2007].
A Figura 2 apresenta a arquitetura do Pentaho, a qual é composta por componentes de
integração de dados, infra-estrutura e apresentação dos dados e a origem destes dados.
3 Estudo de Caso
Demonstra-se, através de um estudo de caso, como funciona o processo de desenvolvimento
de um Data Warehouse (DW) a partir da plataforma Pentaho. O processo de criação do DW
inicia pela análise de um sistema OLTP – On-line Transaction Processing de uma empresa de
reflorestamento fictícia. É feita a identificação dos dados atualmente utilizados para tomada
de decisão na empresa e, a partir desta análise, é realizada a modelagem dimensional do DW.
Logo após, é programado o processo de extração, transformação para posterior carga no DW.
Ao final, com a modelagem dimensional criada e o banco de dados do DW devidamente
preenchido, é feita a configuração do cubo para possibilitar a análise dos dados na plataforma
Pentaho.
a) Empresa
Neste trabalho busca-se o desenvolvimento de uma solução de DW. Esta seção tem por
finalidade descrever genericamente o funcionamento do controle de produção de uma
empresa de reflorestamento, baseado no estudo do software de gestão da empresa.
Posteriormente, com base nas características aqui levantadas, é feita a proposta de uma
aplicação de Data Warehouse para atender às necessidades deste setor.
A estrutura da empresa de reflorestamento é formada por operadores, gerência
comercial e pessoal de apoio. A gerência comercial é responsável pelo controle dos
operadores e acompanhamento dos transportes dos produtos. O pessoal de apoio é
responsável pelo trabalho burocrático do setor, como atendimento a clientes, cadastramento
de produtos, condições de pagamento, interação com as transportadoras e operadores.
O cliente faz o pedido para o pessoal de apoio. O pedido contém uma determinada
data de entrega, a condição de pagamento, a transportadora que faz a entrega e os itens do
pedido, que são os produtos comprados pelo cliente.
O sistema OLTP, que faz o controle de cargas é de grande importância para a empresa,
mas apresenta carência de informações estratégicas e não responde a questões que têm origem
no cruzamento de dados, como: quais os melhores clientes por período do ano, total das
saídas de cargas por cliente no mês, valor total de vendas no dia, mês ou ano e quantidade
transportada.
92
b) Processo ETL
Os detalhes do povoamento do Data Warehouse são explicados neste tópico através da
dimensão TEMPO. Foi utilizado no projeto a ferramenta de código aberto chamada Kettle,
que é distribuída pela Pentaho Inc. e auxilia a integração de dados e a construção do DW.
A dimensão TEMPO apresenta um pouco mais de complexidade, comparada com as
anteriores. Os dados dessa dimensão não vêm do banco OLTP, pois são gerados pelo processo
de ETC e posteriormente são relacionados na tabela de Fatos:
a) Add Sequence: definem-se e selecionam-se números seqüenciais (conjunto de valores
com um valor inicial e um valor de incremento definidos) para dias, meses e anos;
b) Join Rows: faz-se a união dos números com o produto cartesiano;
c) BuildDateInfo: executa-se com linguagem Java Script com cálculos para a validação
das datas;
d) Sort rows: selecionam-se os campos para a organização com base nos campos
especificados (dias, meses e anos);
e) Filter rows: filtram-se os campos, descartando as datas inválidas com base em
condições. Se a data é valida segue o campo para o step Add Sequence, se não for
válida segue para o step InvalidDateIgnore;
f) Add sequence: atribui-se um id para cada data criada, com valor inicial e final pré-
definidos;
g) Value mapper: define-se o mapeamento para os valores string, neste caso o nome do
mês;
h) Calculate: fornece um conjunto de funções pré-definidas que podem ser executadas
sobre os valores contidos nos campos, com base nisso, faz-se o cálculo para mostrar o
nome do mês;
i) Value mapper: define-se o mapeamento para mostrar o nome dia da semana;
j) Select values: selecionam-se os valores necessários para armazenar na dimensão
tempo;
k) Combination lookup/Update: escreve-se na dimensão DIM_TEMPO os dados
resultantes da transformação.
93
c) Pentaho Workbench
O próximo passo é avaliar os softwares responsáveis pela criação do Pentaho Analysis. A
avaliação pode assumir muitas formas, mas esse esquema vai ajudar a orientar o processo de
avaliação Pentaho, fornecendo um recurso para a organização de usar e identificar os
componentes utilizados na plataforma Pentaho.
Pentaho Analysis é desenvolvido sobre o engine Mondrian OLAP. Os esquemas são
modelos de arquivos XML que são criados em uma estrutura específica utilizada pelo engine
Mondrian. A configuração dos cubos são descritos com a utilização do schema Workbench.
O Schema Workbench é uma interface de design que permite a criação e o teste de
esquemas de cubos OLAP do Mondrian. Esses modelos XML utilizam tabelas de fatos e
dimensões encontradas no ambiente de Data Warehouse criados.
O Schema Workbench fornece as seguintes funcionalidades:
Editor de esquema integrado, apresentando a fonte dos dados no rodapé, para
validação;
Teste das consultas MDX nos esquemas e nas bases de dados;
Visualização da estrutura da base de dados.
e) Pentaho Analysis
O Pentaho Analysis apresenta as funcionalidades gerais, nas ferramentas disponíveis, destaca-
se a opção que exporta os dados extraídos para Excel, e a opção OLAP Navigator, que
oferece opções de filtro altamente customizáveis para relacionar informações do cubo.
Outras funcionalidades relevantes são a de Drill Up e Drill Down que consistem,
respectivamente, em agregação de métricas e detalhamento das métricas. Esta opção é
indicada pelo sinal de + e - ao lado das colunas.
Principais recursos da barra de ferramentas:
OLAP Navigator: Define o layout geral da query, como as colunas, linhas a ser
exibidos e campos para os filtros. Pode através desse ícone modificar as estruturas
das pesquisas OLAP visualizando e adicionando ou removendo dimensões ao cubo
propriamente dito.
MDX: o Analysis utiliza a MDX query language para definir queries
multidimensionais.
Config OLAP Table: com o “Config OLAP Table”, podemos configurar a tabela
gerada pelo cubo, podem oferecer recursos importantes na melhor visualização das
pesquisas.
Show Parent Members: mostra os "parent members" para as linhas ou colunas.
Preenche os espaços vazios na tabela com os “membros pais” para cada nível nas
suas respectivas linhas.
96
Hide Spans: retira cabeçalhos repetidos em resultados comuns. Ela realiza uma
tarefa parecida com a ferramenta anterior, porém com relação às colunas
Show Properties: através da ativação dessa opção tornamos visíveis as
propriedades das dimensões expandidas.
Suppress Empty Rows / Columns: mais uma função importante na boa visualização
da tabela, espaços em branco são ocultados por esta ferramenta para uma melhor
visualização.
Swap Axes: realiza a inversão entre linhas/colunas e colunas/linhas.
Drill Member: podemos escolher entre os itens 9, 10, 11 e 12 para refinar um
“Drill down”. Em “Drill Member”, quando expandimos uma dimensão todas as
instâncias do membro serão expandidas.
Drill Position: Seguindo o “Drill Member”, apenas o exemplo do membro clicado
será expandido, mesmo que existam outras instâncias do mesmo membro.
Drill Replace: essa opção no permite como que agregar linhas ou colunas durante
o “Drill down”.
Drill Through: adiciona uma seta indicativa na fatos apresentados para possível
visualização mais específica do usuário.
Show Chart: permite a construção de gráficos para análise dos dados em outra
visão.
Chart Config: como alguns gráficos ficam desconfigurados pelo número grande de
colunas, ou pelo tamanho dos nomes das mesmas, essa ferramenta permite
configurar fatores que possam tornar o gráfico apresentável.
Configure Print Settings: permite a configuração de fatores de impressão.
Print This Page Via PDF: gera um documento em formato PDF com a tabela em
questão.
Start Excel: gera um documento em “xls” com a tabela em questão.
4 Considerações Finais
Com o advento da globalização, as empresas contemporâneas dos mais diversos setores de
atuação têm investido na captação e na aplicação da informação como diferencial estratégico
e competitivo na condução de seus negócios. Data Warehouse é um exemplo de tecnologia da
área da computação muito utilizado neste processo.
As tecnologias que permitem a análise e a visualização de dados e informações são
extremamente importantes para o processo de tomada de decisão. Não basta oferecer grandes
quantidades de dados ou informações, mesmo gratuitamente, sem que haja ferramentas de
apoio que auxiliem o usuário a analisá-las, cruzá-las, sumarizá-las e visualizá-las de uma
forma conveniente, a fim de identificar alguma informação realmente útil e relevante. É
somente realizando esse processo que as pessoas podem prever o resultado de diferentes
situações, visualizando cenários e tomando decisões de forma mais confiável.
As maiores contribuições de cunho acadêmico deste trabalho consistem no estudo e no
aperfeiçoamento de uma tecnologia existente para o auxílio a pequenas empresas que tem
limitações ao desenvolvimento de aplicações para a tomada de decisão, devido ao seu alto
custo Com a suíte de ferramentas Pentaho, desenvolvedor pode desenvolver aplicações
97
Referências Bibliográficas
PENTAHO. Pentaho Open Source Business Intelligence. Disponível em:
<http://www.pentaho.com>. Acessado em: 12 out. 2007.
TEMATEC. Por dentro da Pentaho Open BI Suite: Conceitos, Arquitetura e
Componentes. Disponível em: <http://br.groups.yahoo.com/group/pentahobr/>. Acessado
em: 05 set. 2008.