Você está na página 1de 35

UNIVERSIDADE VEIGA DE ALMEIDA ROBERTA VIEIRA MIRANDA

BUSINESS INTELLIGENCE OPEN SOURCE COM PENTAHO

RIO DE JANEIRO 2010 UNIVERSIDADE VEIGA DE ALMEIDA ROBERTA VIEIRA MIRANDA

BUSINESS INTELLIGENCE OPEN SOURCE COM PENTAHO

Monografia apresentada, como pr-requisito de concluso do curso de Cincias da Computao, ao Instituto de Cincias e Tecnologia da Universidade Veiga de Almeida. rea de Concentrao: Banco de Dados.

Orientadora: Eliane Xavier Cavalcanti

RIO DE JANEIRO 2010

ROBERTA VIEIRA MIRANDA BUSINESS INTELLIGENCE OPEN SOURCE COM PENTAHO MONOGRAFIA

OBJETIVO: ESTE TRABALHO DE CONCLUSO DE CURSO VISA APONTAR AS FUNCIONALIDADES, VANTAGENS E DESVANTAGENS DA IMPLEMENTAO DE FERRAMENTAS DE BUSINESS INTELLIGENCE DE PLATAFORMA OPEN SOURCE COM A IMPLANTAO DO SOFTWARE PENTAHO. DATA DE APROVAO: ____/____/____

INSTITUIO: UNIVERSIDADE VEIGA DE ALMEIDA CURSO: CINCIA DA COMPUTAO

PROF. CARLOS ALBERTO ALVES LEMOS DOUTOR EM ENGENHARIA (SISTEMAS DE COMPUTAO) UNIVERSIDADE ESTADUAL DA ZONA OESTE - UEZO

PROF. LUIZ HENRIQUE DE SOUZA AGUIAR COUTINHO DOUTOR EM PLANEJAMENTO E POLTICAS PBLICAS FURNAS CENTRAIS ELTRICAS S. A. ______________________________________________________________________ PROF.PEDRO HENRIQUE GOUVA COELHO PHD PELA BIRMINGHAM UNIVERSITY UNIVERSIDADE DO ESTADO DO RIO DE JANEIRO - UERJ

Dedico esta Monografia aos meus pais, meus irmos e meus amigos que tiveram pacincia, me deram apoio e acreditaram que este sonho seria possvel.

"Qualquer tecnologia suficientemente avanada parece ser mgica.

Arthur C. Clarke.

AGRADECIMENTO

Agradeo Universidade Veiga de Almeida, ao meu coordenador prof. Luiz Antnio Palmeira Monteiro, por sempre estar disponvel a solucionar qualquer dvida, a minha orientadora prof. Eliane Xavier Cavalcante, pela pacincia e dedicao, e ao Mikael de Souza Fernandes da Universidade Luterana do Brasil (ULBRA) e ao Gustavo Zanini Kantorski da Universidade Federal de Santa Maria (UFSM), por autorizar a utilizao do projeto Neuro Business Intelligence para o estudo de caso, pea chave para o desenvolvimento desta Monografia.

RESUMO

Cada vez mais as empresas necessitam, em tempo real, da informao para basear suas decises. A noo de informao como um elemento estratgico para toda e qualquer companhia tem tido mais reconhecimento a cada dia. Assim, o valor estratgico da informao tem levado os gerentes mais experientes a implementarem sistemas de BI e incorpor-los aos projetos-chaves das companhias para a otimizao de seus negcios e para trazer benefcios aos processos de produo.

PALAVRAS-CHAVE: otimizao.

informao,

deciso, estratgico, implementao,

ABSTRACT Increasingly, companies need real-time, information to base their decisions. The notion of information as a strategic element for any company has had more recognition every day. Thus, the strategic value of information has led the most experienced managers to implement BI systems and incorporate them into projects for key companies to optimize their business and to bring benefits to production processes.

KEYWORDS: information, decision, strategy, implementation, optimization.

SUMRIO PG 1. INTRODUO ................................................................................................ 10 2. PROPSITO DO BUSINESS INTELLIGENCE ........................................ 11 2.1. CENRIO DE UM BI .............................................................................. 12

3. BI OPEN SOURCE......................................................................................... 14 3.1. VANTAGENS ........................................................................................... 14 4. PENTAHO ....................................................................................................... 15 4.1. PENTAHO OPEN BI SUITE ................................................................. 16 4.2. FUNCIONALIDADES PENTAHO........................................................ 16 4.3. MONDRIAN ............................................................................................. 16 4.4. KETTLE ................................................................................................... 17 4.5. JPIVOT ..................................................................................................... 18 4.6. SCHEMA WORKBENCH ...................................................................... 18 4.7. WEKA ....................................................................................................... 19

4.8. PENTAHO USER CONSOLE (PUC) .................................................... 19 4.9. PENTAHO REPORT DESIGNER (PRD)............................................ 20 4.10. PENTAHO DESIGN STUDIO (PDS).................................................. 20 5. ESTUDO DE CASO ....................................................................................... 20 5.1. TECNOLOGIA OLAP ........................................................................... 21 5.2. A FERRAMENTA .................................................................................. 22 5.2.1. Modelagem Multidimensional ......................................... 22 5.2.2. A Ferramenta Neuro ........................................................ 25 6. CONCLUSO ............................................................................................... 30

REFERNCIAS ................................................................................................. 32

10

1. INTRODUO
A presente Monografia pretende apresentar um apanhado de informaes que permite visualizar as principais caractersticas, vantagens e desvantagens das solues de Business Intelligence e a implantao de ferramentas Open Source, tomando como exemplo o Estudo de Caso no sistema Neuro Business Intelligence. Escolhemos por esse tema, pois fato que j faz algum tempo que BI (Business Intelligence) vem ganhando fora no mercado e, mais do que nunca, as empresas voltam sua ateno no apenas para as informaes operacionais, mas tambm para a questo estratgica, permitindo tomadas de decises com maior preciso e menor risco possvel. O grande desafio de todo indivduo que gerencia qualquer processo a anlise dos fatos relacionados a seu dever. Esta anlise deve ser feita de modo que, com as ferramentas e dados disponveis, o gerente possa detectar tendncias e tomar decises eficientes e no tempo correto. Com essa necessidade surgiu ento o conceito de Business Intelligence. Com o surgimento dos bancos de dados relacionais, dos PC's e das interfaces grficas como o Windows, aliados ao aumento da complexidade dos negcios, comearam a surgir os primeiros produtos realmente direcionados aos analistas de negcios, que possibilitavam rapidez e uma maior flexibilidade de anlise. Os sistemas de BI atuais tm como caractersticas:

Extrair e integrar dados de mltiplas fontes Fazer uso da experincia Analisar dados contextualizados Trabalhar com hipteses Procurar relaes de causa e efeito Transformar os registros obtidos em informao til para o

conhecimento empresarial Hoje as ferramentas de BI so a "chave-mestra" em qualquer companhia. Se h dez anos as empresas apostavam em aquisies para alavancar seu crescimento, hoje nota-se uma tendncia para o crescimento organizacional com base no negcio, algo que s possvel com essas ferramentas. As empresas procuram cada vez mais

11

responder s necessidades dos clientes sem serem intrusivas. Com isso, gerou-se uma cadeia de valores muito forte que impulsionou os negcios. Neste caso, mais uma vez o mercado ditou as regras. Tornou-se essencial a existncia de um sistema confivel, simples e acessvel para a anlise das informaes. A quantidade de conhecimento precisou ser ajustada inversamente quantidade das informao para anlises, e neste contexto o BI tem se dado muito bem. Hoje em dia muito difcil para uma empresa conseguir sobreviver sem alguma ferramenta de BI. Elas necessitam mais do que nunca de um sistema de suporte deciso eficaz e relevante, que tenha condies de gerir uma unidade de negcio de forma continuada para quase todos os nveis ou reas da empresa. Por isso, para alguns setores como telecomunicaes, bancos, seguros, cartes de crdito ou outro tipo de negcio que envolva um volume muito grande de informao, o uso destas solues em BI torna-se cada vez mais essencial para sua sobrevivncia no mercado.

2. PROPSITO DO BUSINESS INTELLIGENCE


O BI foi feito para gestores que buscam um melhor entendimento destes

cenrios, tanto internos como externos, e para isto se prope a coletar dados dos mais diversos ambientes e reas da empresa, preparando demonstrativos de desempenho, traando comparativos e elaborando projees. As tecnologias mais utilizadas em BI so:

Data Warehouses Ferramentas de ETL Data Marts Data Mining Geradores de relatrios e consultas Ferramentas OLAP / EIS / DSS

12

2.1.

CENRIO DE UM BI

Figura 1: Cenrio de um BI Quando falamos de aplicaes para negcio, lidamos com dois tipos distintos: Aplicaes que Sustentam o Negcio e Aplicaes que Analisam o Negcio Aplicaes que sustentam o negcio so compostas por Sistemas OLTP (On-line Transaction Processing, ou Processamento de Transaes em Tempo-Real) que trazem retorno de investimento baseado no melhor desempenho do negcio. Sua principal caracterstica o controle e o registro de transaes. Aplicaes que analisam o negcio, so as aplicaes de apoio tomada de deciso mais conhecidas como ferramentas OLAP (On-Line Analytical Processing ou Processamento Analtico em Tempo-Real). Nessas, o retorno do investimento so baseados no melhor conhecimento do negcio. Elas utilizam como fonte de dados os mesmos sistemas de Controle, mas tm como preocupao principal a identificao de tendncias. A diferena principal entre estas duas aplicaes, que enquanto as que Sustentam o Negcio atualizam os dados durante o dia em tempo real, as que Analisam

13

o Negcio so atualizados geralmente em processos batch noturnos, atravs dos mecanismos de ETL. O grande problema de uma corporao que conta primordialmente com sistemas OLTP, que possui muito dado e pouca informao. Sistemas de BI devem ser capazes no apenas de transformar dados em informao, mas utilizar estas informaes e mostrar seu impacto nos negcios da empresa. Existe uma mxima que diz que "A falta de informao leva os executivos a tomarem decises erradas, e o excesso tambm.". Todo BI requer um DW (Data Warehouse) ou Data Mart (Repositrio de Dados). Estes por sua vez possuem rotinas de ETL (Extrao, Transformao e Carga dos Dados), que trazem as informaes de Ambientes Externos fazendo: Tratamentos, Agregaes e Sumarizaes. Esta fase crucial e se alguma coisa der errada aqui, todo o restante do projeto pode ficar comprometido. Sem deixar de lembrar a fase anterior, da Modelagem de Dados, tambm deve ser construda com muita ateno pelo profissional responsvel e precisa ter uma viso clara do negcio. A fase de construo de um ETL geralmente costuma ser subestimada pela maioria dos projetistas e sua construo pode variar de sete meses a um ano. Um bom projeto de BI deve ser feito modularmente, com a construo de pequenos Data Marts, cujos resultados passam a ser vistos rapidamente. Uma abordagem mais corporativa que vise a construo de um grande DataWarehouse, j mostrou no ser uma boa opo, por que o projeto torna-se demasiadamente longo (mais de um ano) e caro (algumas centenas de milhares de reais). Contudo, um projeto com abordagem departamental deve ser construdo com cuidado para que haja total integrao com os Data Marts existentes, e o DW no necessite ser retrabalhado no futuro.

14

Figura 2: Arquitetura de um Data Warehouse

3. BI OPEN SOURCE
No universo de Business Intelligence, temos vrias ferramentas Open Source disponveis no mercado e, a cada ano, surgem novas solues. Neste trabalho de concluso de curso ser destacado o Pentaho, uma ferramenta de apoio tomada de deciso de plataforma open source. 3.1. VANTAGENS NA UTILIZAO DE FERRAMENTAS OPEN SOURCE A maior vantagem das ferramentas Open Source o baixo custo: no h gasto com licenas (que varia de centenas a milhares de dlares em ferramentas proprietrias). Ela reduz drasticamente o custo para uma plataforma de Business Intelligence de nvel empresarial, comparado com os tradicionais e proprietrios sistemas de BI. Entretanto, tal como acontece com ferramentas proprietrias, ainda so necessrios investimentos em implantao, treinamento e suporte para o mximo aproveitamento. Alm do menor custo, as ferramentas open source apresentam outras qualidades importantes, tais como qualidade, segurana, independncia de fornecedor, possibilidade de adequao a necessidades especficas, estabilidade e suporte tcnico.

15

4. PENTAHO
A tecnologia Pentaho foi desenhada do zero como uma plataforma de BI moderna e totalmente integrada, baseada em standards abertos. Isto significa que pode ser integrada facilmente com qualquer infraestrutura de TI de origem, ou embebida numa aplicao desenvolvida medida. Para utilizadores empresariais, o acesso a toda a informao de BI e a possibilidade de criar novos relatrios, vistas de anlise e dashboards encontra-se numa interface web racionalizada, e esto ao alcance de dois cliques. Ela fornece suporte tcnico compreensivo, manuteno de software,

funcionalidades melhoradas e mais, atravs de uma subscrio anual. Possui vrias suites que formam uma plataforma completa de BI, que foi desenvolvida, distribuda e implantada como Open Source apresenta grande flexibilidade e independncia entre as diversas plataformas, possui alta confiabilidade e segurana a um custo mnimo de implantao e manuteno. Possui ferramentas de ETL como o Kettle, anlises OLAP como o Mondrian ou de Data Mining como o Weka, e so reunidos num nico produto que permite solues que acompanham todo o ciclo de implementao de um SAD, (Sistema de Apoio Deciso) e que a tornam uma das solues Open-Source mais populares do mundo. A soluo Pentaho define-se a si mesma como uma plataforma de BI orientada para a soluo e centrada em processos. Ou seja, no s apresenta os resultados de uma forma nica e dando uma viso geral do estado da empresa, como implementa os prprios processos (workflow) para a resoluo de problemas detectados e apresentados. 4.1. PENTAHO OPEN BI SUITE A Pentaho Inc. integrou e promoveu o desenvolvimento de ferramentas open source que fornecem os recursos para criao de Solues de BI. O conjunto conhecido por Pentaho Open BI Suite (ou Suite Pentaho), incluem as suites Reporting, Analysis, Data Integration, Dashboards e Data Mining.

16

Devido sua estrutura em componentes, a Suite pode ser utilizada para atender demandas que vo alm do escopo das Solues de BI mais tradicionais. Esto disponveis componentes para a implementao de processos comandados por workflow automatizado, portais web customizveis com suporte portlets e single sign-on, entre outros. A plataforma executa todas as suas Solues de BI, como servios, e por isso possvel at mesmo prover acesso a esses recursos para sistemas externos, via web services, por meio de um mecanismo baseado em SOAP/WSDL/UDDI incluso.

Figura 3: Componentes do Pentaho Open BI Suite As suites so responsveis pela execuo da Soluo de BI, provendo controle de processos, visualizao, segurana e auditoria. Tm a funo de controlar o repositrio e a execuo de solues, os acessos a banco de dados, agendamentos, permisses, servios de e-mail e mais algumas atividades fundamentais de background, grande parte da sua funcionalidade pode ser configurada atravs do PAC (Pentaho Administration Console ). 4.2. FUNCIONALIDADES PENTAHO Uma das grandes dificuldades para algum que comea a trabalhar com o Pentaho entender o relacionamento entre os diversos aplicativos das suites. Todos os softwares da Suite Pentaho so programas Java e rodam em qualquer plataforma que tenha uma JVM padro, e estas ferramentas do produtividade na criao da soluo e das estruturas usadas pela plataforma. 4.3. MONDRIAN responsvel pelo servidor OLAP (Online Analytic Processing) onde podemos construir os cubos que permitiram segmentar a informao por eixos de anlise,

17

permitindo a anlise da informao com base em vrias perspectivas. Assim ser possvel a compreenso dessa informao de uma forma intuitiva, uma vez que a soluo permite decompor os valores nas diferentes perspectivas de anlise. Desta forma pode-se cruzar a informao com vrias dimenses de um modo muito simples, utilizando drag-and-drop, drilling into, drilling across, encadeamento de dimenses, entre outros, bem como encontrar a causa de um problema que lhe sobressaiu num simples relatrio. escrita em linguagem Java, e implementa a linguagem MDX, XML for Analysis e especificaes JOLAP, e l a partir de instrues SQL e outras fontes de dados, agregando os dados em uma memria cache.

Figura 4: Interface - Mondrian 4.4. KETTLE Faz parte da suite do Data Integration, e utiliza as tcnicas de ETL (ExtractTransform-Load), para a obteno dos dados que viro das vrias fontes de dados, e que obrigatoriamente teremos de cruz-las em algum momento dentro do ciclo de ETL. O Kettle capaz de ler e escrever em vrios formatos de SGBD, como Oracle, PostgreSQL, SQLServer, MySql, entre outros, e importar arquivos texto (CSV ou fixo), planilhas Excel e bases de dados ODBC (apenas em Windows). Ele um ambiente grfico no qual conexes com fontes de dados so estabelecidas e seqncias de passos executam a extrao de dados, sua modificao e a carga desses em um destino. O Kettle pode integrar dados entre empresas e sistemas, substituindo a criao de camadas de programas para integrao por operaes visuais.

18

Figura 5: Kettle

4.5.

JPIVOT Jpivot uma biblioteca customizada JSP que desenha uma tabela e um grfico

OLAP. Os usurios podem executar navegaes tpicas OLAP como drill down e sliceand-dice. Utiliza o Mondrian e XMLA como engines OLAP.

4.6.

SCHEMA WORKBENCH O Schema Workbench cria os cubos no formato XML que sero processados e

exibidos pelo Portal. Ele tem uma interface visual para navegar entre as definies do cubo, permitindo criar, alm de mtricas, dimenses e hierarquias, muitas das estruturas que agregam valor na explorao de um cubo OLAP, como mtricas derivadas, cubos virtuais (combinaes de tabelas fato) e atributos de dimenses. 4.7. WEKA O Weka um ambiente grfico para Data Mining. Permite ao usurio criar e testar hipteses contra as bases de dados. Existem grandes potencialidades na utilizao

19

de Data Mining para apoiar o processo de tomada de deciso.

Figura 6: Weka

4.8.

PENTAHO USER CONSOLE (PUC) Interface para o usurio final, a partir do PUC que os usurios tero acesso s

anlises e relatrios criados, podero ainda - de acordo com as permisses definidas criar relatrios Ad-Hoc utilizando o WAQR, criar novas vises analticas utilizando o JPivot, executar relatrios criados previamente com o PRD (ou outro gerador de relatrios suportado), visualizar dashboards, agendar a execuo de relatrios e compartilhar qualquer um desses artefatos com outros usurios. 4.9. PENTAHO REPORT DESIGNER (PRD) Gerador de relatrios "pixel perfect" da suite, facilita a criao de relatrios "ricos" com uma aparncia mais profissional e personalizada, adicionalmente permite a publicao desses relatrios no PUC, permite inclusive que filtros simples sejam publicados diretamente sem a criao de xactions no PDS.

20

4.10. PENTAHO DESIGN STUDIO (PDS) Plugin para a plataforma Eclipse que funciona como uma interface grfica para a criao de xactions que so arquivos XML interpretados pelo BI Server, so como instrues "passo-a-passo" que dirigem a execuo das atividades pelo BI Sever, permitem, por exemplo, a definio de filtros avanados para relatrios e o envio de emails com os relatrios executados.

5. ESTUDO DE CASO
Os sistemas para informatizao dos procedimentos transacionais de Hospitais Universitrios normalmente no possuem ferramentas de anlise. Neste enfoque, foi desenvolvido um sistema de informaes hospitalares para o Hospital Universitrio de Santa Maria. Este sistema, disponibilizado na web, permite aos gestores do hospital analisarem as informaes sobre a abrangncia de atuao do hospital na regio central do estado do Rio Grande do Sul , alm da comprovao da efetividade dos procedimentos de baixa, mdia e alta complexidade realizados pelo hospital. O sistema foi desenvolvido atravs de tecnologias OLAP (On-Line Analytical Processing), cujo objetivo transformar dados em informaes capazes de dar suporte a decises gerenciais de forma flexvel e em tempo hbil. Desta forma, OLAP precisa oferecer informaes existentes, oportunas, precisas e inteligveis [Thomsen 2002]. O presente Estudo de Caso tem por objetivo apresentar uma ferramenta OLAP Web, para anlise de informaes da rea da sade, aplicadas ao Hospital Universitrio de Santa Maria, com a utilizao de ferramenta open source Pentaho. A seguir so apresentadas as tecnologias utilizadas para o desenvolvimento da ferramenta, a arquitetura e a ferramenta desenvolvida. 5.1. TECNOLOGIA OLAP OLAP uma categoria de software especfica para realizar processamento analtico dos dados de data warehouse, de maneira que este processamento deve ocorrer com alto desempenho, consistncia e interatividade e auxiliar a tomada de deciso em uma organizao atravs da interpretao desses dados em vrias vises multidimensionais [Cood, Codd e Salley 1993].

21

As ferramentas OLAP so geralmente de uma das trs arquiteturas: ROLAP Relational OLAP, MOLAP Multidimensional OLAP e HOLAP Hybrid OLAP. ROLAP realiza o processamento do data warehouse em uma estrutura fsica do modelo relacional e modelada dimensionalmente. A arquitetura MOLAP utiliza o armazenamento fsico multidimensional. E a arquitetura HOLAP integra as caractersticas de ROLAP e MOLAP, onde os dados atmicos so armazenados em um modelo relacional e os agregados e dimenses so guardados em uma matriz ndimensional. Independente da arquitetura utilizada, as ferramentas OLAP manipulam os dados do data warehouse atravs de um estrutura multidimensional denominada cubo. Os cubos representam o data warehouse e so organizados de maneira a realizar consultas rpidas e dinmicas voltadas ao apoio deciso. Os cubos so definidos atravs de dimenses e medidas. As dimenses fornecem as informaes descritivas, enquanto que as medidas disponibilizam informaes quantitativas que se deseja consultar [Kimball 1996]. A manipulao das estruturas multidimensionais pode ser realizada atravs de operaes OLAP. As operaes OLAP so o drill-up ou roll-up, na qual os dados so agrupados em um nvel com maior granularidade, o drill-down, no qual existe o detalhamento dos dados para um nvel com menor granularidade, o slice & dice que seleciona uma parte do cubo, o Pivoting que realiza a inverso / rotao dos eixos do cubo para visualizao de uma consulta, o Rank que ordena as consultas de acordo com os valores das medidas e o Drill-across que realiza o detalhamento dos dados por meio de mltiplos nveis de dimenses diferentes. O Mondrian e o JPivot so exemplos de ferramentas OLAP open source e que possuem interface para a web. O Mondrian um servidor OLAP desenvolvido na linguagem J ava sendo parte de um conjunto de tecnologias open sources pertencentes ao projeto Pentaho Business Intelligence [Pentaho 2007]. Para um melhor entendimento do funcionamento do servidor Mondrian possvel divid-lo em 4 camadas [Mondrian 2007]: a camada de apresentao (presentation layer), a camada dimensional (dimensional layer), camada estrela (star layer) e a camada de armazenamento (storage layer). A tecnologia JPivot responsvel pela camada de apresentao, projetada para trabalhar com vrios servidores OLAP, especialmente com o Mondrian. O JPivot uma ferramenta que atravs de suas tag librarys permite apresentao e interao com os dados analisados [JPivot 2007], isto , visualizao e manipulao de tabelas, resultado

22

de consultas OLAP. A segunda camada, dimensional, a camada que recebe, analisa e envia consultas MDX (Multidimensional Expressions). A camada estrela responsvel pela ligao da consulta MDX recebida pela camada anterior e a execuo da mesma sobre a base de dados mapeada. E por ltima, a camada de armazenamento que executa as consultas solicitadas pela camada estrela sobre a base de dados relacional, logo caracterizando o Mondrian como um servidor ROLAP. 5.2. A FERRAMENTA A ferramenta Neuro Business Intelligence foi desenvolvida para atender as necessidades do hospital universitrio. Sero apresentados nos tpicos seguintes a modelagem dos cubos e o mapeamento realizado entre o modelo relacional e o modelo dimensional. Sero mostradas tambm a ferramenta desenvolvida e as tecnologias utilizadas. 5.2.1. Modelagem Multidimensional O modelo de armazenamento multidimensional implica em dois tipos de tabelas: tabelas de dimenses e tabelas de fatos. Uma tabela de dimenses consiste em tuplas de atributos da dimenso. Uma tabela de fatos pode ser imaginada como se possusse tuplas, uma para cada fato registrado. Esse fato contm alguma varivel ou variveis observadas ou mensuradas e identifica as mesmas como ponteiros para tabelas de dimenses. As tabelas de fatos contm os dados e as dimenses identificam cada tupla nesses dados [Navathe 2000]. O data warehouse foi criado em um modelo ROLAP em uma base MySQL Server. Para modelagem dos cubos foi utilizada uma ferramenta multidimensional denominada Cube Designer (Figura 7), que faz parte do projeto do servidor Mondrian, Pentaho Business Intelligence [Pentaho 2007]. A ferramenta de modelagem multidimensional realiza uma conexo via JDBC (Java Database Connectivity) com diversas bases de dados pr-configuradas, entre elas MySQL. A ferramenta apresenta uma lista de tabelas do banco, onde possvel selecionar e manipular as tabelas e seus atributos. Aps define-se, dentre as tabelas selecionadas, a tabelas de fatos. Entretanto, na definio de dimenses, propriedades e medidas a ferramenta apresenta limitaes nos recursos de configuraes, onde no possvel utilizar-se toda potencialidade da modelagem. O resultado da modelagem armazenado em um arquivo em XML (eXtensible Markup Language) que manipulado pelo servidor Mondrian.

23

Figura 7: Ferramenta Cube Designer modelagem de dimenses. De acordo com [Brito 2004], a lgica do Mondrian implementada atravs de Schemas, que definem o modelo multidimensional lgico e o mapeamento deste modelo em um modelo fsico e relacional. O primeiro modelo, lgico, formado de elementos definidos pelo Schema, sendo estes: cubo (cube), dimenso (dimension), hierarquias (hierarchy), nveis (level) e membros (members). Por conseguinte, o modelo fsico a base de dados relacional que mapeada pelo modelo lgico atravs do Schema. Logo, para uma mais completa definio do Mondrian Schema necessria uma manipulao no arquivo XML por meio de um editor de texto qualquer. Na modelagem da ferramenta para a instituio de sade focou-se na anlise de dois aspectos: um deles referencia os exames realizados pelos pacientes, enquanto o outro corresponde ao consumo de materiais farmacuticos. A modelagem dimensional apresentada na Figura 8.

24

Figura 8: Modelagem Dimensional A primeira modelagem refere-se aos procedimentos de exames cuja tabela de fatos a bi_fat_exames (Figura 8), com as respectivas medidas de nmero de pacientes e de nmero de exames realizados, possuindo como aspectos para anlise as seguintes dimenses: Pacientes: dimenso que caracteriza basicamente duas propriedades dos pacientes do hospital, sexo e domiclio (identificando a cidade e estado do paciente). A propriedade domiclio o resultado da tag do Schema denominada joinTable, referenciando as tabelas pacientes e domiciliados (Figura 9); Exames: dimenso que representa o cdigo e a descrio dos exames; Tempo: dimenso que permite uma robusta anlise dos fatos atravs das propriedades dia, ms, ano, semana, bimestre e semestre. A Figura 9 mostra um fragmento do arquivo XML onde pode ser visualizado o mapeamento da dimenso Pacientes com a tabela de bi_ dim_ pacientes modelada na Figura 8 e o join realizado com a tabela bi_ dim_ domiciliados que representa a modelagem snow-flake da dimenso pacientes. possvel verificar tambm os quatro

25

nveis que a dimenso pacientes possui, estado, cidade, sexo e nome. Alm disso, podese verificar a tabela de fatos, bi_ fat_ exames, que faz parte do cubo exames.

Figura 9: Mapeamento de Esquemas XML e a Tabela de Dimenses. A outra modelagem corresponde movimentao de materiais farmacuticos pelos setores do hospital, denominados de unidades. A modelagem representa os valores financeiros e as devidas quantidades atravs de agregaes e somas da tabela de fatos bi_fat_medicamentos (Figura 8). Para anlise de tais medidas, alm das dimenses citadas anteriormente (pacientes e tempo), novas dimenses foram modeladas: Unidades: dimenso que representa os setores que consomem os materiais da instituio, por meio das propriedades nome e cdigo; Produtos: dimenso que caracteriza o cdigo e a descrio dos diversos materiais referenciados na tabela de fatos. importante salientar que, embora existam vrios cubos modelados, as dimenses so compartilhadas entre os diversos cubos, evitando re-trabalho na modelagem. Assim, por exemplo, a dimenso tempo a mesma que utilizada em todos os cubos modelados. 5.2.2. A Ferramenta Neuro Por meio da utilizao das tecnologias Mondrian e JPivot, e ainda com o Web container Apache Tomcat, foi possvel o desenvolvimento de uma nova ferramenta denominada Neuro. A ferramenta Neuro compreende um aplicativo Java baseado no servidor OLAP Mondrian com caractersticas novas agregadas para o Hospital Universitrio de Santa Maria (HUSM). A Figura 10 apresenta a arquitetura definida para a ferramenta.

26

Figura 10: Arquitetura da Ferramenta. O servidor OLAP Mondrian a camada principal da aplicao Neuro BI, pois processa e retorna as consultas (MDX) geradas pela devida aplicao. Entretanto, para que haja esse processamento necessria uma prvia configurao na estrutura do servidor OLAP, primordialmente, aps a gerao do Schema, deve-se adicion-lo ao diretrio da aplicao, podendo conter ainda outros Schemas, no container Web e configur-lo (no arquivo datassources.xml). Na Figura 10 mostrada a interface principal da ferramenta. No menu, esquerda, podem ser visualizados os esquemas modelados. Na parte central so mostradas informaes sobre o perodo dos dados gerados e os cubos disponveis para consulta. Na Figura 11 possvel visualizar o cubo de exames e o cubo de produtos farmacuticos. Novos cubos e consultas podem ser modelados e adicionados interface e disponibilizados para consulta. Na verso atual da ferramenta o perodo de referncia para gerao dos cubos o mesmo, no sendo possvel gerao de perodos diferentes para cubos diferentes.

27

Figura 11: Interface Inicial da Ferramenta. Depois de configurado o Mondrian Schema, possvel gerar as consultas que estaro contidas em arquivos no formato JSP (Java Server Pages) em um diretrio especfico (diretrio queries), sendo que cada arquivo possui uma nica consulta. Um arquivo possui, alm da convencional tag Java (core) na qual especificada o ttulo para a consulta, a tag denominada mondrianQuery referente ao JPivot. Nesta tag necessrio especificar os parmetros JDBC para conexo, o Schema a ser manipulado e, em seu corpo, a consulta MDX para acesso aos dados, conforme a Figura 12. Logo, existe uma multiplicidade de arquivos do formato JSP onde cada um identifica uma nica consulta MDX, sendo que o nome de cada arquivo corresponder ao parmetro na execuo de cada consulta. As consultas MDX mostradas na Figura 12 compreendem uma parte da gerao e exibio da consulta. Outras funcionalidades (atravs de botes), como cabealho e rodap estaro presentes em um outro arquivo do formato JSP presente no diretrio root (raiz) da aplicao. Desta forma a manuteno da devida aplicao refletir em todas as consultas que fazem uso.

28

Figura 12: Arquivo JSP com parmetro de conexo e exemplo de consulta MDX. A Figura 13 mostra o retorno, em um Browser Web, da consulta MDX mostrada na Figura 12. Na interface possvel visualizar ao topo, alguns links da ferramenta Neuro. Logo abaixo, o ttulo da consulta, especificado no arquivo JSP da consulta (atravs da tag denominada core). Acima da tabela de dados gerada, os botes que correspondem s operaes OLAP permitidas pelo servidor Mondrian. E no centro, a tabela com o resultado da consulta MDX gerada, listando inicialmente as dimenses e medidas como colunas e os respectivos membros como linhas. mostrada uma operao drill member sobre a hierarquia (hierarchy) pacientes da dimenso (dimension) de mesmo nome. E finalmente, abaixo da tabela, possvel retornar ao devido esquema (Schema) em que a consulta pertence, por meio de um link, e o rodap da ferramenta.

29

Figura 13: Interface de Retorno de uma Consulta.

30

6. CONCLUSO
Conclui-se que o mercado de Inteligncia Competitiva conta hoje com uma variedade muito grande de produtos e fornecedores. As caractersticas de cada soluo vo depender da necessidade de cada empresa. Por isso muito importante saber avaliar cada uma delas e o que se prope. Atravs da anlise da quantidade de informaes que passam por uma empresa diariamente, possvel identificar a sua importncia e, acima disso, da anlise de modo a verificar o que util. Baseado neste cenrio, possvel entender o porque da contnua existncia de ferramentas de Business Intelligence (BI) na lista de prioridades nas empresas. A necessidade de eficincia e agilidade no processo de deciso exige delas a utilizao de solues que gerem informaes consistentes e ao mesmo tempo sejam flexveis de modo a se enquadrarem nas suas necessidades e limitaes. Dessa forma, se faz necessrio efetuar uma anlise dessas empresas e das ferramentas do mercado de modo a verificar quais delas so compatveis. Existe uma grande quantidade de ferramentas de BI no mercado hoje com uma ampla variedade de funcionalidades e valores. Alm disso, tm ocorrido um grande crescimento das solues livres com suas constantes melhorias e amadurecimento. No entanto, como no existe um padro estrutural e funcional seguido por todas, o processo de comparao entre essas ferramentas dificultado, aumentando o tempo de anlise das ferramentas para escolha por parte das empresas. Nesse contexto, inserido o risco decorrente da ferramenta no corresponder na realidade aquilo que teoricamente est explicitado nos manuais. No Estudo de Caso realizado no Hospital Universitrio de Santa Maria, foram detectadas vrias situaes relativas realizao de exames pelos pacientes e o consumo de materiais farmacuticos de pacientes internados. As ferramentas de consultas OLAP limitam-se, embora nem todas, a solues privadas que prejudicam o processo de integrao. A ferramenta desenvolvida neste trabalho utiliza tecnologias open source e realiza a integrao dessas tecnologias. A ferramenta utiliza uma interface mais amigvel com a qual os usurios possam trabalhar e realiza a integrao entre tecnologias existentes como o Mondrian e o JPivot. Como trabalhos futuros destacam-se a necessidade dos usurios poderem configurar e salvar as consultas para que no seja necessria, a cada execuo de consulta, a configurao e

31

formatao das informaes geradas. Alm dessas configuraes, deve-se trabalhar melhor algumas modificaes para que o prprio gestor utilize a ferramenta ao invs de delegar essa gerao de consultas para usurios especializados.

REFERNCIAS

32

BARBIERI, CARLOS. BI - Business Intelligence - Modelagem & Tecnologia . Axcel Books, 2001. BOAR, BERNARD. Tecnologia da Informao - A Arte do Planejamento Estratgico, So Paulo, Berkeley, 2002. BRITO, MAIQUEL DE. Proposta de um Data Warehouse de informaes acadmicas. Instituto de Cincias Exatas e Tecnolgicas, Centro Universitrio Feevale, Novo Hamburgo, 2004. CARVALHO, R.B. Tecnologia da Informao aplicada gesto do conhecimento . Belo Horizonte: Editora Arte, 2003. COOD, E.F., COOD S.B., SALLEY, C.T. Providing OLAP (OnLine Analuytical Processing) to user-analysts: IT Mandate, White Paper, Arbor Software Corporation, 1993. DAVENPORT, T.H.;PRUSSAK, L. Conhecimento Empresarial, como as empresas gerencial seu capital intelectual. 5 edio. Rio de Janeiro: Ed.Campos, 1988 DRUKER, PETER. Peter Drucker na Prtica. Editora Campus, 2004 DRUKER, PETER. Administrando em Tempos de Mudana, Editora Thomson Learning, 1995 FIGUEIREDO, SAULO . Gesto do Conhecimento - Estratgia Competitivas para a Criao e Mobilizao do Conhecimento na Empresa. QualityMark Ed., 2005 HAN, J., KAMBER, M. Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers, 2001. JPivot. A JSP based OLAP, http://jpivot.sourceforge.net, December, 2007. KIMBALL, R. (1996). The Data Warehouse Tollkit. John Wiley. Mondrian. Mondrian OLAP Server, http:/ /mondrian.sourceforge.net, December, 2007. NAVATHE, S. E ELMASRI, R. Fundamentals of Database Systems, Addison Wesley, 3th edition, 2000 Pentaho. Open Source Business Intelligence, http:/ / www.pentaho.org, December, 2007.

33

THOMSEN, E. OLAP Solutions: Building Multidimensional Information Systems, 2nd ed., John Wiley & Sons, New York, NY, 2002. SERRA, LARCIO. A Essncia do Business Intelligence. So Paulo, Berkeley, 2002. Fonte: http://www.pentaho.com Obtido em: 19/03/2010. Fonte: http://imasters.uol.com.br/artigo/5415/bi/por_que_business_intelligence/ Quintafeira, 08 de fevereiro de 2007 s 07h35 Obtido em: 19/03/2010 Fonte: http://imasters.uol.com.br/artigo/16080/bi/bi_open_source_conhecendo_o_pentaho/ Segunda-feira, 08 de maro de 2010 s 10h00 Obtido em: 19/03/2010 Fonte: http://imasters.uol.com.br/artigo/12007/bi/ampliando_a_visao_do_bi_dentro_das_empr esas/ Tera-feira, 17 de maro de 2009 s 10h00 Obtido em: 19/03/2010 Fonte: http://imasters.uol.com.br/artigo/12470/bi/ampliando_a_visao_do_bi_dentro_das_empr esas_parte_2/ Quarta-feira, 22 de abril de 2009 s 10h00 Obtido em: 19/03/2010. Fonte: http://imasters.uol.com.br/artigo/6989/bi/o_bi_na_medida_certa/ Quarta-feira, 03 de outubro de 2007 s 09h00 Obtido em: 19/03/2010. Fonte: http://imasters.uol.com.br/artigo/6988/bi/o_bi_e_a_analise_do_ambiente/ Quinta-feira, 20 de setembro de 2007 s 09h52 Obtido em: 20/03/2010 Fonte: http://imasters.uol.com.br/artigo/6172/bi/garantindo_o_sucesso_do_bi/ Segundafeira, 14 de maio de 2007 s 09h25 Obtido em: 20/03/2010.

34

Fonte: http://imasters.uol.com.br/artigo/5354/bi/cresce_o_mercado_para_profissionais_de_bi/ Tera-feira, 30 de janeiro de 2007 s 15h35 Obtido em: 20/03/2010 Fonte: http://www.cni.org.br/links/links-at-gestaoconhecimento.htm Obtida em: 21/03/2010 Fonte:http://computerworld.uol.com.br/slide-shows/os-melhores-softwares-abertosaplicacoes-corporativas/paginador/pagina_7 Obtida em: 21/03/2010 Fonte: http://www.palpitedigital.com/pentaho-open-source-business-intelligence/ Obtida em: 21/03/2010 Fonte:http://www.4linux.com.br/eventos/2009/inteligencia-negocios-open-sourcecomo-criar-uma-solucao-bi-suite-pentaho.html 04/09/2009 11:53 Obtida em: 21/03/2010 Fonte: http://disciplinas.dcc.ufba.br/svn/MATB10/2009.2/Projeto%20Final/Equipes %20SIGDB/artigo-erbd/sbc-template.pdf?revision=217&pathrev=219 Obtida em: 22/03/2010 Fonte: http://projetos.inf.ufsc.br/arquivos_projetos/.../artigo_tcc_felipe.doc Obtido em: 22/03/2010 Fonte:http://wiki.softwarelivre.org/PentahoBrasil/WebChanges Obtido em: 22/03/2010 Fonte: http://jararaca.ufsm.br/websites/kantorski/download/art/cisti2008.pdf Obtido em: 22/03/2010 Fonte: http://www.ulbra.br/santamaria/eventos/jornada/2007/arquivos/Sis1191850962.pdf Obtido em: 22/03/2010 Fonte: http://www.usp.br/siicusp/Resumos/16Siicusp/5675.pdf Obtido em: 22/03/2010. Fonte: http://tconline.feevale.br/tc/files/0001_1946.doc Obtido em: 22/03/2010. Fonte:

35

http://www.linuxmagazine.com.br/images/uploads/pdf_aberto/LM_53_24_25_02_corp_ spago.pdf Obtido em: 22/03/2010. Fonte: http://www.cin.ufpe.br/~tg/2008-2/tmb.pdf Obtido em: 22/03/2010