Escolar Documentos
Profissional Documentos
Cultura Documentos
3, MARCH 2015
Abstract— In recent time, technology applications in different tomada de decisões de negócios melhorando assim a
fields, especially Business Intelligence (BI) have been developed competitividade das empresas [2].
rapidly and considered to be one of the most significant uses of O foco deste trabalho é a selecção e avaliação de suites
information technology. BI is a broad category of applications and Open Source BI utilizando a metodologia Open Business
technologies for gathering, storing, analyzing, and providing access
data to help enterprise users make better business decisions. Readiness Rating (OpenBRR). OpenBRR é uma metodologia
Whereas in the past the Business Intelligence market was strictly de avaliação de software open source que usa um processo de
dominated by closed source and commercial tools, the last few avaliação aberto e standard. Esta metodologia procura integrar
years were characterized by the birth of open source BI solutions. as restrições das empresas (nomeadamente para testes e
This represents a tremendous competitive advantage, however the confiabilidade), e centra-se na partilha e redução do TCO
choice of a suitable open source BI suite is a challenge. The present (Custo Total de Propriedade) do software Open Source. Com
study evaluated and compared the last versions of the five main
Open Source Business Intelligence suites: JasperSoft, Palo, este trabalho pretendemos ajudar na escolha da melhor suite
Pentaho, SpagoBI and Vanilla using OpenBRR methodology. open source de Business Intelligence, pensando numa
implementação numa empresa de média e pequena dimensão,
Keywords— Business Intelligence (BI); Open Source Business tentando demonstrar que estas soluções são viáveis neste tipo
Intelligence Suites; OpenBRR Methodology. de empresas, pois não existem custos de aquisição, embora
necessitem de algum esforço e investimento na sua
I. INTRODUÇÃO implementação.
B. Palo
Palo é como é designada a suite open source desenvolvida
desde 2007 pela empresa alemã Jedox AG [4]. Esta empresa
desenvolve ainda uma versão comercial, com o nome Jedox,
que tem normalmente um avanço no código desenvolvido
entre 12 a 15 meses, relativamente à suite Palo. A plataforma
é completamente baseada em código open source, totalmente
gratuita e distribuída sob uma licença GNU GPL (v2). A Fig.
2, mostra o interface da suite Palo.
vasto conjunto de estilos de reports pré-definidos (por • Scorecards - Torna as métricas exibidas em painéis de
exemplo, financeiros, dashbords operacionais e de análise em algo mais avançado, aplicando-as num mapa
desempenho), e deve permitir aos utilizadores o acesso e estratégico que alinha os indicadores de desempenho
interacção com os conteúdos disponibilizados em (KPIs) com objectivos estratégicos. As métricas dos
diversas plataformas incluindo Web, dispositivos “scorecards” podem ser inseridas em reports e
móveis, e ambientes comuns de portal. informações relacionadas, a fim de realizar análises mais
• Dashboards – Este subconjunto de reporting inclui a aprofundadas. Implica o uso de metodologias de gestão
capacidade de publicar formalmente, baseado em Web de desempenho.
ou para dispositivos móveis, reports com mostradores
interactivos de informação. Estes mostradores indicam o IV. COMPARAÇÃO DAS SUITES
estado das métricas de desempenho comparadas com um Após o estudo das suites open source BI que identificámos
objectivo. São ainda usados para disseminar dados em
como tendo capacidades nas três categorias de funcionalidades
tempo real de aplicações operacionais ou em conjunção
estudadas, foi efectuada uma comparação relativamente às
com eventos de processamento complexos.
funcionalidades descritas na secção anterior. A Tabela I
• Pesquisas ad-hoc – Esta capacidade permite que os
apresenta a comparação das suites tendo em conta as
utilizadores façam as suas perguntas de dados, sem
solicitar a criação de um report. As ferramentas devem capacidades suportadas.
TABELA I. COMPARAÇÃO DAS SUITES OPEN SOURCE BI.
possuir uma camada semântica para permitir que os SUITES
utilizadores naveguem pelas origens de dados.
• Integração com Office – Em muitos casos as plataformas
JASPERSOFT
PENTAHO
SPAGOBI
VANILLA
FUNCIONALIDADES
PALO
de BI são usadas como uma camada intermédia para gerir,
proteger e executar tarefas de BI, sendo o Office
(particularmente o Excel) a agir como cliente de BI.
Nestes casos, é vital que as ferramentas permitam ETL
integração com as aplicações do Office, incluindo suporte COLABORAÇÃO
para formatos de documentos e apresentações, fórmulas, REPORTING
refrescamento de dados e tabelas dinâmicas. As DASHBOARDS
características “cell locking” e “write-back” serão
PESQUISAS AD-HOC
benefícios adicionais e tidas como integração avançada.
INTEGRAÇÃO COM OFFICE
• BI Móvel – Esta capacidade permite que as organizações
apresentem reports e dashboards nas plataformas móveis, BI MÓVEL
numa publicação e/ou modo interactivo, aproveitando o OLAP
modo de interacção dos dispositivos e outras capacidades VISUALIZAÇÃO INTERACTIVA
não disponíveis normalmente nos monitores. DATA MINING
C. Análise SCORECARDS
• OLAP – Permite que os utilizadores finais analisem
dados com pesquisas bastante rápidas, com um bom Desta análise, podemos destacar como a melhor ferramenta
desempenho, navegando facilmente em pesquisas do estudo a SpagoBI, que suporta todas as capacidades por
multidimensionais. Nalguns casos permite o write-back nós seleccionadas, sendo que das suites estudadas, é, a par
de valores para bases de dados proprietárias para com a Vanilla, a que possui uma única versão, totalmente
planeamento e modelação. Pode abranger uma variedade open source e gratuita. A SpagoBI disponibiliza ainda outras
de arquitectura de dados (relacional, multidimensional) e capacidades além das avaliadas neste estudo, como por
de armazenamento (disco ou memória). exemplo Localização Inteligente (GEO-GIS) ou Master Data
• Visualização interactiva – Oferece ao utilizador a Management (para usufruto das capacidades write-back na
possibilidade de visualizar numerosas vistas dos dados base de dados) e rivaliza mesmo com a maior parte das
mais eficientemente, usando imagens e gráficos, em vez versões comerciais das outras suites em estudo.
de linhas e colunas. Ao longo do tempo, a visualização A Pentaho surge como a segunda ferramenta na nossa
avançada permitirá fatiar os dados para os incluir mais análise, visto que suportando basicamente as mesmas
nos processos orientados a projectos de BI, permitindo
capacidades da SpagoBI, possui uma versão comercial, o que
que todos os intervenientes compreendam melhor o fluxo
consideramos uma desvantagem. É no entanto, das estudadas,
de trabalho através da representação visual.
a suite eventualmente mais usada, como referido em [9].
• Modelo preditivo e data mining – Permite explorar
Oferece, junto com a SpagoBI uma solução completa que
grandes quantidades de dados à procura de padrões
consistentes, como regras de associação ou sequências permite atingir os objectivos duma implementação BI numa
temporais, para detectar relacionamentos entre variáveis, empresa, em busca dum maior conhecimento do negócio e
detectando assim novos subconjuntos de dados, usando duma vantagem competitiva. Contudo do estudo efectuado,
técnicas matemáticas avançadas. Os programadores de concluimos que a suite não permite que os utilizadores
projectos BI podem integrar os modelos facilmente em partilhem e discutam a informação disponibilizada, com chat e
reports, painéis de análise e processos de negócio.
814 IEEE LATIN AMERICA TRANSACTIONS, VOL. 13, NO. 3, MARCH 2015
notas, e que a possam integrar noutras ferramentas critérios. Assim, este estudo levou-nos a optar pela adoção da
colaborativas. metodologia OpenBRR para avaliar as suites open source BI.
A suite Vanilla não suporta uma integração com Office
A. OpenBRR
(Microsoft, OpenOffice, LibreOffice ou outros) o que se
traduz numa enorme desvantagem para esta suite. Embora seja A metodologia OpenBRR baseia-se em 12 categorias que
das suites menos conhecidas, contudo rivaliza tanto com a estão descritas na Tabela II.
SpagoBI como com a Pentaho nas restantes funcionalidades. É
TABELA II. CATEGORIAS DA METODOLOGIA OPENBRR.
juntamente com SpagoBI e Pentaho uma boa solução para
implementação de BI nas empresas. CATEGORIA DESCRIÇÃO
Já a Palo e a JasperSoft, podemos considerar que estão num FUNCIONALIDADE O SOFTWARE ATENDE ÀS EXIGÊNCIAS DO
nível inferior às suites já referidas. O facto de não suportarem UTILIZADOR MÉDIO?
data mining nem scorecards deixa-as em grande desvantagem USABILIDADE O INTERFACE É AGRADÁVEL? É DE FÁCIL
UTILIZAÇÃO PARA O UTILIZADOR FINAL? É FÁCIL
relativamente à concorrência. Neste caso negligenciam nas DE INSTALAR, CONFIGURAR, IMPLEMENTAR E
versões open source capacidades fundamentais nas MANTER?
implementações de BI, apostando essencialmente nas versões QUALIDADE QUAL A QUALIDADE DO DESENHO DE SOFTWARE,
CÓDIGO E TESTES? QUÃO COMPLETA E LIVRE DE
comerciais, nas quais disponibilizam outro tipo de
ERROS É?
capacidades. O facto da Palo não disponibilizar uma versão SEGURANÇA COMO LIDA O SOFTWARE COM QUESTÕES DE
desde Julho de 2011 coloca-a, no nosso entender, para a SEGURANÇA? É SEGURO?
última posição deste estudo, pois não disponibiliza soluções DESEMPENHO COMO É O DESEMPENHO DO SOFTWARE?
de mobilidade, tão usadas actualmente, e que são uma ESCALABILIDADE COMO RESPONDE NUM AMBIENTE DE GRANDE
ESCALA?
tendência do mercado a par com a análise de Big Data (não ARQUITETURA COMO É A ARQUITETURA DO SOFTWARE? É
levada em consideração neste trabalho). A JasperSoft peca MODULAR, PORTÁVEL, FLEXÍVEL, EXTENSÍVEL,
essencialmente pela discrepância de oferta da versão open ABERTO E FÁCIL DE INTEGRAR?
source relativamente às suas versões comerciais, que são três, APOIO COMO É A COMPONENTE DE APOIO DO
SOFTWARE?
apostando visivelmente mais nessa vertente. No entanto, DOCUMENTAÇÃO QUAL A QUALIDADE DA DOCUMENTAÇÃO DO
relativamente às capacidades disponibilizadas na versão SOFTWARE?
Community, estas são robustas e competitivas com as ADOÇÃO COMO É A ADOÇÃO DO SOFTWARE PELA
COMUNIDADE, MERCADO E INDÚSTRIA?
restantes.
COMUNIDADE A COMUNIDADE DE SUPORTE DO SOFTWARE ESTÁ
ACTIVA E ANIMADA?
V. AVALIAÇÃO EXPERIMENTAL PROFISSIONALISMO QUAL O NÍVEL DE PROFISSIONALISMO DO
PROCESSO DE DESENVOLVIMENTO E DA
Após realizar a análise das ferramentas baseado na ORGANIZAÇÃO DO PROJECTO COMO UM TODO?
informação disponibilizada por relatórios e no site de cada
fornecedor, nesta secção irá ser feita a avaliação experimental
das duas ferramentas que mais se destacaram nesse estudo: a Neste modelo, a classificação das categorias pode ter
SpagoBI e a Pentaho. diferentes níveis de importância dependendo dos requisitos
A avaliação será efetuada segundo duas perspetivas, a da para utilização do software. A implementação do método
avaliação do software open source de acordo com uma divide-se em quatro fases.
metodologia standard e a outra das funcionalidades do BI, que 1. Numa primeira fase deste método, deve-se identificar a
são as já referidas na secção anterior e baseadas nos critérios lista de componentes do software a ser analisada,
da Gartner. medir cada componente em relação aos critérios de
Com vista a garantir a qualidade, surgiram diversas avaliação, removendo da análise qualquer componente
metodologias de avaliação de software open source nos do software que não satisfaça os requisitos de uso.
últimos anos, que devem ser levadas em consideração antes de 2. Na segunda fase, deve-se atribuir ponderações às
se tomar a decisão de adopção de um destes tipos de software categorias e às métricas do seguinte modo:
por parte das organizações. As duas metodologias que se • Classificar as 12 categorias de acordo com a
destacam são a Qualification and Selection Open Source [10] importância (1 – a mais alta, 12 – a menor).
apoiado pela Atos Origin [11] e a Business Readiness Rating • Seleccionar as 7 categorias mais altas (ou menos), e
[12] criada pelo Carnegie Mellon Silicon Valley Center for atribuir uma percentagem de importância para
Open Source Investigation [13] e Intel [14]. Ambas as cada uma, totalizando 100%.
metodologias de avaliação ajudam os utilizadores a alcançar • Para cada métrica dentro de uma categoria,
um objectivo semelhante, que é seleccionar entre uma lista de classificar a métrica de acordo com a importância.
projectos open source semelhantes qual o mais adequado ao
• Para cada métrica dentro de uma categoria, atribuir
seu contexto.
a importância percentual, totalizando todas as
Deprez [15] descreve as vantagens e desvantagens de cada
métricas 100% da categoria.
uma das metodologias, sendo referido que a OpenBRR
3. Na terceira fase, deve-se recolher a informação para
permite seleccionar os critérios para os adaptar a um contexto,
cada métrica utilizada em cada categoria, e atribuir
e que a QSOS é ambígua em mais de metade dos seus
MARINHEIRO AND BERNARDINO : EXPERIMENTAL EVALUATION OF OPEN 815
uma ponderação, num nível de 1 (inaceitável) a 5 candidatos para métricas para medir a prontidão de negócio
(excelente). em cada categoria. Para algumas métricas a informação é
4. Por fim, na quarta fase, deve-se utilizar a qualificação difícil de recolher, ou está simplesmente indisponível.
da categoria e os factores de ponderação para calcular
B. Avaliação
a pontuação final.
A Fig. 6, abaixo, mostra de uma forma simplificada o A metodologia OpenBRR, estabelece que se devem
esquema de funcionamento do modelo. escolher, no máximo, as 7 categorias mais relevantes para a
análise, de forma a evitar que as mais importantes tenham a
sua importância diluída pelas menos relevantes. Após esta
escolha, deve então atribuir-se-lhes o peso para a avaliação
final.
A Tabela III mostra a escolha feita para esta avaliação,
tendo em apreciação os interesses da implementação.
CATEGORIA PESO
FUNCIONALIDADE 40%
USABILIDADE 15%
QUALIDADE 15%
DOCUMENTAÇÃO 10%
Figura 6. Esquema de funcionamento do modelo OpenBRR. COMUNIDADE 10%
SEGURANÇA 5%
A própria metodologia disponibiliza uma tabela com as ARQUITECTURA 5%
métricas para cada uma das categorias, e com os critérios para
a sua classificação [16]. A justificação para esta escolha é que as características
A categoria “Funcionalidade” é avaliada de forma diferente desempenho, escalabilidade, apoio, adopção e
das outras, e segue um método próprio. Nesta categoria profissionalismo são pouco relevantes relativamente às
pretende-se analisar e avaliar as características que as escolhidas tendo em vista o tipo de implementação idealizado,
ferramentas têm ou deveriam ter (aquilo que se considere ser a dimensão da empresa, a dimensão do seu departamento
expectável), mais extras. No caso das suites open source BI o informático, e a dimensão das próprias ferramentas em
ETL, colaboração, reporting, etc. O método para avaliação análise.
desta categoria é o seguinte: Sendo uma implementação prática numa empresa
1. Definir os recursos (características) a analisar, industrial, com o propósito de lhe trazer uma clara vantagem
atribuindo-lhes uma importância de 1 a 3 (menos competitiva, a categoria funcionalidade foi aquela que teve um
importante a muito importante, respetivamente); peso maior na distribuição. A usabilidade e a qualidade têm a
2. Classificá-las numa soma cumulativa (de 1 a 3), ordem de importâncias seguintes pois tratam-se daquelas que
podendo atribuir-se nota negativa (retirar pontos à vão causar impacto no utilizador final. A documentação e a
soma cumulativa) se não cumprirem uma comunidade seguem-se pelo facto de serem importantes para o
característica; departamento de TI da empresa poder realizar a manutenção,
3. Fazer o mesmo para recursos extra; continuidade e evolução após a implementação. Sendo
4. Dividir a soma cumulativa (incluindo extras) pela importantes, mas devido às métricas sugeridas pelo método
pontuação máxima possível de obter pelas para a sua avaliação, a segurança e a arquitectura foram
características base (sem extras). Isto intensionalmente consideradas mas coube-lhes o menor peso na análise.
pode dar inferior ou igual a 0 ou superior a 100, A categoria desempenho não foi considerada pelo facto de
valorizando os extras, e desvalorizando (punindo) as não haver benchmarks publicados sobre estas ferramentas, e
características básicas não contempladas; por estas não disponibilizarem praticamente nenhuma
5. Normalizar o resultado anterior para uma escala de 1 a informação sobre a melhor forma de o optimizar. Sendo o
5 para a categoria Funcionalidade, de acordo com a software em análise suites que têm muitas implementações e
seguinte escala: estão em constante evolução, a escalabilidade também não foi
• Menos de 65%, nota = 1 (inaceitável) considerada. Como o apoio se refere em parte a apoio
• 65% - 80%, nota = 2 (fraco) profissional, e pelo facto de já ser prática comum o uso de
• 80% - 90%, nota = 3 (aceitável) software open source, com interacção com comunidades de
• 90% - 96%, nota = 4 (bom) programadores, e ainda por ter sido considerada para análise a
• Superior a 96%, nota = 5 (excelente) categoria comunidade, esta categoria também foi considerada
Esta escala final enquadra-se então nas mesmas medições como sendo das menos relevantes. A adopção também foi
do resto das características. considerada pouco relevante, pois ambas as suites têm forte
Estas métricas são um conjunto representativo do modelo implementação no mercado, como já referido. Por fim, e como
Open BRR, entendendo-se que poderá haver melhores estas suites têm comunidades bastante relevantes, e pelo facto
816 IEEE LATIN AMERICA TRANSACTIONS, VOL. 13, NO. 3, MARCH 2015
de serem ambas suportadas num estilo corporativo, com VI. CONCLUSÕES E TRABALHO FUTURO
grandes empresas a suportá-las, também o profissionalismo foi Neste estudo efetuámos a análise das últimas versões das
uma categoria considerada das menos relevantes. principais suites open source BI existentes no mercado. Estas
Para avaliar a categoria da funcionalidade, foram suites tinham que satisfazer um conjunto de capacidades que
consideradas todas as capacidades já utilizadas para a escolha definimos como fundamentais para uma implementação BI
das duas ferramentas. Para cada uma foi atribuída um peso na numa empresa e também sem que os custos aumentassem. O
escala de 1 (pouco importante) a 3 (muito importante), de estudo foi realizado tendo por base a informação
acordo com a sua relevância, como mostra a Tabela IV. disponibilizada pelas próprias suites nos seus sites e em
documentação técnica sobre as mesmas.
TABELA IV. PESO DAS CAPACIDADES DA CATEGORIA FUNCIONALIDADES.
Como avaliação experimental seguimos a metodologia
CAPACIDADES PESO
ETL 3 OpenBRR. A aplicação deste método mostrou-se útil nesta
COLABORAÇÃO 2 avaliação, pois oferece um critério de avaliação objectivo,
REPORTING 3 reproduzível e auditável, atribuindo um valor numérico que
DASHBOARDS 3 permite uma comparação com outras avaliações de outros
PESQUISAS AD-HOC 2
INTEGRAÇÃO COM OFFICE 2 produtos.
BI MÓVEL 2 Desta avaliação a SpagoBI obteve a melhor classificação,
OLAP 3 com Muito Bom, na escala do método, sendo por isso a que
VISUALIZAÇÃO INTERACTIVA 1 mais se adequa à futura implementação.
DATA MINING 1
SCORECARDS 2 Como trabalho futuro, é premente continuar a acompanhar
a evolução das suites open source BI. A portabilidade e o
Pela importância para a empresa, na utilização final, foi acesso à informação através de tablets e smartphones, o
atribuído o maior peso (3) ao ETL, Reporting, Dashboards e tratamento de enormes quantidades de dados, e a
OLAP, importância intermédia (2) à Colaboração, Pesquisas disponibilização da informação em tempo real são paradigmas
ad-hoc, Integração com Office, BI Móvel e Scorecards, e e apostas que estão a surgir nas suites comerciais, e que seria
menor importância (1) à Visualização interactiva e ao Data importante analisar no mundo do open source. No mesmo
Mining. sentido, a Cloud BI é uma solução que começa a ser adoptada
Seguindo a metodologia na avaliação de cada uma das e que desperta todo o interesse por parte das empresas,
categorias definidas, e ponderando as notas de cada categoria, nomeadamente quanto ao custo de armazenamento e
obtivemos o resultado apresentado na Tabela V. disponibilidade da informação, e que é premente acompanhar
e evoluir.
TABELA V. NOTA PONDERADA DAS SUITES EM AVALIAÇÃO.
REFERÊNCIAS
CAPACIDADES PESO NOTA PONDERADA
[1] Global Alliance of SMEs, (2010). Global SME Expo 2010,
PENTAHO SPAGOBI
http://www.globalsmes.org/html/index.php?func=expo2010&lan=en.
FUNCIONALIDADE 40% 1.2 2 [2] S. Negash, P. Gray, “Business Intelligence”, , Ninth Americas
USABILIDADE 15% 0.75 0.75 Conference on Information System, Tampa, Florida, USA, 2003.
QUALIDADE 15% 0.285 0.51 [3] Jaspersoft, http://community.jaspersoft.com/ [acedido em Abril, 2014].
DOCUMENTAÇÃO 10% 0.5 0.5 [4] Palo, http://www.palo.net/ [acedido em Abril, 2014].
COMUNIDADE 10% 0.38 0.38 [5] Pentaho, http://www.pentaho.com/ [acedido em Abril, 2014].
SEGURANÇA 5% 0.25 0.25 [6] SpagoBI, http://www.spagoworld.org/xwiki/bin/view/SpagoBI/Vision
ARQUITECTURA 5% 0.25 0.15 [acedido em Abril, 2014].
3.615 4.54 [7] Vanilla, http://www.bpm-conseil.com/ [acedido em Abril, 2014].
[8] Engineering,
http://www.spagoworld.org/xwiki/bin/view/SpagoWorld/Company
Aplicando a metodologia OpenBRR, com a escolha das [acedido em Abril, 2014].
categorias mais relevantes tendo em apreciação a [9] K. Schlegel, R. L. Sallam, D. Yuen, J. Tapadinhas, “Magic Quadrant for
implementação real e as necessidades da empresa, e Business Intelligence and Analytics Platforms”, Gartner, February
2013.
distribuídos os pesos tendo em consideração o mesmo [10] QSOS, http://www.qsos.org/?page_id=3 [acedido em Abril, 2014].
interesse, a SpagoBI atinge a nota mais alta entre as duas [11] Atos, http://atos.net/en-us/home.html [acedido em Abril, 2014].
suites. [12] OpenBRR, http://www.openbrr.org/ [acedido em Abril, 2014].
[13] CMU, http://www.cmu.edu/silicon-valley/ [acedido em Abril, 2014].
No critério do método OpenBRR, a nota de 4.54 é “Muito [14] Intel, http://www.intel.com [acedido em Abril, 2014].
Bom”, o que oferece toda a confiança para ser esta a suite [15] J. Deprez, S. Alexandre, "Comparing Assessment Methodologies for
escolhida para prosseguir o trabalho. Free/Open Source Software: OpenBRR & QSOS", CETIC, Charleroi,
Belgium, 2008
A aplicação deste método mostrou-se útil nesta avaliação, [16] OpenBRRWhitePaper,
pois oferece um critério de avaliação objectivo, reproduzível e http://master.libresoft.es/sites/default/files/Materiales_MSWL_2010_20
auditável, atribuindo um valor numérico que permite uma 11/Project%20Evaluation/materiales/OpenBRR_Whitepaper.pdf
comparação com outras avaliações de outros produtos.
Assim, será a SpagoBI que será utilizada na implementação
em ambiente real na empresa.
MARINHEIRO AND BERNARDINO : EXPERIMENTAL EVALUATION OF OPEN 817