Escolar Documentos
Profissional Documentos
Cultura Documentos
Livre Blanc
_________
SOMMAIRE
1 OBJECTIFS DU DOCUMENT
Ce livre blanc intitulé « Restituer, Analyser et Piloter : Evaluer les opportunités Open Source » traite
au sein de la chaîne décisionnelle des aspects de reporting, analyse, pilotage et distribution de
l’information.
Nous avons souhaité y orienter la thématique plutôt que d’aborder de manière large mais superficielle
l’ensemble des aspects relevant de la BI.
Ce livre blanc ne traitera donc des autres aspects importants de la chaîne décisionnelle, à savoir les
ETL et base de données. Ceux-ci relevant plus des moyens que des usages.
Il ne traite pas non plus du Datamining pour deux raisons : c’est une étape complémentaire dans la
business intelligence qui n’interpelle pas à ce jour tous les secteurs d’activité et ce sujet mérite à lui
seul une livre blanc dédié.
Ce livre blanc abordera dans des chapitres dédiés chaque problématique (restitution, analyse,
pilotage et industrialisation) sous l’angle de la MOE (installation, conception, production et
exploitation) et sous l’angle MOA (usages).
Nous y présenterons le panel des outils disponibles au moment de la rédaction. Outils que nous
avons eu l’occasion d’intégrer pour le compte de nos clients ou pour lesquels nous avons complété
notre savoir faire en procédant à des bench sur nos plates formes, avec des environnements de
données significatifs.
C’est pourquoi tous les outils disponibles ne sont pas décrits, certains d’entre eux ne nous semblant
pas capables d’assurer à court ou moyen terme, les besoins qu’ils sont censés adresser. Certains ne
nous étant pas encore suffisamment familier non plus !
Nous présentons en toute objectivité, l’ensemble de notre analyse sur les outils BI Open Source dans
les quelques pages qui suivent.
Bonne lecture !
Ce document est sous licence GNU Free Documentation Licence. Page 1/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Notre mission est de proposer aux entreprises une alternative logicielle forte en proposant l’intégration
de composants open source dans leur SI, des couches infrastructure (OS, messagerie, LDAP)
jusqu’au couches métiers (BI, CRM, ERP, SOA, GED, ECM, portail collaboratif...).
Nous accompagnons nos clients dans leur réflexion open source, qu’elle relève d’une démarche de
maîtrise des coûts ou d’une volonté d’assurer efficacement l’interopérabilité des composants du SI.
Créé en 1991, Umanis est une société de conseil et d’ingénierie spécialisée en Business Intelligence,
Gestion de la Relation Client (CRM) et en E-Business. Umanis, un des leaders français dans ces
domaines, accompagne ses clients sur la globalité de leurs projets informatiques : conseils,
réalisation, intégration, Tierce Maintenance Applicative et formation
En 2007, le Groupe Umanis a réalisé un Chiffre d’Affaires de 60 millions d’Euros et compte parmi ses
400 clients actifs des grands comptes internationaux, nationaux et régionaux. Avec près de 1000
collaborateurs, Umanis est implanté à Aix en Provence, Lille, Lyon, Metz, Nantes, Paris, Pau,
Toulouse, Tours. Reconnu pour son expertise technologique et fonctionnelle, le Groupe Umanis est
partenaire des plus grands éditeurs de logiciels du marché.
www.openbizz.fr
www.groupeumanis.com
Ce document est sous licence GNU Free Documentation Licence. Page 2/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
3 INTRODUCTION
3.1 RAPPEL DES PRINCIPALES BRIQUES FONCTIONNELLES DU SI DECISIONNEL
Le thème « Consommer, Analyser et Piloter » est en correspondance avec les pratiques actuelles de
la business intelligence. Ces trois notions correspondent à des usages qui se veulent différent de par
la nature des acteurs et de leur responsabilité dans le dispositif d’entreprise.
Quand on examine les services décisionnels impliqués dans les entreprises, ceux-ci sont déterminés
sous cette triple approche :
3.1.1 Restitution
De plus en plus intégrée dans les dispositifs métiers opérationnels, la consommation d’information
« business intelligence » concerne un large scope d’utilisateurs au sein des entreprises. Basée
directement sur les outils de production ou en aval d’une chaîne décisionnelle (nous de traitons pas ici
des apports de la chaîne décisionnelle ni des alternatives existantes), le besoin reste le même :
Disposer d’informations chiffrées sur son activité, sur un pas temporel. Que ce soit sur des indicateurs
de type flux (volume entre deux dates) ou de type stock (volume à date).
Ces usages s’inscrivent dans un pilotage fin et industrialisé de l’activité rendu nécessaire par
l’envergure de l’activité, la tension de la concurrence ou encore la rationalisation des ressources
disponibles pour maximiser la profitabilité. En cela ils concernent une grande proportion des
personnels de l’entreprise et à tous les niveaux de la chaîne de responsabilité.
Il est commun de distinguer trois modes de restitution, matérialisés par des rapports aux nuances
suivantes :
Rapport statique : il s’agit d’un rapport dont la structure est figée tant en termes de présentation que
du périmètre des données présentées. Il présente l’avantage d’être généré en dehors du temps de
travail de l’utilisateur et d’être consommable instantanément.
Par exemple, l’acheteur logistique d’une plateforme de commerce voudra disposer de manière
hebdomadaire d’un rapport présentant l’évolution de la qualité de service de ses prestataires
logistiques (capacité à délivrer la quantité dans les délais et la qualité attendue) afin de peser sur les
négociations futures ou établir les pénalités.
Rapport dynamique : il s’agit d’un rapport ayant une structure de présentation semi statique au sein
duquel le périmètre des données peut varier. Cela en offrant à l’utilisateur final la possibilité de choisir
les valeurs de paramètres dynamiques intégrés dans le rapport. Cela présente l’avantage indéniable
de disposer d’une grande amplitude sur les rapports finaux puisque à partir d’une même structure de
rapport on pourra par exemple aussi bien générer un rapport de comparaison annuelle qu’un rapport
de comparaison trimestrielle. La notion de paramètre implique cependant d’interroger la BDD ce qui
dégrade l’instantanéité.
Par exemple, un responsable commercial régional travaillant pour une société de service en
recrutement voudra consulter un rapport d’alerte de consommation (nb d’entreprises clientes n’ayant
pas consommé depuis X mois telles offres) en sélectionnant un ou plusieurs codes d’activité INSEE et
tout ou partie des offres de service proposées par sa société.
Ce document est sous licence GNU Free Documentation Licence. Page 3/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Rapport Ad hoc : il s’agit d’un rapport librement aménagé par l’utilisateur final. Il aménage les données
qui l’intéressent dans une structure type tableau ou graphique en définissant le périmètre de
consultation de ses axes et indicateurs. Cette approche nécessite que soit mis en place une « couche
métier » (ou semantic layer) d’accès aux données. Cette couche permet de présenter à l’utilisateur
une approche fonctionnelle des données et de leur relation, affranchissant ce dernier de la complexité
des BDD et du langage SQL. Concrètement, les données sont regroupées au sein de thématiques
métiers et reliées entre elles selon cette même logique métier. L’utilisateur n’a plus qu’à sélectionner
ses données et les disposer dans son rapport. La encore, la volonté de l’utilisateur se traduit en une
sollicitation de la base de données avec une performance d’affichage variable selon la complexité de
la demande.
Par exemple, un chargé d’études au sein d’une société de services immobiliers voudra composer un
rapport mettant en scène un nouvel indice illustrant mieux la tendance du marché des bureaux en
IDF.
Pour ces trois aspects de la restitution, l’open source propose des solutions sous formes de
composants intégrés ou non. Nous vous proposons de les découvrir dans la suite du document.
3.1.2 Analyse
Au-delà de l’activité qu’il faut surveiller à tous les échelons opérationnels (pour laquelle les services de
restitution remplissent parfaitement leur rôle), il appartient à certains niveaux de management de
comprendre plus profondément les mécanismes influant sur cette activité. Il s’agit par exemple de
rechercher les causes d’une inflexion afin de mettre en place les mécanismes managériaux,
organisationnels ou décider des investissements en vue de contrôler les facteurs déterminants les
évolutions de l’activité.
Pour cela, le manager doit disposer d’une structure plus souple d’interrogation des données. Il doit
pouvoir de manière libre naviguer dans les données sans à priori initial plus que la simple découverte.
Sa navigation peut se faire de manière croisée (interroger la valeur de son indicateur de satisfaction
client réparti selon la géographie, le temps et décliné par produit par exemple) et de manière
ascendante / descendante en jouant sur le niveau de granularité des axes métiers (vision niveau
mois, Europe, famille de produit puis mois, France, famille de produit en remontant ensuite sur une
consolidation annuelle etc…)
Un des intérêts reconnus réside dans la capacité à trouver rapidement l’origine, la cause d’un
phénomène. Par exemple, l’origine d’une inflexion des ventes constatée à un niveau agrégé (monde,
annuel, gamme de produit) peut être identifiée par une navigation dans les niveaux plus fin de la
géographie, des périodes ou des produits, aboutissant à situer une partie importante du problème au
niveau d’un produit en particulier, d’un mois en particulier et enfin d’une structure commerciale en
particulier.
Cette approche est volontairement théorique et non généralisable. En effet, on trouvera certaines
catégories d’utilisateurs opérationnels qui peuvent profiter des services offerts pour effectuer leur
travail au quotidien. Ca peut être le cas pour un département marketing qui cherchera à comprendre
les résultats de sa campagne et qui pour cela trouvera un intérêt certain à manipuler des données
disponibles dans un format multidimensionnel. En fait, elle peut être considérée comme un
prolongement du reporting ad hoc.
3.1.3 Pilotage
Les cadres dirigeants ont des besoins complémentaires. La surveillance de l’activité, non plus au
niveau de son delivery opérationnel, mais dans sa capacité à remplir ses objectifs stratégiques,
amène à considérer un outillage spécifique.
Les tableaux de bords du pilote (on entendra les termes associés de KPI, Dashboard, Balanced
scorecard) sont des formats agrégés de présentation de contenu. Ils mettent en scène les indicateurs
clés et les objectifs stratégiques en les confrontant. Très visuel, le tableau de bord permet de savoir
rapidement si l’entreprise est en avance ou en retard sur son plan stratégique.
Les premiers composants OpenSource diffusés n’avaient pour objectif que de rendre un service. Sont
donc souvent absents de l’approche les notions d’authentification, de définition du périmètre suivant
l’utilisateur.
Ces solutions permettront la production du reporting statique, l’analyse au moyen de cubes OLAP.
Optimisés pour le service à rendre, ces composants stables et pérennes sont les briques essentielles
des suites.
Les suites vont plus loin, permettant l’agrégation de composants dans un portail dans un premier
temps, puis intégrant la gestion de liens entre eux.
Le portail permettra une gestion centralisée des accès, avec définition du périmètre utilisateur selon
son profil.
Les mécanismes de workflow des portails dédiés vont permettre le reporting de masse.
Les suites offrent en plus les composants dédiés aux utilisateurs non techniques, leur permettant de
définir et de produire le reporting ad-hoc.
Certaines suite sont complétées par des outils techniques, permettant à la MOE la conception des
rapports ou des axes d’analyse des cubes, et facilitant ensuite le déploiement automatisé des fichiers
de configuration directement dans la plateforme mise à disposition des utilisateurs finaux.
Ce document est sous licence GNU Free Documentation Licence. Page 5/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Dans ce document, nous préciserons pour chacun des outils étudiés, les besoins couverts, mais aussi
les contraintes afférentes, en termes de pré requis techniques à la mise en œuvre, les compétences
techniques nécessaires, la conduite de changement possiblement induite.
Nous préciserons la licence, les différences entre celles-ci impliquant parfois des contraintes légales à
respecter.
Selon nos contacts avec les « éditeurs » ou « mainteneurs » des solutions, nous avons indiqué les
développements futurs ou « roadmap » connues.
Un tableau, tel qu’en exemple ci-dessous, reprend une synthèse des éléments abordés et introduit
quelques commentaires et notre retour d’expérience sur la mise en œuvre de la solution.
Nom de l’outil
Description succincte
DESCRIPTION
Notes Commentaires
Nous conclurons chaque chapitre par une synthèse des outils et leurs indications métier.
Le tableau suivant présente une brève description des distinctions principales entre les différentes
licences open source évoquées dans ce document. Nous n’avons pas souhaité aborder plus
profondément le sujet, de multiples littératures sur le sujet étant déjà disponibles sur le web.
Ce document est sous licence GNU Free Documentation Licence. Page 6/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
GPL General Public License : Code ouvert, usage libre, modification et évolution du code possible,
distribution libre avec pour seule contrainte de propager le type de licence. (notion de copyleft). GPL
est restrictif quant à l’assemblage de codes logiciels. Seuls les codes logiciels compatibles GNU GPL
peuvent être assemblés.
CPL Common Public License : La différence essentielle avec la GPL est la liberté offerte aux personnes
ayant apporté des évolutions majeure au produit d’attribuer la licence de leur choix sur ces évolutions.
Cette licence a été mise en place pour la plateforme Eclipse, permettant ainsi à IBM d’en
commercialiser une version propriétaire.
EPL Eclipse Public License : La différence essentielle avec la GPL est la liberté offerte aux personnes ayant
apporté des évolutions majeure au produit d’attribuer la licence de leur choix sur ces évolutions.
Elle est dérivée de la CPL (Common Public License) originelle qui comportait certaines mentions
favorables à IBM.
MPL Mozilla Public License : Grandes similitudes avec la licence GPL. Elle est cependant un peu moins
restrictive quant à sa compatibilité avec d’autres licences (dans les cas de mixité de programme). La
notion de copyleft demeure mais seulement sur la partie MPL de l’assemblage
LGPL Lesser General Public License Grandes similitudes avec la licence GPL. Elle est cependant un peu
moins restrictive quant à sa compatibilité avec d’autres licences (dans les cas de mixité de
programme). La notion de copyleft demeure mais seulement sur la partie LGPL de l’assemblage
NB : rappelons qu’en droit français, seules les licences rédigées en français sont reconnues valides
par le législateur. Or il n’existe pas de traduction « officielle » de la GNU GPL.
Mais, un jugement du 28 mars 2007 (TGI Paris, 3ème chambre, 1ère section, 28 mars 2007,
Educaffix c/ CNRS, Université Joseph Fourier et autres) expose un premier cas de jurisprudence
relative à une licence GNU GPL v2. On lira avec intérêt l’analyse faite de ce jugement par le cabinet
CAPRIOLI à l’URL :
http://www.caprioli-avocats.com/pages/publications/edocs/management-juridique-de-l-
innovation/edocs-management-juridique-de-l-innovation-premiere-jurisprudence-francaise-relative-a-
une-licence-GNU-GPL.htm
En Allemagne, la loi allemande a validée en 2004 les principales clauses de la GNU GPL
Pour l’Europe, notons que s’est tenue la conférence « EOLE » (European Opensource Lawyers
Event) le 24 septembre 2008, organisée dans le cadre de la manifestation « Paris, Capitale du libre »
Ce document est sous licence GNU Free Documentation Licence. Page 7/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Il est cependant commun de synthétiser sous ce seul terme les usages représentés par la
consommation d’informations statiques, pré paramétrées ou encore ad hoc.
Pour rendre disponibles des rapports statiques ou dynamiques auprès des utilisateurs, il faut des
outils offrant des fonctions de conception et de production de rapports.
Pour cet usage, l’open source propose deux composants majeurs que sont Birt et Ireport couplé avec
JasperReport.
Les plateformes BI que nous détaillons au sein du § 7 sur l’industrialisation des Systèmes
d’Information Décisionnelle mettent généralement en œuvre IReport ou BIRT. La plateforme Pentaho
intègre en plus une solution dédiée, alternative à Birt et JasperReport.
Les critères permettant d’évaluer des services BI sont nombreux et peuvent être déclinés sur un
niveau de précision tel qu’il ne contribuerait pas à leur lisibilité dans le cadre de ce livre blanc. Nous
nous satisferons d’un niveau de présentation agrégé de ces critères afin de positionner chacune des
offres de manière claire.
Pour les rapports statiques ou dynamiques, les fonctions importantes sont listées dans le tableau
suivant
Capacité à intégrer des fonctions de Les données brutes ainsi que des données valorisées (issues de calculs sur
traitement des données (arithmétiques, les données brutes) peuvent être stockées en BDD. Ceci implique une
statistiques, date, texte, numériques …) anticipation par les utilisateurs finaux sur les données à restituer, ainsi
qu’une intervention de la MOE.
Pour d’autres types d’indicateurs (indicateurs non linéaires) ou pour
répondre à un besoin immédiat, les outils de restitutions doivent intégrer des
fonctions de traitement de données.
Mise en forme (rupture, groupement, saut de Pour rendre l’information visible, s’assurer qu’elle sera perçue à sa juste
page, tri, mise en forme conditionnelle, entête valeur, celle-ci doit être lisible. De même pour être partagée, communiquée
et pied de page) vers des tiers, le rendu doit être structuré. Il est donc important de considérer
les capacités de mise en forme des outils. Aérer l’information, mettre en
évidence les groupements, professionnaliser l’aspect sont autant de points
importants
Vision de l’information (Liste, Tableau croisé, La représentation de l’information impacte considérablement la rapidité
Graphes à barre, radar, histogramme …) d’appréhension et de digestion d’une information. Selon ce que sont censées
illustrer les données, ou encore le nombre d’entrées qu’elles présentent, le
Ce document est sous licence GNU Free Documentation Licence. Page 8/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Mise à disposition (formats d’exports, mail, La disparité des environnements accessibles aux utilisateurs nécessite de
portail web, envoi en masse, planification…) – prévoir une distribution selon plusieurs formats ou moyens
Sécurité (droits sur les rapports, droits sur les Le caractère confidentiel des données pour des raisons de management, de
données avec filtre data en fonction de concurrence ou autre nécessite d’apporter des moyens pour restreindre les
l’utilisateur permettant de distribuer un même informations offertes selon les prérogatives du consommateur
rapport avec des périmètres données
différents…)
Paramétrabilité (invites utilisateurs - saisie Coupler un rapport statique avec des paramètres permet de le rendre
libre/ référentiel, invite en cascade,..) – dynamique. L’utilisateur n’est pas contraint à consulter un périmètre figé
mais peut jouer sur les paramètres pour afficher un périmètre différent (en
terme de période, produit, zones de marché etc…)
Fonctions avancées (filtre récapitulatif, Sans être primordiales, un certain nombre de fonctions avancées peuvent
indicateurs en ligne, accès multisource, audit rendre de grands services aux MOE ou MOA
d’utilisation…)
Capitalisation (enregistrement de requêtes, de Utile pour augmenter la productivité des ressources et ainsi favoriser les
modèles, de vues réutilisables…) – personnels (MOE ou MOA) à consacrer leur temps à des tâches à plus forte
valeur ajoutée
• La conception du rapport (format, logo, présentation des données, extraction des données,…) qui
implique une connaissance technique du format de stockage des informations.
• La production du rapport qui sera généré à la demande (avec éventuellement une précision
apportée au périmètre ou au format de sortie) ou bien automatisée (le périmètre est définitivement
déterminé, ainsi que les destinataires et le format de sortie)
Conception du rapport
Dans le reporting statique, cette tâche de conception est assignée à une équipe technique qui va
mettre en place la connexion à la base, élaborer les requêtes SQL, concevoir graphiquement le
canevas du rapport.
Cette première étape va être réalisée au moyen d’un outil graphique déployé sur le poste client, au
moyen d’une interface graphique Java.
Les outils présentés produisent un fichier au format « xml » contenant les éléments nécessaires à
l’extraction des données, leur transformation éventuelle avant le positionnement dans le document à
produire.
Production du rapport
La production du rapport final met en œuvre des librairies Java qui vont parcourir le fichier au format
« xml » produit par l’outil d’élaboration. A la rencontre d’un champ à remplir, l’outil de production
exécute la requête SQL associée, puis l’alimente avec les données extraites.
Il est possible de planifier l’exécution de ce rapport, ou bien de l’intégrer à un portail BI, permettant à
l’utilisateur de définir des paramètres.
Ce document est sous licence GNU Free Documentation Licence. Page 9/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La conception du rapport se fera au moyen de l’outil iReport, une interface dédiée à la conception de
rapports JasperReport.
La restitution, se fera depuis JasperReport, sous forme de librairies intégrées dans un portail BI. Cette
intégration permet la définition d’accès aux bases de données dans le portail et donne la capacité à
l’utilisateur final de compléter la définition du périmètre des données du rapport à produire.
iReport permet la composition du rapport. Les éléments graphiques, les zones de données, sont
définis simplement par « glisser-déposer ». L’utilisateur indique les paramètres de connexion à la
base de données pour valider les données et le rendu final du rapport.
L’interface est simple et intuitive. Elle intègre un « query designer » qui permet de construire
graphiquement une requête. Les clés sont automatiquement reconnues et les jointures s’opèrent sous
forme de lien automatique.
Lorsque que la requête est constituée, les champs remontés peuvent être placés dans les zones de
restitution avec la souris.
On choisit les paramètres de mise en page, puis on lance la compilation. Dans un premier temps,
celle-ci produit un fichier « .java » à partir du descripteur « .jrxml ». Ensuite, ce « programme » est
exécuté en utilisant les librairies JasperReport et les paramètres d’accès aux bases de données.
L’exécution de ce programme génère le rapport final.
Il est possible d’ajouter du code Java dans le document pour produire la conversion de type de
données ou pour ajouter des opérateurs sur des champs remontés. Cette capacité permet
l’optimisation de la mise en forme ou l’ajout de champs calculés.
Un plugin permet un interfaçage direct avec JasperServer, la plateforme BI de JasperSoft dont iReport
et JasperReport sont deux outils. Grâce à ce plugin, le déploiement du format du rapport validé est
immédiat depuis iReport.
Un autre plugin permet de consulter les rapports installés dans la plateforme BI SpagoBI. Il en permet
la modification, à partir du moment où le fichier « .jrxml » a été déployé précédemment dans la
plateforme.
iReport ne peut gérer qu’une seule source de données SQL pour toutes les requêtes du rapport.
Une deuxième requête peut être utilisée pour produire le graphe, indépendamment de la première
utilisée pour la restitution de données sous forme de tableau.
Ce document est sous licence GNU Free Documentation Licence. Page 10/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
L’interface iReport est un client « lourd » sous Java. Aucune compétence technique complexe n’est
requise pour cette installation, il faudra juste veiller à disposer d’une Java Virtual Machine installée sur
le poste de développement.
Les connexions aux bases de données se feront au moyen de drivers JDBC (pendant Java des
connecteurs ODBC sur les plates formes Microsoft), qui devront être installés dans le répertoire des
librairies de l’outil.
Pour aller plus loin dans la conception de rapports, des compétences en langage Java pourront être
utiles, afin de développer des méthodes de remplissage de champs ou de transtypage de données.
Ce document est sous licence GNU Free Documentation Licence. Page 11/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Item CONCEPTION
iReport v3.0.0
Permet la conception graphique d’un rapport. Produit un fichier de définition au format « jrxml »
- MOE : Permet la
conception de reporting
- Client « lourd » supposant une JVM
généré par les librairies
- Paramètres de connexion à la base de données
JasperReport
- Langage SQL (pour la conception de requêtes)
Public - Utilisateurs : Il est Pré-requis
- Langage Java (pour affiner la conception)
possible de l’utiliser
- Langage XML (pour comprendre le fichier « jrxml »
comme outil de production
produit)
de rapports.
DESCRIPTION
- Interface graphique sous Java, indépendante de la plate forme. Elle permet de produire un rapport et/ou un fichier de
description au format « jrxml », utilisable dans une plate forme.
o Interface intuitive
o Mode visualisation permettant de pré visualiser le rapport final
- Conception en mode « drag & drop »
o Les outils et les champs de formats différents se glissent et se dépose sur la page de conception
La définition de la connexion à la base de données est extérieure au fichier de conception produit.
Licence LGPL
Documentation et exemples accessibles depuis le site de JasperForge
Licence
Librement téléchargeable sans coût de licence
Supports et formations payants (proposés par les SSLL)
Notes Les paramètres de connexion à la base de données sont extérieurs à la définition du rapport.
Ce document est sous licence GNU Free Documentation Licence. Page 12/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
JasperReport se présente sous forme de librairies Java, accessible depuis une application ou un
projet J2EE.
Le fonctionnement est « transparent » pour l’utilisateur final, l’interface intègre les librairies
d’exécution.
Elles présupposent l’usage d’une interface (outil Java, portail ou plateforme BI) qui va permettre la
définition des paramètres de connexion aux données et le mode de production du rapport.
Item PRODUCTION
JasperReport v3.0.0
Librairie de production du rapport défini au moyen de « iReport » (cf. ci-dessus)
- JVM
- Utilisateurs : Génère le
- Paramètres de connexion à la base de données
rapport à partir du fichier
- Langage SQL (pour la conception de requêtes)
Public de conception « jrxml » Pré-requis
- Langage Java (pour affiner la conception)
transmis en paramètre
- Langage XML (pour comprendre le fichier « jrxml »
utilisé)
DESCRIPTION
- La librairie JasperReport permet de produire les fichiers de reporting conçu depuis iReport.
o Intégrée dans un portail ou une plateforme BI :
celui-ci fournit les paramètres de connexion à la base de données
il est possible de planifier l’exécution de la production
il est possible de permettre à l’utilisateur d’affiner le périmètre sur lequel construire le rapport
- Exécution transparente pour l’utilisateur final, leur mise en œuvre ne demande aucune connaissance particulière. Elles
doivent être accessibles (dans le chemin des librairies) à l’application qui les utilise.
o Les rapports sont d’un niveau de qualité correct, le rendu graphique s’améliorant à chaque évolution de la
librairie
- Les librairies ne sont accessibles à l’utilisateur final qu’au travers une interface java, sous forme
d’une application ou d’un portail BI.
Notes
- Pas d’utilisation en mode « stand alone »
- Production des graphes gérée par une librairie externe JFreeChart sous licence LGPL
Ce document est sous licence GNU Free Documentation Licence. Page 13/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
4.1.1.3 Restitution
Ce document est sous licence GNU Free Documentation Licence. Page 14/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
4.1.2 BIRT
L’interface BIRT (Business Intelligence Reporting Tools) est conçue sous Eclipse. A l’origine projet de
la fondation Eclipse, la société ACTUATE en est maintenant co-sponsor. La solution permet, par
« glisser-déposer », de composer un rapport. Tous les composants graphiques sont présents et
comme avec iReport, le rapport se construit de manière intuitive.
Cette solution n’intègre pas de « query designer », outil permettant de construire graphiquement les
requêtes. Elle permet par contre d’ajouter des filtres sur les données
Le transtypage de données y est plus intuitif. Il n’est pas nécessaire de produire du code Java pour
obtenir ce résultat. Il peut être obtenu par choix de fonctions aux noms explicites, à appliquer sur les
données insérées dans le rapport.
La solution permet l’usage de plusieurs sources de données, l’utilisation de plusieurs requêtes
différentes, autant pour des données restituées sous forme de tableau que sous forme de graphiques.
Ce document est sous licence GNU Free Documentation Licence. Page 15/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Item CONCEPTION
BIRT v2.3.0
Interface graphique sous Eclipse, permettant la conception de rapports au format BIRT
MOE : conception de
reporting au format BIRT - Client Eclipse en Java, nécessitant l’installation
Utilisateurs : Il est d’une JVM
Public possible de l’utiliser Pré-requis - Paramètres de connexion à la base de données
comme outil de production - Langage SQL (pour la conception de requêtes)
de rapports. - Langage Java (pour affiner la conception)
DESCRIPTION
- Interface graphique sous Eclipse, indépendante de la plate forme. Elle produit un fichier de description au format
« rptdesign »
o Interface intuitive
o Mode visualisation permettant de pré visualiser le rapport final
- Conception en mode « drag & drop »
o Les outils et les champs de formats différents se glissent et se déposent sur la page de conception
o Les images (logo,…) ainsi que la définition de la connexion à la base de données sont inclus dans le fichier
de conception produit
La société ACTUATE est co-sponsor du projet BIRT sous Eclipse. Cette société participe activement
aux développements de BIRT Report et propose des produits non OpenSource additionnels suivants :
Actuate BusinessReport Studio : Portail décrit par Actuate comme permettant la conception de
rapports « adhoc » et leur visualisation.
Actuate BIRT Designer & BIRT Designer Professional : Version « professionnelle » de BIRT
Report
Actuate Information Objects : Permet la conception de vues métiers par la MOE, mis à disposition
des utilisateurs de données fonctionnelles.
Ce document est sous licence GNU Free Documentation Licence. Page 16/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La production se fait par l’usage de librairies paramétrées dans le fichier de description du rapport
final. Les images, les accès aux bases de données étant définies dans ce fichier de description, la
conception d’une application Java autonome exploitant les librairies et le fichier est simplifiée.
Item PRODUCTION
BIRT v2.2.0
Affichage du rapport final et production de différents types d’export
- JVM
Utilisateurs : Affichage
- Paramètres de connexion à la base de données
du rapport généré dans
- Langage SQL (pour la conception de requêtes)
Public l’outil de conception ou Pré-requis
- Langage Java (pour affiner la conception)
dans le portail
- Langage XML (pour comprendre le fichier «
rptdesign » utilisé)
DESCRIPTION
- Les librairies BIRT permettent de produire les fichiers de reporting conçu depuis BIRT.
o Intégrée dans un portail ou une plateforme BI :
- Exécution transparente pour l’utilisateur final, leur mise en œuvre ne demande aucune connaissance particulière. Elles
doivent être accessibles (dans le chemin des librairies) à l’application qui les utilise.
Les rapports sont d’un niveau de qualité correct, le rendu graphique dans certains formats d’export pourrait être
amélioré
Ce document est sous licence GNU Free Documentation Licence. Page 17/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
4.1.2.3 Restitution
Ce document est sous licence GNU Free Documentation Licence. Page 18/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La solution JasperReport fait partie des premiers composants BI. Il a bénéficié d’apports de toute la
communauté depuis l’année 2000. Sa conception en deux parties distinctes, d’un côté l’interface de
conception iReport, de l’autre les librairies de production, le rendent flexible et intégrable dans de
nombreux projets.
On le retrouvera donc dans toutes les plateformes BI, de SpagoBI à Pentaho en passant par
JasperServer.
Une des limitations est qu’il est nécessaire de lui fournir les images et logos décrit dans le fichier de
conception, ainsi que l’accès aux bases de données.
BIRT est lui aussi architecturé autour de librairies de production, mais son interface de conception et
la production d’un descripteur autonome en permettent un usage autonome.
Pour BIRT, seul le fichier de description est nécessaire, les images et le paramétrage d’accès aux
données étant inclus dans celui-ci.
Le choix des outils entre BIRT et JasperReport sera donc guidé par l’usage :
• Pour un rendu comparable, BIRT sera privilégié comme outil autonome.
• Pour l’intégration dans un portail ou un développement spécifique, on préférera Jasper,
dont les paramétrages sont plus accessibles.
• Si de multiples sources de données doivent être agrégées dans le même rapport, on
utilisera la solution BIRT, Jasper n’intégrant pas cette fonctionnalité.
• S’il est nécessaire d’avoir des rapports dynamiques contenant des interactions avec
l’utilisateur, la solution BIRT sera plus adaptée.
D’un point de vue des critères, le tableau suivant présente les points forts des deux solutions
Capacité à intégrer des fonctions de Les fonctions disponibles Les fonctions disponibles peuvent être gérées
traitement des données (arithmétiques, sont celles offertes par la par Birt indépendamment des fonctions fournis
statistiques, date, texte, numériques …) BDD sous jacente – peu par la BDD.
de limite
La programmation procédurale est aussi
La programmation intégrable
procédurale est aussi
intégrable
Mise en forme (rupture, groupement, saut de Toutes ces Toutes ces caractéristiques de mise en forme
page, tri, mise en forme conditionnelle, entête caractéristiques de mise sont prises en compte nativement dans Birt
et pied de page) – en forme sont prises en
compte nativement dans Un rapport Birt peut être conçu de manière
iReport. dynamique pour un usage sous forme de
dashboard.
Vision de l’information (Liste, Tableau croisé, La vision de l’information La vision de l’information est totalement
Graphes à barre, radar, histogramme …) est totalement paramétrable lors de la conception du rapport.
paramétrable lors de la
conception du rapport.
Mise à disposition (formats d’exports, mail, Export possible en PDF, Export possible en PDF, HTML, XLS, DOC,
portail web, envoi en masse, planification…) – HTML, XLS, CSV, Txt, PPT, POSTSCRIPT.
RTF, ODF.
Parfaitement intégrable à un portail pour la
Ce document est sous licence GNU Free Documentation Licence. Page 19/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Sécurité (droits sur les rapports, droits sur les Essentiellement gérée Essentiellement gérée par le portail, dans la
données avec filtre data en fonction de par le portail, dans la conception il faudra simplement spécifier les
l’utilisateur permettant de distribuer un même conception il faudra éléments paramétrables.
rapport avec des périmètres données simplement spécifier les
différents…) éléments paramétrables.
Paramétrabilité (invites utilisateurs - saisie La gestion des La gestion des paramètres est intégrée à BIRT
libre/ référentiel, invite en cascade,..) paramètres est intégrée à et dispose de plusieurs options comme la saisie
iReport ce qui permet, à libre, la liste déroulante, la sélection multiple et
l’exécution du rapport, de la gestion des paramètres en cascade. La
proposer un invite pour gestion des paramètres sert également à rendre
sélectionner le ou les le rapport dynamique à l’image des dashboards.
paramètre(s).
Intégré dans un portail, une autre dimension de
Pour une gestion des paramétrabilité peut être utilisée.
paramètres encore plus
poussée il faudra utiliser
les fonctions du portail.
Fonctions avancées (filtre récapitulatif, Beaucoup de points sont Beaucoup de points étant déjà gérés par le
indicateurs en ligne, accès multisource, audit déjà gérés par le portail. portail, Birt offre la capacité d’accès multi
d’utilisation…) iReport pêche tout de source, les jointures entre plusieurs source de
même quand il s’agit de données et des fonctions de calcule entre des
l’accès multi source ou champs de base de données différentes, et tout
plutôt multi requête. ceci au sein du même rapport en plus de la
gestion des rapports secondaires.
Les rapports secondaires
peuvent éventuellement
palier à ce problème.
Capitalisation (enregistrement de requêtes, de Essentiellement géré par Essentiellement géré par le portail.
modèles, de vues réutilisables…) – le portail.
Ce document est sous licence GNU Free Documentation Licence. Page 20/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Pour qu’un utilisateur puisse créer son propre rapport, en supposant (ce qui représente la majorité des
cas) qu’il n’a pas la connaissance pratique des modalités d’interrogation SQL des données, il a besoin
qu’une représentation métier de ces données lui soit présentée.
Concrètement, stockage relationnel ne veut souvent pas dire grand-chose pour un utilisateur métier.
Donc pour permettre une certaine liberté aux utilisateurs quant à leur besoin en terme de reporting,
les couches métiers sont une réponse efficace (pour faire une analogie avec les éditeurs historiques,
on parlera anciennement de « catalogue » chez Cognos puis de « framework », d’ « univers » pour
Business Objects ou encore d’ « infomap » chez Sas)
Ce genre de service n’est pas offert à tous les utilisateurs, il n’est pas forcément non plus mis en
place au sein de toutes les entreprises, certaines préférant que la DSI contrôle l’ensemble de la
production des rapports mis à disposition des utilisateurs.
Les critères déterminants pour qualifier la pertinence des technologies des éditeurs sur cet aspect
sont globalement les mêmes que ceux déterminés pour les rapports statiques.
Par exemple, la présence de fonctions de calculs nécessaire pour travailler les données, s’adressant
à des utilisateurs ne peut plus être implémentée à l’aide de requêtes SQL ou de procédures type
pgSQL (spécifique base PostgreSQL).
Elle doit devenir graphique, c'est-à-dire permettre à l’utilisateur de sélectionner une fonction présentée
de manière littérale pour qu’il l’applique sur la donnée choisie.
La couche métier, dont la conception est assurée par la MOE, doit offrir des fonctionnalités
élémentaires et d’autres de confort
Ce document est sous licence GNU Free Documentation Licence. Page 21/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Outil de conception de la vue Fonctions de design métier de la BDD Importation des tables, renommage des champs
métier techniques, classement de l’information en
dossiers, création de jointure libre ou semi
automatisé, gestion des boucles
Capacité à créer de nouvelles Les données brutes, une partie des données
données calculées (à partir de celles valorisées peuvent être stockées en BDD mais
importées de la base et offertes tout ne peut être reporté sur la base. Pour des
ensuite aux utilisateurs) – présence de raisons d’anticipation (le process de modélisation
fonctions de traitement des données et d’alimentation demeurant peu flexible) comme
(arithmétiques, statistiques, date, pour des contraintes naturelles (indicateurs non
texte, numériques …) linéaires). Il est donc vital que la valorisation des
données, leur préparation puisse aussi être prise
en charge par les outils de restitution. Ainsi les
fonctions de traitement de données ont leur utilité
dans les outils
Sécurité (droits sur les données) Le caractère confidentiel des données pour des
raisons de management, de concurrence ou
autre nécessite d’apporter des moyens pour
restreindre les informations délivrées
Mise en forme (rupture, groupement, pour rendre l’information visible, s’assurer qu’elle
saut de page, tri, mise en forme sera perçue à sa juste valeur, celle-ci doit être
conditionnelle, entête et pied de page) lisible. De même pour être partagée,
communiquée vers des tiers, le rendu doit être
structuré. Il est donc important de considérer les
capacités de mise en forme des outils. Aérer
l’information, mettre en évidence les
groupements, professionnaliser l’aspect sont
autant de points importants
Mise à disposition (formats d’exports, L’utilisateur créant son rapport peut souhaiter le
mail, portail web, envoi en masse, mettre à disposition des autres utilisateurs. La
planification…) – disparité des environnements accessibles aux
utilisateurs nécessite de prévoir une distribution
selon plusieurs formats ou moyens
Ce document est sous licence GNU Free Documentation Licence. Page 22/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Il n’existe pas de composants dédiés au reporting ad hoc. Ce service est offert de manière intégré par
les différentes plates formes BI, Pentaho », « SpagoBI », « JasperServer » et « BPM Conseil » que
nous présentons à partir du chapitre 7 sur l’industrialisation des SID.
Ce document est sous licence GNU Free Documentation Licence. Page 23/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Les cubes OLAP permettent à un utilisateur de « naviguer » au travers de ses données. Pour ce faire,
un axe d’analyse, appelé « mesure » va être défini, puis analysé suite à un croisement avec des
données organisées sous forme de dimensions.
Par exemple, on souhaite produire une analyse sur les coûts de transport de produits. Ceci
constituera la « mesure » du cube. Les pays expéditeurs et destinations seront deux dimensions
possibles. La période de temps (en mois ou années) constituera une autre dimension.
On pourra alors étudier l’évolution des coûts de transports sur une période en mois pour tous les
pays. Ou bien produire une analyse de ces coûts entre deux pays, entre deux continents (résultat
d’une agrégation des dimensions unitaires de pays). Ou bien, en mixant les deux dimensions
d’analyse, entre plusieurs continents sur plusieurs périodes.
Cet exemple sera repris et commenté dans nos études des solutions.
Les cubes ROLAP (OLAP basé sur une structure Relationnelle) permettent d’accéder directement aux
données physiques contenues dans les tables relationnelles. Les outils présentent les données
regroupées selon des vues métier, organisées autour des mesures et des dimensions.
Il devient possible de passer d’une vue « globalisée » par les axes, présentant des résultats agrégés,
à une vue unitaire des données. Cette navigation, d’une vision globale à une vision unitaire, s’appelle
le « drill through » ou le « drill down ».
La limite d’usage de cette méthode apparaît lors de sa mise en œuvre sur une base de volumétrie
importante. L’outil interroge la base à chaque demande d’analyse.
Les cubes MOLAP (OLAP optimisé pour l'analyse Multidimensionnelle) accèdent à des données
préalablement agrégées selon les mesures et les dimensions. Il n’est donc pas possible à priori de
descendre vers les données unitaires.
Sa mise en œuvre implique au préalable une extraction des données selon les axes de mesure et de
dimensions définis par les besoins d’analyse.
Cette méthode d’analyse, basé sur un sous ensemble de données limité, permet des temps de
réponses élevés sur une base de volumétrie importante.
Il existe aussi des solutions Hybrides (HOLAP) permettant une première analyse optimisée des
données par un cube MOLAP, puis en cas de besoin d’analyse plus fine, d’accéder aux données au
travers d’un cube ROLAP. A notre connaissance, aucune solution de ce type n’est représentée dans
le monde de l’Open Source.
Un composant permettant le design du cube (définition des axes, des indicateurs, des modalités
d’alimentation, de la sécurité…)
Un client permettant à l’utilisateur d’exploiter les données fournies au travers du cube. (client web ou
lourd, add in excel …)
Ce document est sous licence GNU Free Documentation Licence. Page 24/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Dans la suite du document nous vous présentons les deux solutions opensource éligibles au titre de
moteur OLAP :
9 la solution Mondrian : les différents composants pour le design du cube et les différents
composants clients permettant sa lecture,
9 la solution Palo et ses différents clients.
Pour l’analyse au moyen de cubes OLAP, les fonctions importantes sont listées dans le tableau
suivant.
Nous indiquerons en fin de chacune des études sur les deux grandes solutions OpenSource,
l’avancée des réalisations sur les fonctions majeures.
Outil de design Tout type OLAP Déclaration des sources Fonctions bien évidemment primordiales. C’est surtout
(conception) du de données, des axes et le confort apporté à ces fonctions de conception que
moteur OLAP indicateurs, de colonnes nous évaluons au travers de ce critère
calculées
supplémentaires
Tout type OLAP Sécurité – gestion des Toujours la même problématique de confidentialité des
accès aux données données. Elle peut être implémentée par des filtres
relatifs aux profils des utilisateurs ou par la constitution
de vues sur les cubes
Tout type OLAP Mode de consolidation Selon la nature de l’indicateur, sa consolidation sur
des indicateurs l’axe temps ne prend pas la même forme. Au-delà de
la simple somme, Il peut être nécessaire d’agréger la
dernière valeur disponible sur la période (notamment
pour les indicateurs de type stock), la valeur minimale
ou maximale de l’indicateur sur la période
Elaboration d’un rapport Avec les possibilités de mises en forme classiques des
rapports, formats d’exports disponibles, canaux de
diffusion etc…
MOLAP Modalités d’alimentation Un cube MOLAP stockant les données, les modalités
full ou différentiel d’alimentation deviennent primordiales. Avoir le choix
entre les deux modes est utile selon le contexte
d’utilisation de ces cubes, la volumétrie, et la fenêtre
de chargement disponible. On distinguera
l’alimentation full (à chaque alimentation du cube,
l’intégralité des données sont rechargées) et le mode
différentiel (mécanisme permettant de n’alimenter que
les nouvelles données ou celles modifiées depuis la
dernière extraction) -
Ce document est sous licence GNU Free Documentation Licence. Page 25/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
MOLAP Accès au détail Le cube MOLAP stockant ses données, il est courant
de ne pas intégrer les données de niveau de détail
issues de la BDD. Dans certains contextes métier il est
intéressant de pouvoir naviguer dans des indicateurs
agrégés puis d’obtenir les enregistrements unitaires
constitutifs de la valeur de l’indicateur sur un
croisement donné.
Exemple marketing classique : Les équipes utilisent le
cube MOLAP pour naviguer et identifier une population
spécifique sur laquelle ils souhaitent positionner une
offre. Dans le cadre du mailing ils ont besoin des
clients sous jacent avec leur coordonnées. Il faut
pouvoir à partir de la cellule sélectionnée dans le cube
accéder à la population qui a permis de construire
cette valeur.
Outil de consultation Navigation (drill down, Un aspect essentiel d’un cube pour l’utilisateur, à la
slice and dice) découverte d’information, est la fluidité. Il faut donc
aisément pouvoir inverser des axes, les imbriquer
entre eux, descendre d’un clic dans la hiérarchie,
remonter dans l’agrégation aussi simplement etc…
Ce document est sous licence GNU Free Documentation Licence. Page 26/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La solution MONDRIAN est développée en OpenSource depuis 2001 sous licence CPL et se présente
sous la forme d’un ensemble de librairies Java. Elles permettent la représentation de données
relationnelles dans un cube ROLAP, grâce à un fichier XML décrivant les axes de mesures et les
dimensions.
La mise en œuvre du serveur intègre la conception de ce fichier de description, préalable à
l’interrogation des données grâce à un outil client.
Item ANALYSE
Mondrian v3.0
La solution MONDRIAN est une implémentation Java de cubes ROLAP
DESCRIPTION
- La solution MONDRIAN se présente sous la forme d’un ensemble de librairies Java qui permettent la représentation de
données relationnelles dans un cube ROLAP
o La configuration de l’accès aux données relationnelles se fait depuis un fichier .xml
o La définition de la structure du cube (axes, indicateurs) peut se faire au moyen des outils de modélisation «
CubeDesignor », « Schema workbench» ou « FreeAnalysis Schema Designer »
Depuis la version 1.2 un système d’agrégation de tables à fait son apparition pour l’optimisation du
Notes
temps de réponse des requêtes mais sa mise en place reste complexe
Comme explicité plus haut, le serveur MONDRIAN repose sur l’implémentation ROLAP. Il permet
donc d’interroger directement une base relationnelle, au travers de la définition d’un « schéma »
précisant les axes de mesures et les dimensions.
Ce schéma se présente sous forme d’un fichier « .xml », configurant le mode d’accès aux données.
Un cube Mondrian peut également être implémenté dans une plate-forme telle que Jasper, Pentaho
ou SpagoBI. L’interrogation se fera alors à travers l’outil « JPivot », en mode web.
Ce document est sous licence GNU Free Documentation Licence. Page 27/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci-dessous le schéma d’architecture nous permet de comprendre les mécanismes mis en œuvre :
1. l’outil client transmet une requête au format MDX au serveur MONDRIAN
2. après validation du format de la requête, celui-ci utilise le schéma XML correspondant aux
données à traiter afin de transmettre une demande formatée à la couche de requêtage SQL
3. la couche de requêtage accède à la base physique et extrait les données correspondantes
à la requête
4. les résultats sont transmis à l’outil client.
Ce document est sous licence GNU Free Documentation Licence. Page 28/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Aussi appelé « Jasper Workbench », cet outil permet de définir les axes du cube ROLAP dans le
fichier de description XML. Il se connecte via des drivers JDBC aux bases relationnelles et permet de
définir les mesures, les dimensions.
Item ANALYSE
- JVM
MOE : Définition du - Paramètres de connexion à la base de données
cube, ajout de mesures - Langage SQL (pour la conception de requêtes)
Public pré calculées, export de la Pré-requis - Langage Java (pour affiner la conception)
définition du cube en XML - Langage XML (pour comprendre le fichier « xml »
utilisé)
- Langage MDX (pour la conception de la requête)
DESCRIPTION
- Schema Workbench est une application JAVA permettant de construire des cubes ROLAP Mondrian
o Définition et visualisation de la connexion, des mesures, des dimensions et des cubes
o Ajout de colonnes pré calculées (manuelle)
o Ajout de fonctions définis par l’utilisateur (manuelle)
o Gestion de cubes virtuels permettant une limitation du périmètre de données observées.
o Importation et exportation de cube Mondrian
o Publication directement dans la plateforme Pentaho avec cette version
- Mis en œuvre par la MOE, demande des connaissances en base de données et en cube OLAP
o Connexion à la base et construction du cube
Notes Anciennement appelé Jasper Workbench le projet est soutenu par Pentaho.
Ci-dessous une copie d’écran de l’interface de « Schema Workbench ». Des icônes permettent de
positionner facilement les axes et mesures.
Une fois l’outil connecté à la base relationnelle (ici PostgreSQL), celui-ci intègre automatiquement les
méta données de la base, rendant disponibles dans l’interface les noms des tables physiques et leurs
colonnes.
Ce document est sous licence GNU Free Documentation Licence. Page 29/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ce document est sous licence GNU Free Documentation Licence. Page 30/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Pentaho possédait sa propre interface de définition d’un cube ROLAP, « Pentaho Cube Designer ».
Item ANALYSE
- JVM
MOE : Construction du - Paramètres de connexion à la base de données
cube, publication du cube - Langage SQL (pour la conception de requêtes)
Public sur la plateforme ou Pré-requis - Langage Java (pour affiner la conception)
export XML - Langage XML (pour comprendre le fichier « xml »
utilisé)
- Langage MDX (pour la conception de la requête)
DESCRIPTION
- Pentaho CubeDesigner est un client lourd JAVA permettant de construire un cube ROLAP Mondrian.
Tout se regroupe en un gigantesque assistant de création de cubes simples
o Gestion des jointures supplémentaires de façon transparente
o Publication du cube directement dans la plateforme Pentaho ou export en fichier XML
- Exécution pour l’utilisateur final, demande des connaissances en base de données et en cube OLAP
o Connexion à la base, choix des tables, créations des mesures et des dimensions, publication sur la plateforme
Pentaho
Licence NC
Ce document est sous licence GNU Free Documentation Licence. Page 31/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Conçu par la société BPM Conseil « FreeAnalysis Schéma designer » assiste la démarche de
définition des axes et des mesures du cube. Dédié principalement à leur plateforme BI Portal que
nous illustrons plus bas il permet également d’exporter le schéma ainsi créé au format Mondrian
(fichier XML).
Notons également qu’une extension vers les cubes MOLAP est déjà prévue, mais non totalement
implémentée actuellement.
Item ANALYSE
DESCRIPTION
- Free Analysis Schéma Designer est un client lourd JAVA permettant de construire un cube OLAP
o Définition et visualisation de la connexion, des mesures, des dimensions et des cubes
o Ajout de colonnes pré calculées (assistant dédié)
o Ajout d’agrégations sur les colonnes (assistant dédié)
o Gestion des cubes virtuels
o Importation et exportation de cube Mondrian
o Publication du cube directement dans la plateforme FreeAnalysisWeb
o Gestion des agrégations
- L’exécution par le concepteur, demande des connaissances en base de données et en cube OLAP
o Connexion à la base, choix des tables, créations des dimensions et des mesures, enregistrement et publication
sur la plateforme BPM.
o Possibilité de « drag and drop » pour certains éléments
Licence Free Analysis Schema Designer Public License (licence MPL avec des clauses supplémentaires)
Ce document est sous licence GNU Free Documentation Licence. Page 32/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ce document est sous licence GNU Free Documentation Licence. Page 33/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
FreeAnalysis Schéma designer Web est le pendant web de « FreeAnalysis Schema Designer ». Cet
outil est dédié à la plateforme BI Portal de BPM et permet de définir le schéma d’interrogation d’un
cube Mondrian, puis de l’exporter dans le référentiel de la plateforme.
Item ANALYSE
DESCRIPTION
- Free Analysis Schema Designer Web est le pendant Web du client lourd Free Analysis Schema Designer
o Définition et visualisation de la connexion, des mesures, des dimensions et des cubes
o Publication du cube directement dans la plateforme FreeAnalysisWeb
- L’exécution par l’utilisateur final, demande des connaissances en base de données et en cube OLAP
o Connexion à la base, choix des tables, créations des dimensions et des mesures, publication sur la plateforme
BPM.
o Drag and drop des dimensions et des mesures pour créer le cube
Licence NC
Notes Permet la définition du schéma d’accès à un cube Mondrian, depuis la plateforme FreeAnalysis
Ce document est sous licence GNU Free Documentation Licence. Page 34/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La solution « JRubik » permet, à l’instar des librairies JPivot en mode web, de présenter les axes et
les dimensions d’analyse, afin que l’utilisateur puisse les combiner depuis une interface. L’outillage
sert essentiellement à l’analyse, l’intégration dans un tableau de bord n’étant possible que suite à un
export des données vers Excel.
Une présentation graphique « simplifiée » permet une représentation des données plus synthétique.
L’export de ce graphique se fait de la même manière que les données du cube travaillées par
l’utilisateur.
« FreeAnalysis » va plus loin et propose également l’ajout de colonnes calculées avec outre les
opérateurs classiques les fonctions valeur absolue (« absolute »), moyenne (« average »), max et min
disponibles.
5.2.3.1 JPivot
Cette librairie permet d’extraire et de présenter les données d’une base relationnelle au travers d’une
représentation sous forme de cube OLAP. La présentation se fait en mode web, intégrable dans un
portail ou des pages dédiées.
Item ANALYSE
JPivot
Librairie java permettant l’accès aux données d’un cube ROLAP depuis une interface web
DESCRIPTION
- JPivot est une librairie Java permettant la connexion et l’interrogation d’un cube Mondrian
o A partir d’une définition d’accès à un cube existant
o L’utilisateur dispose d’une interface web lui permettant d’effectuer des analyses sur les « mesures » définies
dans le « schéma XML »
o Fonctions de choix des axes à afficher
o Fonctions de slice et dice, drill down
Licence GPL
L’interface est simplifiée et statique. Il y manque nativement quelques fonctions de type « tableur »
Notes (ajout de colonnes calculées). Malgré tout, cette interface est présente dans pratiquement toutes les
solutions proposant les analyses de données sur cubes ROLAP.
Ce document est sous licence GNU Free Documentation Licence. Page 35/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
On distingue les icônes permettant l’accès à la définition des axes à afficher, ainsi que les fonctions
de graphes simplifiés.
Les exports Excel permettent de compléter les informations produites par l’ajout de colonnes
calculées.
Ce document est sous licence GNU Free Documentation Licence. Page 36/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.2.4 JRubik
JRubik est une interface Java permettant la manipulation de données représentées sous forme de
cube ROLAP.
L’interface reprend la présentation offerte par JPivot, en ajoutant une ergonomie plus aboutie par la
gestion d’onglets. Il devient possible d’avoir une représentation des données au format « tableur »,
complétée par la visualisation de la requête MDX générée.
Item ANALYSE
JRUBIK v0.9.4
Application permettant l’accès aux données d’un cube ROLAP depuis le poste de travail
DESCRIPTION
- JRubik est une application Java autonome permettant la connexion et l’interrogation d’un cube Mondrian
o A partir d’un cube existant
o L’utilisateur dispose d’une interface graphique lui permettant d’effectuer des analyses sur les « mesures »
définies dans le « schéma XML »
o Fonctions de choix des axes à afficher
o Fonctions de slice & dice, drill down
Licence GPL
Cet outil est le pendant « client lourd » des librairies JPivot vues plus haut. Nous ferons donc les mêmes
Notes
remarques que celles indiquées alors.
Ce document est sous licence GNU Free Documentation Licence. Page 37/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Les données fonctionnelles sont présentées dans la vue hiérarchique de gauche. Le choix des axes et
mesures se fait par « glisser-déposer ».
Ce document est sous licence GNU Free Documentation Licence. Page 38/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.2.5 FreeAnalysis
FreeAnalysis est la solution développée par BPM Conseil pour accéder au cube. Nous avons vu
précédemment l’outillage dédié « FreeAnalysis Schéma designer » de la solution. Il s’agit maintenant
d’interroger le cube et de produire les analyses correspondantes.
Item ANALYSE
FreeAnalysis v1.25
Interface graphique sous Eclipse, permet d’interroger un cube
Utilisateurs : Navigation
dans le cube, « drag and
drop » des dimensions, - Client « lourd » supposant une JVM
ajout de colonnes - Paramètres de connexion à la base de données
Public Pré-requis
calculées, génération de - Langage MDX (pour édition de requête MDX
graphes et export sous manuelle)
forme de rapports
DESCRIPTION
- FreeAnalysis est un client lourd JAVA permettant de naviguer dans un cube OLAP
o Visualisation du cube, des mesures et des dimensions (assistant de connexion dédié)
o Gestion des dimensions et des mesures en « drag and drop »
o Filtrage des dimensions avant présentation des données du cube
o Visualisation des dimensions sous forme d’organigramme
o Edition de requêtes MDX manuelles
o Gestion des graphes automatiques
o Export sous forme de rapports aux formats HTML, PDF, Excel
o Ajout des colonnes calculées mais limité en nombre de fonctions
Licence Freeanalysis public License (licence MPL avec des clauses supplémentaires)
Ce document est sous licence GNU Free Documentation Licence. Page 39/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci-dessous une copie d’écran réalisée sur la mise en œuvre de l’outil d’analyse sur notre définition de
cube Mondrian :
On notera les accès immédiats aux grandes fonctionnalités au moyen d’icones dédiées.
Ce document est sous licence GNU Free Documentation Licence. Page 40/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Après avoir étudié les solutions pour le cube ROLAP Mondrian, nous abordons maintenant le cube
MOLAP OpenSource « Palo ». Cette solution est éditée par la société allemande « JEDOX ».
Rappelons ici que les cubes MOLAP permettent la représentation de données relationnelles, mises en
forme spécifiquement pour répondre à une problématique d’analyse croisée sous plusieurs axes.
Un cube MOLAP existe donc physiquement (à l’inverse d’un cube ROLAP qui n’est qu’une
représentation fonctionnelle de données réelles) et nécessite une première étape de construction (par
son alimentation).
Item ANALYSE
DESCRIPTION
- PALO est un serveur de cube, optimisé pour un tableur. Il ne dispose donc pas d’outil de visualisation.
Pour ce faire, on utilisera « web-palo » et « Palo client » ou bien les plugins Excel et OpenOffice.
o Le serveur étant installé, il doit être l’alimenté
o Un ETL dédié est fourni avec la solution
o Il est possible de mettre en œuvre des jobs Talend ou Kettle pour l’alimenter.
- Le serveur alimenté, on connectera les clients mentionnés pour produire les analyses.
Licence GPL
Suite à l’installation du serveur, celui-ci doit être alimenté par extraction et mise en forme des
données. Cette étape est assurée au choix par un ETL fourni par JEDOX ou par les ETL génériques
Talend ou Kettle.
Notons que cette étape structurante nécessite une bonne connaissance du cube attendu et produit.
La documentation reste actuellement limitée, malgré la richesse fonctionnelle de la solution.
Ce document est sous licence GNU Free Documentation Licence. Page 41/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Une des grandes originalités de cette solution OpenSource, réside dans sa fonction write back :
L’utilisateur a la possibilité de renseigner ses propres valeurs dans le cube au croisement des
occurrences d’axes qu’il a sélectionnées. Cela permet donc de mettre en perspective des valeurs
prévisionnelles avec la réalisation de la société dans le temps.
Enfin, La solution de JEDOX est utilisée par SAP pour l’élaboration du reporting sur les données
gérées par l’ERP.
JEDOX est donc devenu un « partenaire naturel » de SAP.
Le cube se transforme alors en un cube HOLAP, permettant une première analyse sur les données
agrégées dans un cube MOLAP, puis une analyse plus fine par accès direct aux données sources.
La société JADOX travaille également sur une interface utilisateur pour la conception du processus
d’alimentation.
Cette évolution, ainsi que quelques autres sont attendues pour la fin de l’année 2008.
Ce document est sous licence GNU Free Documentation Licence. Page 42/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La même fonctionnalité pourrait être obtenue plus aisément en utilisant les capacités d’alimentation de
cubes PALO par les ETL KETTLE ou TALEND.
L’outil « IMP :Palo » de la société Cubeware offre une interface utilisateur sous Windows, permettant
l’accès aux données relationnelles, leur extraction et agrégation afin d’alimenter le cube MOLAP. Par
contre, cet outil ne permet pas de produire un « schéma d’extraction » autonome. Les procédures
d’alimentation devront être exécutées par cet outil.
Ce document est sous licence GNU Free Documentation Licence. Page 43/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La société JEDOX fournit un plugin Excel avec le serveur PALO. Ce plugin est complété par un
serveur de publication web de feuilles Excel compilées, accessibles ensuite depuis l’intranet de
l’entreprise. Cette solution ne nécessite pas l’installation du plugin sur les postes utilisateurs.
La société « Tensegrity Software GmbH » fournit un ensemble d’outils et une API, nécessaires à
l’interrogation des cubes PALO. Cet ensemble est dénommé JPalo.
Item ANALYSE
Utilisateurs : Analyse
des données agrégées
depuis un tableur Excel
ou OpenOffice.
Public Ces outils permettent de Pré-requis - Connaissance des tableurs
produire des
représentations
graphiques depuis les
données extraites
DESCRIPTION
- Depuis un tableur, permet alimenter les cellules avec les données agrégées présentes dans le cube.
o La gestion des droits est faite sur le serveur (voir outillage Eclipse décrit précédemment)
o Poste de travail ou mode partagé (mode web)
- Après définition du login/mot de passe, l’utilisateur alimente les cellules depuis le cube
o Possibilité de modifier les axes en utilisant les fonctions « copier-coller »
« Worksheet Server » est une solution de publication de documents Excel. Le serveur peut s’installer
sous Linux comme sous Windows, et permet de publier les feuilles et classeurs produits sous Excel
dans un intranet.
L’installation sous Windows 2003 Server est simple.
Ce document est sous licence GNU Free Documentation Licence. Page 44/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Lors du premier accès aux pages Excel compilées et déployées, il est nécessaire de définir les
utilisateurs autorisés à y accéder.
Ci-dessous un exemple d’analyse des marges, limitée à l’année 2007 pour les Pays-Bas. Il est
possible de définir des zones modifiables par l’utilisateur, afin de permettre une prévision.
« Excel Designer » est la feuille Excel permettant la compilation (au format XML) du classeur Excel à
publier.
Suite à la compilation du classeur, le fichier XML généré sera déployé sur « Worksheet Server » pour
permettre la visualisation et les analyses prévisionnelles.
Le lien avec le serveur PALO, présent dans la feuille Excel, est conservé dans la page générée et
publiée. La fonction « write back » est intégrée, permettant les analyses prévisionnelles.
Ce document est sous licence GNU Free Documentation Licence. Page 45/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
5.3.3.4 web-palo
La société Tensegrity fournit « web-palo », interface web qui permet de visualiser mais aussi de
modifier les données pour réaliser des simulations dans une vue du cube PALO.
Cette interface permet aussi d’accéder à d’autres cubes accessibles par le protocole XMLA. On peut
donc visualiser les cubes de SAP BW, de MS SQL Server 2000/2005 et de Mondrian.
Item ANALYSE
WEB-PALO v2.0
Permet la consultation en mode web des données agrégées dans le cube MOLAP Palo Server
Utilisateurs : L’accès en
mode web au serveur
PALO permet la - Serveur TOMCAT
Public consultation et la Pré-requis - Serveur PALO
modification (fonction « - Navigateur internet
write-back ») des données
DESCRIPTION
- L’installation se compose d’une application java J2EE à déployer dans un serveur Tomcat
o Les droits d’accès à l’interface se configurent directement sur le serveur web
o Les cubes (PALO, Mondrian, SAP ou Microsoft Analysis Services) peuvent être accédés
o Le poste de travail ne nécessite qu’un navigateur pour accéder aux données
L’interface ne permet pas l’ajout de colonnes calculées à l’instar d’un véritable tableur
Notes
Il est possible de modifier ou de filtrer les valeurs des cellules afin de faire des analyses prévisionnelles
Par « glisser-déposer », il est possible de modifier les axes d’analyse de nos coûts de transport.
L’interface permet aussi (suivant les droits attribués à l’utilisateur connecté) de modifier les données
affichées.
Ce document est sous licence GNU Free Documentation Licence. Page 46/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La société Tensegrity fournit « Palo client », application sur plate-forme Eclipse permettant
d’interroger les cubes PALO ainsi que les bases accessibles par le protocole XMLA, soit SAP BW, MS
SQL Server 2000/2005 et Mondrian.
Item ANALYSE
Utilisateurs : L’accès au
serveur PALO permet la
consultation et la - JVM
Public Pré-requis
modification (fonction « - Serveur PALO
write-back ») des données
DESCRIPTION
Ce document est sous licence GNU Free Documentation Licence. Page 47/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Item ANALYSE
L’interface ne permet pas l’ajout de colonnes calculées à l’instar d’un véritable tableur
Notes
Il est possible de modifier ou de filtrer les valeurs des cellules afin de faire des analyses prévisionnelles
La solution de Tensegrity est complétée par les API « Palo Java API » permettant le développement
d’application Java.
« myBIQ » est une solution OpenSource dédiée aux cubes PALO pour l’élaboration budgétaire et plus
vastement le CPM (Corporate Performance Management). Elle permet la consolidation de données et
se présente sous forme de tableaux de bord adressables à une direction générale.
La société éponyme fournit des cubes PALO pré structurés pour l’extraction des axes et indicateurs
nécessaires dans une interface dédiée. Depuis celle-ci, il est alors possible de comparer des
évolutions de marges, des volumes, des résultats de filiales, ….
L’alimentation des cubes se fait au moyen de « Pentaho Data Integration », l’ETL anciennement
nommé Kettle qui possède lui aussi un connecteur PALO.
Ce document est sous licence GNU Free Documentation Licence. Page 48/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Les deux familles de cubes ROLAP et MOLAP représentées par Mondrian et par Palo possèdent
toutes deux leur propre outillage d’interrogation.
Le choix de l’une ou l’autre solution doit être fait selon les besoins des utilisateurs finaux et la capacité
d’intégration des équipes techniques. Pour Mondrian, un gros effort doit être fait par celles-ci pour
appréhender les mécanismes de fonctionnement et d’intégration ainsi que l’écriture de schéma de
description.
Des solutions de modélisation de ces schémas existent, mais restent encore peu intuitives. On verra
plus bas que « BPM Conseil » et « Pentaho » ont axé des efforts de développement dans ce sens.
Pour Palo, l’effort se situe dans la création de scripts d’alimentation, l’usage étant simplifié par les
interfaces, en mode web ou en mode tableur.
Déclaration des sources de données, des La conception du « schema XML » se fait La définition des sources de données
axes et indicateurs, de colonnes avec l’un des outils dédiés présentés plus se fait dans l’ETL utilisé. Soit fourni
calculées supplémentaires haut. par Jedox, soit Talend ou Kettle.
Sécurité – gestion des accès aux Cette fonctionnalité n’existe pas dans les Les outils clients doivent se
données outils clients. Elle sera gérée par le portail connecter au serveur Palo par
et permettra de donner un accès à identifiant/mot de passe limitant
l’intégralité d’un cube. l’accès à un périmètre autorisé.
Il est possible de définir le périmètre
d’accès aux données à un utilisateur au
moyen d’un cube virtuel. Ce dernier est un
sous élément d’un cube sur un périmètre
plus large, limité au choix des dimensions
et des mesures.
Un cube virtuel ne peut actuellement pas
proposer un sous-ensemble de données
dans une dimension ou une mesure.
Un cube virtuel peut par contre proposer
une vue agrégée de plusieurs cubes.
Mode de consolidation des indicateurs Les fonctions d’agrégation « sum », Les fonctions d’agrégation « sum » et
« count », « distinct-count », « count » sont disponibles
mathématiques « min », « max » et de
statistiques « avg », sont disponibles.
Gestion des dimensions récursives Cette fonctionnalité n’existe pas Cette fonctionnalité n’existe pas
Gestion avancée de la dimension temps Ces fonctions sont disponibles à condition Par son ETL dédié, PALO propose
d’être conçues à l’origine dans le cube lors un mode d’agrégation automatisé
de sa définition. lors de l’extraction des données.
Elaboration d’un rapport Mise en forme succincte directement Aucune mise en forme par défaut.
depuis les outils clients. Doit être assurée par l’utilisateur
après export dans un outil tiers
Peut être amélioré en passant par un (tableur, document texte)
tableur externe.
Ce document est sous licence GNU Free Documentation Licence. Page 49/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Implémentation des normes XML/A ou Les deux modes sont disponibles : Le client « web-palo » utilise le
MDX protocole XML/A pour se connecter
soit le cube est interrogé directement en aux différents cubes, dont PALO.
MDX,
soit on y accède au travers d’un
webservice en XML/A
Navigation (drill down, slice and dice) Fonctionnalité fournie par les clients Fonctionnalité fournie par les clients
JPivot, JRubik. et depuis un tableur.
Vision de l’information (Liste, Tableau Les outils clients proposent la Aucune sortie possible depuis le
croisé, Graphes à barre, radar, représentation des données au moyen de client web.
histogramme …) quelques graphiques de base.
Toutes les fonctionnalités offertes par
les tableurs Excel et OOffice sont
disponibles.
Filtre, couche L’outillage client propose l’application de L’outillage client propose l’application
filtres de filtres
Ce document est sous licence GNU Free Documentation Licence. Page 50/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Suite à la remontée de ces indicateurs, une analyse plus fine pourra être élaborée par des
opérationnels plus impliqués localement.
Les mots clés rencontrés dans cette forme de reporting sont « KPI » (Key Performance Indicators),
« dashboards », « tableaux de bord synthétiques ».
Dans les plateformes SpagoBI, JasperServer et Pentaho décrites au chapitre suivant, des tableaux de
bord synthétiques sont implémentés au moyen de développements spécifiques.
Pentaho propose ainsi des pages JSP configurées au moyen de fichiers en XML.
JasperServer dans sa version Pro intègre un designer de dashboard dynamique interne au portail
facilitant la mise en place de ceux-ci.
BPM Conseil propose une solution dédiée au suivi des indicateurs clés. On se reportera avec intérêt
au chapitre présentant cette plateforme et son outil dédié aux KPI, « FreeMetrics ».
L’outillage dédié est obtenu par la mise en œuvre des outils OpenI ou de MarvelIT. BPM Conseil
propose un outil dédié à la gestion des KPI, solution la plus aboutie actuellement en OpenSource
dans ce domaine.
MarvelIT est une solution volontairement simplifiée, n’ayant pas d’autre fonction que de remonter des
données synthétiques sous forme de graphiques, à des utilisateurs qui ne souhaitent pas connaître le
détail des données.
OpenI va plus loin en présentant les résultats de requêtes XMLA sous forme de graphiques.
L’utilisateur pourra également poursuivre l’analyse grâce à JPivot.
Pour une plateforme plus complète, il faudra mettre en œuvre les solutions décrites au chapitre 7
Ce document est sous licence GNU Free Documentation Licence. Page 51/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
6.1 MARVELIT
MarvelIT est une société américaine basée sur la côte ouest d’Amérique du Nord, à Poway non loin
de San Diego.
Elle édite une solution Open Source qui permet depuis une interface web, de consulter des tableaux
de bord sous forme de graphique. Les graphismes peuvent être imbriqués, permettant ainsi une
navigation au travers des données agrégées graphiquement.
Les graphes sont basés sur JasperReport/JFreeReport et permettent les types de restitution compris
dans la librairie.
Dans le graphe de gauche présenté en exemple, la jauge illustre que le volume de marge, indicateur
stratégique, est en avance par rapport aux objectifs.
Dans le graphe de droite présenté en exemple, les volumes de ventes sont répartis par tranches
d’âge. Il est possible, en cliquant sur un segment en couleur, d’obtenir un nouveau graphique
présentant, pour cette tranche d’âge, la répartition des produits vendus en sous catégories.
Les utilisateurs finaux n’ont accès qu’à une visualisation et à la navigation au travers des graphiques.
Ce document est sous licence GNU Free Documentation Licence. Page 52/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
A un autre niveau d’utilisation, il est possible de changer de base de données, permettant ainsi de
produire des comparaisons d’indicateurs sur des SID (Système d’information décisionnel) différents.
Pour les développeurs, tous les paramètres de configuration sont accessibles en mode web, une
fonctionnalité fort appréciée pour la maintenance et le développement. Cela permet d’éviter l’accès
direct au serveur, nécessaire à la modification des divers fichiers de configuration au format XML.
Item PILOTAGE
Dash v2.12
Présentation graphique d’indicateurs
Utilisateurs : Accès à
des données agrégées,
- Plate forme Tomcat 5
Public présentées sous forme de Pré-requis
- Langage SQL
graphiques
DESCRIPTION
- Utilisation
o Accès en mode web aux indicateurs et graphiques
o Couvre les besoins de reporting synthétique
o Semblable à un reporting de masse, accessible à la demande en mode web
Licence GPL
Parmi les évolutions attendues, il y a le portage sur les autres portails JSR 168 tels que Liferay et
WebSphere.
Notes
Il manque à la solution, une capacité d’export vers le format PDF ou HTML afin de permettre
l’impression des graphiques souhaités.
Enfin, MarvelIT a prévu de créer une version payante, sans faire disparaître toutefois la version
librement téléchargeable.
Ce document est sous licence GNU Free Documentation Licence. Page 53/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
6.2 OPENI
« OpenI » est une solution légère, facilement déployable sous Tomcat ou JBoss, pour peu que l’on
sache administrer ce type de serveur.
L’objectif de la solution est de présenter un portail simplifié, présentant les résultats de requêtes
XMLA (accès aux données du cube Mondrian ou Microsoft Analysis Services) sous forme de
graphiques dans la page d’accueil de l’utilisateur. Un « clic » sur un graphique permet d’accéder aux
données extraites du cube et de poursuivre l’analyse grâce à JPivot.
La gestion des utilisateurs se fait au moyen des « projets », pour lesquels deux profils sont définis,
l’administrateur du projet qui pourra gérer les sources de données et les utilisateurs, l’autre profil
concernant les utilisateurs.
Un « super administrateur » permet de gérer l’ajout, la suppression des projets.
Item PILOTAGE
OPENI v2.0
Présentation graphique d’analyses sur hyper cubes
Utilisateurs :
- Plate forme Tomcat 5
Présentation graphique
- Langage SQL
Public des résultats de requêtes Pré-requis
- Langage XMLA
XMLA
- Langage XML
DESCRIPTION
- La solution repose sur un portail de type JSR168, présentant les résultats de requêtes XMLA sur les hyper cubes
implémentant cette technologie :
o SAP
o Mondrian
o Microsoft Analysis Services
- Utilisation
o Accès en mode web aux résultats graphiques
o Par sélection, accès aux données et à un navigateur JPivot pour parcourir l’ensemble des données remontées
Licence Licence OPLv1.0 (Licence Mozilla adaptée par la société Loyalty Matrix )
Notes Projet « à surveiller », qui redémarre suite à une longue période d’inactivité.
Le projet « OpenI » a été lancé en 2005. Sponsorisé par la société « Loyalty Matrix », il a été repris
par la société « Responsys » lors de l’absorption de la société à l’origine du projet.
En aout 2008, le projet reprend après une année d’interruption.
Ce document est sous licence GNU Free Documentation Licence. Page 54/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci-dessous une copie d’écran de l’interface de visualisation d’un cube Mondrian depuis la plateforme.
Ce document est sous licence GNU Free Documentation Licence. Page 55/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
L’onglet « chart » permet d’avoir accès à une représentation graphique de l’extraction de données
souhaitée par l’utilisateur.
Ce document est sous licence GNU Free Documentation Licence. Page 56/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
MarvelIT s’est surtout intéressée aux « dashboards » permettant d’obtenir des graphiques imbriqués
dynamiquement ou l’accès aux données sous jacentes aux représentations.
Le principal intérêt de cette solution est sa légèreté. Son autre avantage est de simplifier la création
de ce type de rapports, complexes sous Pentaho ou SpagoBI.
OpenI propose une solution simple d’accès aux cubes OLAP grâce au langage XMLA. L’émergence
du langage JBDC4Olap remettra peut être en cause l’intérêt pour cette solution légère.
On verra plus bas que BPM Conseil propose un outil dédié à la gestion des KPI « FreeMetrics ». On a
vu que les autres solutions ne proposent pas la gestion de workflow autour des indicateurs, ni de
créer des alertes en cas d’atteinte d’un seuil.
Ce document est sous licence GNU Free Documentation Licence. Page 57/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ces solutions complètent les outils vus précédemment individuellement ou les portails dédiés aux
« dashboards ». Elles sont plus lourdes à mettre en œuvre mais permettent une industrialisation de la
production et de la consommation.
L’accès aux différents outils et aux périmètres de données peut être défini par utilisateur ou par
groupes utilisateurs.
La plateforme comprendra souvent une interface de gestion de l’ETL, la configuration d’accès aux
données, le paramétrage des destinataires avec la mise en place de tâches planifiées.
) Les plateformes s’articulent autour de portails permettant une centralisation des accès et un
niveau plus fin de définition des périmètres de données accédées. Le portail peut s’intégrer dans
l’intranet de l’entreprise et permettre un accès centralisé aux différentes applications web.
) Les accès centralisés rendent possible la gestion du SSO et agrègent des outils complémentaires
à la conception et la production de rapports.
Représentation des données au travers d’une couche d’abstraction permettant la conception de
reporting « adhoc »
Planification de la production des rapports, indépendamment des mécanismes de planification de
l’infrastructure.
) La consommation des rapports passant par une interface centralisée, le suivi de cette
consommation pourra être mesuré. Cela renseignera les équipes techniques sur l’usage des outils et
pourra permettre la mise en place d’une facturation sur le volume consommé.
Ce document est sous licence GNU Free Documentation Licence. Page 58/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Pentaho est une plateforme BI, éditée par la société éponyme basée à Orlando, créée par des
consultants ayant évolués précédemment autour des solutions BI proposées par IBM, Business
Objects, Oracle, Cognos, SAS et Hyperion.
La plateforme regroupe les briques OpenSource nécessaires à l’extraction des données (ETL par
Kettle), leur mise en forme et leur restitution.
Item INDUSTRIALISER
PENTAHO v1.7.0
La plate forme Pentaho permet d’agréger les outils BI de restitution et d’analyse exposés plus haut. Elle permet nativement
de définir les accès aux bases de données pour JFreeReport et de permettre la planification et l’envoi de rapport. Pour les
autres types de rapport, quelques fichiers de configuration restent à modifier.
DESCRIPTION
- A partir d’un seul environnement web, avoir accès aux composants BI les plus aboutis :
o Dans l’extraction des données (pilotage de Kettle)
o Dans la conception et la production de rapports
o Dans l’analyse des données en ROLAP (Mondrian)
o Dans l’exécution d’algorithmes de data mining (Weka)
Ce document est sous licence GNU Free Documentation Licence. Page 59/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La plateforme Pentaho est nativement intégrée dans « JBoss Portal ». Une intégration dans
« Liferay », autre portail répondant à la norme JSR168 existe apparemment, mais sans
documentation explicite de mise en œuvre.
L’authentification se fait directement dans la plateforme Pentaho, sans reposer sur les fonctionnalités
apportées par le portail. Dans la version commerciale, il est fourni une console d’administration des
utilisateurs.
En mode « Communauté », la gestion se fait au moyen d’un fichier de configuration.
La conception de rapport se fait depuis une interface graphique dédiée, « Pentaho Report Designer ».
Item CONCEPTION
DESCRIPTION
- Interface graphique sous Java, indépendante de la plate forme. Elle produit un fichier de type « *.report » (résultat de
l’agrégation d’un fichier « *.xaction » et d’un fichier « xml »)
o Interface simpliste
o Positionnement des éléments en X-Y
o Mode visualisation permettant de pré visualiser le rapport final sous plusieurs formats
o Publication direct sur la plateforme Pentaho
Ce document est sous licence GNU Free Documentation Licence. Page 60/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Item CONCEPTION
Les paramètres de connexion à la base de données sont internes à la définition du rapport dans le
fichier report ou xaction.
Notes Les images ne sont pas intégrées dans le « report » ou dans le « xaction » (chemin indiqué dans le
fichier)
Production des graphes gérée par la librairie JFreeChart sous licence LGPL
Ce document est sous licence GNU Free Documentation Licence. Page 61/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Le fichier « xaction » contient en effet des actions qui vont se dérouler lors de la création du rapport.
On peut alors voir ce dernier comme un « patron » décrit dans le « xml », complété lors de sa
génération par des éléments provenant d’une extraction de données, réalisées avant la diffusion.
Cet outil permettra la mise en place complète des actions à effectuer via la configuration avancée des
fichiers « xaction ».
DESCRIPTION
Licence EPL
Notes Outil très complet permettant un paramétrage très poussé des actions au sein de la plateforme Pentaho.
Ce document est sous licence GNU Free Documentation Licence. Page 62/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Cette fonctionnalité est employée lors de la « diffusion de masse » permettant ainsi de redéfinir le
périmètre d’une requête selon le profil d’un utilisateur.
Cela permet aussi de personnaliser le rapport définitif avec un entête, un pays … selon le destinataire.
On retrouvera ces fichiers « xaction » dans toutes les formes de reporting gérées par Pentaho. Pour
compléter les méthodes qu’il contient, il est nécessaire d’utiliser le client lourd « Designer Studio ».
Les fichiers produits au format « xml » décrivent divers actions telles que la planification, les requêtes
à produire lors de la mise en œuvre, la personnalisation.
Il est ainsi possible de définir un seul rapport, puis de le diffuser à différents utilisateurs, chacun de
ceux-ci recevant par mail un rapport executé sur un périmètre de données différent.
On planifiera l’exécution du fichier « xaction », qui comprendra par exemple, à partir d’un rapport
générique :
Ce document est sous licence GNU Free Documentation Licence. Page 64/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La conception des rapports « ad hoc » depuis la plateforme met en œuvre la solution dédiée « AdHoc
Reporting ». Un outil dédié et externe à la plateforme « Pentaho Metadata Editor » permet aussi cette
conception. Nous le détaillerons par la suite, dans le chapitre des outils complémentaires offerts par la
suite Pentaho.
Dans un premier temps, l’interface permet la visualisation des vues métiers disponibles, puis le choix
parmi des gabarits de présentation.
La construction de ces gabarits est réalisée via des fichiers XML et AdHoc Reporting ne propose
qu’une restitution sous forme de liste.
A l ‘étape suivante (sélection des objets) la visualisation des champs fonctionnels des différentes
tables permet de sélectionner les colonnes à croiser entre elle afin d’extraire les données à mesurer.
Il est possible de choisir les colonnes de regroupement, les colonnes du corps du rapport, les
colonnes qui ne seront utilisées que pour le filtrage de données au moyen d’un glisser déposer ou
d’une affectation par icônes (flèches).
L’étape personnalisation donne accès à un panel d’éléments dédiés à chaque champ en fonction de
leur type.
Ce document est sous licence GNU Free Documentation Licence. Page 65/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Outre la fonction de comptage propre à tous types de champs, les champs de type date bénéficient de
quatre différents formats. Les champs numériques sont complétés par des fonctions de calcul et de
statistiques telles que « somme », « minimum », « maximum » et « moyenne ».
Il est également possible d’ajouter des contraintes sur les colonnes visualisables et sur les colonnes
de filtrage ainsi que de faire des classements par ordres croissants ou décroissants.
La dernière étape de personnalisation est la première phase de l’étape de mise en page permettant
de choisir un alignement spécifique pour chaque champ.
Par un bouton accessible, on peut générer le rapport définit pour valider son aspect et son contenu.
9 PDF
9 HTML
9 Excel
9 CSV
Ce document est sous licence GNU Free Documentation Licence. Page 66/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Les outils « JasperReport », « Birt », « JPivot » et « Mondrian » sont les composants techniques de la
solution. Pour aller plus loin, voir leur analyse individuelle en supra.
Elle intègre de plus les composants « Weka » pour le datamining et « Quartz » pour la planification.
L’étude de ces composants n’est pas réalisée dans ce livre blanc.
Kettel est intégré dans la plate forme. Ceci permet d’en gérer les tâches directement dans
l’environnement BI.
L’outil « Pentaho Metadata Editor » permet de configurer les « vues métiers » nécessaires au
reporting Ad Hoc de Pentaho. Un utilisateur « technique » ayant les droits d’accès aux données
physiques, élabore des sous ensemble de données fonctionnelles.
Cette conception se fait, suite à la définition de la connexion ainsi qu’après avoir renommé les champs
techniques en champs fonctionnels, par glisser/déposer dans l’espace de travail.
MOE : Conception de
- JVM
vues métier, pour mise à
Public Pré-requis - Accès aux données physiques
disposition d’utilisateurs
- Langage SQL
DESCRIPTION
Licence MPL
Notes La vue métier produite peut être directement déployée dans la plateforme Pentaho
Ce document est sous licence GNU Free Documentation Licence. Page 67/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
En fin d’année 2008, il est prévu par l’éditeur que le développement de Pentaho intègre la conception
d’interfaces orientées utilisateur pour la conception de reporting « ad hoc », sans compétence SQL.
Plusieurs sources de données différentes devraient aussi pouvoir être intégrées dans le même rapport
(voir plus haut les limitations de JasperReport sur ce point).
Pour les équipes techniques, il est aussi prévu des interfaces plus évoluées permettant la conception
plus aisée de vues métiers et de « dashboard ».
Concernant l’administration, les cubes OLAP ne sont pas oubliés car ils devraient être plus facilement
déployés et interrogeables dans les futurs versions.
Toutes ces évolutions sont indiquées par Pentaho, sans précision sur la date de sortie.
Ce document est sous licence GNU Free Documentation Licence. Page 68/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
SpagoBI est édité par la SSII italienne « Engineering Ingegneria Informatica » basée à Milan. La
solution se présente comme l’agrégation de composants BI et groupware sur le middleware Spago.
Cette solution présente l’avantage d’être totalement LGPL et de s’affranchir d’un portail particulier. On
peut ainsi déployer la solution sur Liferay, eXoPortal, JBoss Portal.
Elle intègre une gestion des droits utilisateurs évoluée, comprenant les développeurs, les testeurs et
les utilisateurs finaux (voir § 7.2.2)
Les documents (reporting, dashboard, …) peuvent être versionnés en attendant une validation de
leur publication.
Item INDUSTRIALISER
SpagoBI v1.94
La démarche de la société EII est d’agréger des composants BI sur leur middleware SpagoBI
DESCRIPTION
- A partir d’un seul environnement web, avoir accès aux composants BI les plus aboutis :
o Dans l’extraction des données (pilotage de Talend)
o Dans la conception et la production de rapports
o Dans l’analyse des données en ROLAP (Mondrian)
o Dans l’exécution d’algorithmes de data mining (Weka)
Licence LGPL
SpagoBI se présente comme une interface BI intégrant le meilleur des composants de la communauté.
Le versionning et la gestion avancée des utilisateurs est un plus
Notes
La « non adhérence » à un portail spécifique rend cette solution plus souple dans son intégration à un
existant.
Ce document est sous licence GNU Free Documentation Licence. Page 69/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.2.1 Portail
SpagoBI peut s’intégrer dans un portail d’entreprise répondant aux normes JSR 168 (intégration des
applicatifs BI dans des « portlets », permettant la customisation poussée de l’interface utilisateur.)
L’authentification se fait dans le portail, avec « mapping » de l’utilisateur et de son rôle dans la
plateforme. Ceci permet un point d’authentification unique pour toutes les applications intégrées dans
le portail et de s’appuyer sur un mécanisme validé et déporté.
L’outillage « QBE » (Query By Example) a pour objectif de permettre à un utilisateur non technique de
générer une requête.
Suite à la sélection des données, l’outil génère un rapport sous forme de tableau uniquement.
Outre la sélection des champs qui s’effectue en un simple clic sur chacun d’eux, SpagoBI introduit un
mécanisme de visualisation des champs permettant de valider fonctionnellement les données
extraites.
Ce document est sous licence GNU Free Documentation Licence. Page 70/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Là où Pentaho dissocie chaque table, SpagoBI permet de visualiser les données de la « table de fait »
et d’avoir accès aux données de chaque table liée.
L’accès (non recommandé) aux tables unitaires reste possible néanmoins au moyen de jointures.
Dans la gestion des conditions tous les champs sont accessibles afin d’effectuer des filtrages ou des
jointures si cela est nécessaire.
Le tri sur les colonnes sélectionnées peut se faire en ordre croissant ou décroissant.
La gestion des regroupements (mot clé « group by » en langage SQL) ne sera réellement nécessaire
que si il existe des fonctions de calcul affectés à certaines colonnes.
Ce document est sous licence GNU Free Documentation Licence. Page 71/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
9 PDF
9 HTML
9 Excel
9 CSV
9 RTF
9 XML
9 TXT
La dernière option est la création d’une vue. Cette vue regroupe l’ensemble des champs sélectionnés
et est accessible dans l’arborescence de l’onglet « Sélection des champs ». Elle peut être utilisée
pour générer d’autres rapports.
La configuration du seul template disponible se fait directement en XML et est réservée aux
utilisateurs « experts ».
Ce document est sous licence GNU Free Documentation Licence. Page 72/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La version 2.0 est diffusée en version Alpha depuis la mi mai 2008 et met en avant une ergonomie
améliorée, ainsi qu’une simplification d’accès aux fonctions.
Item Nouveautés
Ce document est sous licence GNU Free Documentation Licence. Page 73/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La plateforme JasperServer est architecturée autour des librairies JasperReport. Elle offre la
configuration nécessaire (voir § 4.1.1.2 et la configuration externe d’accès aux bases de données) à la
production d’un rapport. Une gestion des accès et des périmètres utilisateurs est également
implémentée.
Il est possible de déployer directement sur la plateforme les rapports conçus sous iReport.
C’est une plateforme dédiée à la gestion et à la production de rapports JasperReport, ainsi qu’à la
gestion des cubes OLAP Mondrian avec JPivot. Cette plateforme n’intègre pas de capacité de
datamining.
Item INDUSTRIALISER
MOE : Conception de
rapports depuis la
plateforme en version Pro
Conception de «
dashboard » en version
Pro
Utilisateurs : Visualiser - Tomcat, JBoss
Public Pré-requis
des rapports - Navigateur web
JasperReport.
Visualisation de cubes
OLAP
Visualisation de «
dashboard »
DESCRIPTION
- Après authentification
o L’utilisateur peut créer (version Pro) des rapports ou des dashboard
o Chaque utilisateur accède à ses propres tableaux de bord
Licence Deux types de licence. Une version « communauté », en GPL et une version commerciale.
Ce document est sous licence GNU Free Documentation Licence. Page 74/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.3.1 Portail
Le portail adopté est dédié à la plateforme. Il n’intègre pas la norme JSR 168, ce qui ne permet pas
d’utiliser les composants dans les « portlets » d’un autre portail.
Il existe un « plug in » d’intégration à LifeRay dans la version pro.
Il est également possible d’octroyer ces droits directement à un utilisateur ce qui permet une
administration plus fine des accès.
« Ad Hoc editor » est l’outil dédié à la conception de rapports par des utilisateurs ne possédant pas de
connaissance du langage SQL. Cet outillage est réservé à la solution commerciale.
Item CONCEPTION
ADHOC Editor
Outil web de conception de reporting « adhoc » sur la plateforme commerciale
Utilisateurs : Permet la
conception de rapports « - Tomcat, JBoss
Public Pré-requis
adhoc » - Navigateur web
DESCRIPTION
Ce document est sous licence GNU Free Documentation Licence. Page 75/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
L’outil « JasperReport », est le composant technique de la solution. Pour aller plus loin, voir son
analyse individuelle en supra.
Elle intègre de plus le composant « Quartz » pour la planification. L’étude de ce composant n’est pas
réalisée dans ce livre blanc.
La version 3.1 prévue fin 2008 devrait intégrer des outils d’analyse, la mise à disposition de la
plateforme sous forme de Saas (acronyme de l’expression « Software as a service »), une
construction de reporting ad-hoc sur des couches de données métier, un outillage différent permettant
une autre définition du rapport.
La version 3.2, prévue mi 2009, devrait approfondir les outils mis en place dans la version 3.1
Ce document est sous licence GNU Free Documentation Licence. Page 76/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.4 OPENREPORTS
OpenReports est édité par Erik Swenson, développeur à Enfield, en Amérique du nord. Le support
reste limité à l’accès au blog http://oreports.com/blog/ où Erik donne quelques détails de configuration
avancée.
OpenReports est une solution web de publication de rapports pré configuré depuis les outils de
conception iReport ou Birt.
Ceci permet d’adresser simplement à des utilisateurs finaux, des tableaux de bord pré paramétrés. Il
n’est pas possible de gérer un paramétrage dépendant du profil afin par exemple, de réduire le
périmètre du tableau de bord suivant l’utilisateur.
L’avantage est sa simplicité de mise en œuvre, à partir du moment où une solution de conception des
rapports pré existe dans la chaîne décisionnelle.
Item INDUSTRIALISER
OpenReport v3.0.1
Interface web de diffusion et de consultation de tableaux de bord pré paramétrés.
Diffusion paramétrable
- Serveur Tomcat
de tableaux de bord
- Langage SQL
Consultation des
- Langage XML
Public rapports attribués au profil Pré-requis
- Conception sous JasperReport
Accès à des analyses
- Conception sous Birt
ROLAP (Mondrian)
- Conception de cubes Mondrian
DESCRIPTION
Licence GPL
Une version « pro » avec des fonctionnalités supplémentaires est accessible pour un coût de 495$
Licence
(juillet 2008)
Cette version inclus un planificateur, les tableaux de bord et la gestion des alertes
Solution simple à mettre en œuvre, pour compléter une chaîne de production de rapports existante.
Notes
Limitée en version OpenSource
Ce document est sous licence GNU Free Documentation Licence. Page 77/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La gestion des utilisateurs est simplifiée et répartie entre le rôle d’administration (ajout/suppression
d’utilisateurs, de rapports,…) et le rôle « utilisateur », destinataire des rapports ou consommateur des
rapports générés et accessibles depuis l’interface web.
Les outils « JasperReport », « Birt », « JFreeReport » (reporting Pentaho) et « JPivot » sont les
composants techniques de la solution. Pour aller plus loin, voir leur analyse individuelle en supra.
Elle intègre de plus le composant « Quartz » pour la planification. L’étude de ce composant n’est pas
réalisée dans ce livre blanc.
La version 3.1 est sortie le 3 aout 2008. Elle intègre les nouvelles librairies JasperReports 3.0, BIRT
2.3, JXLS 0.9.6, JPivot 1.8, and Mondrian 3.0.
La plate forme fonctionne maintenant avec un JDK 1.6 qui possède nativement des fonctions
étendues dans la gestion des nombres décimaux.
Ce document est sous licence GNU Free Documentation Licence. Page 78/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La suite d’outils éditée par la société Lyonnaise BPM Conseil, fournie une alternative aux plateformes
BI majeures que représentent SpagoBI, Pentaho et JasperServer.
La plateforme fédère l’outillage propre de BPM Conseil. Quelques outils restent sous forme de
« clients lourds », essentiellement pour les tâches d’administration et de conception avancée (comme
la conception de vues métier).
Item INDUSTRIALISER
MOE : Conception de
rapports JasperReport
(FreeWebReport)
Conception de
dashboard
(FreeDashboardWeb)
Utilisateurs :
visualisation de rapports,
visualisation de cubes - Tomcat, JBoss
Public Pré-requis
ROLAP et MOLAP - Navigateur web
(FreeAnalysisWeb)
visualisation de
dashboard
(FreeDashboardWeb)
Visualisation de
Balanced Score Card
(FreeMetricsWeb)
DESCRIPTION
- Seule solution à proposer des rapports sur les KPI (ou Balanced Score Card)
- Doit parfois être complétée par l’utilisation de clients lourds
o FreeMetaData pour la conception des vues métier (automatiquement déployées dans le
référentiel de la plateforme)
o FreeAnalysisDesigner pour produire le fichier descripteur d’interrogation du cube
Mondrian (fichier « schema » cf. § V.B.2.2)
Notes
o FreeDashBoardDesigner permet la définition du « dictionnaire de données » déployé
automatiquement dans le référentiel de FreeDashboardWeb
o FreeMetrics se décompose en « FreeMetricsAdmin », « FreeMetricsAlert », «
FreeMetricsDesigner », « FreeMetricsLoader » qui permettent une gestion plus fine des
Balanced Score Card. Les configurations sont automatiquement disponibles pour
FreeMetricsWeb.
Ce document est sous licence GNU Free Documentation Licence. Page 79/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.5.1 Portail
Le portail est un portail spécifique, non compatible avec les normes JSR168. Chaque application
intégrée est une application autonome qui se trouve agrégée dans le portail « BPM BI Portal ».
Les solutions web correspondent aux clients lourds, modulo quelques aménagements nécessités par
l’interface.
FREEMETADATA v0.40
Conception graphique des vues métier
MOE : Conception de
- JVM
vues métier, pour mise à
Public Pré-requis - Accès aux données physiques
disposition d’utilisateurs
- Langage SQL
DESCRIPTION
Notes Avec « Pentaho MetaDataEditor », autre solution « évoluée » de conception des vues métier
Ce document est sous licence GNU Free Documentation Licence. Page 80/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.5.3.2 FreeDashboardDesigner
L’outil dédié permet la définition de tableaux de bord s’appuyant sur la technologie Pentaho des
fichiers « xaction ».
BPM Conseil envisage à terme de développer sa propre technologie support des tableaux de bord,
leur permettant ainsi plus de fonctionnalités et une meilleure intégration de l’outil
« FreeDashboardWeb » dans leur plateforme.
Item PILOTAGE
DESCRIPTION
- Free Dashboard Designer est un client lourd JAVA permettant de construire des dashboards
o Graphes de types JFreeChart et FusionChart (Flash)
o Insertion de tous les composants de FreeAnalysis et de reporting dans le dashboard (Cubes OLAP, Graphes,
JasperReport, BIRT report, JFreeReport, FreeMetrics)
o Publication du dashboard directement dans la plateforme FreeDashboardWeb et Pentaho
Licence Freedashboard Public License (licence MPL avec des clauses supplémentaires)
Ce document est sous licence GNU Free Documentation Licence. Page 81/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
La copie d’écran ci-dessous présente l’interface et ses principales fonctionnalités. A elle seule, elle
permet de concevoir et de produire un regroupement de graphes présentant des indicateurs clés.
Ensuite, le tableau de bord peut être directement déployé dans la plateforme, comme en utilisant
l’outil web « FreeDashboardWeb ».
La différence entre les 2 modes de conception réside dans la capacité du client lourd à gérer un
dictionnaire de données, absent actuellement de la version web.
Ce document est sous licence GNU Free Documentation Licence. Page 82/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.5.3.3 FreeDashBoardWeb
FreeDashboardWeb est le pendant web de l’outil « Free Dashboard Designer ». Cette version
n’intègre pas encore de dictionnaire de données. Son intégration est prévue dans les versions
ultérieures.
Item PILOTAGE
FreeDashBoardWeb v0.61
Interface web, permet de créer et visualiser des dashboards
Utilisateurs :
Visualisation et création - Tomcat, JBoss
Public Pré-requis
des dashboards - Navigateur Internet
DESCRIPTION
Licence Freedashboard Public License (licence MPL avec des clauses supplémentaires)
Sur la version utilisée, quelques incompatibilités entre navigateurs Internet sont apparues. Les
Notes corrections ont été rapidement implémentées.
Utilisation en mode « client/serveur»
Ce document est sous licence GNU Free Documentation Licence. Page 83/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Celle-ci reprend les fonctionnalités de la solution sous Eclipse intitulée « Free Dashboard Designer »
et étudiée au chapitre précédent.
Le tableau de bord produit est déployé automatiquement dans la plateforme et son exécution peut
alors être planifiée pour une liste de destinataires.
Ce document est sous licence GNU Free Documentation Licence. Page 84/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.5.3.4 FreeAnalysisWeb
Au sein de la plateforme BPM Conseil, la navigation dans les cubes ROLAP a été totalement revue.
L’interface de « FreeAnalysisWeb » remplace totalement les interfaces produites par la librairie JPivot.
Des colonnes calculées ont été ajoutées, permettant une représentation des données en mode
tableur.
Item ANALYSE
FreeAnalysisWeb
Interface web, permet de naviguer dans le cube Mondrian
Utilisateurs : Navigation
dans le cube, « drag and
- Tomcat, JBoss
drop » des dimensions,
- Langage MDX (pour édition de requête MDX
Public génération de graphes, Pré-requis
manuelle)
export sous forme de
- Navigateur Internet
rapports
DESCRIPTION
- FreeAnalysisWeb est la version web du client lourd JAVA permettant de naviguer dans un cube OLAP
o Visualisation du cube et des mesures
o Gestion des dimensions et des mesures en « drag and drop »
o Filtrage des dimensions avant insertion au sein du cube
o Edition de requêtes MDX manuelles
o Gestion des graphes
o Export sous forme de rapports aux formats HTML, PDF, Excel
o Ajout des colonnes calculées (addition et soustraction)
Licence Freeanalysis public license (licence MPL avec des clauses supplémentaires)
Ce document est sous licence GNU Free Documentation Licence. Page 85/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Ci-dessous l’interface, présentant une vue en « mode tableur » des données du cube. On note la
capacité d’ajout de colonnes calculées.
Ce document est sous licence GNU Free Documentation Licence. Page 86/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.5.3.5 FreeAnalysis4Excel
FreeAnalysis4Excel est un plugin Excel destiné à interroger un cube Mondrian directement depuis une
dans une feuille du tableur.
Item ANALYSE
FreeAnalysis4Excel
Suite à l’installation des plugins dans Excel, il est possible d’interroger un cube Mondrian
Utilisateurs : Réalisation
Public de « drill-down » depuis Pré-requis - Connaissance d’Excel
Excel
DESCRIPTION
- Depuis Excel, permet d’alimenter les cellules avec les données agrégées présentes dans le cube.
o L’alimentation est réalisé via une connexion sécurisé à la plateforme BPM (recommandé) ou via l’utilisation du
fichier de description, soit d’un cube « fasd », soit d’une metadata « freemetadata ».
o Le choix des dimensions est pour l’instant très limité
o Les fonctions principales sont le drill-down et le drill-up
o La feuille Excel est recréée à chaque utilisation des fonctions principales
Licence NC
Notes Sur un cube Mondrian, permet une analyse des données depuis Excel.
Ce document est sous licence GNU Free Documentation Licence. Page 87/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.5.3.6 FreeWebReport
La conception de rapports « adhoc » est l’élément différenciant les plateformes BI OpenSource. Pour
BPM Conseil, cette conception est réalisée par l’outil « FreeWebReport », directement intégré dans la
plateforme.
Item CONCEPTION
FreeWebReport
Permet la conception d’un rapport « ad hoc » depuis la plate forme BI
Utilisateurs : Permet la
conception de rapport
sans connaissance - Tomcat, JBoss
Public Pré-requis
approfondie du langage - Navigateur Internet
SQL
DESCRIPTION
- Pas de capacité graphique, rapport uniquement sous forme de tableaux de données ou de tableaux croisés
o Les fonctions de calculs «count », « sum », « avg », « min », « max », « first », « deviation » et « variance » sont
disponibles
Licence NC
Les « tableaux croisés » s’apparentent aux tableaux croisés dynamiques d’Excel, sans capacité d’export
Notes
graphique.
Ce document est sous licence GNU Free Documentation Licence. Page 88/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Le choix de ses colonnes permet à l’utilisateur de concevoir des requêtes SQL sans connaissance de
ce langage et du mode d’implémentation physique des données.
Ce document est sous licence GNU Free Documentation Licence. Page 89/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
7.5.3.7 FreeMetrics
Item PILOTAGE
FreeMetrics
Interface web, permet de naviguer de visualiser des métriques sous forme de tableaux de bord
Visualisation des
objectifs stratégique,
- Tomcat, JBoss
Public gestion de la performance Pré-requis
- Navigateur Internet
et satisfaction client
DESCRIPTION
- FreeMetricsWeb, la version web du client lourd JAVA FreeMetricsUser, permet de visualiser des métriques
o Visualisation des tendances
o Visualisation du statut actuel des indicateurs de l’entreprise
o Détails des données pour chaque métrique
o Visualisation de diagrammes et de jauges
o Gestion des alertes
o Export sous forme de rapports
Licence NC
Ce document est sous licence GNU Free Documentation Licence. Page 90/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Cette gestion complexe fait l’objet par BPM Conseil de session de formations aux entreprises qui
mettent en place ce mode de gestion.
Elles aboutissent à la mise en place d’indicateurs, gérés et remontés vers les utilisateurs finaux au
travers de l’interface présentée ci-dessous.
Ce document est sous licence GNU Free Documentation Licence. Page 91/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Pentaho qui est dans notre livre blanc la première solution présentée, intègre les fichiers « xaction »,
permettant la personnalisation lors du reporting de masse.
La société éponyme a d’ailleurs absorbé les projets Mondrian et Kettle, en en faisant partie intégrante
de la solution.
SpagoBI se présente comme un challenger très intéressant par les choix technologiques adoptés.
Chaque composant est intégré comme une portlet selon la norme JSR 168 au sein d’un portail
entièrement modulable, ce qui en simplifie l’administration et l’intégration.
La gestion des versions et des utilisateurs est l’autre point fort de cette solution.
La société JasperSoft édite la suite d’outils constituée autour de JasperReport. Les composants
intégrés excluent donc Birt comme outil de conception et de production de rapports. La version
commerciale intègre seule la capacité de production de rapports « adhoc ».
OpenReports est limité à la consommation de rapports figés. Cette plateforme n’offre pas toute la
richesse des autres présentées.
BPM Conseil est une plateforme riche, en progression constante. Quelques défauts de jeunesse sont
rapidement rattrapés. Elle rejoint rapidement les trois grandes solutions présentées plus haut.
Au-delà de leur apport dans l’industrialisation, de l’unification de l’accès aux outils, le principal
caractère différenciant des plateformes se concentre dans leur outil de conception du reporting
« adhoc ». La plateforme BPM Conseil intègre en plus le composant FreeMetrics permettant le BSC.
Capacité à créer de Le formatage des dates Les fonctions Les fonctions Les fonctions
nouvelles données et des champs arithmétiques arithmétiques arithmétiques
calculées numériques est prévu, « comptage », classiques sont « comptage »,
les fonctions « somme », intégrées. AdHoc « somme »,
arithmétiques « moyenne », Editor permet « moyenne »,
« comptage », « minimum », également l’ajout de « minimum »,
« somme », « maximum » sont colonnes calculées. « maximum »,
« moyenne », intégrées « premier » sont
« minimum », intégrées.
« maximum » sont
Ce document est sous licence GNU Free Documentation Licence. Page 92/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Sécurité Les droits sont attribués Les droits sont Les droits sont Les droits sont attribués
globalement par attribués par attribués par par utilisateurs, par
utilisateur sur la couche utilisateurs et par utilisateurs et par groupes et par sous
d’abstraction créée. profils sur la couche groupes sur la couche ensemble de données
d’abstraction créée. d’abstraction créée. sur la couche
d’abstraction créée.
Fonction de contrôle Le contrôle des actions Le périmètre d’actions Le périmètre d’actions Le périmètre d’actions
des utilisateurs des utilisateurs se limite possible est défini au est défini par les rôles possibles est affecté au
aux groupes possédant niveau du groupe affectés aux groupe auquel
des rôles figés. auquel appartient d’utilisateurs où à appartient l’utilisateur.
l’utilisateur. leurs groupes
d’appartenance.
Mise en forme Un template peut être La mise en forme est La version Un template peut être
utilisé, permettant une limitée au commerciale permet utilisé, permettant une
personnalisation. regroupement. d’utiliser un template personnalisation.
de personnalisation.
Ce template est défini La présentation de Les formats « portrait »
par un fichier « xml » sortie est figée. et « paysage », ainsi
que la gestion et pied de
Les formats « portrait » page est aussi possible
et « paysage »,
l’alignement du contenu
des colonnes et la
gestion de l’entête et
pied de page est aussi
possible
Vision de L’information est L’information est L’information peut L’information peut être
l’information restituée sous forme de restituée sous forme être restituée au choix restituée sous forme de
liste uniquement. de liste uniquement. sous forme de liste, liste ou tableau croisé.
tableau croisé et
graphe.
Les formats d’export Les formats d’export Les formats d’export Les formats d’export
Mise à disposition possibles sont : possibles sont : possibles sont : possibles sont :
PDF PDF PDF PDF
HTML HTML Excel HTML
Excel Excel RTF Excel
CSV CSV CSV CSV
RTF Flash RTF
XML
TXT
L’export en
« jrxml »est aussi
possible afin de
permettre une reprise
sous iReport.
Ce document est sous licence GNU Free Documentation Licence. Page 93/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Fonctions avancées La seule action possible La seule action La seule action La seule action possible
sur la couche possible sur la couche possible sur la couche sur la couche
d’abstraction est le d’abstraction est le d’abstraction est le d’abstraction est le
filtrage des données filtrage des données filtrage des données filtrage des données
avant restitution. avant restitution. avant restitution. avant restitution.
Capitalisation Seule la couche La vue créée par un Seule la couche Seule la couche
(enregistrement de d’abstraction peut être utilisateur sur la d’abstraction peut être d’abstraction peut être
requêtes, de mutualisée. couche d’abstraction mutualisée. mutualisée.
modèles, de vues peut être
réutilisables…) La vue créée par un sauvegardée et La vue créée par un La vue créée par un
utilisateur sur cette partagée par utilisateur sur cette utilisateur sur cette
couche ne peut être plusieurs utilisateurs. couche ne peut être couche ne peut être
sauvegardée. sauvegardée. sauvegardée.
Ce document est sous licence GNU Free Documentation Licence. Page 94/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
Les plateformes existantes vont plus loin que la simple agrégation de composants, puisqu’elles
permettent en plus de concevoir des sous-ensembles de données et du reporting « ad-hoc », avec les
limitations et les spécificités que nous avons exposées plus haut pour chaque solution.
Pour aller plus loin, il est possible d’appréhender une réponse à des besoins venus de l’usage, en
adoptant au sein de l’entreprise un portail compatible JSR 168 tel que Liferay, d’y construire et d’y
intégrer différentes « portlets » qui vont chacune offrir des solutions des reporting et d’analyse.
Nous avons ainsi intégré avec succès JasperReport, BIRT, web-Palo ou JPivot dans un portail
commun et adaptée à l’intranet de l’entreprise. La gestion des utilisateurs existante (au moyen d’un
annuaire LDAP OpenSource tel qu’OpenLDAP ou propriétaire tel qu’ActiveDirectory) permet de définir
les outils et les périmètres accessibles à chaque utilisateur.
Les outils BI propriétaires tels que Business Objects et SAS peuvent aussi, sous réserve d’interface
d’accès spécifiques, s’intégrer dans des « portlets » et venir compléter l’offre BI OpenSource.
On peut donc, sous réserve d’avoir une expertise approfondie sur les outils BI OpenSource et
propriétaires, adapter une solution BI personnalisée à l’entreprise et à ses besoins.
Ce document est sous licence GNU Free Documentation Licence. Page 95/97
Restituer, Analyser et Piloter : Evaluer les opportunités Open Source
9 POUR CONCLURE…
Nous avons parcouru tout au long de ce livre blanc, un large périmètre de l’outillage BI disponible
dans le monde de l’Open Source.
A l’inverse de l’édition propriétaire qui relève plus d’un marketing de l’offre que de l’usage, l’édition
Open Source prend son inspiration dans les attentes utilisateurs. En ce sens il s’agit d’une approche
pragmatique de la prestation informatique.
Il apparaît clairement que l’offre Open Source associée à une expertise BI (tant conseil que mise en
œuvre) est pertinente pour répondre à une large gamme de services attendus par les directions
métiers et leur DSI :
Que ce soit pour du reporting de masse (diffusion de rapports statiques ou dynamique à un large
périmètre d’utilisateurs par tous les canaux disponibles),
Que ce soit pour des services d’analyse de l’activité à destination des managers (analyse
multidimensionnelle),
Que ce soit pour fournir des tableaux de bord synthétiques à destination des directions, leur offrant
ainsi un visuel ergonomique sur l’avancement de leurs objectifs,
Ou encore pour permettre l’agrégation de composants BI distincts dans un portail web. Ce qui rend
possible le déploiement d’outils adaptés et ciblés au sein de l’entreprise, sans recourir à des
développements spécifiques conséquents.
Il est vrai, la partie Ad hoc (permettre aux utilisateurs finaux la construction personnalisée d’un rapport
à partir d’une vue métier des données) présente encore une limitation chez la majeure partie des
éditeurs. Mais elle peut être compensée par une conception en amont tenant compte de cette
limitation ou encore relever de choix d’organisation (contrôler la production de rapport par la DSI en
l’intégrant dans un cycle projet) – Cependant les efforts actuels des éditeurs se portent tous sur ce
point.
D’un point de vue technique, une attention particulière devra être portée aux pré-requis techniques,
concernant l’intégration et la configuration nécessaire des plateformes décisionnelles.
De même, certaines compétences SQL et/ou Java permettront une meilleure adoption de solutions
demandant parfois un haut niveau de technicité.
Nos retours d’expérience clients et nos liens avec l’écosystème nous amènent à considérer que la
réussite d’un projet métier repose dans l’association d’éditeurs Open Source et d’un intégrateur
fédérateur.
Ce dernier, par son savoir faire et son expérience autour de ces technologies est le rouage essentiel
dans l’assemblage qui détermine le caractère innovant de la solution.
Ce document est sous licence GNU Free Documentation Licence. Page 96/97