Escolar Documentos
Profissional Documentos
Cultura Documentos
devant le jury :
Prsident :
M. Eric GRESSIER-SOUDAN
Examinateurs :
M. Jean-Pierre GIRAUDIN
Mme Vronique PANNE
M. Andr PLISSON
M. Eric SELLIN
M. Mathias VOISIN-FRADIN
Tuteur :
M. Jrme GENSEL
Remerciements
Sommaire
Introduction ...........................................................................................................................1
I. Le concept SOLAP ............................................................................................................2
A. Linformatique dcisionnelle .........................................................................................2
1. Le modle multidimensionnel ..................................................................................2
2. Diffrences avec le modle relationnel ....................................................................3
3. Architecture dun systme dcisionnel .....................................................................4
a. Sources de donnes ............................................................................................5
b. Outils dextraction, transformation et chargement ...............................................5
c. Entrept de donnes............................................................................................6
d. Traitement analytique en ligne OLAP ..................................................................6
e. Outils de visualisation ..........................................................................................8
f. Mtadonnes ........................................................................................................8
B. Linformation gographique .........................................................................................9
1. La donne gographique .........................................................................................9
2. Systme dinformation gographique ......................................................................9
C. Dcisionnelle + Gographique = SOLAP ................................................................. 10
1. Relations spatiales .................................................................................................11
2. Relations temporelles ........................................................................................... 13
3. Relations spatio-temporelles................................................................................. 14
II. Analyse comparative des outils existants ...................................................................... 16
A. Primtre de lanalyse .............................................................................................. 16
B. Critres dvaluation ................................................................................................. 17
C. Prsentation des outils ............................................................................................. 18
1. Produits de rfrence............................................................................................ 18
a. JMap ................................................................................................................. 18
b. SAS Web OLAP Viewer for Java ...................................................................... 19
c. Spatialytics ........................................................................................................ 21
2. Les nouveaux arrivants ......................................................................................... 22
a. Map4Decision ................................................................................................... 22
b. Les autres outils mergents.............................................................................. 24
D. Comparaison et bilan ................................................................................................ 24
Conclusion ......................................................................................................................... 27
Annexe A : Les oprateurs OLAP ...................................................................................... 28
Annexe B : Modles des bases de donnes ROLAP. ....................................................... 30
Annexe C : Les architectures OLAP. ................................................................................. 32
Annexe D : Liens utiles ...................................................................................................... 33
Glossaire ........................................................................................................................... 34
Bibliographie ...................................................................................................................... 35
Ci-dessous, vous trouverez une liste alphabtique des acronymes utiliss dans ce
document :
3FN
BDM
BDR
BI
DSI
DSS
ETL
HOLAP
IGN
MNT
MOLAP
OLAP
OLTP
ROLAP
SGBD
SI
SIG
SOLAP
SQL
XML
Introduction
Introduction
Linformation est dsormais omniprsente dans nos socits, et la matriser est un enjeu
stratgique, ainsi quun passage oblig avant toute prise de dcision.
Mme si linformatique dcisionnelle offre des solutions depuis le milieu des annes 90 pour
lexploitation des donnes, jusqu trs rcemment, toute une partie de ces informations
restait peu exploite : il sagit du domaine spatial, entre temps devenu crucial.
En effet, impossible dchapper la gomatique* de nos jours, elle sinvite dans toutes les
discussions, jusquaux plus hautes sphres, quelles soient prives ou gouvernementales.
Ltude de la dimension spatiale, et son croisement avec les problmatiques quotidiennes
des entreprises en font un axe dcisif de dveloppement pour celles qui veulent un avantage
de poids dans la course concurrentielle. Ceci explique pourquoi ce secteur conomique, si
Parmi les technologies et concepts utiliss pour rpondre ces problmatiques, le traitement
spatial et analytique en ligne, plus communment nomm Spatial OLAP ou SOLAP, est
une solution rcente, encore peu dfriche, mais pourtant lintersection de deux normes
marchs : les outils daide la dcision, et les systmes dinformations gographiques.
Mon prdcesseur, Benot Le Rubrus, a, en 2009, men une analyse comparative pour
lui, a pour but de focaliser sur les capacits des logiciels Spatial OLAP actuels en termes de
requtes spatiales, temporelles et spartio-temporelles.
notions et des concepts importants, que sont linformatique dcisionnelle et linformation
partie rappelle les enjeux puis conduit lanalyse comparative des outils utilisant cette
technologie, sur les critres focaliss, et conclut sur une synthse des rsultats obtenus.
I. Le concept SOLAP
Le traitement spatial et analytique en ligne ou SOLAP, par son nom et les technologies sur
lesquelles il repose, est la runion de deux concepts : la spatialisation des donnes, et leur
exploitation dans les systmes daide la dcision.
Lexploration et le croisement dinformations sont un exercice connu. Cependant, si lon
considre les donnes spatiales, les outils en sont leurs dbuts, mme sils sintgrent
progressivement aux systmes dcisionnels.
Cette premire partie prsente linformatique dcisionnelle, puis le modle
multidimensionnel et ses diffrences avec le modle relationnel, les principes qui la
dans cette partie focalise sur la conjonction de deux mondes, dont SOLAP est le rsultat.
A. Linformatique dcisionnelle
Conscients que lune des plus grandes richesses dune entreprise est son information, mais
noys sous de nombreuses donnes, parses, dstructures et htrognes, les dirigeants
sont faces une problmatique de taille : comment analyser ces informations, dans des
temps raisonnables ? Celles-ci concernent-elles toutes les mmes priodes ? Ces dcideurs
ont besoin quon leur expose les faits importants, bases de leurs dcisions [LC2008].
Cest ce quoi linformatique dcisionnelle (aussi nomme DSS pour Decision Support
System ou encore BI pour Business Intelligence) est destine. Elle prend une place en
constante croissance dans les systmes dinformation (SI) depuis son apparition, dans les
annes 90.
Elle permet une slection des informations oprationnelles pertinentes pour lentreprise.
Celles-ci sont ensuite normalises pour alimenter un entrept de donnes. De ce concept
est ne la notion de modlisation dimensionnelle. Cette dernire est fondamentale pour
rpondre aux exigences de rapidit et de facilit danalyse. Elle permet, en outre, de rendre
les donnes dun entrept cohrentes, lisibles, intelligibles et faciles daccs [LC2008].
Linformatique dcisionnelle doit produire des indicateurs et des rapports lattention des
analystes. Elle doit galement proposer des outils de navigation, dinterrogation et de
visualisation de lentrept.
1. Le modle multidimensionnel
Le modle multidimensionnel est la combinaison de tables de dimensions et de faits. Le fait
est le sujet de lanalyse. Il est form de mesures, gnralement numriques, renseignes de
manire continue. Ces mesures permettent de rsumer un grand nombre denregistrements
des donnes sources en quelques-uns. Le fait est analys selon des perspectives, nommes
dimensions. Chacune contient une structure hirarchique ; la dimension temps , par
exemple, pourrait tre divise en annes, trimestres, mois, semaines, jours...
Indicateur de vente :
Exemple :
Clavier, Est, 1T2005 : 30 units
Dimension
Produit :
Disque dur
Moniteur
Clavier
30
Souris
Dimension Rgion :
Ouest Est Nord Sud
:
ps
m
e
4T2005
nT
o
i
3T2005
ns
me 2T2005
i
D
1T2005
- La grande diffrence provient du systme de traitement des donnes. Les BDR utilisent
le traitement transactionnel en ligne (On-Line Transaction Processing OLTP), qui permet
seule la version jour, linstant de la slection est intrressante. Les BDM reposent
sur le traitement analytique en ligne (On-Line Analytical Processing OLAP), en lecture
uniquement. Lintrt est de focaliser sur la consultation de grandes quantits de donnes,
historises pour constater de lvolution dun indicateur, par exemple.
Pour conclure, les BDM sont beaucoup plus mme de supporter les analyses ncessaires
aux systmes daide la dcision.
f.
b.
Sources
externes
a.
BDs
oprationnelles
Sources de
donnes
Extraire
Nettoyer
Transformer
Charger
Rafrachir
Mta-donnes
Requtes &
Rapports
c.
Serveur
OLAP
Entrept
de donnes
d.
Data marts
Bottom-tiers :
Serveur DW
e.
Servir
Serveur
OLAP
Middle-tiers :
Moteur OLAP
Analyses
Data mining
Top-tiers :
GUI
Figure 2 : Ensemble des composants intervenant dans un systme dcisionnel (Source : [LC2008]).
Cette section propose de parcourir les diffrents lments ncessaires (illustrs par la
donnes jusqu leur restitution sous forme agrge, synthtise et normalise.
donnes manquantes ;
- Le ddoublonnage est ncessaire lorsque plusieurs sources de donnes partagent des
donnes communes ;
en un ensemble de champs (anne, mois, jour, heure, minute, etc.), contenant chacun
une information pertinente ;
- La dnormalisation est invitable si la source est une base de donnes relationnelle, qui
utilise gnralement la troisime forme normale* (3FN), interdisant toute redondance.
noter que le formatage et la dnormalisation peuvent tre contradictoires car dans le cas
de les normaliser nouveau ;
- La synchronisation garantit la cohrence des agrgats de lentrept ;
- Lagrgation est une collection doprations possibles effectuer sur les donnes. Les
plus courantes sont la somme, la moyenne, le comptage, la somme cumule, le minimum,
le maximum. Ces oprations sont considrer compte tenu du niveau de granularit* de
lentrept.
Ces tches conditionnent la qualit des donnes du systme dcisionnel. ce titre,
cette tape apparat comme la plus importante et la plus complexe effectuer lors de
limplantation dun entrept de donnes [BLM1998].
5
Entre entrept et OLAP, il ny a quun pas. En effet, lentrept est le lieu de stockage physique
des donnes, tandis que lOLAP est loutil permettant leur analyse multidimensionnelle.
Celle-ci est lobjet dune requte particulire, mise par lutilisateur, contrario du forage
(data mining) qui vise la recherche de corrlations entre les donnes dans lintgralit de
lentrept [RL2008].
des oprateurs. Il sagit de mcanismes servant naviguer dans les hirarchies et les
dimensions. Les oprateurs, illustrs dans lannexe A, permettent de [LR2009,Don2006] :
- Tailler (slicing, scoping) : autorise lextraction dune tranche, dun bloc dinformations.
Il sagit dune slection classique ;
- Pivoter (rotate ou swap) : permet dinterchanger deux dimensions ;
- Remonter (roll-up) : synthtise les informations en fonction dune dimension.
Par exemple, sur la dimension gographique, il sagirait de passer du niveau dpartement
au niveau rgion ;
- Forer (drill-down) : il sagit de linverse du (drill-up), on zoome sur une des dimensions
(de la rgion au dpartement) ;
- Forer latralement (drill-accross) : en restant au mme niveau des dimensions, permet
de changer lune des valeurs. Par exemple, passer de lanne 1998 lanne 1999.
Le forage latral sur une dimension spatiale peut paratre aussi simple, si lon considre
que lon passe, par exemple, dun dpartement un autre. On peut sinterroger sur la
pertinence de passer de lAin lAine. Ne serait-il pas plus pertinent de rester dans la
rgion ? Ou de considrer des critres de voisinnage ?
- Percer (drill-through) : permet daccder au dtail des informations, lorsquon ne dispose
que de donnes agrges (possible uniquement avec Hybrid OLAP).
Larchitecture dun systme OLAP peut se dcliner sous plusieurs formes, selon la technologie
utilise. On peut rencontrer des approches sans serveur OLAP, il sagit alors de bases de
donnes relationnelles, o rien nest nativement prvu pour linformatique dcisionnelle. Il
faut alors que la requte, construite dans le langage SQL* (Structured Query Language),
analystes nont pas forcment.
Lapproche ROLAP (Relationnal OLAP) est aussi base sur une BDR, mais simulant une
structure multidimensionnelle. Les tables sont alors organises selon un des modles
dcrits dans lannexe B.
Lapproche MOLAP (Multidimensional OLAP) est optimise, comme son nom lindique, pour
lanalyse multidimensionnelle dont elle en gre la structure de manire physique.
HOLAP (Hybrid OLAP) est un croisement des approches MOLAP et ROLAP. Les donnes
dtailles sont stockes dans une BDR tandis que celles agrges le sont dans une BDM
[GO2008, LR2009, Bd-a].
Un tableau comparatif de ces architectures est prsent dans lannexe C.
B. Linformation gographique
Il est estim quenviron 80 % des donnes stockes dans des bases de donnes dentreprises
intgrent des informations caractre gographique [BMT2005].
Ces donnes deviennent de plus en plus stratgiques, quelquen soit le domaine.
lvolution de sa zone de chalandise ; pour les services de veille sanitaire, de pouvoir suivre
la progression dune pidmie ou le dplacement dun nuage radioactif, dans le temps et
lespace ; ou encore pour les rseaux sociaux, o il sagirait de croiser les contributions des
membres, en fonction dun vnement.
ensuite voquer le systme dinformation gographique (SIG) et les prrogatives de ces
systmes, sa place vis--vis du SOLAP, ainsi que les enjeux de ce dernier.
1. La donne gographique
Avant daller plus en avant, un point doit tre fait sur la notion mme de donne
gographique . De trs nombreuses donnes ont un caractre spatial, comme par exemple,
des adresses, des codes postaux, des pays, des coordonnes latitudinales et longitudinales.
De manire gnrale, il sagit donc dassocier aux objets une thmatique et leur localisation
topologiques entre les objets, relations que nous allons dcrire dans le chapitre C.
En ajoutant la dimension temporelle, gnralement dj bien gre dans les systmes
est la reprsentation dun objet ou dun phnomne rel, localis dans lespace un moment
donn [DS1996].
Toute information gographique doit prciser son systme de localisation. Il peut sagir du type
direct (mathmatique) : tout point terrestre peut, en effet, tre repr par ses coordonnes
latitude et longitude. Pour le type indirect, la description est smantique, indiquant le nom
passage dune rfrence indirecte une rfrence directe, les descriptions textuelles sont
classes dans des rpertoires, diffuss par des organismes spcialiss comme lInstitut de
Gographie Nationale (IGN) en France, ou GEOREP au Canada [LR2009, Pro2001].
Pour reprsenter le monde rel, trois primitives gographiques peuvent tre utilises :
le point, la ligne et la surface. Grce ces entits gomtriques, on peut les assembler
(les rivires sont une succession de coordonnes, mettant en jeu les lignes en amont, et
les surfaces leur embouchure), les composer (un objet peut tre compos de plusieurs
autres, comme par exemple, une fort est compose de plusieurs surfaces) ou construire
des relations topologiques.
France
PoitouCharentes
Isre
RhneAlpes
France
Pays de
la Loire
Rhne
Rhne
Figure 3 : Reprsentations des types de dimensions spatiales, de gauche droite, descriptive, gomtrique
et mixte.
10
Grce ces enregistrements et aux capacits du SOLAP, les utilisateurs vont pouvoir
effectuer des requtes plus spcialises, bases notamment sur les relations spatiales,
temporelles ou spatio-temporelles des donnes.
Travailler sur des entits spatiales et temporelles implique naturellement de les localiser et
de les dcrire individuellement, mais aussi de les considrer collectivement en dcrivant
leurs relations dans le temps et dans lespace. Pour les relations spatiales, il est primordial
dapprhender les notions de distance, dorientation, et de topologie. Concernant les
relations temporelles, les relations de J. Allen font rfrence, la gestion des vnements
rcurrents peut aussi entrer en considration. La combinaison des deux amne tudier
des dplacements dans un environnement, ventuellement dformable.
1. Relations spatiales
Il est courant, dans notre vie quotidienne, dutiliser les relations spatiales pour dcrire, par
exemple, un paysage : larbre est dans le champ qui borde la route, au nord du village .
Ceci nous permet de situer des objets les uns par rapport aux autres.
Lorsquon voque les relations spatiales, on doit en distinguer trois sortes.
Tout dabord, la topologie est lensemble des relations perues qui nous permettent de
situer les objets. Elle est fondamentale dans lanalyse spatiale. Sans elle, il serait impossible
dextraire des informations sur le voisinage dune unit (adjacence), sur les croisements de
deux surfaces (intersection), ou sur le sens dcoulement de leau dune rivire (connectivit).
Mathmatiquement, il sagit de ltude des proprits gomtriques se conservant
par dformation continue, puis gnralises pour englober les notions de limites et de
voisinage [PLI2000].
Unit de rfrence
Adjacence au sens strict
Adjacence au sens large
Adjacence du second ordre
11
- La connectivit exprime ladjacence pour des rseaux linaires. Il sagit de lier les
diffrents segments constitutifs du rseau, tout en leur donnant (ou non) une orientation.
La connectivit est notamment utilise pour reprsenter les rseaux de distribution (eau,
gaz, lectricit) ;
- Linclusion est utilise pour dterminer si une unit A est un sous-ensemble dune autre
(B). Alors tout point de A est contenu dans B ( A B ). Lexemple le plus naturel est la
relation entre une rgion et son pays ;
- Lintersection exprime le point ou la surface commune deux entits (A B) ;
- La connexit formalise le concept d tre un seul tenant .
Certaines relations logiques ne sont pas voques par des points distincts, car tant des cas
particuliers. Cest le cas de la disjonction, quivalente la non-intersection, ou de lgalit
qui est une inclusion spciale.
Ensuite, la distance. Elle peut tre trs paradoxale, selon la manire dont on la manipule.
La distance orthodromique* ( vol doiseau ) est bien plus courte que la distance que
lon devra parcourir rellement si lon doit marcher entre, par exemple, deux villes, en
franchissant la chane montagneuse qui les sparent, ou encore, si lon devait emprunter le
rseau routier, qui lui, contourne le massif [CS2010]. Deux types de distances peuvent tre
voques :
- La distance quantitative correspond un nombre de kilomtres, par exemple ;
- La distance qualitative voque lcartement entre les objets, selon sils sont proches ou loigns .
N
NO
NE
SE
SO
S
huit valeurs linguistiques : nord, nord-est, est, sud-est, sud, sud-ouest, ouest, nord-ouest.
La smantique de chaque valeur est donne par une fonction dappartenance trapzodale,
12
2. Relations temporelles
Les requtes temporelles sont gnralement bases sur lalgbre dintervalles de James
Allen, introduite en 1983 [All1983]. Il sagit dun ensemble complet doprateurs boolens
de base pour le positionnement relatif dans le temps : prcde, succde, gale, rencontre,
Ces relations sont le pendant temporel des relations topologiques que lon applique au ct
spatial. Cependant, dautres notions peuvent entrer en compte, comme par exemple, les
cycles, vnements rcurrents ayant une priodicit rgulire [Pas2004] : heures de pointe
Figure 7 :
Reprsentation temporelle sur
carte : gauche, multicartes
thmatiques, au dessus,
carte unique avec diagrammes
superposs (Source : [Riv2010]).
13
La reprsentation temporelle sur carte est possible de plusieurs faons (comme lillustre la
3. Relations spatio-temporelles
existence. chaque instant, cet objet est localisable dans lespace. Grce la combinaison
des requtes spatiales et temporelles, on peut suivre la trajectoire dobjets ou la propagation
dun lment.
Figure 8 :
Trajectoires, sans ( gauche) et avec
environnement gographique ( droite)
(Source : [Run2010]).
Une trajectoire est une volution de positions dun objet dans un espace, et dans un
rcupres une frquence rgulire. De plus, lenvironnement gographique de lobjet
doit tre connu si lon veut tirer un maximum dinformations de ces donnes, comme lillustre
Le concept d origine-destination
dterminer la rpartition dune demande entre une origine et une destination. Cela sert
en rgulant les vitesses (abaissement des limitations), en changeant les temporisations des
panneaux urbains, etc. Cette fonctionnalit implique que le cube danalyse contienne deux
Lutilisation de trajectoires et le recoupement des origines-destinations permettent danticiper
les ventuels points bloquants, en proposant le contournement de certaines zones. Ce peut
tre le cas, en prenant en exemple un vnement rcent, pour vacuer la population ou
dtourner la circulation dun lieu o la radioactivit est trop leve.
14
4. Limite du SOLAP
du SOLAP, et donc den dmontrer la limite. Il ne sera donc pas repris dans les lments
comparatifs des outils.
Figure 9 : Gestion de lhistorique sur des entits ayant volues : gauche, lURSS de 1991, droite, les
pays rsultant de la division de lUnion Sovitique, aprs 1991 (Source : [Lav2009]).
15
A. Primtre de lanalyse
Ce rapport ne se veut pas destin accueillir la liste exhaustive des outils SOLAP existants
il est la suite focalise sur les problmatiques spatiales, temporelles et spatio-temporelles
du rapport de Benot Le Rubrus [LR2009]. Lanalyse qui y tait mene, tait base sur une
tude ralise en 2007 par lquipe dYvan Bdard sur les outils SOLAP commerciaux,
complte par la considration des offres libres et des prototypes utiliss dans le cadre de
la recherche [BPR2007].
fait quen 2007, et encore en 2009, ils taient les plus prometteurs. Ceci permettra de
statuer sur leur pertinence actuelle et dtablir notre base de rfrence. Les nouveaux
arrivants sur le march sont ensuite examins. Pour ceux-ci, deux sources sont tudies.
La premire est une slection doutils commerciaux, que lquipe dYvan Bdard
garde jour [Bd-b]. La seconde est un compte-rendu de la goconfrence
Free and Opensource Software for Geospatial (FOSS4G), qui sest tenue Barcelone
dbut septembre 2010. Il en sort, en effet, que loffre open-source dans ce secteur est
mature et que donc, elle a volu depuis lanalyse faite par mon prdcesseur [Fra2010].
Logiciel
JMap
Spatialytics
Map4 Decision
K2 Geospatial
SAS-ESRI
GeoSOA
Intelli3
Dernire version
4.0i
ArcGIS 10 SP2
Geo Mondrian
1.0.0.97
Date de version
Janvier 2011
Avril 2011
Nov. 2009
Juin 2010
Guide de lutilisateur
oui
oui
non
oui
Fiche technique
oui
oui
non
oui
Vido de dmonstration
non
oui
oui
oui
non
non
non
oui
Support de confrence
non
non
oui
oui
Editeur
Tableau 1 : Liste des sources dinformation collectes sur logiciels retenus. Prcisions sur leur diteur,
numro et date de dernire version.
16
Daprs ltude du LGS Group, il existe trois approches rsultant de la combinaison SIG et
o les fonctions SIG sont trop restreintes, ou SIG-domimants, o les oprateurs OLAP
sont trop limits [Lgs2000]. Par consquent, seules les premires seront retenues dans ce
document.
Pour conclure, en considrant uniquement des solutions intgres, provenant la fois du
rapport de Benot Le Rubrus et des deux sources supplmentaires, le tableau 1, ci-dessus,
indique les outils retenus, ainsi que les sources dinformations utilises pour mener lanalyse.
B. Critres dvaluation
Les critres retenus pour mener bien cette tude comparative ont pour objectif daider
une organisation faire un choix parmi loffre existante. Ceux-ci portent sur les capacits
spatiales, temporelles et spatio-temporelles des outils SOLAP. Les rsultats en termes
permettre une vue globale des possibilits techniques offertes.
1. Les capacits oprer des requtes spatiales sont, bien entendu, un des critres les plus
importants :
- Permettre lutilisation des relations topologiques : adjacence, connectivit, inclusion,
intersection, connexit ;
- Prciser et calculer des distances: les deux types doivent tre paramtrables. Il peut
sagir de distance qualitative ou quantitative : par exemple, la prsence dun objet dans
un rayon de 20 km, par rapport au point de rfrence ou la distance laquelle le parc le
plus proche est ;
- Rechercher selon des critres dorientation : trouver les terrains constructibles au sud
de la voie rapide ;
constructible, au sud de la voie rapide, moins de 20 km dun parc ;
2. La gestion des relations temporelles, second critre dcisif, doit permettre de :
- Grer les 13 relations de James Allen : cet vnement sest-il droul avant tel autre ?
- Reconnatre ou permettre la recherche dvnements priodiques : comment mieux
connatre les cycles de migration des hirondelles ?
- Reprsenter le temps sur des cartes : il sagit ici de dcrire comment loutil permet
la reprsentation et le contrle du temps, notamment par lutilisation dun curseur sur
une glissire, ou par la possibilit de faire une lecture du temps (faire progresser le
curseur sur la glissire) ;
3. La combinaison spatio-temporelle nest pas toujours aussi triviale que le simple rsultat
du produit des capacits spatiales et temporelles de loutil. Ce dernier doit tre capable de :
- Permettre le calcul et la reprsentation de trajectoires ;
17
Analyse comparative des outils existants - Critres dvaluation / Prsentation des outils
1. Produits de rfrence
Les produits tudis proviennent des analyses effectues par mon prdecesseur, Benot Le
Rubrus. Ils ont dj fait lobjet dune tude dtaille sur des critres darchitecture, de type
de forages, et de cartographies. Il faut donc complter avec les critres spatiaux, temporels
et spatio-temporels.
a. JMap
Le dveloppement du logiciel JMap (anciennement nomm JMap Spatial OLAP) a fait
lobjet, en 2005, dun transfert technologique du centre de recherche de gomatique de
lUniversit Laval vers la socit K2 Geospatial (anciennement KHEOPS Technology).
Il tait alors le rsultat le plus abouti de travaux sur des prcdents prototypes qui ont pu tre
hub gospatial , et permet de le spcialiser grce lutilisation dextensions (plugin) [K2G].
JMap embarque des outils pour effectuer des requtes spatiales. Plusieurs types de critres
spatiaux sont disponibles, mais tous utilisent une slection de rfrence comme base de
recherche. Voici deux exemples :
- rechercher les parcs, dans un rayon de 1000 mtres par rapport au point slectionn,
- dterminer les lots qui touchent la rivire en cours dtude.
18
laquelle porte la recherche (objet de la recherche), puis de (2) choisir les options de
recherche, permettant notamment dajouter les lments trouvs la slection en cours.
Finalement, il faut choisir le critre spatial appliquer la recherche (3) [K2G2010]. Grce
la documentation en ligne, on peut constater que les recherches peuvent aussi seffectuer
sur des descriptions (requtes par attributs). Il sait aussi grer les trajectoires [Bd2005].
Rien cependant sur la distance qualitative, ni sur les relations temporelles.
b. SAS Web OLAP Viewer for Java
SAS Web OLAP Viewer for Java* est le fruit de la collaboration de SAS et ESRI, deux
acteurs majeurs des mondes du dcisionnel et des SIG. Larchitecture de cet outil consiste
en le couplage de la solution ArcGIS dESRI avec SAS Enterprise BI Server de SAS (pour
les accs aux hypercubes). Il sagit dune application web, permettant la visualisation et
lexploration des donnes OLAP depuis un navigateur.
Pour en savoir plus sur les capacits spatiales, temporelles et spatio-temporelles, il faut se
de lditeur, ArcGIS permet la modlisation de relations spatiales entre les donnes, par
exemple, la topologie, les rseaux et les mesures numriques de terrain (MNT*) , comme
Figure 11 : Mise en oeuvre dun outil de proximit dans ArcGIS, les couleurs des points sont
dgrades selon la distance, par rapport la
rivire (Source : [Arc2011]).
En tudiant laide en ligne dArcGis (ArcGIS Resource Center), on peut constater que loutil
gre une multitude de types de distances, comme les outils de distance de rseau (pour
prennent en considration que le dplacement peut tre mesur en termes de dpenses
12, droite) [Arc2011].
ArcGIS est capable de grer les relations temporelles, en proposant mme des services
Figure 13 : Exemple dutilisation du curseur de temps dans ArcGIS, sur une carte gnre suite au
tremblement de terre Hati (Source : [Qui2010]).
Voir la dmonstration de la reprsentation de la fuite de ptrole dans le Golfe du Mexique, en mai 2010 :
http://www.arcgis.com/home/webmap/viewer.html?webmap=dfa1e187310c4c7a897e4c919dd3f781
20
c. Spatialytics
Le groupe de recherche GeoSOA dveloppe une solution libre daide la dcision
gospatiale nomme Spatialytics (anciennement connue sous le nom GeoSOA). Celle-ci
est dveloppe partir de la suite Pentaho et est compose de trois logiciels :
- GeoKettle, loutil ETL supportant les donnes spatiales (Pentaho Data Integration) ;
- GeoMondrian, le serveur SOLAP (Pentaho Analysis Services) ;
- SOLAPLayers, composant web de cartographie, permettant de naviguer dans les
hypercubes.
Tous ces logiciels libres sont regroups sur le site Spatialytics.org, tandis que la socit
Solutions Spatialytics Inc. offre un support commercial ces solutions.
Pour cette analyse, GeoMondrian est donc llment tudier. Fonctionant exclusivement
avec PostGIS, extension SIG de PostGreSQL, GeoMondrian se revendique le premier
moteur SOLAP open-source* [Bad2010]. Spatialytics est encore en version exprimentale,
et la communaut autour de GeoMondrian ne semble pas trs active, en effet la dernire
mise jour du code source date de 2009. La dmonstration en ligne, rfrence dans
lannexe D, montre le bon fonctionnement des oprateurs OLAP classiques, notamment le
21
Figure 15 :
22
Analyse comparative des outils existants - Prsentation des outils / Comparaison et bilan
D. Comparaison et bilan
Cette section propose une synthse des rsultats obtenus par les outils prsents dans la
section prcdente. Un bilan des capacits spatiales, temporelles et spatio-temporelles des
outils est avanc partir de cette analyse comparative.
thorique des notions spatiales, temporelles et spatio-temporelles. En effet, aucune tude
na, jusqu prsent, compar ces capacits entre les diffrentes solutions, et nul outil
comparaison avec le monde du traitement de texte, la rfrence serait sans nul doute Word,
dit par Microsoft.
Les critres topologiques (adjacence, connectivit, inclusion, intersection, connexit), de
distance (quantitative et qualitative), et dorientation sont les oprateurs classiques pour
toute requte spatiale. En effet, les SIG se doivent de rpondre aux questions fondamentales
suivantes Quest-ce qui se trouve prs de quoi ? , O se situe tel objet du point
actuel ? ou encore Combien doccurence de ce type dobjet se trouve dans un rayon de
x km ? .
Les outils sont valus en se posant ces questions, ainsi que celles numres dans
la section B Critres dvaluation . La possibilit de constituer des combinaisons de
plusieurs critres rentrent en compte dans lanalyse.
24
Concernant les critres temporels, les primitives qualitatives de James Allen constituent la
base de ce sujet. Ensuite, viennent la gestion et dtection des vnements priodiques ou
curseur.
(origine-destination) et sur la gestion des trajectoires.
Le rsultat de la comparaison est synthtis dans la grille du tableau 2.
Logiciel
JMap
Spatialytics
Map4 Decision
- adjacence
oui
oui
oui
non
- connectivit
oui
oui
non
- inclusion
oui
oui
oui
non
- intersection
Relations spatiales :
Topologique
oui
oui
oui
non
- conexit
oui
non
Distance quantitative
oui
oui
oui
non
Distance qualitative
oui
non
Orientation
non
oui
oui
oui
oui
oui
non
oui
oui
non
oui
non
oui + lecture
non
oui
oui
oui
oui
Pivoter
oui
oui
oui
oui
Forer-Remonter
oui
oui
oui
oui
Forer latralement
oui
oui
oui
oui
Relations spatio-temporelles :
Origine-Destination
Trajectoires
Outils OLAP :
Tableau 2 : Comparaison des capacits spatiales, temporelles et spatio-temporelles des outils SOLAP.
Cette analyse met en vidence la maturit de la solution dESRI, ArcGIS Server, suivie
de prs par JMap, de K2 Geospatial. Ce rsultat sexplique par le fait quArcGIS Server,
coutant les attentes de ses clients.
25
Les pistes damlioration sont nombreuses pour ces quatres solutions, notamment en
matire temporelle, et spatio-temporelle. De nouveaux oprateurs sont ltude dans les
centres de recherche et de devloppement, linovation psera plus lourd dans les critres
de choix des directeurs de systmes dinformation (DSI).
On peut sans doute parier sur une future nette progression de Spatialytics. En effet, aprs
avoir absorb GeoBI (dit par socit Italienne Inova), les acteurs de lOpen-Source tentent
ladoption des solutions libres dans le godcisionnel [Spa2010].
Pour conclure, seul un outil semble actuellement tre en mesure de rpondre
presquentirement nos critres dvaluation ; la solution seconde nest sans doute
pas trs loin derrire, mais de nombreux points restent sans rponse. Loffre libre parat
dpasse, car sans activit depuis 2009. Le benjamin de la slection a jou la transparence,
mais nest pas encore un candidat srieux face aux mastodontes commerciaux.
26
Conclusion
Conclusion
Spatial OLAP, une prsentation de ses
composantes a t mene, les principes de linformatique dcisionnelle, puis les systmes
dinformation gographiques. La description des concepts et fonctions de ces domaines ont
parti des avantages de chacun : laspect analytique dOLAP et la puissance cartographique
des SIG. Cette combinaison, appele SOLAP, offre naturellement de nouveaux oprateurs,
temporels, spatiaux et spatio-temporels, que lon a dcrits.
Ces fonctionnalits ont t la base des critres qui a conduit lanalyse comparative des
outils actuels. Une prsentation de ces logiciels a t propose, en sinterrogeant sur les
options quils mettent disposition pour mettre en oeuvre ces fonctionnalits. En croisant les
informations mises disposition par les diteurs et en consultant les forums de discussions
pu tre trouve. Finalement, lanalyse a mis en avant un logiciel, qui semble la hauteur
27
Annexe A
Frais
Liquide
Frais
IdF
Province
IdF
Province
1995
220
225
163
187
IdF
Province
1996
265
245
152
174
1995
220
225
1997
284
240
145
184
Frais
IdF
Province
IdF
Province
Liquide
Frais
1996
265
245
Liquide
1995
220
225
163
187
IdF
Province
IdF
Province
1996
265
245
152
174
1997
284
240
145
184
1996
265
245
152
174
2003
2000
2001
2002
2003
Canada
28
Annexe A
Niveau gnral
Niveau local
Figure A3 : Oprateurs remonter (en bleu) et forer (en violet) (Source : [LR2009]).
Remonter (roll-up) : synthtise les informations en fonction dune dimension. Par exemple,
sur la dimension gographique, il sagirait de passer du niveau dpartement au niveau
mois ;
Forer (drill-down) : il sagit de linverse du drill-up, on zoome sur une des dimensions
1998
1999
Figure A4 : Oprateur forer latralement sur des donnes temporelles (Source : [LR2009]).
29
Annexe B
DIMENSION 1
DIMENSION 2
DIMENSION 4
FAITS
DIMENSION 5
Mesures
DIMENSION 3
DIMENSION N
Figure B2 :
Annexe B
31
Annexe C
Architecture
RelationnelleOLAP
Architecture
MultidimensionnelleOLAP
Cot
Ncessite lachat
dun
serveur ROLAP
aucun
serveur OLAP requis
Structure de
donnes
Prparation des
donnes
agrges
Ncessite plusieurs
manipulations
et des
connaissances
particulires
Le serveur se charge
de produire les
donnes
agrges
Stockage des
agrgations
Ncessite le
Optimisation des
pr-calcule
donnes
complet des donnes calcules la vole
des donnes
pr-calcules
Optimisation
Aucune. Requiert
beaucoup
despace disque et
de temps de prcalcul
Le serveur se charge
de produire les
donnes
agrges
Optimisation des
donnes
calcules la vole
des donnes
pr-calcules
32
Annexe D
33
Glossaire
Glossaire
Agrgation : Action de calculer les valeurs associes aux positions parents des
dimen sions hirarchiques. Cette agrgation peut tre une somme, une
moyenne, ou tout autre processus plus complexe comme la deuxime
plus forte valeur.
Granularit : Taille du plus petit lment dun systme pouvant tre manipul.
Hypercube : Cube n-dimensions.
Java : Langage de programmation et plate-forme informatique cre par Sun
Microsystems en 1995. Open-source et orient-objet, Java est lun des
langages les plus populaires lheure actuelle.
MNT : Modle numrique de terrain. Reprsentation de valeurs daltitudes
continues sur une surface topographique laide dun tableau de
valeurs Z rfrences par rapport un datum commun. Gnralement
utilis pour reprsenter le relief dun terrain.
Open-Source : La dsignation Open Source (souvent traduit par libre ) sapplique
aux logiciels dont la licence respecte des critres prcisment tablis par
lOpen Source Initiative, cest--dire la possibilit de libre redistribution,
daccs au code source, et de travaux drivs.
Orthodromie : Arc de grand cercle de plus courte distance qui joint deux points
de la surface de la Terre. Par opposition, la loxodromie est la courbe
suivie en coupant les mridiens sous un mme angle, cest la course
reprsente par une droite sur les cartes nautiques qui ne correspond
donc pas la distance la plus courte parcourir.
SQL : Structured Query Language, langage informatique standard et
normalis, destin interroger ou manipuler une base de donnes
relationnelle.
Troisime Forme Les formes normales sont appliques dans les bases de donnes
Normale : relationnelles. Respecter la troisime forme normale prvient la
redondance des donnes, et permet alors une acclration consquente
des requtes de slection.
eXtensible Markup Language. Langage de balisage gnrique. Il sert
essentiellement stocker et transfrer des donnes de type texte
structures en champs arborescents.
34
Bibliographie
Encyclopdies et dictionnaires :
[PLI2000] : Le Petit Larousse Illustr 2000.
(page 1016).
Ouvrages :
[All1983] : James Allen. Novembre 1983.
Maintaining Knowledge about Temporal Intervals.
Paru dans Communications of the ACM, volume 26, numro 11.
(pages 832 843).
[CK2004] : Joe Caserta, Ralph Kimball. 2004.
The Data Warehouse ETL Toolkit, Practical Techniques for Extracting,
Cleaning, Conforming, and Delivering Data.
(526 pages, page xxi).
[DS1996] : Jean Dengre, Franois Salg.1996.
Que Sais-Je ? Les Systmes dInformation Gographique.
Paris : Presse Universitaire de France. Seconde dition : 2004.
(127 pages).
[LC2008] : Gilles Lebrun, Christopher Charrier. 2008.
Informatique Dcisionnelle.
Cours DEST CNAM UE NFE115.
[Lgs2000] : LGS Group. 2000.
Analysis of Health Surveillance Business Intelligence Tools and
Applications : Analysis Methodology and Criteria. Project report.
(19 pages).
[LR2009] : Benot Le Rubrus. Juin 2009.
Capacit de rendu cartographique autour des technologies SOLAP.
Epreuve TEST CNAM UE ENG111.
[LR2011] : Benot Le Rubrus. Janvier 2011.
Cartographie et analyse territoriale multiscalaire. Ringnierie des
logiciels HyperAtlas et HyperAdmin.
Mmoire ingnieur CNAM (143 pages).
[Mei2006] : Andreas Meier. 2006.
Introduction pratique aux bases de donnes relationnelles.
Seconde dition. (pages 197 203).
35
Sites Internet :
[Arc2011] : Arcgis.com. Avril 2011.
ArcGUIS Resource Center : Analyse de proximit.
(consult le 15 mai 2011)
http://help.arcgis.com/fr/arcgisdesktop/10.0/help/index.html#/
na/002s00000008000000/
[Bad2009] : Thierry Badard. Avril 2009.
GeoMondrian in action ! (consult le 8 mai 2011)
http://geosoa.scg.ulaval.ca/~badard/geomondrian_demo/reader.html
[Bad2010] : Thierry Badard. Juin 2010.
Geospatial Business Intelligence made easy with GeoMondrian &
SOLAPLayers. (consult le 8 mai 2011)
http://www.slideshare.net/tbadard/presentation-geobi-rdvosgeoqctbadard
[BBL+2007] : Yvan Bdard, Eveline Bernier, Suzie Larrive, Martin Nadeau, MarieJose Proulx, Sonia Rivest. Octobre 2007.
dun requteur minimal de cubes (consult le 6 mai 2011)
http://sirs.scg.ulaval.ca/YvanBedard/Prof/download/rapportR&D/492.pdf
[BCG+2004] : Yvan Bdard, Jacques Charron, Pierre Gignac, Sonia Rivest. 2004.
Dveloppement dun systme dexploration spatio-temporelle interactive
des donnes de la Banque dinformation corporative du ministre des
Transports du Qubec. (consult le 26 avril 2011)
http://sirs.scg.ulaval.ca/Yvanbedard/article_nonprotege/358.pdf
[BDW2009] : Isabelle Bloch, Sverine Dubuisson, Nicolas Widynski. Juin 2009.
suivi dobjets. (consult le 30 avril 2011)
http://www-pequan.lip6.fr/~dubuisso/media/gretsi_1.pdf
[Bd-a] : Yvan Bdard.
OLAP et SOLAP : notions avances des bases de donnes SIG. (consult
le 24 avril 2011)
http://www.scribd.com/doc/6964842/OLAP-et-SOLAP-complet-avecexplication-ppt-univ-laval
[Bd-b] : Yvan Bdard et al. Novembre 2009.
Spatial OLAP Development Approaches. (consult le 2 mai 2011)
http://spatialolap.scg.ulaval.ca/DevApproaches.asp
36
37
38
39
40
Rsum :
Linformation spatiale a longtemps t mise de ct par lanalyse des donnes par les outils
de traitement analytique en-ligne OLAP. Depuis quelques annes, un nouveau concept
gographique : le Spatial OLAP. la jonction du monde analytique et des systmes
Abstract :
The spatial information has been set aside for a long time by online analytical processing
tools (OLAP). Since a few years, a new concept was born, allowing to highlight and taking
a full advantage of the geographical data : Spatial OLAP. At the junction of the analytical
This document focuses on the temporal, spatial and spatio-temporal abilities of the actual
be provided, as well as this market maturity state as an appraisal.