Escolar Documentos
Profissional Documentos
Cultura Documentos
Jean-Marc
Petit
RSUM. Comprendre la smantique des donnes dans les bases de donnes (BDs) relationnelles existantes est une tche importante pour de nombreuses applications comme lanalyse et
la maintenance de BDs, la rtro-conception des BDs ou loptimisation de requtes. La smantique des donnes est contenue principalement dans les contraintes dintgrit. Pour la plupart
des BDs oprationnelles, en particulier pour les plus anciennes, nous ne pouvons pas supposer que nous disposons de cette connaissance. Dans cet article, nous prsentons un prototype
appel DBA Companion qui peut apporter une aide pour la comprhension des BDs relationnelles existantes. Cet outil intgre des algorithmes pour lextraction des contraintes dintgrit
ainsi que dautres problmes connexes. Parmi les diverses applications possibles, nous nous
focalisons sur le rglage logique des BDs.
rglage logique des BDs, analyse de schmas de BDs, contraintes dintgrit, infrence des dpendances fonctionnelles, infrence des dpendances dinclusion.
MOTS-CLS :
KEYWORDS:
1. Introduction
Comprendre la smantique des donnes dans les bases de donnes (BDs) relationnelles existantes est une tche importante pour de nombreuses applications comme
lanalyse et la maintenance de BDs, la rtro-conception, la construction dentrepts
de donnes ou loptimisation de requtes. La smantique des donnes est contenue
principalement dans les contraintes dintgrit. Parmi ces contraintes, les dpendances
fonctionnelles (DFs), qui gnralisent la notion de cl, et les dpendances dinclusion
(DIs), qui gnralisent la notion de cl trangre, sont les contraintes dintgrit les
plus communes [MAN 94]. Dans le meilleur des cas, ces contraintes ont t spcifies
lors de la conception de la BD et sont donc disponibles dans le SGBD. Cependant,
nous ne pouvons pas prsumer que nous nous trouvons dans cette situation idale pour
une BD oprationnelle, particulirement pour les plus anciennes. Dans ce dernier cas,
cette connaissance doit tre extraite partir de la BD. Plusieurs sources dinformations sont pertinentes pour mener bien une telle tche. On peut citer notamment le
schma physique de la BD, lextension de la BD ou les programmes dapplication.
Dans cet article, nous prsentons un prototype appel DBA Companion qui peut
apporter une aide pour la comprhension des BDs existantes. Cet outil intgre plusieurs algorithmes ddis lanalyse de BDs. Cette analyse est ralise en sappuyant
sur des techniques de fouilles de donnes ce qui a permis de concevoir des algorithmes
efficaces. Laccent est mis sur lefficacit afin de pouvoir se confronter des situations relles. Nous traitons trois problmes principaux (infrence des DFs, infrence
des DIs et slection des dpendances intressantes) ainsi que divers problmes lis
(gnration de BDs dArmstrong, infrence des dpendances approximatives). Lide
est de fournir ladministrateur de BD des informations pertinentes qui lui permettent
damliorer les performances des applications et dassurer la cohrence des donnes.
Parmi les application pouvant bnficier de la comprhension des BDs existantes,
nous avons choisi de nous intresser plus particulirement au rglage logique de BDs.
Notre prototype a t ralis dans le but dassister un administrateur de BDs pour cette
tche.
Rglage logique des BDs De nos jours, les administrateurs de BDs doivent surveiller et rgler une nombre important de paramtres pour un fonctionnement optimal de leurs BDs. La difficult dune telle tche est largement reconnus alors que de
nombreuses entreprises ne disposent pas dun administrateur temps plein. Simplifier
ladministration des SGBDs devient donc un nouveau challenge pour la communaut
base de donnes.
Le rglage physique dune BD est intensivement tudi afin damliorer les performances du systme notamment en assistant ladministrateur pour la cration dindex
ou en collectant automatiquement des statistiques pour loptimisation de requtes.
Nous nous plaons ici dans le cadre du rglage logique dune BD, i.e. de lanalyse et de loptimisation du schma de la BD. Fournir ladministrateur de BD des
connaissances propos des dpendances satisfaites par une BD peut aider raliser
certaines tches comme la spcification des cls candidates ou la dtection de relations dnormalises [LOP 00, LOP 01a]. Par exemple, une relation dnormalise peut
rsulter dune erreur de conception ou dune volution mal contrle dune BD et
pas toujours de besoins doptimisation. Notons galement que les dpendances approximatives peuvent apporter des indices propos des donnes inconsistantes. Par
exemple, une DF viole par un petit nombre de tuples peut signifier quune erreur de
saisie existe dans ces tuples.
4. Bibliographie
[LOP 00] L OPES S., P ETIT J.-M., L AKHAL L., Efficient Discovery of Functional Dependencies and Armstrong Relations , Proc. of EDBT 2000, Konstanz, Germany, vol. 1777
de LNCS, Springer, 2000, p. 350364.
[LOP 01a] L OPES S., P ETIT J.-M., L AKHAL L., A Framework for Understanding Existing
Databases , Proc. of IDEAS 2001, Grenoble, France, IEEE, 2001, p. 330338.
[LOP 01b] L OPES S., P ETIT J.-M., T OUMANI F., Discovering Interesting Inclusion Dependencies : Application to Logical Database Tuning , J. of Information Systems, vol. 27, n 8
1, 2001, p. 119, Elsevier Science.
[MAN 94] M ANNILA H., R IH K.-J., The Design of Relational Databases, Addison Wesley, 1994.
[MAR 02a] M ARCHI F. D., L OPES S., P ETIT J.-M., Efficient Algorithms for Mining Inclusion Dependencies , Proc. of EDBT 2002, Prague, Czech Republic, vol. 2287 de LNCS,
Springer, 2002, p. 464476.
[MAR 02b] M ARCHI F. D., L OPES S., P ETIT J.-M., Samples for Understanding Datasemantics in Relations , Proc. of ISMIS 2002, Lyon, France (to appear), 2002.