Você está na página 1de 170

Academiejaar 2009 – 2010

UNIVERSITEIT ANTWERPEN

FACULTEIT TOEGEPASTE ECONOMISCHE WETENSCHAPPEN

Ontologie-gebaseerd beheer van


bedrijfsprocessen
Kris Van den Bergh

Masterproef voorgedragen tot het bekomen


van de graad van:

Master in de Toegepaste Economische Wetenschappen Promotor:


Handelsingenieur in de Beleidsinformatica
Prof. dr. Herwig Mannaert
Academiejaar 2009 – 2010

UNIVERSITEIT ANTWERPEN

FACULTEIT TOEGEPASTE ECONOMISCHE WETENSCHAPPEN

Ontologie-gebaseerd beheer van


bedrijfsprocessen
Kris Van den Bergh

Masterproef voorgedragen tot het bekomen


van de graad van:

Master in de Toegepaste Economische Wetenschappen Promotor:


Handelsingenieur in de Beleidsinformatica
Prof. dr. Herwig Mannaert
Voorwoord
You are young, my son, and, as the years go by, time will change and even reverse
many of your present opinions. Refrain therefore awhile from setting yourself up as
a judge of the highest matters.

Plato (427 BC - 347 BC), Dialogues, Theatetus

Voor u ligt mijn eindwerk. Na vijf jaar hoop ik de laatste fase van mijn studie af te
ronden. In vijf jaar universitaire opleiding ontbrak het niet aan inhoud; ik heb ontzettend
veel kennis opgebouwd. Voor het aanvangen van de studies Handelsingenieur in de
Beleidsinformatica, was ik reeds gepassioneerd door IT. Doch, het ontbrak mij de correcte
attitude en bedrijfskundige aanpak die nodig is in deze complexe wereld. Vandaag ben ik
meer dan overtuigd van mijn studiekeuze. Na vijf jaar luisteren ben ik dankbaar het heft
in eigen handen te mogen nemen, mede door zelf een onderzoeksgebied aan te reiken. De
uitdaging was vooral het afbakenen van de onderzoeksvraag. Dankzij een gezonde dosis
doorzettingsvermogen ben ik er geraakt.

De zoektocht naar een passend onderwerp was eigenlijk niet zo heel moeilijk. Het
begon met de keynote van Tim O’reilly op de Web 2.0 Expo in September 2008. Hij vroeg
om na te denken welke dingen we graag anders zouden doen. “Work on stuff that matters”
luidde zijn boodschap. Bijgevolg heb ik mezelf die vraag gesteld: wat vind ik belangrijk?
Zou een wereld waarin alles met elkaar verbonden is geen onvoorstelbare waarde kunnen
creëren? Veel van de kennis van het menselijk ras wordt opgeslagen in databanken die
niet worden gedeeld. Het koppelen van gegevens is nochtans ontzettend belangrijk om
de overbrugging tussen disciplines te maken. Het kan ons meer inzicht bieden in hoe de
complexe wereld in elkaar zit. Ik geloof dat we de wereld kunnen verbeteren door het
bouwen van bruggen, maar wel stap voor stap. Aan de hand van ontologieën kunnen
we vandaag bedrijfskundige kloven overbruggen. Dit werd alsmede mijn onderzoeksgebied.

Voor de totstandkoming van dit werk ben ik een aantal mensen dank verontschuldigd. In
het bijzonder aan Prof. Dr. H. Mannaert omwille van zijn opvolging, inspiratie en talrijke
suggesties. Graag zou ik ook het Krimson team willen bedanken om mij vorig jaar mee te
nemen naar Drupalcon Parijs. De doorslag voor de keuze van deze scriptie is voor een stuk
ook daar gebeurd. Voorts ben ik Prof. Dr. C. De Backer (UA), Dr. P. De Leenheer (VU),
Dr. M. Hepp (UniBw München), Dr. D. Karger (MIT), Dhr. M. Rospocher (FBK) en
Dhr. J. Vermeulen (UHasselt) dankbaar voor hun bereidwillige medewerking. Tenslotte
zou ik mijn ouders willen bedanken omdat zij mij de kans hebben geboden om te stude-
ren, en niet aflatende steun hebben geboden. Mijn zus tot slot voor haar spontane inbreng.

Rest mij u nog een aangename leeservaring toe te wensen.

Kris Van den Bergh


Antwerpen, juni 2010

i
Inhoudsopgave

1 Algemene inleiding 1
1.1 Probleemstelling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Onderzoeksmethode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Onderzoeksvragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4 Structuur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Het Semantisch Web 7


2.1 Het Semantisch Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.1 Doel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.2 Oorsprong . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.3 Grondbeginselen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.4 Onderzoek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Data-integratie en het delen van informatie . . . . . . . . . . . . . . . . . 12
2.2.1 Syntaxis en semantiek . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.2 Metadata en data zijn elkaars wederhelften . . . . . . . . . . . . . 14
2.2.3 Gebrek aan data-integratie op het Web . . . . . . . . . . . . . . . 15
2.3 Datamodellering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3.1 Traditionele methoden . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3.2 Modelleertechnieken voor het Semantisch Web . . . . . . . . . . . 21
2.4 Ontologische modellering . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5 Componenten van het Semantisch Web . . . . . . . . . . . . . . . . . . . . 26
2.5.1 XML Schema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.5.2 Resource Description Framework . . . . . . . . . . . . . . . . . . . 27
2.5.3 RDF Schema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.5.4 OWL Web Ontology Language . . . . . . . . . . . . . . . . . . . . 31
2.5.5 Querytalen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.5.6 Rules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.5.7 Nog niet gerealiseerde lagen . . . . . . . . . . . . . . . . . . . . . . 36
2.5.8 Reasoning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.6 Nadenken over de Systeemtheorie . . . . . . . . . . . . . . . . . . . . . . . 37
2.6.1 Entropie in de Statische Thermodynamica . . . . . . . . . . . . . . 38
2.6.2 Het Diepe Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.7 Obstakels en kritieken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.7.1 Praktische haalbaarheid . . . . . . . . . . . . . . . . . . . . . . . . 39
2.7.2 Een ongerealiseerd idee . . . . . . . . . . . . . . . . . . . . . . . . 40
2.7.3 Privacy en censuur . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.7.4 Verdubbeling van output formaten . . . . . . . . . . . . . . . . . . 41
2.7.5 Kip-en-eiprobleem . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

ii
Inhoudsopgave

2.7.6 The Semantic Web Of Death . . . . . . . . . . . . . . . . . . . . . 42


2.7.7 The Pragmatic Web . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.7.8 The Curse of Knowledge . . . . . . . . . . . . . . . . . . . . . . . . 43

3 De Semantische Onderneming 44
3.1 Het potentieel van informatie en goede communicatie . . . . . . . . . . . . 44
3.1.1 De Informatierevolutie . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.1.2 Van waardeketen naar waardenetwerk . . . . . . . . . . . . . . . . 48
3.1.3 Van push- naar pullmodel . . . . . . . . . . . . . . . . . . . . . . . 50
3.1.4 Communicatieproblemen . . . . . . . . . . . . . . . . . . . . . . . . 50
3.2 Concepten voor de Semantische Onderneming . . . . . . . . . . . . . . . . 52
3.2.1 (On)gestructureerde, semi-gestructureerde data en Linked Data . . 52
3.2.2 Soorten gegevens in de onderneming . . . . . . . . . . . . . . . . . 55
3.2.3 Open en gesloten systemen . . . . . . . . . . . . . . . . . . . . . . 56
3.3 Nood aan interoperabiliteit . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.3.1 Interoperabiliteit classificatie . . . . . . . . . . . . . . . . . . . . . 59
3.3.2 Enterprise-interoperabiliteit . . . . . . . . . . . . . . . . . . . . . . 59
3.3.3 Semantische interoperabiliteit . . . . . . . . . . . . . . . . . . . . . 61
3.4 Integratie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.4.1 Data-integratie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.4.2 Enterprise-integratie . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.5 Semantisch Web oplossingen voor integratie . . . . . . . . . . . . . . . . . 73
3.5.1 De rol van RDF . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.5.2 De rol van SPARQL . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.5.3 De rol van ontologieën . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.5.4 De rol van de Linked (Open) Data cloud . . . . . . . . . . . . . . . 77
3.5.5 Het Semantisch Web en cross-enterprise integratie . . . . . . . . . 78
3.6 Een managementperspectief . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.6.1 Business Intelligence en kennisbeheer . . . . . . . . . . . . . . . . . 83
3.6.2 Beheren van bedrijfsecosystemen met ontologieën . . . . . . . . . . 85
3.6.3 Een meer flexibele Informatie Architectuur . . . . . . . . . . . . . 85
3.6.4 Mogelijke ontologie-gebaseerde strategieën . . . . . . . . . . . . . . 86
3.6.5 Bouwen van het informatie raamwerk . . . . . . . . . . . . . . . . 88
3.6.6 Buy-in van de belangrijkste medewerkers . . . . . . . . . . . . . . 88
3.7 Uitdagingen bij het inzetten van Semantische Technologieën . . . . . . . . 88
3.7.1 Mismatch semantische- en bestaande data technologie . . . . . . . 88
3.7.2 Organisatie mindset, de rol in het overkomen van het Kip-en-
eiprobleem en betrokkenheid . . . . . . . . . . . . . . . . . . . . . 89
3.7.3 Het belang van de kwaliteit van ontologieën . . . . . . . . . . . . . 90
3.7.4 Ontologie creatie in OWL is een steile leercurve . . . . . . . . . . . 90
3.7.5 Het afstemmen van meerdere ontologieën is een niet-triviale taak . 90
3.7.6 Nood aan betere visualisatietechnologieën en tools . . . . . . . . . 90

iii
Inhoudsopgave

4 Semantic Business Process Management 91


4.1 Service-Oriented Computing . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.1.1 Semantic Web Services . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.1.2 Mediatie bij Web Services . . . . . . . . . . . . . . . . . . . . . . . 95
4.2 Semantic Business Process Management . . . . . . . . . . . . . . . . . . . 96
4.2.1 Motivatie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
4.2.2 Benadering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.2.3 Gebruiksscenario’s . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.2.4 Vereisten en subproblemen . . . . . . . . . . . . . . . . . . . . . . 101
4.2.5 Problemen met betrekking tot Business Process Management . . . 103
4.2.6 SUPER Architectuur . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.3 Automatisch koppelen van gedistribueerde systemen . . . . . . . . . . . . 104
4.3.1 Top-down aanpak . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.3.2 Bottom-up aanpak . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.4 Naar een ontologie-gebaseerde beschrijving van procesmodellen . . . . . . 107
4.4.1 Vereistenanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4.4.2 Literatuuroverzicht . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4.4.3 Een vergelijkende studie . . . . . . . . . . . . . . . . . . . . . . . . 112
4.5 Gevalstudie: prijsbeheer . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.5.1 Encoderen van Modellen en Viewpoints . . . . . . . . . . . . . . . 115
4.5.2 Meta Object Facility . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.5.3 Ontology Definition Metamodel . . . . . . . . . . . . . . . . . . . . 118
4.5.4 The Semantics of Business Vocabulary and Business Rules . . . . . 119
4.5.5 Werkwijze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
4.5.6 Technische implementatie van de vertaling . . . . . . . . . . . . . . 122
4.5.7 Representatie van UML in OWL . . . . . . . . . . . . . . . . . . . 123
4.5.8 Uitwerking en evaluatie . . . . . . . . . . . . . . . . . . . . . . . . 125
4.6 Proces-gebaseerde ontologie-omgeving . . . . . . . . . . . . . . . . . . . . 126
4.6.1 Beschrijving ontologie-omgevingen . . . . . . . . . . . . . . . . . . 126
4.6.2 Ontology matching . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
4.6.3 Ontologie-ontwerp . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
4.6.4 Ontwikkeling van ontologieën . . . . . . . . . . . . . . . . . . . . . 132

5 Algemeen besluit 135


5.1 Bevindingen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.2 Aanbevelingen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
5.3 Verder onderzoek en reflectie op ontologieën . . . . . . . . . . . . . . . . . 137
5.3.1 De uitvoerbaarheid van upper ontologies . . . . . . . . . . . . . . . 139
5.3.2 De nood aan ontologieën op het Semantisch Web . . . . . . . . . . 140

Bibliografie 142

Bijlage A: UML-diagram prijsbeheer 154

Bijlage B: OWL-output prijsbeheer 155

iv
Lijst van tabellen

2.1 Voorbeeld van tabelgegevens met betrekking tot restaurants. . . . . . . . 18


2.2 Een illustratie van te veel gegevens in een tabel. . . . . . . . . . . . . . . . 18
2.3 De introductie van onvoorziene gegevens. . . . . . . . . . . . . . . . . . . 20
2.4 Een vergelijk tussen een ontologisch model en een relationeel datamodel. . 24
2.6 Voorbeeld van een SPARQL query. . . . . . . . . . . . . . . . . . . . . . . 36

3.1 Heterogeniteit in informatiesystemen en bijbehorende interoperabiliteit


kwesties. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.2 Dimensies en niveau’s van integratie . . . . . . . . . . . . . . . . . . . . . 63
3.3 Wisselwerking tussen twee dimensies binnen het Fischer raamwerk . . . . 64
3.4 Integratie niveaus en aspecten. . . . . . . . . . . . . . . . . . . . . . . . . 71
3.5 Integratiemethoden bij silo’s zijn arbeidsintensief. . . . . . . . . . . . . . . 80
3.6 Traditionele versus Ontologie-gebaseerde data-integratie. . . . . . . . . . . 82

4.1 Evaluatie van Semantic Web Services methoden. . . . . . . . . . . . . . . 94


4.2 Literatuur rond ontologie-gebaseerde vertaling van procesmodellen: niet-
functionele vereisten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.3 Literatuur rond ontologie-gebaseerde vertaling van procesmodellen: func-
tionele vereisten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.4 Meta niveaus van de MOF architectuur . . . . . . . . . . . . . . . . . . . 116
4.5 Gemeenschappelijke eigenschappen van UML en OWL. . . . . . . . . . . . 124
4.6 UML elementen zonder OWL equivalent . . . . . . . . . . . . . . . . . . . 124
4.7 OWL elementen zonder UML equivalent . . . . . . . . . . . . . . . . . . . 124
4.8 Een vergelijking tussen proces-gebaseerde ontologie-omgevingen. . . . . . 130

v
Lijst van figuren

2.1 Euler toont aan dat het handelsreizigersprobleem kan voorgesteld worden
als een probleem op een graaf. . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Een simpel relationeel schema voor een restaurant. . . . . . . . . . . . . . 19
2.3 Het linken van “bars”-entiteiten aan een bestaand schema. . . . . . . . . . 20
2.4 Genormaliseerd schema dat een plaats scheidt van zijn doeleinden. . . . . 20
2.5 Een voorbeeld van een triple. . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.6 Een samengestelde graaf is de unie van verschillende triples met gemeen-
schappelijke identificaties. . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.7 Variërende rijkdom bij woordenschat, taxonomie en ontologie. . . . . . . . 25
2.8 De meest recente versie van de Semantic Web Layer Cake volgens het W3C. 26
2.9 Een voorbeeld van een RDF-graaf op basis van URI’s. . . . . . . . . . . . 28
2.10 RDF-statements kunnen beschouwd worden als punten in een driedimensi-
onale ruimten in een IRI/letterlijke namespace. . . . . . . . . . . . . . . . 29
2.11 Voorbeeld van een simpele ontologie. . . . . . . . . . . . . . . . . . . . . . 32
2.12 Een voorbeeld van gevolgtrekking. . . . . . . . . . . . . . . . . . . . . . . 33
2.13 Onbekende informatie wordt begrijpbaar wanneer men ziet hoe het aan
gekende concepten gerelateerd wordt. . . . . . . . . . . . . . . . . . . . . . 35
2.14 Componenten en talen van het Semantisch Web en de positionering van
reasoners. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.1 De rol van Semantisch Web technologieën bij de afleiding van inzichten
uit bestaande gegevens voor evaluatie en feedback. . . . . . . . . . . . . . 48
3.2 De waardeketen van Porter. . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3 “The Meaning Triangle”: Symbool symboliseert Concept refeert aan Refe-
rent; Symbool betekent Referent. . . . . . . . . . . . . . . . . . . . . . . . 51
3.4 Gegevensstructuur op een spectrum. . . . . . . . . . . . . . . . . . . . . . 53
3.5 Een visualisatie van de Linked Open Data sets die tot nu toe (ongeveer
13.1 miljard triples) gepubliceerd en verbonden zijn. . . . . . . . . . . . . 55
3.6 De transitie van het Web. . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.7 Semantiek zorgt voor bedrijfsinteroperabiliteit op vier niveaus: bedrijfs-
processen, data, applicaties en bedrijfsmiddelen. . . . . . . . . . . . . . . . 60
3.8 Simpele schematische voorstelling voor een datawarehouse en gemedieerd
schema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.9 Drie mogelijke manieren om ontologieën te gebruiken voor data-integratie. 68
3.10 Het beklimmen van de data-federatie piramide. . . . . . . . . . . . . . . . 71
3.11 Een ontologische benadering is schaalbaar. . . . . . . . . . . . . . . . . . . 77

vi
Lijst van figuren

3.12 Ontologieën zijn de basis van de information mediation laag. . . . . . . . 78


3.13 Technieken en hun mate van expressiviteit. . . . . . . . . . . . . . . . . . 79
3.14 SPARQL federatie voordeel. . . . . . . . . . . . . . . . . . . . . . . . . . . 84
3.15 Informatiebronnen voor de onderneming. . . . . . . . . . . . . . . . . . . 84
3.16 Interne en externe data-elementen bieden meer context. . . . . . . . . . . 86
3.17 De waarde van het bedrijfsecosysteem met behulp van gedeelde ecosyste-
men . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.18 De bedrijfslogica waarde van ontologieën . . . . . . . . . . . . . . . . . . 87

4.1 Generieke Semantische Integratie Workflow. . . . . . . . . . . . . . . . . . 95


4.2 De drie dimensies van de performantie van een onderneming bekeken
vanuit een proces. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.3 De bi-directionele IT / proces kloof. . . . . . . . . . . . . . . . . . . . . . 98
4.4 Semantic Business Process Management. . . . . . . . . . . . . . . . . . . . 100
4.5 Vereenvoudigde architectuur van een SBPM-omgeving. . . . . . . . . . . . 101
4.6 Workflow voor uitbreiding procesmodel naar ontologieën. . . . . . . . . . 121
4.7 model2RDF: technisch proces . . . . . . . . . . . . . . . . . . . . . . . . . 123
4.8 Raamwerk voor de semantische annotatie van bedrijfsprocesmodellen. . . 126
4.9 Semantisch verrijkte procesmodellen. . . . . . . . . . . . . . . . . . . . . . 127
4.10 Aspecten en opties binnen een ontologie. . . . . . . . . . . . . . . . . . . . 131
4.11 De modelleringsmethode binnen het Business Semantics Framework bestaat
uit twee cycli die elk een aantal modelleringsactiviteiten groeperen. . . . . 133
4.12 De stappen voor een faceted-aanpak van ontologieën. . . . . . . . . . . . . 134

vii
Lijst van afkortingen
API Application Programming Interface
BPM Business Process Management
DTD Document Type Definition
EO Enterprise Ontology
ERP Enterprise Resource Planning
ETL Exteract Transform Load
FOAF Friend of a friend
GAV Global As View
GRDDL Gleaning Resource Descriptions from Dialects of Languages
IRI Internationalized Resource Identifiers
ISO International Organization for Standardization
LAV Local As View
OWL OWL Web Ontology Language
RDF Resource Description Framework
RDFa Resource Description Framework in attributes
RDFS RDF Schema
RDQL RDF Data Query Language
SeRQL Seasame RDF Query Language
SPARQL SPARQL Protocol and RDF Query Language
SQL Structured Query Language
SWS Semantic Web Services
Turtle Terse RDF Triple Language
WSMO Web Service Modeling Ontology
XBRL eXtensible Business Reporting Language
XML eXtensible Markup Language
XSD XML Schema Definition Language
XSLT XML Stylesheet Transformations

viii
1 Algemene inleiding
PricewaterhouseCoopers bracht in het voorjaar van 2009 een editie van Technology
Forecast, integraal gewijd aan het Semantisch Web. In het professionele rapport wordt de
voorspelling gemaakt dat gedurende de volgende drie tot vijf jaar, er een transformatie
zal plaatsvinden in de manier waarop we informatie beheren in de onderneming. Deze
transformatie wordt ingegeven door ontologieën, het mechanisme dat het Semantisch
Web voortstuwt.

Toegegeven, het holle “Semantisch Web” begrip begint meer en meer op een marke-
ting kreet te lijken. Desalniettemin, het PricewaterhouseCoopers rapport spreekt over
een immense impact op het bedrijfsleven. We staan voor enorme uitdagingen. On-
dertussen investeert de Europese Unie ontzaglijk veel geld in onderzoek rondom het
Semantisch Web. Zij sponsoren en zetten talrijke projecten op onder de Framework
Programme takken. Bijvoorbeeld, het DIP1 project deed onderzoek naar het combineren
van Semantisch Web en Web Service technologieën. Het budget betrof 16,3 miljoen euro.

Dertig jaar geleden deden we onderzoek naar relationele databanken. Vandaag is dat
verschoven naar ontologieën. Om het maar in perspectief te plaatsen. Gegeven deze
observaties, leek het mij zeer interessant en relevant om te kijken hoe we ontologieën
kunnen inzetten om bedrijfsprocessen te beheren. Het Semantisch Web biedt een manier
van denken over de wereld. Dit denken strookt echter niet met de praktijken van vele
organisaties en is een verzoek tot heroverweging.

In dit inleidend hoofdstuk wordt vooreerst de probleemstelling van deze scriptie be-
handeld. Vervolgens beschouwen we het onderzoek zelf, en tenslotte overlopen we de
structuur.

1
http://dip.semanticweb.org/

1
1 Algemene inleiding

1.1 Probleemstelling
Organisaties moeten flexibel en wendbaar zijn om te overleven in een dynamische en
continue evoluerende omgeving. Business Process Management (BPM) systemen worden
hiervoor ingezet, dewelke als doel hebben om de ganse bedrijfsprocessen levenscyclus
(analyse, ontwerp, configuratie, executie) te ondersteunen, te implementeren en te onder-
houden. Doch, een significant probleem in BPM benaderingen vandaag is dat moeilijk de
brug kan worden gemaakt tussen de organisationele context, de diverse process workflow
notaties, en de executable services die de procesactiviteiten vervullen. De moeilijkheden
bij het automatiseren van de overgang tussen de verschillende werelden, is te wijten
aan een gebrek van semantische betekenis dewelke machines vereisen voor verwerking.
Het Semantisch Web, en Semantische Web Services in het bijzonder (SWS) bieden de
belofte om applicaties ook op een semantisch niveau te integreren. Door bedrijfsprocessen
eveneens op een semantisch niveau te gaan beschouwen, kunnen deze beter ondersteund
worden gaande van modellering en querying tot de executie (Cabral, Nitzsche en Norton,
2009; Herrero, 2007).

1.2 Onderzoeksmethode
Bij aanvang werd er voor gekozen om een holistische benadering te hanteren. Vertrekkende
van de probleemstelling argumenteren we dat er inzicht nodig is in de grondslagen van
het Semantisch Web, vooraleer men de concepten kan toepassen op bedrijfskundig niveau.
Er wordt een kritische blik geworpen op het fenomeen van het Semantisch Web, wat
gesynthetiseerd wordt aan de hand van bestaande literatuur. Vervolgens wordt er gekeken
naar organisaties. Voor organisaties identificeren we mogelijke oorzaken van wanorde, die
ons leiden tot het evalueren van verschillende kijken op interoperabiliteit en integratie.
Geleidelijk wordt er verschoven richting ontologieën en hoe deze waarde kunnen creëren
voor de onderneming. Hiervoor is een methodologie nodig. Dit brengt ons tot de
notie van Semantic Business Process Management. Vermits het over het koppelen van
gedistribueerde systeem gaat, woren twee benaderingen geëvalueerd: top-down versus
bottom-up. De redenering van onderop wordt verder uitgediept, vertrekkende van
procesmodellen. Naast een vergelijkende studie voor verschillende ontologie-gebaseerde
ondersteuning van procesmodellen, wordt er een gevalstudie uitgewerkt – rond UML – die
nagaat of een voorgestelde oplossing betrouwbaar is. Aansluitende bevindingen worden
tenslotte gerapporteerd en er worden aanbevelingen geformuleerd voor het beheren van
bedrijfsprocessen met ontologieën.

2
1 Algemene inleiding

1.3 Onderzoeksvragen
Het onderzoek in deze scriptie betreft ontologieën in bedrijfscontext. We werken we met
drie categoriën van vragen, met telkens een aantal subvragen.

Categorie 1: Het Semantisch Web.


1. Wat is het Semantisch Web? Wat zijn de onderliggende grondslagen, wat is het
doel, welke componenten omvat het?

2. Wat zijn de voor- en nadelen van conventionele modelleermethoden? Wat loopt er


mis, en wat betekent dit in termen van het Web?

3. Wat zijn de oplossingen die het Semantisch Web voorschrijft? Hoe kunnen deze
technieken huidige datamodellen aanvullen of verbeteren?
Categorie 2: Organisaties.
1. Met welke problemen worden organisaties vandaag geconfronteerd?

2. Wat zijn de onderliggende oorzaken van deze problemen?

3. Hoe kan een organisatie waarde creëren met behulp van ontologieën?
Categorie 3: Het beheren van bedrijfsprocessen.
1. Wat maakt dat bedrijfsprocessen niet goed beheerd worden vandaag?

2. Wat zijn ontologie-gebaseerde oplossingen hiervoor?

3. Hoe kunnen procesmodellen beter ondersteund en beheerd worden?

1.4 Structuur
De scriptie is opgebouwd rond drie hoofdstukken, die elk voldoende afgebakend zijn.

In Hoofdstuk 2, Het Semantsich Web, beschouwen we het Semantisch Web vanuit een
algemeen perspectief. Om het Semantisch Web te begrijpen, is een gedegen achtergrond
en conceptuele kennis vereist. Zoals duidelijk zal worden, zijn vele van deze ideeën niet
nieuw. In essentie gaat het Semantisch Web immers over het ontkoppelen van applicaties
en hun gegevens dankzij simpele, abstracte modellen voor kennisrepresentatie. Dit zijn
ideeën die reeds verschillend jaren onderzoek herbergen in Artificiële Intelligentie. Maar
toch, om een dergelijke visie te realiseren, is er volgens mij meer nodig. Eerst en vooral
ondergaat het Semantisch Web nog steeds actief onderzoek. Hoewel de visie van Berners-
Lee al meer dan tien jaar oud is, is het nog maar recent dat de eerste concretiseringen
van de vele abstracte concepten naar boven komen. Dit gebeurt onder de vorm van
tools en programmeerboeken. De hoeveelheid aan literatuur is overweldigend, maar
voor de basisconcepten wordt er steeds gerefereerd naar de respectievelijke complexe

3
1 Algemene inleiding

W3C-standaarden. Hoofdstuk 2 poogt verheldering te brengen in de soep van acroniemen


en componenten aan de hand van talrijke voorbeelden en illustraties. Niet alleen probeert
het te contribueren aan de theorie-vorming door een kritische analyse van bestaande
literatuur en een state of the art naslagwerk, maar door het in kaart te brengen van
het hele spectrum poogt het ook onrechtstreeks de adoptie vooruit te helpen. In eerste
instantie is de invalshoek het Wereldwijde Web, en al haar onderliggende problemen.
Vervolgens wordt er geargumenteerd dat onze modelleertechnieken veelal niet toereikend
zijn, en dat ook het Wereldwijde Web hier mee te kampen heeft. Tenslotte wordt er
gekeken naar oplossingen, in het bijzonder in de context van ontologieën.

Hoofdstuk 3 gaat na hoe organisaties waarde kunnen creëren op basis van het Se-
mantisch Web, en met onotologieën in het bijzonder. Er wordt een zo accuraat mogelijke
representatie weergegeven van de vele problemen waarmee organisaties vandaag gecon-
fronteerd worden, en gewezen op het belang van informatie bij het nemen van beslissingen.
Vervolgens worden concepten en begrippen geïntroduceerd: we geven een overzicht van de
verschillende soorten gegevens in de onderneming en op het Semantisch Web. Ook wordt
er een onderscheid gemaakt tussen open- en gesloten systemen. Het verdere verloop van
het hoofdstuk behandelt interoperabiliteit in breedste zin, waarbij er in de literatuur ook
inzichten van constructiebouw worden overwogen, voor definiëring en classificatie van
het integratie begrip. We zetten de Web hoed af, de bedrijfskundige hoed op, en kijken
naar integratieproblemen, zowel binnen de onderneming, als in de vraag- en aanbodketen.
Vervolgens worden Semantisch Web ontologieën toegepast op de interoperabiliteit- en
integratieproblematiek. Vanuit een managementperspectief wordt beschouwd hoe een
CIO een dergelijke benadering best dient aan te pakken. Tot slot worden mogelijke
uitdagingen bij een ontologie-gebaseerde benadering aangehaald.

In Hoofdstuk 4 stellen we de tekortkomingen van Business Process Management vast. We


vertrekken van Service-Oriented Computing, waarna de combinatie volgt met ontologieën.
Dit geeft een aantal interessante gebruiksscenario’s voor een betere ondersteuning van
gekoppelde systemen. We zoeken vervolgens naar oplossingen voor Busines Process
Management, waarbij we vertrekken van procesmodellen. In de literatuur wordt gekeken
naar verschillende aanpakken voor een ontologie-gebaseerde ondersteuning van dergelijke
procesmodellen. Tevens onderzoeken we welke vereisten deze afdekken. Voor een prijsbe-
heer proces wordt een gevalstudie uitgewerkt die een mogelijke ondersteuning evalueert.
Tenslotte onderzoeken we de situatie waarbij meerdere ontologieën betrokken zijn.

4
Executive Summary

This report researches the application of Semantic Web concepts, namely ontologies, in
the context of business processes. First and foremost, we make the observation that the
Semantic Web can be approached from different angles. In the literature, one can find
the following goals: machine readability, the exchanging information and the expressing
domain knowledge. Despite the original vision of Berners-Lee, this makes an ambiguous
and abstract understanding. The same applies to ontology concept, where, again many
defintions co-exist. Especially the notion of “a shared understanding” emerges, as well
as the specification of anything in terms of concepts. Subsequently, several modeling
approaches were compared, in which particulary the weaknesses of the relational data
model were emphasized. Analysis of different layers and corresponding components of
the Semantic Web, showed that some layers are still actively researched, especially with
regards to trust, cryptography and pragmatics. The approach of systems theory teaches
us that structure goes a long way. Finally, there are many obstacles to the Semantic Web.
There is also a lot of criticism involved, and therefore we conclude that the Semantic
Web is a delicate issue.

Applying semantics in the domains of Information technology and data modeling has
been done before. In fact, it is something that seems rather simple, but when it comes
to semantics in the context of a distributed Web, and with everything it represents, the
challenges are significant. Many of the problems that the Web experiences, are similar to
problems encountered by organizations today. Although the Web is only twenty years
young, it is not necessarily useless to introduce similar ideas to organizations, because the
Web is the only system today that scales and, as argued before, faces similar challenges.
The Semantic Web allows to make relation models work effectively and efficiently in a
decentralized manner, which ensures interoperability and integration at various levels,
both within and outside supply and demand chain and between internal and external
sytems. In overall, a “Semantic Enterprise” is probably characterized by information
systems that exploit relational information and their associations in such a way, towards
better achieving business goals and making better decisions. Today the technologies are
out there, and the main constraints are the business models and how organizations are
operated and managed. The CIO is responsible for creating the appropriate conditions.
The development, alignment and adoption of ontologies is not obvious. Besides the buy-in
of key staff members, adoption also necessitates a methodology and framework, as well
as new visualization tools. The bottom line is that data should be considered as an
important “asset” for achieving agility of the organization, as well as a strategic means
that is an important precondition for a sustainable and profitable enterprise.

5
The last chapter deals with Business Process Management (BPM). It was shown that a
significant problem in BPM approaches, is the difficulty of bridging between the organi-
zational context, the various workflow processes, and executable services that perform
the process activities. The underlying cause for difficulties in automating the transition
between different worlds, is due to the lack of semantics, which machines require for
processing capabilities. The Semantic Business Process Management framework, tries to
combine both Web Services and BPM. From an organizational perspective, SBPM aims to
answer the needs for business process modeling. Different approaches to ontology-based
support for business process models are compared. Because of their different focus, they
cover different functional and non-functional requirements, but they often fail to offer an
answer on how ontologies are part of a broader organizational perspective. There are a
number of frameworks that identify the different required ontologies. They often include
concrete guidance, but no single approach that we are aware of is capable of supporting
both structural and dynamic aspects of process models. Especially the development and
alignment of ontologies is and remains a tall order. Nevertheless, through a case study
for a pricing management process, we argue that an UML-based translation to ontologies
is possible. Whether the suggested translations of these frameworks work effectively,
remains an open question. Finally, by considering business processes at a semantic level
as well, they can be better supported for extensive analysis and modeling to execution
and querying.

6
2 Het Semantisch Web
Eind jaren negentig kende het Wereldwijde Web een explosieve groei met een immense
hoeveelheid aan informatie tot gevolg. Deze informatie is echter alleen begrijpbaar voor
mensen. Met het oog op een verdere automatisering is het nodig dat ook machines
moeten kunnen omgaan met deze informatie. Dit is kort samengevat waarover het
Semantisch Web gaat. De formele beschrijving van concepten, termen en relaties binnen
een bepaald kennisdomein zorgen er voor dat er automatisch (nieuwe) relaties tussen
concepten worden gelegd, waardoor gegevens begrijpbaar worden. In essentie bestaat het
Semantisch Web uit een reeks van ontwerpprincipes, collaboratieve werkgroepen en een
verscheidenheid aan technologieën.

Dit hoofdstuk behandelt het Semantisch Web vanuit een algemeen standpunt, aangezien
het nog jong, opkomend en multidisciplinair is. Het is van belang om de principes achter
het Semantisch Web te doorgronden om een beter begrip te krijgen hoe zij nuttig kunnen
zijn voor diverse bedrijfskundige problemen en bij het modelleren van bedrijfsprocessen in
het bijzonder. Tenslotte, op basis van de stromingen die Ding (2010) onderscheidt, zouden
we deze scriptie dan ook kunnen onderbrengen in de school “ontology engineering”.

2.1 Het Semantisch Web


In de literatuur vindt men verscheidene definities over het Semantisch Web. Het wordt
beschreven op verschillende manieren: als een utopische visie, als een Web van gegevens
(Web of Data), of als louter een natuurlijke paradigma verschuiving in ons dagelijks
gebruik van het web (Hitzler, Krötzsch en Rudolph, 2009). In de volgende sectie wordt het
doel, de oorsprong, de grondbeginselen en onderzoek met betrekking tot het Semantisch
Web behandeld.

2.1.1 Doel
De essentie van het Wereldwijde Web is het idee van een open gemeenschap: iedereen
die wenst bij te dragen kan dat. Het is deze onpartijdigheid die geresulteerd heeft in
een verbazingwekkende hoeveelheid aan kennis over verschillende topics. Echter, omdat
natuurlijke taalverwerking nog steeds een onopgelost probleem is, kunnen machines
deze webpagina’s niet begrijpen in de mate dat nodig is om de gewenste taken uit te
voeren (Heflin en Hendler, 2008). Maar het is de mengelmoes van verschillende analyses,
presentaties en informatie over eender welk topic dat het Web de das om doet. Het lijkt
wel of het Web dom is. Bijvoorbeeld, als we een hotelkamer wensen te boeken die het
dichtst in de buurt is van een congres, dan moeten we nog steeds manueel de adressen

7
2 Het Semantisch Web

kopiëren en plakken om vervolgens de afstanden te vergelijken. Maar een webpagina is


niet gebouwd om door machines te worden gelezen; de mens bepaalt de instructies en
zorgt dat de vereiste taken worden volbracht (Allemang en Hendler, 2008).

Uit het voorgaande blijkt dat er een meer geïntegreerde en consistente Web ervaring nodig
is. De uitdaging voor het Semantisch Web is niet om een infrastructuur te bouwen die zo
slim mogelijk is, maar wel een infrastructuur te ontwikkelen die het meest geschikt is
om informatie te integreren op het Web (Allemang en Hendler, 2008). Tim Berners-Lee1
sprak de visie van het Semantisch Web in 1999 uit als volgt:

“I have a dream for the Web [in which computers] become capable of
analyzing all the data on the Web — the content, links, and transactions
between people and computers. A ‘Semantic Web’, which should make this
possible, has yet to emerge, but when it does, the day-to-day mechanisms of
trade, bureaucracy and our daily lives will be handled by machines talking
to machines. The ‘intelligent agents’ people have touted for ages will finally
materialize.”

Naast machineleesbaarheid (1), zijn het ter beschikking stellen van een rijk semantisch
model voor het uitdrukken van domeinkennis (2) en het uitwisselen van informatie over
domeinen heen (3), veel genoemde doelen van het Semantisch Web (Hebeler et al, 2009).

2.1.2 Oorsprong
De origines van het Semantisch Web liggen bij de zoektocht naar het externaliseren van
kennis. Het is niet verwonderlijk dat we problemen hebben om informatie te vertalen
naar computers. Immers, computers vereisen correctheid en precisie en dit zijn twee
domeinen waarin mensen tekortschieten. Hierin ligt ook het dilemma: computers kunnen
nuttige dingen doen als we de zaken precies, gedetailleerd en consistent uitleggen. Deze
strijd heeft verschillende types van data, informatie en zelfs formaten geproduceerd,
ook wel vormen van kennisrepresentatie genoemd. De bedoeling van het Semantisch
Web is niet zozeer om deze benaderingen te vervangen, doch om een nieuwe vorm van
kennisrepresentatie te omarmen dat gebruik maakt van een aantal eerdere methodes en
deze verbetert (Hebeler et al, 2009).

Het Semantisch Web werd voor het eerst wetenschappelijk2 beschreven in een artikel in
Scientific American door Tim Berners-Lee, James Hendler en Ora Lassila (2001). Hoewel
deze rudimentaire paper reeds karakteristieken zoals machine leesbaarheid aanhaalde, is
het Semantisch Web het resultaat van vele jaren voortgezet onderzoek. Vanzelfsprekend
is het Semantisch Web gebaseerd op fundamentele Internet technologieën en filosofieën.
Echter, twee belangrijke wiskundige disciplines hebben bijgedragen aan het Semantisch
Web, meer bepaald grafentheorie en beschrijvende logica.
1
http://www.w3.org/People/Berners-Lee/
2
Berners-Lee omschreef het Semantisch Web reeds eerder, bijvoorbeeld:
http://www.w3.org/DesignIssues/Semantic.html

8
2 Het Semantisch Web

Grafentheorie maakt deel uit van de kern van het Semantisch Web. Een graaf represen-
teert knooppunten en relaties. Op het Wereldwijde Web kan men deze graafstructuur
herkennen op basis van hyperlinks. Het was de bekende wiskundige Euler die met grafen-
theorie bewees dat men de zeven bruggen van Koningsbergen niet zó kon wandelen zodat
men precies één maal over elke brug liep. Tevens heeft hij laten zien dat het probleem
beschouwd kan worden als een probleem op een graaf (zie verder), waarin het vraagstuk
over de bruggen van Koningsbergen geabstraheerd kan worden zoals in Figuur 2.1.

Figuur 2.1: Euler toont aan dat het handelsreizigersprobleem kan voorgesteld worden als
een probleem op een graaf.

Bron: gebaseerd op Wikipedia (2010), Zeven bruggen van Koningsbergen.

Het handelsreizigersprobleem vormt de basis van de oprichting van routes naar nuttige
informatie op het Web. Semantische Web oplossingen haken direct in op de voordelen
die de wiskundige grafentheorie biedt. Dit leidt tot efficiëntieverbeteringen bij gegevens-
verwerking.

Het creëren van computer-gebaseerde systemen die de betekenis van data verstaan,
vereisen een formele representatie van de betekenis en context van data. Beschrijvende
logica bevat de regels voor de bouw van geldige, nuttige kennisrepresentaties, kennisre-
presentaties die beslisbaar zijn, representaties die werkelijk een antwoord kunnen bieden.
Onbeslisbare representaties zullen nooit een conclusie kunnen bereiken. Beschrijvende
logica is afgeleid van eerste-ordelogica en het is een formalisatie voor het representeren
van kennis. Het zorgt ervoor dat informatie expliciet wordt in plaats van stilzwijgende
kennis. Stilzwijgende informatie is te vinden in traditionele applicaties via bijvoorbeeld
if/else statements. Door kennis te externaliseren kan informatie geverifieerd, geïntegreerd,
beredeneerd en ondervraagd worden. Beschrijvende logica bevat vele verschillende relati-
etypen, waaronder overerving, die toelaten om rijke en complexe concepten te vormen,
die zich op hun beurt vertalen in Semantisch Web constructen. Hun semantiek wordt
traditioneel opgesplitst in concepten en relaties, volgens de verschillende behandeling
van instanties, hun attributen en rollen, uitgedrukt als feiten beweringen. Het eerste

9
2 Het Semantisch Web

concept is gekend als de TBox (voor terminologische kennis, de basis voor “T” in TBox)
en representeert het schema of de taxonomie van een domein. De TBox is het structurele
en intentionele concept van conceptuele relaties. Het tweede onderdeel van instanties is
gekend als de ABox (voor beweringen/assertions, de basis voor “A” in ABox) en beschrijft
de attributen van de instanties, de rollen tussen de verschillende instanties en andere
beweringen over instanties met betrekking tot hun klasse lidmaatschap van de TBox
concepten (Nardi en Brachman, 2002). Formele representaties van kennis zijn de focus
geweest van kennisrepresentatie en reasoning research van de voorbije twintig jaar binnen
het domein van de Artificiële Intelligentie (Brachman en Levesque, 2004; Sowa, 1999 en
Baader et al, 2003).

2.1.3 Grondbeginselen
Het Wereldwijde Web introduceerde een aantal radicale nieuwe ideeën over het delen van
informatie. Maar deze radicale nieuwe manier van denken heeft nog meer ingrijpende
gevolgen wanneer het wordt toegepast op een web van gegevens zoals het Semantisch Web.
Hendler (2008) onderscheidt de volgende fundamentele concepten die de basis vormen
voor de ontwerpbeslissingen omtrent Semantisch Web standaarden en dewelke van sterke
beïnvloeding zijn voor het produceren van kwalitatieve semantische webapplicaties.

• De AAA slogan — “Anyone can say Anything about Any topic.” Eén van de
grondbeginselen van het Web in het algemeen en het Semantisch Web in het
bijzonder.

• Open wereld/gesloten wereld — Een gevolg van de AAA slogan is dat er altijd
iets nieuws zou kunnen zijn dat iemand kan zeggen; dit betekent dat we moeten
aannemen dat er altijd meer informatie is dan men kent.

• Niet-unieke naamgeving — Vermits de stemmen op het Web niet noodzakelijk hun


benamingen coördineren met anderen, kan het zijn dat dezelfde entiteit meerdere
benamingen kent.

• Het netwerk effect — Het kenmerk van het Web dat het organisch doet groeien. De
waarde van het toetreden stijgt met het aantal mensen die reeds zijn toegetreden.
Dit is ook wel bekend als de wet van Metcalfe3 .

2.1.4 Onderzoek
Ding (2010), voerde in zijn recente paper, “Who is who in the field – A bibliometric
analysis”, een citatie-analyse uit rond Semantisch Web voor de periode 1960 tot 2009.
Papers en citaten werden verzameld uit twee grote databanken, Web of Science en Scopus.
De belangrijkste publicatiekanalen op vlak van het Semantisch Web zijn conference pro-
ceedings, met name deze die worden uitgegeven door Springer, in de reeks Lecture Notes
in Computer Sciences. Belangrijke tijdschriften die Semantisch Web papers publiceren

3
http://nl.wikipedia.org/wiki/Wet_van_Metcalfe

10
2 Het Semantisch Web

zijn Theoretical Computer Science, Bioinformatics, Data & Knowledge Engineering en


IEEE Transactions on Knowledge and Data Engineering. De meest productieve auteurs
zijn T. Eiter, A. Brogi en H. Zhuge.

De onderzoek impact is geanalyseerd op basis van het aantal citaties. In de gehele


periode (1960-2009), zijn R. Milner, M. Gelfond en C.A.R. Hoare Gelfond gerangschikt
als de top drie auteurs. Sir Tim Berners-Lee neemt de vierde plaats in gedurende de
gehele periode. Scopus haar citatie-data laat de rangschikking van de aangehaalde tweede
of derde auteurs toe. J. Hendler, S. Staab en H. Garcia-Molina zijn gerangschikt als
meest aangehaalde tweede auteurs, terwijl O. Lassila, F. van Harmelen en I. Horrocks
deel uitmaken van de top drie meest geciteerde auteurs. In WOS wordt T. Gruber zijn
ontologie paper consistent als meeste aangehaald. A. Van Gelder zijn theoretisch bewijs
heeft een tweede plaats, en S. Deerwester zijn “latent semantic analysis” paper is derde.
T. Berners-Lee, J. Hendler en O. Lassila’s artikel over de visie van het Semantisch Web
wordt gerangschikt als tweede meeste aangehaalde paper in 2005-2009, terwijl in Scopus,
Gruber zijn ontologie paper en Berners-Lee zijn Scientific American paper de top twee
meest aangehaalde papers zijn in 1960-2009 en van 2005-2009.

Zowel in WOW als in Scopus zijn de meest geciteerde tijdschriften en conferenties


Lecture Notes in Computer Science of Lecture Notes in Artificial Intelligence, Artificial
Intelligence, Communications of the ACM en Theoretical Computer Science. In WOS
worden M.A. Haaris, T. Harris en L. Ding gerangschikt als de drie auteurs met een
aanzienlijke toename van het aantal citaten. Daarentegen, in Scopus worden D. Roman,
J. De Bruijnn en L. Ding gerangschikt als de top drie auteurs met de grootste toename
van het aantal citaten. Tenslotte meent Ding dat men, door het vergelijken van artikelen
aangehaald in de periodes 2000-2004 en 2005-2009, een verschuiving in het onderzoek
ziet van AI-gerelateerd logisch programmeren, logische redenering en het bewijzen van
theorieën naar ontologische talen (e.g., RDF, OWL), semantische data conversie en het
mappen van ontologieën.

Brickley (2010), heeft enige kritiek op de manier waarop Ding zijn paper presenteert.
Brickley meent namelijk dat veel van de belangrijke infrastructuur van het Semantisch Web
tot stand is gekomen door middel van niet-academische samenwerking, hetzij industriële
of informele online samenwerking. Hij meent zelfs dat het academische publicatie-proces
een vertragende factor is op dit gezamenlijk werk. De traditioneel-gepubliceerde weten-
schappelijke literatuur is natuurlijk een belangrijk onderdeel van het verhaal, maar als
men alleen dit beschouwt, creëert men een misleidende gevoel van hoe de dingen werkelijk
tot stand zijn gekomen, en zelfs nog erger is dat men een misleidende intuïtie geeft hoe
men het project verder kan helpen. In de ervaring van Brickley zijn veel van de discussies
en inspanningen rond het Semantisch Web online gebeurd. Veel van de mensen die wel
wat realiseerden werkten niet in een academische omgeving waar er institutionele druk is
om te publiceren in bepaalde domeinen. Hiermee wilt hij zeker niet het kritische belang
afkomstig van de academische wereld kleineren. Immers, zonder de academische buy-in en
de bijhorende financiering van onderzoek, zou het Semantisch Web project zeker een stille

11
2 Het Semantisch Web

dood zijn gestorven. Echter, er is voortdurend gevaar op verwarring rond het werkelijke
project — een wereldwijde samenwerking ter verbetering van de faciliteiten voor het
linken van informatie op het Web — met een tweede activiteit door erover te schrijven.
De twee zijn niet hetzelfde, en bij gebrek aan bruikbare moderne impact statistieken,
wordt het gemakkelijk om de twee te vermengen. Hij stelt daarom dat een academische
citatie-analyse van het Semantisch Web project met als titel “Who is who in the field?”
niet gepast is, omdat het jonge ontwikkelaars misleidt om een impact te maken op de
wereld, in plaats van slechts op de literatuur. “Who cites who?” is misschien wel een
meer accurate karakterisering.

2.2 Data-integratie en het delen van informatie


Als data geïsoleerd is in een silo, dan wordt zijn gebruik en functie significant gelimiteerd.
De wereld wordt echter steeds complexer en gekoppeld, waardoor het delen van gegevens
essentieel is geworden op vrijwel alle terreinen (Barabasi, 2002). Het probleem bij het
delen van gegevens tussen systemen kan opgedeeld worden in twee subproblemen: het
syntactische probleem en het semantische probleem. Deze worden achtereenvolgens
toegelicht. Vervolgens wordt er beargumenteerd dat metadata en data onlosmakelijk
verbonden zijn met elkaar. Tenslotte kijken we naar het Web, dat ook het probleem
ervaart van het delen van data en gegevensintegratie (Berners-Lee, Hall, Shadbolt, 2006).
De beperkingen van het traditionele Web voor het delen en integreren van data worden
behandeld; meer bepaald op het niveau van de Web-infrastructuur en op het niveau van
hypertext.

2.2.1 Syntaxis en semantiek


Het onderscheidt tussen de syntactische-, semantische- en pragmatische dimensies in
de taal-en communicatie theorie werd toegeschreven aan de Amerikaanse semioticus en
filosoof Charles Morris (1946), die deze dimensies als volgt gedefinieerd heeft:

“Pragmatics deals with the origins, uses and effects of signs within the total
behavior of the interpreters of signs, and thus has the widest scope of any
semiotic study. Semantics concerns just the relations between signs and the
objects they signify, narrowing semiotic study to the strict literal meaning of
signs and propositions. Syntactics concerns the formal relations between signs
themselves, further narrowing semiotic study to the logical and grammatical
rules that govern sign use.”

Morris baseerde veel van zijn werk op eerdere studies van semiotici zoals Charles Pierce
en het sociaal behaviorisme van John Dewey en George Herbert Mead. In alledaagse IT
taal verwijst semantiek naar de studie van de betekenis van woorden, in tegenstelling tot
syntaxis dat refereert naar de structuur van woorden of taal, zoals grammatica. Commu-
nicatie vereist dat mensen het eens moeten zijn over een gemeenschappelijk medium en

12
2 Het Semantisch Web

taal. Het vinden van een gemeenschappelijk medium voor communicatie is analoog aan
het syntactisch aspect bij het delen van data. Als een persoon beslist om Morsecode te
gebruiken, maar de andere is van plan om rooksignalen uit te zenden, dan zullen ze moeite
hebben om ideeën uit te wisselen. Het vinden van een wederzijds verstaanbare codering
van concepten binnen een gemeenschappelijk medium is analoog aan het semantische
aspect van het probleem van gedeelde gegevens. In relatie tot het Wereldwijde Web is de
notie van semantiek erg open voor interpretatie, waarschijnlijk omdat het World Wide
Web Consortium (W3C) het totale concept van semantiek bewust breed definitieert. In de
context van organisatorische informatie wordt semantiek gerepresenteerd door de relatie
tussen informatie objecten, met verschillende granulariteit (e.g., gegevens versus kennis).
Wanneer zulke relaties behoorlijk gestructureerd zijn, bevatten zij de “intelligentie”, die
we uit onze systemen wensen te halen. Cognitieve systemen (kennissystemen, informa-
tiesystemen, intelligente systemen, enz.) en de IT-infrastructuren die zijn ontworpen
om hen te ondersteunen, moeten ontwikkeld worden langs alle drie de dimensies om
intelligent te communiceren.

Laten we nu een voorbeeld geven vanuit het perspectief van een databank, gebaseerd
op Hebeler et al (2009) en Evans et al (2009). Eén van de grootste uitdagingen voor de
database community is het vinden van manieren om data efficiënt te integreren. De com-
plexiteit bij data-integratie wordt bepaald door syntaxis en semantiek. Het syntactische
aspect van het probleem rond het delen van data betreft het verkrijgen van toegang tot de
gedeelde gegevens, terwijl het semantische aspect het incorporeren van deze informatie in
de datastructuren van de verbruikende systemen betreft. Om het verschil tussen syntaxis
en semantiek te illustreren, worden er drie benaderingen om informatie te representeren
beschouwd, evenals hun implicaties voor het delen van gegevens. Het scenario betreft
twee software systemen die informatie beheren binnen een gemeenschappelijk domein.
Het eerste systeem, de producent, heeft informatie dewelke de tweede, de consument,
wenst te incorporeren.

Geserialiseerde objecten Bij binaire object serialisatie genereert de producent objecten


die data representeren om gedeeld te worden. De gegevenswaarden in deze objecten worden
rechtstreeks geserialiseerd als collecties van bytes. Deze techniek kan enkel succesvol
geïntegreerd worden met het nodige inzicht van de consument. Het consumerende systeem
moet de exacte details van de producent zijn gegevensstructuren kennen en dat om het
syntactische gedeelde gegevens probleem te kunnen adresseren. De hoeveelheid aan
vereiste voorkennis heeft een significante impact op de bruikbaarheid van deze methode
van delen van informatie.

Relationele databanken Een relationele databank biedt significante verbeteringen ten


opzicht van geserialiseerde objecten maar heeft zijn eigen tekortkomingen. Relationele
databanken zijn meestal onderscheidende, herbruikbare componenten die betrekking
hebben op de bedrijfslogica van een software systeem. Dit heeft geleid tot de stan-

13
2 Het Semantisch Web

daardisatie van API’s 4 om ermee te interacteren. Daarnaast ondersteunen de meeste


relationele databanken ook Structured Query Language (SQL) queries5 om data op te
halen. Door gebruik te maken van deze API’s en SQL, kan de complexiteit op het syntac-
tische probleem gereduceerd worden. Nochtans blijft het syntactische probleem bestaan.
De gestandaardiseerde API’s bieden wel een interface, maar zijn per database vendor
verschillend. Zonder a priori te weten welke database vendor de producent gebruikt,
wordt het moeilijk voor de consument om toegang te krijgen tot de databank van de
producten. Bovendien blijft het semantische probleem eveneens. Zonder een gedetailleerd
begrip van de databank schema’s en tabel definities wordt het een uitdaging om zelfs de
eenvoudigste databanken te integreren.

Extensible Markup Language (XML) XML is momenteel een zeer populaire en ef-
fectieve manier om informatie uit te wisselen. XML kan namelijk een effectieve en
flexibele oplossing bieden voor het syntaxis probleem bij het delen van data omwille
van het ontbreken van gereserveerde sleutelwoorden of vooraf bepaalde woordenschatten.
Ondanks zijn flexibiliteit, adresseert XML niet het semantische aspect bij het delen van
data. XML Stylesheet Transformations (XSLT’s) zijn in staat om speciaal gedefinieerde
elementen te converteren van één syntaxis naar een ander, maar deze XML elementen
hebben geen betekenis op zichzelf. Een kleine verandering vereist veel aanpassingswerk
omdat XSLT heel syntaxis specifiek en daardoor fragiel is. Zonder de betekenis vast te
leggen van de codering en relaties tussen XML elementen, kan men onmogelijk de impact
van een verandering in grootte of terminologie inschatten.

2.2.2 Metadata en data zijn elkaars wederhelften


De drie hierboven beschreven methoden tonen progressie in tijd en sofisticatie op het
gebied van het syntactische probleem bij het delen van data. Maar tot op vandaag vereist
het hard labeur om twee XML documenten bijeen te voegen. Dit komt omdat de focus
bij data uitwisseling zich niet toelegt op het semantische aspect. Om dit probleem te
overkomen moet men realiseren dat data en metadata onafscheidelijk zijn. Laten we
eerst metadata definiëren. Volgens International Organization for Standardization (ISO)
zijn metadata het volgende:

“... the information and documentation which makes data understandable


and shareable for users over time. Data remains usable, shareable, and
understandable as long as the metadata remain accesible (ISO, 2004).”

Gegevens betreffen met andere woorden waarden, individuele atomen van informatie
en metadata beschrijven de relatie tussen deze atomen en andere data. De hoeveelheid
metadata is meestal een veelvoud van de hoeveelheid data. Bovendien wijzigen metadata
vaak veel minder frequent dan data.

4
Open Database Connection (ODBC) en Java Database Connectivity (JDBC) zijn voorbeelden van
gestandaardiseerde software interfaces of Application Programming Interfaces voor databanken.
5
Queries laten toe om complexe, expliciete en gestructureerde vragen te stellen. De resulterende
informatie slaagt er al dan niet in om die vraag te beantwoorden.

14
2 Het Semantisch Web

Eén van de uitdagingen van relationele data is begrijpen hoe de verscheidene tabel-
len met elkaar gerelateerd zijn. Bij zulk relationeel datamodel kunnen de semantische
relaties afgeleid worden uit de tabellen en kolommen. De metadata van een relationeel
schema, dewelke kolommen beschrijven die samen een bepaalde entiteit vormen, is bij
een semantisch datamodel deel geworden van de data zelf. Op die manier wordt er een
flexibel datamodel gevormd dat toelaat om naadloos informatie te integreren met nieuwe
semantische data.

Meestal gebeurt de samensmelting van data en metadata in het hoofd van de ont-
wikkelaar, maar geautomatiseerde informatie-uitwisseling mag niet afhankelijk zijn van
een persoon. Daarom, om ervoor te zorgen dat informatie automatisch uitgewisseld
wordt, moeten data en metadata gegroepeerd worden. Samen zorgen data en metadata
ervoor dat informatie overdraagbaar, uitwisselbaar, interoperabel en vindbaar wordt
omdat de relaties tussen de gegevenswaarden onafhankelijk blijven van waar ze worden
opgeslagen. Deze benadering, die het Semantisch Web hanteert, zorgt ervoor dat het
delen van informatie evidenter wordt op het semantische niveau.

2.2.3 Gebrek aan data-integratie op het Web


De literatuur wijst op twee beperkingen van het traditionele Web; meer bepaald op
het niveau van de Web-infrastructuur en op het niveau van hypertext. Deze worden
achtereenvolgens besproken.

Limieten vanwege de Web-infrastructuur Ten grondslag aan het Web ligt een set van
berichten dewelke de ontwikkelaars van de Web-infrastructuur besloten hebben om op
een gestandaardiseerde manier te behandelen. Bijvoorbeeld, een HTTP webserver die een
GET request ontvangt, zal data corresponderend met het path terugsturen. De semantiek
van deze berichten zijn dus wel degelijk gedefinieerd in standaarden vastgelegd door
comités en gedocumenteerd in Request For Comments (RFC) en W3C aanbevelingen.
Dit heeft ervoor gezorgd dat webapplicatie ontwikkelaars kunnen opereren achter een
façade die de details van de tussen machines uitgewisselde applicatie data afschermt,
waardoor men kan focussen op de eigen applicatie. Webontwikkelaars hoeven zich niet
langer te coördineren met andere ontwikkelaars met betrekking tot berichtformaten of
hoe applicaties zich moeten gedragen in de aanwezigheid van bepaalde gegevens.

Hoewel deze façade heeft geresulteerd in een explosie aan beschikbare applicaties voor
de eindgebruiker, heeft de ontkoppeling van de data uitwisseling ervoor gezorgd dat de
data verzuilt is geraakt in stovepipe systems 6 , verborgen achter webinterfaces. Deze
webfaçade kan dus als oorzaak worden beschouwd van het ontbreken van de integratie
van webapplicaties met andere Internet-applicaties. Het is daarom dat het huidige proces
om data te combineren momenteel gesofisticeerde en ad-hoc technieken vereist, juist
vanwege deze verborgen aard van data op het Web (Evans et al, 2009).
6
Een stovepipe system is een legacy systeem dat een verzameling is van onderling verbonden elementen die
zo nauw met elkaar gekoppeld zijn dat de afzonderlijke elementen niet differentieerbaar, aanpasbaar of
herwerkbaar zijn. Het stovepipe systeem moet worden gehandhaafd totdat het geheel wordt vervangen
door een nieuw systeem.

15
2 Het Semantisch Web

Limieten vanwege Hypertext op het Web: syntaxis vs. semantiek Het traditionele
Web bestaat uit documenten geschreven in de Hypertext Markup Language (HTML), een
opmaaktaal voor de specificatie van documenten. HTML wordt gebruikt om documenten
te beschrijven, afgewisseld met multimedia objecten zoals afbeeldingen en video’s of
interactieve formulieren. Echter, HTML heeft een aantal beperkingen die duidelijk worden
gemaakt met het voorbeeld dat volgt en gebaseerd is op Evans et al (2009).

Hieronder twee items uit de CD catalogus van webshop ’CD WOW!’:

• 88697369212 – Set Your Goals – Reset – 6,99 euro

• WEAC268 – The National – The National – 6,99 euro

De webontwikkelaar van de ’CD WOW’ website is niet vertrouwd met het Semantisch
Web en laat de catalogus als volgt genereren in HTML.

<table>
<tr><td>88697369212</td><td>Set Your Goals</td><td>Reset<td>6,99 euro<td></tr>
<tr><td>WEAC268</td><td>The National</td><td>The National</td><td>6,99 euro</td></tr>
</table>

Een computerprogramma zou wel in staat zijn de tekst op catalogus pagina te lezen,
maar weet de betekenis van de informatie niet te achterhalen. In het voorbeeld dient het
programma aan te nemen dat hem om de catalogus van een winkel genaamd ’CD WOW’
gaat en dat een album “Reset” van de artiest “Set Your Goals” wordt verkocht tegen een
prijs van EUR 6,99. Een totaal gebrek aan contextinformatie maakt dat het programma
de inhoud niet zal kunnen begrijpen. Syntaxis onderscheidt wel data, maar geen kennis.

In het bovenstaande voorbeeld wordt slechts de presentatiewijze – de vorm van de


willekeurige objecten of ook wel symbolen – beschreven. Net zoals bij een programmeer-
taal komt dit overeen met de syntaxis. In tegenstelling tot computers zijn deze symbolen
wel interpreteerbaar voor het menselijk verstand. Mensen zijn namelijk in staat om een
welbepaalde betekenis te geven aan een combinatie van symbolen. Bij semantiek gaat
het om de betekenis van symbolen en niet om de vorm ervan. Met andere woorden,
de syntaxis legt de presentatiewijze vast en de semantiek beschrijft de onderliggende
betekenis.

Semantische HTML7 is een manier om HTML te schrijven waarbij tags de beteke-


nis van gecodeerde informatie benadrukken in plaats van de presentatiewijze.
Een voorbeeld hiervan is het gebruik van de tag <em>, die staat voor emphasis (nadruk),
in plaats van de tag <i>, die italic (schuinsgedrukt) betekent.

7
http://en.wikipedia.org/wiki/Semantic_HTML

16
2 Het Semantisch Web

Eén manier om HTML uit te breiden met semantiek is door middel van Microfor-
mats8 . Door het HTML class attribuut in te vullen, kan men op een eenvoudige manier
semantische data toevoegen. Een andere benadering is die van RDFa. Eveneens biedt
het de mogelijkheid om attributen toe te voegen aan tags. Doch laat het ook toe om een
namespace te definiëren op dezelfde manier zoals RDF/XML dat doet. Op deze manier is
de uitgever niet gebonden aan bepaalde woordenschatten en is men in staat om een eigen
woordenschat te definiëren als er nog niets geschikt bestaat. Online winkels of veilingen
zoals Best Buy maken reeds gebruik van deze semantische annotaties (Mohan, 2009). De
reden van adoptie is dat Google en Yahoo! recent begonnen zijn met het verzamelen van
embedded RDFa, wat zich dan weer vertaalt in een hogere ranking van de respectievelijke
pagina’s (Goer, 2008; Goel, Ramanathan, Hansson, 2009).

2.3 Datamodellering
Het Semantisch Web, net zoals het traditionele Web van documenten, is gebaseerd op
een aantal radicale noties rond het delen van informatie. Deze ideeën — de AAA slogan,
de open wereld assumptie en niet-unieke naamgeving — bieden een ruimte waarin het
delen van informatie kan floreren en waar een netwerkeffect door een synergie van kennis
mogelijk wordt. Maar de huidige manier om informatie te verzamelen creëert een chaos
van verwarring, onenigheid en conflict. Immers, de Web-infrastructuur verhindert het
delen van informatie, coöperatie en collaboratie.

De oplossing ligt in modellering. Modellering is het proces van het ordenen van in-
formatie voor gemeenschappelijk gebruik. Dit wordt op drie manieren ondersteund (de
Leeuw, 1994):

• Het biedt een raamwerk voor communicatie tussen mensen;

• Het biedt een formele verklaring;

• Het biedt een structuur voor het beheren van verschillende meningen/betekenissen.

Er zijn vele manieren om na te denken over data en bijgevolg ook modelleringwijzen. In


de volgende secties wordt een overzicht geboden van de traditionele, vaak mature en goed
onderbouwde manieren van modelleren. Hun sterktes en zwaktes worden beschreven
waarna een uiteenzetting volgt rond de modelleringtechnieken voor het Semantisch Web.
We baseren ons op Evans et al (2009).

2.3.1 Traditionele methoden


Gegevens in tabelvorm De eenvoudigste dataset is data in tabelvorm, zoals een Excel
werkblad of een HTML-tabel. Gegevens in tabelvorm hebben het voordeel dat ze heel
eenvoudig te lezen en te manipuleren zijn. Beschouw de restaurant-gegevens in Tabel 2.1.

8
http://www.microformats.org/

17
2 Het Semantisch Web

Tabel 2.1: Voorbeeld van tabelgegevens met betrekking tot restaurants.

Restaurant Adres Keuken Prijs Open


Deli Llama Molenweg Deli € ma, di, wo, do, vr
Peking Inn Dorpsstraat Chinees €€ do, vr, za
Wok This Way Schoolstraat Chinees € ma, di, wo, do, vr, za, zo
Marquis de Salade Kerkstraat Frans €€€ do, vr, za
Bron: gebaseerd op Evans et al (2009), Programming the Semantic Web.

Het is meestal eenvoudig om data in een tabel te tonen, sorteren en te bewerken. Vermits
er betekenis wordt gegeven aan de data in de rijen en kolommen spreken we hier van
modellering. De data in deze rijen en kolommen leggen aan een persoon uit wat de
semantiek is. Het feit dat Chinees in de rij Peking Inn staat en in de kolom keuken,
vertelt ons dat “Peking Inn serveert Chinees eten”. We weten dit omdat we begrijpen
wat een restaurant is en een keuken, en omdat we geleerd hebben hoe een tabel te lezen.

Gegevens in tabellen hebben duidelijke beperkingen. Beschouw bijvoorbeeld de laatste


kolom, Open. In deze kolom worden verschillende dagen samengevoegd. Wat als we
nu ook de openingsuren wensen toe te voegen? In theorie is dit mogelijk, zoals wordt
getoond in Tabel 2.2:

Tabel 2.2: Een illustratie van te veel gegevens in een tabel.

Restaurant Adres Keuken Prijs Open


Marquis de Salade Molenweg Deli €€€ di(11u–19u), do(11u–20u), za(11u–22u)
Peking Inn Dorpsstraat Chinees €€ do(17u–22u), vr(17u–23u), za(17u–23u)

Bron: gebaseerd op Evans et al (2009), Programming the Semantic Web.

Deze tabel laat ons echter niet toe om restaurants te vinden die vrijdagavond open zijn.
Het computerprogramma zal namelijk de samengevoegde velden in de Open kolom niet
kunnen interpreteren. De problemen met tabellen worden nog meer zichtbaar wanneer er
door meerdere tabellen wordt gerefereerd naar dezelfde data. Bijvoorbeeld, als we een
werkblad hebben met de restaurant aanbevelingen van onze vrienden, dan kunnen we
niet zomaar de aanbevolen restaurants oplijsten die ook dicht bij huis zijn. De modellen
zijn simpelweg te rigide, gelimiteerd en meestal ook niet aanpasbaar.

Relationele data Relationele databases zijn gemeen goed geworden in zowat elke in-
dustrie. Producten als IBM DB2, Oracle DB en MySQL zijn zeer matuur en zijn het
resultaat van talrijke jaren intensief onderzoek. Vooral wanneer het datamodel goed
begrepen is, zijn relationele databases zeer krachtig voor het opslaan van grote data sets.
In essentie laat een relationele database toe om meerdere tabellen samen te voegen op
een gestandaardiseerde manier. Voor de restaurant data kan een schema gedefinieerd
worden zoals Figuur 2.2 weergeeft.

18
2 Het Semantisch Web

Figuur 2.2: Een simpel relationeel schema voor een restaurant.


Restaurant Uren
ID RestaurantID
Naam Dag
Adres Open
KeukenID Gesloten

Keuken
ID
Naam

Bron: gebaseerd op Evans et al (2009), Programming the Semantic Web.

In plaats van te sorteren of te filteren op slechts één kolom, kan men nu meer gesofisti-
ceerde queries doen. Bijvoorbeeld, een query die alle restaurants oplijst die open zijn om
22 uur op een vrijdag, kan in SQL uitgedrukt worden als volgt:

SELECT Restaurant.Naam, Keuken.Naam, Uren.Open, Uren.Gesloten


FROM Restaurant, Keuken, Uren
WHERE Restaurant.KeukenID = Keuken.ID
AND Restaurant.ID = Uren.RestaurantID
AND Uren.Dag = “vr”
AND Uren.Open < “22”
AND Uren.Gesloten > “22”

In het relationele datamodel is de semantiek van de data meer expliciet. De bete-


kenis van de waarden worden beschreven door het schema. Zo zijn er de entiteiten
“Restaurant” en het type “Dag”, en er is een bepaalde relatie tussen beide. Hoewel
de database niet echt weet wat een “Restaurant” is, kan het wel verzoeken om alle
restaurants op te lijsten met bepaalde eigenschappen.

Vele applicaties (e.g., productcatalogi), lenen zich perfect voor een relationeel schema
vermits er maar een beperkte set van velden is, die bovendien maar op een aantal ma-
nieren worden gebruikt. Data-integratie op het Web wordt echter gekenmerkt door snel
veranderende en onbekende types van data. Stel dat we de volgende bijkomstige gegevens
met betrekking tot ons restaurant-schema te weten komen, zoals getoond in Tabel 2.3.

Vele restaurants kunnen vaak bestempeld worden als zowel bar als restaurant, bijvoor-
beeld een taverne. Tabel 2.3 toont of er ook een DJ draait en wat de drankspecialiteit is.
Momenteel zijn al deze tabellen gescheiden, maar het is perfect mogelijk dat iemand een
plaats zoekt waar men een Franse keuken heeft en waar er Martini wordt geserveerd. Als
we de bestaande structuur wensen te behouden, dan kunnen de tabellen gewoon gelinkt
worden met elkaar. Een tabel RB_Link die aangeeft welk restaurant en bar op hetzelfde
adres zijn, kan hiervoor zorgen.

19
2 Het Semantisch Web

Tabel 2.3: De introductie van onvoorziene gegevens.

Bar Adres DJ Drank specialiteit


Marquis de Salade Molenweg Ja Martini
Café De Prof Vekestraat Ja Blue Thrill
Peking Inn Dorpsstraat Nee Scorpion Bowl
Bron: gebaseerd op Evans et al (2009), Programming the Semantic Web.

Figuur 2.3: Het linken van “bars”-entiteiten aan een bestaand schema.
Bar
Restaurant
ID
ID RC_Link
Naam
Naam RestaurantID
Adres
Adres BarID
DJ?
KeukenID
Specialiteit

Bron: gebaseerd op Evans et al (2009), Programming the Semantic Web.

Dit introduceert echter een nieuw probleem. Er zijn nu namelijk twee namen en adressen
in de databank. Willen we zoeken op adres, dan moeten we naar beide tabellen kijken.
Bovendien is de keuken gebonden aan het restaurant type en niet aan het bar type. Het
toevoegen en bijwerken van data is nu veel ingewikkelder. Een betere manier om dit
te modelleren zou zijn door een tabel “Plaats” in te voeren, dewelke restaurant en bar
ontkoppelt.

Figuur 2.4: Genormaliseerd schema dat een plaats scheidt van zijn doeleinden.
Bar
ID
PlaatsID
DJ?
Specialiteit
Uren
Plaats
PlaatsID
ID
Dag
Naam
Open Restaurant
Adres
Gesloten ID
PlaatsID
KeukenID

Bron: gebaseerd op Evans et al (2009), Programming the Semantic Web.

20
2 Het Semantisch Web

Hoewel dit ons probleem oplost, moet het oude datamodel nog wel getransformeerd
worden naar het nieuwe datamodel. Dit proces noemt men schema migratie. Niet alleen
moeten alle queries herschreven worden, maar ook alle bestaande code die uitgaat van
een bepaalde tabel structuur. In omgevingen zoals het Web waar datasets voortdurend
veranderen, wordt het migratie proces gewoonweg onhandelbaar. Een ander probleem
met relationele databanken is dat schema’s ongelofelijk complex kunnen worden wanneer
men met grote hoeveelheden data heeft te maken. Denk maar aan schema’s voor ERP-
applicaties die ontoegankelijk zijn waardoor er zich een hele industrie van adviesbureaus
is ontstaan die dergelijke pijnlijke- en arbeidsintensieve processen aanpakken.
Een andere manier om data te modelleren is door gebruik te maken van het key/value
formaat. Hierbij zijn plaatsnaam en adres eigenschappen van “plaats”. De kolommen in
de plaatstabel kunnen vertaald worden naar key/value rijen in een Eigenschappen tabel.
Dit wordt meestal niet aangeraden omdat dan de normalisatie verloren gaat en meestal
resulteert in een lagere database performantie. Desalniettemin laat het toe om data uit
te drukken en te anticiperen op nog ongekende doeleinden. Zo zou de tabel uitgebreid
kunnen worden naar bijvoorbeeld concertgebouwen.

2.3.2 Modelleertechnieken voor het Semantisch Web


Op het Semantisch Web wordt informatie gemodelleerd op basis van een set van drie
complementaire talen: het Resource Description Framework (RDF), RDF Schema (RDFS)
en de OWL Web Ontology Language.

Eens een tabel volledig geparameteriseerd is, kunnen we willekeurige nieuwe feiten
toevoegen. Immers, er is niets meer dat de “plaats” tabel verhindert om enkel maar
feiten over lokale specialiteiten en concertgebouwen bij te houden. De geïntroduceerde
drie kolommen structuur wordt op het Semantisch Web gebruikt om informatie te repre-
senteren als een set van statements bestaande uit drie delen: een onderwerp, predicaat
en object. Daarom wordt het ook wel triple genoemd. Triples kunnen beschouwd worden
als taalkundige uitdrukkingen, waarbij elk element overeenkomt met een stukje uit de
grammatica, dat gebruikt kan worden om een korte zin mee te vormen.

Figuur 2.5: Een voorbeeld van een triple.

The Art
Sun Tzu schreef
Of War

onderwerp predicaat object

In het algemeen refereert een onderwerp van een triple naar een entiteit — een “ding”
waarvoor een conceptuele klasse bestaat. Mensen, plaatsen en andere objecten zijn
entiteiten, maar ook minder concrete dingen zoals tijdsaanduidingen of ideeën. Predicaat

21
2 Het Semantisch Web

refereert naar een eigenschap van de entiteit. Een geboortedatum, naam, of e-mail adres
zijn voorbeelden. Objecten vallen in twee klassen: entiteiten die een onderwerp kunnen
zijn in een andere triple en letterlijke waarden zoals strings of nummers.

Meerdere triples kunnen samengevoegd worden door hetzelfde onderwerp en object


te gebruiken over verschillende triples heen. De verzameling van deze ketens van relaties
wordt een graaf genoemd. Door grafen te gebruiken om informatie te modelleren kan men
twee afzonderlijke grafen op een dezelfde manier onderwerpen en objecten identificeren
wordt het mogelijk om deze twee grafen samen te voegen. Elke triple kan nog steeds
zinvol op zichzelf staan. Figuur 2.6 is een diagram waarbij twee afzonderlijke grafen met
gemeenschappelijke identificaties samengevoegd worden.

Figuur 2.6: Een samengestelde graaf is de unie van verschillende triples met gemeen-
schappelijke identificaties.

B B B

A A
C

+ =
C
A

D
C
D F E
E
E F

Bron: gebaseerd op Hebeler et al (2009), Semantic Web Programming.

Gegevens worden flexibel en dynamisch Eén van de grondbeginselen van het Seman-
tisch Web is een open wereld; er is namelijk steeds ongekende informatie. Het Semantisch
Web speelt hier op in op basis van inferentie. Het is in staat om zelf dingen uit te
zoeken door middel van inferentie. Namelijk, eens dat informatie correct gedefinieerd
is, kan een zogenaamde reasoner nieuwe relaties afleiden. Bijvoorbeeld, stel dat Jan
een man is, en man is van het type persoon. Het systeem zou dan kunnen afleiden dat
Jan een persoon is. Bovendien kan een reasoner ook logische contradicties identificeren.
Bijvoorbeeld, als men claimt dat man en vrouw mutueel exclusieve groepen zijn, en ergens
is er sprake van dat Jan een vrouw is9 , dan zou de reasoner deze data kunnen bestempelen
als contradictorisch. Hoewel inferentie elk gegeven meer waarde bijbrengt, moet men
zorgzaam deze dynamische informatie valideren. Het inferentie proces is immers net
zoals alle computer systemen kwetsbaar voor het zogenaamde “Garbage In, Garbage Out”
fenomeen (Hebeler et al, 2009; Evans et al, 2009).10
9
Jan zou natuurlijk ook transseksueel kunnen zijn.
10
Garbage In, Garbage Out (GIGO) wordt gebruikt in Computerwetenschappen om de aandacht te
vestigen op het feit dat computers kritiekloos omgaan met de meest onzinnige input gegevens (Garbage

22
2 Het Semantisch Web

Semantische metadata laten toe om nieuwe informatie te ontdekken (zie reasoning),


maar bieden eveneens een nieuwe vorm van informatie-navigatie. Men kan in eender
welk punt starten en ontdekken door een bepaalde set van relaties te volgen. Voor
programma’s wordt het mogelijk om even eenvoudig te navigeren als op webpagina’s
(Hebeler et al, 2009; Evans et al, 2009).

Tenslotte is het Semantisch Web inclusief. De wijze waarop het Semantisch Web in
staat is om informatie flexibel uit te drukken, maakt het een ideale kandidaat om andere
gegevensformaten te incorporeren. Semantische vertaalregels en statements laten toe
om andere datatypes, waaronder relationele databanken, XML webservers en komma-
gescheiden lijsten te incorporeren. Op die manier kunnen andere waardevolle informatie
bronnen verrijkt en geünificeerd worden (Hebeler et al, 2009; Evans et al, 2009).

in) en dat ze onzinnige informatie produceren (Garbage out). Het was zeer populair in de begindagen
van de computer, maar kent een lange geschiedenis in de ingenieurswetenschappen. Het inferentieproces
bij kennisgebaseerde systemen versterkt deze zorg.

23
2 Het Semantisch Web

Een vergelijking tussen een ontologisch model en een relationeel datamodel Ten-
slotte presenteren we Tabel 2.4 die de subtiele verschillen tussen een ontologisch model
en relationeel datamodel weergeeft.

Tabel 2.4: Een vergelijk tussen een ontologisch model en een relationeel datamodel.

Ontologisch model Relationeel datamodel


Data gepresenteerd op conceptueel Data gerepresenteerd op fysiek niveau.
niveau, meer herbruikbaar.
Data is gebaseerd op een flexibel Data wordt beperkt door rigide schema.
datamodel die elke relatie kan uitdrukken Schema taal is primitief in vergelijking
door middel van ontologie. met de expressiviteit van een ontologie.
Data met context. Betekenis wordt Impliciete informele betekenis. Relaties
formeel en expliciet uitgedrukt. kunnen vertaald worden in kolommen.
Vangt subsumptie op via relaties tussen Geen ondersteuning voor
concepten en relaties. subsumptie-relatie – subsumptie
hiërarchie ontbreekt.
Domeinvriendelijke taal wordt gebruikt Queries zijn verbonden aan een schema,
om queries uit te drukken: alles is en expliciete joins moeten worden
expliciet. gespecificeerd.
Rules-talen drukken nieuwe concepten en Concepten en relaties worden gelimiteerd
relaties uit over bestaande. tot op de hoogte van het schema. Geen
afleidingen – afwezigheid van rule
ondersteuning om internationale
concepten en relaties te definiëren.
Gevolgtrekkingsmechanisme. Geen gevolgtrekkingsmechanisme.
Informatie-toegang is domein-afhankelijk Informatie-toegang is gebonden aan een
en schema-onafhankelijk – ideaal voor het schema – moeilijk om te samen te voegen
integreren van informatie over en combineren. Ideaal voor het beheren
verschillende bronnen heen. van gecontroleerde data. Redelijke
schaalbaarheid en query performantie.

Bron: gebaseerd op Kuriakose (2009), Understanding and Adopting Semantic Web Technology.

2.4 Ontologische modellering


Het Semantisch Web introduceert het idee van ontologische modellering. Filosofen, met
name Aristoteles (384-322), zijn altijd sterk betrokken geweest bij wat er bestaat en hoe
het te beschrijven — de zijnsleer. Er bestaan vele definities van ontologieën. De meest
gebruikte definitie in de Semantisch Web gemeenschap komt van filosoof Gruber (1993):

“an ontology is an explicit specification of a conceptualisation”

24
2 Het Semantisch Web

Nog een definitie die de wereld als invalshoek neemt (Uschold en Gruninger, 1996):

“an ontology is a shared understanding of some domain of interest”

Andere definities benadrukken naast het gedeelde begrip, ook de toepassing van ontolo-
gieën, zoals bijvoorbeeld Fensel (2001):

“An ontology is a shared and common understanding of a domain that can


be communicated across people and application systems.”

Een ontologie is gerelateerd aan woordenschatten en taxonomieën11 . Het biedt een precieze
woordenschat hoe kennis kan gerepresenteerd worden. Deze woordenschat laat ons toe
om, net zoals bij database schema’s of objectgeoriënteerde klasse-diagrammen, op een
formele manier te specificeren welke entiteiten worden gerepresenteerd, hoe ze gegroepeerd
kunnen worden en welke relaties ze leggen. Dit is zinvol, omdat we anders beroep moeten
doen op eigen inventie, intuïties en gedeelde ervaringen over onderwerp en object relaties.
De woordenschat kan daarom gezien worden als een sociaal contract tussen een data
provider en een data consumer. Hoe preciezer een ontologie, hoe beter het begrip van hoe
de data kan ingezet worden. Een ontologie wordt als succesvol beschouwd als mensen en
systemen die gebruik maken van de ontologie succesvol samenwerken. Ontologieën laten
toe om regels te formuleren voor de afleiding van nieuwe informatie. Nieuwe informatie
kan verstaan worden als de conclusies die we kunnen afleiden uit bestaande informatie.
Bijgevolg moeten machines die een ontologie lezen dezelfde conclusies kunnen trekken
(Kuriakose, 2009).

Figuur 2.7: Variërende rijkdom bij woordenschat, taxonomie en ontologie.


Toenemende Rijkdom van Kennismodelleertaal

Ontologie
taxonomie
+ andere relaties in domein
+ beperkingen

Taxonomie
terminologie
+ isKindOf relatie

Woordenschat
taalkundige afspraken (termen)
over concepten
in het domein

Bron: gebaseerd op Kuriakose (2009), Understanding and Adopting Semantic Web Technology.

11
Woordenschatten zijn simpele verzamelingen van goed gedefinieerde termen. Taxonomieën breiden
woordenschatten uit door het toevoegen van hiërarchische relaties tussen termen.

25
2 Het Semantisch Web

2.5 Componenten van het Semantisch Web


Het W3C heeft het Semantisch Web steeds voorgesteld als een monolithische “stack” van
technologieën, ook wel de “layer cake” genaamd. De stack illustreert hoe de verschillende
technologieën op elkaar bouwen. Op basis van de onderliggende technologieën kunnen dan
applicaties voor de eindgebruiker ontwikkeld worden. Over de verschillende jaren heen
werden de lagen van de taart bijgewerkt om de evoluerende standaarden te reflecteren en
om nieuwe use cases te ondersteunen. Hoewel we in deze sectie deze verschillende lagen
zullen beschrijven, mag men niet vergeten dat het Semantisch Web een collectie is van
standaarden, een set van tools en vooral ook een community met zich meedraagt.

Figuur 2.8: De meest recente versie van de Semantic Web Layer Cake volgens het W3C.

Bron: gebaseerd op Berners-Lee (2007), Semantic Web and Other Technologies to Watch.

26
2 Het Semantisch Web

2.5.1 XML Schema


Een algemene standaard van het Semantisch Web is de eXtensible Markup Language
(XML)12 . Zoals reeds aangehaald in Sectie 2.2.1, is XML op zichzelf niet in staat om een
document een bepaalde semantiek te geven. Loutere XML-tags worden door machines
begrepen als een opeenvolging van tekens. Om structuur aan een XML document te
geven gebruikt men XML Schema13 . De formele taal van XML Schema, XML Schema
Definition Language (XSD), is een standaard van het World Wide Web Consortium
(W3C). Het is de opvolger van het eerder ontwikkelde Document Type Definition (DTD).
Door middel van XML Schema kan een document model opgesteld worden en op grond
daarvan worden gecontroleerd op basis van een “validating parser”. Een XML Schema
kan onder meer opleggen welke elementen in een XML document kunnen voorkomen,
de volgorde waarin deze elementen moeten voorkomen en aan welke kenmerken deze
elementen moeten voldoen (De Backer, 2005). In principe zou men XML Schema kunnen
hanteren om semantische beschrijvingen af te spreken. XBRL14 is zo een universeel XML
schema dat gebruikt wordt om financiële rapporten te beschrijven, dat gebruik maakt
van gestandaardiseerde industrie termen en tags. Deze aanpak werkt alleen maar door
gebruik te maken van deze afgesproken beperkte woordenschat, waarop dan semantische
relaties tussen de verschillende documenten met dezelfde syntaxis kunnen worden gelegd.
Bij gebruik van een ander XML Schema, houdt het leggen van relaties op. Andere
Semantsich Web technologieën zoals RDF-metadata, RDFS en OWL bieden hier een
oplossing voor.

2.5.2 Resource Description Framework


Zoals reeds eerder duidelijk werd, maakt het Semantisch Web gebruik van statements
bestaande uit een onderwerp, predicaat en object, ook wel triple genoemd. Het is het
Resource Description Framework dat dit datamodel formaliseert. Een RDF-graaf is een
set van RDF triples.

Knooppunten van een RDF-graaf zijn de onderwerpen en de objecten van de state-


ments die een graaf vormen. Er zijn twee soorten knooppunten: literals en resources.
Literals vertegenwoordigen concrete datawaarden zoals getallen of strings en kunnen
enkel de objecten zijn van een statement. Resources daarentegen kunnen eender welke
waarde voorstellen en kunnen zowel onderwerp als object zijn. Ze nemen de vorm aan
van Internationalized Resource Identifiers (IRI). De IRI is een uitbreiding op URI. Het is
een gestandaardiseerde manier voor de benaming van resources. Het IRI schema biedt
een hiërarchische namespace voor verschillende resources die al dan niet toegankelijk zijn
via het Web15 . Een IRI is universeel uniek en blijft geldig in elke context waardoor de
uitdrukking van informatie in RDF overdraagbaar maakt (Hebeler et al, 2009).
12
http://www.w3.org/XML
13
http://www.w3.org/XML/Schema
14
http://www.xbrl.org/
15
Een telefoonnummer is bijvoorbeeld ook een IRI vermits het uniek, globaal bruikbaar en betrouwbaar
is.

27
2 Het Semantisch Web

URI’s beschikken vaak over een hash teken dat verwijst naar een ding – zoals een
individuele muzikant, een liedje van haar, of het recordlabel waar ze muziek op uitbrengt
– binnen een pagina zelf, in plaats van de pagina op zich. Figuur 2.9 representeert een
RDF graaf met machine leesbare statements over Eric Miller (voorheen hoofd van de
Semantic Web Group van het W3C, nu CEO bij Zepheira) en zijn contactgegevens van
2004. Deze statements betekenen het volgende: “Er is een persoon geïdentificeerd door
http://www.w3.org/People/EM/contact#me, wiens naam Eric Miller is, wiens e-mail adres
em@w3.org is en wiens titel Dr. is. (Miller en Manola, 2004)”

Figuur 2.9: Een voorbeeld van een RDF-graaf op basis van URI’s.
http://www.w3.org/2000/10/swap/pim/contact#Person

http://www.w3.org/1999/02/22-rdf-syntax-ns#type

http://www.w3.org/People/EM/contact#me

http://www.w3.org/2000/10/swap/pim/contact#personalTitle http://www.w3.org/2000/10/swap/pim/contact#fullName

Dr. http://www.w3.org/2000/10/swap/pim/contact#mailbox Eric Miller

mailto:em@w3.org

Bron: gebaseerd op Miller en Manola (2004), RDF Primer, W3C Recommendation

In een RDF-context worden predicaten, ook wel eigenschappen genoemd. Ze stellen de


verbindingen voor tussen resources. Ze kunnen echter zelf resources zijn waarover op zijn
beurt RDF-statements kunnen worden geformuleerd. Net zoals onderwerpen, worden
predicaten voorgesteld door middel van IRI’s (Hebeler et al, 2009).

Het delen van informatie De simpele structuur van een graaf en de globale namespace
van IRI’s maken dat RDF geoptimaliseerd is voor het uitwisselen van data. Ten eerste,
grafen hebben geen roots in tegenstelling tot bijvoorbeeld hiërarchische XML. Als men
twee bomen wenst samen te voegen, is het moeilijk om de root te bepalen omdat de
structuur van de boom gekend moet zijn. Dit in tegenstelling tot een RDF graaf, want
daar is geen enkele resource belangrijker in vergelijking met een andere. Het combineren
van grafen is hier conceptueel hetzelfde als het naast elkaar plaatsen van grafen. Ten
tweede, triples zijn collecties van URI’s en letterlijke waarden. Elke URI en letterlijke
waarde hebben een globale scope. Hierdoor moeten hun namen niet vertaald worden wat
een voordeel is bij het uitwisselen van data.

28
2 Het Semantisch Web

RDF-statements als punten in een assenstelsel RDF-statements kunnen beschouwd


worden als punten in een abstracte driedimensionale ruimte. Elke axis in de ruimte
presenteert ofwel het onderwerp, predicaat of object van een statement waarop URI’s en
letterlijke waarden kunnen geplaatst worden zoals blijkt uit Figuur 2.10. Een statement
kan dus met andere woorden afgebeeld worden als een punt gedefinieerd door een
onderwerp, predicaat en object (Hebeler et al, 2009).

Figuur 2.10: RDF-statements kunnen beschouwd worden als punten in een driedimensio-
nale ruimten in een IRI/letterlijke namespace.

<http://example.org/ont#d> <http://example.org/ont/#d> "f"


Onderwerpen

...
http://example.com/ont#d
http://example.com/ont#c Predikaten
http://example.com/ont#b
http://example.com/ont#a

... ...
http://example.com/ont#d http://example.com/ont#d
http://example.com/ont#c http://example.com/ont#c
http://example.com/ont#b http://example.com/ont#b
http://example.com/ont#a http://example.com/ont#a
http://example.com/ont#a

http://example.com/ont#b

http://example.com/ont#d
http://example.com/ont#c

"a"

"b"

"d"

"e"
"c"

...
"f"

Objecten

Bron: gebaseerd op Hebeler et al (2009), Semantic Web Programming.

De voordelen van RDF-statements bij het uitwisselen van informatie worden nu duidelijk:

• Eenvoudig samenvoegen: Punten in de statement ruimte zijn net hetzelfde als


punten in eender welke N -dimensionale ruimte. Twee sets van punten kunnen
samengevoegd worden om een rijker beeld te verkrijgen, net zoals grafen van
statements gecombineerd kunnen worden om een rijkere graaf te bekomen.

• Volgorde onafhankelijkheid: Als alle punten toegevoegd zijn in een statement


ruimte van punten, en het beeld is compleet, dan is het onmogelijk om te bepalen
in welke volgorde zij werden toegevoegd.

29
2 Het Semantisch Web

• Geen duplicaten: Als twee statements hetzelfde onderwerp, predicaat en object


hebben, dan zijn ze identiek. Eens een statement toegevoegd is aan een collectie, dan
zullen volgende statements geen additionele informatie bijdragen aan de collectie
van beweringen.

De expressiviteit van RDF is gelimiteerd tot binaire relaties. Anderzijds kunnen n-aire
relaties vertaald worden in een relatie object met n binaire relaties (Hebeler et al, 2009;
Evans et al, 2009; Allemang en Hendler, 2008).

Een andere interessante eigenschap van RDF, is dat het reflectief is door het ondersteu-
nen van reification. Dit laat toe om een verklaring te hijsen aan een statement, op het
niveau dat het het onderwerp of object kan zijn van andere verklaringen. Met andere
woorden, RDF-statements kunnen praten over andere “verdinglijkte”16 statements. Een
statement kan bijvoorbeeld aangeven wie een ander statement maakte, of wanneer deze
werd gemaakt (Hebeler et al, 2009).

RDF serialisaties Serialisatie maakt RDF praktisch voor het uitwisselen van informatie,
door een manier aan te bieden om het abstracte model te vertalen naar een concreet
formaat zoals een file of byte stream. De voornaamste serialisaties worden kort besproken
(Allemang en Hendler, 2008).

• RDF/XML17 : RDF/XML is een XML syntaxis voor het representeren van RDF tri-
ples en is de enige normatieve (gestandaardiseerde) syntaxis voor RDF serialisaties.

• Terse RDF Triple Language (Turtle)18 : Turtle is meer gebruiksvriendelijk. Omdat


het een graaf niet moet voorstellen als een boom, is het preciezer en heeft het een
beter leesbare syntaxis.

• N-Triples19 : N-Triples is een vereenvoudigde versie van Turtle. Het gebruikt dezelfde
syntaxis voor commentaar, URI’s en letterlijke waarden maar legt een aantal nieuwe
vereenvoudigende beperkingen op.

2.5.3 RDF Schema


RDF biedt een extreem krachtig en expressief model voor het vastleggen van informatie.
Toch, RDF alleen biedt geen manier om de mening van de gemodelleerde informatie vast
te leggen zoals verder blijkt.

16
Verdinglijken is de correcte Nederlandstalige vertaling voor het werkwoord “to reify” en is te mooi om
niet te gebruiken.
17
http://www.w3.org/TR/rdf-syntaxis-grammar/
18
http://www.w3.org/TeamSubmission/turtle/
19
http://www.w3.org/TR/rdf-testcases/#ntriples

30
2 Het Semantisch Web

“RDF defines a simple datamodel for describing the properties of resources,


and interrelationships among resources, in terms of named properties and
values. However, the RDF datamodel itself provides no mechanisms for
declaring specific types or classes of resources, or for declaring which properties
might apply to which classes of resources. However, RDF user communities
require the ability to say certain things about certain kinds of resources.
For describing bibliographic resources, for example, descriptive attributes
including "author", "title", and "subject" are common. For digital certification,
attributes such as "checksum" and "authorization" are often required. The
declaration of these properties (attributes) are defined for RDF in an RDF
schema. A schema defines not only the properties of a resource (e.g., title,
author, subject, size, color, etc.) but may also define the kinds of resources
being described (books, Web pages, people, companies, etc.) (Miller en
Manola, 2004). ”

De eerste stap om de betekenis van RDF-informatie uit te drukken, bestaat er in een


gemeenschappelijke woordenschat te ontwikkelen die een welbegrepen mening heeft en
op een consistente manier gebruikt wordt om andere resources te beschrijven. RDF
Schema probeert niet om deze gedeelde woordenschatten te definiëren, maar het biedt de
mogelijkheid om zelf gedeelde woordenschatten te ontwikkelen20 (Miller en Manola, 2004).

RDFS-woordenschatten beschrijven de klassen van resources en eigenschappen die ge-


bruikt worden in een RDF-model. Met behulp van RDFS, kan men de klassen en
eigenschappen regelen in generalisatie / specialisatie hiërarchieën, het domein en bereik-
verwachtingen definiëren voor eigenschappen, klasse lidmaatschap toelichten en datatypes
interpreteren. Alle resources in RDFS worden beschouwd als leden van de klasse van alle
resources en zijn bijgevolg allemaal instanties. Deze instanties kunnen verder beschreven
worden door statements te maken door middel van eigenschappen of door ze expliciet
lid te maken van een andere klasse gedefinieerd in een RDFS-woordenschat (Miller en
Manola, 2004).

2.5.4 OWL Web Ontology Language


De OWL Web Ontology Language breidt de RDFS-woordenschat uit met bijkomende
resources die gebruikt kunnen worden om meer expressieve ontologieën te bouwen. OWL
introduceert toegevoegde beperkingen ten aanzien van de structuur en inhoud van RDF
documenten met het oog op de verwerking en de redenering meer computationeel be-
slisbaar te maken. Verder wordt duidelijk dat dit onder meer de mogelijkheid is om
restricties, kardinaliteit en eigenschappen van relaties (zoals symmetrisch en transitief)
vast te leggen. Het maakt gebruik van RDF en RDFS, XML Schema datatypes en
OWL-namespaces. Bijgevolg is de set van valide OWL-documenten een subset van de set
van valide RDFS-documenten. OWL 2 is een uitbreiding op de originele W3C aanbeveling
van februari 2004, dat een reeks van nieuwe mogelijkheden toevoegt ingegeven op basis
van feedback van de gebruikers (McGuinness en van Harmelen, 2004).
20
Een mooi voorbeeld is OpenVocab (http://open.vocab.org). Het laat eenieder toe om woordenschat
termen te wijzigen in geval er twijfel is over de rechtvaardiging van het schema.

31
2 Het Semantisch Web

Figuur 2.11 beeld een simpel voorbeeld af van een muziek-ontologie21 . Deze verbindt
een artiest, compositie, voorstelling, opname, signaal en plaat/album. Elke relatie tussen
deze elementen is verschillend. Net zoals in RDF-grafen, geven de expliciete relaties
tussen de elementen kracht aan ontologieën.

Figuur 2.11: Voorbeeld van een simpele ontologie.

mo:performance_of mo:produced_sound
mo:compose mo:produced_work
mo:MusicArtist mo:Composition mo:MusicalWork mo:Performance mo:Sound

mo:recorded_as mo:recorded_in

mo:Recording mo:Signal mo:Record

mo:produced_signal mo:published_as

Bron: gebaseerd op Fazekas et al (2010), Music Ontology Specification.

OWL ondersteunt de notie van een gedistribueerd kennis model omdat het gebouwd is
op RDF, wat toelaat om resources lokaal te beschrijven en te declareren of naar hen te
verwijzen van op afstand. Om de juiste gevolgtrekkingen te maken, worden er twee van de
belangrijke grondbeginselen (zie Sectie 2.1.3) van het Semantisch Web als onderliggende
assumptie genomen: de open wereld assumptie en niet-unieke naamgeving. Hier een
voorbeeld van gevolgtrekking:

Op basis van Figuur 2.12 kunnen we concluderen dat:


• een Persoon is altijd een Man of Vrouw (m.a.w., Man en Vrouw zijn van het type
Persoon) — isKindOf relatie;
• Man is compleet onafhankelijk en verschillend van Vrouw — disjointWith relatie;
• Sommige Mannen zijn Echtgenoten en sommige Vrouwen zijn Echtgenotes —
isKindOf relatie;

• Sommige Personen zijn Werknemers. Daarom zijn sommige Mannen en sommige


Vrouwen Werknemers — logisch gevolg.
21
http://musicontology.com/

32
2 Het Semantisch Web

Figuur 2.12: Een voorbeeld van gevolgtrekking.

Persoon
Man Vrouw

Sue Sue
Echtgenoot Echtgenote

Werknemer

Bron: gebaseerd op Kuriakose (2009), Understanding and Adopting Semantic Web Technology.

OWL-ontologieën worden opgeslagen als documenten op het Web. Elk document bestaat
uit een optionele header die de resource dewelke de ontologie zelf representeert, be-
schrijven en definiëren. Annotaties voegen non-semantische beschrijvende informatie toe
aan resources. Verder bestaan ontologieën uit drie fundamentele bouwblokken: klassen,
individuals en eigenschappen. Een klasse is een set van resources. Een individual is
elke resource dewelke een member is van tenminste één klasse. Zo wordt het duidelijk
dat de structuur van OWL gedeeltelijk vergelijkbaar is met die van Objectgeoriënteerde
modellen; men kan klassen, subklassen en attributen modelleren22 . Wel worden de relaties
subClassOf en instanceOf overgenomen van RDFS (Kuriakose, 2009).

Een eigenschap wordt gebruikt om een resource te beschrijven. Er zijn twee soorten
eigenschappen:

• Datatype eigenschappen, relaties tussen individuals (instanties van klassen) en


datatype definities die variërende waarden beschrijven (e.g., RDF van XML Schema
datatypes);

• Object eigenschappen, relaties tussen twee individuals.

De collectie van types die een bepaalde eigenschap gebruiken wordt het domein van de
eigenschap genoemd. De verschillende waarden dat een eigenschap kan hebben wordt de
rang van een eigenschap genoemd. Verder kan de kardinaliteit van een eigenschap worden
gespecificeerd, en kunnen eigenschappen gedefinieerd worden als een sub-eigenschap (spe-
cialisatie) van een andere eigenschap. Op die manier kunnen eigenschappen geconstrueerd
worden als hiërarchieën, waardoor de encapsulatie van details mogelijk wordt binnen
meer algemene eigenschappen (Allemang en Hendler, 2008).
22
Individuals in OWL zijn niet anoloog aan objecten in OOP, ondanks dat ze beide instanties zijn
van klassen. De objecten in OOP zijn opgebouwd rond de informatie van hun klasse types. In
OWL beschrijven klassen sets van individuals die zelfde kenmerken delen. OWL individuals kunnen
daarom eender welke structuur hebben ondanks hun type. Semantische modellen zijn met andere
woorden property oriented. Vandaar worden semantische entiteiten niet geboren in een klasse, maar
wel begrepen als members van klassen omwille van hun eigenschappen. Bij objectoriëntatie worden
eigenschappen begrepen als deel van een klasse.

33
2 Het Semantisch Web

Het is mogelijk om eigenschap karakteristieken te specificeren die het redeneren over


eigenschappen faciliteert. Bijvoorbeeld, een eigenschap P kan gedeclareerd worden als
transitief, wat betekent als P (x,y) en P (y, z) dan ook P (x, z). De karakteristieken
ondersteund door OWL zijn:

• TransitiveProperty:
P (x, y) ∧ P (y, z) ⇒ P (x, z)

• SymmetricProperty:
P (x, y) ⇒ P (y, x)

• FunctionalProperty:
P (x, y) ∧ P (x, z) ⇒ y = z

• inverseOf:
P (x, y) ⇔ P (y, x)

• inverseFunctionalProperty:

P (y, x) ∧ P (z, x) ⇒ y = z

Men kan ook verklaren dat klassen of eigenschappen in OWL equivalent zijn met andere
klassen of eigenschappen — de sameAs relatie. Dit helpt bij het combineren van bestaande
ontologieën, waar equivalente concepten worden gebruikt onder verschillende namen
(Allemang en Hendler, 2008).

Het is gebruikelijk dat men slechts een kleine subset van de OWL-elementen gebruikt. Dit
is echter perfect acceptabel, omdat de taal flexibel is en moet kunnen worden gebruikt op
de meest mogelijke en pragmatische wijze. Vandaar zijn er een aantal vooraf gedefinieerde
subgroepen, of OWL profielen met uiteenlopende niveaus van expressiviteit en tradeoffs
in computationele complexiteit. OWL Lite is de simpelste variant, maar ontbreekt de
expressiviteit van OWL DL. OWL DL beschikt over computationele compleetheid (elke
implicatie kan worden berekend) en beslisbaarheid (elke berekening zal binnen afzienbare
tijd afgewerkt worden). DL staat voor Description Logics (Beschrijvende Logica); een
beslisbaar fragment van eerste-orde logica. Klasse expressies maken het mogelijk dat
klassen gedefinieerd worden op basis van andere klassen, door set-operaties zoals unionOf,
intersectionOf en complementOf. Tenslotte, OWL Full kan oneindige lussen bevatten,
ontbreekt de computationele eigenschappen van OWL DL, maar beschikt over meer
expressiviteit (Hebeler et al, 2008; McGuinness en van Harmelen, 2004).

Tenslotte nog de volgende opmerking. Het Semantisch Web gaat niet alleen over het
delen van informatie, maar ook over het overbrengen van concepten tussen systemen
en kennisdomeinen. In onderstaande figuur wordt een eenvoudige definitie gegeven het
Wereldwijde Web en het Semantisch Web door het tekenen van relaties tussen beide

34
2 Het Semantisch Web

concepten. De cirkels vertegenwoordigen concepten, terwijl de pijlen relaties tussen deze


concepten beschrijven. De stippellijnen verbinden de concepten van het WWW met de
concepten van het Semantisch Web. Wanneer we dus het concept Semantisch Web willen
begrijpen, dan beschrijven we het in termen van concepten waar we reeds bekend mee
zijn (Hebeler et al, 2009).

Figuur 2.13: Onbekende informatie wordt begrijpbaar wanneer men ziet hoe het aan
gekende concepten gerelateerd wordt.

World Wide Semantisch


is een uitbreiding van
Web Web

omvat omvat

Documenten zijn Ontologieën

URI's

gekoppeld door definiëren gebruik


taal
specifieke types geïdentificeerd
van door

Concepten
URL's OWL
en Relaties

Bron: gebaseerd op Hebeler et al (2009), Semantic Web Programming.

2.5.5 Querytalen
Het Semantisch Web biedt de mogelijkheid om data te annoteren opdat zowel mens als
machine kan omgaan met deze data. Annoteren op zich is echter slechts een voorwaarde
om goede informatie te kunnen extraheren. Een vereiste om het Semantisch Web te
query’en, is een taal die RDF herkent als fundamentele syntaxis. Op die manier zijn er
geen speciale procedures vereist om op RDF-gebaseerde talen zoals OWL te voorzien van
een query. SPARQL23 is een W3C-standaard en het recursief acroniem voor SPARQL
Protocol and RDF Query Language (Borsje en Embregts, 2007). Andere RDF-querytalen
zijn RDQL (RDF Data Query Language) en SeRQL (Sesame RDF Query Language).
Een endpoint (ook wel processor) is een service die SPARQL queries accepteert, ver-
werkt en resultaten retourneert. SPARQL is zowel een querytaal als een protocol. Het
protocol wordt gebruikt om te beschrijven hoe een SPARQL client met een SPARQL
endpoint/processor communiceert, zowel op een abstracte manier als voor een concrete
implementatie gebaseerd op WSDL 2.0 (Hebeler et al, 2009).
23
http://www.w3.org/TR/rdf-sparql-query/

35
2 Het Semantisch Web

Zoals in Tabel 2.6 wordt getoond, gaat de SELECT statement twee waarden halen (?voornaam
en ?achternaam) van twee afzonderlijke grafen gesitueerd op http://www.voorbeeld1.xyz
en http://www.voorbeeld2.xyz. De WHERE clausule is een query optie voor het filteren van
de output. Wanneer een applicatie deze query uitvoert, is een mogelijke output zoals in
de rechterkolom. SPARQL is gemakkelijker dan traditionele query talen zoals SQL. Het
elimineert plompe joins bij het query’en van grafen. Zoals zichtbaar is wordt er geen join
logica uitgevoerd, in tegenstelling tot hoe we queries implementeren in een relationele
databank.
Tabel 2.6: Voorbeeld van een SPARQL query.

Query Output
SELECT ?voornaam ?achternaam ?voornaam ?achternaam
FROM <http://www.voorbeeld1.xyz> Jan Janssens
FROM <http://www.voorbeeld2.xyz> Stijn Stijnen
WHERE { ?persoon <http://www.voorbeeld1.xyz#voor> ?voornaam . Ribbe De Bie
? persoon <http://www.voorbeeld2.xyz#achter> ?achternaam . } Beau Ter Ham

2.5.6 Rules
Vaak wenst men kennis te representeren op een manier die verder gaat dan wat de OWL
1 specificatie in staat is. Ook rules zijn onderdeel van de Semantic Web Layer Cake, en
ze verschijnen meestal onder de vorm van if-then clausules. Rules zijn in de vorm van een
implicatie tussen een antecedent en een consequent. De betekenis kan worden verstaan
als wanneer een bepaalde conditie in het antecedent waar is, dan moet de conditie,
gespecifieerd in het consequent, ook waar zijn. Bijgevolg wordt nieuwe kennis toegevoegd
wanneer een bepaalde set van statements waar is. Door een aantal beperkingen in OWL
1, kan er echter niet worden voldaan aan de benodigde expressiviteit. Welke beperkingen
dit zijn, valt buiten het bestek van deze scriptie. Momenteel is er geen gestandaardiseerde
rule taal voor het Semantisch Web.

2.5.7 Nog niet gerealiseerde lagen


Nog niet alle lagen van de “layer cake” zijn volledig gerealiseerd. De Unifying Logic en
Proof lagen ondergaan actief onderzoek. Een voorbeeld van onderzoek naar cryptografie
en vertrouwen op het Semantisch Web is het authenticatie mechanisme FOAF+SSL. Het
is een eenvoudig protocol dat toelaat om zich te authenticeren aan de hand van slechts
een URI in bestaande browsers — zonder dat de eindgebruiker zijn accountgegevens
hoeft te onthouden. Het is opgebouwd rond op grote schaal ingezette technologieën zoals
HTTP, SSL/TLS certificaten en Semantisch Web gebaseerde FOAF netwerken (Van
den Bergh, 2009). Daarnaast mag men user interfaces en applicaties ook niet vergeten.
Recent onderzoek van Berners-Lee, Hollenbach en Presbey (2009) betrof autorisatie
beheer op het Semantisch Web. Hierbij werd een simpele interface gebouwd in de Web

36
2 Het Semantisch Web

browser om een Access Control List (ACL) te beheren onder de vorm van RDF metadata.
FOAF+SSL was hier een belangrijke bouwsteen voor authenticatie. Ondanks talrijke
specificaties, gereedschappen en architectonische middelen blijven front-end oplossingen
voor de gemiddelde gebruiker nog veelal uit.

2.5.8 Reasoning
Hoewel het niet expliciet aanwezig in de “layer cake”, is er nood aan een zogenaamde
semantische reasoner, redeneer motor, of gewoon denker, om aan gevolgtrekking te kunnen
doen. Dit is bepaalde software dat in staat is om logische gevolgen af te leiden uit een
set van beweerde feiten of axioma’s. Het idee van een semantische reasoner generaliseert
gevolgtrekking, door het verstrekken van een rijkere set van mechanismen om mee te
werken. De regels worden vastgelegd in een ontologie. Vele reasoners maken gebruik
van eerste-orde predicatenlogica om de redenering uit te kunnen voeren. Inferentie
gebeurt dan ook door het koppelen van voorwaarts en achterwaarts redeneren. Bekende
reasoners zijn Pellet, KAON en Jena. Hoewel reasoners niet gestandaardiseerd zijn, zijn
ze voorwaardelijk om te kunnen redeneren, vandaar Figuur 2.14.

Figuur 2.14: Componenten en talen van het Semantisch Web en de positionering van
reasoners.

Query taal: SPARQL

Rules taal: SWRL, RIF

Reasoning component: Pellet, KAON2, JENA etc.

Ontologie: OWL, RDFS

Triple gebaseerde flexibel data model: RDF

Bron: gebaseerd op Kuriakose (2009), Understanding and Adopting Semantic Web Technology.

2.6 Nadenken over de Systeemtheorie


De grondbeginselen van het Semantisch Web vinden hun oorsprong in informatietheo-
rie. Nochtans kan het nuttig zijn om deze problematiek te benaderen door analogieën
te trekken en zo nieuwe inzichten te verwerven. De invalshoek hier is met name de
systeemtheorie.

37
2 Het Semantisch Web

2.6.1 Entropie in de Statische Thermodynamica


In de thermodynamica spreekt men over entropie. Het is een maat voor de wanorde of
de ontaarding in een systeem. Met het aantal mogelijke toestanden van een systeem is
het meestal zo gesteld dat er veel meer wanordelijke toestanden dan ordelijke toestanden
mogelijk zijn. De wanorde in een geïsoleerd systeem neigt altijd tot toename, mits er
geen energetische toename is. Een formele manier om dit uit te drukken is de tweede wet
van de thermodynamica (Mannaert en Verelst, 2009).

Geaggregeerde metingen beschikken over te veel entropie. Dit geldt ook voor geag-
gregeerde informatie, waar er wanorde heerst. Zogenaamde Key Perfomance Indicators
(KPI’s) zijn in dit opzicht triviaal. Indien men verklaart dat de verkopen in het eerste
kwartaal gestegen zijn, is dit nietsbetekenend. Wat nodig is, is inzicht in de onderlig-
gende causaliteit. Een voorwaarde om tot deze causaliteit te komen en de wanorde te
doorbreken, is stabiele structuur (Mannaert en Verelst, 2009).

Eén van de grondbeginselen van het Semantisch Web luidt: “Anyone can say Any-
thing about Any topic” — de AAA slogan. Dit is mijns inziens een andere manier om
te zeggen dat structuur heel diep gaat, en is een andere doch verfrissende kijk op het
Web. Entropie zegt namelijk dat meten in feite niets betekent. Immers, met statistiek
kan men alles meten. Bijgevolg kan men met correlaties alles aantonen. Maar dit is
niet voldoende. De oplossing is meten en structureren in verschillende dimensies, zodat
koppeling laag wordt en men stabiliteit verkrijgt. De oorzaak van een verschijnsel is vaak
ongekend; alleen een grondige observatie zal aangeven wat er moet veranderd worden
(Mannaert en Verelst, 2009).

2.6.2 Het Diepe Web


Dat structuur heel diep gaat, brengt ons tot de notie van het Diepe Web. Het Diepe
Web is het fenomeen waarbij database-backed inhoud wordt geserveerd via interactieve
zoekformulieren op het Web. Daar diepe Web inhoud dynamisch is, en enkel wordt
geproduceerd op verzoek, is het moeilijk voor traditionele zoekmachines om deze te
indexeren. Het Diepe Web is enorm in grootte en van zeer hoge kwaliteit (Bergman,
2001).

Biologische systemen hebben structuur over niet-cohesieve dingen, namelijk cellen. Onze
technologieën bezitten echter een zeer hoge mate van entropie. Zo ook het Web, waar
chaos heerst. Het Semantisch Web brengt echter structuur en semantische karakte-
risatie bij aan dit Diepe Web, dankzij metadata. Een aantal academici houden zich
dan ook bezig met zowel het Diepe Web als semantiek. Chun, Geller en Jung (2008)
tonen hoe ontologieën en Semantisch Web constructen kunnen worden gecombineerd om
meer effectieve informatie te extraheren van het Diepe Web. De auteurs poneren dat
gestructureerde wortels van het Diepe Web het Web in staat moeten stellen om dieper te
redeneren. Zij wijzen ook op het nut van diepe Web structuur voor annotaties.

38
2 Het Semantisch Web

Wat eveneens belangrijk is, zijn de zoektechnieken voor het Diepe Web. Wright (2008)
geeft een overzicht van zoekstrategieën, retrieval- en analyse methoden. Er valt veel
van deze technieken te leren die gebruikt worden voor het selecteren en om toegang te
krijgen tot diepe Web inhoud. In de context van het Diepe Web observeerden Halevy,
Norvig en Pereira (2009) het semantische interpretatie probleem, wat zij afzonderlijk
van het Semantisch Web plaatsen. Dit veralgemeende concept is geschikt voor een soort
eenvoudige, brute-force, analyse op de schaal van het Web: “Relying on overt statistics
of words and word co-occurrences has the further advantage that we can estimate models
in an amount of time proportional to available data and can often parallelize them
easily. So, learning from the Web becomes naturally scalable.” Deze zoekstrategieën zijn
voorwaardelijk om inzicht te krijgen in verschillende dimensies en om alle facetten te
kunnen beschouwen in het Diepe Web. Het is dan ook niet verwonderlijk dat de user
interfaces bij Semantisch Web applicaties veelal gebaseerd zijn op een zogenaamde faceted
search, precies om deze diepe structuur te kunnen navigeren.

Tenslotte, wat men leert van het Diepe Web, is dat Semantisch Web technieken steeds
meer als een structuur-extractie laag werken voor het gestandaardiseerde Web. In dit
verband kan de voorwaarde van inherent gestructureerde brongegevens leiden tot een
hogere kwaliteit van de inhoud in de gedistribueerde, heterogene omgeving van het Web.
In het volgende hoofdstuk zullen vele van deze technieken behandeld worden.

2.7 Obstakels en kritieken


Tot slot bekijken we hier mogelijke obstakels voor het realiseren van een Semantisch Web.
Er zijn eveneens heel wat critici die nuttige inzichten bieden.

2.7.1 Praktische haalbaarheid


Een aantal skeptici stellen de fundamentele haalbaarheid van het Semantisch Web in
vraag. Eén kritiek betreft de waarachtigheid van metadata. Immers, mensen liegen: ze
kunnen onechte metadata gebruiken in de poging semantische web motoren te misleiden.
Cory Doctorow gaat nog een stapje verder en spreekt over “metacrap”. Metacrap is
een samenvoeging van metadata en crap. De oorsprong van het woord is onbekend,
maar het werd gepopulariseerd door Doctorow in 2001 met een essay getiteld “Meta-
crap: Putting the torch to seven straw-men of the meta-utopia.” In het essay illustreert
Doctorow problemen met het vertrouwen op kennisrepresentatie in online records of files
door het opstellen van humoristische parallellen met systemen in de echte wereld. De
kwetsbaarheid van metadata is een belangrijk aandachtspunt, omdat veel plannen voor de
verbetering van het web (zoals het Semantisch Web) gebaseerd zijn op bepaalde “smaken”
van metadata die steeds op grotere schaal worden overgenomen en toegepast. Dit is iets
wat volgens Doctorow’s essay niet kan en zal gebeuren. Het probleem met expliciete
metadata is veelzijdig. Mensen liegen, ze vertellen wat ze denken dat je wilt horen. Of
ze vertellen wat ze denken dat ze geloven, zelfs als het niet is wat ze eigenlijk geloven.

39
2 Het Semantisch Web

Mensen zijn eveneens niet volmaakt. Ze beschikken soms gewoon niet over de juiste
informatie of ontbreken de juiste indeling. Bovendien zijn mensen ook lui, kunnen ze het
niet over alles eens zijn, enzovoort. Andere redenen die resulteren in verouderde “crap”
metadata is het feit dat gegevens irrelevant kunnen worden in de tijd of dat gegevens
gewoonweg niet mogen bijgewerkt worden met nieuwe inzichten. Ook Pelgrim (2002)
is een gelijkaardige mening genegen wat metadata betreft. Ook Tim O’reilly heeft zich
recentelijk negatief geuit over het Semantisch Web en metadata in het bijzonder. In een
interview over “recognition, RFID en Web 3.0”24 zegt hij dat weldra vele objecten zullen
worden erkend zonder metadata. Het Semantisch Web is dan evolutionair doodlopend.

Shirky (2003) wijst erop dat vele beschrijvingen van het Semantisch Web niet adresseren
waarvoor het nu eigenlijk goed is. Volgens hem is het Semantisch Web een machine voor
het creëren van syllogismen25 . Hij meent daarbij dat syllogismen niet nuttig zijn, omdat
deze niet werken in de echte wereld. In de echte wereld opereren we met gedeeltelijke, niet
afdoende of contextgevoelige informatie. We kunnen de wereld niet ondubbelzinnig be-
schrijven. Wanneer we een beslissing nemen zullen we eerder vertrouwen op onze intuïtie
en extrapoleren. Bijgevolg, de mensen betrokken bij het Semantisch Web overwaarderen
volgens hem de waarde van deductieve redenering. Zijn conclusie is daarom dat het
Semantisch Web ook onnuttig is. Ook Honkela en Gärdenfors (2004) wijzen erop dat de
op logica gebaseerde semantische webtechnologieën slechts een fractie van de relevante
semantiek vraagstukken behandelen.

Iets anders is dat bovendien de principes rond het Semantisch Web moeilijk zijn aan te
brengen. Door een gebrek aan werkbare oplossingen is er daarom weinig nood om deze
technologie begrijpbaar te maken en blijft een praktische adoptie veelal uit. Vooral in
gespecialiseerde communities en bij intra-organisationele projecten is de adoptiegraad
hoog. Waar het domein en de reikwijdte eerder beperkt zijn, zijn er minder knelpunten
in vergelijking met het wereldwijde web in bredere context. De adoptie van andere
gerelateerde technieken zoals folksonomies26 , Web 2.0 tags en microformaten kennen
meer succes maar zijn minder flexibel en bieden minder structuur dan Semantisch Web
ontologieën (Wikpedia, 2010).

2.7.2 Een ongerealiseerd idee


Het Semantisch Web is nog steeds in evolutie. Dat het idee nog in kinderschoenen
staat, blijkt uit actief onderzoek en bijvoorbeeld het feit dat de unifying logic-, trust- en
proof layers nog niet volledig gerealiseerd zijn (Herman, 2009). Ondanks het originele
2001 Scientific American artikel van Tim Berners-Lee, blijft de beschreven evolutie uit

24
http://artimes.rouli.net/2009/04/tim-oreilly-on-recognition-rfid-and-web.html
25
Een syllogisme is een logica vorm, als eerste beschreven door Aristoteles, waar “... certain things
being stated, something other than what is stated follows of necessity from their being so.”
(http://www.gibson-design.com/philosophy/Aristotle-Organon-3-prior.1.i.htm)
26
Bij folksonomy wordt er door verschillende gebruikers metadata toegevoegd met behulp van tagging.

40
2 Het Semantisch Web

(Berners-Lee, Hendler en Lassila, 2001). Een meer recent artikel van Berners-Lee, Hall en
Shadboldt (2006) bevestigt dit: “This simple idea, however, remains largely unrealized.”
Het Semantisch Web is het resultaat van een set ontwerpprincipes, werkgroepen en een
aantal technologieën die de de facto formaten voor het structureren en het uitwisselen
van data en services. Niettemin, de graad van expliciete semantiek in deze talen is nog
steeds marginaal. Bovendien ontbreken vaak de ontologieën die het Semantisch Web
moeten leveren. Van de domein woordenschatten die zijn gepubliceerd op het Web,
worden slechts enkele van hen actief onderhouden (De Leenheer, 2009). De droom van
Berners-Lee lijkt nog ver weg, maar de kritiek van het Semantisch Web als ongerealiseerd
idee mag volgens mij genuanceerd worden vermits er vaak op een veel beperktere schaal
wel verscheidene Semantische Webs beginnen te onstaan.

Recent werden 895 deskundigen bevraagd om te voorspellen wat de verwachtte vooruit-


gang zal zijn, bij de verwezenlijking van de doelstellingen van het Semantisch Web in het
jaar 2020. Enerzijds was 47 percent akkoord met de stelling dat in 2020 het Semantisch
Web niet zo effectief zal zijn zoals zijn scheppers hadden verhoopt, en dat de gemiddelde
gebruiker weinig verschil zal hebben gemerkt. Anderzijds is 41 percent akkoord met
de tegenovergestelde bewering, die poneerde dat tegen 2020 de doelstellingen van het
Semantisch Web in belangrijke mate zullen worden bereikt en een duidelijk verschil
gemaakt zal hebben op de gemiddelde Internet gebruiker (Anderson en Rainie, 2010).

2.7.3 Privacy en censuur


Het enthousiasme rond het Semantisch Web zou wel eens getemperd kunnen worden
door zorgen met betrekking tot privacy en censuur. Zo wordt het heel eenvoudig om
tekst-analyse technieken te omzeilen door gebruik van andere woorden of metaforen, of
met behulp van beelden in plaats van woorden. Ook bestaat de vrees dat bedrijven
en regeringen makkelijker controle krijgen over de weergave en de creatie van online
informatie, vermits het simpeler wordt om informatie te interpreteren (e.g., door censuur
systemen27 ) wanneer gegevens koppelbaar worden. Bovendien worden door het gebruik
van de FOAF-ontologie en geo-locatie metadata het mogelijk om coördinaten aan personen
te koppelen, waardoor de anonimiteit in het gedrang komt.

2.7.4 Verdubbeling van output formaten


Een andere kritiek van het Semantisch Web is dat het veel tijd in beslag neemt om twee
formaten te publiceren rond één gegeven: voor de mens en voor machines. Er zijn echter
tal van webapplicaties in de ontwikkeling die dit probleem aanpakken door de gegevens
ook in een machineleesbare vorm aan te bieden. De ontwikkeling van Microformats is een
reactie op dit soort kritiek. Daarnaast zijn er specificaties zoals eRDF en RDFa die RDF
gegevens incorporeren in HTML pagina’s. GRDDL (Gleaning Resource Descriptions from
Dialects of Languages) is een mechanisme dat het mogelijk maakt om bestaand materiaal
automatisch te vertalen naar RDF, zodat uitgevers niet meer afhankelijk worden van het
formaat (Wikipedia, 2010).
27
The Golden Shield Project, beter bekend als de “Great Firewall of China”, is een voorbeeld van een
censuur systeem dat beheerd wordt door de Chinese regering.

41
2 Het Semantisch Web

2.7.5 Kip-en-eiprobleem
Het Semantisch Web zit met een kip-en-eiprobleem28 . Enerzijds zien data providers
(e.g., tool leveranciers) geen reden/vraag om gestructureerde data aan te leveren. Bij-
gevolg zijn ze terughoudend om producten op de markt te brengen. De kern van het
Semantisch Web betreft een ontologie beschreven in een machineleesbare woordenschat.
Deze woordenschatten kunnen variëren van een eenvoudige “thesaurus van termen”, een
uitgebreide uitdrukking van de complexe relaties tussen concepten of dienen om patronen
te herkennen in gegevens. Maar het is echter een misverstand dat het altijd zaken van
het laatste type betreft. Anderzijds is het moeilijk voor data-consumers om metadata te
begrijpen. Zij worden geconfronteerd met een zeer steile leercurve en complexe specifica-
ties (e.g., SPARQL om RDF te query’en). Nochtans, Clark, Corlosquet, Decke, Delbru
en Polleres (2009) beschrijven hoe het Content Management System Drupal het reeds
mogelijk maakt om zonder over de nodige kennis van Semantisch Web technologieën
te beschikken, gestructureerde data aan te leveren. Op die manier kunnen genetwerkte
Drupal-sites RDF hergebruiken, verrijken en het Web in het algemeen vooruit helpen.

Ook is het niet evident om Semantisch Web gegevens in een begrijpbare vorm – de
user interface – aan de eindgebruiker te presenteren. Het motiveren van bedrijven of
regeringen om gegevens vrij te geven29 , ontologie ontwerpers om woordenschatten op
te bouwen en webapplicatie ontwikkelaars om semantische toepassingen te ontwikkelen
hangen allemaal van elkaar af (Hendler, 2008).

2.7.6 The Semantic Web Of Death


Het Ignite programma op de O’Reilly Open Source Conference in 2009 werd afgesloten
door Damien Conway, onder andere een prominente figuur in de Perl community. In zijn
tiranniek, doch humoristisch betoog gaat hij fel tekeer tegen het Semantisch Web – wat
hij zelf het Semantic Web Of Death noemt. Volgens hem is dit gebaseerd op een zich
ontwikkelende pseudostandaard. Hij impliceerde dat dit niet meer is dan een dubieuze
standaard waarbij élk soort gegevens wordt getagd. Hij gelooft niet in het proces om
van metadata naar semantiek, naar introspectie, naar ontologie, naar bewustzijn te gaan.
De Science Fiction literatuur van de voorbije honderd jaar bracht een verontrustende,
terugkerende boodschap: het ontwaken van een verbolgen netwerk. Daarom kondigt hij
aan dat het Semantisch Web het begin van het einde betekent. Dat het Semantisch Web
het “critical component that will enable the evolving internet to develop the intellingence
it will need to better serve mankind” zal zijn, trekt hij dan ook sterk in vraag. Het
Semantisch Web is volgens Conway louter een kookboek.

28
http://nl.wikipedia.org/wiki/Kip-en-ei-probleem
29
De vrije uitwisseling van informatie tussen de overheid en het publiek is essentieel voor een democratische
samenleving zoals het Data.gov initiatief stelt.

42
2 Het Semantisch Web

2.7.7 The Pragmatic Web


In 2006 schreven de Moor, Dietz en Schoop “The Pragmatic Web: a manifesto.” In
tegenstelling tot het syntactische en Semantisch Web, bestaat het Pragmatisch Web
uit tools, methoden en theorieën die beschrijven waarom en hoe mensen informatie
gebruiken. Immers, zij menen dat er meer nodig is dan een Semantisch Web. Het
gaat niet alleen over de vorm of de betekenis van informatie, maar ook over de sociale
interactie die leidt tot bijvoorbeeld iets begrijpen, iets overeen te komen of verplichtingen.
De transformatie van bestaande informatie in informatie die relevant is voor een groep
gebruikers of een individuele gebruiker, omvat de ondersteuning van de manier waarop
gebruikers lokaliseren, filteren, toegang krijgen tot, verwerken, synthetiseren en informatie
delen. Het idee van het Pragmatisch Web idee heeft zijn wortels in het Language/action
perspective.

2.7.8 The Curse of Knowledge


Ding (2007) schrijft in een blog post over “the curse of knowledge.” Het idee is dat hoe
meer we weten, hoe moeilijker het wordt om deze kennis te communiceren. Als we iets
weten, kunnen we ons nauwelijks voorstellen dat we het niet weten. En hoe meer we
leren over iets, hoe moeilijker het wordt voor ons om te denken het niet te weten. Het
is over het algemeen moeilijk voor deskundigen (die veel weten) om hun expertise uit
te leggen aan leken (die weinig weten), omdat het moeilijk is voor hen om een scenario
voor te stellen waarbij ze zelf geen deskundigen waren. Dit is de zogenaamde Vloek
van Kennis. Vanuit technologisch standpunt wordt de Vloek van Kennis in de context
van het Semantisch Web weerspiegeld door de moeilijkheid van de ontologie in kaart te
brengen. Vaak hebben deskundigen volledige ontologieën van professionele constructen
in hun hoofd over een bepaald domein van deskundigheid. Deze professionele ontologieën
worden gedeeld met andere deskundigen, maar zijn meestal minder toegankelijk voor
leken. In tegenstelling, leken hebben vaak ook hun onprofessionele beschrijvingen van
de respectievelijke domeinen. De taak van “ontology mapping” is om een mapping
te bouwen tussen expert- en leekontologieën en deze in kaart te brengen. Maar deze
ontologie mapping problematiek is reeds zeer lang inherent aan kennisbeheer. Als
“ontology mapping” een weerspiegeling is van de Vloek van Kennis, kan men het moeilijke
“ontology mapping probleem” oplossen door de Vloek van Kennis te doorbreken. Dit is
dan ook een zeer grote uitdaging voor het Semantisch Web.

43
3 De Semantische Onderneming
Het vorige hoofdstuk poogde het Semantisch Web te omschrijven en definiëren vanuit
een algemeen perspectief. Duidelijk is geworden dat het Semantisch Web toelaat om
informatie uit te wisselen tussen applicaties die leesbaar en begrijpbaar zijn voor machines.
Dit gaat echter veel verder dan het louter uitwisselen van bits en bytes op het Web.
In dit hoofdstuk zal duidelijk worden dat vele semantiek- en siloproblemen die het
Wereldwijde Web ondervindt, zeer congruent zijn met de problemen waar ondernemingen
al jaren onder lijden. Maar dan wel op een veel grotere schaal, namelijk die van het Web.
Samengevat wordt uiteengezet hoe het Semantisch Web kadert in de vele problemen
waarmee organisaties vandaag geconfronteerd worden.

3.1 Het potentieel van informatie en goede communicatie


Ten eerste beschrijft deze sectie kort de geschiedenis van informatie. Er wordt geponeerd
dat informatie aan de basis ligt van vele van de problemen waar bedrijven vandaag
mee geconfronteerd worden. Vervolgens wordt de strategische waarde van informatie
bepaalt, evenals de evoluties van waardeketens naar waardenetwerken en van het push-
naar pullmodel. Tenslotte bekijken we de bedrijfsproblematiek vanuit het opzicht van
communicatie.

3.1.1 De Informatierevolutie
Geen enkel bedrijf kan vandaag ontsnappen aan het effect van de informatierevolutie.
Reeds in 12.000 v.Chr. zijn mensen symbolen beginnen gebruiken als communicatievorm.
Dit is zeer succesvol gebleken, en rond 1440 volgde de uitvinding van de boekdrukkunst
door Gutenberg. Het is pas met de uitvinding van de cartotheek1 door Seibels in 1898,
dat we informatie organiseren. Bedrijven hebben dit overgenomen, met als resultaat
muren en kamers vol papier. In de jaren tachtig werden computers gebruikt om informatie
te digitaliseren. We gingen datacenters bouwen en later werden computernetwerken
aangelegd; eerst lokaal en dan over het Internet (Bergman, 2010). Het resultaat is dat
we de afgelopen dertig jaar een digitale Toren van Babel hebben gebouwd. Wat het
nog erger maakt is dat de huidige gegevensbanken en documenten een verschillende taal
hanteren. Bijkomend stellen we vast dat dit niet meer schaalbaar is en dat we vaak over
de verkeerde informatie beschikken.
1
Dit is een verticaal archiveringssysteem. Eerder werden papieren bewaard in enveloppen, op hun beurt
opgeslagen in hokjes aan een muur. Het vinden en het openen van deze enveloppen en het ontvouwen
van papier was lastig en inefficiënt. Seibels redeneerde dat het vouwen niet nodig was; kranten konden
worden bewaard in grote enveloppen, verticaal geplaatst in een lade.

44
3 De Semantische Onderneming

Uit een studie van Bergman (2005) kwamen onder andere volgende absurde feiten
naar boven:

• De gemiddelde professional spendeert 5-15 percent van zijn tijd om informatie te


lezen, maar 50 percent om het op te zoeken

• Gemiddeld worden er 19 kopieën gemaakt van elk papieren document

• Publicatie inefficiënties van werknemers kosten organisaties ongeveer 750 miljard


dollar

• Het totale voordeel voor de Amerikaanse economie door de verbeterde toegang


tot documenten en het gebruik ervan, is ongeveer 800 miljard dollar per jaar, of
ongeveer 8 percent van het BBP

Andere voorbeelden zijn legio. Zo kost het papierwerk voor de gezondheidssector meer dan
400 miljard, dat is meer dan 1000 dollar per burger (Himmelstein, Wolfe en Woolhander,
2003). Of nog, de U.S. Postal Service retourneert en vernietigt en zendt voor meer dan
vijf miljard stukken post per jaar na, als gevolg van incorrecte adressen.

In een rapport van IDC (2008) komt naar boven dat het digitale universum in 2007 maar
liefst 281 exabytes (of 281 miljard gigabytes) omvat. Voorts voorspellen zij dat tegen
2011, het digitale universum tien keer zo groot zal zijn vergeleken met 2006. Ongeveer
70 percent van de informatie in dit universum wordt gecreëerd door individuen op basis
van telefoongesprekken, e-mails, foto’s, internetbankieren en sociale netwerksites. Echter,
de verantwoordelijkheid voor beveiliging, privacy, betrouwbaarheid en compliance ligt
voor 85 percent van deze informatie bij ondernemingen. Om met deze explosiviteit
aan informatie in omvang en complexiteit om te kunnen gaan, meent IDC dat dit drie
gevolgen heeft voor organisaties.

1. De bestaande relaties met bedrijfsunits moet getransformeerd worden. Iedereen in de


organisatie moet betrokken zijn bij informatiecreatie, -opslag, -beheer, -beveiliging,
-retentie en -verwijdering. Bovendien is omgaan met het digitale universum niet
alleen een technisch probleem.

2. Er is nood aan een organisatiebreed beleid voor informatiebeheer: informatiebevei-


liging, informatiebehoud, toegang tot de gegevens en compliance.

3. De organisatie heeft nood aan nieuwe tools en standaarden voor het optimaliseren
van opslag, zoeken in ongestructureerde data, database analytics (virtualisatie),
beheer en beveiligingstools. Een vereiste daarbij is dat de informatie-infrastructuur
zo flexibel, aanpasbaar en schaalbaar mogelijk is.

IDC meent tenslotte, dat we reeds veel instrumenten voorhanden hebben – zoals Web-
technologieën en terabyte-schijven – om het digitale universum te temmen. Het is dan
ook de kunst om deze informatiegroei om te zetten in economische groei.

45
3 De Semantische Onderneming

David Siegel legt in een recente video opname2 , die handelt over de geschiedenis van
informatie, uit dat er momenteel een transitie plaatsvindt, waarbij we ons via een seman-
tische golf voortbewegen naar een voortgezette automatisering van informatie. In zijn
onderbouwd betoog ziet hij deze transitie vooral als een oplossing voor de exuberante
administratieve kosten van onze samenleving.

In wat volgt zullen we het over de strategische waarde van informatie hebben. Porter en
Millar (1985) introduceerden een nuttig raamwerk voor de analyse van de strategische be-
tekenis van informatietechnologie. De informatierevolutie is in het licht van mededinging
op drie manieren belangrijk. Ten eerste is het in staat de structuur van een bedrijfstak
te veranderen. De structuur van een bedrijfstak bestaat uit vijf concurrerende krachten
die samen de industrie winstgevendheid bepalen: de macht van afnemers, de macht van
leveranciers, de dreiging van nieuwe toetreders, de dreiging van vervangende producten en
de rivaliteit tussen bestaande concurrenten. Informatietechnologie maakt het mogelijk om
elk van deze vijf competitieve krachten te veranderen en daarmee ook de aantrekkelijkheid
van de industrie. Ten tweede kan informatietechnologie concurrentievoordeel creëren door
middel van differentiatie. Tenslotte brengt informatietechnologie nieuwe ondernemingen
voort op drie verschillende manieren. Het maakt nieuwe bedrijven technologisch haalbaar,
het kan nieuwe ondernemingen ook paaien door het creëren van een afgeleide vraag naar
nieuwe producten en het creëert nieuwe bedrijven binnen de oude. In 2003 verscheen dan
het artikel “IT Doesn’t Matter” van Carr. In dit uitvoerig besproken werk, betoogde hij
dat het strategische belang van informatietechnologie in het bedrijfsleven is afgenomen
omdat IT gemeengoed is geworden, gestandaardiseerd werd en goedkoper is. Het zijn
echter de bedrijfsprocessen die van belang zijn (Fingar en Smith, 2003).

In een dynamische bedrijfsomgeving moet strategie eveneens dynamisch benaderd worden.


De essentie van een strategie is niet de productstructuur van een bedrijf, maar wel de
dynamiek van zijn gedrag. Evans, Shulman en Stalk (1992) beargumenteren dat een
onderneming slaagt als ze haar belangrijke bedrijfsprocessen verweeft in moeilijk te
imiteren strategische capabilities, dat het onderscheid van concurrenten. Een capability
moet verstaan worden als een set van bedrijfsprocessen die strategisch worden begrepen.
Om echter te kunnen overleven en te concurreren, moeten bedrijven vandaag inspelen op
het scala aan interne en externe capabilities, knowhow, knowwho en netwerken. Dynamic
capabilities biedt een raamwerk dat langzaam bewegende organisaties nu moet doen
evolueren naar snel bewegende teams die focussen op de innovatieve combinatie en
orchestratie van het ecosysteem bestaande uit globale partners, gebruikers en klanten
(Pisano, Shuen en Teece, 1997).

De nieuwe bedrijfscontext legt de nadruk op informatiebeschikbaarheid, integratie en


analytics en heeft als doel om collaboratieve gemeenschappen te bevorderen wiens ge-
deelde bijdrage de organisatie helpt in te spelen op opportuniteiten op een efficiënte en

2
http://vimeo.com/11117216

46
3 De Semantische Onderneming

effectieve wijze. James Martin (1987) is met zijn Information Engineering methode erin
geslaagd om een brug te zetten van een strategische bedrijfsplanning naar betrouwbare
informatie systemen. De huidige, doorontwikkelde versie van Information Engineering is
ontworpen voor de tegenwoordig snel veranderende omgeving zoals hieronder duidelijk
wordt. Het is door deze lens dat we Semantisch Web technologieën in de onderneming
moeten bekijken. Immers, vele Information Engineering technieken zullen bijdragen tot
de realisatie van het Semantisch Web binnen de onderneming, zoals verder blijkt.

Ondanks het feit dat informatietechnologie vandaag een zogenaamde commodity is


geworden, is informatie/kennis in de genetwerkte economie van cruciaal belang bij strate-
gische besluitvorming3 . Het probleem vandaag is niet information overload, maar onze
filters die falen om vat te krijgen op het dynamisch gedrag van informatie. Informatie
verandert vandaag immers sneller dan onze informatiesystemen (Hinssen, 2010). Toch
is kwaliteit van informatie belangrijk4 . Mijns inziens moeten organisaties bijgevolg de
levenscyclus van eigen gegevens (beter) opvolgen, in plaats van steeds nieuwe filters
te introduceren, omdat bedrijfsstrategie vaak gebaseerd is op specifieke kennis over de
eigen bedrijfscontext boven algemene domeinkennis en klantenwensen. Eén aspect bij
strategieontwikkeling behelst het verkrijgen van precieze inzichten uit bestaande gegevens
en eerdere resultaten. Op basis van feedback, door middel van informatie-integratie, kan
men de strategie verder ontwikkelen.

Deze terugkoppeling vereist een high-level beschrijving van entiteiten, hun toestand en
de relaties tussen hen onderling. Dit biedt beleidsmakers een manier om de dynamiek
tussen de verschillende belanghebbenden, de bedrijfsentititeiten en hun relaties binnen de
organisatie onder ogen te zien. Dit model van de onderneming vormt de basis voor alle
interpretaties die bedrijfsbeslissingen en investeringen zullen bepalen. Voor een groot deel
is dit model impliciet of in het beste geval uitgedrukt in natuurlijke taal. Het Semantisch
Web leent zich er perfect toe om de visie van een verbonden en collaboratieve onder-
neming te realiseren en accelereren. De bijkomende flexibiliteit wordt bereikt op basis
van diepe integratie-oplossingen over verschillende gegevensbronnen heen en methodes
voor het genereren van de nodige inzichten afgestemd op de noden van belanghebbenden.
Deze relevante inzichten zullen beleidsmakers de nodige ondersteuning bieden bij het
afstemmen, aligneren en uitvoeren van plannen.

3
Het zijn de Business Analytics en Business Intelligence domeinen die veel melk te brokken hebben
in het licht van besluitvorming. Zij zijn beide afhankelijk van data en statistische methoden om
performantie te meten en bedrijfsplanning te gidsen.
4
De “Pedantic Web Group” (http://pedantic-web.org/) is een georganiseerde groep van beoefenaars
wiens projecten en producten afhangen van de kwaliteit van gegevens. Zij wijzen op de gebrekkige
adoptie van standaarden en gebroken gegevens.

47
3 De Semantische Onderneming

Figuur 3.1: De rol van Semantisch Web technologieën bij de afleiding van inzichten uit
bestaande gegevens voor evaluatie en feedback.

Bedrijfsstrategie
High-level
plannen

Bedrijfs-
Evaluatie levenscyclus
en feedback

Uitvoering
concrete
plannen

Bron: gebaseerd op Kuriakose (2009), Understanding and Adopting Semantic Web Technology.

3.1.2 Van waardeketen naar waardenetwerk


Het was Porter die in 1985 de waardeketen introduceerde. De waardeketen is een bedrijfs-
kundig concept, dat de strategisch relevante bezigheden van een organisatie met elkaar in
verband brengt. Het concept wordt gebruikt als management tool voor het systematisch
onderzoeken van activiteiten die materiële of immateriële meerwaarde genereren door
middel van bilaterale statische communicatie tussen organisaties. Op basis van de strate-
gisch relevante activiteiten krijgt men inzicht in het kostengedrag en de bestaande en
potentiële bronnen van differentiatie. Een bedrijf verwerft concurrentievoordeel door deze
strategisch belangrijke activiteiten goedkoper of beter uit te voeren dan zijn concurrenten.
De waardeketen toont de primaire activiteiten die gebruikt worden om de processen
te analyseren die het finale product voortbrengen, gaande van inkomende logistiek tot
marketing en sales. De ondersteunende activiteiten omvatten de inkoopfunctie, tech-
nologieontwikkeling, management van het menselijk kapitaal (HRM) en infrastructuur.
Tenslotte geeft de marge de totale opbrengsten weer van de organisatie en de totale
kosten die gemaakt worden om deze opbrengsten te genereren Chaffey (2007).

Wat Internettechnologieën betreft, stelt Chaffey (2007) dat zij de productietijd kunnen
verkorten en kosten verminderen door de informatiestroom te verhogen, als methode
voor de integratie van de verschillende activiteiten in de waardeketen. Op die manier
kan de waardeketen efficiënter worden gemaakt en kunnen klanten sneller genieten van
de diensten. Rayport en Sviokla (1996) menen dat het Internet extra waarde creëert
door informatie te verzamelen, organiseren, selecteren, generen en distribueren. Hierbij

48
3 De Semantische Onderneming

Figuur 3.2: De waardeketen van Porter.

Bron: gebaseerd op Porter (1985), Competitive Advantage: Creating and Sustaining Superior Performance.

verwijzen ze naar een aparte, parallelle virtuele waardeketen, die een afspiegeling van de
echte waardeketen vormt. In deze virtuele waardeketen wordt e-commerce gebruikt als
verbindend middel tussen activiteiten in de conventionele waardeketen. De verwerking
gebeurt op basis van technologie of visueel. Doch niet volledig virtueel, aangezien voor
bepaalde zaken zoals inkoop er nog steeds menselijke tussenkomst nodig is.

Dit waardeketenmodel werkt echter niet meer in onze moderne globale en verbonden
economie (De Leenheer, 2009)5 . Organisaties moeten vandaag wendbaar zijn. Fusies en
overnames zijn schering en inslag. Organisaties krimpen of breiden uit naar nieuwe mark-
ten; zij moeten hierop kunnen inspelen. Relaties veranderen daardoor ook voortdurend
onder de vorm van nieuwe partners, rollen en functies. De waardeketen van Porter is
dan niet meer zo relevant, vermits op elk moment relaties, interacties en stromen kunnen
veranderen. Waardecreatie wordt bereikt door middel van dynamische en complexe
netwerken en niet op basis van voorspelbare sequentiële ketens. In plaats van over
waardeketens te spreken zou het begrip waardenetwerken vandaag veel meer aan de orde
zijn. Het waardenetwerk is een Web van activiteiten dat materiële of immateriële waarde
genereert door een complexe, dynamische communicatie tussen twee of meer individuen,
groepen of organisaties. Hoewel waardenetwerk en waardeketen hetzelfde doel hebben
en dezelfde spelers behelzen, worden ze anders georganiseerd. Het waardenetwerk is
gebaseerd op een Web en is dynamisch van aard, terwijl de waardeketen sequentieel is en
statisch van aard.

5
Het boek The World Is Flat van Thomas L. Friedman heeft mij gefascineerd. Friedman beschrijft de
economische opkomst van vooral India en China door verbeterde communicatiemogelijkheden, en de
invloed die deze opkomst zal hebben op de wereld.

49
3 De Semantische Onderneming

De waardenetwerkbenadering impliceert een aantal belangrijke heroverwegingen van


het model van Porter. De belangrijkste waarde van ICT zal liggen in het vereenvoudigen
van het waardenetwerk. Dit vereist een verschuiving van het bouwen van strakke gesloten
informatiesystemen, naar het creëren van “open” bedrijfsecosystemen gedefinieerd in
termen van autonome, heterogene en gedistribueerde informatiesystemen. In complexe en
wendbare waardenetwerken, kan de ondersteunende rol van ICT uiteindelijk uitgroeien
tot een groot deel van zogenaamde digitale bedrijfsecosystemen. Het is duidelijk dat deze
nieuwe configuratie de noodzaak zal verhogen voor semantische interoperabiliteit tussen
open informatiesystemen in zeer veranderlijke bedrijfscontexten.

3.1.3 Van push- naar pullmodel


Informatietechnologieën maken het mogelijk voor organisaties om informatie uit te wisse-
len tussen partners. Veel van de opwinding rond e-business heeft dan ook te maken met
de efficiëntieverbeteringen die organisaties kunnen realiseren in de toevoerketen. Vandaag
maken we de overstap van pushmodellen voor verkoop naar pullmodellen. Bij een traditi-
oneel pushmodel ontwikkelt een fabrikant een innovatief product, vervolgens identificeert
hij een geschikte doelmarkt. Er wordt een distributiekanaal opgezet, waarna het product
op de markt wordt “gedrukt”. Het doel is het optimaliseren van het productieproces wat
betreft kosten en efficiëntie. Anderzijds is er het pullmodel, dat gericht is op de klant.
Het begint met een klantenanalyse via marktonderzoek en een nauwe samenwerking met
klanten en leveranciers tijdens de ontwikkeling van een nieuw product. De gebruikelijke
motivatie is om de product- en servicekwaliteit voor de klant te verbeteren. Bij deze
benadering zijn de diverse elementen in de toevoerketen nauwer met elkaar verbonden
door het gebruiken van technologie zoals EDI (Chaffey, 2007).

Hoewel het pullconcept al even ingeburgerd is, zijn er alsnog verscheidene auteurs die er
vandaag een boek aan wijden, zoals “The Power of Pull: How Small Moves, Smartly Made,
Can Set Big Things in Motion” door Hagel, Brown en Davidson. Dergelijke publicaties
vertellen jammer genoeg vaak niet veel vernieuwends. Doch, het boek “Pull: The Power
of the Semantic Web to Transform Your Business” biedt mijns inziens verfrissende ideeën,
omdat de auteur, David Siegel, het verband legt tussen het Semantisch Web en het
pullconcept. Siegel (2010) meent dat het Semantisch Web in staat is om gegevens zo
nauwkeurig te ontleden dat logische conclusies mogelijk worden. Onze online informatie
kan worden opgeslagen in een persoonlijk online locker vanaf de geboorte, waarbij alle
belangrijke informatie, zoals adressen, automatisch geactualiseerd wordt, en de manier
waarop we zaken doen sterk gestroomlijnd zal zijn. Hij stelt dat het Semantisch Web onze
huidige pushgeoriënteerde strategie, waarin bedrijven producten en diensten “pushen”,
zal transformeren in een geïndividualiseerde pull economie.

3.1.4 Communicatieproblemen
We zouden ook anders kunnen redeneren, en beargumenteren dat het niet datasilo’s of
de digitale Toren van Babel zijn, die aan de basis liggen van bedrijfskundige problemen,

50
3 De Semantische Onderneming

maar dat het communicatieproblemen betreft. Vanzelfsprekend zijn beide problematisch


en hebben ze beide oplossingen nodig. Ook het fenomeen van communicatieproblemen
verdient daarom de nodige aandacht.

Ten eerste communiceren mensen direct of indirect met elkaar, maar dit is niet evi-
dent. McComb (2003) beschrijft deze problematiek met het volgende voorbeeld:

“There are 880,000 lawyers in the United States, representing at least a


$100 billion industry. One of the most lucrative things they do is draft,
interpret, and litigate contracts. If contracts were easy to draft and easy to
interpret, they would also be easy to litigate in those fewer cases when they
would go to court.”

Het is zo dat dezelfde symbolen soms kunnen leiden tot interpretatie van verschillende
concepten. Dit idee wordt hier geïllustreerd aan de hand van de “Meaning Triangle”
van Odgen en Richards (1923). Figuur 3.3 toont dat de term “Mars” op verschillende
manieren geïnterpreteerd kan worden. Voor sommigen refereert het aan de planeet Mars,
anderen denken aan het concept van de chocoladereep. In de werkelijke wereld is niet
alles concreet of direct waar te nemen. Abstracte zaken maken het nog moeilijker.

Figuur 3.3: “The Meaning Triangle”: Symbool symboliseert Concept refeert aan Referent;
Symbool betekent Referent.
1) The Meaning Triangle

Concept(en) of (in het achterhoofd)


- gedachten
- ideeën
- intensies

symboliseert
refereert naar

Symbool(en) of Referent(en) of
- term - ding
betekent
- label - object
- code - extensie

"Mars"

2) Voorbeeld van de dubbelzinnigheid van symbolen

Bron: gebaseerd op Odgen en Richards (1923), Meaning of Meaning.

51
3 De Semantische Onderneming

Niet alleen mensen communiceren, maar vandaag worden er ook steeds meer geauto-
miseerde systemen ingezet. De uitdaging hierbij is het omzetten van kennis uit een
expertisedomein naar een syntaxis die door deze systemen geïnterpreteerd worden. Een
hulpmiddel dat hier vaak bij gebruikt wordt is het inzetten van een bedrijfsbreed gegevens-
model, maar een dergelijke aanpak leidt vaak niet tot de gewenste resultaten (Darke en
Shanks, 1999). Eens een systeem operationeel is zullen eindgebruikers gegevens inbrengen,
maar systemen zijn vaak niet in staat om deze gegevens correct te interpreteren. Bijgevolg
moet de eindgebruiker over de noodzakelijke kennis en ervaring beschikken. De oplossing
is een thesaurus die de gegevens met betrekking tot een expertisedomein vastlegt. In vele
situaties zijn gegevens echter afkomstig uit verschillende expertisedomeinen en applicaties,
en deze kunnen dan niet zomaar inzichtelijk worden gemaakt aan de hand van een
termenlijst. Mogelijk oplossingen zullen verder uitgewerkt worden.

Een ander probleem is de “Throw it over the Wall”-benadering die in de cultuur van heel
wat organisaties zit ingebakken. Dit is het fenomeen waarbij een medewerker/departement
een bepaalde taak afwerkt en deze vervolgens doorgeeft aan een collega/departement
zonder veel communicatie onderling, veelal ingegeven door een tekort aan tijd. Bijvoor-
beeld, een werknemer verzamelt documenten, selecteert de voornaamste eruit, en geeft
deze vervolgens door aan een collega die er zich door dient te wurmen. De onderliggende
oorzaak is een tekortschietend management en gebrekkige processen; het heeft dan ook
niets te maken met technologie (Aberdeen Group, 2006).

Tenslotte, dat uitsluitend communicatie alle problemen zou kunnen oplossen is kortzichtig.
We zouden de redenering ook kunnen omdraaien en stellen dat er vandaag meer nood is
aan communicatie, juist om alle chaos op te vangen. Indien deze chaos verdwijnt, is er
ook minder communicatie nodig.

3.2 Concepten voor de Semantische Onderneming


Deze sectie vertrekt van verschillende soorten gegevens, en situeert zich daarmee op een
laag niveau. Er worden een aantal bottom-up concepten uitgelegd die belangrijk zullen
blijken om tot een Semantische Onderneming te komen. De Semantische Onderneming
gaat over het ondersteunen van bedrijfskundige problemen met behulp van oplossingen
die voort zijn gekomen uit onderzoek rond het Semantisch Web.

3.2.1 (On)gestructureerde, semi-gestructureerde data en Linked Data


Gegevens opgeslagen in gegevensbanken is gestructureerde data6 , maar op het Web is
de meeste data semi-gestructureerd, meestal onder de vorm van tekst-gebaseerde data
serialisaties7 en opmaaktalen8 . Vandaar is het nuttig om de verschillende soorten data te
onderscheiden.

6
Het woord “structuur” heeft verschillende betekenissen. Hier bedoelen we enkel data structuur.
7
Voorbeelden van tekst-gebaseerde serialisaties zijn Atom, Gdata, JSON, RDF/XML, RSS, XML, YaML
enzovoort.
8
Voorbeelden van opmaaktalen op het Web zijn XHTML, XML en HTML.

52
3 De Semantische Onderneming

Gestructureerde data Gestructureerde data zijn gegevens georganiseerd in semantische


entiteiten, met soortgelijke entiteiten gegroepeerd in relaties of klassen, en gepresenteerd
op basis van een patroon. Een gestructureerde data resource op het Semantisch Web kan
worden verkregen via een URI.

Semi-gestructureerde data Semi-gestructureerde data zijn gegevens die georganiseerd


zijn in semantische entiteiten die attributen of groepen kunnen bevatten, maar die
niet de vereiste hebben om in een vaste volgorde of in een vooraf ingesteld formaat
te worden gepresenteerd. Deze gegevens kunnen worden ingesloten of afgewisseld met
ongestructureerde data.

Ongestructureerde data Ongestructureerde data zijn gegevens van eender welk type –
tekst, afbeeldingen, video of geluid – die niet noodzakelijkerwijs enige vorm, sequentie of
regels volgen.

De afgelopen jaren werden gestructureerde data typisch beheerd door Database Mana-
gement Systems (DBMS) of werkbladen. Ongestructureerde data vinden we terug in
losstaande tekst, video, geluid of afbeeldingen. Gegevensstructuur kan bijgevolg afgebeeld
worden op een spectrum:

Figuur 3.4: Gegevensstructuur op een spectrum.


DBMS Information Retrieval

Gestructureerd Semi-gestructureerd Ongestructureerd

Bron: gebaseerd op Bergman (2007), More Structure, More Terminology and (hopefully) More Clarity.

Linked Data Linked Data is een subtopic van het Semantisch Web en is eigenlijk een
inspanning om de adoptie van het Semantisch Web te bevorderen. Meer concreet wordt
de term Linked Data gebruikt om een methode te beschrijven voor het delen van gegevens
en het koppelen van data via dereferenceable URI’s op het Web. In 2006 maakte Tim
Berners-Lee de observatie dat in feite een verrassende hoeveelheid gegevens niet verbonden
zijn. In het Linked Data artikel bespreekt hij oplossingen voor de problemen, details

53
3 De Semantische Onderneming

van de uitvoering, en de factoren die keuzes beïnvloeden bij de vraag hoe gegevens te
publiceren. Dit resulteerde in vier simpele Linked Data principes:

1. Gebruik URI’s om dingen te identificeren.

2. Gebruik HTTP URI’s zodat deze dingen gerefereerd en opgezocht (“dereferenced”)


kunnen worden door mensen en user agents.

3. Bied nuttige informatie aan (i.e., een gestructureerde beschrijving — metadata)


over het ding wanneer de URI wordt opgezocht.

4. Voeg links toe naar andere, gerelateerde URI’s in de blootgestelde gegevens om


andere gerelateerde informatie te ontdekken op het Web.

De componenten van Linked Data zijn dus URI’s, het HTTP-protocol en het Resource
Description Framework (RDF). De gestructureerde data in RDF vorm kan geserialiseerd
worden in verschillende formaten zoals RDFa, RDF/XML, N3 en Turtle. Bijzondere
aandacht verdient Linking Open Data9 . Dit is een gemeenschappelijk project om vrij
toegankelijke en aan elkaar gekoppelde RDF data op het Web te creëren. De data wordt
aangeboden in het RDF formaat en komt uit een grote verzameling van bronnen. Voor-
beelden zijn zeer gevarieerd: datasets van BBC programma’s, medicijnen datasets, genen
datasets enzovoort. Het project wordt gesponsord door de Semantic Web Education
& Outreach Interest Group (SWEO) van het W3C. Figuur 3.5 toont wat tot dusver
gerealiseerd is.

In een zeer doordachte blog post beschrijft Bergman (2007) zijn idee van het “Gestructu-
reerde Web”. De belangrijkste opmerking in dit verband is dat er een gestage vooruitgang
is van een “Gestructureerd Web” van het oorspronkelijke documentencentrisch Web
naar het uiteindelijke Semantisch Web. In deze overgangsfase, is het Web veel meer
datacentrisch. Ook het idee van Linked Data is een onderdeel van deze overgang, maar is
nauwkeuriger in die zin dat per definitie de gegevens moeten worden uitgedrukt in RDF
om interoperabiliteit te verkrijgen. De uitdaging is om bestaande webpagina’s en gegevens
te converteren naar een Gestructureerd Web waarbij alles eenvoudig te bereiken is via
een URI. Voor zover deze conversie ook naar RDF gebeurt, zal het de interoperabiliteit
van de gekoppelde gegevens bevorderen. Verder argumenteert hij dat eens er overgangen
zijn van een dergelijke ingrijpende aard, er noodzaak is aan het creëren van een nieuwe
taal en terminologie voor beter begrip en communicatie. Simplistische noties zoals “Web
3.0”10 hebben weinig toe te voegen aan een beter begrip en communicatie.

9
http://esw.w3.org/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
10
Sommigen noemen ze vaak in één adem: Web 3.0 en Semantisch Web. Tim Berners-Lee beschrijft
het Semantisch Web als een component van Web 3.0: “People keep asking what Web 3.0 is. I think
maybe when you’ve got an overlay of scalable verctor graphics on Web 2.0 and acces to a Semantic
Web integrated across a huge space of data, you’ll have access to an unbelievable data resource”.

54
3 De Semantische Onderneming

Figuur 3.5: Een visualisatie van de Linked Open Data sets die tot nu toe (ongeveer 13.1
miljard triples) gepubliceerd en verbonden zijn.
ECS
South-
Sem- Wiki-
BBC Surge ampton
LIBRIS Web- company
Playcount Radio Central RDF
Data ohloh
Resex
Doap- Buda-
Music- space Semantic ReSIST
brainz Audio- pest Eurécom
Project
Flickr Web.org
MySpace Scrobbler QDOS SW BME Wiki
exporter
Wrapper
Conference IRIT
Corpus Toulouse

RAE National
BBC BBC Crunch 2001 Science
FOAF SIOC ACM
BBC Music Later + John Base Revyu Foundation
Jamendo Peel profiles Sites
TOTP Open-
Guides
DBLP
flickr RKB
Project
Pub Geo- Euro- wrappr Explorer
Guten- Virtuoso
Guide names stat Pisa CORDIS
berg Sponger eprints
BBC
Programmes Open
Calais
RKB
riese World Linked
ECS
Magna- Fact- MDB IEEE New-
South-
tune book
ampton castle
RDF Book
DBpedia Mashup
Linked
GeoData lingvoj Freebase LAAS-
US CiteSeer
Census CNRS
W3C DBLP
Data IBM
WordNet Hannover
UniRef
GEO
UMBEL Species DBLP
Gov-
Track Berlin
Reactome
LinkedCT UniParc
Open Taxonomy
Cyc Yago Drug
PROSITE
Daily Bank
Med
Pub GeneID
Chem
Homolo KEGG UniProt
Gene
Pfam ProDom
Disea- CAS
Gene
some
ChEBI Ontology
Symbol OMIM

Inter
Pro
UniSTS PDB
HGNC
MGI
PubMed
As of July 2009

Bron: Semantic Web Education & Outreach Interest Group (SWEO) (2010)

3.2.2 Soorten gegevens in de onderneming


In de onderneming kwalificeren we data op een geraffineerder niveau. Haselden en Wolter
(2006) onderscheiden vijf verschillende essentiële datatypes in de onderneming. Zij geven
hieraan de volgende rudimentaire definities:
• Ongestructureerde data — Dit is data die gevonden kan worden in e-mails, pro-
ductspecificaties, PDF-files, et cetera.
• Transactionele data — Dit is data gerelateerd aan verkopen, leveringen, facturen,
trouble tickets, claims en andere monetaire en niet-monetaire interacties.
• Metadata — Dit zijn gegevens over andere gegevens en kunnen in een formele
repository verblijven, of in verschillende andere vormen zoals XML-documenten,
data dictionaries, beschrijvingen van kolommen in een gegevensbank, logbestanden
en configuratiebestanden.
• Hiërarchische data — Hiërarchische data slagen de relaties tussen andere gegevens
op. Het kan worden opgeslagen als onderdeel van een boekhoudsysteem, hetzij af-
zonderlijk beschreven als relaties in de echtere wereld, zoals de organisatiestructuren
of productlijnen. Hiërarchische data worden soms beschouwd als een overkoepelend
Master Data Management domein, omdat het kritiek is voor het begrijpen van de
relaties tussen master data.

55
3 De Semantische Onderneming

Figuur 3.6: De transitie van het Web.

Documenten Web Gestructureerde Web Semantisch Web


Linked Data

- Documenten-centrisch - Data-centrisch - Data-centrisch - Data-centrisch


- Documenten resources - Gestructureerde data - Linked Data - Linked Data
- Ongestructureerde data en - Semi-gestructureerde data - Semi-gestructureerde data - Semi-gestructureerde data
semi-gestructureerde data en gestructureerde data en gestructureerde data en gestructureerde data
- HTML - XML, JSON, RDF etc. - RDF, RDF-S - RDF, RDF-S, OWL
- URL-centrisch - URI-centrisch - URI-centrisch - URI-centrisch
- circa 1993 - circa 2003 - circa 2006 - circa ???

Bron: gebaseerd op Bergman (2007), More Structure, More Terminology and (hopefully) More Clarity.

• Master data — Master data zijn de kritische zelfstandige naamwoorden van een
bedrijf en worden over het algemeen opgedeeld in vier groepen: mensen, dingen,
plaatsen en begrippen. Verdere indelingen binnen de groepen worden vakgebie-
den, domein specifiek of entiteitstypen genoemd. Voorbeelden bij mensen zijn
klanten, werknemers en verkopers. Binnen dingen zijn er producten, onderdelen,
vermogensbeheer, et cetera. Binnen begrippen zijn er contracten, garanties en
licenties. Bij plaatsen zijn er dan weer kantoorlocaties en geografische divisies.
Sommige van deze entiteitstypen kunnen verder worden opgedeeld. Een klant kan
worden gesegmenteerd op basis van aankoopgedrag. Een product kan verder worden
gesegmenteerd per sector en industrie. De granulariteit van de domeinen wordt
bepaald door de grootte van verschillen tussen de interne attributen en entiteiten.

3.2.3 Open en gesloten systemen


Een ander belangrijk concept is open versus gesloten systemen. We kunnen namelijk
de Semantische Onderneming vanuit twee perspectieven benaderen. In dit opzicht
onderscheidt Leenheer (2009) open- en gesloten systemen die we hieronder omschrijven.

Gesloten systemen Bij traditionele (gesloten) informatiesystemen, wordt interoperabi-


liteit bereikt door fysiek te integreren. Kleinere satellietsystemen worden omgevormd
naar een uniform systeem door middel van federatie (zie Sectie 3.4.2). De integratie
is vrij eenvoudig, omdat de mate waarin gegevens, toepassingen en processen moeten
samenwerken, en de semantiek die nodig is voor interoperabiliteit eisen, a priori bekend

56
3 De Semantische Onderneming

zijn. Bovendien ligt de verantwoordelijkheid voor de handhaving en evaluatie van de inte-


gratie bij een beperkte groep van interne bestuurders of is het uitbesteed aan zogenaamde
Enterprise Resource Planning (ERP) leveranciers. Een gesloten informatiesysteem is
daarom een informatiesysteem waarbij interoperabiliteit niet van belang is. Met andere
woorden, evoluties die plaatsvinden zijn enkel zinvol voor het systeem als ze in de context
van het systeem plaatsvinden. Dit is ook wel een closed-world assumption of inside-out
benadering. Alle beslissingen kunnen worden gemaakt op basis van bekende gegevens, en
worden beheerd door de onderneming.

Onsuccesvolle ERP projecten zijn mogelijk te wijten aan het feit dat vaak het hele
ERP-project uitbesteed is zonder dat de interne IT afdeling daarbij betrokken werd. Het
inadequaat reageren op weerstand tegen verandering (bv. veranderingen in functieom-
schrijvingen) is eveneens een factor. Bovendien stelt men vaak geen specifieke en meetbare
voordelen vast, focust men teveel op technologie in plaats van op de bedrijfsvoordelen
en negeert men de behoeften voor managementrapportage. Onvoldoende investeringen
in permanente opleiding voor het betrokken personeel leiden eveneens tot onsuccesvolle
projecten (Sykes en Willcocks, 2000).

Open systemen In tegenstelling tot gesloten systemen, voldoet een open informatiesys-
teem aan semantische interoperabiliteit. Met andere woorden: er kunnen zich wijzigingen
in het systeem voordien, die te wijten zijn aan externe oorzaken uit een of meer informa-
tiesystemen in de omgeving die zich hebben gecommitteerd aan dezelfde ontologie. Het
informatiesysteem in kwestie kan op een zinvolle manier hierop reageren. Bijvoorbeeld,
leverancier- en klant informatiesystemen zijn duidelijk open systemen vermits ze veron-
dersteld worden op elkaars berichten te kunnen reageren op de verschillende stappen
bij een levering. Dit is de open-world assumption – één van de grondbeginselen van
het Semantisch Web – of inside-out benadering. Hierbij gaat men er vanuit dat feiten
onvolledig zijn en in het algemeen nooit volledig bekend worden.

Indien we de Semantische Onderneming beschouwen als een onderneming die opereert


onder de gesloten wereld veronderstelling, dan zijn de architectuur en tools die worden
ingezet vergelijkbaar met de aanpak die gehanteerd wordt bij een traditioneel en zo
ook relationeel model. Dit komt omdat de gegevens, waarvan de semantiek nodig is,
opgeslagen zijn in een gegevensbank. Als zodanig kan semantiek worden geëxtraheerd uit
voornamelijk transactionele data met behulp van conventionele relationele database syste-
men. Vele van de midden jaren tachtig problemen waarmee relationele gegevensbanken te
maken hadden, zijn vergelijkbaar met diegene waar het Web nu mee wordt geconfronteerd,
alleen op een veel grotere schaal. Echter, als we de Semantische Onderneming definiëren
als onderneming die opereert onder de zogenaamde open world assumption, dan moet
zij gebruik maken van de semantiek van ongestructureerde, niet-transactionele gegevens,
die niet opgeslagen zijn in een gegevensbank. In het vorige hoofdstuk werd duidelijk
dat vertrouwen en privacy domeinen zijn waar nog veel onderzoek nodig is. Bedrijven
zetten vaak firewalls in om te voorkomen dat ongewenst verkeer (i.e., hackers, crackers,

57
3 De Semantische Onderneming

computervirussen etc.) in de gevoelige netwerkzone van het bedrijf komt. Daar seman-
tisch bewuste applicaties meestal ontworpen zijn om te werken op het open web, zouden
ze ingetoomd worden door de firewall-configuratie waarop deze draaien. Fitzgerald en
Foley (2008) beargumenteren dat ondanks dat het Semantisch Web het mogelijk maakt
om de beveiliging van toepassingen tot op de hoogte van domeinkennis te brengen, de
notie van firewalls – de indeling van de wereld in twee domeinen, publiek en privaat –
een rol zal blijven spelen bij het veiligstellen van de low-level infrastructuur. Te strakke
configuraties missen de voordelen van het Semantisch Web, terwijl losse configuraties
ervoor zorgen dat bedrijfsgegevens opeens kwetsbaar worden. In essentie betekent dit dat
semantiek in de onderneming intrinsiek wordt bepaald door de mate van transparantie
en openheid van het datamodel.

3.3 Nood aan interoperabiliteit


In de huidige heterogene IT-omgeving en mede door de opkomst van Web services en
service-oriented architectures, is interoperabiliteit uitgegroeid tot een belangrijke organisa-
tie behoefte. Immers, in een dergelijke omgeving, gekenmerkt door grote gedistribueerde,
autonome, gevarieerde en dynamische informatiebronnen, wordt toegang tot relevante en
accurate informatie steeds complexer. Hiervoor zijn oplossingen nodig, en dat is waar
interoperabiliteit om draait.

Er bestaan vele definities van interoperabilities. Interoperabiliteit is immers domein-


specifiek. Naast interoperabiliteit die nodig is tussen mensen, ICT en mensen, en tussen
ICT onderling, zijn er verschillende bedrijfsdomeinen zoals manufacturing, financiën en
marketing, die elk op hun beurt verschillende subdomeinen omvatten, bestaande uit
mensen (managers, experten, operatoren), devices (controllers, actuatoren, sensors) en
systemen (computers, machines, communicatienetwerken), die allemaal interoperabiliteit
vereisen. Een naar mijn mening zeer volledige, doch voldoende abstracte en generieke
definitie is te vinden in de productie-industrie onder de vorm van een ISO11 standaard.
De ISO definitie formuleert de voorwaarden voor het plaatsvinden van interoperatie.

“Interoperation may occur between two (or more) entities thar are related
to one another in one of three ways (ISO 14285, 1999):
a. Integrated where there is a standard format for all constituent systems
b. Unified where there is a common meta-level structure across constituent
models, providing a means for establishing semantic equivalence
c. Federated where models must be dynamically accomodated rather than
having a predetermined meta-model”

11
De International Organization for Standardization (Internationale Organisatie voor Standaardisatie),
beter bekend als ISO, is een internationale standaard-instelling bestaande uit vertegenwoordigers van
verschillende nationale standaardorganisaties. De organisatie legt wereldwijde industrie en commerciële
normen vast.

58
3 De Semantische Onderneming

In wat volgt benaderen we de dimensies en verschillende classificaties rondom interope-


rabiliteit bij informatiesystemen. Vervolgens bekijken we interoperabiliteit vanuit een
bedrijfskundige invalshoek. Tenslotte adresseren we het Semantisch Web en bepalen we
hoe ontologieën in het bijzonder een antwoord kunnen bieden op deze problematiek.

3.3.1 Interoperabiliteit classificatie


Ouksel en Sheth (1999) onderscheiden verschillende vormen van heterogeniteit in informa-
tiesystemen. Zij onderscheiden hierbij tevens verschillende niveaus van interoperabiliteit
– het systeem, de syntaxisis, de structuur en het semantische. Syntactische heterogeniteit
heeft te maken met verschillen in machineleesbaarheid van aspecten van vertegenwoordi-
ging of formattering. Schematische heterogeniteit, die vooral voorkomt in gestructureerde
databases, is een aspect van de structurele heterogeniteit. Hoewel er reeds aanzienlijke
vooruitgang is geboekt in de systeem-, syntactische-, en structurele / schematische inter-
operabiliteit, zijn uitgebreide oplossingen voor semantische interoperabiliteit moeilijk te
bereiken. Toch zijn een aantal trends en ontwikkelingen, zoals het Semantisch Web, die
de aandacht blijven vestigen op semantische kwesties en semantische interoperabiliteit.

Tabel 3.1: Heterogeniteit in informatiesystemen en bijbehorende interoperabiliteit


kwesties.

Informatie Heterogeniteit
Semantische Heterogeniteit
Structurele, Representationele/Schematische Heterogeniteit
Syntactische Heterogeniteit
Systeem Heterogeniteit
Informatiesysteem Heterogeniteit
Digital Media Repository Management Systems, Database Management Systems
Platform Heterogeniteit
Operating Systems
Hardware/System
Semantische Interoperabiliteit
Structurele Interoperabiliteit
Syntactische Interoperabiliteit
Systeem Interoperabiliteit
Bron: Sheth (1998), Changing Focus On Interoperability in Information Systems: from System, Syntax,
structure to Semantics.

3.3.2 Enterprise-interoperabiliteit
De dringende noodzaak van organisatorische interoperabiliteit en ondersteuning van de
besluitvorming op alle niveaus van de onderneming is erkend door het bedrijfsleven en de
academische wereld (Kosanke en Nell, 1997). Volgens Chen en Doumeingts (2003), kan

59
3 De Semantische Onderneming

interactie tussen twee systemen plaatsvinden op tenminste drie niveaus: data, resource en
bedrijfsproces. Interoperabiliteit kan daarom bereikt worden op verschillende manieren:
inter-enterprise coördinatie, bedrijfsproces integratie, semantic application integration en
fysische integratie. De aanbevelingen luiden dan ook om interoperabiliteit te benaderen
vanuit drie onderzoeksdomeinen: enterprise modelling, ontologieën en architecturen en
platformen. De drie domeinen benaderen de interoperabiliteit prolematiek vanuit verschil-
lende perspectieven. Enterprise modelling heeft te maken met de abstracte representatie,
beschrijving en definitie van de structuur, processen, informatie en middelen van een
genetwerkte organisatie. Ontologieën betreffen het toevoegen van de nodige semantiek.
Architecturen en platformen bepalen de implementatie oplossing.

Ontologieën, zijnde formele computer-gebaseerde representaties van concepten en woor-


denschatten van de zakelijke context die wordt besproken, spelen een belangrijke rol
in bedrijfsinteracties omdat zij voor de nodige gedeelde semantische “lijm” zorgen om
interoperabiliteit mogelijk te maken (De Leenheer, 2009). In Figuur 3.7 worden de drie
niveaus van interactie aangehaald met een bijkomend vierde niveau: de bedrijfsmiddelen.
Bijvoorbeeld, actoren van twee verschillende ondernemingen kunnen fysiek en verbaal
contact met elkaar hebben.

Figuur 3.7: Semantiek zorgt voor bedrijfsinteroperabiliteit op vier niveaus: bedrijfspro-


cessen, data, applicaties en bedrijfsmiddelen.
Enterprise Eén Enterprise Twee
Proces
Proces
Data

Data

semantiek
Applicatie
Applicatie
Middelen

Middelen

Bron: De Leenheer (2009), On Community-based Ontology Evolution.

60
3 De Semantische Onderneming

3.3.3 Semantische interoperabiliteit


In “open” bedrijfsecosystemen, ligt de nadruk op semantische aspecten van informatie,
kennis en proces interoperabiliteit. Semantische interoperabiliteit vereist dat het infor-
matiesysteem de semantiek van een informatieverzoek begrijpt, gebruik makend van
mediation of information brokering, opdat het zo goed mogelijk kan voldoen aan het
verzoek (Sheth, 1998).

In deze scriptie is het onderzoeksdomein ontologieën. Interoperabiliteit bij ontologieën


verwijst naar semantische interoperabiliteit. We nemen de definitie van De Leenheer
(2009) over, die semantische interoperabiliteit definieert in termen van een ontlogie:

“Interoperability by means of an ontology that is shared by the involved information


systems”

De mate waarin semantische interoperabiliteit plaatsvindt, hangt af van de inhoud


van de ontologie. Bijgevolg, om waarde te creëren met semantische interoperabiliteit,
moeten de vereiste domein concepties gerepresenteerd worden door de gedeelde ontologie.

Beschouw een levering van goederen van leverancier naar klant. De sleutelvraag hier bij
sociale interactie is: “Wat is een levering?”. Door het domein te interpreteren kunnen de
domein concepties van het domein worden geïdentificeerd. Bijvoorbeeld: “een levering is
een type object die bestaat uit een bepaalde hoeveelheid paletten, een zekere hoeveelheid
dozen bevattend, die een bepaalde hoeveelheid van producten met een ID dragen”. Voor
mensen in face-to-face interactie is dit vanzelfsprekend. Echter, de onderliggende informa-
tie sub-systemen stellen deze domein conceptie elk voor in hun eigen domein representatie.
Zoals De Leenheer (2009) terecht uiteenzet, zou er in een ideale situatie waar ontologieën
toegepast worden, gemeenschappelijke en herbruikbare representaties zijn voor domein
concepties. Voor elke nieuwe semantische interoperabiliteit vereiste, worden dan de
benodigde content types geselecteerd vanuit een repository. In de realiteit is dit meestal
echter niet het geval. Elke keer wanneer een nieuwe service of applicatie gedefinieerd
wordt, gaat men applicatie specifieke representaties lokaal aligneren, in plaats van te
herbruiken wat er reeds gedeeld is vanuit andere contexten. Als de vereiste concepten
niet beschikbaar zijn dan moeten de stakeholders samen tot een besluit komen. Echter,
dit is niet evident. Hepp (2007) wijst op technische, sociale, economische en juridische
gevolgen, die een rem zetten op de ontwikkeling van praktisch bruikbare ontologieën,
dewelke een verklaring bieden voor het huidige tekort aan ontologieën. In zijn doctoraat
legt De Leenheer (2009) de grondslagen van Business Semantics Management vast aan
de hand van de community-based ontology evolution methodologie, dat een oplossing
aanreikt voor deze problematiek.

61
3 De Semantische Onderneming

3.4 Integratie
De moeilijkheid bij kwaliteitswaarborging van gegevens is het integreren en combineren
van gegevens tussen verschillende systemen (Davenport & Harris, 2007). Laten we daarom
vooreerst integratie definiëren.

Fischer (1989) definieerde integratie als volgt: “The continuous interdisciplinary sharing
of data, knowledge, and goals among project participants”. Deze definitie is acceptabel
en gepast in verschillende contexten. Immers, IT integratie of eender andere vorm, is
geen intrinsiek doel van een organisatie. Integratie moet bekeken worden vanuit de nood
aan bedrijfsproces verbetering in het licht van de business strategie.

Fischer et al. (1993) ontwikkelden een raamwerk met de verschillende dimensies van
integratie, om de verschillende niveaus van integratie aan te geven. Hun bevinding was
dat het niet altijd nodig is om een vorige stap te hebben bereikt om naar het volgende
integratieniveau te gaan. Het raamwerk laat individuen, departementen, bedrijven, pro-
jecten en industrieën toe, om hun huidige stand van integratie te plotten, en te wijzen op
de inspanningen die nodig zijn om het integratieniveau te verhogen. Bovendien biedt het
raamwerk een generieke en gefocuste integratiedefinitie. Generieke integratie kan worden
omschreven als het delen van iets door iemand, door gebruik te maken van een bepaalde
benadering voor het bereiken van een bepaald doel. Uiteraard is deze definitie niet op zich
bruikbaar. Als men de vage formuleringen echter vervangt met waarden van het kader,
kan men een definitie bekomen die bij een bepaald doel past. Bijvoorbeeld, een bedrijf zou
integratie kunnen definiëren als de uitwisseling van gegevens en modellen van afdelingen
met verschillende toepassingen met betrekking tot een aantal disciplines en projectfasen,
met als doel verhoging van winst en marktaandeel. Een overheidsinstelling kan integratie
dan weer zien als de uitwisseling van gegevens tussen applicaties in meerdere disciplines
ter overleving in een industrie. Met andere woorden, het voordeel van het kader is dat de
verschillende definities eenvoudig aan elkaar gerelateerd kunnen worden. Het raamwerk
bestaat uit vijf dimensies die elk afzonderlijk gepresenteerd worden in Tabel 3.2. In
werkelijkheid kan elke dimensie gecombineerd worden op een multidimensionale wijze, het
welk geïllustreerd kan worden door het combineren van de “wie” en “waarom” dimensies,
zoals in Tabel 3.3.

62
Tabel 3.2: Dimensies en niveau’s van integratie

Lage integratie → → → Hoge integratie


Wie? Individuen Departementen Gehele Hele project Gehele industrie
organisaties levenscyclus
Wat? Data Modellen Kennis Doelen Alle project
informatie
Wanneer? Eilandautomatisering Verschillende Verschillende Verschillende Alle applicaties
applicaties binnen applicaties voor applicaties voor gedurende project
één discipline en verschillende verschillende proces
fase disciplines in één disciplines en
fase fases
Waarom? Overleving Stijging winst Stijging Binnentreden van Stijging industrie

3 De Semantische Onderneming
marktaandeel nieuwe markten aandeel binnen
economie
Bron: Fischer (1989), Computer Integrated Construction Framework.
63
Tabel 3.3: Wisselwerking tussen twee dimensies binnen het Fischer raamwerk

WIE?
Individuen Departementen Enterprises Projecten Industrie
Een baan Afdeling Operationeel Projecten Industrie
behouden overleving blijven voltooien overleving
Winst verhogen Stijging Stijging winst Stijging project Stijging industrie
winstbijdrage succesgraad winstgevendheid
WAAROM? Uitbreiden van Stijging politieke Stijging Stijging project Stijging industrie
job gezag rol afdeling marktaandeel scope aandeel binnen
economie
Van job Aanvullende Binnentreden Het project op Uitbreiding naar
veranderen rollen nemen nieuwe markten grotere schaal andere sectoren
inzetten

3 De Semantische Onderneming
Nieuwe job Nieuwe rollen Nieuwe markten Project verlengen Nieuwe sectoren
creëren creëren creëren en diensten
creëren
Bron: Fischer (1993), Computer Integrated Construction Framework.
64
3 De Semantische Onderneming

3.4.1 Data-integratie
Data-integratie gaat over het combineren van gegevens in verschillende bronnen en het
aanbieden van een eenduidig beeld van deze gegevens. Het probleem van het ontwerpen
van data-integratiesystemen is belangrijke in de huidige applicatie wereld (Lenzerini,
2002). Data-integratie gebeurt steeds vaker als het volume en de nood om gegevens te
delen explodeert (IDC, 2008). In managementkringen wordt vaak naar data-integratie
gerefereerd als “Enterprise Information Integration” (EII).

Integratie problematiek: silo’s De reden waarom integratie geen evidente materie is, is
de massale heterogeniteit binnen informatiesystemen. In de interoperabiliteit-sectie werd
er reeds een classificatie van heterogeniteit gegeven. In een bedrijfskundige omgeving is
er echter vaak nood aan homogeniteit. Beschouw het volgende voorbeeld. Eén van de
primaire drijfveren die de IT strategieën binnen Financial Services organisaties beïnvloedt,
is de nood om gegevens te verzamelen van verschillende bronnen doorheen de organisatie
opdat het geassembleerd wordt tot een nieuw, breder, allesomvattend en zinvol geheel. Zo
zou een Customer Relationship Management (CRM) systeem kunnen worden aangevuld
met gegevens van een order systeem. De bedoeling is om gefragmenteerde informatie
te herintegreren tot een collectief geheel. Wanneer deze informatie gesynthetiseerd
wordt, biedt dit meerwaarde voor de business zoals een 360 graden beeld van de klant,
een geconsolideerde rekening portfolio en een uniforme financiële statement. Het gaat
echter niet alleen over verspreide klantengegevens, maar ook bijvoorbeeld definities die
verschillen over systemen heen, zoals de productdefinitie. Inderdaad, er is bijvoorbeeld
een zekere overlapping tussen de voorraadadministratie en de boekhouding die, indien
deze verbonden zijn, veel fouten zou vermijden. Het resultaat is het ontstaan van wrijving,
door de verkeerde afstemming van data als gevolg van het gebruik van verschillende
technologieën en datamodellen. Bijvoorbeeld, traditionele gegevensbanken creëren silo’s
omdat relationele data specifiek zijn aan de gegevensbank implementatie. Elk systeem
behoudt dus zijn eigen perspectief, gebaseerd op zijn eigen noden. Geen van beide is
verkeerd, maar de integratie creëert wrijving dat meestal gepaard gaat met uitgebreide
en complexe software vertalingen om het leed te verzachten en met bijkomende negatieve
gevolgen: het ontbreken van data, conflicterende data en incorrecte data. Tenslotte dient
nog opgemerkt te worden dat de uitdagingen met betrekking tot gegevens niet te overzien
zijn bij grote integraties. We spreken in dit verband over de “integratie ijsberg”. Net als
een ijsberg die uit een verborgen massa bestaat, openbaren data uitdagingen zich vaak
op stressvolle en moeilijke tijden (Evans et al, 2009; Lenzerini, 2002).

Het structureren van de integratie-architectuur De snelle adoptie van gegevensban-


ken in de zestiger jaren, heeft geleid tot de nood om bestaande repositories te delen of
samen te voegen. Deze merging kan op verschilende niveaus in de database architectuur
plaatsvinden (Dittrich en Ziegler, 2007). De conventionele benadering is een warehouse-
systeem dat data van verschillende bronnen extraheert, transformeert, laadt (ETL) en
deze gegevens samenbrengt in één “queriable” schema. Vertrekkende van de koppeling en
cohesieprincipes die Jackson (1983) en anderen introduceerden in de Structured Design

65
3 De Semantische Onderneming

discipline, stellen we vast dat er een hoge koppeling heerst, aangezien de data in één
enkele repository verblijft tijdens query-time. Dit heeft implicaties op herbruikbaarheid
en evolueerbaarheid. Problemen die dan kunnen opduiken betreft de “versheid” van deze
gegevens. Bijvoorbeeld, wanneer een originele gegevensbron wordt bijgewerkt, maar het
warehouse bevat nog steeds verouderde gegevens en het ETL proces moet worden heruitge-
voerd. Daarnaast is het vaak ook niet evident om data warehouses te construeren, omdat
men slechts over een interface beschikt, en geen toegang heeft tot de volledige gegevensset.

Door gegevens los te koppelen van elkaar, verkrijgt men stabielere integraties. Deze
worden gekenmerkt door een uniforme query interface over een gemedieerd schema. Met
andere woorden, een query wordt getransformeerd in een reeks gespecialiseerde queries
over de originele gegevensbanken. Computerwetenschappers noemen dit een Local As
View (LAV) benadering — Local verwijst naar lokale gegevensbronnen/gegevensbanken.
Een alternatief integratie model gebruikt het gemedieerde schema als overzicht op de
gegevensbronnen. Deze benadering heet Global As View (GAV) – Global verwijst naar
het globale gemedieerde schema. Deze vorm is aantrekkelijk vermits het zeer simpel is om
queries te beantwoorden aan de hand van het gemedieerde schema. Nochtans, wanneer er
een nieuwe bron wordt geïntegreerd en/of een bestaande bron zijn schema wijzigt, moet
de view van het gemedieerde schema gewijzigd worden.

Figuur 3.8 geeft het verschil weer tussen de schematische voorstelling van een data
warehouse (a), waarbij een ETL proces informatie extraheert uit verschillende gege-
vensbronnen, deze transformeert en laadt in het warehouse, tegenover de gemedieerde
oplossing (b), waarbij een virtuele gegevensbank communiceert met de brongegevens via
wrapper code indien nodig.

Figuur 3.8: Simpele schematische voorstelling voor een datawarehouse en gemedieerd


schema.
a) b)

Databron A
Databron A Wrapper

ETL

Databron B Data Warehouse Gemedieerd


Databron B Wrapper Schema "Virtuele
Databank"

Databron C
Databron C Wrapper

Bron: gebaseerd op Wikipedia (2010), Data Integration.

66
3 De Semantische Onderneming

In deze scriptie behandelen we het semantische integratie probleem. Dit probleem


adresseert niet zozeer de structuur van de integratie architectuur, maar probeert op te
lossen hoe semantische conflicten tussen heterogene gegevensbronnen kunnen worden
opgelost. In feite is dit niets anders dan het fameuze interoperabiliteit probleem, met
al zijn niveau’s, dat in Sectie 3.3 uitvoerig aan bod kwam. De algemene strategie voor
de resolutie van dergelijke problemen is het gebruik van ontologieën. Vanuit een data-
integratie perspectief, is dit wat men ontologie-gebaseerde data-integratie noemt, en kan
geclassificeerd worden als een LAV benadering Lenzerini (2002).

67
3 De Semantische Onderneming

Benaderingen voor het gebruik van ontologieën voor data-integratie Zoals Figuur
3.9 toont, onderscheiden Hübner et al (2001) drie algemene architecturen die kunnen
worden gebruikt voor ontologie-gebaseerde data-integratie, met name:

Figuur 3.9: Drie mogelijke manieren om ontologieën te gebruiken voor data-integratie.


a) b)

global ontologie lokale ontologie lokale ontologie lokale ontologie

Databron A Databron B Databron C Databron A Databron B Databron C

c)
gedeelde woordenschat

lokale ontologie lokale ontologie lokale ontologie

Databron A Databron B Databron C

Bron: gebaseerd op Hübner et al (2001), Ontology-Based Integration of Information: A Survey of Existing


Approaches.

• Enkelvoudige ontologie benadering (a). Een enkelvoudige ontologie wordt


gebruik als globaal referentie model in een systeem. Dit is de eenvoudigste benade-
ring, vermits het kan gesimuleerd worden door andere benaderingen (Hübner et
al, 2001). SIMS is een prominent voorbeeld van deze benadering (Arengs, Hsu &
Knoblock, 1996).

• Verschillende ontologieën benadering (b). Verschillende ontologieën, die elk


een individuele gegevensbron modelleren, worden gebruikt in combinatie voor in-
tegratie. Hoewel deze benadering meer flexibel is dan de enkelvoudige ontologie
benadering, vereist het de ontwikkeling van mappings tussen verschillende ontolo-
gieën. Ontology mapping is een uitdagende issue en is de focus van grootschalig

68
3 De Semantische Onderneming

onderzoek in de computerwetenschappen (Lenzerini, 2002). Het OBSERVER sys-


teem is een voorbeeld van deze benadering (Illaramendi, Kashyap, Mena en Sheth,
1996).

• Hybride benadering (c). De hybride benadering gaat verschillende ontologieën


gebruiken die het eens zijn met een gemeenschappelijke, top-level woordenschat.
De top-level woordenschat definieert de basistermen voor het domein. Vandaar
dat de hybride benadering het gemakkelijker maakt om meerdere ontologieën te
gebruiken voor integratie in aanwezigheid van de gemeenschappelijke woordenschat
(Goh, 1997).

Tot slot van deze sectie verwijzen we naar Wikipedia12 , voor een volwaardige inleiding
tot de theorie van data integratie. Dit is een subset van database theorie en formaliseert
de onderliggende concepten van het probleem van de eerste-orde logica.

3.4.2 Enterprise-integratie
Het doel van Enterprise Integration (EI) is de ontwikkeling van oplossingen en computer-
gebaseerde gereedschappen die de coördinatie van werk- en informatiestromen faciliteren
over organisatiegrenzen heen. Enterprise-integratie vindt plaats wanneer er een verbe-
tering is in de interacties op taak niveau tussen mensen, departementen, diensten en
bedrijven. Dit kan niet zomaar bereikt worden door het louter verbinden van computers
(Vernadat, 1996).

Petrie (1992) onderscheidt drie benaderingen voor enterprise-integratie: master-model


based integration; unifcation-based integration en federation-based integration.

Master model-based integratie In deze benadering is er slechts één referentie model


(ook wel master model) opgeslagen in een bibliotheek waaruit alle andere modellen worden
afgeleid en geïnstantieerd. Bepaalde modellen zijn aangepast om tegemoet te komen aan
specifieke noden van de gebruiker. Het probleem met deze benadering is dat het systeem
en de modellen zeer sterk gekoppeld zijn in die zin dat wanneer er veranderingen moeten
worden gemaakt in het master model, deze moeten gepropageerd naar alle instanties, als
men consistentie wenst blijven te garanderen. Deze benadering wordt gevolgd door IEM,
waar alle object klassen afgeleide specialisaties zijn van een set van drie generieke klassen
en ARIS, hetwelk informatie modellen en proces modellen afleidt van vooraf gedefinieerde
referentiemodellen (Vernadat, 1996)13 .

Unification-based integratie Er kunnen zoveel locale modellen zijn als vereist, maar alle
concepten gedeeld door de verschillende componenten van het systeem worden semantisch

12
http://en.wikipedia.org/wiki/Data_Integration
13
Architecture of Integrated Information Systems (ARIS) en Integrated Enterprise Modeling (IEM) zijn
procesgeoriënteerde enterprise modeling methodes ontwikkeld tijdens de negentiger jaren.

69
3 De Semantische Onderneming

geünificeerd in een meta-model door middel van early binding14 . Het Computer Integrated
Manufacturing Open System Architecture (CIMOSA) modeling raamwerk is gebaseerd op
deze benadering. De voordelen zijn drievoudig: een haalbare oplossing is steeds mogelijk,
veranderingen worden consistent gereflecteerd doorheen het systeem en de benadering is
schaalbaar. Het nadeel ligt in het feit dat grote modelleer inspanningen nodig zijn tijdens
de ontwerpfase. Deze benadering is sterk afhankelijk van vooruitgang met betrekking tot
standaardisatie (Vernadat, 1996).

Federation-based integratie Deze benadering laat zoveel lokale modellen toe als er
nodig zijn, maar bestaande modellen blijven hetzelfde en nieuwe worden toegevoegd. Al
deze modellen kunnen zeer verschillend zijn van aard. Enkel de zwakke koppeling tussen
de systemen is verzekerd. Uitwisselingen gebeuren wanneer het nodig is, op basis van
een federatie mechanisme voor semantische unificatie gebaseerd op late binding. Late
binding betekent dat wanneer systeem A informatie vraagt van systeem B, dan moet B
het verzoek van A aanpassen aan zijn kennisdomein. Concepten tussen A en B worden
met andere woorden gemapt. Ontologieën worden ontwikkeld om dit probleem op te
lossen. Echter, op dit moment is het onduidelijk hoe deze aanpak kan omgaan met
schaalbaarheid voor de orde grootte typisch bij grote industriële toepassingen (Vernadat,
1996).

Data-federatie is ontstaan in de tachtiger jaren, met onderzoek in de biologie en com-


puterwetenschappen gemeenschappen. Destijds bestond er een enorme diversiteit aan
fysische hardware, besturingssystemen, gegevensbanken, software en immature netwerk-
protocols, die het delen van gegevens bemoeilijkten. Het Internet en haar TCP/IP en
HTTP protocollen, en XML standaarden in het bijzonder, hebben veel bijgedragen om
de respectievelijke fysische-, syntactische- en data-uitwisselings- heterogeniteiten weg te
werken. De huidige uitdaging is om verschillen in betekenis te overkomen. De volgende
stap is die van de pragmatiek en het creëren van vertrouwen (Bergman, 2006). Figuur
3.10 toont de gemaakte progressie.

Een mogelijke onderverdeling van de integratieniveaus en bijhorende aspecten is die


volgens Vernadat (1996). Hij onderscheid drie verschillende integratie niveaus: business-,
applicatie-, en fysieke integratie, zoals samengevat in Tabel 3.4. Zoals is gebleken, is
fysische integratie, geregeld door de communicatie tussen hardware en software, van-
daag minder aan de orde. Hedendaagse communicatiesoftware heeft noodzaak aan een
sterke structurering. Daarom is communicatiesoftware ingedeeld in lagen en vervat in
een zogenaamde netwerkarchitectuur. Moderne netwerkarchitecturen zoals ISO OSI en
TCP/IP zijn vandaag de de facto. Andere standaarden zijn onder meer Manufactu-
ring Automation Protocol (MAP) en Asynchronous Transfer Mode (ATM), maar deze
zijn veelal bezweken door een gebrek aan belangstelling van de industrie. De overige

14
Semanische problemen worden opgelost at design time, gedurende de constructie. De incrementele
benadering zorgt ervoor dat distrubie geoptimaliseerd wordt over de systeemarchitectuur heen,
waardoor het schaalbaar wordt.

70
3 De Semantische Onderneming

Figuur 3.10: Het beklimmen van de data-federatie piramide.

Vertrouwen

Pragmatiek

Progressie
Webstandaarden XML
OWL/
RDF-S Semantiek

Data representatie
} Vandaag

TCP/IP Netwerk

Software / DBMS

Besturingssysteem

Hardware (fysiek)

Bron: gebaseerd op Bergman (2006), Climbing the Data Federation Pyramid.

twee integratievormen, applicatie- en business integratie verdienen wel de nodige aandacht.

In wat volgt wordt de integratie problematiek uitgelegd vanuit de invalshoek van het
bedrijf. Vervolgens wordt beschreven hoe conventionele en traditionele benaderingen
deze integratie problematiek aanpakken, zowel intern als in de vraag- en aanbodketen. In
de volgende sectie behandelen we Enterprise Integratie in de context van het Semantisch
Web.
Tabel 3.4: Integratie niveaus en aspecten.

Integratie niveaus Integratie aspecten


Business Bedrijfsproces coördinatie
Bedrijfsbreed delen van kennis
Interworking; enterprise internetworking
Applicatie Gedistribueerde coöperatieve applicaties
Gegevens/informatie-uitwisseling
Applicatie interoperabiliteit
Fysiek Basis computer communicatie
Het doorgeven van berichten
Interconnectie
Bron: Vernadata (1996), Enterprise Modeling and Integration: Principles and Application.

71
3 De Semantische Onderneming

Integratie binnen de onderneming Conventionele benaderingen proberen informatie


binnen de onderneming te integreren via Extract, Transform en Load (ETL) technieken.
Dit proces vereist veel arbeid om informatie te vergaren, te transformeren en tenslotte te
integreren in een enkele, verenigde data store. ETL heeft verscheidene beperkingen. Het is
niet schaalbaar, veroorzaakt latency en leidt tot incorrecte informatie, het is foutgevoelig,
is niet afgestemd op verandering en heeft een single point of failure. Ook software voor
toepassingen worden steeds meer geïntegeerd, bijvoorbeeld met een Enterprise Resource
Planning (ERP) systeem. Met behulp van Enterprise Application Integration (EAI)
middleware, kunnen toepassingen gekoppeld worden. Niet alleen data in rust, maar ook
data in beweging kan op deze manier worden geïntegreerd. Software vendors bieden dit
aan onder de vorm van middleware15 aan (Lacoul, 2009).

Data warehouses hielden de belofte in van een enkele, uniforme aanpak voor alle enterprise
data, maar zijn vandaag alleen nog gerechtvaardigd voor belangrijke, consistente streams,
of batches van gegevens die hoge precisie vereisen. In een data warehouse omgeving, is
de integratietaak moeilijk omdat elke database-naar-database koppeling in wezen een
custom-built verbinding betreft, waarin ETL en de bijbehorende data profiling processen
veel zorg, kennis en investeringen vereisen. Het besluit is dat ETL, EAI en alle andere
soorten van complexe data warehousing veelal gefaald hebben, maar wel vele vendors
“fat” gemaakt hebben (Lacoul, 2009).

15
Middleware is de systeemsoftware die zich bevindt tussen de client en de software die de bedrijfsgegevens
beheert. Het werkt op basis van standaardinterfaces waardoor leverancier modules moeiteloos
geïntegreerd kunnen worden. EAI oplossingen zijn bijvoorbeeld SAP Netweaver, WebMethods en
WebSphere.

72
3 De Semantische Onderneming

Integratie in de vraag- en aanbodketen Het is met de opkomst van Enterprise Resource


Planning (ERP) systemen, dat integratie over de bedrijfsgrenzen heen steeds belangrijker
is geworden. In de late zeventiger en tachtiger jaren werd er voor het eerst aandacht
besteed aan data transfer protocols. De oudste en meest bekende vorm van integratie, is
gegevensuitwisseling met behulp van Elektronic Data Interchange (EDI). EDI is gebaseerd
op gecodeerde transacties die tussen partijen in de vraag-en-aanbodketen (B2B) worden
uitgewisseld. EDIFACT is de internationale standaard ontwikkeld door de Verenigde
Naties en is een uitbreiding van EDI voor bepaalde bedrijfstakken. Een voorbeeld is
de integratie tussen klant en leverancier bij een order. Om een EDI-order te plaatsen
bij een leverancier maakt een inkoper in het ERP systeem een order aan. Het systeem
creëert vervolgens een file met daarin het gecodeerde EDI orderbericht, en verzendt
het vervolgens naar de leverancier die het bericht interpreteert. Vervolgens handelt de
leverancier de order af. Een andere vorm van elektronische gegevensuitwisseling is die
tussen onderneming en bank. De automatisering van betalingen en ontvangsten wordt
veelal aangeduid met de term Electronic Fund Transfer (EFT). Net als voor EDI bestaan
er voor EFT diverse landsspecifieke standaarden (Sneller, 2007).

Standaarden voor gegevensuitwisseling zoals EDI, RosettaNet, UBL en ebXML zijn


reeds sinds 1970 in de onderneming aanwezig, maar deze “standaarden” brachten nog
meer standaarden voort die niemand meer volgde. Met andere woorden, iedereen heeft
de neiging om zijn of haar eigen idiosyncratische normen voor het uitwisselen van docu-
menten in het bedrijfsleven te creëren. Bijgevolg wordt het moeilijk om nog te kunnen
voldoen aan de standaarden binnen het bedrijfsecosysteem. Het probleem met EDIFACT
was dat vele software systemen syntaxis problemen ervaarden. Vermits een factuur een
factuur blijft en EDIFACT perfect werkt vanuit inhoudelijk standpunt was een combinatie
van EDIFACT woordenschat met XML-syntaxis vanzelfsprekend. XML/EDIFACT werd
geboren. XML is met andere woorden de standaard syntaxis geworden voor gegevens-
uitwisseling waarop telkens wordt voortgebouwd. Speciaal voor financiële verslaggeving
werd eXtensible Business Reporting Language (XBRL)16 ontworpen en belastingsdiensten
gebruiken XML uitbreidingen om elektronische belastingaangifte mogelijk te maken.

3.5 Semantisch Web oplossingen voor integratie


In de begindagen van computers moesten gegevens geëncodeerd worden, vooraleer het
gebruikt kon worden door een elektronisch systeem. Dit betekende dat de informatie die
leefde in zijn “natuurlijke” staat – ongestructureerd, rond verspreid, in geschreven of
gesproken taal – niet kon worden gebruikt door computers. Het betekende ook dat elk
systeem en programma zou werken met zijn eigen opgezette interne architectuur, die vaak
niet compatibel is met andere systemen. Inderdaad, er is een veelheid aan applicaties voor
specifieke bedrijfsvereisten – ook wel silo’s genaamd. Deze talrijke applicaties brengen
een onbeheersbare set van activa voort doorheen de organisatie. Zoals Berners-Lee (2001)
16
In het boek “Pull” van David Siegel is het hoofdstuk “Financial Transparency” volledig geweid aan
XBRL. Met verschillende voorbeelden en case studies worden de voordelen van XBRL toegelicht.

73
3 De Semantische Onderneming

opmerkt zijn er, als we N applicaties hebben binnen een bedrijf, N 2 manieren om deze
te verbinden. Dat vereist heel wat aangepaste programmering door talrijke consultants.
Indien alle applicaties in XML zouden zijn, dan zou men gebruik kunnen maken van een
transformeertaal zoals XSLT die als lijm dienst doet tussen de applicaties. Het probleem
is dat dit dan nog steeds een N 2 probleem betreft. Immers, voor elk paar applicaties
moet er voor elke manier waarop ze verbonden willen zijn een XML naar XML brug
worden gecreëerd. XML files van twee verschillende applicaties kunnen niet zomaar
samengevoegd worden. Als men een query uitvoert op een XML document en men voegt
een aantal beperkingen toe van een ander document, dan kunnen deze twee queries niet
zomaar samengevoegd worden. Vandaar dat er nood is aan interoperabiliteit. Database
systemen zijn compatibel omdat ze een consistent relationeel data model hebben. Door
ongestructureerde data ook een dergelijk consistent model te laten adopteren kan het
genieten van dezelfde voordelen als relationele data. Op het Semantisch Web zorgt RDF
voor dit model. Wanneer twee bronnen in RDF samengevoegd worden, dan schakelt men
de verschillende bestanden in één groot bestand. Al de relationele database ideeën werken
— bijvoorbeeld joins en views. Wanneer alle informatie van elke applicatie geconverteerd
of uitgebracht wordt in RDF, dan kan eendere welke query uitgevoerd worden over eender
welke selectie van data. Het N 2 probleem verdwijnt omdat wijzingen nu lineair zijn
geworden: nieuwe RDF applicaties leveren en gebruiken informatie zonder de rest van
het systeem te verstoren.

Semantische Web technologieën kunnen met andere woorden informatie helpen bevrijden
door het ondersteunen van “externe integratie”, het vermogen informatie te binden
en kennis direct uit ongestructureerde bronnen halen door gebruik te maken van de
logische structuren van natuurlijke taal. De technieken om dit te bewerkstelligen worden
hieronder beschreven. Vooreerst herhalen we nog een aantal tekortkomingen van huidige
benaderingen, de rol van RDF, SPARQL, ontologieën en de Linked Open Data cloud, in
termen van de onderneming, vooraleer we het gaan hebben over extractiemethoden, door
bijvoorbeeld documenten – (on)gestructureerd of semi-gestructureerd, op het web of in
de onderneming – te transformeren naar RDF.

Tekortkomingen traditionele en conventionele benaderingen Huidige talen en tech-


nologieën voor het opslaan en beheren van data, zij het XML- of RDBMS-gebaseerd,
leggen de structuur van data vast in een syntaxis. Bij een RDBMS is dat met behulp
van relationele data in tabel vorm, alwaar relaties worden gelegd op basis van primary
en foreign keys, bij XML is dat op basis van een XSD schema die een boomstructuur
vastlegt. Vandaar, als men de formaten van deze data in silo’s met elkaar wenst te
verzoenen, dan is dit moeilijk om de verschillende attributen van verscheidene schema’s
te mappen. Het is niet zo dat alleen de betekenis van het data element mist, wat een
absolute vereiste is voor de automatische interpretatie van data (1). Het inherente
probleem is dus dat er bij bestaande methodes om toegang te krijgen tot gestructureerde
data, deze intrinsiek gekoppeld zijn met de technologische keuze op het niveau van de
fysieke gegevens. Bijvoorbeeld, SQL wordt gebruikt om relationele databases te manipu-

74
3 De Semantische Onderneming

leren. Hetzelfde geldt voor XQuery / XPath voor XML. Een tweede observatie is dat
huidige talen en technologie voor informatiebeheer ook de mogelijkheid ontbreken om
aan gevolgtrekking te doen (2). Ten derde zouden we kunnen stellen dat traditionele
integratiemethodes gefaald hebben omdat ondernemingen zelf hun metadata moesten
ontwikkelen en onderhouden om silo’s en onsamenhangende data te integrereren (zie
ook Tabel 4.5) (3). Ten vierde, is er ook nood aan betere manieren om gegevens en
hun relaties te indexeren, op te slaan en te kunnen manipuleren, zeker op de schaal
die ondernemingen vandaag ervaren (4). Deze belangrijke materie wordt vaak vergeten.
Zoals Stonebraker en Hellerstein (2005) opmerken in hun retrospectief overzicht van 35
jaren ontwikkeling in gegevensbanken, werden de eerste post-relationele data modellen
typisch semantische data modellen genoemd, inclusief deze van Smith en Smith (1977)
en Hammer en McLeod (1981).

3.5.1 De rol van RDF


In de visie van het Semantisch Web is data niet in cubes of tabellen, maar in grafen
bestaande uit triples — onderwerp, predicaat, object combinaties. In dit universum van
zelfstandige naamwoorden en werkwoorden, articuleren de werkwoorden de connecties
of relaties tussen zelfstandige naamwoorden. Elk zelfstandig naamwoord verbindt zich
als een knooppunt in een gestructureerd netwerk. Dit netwerk is schaalbaar omdat het
gebaseerd is op een aantal simpele principes, granulariteit en uniformiteit (Bergman,
2009). Een ander belangrijk voordeel van RDF ten opzichte van relationele data is dat
het zelf-beschrijvend is. Het is geen vereiste om kennis te hebben over de traditionele
metadata – schema’s, ja zelfs tabellen – vooraleer de data set te exploreren (Allemang,
2008). Zie vorig hoofdstuk voor een vergelijking tussen een ontologisch model en relationeel
datamodel.

3.5.2 De rol van SPARQL


SPARQL is vergelijkbaar met gekende query talen in de relationele wereld, maar het
kan gefedereerde data query’en over meerdere grafen. Met SPARQL ervaart men minder
obstakels omdat een graaf kan worden geconverteerd in verschillende formaten. De
graafstructuur simplificeert de relaties tussen elementen en ontologieën. Met andere
woorden, legacy data opgeslagen in silo’s kunnen worden blootgesteld als “queryable” in de
vorm van een SPARQL endpoint, indien de legacy data is uitgedrukt in RDF formaat. In
plaats van het aanroepen van een API van een Web Service, kan men nu expliciet queries
schrijven op de gefedereerde data en de output samenvoegen door gebruik te maken van
dezelfde query. Dit zorgt voor een handige manier om bedrijfslogica in te sluiten in de
query, met dewelke men gegevens kan ophalen van gedistribueerde data modellen die
rijk zijn, dynamisch en evolueren. Master Data Management oplossingen worden minder
relevant, want alle data kan in RDF worden getoond, dewelke met SPARQL benaderd
kan worden. In essentie, hoe breder de data set, hoe meer specifiek en relevant de query
resultaten kunnen zijn. SPARQL biedt de mogelijkheid om resultaten te filteren op een
efficiënte manier en helpt vandaar bij het extraheren van meer relevant inzichten.

75
3 De Semantische Onderneming

3.5.3 De rol van ontologieën


Hübner et al (2001) stellen dat ontologieën, algemeen beschouwd, de volgende rollen
spelen:
• Inhoud explicatie: Een ontologie zorgt voor een accurate interpretatie van gegevens
afkomstig van verschillende bronnen door de expliciete definitie van termen en
relaties in de ontologie.

• Query model: In sommige systemen zoals SIMS, wordt de query geformuleerd


gebruik makend van de ontologie als globaal query schema.

• Verificatie: De ontologie verifieert de mappings die gebruikt worden om gegevens te


integreren van verschillende bronnen. Deze mappings kunnen gespecificeerd worden
door gebruikers, of gegenereerd worden door systemen.
Bij data-integratie in de relationele data wereld, moeten mensen per data element de
semantiek uitzoeken en met tijdrovende activiteiten verifiëren of een veld met een specifiek
label wel nuttig is, bijgewerkt is, en gedefinieerd is zoals het label impliceert. Hoewel een
ontologische benadering meer inspanningen vereist dan een traditioneel data-integratie
programma, levert dit schaalvoordelen op, zoals Figuur 3.11 toont. Door de bakens te
verzetten om nieuwe bronnen te integreren, elimineert de ontogische benadering data
silo’s. Het Semantisch Web maakt dat men zelf geen ontologieën moet ontwikkelen,
zolang ze publiek en nuttig zijn. Indien de context echter verschillend is, kan men zelf
een ontologie ontwerpen, maar niets houdt tegen om gelijkenissen over te nemen. In een
ideale wereld deelt men de niet-gevoelige elementen van de bedrijfsspecifieke ontologie –
die consistent zijn met het bedrijfsmodel – in het publieke domein, zodat andere er van
gebruik kunnen maken. Dit hergebruik zorgt ervoor dat economische redenen, zoals tijd
en geld – alomtegenwoordig bij traditionele benaderingen – op die manier ondermijnd
worden.

De ondubbelzinnigheid en mate van detail van ontologieën, zorgt ervoor dat ze makkelijker
te verbinden zijn dan taxonomieën. Niet alleen beschrijven ontologieën relaties tussen
RDF grafen, ze kunnen ook andere metadata en minder formele soorten tags beschrijven
en deze verbinden met de rest. In essentie zorgen ontologieën ervoor data metadata en
grafen georganiseerd zijn. Door het mappen van ontologieën, worden deze verbonden
op het Web. Ontologieën bieden een rijkere, meer geünificeerde metadata basis voor
machine leesbaarheid, interoperabiliteit en menselijke compressie. Figuur 3.12 toont
hoe het inzetten van ontologieën per bedrijfsunit ervoor zorgt dat men lokaal betekenis
kan specifiëren, en hoe een afzonderlijke semantische interoperabiliteit mapping laag
verschillende bedrijfsdomeinen kan verbinden (Rittgen, 2009).

Gedistribueerde data op het Web en de nood om deze gegevens te aggregeren en analyseren,


heeft geleid tot nieuwe data management tools, technieken en filosofieën. Conceptueel
representeren zij de logische volgende stap in de evolutie van data management. Daar
Semantisch Web technologieën verder bouwen op wat er reeds bestaat, kunnen ontologieën

76
3 De Semantische Onderneming

Figuur 3.11: Een ontologische benadering is schaalbaar.

Hoog

Traditioneel
data-integratie
proces
Kost gebruik
gegevensbronnen

Ontologische benadering

Laag

Laag Hoog
Aantal gegevensbronnen

Bron: gebaseerd op PricewaterhouseCoopers (2009), Technology Forecast.

ondernemingen helpen bij de organisatie en het expanderen van de metadata die reeds
aanwezig is. Ontologieën kunnen de drijfveer worden voor collaboratie die nodig is
tussen bedrijfsunits en IT departementen om zo alignment te bereiken. Figuur 3.3
toont dat ontologieën de hoogste mate van expressiviteit vertonen, wat leidt tot een
krachtigere datafederatie capaciteiten. Echter, om ze effectief te gebruiken is er een sterke
betrokkenheid van de bedrijfsunits nodig (PricewaterhouseCoopers, 2009).

3.5.4 De rol van de Linked (Open) Data cloud


In feite gaat Linked Data over vraag en aanbod. Aan de vraagzijde krijgt men toegang
tot de uitgebreide gegevens die men nodig heeft om beslissingen te nemen. Aan de
aanbodzijde, deelt men meer van de interne gegevens met partners, leveranciers en zelfs
met het publiek zodat zij er voordeel uit kunnen halen zij (i.e., Linked Open Data). De
Linked Data aanpak gaat over het confronteren van bestaande data silo’s en het sturen
van information management inspanningen in een andere richting omwille van voordelen
met betrekking tot schaalbaarheid. URI’s zijn fundamenteel voor data federatie. In
essentie is het een onderdeel van de informatie mediëring- of conflictbemiddelingslaag die
ondernemingen moeten creëren om de kloof tussen strategie en uitvoering te overbruggen
(Lacoul, 2009).

Eerder was er sprake van het Linked Open Data (LOD) project. De LOD biedt de
mogelijkheid om het Web of Data te query’en. Inderdaad, wanneer zo’n gigantische
hoeveelheid data beschikbaar en verbonden wordt, genereert dit een netwerkeffect en
voegt het waardevolle informatie toe aan, door de voorziening van additionele context.

77
3 De Semantische Onderneming

Figuur 3.12: Ontologieën zijn de basis van de information mediation laag.

Semantische Services

Semantische Interoperabiliteit
Information mediation

Ontologie Ontologie Ontologie

Metadata Metadata Metadata

Data Data Data

Bedrijfsunit 1 Bedrijfsunit 2 Bedrijfsunit 3

Bron: gebaseerd op Rittgen (2009), Handbook of Ontologies for Business Interaction.

In de LOD-wereld hoeven we ons geen zorgen te maken over toegang. De kracht van
SPARQL kan eender welke URI aanspreken en de query uitvoeren, waardoor mashup
applicaties overbodig worden. Linked Data principes bieden de abstractie laag, waarop
SPARQL zit. Onder meer GoodRelations17 (voor het definiëren van het bedrijf en
haar producten), National Center for Biomedical Ontology (NCBO)18 en oeGov19 (voor
eGovernment) zijn populaire bruikbare publieke ontologieën voor organisaties (Lacoul,
2009).

3.5.5 Het Semantisch Web en cross-enterprise integratie


Ontologieën zijn een gestructureerde benadering voor de confrontatie die bedrijven moeten
aangaan bij de afweging tussen operationele standaarden en operationele flexibiliteit. Ze
vormen een platform voor het creëren van een gedeeld begrip van een formele bedrijfstaal
waar flexibiliteit op lokaal niveau binnen de enterprise aangemoedigd wordt. Evenzo kan
deze formele bedrijfstaal uitgebreid worden naar buiten de firewall, door de gegevens
beschikbaar te maken aan een uitgebreid ecosysteem van leveranciers en partners om
waarde toe te voegen voor klanten. Door expliciet toegang te geven aan de ontologieën
binnen het ecosysteem, kunnen deelnemers een bijdrage leveren door onderscheidende
standpunten aan te kaarten en bijgevolg de inter-organisatorische relaties te laten evolue-
ren op een organische manier. Tegelijkertijd biedt SPARQL de mogelijkheid om toegang

17
GoodRelations is een lichte ontologie voor het annoteren van aanbiedingen op het Web
(http://www.heppnetz.de/projects/goodrelations)
18
Het National Center for Biomedical Ontology (NCBO) is een consortium voor biologen, clinici,
informatici en ontologen (http://bioontology.org)
19
oeGov maakt en publiceert W3C OWL ontologieën voor eGovernment (http://www.oegov.org)

78
3 De Semantische Onderneming

Figuur 3.13: Technieken en hun mate van expressiviteit.

Sterke Ontologieën
semantiek
Taxonomieën
OWL
Enterprise data modellen

Gecontrolleerde Concept mappen


woordenschatten RDF
UML, XML
Thesaurus
Glossaries
XML, XSLT
Word/HTML
Zwakke
semantiek

Mate van bedrijfsunit betrokkenheid

Bron: gebaseerd op Ian Davis (2005).

te krijgen tot de blootgestelde enterprise data stores onder de vorm van ontologieën.
Indien bedrijven hun gegevens blootstellen zoals in de LOD cloud, dan kan elke partner
die bevoegd is deze data eenvoudig query’en met behulp van SPARQL. In plaats van
data peer-to-peer te mappen op allerlei standaarden, kunnen deze gegevens eenvoudig
gemanipuleerd worden op basis van een query tot eender welke standaard die intern nodig
is. Dit is enerzijds nuttig om data bij zijn oorspronkelijke bron te houden in zijn native
formaat, en anderzijds hoeft men alleen maar een subset van gegevens binnen te trekken
– pull in plaats van push – die de gebruikers nodig hebben. Bijvoorbeeld, beschouw het
scenario waar Leverancier A een dagelijks rapport moet delen met Afnemer B om orders
met elkaar te laten overeenstemmen op het einde van elke werkdag. Veronderstel dat
Leverancier A de data aanlevert aan bevoegde Afnemer B in RDF formaat en hem een
SPARQL query aanreikt. Wanneer Afnemer B deze query uitvoert, krijgt ze de data
direct van Leverancier A en extraheert enkel de subset die ze nodig heeft. Nog beter, als
de vereisten morgen veranderen, dan moeten de partners slechts de logica in de query
veranderen (Lacoul, 2009).

Informatie extraheren uit (on)gestructureerde data en tekst Eerder was er sprake van
de transitie naar het Gestructureerde Web. Het pad naar het Gestructureerde Web kan
gebeuren aan de hand van drie verschillende takken. Een eerste tak is door een combinatie
te gebruiken van Information Engineering (IE) technieken om entiteit20 informatie te
extraheren van ongestructureerde tekst of door structuur extractie toe te passen op de
20
Entity Analysis identificeert alle zaken waarover een onderneming gegevens wilt van bijhouden. De
analyse classificeert alle dingen in verschillende soorten entiteiten en onthult hoe ze zich tot elkaar
verhouden. Dit wordt beschreven in het entiteiten model.

79
3 De Semantische Onderneming

Tabel 3.5: Integratiemethoden bij silo’s zijn arbeidsintensief.

Brontype Integratiemethode
Werkbladen schrijf een formule of neem een macro op
Relationele gegevensbanken schrijf SQL joins of gebruik een SQL wizard
Media gegevensbanken query afzonderlijk door middel van een
multimedia gegevensbank engine, indien
beschikbaar
XML content repositories gebruik een query engine voor de koppeling
tussen documenten
Bron: PricewaterhouseCoopers (2009), Technology Forecast.

semi-structuur van een document om de gestructureerde data resource aan te maken voor
dat document. Zoals eerder aangehaald zijn web documenten typisch semi-gestructureerd,
ingebed met tags, metadata en presentatie structuur. Voor ongestructureerde tekst
inhoud worden traditionele informatie extractie technieken toegepast. Maar voor semi-
gestructureerde inhoud kunnen scraping of extractie technieken ingezet worden die zowel
vervaardigd zijn met de hand, als semi-automatisch of automatisch dankzij technieken als
reguliere expressies en patroonherkenning. Van alle varianten is dit de minst ontwikkelde
benadering, maar wel één met mogelijk een grote waarde. Een tweede tak is om direct
gestructureerde data te publiceren als resource, of om toegang aan te bieden op basis
van een web service of Application Programming Interface (API). Dit is momenteel de
basis voor de meeste gestructureerde data resources op het huidige Web.De derde tak is
een complete variant van de andere twee — ervoor zorgen dat de gestructureerde data
resources beschikbaar zijn en interoperabel onder de vorm van Linked Data. Er zijn twee
manieren om dit te bereiken. Eén manier is om de resource rechtstreeks te publiceren
in de vorm van RDF. Vermits de conversie tussen verschillende serialisatie formaten als
RDF/XML, N3, Atom en Turtle relatief eenvoudig is, is het serialisatie formaat niet zo
van belang. De andere manier is minder rechtstreeks en doet beroep op een derde partij
om de niet gestructureerde data te converteren naar RDF21 .

Informatie uit Relationele gegevensbanken Tientallen jaren hebben ondernemingen


data opgeslagen in relationele gegevensbanken, en dit is vandaag nog steeds de dominante
methode omdat ze zeer verfijnd zijn. Opdat het Semantisch Web benaderingen hun volle-
dig potentieel realiseren moeten deze relationele gegevens eveneens ontgrendeld worden.
Het integreren van semantische systemen met relationele data concepten als data types,
unieke identificatie en normalisatie is niet evident. Immers, bij relationele gegevensbanken
is de onderliggende mathematica gebaseerd op relationele of verzamelingenleer. Een unit
informatie binnen het semantisch model wordt altijd gepresenteerd als een graaf, wat
makkelijker kan evolueren. Het semantische model is echter gebaseerd op grafentheorie.
21
Er is een indrukwekkende en groeiende lijst van dataconversie protocollen en tools, waarvan de meeste
verschillende input en output vormen ondersteunen, inclusief RDF en verschillende serialisaties van
RDF. Deze lijst omvat o.a. Virtuoso Sponger, GRDDL, Babel, Triplr etc.

80
3 De Semantische Onderneming

Tools zoals D2RQ, SquirrelRDF en Triplify proberen daar verandering in te brengen.


Eens een ontologie geëxtraheerd werd en gemapt werd op een schema, zijn er twee
mogelijkheden om om te gaan met relationele data in gegevensbanken. Men kan ofwel de
data als triples in een RDF store transformeren, of mapping gebruiken tussen de ontologie
en de fysieke data om data toegang te bemiddelen door semantische queries te vertalen
binnen de fysieke laag. Het is mogelijk om beide benaderingen te accommoderen binnen
één platform, gebaseerd op specifieke overwegingen voor elke gegevensbank. De ontologie
definieert de business terminologie, terwijl de data onderhouden wordt in het Relational
Database Management System (RDBMS). Een nuttige functie van de mogelijkheid om
semantische queries uit te voeren, is dat het een geconsolideerd business model presenteert
over verschillende gegevensbanken en bronnen heen.

In deze sectie werd duidelijk dat Semantisch Web technologieën gekenmerkt worden door
vijf karakteristieken. Het is nuttig om deze karakteristieken hier te herhalen.

• Informatie relateren. Door middel van triples kunnen multidimensionele relaties


tussen data-elementen worden gelegd. Het triple-gebaseerde datamodel kan, maar
hoeft niet opgebouwd zijn met een schema. Dit maakt dat het datamodel zeer
flexibel is.

• Computationeel redeneren. Semantisch Web technologieën bieden de mogelijk-


heid om logische conclusies te trekken uit bestaande gegevens, door het combineren
van metadata, met een correct weergave van de kennis en concepten binnen de
onderneming.

• Informatie integreren. Semantisch Web technologieën laten toe om informatie


te integreren, afkomstig van verschillende gegevensbronnen en domeinen en dat in
een enkel model te gieten, met behulp van ontologieën.

• Informatie samenvatten. De stapel aan Semantisch Web technologieën omvatten


een declaratieve taal, die het mogelijk maken om abstracte high-level regels toe te
passen voor de precieze ontleding van low-level concepten.

• Informatie manipuleren. De ontologie-gebaseerde querytaal van het Semantisch


Web, stelt eindegebruikers in staat om vragen te stellen over relaties en concepten
in ontologieën. Een query richt zich op het domein en de relaties van entiteiten,
zonder enige verwijzing nodig te hebben hoe de gegevens daadwerkelijk opgeslagen
en georganiseerd zijn op het fysieke niveau.

81
Tabel 3.6: Traditionele versus Ontologie-gebaseerde data-integratie.

Traditionele data-integratie Ontologie-gebaseerde data-integratie


Gegevensstructuur Predominant relationeel: focus op Meer flexibel: focus op relaties
sets van gelijksoortige data tussen dingen, onafhankelijk van
hun gelijksoortigheid
Data-integratie methode Extraheer van originele bron, Link naar bron van data gebruik
transformeer naar lokale data makend van data definities in een
definities, laadt op eigen servers gedeelde ontologie
Data-integratie Elke nieuwe gegevensbron Nieuwe data bronnen zijn
schaalbaarheid expandeert kosten exponentieel toegankelijk tegen minimale kost;
bedrijfsdomeinen delen de federatie
kost
Contextuele rijkheid Beperkt door kosten en personeel Voordelen van het netwerkeffect:
werklast context toegevoegd met nieuwe
gegevens en verbanden
Bron van Intern Intern en extern

3 De Semantische Onderneming
informatievertekening
Betrokkenheid bedrijfsunit Verslag van verzoekers Managers van hun eigen ontologie
en data-linking activiteiten
Standaardisatie Eén standaard, geen uitzonderingen, Laat expliciet gestandaardiseerde
verlies van waardevolle informatie data en contextuele informatie toe
context
Bron: PricewaterhouseCoopers (2009), Technology Forecast.
82
3 De Semantische Onderneming

3.6 Een managementperspectief


Een studie van PricewaterhouseCoopers (2009) merkte op dat er zeer grote leemtes
bestaan tussen de informatie die CEO’s hebben en de informatie die ze nodig hebben,
vooral wat bedrijfsrisico’s en klantennoden betreft. Het zijn echter deze zelfde bestuurders
die zich in een penibele situatie bevinden omdat ze vandaag gedwongen worden tot het
maken van snelle beslissingen (zie Sectie 3.1) . Het is dan ook aan de CIO’s om de
bedrijfsunits te betrekken bij ontologie-gebaseerd beheer van bedrijfsprocessen.

Vooraleer we het over bedrijfsecosystemen en een flexibele informatie-architectuur hebben,


beschouwen we vooreerst hoe ontologieën ingezet kunnen worden voor kennisbeheer en
Business Intelligence.

3.6.1 Business Intelligence en kennisbeheer


De noties van het Semantisch Web toepassen op het niveau van Business Intelligence
brengt een aantal nieuwe overwegingen met zich mee. Enerzijds, verspreide gegevens
kunnen worden samengebracht in een mashup22 die elke keer wordt bijgewerkt wanneer
men een nieuwe data store toevoegt of verwijdert. Andere data in de mashup wordt
ververst wanneer de originele bronnen worden bijgewerkt. Hoe breder een data set, hoe
specifieker en relevanter query resultaten kunnen zijn. SPARQL biedt, een nieuwe manier
om informatie te filteren, en dus meer relevante inzichten te extraheren. Het query’en van
gedistribueerde data, zorgt ervoor dat organisaties worden blootgesteld aan een rijkdom
die verschillend is aan de rijkdom van traditionele data warehouses. Ontologieën bieden
een manier om de verschillende BI-methoden samen te steken, en gegevensbronnen die
zich in silo’s bevinden ,samen te voegen. Terwijl conventionele metadata-inspaningen
een centrale oplossing aanwenden om verschillen te doen overeenstemmen, gaat een
ontologische benadering gegevens intern blootstellen opdat gebruikers de bevoegdheid
krijgen om gegevens van het eigen departement te koppelen en toe te voegen. Figuur 3.10
toont het federatie voordeel van SPARQL. SPARQL engines query’en over verschillende
data bronnen heen, zodat samenvoegen mogelijk wordt via de point-and-click capaciteit
van grafische tools (PricewaterhouseCoopers, 2009).

Ondernemingen moeten controle hebben over een aantal gegevens, maar niet alle gegevens.
Veel bedrijven hebben geleerd dat het opslaan van gegevens – data warehousing – niet de
schaal van alle bedrijfsgegevens omvat. Nochtans, data warehousing is een probleem dat
aandacht verdient, maar een deel van het antwoord is niet te kijken naar het warehouse
voor alle gegevensbehoeften. PricewaterhouseCoopers (2009) raadt aan om het data
warehouse te limiteren tot transactie systemen en voor problemen die zware investeringen
vereisen.

Iets anders is dat ondernemingen de meeste beschikbare gegevens niet op de beste


22
Een mashup is een Webapplicatie die data of functionaliteit combineert van twee of meerdere bronnen
om een nieuwe dienst te creëren.

83
3 De Semantische Onderneming

Figuur 3.14: SPARQL federatie voordeel.

Query: Toon de vijf top artiesten volgens omzet per optreden,


inclusief agentschap, omzet, een foto en de biografie van elk

Toon omzet
Toon 1 Excel werkblad Artiest foto's
Toon 2 Afbeeldingen Artiest 1
Toon 3 Artiest 2
Toon 4 Artiest 3
Toon 5 Artiest 4
RDBMS XML
Artiest 5

Artiest omzet
Artiest 1 Artiest met Webites
Artiest 2 Artiest 1
Artiest 3 Artiest 2
Artiest 4 Artiest 3
Artiest 5 Artiest 4
Artiest 5

Bron: gebaseerd op Semantic Discovery System (2009).

manier gebruiken. Bij transactionele systemen focust men te vaak op de interne, gestruc-
tureerde data. Zoals Figuur 3.15 toont, zijn drie van de vier kwadranten onderbenut.
Ondernemingen hebben in het verleden data-integratie benaderd als een technische uit-
daging, wat de taak bemoeilijkt. PricewaterhouseCoopers (2009) schrijft hierover dat
“For years, enterprises have been using the IT equivalent of watchmakers to manage their
data, people who have been focused on the closeness of fit of one part with another.
They should have been using mapmakers, too.” Dit is precies de reden waarom managers
moeten klagen omdat ze niet genoeg relevante informatie hebben om goede beslissingen
te nemen.

Figuur 3.15: Informatiebronnen voor de onderneming.


O

Diep (dynamisch) Derden


nd

Webbronnen Industrie analyses


er

Extern
be
nu
tte
da
ta
ac
tiv
a

Traditionele business Traditioneel kennis-


intelligence beheer
Intern Dagelijkse verkopen Vrijgeven producten
Rapporten Performantie
Werkbladen

Gestructureerd Minder gestructureerd

Bron: PricewaterhouseCoopers (2009), Technology Forecast.

84
3 De Semantische Onderneming

3.6.2 Beheren van bedrijfsecosystemen met ontologieën


Ontologieën zijn een gestructureerde benadering, die bedrijven blootstellen aan de keuze
tussen operationele standaarden en operationele flexibiliteit. Ze worden het platform voor
het creëren van een gedeeld begrip van de formele bedrijfstaal in de onderneming, waar
flexibiliteit op het lokale niveau wordt aangemoedigd. De waarde van ontologieën reikt
echter verder dan de onderneming. Er zijn maar weinig grote bedrijven vandaag de dag
die de gehele verticale stack voor hun eindproduct of dienst organiseren en controleren.
De meeste werken namelijk binnen uitgebreide ecosystemen, en werken met leveranciers
en zakelijke partners om waarde te produceren voor klanten. Het ecosysteem kan op
twee manieren profiteren van het ontwikkelen van een gedeelde ontologie. Ten eerste, het
verhoogt de efficiëntie voor de deelnemers door onduidelijkheden in de terminologie te
verminderen en de procesbeheer tussen ondernemingen. In de tweede plaats staat het
individuele deelnemers toe expliciet te definiëren in welke elementen van het ecosysteem
zij waarde kunnen creëren. De focus ligt op concepten en informatie gedeeld tussen
de participanten in het ecosysteem. In essentie gaat het erom dat bedrijfspartners en
concurrenten ontologieën gebruiken, om de wendbaarheid te verbeteren in zowel interne
operaties en ook op een manier zodat ze hun operaties kunnen integreren met elkander.

3.6.3 Een meer flexibele Informatie Architectuur


BI-oplossingen van vandaag werden ontwikkeld voor slechts een kleine hoeveelheid infor-
matie die ondernemingen nodig hebben. Ze werden niet ontwikkeld met de bedoeling
om informatie te herbruiken in combinatie met andere interne en externe informatie.
Bijgevolg kunnen traditionele informatiesystemen niet overweg met de vele en verschil-
lende gestructureerde en ongestructureerde bronnen. Daar het nut van eender welke
bron na verloop van tijd verandert – zelfs als men alle data kan integreren waarvan
men dacht dat deze nuttig was – kunnen er nog vele andere gegevens zijn die gebruikers
vereisen. Er is dus nood aan een veel flexibelere architectuur om aan de bedrijfsnoden
te kunnen voldoen. Een ontologie-gebaseerde benadering kan CIO’s helpen door een
flexible en wendbare informatie architectuur te bieden die zowel waarde ontsluit van
huidige informatiesystemen als uitbreidt naar de rijkdom van externe informatie (zie
Figuur 3.16). Ontologieën zijn een manier om silo’s te vermijden en toegang te bieden
tot contextuele informatie. Dit leidt tot betere besluitvorming (zie Figuur 3.17).

CIO’s moeten niet het doel hebben om één monolithisch systeem creëren. Immers,
dit zou een kostelijke en tijdrovende zaak zijn, voor iets waarvan de toegevoegde waarde
nog niet volledig bekend is. In plaats daarvan dienen CIO’s volgens PricewaterhouseCoop-
ers (2009) een information mediation layer te creëren die medewerkers toelaat om what-if
scenario’s te verkennen, en interne- en externe inzichten te verwerven. Een information
medation layer orchestreert informatie van verschillende bronnen voor verkennende ana-
lyse, in plaats van het ontdekken van een onveranderlijke single source of truth. CIO’s
dienen een raamwerk bouwen dat on the fly kan mappen, zodat dure en tijdrovende
normalisatie activiteiten voor eenmalige of kleinschalige analyses uit den boze zijn.

85
3 De Semantische Onderneming

Figuur 3.16: Interne en externe data-elementen bieden meer context.

RDF wrapper RDF wrapper


Interne data Externe data

Gedeelde ontologie

Volledige context

Betere proces flow

Betere beslissingen

Bron: PricewaterhouseCoopers (2009), Technology Forecast.

3.6.4 Mogelijke ontologie-gebaseerde strategieën


In vorige secties werd duidelijk dat CIO’s hun informatiestrategie moeten herdenken.
PricewaterhouseCoopers (2009) meent daarbij dat een Big Bang strategie onrealistisch
is voor een opkomende technologie. Afhankelijk van de sterkte en zwaktes van een
onderneming, onderscheiden ze twee mutueel exclusieve paden. Beide benaderingen
starten van een gemeenschappelijke basis: het opzetten van een basis bedrijfsontologie
die de relaties tussen de sleutel bedrijfsprocessen en entiteiten capteert.

Uitbreiden bestaande data warehouses en gestructureerde data stores voor de ont-


brekende ontologie dimensie Deze uitbreiding zal de vereiste context bieden voor
gegevens. Deze uitbreiding kan worden afgebouwd in de loop der tijd en kan meer
waarde ontsluiten van data-investeringen die reeds gemaakt zijn. Dit zorgt voor een
samenhang vanuit de kern: een gemeenschappelijke taal voor het beschrijven van relaties
en concepten.

Geef medewerkers de exploratie tools die ze kunnen gebruiken met bestaande interne-
en externe gegevens Deze tools stellen medewerkers in de mogelijkheid om de beste
business cases te vinden en onmiddellijk gebruik te maken van Linked Data technologieën
tegen een lage kost. Dit is gelijkaardig met het bouwen en opereren van een wagen – de
technologie platform en geassocieerde processen – die de medewerkers besturen. In deze
benadering worden applicaties gestuurd op basis van de inzichten rond gegevens.

86
3 De Semantische Onderneming

Figuur 3.17: De waarde van het bedrijfsecosysteem met behulp van gedeelde ecosystemen
.
Gedeelde
Met ontologieën ecosysteem
Volledige context Betere besluitvorming
Bedrijfsecosysteem ontologieën en Linked Data
voor besluitvorming en wendbaarheid
upper ontologies

Zonder ontologieën 1. Onzorgvuldige besluitvorming


P2P gegevens- Gelimiteerde context 2. Complexiteit
Bedrijfsecosysteem Data silo's
uitwisseling voor besluitvorming 3. Afwezige wendbaarheid

Bron: PricewaterhouseCoopers (2009), Technology Forecast.

PricewaterhouseCoopers (2009) stelt verder dat de CIO de inspanning als richtinge-


vend en exploratief moet benaderen, en niet als een project. De CIO is in de beste positie
om de ontologie-gebaseerde concepten te evangeliseren, uitgaande van de kennis van de
core informatiesystemen en de relatie met bedrijfsmedewerkers om hun informatienoden
te begrijpen. Vermits de concepten rond het Semantisch Web, Linked Data en een
ontologie-gebaseerde benadering in het algemeen nog steeds evolueren, wordt de CIO
verwacht om ondersteuning te bieden op verschillende domeinen: consultancies; training
van medewerkers; enterprise architecture modellen; ontologiestructuren. Vandaar moet de
CIO de ontwikkeling van de bedrijfsontologie leiden. De CIO moet sleutelpartijen helpen
om hun subsets te bouwen. Eenmaal op zijn plek, kan dit tot geharmoniseerde modellen
leiden die flexibiliteit en betere besluitvorming bieden (zie Figuur 3.18). Tenslotte moet
de CIO ook bereid zijn voor de ontnuchterende realiteit, dat ondanks haar belofte, de
Linked Data technologieën falen.

Figuur 3.18: De bedrijfslogica waarde van ontologieën .

Met ontologieën Ontologie-


Business planning Geharmoniseerde Betere besluitvorming
gebaseerde
strategy operationele modellen en wendbaarheid
bedrijfslogica

Zonder ontologieën Inconsistente


Business planning 1. Onzorgvuldige besluitvorming
operationele
strategy 2. Complexiteit
modellen
3. Afwezige wendbaarheid

Verschillende
management
interpretaties

Bron: PricewaterhouseCoopers (2009), Technology Forecast.

87
3 De Semantische Onderneming

3.6.5 Bouwen van het informatie raamwerk


Om op een succesvolle manier ontologieën toe te passen op bestaande gegevensstruc-
turen, moeten gegevens consistent zijn. Vaak zijn management information systems
inconsistent, hebben ze verschillende data definities en verschillende of zelfs geen context
voor deze definities. Vandaar is het cruciaal om op MDM-benaderingen te focussen die
gestructureerde gegevens en hun context rationaliseren in bestaande informatiesystemen.
Hoe meer inconsistent interne systemen zijn, hoe moeilijker het wordt om deze gegevens
ontologisch te mappen op externe bronnen. Bijgevolg zijn MDM-inspanningen imperatief
om kosten te reduceren en de effectiviteit van interne systemen te verhogen, maar ook om
met externe bronnen te kunnen werken. Met betrekking tot het informatie raamwerk ter
ondersteuning van ontologie-gebaseerde benaderingen, moet men inzicht krijgen in welke
informatie een contextuele bron hebben, welke een temporele bron hebben, en welke een
masterbron hebben. Het kennen van deze bronnen van autoriteit helpt bij het bepalen
waar het raamwerk rigide moet zijn en waar niet.

3.6.6 Buy-in van de belangrijkste medewerkers


Het voordeel van informatie mediatie is het meest direct op bedrijfsunit niveau, waar
bedrijfsanalisten en andere strategische denkers geboden zijn om ideeën te verkennen.
Door een baseline ontologie beschikbaar te stellen voor de bedrijfsunits en zo de analisten
bij deze ontologie en ontologieën buiten het bedrijf te betrekken, laat toe om via beta tools
de waarde van deze benadering te testen, de ontologie te testen in de context van de reële
wereld en buy-in te verwerven van belangrijke medewerkers om verdere investering aan
te sturen. Het is de taak van de CIO om controle los te laten van de tools gebruikt voor
exploratie. Immers, eindgebruikers moeten in staat zijn om data on the fly te verkennen
en te transformeren. Een heuristiek hierbij is dat de semantische reikwijdte en controle
invers zijn met de afstand: hoe verder informatiebronnen verwijderd zijn, hoe minder
precies ze zullen zijn en hoe meer vrijheid gebruikers nodig hebben om de betekenis te
manipuleren met het doel een precieze context te verkrijgen (PricewaterhouseCoopers,
2009).

3.7 Uitdagingen bij het inzetten van Semantische


Technologieën
Terwijl er verscheidene voordelen verbonden zijn aan het inzetten van semantische
technologie in de onderneming, zijn er alsnog een aantal uitdagingen die hier zullen
worden besproken.

3.7.1 Mismatch semantische- en bestaande data technologie


De rules laag binnen de Semantische “Layer Cake” en SQL zijn beide gebaseerd op de
abstracte logica-gebaseerde taal Datalog23 . OWL en RDF zijn ontworpen om te opereren
23
Datalog is een rule en query taal voor deductieve databases die syntactisch een subset is van Prolog.

88
3 De Semantische Onderneming

op schaal van het Web zonder enige centrale controle. Ze veronderstellen incomplete
gedistribueerde data die niet centraal beheerd wordt en vandaar ook de “open-world
assumption” en “non-unique naming”. Bestaande database technologie opereert in een
compleet gecontrolleerde omgeving, waar het veilig is om unieke namen te gebruiken
en te redeneren met een “closed-world assumption”. Beide paradigma’s bieden dezelfde
resultaten als de feiten gekend zijn en uitgedrukt zijn in een kennisbank. Niettemin,
wanneer het gaat om ontkennende voorwaarden, verschillen resultaten. Bijvoorbeeld,
beschouw de definitie van een “kinderloos echtpaar” als een man en vrouw die geen
kinderen hebben. Het is mogelijk dat kinderen van bepaalde koppels niet werden
opgenomen in de kennisbank. In dit scenario zal de “closed-world” logica simpelweg
aannemen dat wat niet in de kennisbank aanwezig is niet waar is en er dus van uit te gaan
dat alle koppels in feite kinderloos zijn. Uitgaande van dezelfde kennisbank, concludeert
“open-world” logica dat deze koppels kinderloos kunnen zijn (Kuriakose, 2009).

3.7.2 Organisatie mindset, de rol in het overkomen van het


Kip-en-eiprobleem en betrokkenheid
Culturele kwesties zijn een belangrijke reden dat er vaak silo’s bestaan in data-omgevingen.
Aan de ene kant is er behoefte aan compartimentalisatie. Aan de andere kant is er
een steeds dringendere noodzaak voor inter-organisatorische samenwerking. De balans
moet worden verschoven in de richting van samenwerking, maar bedrijven zijn het niet
gewend om gegevens te het delen op de schaal van het Web. Dat is waarom kleine
projecten die het onbenutte potentieel van Web data resources exploreren, en mensen een
gevoel geven van dat potentieel, belangrijk zijn (PricewaterhouseCoopers, 2009). Deze
samenwerking is niet evident omdat mensen afkomstig uit verschillende organisaties vaak
moeten samenwerken aan complexe taken. In zijn proefschrift ontwikkelde Aldo de Moor
(1999) een methode om een legitieme gebruikergestruurde specificatie te odnersteunen.

In Sectie 2.7.5 werd het kip-en-ei probleem besproken, waar er geargumenteerd werd
dat data consumers en providers geprikkeld moeten worden. Om een zogenaamd Web
of Data, Gestructureerd Web of Semantisch Web te realiseren, zullen organisaties zelf
contributies moeten maken. Niet alleen via het toegankelijk maken van data, maar
evenzeer door het expliciet maken de context die nu impliciet aanwezig is in kolommen
en rijen, in cubes, ondoorgrondelijke metadata in glossaries, of webpagina’s. Om deze
context te kunnen delen, zullen organisaties universaliteit moeten uitstralen en uitademen.
Dit is iets dat afwezig is in een gesloten omgeving. Ondernemingen zullen op een meer
gedisciplineerde manier moeten samenwerken. De wendbaarheid van een onderneming
zal daarbij afhangen of ze in staat zijn om de beschreven nieuwe technieken toe te passen
en afscheid te nemen van het silo denken.

Tenslotte zal het succes van een ontologie-gebaseerd beheer van bedrijfsprocessen afhangen
van de betrokkenheid van de bedrijfsunits en de samenwerking met IT — Business/IT
alignment. De medewerkers van de bedrijfsunits zijn de beste mensen om de domeinon-
tologieën te beschrijven; ze zijn er eveneens verantwoordelijk voor. Er is mijns inziens

89
3 De Semantische Onderneming

eveneens nood aan een nieuw profiel: de ontologist. Deze zal als het ware de rol van the-
rapeut invullen die Theo en Hans Mulder (1998) onderscheiden voor een nieuwe generatie
aan methodische werkwijzen, alwaar een goede communicatie in de organisatie centraal
staat, waarbij opdrachtgever en automatiseerder zich richten op de organisatorische
aspecten van het informatiesysteem.

3.7.3 Het belang van de kwaliteit van ontologieën


Ontologische modellen vereisen dat er een sociaal akkoord (commitment) bereikt wordt
over de woorden gebruikt om concepten en relaties te beschrijven in een domein. De ver-
taling van bestaande expertise en kennis in machineleesbare modellen is een foutgevoelige,
handmatige activiteit. In plaats van mensen in te schakelen voor deze modellen, kunnen
ook “machine learning” methodes gebruikt worden om concepten te “leren” van bestaande
documenten en data. In beide gevallen zal de kwaliteit van de modellen bepalen welke
waarde men verkrijgt uit semantische applicaties bij onder andere informatie integratie.

3.7.4 Ontologie creatie in OWL is een steile leercurve


Ontologische modellering brengt met zich mee dat men de verschillende constructen van
kennisrepresentatie moet begrijpen. De grondbeginselen van modelleertalen constructen
zijn geleend van een subset van eerste-orde logica, beter bekend als beschrijvende logica.
Dit kan intimiderend overkomen voor modelleurs, dus moeten nieuwe modelleringsinstru-
menten verbergen de complexiteit door middel van een grafische omgeving aan te bieden
voor het modelleren en logische samenhang te handhaven. Desalniettemin vereist dit nog
enige vaardigheid met betrekking tot de initiële concepten van kennisrepresentatie.

3.7.5 Het afstemmen van meerdere ontologieën is een niet-triviale taak


Een onderneming zal meerdere ontologieën vereisen om de verscheidene producten,
functies, units en informatie categorieën te dekken. Er zal overlapping optreden over
de ontologieën heen, dus het ontdekken ven uitdrukken van deze preciese overlapping
en deze te mappen tussen de verschillende ontologieën binnen een enterprise is absoluut
essentieel. Denk hierbij ook aan change management van gedistribueerde ontologieën
(Klein, 2004), ontologie-evolutie (De Leenheer, 2009).

3.7.6 Nood aan betere visualisatietechnologieën en tools


Het bewerkstelligen van human computer interaction op basis van kennisgebasseerde
gegevensbanken vereist nieuwe technieken voor het visualiseren van de relaties tussen
gegevens. De ontologie en triple-gebaseerde datastore representeert immers massale
informatie grafen. De uitdaging hier is om gebruikers in staat te stellen om te zien wat
relevant is voor hen, in termen van concepten en relaties die informatie uitdrukken op
het juiste niveau van granulariteit. Daarnaast zijn er nieuwe tools nodig die de mysterie
uit de ontologie ontwikkeling wegnemen voor niet-technische profielen.

90
4 Semantic Business Process Management
Op het einde van Hoofdstuk 3 kwam naar voren dat er nood is aan een flexibele informa-
tiearchitectuur voor de ondersteuning van ontologieën. In dit laatste hoofdstuk bekijken
we een geïntegreerde benadering, met name Semantic Business Process Management
(SBPM). Vooraleer we SBPM definiëren, worden de raakvlakken met recente evoluties op
het gebied van Service-Oriented computing aangehaald. Vervolgens worden twee benade-
ringen afgetoetst voor de ultieme visie van het koppelen van geautomiseerde systemen: een
eerste aanpak die een beschrijving van de organisatie en haar informatiesysteem weergeeft,
waarbij de semantiek top-down wordt toegepast, en een tweede benadering waarbij we
bottom-up vanuit procesmodellen vertrekken. In het opzicht van bedrijfsprocesmodellen
wordt een gevalstudie uitgewerkt, waar de UML-artefacten (Kruchten, 1998) van een
prijsbeheer-proces worden vertaald naar OWL. Aansluitend wordt de ontologie-omgeving,
vertrekkende vanuit een procesgebaseerde aanpak, theoretisch onderbouwd.

4.1 Service-Oriented Computing


In het begin werden Services voorgesteld in termen van Web Services, op basis van SOAP,
WSDL en UDDI. Na verloop van tijd stelden verscheidene auteurs dat Services ook
geïmplementeerd konden worden zonder specifieke talen te gebruiken. Zij argumenteerden
dat zelfs legacy functies of objecten als Services konden worden aangeboden, door middel
van het schrijven van een wrapper. Op die manier werd de term Service een breed
begrip. In deze betekenis refereert een Service dan aan een technologie-onafhankelijke
module. Andere auteurs definiëren Services als een concept op bedrijfsniveau in plaats
van technisch niveau. Bijgevolg is het vaak onduidelijk en vaag wat een Service exact
betekent. Hierdoor bekritiseren sommigen het acroniem Service-Oriented Architecturen
omdat zij menen dat de term “service” arbitrair en misleidend is. Zij zeggen dat wat
hevig gecommuniceerd wordt door de IT industrie als SOA; in essentie een “semantically
enabled architecture” is. In termen van informatiearchitectuur verwijzen SOA modellen
duidelijk naar het openen van grenzen, niet alleen in termen van domeinkennis, maar
ook in termen van organisatorische structuren en processen. Dit is zeker relevant in een
wereld waar outsourcing steeds belangrijker wordt en waar toevoerketens in toenemende
mate moeten openstaan voor externe collaboratie. Toch worden Services gekenmerkt door
een aantal karakteristieken: geaggregeerde constructen, hoge granulariteit, losgekoppeld
en afzonderlijke eenheden die kunnen worden ingezet (Mannaert en Verelst, 2009). In
deze scriptie hanteren we de definitie van het W3C:

91
4 Semantic Business Process Management

“A Web service is a software system designed to support interoperable


machine-to-machine interaction over a network. It has an interface described
in a machine-processable format (specifically WSDL). Other systems interact
with the Web service in a manner prescribed by its description using SOAP-
messages, typically conveyed using HTTP with an XML serialization in
conjunction with other Web-related standards. (W3C, 2004)”

Ook op het gebied van het Semantisch Web is er een insteek naar services toe. Daar
Service-Oriented Computing steeds belangrijker werd voor het ontwikkelen van gedis-
tribueerde systemen, voelde de Semantisch Web community de hete adem van vele
concurrerende benaderingen en werd het minder evident om het hele verhaal te onder-
steunen. Verscheidene hebben gepubliceerd over de relatie tussen SOA en Semantisch
Web (Brambilla, Ceri en Valle, 2007). In wat volgt gaan we dieper in op Semantic Web
Services (SWS).

4.1.1 Semantic Web Services


Web Services omvatten een interface van een applicatiecomponent, dat toegankelijk is via
standaard protocollen en waarbij wordt gecommuniceerd aan de hand van XML, zonder
menselijke tussenkomst. Onder Semantic Web Services (SWS) verstaan we Web Services
die kunnen worden verrijkt door naast hun zuivere syntactische interface beschrijving
ook semantische inhoud beschikbaar stellen voor Discovery, Selection, Invocation en haar
Compositie met diverse andere aspecten. Semantische services zijn een component van het
Semantisch Web, omdat ze opmaaktaal gebruiken om machineleesbare gegevens op een
gedetailleerde en gesofisticeerde manier beschikbaar te maken, zodat er een voortgedreven
automatisering ontstaat (Cardoso en Sheth, 2006).

De algemene XML standaarden voor interoperatie van Web Services specificeren slechts
de syntactische interoperabiliteit, en niet de inhoudelijke semantische betekenis van de
berichten. Bijvoorbeeld, Web Services Description Language (WSDL), kunnen wel de
beschikbare operaties van de ontvangen en verzonden gegevens specificeren, maar kunnen
niet de semantische betekenis of constraints van de gegevens bepalen. Op die manier is
er niet te achterwalen wat er in het echt gebeurt bij het uitvoeren van een dienst. Dit
maakt automatische Web Service compositie moeilijk, waardoor ontwikkelaars vereist
om specifieke overeenkomsten te bereiken over de interactie van Web Services. Daar-
entegen, Semantische Web Services zijn opgebouwd rond universele standaarden voor
het uitwisselen van semantische gegevens, wat het ontwikkelaars gemakkelijker maakt
om gegevens te combineren van verschillende bronnen en diensten zonder betekenis te
verliezen. Webdiensten kunnen dan achter de schermen geactiveerd worden om een meer
gesofisticeerde antwoord te bieden dan voorheen op een manuele manier (Cardoso en
Sheth, 2006).

92
4 Semantic Business Process Management

Bastiaansen en Vrijkorte (2006) introduceerden een raamwerk voor het eenduidig be-
schrijven van diensten, waarbij er criteria werden afgeleid voor Semantic Web Services
methoden die in menig wetenschappelijke artikelen worden gepubliceerd. De auteurs
beoordelen met behulp van het raamwerk voor drie zulke methoden, met name OWL-S,
WSMO en SWSF, in welke mate ze geschikt zijn voor het daadwerkelijk automatisch
koppelen van webdiensten of bedrijfssoftware. Het raamwerk onderscheid daarbij twee
viewpoints, namelijk een structuurperspectief en een procesperspectief. Het structuur-
perspectief geeft weer wat een dienst in feite is, en wat moet worden beschreven in een
ontologie. Dit is uiteindelijk terug te voeren tot drie kernaspecten: het vastleggen van het
berichtenverkeer, de te realiseren service level agreements en de effecten van het uitvoeren
van de dienst. Het procesperspectief eist dat het mogelijk moet zijn diensten te vinden
en deze vervolgens af te kunnen nemen. Het zoeken gebeurt op basis van een beschrijving
van een gewenste wereld transformatie. Met andere woorden, zoekt een dienst door
een logische expressie te formuleren die waar moet zijn nadat de dienst is uitgevoerd.
Op deze manier zoekt een afnemer naar een dienst die een bepaald doel voor hem kan
bereiken. Parameterverfijning is daarbij een essentieel onderdeel. Tabel 4.1 toont de
toepasbaarheid van het raamwerk aan de hand van een objectieve vergelijking van de
methoden waaruit blijkt wat er met de huidige stand van de technologie wel en niet
mogelijk is. Toepassing van het raamwerk laat zien dat bestaande methoden ontoereikend
zijn om informatiesystemen automatisch te koppelen. Vooral het vinden van diensten
is niet precies genoeg en het is onduidelijk hoe uit een abstracte dienstbeschrijving een
concrete webservice-aanroep kan worden gegenereerd.

93
Tabel 4.1: Evaluatie van Semantic Web Services methoden.

criterium OWL-S WSMO SWSF


representatie van ja, enkelvoudige diensten aan de ja, diensten worden beschreven ja, enkelvoudige diensten aan de
bedrijfsprocessen hand van pre- en postcondities, op basis van pre- en hand van pre- en postcondities;
composities, d.m.v. een postcondities composities d.m.v. een
procesmodel procesmodel
representatie van niet in methode niet in methode niet in methode
Service Level
Agreements

4 Semantic Business Process Management


berichtenverkeer ja, maar slechts één input- en ja, ieder interactiepatroon is ja, met procesmodel bij
outputmessage per service mogelijk compositie van diensten
discovery discoverymethode gebaseerd op diverse voorstellen, nog geen beperkt, discovery op basis van
statisch objectcentrisch definitieve keuze; niet op basis centraal gedefinieerde doelen die
wereldbeeld van de transformatie van de een service kan bereiken
wereld
parameterverfijning niet in methode niet in methode niet in methode
Bron: Bastiaansen en Vrijkorte (2006), Raamwerk voor semantiek in webservices.
94
4 Semantic Business Process Management

4.1.2 Mediatie bij Web Services


Het concept van de informatie mediatie laag kan ook worden toegepast op het niveau van
Web Services. Burlat, Izza en Vincent (2005) introduceren een geünificeerd raamwerk voor
semantiek en ontologieën bij enterprise integratie. Het nuttige en generieke semantische
integratie workflow legt wel de nadruk op Web Services, maar is toepasbaar op semantiek
in het algemeen. Figuur 4.1 geeft deze workflow schematisch weer.

Figuur 4.1: Generieke Semantische Integratie Workflow.


WSs Service beschrijving
Annotaties Semantische 2
(DSD, FDS, BSD)
beschrijving
1 (Beschrijf)
3
Semantische Service Profiel
publicatie
(Publliceer)

6 Privaat Ontologieën
Register
WSs gevonden

WS template
5 Semantische
discovery
(Gevonden)

WSs om uit te voeren


Query 9
Semantische Executie Service
integratie (Integreer) (Bind)
4

7
WSs om te mediëren

Semantische
mediëring
(Gevonden)

8 WSs gemedieerd
Kennisbank
(Feiten, Rules)
10 WSs om te invokeren, resultaten om te vertalen

Bron: gebaseerd op Burlat, Izza en Vincent (2005), A Unified Framework for Enterprise Integration: An
Ontology-Driven Service-Oriented Approach.

Voor bestaande gegevens begint de workflow met informatie-extractie of annotatie van


semantiek, in overeenstemming met een referentie ontologie. Nieuwe gevonden informatie
moet eveneens worden geïntegreerd. Echter, in sommige gevallen beschikken externe
diensten over hun eigen ontologieën, wat betekent dat er mediëring nodig is. Vermits dit
een generieke workflow is, zijn er afhankelijk van de interoperatie taak, verschillende flows
en stappen vereist. Een alternatieve benadering is die van Cardoso en Sheth (2006). Daar
de algemene workflow met andere woorden kan variëren afhankelijk van de invalshoek, is
het modelleren van dergelijke workflows primordiaal onderzoek.

95
4 Semantic Business Process Management

4.2 Semantic Business Process Management


In wat volgt wordt de oorspronkelijke visie van Semantic Business Process Management
uitvoerig besproken, zoals die beschreven werd door Bussler, Domingue, Fensel, Hepp,
Leymann en Wahler (2005). De structuur en opbouw van dit werk wordt gedeeltelijk
overgenomen.

Business Process Management (BPM) is de benadering die de uitvoering van IT-


ondersteunde bedrijfsprocessen beheert vanuit het opzicht van de bedrijfsexpert, in
tegenstelling tot een technisch perspectief (Object Management Group, 2005). Echter, de
graad van mechanisatie in BPM is nog steeds zeer beperkt, waardoor er inertie ontstaat
in de vereiste evolutie en dynamiek van bedrijfsprocessen. Bovendien biedt BPM geen
uniforme representatie van een organisatie haar processen op een semantisch niveau, wat
een vereiste is om intelligente queries te kunnen doen. Met andere woorden, bedrijven
hebben incomplete kennis en zeer incomplete en “vertraagde” controle over hun processen.
Deze vaststellingen worden in deze sectie verder uitgediept met aanvullende relevante
publicaties.

4.2.1 Motivatie
De initiële motivatie voor het gebruik van IT in bedrijfskunde is het automatiseren van
operaties. Begin de jaren negentig introduceerde Hammer de term “Business Process
Reengineering”, wat bedrijfsprocessen in het centrum van de belangstelling plaatste.
Nochtans, de populariteit van Business Process Reengineering heet niet het onderlig-
gende sequentiële paradigma van (1) het uitgebreid analyseren van de huidige status,
(2) het meegeven van de beschrijving van een verbeterde toestand en (3) het wijzigen
van bestaande systemen volgens het ingenieursdenken om de nodige veranderingen te
implementeren. Dit strikt sequentiële model van IT ontwerp in ondernemingen heeft
echter tot enorme problemen geleid omdat organisaties voortdurend veranderen, wat
betekent dat elke vereistenanalyse bij wijze van spreke verouderd is terwijl men nog
aan de implementatie werkt. Hoe langer een cyclus duurt, hoe groter dit probleem
wordt. Bijkomstig stellen Hepp en Roman (2007) dat deze workflow-centrische kijk
op bedrijfsprocessen zich reflecteert in modelleertalen, in het bijzonder BPEL, door
de focus op control flow patronen. Recent werden de zwakheden van het gebruik van
uitsluitend een workflow-centrische representatie blootgelegd door Pesic en van der Aalst
(2006). Een andere benadering is die van de enterprise ontology, zoals die van Dietz
(2006). Echter, de procesmodellen die hier worden gehanteerd zijn niet toepasbaar voor
productiesystemen. Bijgevolg zijn workflow-centrische procesrepresentaties en enterprise
ontology benaderingen sterk ontkoppeld. Dit zorgt volgens Hepp en Roman (2007) voor
twee tekortkomingen. Ten eerste zijn workflow-centrische procesrepresentaties niet erg
geschikt voor het toegankelijk maken van de procesruimte op kennisniveau (e.g., voor
het vinden van processen of procesfragmenten voor het bereiken van een bepaald doel).
Ten tweede kunnen modellen gecreëerd door de “enterprise ontology” gemeenschap niet
gebruikt worden in bestaande, workflow-centrische BPM-tools en -infrastructuur. Nopens

96
4 Semantic Business Process Management

het combineren van een omvangrijk conceptueel model van de onderneming met de
feitelijke productiesystemen en de uitvoerbare workflows, menen Hepp en Roman (2007)
verder dat de ARIS methodologie (Scheer, 1998) en de respectievelijke tools een stap
voorwaarts zijn. ARIS incorporeert niet alleen het controle flow perspectief, maar ook de
organisationele gegevens en de functionele dimensie van ondernemingen (Scheer, 1998).
Hoewel ARIS gebaseerd is op een omvangrijk conceptueel raamwerk draagt het twee
zwakheden met zich mee: (1) de expressiviteit en de formaliteitsgraad in de verschillende
modellen is eerder beperkt en (2) de verbanden tussen de verschillende modellen zijn zeer
zwak. Bijgevolg limiteert dit de automatiseringsgraad in ARIS-gebaseerde BPM. Ook
het query’en van de procesruimte op basis van logische expressies en machine reasoning
behoort niet tot de mogelijkheid.

Opdat bedrijven overleven in een dynamische omgeving, moeten ze competitief zijn


in tenminste drie dimensies (zie Figuur 4.2): kost per proces executie (y-as), kost van de
setup in een proces (z-as) en vertraging in de setup van een proces (x-as). Met andere
woorden, bedrijven moeten efficiënt zijn (lage kost per transactie in de operationele stage),
wendbaar (weinig vertraging in het opzetten van nieuwe of gewijzigde processen) en in
staat zijn om hun processen te doen evolueren in kleine iteraties gebaseerd op lage kosten
voor het opzetten van nieuwe of gemodificeerde processen. Zulke ondernemingen die
beantwoorden aan deze vereisten functioneren goed en bevinden zich binnen de stippellijn
kubus van de figuur. Omgekeerd, als de kosten per transactie te hoog liggen is er te
weinig efficiëntie (ruimte boven kubus); als het te lang duurt om een nieuwe proces op te
zetten is er te weinig wendbaarheid (ruimte rechts van de kubus) en als de kost voor het
opzetten van een nieuw proces te hoog is, dan is de organisatie niet in staat om processen
op te zetten voor of kleine verbeteringen (ruimte onder de kubus).

Figuur 4.2: De drie dimensies van de performantie van een onderneming bekeken vanuit
een proces.
Gebrek aan efficiëntie
Kost van proces executie

Gebrek aan Evolutionaire


s
o ce Granulariteit
pr
p
tu
se
an
tv Gebrek aan wendbaarheid
Kos

Vertraging van proces setup

Bron: Bussler, Domingue, Fensel, Hepp, Leymann en Wahler (2005), Semantic Business Process Manage-
ment: A Vision Towards Using Semantic Web Services for Business Process Management.

97
4 Semantic Business Process Management

Hoewel een significant deel van de procesuitvoering reeds opgeslagen is in computersys-


temen, vraagt het query’en en manipuleren van een proces regelmatig interventie van
arbeidskrachten tussen (1) het bedrijfsperspectief op de operaties en (2) de effectieve
uitvoering van operaties op IT systemen (Object Management Group, 2005). Figuur 4.3
toont deze kloof tussen IT en business. De bovenste triangel toont het perspectief van de
bedrijfsdeskundigen, terwijl de lagere triangel de effectieve implementatie representeert.
De transitie tussen deze twee sferen is haast onbestaande, vermits er geen geautomati-
seerde onderlinge mediëring bestaat. Met andere woorden, het fundamentele probleem is
dat het oversteken van de ene sfeer naar de andere veel manuele arbeid vereist in één van
de twee dimensies. Dit leidt tot de situatie dat bedrijfsproces gerelateerde activiteiten,
naast de weelderige IT, verrassend veel manuele arbeid vereist en dus traag, kostelijk
en imperfect is. Business Process Management (BPM) heeft geprobeerd deze kloof te
dichten. BPM biedt tools en technieken aan om operaties te modelleren, te beheren en
te monitoren op bedrijfsproces niveau, terwijl men dit high-level perspectief probeert
automatisch te mappen op de eigenlijke implementatie die uitgevoerd wordt op een
multipliceit aan systemen. Echter, de huidige implementatie lost de beperking niet op
dat het bedrijfsproces in de organisatie niet toegankelijk is op semantisch niveau, vooral
omdat bedrijfsproces modelleertalen zoals BPEL ontoereikend zijn om zulk universum
van discussie te representeren. Bussler, Domingue, Fensel, Hepp, Leymann en Wahler
(2005) menen dan ook dat Business Process Management slechts zijn potentieel volledig
kan realiseren indien het volledige mechanisatie ondersteunt voor het overbruggen van de
IT/proces kloof. Het doel van Semantische Web Services is om de discovery en compositie
van Web Services te mechaniseren en om een manier aan te bieden voor de representatie
van uitvoerbare artefacten die toegankelijk zijn voor intelligente queries en machine
reasoning.

Figuur 4.3: De bi-directionele IT / proces kloof.


Bedrijfsexperten-perspectief: Processen

Het query'en Procesimplementatie


van de procesruimte Manuele Arbeid

IT Implementatieperspectief

Bron: Bussler, Domingue, Fensel, Hepp, Leymann en Wahler (2005), Semantic Business Process Manage-
ment: A Vision Towards Using Semantic Web Services for Business Process Management.

98
4 Semantic Business Process Management

4.2.2 Benadering
SBPM (Semantic Business Process Management) wil door het combineren van SWS en
BPM een geconsolideerde technologie ontwikkelen. Bussler, Domingue, Fensel, Hepp,
Leymann en Wahler (2005) nemen hierbij de volgende punten in acht:

1. Representeer en geef een semantische beschrijving van elk atomair en samengesteld


proces binnen een organisatie als een SWS in een proces repository;

2. Beschouw het complete IT landschap (e.g., hardware, OS, apparatuur) in de vorm


van een ontologie;

3. Verzamel domeinkennis (e.g., technische beperkingen, business rules) en sla het op


in de vorm van axioma’s in een rule taal;

4. map transactionele gegevens van verschillende gegevens (e.g., ERP) op een instance
store;

5. druk queries uit in een ontologie-querytaal;

6. modelleer de noden van deskundigen als WSMO doelen en

7. gebruik SWS executie omgeving voor de mediëring van bedrijfsdoelstellingen en


queries en het feitelijke proces.

Beide oplossingen zijn met andere woorden kosteninefficiënt en tijdrovend met betrekking
tot onderhoud en beheer. Het is van deze redenering dat er stemmen opgaan om
Semantische Web Services (SWS) te combineren met Business Process Management
(BPM) om één geconsolideerde technologie te creëren. Dit is gebaseerd op het feit dat de
mechanisatie van BPM kan geadresseerd worden op basis van machineleesbare semantiek,
dat beschikbaar is onder de vorm vand SWS raamwerken (e.g., WSMO). SBPM is
echter niet de eerste benadering die SWS combineert met het beheer van enterprise IT
landschappen; ook Oberle (2006) heeft hier op een vergelijkbare manier onderzoek naar
gedaan, maar deze benadering wordt verder niet meer beschouwd.

4.2.3 Gebruiksscenario’s
Bussler, Domingue, Fensel, Hepp, Leymann en Wahler (2005) stellen dat alle soorten
beheerstaken gerelateerd aan de procesruimte van een organisatie, kunnen teruggevoerd
worden tot twee fundamentele gebruiken, i.e. ofwel het query’ren of het manipuleren van
deze ruimte (zie Figuur 4.4).

Het query’en van de procesruimte In Management Science is besluitvorming een be-


langrijke discipline en de uitdaging om tot goede besluitvorming te komen is toegang
tot alle vereiste informatie. Dit lijkt triviaal, maar toont het belang van het query’en
van de procesruimte aan. Queries kunnen tijdkritisch zijn om relevante activiteiten te

99
4 Semantic Business Process Management

Figuur 4.4: Semantic Business Process Management.


Bedrijfsexperten-perspectief: Processen

SBPM Scope

Procesimplementatie
van de procesruimte
Machine-toegankelijke Representatie van
Het query'en

de Vereisten van Bedrijfsdeskundigen

Machine-toegankelijke Representatie
gebaseerd op Machine Reasoning
Machine-toegankelijke Representatie van
Processen, Procesfragmenten en IT-infrastructuur
onder de vorm van Semantic Web Services

IT Implementatieperspectief

Bron: Bussler, Domingue, Fensel, Hepp, Leymann en Wahler (2005), Semantic Business Process Manage-
ment: A Vision Towards Using Semantic Web Services for Business Process Management.

identificeren om te voldoen aan financiële of milieuvoorschriften, of in noodsituaties. Het


is duidelijk dat zulke types van queries niet ondersteund kunnen worden door syntactische
processtandaarden of simpele databanken, maar dat volwaardige kennisrepresentatie-
technieken nodig zijn. Een voor de hand liggende reden voor deze vereiste, is dat een
groot deel van deze feiten om queries te beantwoorden impliciete informatie is. Om zulke
antwoorden te kunnen geven op queries die de ganse procesruimte omvatten, vereist:

1. een machineleesbare representatie van alle relevante feiten (concepten, instanties


en axioma’s) op de implementatie- en uitvoeringsniveaus en

2. een machineleesbare representatie van deze queries.

Op het eerste zicht lijkt dit het louter “ontologiseren” van de procesruimte. Echter,
een belangrijk type van queries zijn in de vorm van “kunnen we een proces opzetten
(composition / enactment) dat xyz doet?”. Dit is typisch SWS discovery en het compositie
scenario.

Het manipuleren van de procesruimte Het tweede probleem met betrekking tot proces-
ruimte toegang, is deze manipuleren. Voorbeelden zijn het creëren van een bedrijfsproces,
het wijzigen van een bestaand proces of het stopzetten van een verouderd proces. Zulke
functionaliteiten vereisen dezelfde representaties zoals beschreven in vorige paragraaf,
maar eveneens:

• de mogelijkheid om de gerepresenteerde functionaliteit aan te roepen,

• een component dat kan beslissen over de orchestratie van een verzoek en

• een workflow engine die de resulterende orchestratie kan uitvoeren.

100
4 Semantic Business Process Management

Huidige BPM technieken en talen om bedrijfsprocessen uit te drukken kunnen gedeeltelijk


tegemoet komen aan deze vereisten. Bijvoorbeeld, de orchestratie van een bedrijfsproces
kan gedefinieerd worden in BPEL en doorgegeven worden aan een executie-omgeving dat
dit proces effectief zal opzetten en uitvoeren. Niettemin, Bussler, Domingue, Fensel, Hepp,
Leymann en Wahler (2005) willen dit opzetten niet beperken tot processen waarvan reeds
een orchestratie-beschrijving en componenten gekend zijn. Zij stellen dat er eveneens een
beschrijving van de doelen gewenst, waarbij de beslissing bij de BPM-omgeving ligt hoe
deze geïmplementeerd kunnen worden.

4.2.4 Vereisten en subproblemen


Het bereiken van de beschreven BPM automatisering kan uitgesplitst worden in vijf sub-
problemen. Deze worden achtereenvolgens besproken. Figuur 4.5 toont de architectuur
van een dergelijke SBPM-omgeving.

Figuur 4.5: Vereenvoudigde architectuur van een SBPM-omgeving.


SBPM SBPM SBPM BPM BAM Tool
Ontwerp Tool Query Tool Monitoring Tool van een Derde Externe
Applicaties
Adapter

SBPM API

SBPM Executie-Omgeving

Matchmaking
OMS SBPM Proces Engine
Manager
WSMO Dienst
Beschrijvingen
WSMX SBPM-specieke
Ontologieën Executie Reasoner
Procesmodel en Engine
Instantiegegevens Mediators
Doelen

Service Proxies
(representeren functionaliteit van ERP, Legacy, etc.)

Geautomatiseerde en Semi-geautomatiseerde Annotatietools

Externe Andere COTS- Man-Machine


ERP-paketten Legacysystemen
Functionaliteit software teams

Bron: Bussler, Domingue, Fensel, Hepp, Leymann en Wahler (2005), Semantic Business Process Manage-
ment: A Vision Towards Using Semantic Web Services for Business Process Management.

Het vinden van feiten Vooreerst moet men alle feiten vinden en annoteren in het
universum van discussie. Er is behoefte aan een veelomvattende representatie van
het IT landschap. Wat de bedrijfslogica betreft, moet men alle procesmodellen en
procesmodelfragmenten capteren, maar eveneens de business rules die de beperkingen

101
4 Semantic Business Process Management

en afhankelijkheden tussen deze processen reflecteren. Deze zijn te vinden in COTS-


paketten1 en ERP-systemen. Doch, niet alle procesmodellen en procesmodelfragmenten
zijn hard gecodeerd in computer software. Deze processen en procesfragmenten kunnen
gecapteerd worden door mining-technieken. Ook de beperkingen van menselijke arbeid
(fysiek, sociaal, juridisch, ...) dienen in kaart te worden gebracht. Op het uitvoerende
niveau verblijven de meeste gegevens in transactionele gegevensbanken van de organisatie.
De uitdaging hier is om deze gegevens op te slaan in een data warehouse en dit data
warehouse toegankelijk maken als een ontologie-instantie store, door het transformeren
van de warehouse metadata in volwaardige semantische annotaties. Tenslotte moet ook de
omgeving van de organisatie geanalyseerd worden: hoedanigheid van nutsvoorzieningen,
juridische- en regulatorische beperkingen etc.

Representatie Als de feiten gevonden zijn, dienen ze gerepresenteerd worden. Huidige


standaarden voor procesmodellering zoals BPEL (OASIS, 2007) en BPMN (Object Mana-
gement Group, 2005) focussen slechts op bepaalde aspecten van bedrijfsprocessen. BPEL,
bijvoorbeeld, is hoofdzakelijk een syntaxisis voor de orchestratie van bedrijfsprocessen,
terwijl BPMN een grafische notatie is voor het beschrijven van de controle flow van een
bedrijfsproces in een vorm aangepast aan bedrijfsdeskundigen. Nochtans, geen van deze
bestaande talen bieden de nodige expressiviteit en nodige graad van formele semantiek
voor het representeren van gevonden feiten. Ten eerste is er nood aan primitieven (e.g.,
klassen, instanties, data type definities, axioma’s etc.) om feiten te kunnen uitdruk-
ken. Eveneens moeten er ondersteunde woordenschatten worden ontwikkeld, in de vorm
van ontologieën. Daarnaast dienen ook de domeinen-rules gecapteerd te worden in de
vorm van axioma’s. Verder dient er een repository aanwezig te zijn voor de persistente
opslag van alle componenten van deze representaties, en is er nood aan een taal voor
het representeren van alle aspecten – choreografie, orchestratie, pre- en postcondities,
assumpties en effecten – van het procesmodel en procesinstanties. Tenslotte behoeft men
een querytaal die de modelleerprimitieven van de gekozen representatie ondersteunt.

Query en retrieval Klein en Bernstein (2004) stelden een Process Query Language
(PQL) voor en toonden aan dat procesgebaseerde representatie en het query’en van
diensten resulteert in een veel hogere precisie in vergelijking met sleutelwoorden- en
tabelgebaseerde benaderingen. Zij menen daarbij dat ontologie-gebaseerde retrieval en
deductieve retrieval te complex zijn. Bussler, Domingue, Fensel, Hepp, Leymann en
Wahler (2005) verloochenen dit en nemen aan dat het “ontologiseren” van de procesruimte
van een organisatie op lange termijn de enige haalbare oplossing is voor beheer. Onder
deze assumptie wordt het query’en van de procesruimte dan het query’en van de ontologie-
repository.

1
Commercially, off-the-shelf (COTS) is een term voor technologie die beschikbaar is voor verkoop, als
lease, of als licentie aan het grote publiek.

102
4 Semantic Business Process Management

Mediëring Om de interoperabiliteitsproblemen, veroorzaakt door heterogeniteiten, tus-


sen systemen weg te werken en om de automatisering hiervan te bevorderen worden er
mediators ingezet op verschillende niveaus: op het niveau van gegevens, ontologieën,
processen, protocols en doelen. Het succes van de SWS visie, zal afhangen van de
beschikbaarheid van gesofisiticeerde mediators op industrieniveau. Vermits mediators
een core component zijn van verscheidene SWS raamwerken (e.g., WSMO), is men reeds
goed opweg.

Enactement en Executie Tenslotte, vanuit het perspectief van bedrijfsdeskundigen


is er nog bijkomende nood aan een component voor orchestratie, de mogelijkheid om
bestaande processen stop te zetten of te wijzigen, een workflow-engine die de resulterende
orchestraties kan uitvoeren, en de mogelijkheid biedt om het procesmodel uit te voeren
(enactment en execution).

4.2.5 Problemen met betrekking tot Business Process Management


De auteurs van de oorspronkelijke SBPM-paper bespreken dan nog de problemen met
huidige BPM oplossingen. Samengevat zijn deze als volgt:

1. De huidige setup van bedrijfsprocessen volgens managementnoden gebeurt nog


manueel, waardoor er een lage automatiseringsgraad is in de implementatie fase.

2. De dynamische compositie van bedrijfsprocessen is haast onmogelijk. Dit resulteert


in vertraging van de implementatie, waardoor de marktintroductietijd langer duurt
en de wendbaarheid van de organisatie vermindert.

3. Door een gebrek aan scheiding tussen de bedrijfsdoelstellingen en de implemen-


tatiedetails, brengt dit teweeg dat het beheer van bedrijfsprocesen zeer complex
is.

4. Managers en andere bedrijfsdeskundigen kunnen niet snel bepalen of een specifiek


proces kan gebouwd worden aan de hand van bestaande atomaire processen, noch
kunnen stakeholders de procesruimte query’en binnen de organisatie op basis van
logische expressies. Bijgevolg moet de haalbaarheid van een proces (e.g., voor
product- of dienstenlancering) of overeenstemming (e.g., Sarbanes-Oxley, ISO, et
cetera) nog steeds manueel gebeuren door bedrijfsanalisten.

5. Het is momenteel onmogelijk om machine reasoning te gebruiken om potentiële


neveneffecten te identificeren. Vermits er geen correcte representatie is van de
onderlinge afhankelijkheden zijn globale procesverbeteringen zeer moeilijk.

103
4 Semantic Business Process Management

De auteurs hebben de vereisten voor de mechanisatie van BPM dan toegepast op


zowel BPEL als WSMO. Hieruit bleek duidelijk dat BPEL slecht een klein deel van
de vereisten voor een omvangrijke representatie van de organisationele procesruimte
worden gedekt. Dit in tegenstelling tot WSMO dat wel deze vereisten kan invullen.
Vermits WSMO een conceptueel model is, hoeft het zich geen zorgen te maken over
implementatiezaken. WSMO-resultaten kunnen eenvoudig gerepresenteerd worden aan
de hand van de bijhorende WSML-representatietaal.

4.2.6 SUPER Architectuur


Semantics Utilised for Process management within and between EnteRprises (SUPER)2
was een geïntegreerd project gefinancierd door het European Sixth Framework Program
in de periode van April 2006 tot en met Maart 2009. Het doel van SUPER was om
Business Process Management terug op het niveau van de business te brengen, in plaats
van het informatietechnologie niveau waar het zich momenteel bevindt. Dit doel vereist
dat BPM toegankelijk is op het niveau van bedrijfsdeskundigen en dit is precies waarover
SBPM handelt.

Leymann (2006) beschrijft de architectuur die uit het onderzoeksproject is voortgekomen.


De fundamentele en eerste laag is de Semantic Service Bus. Deze behandelt de verzoeken
van de hogere lagen en functioneert zo als brokering service of tussenlaag. De tweede
laag is de Semantic Process Engine. Deze procesmotor instantieert en voert bedrijf-
sprocesmodellen uit en behandelt eveneens gerelateerde dienstverzoeken van de service
bus. De derde laag is de Semantic Process Modeling Layer. Deze laag slaagt alle bedri-
jfsprocesmodellen op, evenals alle bijkomstige relevante gebieden van de onderneming,
bijvoorbeeld met betrekking tot de organisatie, de activa, enzovoort. Vermits SBPM een
overvloed aan zowel technische als praktische uitdagingen met zich meebrengt, beperken
we ons vervolgens tot het gebruik van ontologieën die het conceptuele SBPM raamwerk
vormgeven.

4.3 Automatisch koppelen van gedistribueerde systemen


Het ultieme doel dat we willen bereiken, is een geïntegreerde benadering voor een
geautomatiseerde koppeling van gedistribueerde systemen die onafhankelijk van elkaar
zijn ontwikkeld en zich overal kunnen bevinden. In wat volgt bespreken we kort twee
radicale vormen: een top-down benadering, gezien van het perspectief van de Enterpise
Architectuur en de bottom-up benadering verrekkende vanuit de vereistenanalyse en
procesmodellen. Om pragmatische redenen wordt de bottom-up benadering aan de hand
van bedrijfsprocesmodellen verderop uitgediept op basis van een gevalstudie.

2
http://www.ip-super.org/

104
4 Semantic Business Process Management

4.3.1 Top-down aanpak


Er bestaan vele definities met betrekking tot Enterprise Architectuur. Lankhorst et al
(2005) definiëren Enterprise Architectuur als een coherent geheel van principes, methodes
en modellen die gebruikt worden in het ontwerp en de realisatie van de organisatorische
structuur, bedrijfsprocessen, informatiesystemen en infrastructuur van een onderneming.
Een vereiste is dat deze modellen robuust dienen te zijn met betrekking tot de beschrijving
van de fundamentele ordening van organisaties. In essentie betreft het een high-level
beschrijving van de onderneming en al haar informatiesystemen Net zoals Enterprise
Architecturen, volgt de semantische variant dezelfde principes waaronder uniciteit, on-
afhankelijkheid, en het juiste niveau van abstractie voor het ontwerp van complexe
systemen om de integriteit van het model te waarborgen zoals pioniers als Dijkstra
(1968) en Brooks (1975) ze hebben beschreven. Echter, het verschil is dat deze Semanti-
sche Enterprise Architecturen deze principes niet alleen toepast op gestructureerde data,
maar eveneens op ongestructureerde en semi-gestructureerde informatie (Kuriakose, 2009).

Semantische Web technologieën bieden de mogelijkheid om verschillende aanzichten


te creëren met betrekking tot de functies en lagen van de Enterprise Architectuur voor
de perspectieven van verscheidene stakeholders. Bijvoorbeeld, het platform kan worden
ingezet om een geïntegreerde kennis-repository te maken van IT, bedrijfsartefacten en
modellen, inclusief bedrijfsprocesmodellen, entiteitenmodellen, fysieke database schema’s,
use case modellen, applicatie-broncode en configuratiebestanden. De informatie-integratie
en mogelijkheid tot samenvatten van het platform, zullen voldoen aan de verscheidene
belangen van betrokken op verschillende niveaus van detail en reikwijdte vanuit één enkele
repository (Kuriakose, 2009). Het is maar de vraag of dit kan met een bedrijfsbreed
model, hier geïnterpreteerd als een loutere top-down benadering van ontologieën.

De taak van systeemanalisten is ervoor te zorgen dat semantische conflicten met de


buitenwereld – ook met de klant – weggewerkt worden. De traditionele remedie hiervoor,
is het aanwenden van een bedrijfsbreed model, in deze context te interpreteren als het
bedrijfsbrede model opgelegd door de Enterprise Architectuur. Voordelen van een or-
ganisatiebrede ontologie/taxonomie die vaak aangedragen worden, zijn een efficiëntere
koppeling van heterogene systemen en minder conflicten. Darke en Shanks (1999) menen
dat een dergelijke benadering nadelig is en wijzen op empirische studies die dit aantonen.
Immers, bedrijfsbrede gegevensmodellen zijn zeer complex. De generieke concepten zijn
te abstract voor zowel architecten als eindgebruikers omdat het te ver weg staat van hun
organisatorische context.

Voor zover geweten, bestaat er geen uitgewerkt geïntegreerd raamwerk voor Enter-
prise Architectuur, zoals IBM’s Information Framework dat tracht te realiseren. Een
ontologie is een mathematisch model, gebaseerd op grafen. Van deze diepe grafen naar
de blok- en wolk-vormige domeinen gaan, kenmerkend voor een top-down view, is verre
van evident. Daar primitieven anders zijn door problemen van verschillende orde, is een
één-op-één mapping tussen verschillende niveaus niet mogelijk. Een top-down kijk op het
as-is landschap is daarom niet zo realistisch. We laten dit dus voor wat het is.

105
4 Semantic Business Process Management

4.3.2 Bottom-up aanpak


Om snel te kunnen inspelen op de veranderende behoeften van de markt, moet een
organisatie haar wendbaarheid verhogen in alle fasen van BPM en softwareontwikkeling.
Nochtans, men moet ergens beginnen. Vermist men steeds begint bij procesmodellering
(na de vereistenanalyse), nemen we aan dat dit de belangrijkste fase in deze keten. Deze
aanpak vertrekt dus vanuit de procesmodellen.

Eén paradigma binnen SBPM-onderzoek is om zoveel mogelijk comptabiliteit te re-


aliseren met bestaande tools en standaarden. Bussler, Domingue, Fensel, Hepp, Leymann
en Wahler (2005) passen dit toe op processen gerepresenteerd in BPEL of EPC in het
bijzonder. Deze processen moeten bruikbaar zijn in een SBPM-omgeving. Vooreerst
bepalen zij de verschillende origines van procesmodellen.

Bussler, Domingue, Fensel, Hepp, Leymann en Wahler (2005) onderscheiden drie ver-
schillende bronnen voor procesmodellen die als basis dienen voor het conceptueel SBPM
raamwerk:

1. Tool-gebaseerde of manuele modellering: De meest vanzelfsprekende bronnen


voor procesmodellen zijn modelleertools gebruikt door mensen voor het modelleren
van hun bestaande processen (het documenteren van de “as-is”) of doelprocessen
(het definiëren van de “should-be”). Typische notaties zijn EPC (Keller, Nüttgens
en Scheer (1992) en verschillende formaliseringen zoals Petri nets (Petri, 1962),
UML activity diagrams (Object Management Group, 2005) of BPMN (Object
Management Group, 2010).

2. Referentie procesbibliotheken: Het voordeel van substantiële inspanningen in


het manueel modelleren van de huidige status (“as-is”) is voortdurend in vraag
gesteld, vooral in ERP-centrische corporate omgevingen. Rainer en Andreas (1997)
sporen aan om meer aandacht te besteden aan impliciete procesbibliotheken die
aanwezig zijn in grote COTS-paketten. In werkelijkheid bestaan er grote aantallen
specificaties die kunnen beschouwd worden als bibliotheken van best practices; zij
zijn een belangrijke bron voor de procesmodellen van een onderneming.

3. Reconstructie: procesmining en Reverse Business Engineering: De derde


bron voor procesmodellen zijn tools die processen reconstrueren op basis van log-
files, evenals door middel van het aanpassen van gegevens van bestaande systemen.
Alves de Medeiros et al (2007) presenteren een aantal mogelijke richtingen voor
de ontwikkeling van semantic process mining en monitoring tools. Volgens hen is
het grote voordeel van dergelijke systemen de link tussen genereerde events (nodig
voor analyse) en de feitelijke concepten dewelke ze representeren. Twee uitdagingen
hierbij zijn hoe het semantiek perspectief nuttig onder te brengen – zij ontwikkelden
hiervoor een raamwerk voor het annoteren van event logs, ontologieën en reasoners

106
4 Semantic Business Process Management

– en hoe deze semantische informatie te minen. Bussler, Domingue, Fensel, Hepp,


Leymann en Wahler (2005) beschrijven Reverse Business Engineering als “[...] a
methodology and family of toolsets that extract and interpret transactional data
and program module usage in ERP systems, [...], in order to analyze the process
space of an organization. While the main goal of RBE is not the creation of process
models, it can be used to select from the ERP reference processes those variants
that are in use in the given environment.” Tenslotte kunnen zowel procesmining
technieken als RBE gebruikt worden als bron voor procesmodellen, en kunnen ze
op hun beurt genieten van de rijkere voorstellingen in SBPM.
Om een bedrijfsmodel inhoudelijk te beschrijven is het noodzakelijk de relevante aspecten
eenduidig vast te leggen. Het belangrijkste begrip binnen dit vraagstuk is ontologie. Ook
een bedrijfsprocesmodel kan een ontologie zijn, zoals een UML-klassediagram. Als de
ontologie door computers moet worden kunnen geïnterpreteerd, is het noodzakelijk dat
de kennis wordt vastgelegd met behulp van wiskundige, logische constructies. Door op
een bedrijfskundige manier te denken, is men in staat een dienst uit te leggen in termen
die voor de klant betekenis hebben.

4.4 Naar een ontologie-gebaseerde beschrijving van


procesmodellen
In wat volgt beperken we ons tot de tool-gebaseerde of manuele modellering. Sinds het
ontstaan van applicaties voor de verwerking van grootschalige gegevens, werd er een
veelheid aan modelleertalen ontwikkeld voor de representatie van processen (Dumas, ter
Hofstede en van der Aalst). De modellen beschreven door deze modelleertalen dienen
als communicatie tussen medewerkers in een organisatie met gespecialiseerde kennis,
en deze met methodische of technische kennis zoals consultants en software engineers
(Scheer en Thomas, 2006). In feite probeert men te voorkomen dat het probleem van
vaagheid in natuurlijke taal en de vele problemen in de inherente onuitvoerbaarheid van
wiskundige formules door middel van semi-formele, grafische vormen va representatie
in modelleertalen. Deze zijn nauw gebaseerd op gespecialiseerde bedrijfstermen, wel
exact genoeg, maar deze modellen dienen slechts als uitgangspunt voor de uitvoering
van computer-ondersteunde informatiesystemen (Fellman en Thomas, 2007). Hoewel dit
idee fundamenteel is voor zogenaamd model-driven development van informatiesystemen
(Hailpern en Tarr, 2006), is deze link tussen natuurlijke taal en grafische representaties
het voornaamste probleem voor semi-formele modelleertalen volgens (Fellman en Thomas,
2007). De auteurs menen dat een essentieel deel van de semantiek van een procesmodel
gebonden is aan natuurlijke taal, omdat de identificatiemiddelen van de individuele
elementen van de bedrijfsprocesmodellen worden toegevoegd door de modelleur, onafhan-
kelijk van zijn beslissing voor een bepaalde modelleertaal. Vermits er altijd ambiguïteiten
zijn bij het gebruik van natuurlijke taal, is er veel ruimte voor interpretatie. Hierbij
stellen ze dat dit geen probleem is als dit slechts gecreëerd en gelezen wordt door één
persoon, maar het definiëren van de semantiek voor elk modelelement is wel nodig wan-
neer procesmodellen van verschillende modelleurs gecombineerd, onderzocht en vertaald
worden (Thomas, 2007) of als het gepland is dat de semantiek in het model automa-
tisch gevalideerd en gebruikt moet worden voor de configuratie van het informatiesysteem.
107
4 Semantic Business Process Management

De hierboven beschreven problematiek kan opgelost worden door elementen van het
bedrijfsprocesmodel te verbinden met de concepten van een ontologie. In wat volgt zullen
we eerst het belang van de vereistenanalyse behandelen. Vervolgens vatten we samen
wat er reeds is gepubliceerd over semantische annotaties van bedrijfsprocesmodellen.
Tenslotte maken we een vergelijkende studie op basis van de Volere template, en trekken
we hieruit de nodige conclusies.

4.4.1 Vereistenanalyse
Business Process modellen worden gecreëerd door bedrijfsanalisten, met als objectief
om de vereisten te capteren en om een beter inzicht te krijgen in het bedrijfsproces,
het faciliteren van de communicatie tussen bedrijfs- en IT-expert, het identificeren van
procesverbeteringen en het uitvoeren van deze bedrijfsprocessen (Markovic, 2008). Echter,
de eerste en cruciale stap die men moet uitvoeren, vooraleer men het bedrijfsproces kan
modelleren, is het uitvoeren van een grondige vereistenanalyse. Traditioneel resulteert
een dergelijke analyse in een gestructureerd vereistendocument. Vereisten kunnen zowel
functioneel als niet-functioneel zijn. Echter, het maken van een goed gestructureerd,
volledig en bruikbaar document is geen makkelijke taak. Bedrijfsanalisten willen ervoor
zorgen dat de applicatie die ze definiëren voldoet aan de behoeften van de eindgebruiker.
Dit betekent dat ze de juiste vereisten moeten documenteren door aandachtig te luisteren
naar de feedback van de “klant”, om een duidelijke set van eisen aan de technische
architecten te kunnen opleveren. Indien een bedrijfsanalist slechts over beperkte tools
en skills bezit, die hem helpen bij het documenteren van de eisen, dan is de kans vrij
groot dat hij uiteindelijk vereisten gaat documenten die niet nodig zijn of die moeten
worden herschreven. De tijd die wordt verspild aan het onnodig documenteren heeft
niet alleen een effect op de bedrijfsanalist, maar heeft ook gevolgen in de rest van de
ontwikkelingscyclus. Deskundigen schatten dat 10 tot 40 procent van de functionali-
teit in nieuwe software applicaties overbodig zijn of niet worden gebruikt (Laplante, 2009).

Traditioneel werden de meeste vereisten volgens “tight-coupled” principes in kaart ge-


bracht. Immers, er kwam vaak slechts één gegevensbank bij te pas, en bij een dergelijke
aanpak zijn de meeste analisten in staat om de vereisten ondubbelzinnig in kaart te
brengen. Maar door de opkomst van het Internet, zijn we genoodzaakt op een een
fundamentele andere manier te kijken naar bedrijfsmodellen en het delen van kennis.
Dergelijke conflicten en communicatieproblemen willen we kost wat kost verminderen.
Daarom steunen we op formalisering aan de hand van ontologieën.

4.4.2 Literatuuroverzicht
Recent is er veelvuldig gepubliceerd met betrekking tot de introductie en het formele
gebruik van semantiek om BPM te ondersteunen. Francescomarino, Ghidini, Rospocher,
Serafini, en Tonella (2009) onderscheiden twee verschillende groepen van benaderingen.

108
4 Semantic Business Process Management

In de eerste groep wordt semantiek gebruikt om het dynamisch gedrag te specificeren


dat door een bedrijfsproces wordt vertoond. De tweede groep gebruikt semantiek om de
betekenis van de entiteiten vast te leggen, met de bedoeling om BPM-automatisering
te bevorderen. We overlopen kort enkele publicaties in het domein van het dynamisch
gedrag, waarna we dieper ingaan op publicaties in groep twee. Tenslotte wordt een
conclusie gegeven op basis van een vergelijking met betrekking tot de vereisten die
dergelijke benaderingen invullen. Dit gebeurt aan de hand van de Volere template.

Met betrekking tot het dynamisch gedrag van bedrijfsprocessen werd er onder andere
het volgende geschreven. Hoffman, Mendling en Weber (2008) introduceren semantische
annotaties voor validatie-redenen. Er wordt geverifieerd of taken onderling consistent
zijn en in overeenstemming zijn met de workflow-structuur, op het moment dat ze reeds
uitgevoerd worden. Gibbons en Wong (2008) ontwikkelden een relative-timed model om
de comptabiliteit te verifiëren tussen deelnemers bij bedrijfscollaboratie gemodelleerd
in BPMN. Tenslotte, Oberweis en Koschmider (2005) behandelen het koppelen van
cross-organisationele bedrijfsprocessen. Door het representeren van bedrijfsprocessen
met Petri nets in combinatie met OWL, verkrijgt men flexibiliteit en automatisering van
de betrokken systemen; die de semantische interconnectiviteit tussen bedrijfsprocessen
vergemakkelijkt en de communicatieduur verkort. De conclusie aangaande het dynamisch
gedrag perspectief, is dat deze oplossingen een enorme uitdaging zijn in termen van
computationele correctheid, om de effecten na binding onder controle te houden.

Publicaties in de groep met als doel om de automatisatie van BPM te verbeteren


zijn iets talrijker. Francescomarino, Ghidini, Rospocher, Serafini, en Tonella (2009)
focussen op het gebruik van Semantisch Web technologieën om structurele beperkingen
te specificeren en te verifiëren. Deze beperkingen zijn afkomstig van structurele vereisten
en domeinkennis, die verwijzen naar beschrijvende eigenschappen van geannoteerde pro-
cesdiagrammen, en niet naar de uitvoering ervan.

Zij introduceren hierbij tevens een ontologie-gebaseerd raamwerk voor. Tenslotte beschri-
jven ze een tool voor de geautomatiseerde transformatie van een geannoteerd bedrijfsproces
in een OWL ontologie en evalueren ze hoe een standaard DL reasoners kunnen worden
ingezet om automatisch ontologie-beperkingen te verifiëren.

De invalshoek van Frankel, Hayes, Kendall en McGuinness (2004) is er één van software
engineering. Zij stellen dat er overlap is tussen Model Driven Architecture (MDA) en
kennisrepresentatie en dat er mogelijke synergieën bestaan die tot nieuwe, grensver-
leggende mogelijkheden zou leiden in software engineering. Ten eerste menen zij dat
vele ontologie-ontwikkelingsystemen zoals Protégé en WebOnto een diepe kennis vereisen
van representatietalen en methodologieën. Tevens bieden deze tools slechts beperkte
interoperabiliteit-ondersteuning evenals inherente analyse, samenvoeging, alignment en
compositie van ontology componenten. Bovendien zijn deze tools “single user”; weinigen
ondersteunen component-based ontwikkeling, geïntegreerde consistentie verificatie of
validatie en de meeste bieden slechts beperkt configuratiebeheer, versioning of andere

109
4 Semantic Business Process Management

software engineering ondersteuning. Deze tools focussen te weinig op ontwikkeling van


de kennisbank, wat tot dramatische kosten leidt bij grootschalige ondernemingsprojecten.
Aan de MDA kant is er de Meta Object Facility (MOF) en Unified Modeling Language
(UML). Deze zijn grafisch van nature en vandaar toegankelijker voor bedrijfsdeskundi-
gen in vergelijking met kennisrepresentatietalen. De meeste UML tools bieden tevens
uitgebreide configuratiebeheer mogelijkheden. Vele van deze functionaliteiten kunnen
ook uitgebreid worden met ontologieën, ondanks de abstracte syntaxis van deze talen.
Een belangrijk onderscheid tussen de benaderingen is hun focus. MOF houdt zich bezig
met de automatisering van het fysieke beheer en de uitwisseling van metadata, terwijl
kennisrepresentatie zich focust op de semantiek van de metadata evenals het automatische
redeneren hieromtrent. Een ander verschil is dat MDA technologieën vooral op industrieel
niveau wordt toegepast; als er al semantiek aanwezig is, dan is die vaak sterk gekoppeld
met de applicaties. Daarentegen zijn er maar weinig Semantisch Web projecten die op
grote schaal werden toegepast. Vermits opkomende applicaties in financiering, gezondhei-
dszorg, beveiliging, communicatie, Business Intelligence en vele andere verticale markten
content- en contextgevoelig zijn en omdat ze schaalbaarheid en prestaties vereisen op het
niveau van de onderneming, kunnen MDA en Semantisch Web technologieën doorbraak
bieden voor talrijke problemen. Tot slot worden er enkele voorbeelden gegeven:

• Het biedt interoperabiliteit tussen verschillende gecontroleerde woordenschatten


met soms conflicterende semantiek.

• Op beleid-gebaseerde applicaties met declaratieve – in plaats van procedurele – rules


representatie, kunnen de schaalbaarheid verhogen zoals voor netwerkbeveiliging en
beheer.

• Redeneercapaciteiten kunnen inzicht geven in of het beperken van beleidsovertreding,


het beschrijven van optimale communicatiepaden, of het beantwoorden van voorheen
onbeantwoordbare vragen, bijvoorbeeld in Business Intelligence applicaties.

Verder menen Frankel, Hayes, Kendall en McGuinness (2004) dat kennisrepresentatie


en Semantisch Web technologieën ook significante voordelen kunnen bieden voor meer
traditionele enterprise software engineering en bestaande MDA best practices. Immers,
declaratieve en beleids-gebaseerde benaderingen van complexe systeemontwikkeling en
-beheer kunnen de schaalbaarheid en onderhoudbaarheid immens verbeteren, in het
bijzonder waar er (1) talrijke afhankelijke en intergerelateerde bedrijfsprocessen spelen,
waar er (2) talrijke complexe productieregels zijn, en (3) waar MDA’s design by contract
(DBC) rigoureus werd toegepast. Door een formele kennisrepresentatie, kunnen in zulke
gevallen de regels ontkoppeld worden waardoor de schaalbaarheid dramatisch verbeterd.
Bovendien kunnen redeneersystemen op hun beurt analyse mogelijkheden bieden en
zo bepalen of er al dan niet inherente inconsistenties zijn tussen regels of beleid, het
vaststellen van onderlinge conflicten en het elimineren van inherente consistenties die
moeilijk zijn vast te stellen.

110
4 Semantic Business Process Management

Fellman en Thomas (2007) hanteren een proces-georïenteerde benadering. Ze beschouwen


het probleem van de semantische annotatie van EPC-procesmodellen. Eveneens introduc-
eren ze een meer generiek ontologie-raamwerk op basis van het linken van modelelementen
van semi-formele talen met concepten van formele ontologieën. Zij categoriseren de vo-
ordelen van de transformatie van procesmodellen naar semantische procesmodellen als
volgt:

• Proceskennis: Enerzijds krijgt men een beter begrip van bedrijfsprocessen door het
verbinden van modelelementen met een ontologie, anderzijds zijn de elementen van
het bedrijfsproces ingesloten in een bepaalde context waardoor het een uitgangspunt
is voor kennisbeheer.

• Procesrepresentatie: De inspanning die nodig is om een procesmodel te “inter-


nationaliseren” wordt beperkt, omdat identifiers opgeslagen kunnen worden in een
ontologie in verschillende talen, waardoor automatische vertaling van de labels van
de modelelementen mogelijk wordt.

• Procesonderzoek: Queries op procesmodellen worden mogelijk op semantisch


niveau. Door inferentie-mechanismen toe te passen en rules-talen, kunnen op elk
moment nieuwe feiten worden afgeleid.

• Procesvalidatie: Naast de syntactische regels opgelegd door een metamodel van


een procesmodelleertaal, kan de validatie van procesmodellen ook op semantisch
niveau plaatsvinden. Semantisch incorrecte bedrijfsprocesmodellen kunnen op die
manier geïdentificeerd worden, vooraleer ze uitgevoerd worden.

• Procesexecutie: De uitvoering wordt eenvoudiger omdat de ontologie functioneert


als een centrale repository voor zowel conceptuele als technische beschrijving
van de elementen van een bedrijfsproces. Best practices met betrekking tot de
overdracht van conceptuele processen kunnen opgeslagen worden in een ontologie,
vrij van overtolligheden en herbruikbaar op basis van semantisch geannoteerde
bedrijfsprocesmodellen.

In Markovic (2008) wordt een benadering voorgesteld voor het query’en en redeneren over
bedrijfsprocesmodellen voor het maken van betere beslissingen (1), het faciliteren van
herbruik van artefacten (2) en het voldoen aan relevante reguleringen (3). Ook hier wordt
een raamwerk geïntroduceerd voor het beschrijven van bedrijfsprocesmodellen die zowel
de functionele, gedragsmatige, organisationele en informationele perspectieven integreert.
Born, Dörr en Weber (2007) hebben een gelijkaardige benadering, waarbij elementen
van bedrijfsprocessen gelinkt worden met elementen van een ontologie die objecten,
states, transities en acties beschrijven. Hun benadering laat toe om op een flexibele en
gebruiksvriendelijke manier semantische annotaties toe te voegen aan procesmodellen.
Dit gebeurt door op gepaste manieren ontologische kennis beschikbaar te stellen aan de
eindgebruiker en door het aanreiken van de nodige filtertechnieken om relevante zaken te
onderscheiden.

111
4 Semantic Business Process Management

Tenslotte, in de context van het SUPER-project behandelen Cabral, Nitzsche en Norton


(2009) hoe de Business Process Modelling Ontology (BPMO) kan ingezet worden om
het perspectief van de bedrijfsanalist, evenals de semantische representaties van orga-
nisatorische en andere bedrijfsaspecten te capteren. De BPMO-ontologie kan gebruikt
voor de semantische annotatie van BPMN, EPC, XPDL en BPEL procesmodellen om
ondersteuning te bieden aan de automatische compositie, mediatie en uitvoering.

4.4.3 Een vergelijkende studie


Het amalgaam aan publicaties aangaande ontologie-gebaseerde vertaling van bedrijfspro-
cesmodellen, verdient een diepere analyse. In deze sectie wordt er nagegaan welke vereisten
er worden afgedekt op basis van Volere3 . Volere is een verzameling van gereedschappen en
materialen op het gebied van vereistenanalyse in het software-ontwikkelingsproces. Aan
de hand van de Volere Requirements Specification Template4 wordt voor de verscheidene
behandelde auteurs – ofschoon hun scope verschilt – nagegaan welke functionele- en
niet-functionele vereisten zij (in)direct invullen en/of behandelen. Dit vormt de aanzet
voor een besluit met betrekking tot de effectiviteit rond de ondersteuning op basis van
ontologie-gebaseerde vertaling van bedrijfsprocesmodellen.

Tabel 4.2 toont welke niet-functionele vereisten afdekken voor de verschillende bijdrages.
Hieruit kunnen we afleiden dat nagenoeg alle niet-functionele vereisten worden ingevuld,
behalve wat look & feel en gebruiksvriendelijkheid betreft. Dit zijn namelijk zaken die
de applicaties zelf realliseren. Dynamische aspecten zoals performantie, omgeving en
het operationele komen ook eveneens aanbod. Verscheidene auteurs laten zich ook in
met richtlijnen; dit maakt dat juridische-, culturele- en beveiligingsaspecten eveneens in
aanmerking komen. Wat de functionele aspecten betreft, kijken we naar Tabel 4.3. Ook
deze worden goed afgedekt, hoewel niet elke auteur ze expliciet onderkent. Het louter
semantisch annoteren van bedrijfsprocesmodellen geeft hoe dan ook een beter inzicht in
de context en situatie.

Algemeen kunnen we besluiten dat een doorgedreven ontologie-gebaseerde beschrijving


van bedrijfsprocessen zowel functionele als niet-functionele vereisten kunnen beschrijven.
Op die manier kan de eerder gemaakte vereistenanalyse ondersteund en gestaafd wor-
den. Echter, hiervoor dienen zowel dynamische- als structurele aspecten in overweging
te worden genomen. Zoals Cabral, Nitzsche en Norton (2009) opmerken, is de echte
uitdaging van een graaf-gebaseerde representatie van processen de conversie van deze
graaf-georiënteerde- naar block-georiënteerde functionaliteit, waardoor men naar deze
componenten kan kijken als black boxes zoals de droom van Doug Mc Ilroy (1968) is.
Dit is een erkend problemen binnen BPM, dat nog niet eerder werd geadresseerd binnen
ontologie-gebaseerde technologie.

3
http://www.volere.co.uk
4
Hier maken we gebruik van Volere Requirements Specification Template Edition 11—February 2006.

112
Tabel 4.2: Literatuur rond ontologie-gebaseerde vertaling van procesmodellen: niet-functionele vereisten.

niet-functionele vereisten
operational
look & usability & maintainability cultural &
performance & environ- security legal
feel humanity & support political
mental
Weber, Hoffman,
x
Mendling
Wong, Gibbons x x
Koschmider,
x
Oberweis
Di Francescomarino,
Ghidini, Rospocher, x x x

4 Semantic Business Process Management


Serafini, Tonella
Frankel, Hayes,
Kendall, x x x x x x
McGuinness
Thomas, Fellman x x x x x
Markovic x x x x
Born, Dörr, Weber x
Norton, Cabral,
Nitzsche
Bron: eigen analyse.
113
Tabel 4.3: Literatuur rond ontologie-gebaseerde vertaling van procesmodellen: functionele vereisten.

functionele vereisten
scope of the scope of the functional &
work product data
Weber, Hoffman, Mendling x
Wong, Gibbons x
Koschmider, Oberweis
Di Francescomarino, Ghidini, Rospocher, Serafini, Tonella x x x

4 Semantic Business Process Management


Frankel, Hayes, Kendall, McGuinness
Thomas, Fellman x x x
Markovic x x
Born, Dörr, Weber x x x
Norton, Cabral, Nitzsche x x x
Bron: eigen analyse.
114
4 Semantic Business Process Management

4.5 Gevalstudie: prijsbeheer


Deze sectie heeft een pragmatische invalshoek in die zin dat er wordt nagegaan in welke
mate de eerder beschreven ideeën toepasbaar zijn aan de hand van een gevalstudie. Speci-
fiek wordt er geëvalueerd of men UML op een eenvoudige manier “OWL compatibel” kan
maken voor een prijsbeheerproces. Er wordt vertrokken van de paper van Frankel, Hayes,
Kendall en McGuinness (2004). Zoals eerder aangehaald, is de invalshoek van deze auteurs
één vanuit software engineering. Zij vertrekken van OMG’s Model Driven Architecture
initiatief. MDA en het Semantisch Web (W3C) zijn onafhankelijk van elkaar bedacht en
ontwikkeld met weinig kruisbestuiving in de loop van de jaren. Wat MDA betreft, bestaat
er de Meta Object Facility (MOF) die de metadata architectuur definiteert voor een MDA.
MOF (Object Management Group, 2006) definieert standaarden voor het automatiseren
van de integratie van verschillende metadata door middel van metamodellen en mappings.
Anderzijds is er het Semantisch Web, dat een logische extensie van het Wereldwijde Web
dat in deze context toelaat om business semantiek te representeren. Echter, deelnemers
uit beide gemeenschappen erkenden voordelen om de twee technologieën te overbruggen
om een coherente, enterprise information interoperabiliteit architectuur te vormen. De
belangrijkste verwezenlijking tot op heden hiervan is de Ontology Definition Metamodel
(ODM). De eerste gestandaardiseerde versie werd gelanceerd in mei 2009.

Wat volgt is een toepassing van het Ontology Defintion Metamodel (Object Management
Group, 2010), dat de UML methodologie met Semantisch Web technologieën zoals RDF
en OWL samenbrengt. Eerst wordt het encoderen van modellen en viewpoints aan de
hand van MOF uitegelegd, evenals de recente ODF ontwikkeling behandeld. Vervolgens
wordt de gevalstudie uitgewerkt en tenslotte geëvalueerd.

4.5.1 Encoderen van Modellen en Viewpoints


Om modellen te kunnen manipuleren moet er beslist worden over een formaat waarin deze
worden vastgelegd. Bij voorkeur is dit een erkende standaard, zodat deze met bestaande
tools kan worden gebruikt. De twee belangrijkste standaarden voor kennisrepresentatie
vandaag zijn Meta Object Facility (Object Management Group, 2002) en RDF (W3C,
2004).

Het doel van een “viewpoint” is om ingenieurs in staat te stellen om zeer complexe
systemen te begrijpen, en om de elementen van het probleem en de oplossing te or-
ganiseren rond domeinen van expertise. Het redeneren over ontologieën vertoont veel
gelijkenissen met het construeren van een “view” op de inhoud van een model. “Rules”
worden toegepast op een kennisbank van feiten (objecten in model) om nieuwe feiten af
te leiden (objecten in view) . Vele gelijkaardige problemen ontstaan, zoals patroonherken-
ning tussen selectie statements en objecten tot operaties voor het creëren van nieuwe
objecten van bestaande objecten. RDF heeft als doel om het redeneren over kennis te
faciliteren. RDF werd reeds uitvoerig besproken. MOF wordt behandeld in de volgende
secties.

115
4 Semantic Business Process Management

4.5.2 Meta Object Facility


MDA biedt een methodologie en definieert de vereisten voor tools die modellen voorschri-
jven voor elke ontwerpfase, hoe deze ontwikkeld moeten worden voor maximaal hergebruik,
portabiliteit, interoperabiliteit en de relaties onderling om code generatie te onderste-
unen. Het succes van MDA is dankzij deze Separation of Concerns. Echter, vanuit
het perspectief van kennisrepresentatie is MDA ontoereikend. Er worden wel standaar-
den aangeboden voor het beheren en integreren van modellen, maar er wordt weinig
gezegd over de onderliggende semantiek van het domein dat gemodelleerd wordt (Kendall,
Oberle, Pan, Tetlow, Uschold en Wallace, 2006). Meta Object Facility definieert de
metadata-architectuur van een MDA. Een MOF specificatie van een metamodel kan
worden opgslagen in een MOF-gebaseerde repository, die vervolgens modellen kunnen
manipuleren die voldoen aan deze specificatie. In die zin kan een MOF metamodel worden
vergeleken met een database schema, dat de database vertelt welke datastructuren op
te slaan. MOF is niet beperkt tot object-georiënteerde metamodellen, zoals het UML
metamodel. Het wordt alsmede gebruikt om de gegevens met betrekking tot modellen in
het algemeen te specificeren.

Basis structuur van MOF MOF heeft een object-geörienteerde structuur, omdat het het
klasse construct ontleent van UML. MOF metamodellen lijken op UML klassediagrammen.
Elk construct in het metamodel wordt gemodelleerd als een klasse en de eigenschappen
van deze constructen worden gepresenteerd als attributen van een klasse. Relaties tussen
constructen worden gemodelleerd met UML associaties. Eén verschil tussen het MOF
Model en het UML metamodel ligt in associaties. In tegenstelling tot UML associaties,
zijn MOF associaties altijd binair en geregisseerd. Dit limiteert de expressiviteit van
MOF. Echter, n-aire associaties kunnen steeds uitgedrukt worden als n binaire associaties
en een associatie object.

Meta-niveaus De MOF-architectuur omvat vier meta-niveaus, zoals beschreven in Tabel


4.4.

Table 4.4: Meta niveaus van de MOF architectuur

Meta niveau Beschrijving Elementen


M3 Meta-metamodellen het “MOF Model”
M2 Metamodellen UML klasse diagram, UML associaties,
M1 Modellen UML model met klasse “Klant” Proces
“Facturatie”
M0 Objecten en data Klant “Janssen”
Bron: Object Management Group (2006), Meta Object Facility.

Elk niveau wordt gepopuleerd met instanties van constructen van een hoger niveau.
Bijvoorbeeld, op het M1 niveau is de klasse “Klant” een instantie van de constructen

116
4 Semantic Business Process Management

van het M2 metamodel, zoals een UML klasse. De uitzondering is niveau M3. Het
MOF-model, ook wel het meta-meta model, is zelfbeschrijvend en wordt uigedrukt in
MOF-termen: MOF-elementen zijn instanties van MOF-elementen.

XMI OMG heeft een XML taal gespecificeerd voor het uitwisselen van MOF-gebaseerde
modellen. De XML Metadata Interchange (XMI) (Object Management Group, 2002)
taal specificeert hoe een model opgeslagen in een MOF-gebaseerd model repository kan
worden gerepresenteerd in een XML document. Dit document wordt geëncodeerd in
termen van een Document Type Definition (DTD), dat automatisch gegeneerd wordt van
het MOF metamodel van de modelleertaal die gebruikt wordt. In het bijzonder is er een
DTD voor UML en UML modellen kunnen worden geserialiseerd als XML documenten in
termen van een DTD. Maar XMI is niet gelimiteerd tot UML; eender welke modelleertaal
dat gespecificeerd is in termen van een MOF model kan beschreven worden als een XMI
DTD.

Tekortkomingen van MDA Een belangrijk voordeel van het gebruiken van een MOF
repository is dat het verschillende soorten modellen kan opslaan, die toegankelijk zijn
via een gestandaardiseerde API. Wat echter wel een probleem vormt (1), is dat MDA-
benaderingen in het algemeen geïsoleerd verlopen, waardoor ze vaak dubbelzinnig zijn.
Immers, hoe goed men ze ook heeft gespecificeerd, dit geeft interpretatieproblemen voor
diegenen die niet bekend zijn met het feitelijke model in ontwikkeling. Dit geldt ook voor
UML. De UML community ontwikkelde een set nuttige modellen voor het representereren
van statische en dynamische componenten van software-intensieve systemen. Vandaag
is UML een industriestandaard en bestaan er verschillende woordenschatten voor het
beschrijven van object modellen, datatypes, database schemas, transformaties enzovoort.
XML Metadata Interchange (XMI), de huidige standaard voor het encoderen van van
UML in XML door de OMG, biedt niet deze mogelijkheid. XMI is namelijk gebaseerd op
stringente DTD’s. Bijvoorbeeld, als er een derde partij is die het concept “Evenement”
definieert in UML statecharts in pakweg “ExternEvenement” en “InternEvenement”, dan
zou het niet mogelijk zijn om de corresponderende evenement instanties te serialiseren in
XMI. Of noch, als er een klant binnen één departement in het bedrijf wordt beschreven als
“Klant”, terwijl een ander departement spreekt over een “Customer”, dan is het onmogelijk
om beide concepten zomaar aan elkaar gelijk te stellen. Een ander probleem (2) specifiek
met betrekking tot MOF, en vandaar ook met XMI, is dat het geen uitwisselingsformaat
specificeert voor het diagram. Enkel de model concepten kunnen worden geëncodeerd;
dit is voldoende voor tools die bijvoorbeeld aan codegeneratie doen, maar is een ernstige
limitatie voor de interoperabiliteit tussen modelleer tools, vermits grafische informatie niet
kan uitgewisseld worden op een gestandaardiseerde manier. Tenslotte, MDA biedt geen
geautomatiseerde validatie en verificatie (3). Semantische Web technologieën kunnen dit
oplossen door formele kennisrepresentaties, waardoor dubbelzinnigheden kunnen worden
weggewerkt. Het zullen met andere woorden ontologieën zijn die de OMG standaarden
en methodologie verrijken. Dit wordt ook wel eens een Ontology Driven Architecture
(ODA) genoemd (Kendall, Oberle, Pan, Tetlow, Uschold en Wallace, 2006).

117
4 Semantic Business Process Management

4.5.3 Ontology Definition Metamodel


Onder het mom van de Ontology Definition Metamodel (ODM), is er de afelopen jaren
significante inspanning geweest om software engineering talen en methodologieën zoals
UML samen te brengen met Semantisch Web technologieën. De voornaamste reden
hiervoor is om de populariteit en de functionaliteit van UML tools te uit te buiten voor
de ontwikkeling van ontologieën. Toch zijn er ook die de potentiële voordelen inzien van
het toepassen van ontologie-concepten op modelvalidatie en -automatisering (Kendall,
Oberle, Pan, Tetlow, Uschold en Wallace, 2006). In Maart 2003 initieerde de OMG het
formele proces voor ODM; in mei 2009 werd dit een standaard. Haar doelstellingen zijn
de volgende:

• Het ontwikkelen van ontologieën via UML tools.

• De implementatie van dergelijk ontologieën in OWL, zonder verlies van getrouwheid.

• Voor-en achterwaarts bouwkunde (engineering) van ontologieën.

ODM zal voor de interoperabiliteit zorgen tussen een aantal belangrijke kennisrepresenta-
tie en metadatabeheer-oplossingen, evenals het realiseren van de doelstellingen van OMG,
uiteengezet in de oorspronkelijke RFP. Deze interoperabiliteit zal bewerkstelligd worden
via een set van onafhankelijke, doch gerelateerde metamodellen (Object Management
Group, 2010):

• In de kern zijn twee metamodellen voor Beschrijvende Logica (DL) en Common Logic
(CL). Hoewel deze talen zeer verschillend zijn, bieden ze samen ondersteuning voor
een breed scale aan representaties die op een continuüm liggen gaande van hogere
orde, modale, probabilistische en intentionele representaties tot het uitdrukken van
eenvoudige taxonomische expressies.

• Ten tweede zijn er metamodellen die meer de structurele en beschrijvende represen-


taties weergeven, en die iets minder expressief zijn dan DL en CL. Deze omvatten
metamodellen voor de abstracte syntaxisis van RDFS, OWL en Topic Maps (TM)
uit te drukken.

• Twee extra metamodellen voor het uitdrukken van concepten die gebruikt worden in
traditionele software engineering: UML2 en Entity Relationship (ER) diagrammen.

Daarnaast worden er nog drie UML profielen beschikbaar gesteld voor RDF, OWL en
TM. Deze helpen bij het gebruiken van de UML notatie (en tools- voor ontologische
modellering en faciliteren de generatie van de corresponderende ontologie-beschrijvingen
in RDF, OWL en TM respectievelijk.

Om legacy modellen als basis te nemen voor ontologie-ontwikkeling, en om ODM gebrui-


kers in staat te stellen om de nodige trade-offs te maken in expressiviteit, gebaseerd op
applicatievereisten, worden voor een aantal metamodellen mappings beschikbaar gesteld.
Om het N 2 mapping-probleem te vermijden, worden er een aantal directe mappings

118
4 Semantic Business Process Management

van en naar OWL voor UML en TM aangereikt. Echter, CL is een uitzondering in


deze strategie omdat het veel expressiever is in vergelijking met andere metamodellen.
Uni-directionele mappings naar CL zijn op dit moment niet mogelijk.

Frankel, Hayes, Kendall en McGuinness (2004) menen dat door MOF metamodellen van
bestaande metadata silo’s te mappen naar en van ODM, MOF en ODM-gebaseerde tools,
men automatisch de relevante porties van metadata kan importeren om een ontologie- en
kennisbankontwikkelingsproces op te starten. Bijgevolg kan men de ontwikkelingskosten
dramatisch verminderen. Verder menen zij dat ODM praktijken configuratie- en versie-
beheer voor kennisrepresentatie mogelijk maakt. Zij stellen wel dat configuratiebeheer
veel minder evident is voor ontologieën dan voor software componenten, onder andere
omdat ontologieën evolueren.

4.5.4 The Semantics of Business Vocabulary and Business Rules


Hoewel we niet formeel gebruik gaan maken van SBVR, geven we om redenen van
belang, complementariteit en relevantie alsnog een korte beschrijving. The Semantics
of Business Vocabulary and Business Rules (SBVR) is een Object Management Group
standaard. Het definieert een metamodel en laat toe om dit te instantiëren, om ver-
schillende woordenschatten te creëren en om gerelateerde business rules te definiëren.
Bovendien is het eveneens mogelijk om deze modellen aan te vullen met gegevens omtrent
een specifieke organisatie. De SBVR-benadering biedt een manier (i.e. mapping rules)
om natuurlijke taal artefacten te vertalen in artefacten die voldoen aan MOF (OMG,
2008). Het is daarmee geen modelleernotatie, maar eerder een conceptueel raamwerk
voor semantiek-gerelateerde zaken zoals het gebruik van termen binnen een bedrijfsunit.
Het erkent dat verschillende entiteiten dingen op een andere manier omschrijven.

Voor een stuk is deze aanpak vergelijkbaar met ODM. Nochtans is de ISO Common Logic
specificatie (CL), die door ODM gehanteerd wordt, verenigbaar gemaakt met de SBVR
Logical Formulation of Semantics woordenschat. CL zelf was speciaal aangepast zodat
het de “modale zin”-vereisten van SBVR kan incorporeren. Ook het W3C overweegt
SBVR op te nemen, dankzij de brugfunctionaliteit inherent aan ODM.

119
4 Semantic Business Process Management

4.5.5 Werkwijze
Om een bestaande procesmodel uit te breiden met ontologieën, wordt een stappenplan
gevolgd. Het generiek proces verloopt als volgt. Vooreerst wordt er een use case
beschouwd, waarna een bedrijfsanalist de vereistenanalyse visueel communiceert aan de
hand van een modelleringtool. Vele van deze tools zijn in staat een XML-serialisatie
te genereren, bijvoorbeeld in XMI voor UML, of in EPML voor EPC’s. Figuur 4.6
geeft dit proces grafisch weer. Vervolgens wordt er een mapping methode bepaald; dit
betreft de afstemming met andere ontologieën en hangt af van het gehanteerde ontologie-
raamwerk. Er moet immers nagedacht worden over de afstemming van verschillende
ontologieën. Dit wordt in meer detail behandeld in volgende sectie. Dan wordt deze
mapping toegepast, waarna een vertaling plaatsvindt en tenslotte de encodering. Let wel
dat de tekortkomingen in expressiviteit van bestaande procesmodellen als gegeven wordt
aangenomen. Vermits deze scriptie over het Semantisch Web handelt, werd er gekozen
voor de RDF- en OWL talen als formele representatie. Het resulterende ontologie-model
vormt dan de basis voor een zee aan mogelijkheden, zoals in Sectie 4.4 werd uiteengezet.

120
Figure 4.6: Workflow voor uitbreiding procesmodel naar ontologieën.

BPM Mapping
Specificatie methodes

Genereer JA

4 Semantic Business Process Management


Beschouw use Mapping Bepaal mapping
Start Kies BPM notatie specifieke XML Vertaal Encodeer Stop
case Methode? methode
serialisatie
NEE

Stop
121
4 Semantic Business Process Management

4.5.6 Technische implementatie van de vertaling


In de gevolgde werkwijze is er nood aan decodering, vertaling en encodering, oftewel
mapping van vereistenanalyse tot het ontologie-model. De reden is als volgt. We kunen
niet zomaar van een grafisch gemodelleerd bedrijfsproces vertrekken 5 . Immers is het zo
dat machines vandaag niet zomaar artefacten van een bedrijfsproces kunnen herkennen,
laat staan kunnen afleiden over welke notatie het gaat. Daarom dat er metadata nodig
is. Om de reden van dataportabiliteit werden er verschillende standaard XML formaten
in het leven geroepen die de uitwisseling tussen software mogelijk maakt. Vele van deze
tools (e.g., Microsoft Visio, BizAgi, Visual Paradigm et cetera) ondersteunen dit onder
de vorm van import- en export functionaliteiten. Zij bieden ook de mogelijkheid aan
om een XML-serialisatie van een procesmodel te genereren, in een bijhorend specifiek
gestandaardiseerd formaat. Echter, deze standaarden en hun bijhorende encoderingen
zijn niet zomaar Semantisch Web compatibel. Men kan niet zomaar de elementen van
een bestaand model mixen en uitbreiden om de expressiviteit van het Semantisch Web te
kunnen ondergaan. Deze één op één mapping bestaat simpelweg niet. Bijgevolg is er nood
aan een dergelijke mapping. Vandaar dat er een kleine tool, model2RDF, ontwikkeld werd.

Vandaag gebruiken de meerderheid van bestaande XML naar XML mapping tools
eXtensible Stylesheet Language Transformations (XSLT). XSLT is een taal om een XML
document te transformeren naar een ander XML document formaat. Echter, speci-
fiek voor het Semantisch Web ontwikkelde het W3C Gleaning Resource Descriptions
from Dialects of Languages (GRDDL)6 , dat een mechanisme is om de resource beschri-
jvingen bij dialecten van verschillende talen te achterhalen. De GRDDL specificatie
introduceert markup gebaseerd op bestaande normen en verklaart dat de gegevens in een
XML-document verenigbaar zijn met RDF en dat de extractie van gegevens uit “dialect
documenten” mogelijk is met algoritmen.

De GRDDL-specificatie toont XSLT-voorbeelden, maar is abstract genoeg om andere


implementaties te ondersteunen. In deze scriptie werd GRDDL daarom beschouwd als
een richtlijn en niet zozeer normatief. De implementatie van de tool volgt de specificatie
bijgevolg niet volledig7 . Figuur 4.7 geeft een grafische presentatie van het gevolgde proces
in de tool.

5
In een interview over “recognition, RFID en Web 3.0” zegt Tim O’reilly dat vele objecten zullen worden
erkend zonder metadata. Hij meent dat dingen zullen worden erkend zonder tags, en voor gezichten,
mensen, plaatsen en kunstwerken heeft hij waarschijnlijk gelijk.
6
http://www.w3.org/TR/grddl/
7
Bijvoorbeeld, een document worden server-side geïnformeerd dat er GRDDL transformaties beschikbaar,
niet door het “profile” attribuut op te nemen in het “head” element.

122
4 Semantic Business Process Management

Figure 4.7: model2RDF: technisch proces


model2RDF

1.1 1.2 1.3

Decodeer en Bepaal XSL Mapping door


parse XML transformatie middel van
metadata XSLT

XML
serialisatie

XSL

Use Case

4.5.7 Representatie van UML in OWL


In deze sectie wordt een UML/OWL mapping geëvalueerd. Hoewel de formele structuur
van UML heel verschillend is van die van OWL, hebben ze toch een aantal features die
in vele opzichten gelijklopend zijn (Object Management Group, 2009). In deze casus
wordt er een mapping van UML (OMG) naar OWL (W3C) gedaan, vertrekkende vanuit
de principes beschreven in de ODM-standaard. De beschreven mapping is echter wel
gelimiteerd tot de OWL DL versie, maar indien noodzakelijk, bijvoorbeeld voor abstracte
metaklassen van de UML2 kernel package, zou een geavanceerd mapping naar OWL Full
geen probleem moeten vormen.

Tabel 4.5 geeft een samenvatting weer van de UML features die over een bijhorende OWL
equivalent beschikken. Zoals duidelijk is hebben de meeste UML features bevredigende
OWL equivalenten; men zou zelfs kunnen stellen dat een één-op-één mapping aan de orde
is. Toch zijn er bepaalde UML elementen die geen OWL equivalent hebben en anderzijds
ook bepaalde OWL elementen die niet over een UML equivalent beschikken. Tabellen
4.6 en 4.7 geven hiervan een overzicht.

123
4 Semantic Business Process Management

Table 4.5: Gemeenschappelijke eigenschappen van UML en OWL.

UML element OWL element


class, property owned class
property owned
instance individual

ownedAttribute property
binary association
subclass subclass
generalization subproperty
N-ary association class
association class property
enumeration oneOf

disjoint disjointWith
cover unionOf
multiplicity minCardinality
maxCardinality
package ontology

dependency reserved name


RDF:property
Bron: Object Management Group (2009), Ontology Definition Metamodel.

Table 4.6: UML elementen zonder OWL equivalent

navigable, non-navigable
derived
abstract classifier
Classes as instances
Bron: Object Management Group (2009), Ontology Definition Metamodel.

Table 4.7: OWL elementen zonder UML equivalent

Thing, global properties, autonomous individual


allValuesFrom, someValuesFrom
SymmetricProperty, TransitiveProperty
Classes as instances
disjointWith, complementOf
Bron: Object Management Group (2009), Ontology Definition Metamodel.

124
4 Semantic Business Process Management

4.5.8 Uitwerking en evaluatie


Tot nu toe werd er nog niets gezegd over de inhoud van het prijsbeheerproces. Dit is in
feite ook niet nodig, vermits de tool proces-agnostisch is en zelf niet redeneert. De output,
voor het prijsbeheer proces in Bijlage B, kan wel gebruikt worden als input voor systemen
die wel bewust willen redeneren over het proces. Voor deze casus werd er vertrokken van
een klassediagram voor prijsbeheer, gemodelleerd in UML. Dit diagram werd ontwikkeld
in het kader van de syntheseproef, met het oog op een automatisch Pricing Management
systeem voor het bepalen van een gedifferentieerde productprijs rekening houdend met
zeer gevarieerde klantenvereisten. Een gedetailleerde beschrijving van de verschillende
elementen en het achterliggende informatie zijn hier niet aan de orde, maar om een idee
te geven van de complexiteit van dit diagram verwijs ik naar Bijlage A.

Er werd uitgegaan van een XML document gegenereerd door Microsoft Office Visio
2003. Hoewel het UML klassediagram enige mate van complexiteit vertoont, is mijn
observatie dat het XML ongelooflijk “opgezweld” is. Voor een twintigtal klassen zijn
er maar liefst circa 11.000 lijnen, wat zo’n 1,5 megabyte schijfruimte inneemt. Het
werd ook duidelijk dat de UML-representatie in XMI veel detail bevat die verder gaat
dan de scope, met name de aanwezigheid van grafische coördinaten van het grafische
UML-model in kwestie. Overigens is de structuur van het document van een zeer
bedroevende kwaliteit. Structuur moet van structuur komen, en niet van een element
zoals <Foundation.Core.Classifier.Feature>. Het was dan ook een hele opgave om de
mechanische conversies toe te passen op basis van GRDDL. Toch is het niet onmogelijk om
voor een belangrijke subset van de UML-standaard een encodering in OWL te realiseren.

Tot slot, men zou kunnen stellen dat een vertaling van bestaande XML-metamodel
standaarden naar een Semantisch Web model overbodig is. Immers, er wordt weer een
nieuwe tussenschakel gecreëerd. Zo zou men kunnen aanhalen dat men evengoed een
OWL-plugin kan ontwikkelen voor bestaande software tools. Mijns inziens is dit ook
broodnodig. De reden dat formaten als XMI ingeroepen werden is om interoperabiliteit
tussen tools te garanderen. Uit eigen observatie betwijfel ik de kwaliteit en efficiëntie van
dergelijke code generatie ten zeerste, daar vendors de vertaling niet strikt volgen. Wat is
het nut dan nog van een standaard? Hoe dan ook, een uitbreiding van een bedrijfsproces
naar ontologieën is een probleem van een andere orde. Nochtans zijn er twee redenen die
een dergelijke tussenschakel staaft. Ten eerste, beide hebben een bijzondere overlapping,
namelijk metadata, die reeds aanwezig zijn onder de vorm van XMI. Ten tweede, men
mag de adoptie van bijvoorbeeld XMI ook niet onderschatten. Een Google query naar
XMI versie 1.08 geeft ongeveer 118.000 resultaten terug.

8
http://www.google.com/search?as_epq=xmi:xmi+version+1.0

125
4 Semantic Business Process Management

4.6 Proces-gebaseerde ontologie-omgeving


Een belangrijke vraag die naar voren kwam uit de gevalstudie, is hoe een procesmodel nu
juist gemapt moet worden op ontologieën; welke ontologieën dient men te gebruiken en
hoe deze afstemmen? In de gevalstudie werd een zeer simplistische werkwijze toegepast,
die in grote organisaties gewoon niet toereikend is door de socio-technische complexiteit;
er is echter geen eenvoudig antwoord. In de beoordeelde literatuur werden in de context
van procesmodellen een aantal ontologie-raamwerken aangereikt. In deze sectie worden
deze omgevingen vooreerst beschreven, waarna er een beoordeling plaatsvindt op basis
van een aantal vooropgestelde criteria.

4.6.1 Beschrijving ontologie-omgevingen


Thomas en Fellman (2007) introduceren een raamwerk voor de semantische annotatie
van bedrijfsprocesmodellen. De semantiek van de individuele modelelementen wordt
gespecificeerd aan de hand van concepten van een formele ontologie. Hiervoor wordt een
afzonderlijk metadata-niveau gebruikt, om de modelelementen te linken met de ontologie.
Er zijn semantische annotaties tussen modellen, metadata en ontologieën (zie Figuur 4.8).
Metadata worden gegenereerd van de modellen. Deze metadata bevatten referenties naar
modelelementen van het initiële modellen, evenals naar de concepten van de ontologie;
hierdoor zijn ze inter-afhankelijk. Tenslotte, concepten van de ontologieën worden in de
metadata gebruikt om betekenis aan de modelelementen te geven. De auteurs menen
daarom dat de ontologieën deze concepten moeten omvatten, anders dienen ze toegevoegd
te worden.

Figuur 4.8: Raamwerk voor de semantische annotatie van bedrijfsprocesmodellen.

Opvatting Representatie

Ontologieën OWL

Metadata RDF

Modellen XML

Bron: Thomas en Fellman (2007), Semantic EPC: Enhancing Process Modeling, Using Ontology Languages,
Semantic Business Processes and Product Lifecycle Management.

De auteurs menen dat men voor SBPM bestaande ontologieën moet gebruiken, bijvoor-
beeld Enterprise Ontology van Dietz of TOVE. Daarnaast moet men kijken in technische
standaarden voor de constructie van ontologieën, of door middel van ODF toe te passen.

126
4 Semantic Business Process Management

Voor de ontologie-gebaseerde representatie van bijvoorbeeld EPC, kan men differentiëren


tussen het representen van EPC in de ontologie aan de hand van de EPC-taal constructen
of via de representatie van EPC-model elementen. Het EPC-model is dan de instantiatie
van klassen en eigenschappen binnen de ontologie. Het linken van de ontologie en de
EPC-modelementen gebeurt aan de hand van eigenschappen; meer bepaald semType-
eigenschappen.

Born, Dörr en Weber (2007) linken de elementen van bedrijfsprocessen aan de ele-
menten van een ontologie die objecten, states, transities en acties beschrijven (zie Figuur
4.9). De objecten relevant voor elke activiteit in het procesmodel kunnen gespecifieerd en
direct gelinkt worden aan objecten in een domein. De states – voor- en na het uitvoeren
van activiteit – van deze objecten gespecificeerd worden. Men kan activiteiten linken aan
de acties van een domeinontologie, dit gebeurt via matchmaking functionaliteit. Niet alle
objecten of states kunnen teruggevonden worden in een domeinontologie. Deze ongelinkte
objecten en states geven indicatie dat zulke elementen gecreëerd moeten worden in het
bedrijfsprocesmodel.

Figuur 4.9: Semantisch verrijkte procesmodellen.

Matchmaking
functionaliteit

Offerte
Business
Process Model Domeinontologie
(BPMN)
< gecreëerd (Offerte)
> verzonden (Offerte)
geworteld in geselecteerd uit

verzenden
Offerte
Uitgebreide
BPMN Domeinontologieën
ontologie

O = Object t = Transition
S = State A = Action

Bron: Born, Dörr en Weber (2007), User-Friendly Annotation in Business Process Modeling.

127
4 Semantic Business Process Management

Vervolgens zijn er twee geïntegreerde benaderingen: ODF en SUPER. ODF werd reeds
uitvoerig behandeld. Bij het SUPER-raamwerk gaat men BPMN/EPC procesmodellen
annoteren en referenties leggen naar ontologie-elementen, WSMO-doelen en semantische
beperkingen. Een belangrijk aspect is het hergebruiken van bestaande enterprise-modellen,
die worden opgeslagen in een Semantic Business Process Library (Cabral, Nitzsche en
Norton, 2009).

Tot slot, in Di Francescomarino, Ghidini, Rospocher, Serafini en Tonella (2009) wordt er


een raamwerk geïntroduceerd voor het verifiëren van sets van structurele beperkingen die
zowel domeinkennis als processtructuur omvatten. Op die manier kan de correctheid van
semantische procesannotaties bepaald worden, maar evengoed kunnen rijke structurele
vereisten geverifieerd worden.

Op basis van deze observaties maken we nu een vergelijking tussen deze proces-gebaseerde
ontologie-omgevingen. We evalueren de raamwerken op basis van de volgende criteria:
• Oplossing: Gaat na of de oplossing met al zijn componenten eenvoudig te integre-
ren is in een bredere socio-technische context.

• Beschouwde dimensies: Verifieert welke dimensies in beschouwing worden ge-


nomen en welke respectievelijke ontologieën hiervoor worden aangereikt.

• Mapping: Beschrijft hoe de mapping / het binden tussen de verschillende dimensies


plaatsvindt.

• Herbruikbaarheid: Geef de aangereikte dimensies weer die herbruikt kunnen


worden.
Tabel 4.8 toont een vergelijking tussen proces-gebaseerde ontologie-omgevingen. De
benaderingen hebben veelal een verschillende focus. De SUPER- en ODF benaderingen
zijn organisatiebreed en de enige geïntegreerde benaderingen. Opmerkelijk is dat er
overal sprake is van een domeinontologie, behalve in het raamwerk van Fellman en
Thomas (2007), waar een brede interpretatie wordt gegeven aan het begrip ontologie.
Ook situeren er zich grote verschillen in de manier waarop de mapping gebeurt. Waar bij
Di Francescomarino, Ghidini, Rospocher, Serafini, Tonella (2009) de mapping gebeurt
op basis van subsumptie, gebeurt die bij Fellman en Thomas (2007) aan de hand van
eigenschappen. SUPER maakt gebruik van een bridging ontologie BPMO genaamd. Bij
ODF vind er nagenoeg een één-op-één mapping plaats. Tenslotte, wat herbruikbaarheid
betreft is de tendens hetzelfde; men streeft er naar om procesmodel, domeinontologie,
evenals alle andere metamodellen te herbruiken.

Waar we hierboven het over proces-geörienteerde ontologieën spraken, wordt in Fili-


powska, Hepp, Kaczmarek en Markovic (2009) een set van ontologieën voorgesteld voor
SBPM die een consistent en operationeel raamwerk vormen dat alle niveaus van de
enterpise structuur en operaties probeert te incorporeren. Daarnaast wordt een ver-
gelijking gemaakt met andere enterprise modellen zoals TOVE, REA, e3-value en EO.

128
4 Semantic Business Process Management

Er blijkt vaak een verschillende focus te zijn. Terwijl TOVE en EO-projecten vooral
proberen om een generiek enterprise-model aan te bieden, focussen REA en e3-value
op het creëren en transfereren van economische waarde. De SBPM-benadering heeft
daarentegen als doel de relevante organisatie-context weer te geven die de noden voor
bedrijfsprocesmodellering afdekt. Bovendien zeggen maar weinig initiatieven iets over de
afstemming van de verschillende ontologieën. Zo vertonen de drie verschillende lagen van
TOVE een incosistent niveau van detail en zorgt de terminologie van de REA-constructen
voor dubbelzinnigheid. Ook ontbreken sommige initiatieven een formele versie in een
ontologie-taal (e.g., EO), of worden ze niet geserialiseerd in een ontologie-taal waarvoor
degelijke reasoners voor bestaan (e.g., TOVE).

4.6.2 Ontology matching


In eerdere secties is er voortdurend gewezen op het feit dat ontologieën “gemapt” moeten
worden. Het is gepast om deze problematiek hier te bespreken, omdat de vraag wederom
aangekaart wordt door de gemaakte analyses. Wat betekent het afstemmen van ontolo-
gieën voor het Semantisch Web? Het Semantisch Web laat namelijk de ontwikkeling van
ontologieën van onderop toe, maar tegelijkertijd poneert het dat er een centraal coördine-
rend mechanisme nodig is voor formalisatie. Hoewel er verschillende OWL profielen zijn,
voor verschillende noden van expressiviteit, zal er bijkomende ondersteuning nodig zijn
voor de transformatie en validatie van specifiekere domeinontologieën. Het Semantisch
Web schrijft immers voor dat er niet zoiets bestaat als één ontologie. Het imposeren van
één ontologie op de wereld is absurd. Zij erkent het bestaan van diverse, rivaliserende en
inconsistente perspectieven, maar meent dat er een gestandaardiseerde manier nodig is
om deze te verbinden.

Het domein van de ontologie alignering houdt zich bezig met het bepalen van over-
eenkomsten tussen concepten van verschillende ontologieën. Het speelt bijgevolg een
kritieke rol voor de interoperatie tussen heterogene bronnen. Deze tools houden zich
bezig met het vinden van klassen van gegevens die semantische equivalent zijn. Deze
klassen hoeven niet noodzakelijk logisch consistent te zijn. Er zijn drie belangrijke di-
mensies voor gelijkheid: syntactisch, extern en semantisch. Toevallig komen deze ruwweg
overeen met gelijkaardige dimensies gedefinieerd door cognitieve wetenschappers. Tools
en raamwerken halen hier inspiratie uit (Euzenat, 2007).

Ontology matching verloopt nog zeer stroef. De uiteenzetting van Hayes (2009) op
de 8ste International Semantic Web Conference handelde over de redenen hiervan. Er zijn
nl. een aantal problemen met het toepassen van traditionele logica in een gedistribueerde
context. Eén van deze problemen met traditionele logica is dat men instanties tussen
verschillende ontologieën mapt op basis van de sameAs relatie. Ondanks het feit dat deze
instanties van verschillende ontologieën komen, betekent dit niet dat ze exact hetzelfde
betekenen. Er zijn geen relatietypen in traditionele logica die subtiele verschillen kunnen
modelleren. Hoewel er reeds verschillende component matchers zijn ontwikkeld, is er nog
geen geïntegreerde oplossing voor Ontology alignment (Euzenat, 2007).

129
Tabel 4.8: Een vergelijking tussen proces-gebaseerde ontologie-omgevingen.

Di
Francescomarino,
Fellman en Thomas Born, Dörr en Weber
SUPER (2009) ODF (2009) Ghidini, Rospocher,
(2007) (2007)
Serafini, Tonella
(2009)
semi-geïntegreerd via geïntegreerd met
oplossing ad-hoc geïntegreerd ad-hoc
SUPER MDA
assumptie dat BPMO
onderscheid tussen
domeinontologie (brug-ontologie), upper-ontologie, BPMN-metamodel
concept, metadata en
beschouwde aanwezig is, WSMO, geen en domeinontologie,
ontologie; er wordt
dimensies uitgebreide BPMN organisationele domeinontologie processtructuur

4 Semantic Business Process Management


niet aangegeven welke
ontologie (SUPER) context
constructen in koppeling tussen
ontologie als klasse, domein- en BPMN BPMO; is domein- bijna één-op-één subsumptie (a.d.h.v.
mapping instantiëren en linken ontologie gebeurt via en organisatie- mapping voor subClass of is-a
a.d.h.v. matchmaking overschrijdend UML relatie)
eigenschappen functionaliteit
enterprise beperkt tot
sBPMN en metamodel,
procesmodellen, optimaal herbruik
herbruikbaarheid domeintontologieën domeinontologie
standaarden, ODF procesmodellen
Bron: eigen analyse.
130
4 Semantic Business Process Management

4.6.3 Ontologie-ontwerp
Een belangrijke vaststelling uit vorige analyse, zijn de verschillende manieren waarop de
domeinontologieën en ontologieën in het algemeen worden ontworpen. Born, Dörr en We-
ber (2007) linken de elementen van bedrijfsprocessen aan de elementen van een ontologie
die bestaan uit objecten, states, transities en acties beschrijven. Er zijn verschillende
aspecten die men in overweging moet nemen, afhankelijk van het doel dat men wenst
te bereiken. Daardoor kunnen de uitwerkingen fel van elkaar verschillen, juist omdat er
veel manieren zijn waarop men een ontologie kan vormgegeven.

Madsen (2004) introduceert in zijn dissertatie een aantal invalshoeken om ontologieën te


ontwerpen (zie Figuur 4.10). Bij een conceptuele benadering worden eerst de categorieën
bepaald voor een upper ontologie. Dit wordt aangevuld met conceptuele modellen voor
een bepaald domein. In tegenstelling tot de conceptuele benadering, is de linguïstische
benadering taal-specifiek. Semantische “lexiconen” leggen relaties tussen woorden en
omvatten de benodigde woordenschatten. Tenslotte, bij een intermediaire of gecombi-
neerde benadering worden terminologie modellen opgesteld (woorden en zinnen), maar
dan specifiek per domein.

Figuur 4.10: Aspecten en opties binnen een ontologie.

ontologie

gezichtspunt niveau onderwerp doel taal formalisering

filosofische pragmatische taak-specifieke taak-


formele informele
ontologie ontologie ontologie onafhankelijke
ontologie ontologie
ontologie
universele domeinspecifieke algemene
ontologie ontologie taal- taal-
ontologie onafhankelijke afhankelijke
ontologie ontologie
top level specifieke
ontologie ontologie
applicatie-
specifieke
ontologie

Bron: gebaseerd op Madsen (2004), Terminological ontologies.

131
4 Semantic Business Process Management

4.6.4 Ontwikkeling van ontologieën


Hiervoor werden verschillende manieren beschreven voor het ontwerpen van één ontologie.
Maar wat hoe verloopt de constructie wanneer er meerdere ontologieën in het spel zijn
en hoe deze afstemmen?

Eerst en vooral, het is onwaarschijnlijk dat men vanuit het louter aggregeren van de
domein-specifieke en domein-onafhankelijke ontologieën tot complete traceerbaarheid
komt zoals Jacobson (1999) die met zijn Unified Software Development voorziet. Hiervoor
is een methodologie nodig, zoals het SUPER-raamwerk. Het raamwerk zorgt voor de
integratie van heterogene bedrijfsprocessen, de bouw van ondersteunende ontologieën
om snel te kunnen reageren op de veranderingen in interne- en exteren omgeving en een
mediatie-laag die zorgt voor de snelle doorstroming van kennis. SUPER meent indirect
dat traceerbaarheid in theorie mogelijk is, maar zover ik weet zijn er nog geen empirische
bewijzen. De mapping is en blijft nog zeer complex, waardoor de traceerbaarheid van
organisationeel niveau tot programmacode uitblijft.

Alleen al de constructie van ontologieën is zeer moeilijk, kostbaar en tijdrovend (Gruninger


en Lee, 2002). We nemen hier gedeeltelijk de ideeën van Claassens (2007) over. In plaats
van een formele benadering te hanteren, is het daarom interessant om een pragmatische
ingesteldheid te hanteren. In de bibliotheekwetenschappen heeft men reeds talrijke jaren
ervaring met het ontwikkelen van taxonomieën.

Twee mogelijke manieren zijn de de enumeratieve- en faceted-aanpak. Bij een enumeratieve-


aanpak vertrekt men van een kennisdomein, hetwelk verdeeld wordt in engere klassen die
alle mogelijke subklassen omvatten. Ranganathan (1967) baseert zich met zijn faceted-
aanpak op het uitsplitsen van complexe subjecten in beperkte domeinen, in groepen
van simpele concepttermen (facets). Deze facets worden vervolgens samengevat in een
gecontroleerde woordenschat. Prieto-Diaz (2003) past deze faceted-aanpak toe op onto-
logieën (zie Figuur 4.12). Vanuit de aanwezige expertise wordt er top-down een intiële
classificatiehiërarchie opgesteld. Vervolgens worden de gerelateerde termen bottom-up
in categorieën gegroepeerd. Tenslotte wordt de classificatiehiërarchie aan de hand van
een iteratief proces met de gecreëerde clusters vergeleken. Op basis daarvan kunnen
aanpassingen doorgevoerd worden. Het resultaat is een praktische en bruikbare aanpak
van ontologieën die geen formele axioma’s bevatten, maar wel structuur biedt voor een
gecontroleerde woordenschat die op informele wijze concepten definieert.

Tot slot verwijzen we nog naar De Leenheer (2009), omdat zijn aanpak pragmatiek
en formalisering combineert. In zijn dissertatie introduceert hij binnen het Business
Semantics Framework een generieke en pragmatische modelleringsmethode die op basis
van korte iteraties omgaat met de dynamische omgeving. De modelleringsmethode bestaat
uit twee cycli die elk een aantal modelleringsactiviteiten groeperen. De twee proces-
sen die centraal staan, zijn met name semantic reconciliation en semantic application,
in deze scriptie vrij vertaald naar semantische overeenstemming en semantische applicatie.

132
4 Semantic Business Process Management

Figuur 4.11: De modelleringsmethode binnen het Business Semantics Framework bestaat


uit twee cycli die elk een aantal modelleringsactiviteiten groeperen.
Semantische Overeenstemming Semantische Applicatie

Scope Creeër Verfijn Articuleer Unificeer Selecteer Compromitteer

Bron: De Leenheer (2009), On Community-based Ontology Evolution.

In de eerste stap wordt de bedrijfssemantiek gemodelleerd door het extraheren, raf-


fineren, articuleren en consolideren van feiten uit bestaande bronnen, op basis van de
hierboven beschreven technieken. Uiteindelijk resulteert dit in een aantal geconsolideerde
taal-neutrale semantische patronen die zijn verwoord met informele beschrijvingen. Deze
patronen zijn herbruikbaar voor de bouw van diverse semantische toepassingen.

Semantische toepassing is de tweede cyclus binnen het Business Semantics Framework.


Tijdens deze cyclus wordt er gestreefd naar een selectie van semantische patronen binnen
bestaande informatiebronnen en diensten. Dit wordt gedaan door het selecteren van
de relevante patronen te beperken, te interpreteren en tenslotte in kaart te brengen.
Met andere woorden, een “commitment” schept een bi-directionele koppeling tussen de
bestaande gegevensbronnen en diensten enerzijds en de bedrijfssemantiek die de infor-
matie van een organisatie beschrijft. De bestaande gegevens zelf worden niet verplaatst.
Integendeel, de bedrijfssemantiek biedt een soort van abstractielaag voor toegang tot
het aanleveren van deze gegevens op een meer efficiënte wijze, closed-loop transparantie,
alignment en governance.

133
Figuur 4.12: De stappen voor een faceted-aanpak van ontologieën.

1) Top-down 2) Bottom-up
Gepostuleerde ontologie Gesynthetiseerde clusters

3) Herzien & valideren


Ontologie wordt gewijzigd

4 Semantic Business Process Management


op basis van de mapping met
de gevonden clusters
x s

t u

v w

Clusters worden
D
gemapt met E B
ontologie F C
A

Bron: gebaseerd op Prieto-Diaz (2003), A Faceted Approach to Building Ontologies.


134
5 Algemeen besluit
In dit hoofdstuk recapituleren we de bevindingen van deze scriptie, met betrekking
tot het Semantisch Web, de relatie semantiek en de onderneming, en het beheren van
bedrijfsprocessen op basis van ontologieën. In Sectie 5.1 rapporteren we de gevonden
resultaten. Op basis van deze bevindingen, geeft Sectie 5.2 een korte, doch krachtige
aanbeveling met betrekking tot de adoptie van ontologieën. Tenslotte maken we nog een
afsluitende reflectie op ontologieën.

5.1 Bevindingen
Eerst en vooral maken we de observatie dat het Semantisch Web vanuit verschillende
invalshoeken kan worden benaderd. Dit heeft zo zijn implicaties. Zo worden er wel drie
verschillende doelstellingen opgelijst: machineleesbaarheid, het uitwisselen van informatie
en het uitdrukken van domeinkennis. Ondanks de oorspronkelijke visie van Berners-Lee,
maakt dit het een dubbelzinnig en abstract begrip. Hetzelfde geldt voor ontologieën,
waarvoor, ook in de context van het Semantisch Web, talrijke definities bestaan. Vooral
het gedeelde begrip aspect komt naar voren, evenals het specificeren van iets in termen
van concepten. Vervolgens werden er verschillende modelleermethoden werden met elkaar
vergeleken, waarbij vooral de tekortkomingen van het relationeel datamodel werden
beklemtoond. Uit analyse van de verschillende lagen en bijhorende componenten van
het Semantisch Web, is gebleken dat een aantal lagen nog actief onderzoek ondergaan,
vooral in het licht van vertrouwen, cryptografie en pragmatiek. De invalshoek van de
systeemtheorie leert ons dat structuur heel diep gaat. Tenslotte zijn er tal van hindernis-
sen, die het Semantisch Web moet ondergaan. Uit de vaststelling dat er ontzettend veel
kritieken zijn, concluderen we dat het om een delicate kwestie gaat.

Semantiek in relatie met informatietechnologie en gegevensmodellen is niet nieuw. In feite


is het iets dat eerder simpel lijkt, maar wanneer het aankomt op semantiek in de context
van een gedistribueerd Web, met alles dat het vertegenwoordigt, dan zijn de uitdagingen
significant. Vele van de problemen die het Web ervaart, zijn vergelijkbaar met problemen
waar organisaties vandaag tegenaan lopen. Ofschoon het Web nog maar twintig jaar jong
is, is het niet onnuttig om deze ideeën, afhankelijk van het type organisatie, te toetsen in
de onderneming, want het Web is het enige systeem vandaag op een dergelijke schaal. Het
Semantisch Web kan werkende relationele modellen toepassen op een gedecentraliseerde
manier, wat ervoor zorgt dat interoperabiliteit- en integratrieproblemen in bedrijfsecosys-
temen op verschillende niveaus, zowel binnen als buiten vraag- en aanbodketen en tussen
sytemen, kunnen worden overbrugd. Algemeen beschouwd, wordt een “Semantische
Onderneming” waarschijnlijk gekenmerkt door informatiesystemen die de relationele

135
5 Algemeen besluit

associaties tussen objecten, gegevens en informatie zo kunnen benutten, dat bedrijfsdoel-


stellingen verwezenlijkt worden en betere beslissingen worden genomen. Vandaag zijn de
technologieën er, en de voornaamste beperkingen zijn de bedrijfsmodellen en de manier
waarop organisaties vandaag opereren en worden beheerd. Het is dan ook aan de CIO
van de organisatie om de ideale omstandigheden te creëren. Het ontwikkelen, afstemmen
en gebruikmaken van ontologieën is niet evident en vereist naast buy-in van belangrijke
medewerkers, een methodologie en raamwerk, maar ook nieuwe visualisatietools. Het
komt er op neer dat gegevens moeten worden beschouwd als een belangrijke “asset” voor
het verwezenlijken van wendbaarheid van de organisatie, evenals een strategisch middel
zijn die een belangrijke voorwaarde zijn voor een duurzame en winstgevende onderneming.

Het laatste hoofdstuk handelde over Business Process Management (BPM). Hieruit
bleek dat het significant probleem in BPM benaderingen is, dat moeilijk de brug kan
worden gemaakt tussen de organisationele context, de diverse process workflow notaties,
en de executable services die de procesactiviteiten vervullen. Als onderliggende oorzaak
voor moeilijkheden bij het automatiseren van de overgang tussen verschillende werelden,
is te wijten aan het gebrek van semantische betekenis dewelke machines vereisen voor ver-
werking. Het SBPM-raamwerk probeert deze verbinding tot stand te brengen door Web
Services en BPM te combineren. Bekeken vanuit een organisatiebrede benaderingswijze,
heeft SBPM tot doel de relevante organisatiecontext weer te geven die de noden voor
bedrijfsprocesmodellering afdekt. Er werden verschillende benaderingen voor ontologie-
gebaseerde ondersteuning van procesmodellen vergeleken. Door hun verschillende focus,
dekken ze verschillende functionele en niet-functionele vereisten af, maar bieden ze vaak
geen antwoord hoe de ontologieën kaderen in een breder organisationeel perspectief. Er
zijn wel een aantal raamwerken die de verschillende vereiste ontologieën identificeren en
concrete richtlijnen geven, maar geen enkele benadering is in staat zowel het structurele
als dynamische aspect van procesmodellen te ondersteunen. Vooral het ontwikkelen en
afstemmen van ontologieën is en blijft geen sinecure, doch wees de gevalstudie uit dat
een vertaling mogelijk is. Of ook de gesuggereerde vertalingen en werkwijzen van deze
raamwerken effectief werken, blijft een open vraag. Hoe dan ook, door bedrijfsprocessen
eveneens op een semantisch niveau te gaan beschouwen, kunnen deze betere ondersteund
worden gaande van analyse en modellering tot querying en executie.

136
5 Algemeen besluit

5.2 Aanbevelingen
Gerard Bodifée stelde in een column in De Standaard dat de moderne wetenschap droomt
van een perfect mathematiseerbare kosmos. De hele anorganische en organische werke-
lijkheid uitdrukken in klare wiskundige vergelijkingen, is volgens hem het ideaal van een
fysica die begrijpt dat het meetbare krachten zijn die de natuur voortstuwen.

De werkelijkheid in een model gieten is in theorie een verademing. Zo ook kunnen


ontologieën, bijvoorbeeld bij procesmodellen, bijzonder praktisch zijn. Echter, de realiteit
is socio-technisch, en de vele formele werkwijzen die in de literatuur worden opgeworpen
zijn in praktijk niet zo evident realiseerbaar. De aanbeveling die we dan ook kunnen
maken, voor het beheer van bedrijfsprocessen met behulp van ontologieën, is een goede
balans te zoeken tussen een pure formele- en pragmatische werkwijze, die wel dichter bij
de realiteit staat. Door enerzijds in te spelen op praktijk, maar anderzijds ook de nodige
structuren aan te brengen, is de organisatie in staat om op een verantwoorde manier om
te gaan met een steeds veranderende wereld.

Het hoofdstuk over de Semantische Onderneming formuleerde reeds concrete aandachts-


punten voor de CIO. Er werden echter nog geen aanbevelingen geponeerd voor de
Enterprise Architect. Het is immers de Enterprise Architect die de organisatie in al haar
geledingen in de gewenste richting ontwikkelt. Voor het beheren van bedrijfsprocessen
met ontologieën stellen we een stappenplan voor. We baseren ons hierbij op Pietro-Diaz
(2003) zijn werk.

De eerste stap begint van bovenaf. Aan de hand van een gepostuleerde ontologie wordt
de organisatie in kaart gebracht. Een mogelijk voorbeeld van een dergelijke ontologie
is de recent ontwikkelde org FOAF extensie1 . In stap twee worden er clusters gevormd
van onderop. Een grote uitdaging hierbij zijn het matchen van de ontologieën. Door
de heterogeniteit tussen systemen is er een grote waarschijnlijkheid dat bijvoorbeeld
klanten op een verschillende manier gedefinieerd worden. Daarom moeten er clusters
gevormd worden die deze mappen op de gepostuleerde klantenontologie. We bevelen
hierbij aan om bestaande technieken zoals K-means te gebruiken. In een tweede fase is
het belangrijk om procesmodellen semantisch te verrijken en te matchen met domeinon-
tologieën. Deze procesmodellen kunnen dan vertaald worden naar domeinontologiën die
vervolgens gemapt worden op elementen, overeenkomstig met de Normalized Systems
theorie (Mannaert en Verhelst, 2009), of zoals Born, Dörr en Weber (2007) suggeren. Op
die manier kan ook software mee-evolueren. Tenslotte, in stap drie wordt er gevalideerd.
De gepostuleerde ontologie wordt herzien op basis van de gesuggereerde mappings in de
gevonden clusters. Voor een overzicht van bestaande methodologieën verwijzen we naar
Fernández López (2002).

5.3 Verder onderzoek en reflectie op ontologieën

1
http://www.epimorphics.com/public/vocabulary/org.html

137
5 Algemeen besluit

Tot slot gaan we hier nog even dieper in op ontologieën, om alles in een beter perspectief
te kunnen plaatsen.

De toepassingsgebieden van ontologieën zijn veelzijdig. Grüninger en Uschold (1996)


onderscheiden de volgende toepassingsmogelijkheden voor ontologieën:
• communicatie tussen mensen en organisaties;

• interoperabiliteit – tussen systemen;

• software engineering – specificaties, kwaliteit, herbruikbare componenten en kennis-


verwerving.
In het begin van Hoofdstuk 3 over de Semantisch Onderneming werden de problemen
beschreven waarmee bedrijven vandaag vaak mee worden geconfronteerd. Een eerste
probleem betrof de overvloed aan informatie en de bijhorende datasilo’s. Dit is niet
meteen een toepassingsgebied die Uschold en Grüninger (1996) onderscheiden, maar in
deze scriptie werden verschillende methoden voor mediëring beschreven, ook op het gebied
van Web Services. Een tweede probleem betrof de interoperabiliteit tussen organisaties en
hun partners. Door Semantisch Web technologieën toe te passen, kan interoperabiliteit
bewerkstelligd worden op verscheidene niveaus. Tenslotte, in het laatste hoofdstuk kwam
via de gevalstudie aanbod hoe ontogieën kunnen ingezet worden ter ondersteuning van
software engineering, met behulp van een vertaling naar UML abstractieniveau. De
problemen die hier afgedekt worden op basis van ontologieën kennen echter allemaal
een verschillende niveau van verfijning, omdat ze juist problemen van verschillende orde
behandelen.

Frank Chum (2008), enterprise architect bij Chevron, beschreef een W3C meeting
van de olie en gas industrie ecosysteem, alwaar deelnemers de waarde van ontologieën in
overweging namen. De groep identificeerde drie potentiële nuttige ontologieën in de olie
en gas industrie. Zij kwamen tot de volgende resultaten:
• Upper ontologies: drukken concepten uit die niet industrie specifiek zijn (bijvoor-
beeld locatie informatie)

• Domeinontologieën: drukken concepten uit die specifiek zijn voor de industrie of


hevig worden gebruikt (zoals geologie, reservoir kenmerken of productie volumes)

• Applicatie ontologieën: drukken informatie uit dat gebruikt wordt in een bepaald
project of deskundige ervaring in industrie activiteiten (zoals informatie over geolo-
gische interpretaties of reservoir simulaties)
Ofschoon men reeds goed op weg is met het identificeren en onderkennen van verschillende
soorten ontologieën, zijn er echter geen richtlijnen rond afstemming met betrekking tot
de granulariteit van deze verschillende ontologieën. Immers, er bestaan generieke / upper
ontologieën (hoog abstractieniveau), maar ook aanvullende / dedicated ontologieën (laag
abstractieniveau), nodig om bijvoorbeeld domeinkennis te kunnen afleiden. Zo beschikt

138
5 Algemeen besluit

de DEMO2 methodologie over een interactie-, proces-, actie-, feiten- en interstrictiemodel,


die allemaal van een hoog abstractieniveau zijn, maar biedt zij geen mechanisme voor
het mappen met meer specifieke ontologieën van een laag abstractieniveau. Daarom is
het nuttig om na te denken omtrent de uitvoerbaarheid van generieke ontologieën, omdat
zij immers moeten inhaken op meer specifieke ontologieën. Dit is een goede basis voor
verder onderzoek, en ligt in het verlengende van deze scriptie. In Sectie 5.3.1 bekijken we
de voor- en nadelen van zo’n upper-ontologie, op basis van een filosofische invalshoek.
Tenslotte vragen we ons in Sectie 5.3.2 af of ontologieën een must zijn voor het Semantisch
Web.

5.3.1 De uitvoerbaarheid van upper ontologies


In informatiewetenschappen is een upper-ontologie (ook wel top-level ontologie of foun-
dation ontologie) een poging om een ontologie te beschrijven die algemene concepten
beschrijft, die hetzelfde zijn over verschillende domeinen. Het doel is dan om een groot
aantal ontologieën te gebruiken onder deze upper-ontologie. Meestal bestaat zo’n ontolo-
gie uit een hiërarchie van entiteiten en geassocieerde rules die die algemene entiteiten
proberen te beschrijven die niet tot een bepaald specifiek probleemdomein behoren (Smith,
2003).

Murray-Rust (2009) stelt dat upper-ontologieën commerciële waarde hebben, waar-


door er competitie ontstaat. Bijgevolg wordt elke gestandaardiseerde upper-ontologie
waarschijnlijk fel bekritiseerd door commerciële of politieke partijen, omdat zij hun eigen
ideeën hebben over wat bestaat. Er is daarom nood aan een objectieve methode om de
praktische performantie van verschillende benaderingen te testen.

Er bestaat momenteel geen de facto upper ontology. Een eerste voorwaarde is dat
een dergelijke ontologie neutraal, wijdverspreid en zeer expressief moet zijn. De reden
voor de afwezigheid van wijdverspreide adoptie is de complexiteit. Een upper-ontologie
bestaat meestal uit zo’n 2000 tot 10000 elementen, met complexe interacties ertussen.
De resulterende complexiteit is vergelijkbaar met die van de menselijke taal, en het
leerproces is vaak nog moeilijker omdat men onbekend is met het formaat en de op
logica gebaseerde regels. Omwille van deze complexiteit en de afwezigheid van goede
voorbeelden, zullen diegenen verantwoordelijk voor domeinontologieën zich niet baseren
op een upper-ontologie (Smith, 2003). Het debat woedt dan ook of het concept van
enkelvoudige, upper-ontologie wel haalbaar en praktisch is. Op Wikpedia (2010) worden
er voor- en tegenargumenten gegeven voor de haalbaarheid van upper-ontologieën. Deze
argumenten zijn eerder indicatie en niet-exhaustief. Argumenten waarom een upper-
ontologie niet haalbaar is, is onder andere omdat er geen vanzelfsprekende manier bestaat
om de wereld op te splitsen in de concepten. Menselijke taal is zelf reeds een arbitraire
benadering voor juist één van vele conceptuele mappen. Een mogelijke correlatie trekken
tussen Engelse woorden en een aantal intellectuele concepten is voor miserie vragen.
2
DEMO, acroniem voor Design & Engineering Methodology for Organizations, is een methode om
bedrijfsprocessen te beschrijven, waarbij het handelen van mensen centraal staat.

139
5 Algemeen besluit

Tenslotte, een hiërarchise of topologische representatie van concepten moet beginnen


van iets ontologisch, epistemologisch, linguïstisch, cultureel en uiteindelijk pragmatisch
perspectief. Zulk pragmatisme biedt geen ruimte om politieke disputen tussen personen
of groepen te filteren. Mogelijk argumenten die voor een upper-ontologie pleiten zijn
de volgende. Diegenen die twijfelen aan de mogelijkheid van een gemeenschappelijke
upper-ontologie trappen in twee vallen. Zij stellen dat er geen mogelijkheid bestaat om
een universele overeenkomst te bereiken over eender welk conceptueel schema, maar
ze negeren het feit dat een praktische gemeenschappelijke ontologie geen universele
overeenkomst vereist. Er is enkel maar ondersteuning nodig door een grote gemeenschap,
die waarde creëert voor haar ontwikkelaars op basis van interoperabiliteit. Ten tweede,
ze stellen dat ontwikkelaars van dataschema’s verschillende representaties gelijkgestemd
vinden met hun lokale inspanningen, maar ze onderkennen niet dat deze verschillende
representaties in feite logisch inconsistent zijn.

5.3.2 De nood aan ontologieën op het Semantisch Web


In Januari 2009 ontstond een interessante discussie op de Semantic Web Interest Group
mailinglijst. De observatie was dat RDF in de OWL2 specificatie niet meer zo prominent
aanwezig is als in OWL1. Terwijl de OWL1 specificatie werd geschreven met behulp
van RDF/XML voorbeelden, introduceerde OWL2 drie nieuwe representatieformaten:
Manchester, owl2xml en OWL functional. Uiteraard moeten deze representatieformaten
bekeken worden in het licht van bestaande representatieformaten (e.g., N3, Turtle, RD-
F/XML), maar dit maakt het alleen maar moeilijker om het reeds zeer complexe OWL2
te begrijpen. Het is echter het simpele en gestandaardiseerde RDF dat voor structuur
zorgt. Het schisma in de Semantisch Web gemeenschap gaat dan ook over of ontologieën
al dan niet een must zijn.

Enerzijds zijn er zij die menen dat ontologieën zeer belangrijk zijn voor het Semantisch
Web. Immers, het uitdrukken van relaties tussen concepten is in feite deze concepten
formeel definiëren. Academici zoals Frank van Harmelen proberen een meer wetenschappe-
lijke, objectieve kijk op de wereld te bewerkstelligen, maar geven daarbij niet expliciet aan
te verzaken aan de diversiteit van gedachten — het erkennen van meerdere ontologieën
die handelen over hetzelfde. Nochtans menen zij dat er bepaalde domeinen zijn waar er
wel degelijk nood is aan overeenkomst over definities. Bijvoorbeeld, een Japanse fabrikant
die werkt met een Amerikaanse fabrikant voor de constructie van vliegtuigen kan maar
beter goede afspraken maken over hoe verschillende onderdelen op elkaar bouwen.

Anderzijds zijn er zij die propageren dat ontologieën geen must zijn. Zij vinden het
desalniettemin nuttig om dingen in termen van hun relaties uit te drukken. Volgens hen
valt het niet te ontkennen dat ontologieën voor zeer veel zaken nuttig zijn. Doch, zij
stellen dat een beetje structuur heel diep gaat als men het met mensen combineert. Er
zijn ook vele andere voordelen die men verkrijgt van gestructureerde gegevens, of deze nu
een ontologie heeft of niet. Vermits ontologieën veel uitdagingen met zich meebrengen,
kan een ontologie-gebaseerde oplossing de ontwikkeling van ontologie-vrije oplossingen

140
5 Algemeen besluit

tegenhouden. Karger (2010), pleit ervoor om aanzienlijke inspanningen te leveren in


deze ontologie-vrije benaderingen, omdat ze sneller kunnen worden ontwikkeld, ze meer
problemen kunnen oplossen en omdat ze waardevol “zaaizaad” zijn als we uiteindelijk
wel ontologie-gebaseerde oplossingen inzetten. Het meeste werk van de MIT Computer
Science and Artificial Intelligence Laboratory Haystack Group reflecteert dit perspectief.
Een bijzonder voorbeeld is Exhibit3 , een raamwerk dat auteurs helpt bij de constructie
van rijke interactieve visualisaties op basis van gestructureerde gegevens, zonder daarbij
te voldoen aan ontologische vereisten. In vergelijking met platte tekst, communiceren
deze visualisaties op een meer effectieve manier wat auteurs willen communiceren, wat
een significant voordeel is van gestructureerde data zonder ontologieën. Een tweede
voordeel, als neveneffect van de gegevens die door Exhibit worden geproduceerd, is dat
deze gegevens kunnen worden gekopieerd of gedownload worden door andere gebruikers
om ze te incorporeren bij hun eigen gegevens en visualisaties. Het ontbreken van een
gemeenschappelijke ontologie, betekent dat de integrator een kleine inspanning moet
doen om de gedownloade gegevens af te stemmen met wat er reeds bestaat, maar deze
inspanning is verwaarloosbaar vergeleken met de vereiste inspanning om deze gegevens te
extraheren van ongestructureerde representaties. Anderen, zoals Siegel (2010), menen dat
er kleine stappen nodig zijn. Informatie binnen trekken (pull) in plaats van te drukken
(push), lijkt volgens hen veel effectiever dan het implementeren van ontologieën.

3
http://simile-widgets.org/exhibit

141
Bibliografie
Aberdeen Group (2006), Next-Generation Product Documentation: Getting Past the
“Throw It over the Wall” Approach, 22 blz.

Allemang, D. & Hendler, J. (2008), Semantic Web for the Working Ontologist, Burlington,
Morgan Kaufmann, 330 blz.

Allemang, D. (2008), “RDF as self-describing data”. Geraadpleegd op


2 maart 2010 uit: http://dallemang.typepad.com/my_weblog/2008/08/
rdf-as-self-describing-data.html

Alves de Medeiros, A. K. et al, “An Outlook on Semantic Business Process Mining and
Monitoring”, in: Meersman, R.; Tari, Z.; Herrore, P. et al (Eds.) (2007), OTM 2007 Ws,
Part II, LNCS 4806, blz. 1244-1255.

Anderson J. Q. & Rainie, L. (2010), The Fate of the Semantic Web, Pew Research Center,
29 blz.

Andreas, H. & Rainer, T. (1997), Continuous System Engineering. Entdeckung der


Standardsoftware als Organisator, s.l., Vogel Verlag und Druck, 170 blz.

Arens, Y.; Hsu, C. & Knoblock, C. A. (1997), “Query Processing in the SIMS Information
Mediator”, in: Huhns, M. N. & Singh, M. P. (Eds.), Readings in agents, Massachussets,
Morgan Kaufmann, blz. 82-90.

Baader, F.; Calvanese D.; McGuiness, D.; Nardi, D. & Patel-Schneider, P. (Eds.) (2003),
The Description Logic Handbook: Theory, Implementation and Applications, Cambridge,
Cambridge University Press, 574 blz.

Barabási, A. (2002), Linked: The New Science of Networks, s.l., Basic Books, 256 blz.
Bastiaansen, H. & Vrijkorte, B. (2006), “Raamwerk voor semantiek in webservices”,
Informatie, blz. 32-37.

Bergman, M. K. (2001), “The Deep Web: Surfacing Hidden Value,” The Journal of
Electronic Publishing, 7de jg., nr. 1.

Bergman, M. K. (20.7.2005), “Untapped Assets: The 3 Trillion Value of U.S. Enter-


prise Documents”. Geraadpleegd op 5 mei 2010 uit: http://www.mkbergman.com/82/
untapped-assets-the-3-trillion-value-of-us-enterprise-documents/

Bergman, M. K. (25.5.2006), “Climbing the Data Federation Pyramid”. Geraadpleegd op


22 april 2010 uit: http://www.mkbergman.com/229/

142
Bibliografie

Bergman, M. K. (22.7.2007), “More Structure, More Terminology and (hopefully) More


Clarity”. Geraadpleegd op 4 april 2010 uit:
http://www.mkbergman.com/391/
Bergman, M. K. (8.4.2009), “Advantages and Myths of RDF”. Geraadpleegd op 27 april
2010 uit: http://www.mkbergman.com/483/advantages-and-myths-of-rdf/
Bergman, M. K. (2010), “A Timeline of Information History”. Geraadpleegd op 12 mei
2010 uit: http://www.mkbergman.com/temp-exhibit/
Berners-Lee, T.; Hendler, J. & Lassila, O. (2001), “The Semantic Web,” Scientific
American Magazine.
Berners-Lee, T. (2001), “Business Model for the Semantic Web”. Geraadpleegd op 24
april 2010 uit: http://www.w3.org/DesignIssues/Business
Berners-Lee, T.; Hall, W. & Shadbolt, N. (2006), “The Semantic Web Revisited,” IEEE
Intelligent Systems, 21ste jg., nr. 3, blz. 96-101.
Berners-Lee, T. (2009), “Linked Data”. Geraadpleegd op 1 maart 2010 uit: http://www.
w3.org/DesignIssues/LinkedData.html
Berners-Lee, T.; Presbey, J. & Hollenbach, J. (2009), “Using RDF Metadata to Enable
Access Control on the Social Semantic Web”, Workshop on Collaborative Construction,
Management and Linking of Structured Knowledge, 25 oktober 2009, Washington, DC.,
USA, 10 blz.
Berners-Lee, T. (01.2007), “Semantic Web, and Other Technologies to Watch,
slide 24”. Geraadpleegd op 3 november 2009 uit: http://www.w3.org/2007/Talks/
0130-sb-W3CTechSemWeb/#%2824%29
Bernstein, A. & Klein, M. (2004), “Toward High-Precision Service Retrieval”, IEEE
Internet Computing, 8ste jg., nr. 1, blz. 30-36.
Blace, R.; Fisher, M.; Hebeler, J. & Perez-Lopez, A. (2009), Semantic Web Programming,
Wiley, 684 blz.
Bodifée, G. s.d., De Standaard
Borsje, J. & Embregts, H. (2007), “Data krijgt een nieuwe betekenis,” Informatie, mei
2007, blz. 46-49.
Born, M.; Dörr, F. & Weber, I. (2007), “User-Friendly Semantic Annotation in Business
Process Modeling”, in: Web Information Systems Engineering – WISE 2007 Workshops
(2007), blz. 260-271.
Brachman, J. R. & Nardi, D., “An Introduction to Description Logics”, in: Baader,
F.; Calvanese, D.; McGuinness, D.; Nardi, D. & Patel-Schneider, P. (Eds.) (2003), The
Description Logic Handbook – Theory, Implementation and Applications, Cambridge,
Cambridge University Press.

143
Bibliografie

Brambilla, M.; Ceri, S.; Valle, E. D. (2007), “Design Abstractions for Innovative Web
Applications: the case of the SOA augmented with Semantics”, in: Proceedings of the
4th European conference on The Semantic Web: Research and Applications, blz. 4-15.

Brickley, D. (12.2.2010), “Re: The status of Semantic Web community- perspective


from Scopus and Web Of Science (WOS)”. Geraadpleegd op 9 april 2010 uit: http:
//lists.w3.org/Archives/Public/semantic-web/2010Feb/0107.html

Brooks, F. P. (1975), The Mythical Man-Month: essays on software engineering, s.l.,


Addison-Wesley, 322 blz.

Brown, J. S.; Davidson, L.; & Hagel, J. (2010), The Power of Pull: How Small Moves,
Smartly Made, Can Set Big Things in Motion, Basic Books, 288 blz.

Burlat, P.; Izza, S. & Vincent, L., (2005), “A Unified Framework for Enterprise Integration:
An Ontology-Driven Service-Oriented Approach”, in: Proceedings of the 7the International
Conference on Enterprise Integration, blz. 78-89.

Bussler, C.; Domingue, J.; Fensel, D.; Hepp, M.; Leymann, F. & Wahler, A. (2005),
“Semantic Business Process Management: A Vision Towards Using Semantic Web Services
for Business Process Management”, in: in: Proceedings of the IEEE International
Conference on e-Business Engineering (ICEBE 2005), 18-20 oktober, 2005, Peking,
China, blz. 535-540.

Cabral, L.; Nitzsche, J. & Norton, B. (2009), “Ontology-based Translation of Business


Process Models”, in: Proceedings of the 2009 Fourth International Conference on Internet
and Web Applications and Services (ICIW) (2009 ), blz. 481-486.

Cardoso, J. & Sheth, A., “The Semantic Web and its Applications”, in: Cardoso, J. &
Sheth, A. (Eds.) (2006), Semantic Web Services, Processes and Applications, Springer,
blz. 5-36.

Carr, N. G. (2003), “IT doesn’t matter”, Harvard Business Review, 81ste jg., nr. 5, blz.
41-49.

Chaffey, D. (2007), E-Business and E-Commerce Management: Strategy, Implementation,


and Practice, New York, Pearson Prentice Hall, 696 blz.

Chen, D. & Doumeingts G. (2003), “European initiatives to develop interoperability of


enterprise applications—basic concepts, framework and roadmap”, Annual Reviews in
Control, 27ste jg., nr. 2, blz. 153-162.

Chun, S. A.; Geller, J. & Jung, Y. (2008), “Toward the Semantic Deep Web”, IEEE
Computer, 41ste jg., nr. 9, blz. 95-97.

Chum, F. (2008), in: W3C Workshop on Semantic Web in Oil & Gas Industry: Report.
Geraadpleegd op 26 februari 22-010 uit: http://www.w3.org/2008/12/ogws-report.
html

144
Bibliografie

Chute, C.; Manfrediz, A.; Minto, S. & Toncheva, A. (2008), The Diverse and Exploding
Digital Universe – An Updated Forecast of Worldwide Information Growth Through 2011,
IDC, 16 blz.
Claassens, R. (2007), “Semantische interoperabiliteit met behulp van een bedrijfsbrede
taxonomie”, Via Nova Architectura, blz. 1-15.
Clark, T.; Corlosquet, S.; Decke, S.; Delbru, R. & Polleres, A. (2009), “Produce and
Consume Linked Data with Drupal!”, in: 8th International Semantic Web Conference
(ISWC 2009), Washington, DC, USA
Darke, P. & Shanks G. (1999), “Understanding corporate models”, Information &
Management, 35ste jg., nr. 1, blz. 19-30.
Davenport, H. & Harris, J. G. (2007), Competing on analytics: the new science of winning,
Massachusetts, Harvard Business School Press, 240 blz.
Darke, P. & Shanks, G. (1999), “Understanding corporate data models”, Information
and Management, 35ste jg., nr. 1, blz. 19-30.
De Backer, C. (2005), Informatiesystemen, Universiteit Antwerpen, 138 blz.
De Leenheer, P. (2009), On Community-based Ontology Evolution, Phd Thesis, Vrije
Universiteit Brussel, 391 blz.
de Leeuw, A.C.J. (1994), Besturen van veranderingsprocessen: fundamenteel en prak-
tijkgericht management van organisatie-veranderingen, Van Gorcum & Comp B.V., blz.
65-66.
de Moor, A.; Dietz, J. L. G. & Schoop, M. (2006), “The Pragmatic Web: a manifesto”,
Communications of the ACM, 49ste jg., nr. 5., blz. 75-76.
de Moor, A. (1999), Empowering Communities: A Method for the Legitimate User-Driven
Specification of Network Information Systems, Phd Thesis, Tilburg University.
Dietz, J. L. G. (2006), Enterprise Ontology: Theory and Methodology, Berlijn, Springer,
244 blz.
Dijkstra, E. W. (1968), “The structure of ’THE’-multiprogramming system”, Communi-
cations of the ACM, 11de jg., nr. 5, blz. 341-346.
Ding, Y. (2010), “Semantic Web: Who is who in the field – A bibliometric analysis”,
Journal of Information Science, 36ste jg., nr. 2.
Ding, Y. (2007), “The Curse of Knowledge and the Semantic Web”. Geraadpleegd op 24
februari 2010 uit: http://www.semanticfocus.com/
Dittrich, K. R. & Ziegler, P., “Data Integration – Problems, Approaches, and Perspec-
tives”, in: Brinkhemper, S.; Krogstie, J. & Opdahl, A. L. (Eds.) (2007), Conceptual
Modelling in Information Systems Engineering, Berlijn, Springer, blz. 39-58.

145
Bibliografie

Doctorow, C. (26.8.2001), “Metacrap: Putting the torch to seven straw-men of the meta-
utopia”. Geraadpleegd op 9 mei 2010 uit: http://www.well.com/~doctorow/metacrap.
htm

Dumas, M.; ter Hofstede, A. H. M. & van der Aalst, W. M. P. (2005), Process-aware
Information Systems: Bridging People and Software through Process Technology, New
Jersey, Wiley, 409 blz.

Evans, C.; Segaran, T. & Taylor, J. (2009), Programming the Semantic Web, O’Reilly,
304 blz.

Euzenat, J. & Pavel, S. (2007), Ontology matching, Berlijn, Springer, 333 blz.

Evans, P.; Shulman, L. E. & Stalk, G. (1992), “Competing on capabilities: the new rules
of corporate strategy”, Harvard Business Review, 70ste jg., nr. 2, blz. 57-69.

Fazekas, G. et al (14.2.2010), “Music Ontology Specification”. Geraadpleegd op 30 maart


2010 uit: http://musicontology.com/

Fellman, M. & Thomas, O. (2007), “Semantic EPC: Enhancing Process Modeling Using
Ontology Languages, Semantic Business Processes and Product Lifecycle Management”,
in: Proceedings of the Workshop SBPM 2007.

Fensel, D. (2001), Ontologies: A Silver Bullet For Knowledge Management and Electronic
Commerce, Berlijn, Springer, 138 blz.

Fernández López, M. (2002), “Overview and Analysis Of Methodologies For Building


Ontologies”, The Knowledge Engineering Review, 17de jg., nr. 2, blz. 129-156.

Filipowska, A.; Hepp, M.; Kaczmarek, M. & Markovic, I. (2009), “Organisational


Ontology Framework for Semantic Business Process Management”, in: Proceedings of
the 12th International Conference on Business Information Systems, BIS 2009, Poznan,
Polen, blz. 1-12.

Fingar, P. & Howard, S. (2003), IT Doesn’t Matter – Business Processes Do: A Critical
Analysis of Nicholas Carr’s I.T. Article in the Harvard Business Review, Megan-Kiffer
Press, 128 blz.

Fischer, M. (1989), “A Constructibility Expert System for The Preliminary Design


of Reinforced Concrete Structure”, in: Proceedings of the 6th Conference on Civil
Engineering, ASCE, blz. 60-66.

Fischer, M.; Betts, M.; Hannus, M. et al. (1993), “Computer Integrated Construction
Framework”, in: First International Conference on the Management of Information,
Singapore, blz. 60-66.

Fitzgerald, W. M. & Foley, S. N. (2008), “Semantic Web and firewall alignment”, in:
IEEE 24th International Conference on Data Engineering Workshop, Cancun, Mexico,
blz. 447-453.

146
Bibliografie

Francescomarino, C. D.; Ghidini, C.; Rospocher, M.; Serafini, L. & Tonella,


P.,“Semantically-aided business process modeling”, in: Bernstein, A.; Karger, D. R.;
& Heath, T. (Eds.) (2009), 8th International Semantic Web Conference (ISWC2009),
Washington, DC, USA, blz. 114-129.

Frankel, D.; Hayes, P.; Kendall, E. & McGuinness, D. (2004), “The Model Driven
Semantic Web”, in: 1st International Workshop on the Model-Driven Semantic Web.

Gärdenfors, P., “How to make the Semantic Web more semantic”, in: Varzi, A. C. &
Vieu, L. (Eds.) (2004), Formal Ontology in Information Systems, s.l., IOS Press, blz.
19-36

Gibbons, J. & Wong, P. Y. H. (2008), “A Relative Timed Semantics for BPMN”, in: In
Proceedings of 7th International Workshop on the Foundations of Coordination Languages
and Software Architecturs (ENTCS).

Goel, K.; Ramanathan, V. & Hansson, O. (1.11.2009), “Introducing Rich Snippets”. Ge-
raadpleeg op 7 november uit: http://googlewebmastercentral.blogspot.com/2009/
05/introducing-rich-snippets.html

Goer, E. (22.9.2008), “Evan Goer, SearchMonkey Support for RDFa Enabled”. Geraad-
pleegd op 6 november 2009 uit: http://developer.yahoo.net/blog/archives/2008/
09/searchmonkey_support_for_rdfa_enabled.html

Goh, C. H. (1997), Representing and reasoning about semantic conflicts in hetereogeneous


information systems, Phd Thesis, Massachusetts Institute of Technology.

Gruber, R.T. (1993), “A Translation Approach to Portable Ontology Specifications”,


Knowledge Acquisition, 5de jg., nr. 2, blz. 199-220.

Grüninger, M. & Uschold, M. (1996), “Ontologies: principles, methods, and applications”,


Knowledge Engineering Review, jg 11, nr. 2, blz. 93-136.

Grüninger, M. & Lee, J. (2002), “Ontology Applications and Design”, Communications


of the ACM, 45ste jg., nr. 2, blz. 39-41.

Hailpern, B. & Tarr, P. (2006), “Model-driven development: The good, the bad, and the
ugly”, IBM Systems Journal, 45ste jg., nr. 3, blz. 451-461.

Haselden, K. & Wolter, R. (2006), “The What, Why, and How of Master Data Manage-
ment”, Microsoft Corporation.

Halevy, A.; Norvig, P. & Pereira, F. (2009), “The Unreasonable Effectiveness of Data,”
IEEE Intelligent Systems, 24ste jg., nr. 2, blz. 8-12.

Hammer, M. & McLeod, D. (1981), “Database Descriptions with SDM: A Semantic


Database Model”, ACM Transactions on Database Systems, 6de jg., nr. 3, blz. 351-386.

147
Bibliografie

Hammer, M. (1990), “Reengineering work: don’t automate, obliterate”, Harvard Business


Review, 68ste jg., nr. 4, blz. 104-112.
Hayes, P. (2009), “BLOGIC”. Geraadpleegd op 17 mei 2010 uit: http://www.slideshare.
net/PatHayes/blogic-iswc-2009-invited-talk
Heflin, J. & Hendler, J. (2001), “A Portrait of the Semantic Web,” IEEE Intelligent
Systems, 16de jg., nr. 2, blz. 54-59.
Hellerstein, J. & Stonebraker, M., “What Goes Around Comes Around”, in: Hellerstein,
M. & Stonebraker, M. (Eds), Readings in Database Systems, MIT Press, Cambridge, MA,
blz. 2-41.
Hendler, J. (2008), “Web 3.0: Chicken Farms on the Semantic Web”, IEEE Computer,
41ste jg, nr. 1, blz. 106-108.
Hepp, M. (2007), “Possible Ontologies: How Reality Constraints the Development of
Relevant Ontologies”, IEEE Internet Computing, 11de jg., nr. 1, blz. 90-96.
Hepp, M. & Roman, D. (2007), “An Ontology Framework for Semantic Business Process
Management”, in: Proceedings of the 8th International Conference Wirtschaftsinformatik
2007, 28 februari - 2 maart, 2007, Karlsruhe, Duitsland, blz. 423-440.
Herman, I. (2009), “State of the Semantic Web”, The Third Chinese Semantic Web
Symposium, Nanjing, China
Herrero, P. et al (2007), “An Outlook on Semantic Business Process Mining and Monito-
ring”, in: Lecture Notes in Computer Science, Berlijn, Springer, blz. 1244-1255.
Himmelstein, D.; Wolfe, S. & Woolhander, S. (2004), “Administrative Waste in the U.S.
Healthcare System in 2003”, Internation Journal of Health Services, 34ste jg., nr. 1, blz.
79-86.
Hinssen, P. (16.3.2010), “The New Normal”, Congres Intranet 2010, Utrecht. Geraad-
pleegd op 15 mei 2010 uit: http://www.neonormal.com/downloads
Hitzler, P.; Krötzsch, M., & Rudolph, S. (2009), Foundations of Semantic Web technologies,
s.l., Chapman & Hall, 455 blz.
Hoffman, J.; Mendling, J. & Weber, I. (2008), “Semantic Business Process Validation”,
in: Proceedings of the Workshop on Semantic Business Process and Product Lifecycle
Management (SBPM).
Hübner et al (2001), “Ontology-Based Integration of Information: A Survey of Existing
Approaches”, in: Workshop: Ontologies and Information Sharing, blz. 108-117.
Illaramendi, A.; Kashyap, V.; Mena, E. & Sheth, A. (1996), “OBSERVER: An Approach
for Query Processing in Global Information Systems based on Interoperation across
Pre-existing Ontologies”, in: Proceedings of the First IFCIS International Conference on
Cooperative Information Systems, IEEE Computer Society, blz. 14

148
Bibliografie

ISO 14825 (1999), Industrial automation systems and integration – Concepts and rules
for enterprise models, 93 blz.

ISO/IEC 11179-1 (1999), Information Technologie – Metadata Registries (MDR) – Part


1: Framework, ISO, Geneva, 32 blz.

Jackson, M. (1983), System Development, Michigan, Prentice Hall, 418 blz.

Jacobson, I.; Booch, G. & Rumbaugh, J. (1999), The Unified Software Development
Process, s.l., Addison-Wesley, 463 blz.

Karger, D. (2010), “The Semantic Web: do we need ontologies?”, 16 mei 2010, E-mail
van karger@mit.edu

Keller, G.; Nüttgens, M. & Scheer, A. W. et al (1992), “Semantische Prozessmodellierung


auf der Grundlage Ereignisgesteuerter Prozessketten (EPK)”, Veröffentlichung des Institus
für Wirtschaftsinformatik, Saarbrücken, s.n., 31 blz.

Kendall, E.; Oberle, D.; Pan, J. Z.; Tetlow, P.; Uschold, M. &Wallace, E. (2006),
“Ontology Driven Architectures and Potential Uses of the Semantic Web in Systems and
Software Engineering”, W3C. Geraadpleegd op 21 maart 2010 uit: http://www.w3.org/
2001/sw/BestPractices/SE/ODA/

Klein, M. C. A. (2004), Change Management for Distributed Ontologies, Phd Thesis,


Vrije Universiteit Brussel, 206 blz.

Kosanke, K. & Nell, J. G. (1997), “Enterprise Engineering and Integration: Building


International Consensus”, in: International Conference on Enterprise Integration and
Modelling Technology, Springer, blz. 613-623.

Koschmider, A. & Oberweis, A. (2005), “Ontology Based Business Process Description”,


in: Proceedings of the CAiSE-05 Workshops, LCNS 2005, blz. 321-333.

Kruchten, P. (1998), The Rational Unified Process – An Introduction, Massachusetts,


Addison-Wesley, 332 blz.

Kuriakose, J. (2009), “Understanding and Adopting Semantic Web Technology”, Cutter


IT Journal, 22ste jg., nr. 9, blz. 10-18.

Lacoul, S. (2009), “Leveraging the Semantic Web for Data Integration”, Cutter IT
Journal, 22ste jg., nr. 9, blz. 19-23.

Lankhorst et al (2005), Enterprise Architecture at Work: Modelling, Communication and


Analysise, Berlijn, Springer, 331 blz.

Laplante, P. (2009), Requirements Engineering for Software and Systems, s.l., CRC Press,
264 blz.

149
Bibliografie

Lenzerini, M. (2002), “Data integration: a theoretical perspective”, in: Symposium on


Principles of Database Systems archive Proceedings of the twenty-first ACM SIGMOD-
SIGACT-SIGART, symposium on Principles of database systems, blz. 223-246.

Leymann, F. (2006), “SUPER: Overall Architecture Description”, in: Proceedings of


BPMDS’08.

Madsen , B. N. (2004), Terminological ontologies, Phd Thesis, Kopenhagen.

Mannaert, H. & Verelst, J. (2009), Normalized Systems – Re-creating Information


Technology Based on Laws for Software Evolvability, Kermt, Koppa, 208 blz.

Markovic, I., “Advanced Querying and Reasoning on Business Process Models”, in:
Abramociwz, W. & Fensel, D. (Eds.) (2008), Lecture Notes in Business Information
Processing 7, blz. 189-200.

Martin, J. (1987), Information Engineering, Savant Institute, Carnforth, U.K., 4 volumes.

McGuiness, D. L. & van Harmelen, F. (10.2.2004), “OWL Web Ontology Language


Overview”. Geraadpleegd op 13 maart 2010 uit: http://www.w3.org/TR/owl-features/

McIlroy, M. D., “Mass produced software components”, in: Nar, P. & Randell, B. (Eds.)
(1968), NATO Conference on Software Engineering, Garmish, Duitslan, 7-11 oktober
1968, Scientfic Affair Division, NATO, Brussel, blz. 138-155.

McComb, D. (2003), Semantics in Business Systems – The Savvy Manager’s Guide,


Amsterdam; Boston e.a., Morgan Kaufmann, 399 blz.

Millar, V. E. & Porter, M. (1985), “How information gives you competitive advantage”,
Harvard Business Review, 63ste jg., nr. 4, blz. 149-160.

Miller, E. & Manola, F. (10.2.2004), “RDF Primer, W3C Recommendation”. Geraadpleegd


op 8 april 2010 uit: http://www.w3.org/TR/rdf-primer/

Mohan, P. (10.12.2009), “Online retail : How Best Buy is using Semantic Technology
to define a new trend”. Geraadpleegd op 12 december 2009 uit: http://priyankmohan.
blogspot.com/2009/12/online-retail-how-best-buy-is-using.html

Morris, W.C. (1946), Signs, language, and behavior, s.l., G. Braziller, 365 blz.

Mulder, M. & Mulder, T. (1998), “Nieuwe generaties technieken bepalen grote prijsver-
schillen”, Automatisering Gids, week 16 1998.

Murray-Rust, P. (1999), “Ontology warfare”. Geraadpleegd op 12 mei 2010 uit: http:


//www.xml.com/pub/a/1999/12/xml99/keynote.html

OASIS (2007), Web Services Business Process Execution Language, Version 2.0, 264 blz.
Oberle, D. (2006), Semantic Management of Middleware, New York, Springer, 267 blz.

150
Bibliografie

Object Management Group (2005), Unified Modeling Language: Superstructure, version


2, 214 blz.

Object Management Group (2006), Meta Object Facility, Version 2.0, 76 blz.

Object Management Group (2008), Semantics Of Business Vocabulary And Business


Rules (SBVR), Version 1.0, 422 blz.

Object Management Group (2009), Ontology Definition Metamodel (ODM), Version 1.0,
334 blz.

Object Management Group (2010), BPMN v2.0 Beta 1, 466 blz.

Ogden, C. K. & Richards, I. A. (1923), Meaning Of Meaning, s.l., Mariner Books, 363
blz.

Ouksel, A. M. & Sheth, A. (1999), “Semantic interoperabilithy in global information


systems”, ACM SIGMOD Records, 28ste jg., nr. 1, blz. 5-12.

Pelgrim, M. (30.12.2002), “The tag soup of a new generation”. Geraadpleegd op 10


mei 2010 uit: http://diveintomark.org/archives/2002/12/30/the_tag_soup_of_
a_new_generation

Pesic, M. & van der Aalst, W. M. P., “Specifying, Discovering, and Monitoring Service
Flows: Making Web Services Process-Aware”, in: Baresi, L. & Di Nitto, E. (Eds.) (2007),
Test and Analysis of Web Services, Berlijn, Springer, blz. 11-56.

Petri, C. A. (1962), Kommunikation mit Automaten, Phd Thesis, Mathematisches Institu


der Universtät Bonn.

Petrie, C. J. (1992), “Enterprise Integration Modeling”, in: Proceedings of the First


International Conference, MIT Press, 570 blz.

Prieto-Diaz, R. (2003), “A Faceted Approach to Building Ontologies”, in: Proceedings of


IEEE International Conference on Information Reuse and Integration (IRI 2003), blz.
458-465.

Pisano, G.; Shuen, A. & Teece, D. (1997), “Dynamic Capabilities and Strategic Manage-
ment”, Strategic Management Journal, 18de jg., nr. 7, blz. 509-533.

Porter, M. (1985), Competitive Advantage: Creating and Sustaining Superior Performance,


s.l., Free Press, 592 blz.

PricewaterhouseCoopers (2009), Technology Forecast, Spring 2009, 55 blz.

Ranganathan, S. R. (1967), Prolegomena to Library Classification, s.l., Advent Books


Division, 640 blz.

Rittgen, P. (2008), Handbook of Ontologies for Business Interaction, s.l., Information


Science Reference, 452 blz.

151
Bibliografie

Scheer, A-W. (1998), Vom Geschäftsprozess zum Anwendungssystem, Berlijn, Springer,


186 blz.

Scheer, A-W. & Thomas, O. (2006), “Tool Support for the Collaborative Design of
Reference Models – A Business Engineering Perspective”, in: Proceedings of the 39th
Annual Hawaii International Conference on System Sciences, IEEE Computer Society
Press, Los Alamitos.

Sheth, A., “Changing Focus on Interoperability in Information Systems: from System,


Syntax, structure to Semantics”, Goodchild, M.; Egenhofer, M.; Fegeas, R. & Kottman,
C. (Eds.) (1998), Interoperating Geographic Information Systems, Massachusetts, Kluwer
Academic, blz. 5-30.

Shirky, C. (7.11.2003), “The Semantic Web, Syllogism, and Worldview”. Geraadpleegd


op 10 mei uit: http://www.shirky.com/writings/semantic_syllogism.html

Siegel, D. (2010), Pull: The Power of the Semantic Web to Transform Your Business,
Penguin Group, 288 blz.

Smith, B. (2003), The Blackwell guide to the philosophy of computing and information,
New York, Wiley Blackwell, blz. 155-166.

Smith, D. C. P. & Smith, J. M. (1977), “Database Abstractions: Aggregation and


Generalization”, ACM Transactions on Database Systems, 2de jg., nr. 2, blz. 105-133.

Sneller, L. (2007), Basisboek ERP, Amsterdam, Uitgeverij Tutein Nolthenius, 172 blz.

Sowa, J.F. (1999), Knowledge Representation: Logical, Philosophical, and Computational


Foundations, s.l., Brooks Cole Publishing, 594 blz.

Sviokla, J. & Rayport, J. (1996), “Exploiting the virtual value-chain”, The McKinsey
Quarterly, nr. 1, blz. 20-37.

Sykes, R. & Wilcocks, L. P. (2000), “The role of the CIO and the IT function in ERP”,
Communications of the ACM, 43ste jg., nr. 4, blz. 22-28.

Thomas, O. (2007), “Joint Reference Modeling: Collaboration Support through Version


Management”, in: Proceedings of the 40th Annual Hawaii International Conference on
System Sciences, Big Island, Hawaii, IEEE Computer Society Press, blz. 9.

Van den Bergh, K. (2009), “Flexibel beheer van gedistribueerde sociale netwerksites met
FOAF+SSL”, Security Management, Universiteit Antwerpen, 10 blz.

Vernadat, F. (1996), Enterprise Modeling and Integration: Principles and Application,


Londen, Chapman Hall, 496 blz.

W3C Semantic Web Education & Outreach Interest Group (SWEO) (2010), “Lin-
king Open Data”. Geraadpleegd op 6 maart 2010 uit: http://esw.w3.org/SweoIG/
TaskForces/CommunityProjects/LinkingOpenData

152
Bibliografie

W3C (2004), “Web Services Glossary”. Geraadpleegd op 16 mei 2010 uit: http://www.
w3.org/TR/ws-gloss/

Wikipedia (2010), “The Semantic Web”. Geraadpleegd op 4 januari 2010 uit: http:
//en.wikipedia.org/wiki/Semantic_Web

Wikpedia (2010), “Zeven bruggen van Koningsbergen”. Geraadpleegd op 22 februari 2010


uit: http://nl.wikipedia.org/wiki/Zeven_bruggen_van_K%C3%B6nigsberg

Wikipedia (2010), “Data Integration”. Geraadpleegd op 22 mei 2010 uit: http://en.


wikipedia.org/wiki/Data_integration

Wikpedia (2010), “Upper ontology (information science)”. Geraadpleegd op 23 mei 2010


uit: http://en.wikipedia.org/wiki/Upper_ontology_%28information_science%29

Wright, A. (2008), “Searching the Deep Web,” Communications of the ACM, 51ste jg.,
nr. 10, blz. 14-15.

153
Bijlage A: UML-diagram prijsbeheer
154
Bijlage B: OWL-output prijsbeheer
1 <? x m l v e r s i o n=" 1 . 0 " e n c o d i n g="UTF−8" ?>
2 <r d f : R D F x m l n s : r d f=" h t t p : //www. w3 . o r g /1999/02/22 − r d f −s y n t a x−n s#" x m l n s : o w l=" h t t p : //www. w3 . o r g
/ 2 0 0 2 / 0 7 / owl#" x m l n s : r d f s=" h t t p : //www. w3 . o r g / 2 0 0 0 / 0 1 / r d f −schema#" x m l n s : x s d=" h t t p : //www. w3 .
o r g / 2 0 0 1 /XMLSchema#">
3 <o w l : C l a s s r d f : I D=" Customer " />
4 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c u s t o m e r I D ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
5 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" customerName ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
6 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" f i r s t N a m e ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
7 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" g e n d e r ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
8 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" b i r t h D a t e ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d a t e " /></ o w l : D a t a t y p e P r o p e r t y>
9 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c u s t o m e r A d d r e s s ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /></
o w l : D a t a t y p e P r o p e r t y>
10 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" income ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#f l o a t " /></ o w l : D a t a t y p e P r o p e r t y>
11 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r o f e s s i o n ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
12 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" e d u c a t i o n ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
13 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c u s t o m e r L i f e T i m e V a l u e ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
14 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c u s t o m e r R i s k ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#f l o a t " /></ o w l : D a t a t y p e P r o p e r t y>
15 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" m a r i t a l S t a t u s "> < r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
16 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c u s t o m e r S p o u s e ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /> </
o w l : D a t a t y p e P r o p e r t y>
17 <o w l : C l a s s r d f : I D=" Customer " />
18 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c u s t o m e r I D ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
19 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" customerName ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
20 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" f i r s t N a m e ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
21 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" g e n d e r ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
22 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" b i r t h D a t e ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d a t e " /></ o w l : D a t a t y p e P r o p e r t y>
23 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" income ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#f l o a t " /></ o w l : D a t a t y p e P r o p e r t y>
24 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r o f e s s i o n ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
25 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" e d u c a t i o n ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
26 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c u s t o m e r L i f e T i m e V a l u e ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
27 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c u s t o m e r R i s k ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#f l o a t " /></ o w l : D a t a t y p e P r o p e r t y>
28 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" m a r i t a l S t a t u s ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
29 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" a d d r e s s ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /></
o w l : D a t a t y p e P r o p e r t y>
30 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" l a s t P r i c e Q u o t a t i o n ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /></
o w l : D a t a t y p e P r o p e r t y>
31 <o w l : C l a s s r d f : I D=" C o m m e r c i a l Pr o d u c t " />
32 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c o m m e r c i a l P r o d u c t I D ">< r d f s : d o m a i n r d f : r e s o u r c e=" C o m m e r c i a l P r o d u c t " /
>< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></
o w l : D a t a t y p e P r o p e r t y>
33 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c o m m e r c i a l P r o d u c t C o s t ">< r d f s : d o m a i n r d f : r e s o u r c e=" C o m m e r c i a l P r o d u c t
" />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></
o w l : D a t a t y p e P r o p e r t y>
34 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" commercialProductName ">< r d f s : d o m a i n r d f : r e s o u r c e=" C o m m e r c i a l Pr o d u c t
" />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></
o w l : D a t a t y p e P r o p e r t y>
35 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c o m m e r c i a l P r o d u c t D e s c r i p t i o n ">< r d f s : d o m a i n r d f : r e s o u r c e="
C o m m e r c i a lP r o d u c t " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></
o w l : D a t a t y p e P r o p e r t y>
36 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c o m m e r c i a l P r o d u c P r i o r i t y ">< r d f s : d o m a i n r d f : r e s o u r c e="
C o m m e r c i a lP r o d u c t " /></ o w l : D a t a t y p e P r o p e r t y>
37 <o w l : C l a s s r d f : I D=" Customer " />
38 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" r i s k ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " />< r d f s : r a n g e r d f : r e s o u r c e
=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
39 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" ID ">< r d f s : d o m a i n r d f : r e s o u r c e=" Customer " />< r d f s : r a n g e r d f : r e s o u r c e="
h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
40 <o w l : C l a s s r d f : I D=" SegmentProduct " />
41 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t P r o d u c t I D ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>

155
42 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" SegmentRisk ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
43 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" n e g o t i a b i l t y ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#B o o l e a n " /></ o w l : D a t a t y p e P r o p e r t y>
44 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" SegmentProductMargin ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
45 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r i c e S e n s i t i v i t y ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
46 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r o d u c t i o n C o s t ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
47 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" r i s k W e i g h i n g ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
48 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r o d u c t i o n C o s t W e i g h i n g ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /
>< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></
o w l : D a t a t y p e P r o p e r t y>
49 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" w e i g h t e d T o t a l C o s t ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
50 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" t o t a l P r i c e ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
51 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" l a s t P r i c e S e t t i n g ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /></
o w l : D a t a t y p e P r o p e r t y>
52 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t P r o d u c t P r i o r i t y ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /
>< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y
>
53 <o w l : C l a s s r d f : I D=" P r o d u c t M a r g i n " />
54 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" margin ">< r d f s : d o m a i n r d f : r e s o u r c e=" P r o d u c t M a r g i n " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
55 <o w l : C l a s s r d f : I D=" S a l e s C h a n n e l " />
56 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c h a n n e l I D ">< r d f s : d o m a i n r d f : r e s o u r c e=" S a l e s C h a n n e l " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
57 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" channelName ">< r d f s : d o m a i n r d f : r e s o u r c e=" S a l e s C h a n n e l " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
58 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c h a n n e l D e s c r i p t i o n ">< r d f s : d o m a i n r d f : r e s o u r c e=" S a l e s C h a n n e l " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
59 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c h a n n e l D i s c o u n t ">< r d f s : d o m a i n r d f : r e s o u r c e=" S a l e s C h a n n e l " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
60 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c h a n n e l C o s t s ">< r d f s : d o m a i n r d f : r e s o u r c e=" S a l e s C h a n n e l " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
61 <o w l : C l a s s r d f : I D=" P r i c e Q u o t a t i o n " />
62 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" q u o t a t i o n I D ">< r d f s : d o m a i n r d f : r e s o u r c e=" P r i c e Q u o t a t i o n " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
63 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r i c e O f f e r ">< r d f s : d o m a i n r d f : r e s o u r c e=" P r i c e Q u o t a t i o n " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
64 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r i c e Q u o t a t i o n D a t e ">< r d f s : d o m a i n r d f : r e s o u r c e=" P r i c e Q u o t a t i o n " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
65 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" v a l i d i t y ">< r d f s : d o m a i n r d f : r e s o u r c e=" P r i c e Q u o t a t i o n " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#B o o l e a n " /></ o w l : D a t a t y p e P r o p e r t y>
66 <o w l : C l a s s r d f : I D=" C o m p e t i t o r P r o d u c t " />
67 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c o m p e t i t t o r P r o d u c t I D ">< r d f s : d o m a i n r d f : r e s o u r c e=" C o m p e t i t o r P r o d u c t "
/>< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></
o w l : D a t a t y p e P r o p e r t y>
68 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r i c e ">< r d f s : d o m a i n r d f : r e s o u r c e=" C o m p e t i t o r P r o d u c t " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
69 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" name ">< r d f s : d o m a i n r d f : r e s o u r c e=" C o m p e t i t o r P r o d u c t " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
70 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" d e s c r i p t i o n ">< r d f s : d o m a i n r d f : r e s o u r c e=" C o m p e t i t o r P r o d u c t " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
71 <o w l : C l a s s r d f : I D=" N e g o t i a t i o n M a r g i n " />
72 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" n e g o t i a t i o n I D ">< r d f s : d o m a i n r d f : r e s o u r c e=" N e g o t i a t i o n M a r g i n " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
73 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" d i s c o u n t ">< r d f s : d o m a i n r d f : r e s o u r c e=" N e g o t i a t i o n M a r g i n " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
74 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" b o t t o m L i n e ">< r d f s : d o m a i n r d f : r e s o u r c e=" N e g o t i a t i o n M a r g i n " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
75 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" r e l e v a n t C u s t o m e r "> < r d f s : d o m a i n r d f : r e s o u r c e=" N e g o t i a t i o n M a r g i n " /><
/ o w l : D a t a t y p e P r o p e r t y>
76 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" r e l e v a n t P r o d u c t ">< r d f s : d o m a i n r d f : r e s o u r c e=" N e g o t i a t i o n M a r g i n " /></
o w l : D a t a t y p e P r o p e r t y>
77 <o w l : C l a s s r d f : I D=" Segment " />
78 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" segmentID ">< r d f s : d o m a i n r d f : r e s o u r c e=" Segment " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
79 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t D e s c r i p t i o n ">< r d f s : d o m a i n r d f : r e s o u r c e=" Segment " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
80 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" sementName ">< r d f s : d o m a i n r d f : r e s o u r c e=" Segment " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
81 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t R i s k ">< r d f s : d o m a i n r d f : r e s o u r c e=" Segment " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
82 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" r i s k W e i g h i n g ">< r d f s : d o m a i n r d f : r e s o u r c e=" Segment " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
83 <o w l : C l a s s r d f : I D=" P r i c e S e t t i n g " />
84 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r i c e S e t t i n g I D ">< r d f s : d o m a i n r d f : r e s o u r c e=" P r i c e S e t t i n g " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
85 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c u s t o m e r P r i c e ">< r d f s : d o m a i n r d f : r e s o u r c e=" P r i c e S e t t i n g " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>

156
86 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r i c e S e t t i n g D a t e ">< r d f s : d o m a i n r d f : r e s o u r c e=" P r i c e S e t t i n g " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
87 <o w l : C l a s s r d f : I D=" S e t t i n g H a n d l e r " />
88 <o w l : C l a s s r d f : I D=" Facade " /><o w l : C l a s s r d f : I D=" C l a s s 1 " />
89 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" k l l ">< r d f s : d o m a i n r d f : r e s o u r c e=" C l a s s 1 " /></ o w l : D a t a t y p e P r o p e r t y>
90 <o w l : C l a s s r d f : I D=" T r a n s a c t i o n " /><o w l : D a t a t y p e P r o p e r t y r d f : I D=" t r a n s a c t i o n I D "><
r d f s : d o m a i n r d f : r e s o u r c e=" T r a n s a c t i o n " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /
XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
91 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" t r a n s a c t i o n C o s t ">< r d f s : d o m a i n r d f : r e s o u r c e=" T r a n s a c t i o n " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
92 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" t r a n s a c t i o n N a m e ">< r d f s : d o m a i n r d f : r e s o u r c e=" T r a n s a c t i o n " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
93 <o w l : C l a s s r d f : I D=" C o m p e t i t o r P r o d u c t " />
94 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c o m p e t i t o r P r o d u c t I D ">< r d f s : d o m a i n r d f : r e s o u r c e=" C o m p e t i t o r P r o d u c t " /
>< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></
o w l : D a t a t y p e P r o p e r t y>
95 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c o m p e t i t o r P r o d u c t N a m e ">< r d f s : d o m a i n r d f : r e s o u r c e=" C o m p e t i t o r P r o d u c t
" />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></
o w l : D a t a t y p e P r o p e r t y>
96 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c o m p e t i t o r P r o d u c t P r i c e ">< r d f s : d o m a i n r d f : r e s o u r c e="
C o m p e t i t o r P r o d u c t " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></
o w l : D a t a t y p e P r o p e r t y>
97 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" m a r k e t P o s i t i o n ">< r d f s : d o m a i n r d f : r e s o u r c e=" C o m p e t i t o r P r o d u c t " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
98 <o w l : C l a s s r d f : I D=" C l a s s 2 " />
99 <o w l : C l a s s r d f : I D=" P r o d u c t C a t e g o r y " />
100 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r o d u c t C a t e g o r y I D ">< r d f s : d o m a i n r d f : r e s o u r c e=" P r o d u c t C a t e g o r y " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
101 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" productCategoryName ">< r d f s : d o m a i n r d f : r e s o u r c e=" P r o d u c t C a t e g o r y " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
102 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r o d u c t C a t e g o r y D e s c r i p t i o n ">< r d f s : d o m a i n r d f : r e s o u r c e="
P r o d u c t C a t e g o r y " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></
o w l : D a t a t y p e P r o p e r t y><o w l : C l a s s r d f : I D=" SegmentProduct " />
103 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t P r o d u c t I D ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
104 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t P r o d u c t P r i o r i t y ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /
></ o w l : D a t a t y p e P r o p e r t y>
105 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t P r o d u c t R i s k ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
106 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t P r o d u c t N e g o t i a b i l i t y ">< r d f s : d o m a i n r d f : r e s o u r c e="
SegmentProduct " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#B o o l e a n " /></
o w l : D a t a t y p e P r o p e r t y>
107 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t P r o d u c t P r i c e S e n s i t i v i t y ">< r d f s : d o m a i n r d f : r e s o u r c e="
SegmentProduct " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></
o w l : D a t a t y p e P r o p e r t y>
108 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t P r o d u c t M a r g i n ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
109 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t P r o d u c t P r o d u c t i o n C o s t ">< r d f s : d o m a i n r d f : r e s o u r c e="
SegmentProduct " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></
o w l : D a t a t y p e P r o p e r t y>
110 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t P r o d u c t R i s k W e i g h i n g ">< r d f s : d o m a i n r d f : r e s o u r c e="
SegmentProduct " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></
o w l : D a t a t y p e P r o p e r t y>
111 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t P r o d u c t W e i g h t e d T o t a l C o s t ">< r d f s : d o m a i n r d f : r e s o u r c e="
SegmentProduct " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></
o w l : D a t a t y p e P r o p e r t y>
112 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t P r o d u c t T o t a l P r i c e ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct
" />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></
o w l : D a t a t y p e P r o p e r t y>
113 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t P r o d u c t P r o d u c t i o n C o s t W e i g h i n g ">< r d f s : d o m a i n r d f : r e s o u r c e="
SegmentProduct " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></
o w l : D a t a t y p e P r o p e r t y><o w l : D a t a t y p e P r o p e r t y r d f : I D=" s e g m e n t P r o d u c t L a s t P r i c e S e t t i n g "><
r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /></ o w l : D a t a t y p e P r o p e r t y>
114 <o w l : C l a s s r d f : I D=" P r i o r i t y " /><o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r i o r i t y I D ">< r d f s : d o m a i n r d f : r e s o u r c e=
" P r i o r i t y " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></
o w l : D a t a t y p e P r o p e r t y>
115 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r i o r i t y V a l u e ">< r d f s : d o m a i n r d f : r e s o u r c e=" P r i o r i t y " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>
116 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r i o r i t y S t a r t D a t e ">< r d f s : d o m a i n r d f : r e s o u r c e=" P r i o r i t y " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d a t e " /></ o w l : D a t a t y p e P r o p e r t y>
117 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p r i o r i t y E n d D a t e ">< r d f s : d o m a i n r d f : r e s o u r c e=" P r i o r i t y " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d a t e " /></ o w l : D a t a t y p e P r o p e r t y>
118 <o w l : C l a s s r d f : I D=" A d d r e s s " /><o w l : D a t a t y p e P r o p e r t y r d f : I D=" a d d r e s s I D ">< r d f s : d o m a i n r d f : r e s o u r c e="
A d d r e s s " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></
o w l : D a t a t y p e P r o p e r t y>
119 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s t r e e t ">< r d f s : d o m a i n r d f : r e s o u r c e=" A d d r e s s " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
120 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" number ">< r d f s : d o m a i n r d f : r e s o u r c e=" A d d r e s s " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
121 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c i t y ">< r d f s : d o m a i n r d f : r e s o u r c e=" A d d r e s s " />< r d f s : r a n g e r d f : r e s o u r c e=
" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y>
122 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" p o s t a l C o d e ">< r d f s : d o m a i n r d f : r e s o u r c e=" A d d r e s s " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : D a t a t y p e P r o p e r t y>

157
123 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c o u n t r y ">< r d f s : d o m a i n r d f : r e s o u r c e=" A d d r e s s " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></ o w l : D a t a t y p e P r o p e r t y><
o w l : C l a s s r d f : I D=" C o m m e r c i a l Pr o d u c t " />
124 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c o m m e r c i a l P r o d u c t I D ">< r d f s : d o m a i n r d f : r e s o u r c e=" C o m m e r c i a l P r o d u c t " /
>< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></
o w l : D a t a t y p e P r o p e r t y>
125 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" commercialProductName ">< r d f s : d o m a i n r d f : r e s o u r c e=" C o m m e r c i a l Pr o d u c t
" />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></
o w l : D a t a t y p e P r o p e r t y>
126 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c o m m e r c i a l P r o d u c t D e s c r i p t i o n ">< r d f s : d o m a i n r d f : r e s o u r c e="
C o m m e r c i a lP r o d u c t " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#s t r i n g " /></
o w l : D a t a t y p e P r o p e r t y>
127 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c o m m e r c i a l P r o d u c t C o s t ">< r d f s : d o m a i n r d f : r e s o u r c e=" C o m m e r c i a l P r o d u c t
" />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></
o w l : D a t a t y p e P r o p e r t y>
128 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c o m m e r c i a l P r o d u c t P r i o r i t y ">< r d f s : d o m a i n r d f : r e s o u r c e="
C o m m e r c i a lP r o d u c t " /></ o w l : D a t a t y p e P r o p e r t y>
129 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" c o m m e r c i a l P r o d u c t C a t e g o r y ">< r d f s : d o m a i n r d f : r e s o u r c e="
C o m m e r c i a lP r o d u c t " /></ o w l : D a t a t y p e P r o p e r t y><o w l : C l a s s r d f : I D=" O b s e r v e r " />
130 <o w l : C l a s s r d f : I D=" M ar g eO bs e rver " /><o w l : D a t a t y p e P r o p e r t y r d f : I D=" o b s e r v e r M a r g i n "><
r d f s : d o m a i n r d f : r e s o u r c e=" Ma rg e Obse rve r " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /
XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
131 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" s u b j e c t ">< r d f s : d o m a i n r d f : r e s o u r c e=" Ma rg e Ob se r ve r " /></
o w l : D a t a t y p e P r o p e r t y>
132 <o w l : C l a s s r d f : I D=" SegmentProduct " />
133 <o w l : D a t a t y p e P r o p e r t y r d f : I D=" o b s e r v e r ">< r d f s : d o m a i n r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : D a t a t y p e P r o p e r t y>
134 <o w l : O b j e c t P r o p e r t y r d f : I D=" c o n s i s t s o f ">< r d f s : d o m a i n r d f : r e s o u r c e=" C o m m e r c i a l P r o d u c t " /><
r d f s : r a n g e r d f : r e s o u r c e=" C o mm e r c ia l Pr o duc t " /></ o w l : O b j e c t P r o p e r t y>
135 <o w l : O b j e c t P r o p e r t y r d f : I D=" h a s ">< r d f s : r a n g e r d f : r e s o u r c e=" N e g o t i a t i o n M a r g i n " /><
r d f s : d o m a i n r d f : r e s o u r c e=" P r i c e Q u o t a t i o n " /></ o w l : O b j e c t P r o p e r t y>
136 <o w l : O b j e c t P r o p e r t y r d f : I D=" i s o f f e r e d t o ">< r d f s : r a n g e r d f : r e s o u r c e=" P r i c e Q u o t a t i o n " /><
r d f s : d o m a i n r d f : r e s o u r c e=" Customer " /></ o w l : O b j e c t P r o p e r t y>
137 <o w l : O b j e c t P r o p e r t y r d f : I D=" h a s ">< r d f s : r a n g e r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : d o m a i n r d f : r e s o u r c e=" P r i c e Q u o t a t i o n " /></ o w l : O b j e c t P r o p e r t y>
138 <o w l : O b j e c t P r o p e r t y r d f : I D=" h a s ">< r d f s : r a n g e r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : d o m a i n r d f : r e s o u r c e=" C o m p e t i t o r P r o d u c t " /></ o w l : O b j e c t P r o p e r t y>
139 <o w l : O b j e c t P r o p e r t y r d f : I D=" o f f e r e d t o ">< r d f s : r a n g e r d f : r e s o u r c e=" SegmentProduct " /><
r d f s : d o m a i n r d f : r e s o u r c e=" Segment " /></ o w l : O b j e c t P r o p e r t y>
140 <o w l : O b j e c t P r o p e r t y r d f : I D=" h a s ">< r d f s : d o m a i n r d f : r e s o u r c e=" P r i c e S e t t i n g " /><
r d f s : r a n g e r d f : r e s o u r c e=" SegmentProduct " /></ o w l : O b j e c t P r o p e r t y>
141 <o w l : C l a s s r d f : I D=" C u s t o m e r T r a n s a c t i o n " />
142 <o w l : C l a s s r d f : I D=" "><o w l : s u b C l a s s O f>< o w l : R e s t r i c t i o n><o w l : o n P r o p e r t y r d f : r e s o u r c e=" Customer " /><
o w l : m i n C a r d i n a l i t y r d f : d a t a t y p e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#n o n N e g a t i v e I n t e g e r ">1</
o w l : m i n C a r d i n a l i t y></ o w l : R e s t r i c t i o n></ o w l : s u b C l a s s O f>
143 </ o w l : C l a s s>
144 <o w l : F u n c t i o n a l P r o p e r t y r d f : I D=" C u s t o m e r T r a n s a c t i o n C u s t o m e r ">< r d f s : d o m a i n r d f : r e s o u r c e="
C u s t o m e r T r a n s a c t i o n " />< r d f s : r a n g e r d f : r e s o u r c e=" Customer " /></ o w l : F u n c t i o n a l P r o p e r t y>
145 <o w l : F u n c t i o n a l P r o p e r t y r d f : I D=" C u s t o m e r T r a n s a c t i o n T r a n s a c t i o n ">< r d f s : d o m a i n r d f : r e s o u r c e="
C u s t o m e r T r a n s a c t i o n " />< r d f s : r a n g e r d f : r e s o u r c e=" T r a n s a c t i o n " /></ o w l : F u n c t i o n a l P r o p e r t y>
146 <o w l : F u n c t i o n a l P r o p e r t y r d f : I D=" C u s t o m e r T r a n s a c t i o n c u s t o m e r T r a n s a c t i o n I D "><
r d f s : d o m a i n r d f : r e s o u r c e=" C u s t o m e r T r a n s a c t i o n " /> < r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g
/ 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : F u n c t i o n a l P r o p e r t y>
147 <o w l : F u n c t i o n a l P r o p e r t y r d f : I D=" C u s t o m e r T r a n s a c t i o n ">< r d f s : d o m a i n r d f : r e s o u r c e=" " /><
r d f s : r a n g e r d f : r e s o u r c e=" C u s t o m e r T r a n s a c t i o n R " /></ o w l : F u n c t i o n a l P r o p e r t y>
148 <o w l : C l a s s r d f : I D=" S a l e s C h a n n e l P r o d u c t " />
149 <o w l : C l a s s r d f : I D=" i s s o l d t h r o u g h "><o w l : s u b C l a s s O f>< o w l : R e s t r i c t i o n><o w l : o n P r o p e r t y r d f : r e s o u r c e="
i s s o l d t h r o u g h S a l e s C h a n n e l " />
150 <o w l : m i n C a r d i n a l i t y r d f : d a t a t y p e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#n o n N e g a t i v e I n t e g e r ">1</
o w l : m i n C a r d i n a l i t y></ o w l : R e s t r i c t i o n></ o w l : s u b C l a s s O f>
151 </ o w l : C l a s s>
152 <o w l : F u n c t i o n a l P r o p e r t y r d f : I D=" S a l e s C h a n n e l P r o d u c t S a l e s C h a n n e l ">< r d f s : d o m a i n r d f : r e s o u r c e="
S a l e s C h a n n e l P r o d u c t " />< r d f s : r a n g e r d f : r e s o u r c e=" S a l e s C h a n n e l " /></ o w l : F u n c t i o n a l P r o p e r t y>
153 <o w l : F u n c t i o n a l P r o p e r t y r d f : I D=" S a l e s C h a n n e l P r o d u c t S e g m e n t P r o d u c t ">< r d f s : d o m a i n r d f : r e s o u r c e="
S a l e s C h a n n e l P r o d u c t " />< r d f s : r a n g e r d f : r e s o u r c e=" SegmentProduct " /></ o w l : F u n c t i o n a l P r o p e r t y>
154 <o w l : F u n c t i o n a l P r o p e r t y r d f : I D=" S a l e s C h a n n e l P r o d u c t s a l e s C h a n n e l P r o d u c t I D "><
r d f s : d o m a i n r d f : r e s o u r c e=" S a l e s C h a n n e l P r o d u c t " /> < r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g
/ 2 0 0 1 /XMLSchema#i n t e g e r " /></ o w l : F u n c t i o n a l P r o p e r t y>
155 <o w l : F u n c t i o n a l P r o p e r t y r d f : I D=" S a l e s C h a n n e l P r o d u c t s a l e s C h a n n e l P r o d u c t C o s t "><
r d f s : d o m a i n r d f : r e s o u r c e=" S a l e s C h a n n e l P r o d u c t " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g
/ 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : F u n c t i o n a l P r o p e r t y>
156 <o w l : F u n c t i o n a l P r o p e r t y r d f : I D=" S a l e s C h a n n e l P r o d u c t s a l e s C h a n n e l P r o d u c t D i s c o u n t "><
r d f s : d o m a i n r d f : r e s o u r c e=" S a l e s C h a n n e l P r o d u c t " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g
/ 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : F u n c t i o n a l P r o p e r t y>
157 <o w l : F u n c t i o n a l P r o p e r t y r d f : I D=" S a l e s C h a n n e l P r o d u c t s a l e s C h a n n e l P r o d u c t P r i o r i t y "><
r d f s : d o m a i n r d f : r e s o u r c e=" S a l e s C h a n n e l P r o d u c t " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g
/ 2 0 0 1 /XMLSchema#d o u b l e " /></ o w l : F u n c t i o n a l P r o p e r t y>
158 <o w l : F u n c t i o n a l P r o p e r t y r d f : I D=" i s s o l d t h r o u g h S a l e s C h a n n e l P r o d u c t ">< r d f s : d o m a i n r d f : r e s o u r c e="
i s s o l d t h r o u g h " />< r d f s : r a n g e r d f : r e s o u r c e=" S a l e s C h a n n e l P r o d u c t R " /></ o w l : F u n c t i o n a l P r o p e r t y>
159 <o w l : C l a s s r d f : I D=" CustomerSegment " />
160 <o w l : C l a s s r d f : I D=" i s p a r t o f ">
161 <o w l : s u b C l a s s O f>< o w l : R e s t r i c t i o n><o w l : o n P r o p e r t y r d f : r e s o u r c e=" i s p a r t o f C u s t o m e r " /><
o w l : m i n C a r d i n a l i t y r d f : d a t a t y p e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#n o n N e g a t i v e I n t e g e r ">0</
o w l : m i n C a r d i n a l i t y></ o w l : R e s t r i c t i o n></ o w l : s u b C l a s s O f>

158
162 </ o w l : C l a s s>
163 <o w l : F u n c t i o n a l P r o p e r t y r d f : I D=" CustomerSegmentCustomer ">< r d f s : d o m a i n r d f : r e s o u r c e="
CustomerSegment " />< r d f s : r a n g e r d f : r e s o u r c e=" Customer " /></ o w l : F u n c t i o n a l P r o p e r t y>
164 <o w l : F u n c t i o n a l P r o p e r t y r d f : I D=" CustomerSegmentSegment ">< r d f s : d o m a i n r d f : r e s o u r c e="
CustomerSegment " />< r d f s : r a n g e r d f : r e s o u r c e=" Segment " /></ o w l : F u n c t i o n a l P r o p e r t y>
165 <o w l : F u n c t i o n a l P r o p e r t y r d f : I D=" CustomerSegmentcustomerSegmentID ">< r d f s : d o m a i n r d f : r e s o u r c e="
CustomerSegment " />< r d f s : r a n g e r d f : r e s o u r c e=" h t t p : //www. w3 . o r g / 2 0 0 1 /XMLSchema#i n t e g e r " /></
o w l : F u n c t i o n a l P r o p e r t y>
166 <o w l : F u n c t i o n a l P r o p e r t y r d f : I D=" i s p a r t o f C u s t o m e r S e g m e n t ">< r d f s : d o m a i n r d f : r e s o u r c e=" i s p a r t o f " /><
r d f s : r a n g e r d f : r e s o u r c e=" CustomerSegmentR " /></ o w l : F u n c t i o n a l P r o p e r t y>
167 </ rdf:RDF>

159

Você também pode gostar