Você está na página 1de 308

N

o
dordre: 3594
THSE
Prsente devant
lUniversit de Rennes 1
pour obtenir
le grade de : DOCTEUR DE LUNIVERSIT DE RENNES 1
Mention INFORMATIQUE
par
Sbastien PARIS
quipe daccueil : Bunraku - IRISA
cole Doctorale : Matisse
Composante universitaire : IFSIC
Titre de la thse :
Caractrisation des niveaux de services
et modlisation des circulations de personnes
dans les lieux dchanges
soutenue le 10 octobre 2007 devant la commission dexamen
M. : Daniel HERMAN Prsident
MM. : Daniel THALMANN Rapporteurs
Bernard MOULIN
MM. : Cline LOSCOS Examinateurs
Jean-Louis BERROU
M. : Nicolas BONVALET Invit
M. : Stphane DONIKIAN Directeur
Les aptitudes du systme humain percevoir et identier un dbit
lev de donnes sensorielles shuntent pour la plupart lapprhen-
sion verbale et analytique. Nous sommes gnralement conscients
dune reconnaissance cognitive aprs les faits. Dans cette pers-
pective, ce que nous entendons par conscience doit tre considr
comme une aptitude rexe danalyse dont les applications sont
assez limites.
Frank Herbert, Destination : vide, 1966
iii
Remerciements
Jai volu plus de quatre ans lIRISA, au sein de lquipe SIAMES puis Bunraku, sa
nouvelle dnomination. Le temps pass (trop vite) au sein de cette quipe a marqu un
tournant de ma vie, tant professionnelle que personnelle. Laboutissement de ces quatre
ans consiste certes en lobtention de mon diplme, mais aussi en lassouvissement de
ma passion quest ltude et la modlisation du comportement humain, et enn en la
cration de certaines amitis qui, je lespre, perdureront encore longtemps.
Je tiens en premier lieu remercier mon directeur de thse scientique Stphane Doni-
kian, sans qui ces travaux nauraient jamais vu le jour. Merci tout dabord de mavoir
donn lopportunit de rejoindre lquipe SIAMES il y a plus de 4 ans au cours de mon
stage de DEA. Merci ensuite de mavoir fais conance pour ce projet ambitieux, en me
proposant le sujet de thse le plus passionnant que jaurais pu esprer. Merci ensuite
pour la grande latitude que tu mas laiss durant cette thse, tout en restant disponible
pour en xer les lignes directrices, renforant dautant plus laspect formateur de ce
doctorat. Enn, merci pour ton soutien et ton implication an que cette thse se termine
dans les meilleures conditions possibles. Je souhaite aussi remercier mon directeur de
thse industriel Nicolas Bonvalet, qui a su donner un cadre applicatif des plus motivant
ces travaux. Merci tout dabord davoir rendu ce projet possible, via une collabora-
tion avec lquipe Bunraku. Merci ensuite pour ton implication an de continuer ces
travaux avec le montage du projet SIMULEM. Merci aussi davoir facilit le dialogue
entre le monde informatique et le monde de lurbanisme et de larchitecture. Merci en-
n de mavoir laiss une grande libert concernant la modlisation thorique, tout en
me faisant bncier de lexpertise dAREP quant ltude des ux de personnes.
Je tiens ensuite remercier lensemble des membres de mon jury pour leur prsence le
jour de ma soutenance, dautant plus que certains venaient dassez loin. Ce fut un rel
honneur de prsenter mes travaux devant une assemble aussi prestigieuse quagrable.
Des remerciements personnels ne sont pas de trop. Merci au Professeur Daniel Her-
man davoir accept de prsider mon jury, ainsi que pour son discours logieux la
suite des dlibrations. Votre prsence me t dautant plus honneur que, comme vous
lavez voqu lors de la soutenance, cette thse sera peut-tre la dernire que vous
prsiderez. Merci au Professeur Bernard Moulin davoir rapport ma thse, pour lin-
trt certain quil porte mes travaux, ainsi que pour son apprciation logieuse. Votre
grande sympathie durant les quelques jours que vous avez pass Rennes locca-
sion de ma soutenance tmoigne de votre amabilit. Je tiens aussi vous remercier
tout particulirement pour votre implication an de moffrir un post-doctorat, me per-
mettant ainsi de continuer assouvir ma passion au sein de votre quipe. Merci au
Professeur Daniel Thalmann davoir rapport ma thse, pour son apprciation trs fa-
vorable de mes travaux, et pour ses compliments quant au manuscrit. Jespre que votre
v
Remerciements
venue Rennes fut agrable, et que nous aurons de nouveau loccasion de nous rencon-
trer. Merci au Docteur Cline Loscos davoir particip mon jury, pour sa sympathie
lorsque nous nous sommes rencontrs, et pour ses compliments quant au manuscrit et
la soutenance. Les quelques discussions que nous avons eu furent fort agrables, et
jespre que nous aurons lopportunit den entamer de nouvelles. Merci Monsieur
Jean-Louis Berrou davoir particip mon jury, pour ses compliments quant laccom-
plissement des travaux, ainsi que pour le regard objectif du point de vue industriel quil
a pu apporter. Je suis dsol que vous nayez pu assister la soutenance cause dalas
de transports, et tiens vous remercier pour les avis expriments que vous avez pu
mettre lors des questions du jury.
Je tiens ensuite remercier chaleureusement Fabrice (Babooz) Lamarche pour ces
presque cinq ans passs ses cts dans le "bureau du bonheur". Je ne compte plus
le nombre de discussions, toujours passionnes et parfois endiables, que nous avons
eu. Ces changes ont normment particip laboutissement de mes travaux, tout en
me permettant enn de dialoguer avec quelquun parlant le mme langage que moi
(le C++ bien entendu). Merci aussi pour tes nombreux conseils tout au long de mon
doctorat, et notamment quant la rdaction de ce manuscrit et la prparation de la
soutenance.
Je voudrais aussi remercier particulirement Julien Pettr avec qui jai eu grand plaisir
travailler depuis son arrive dans lquipe. Merci pour ta sympathie et les discus-
sions que nous avons eu quant la simulation de foules et dautres sujets. Merci aussi
pour tes conseils durant la n de ma thse, particulirement concernant la rdaction du
manuscrit et la prparation de la soutenance.
Je tiens ensuite remercier Delphine Lefebvre, notre ingnieur SIMULEM, avec qui ce
fut un plaisir de travailler. Comme je lai souvent dit, ton exprience et tes aptitudes
en dveloppement ont rellement permis de faire de ce projet une application de si-
mulation. Tu as su parfaitement grer des objectifs complexes avec une facilit et une
autonomie dconcertantes. Je te remercie tout particulirement pour les dernires se-
maines de ma thse, o tu as pris en charge llaboration de la dmonstration nale an
de rduire la saturation de mon emploi du temps.
Je voudrais aussi remercier Vincent Delannoy (avec deux n), qui fut lingnieur SIMU-
LEM pendant six mois. Tu dois tre lun des collgues (comme on dit dans le Sud) les
plus sympathiques que je nai jamais eu, tout en tant lun des plus efcaces et impli-
qus dans son travail : je nai eu le plaisir de passer des nuits blanches (de prparation
de dmo) quavec peu de personnes, et pourtant dj deux avec toi...
Je voudrais ensuite remercier plusieurs des omo zukari que je nai pas cit auparavant,
qui font de cette quipe plus quun simple lieu de travail.
Tout dabord, je remercie Bruno Arnaldi dont lesprit danalyse et de critique construc-
tive ont atteint le stade de lgende, et pour sa capacit rester accessible malgr un
agenda en mode ubiquit. Ensuite, je remercie Kadi Bouatouch qui a toujours t trs
amical, de trs bon conseil, et dont les compliments quant mon boulot mont tou-
jours soutenu. Je remercie aussi Georges Dumont pour son esprit aussi dsopilant que
diligent, contribuant faire de cette quipe un endroit si agrable. Je souhaite de plus
remercier Rmi Cozot pour sa sympathie et les discussions que nous avons pu avoir
propos du monde du jeu vido quil connat si bien. Je tiens particulirement vous
remercier tous les quatres pour vos conseils aviss quant la prparation de la soute-
nance de cette thse.
Je voudrais aussi remercier les autres permanents, Thierry Duval pour sa grande sym-
vi
Remerciements
pathie, Alain Chauffaut pour sa disponibilit, Anatole Lecuyer que jai eu le plaisir de
"rencontrer", Valrie Gouranton pour sa bonne humeur, et Yves Bekkers que jai eu le
plaisir de ctoyer durant mon passage Bunraku. Je remercie aussi Anglique Jarnoux,
notre assistante de projet, qui a toujours t agrable et avenante, et qui sest occupe
dorganiser la venue des membres de mon jury.
Dautres membres ou ex-membres de lquipe me sont aussi particulirement chers,
tant devenus des amis au l des ans. Je remercie tout dabord Marwan (KB) pour son
amiti, qui sest forge tout au long de nos annes de thse. Je te remercie de mavoir
fait dcouvrir lart culinaire Libanais, et pour tous les bons moments que nous avons
partags, que ce soit autour dune table de Donj ou dune bibine. Je remercie aussi
Nico (Lo***) [113] (NDA : a cest fait) pour son amiti, qui sest renforce depuis
cette anne lointaine o nous tions en DEA. Je te remercie pour ton attitude de bon
vivant, ton imitation Bretonne du gars du Sud, et pour tous les bons moments que nous
avons partags, le plus souvent autour dune bonne table ou dun bon verre. Je remer-
cie ensuite Nico (Maccione) et sa moiti Flo pour leur amiti, qui sest dveloppe tout
au long des annes passes Bunraku. Je vous remercie pour votre esprit ftard, votre
bonne humeur, et votre franc parl. Jespre que nous nous reverrons bientt, et que
vous comprendrez enn, en vivant en Italie, que le Sud cest quand mme vachement
mieux que la Bretagne... Je remercie aussi Jean-Marie et sa moiti Audrey pour leur
amiti, elle aussi forge durant mes annes de thse. Merci pour votre sympathie, pour
les bons petits plats que vous nous faites, et flicitations pour le petit bonhomme qui
vient juste darriver. Merci de plus Mickal (Norris), dont jai fait la connaissance
lors de mon stage de DEA et que jai eu le plaisir de retrouver la n de mon docto-
rat. Merci pour ton humour rafrachissant, de parler couramment le C++, et de veiller
sur nous grand matre de lunivers. Je remercie de mme Romain pour son amiti
dveloppe durant les trois ans que nous avons pass ensemble dans le "bureau du
bonheur". Merci pour notre diplme de ptanque, et pour tous les bons moments pas-
ss, le plus souvent avec une chope ou un dart la main. Je remercie aussi Vincent Q.
pour son amiti, rapidement forge aprs ton arrive dans Bunraku. Merci pour ton
franc parl dconcertant, ta bonne humeur, et les franches rigolades qui en dcoulent.
Je souhaite aussi remercier Xavier, lminent Yann R. (merci pour lafche de thse),
Yann, et encore Yann, Fabien (PA), Steph, Loc, Benoit, Julien, et Nico, qui participent
tous la bonne humeur qui rgne dans lquipe Bunraku.
Je remercie de plus les lles de la cafet, dont notamment Pirouette et Lolo, dont les
sourires, la bonne humeur, et les cafs mont accompagn durant ces annes de travail
intensif... Je remercie de mme le personnel technique de lIRISA, dont notamment
Alain Crenn (merci pour le DVD de la soutenance), pour leur disponibilit et efcacit.
Je voudrais ensuite remercier ma mre et son ami Jean-Paul davoir assist ma sou-
tenance, en bravant la fracheur Bretonne. Je suis content que vous ayez pu venir, et
espre que vous voyez maintenant un peu plus en quoi a consist ce doctorat.
Finalement, je voudrais grandement remercier la personne qui a le plus compte pour
moi au cours de ces annes de thse, ma moiti Stphanie. Merci davoir support des
horaires de travail si prenants, ma courbe de stress exponentielle, et mon caractre si
facile... Merci pour ton appui, ta gentillesse, et ta comprhension. Merci de mavoir
soutenu dans les moments difciles, et de ttre investie pour me prter main forte.
Merci aussi de tenter laventure au Canada avec moi ; jespre que cela sera aussi pas-
sionnant pour toi que cela devrait ltre pour moi.
vii
Versions
1.11 12 novembre 2007
Dernires corrections avant impression.
1.1 30 octobre 2007
Corrections demandes par les rapporteurs et membres de jury :
Introduction gnrale tendue.
Ajout des comportements bass sur les besoins physiques dans ltat de lart
(Chapitre 2.4.3, page 76).
Changement du titre du chapitre 5, page 135 de Lhumain virtuel en Le
comportement de lhumain virtuel.
Corrections de fautes de typo diverses.
Modications supplmentaires :
Retrait de la prface Pr-version.
Ajout de la prface Remerciements.
Ajout de la prface Versions.
Ajout de la postface Quelques chiffres.
Modication du style de bibliographie de Anglais vers Franais.
Corrections de dnitions multiples de label L
A
T
E
X.
1.01 4 septembre 2007
Modication des rsums pour appliquer les directives de la bibliothque
(1000 caractres au maximum).
1.0 29 juillet 2007
Publication pour membres du jury.
Version complte.
0.9 18 juillet 2007
Dpt pour lcole doctorale MATISSE et lUniversit de Rennes I.
ix
Table des matires
Introduction gnrale 1
I tat de lart 5
Introduction 7
1 tude des circulations de personnes 9
1.1 Le comportement de navigation pitonnier . . . . . . . . . . . . . . . 10
1.1.1 Reprsentation mentale de lenvironnement de navigation . . 10
1.1.2 Processus mentaux de navigation . . . . . . . . . . . . . . . 11
1.1.3 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2 Modles statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.2.1 Approche historique : les niveaux de services de J.J. Fruin . . 14
1.2.2 Autres caractrisations en niveaux de services . . . . . . . . . 16
1.2.3 Lapproche Franaise plus gnrale . . . . . . . . . . . . . . 19
1.2.4 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3 Modles macroscopiques . . . . . . . . . . . . . . . . . . . . . . . . 21
1.3.1 Le modle gazeux . . . . . . . . . . . . . . . . . . . . . . . 21
1.3.2 Le modle hydraulique . . . . . . . . . . . . . . . . . . . . . 21
1.3.3 Le modle de Togawa . . . . . . . . . . . . . . . . . . . . . 22
1.3.4 Le modle de Melinek et Booth . . . . . . . . . . . . . . . . 23
1.3.5 Le modle de Pauls . . . . . . . . . . . . . . . . . . . . . . . 24
1.3.6 Le modle de Predtechenskii et Milinskii . . . . . . . . . . . 26
1.3.7 Le modle de Takahashi, Tanaka, et Kose . . . . . . . . . . . 30
1.3.8 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.4 La navigation ractive . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.4.1 Le modle de particules . . . . . . . . . . . . . . . . . . . . 33
1.4.2 Le modle base de rgles . . . . . . . . . . . . . . . . . . . 35
1.4.3 Un modle gomtrique prdictif . . . . . . . . . . . . . . . 36
1.4.4 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.5 Reprsentation de lenvironnement et recherche de chemin . . . . . . 38
1.5.1 Reprsentations exactes de lenvironnement . . . . . . . . . . 38
1.5.2 Reprsentations approximatives de lenvironnement . . . . . 41
1.5.3 Le modle de champs de potentiels . . . . . . . . . . . . . . 44
1.5.4 Planication de chemin . . . . . . . . . . . . . . . . . . . . . 45
xi
Table des matires
1.5.5 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
1.6 Techniques de validation . . . . . . . . . . . . . . . . . . . . . . . . 49
1.6.1 Analyse du rel . . . . . . . . . . . . . . . . . . . . . . . . . 49
1.6.2 Analyse du simul . . . . . . . . . . . . . . . . . . . . . . . 51
1.6.3 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
1.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2 Modles de comportement 55
2.1 Psychologie du comportement . . . . . . . . . . . . . . . . . . . . . 55
2.1.1 Linteraction au centre du comportement . . . . . . . . . . . 56
2.1.2 Symbolisation des connaissances . . . . . . . . . . . . . . . 57
2.1.3 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.2 Modles de comportement . . . . . . . . . . . . . . . . . . . . . . . 61
2.2.1 Comportement ractif . . . . . . . . . . . . . . . . . . . . . 61
2.2.2 Comportement rationnel . . . . . . . . . . . . . . . . . . . . 64
2.2.3 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.3 Reprsentation des connaissances : les environnements informs . . . 69
2.3.1 Le modle Parameterized Action Representation . . . . . . . 69
2.3.2 Les Smart Objects . . . . . . . . . . . . . . . . . . . . . . . 70
2.3.3 Le modle STARFISH . . . . . . . . . . . . . . . . . . . . . 72
2.3.4 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
2.4 Modles multi-couches . . . . . . . . . . . . . . . . . . . . . . . . . 74
2.4.1 Approche gnrale . . . . . . . . . . . . . . . . . . . . . . . 74
2.4.2 Approche oriente vers les comportements sociaux . . . . . . 75
2.4.3 Approche base sur les motions . . . . . . . . . . . . . . . . 76
2.4.4 Approche grande chelle . . . . . . . . . . . . . . . . . . . 78
2.4.5 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
Discussion 83
II Contributions 87
Introduction 89
3 Les objets interactifs 91
3.1 BIIO : principes de fonctionnement . . . . . . . . . . . . . . . . . . . 91
3.1.1 Constituants . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.1.2 Hritage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.1.3 Introspection . . . . . . . . . . . . . . . . . . . . . . . . . . 93
3.1.4 Automatisation . . . . . . . . . . . . . . . . . . . . . . . . . 93
3.2 Les concepts introduits par BIIO . . . . . . . . . . . . . . . . . . . . 94
3.2.1 Vue densemble . . . . . . . . . . . . . . . . . . . . . . . . . 94
3.2.2 La ressource . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3.2.3 Lobjet physique . . . . . . . . . . . . . . . . . . . . . . . . 96
3.2.4 Les zones dancrage . . . . . . . . . . . . . . . . . . . . . . 97
xii
Table des matires
3.2.5 Les les dattente . . . . . . . . . . . . . . . . . . . . . . . . 98
3.2.6 Les les dutilisation . . . . . . . . . . . . . . . . . . . . . . 99
3.2.7 La tche cognitive . . . . . . . . . . . . . . . . . . . . . . . 100
3.2.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
3.3 Laffordance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
3.3.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
3.3.2 Des concepts dinteraction hirarchiques . . . . . . . . . . . 101
3.3.3 Le rle comportemental de laffordance . . . . . . . . . . . . 103
3.3.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
3.4 Linteracteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
3.4.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
3.4.2 Le gestionnaire daffordances . . . . . . . . . . . . . . . . . 107
3.4.3 Gestion des tches cognitives . . . . . . . . . . . . . . . . . 109
3.4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
3.5 Leffecteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
3.5.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
3.5.2 Gestion des les dattente et dutilisation . . . . . . . . . . . 111
3.5.3 Laffordance spontane . . . . . . . . . . . . . . . . . . . . . 112
3.5.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
3.6 Conclusion et discussion . . . . . . . . . . . . . . . . . . . . . . . . 113
4 Lenvironnement virtuel 115
4.1 La reprsentation topologique . . . . . . . . . . . . . . . . . . . . . 115
4.1.1 Subdivision spatiale informe . . . . . . . . . . . . . . . . . 116
4.1.2 Labstraction topologique . . . . . . . . . . . . . . . . . . . 117
4.1.3 Les nuds conceptuels . . . . . . . . . . . . . . . . . . . . . 122
4.2 Un environnement inform . . . . . . . . . . . . . . . . . . . . . . . 125
4.2.1 Informations statiques . . . . . . . . . . . . . . . . . . . . . 125
4.2.2 Informations dynamiques . . . . . . . . . . . . . . . . . . . . 127
4.3 Intgration des objets interactifs . . . . . . . . . . . . . . . . . . . . 130
4.3.1 Les objets statiques . . . . . . . . . . . . . . . . . . . . . . . 131
4.3.2 Les objets dynamiques . . . . . . . . . . . . . . . . . . . . . 132
4.4 Conclusion et discussion . . . . . . . . . . . . . . . . . . . . . . . . 133
5 Le comportement de lhumain virtuel 135
5.1 Principe gnral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.2 Accder aux informations de lenvironnement . . . . . . . . . . . . . 138
5.2.1 La perception visuelle . . . . . . . . . . . . . . . . . . . . . 138
5.2.2 Base de connaissances . . . . . . . . . . . . . . . . . . . . . 141
5.2.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
5.3 La planication de chemin . . . . . . . . . . . . . . . . . . . . . . . 144
5.3.1 Un algorithme hirarchique . . . . . . . . . . . . . . . . . . 144
5.3.2 Modes de planication globale . . . . . . . . . . . . . . . . . 147
5.3.3 Heuristique multi-critres . . . . . . . . . . . . . . . . . . . 150
5.3.4 Analyse du chemin valu . . . . . . . . . . . . . . . . . . . 155
5.3.5 Rafrachissement de la planication . . . . . . . . . . . . . . 158
xiii
Table des matires
5.3.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
5.4 La navigation ractive . . . . . . . . . . . . . . . . . . . . . . . . . . 160
5.4.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
5.4.2 Slection des entits inuentes . . . . . . . . . . . . . . . . . 164
5.4.3 Prdiction : une discrtisation du temps . . . . . . . . . . . . 165
5.4.4 Quantication des informations de navigation . . . . . . . . . 172
5.4.5 Fusion des informations . . . . . . . . . . . . . . . . . . . . 176
5.4.6 Prise de dcision . . . . . . . . . . . . . . . . . . . . . . . . 177
5.4.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
5.5 Les tches cognitives . . . . . . . . . . . . . . . . . . . . . . . . . . 180
5.5.1 Choix du mode dobservation . . . . . . . . . . . . . . . . . 181
5.5.2 Choix du mode de dplacement . . . . . . . . . . . . . . . . 182
5.5.3 Gestion de linteraction . . . . . . . . . . . . . . . . . . . . . 183
5.5.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
5.6 Le processus de raisonnement . . . . . . . . . . . . . . . . . . . . . 186
5.6.1 Gestion des affordances . . . . . . . . . . . . . . . . . . . . 186
5.6.2 Gestion des tches cognitives . . . . . . . . . . . . . . . . . 187
5.6.3 Intgration gnrale . . . . . . . . . . . . . . . . . . . . . . 188
5.6.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
5.7 Conclusion et discussion . . . . . . . . . . . . . . . . . . . . . . . . 190
Conclusion et perspectives 193
III Rsultats 195
Introduction 197
6 Une architecture logicielle ddie la simulation 199
6.1 Vue densemble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
6.1.1 Les modles utiliss . . . . . . . . . . . . . . . . . . . . . . 199
6.1.2 Larchitecture . . . . . . . . . . . . . . . . . . . . . . . . . . 200
6.2 Dnition des objets de simulation . . . . . . . . . . . . . . . . . . . 201
6.3 Conguration de la simulation . . . . . . . . . . . . . . . . . . . . . 203
6.3.1 Import de lenvironnement de simulation . . . . . . . . . . . 203
6.3.2 Conguration des donnes de simulation . . . . . . . . . . . 204
6.4 Droulement dune simulation . . . . . . . . . . . . . . . . . . . . . 208
6.5 Exploitation des rsultats . . . . . . . . . . . . . . . . . . . . . . . . 211
6.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
7 Validation des rsultats 215
7.1 Validation des logiques de dplacement . . . . . . . . . . . . . . . . 215
7.1.1 tude prcise de lvitement de collision . . . . . . . . . . . 216
7.1.2 tude macroscopique des phnomnes mergeants . . . . . . 218
7.1.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
7.2 Validation des vitesses de dplacement . . . . . . . . . . . . . . . . . 219
7.3 Conclusion et perspectives . . . . . . . . . . . . . . . . . . . . . . . 223
xiv
Table des matires
8 Analyse des performances dexcution 225
8.1 Frquences de rafrachissement . . . . . . . . . . . . . . . . . . . . . 226
8.2 Temps dexcution . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
8.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
Conclusion et perspectives 231
Conclusion et perspectives gnrales 233
Annexes 239
A Ordonnancement des affordances 241
B Smantique des automates 243
C La tche cognitive interagir 245
C.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
C.2 Contrle haut niveau : dcision dinteraction . . . . . . . . . . . . . 245
C.3 Choix du type dinteraction : active ou ractive . . . . . . . . . . . . 246
C.4 Interaction active . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
C.4.1 Recherche active . . . . . . . . . . . . . . . . . . . . . . . . 248
C.4.2 Utilisation active . . . . . . . . . . . . . . . . . . . . . . . . 249
C.4.3 Attente active . . . . . . . . . . . . . . . . . . . . . . . . . . 250
C.5 Interaction ractive . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
C.5.1 Recherche ractive . . . . . . . . . . . . . . . . . . . . . . . 252
C.5.2 Utilisation ractive . . . . . . . . . . . . . . . . . . . . . . . 253
C.6 Utiliser leffecteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
C.7 Synthse et conclusion . . . . . . . . . . . . . . . . . . . . . . . . . 255
D Simulation dune gare virtuelle 257
D.1 Dnition des objets de simulation . . . . . . . . . . . . . . . . . . . 257
D.1.1 Les ressources . . . . . . . . . . . . . . . . . . . . . . . . . 257
D.1.2 Les affordances . . . . . . . . . . . . . . . . . . . . . . . . . 258
D.2 Simulation complte du voyageur au dpart . . . . . . . . . . . . . . 262
E Exprimentations impliquant des foules 265
Bibliographie 271
Table des gures 281
Liste des tableaux 285
Liste des Algorithmes 287
xv
Introduction gnrale
Lvaluation des btiments publics, et plus particulirement ceux comportant une forte
afuence, est depuis longtemps une ncessit en matire de scurit. Mais depuis peu,
un nouveau cadre dvaluation voit le jour o un btiment nest plus seulement jug par
rapport des normes de scurit, mais aussi expertis en fonction de la qualit de ser-
vices quil offre aux usagers. Cest dans ce cadre que se placent ces travaux : analyser
par la simulation des lieux publics, potentiellement forte afuence, et plus particuli-
rement les lieux dchanges que sont les gares. Cette catgorie denvironnement a t
choisie pour rpondre aux besoins des partenaires industriels de cette tude : la socit
AREP
1
, et la SNCF
2
.
La socit AREP est une liale de la SNCF en charge de ltude et la validation de pro-
jets architecturaux. Ces projets peuvent reprsenter soit de nouveaux btiments, soit des
btiments existant en cours de rnovation, an daccueillir une plus forte afuence par
exemple. Les btiments tudis sont principalement des lieux dchange, tels que les
gares, qui ont deux caractristiques principales. Premirement, lafuence globale dans
le btiment peut trs fortement varier (Figure 1) sur des chelles de temps courtes, de
lordre de lheure voire de la minute. Cette variation dafuence rsulte en des densits
FIG. 1: Variation dafuence dans un lieu dchange : les deux illustrations
reprsentent le mme endroit deux moment de la journe.
de personnes htrognes dans le temps et dans lespace. Deuximement, les btiments
tudis proposent un certain nombre dinteractions avec des quipements aux usagers,
leur permettant de raliser des processus comportementaux plus ou moins complexes.
Par exemple, un voyageur au dpart dans une gare (Figure 2) devra accomplir certaines
tches avant de prendre son train, comme sassurer quil dispose dun billet valide,
1
Amnagement Recherche Ples dchanges
2
Socit Nationale des Chemins de Fer Franais
1
Introduction gnrale
composter ce billet, ou encore reprer son quai.
FIG. 2: Exemples dinteractions avec lenvironnement dans une gare : le
voyageur au dpart doit utiliser une srie dquipement an de rali-
ser ses objectifs.
Lanalyse de ces btiments par la simulation implique lextraction de donnes carac-
tristiques, qui doivent de ce fait tre aussi ralistes que possible. Le ralisme que
nous voquons ne concerne pas ncessairement laspect visuel de la simulation, qui
est ici secondaire, mais plutt celui des chelles de valeur des donnes. Ainsi, laspect
primordial des simulations de circulations de personnes concerne la dynamique des
foules dindividus qui voluent au sein dun environnement. Cette dynamique peut tre
synthtise par des informations localises, telles que les densits de personnes et les
vitesses de dplacement. Cest cette synthse que reprsentent les niveaux de services,
en distinguant des intervalles de densits de personnes suivant une chelle qualiant
laisance de circulation.
Mais avant mme de chercher reproduire les logiques de dplacement pdestre, il
faut tre capable den saisir le dessein. En effet, le mouvement dun piton nest pas
une n en soi, mais sinsre dans une logique comportementale impliquant des m-
canismes plus abstraits. Cela est particulirement vrai pour les gares ferroviaires, o
de nombreuses interactions vont guider les voyageurs au travers de lenvironnement.
Les diffrents enchanements de ces interactions vont ainsi constituer des procdures
comportementales, dont limpact sur les circulations globales de personnes est pr-
pondrant. Cest pourquoi le deuxime aspect capital de notre tude est plus loign
de la description physique des mouvements de personnes, pour se rapprocher de leur
implication dans un mcanisme rationnel.
Notre problmatique peut donc tre rsume en trois points. Premirement, elle sous-
entend la description dun environnement de simulation, non seulement dun point de
vue topographique, mais aussi smantique. Cette smantique permettra dancrer une
symbolique au sein des constituants de la simulation, pour autoriser la mise en uvre
de mcanismes comportementaux. Deuximement, notre sujet implique llaboration
dun humain virtuel aussi raliste que possible compte tenu des contraintes de per-
formances impose par la simulation de foules. Celui-ci sera donc dot dune chane
comportementale intgrant les capacits qui peuvent inuencer son dplacement, telles
que la perception visuelle, la navigation, ou la prise de dcision relative linteraction.
Troisimement, notre problmatique ne sera rsolue quaprs avoir mis cet humain vir-
tuel en situation, et lavoir analys. Cette dernire tape consiste ainsi fournir un outil
permettant de renseigner un environnement virtuel, de procder une simulation, et
enn den extraire des rsultats.
Quelques logiciels commerciaux existent dj pour simuler et analyser les mouvements
2
Introduction gnrale
de foule. On peut citer par exemple Legion, dont les modles sont peu communiqus,
ou Myriad, qui se base sur les travaux de G.K. Still [128] (Figure 3). Nanmoins, ces
applications ne rpondent pas totalement notre problmatique, surtout concernant
limpact des comportements dinteraction sur les dplacements de personnes.
(a) Legion de la socit Legion Limited (b) Myriad de la socit Crowd Dynamics
FIG. 3: Deux logiciels commerciaux danalyse des foules caractrisant les
ux de personnes. Ces illustrations prsentent des exemples de pro-
duit de sortie de ces logiciels.
Pour rpondre cette problmatique, nous organiserons ce document en trois parties.
Tout dabord, nous tudierons lexistant concernant lanimation comportementale dans
la partie I. Nous y aborderons aussi des sujets inhrents ltude du comportement
humain, tels que la sociologie et la psychologie. Ensuite, nous prsenterons nos contri-
butions dans la partie II, avec un modle dobjets interactifs, la reprsentation de len-
vironnement de simulation, et le modle dhumain virtuel. Enn, nous exposerons nos
rsultats dans la partie III, que ce soit lapplication de simulation qui met en uvre
les modles proposs, ou les tapes de validation qui permettent den assurer la perti-
nence. Certains points plus techniques des contributions et des rsultats seront dtaills
en annexe de ce document.
3
Premire partie
tat de lart
5
Introduction
Bien quaborde depuis un certain temps dj, la simulation de foule reste encore au-
jourdhui un sujet trs ouvert. Ainsi, de nombreuses recherches traitent encore ce vaste
sujet, que ce soit dans le seul but de produire une animation dont laspect semble ra-
liste, ou encore deffectuer des simulations permettant la caractrisation et ltude de ce
phnomne. De nombreuses thmatiques peuvent intervenir dans le cadre de la simula-
tion de foules, telles que la psychologie, la sociologie, les sciences cognitives, et mme
la biophysique. Nous allons nous attacher dans cette partie dresser un tat de lexis-
tant concernant la simulation de foule et les sujets sy rapportant. Nous aborderons ce
phnomne en parcourant les diffrentes mthodes permettant soit de le caractriser,
soit de le reproduire.
Dans un premier temps, nous prsenterons dans le chapitre 1 les tudes caractrisant les
circulations de personnes, comportement de base ncessaire toute simulation denti-
ts mobiles. Nous exposerons ainsi les diffrentes mthodes permettant danalyser le
dplacement des personnes, allant de la psychologie au modle algorithmique spcia-
lis, tout en laissant de cts les processus de contrle comportementaux de plus haut
niveau.
Dans un deuxime temps, chapitre 2, nous pousserons un peu plus loin nos investiga-
tions concernant la gestion comportementale de lindividu. Nous nous focaliserons sur
la reprsentation des connaissances, son lien avec lenvironnement, ainsi que son uti-
lisation principalement pour des comportements dinteraction. Nous introduirons ainsi
les premires mthodes simulant le raisonnement, sans toutefois descendre un niveau
de complexit quivalent au domaine de lintelligence articielle.
7
Chapitre 1
tude des circulations de
personnes
La capacit se mouvoir est sans aucun doute lun des comportements lmentaires les
plus indispensables pour un individu. Cest pourquoi ce sujet est lun des plus anciens
concernant la simulation de personnes. Il dispose ainsi dun grand nombre de modles
et dacquis, mais reste tout de mme trs ouvert encore aujourdhui. En effet, de par
sa complexit, ce thme de recherche fait souvent lobjet dune tude volontairement
partielle et spcialise un cadre dapplication.
Nous allons exposer cette complexit, dans la section 1.1, en faisant un rapide tour
dhorizon des thories psychologiques et sociologiques lies la reprsentation men-
tale de lenvironnement ainsi qu la navigation. Nous continuerons dans la section 1.2
avec un certain nombre de modles statistiques qui ont rpertori et classi des don-
nes concernant les ux de personnes. Nous prsenterons ensuite, dans la section 1.3,
les premiers modles informatiques permettant de simuler les foules, dits macrosco-
piques, surtout utiliss dans le cadre de simulation dvacuations. Nous poursuivrons,
dans la section 1.4, avec les modles de navigation ractive, permettant de reproduire
individuellement les logiques de navigation locales. Nous complterons la prsentation
de cette technique, dans la section 1.4, avec dautre modles complmentaires permet-
tant cette fois-ci de simuler les logiques de navigation globales, par la reprsentation de
lenvironnement puis un procd de planication de chemin. Nous terminerons, dans
la section 1.6, en faisant le point sur les techniques de validation permettant de vrier
la validit des modles de circulation de personnes.
Nous ferrons ressortir pour chacun des modles prsents leurs points forts et leurs
faiblesses, ainsi que leur cadre dapplication de prdilection. Nous indiquerons dans
quel sens ses modles pourraient tre amliors et/ou inclus dans dautres modles
plus complexes.
9
tude des circulations de personnes
1.1 Le comportement de navigation pitonnier
Les premires tudes stant intresses la caractrisation du comportement de navi-
gation pitonnier furent ralises par les psychologues et autres sociologues. Ceux-ci,
se basant sur une observation du rel, ont distingu certains comportements rcurrents,
allant mme parfois jusqu proposer des modles les explicitant.
Sans chercher tre exhaustif dans ce domaine, nous allons synthtiser dans ce cha-
pitre un ensemble dtudes qui ont servi ou pourraient servir llaboration de
modles informatiques. Nous classieront les travaux prsents en deux parties. Nous
commencerons avec les thories traitant de la reprsentation mentale dun environne-
ment. Puis, nous nous pencherons sur les thories tentant dexpliquer le comportement
de navigation pitonnier, avec dune part la planication de chemin, et dautre part la
locomotion.
1.1.1 Reprsentation mentale de lenvironnement de navigation
Avant mme de pouvoir se dplacer dans son environnement, ltre humain a besoin
de se le reprsenter. Cette reprsentation mentale va en effet lui servir raisonner sur
cet environnement, que ce soit pour valuer un chemin an datteindre une localisation
prcise, ou encore pour organiser les tches quil doit effectuer (comme les interactions
avec des objets). Cest la reprsentation mentale permettant le premier type de rai-
sonnement la navigation que nous allons nous attacher ici, pour revenir plus tard
dans ce document sur le second type de raisonnement.
Cette reprsentation mentale, dite topologique, permet un tre humain de se reprer
dans lenvironnement. Elle passe par une phase dabstraction, cest--dire une inter-
prtation personnelle de la gomtrie des lieux. Une telle abstraction, dnomme carte
cognitive spatiale, est base sur deux concepts. Premirement, llaboration dune
carte sous-entend une construction mentale durable, faisant intervenir des processus
mmoriels permettant une conservation de linformation au cours du temps. Deuxi-
mement, le recours un mcanisme cognitif signie que cette reprsentation est ob-
tenue par un procd actif, rchi, de ltre humain, celui-ci raisonnant sur ce quil
peroit de son environnement pour lorganiser.
Labstraction mentale dun environnement peut tre vue comme un systme de ltrage,
o ltre humain ne va pas stocker lensemble de la gographie perue, mais plutt en
extraire des lieux marquants (landmarks en anglais). Ces zones dintrt sont des en-
droits dont la localisation est mieux connue, et serviront ensuite de point de repre
dautres lieux adjacents. Waller et al. [144] indiquent que ces lieux marquant, une fois
associs entre eux, forment une mmoire spatiale implique dans plusieurs tches men-
tales. Nanmoins, Wender et al. [146] signalent que la mmoire spatiale ne se rsume
pas la simple association de lieux marquants. Par lintermdiaire dexpriences, ils
montrent que la construction dune carte cognitive spatiale ne se fait pas en une seule
tape, mais est un phnomne redondant au cours du temps. Tout dabord ltre humain
extrait des lieux marquants, puis des chemins, et enn une organisation topographique
des lieux. Ensuite, il est capable de se rappeler dun chemin en se servant de cette carte
cognitive spatiale, grce un mcanisme de rappel depuis la mmoire. Celui-ci est
dpendant du contexte comportemental et environnemental de lindividu.
10
Le comportement de navigation pitonnier
An dagencer ces lieux marquants, R.L. Klatzky [64] dcrit deux sortes de reprage
pour ltre humain : allocentrique et gocentrique. La mthode gocentrique organise
les lments perus relativement la position de lentit qui les peroit. A loppos,
la mthode allocentrique organise les lments globalement, suivant un repre absolu
totalement dcorrl de tout point de vue subjectif et perceptif.
Pour nir, des tudes spcient que la reprsentation mentale de lespace est hirar-
chique. Ainsi, J. Wiener et H. Mallot [147] dnissent la notion de niveaux de dtails
dans les reprsentations spatiales lies au processus de navigation. Ils indiquent quun
minimum de deux niveaux hirarchiques sont utiliss, le premier tant form dun en-
semble de places, le second de rgions constitues dagglomrats de places.
Le principe de carte cognitive spatiale est utilis dans certains modles informatiques,
comme les IHT-graph de R. Thomas et al. [136]. Nanmoins, de part leur complexit
calculatoire, ces modles ne sont gnralement utiliss que pour la simulation dun
nombre trs limit dhumains, bien en de de leffectif ncessaire une foule. Comme
nous le verrons dans les sections suivantes, dautre modles plus simples exploitent
tout de mme la thorie de reprsentation spatiale, en ne retenant que certains de ses
principes (comme une abstraction simplie).
1.1.2 Processus mentaux de navigation
Une fois que ltre humain dispose dune reprsentation mentale de son environne-
ment, il peut lexploiter an dorganiser son dplacement. Ces processus mentaux sont
scinds en trois groupes principaux :
1. Raisonnement spatial, o lindividu va associer les tches quil doit effectuer
avec leur localisation, puis procder une slection.
2. Planication dun chemin, permettant lindividu dvaluer son dplacement au
sein de lenvironnement jusqu la tche slectionne, et donc de se projeter dans
le temps et lespace.
3. Navigation et locomotion, qui vont grer le dplacement local dun individu tout
au long du chemin plani.
Nous nous intresserons ici aux deux derniers groupes de tches, et reviendrons sur le
processus de raisonnement spatial plus tard dans ce document.
Planication dun chemin
La planication de chemin (aussi dnomme navigation dans la littrature anglaise)
consiste lister les lieux par lesquels passer pour relier la position courante dun hu-
main sa destination. Ce processus mental est bien entendu trs fortement li la repr-
sentation mentale de lespace, tant une exploitation directe des informations contenues
dans la carte cognitive spatiale de lindividu.
Dautres informations peuvent tout de mme intervenir dans ce processus. Par exemple,
A. Tom et M. Denis [139] ont tudi les degrs dutilisation des lieux marquant et des
noms de rues dans la planication de chemin. Ils indiquent que, du fait de leur plus
faible corrlation la topographie, les noms de rues sont beaucoup moins utiliss.
11
tude des circulations de personnes
Concernant le fonctionnement de la tche de planication de chemin, plusieurs tudes
montrent quil sagit dun procd hirarchique. Ainsi, S. Steck et H. Mallot [127]
indiquent que des lieux marquants locaux et globaux interviennent dans le processus,
mais de faon diffrente suivant les personnes : certaines nutilisent que lun ou lautre,
ou encore les deux la fois. De plus, J. Wiener et H. Mallot [147] introduisent dans
leur carte mentale hirarchique les concepts de place et rgion dnissant deux niveaux
dabstraction topologique. Ils expliquent que la planication de chemin se fait dabord
localement au niveau des places, puis globalement au niveau des rgions ds que le
processus sloigne du lieu marquant courant de lindividu (Figure 1.1).
FIG. 1.1: Reprsentation mentale hirarchique pour la planication de che-
min selon J. Wiener et H. Mallot. En haut, lenvironnement de test,
et son quivalent mental en a. En b les conditions de dpart (posi-
tion et destinations), et en c les chemins hirarchiques.
Locomotion
La locomotion est le comportement humain permettant le dplacement de lindividu
au sein de lenvironnement, jouant de ce fait un rle central dans de nombreuses acti-
vits. Celui-ci se doit dtre grandement adaptatif, notamment du fait de sa gestion de
lvitement de collision avec dautres entits prsentes dans lenvironnement. Ainsi,
W.H. Warren [145] indique que la vision exerce un contrle fondamental sur la loco-
motion humaine.
M. Relieu [118] indique que le lien social entre pitons est caractris par le silence
et lindiffrence. An de maintenir cet tat de fait, E. Goffman [46] nonce que trois
comportements sont mis en uvre lors de la locomotion :
Lexternalisation est le processus par lequel les gens fournissent constamment des
informations sur leurs intentions de dplacement, que ce soit la direction, la vi-
tesse, ou encore la longueur de pas. Cette transmission se fait par des successions
de mouvements corporels, devant tre perceptibles par lentourage du piton.
12
Le comportement de navigation pitonnier
La scrutation est le processus complmentaire lexternalisation. Celui-ci permet
un piton de regrouper slectivement les informations mises par son entourage.
La minimisation des ajustements signale que le piton rduit lamplitude et le nombre
de changements dorientation au cours de son trajet. Cela implique une antici-
pation dans la modication des trajectoires, an de la rendre perceptible assez
tt par lentourage, dans le but dviter une coordination ainsi quune interaction
proche.
De plus, J.R.E. Lee et R. Watson [74] remarquent que les conditions socio-culturelles
inuent sur la minimisation des interactions, notamment par la prise en compte im-
plicite du code de la route dans lorganisation globale des ux (comme lvitement
droite).
Concernant linteraction locale lors de la locomotion, E. Goffman introduit la rgion
ovale de scurit (Figure 1.2). Sa profondeur est dpendante de la vitesse du piton,
dnissant ainsi une zone danticipation, tandis que sa largeur dtermine des para-
mtres daisance personnelle, dsignant la distance acceptable pour passer ct dun
obstacle, dont notamment une personne. De manire plus gnrale, M. Relieu [119]
nonce le principe de discrimination urbaine, signalant que le piton focalise son at-
tention lintrieur de sa rgion courante pour en extraire une information pertinente.
FIG. 1.2: Reprsentation de laire de Goffman (en vert).
A Distance danticipation. B Distance latrale de scurit.
Concernant lorganisation dans lespace de la locomotion, B. Hillier et al. [56] in-
diquent que la plupart des mouvements pitonniers suivent les lignes de vue pour le
choix du chemin local, tentant ainsi de maximiser la distance couverte par le regard.
M. Azimazadeh et B. Klarqvist [9] signalent que cette proprit a un impact direct
sur le choix dun chemin, et permet dexpliquer le fait que des chemins aller et retour
soient gnralement diffrents.
1.1.3 Synthse
Le rapide survol des tudes psychologiques et sociologiques dans ce chapitre nous a
permis de nous familiariser avec les rgles rgissant le comportement pitonnier (le
lecteur intress trouvera une tude plus complte faite par S. Donikian [36]). Ainsi,
13
tude des circulations de personnes
nous avons pu voir dans un premier temps que la reprsentation mentale de lenvi-
ronnement dun tre humain est bien plus axe sur la topologie que sur la gographie
des lieux, avec des processus de classication abstraits et hirarchiques. Ensuite, cette
reprsentation mentale est utilise pour planier un chemin, encore une fois de faon
hirarchique, en tant trs prcis pour les lieux observables, et plus gnral pour le
reste du chemin. Pour nir, plusieurs rgles rgissent le dplacement court terme du
piton, dont notamment la prdiction quant aux collisions, ainsi que la minimisation
des adaptations.
Lensemble de ces constats caractrisent lattitude de navigation humaine. Le schma
comportemental qui en ressort est constitu de trois tapes successives et interconnec-
tes : perception de lenvironnement, analyse de linformation, puis dplacement au
sein de lenvironnement. Cette boucle perception - dcision - action constitue ainsi le
principe de fonctionnement gnral de ltre humain, tout au moins en ce qui concerne
son dplacement.
Pour conclure, il parat vident que la reproduction des proprits nonces soit une
condition minimale de validit lors de llaboration dun modle informatique. Nan-
moins, la mise en uvre exacte de ces processus semble difcile, surtout pour le pas-
sage lchelle dune foule, de part la complexit des modles ncessaires et le nombre
de facteurs entrant en ligne de compte. Cest pourquoi, comme nous le verrons dans
la suite de ce chapitre, les modles existants se concentrent gnralement sur la re-
production dune partie des caractristiques observes dans la navigation humaine, en
contraignant aussi le cadre dapplication (et donc de validit).
1.2 Modles statistiques
Les tudes statistiques furent les premires tre utilises pour caractriser les mou-
vements de personnes. Elles sont encore employes aujourdhui, mais plus pour un
aspect de validation. Leur objectif est de synthtiser les mouvements de personnes par
une quantication de leur impact sur lenvironnement. Ces tudes se concentrent donc
surtout sur des valeurs de densits et dbits observables, permettant ainsi den dduire
des vitesses moyennes de dplacement. Une faon deffectuer cette synthse a t pro-
pose par J.J. Fruin [41] grce des niveaux de services. Ceux-ci se basent toujours sur
des densits et dbits de personnes, mais qualient aussi de manire plus descriptive
laisance de dplacement. Nous allons nous concentrer sur cette approche dans cette
section, en parcourant les diffrentes classications de la littrature. Nous tudierons
aussi le cas de la lgislation franaise, an de nous rendre compte des caractristiques
minimales quune tude des circulations de personnes doit mettre en vidence.
1.2.1 Approche historique : les niveaux de services de J.J. Fruin
Lune des premires tudes de ux de pitons a t ralise par J.J. Fruin [41] en 1971
aux tats-Unis. Celui-ci propose dvaluer divers lieux dchanges en prenant comme
caractristique la libert de mouvements des pitons qui les traversent : vitesse de cir-
culation, risques de collisions, confort, scurit. Ainsi, il met au point une graduation
en niveaux de services (Table 1.1) allant de A pour le meilleur F pour le moins bon.
La caractrisation de chaque niveau de service (Level Of Service en anglais), du point
14
Modles statistiques
Niveau de
service
Densits Dbit
personnes/m
2
m
2
/personne pers./min/m
A < 0.3 > 3.2 < 23
B 0.3 0.4 2.3 3.2 23 33
C 0.4 0.7 1.4 2.3 33 49
D 0.7 1.1 0.9 1.4 49 66
E 1.1 2 0.5 0.9 66 82
F > 2 < 0.5 variable
TAB. 1.1: Les niveaux de services de J.J. Fruin : chaque niveau correspond
un intervalle de densits de personnes, et un dbit moyen observ.
de vue du comportement des pitons, est dicte par J.J. Fruin de la faon suivante :
A Jusqu cette densit Figure 1.3(a) chaque voyageur peut se dplacer la vitesse
quil dsire, les collisions restant improbables.
B-C Ici Figure 1.3(b) les voyageurs peuvent encore se mouvoir avec une relative
facilit, viter les conits et choisir leur vitesse.
C-D Avec cette densit Figure 1.3(c) les dpassements deviennent plus difciles, la
faible distance sparant chaque personne incite les pitons rduire leur vitesse.
D-E Cette zone critique Figure 1.3(d) impose une vitesse gnrale faible, le dpla-
cement des voyageurs devient irrgulier, les dplacements et autres changements
de direction sont quasiment impossibles.
E-F Enn, avec une telle densit Figure 1.3(e) les contacts entre pitons sont in-
vitables, interdisant tout dpassement.
(a) 0.3 pers./m
2
(LOS A-B) (b) 0.4 pers./m
2
(LOS B-C) (c) 0.7 pers./m
2
(LOS C-D)
(d) 1.1 pers./m
2
(LOS D-E) (e) 2 pers./m
2
(LOS E-F)
FIG. 1.3: Reprsentation des valeurs limites de transition entre les diffrents
niveaux de service.
15
tude des circulations de personnes
Pour ce qui est des espaces publics, J.J. Fruin recommande dutiliser un espace dimen-
sionnant de niveau de service C, mesur en priode de pointe. Ceci permet de crer une
marge de scurit en cas de trs forte afuence.
Enn, J.J. Fruin indique la relation quil peut exister entre un niveau de service, caract-
ris par une densit de personnes, et la vitesse de dplacement des pitons (Figure 1.4).
On peut ainsi remarquer que plus le niveau de service est lev (proche de A), plus la
vitesse de dplacement est importante. Le dbit, quant lui, varie dans le sens inverse
(plus le niveau de service est faible, plus le dbit est fort), avec un renversement de cette
caractristique pour le niveau de service le plus mauvais (F), la vitesse de dplacement
devenant alors quasi nulle.
FIG. 1.4: Relation entre les densits de personnes et la vitesse de dplacement
possible, ainsi que le dbit de population. Les niveaux de services
sont indiqus suivant la densit de personnes.
1.2.2 Autres caractrisations en niveaux de services
J.J. Fruin a ouvert la voie de nombreuses autres classications en niveaux de services.
Nous allons voir que ces autres rpartitions sont parfois trs loignes les unes des
autres, allant mme jusqu considrer des ordres de grandeurs diffrents quant aux
densits de personnes.
Transportation Research Board (T.R.B.)
Le T.R.B., aux tats-Unis, en se basant sur les tudes de J.J. Fruin, a mis une classi-
cation en niveaux de services dans le Highway Capacity Manual [140] (H.C.M.).
Bien que les niveaux de services soient toujours subdiviss en six catgories, de A F,
on peut remarquer que les valeurs sont plus compactes, ne variant que de 0.43 1.33
personnes par m
2
(Table 1.2).
16
Modles statistiques
Niveau de
service
Densits Dbit
personnes/m
2
m
2
/personne pers./min/m
A < 0.43 > 2.3 < 6.6
B 0.43 0.77 1.3 2.3 6.6 23
C 0.77 1 1 1.3 23 33
D 1 1.25 0.8 1 33 49
E 1.25 1.33 0.75 0.8 49 82
F > 1.33 < 0.75 variable
TAB. 1.2: Les niveaux de services du HCM.
Comme valeurs dimensionnantes, Joseph S. Milazzo et al. [86] prconisent, dans le
H.C.M., le niveau B en heures de pointe, ce qui correspond en valeurs au niveau C
recommand par J.J. Fruin.
Puskarev et Zupan
Puskarev et Zupan [114], toujours aux tats-Unis, proposent quant eux une classi-
cation en sept niveaux (Table 1.3), cette fois ci caractriss non plus par des lettres,
mais par leur description.
Niveau de
service
Densits Dbit
personnes/m
2
m
2
/personne pers./min/m
Open < 0.02 > 49 < 1.6
Unimpeded 0.02 0.08 12 49 1.6 7
Impeded 0.08 0.25 4 12 7 20
Constrained 0.25 0.5 2 4 20 33
Crowded 0.5 0.67 1.5 2 33 46
Congested 0.67 1 1 1.5 46 59
Jammed 1 5 0.2 1 0 59
TAB. 1.3: Les niveaux de services de Puskarev et Zupan.
On peut remarquer que la classication est ici tire vers le haut, avec une plus grande
subdivision des niveaux de services levs. Elle devient nanmoins plus difcile uti-
liser, lcart entre chaque niveau tant trs faible.
W. Brilon
W. Brilon [28], en Allemagne, a rig une classication en six niveaux de services la
manire de J.J. Fruin (Table 1.4).
Cette classication est assez proche de celle du H.C.M. avant sa rvision en 2000. Elle
comporte des niveaux faibles peu scuritaires, mais des niveaux levs allouant bien
plus despace par personne que J.J. Fruin (10m
2
contre 3.2m
2
pour le niveau A).
Comme valeur dimensionnante, W. Brilon recommande le niveau D comme maximum,
ce qui correspond la valeur conseille par J.J. Fruin.
17
tude des circulations de personnes
Niveau de
service
Densits
personnes/m
2
m
2
/personne
A < 0.1 > 10
B 0.1 0.3 3.3 10
C 0.3 0.5 2 3.3
D 0.5 0.7 1.4 2
E 0.7 1.8 0.56 1.4
F > 1.8 < 0.56
TAB. 1.4: Les niveaux de services de W. Brilon
Polus et al.
Polus et al. [111], en Isral, ont quant eux choisi une classication en cinq niveaux
de services (Table 1.5).
Niveau de
service
Densits Dbit
personnes/m
2
m
2
/personne pers./min/m
A < 0.6 > 1.67 < 40
B 0.6 0.75 1.33 1.67 40 50
C
1
0.75 1.25 0.8 1.33 50 75
C
2
1.25 2 0.5 0.8 75 95
D indtermin
TAB. 1.5: Les niveaux de services de Polus et al.
Cette classication est moins scuritaire que toutes celles vues jusqu prsent, son
niveau le plus lev correspondant au niveau C de J.J. Fruin.
Tanaboriboon et Guyano
Y. Tanaboriboon & J. A. Guyano [130], en Thalande, se conforment une classica-
tion en sept niveaux de services (Table 1.6).
Niveau de
service
Densits Dbit
personnes/m
2
m
2
/personne pers./min/m
A < 0.4 > 2.38 < 28
B 0.4 0.6 1.6 2.38 28 40
C 0.6 1 1 1.6 40 61
D 1 1.5 0.65 1 61 81
E 1.5 2.7 0.37 0.65 81 101
F > 2.7 < 0.37 variable
TAB. 1.6: Les niveaux de services de Tanaboriboon et Guyano.
Cette classication est la moins scuritaire, avec plus de 2.7 personnes/m
2
dans son
niveau le plus bas.
18
Modles statistiques
Conclusion
Les diffrentes classications en niveaux de services prsentes sont assez distantes les
unes des autres (Figure 1.5). Cette htrognit peut sexpliquer par les diffrences de
condition dvaluation. En effet, les densits de personnes mesures sont fortement
corrles aux situations observes, ainsi quaux catgories de populations. Ainsi, pour
pouvoir tre analyse, une mesure doit tre corrle aux mensurations des populations
observes, mais aussi leur objectif gnral. Ce dernier pourra en effet avoir un im-
pact majeur sur leur vitesse dsire de dplacement, qui est par exemple leve en cas
dvacuation, et basse en cas de lieu de promenade.
FIG. 1.5: Comparaison des niveaux de services prsents. On voit apparatre
une forte disparit des valeurs, ainsi que des allures des courbes.
1.2.3 Lapproche Franaise plus gnrale
Une catgorisation en niveaux de services nest pour le moment pas disponible en
France. Les seules valeurs dimensionnantes fournies ofciellement dnissent les rgles
de scurit, donc des maxima ne pas dpasser. En effet, la loi prvoit une dure
dvacuation de dix minutes pour nimporte quel type de btiment public, les dbits et
densits tant fonctions de cette rgle.
Tout dabord, le lgislateur a rpertori les tablissements pouvant recevoir du public
suivant le type de leur exploitation [48], dont le type GA pour les gares. Ces types sont
alors classis suivant lafuence quils peuvent supporter (Table 1.7).
Ensuite, il est prcis les effectifs et dbits maximum dexploitation, par exemple pour
une gare [49] :
100 pers./min/m dans un couloir,
1 pers./m
2
pour les zones o le public stationne, 0.5 pers./m
2
pour celles o le public
stationne et transite.
19
tude des circulations de personnes
Groupe Catgorie Afuence
1 > 1500 pers.
I 2 701 1500 pers.
3 301 700 pers.
4 <= 300 pers.
II 5 spcial
TAB. 1.7: Catgories des tablissements publics.
Enn, ces dbits sont valus statistiquement en considrant la notion dunit de pas-
sage
1
. Ces units de passage dnissent les largeurs des ouvertures servant lvacua-
tion dun btiment. Elles sont dnies de la faon suivante :
une unit de passage fait 0.9 m de largeur ;
deux units de passage font 1.4 m de largeur ;
n units de passage (n > 2) font 0.6n m de largeur.
On peut remarquer que les densits prcites correspondent respectivement aux ni-
veaux D et C chez J.J. Fruin, et C/D et B pour le H.C.M. Quant au dbit envisag
par les normes franaises, il se trouve bien au dessus du plus grand dbit envisag par
J.J. Fruin ou le H.C.M. (soit 82 pers./min/m).
1.2.4 Synthse
Nous avons vu que plusieurs dcoupages en niveaux de services ont t faits, mais que
ceux-ci comportent de nombreuses diffrences, surtout dun pays lautre.
Ceci vient principalement des conditions socio-culturelles de chaque pays. Par exemple
les Thalandais ont besoin de moins despace personnel que les Amricains pour se
sentir laise. De plus, les tudes sont ralises partir de donnes htroclites : gares
pour J.J. Fruin, bazars pour Y. Tanaboriboon et J. A. Guyano.
Une autre raison de ces fortes disparits provient de la mthode destimation des ux.
Celle-ci prend en compte la corpulence des pitons (surface projete au sol) pour esti-
mer le nombre de personnes par mtre carr. Bien entendu, une variation de la corpu-
lence utilise (Table 1.8) par les diffrentes tudes entrane une variation des rsultats.
Pour conclure, ces modles statistiques prsentent des valeurs dimensionnantes rutili-
sables dans des modles informatiques. Certes lhtrognit des donnes considres
contraignent leur gnralisation, mais les valeurs observes sont tout de mme globale-
ment comparables. Ainsi, les tables associant des densits de population des vitesses
et dbits observs pourront servir de deux faons diffrentes et exclusives, dans un mo-
dle informatique. Premirement, comme valeurs de contrle : on pourra ainsi directe-
ment associer une vitesse de dplacement une condition de densit. Deuximement,
comme valeurs de comparaison : on pourra ainsi valuer la abilit dun modle de
navigation en confrontant ses rsultats ceux estims dans ces donnes statistiques.
1
Article CO 36 de la Rglementation de Scurit contre lIncendie dans les tablissements Recevant du
Public
20
Modles macroscopiques
Population Largeur Profondeur Surface
(cm) (cm) (m
2
)
tats-Unis (H) 51.5 29 0.23
tats-Unis (F) 44 30 0.21
France (H) 51.5 28 0.23
France (F) 47 29.5 0.22
Inde (H) 45.5 23.5 0.17
Inde (F) 39 25.5 0.16
Suisse (H) 51 25.5 0.2
Suisse (F) 42.5 30 0.2
Moyenne 46.5 27.6 0.2
Maximum 51.5 30 0.23
TAB. 1.8: Caractristiques moyennes de tailles de diverses populations [128].
1.3 Modles macroscopiques
Les modles de simulation macroscopique sont historiquement les premiers modles
informatiques ayant permis des simulations de foules. En effet, ceux-ci simulent la to-
talit des individus par un ensemble de fonctions mathmatiques, ne ncessitant quune
puissance de calcul assez faible. Ainsi, ces modles abandonnent tout comportement
individuel volu, au prot dune simulation trs rapide dun grand nombre dentits.
Nous verrons que le but de ces modles rside dans la caractrisation dun phnomne
particulier gnralement reproductible dans des conditions environnementales ges.
1.3.1 Le modle gazeux
L.F. Henderson [55] propose ds 1971 dassimiler les dplacements de personnes dans
des conditions de faible densit ceux de molcules de gaz. En se basant sur la thorie
cintique des gaz de Maxwell-Boltzmann, il fait le parallle entre la densit des pitons
et celle des particules dun gaz, en assimilant leur diffrence dtats (arrt, marche,
course) aux diffrences dnergie des gaz. Ce modle sappuie sur deux hypothses
concernant les pitons, en laissant de ct toutes rgles sociales (comme les afnits
liant certaines personnes) :
Leurs positions et vitesses sont indpendantes les unes des autres ;
Leur vitesse est indpendante de leur position.
Ces premiers constats, mme sils peuvent paratre vidents aujourdhui, sont la base
de toute simulation dhumanodes virtuels.
1.3.2 Le modle hydraulique
Un modle hydraulique a t propos par J. Archea [6] pour simuler des foules de forte
densit. Il assimile ici le mouvement des personnes au travers de couloirs, escaliers, et
portes, celui de leau au travers de tuyaux, vannes, ou autres.
La simulation de lvacuation du btiment se fait en deux tapes :
21
tude des circulations de personnes
1. Initialisation du mouvement de lensemble des individus recevant simultanment
un message dalerte (ouverture des vannes) ;
2. Simulation de lvacuation (coulement de leau d la force de gravitation).
Ce modle se base sur les hypothses suivantes :
Prise de conscience et dcision de lvacuation immdiate et simultane de tous les
individus ;
Rpartition uniforme des occupants ;
Dbits uniformes ;
Flux unidirectionnels ;
Trajets prdnis.
Mme si ce modle a trouv de nombreuses applications, notamment du fait de sa
facilit de mise en uvre, il souffre de la simplicit des hypothses sur lesquelles il
repose : en ralit les personnes ne partent pas en mme temps, et leurs directions ne
sont pas aussi facilement prvisibles.
1.3.3 Le modle de Togawa
K. Togawa [138] propose un modle bas sur des observations ralises sur une p-
riode de dix ans dans des tablissements recevant du public. Il donne ainsi une formule
permettant de calculer la vitesse de marche dune foule par rapport sa densit :
V =V
0
.
0.8
avec V
0
= 1.3 m.s
1
= densit en personnes / m
2
Le dbit est alors dduit par :
N = .V =V
0
.
0.2
avec N = dbit en personnes / s / m, 1.3 < N < 1.7
K. Togawa suggre quelques modications suivant le degr dinclinaison du plan de
circulation :
Si le sens est ascendant, V est rduite de 2% par degr dangle dinclinaison ;
Si le sens est descendant, la vitesse augmente pour des pentes faibles, mais diminue
pour des pentes fortes.
Ce modle a t appliqu dans le cadre de la simulation de lvacuation dun immeuble
en cas dincendie. Le produit de sortie de cette simulation est un temps total dvacua-
tion, dni comme la somme des temps :
de dtection du feu ;
dalarme ;
de prparation ;
et dvacuation net, qui est lui-mme la somme des temps dvacuation des escaliers
et des circulations horizontales.
Le temps dvacuation des circulations horizontales est calcul ainsi :
T =
P
C
c
. L
e
+
L
h
v
22
Modles macroscopiques
avec T = temps dvacuation en secondes
P = nombre de personnes dans le btiment
L
e
= largeur des zones de circulation et des issues en mtres
C
c
= coefcient de circulation (valu 1.3 pers. / m / s)
L
h
= longueur totale maximale des chemins dvacuation
v = vitesse de circulation (gnralement 0.6 m / s)
Le temps de parcours dun escalier est quant lui calcul par, quel que soit le sens de
parcours :
t = 4H
avec t = temps de parcours en secondes
H = hauteur dun tage en mtres
K. Togawa remarque que, pour lvacuation des tablissements plusieurs tages, la
largeur seule des escaliers nest pas sufsante pour prdire leur dbit. Il pense que les
paramtres les plus signicatifs sont la hauteur des marches et lallure des personnes.
Il constate que le temps de parcours dun escalier est inversement proportionnel son
angle et sa hauteur, et que la vitesse moyenne en descente est de 0.5 m/s.
Pour conclure, le modle de K. Togawa propose un ensemble de rgles permettant
une valuation approximative du dbit maximal admissible en sortie dun btiment. Il
semble difcile dintgrer telles quelles ces rgles dans un modle plus complexe, mais
elles peuvent tout de mme servir comme valeur de comparaison lors dune premire
tape de validation.
1.3.4 Le modle de Melinek et Booth
S. J. Melinek et S. Booth [85] ont amlior le modle de K. Togawa en prenant en
compte les ventuels phnomnes de saturation. Ils dcoupent un btiment en cellules
(une par tage) et calculent le temps dvacuation pour chacune delles.
Les personnes sont supposes tre proximit des escaliers, et leur ot continu et
ne rencontrant pas dobstacle. Il est aussi admis que les personnes quittant le rez-de-
chausse ne rduisent pas le dbit des niveaux suprieurs.
Il est dnit :
Q
r
= occupation du niveau r en personnes
b
r
= largeur de lescalier entre les niveaux r et (r 1) en mtres
N

= dbit unitaire par mtre de largeur des escaliers descendants (gnralement 1.1
pers / m / s)
t
s
= temps mis par une personne pour descendre librement un tage (gnralement
16 s)
La population P
r
des niveaux r et suprieurs se calcule ainsi :
P
r
=
n

i=r
Q
i
Le temps minimum pour descendre lescalier situ entre les niveaux r et (r 1) est :
P
r
N

.b
r
23
tude des circulations de personnes
Le temps pour que la queue de la foule atteigne le rez-de-chausse est :
r.t
s
Le temps minimum dvacuation T
r
des niveaux r et suprieurs est donc :
T
r
=
P
r
N

.b
r
+r.t
s
, r {1, ..., n}
soit :
T
r
=
n

i=r
Q
i
N

.b
r
+r.t
s
, r {1, ..., n}
Dans les cas o plusieurs escaliers sont disponibles un tage r, b
r
est considr
comme tant la somme de leurs largeurs. En supposant que le nombre doccupants
et la largeur descaliers soient identiques chaque niveau, on pose Q = Q
r
et b = b
r
.
On obtient donc le temps minimum T
r
dvacuation des tages r et suprieurs par :
T
r
=
(nr +1).Q
N

.b
+r.t
s
Deux cas sont alors possibles pour le temps net dvacuation T
e
:
Q
N

.b
>t
s
T
r
est maximum pour r = 1
Q
N

.b
<t
s
_

_
T
e
=
n.Q
N

.b
+t
s
(saturation chaque niveau)
T
r
est maximum pour r = n
T
e
=
Q
N

.b
+n.t
s
(aucune saturation)
Malheureusement, les temps prdits par ce modle sont gnralement bien infrieurs
ceux observs en situation relle (avec un cart denviron deux minutes). S. J. Melinek
et S. Booth proposent donc de rajouter systmatiquement ces deux minutes aux temps
calculs car ils estiment quelles correspondent au dlai de rponse lalarme ainsi
quau temps daccs aux escaliers.
Comme pour le modle de K. Togawa, le modle prsent ici fournit des approxima-
tions quant aux dbits maximum de personnes dans des situations particulires. Les
corrections approximatives apportes par S. J. Melinek et S. Booth peuvent amener
douter quant la gnralisation de leur modle. En effet, il est difcilement concevable
de pouvoir approximer la complexit du comportement humain par une approxima-
tion constante du temps de rponse un stimulus externe. Ainsi, dautres situations
ncessiteront certainement des corrections diffrentes.
1.3.5 Le modle de Pauls
J. L. Pauls [102, 103, 104] oriente son tude sur lobservation dexercices dvacuation
dimmeubles de bureaux de grande hauteur au Canada. Celui-ci justie lutilisation de
son modle par le fait que de tels exercices, mens en situations relles, peuvent tre
considrs comme potentiellement dangereux.
24
Modles macroscopiques
Son tude porte surtout sur lvacuation au niveau des escaliers, en tablissant la loi
suivante :
f = 0.206.p
0.27
avec f = dbit unitaire en pers. / s / m de largeur descalier
p = nombre de personnes par mtre de largeur descalier
J. Pauls afne son modle quantitatif par des prcisions qualitatives provenant de di-
verses observations (vidos, photographies). Il dveloppe ainsi le concept de largeur
effective dun escalier en constatant quun espace dune quinzaine de centimtres est
systmatiquement laisse entre les vacuants et les murs latraux. La largeur effective
correspond donc la largeur rellement utilise dun escalier, soit la largeur relle di-
minue de trente centimtres. Ainsi, il indique que la formule permettant de calculer le
dbit est :
Q = 0.206.(L0.3).(
P
L0.3
)
0.27
avec Q = dbit en pers. / s
L = largeur effective en mtres
P = nombre de personnes vacuant (P = p.L)
Le temps dvacuation est alors li la population initiale du btiment et la largeur
effective des escaliers par :
L
P
= 8040.T
1.37
avec L = largeur effective en mtres
P = nombre de personnes vacuant
T = temps dvacuation en secondes (au maximum 600)
J. Pauls prcise que le rapport
L
P
doit tre ajust pour tenir compte de paramtres in-
uenant lvacuation comme la forme des marches, les caractristiques de la popula-
tion (y compris vestimentaire), ou encore la position de lescalier dans le btiment.
J. Pauls se rapproche des tudes menes par J. J. Fruin [41] en mettant en vidence
la notion de distance minimale quun piton tablit avec ses voisins, directement issue
du concept psychologique despace personnel qui explique en grande partie lagence-
ment des pitons. Il note ce propos quun individu rduit plus facilement son espace
longitudinal que latral.
Dans tous les cas, le piton adopte de prfrence une position qui respecte un espace
personnel sufsant, impliquant que toute la largeur dun passage est exploite lex-
ception des quinze centimtres latraux. Cest pourquoi J. Pauls remet en cause la
notion dunit de passage, juge inadquate et irraliste , utilise dans certaines
rglementations (notamment la lgislation franaise).
Pour conclure, ce modle met en vidence les notions de distance de scurit latrale
et de couverture optimale de lespace. Ces constats renforcent les observations qualita-
tives faites en psychologie et sociologie. Les formules nonces peuvent quant elles
tre utilises pour grer macroscopiquement les circulations verticales. Il faut nan-
moins garder lesprit quune approche aussi gnrale aura du mal reproduire les
particularits du comportement humain.
25
tude des circulations de personnes
1.3.6 Le modle de Predtechenskii et Milinskii
V. M. Predtechenskii et A. I. Milinskii [112] proposent un modle uidique dtermi-
niste bas sur lanalyse statistique dun trs grand nombre de mouvements de foules.
Ces travaux ont eu un impact fort en Europe, et continuent encore aujourdhui a tre
utiliss aux tats-Unis, notamment par la Society of Fire Protection Engineers [95]. Ils
introduisent les notions dintensit et de dbit unitaire (produit de la densit et de la
vitesse du mouvement) an de dterminer la capacit dune issue.
La grandeur fondamentale de ce modle est la densit locale de la foule, exprime
comme le rapport entre la somme des projections horizontales des individus et la sur-
face totale occupe par la foule. Lencombrement dune personne est ici calcule en
fonction de son physique, de son ge ainsi que de sa tenue vestimentaire, et correspond
environ une ellipse :
s =

4
.l.e
avec s = surface au sol occupe par lindividu en m
2
l = largeur de lindividu en mtres
e = paisseur de lindividu en mtres
V. M. Predtechenskii et A. I. Milinskii fournissent quelques valeurs types pour diff-
rentes classes de population (Table 1.9).
ge Encombrement
Largeur paisseur Surface
en m en m en m
2
Enfant 0.3 0.34 0.17 0.21 0.04 0.056
Adolescent 0.38 0.43 0.22 0.27 0.067 0.09
Adulte : Vtements dt 0.46 0.26 0.1
Vtements de mi-saison 0.48 0.3 0.113
Vtements dhiver 0.5 0.32 0.125
Avec paquets lgers 0.75 0.4 0.235
Portant un enfant 0.75 0.48 0.285
Avec bagages 0.9 1.1 0.75 0.53 0.65
TAB. 1.9: Surfaces projetes pour diffrents types de population
La densit maximale tablie par le modle et valide par lobservation est de 0.92 m
2
de personnes par m
2
de surface (not m
2
p
/m
2
s
pour le reste du document), soit environ 7
adultes en vtements dhiver, en admettant quil ny ait pas de dformation de lellipse.
Dans la ralit les individus sont compresss, et ainsi la densit limite peut atteindre
1.15 m
2
p
/m
2
s
(soit 9 adultes), impliquant un fort risque dasphyxie et de malaise. Le
maximum donn pour une foule en mouvement est de 1.04 m
2
p
/m
2
s
(soit 8 adultes), la
vitesse et le dbit devenant pratiquement nuls.
La formule estimant la densit locale dun ot de personnes est :
D =
P.S
.l
26
Modles macroscopiques
avec D = densit locale en m
2
p
/m
2
s
P = nombre de personnes du ot
S = surface projete individuelle des personnes du ot en m
2
= largeur du ot en mtres, identique celle du passage
l = longueur du ot en mtres
La vitesse de ce groupe de personnes est alors une fonction dterministe de la densit :
v = f (D) m/s. V. M. Predtechenskii et A. I. Milinskii, sur la base dobservations, ont
ensuite rig une classication en trois catgories de vitesses, associes trois types de
conditions dvacuation : Confortable, Normale, Urgente (Figure 1.6). Emmanuel Lar-
deux [72], dans son analyse de ce modle, note que les termes Lente, Moyenne et Ra-
pide seraient ici plus appropris, vitant ainsi la confusion entre des aspects purement
cinmatiques (rapidit) et des causes potentielles (confort). Par exemple, des vitesses
faibles (catgorie Confortable) peuvent tre choisies an de tenir compte dune entrave
au dplacement (prsence de fume, handicap, ou autre).
Vitesse (m/min)
Densit (m
2
p
/m
2
s
)
FIG. 1.6: Vitesse de progression le long dune circulation horizontale en
fonction de la densit et des conditions dvacuation.
Par lexploitation directe de ces valeurs, on peut calculer le dbit de passage pour une
section de largeur : Q = D.v. m
2
/min. Mais cest gnralement le dbit unitaire
q = D.v m/min (aussi appel intensit) qui est utilis. Ce dbit unitaire est fonction de
la densit : il crot avec elle jusqu un certain seuil, puis diminue. La fonction qui les
lie dpend du type de passage considr : une circulation horizontale prsentera une
variation diffrente de celle dune issue ou dun escalier, ce dernier tant aussi sensible
au sens de franchissement. On peut remarquer sur la gure 1.7 que pour des densits
faibles ou moyennes (< 0.5 m
2
p
/m
2
s
), le dbit dun escalier descendant est suprieur
celui dun escalier ascendant. Puis, cette tendance sinverse, sexpliquant par le fait que
lavantage davoir fournir un effort moindre dans la descente, lorsque lescalier est
27
tude des circulations de personnes
peu encombr, est compens par linconvnient du risque de chute, lorsque la densit
augmente.
Dbit unitaire (m/min)
Densit (m
2
p
/m
2
s
)
FIG. 1.7: Dpendance entre le dbit unitaire, la densit de population, et le
type dun passage (conditions normales).
Pour simuler lvacuation dun btiment, on propage les densits et dbits des blocs
occups initialement. Trois types de propagations peuvent alors apparatre : transition,
conuence, et divergence.
Transition : elle a lieu lors dune modication de largeur du chemin dvacuation pen-
dant la propagation du ot de personnes.
Q
n+1
= Q
n
q
n+1
= q
n
.

n

n+1
Conuence : cest la fusion de plusieurs ots distincts de personnes.
Q
n+1
=

i=1
Q
n
i
q
n+1
=

i=1
q
n
i
.
n

n+1
28
Modles macroscopiques
Divergence : cest la sparation dun ot principal en ots secondaires. Cette spara-
tion peut se faire proportionnellement la largeur des circulations secondaires
(premire formule), ou selon une autre pondration (seconde formule, utilisant
une famille de pondrations
i
).
Q
(n+1)
i
= Q
n

(n+1)
i

j=1

(n+1)
j
Q
(n+1)
i
= Q
n

i

j=1

j
On a alors deux cas possibles :
1. Si le dbit impos la section aval est infrieur son dbit maximum q
max
absorbable (en se basant sur les courbes du modle Figure 1.6 et Fi-
gure 1.7 dpendant du type du bloc et des conditions dvacuation), le
dbit est conserv.
q
n+1
= q
n
.

n

n+1
q
max
La densit, ainsi que la vitesse, de la section aval se dduisent ensuite de
son dbit q
n+1
grce aux courbes.
2. Si le dbit impos la section aval est suprieur son dbit maximum q
max
absorbable, il y a apparition dun phnomne de congestion, ou blocage.
q
n+1
= q
n
.

n

n+1
> q
max
Une zone de forte densit (0.92 m
2
p
/m
2
s
) se cre alors dans la section amont,
au niveau de linterface entre les deux sections, et le dbit dans la section
aval se stabilise au dbit correspondant cette densit maximale.
q
n+1
= q(D
max
)
Le front entre la zone forte densit et le ot de personnes continuant
afuer se propage alors dans la section amont une vitesse v
p
ngative :
v
p
=
q(D
max
).

n+1

n
q
n
D
max
D
n
Puis, lorsque le ot amont nest plus aliment, le front se dissipe la vitesse
v
d
:
v
d
= v
n+1
.

n+1

n
De faon plus gnrale, la vitesse de transition entre deux ots de dbits q
1
/ q
2
et de
densits D
1
/ D
2
est :
v
t
=
q
2
q
1
D
2
D
1
29
tude des circulations de personnes
Pour conclure, on remarquera que les calculs imposs par le modle de V. M. Predte-
chenskii et A. I. Milinskii sont trs fastidieux. Nanmoins, ils fournissent des informa-
tions assez prcises, notamment en ce qui concerne les phnomnes de blocage. Il est
indniable que la richesse des donnes quantitatives fournies avec ce modle pourra
tre exploite dans dautres tudes.
1.3.7 Le modle de Takahashi, Tanaka, et Kose
K. Takahashi, T. Tanaka et S. Kose [129] proposent un modle en 1988 au Japon. Ils
dcrivent un btiment sous la forme de huit types dlments, dont deux reprsentant
des espaces virtuels :
Une pice est un espace pourvu dissues, contenant initialement des personnes.
Un couloir est un espace pourvu dune entre et dune sortie, initialement vide. Il
peut tre divis en units pour les besoins du calcul.
Un escalier est un espace reliant entre eux deux tages, fonctionnant comme un
chemin.
Un vestibule est un espace avec une entre et une sortie vers un escalier, fonctionnant
comme un chemin et permettant, par comptage, de juger de ltat dvacuation dun
tage.
Un hall est un espace entres et sorties multiples, connectes par des chemins
multiples.
Un refuge est une destination nale dvacus.
Un lien est un espace imaginaire sans capacit qui rgule un ot dvacus linter-
section de deux lments.
Une zone dentassement est un espace imaginaire qui reoit les vacus ne pouvant
passer immdiatement llment suivant.
Le modle suppose des mouvements homognes dvacuants (vitesse constante, mo-
dle uidique) et une rpartition initiale uniforme dans les pices. Au dpart de lva-
cuation, les occupants de chaque pice vont vers la sortie, en privilgiant la plus proche
si elles sont multiples. Ainsi, une pice avec plusieurs sorties sera dcoupe en units
(Figure 1.8(a)). Pour les cas o lissue ne se trouve pas dans un coin, on dcoupe celle-
ci en deux units (Figure 1.8(b)).
(a) Issues multiples.
(b) Issue non latrale.
FIG. 1.8: Dcompositions dune pice en units.
30
Modles macroscopiques
On a alors deux types de mouvements possibles :
1. Si la pice est meuble, les trajets sont en zigzag (Figure 1.9).
(a) (b) (c)
FIG. 1.9: vacuation dune pice encombre.
Les formules associes sont les suivantes :
P
t
=
_

(v.t)
2
2
0 t
a
v
(Figure 1.9(a))
.(a.v.t
a
2
v
)
a
v
<t
b
v
(Figure 1.9(b))
a.b
(a+bv.t)
2
v
b
v
<t
a+b
v
(Figure 1.9(c))
o t = temps coul depuis le dpart, en secondes
v = vitesse de marche en m / s
= densit initiale doccupation en personnes / m
2
P
t
= nombre dvacus arrivant la sortie avant linstant t
2. Si la pice ne contient pas dobstacle la marche, le trajet est centripte(Figure 1.10).
(a) (b) (c)
FIG. 1.10: vacuation dune pice dgage.
Les formules associes sont les suivantes :
P
t
=
_

.(v.t)
2
4
0 t
a
v
(Figure 1.10(a))
.
v.t
2
.(

2

1
.v.t +a. sin
1
)
a
v
<t
b
v
(Figure 1.10(b))
.
v.t
2
.(

2

1

2
.v.t
+a. sin
1
+b. sin
2
)
b
v
<t
a
2
+b
2
v
(Figure 1.10(c))
o
1
= arccos
a
v.t

2
= arccos
b
v.t
31
tude des circulations de personnes
En prenant comme principe que les personnes cherchent vacuer le plus vite possible,
on peut considrer que dans une pice ayant plusieurs sorties, elles choisissent celle qui
optimisera le temps global dvacuation. Le temps optimal tant :
T
min
=

i
Occ
i

i
P
ext
i
La distribution chaque issue est :
Occ

i
= P
ext
i
.T
min
avec P
ext
i
= dbit de la sortie i en personnes / s
Occ
i
= nombre de personnes la sortie i avant redistribution
Occ

i
= nombre de personnes la sortie i aprs redistribution
Notons que P
ext
i
peut changer au cours du temps en fonction des conditions la sortie i.
Les escaliers et les vestibules sont quant eux diviss en units dont la longueur cor-
respond la progression des vacuants en un pas de calcul t, soit v.t. Ainsi, chaque
pas de calcul, les occupants dune unit passent la suivante. Enn, les halls sont traits
de la mme manire que les pices.
Les auteurs ont compar leurs rsultats des observations effectues deux reprises
grce des camras vidos. Les premires concernent lvacuation de sept amphi-
thtres lors de lexposition internationale de Tsukuba au Japon en 1985. Ils ont constat
de meilleures prdictions en effectuant une subdivision des amphithtres en sous-
units quavec lapproche en zigzag. La seconde vrication t effectue dans un
immeuble de cinquante tages Tokyo. Dans les deux cas les temps obtenus grce
au modle sont infrieurs denviron 10% aux temps observs. Largument invoqu est
encore une fois le temps de prparation des occupants.
Pour conclure, on peut remarquer que ce modle est plus n que lensemble de ceux
vus prcdemment. En effet, celui-ci repose sur une description plus prcise de len-
vironnement, introduisant le concept dabstraction topologique an de simplier ce
dernier, ainsi que les premires notions de smantique avec la caractrisation des es-
paces. La marge derreur dans les rsultats observe est encore une fois due la trop
grande simplicit du modle, ne tenant pas compte de toute la complexit du compor-
tement humain. Malgr tout, ce modle ouvre la voie des approches plus complexes,
posant les bases de la description topologique dun environnement.
1.3.8 Synthse
Nous avons prsent tout au long de ce chapitre les premiers modles informatiques
ayant permis de simuler des foules de pitons. Ces modles se caractrisent tous par
une abstraction totale du comportement individuel, pour se concentrer sur une approche
macroscopique quantitative de la foule. Cest pourquoi ces modles ont t trs utili-
ss dans le cadre de simulations dvacuation, o le comportement individuel peut tre
quasiment ignor, se rduisant sa plus simple expression : se dplacer vers la sor-
tie la plus proche. Cest pourquoi nous pouvons penser que ces modles seraient trs
difcilement exploitables dans des situations plus varies, o limpact des dcisions
individuelles ne serait plus ngligeable.
32
La navigation ractive
Nanmoins, la plupart de ces approches sont bases sur des tudes statistiques cons-
quentes, issues dobservations du rel indpendantes du modle de synthse. Ces tudes
restent donc exploitables pour des simulations plus volues, ne serait-ce que pour va-
lider globalement les rsultats, ou encore comme donnes de conguration. Elles ne
sont nanmoins pas sufsantes, ne couvrant pas un spectre assez large du comporte-
ment humain.
Pour nir, nous pouvons aussi mettre en avant que ces modles font tat de certaines
organisations spatiales pour ne pas dire sociales observes dans les foules dindivi-
dus. Ces schmas indiquent globalement lattitude des individus lorsquils sont placs
dans certaines conditions de densit et avec certains buts (gnralement atteindre un
endroit prcis). Comme nous le verrons dans le chapitre suivant, la reproduction de
ces congurations est trs souvent utilise comme justication pour des modles plus
complexes.
1.4 La navigation ractive
Les mthodes de navigation ractive ont succd au mthodes macroscopiques, en ne
considrant plus cette fois-ci les entits simules dans leur globalit, mais de faon
indpendante. Cette nouvelle approche sinscrit dans le cadre de la simulation micro-
scopique, o chaque entit est dote de son propre processus de dcision, et sadapte
donc en regard des variations de son environnement. Cette navigation ractive est donc
un sous-ensemble du processus de dcision individuel, qui ce concentre sur la faon de
grer les interactions locales lies au dplacement pdestre.
Ces modles ont tout dabord t utiliss seuls, principalement pour de la simulation
dvacuation o les buts individuels sont borns au dplacement court terme. Ils se-
ront ensuite exploits dans des modles plus complexes, capables de prendre en charge
des comportements plus volus. Nous reviendrons sur ces processus de dcision vo-
lus dans les chapitres suivants, pour nous concentrer ici sur les principaux algorithmes
utiliss uniquement pour lvitement de collision.
1.4.1 Le modle de particules
Introduit par I. Peschl [106] en 1971, ce modle fait lanalogie entre le dplacement
dindividus en forte densit, nayant quasiment pas de libert de dplacement, et lcou-
lement de particules dans des compartiments. Ce modle est donc un rafnement du
modle macroscopique uidique, discrtisant le uide par autant dentits reprsentant
les pitons. I. Peschl indique dans son tude que cette modlisation est pertinente pour
le cas o une forte densit de personnes est conne et en tat de panique. Quand le
ot se dirige vers une unique issue, on voit apparatre un phnomne dagglutination.
Au nal, le dbit de lissue devient quasi nul. Le parallle peut tre fait avec des billes
introduites dans un rcipient perc, qui tombent grce la force de la gravit mais sont
bloques cause de la pousse croissante quelles exercent.
Le modle de particules permet dapprhender le phnomne darche observ par
K. Togawa [138] en 1955 (Figure 1.11). I. Peschl, en faisant des expriences la fois
sur des personnes et sur des billes de mtal, a dduit les rgles suivantes :
33
tude des circulations de personnes
Quand la largeur dune issue augmente, la probabilit dapparition dune arche di-
minue tandis que la variation du dbit augmente.
La probabilit dapparition dune arche crot avec la densit.
Le ux est linairement proportionnel la largeur de lissue.
Les pulsations du ux travers une issue sont induites, le plus souvent, par la for-
mation et la rsorption des arches.
FIG. 1.11: Phnomne dagglutination dans le modle de particules de
D. Helbing. Une arche se forme au cours du temps, due la
congestion au niveau de la sortie.
D. Helbing [54] tend ce principe avec un systme de forces socio-psychologiques tra-
duisant deux caractristiques : premirement la tendance garder une certaine distance
avec les autres pitons, deuximement la friction intervenant lors de la rsolution dun
contact entre plusieurs pitons. Le cadre dapplication principal de ce modle est la ges-
tion du comportement de panique, qui ne ncessite quune procdure comportementale
simple (aller vers un endroit, gnralement une sortie). La validit de cette approche
est atteste par la reproduction de mouvements macroscopiques observables en fortes
densits [52]. Des modles ont ensuite tendu celui de D. Helbing dautres cadres
dapplication. Ainsi, A. Braun et al. [27] introduisent un lien social entre les entits au
niveau de leur connaissance mutuelle, permettant une entraide en cas de panique. De la
mme manire, N. Pelechano et N. I. Badler [105] exploitent le modle de D. Helbing
pour la simulation dvacuation dimmeubles, en prenant en compte trois catgories de
population : les entrans, les meneurs, et les suiveurs. Ces trois archtypes vont alors
disposer de diffrentes forces dattraction/rpulsion reprsentant leur attitude globale.
Enn, T.I. Lakoba et al. [68] font tat de la non validit du modle de D. Helbing
dans des cas de faibles densits. Ils remarquent que les distances danticipation sont
trop faibles, provoquant des acclrations irralistes, et que les forces de rpulsions,
utilises pour viter linterpntration, sont trop fortes. Ils proposent ensuite une mo-
dication des quations et paramtres permettant de conserver un ralisme visuel dans
un plus large spectre de densits de personnes.
Nous avons vu que de nombreux modles dans la littrature exploitent le modle de
particules, et particulirement celui de D. Helbing, pour la gestion de la navigation p-
destre. Ces modles ont dmontr leur adquation aux situations dvacuations. Deux
raisons principales tendent restreindre les modles de particules cette catgorie
dutilisation. Premirement, ils ne proposent pas de gestion comportementale volue,
ce qui est acceptable dans les cas dvacuation o le but des entits consiste seulement
sortir de lenvironnement, mais insufsant pour des situations moins contraintes o
les individus auront des objectifs varis. Deuximement, le principe de prdiction lors
du dplacement nest abord que trs succinctement dans ces modles. Cela se justie
pour lvacuation, qui impose une distance interpersonnelle trs faible, mais devient
plus gnant lorsque les densits de personnes diminuent, autorisant des adaptations de
34
La navigation ractive
mouvement plus anticipes. Ainsi, il semble difcile dexploiter de tels modles pour
des simulations denvironnements et de situations quelconques, prsentant une certaine
diversit de comportements et un gradient de densits suivant les zones.
1.4.2 Le modle base de rgles
Craig Reynolds [121], avec son modle Flocks of Boids, introduit la notion de simu-
lation microscopique base de rgles. Ici, le dplacement de chaque individu est rgit
par des rgles de comportement de la forme si condition alors action .
Trois rgles sont proposes par C. Reynolds dans le cadre de lanimation de nues
(Figure 1.12) :
Sparation an dviter dventuelles collision avec ses voisins.
Alignement an de rguler sa vitesse par rapport lensemble du groupe.
Cohsion an de rester proche de ses voisins.
(a) Sparation (b) Alignement (c) Cohsion
FIG. 1.12: Les trois rgles comportementales du modles Flocks of Boids
De telles rgles dinter-relations conduisent ainsi un comportement de groupe mer-
geant. Mais, dans ce modle ocks of boids, lautonomie de lentit est bride par le fait
que son comportement est uniquement dni en fonction de celui de ses voisins. On a
alors deux catgories dindividus : des leaders qui choisissent rellement la trajectoire,
et des suiveurs qui se contentent dvoluer suivant le mouvement gnral en appliquant
les rgles dvitement. C. Hartman et B. Benes [51] proposent de ne pas xer le lea-
der lors de la simulation, mais plutt dintroduire une nouvelle rgle permettant une
entit standard de prendre la place du dcideur actuel.
Dautre approches, comme celle de W. Shao et D. Terzopoulos [124] ou F. Lamarche et
S. Donikian [70], exploitent tout de mme le concept de rgles sans avoir recours un
leader : les diffrentes possibilits dadaptation de lentit sont itrativement values
lors du dplacement, ce dernier tant cette fois-ci guid par un processus de contrle
indpendant. Cette technique est aussi utilise dans le monde du jeu vido [50], o les
possibilits de contrle offertes par les rgles sduisent. De plus, la faible complexit
dvaluation des modles base de rgles est exploite par le domaine de lanima-
tion [79] an de peupler des environnements avec des milliers dindividus capables de
se dplacer, et mme daccomplir certains comportements assez simples.
Pour conclure, les modles base de rgles proposent une approche plus souple de la
navigation microscopique, permettant dintroduire des adaptations varies dans diff-
rentes situations. Nanmoins, le caractre itratif de la dcision rend difcile la fusion
dinformations, les rgles tant indpendantes les unes des autres. Une solution, ex-
ploite par W. Shao et D. Terzopoulos [124] ou encore S. Raupp Musse [89], est de
35
tude des circulations de personnes
crer des rgles grant directement un ensemble dinformations, comme un groupe de
personnes voluant dans lenvironnement. Mais cette approche a le dsavantage de sp-
cialiser le modle, rendant encore une fois sa gnralisation difcile : an de grer le
gradient des situations pouvant apparatre lors de la navigation, un modle base de
rgles devra spcier lensemble des adaptations pouvant intervenir pour lensemble
des congurations.
1.4.3 Un modle gomtrique prdictif
F. Feurtey [39] propose une approche prdictive de lvitement de collision. Il repr-
sente lenvironnement de navigation des entit en 3D, dans un repre (x, y, t).
Dans ce repre, lensemble des dplacements possibles pour une entit donne se re-
prsente sous la forme dun cne, dont la pente correspond la vitesse maximale V
M
de lentit, et dont le sommet est sa position actuelle M. Le cercle des dplacements
admissibles en un laps de temps t est donc le cercle inclut par le cne dont le rayon
est V
M
.t (Figure 1.13(a)). Ensuite, une collision est reprsente dans le cne sous la
forme dun segment, dans le cas o la trajectoire dune entit voisine lintersecte. Pour
reprsenter limprcision de la prdiction de la trajectoire, en cas de changement de
direction, la zone de collision potentielle est tendue par un triangle (Figure 1.13(c)).
(a) (b) (c)
FIG. 1.13: Modle prdictif de navigation de F. Feurtey. (a) Reprsentation
dans (x, y, t) du dplacement dune entit. (b) Les trois adaptations
de trajectoire possibles pour viter une collision. (c) Recherche de
la meilleure trajectoire suivant les collisions prdites.
F. Feurtey part du principe que pour viter des collisions, un individu applique trois
rgles avec diffrentes priorits (Figure 1.13(b)) :
1. Prserver sa direction.
2. Prserver sa vitesse.
3. Prserver le temps ncessaire au dplacement.
Il propose de synthtiser ces rgles dans une fonction de cot C
P
calcule pour chaque
point P non contraint du cercle des dplacements admissibles de rayon r
M
. Cette fonc-
tion de cot est sensible au point V reprsentant la projection de lentit de rfrence
36
La navigation ractive
sa vitesse actuelle, et au point G qui est son but (reprsents sur la gure 1.13(c)) :
C
P
= K
1
GP
2.r
M
+K
2
angle(OV,OP)
180
+K
i
|OPOV|
2.r
M
avec i =
_
3 si OP OV
4 si OP < OV
Dans cette formule, les paramtres K sont des constantes reprsentant les poids relatifs
des diffrentes catgories dadaptation :
K
1
est le cot dloignement par rapport au but actuel.
K
2
est le cot de changement de direction.
K
3
est le cot dacclration.
K
4
est le cot de dclration.
Le meilleur mouvement est alors celui correspondant au point P qui minimise cette
fonction de cot, lauteur ne prcisant pas la mthode de recherche employe.
Cette mthode prsente lavantage indniable dtre fonde sur les logiques de locomo-
tion humaine, dont notamment les diffrentes capacits dadaptation et le mcanisme
de prdiction. On retrouve ainsi des rfrences dans la littrature [79, 141, 125] quant
aux principes mis en avant par cette dmarche, sans pour autant quelle soit rutilise
du fait de certains de ses inconvnients. Son premier point faible est quelle ne propose
pas de mthode pour inclure les obstacles statiques de lenvironnement, tels que les
murs, qui jouent pourtant un rle prpondrant dans la prise de dcision de la naviga-
tion. Un autre dsavantage est que cette mthode considre les collisions sparment
les unes des autres en appliquant sa fonction de cot, bien que celles-ci soient unies
en une seule reprsentation. Ce second point bride le principe de prdiction, en n-
gligeant des liens de dpendances entre plusieurs collisions (comme deux personnes
marchant cte cte). Enn, F. Furtey indique que le passage lchelle na pu tre
ralis, sans doute cause de la complexit de la mthode de recherche dune solution.
Ainsi, il ne fait tat dexpriences nimpliquant quun nombre trs limit dentits, une
douzaine, bien en de de leffectif ncessaire lmergence dune foule.
Pour conclure, il semble que la reprsentation propose par cette mthode dans le temps
et lespace soit un bon point de dpart pour un processus de navigation ractive, tout
comme le fait de considrer plusieurs possibilits de rsolution de conit. Il faut nan-
moins tendre la mthode de calcul an de fusionner les informations quant la prise
de dcision, dinclure les obstacles statiques de lenvironnement, et damliorer la com-
plexit du traitement pour permettre son application des foules dindividus.
1.4.4 Synthse
Nous avons expos dans ce chapitre trois techniques permettant de simuler individuel-
lement les circulations de personnes. Nous nous sommes concentrs ici sur le caractre
ractif de la dcision lors du mouvement pdestre : la navigation ractive.
La premire conclusion que lon peut tirer des modles prsents est quaucun de ceux-
ci ne permet, seul, de grer toutes les situations potentielles des mouvements de per-
sonnes. Certains sont plus axs sur lobtention de performances de calcul, dautres sur
la robustesse de la rsolution, certains donnent une grande part lorganisation sociale,
37
tude des circulations de personnes
et dautres appuient plus sur la dcision individuelle. Le danger lors de la rutilisation
de ces modles est donc de les exploiter en dehors du contexte pour lequel ils ont t
crs, et valids.
Dautre part, ces modles nabordent pas le caractre plus global de la dcision relative
au dplacement. Nous verrons par la suite que dautres techniques sont ncessaires
pour traiter ce sujet, et sont gnralement utilises conjointement aux modles exposs
ici.
Pour conclure, nous pouvons retenir comme points forts des mthodes voques : lor-
ganisation macroscopique mergeant du modle de particules, le large ventail de situa-
tions pouvant tre couvert par le modle base de rgles, et le fort lien avec les logiques
de dplacement pdestres du modle gomtrique prdictif. Il serait alors intressant
de se diriger vers un modle permettant un contrle n comme avec les rgles, tout en
conservant les schma sociaux mis en vidence avec les particules. Nous pouvons de
plus afrmer que le modle gomtrique prdictif doit tre le support de la dcision de
lindividu, celui-ci permettant la mise en place de mcanismes dadaptation ralistes.
1.5 Reprsentation de lenvironnement
et recherche de chemin
Comme nous lavons voqu dans la section prcdente, lvolution des modles in-
formatiques avec lapproche microscopique sest intress laspect individuel de la
dcision relative au dplacement. Cest cet aspect que sintresse la planication de
chemin. Le but de la planication de chemin nest plus, comme avec la navigation r-
active, de grer les interactions locales entre individus, mais de trouver globalement les
endroits par lesquels passer pour atteindre une destination.
On voit donc apparatre avec ces modles la ncessit dune description topologique,
permettant de reprsenter et dorganiser lenvironnement de simulation. Cette descrip-
tion topologique peut tre plus ou moins ne, exacte ou approximative, et peut ven-
tuellement contenir des informations smantiques. Les algorithmes utiliss en anima-
tion comportementale pour reprsenter lenvironnement sont troitement lis ceux
employs en robotique [73], domaine o cette reprsentation tient un rle prpond-
rant.
Cette description est ensuite exploite par des algorithmes de recherche de chemin.
Ceux-ci peuvent se baser sur diffrentes informations issues de lenvironnement, quelles
soit gomtriques comme les distances, ou qualitatives comme la charge cognitive as-
socie au chemin. Cette planication de chemin constitue un premier pas vers des mo-
dles de dcision plus pousss, ouvrant la voie une gestion comportementale indivi-
duelle.
1.5.1 Reprsentations exactes de lenvironnement
Les reprsentations exactes de lenvironnement vont chercher organiser les donnes
spatiales tout en conservant intgralement les informations quelles contiennent lori-
gine. La mthode utilise consiste gnralement dcouper lespace navigable en cel-
lules convexes de diffrentes formes. Il existe plusieurs modles pour effectuer cette
38
Reprsentation de lenvironnement et recherche de chemin
subdivision, mais nous nous attacherons ici la plus utilise quest la triangulation de
Delaunay, ainsi qu ses volutions.
Triangulation de Delaunay
La triangulation de Delaunay [22] cre un ensemble de triangles en runissant des
points fournis en entre. Lalgorithme dunication respecte pour contrainte que le
cercle circonscrit un triangle ne contienne aucun autre point que les trois sommets qui
le composent. Une consquence de cette proprit est que langle minimum dun tri-
angle produit est maximis. La complexit de lalgorithme dunication est en O(n. lnn),
avec n le nombre de points fournis en entre.
La proprit la plus intressante de cette triangulation est que chaque point y est reli
son plus proche voisin par larte dun triangle. Ainsi, cette triangulation peut tre uti-
lise pour reprsenter lespace navigable, les points dentre tant issus des obstacles.
Une autre utilisation possible de cette triangulation est cette fois dynamique lors de
la simulation [70], pour calculer un graphe de voisinage entre les entits mobiles, qui
serviront cette fois-ci de point dentre.
Triangulation de Delaunay contrainte
La triangulation de Delaunay contrainte [30] permet de modrer les contraintes de la
version standard an de conserver certaines artes de la dnition graphique dorigine.
Pour se faire, la contrainte du cercle circonscrit un triangle est modie, pour spcier
que tout point inclus dans ce cercle ne peut tre reli tous les points du triangle sans
intersecter un segment contraint.
Cette triangulation tend la proprit du plus proche voisin en permettant dy associer
une notion de visibilit. Si lon considre que les artes contraintes coupent la visibilit
dun point lautre, la proprit de plus proche voisin devient : chaque point est reli
son plus proche voisin visible.
La triangulation de Delaunay contrainte est aussi utilise pour obtenir une subdivision
spatiale en triangles [59], en introduisant les obstacles la navigation sous la forme
dautant de segments contraints (Figure 1.14). Il a t prouv [21] que le nombre de
triangles produits lors dune telle subdivision est linaire en fonction du nombre de
points, indiquant que la discrtisation est donc directement proportionnelle la com-
plexit gomtrique de lenvironnement. Cette proprit prsente un avantage certain
comparativement aux mthodes approximatives, o la discrtisation est fonction de la
prcision dsire de la reprsentation.
Triangulation de Delaunay ltre
La triangulation de Delaunay ltre [70] est une extension de la version contrainte.
Deux types de ltrages sont proposs, lun ayant pour effet daugmenter le nombre de
triangles produits an dafner la reprsentation de lenvironnement, lautre de le di-
minuer an de tenir compte de la visibilit pour llaboration dun graphe de voisinage.
Premirement, concernant son application la subdivision spatiale, la triangulation
39
tude des circulations de personnes
(a) Environnement dorigine (b) Triangulation de Delaunay contrainte
FIG. 1.14: Exemple de triangulation de Delaunay contrainte.
de Delaunay est ltre par lajout progressif de contraintes reprsentant les goulets
dtranglement (Figure 1.15(a)). Ainsi, en considrant lensemble des artes produites,
on est sr de reprsenter tous les rtrcissements prsents dans lenvironnement.
Deuximement, concernant son application aux graphes de voisinage, la triangulation
de Delaunay est ltre sur un principe quivalent la triangulation contrainte, en sup-
primant les artes intersectant des obstacles de lenvironnement (Figure 1.15(b)). Ainsi,
cette triangulation peut servir dterminer trivialement quels sont les voisins directs
visibles dune entit, et avec un simple parcours de graphe peut slectionner les entits
visibles une certaine distance.
1) 2)
3) 4)
(a) Filtrage pour subdivision spatiale. 1) Environnement
dorigine. 2) Triangulation de Delaunay contrainte.
3) Calcul des plus courtes distances des sommets aux
segments voisins. 4) Triangulation ltre.
(b) Filtrage pour graphe de voisinage.
Seules les artes noires seront conser-
ves, nentrant pas en collision avec les
obstacles de lenvironnement.
FIG. 1.15: Exemples de triangulations de Delaunay ltres.
Synthse
Pour conclure concernant les reprsentations exactes de lenvironnement, nous allons
retenir deux points forts. Tout dabord, ces reprsentations sont totalement indpen-
dantes dune quelconque prcision dsire, reproduisant exactement lenvironnement
dorigine tout en lorganisant de manire plus accessible. Ainsi, il sera possible par ces
40
Reprsentation de lenvironnement et recherche de chemin
reprsentations dextraire la dnition graphique source, pour son ventuelle utilisation
dans des processus plus prcis. Ensuite, ces reprsentations exposent plusieurs propri-
ts, comme le calcul des plus proches voisins, permettant par la suite dautomatiser un
certain nombre de calculs moindre cots.
Nanmoins, un point faible est associ ces techniques, rsidant dans la profusion des
cellules produites. En effet, pour des environnements gomtrie complexe, notam-
ment contenant des courbes, le nombre de triangles obtenus augmente trs rapidement.
Mme si leffectif des triangles reste linaire en fonction du nombre dobstacles traits,
cela rduira tout de mme les performances dalgorithmes se basant sur cette dnition.
Une solution propose par F. Lamarche et al. [71, 70] consiste abstraire la subdivision
obtenue, par des regroupements successifs, permettant de hirarchiser les processus et
ainsi de rduire le nombre de cellules manipuler chaque tape. Il faut tout de mme
noter que pour rester avantageuse en terme de ralisme, une telle abstraction doit per-
mettre de conserver un maximum dinformations. Dans le cas contraire, elle risque
de fausser les dcisions prises par des algorithmes lexploitant directement (comme la
planication de chemin).
1.5.2 Reprsentations approximatives de lenvironnement
Les reprsentations approximatives de lenvironnement sont sans doute les plus uti-
lises en animation comportementale, du fait de leur facilit de mise en uvre. Ces
reprsentations vont dcrire lespace libre de navigation avec des formes gom-
triques simples telles que des carrs ou des segments. Deux modles entrent dans cette
catgorie : les modles base de grilles, et les cartes de cheminement.
Modles base de grilles
Le premier modle de reprsentation approximative utilise des grilles rgulires, for-
mes de cellules carres en deux dimensions (Figure 1.16(a)) et cubiques en trois di-
mensions. Lenvironnement est donc pav par ces cellules, qui peuvent avoir trois tats :
libre, partiellement obstrue, et obstacle.
La prcision de la reprsentation obtenue dpend directement de la taille des cellules
utilises : plus les cellules sont grandes, moins la reprsentation est prcise. Bien en-
tendu, laugmentation de la prcision induit une augmentation proportionnelle de loc-
cupation mmoire. Loccupation mmoire de cette mthode constitue ainsi son premier
point faible, se rpercutant directement sur la complexit de recherche de chemin lin-
trieur de lenvironnement [137].
Pour rduire ce problme, une volution de ce modle est apparue sous la forme des
grilles hirarchiques [148, 124]. Cette mthode dcrit lespace navigable par une suc-
cession de grilles de plus en plus prcises, organises sous forme darbre. Lalgorithme
de construction va commencer par paver lenvironnement avec les cases les moins pr-
cises, puis dcouper rcursivement les cases partiellement obstrues, en quatre parties
pour la 2D (formation dun quadtree Figure 1.16(b)), ou en huit pour la 3D (for-
mation dun octree). Lalgorithme arrte les subdivisions ds quune prcision xe est
atteinte, ou si la case produite nest plus partiellement obstrue. Cette mthode est donc
dautant plus avantageuse que lenvironnement est peu dense en obstacles.
41
tude des circulations de personnes
(a) Grille rgulire (b) Quadtree de profondeur 3
FIG. 1.16: Exemple de grilles rgulires.
Les mthodes base de grilles sont fortement utilise en animation comportemen-
tale [66, 131] du fait de leur simplicit de mise en uvre et de leur rapidit dexploi-
tation. On peut ainsi voir des animations de milliers dindividus [132] bases sur ce
mode de reprsentation (Figure 1.17).
FIG. 1.17: Utilisation de grille en animation.
Les grilles sont trs difcilement gnralisables des environnements quelconques,
notamment sils comportent des obstacles non aligns sur les axes, et dans un cadre
de simulation o lindividu devra se dplacer nement. Nanmoins, la rapidit daccs
aux informations quelle produit fait de cette mthode un complment envisageable
une approche plus ne de reprsentation de lenvironnement. Pour nir, il faut remar-
quer que le niveau de discrtisation de la grille introduit implicitement une limite aux
densits de populations que lon peut simuler [5]. Cela rend aussi le dplacement des
entits discret, et les contraint gnralement avoir une taille standardise.
Cartes de cheminement
Les cartes de cheminement discrtisent lespace navigable sous la forme dun rseau
de chemins. Ce rseau est obtenu en reliant des points clefs rpartis lintrieur de
lenvironnement (Figure 1.18). Plusieurs mthodes existent pour crer des cartes de
cheminement, diffrentes dans la manire de crer et de relier ces points clefs.
42
Reprsentation de lenvironnement et recherche de chemin
(a) Calculs sur lenvironnement dorigine (b) Exemple de carte de cheminement
FIG. 1.18: Exemple de carte de cheminement. A gauche, triangulation de De-
launay (gris) de lenvironnement dorigine, et carte de chemine-
ment dduite (bleu). A droite, un exemple de carte de chemine-
ment obtenue.
Graphe de visibilit. Cette mthode utilise les sommets des polygones reprsentant
les obstacles comme points clefs. Les points clefs sont ensuite relis deux deux sils
sont mutuellement visibles, cest dire si lon peut tracer une ligne droite passant
par les deux points sans rencontrer dobstacle. Les graphes ainsi crs minimisent les
distances parcourues [7], assurant dobtenir des chemins de longueur minimale. La
taille du graphe gnr est ici dpendante du nombre de points mutuellement visibles,
et est donc dautant plus importante que lenvironnement est ouvert avec des obstacles
ponctuels et disparates.
Diagramme de Vorono gnralis. Cette mthode est base sur une notion dqui-
distance aux obstacles de lenvironnement. Pour se faire, un ensemble de sites sont
valus au sein de lenvironnement, correspondant aux obstacles, dont les intersections
vont former les points clefs. Les chemins ainsi gnrs maximisent la distance aux
obstacles. Ce calcul savre complexe, mais son approximation peut tre obtenue ra-
pidement par des mthodes utilisant les cartes graphiques [58], o le calcul est obtenu
directement en effectuant le rendu des sites. Une autre mthode utilise la triangulation
de Delaunay pour obtenir les points clefs du diagramme de Vorono gnralis, en se
servant du centre des triangles calculs. La carte de cheminement ainsi produite peut
tre considre comme un condens des informations de la triangulation, ne contenant
plus la dnition gomtrique des obstacles de lenvironnement.
Cartes de cheminement probabilistes. Avec cette mthode, la dnition gom-
trique de lenvironnement nest pas utilise comme support direct de la construction.
En effet, les points clefs sont ici obtenus par une distribution alatoire au sein de len-
vironnement navigable [97]. Deux points sont ensuite relis sil existe un chemin libre
de collision entre eux. Ce test est effectu en se basant sur la gomtrie de lenvi-
ronnement, mais aussi sur la taille de lentit qui se dplace. Cette mthode est plus
largement utilise en planication de mouvement [31, 109] quen navigation, an de
43
tude des circulations de personnes
gnrer des dplacements assez complexes (sauter, se baisser, marcher sur des piliers).
Pour conclure, les cartes de cheminement prsentent le net avantage de fournir une des-
cription trs condense de lenvironnement, ne ncessitant une prise de dcision quau
niveau des points clefs. Nanmoins, leur dnition seule nest pas sufsante pour grer
la complexit de la locomotion humaine. Par exemple, leur exploitation devient trs
difcile lorsquil sagit de grer le croisement des entits le long dun mme chemin.
Certaines mthodes [108] proposent de rgler ce problme en subdivisant chaque che-
min dans sa largeur, les grant ainsi comme un ensemble de rails parallles entre les-
quels vont pouvoir transiter les entits en mouvement. Mais, mme si une telle mthode
produit des animations visuellement plausibles, son fonctionnement est trop loign du
comportement humain pour tre exploit dans des simulations ralistes. Les reprsen-
tations sous forme de cartes de cheminement semblent donc bien adaptes un proces-
sus de planication de chemin gnral, ne tenant pas compte des autres entits, mais
beaucoup moins un processus de navigation, grant lui les mouvements locaux.
1.5.3 Le modle de champs de potentiels
Le modle base de champs de potentiels consiste en une dnition de lenvironnement
permettant directement de rsoudre les dplacements de personnes. Les champs de
potentiels caractrisent les obstacles de lenvironnement par des forces de rpulsion,
et les buts par des forces dattraction [117, 141]. Un gradient de forces, ou champ de
potentiel, est alors dduit en chaque point de lenvironnement comme tant une somme
pondre, le plus souvent par la distance, des potentiels de rpulsion et du potentiel li
au but (Figure 1.19). La navigation dune entit est alors simule par une descente de
gradient depuis sa position dans lenvironnement.
(a) Environnement dorigine (b) Exemple de champs de potentiels
FIG. 1.19: Carte de champs de potentiels : en noir les obstacles (rpulsion),
en blanc les zones de navigation (attraction). Le gradient de gris
exprime la valeur de potentiel dans lenvironnement. Cet exemple
contient 6 minima locaux : zones isoles potentiel dattraction
maximal.
Les mthodes bases sur les champs de potentiels savrent simples et efcaces, mais
posent le problme des minima locaux : zones de lenvironnement o un potentiel mi-
44
Reprsentation de lenvironnement et recherche de chemin
nimal isol apparat (Figure 1.19(b)). Ainsi, la mthode de navigation associe va pous-
ser lentit se dplacer vers le minimum local le plus proche, qui ne reprsente pas
forcment son but. Pour pallier ce type de problme, des mthodes base de marche
alatoire sont utilises. Par exemple, dans RPP (Random Path Planner) [16], lorsquun
minimum local est atteint, un ensemble de congurations alatoires sont tires puis tes-
tes avec une phase de sortie du minimum et une phase de convergence vers le prochain
minimum. Les informations sont alors stockes dans un graphe dont les nuds sont les
minima locaux et les arcs traduisent des chemins entre deux minima. Dautre mthodes
existent base de tirage alatoire de direction suivre [29], plutt que de conguration,
pour chapper au minimum local. Ces mthodes ne sont cependant pas trs adaptes
lanimation comportementale. Les comportements induits par les tirages alatoires,
sils sont acceptables pour des robots, ne le sont pas pour des humanodes car ils sont
en dehors de la logique de navigation humaine qui comporte une part importante de
planication.
De manire gnrale, les mthodes base de champs de potentiels ne sont pas appli-
cables directement la simulation dhumains, du fait du manque de souplesse dans la
mthode de contrle. On peut nanmoins trouver quelques cas dapplication grande
chelle [45], o le comportement individuel est noy dans la caractrisation globale
des mouvements de milliers dindividus. Notons tout de mme que cette technique a
deux grands avantages quil serait bon de conserver dans une volution permettant une
dcision individuelle plus importante. Premirement, cette mthode permet la fusion
de linformation au sein de lenvironnement, traduisant tout ce qui intervient dans la
navigation par des potentiels qui sont mlangs. Deuximement, et cest une cons-
quence directe du premier point, ces mthodes introduisent une abstraction trs forte
de lenvironnement, grce laquelle lindividu ne raisonne plus sur des entits per-
ues indpendantes (que ce soit la topologie des lieux ou les autres individus), mais
directement sur une abstraction spcialise pour sa tche de dplacement.
1.5.4 Planication de chemin
An dexploiter une reprsentation de lenvironnement, quelle soit approximative ou
exacte, les simulations microscopiques ont gnralement recours un procd nomm
planication de chemin. Ce procd peut tre compar un comportement expos en
psychologie, qui a pour but dextraire un chemin reliant la position courante de len-
tit une destination donne. Une mthode classique pour effectuer cette planication
consiste utiliser des algorithmes de parcours de graphe, bien que certaines mthodes
utilisent dautres techniques (comme la descente de gradient pour le cas des champs
de potentiel, Chapitre 1.5.3, page 44). En effet, toutes les reprsentations topologiques
que nous avons introduites sont exploitables sous la forme dun graphe de points de
passages, o les nuds reprsentent les zones navigables et les arcs les connexions
entre ces zones.
Algorithmes de parcours
Diffrents algorithmes de parcours de graphe peuvent tre utiliss dans le cadre de
la planication de chemin. Ceux que nous dcrirons ici se basent sur un critre de
minimisation de cot pour extraire le plus court chemin. Ce cot reprsente souvent
45
tude des circulations de personnes
une notion de distance spatiale, mais nous verrons dans la section suivante que des
heuristiques plus complexes peuvent tre utilises.
Dijkstra Lalgorithme de Dijkstra, aussi dnomm ood-ll [75], permet de trouver
lensemble des meilleurs chemins entre deux nuds du graphe. Cet algorithme utilise
une le de priorit o il stocke pour chaque nud explor deux informations :
la distance parcourue depuis le nud de dpart jusquau nud courant ;
le nud prcdent, i.e. parcouru avant le nud courant.
Lalgorithme commence avec un nud source correspondant gnralement la posi-
tion courante de lentit, qui na donc aucun prdcesseur et un compteur de distance
nul. Cet algorithme fonctionne directement sur le graphe topologique, quil soit expli-
cite (par exemple avec les cartes de cheminement) ou implicite (par exemple avec les
grilles). An de trouver un chemin entre deux nuds, en admettant que la longueur
de ce chemin soit l, lalgorithme explorera par propagation circulaire lensemble des
nuds se trouvant une distance infrieure l (Figure 1.20).
(a) Environnement non contraint (b) Environnement avec obstacle concave
FIG. 1.20: Fonctionnement de lalgorithme de Dijkstra dans des cas
contraints ou non [101]. Le carr rose reprsente le nud source,
le mauve la destination. Le gradient de bleus correspond la dis-
tance lorigine, le plus clair tant le plus loign.
Les intrts majeurs de cet algorithme sont sa robustesse (si un chemin existe il sera
forcment trouv) et son abstraction totale de la destination, si ce nest comme condi-
tion de n. Son point faible est sa complexit calculatoire, tant de lordre de O(A+
N. logN) o A est le nombre darcs du graphe, et N son nombre de nuds. Malgr
tout, ce point faible peut aussi tre un avantage, lalgorithme supportant des recherches
guides par un but plus conceptuel, associ la smantique des nuds parcourus.
A
*
Dans les cas o la performance de la recherche est primordiale, comme en anima-
tion comportementale (dans le cas des jeux vidos par exemple), lalgorithme A

[93]
est plus utilis. Celui-ci fonctionne dune faon similaire lalgorithme de Dijkstra,
mais en ajoutant un cot prdictif aux nuds correspondant au reste du chemin par-
courir. Le cot total est donc la longueur relle du chemin jusquau nud, incrmente
par une valeur prdite pour le chemin menant au but, calcule par une heuristique.
Lalgorithme va ainsi parcourir les nuds dans lordre croissant de leurs cots associs
(Figure 1.21). La rapidit de convergence de cet algorithme est directement dpen-
dante de la qualit de lheuristique employe. Dans le cas de la recherche de plus court
46
Reprsentation de lenvironnement et recherche de chemin
chemin, lheuristique employe est une estimation de distance, gnralement la norme
gomtrique sparant le nud courant du but.
(a) Environnement non contraint (b) Environnement avec obstacle concave
FIG. 1.21: Fonctionnement de lalgorithme A

dans des cas contraints ou


non [101]. Le carr rose reprsente le nud source, le mauve la
destination. Le gradient de jaune bleu correspond au cot total
du chemin passant par le nud (somme de la longueur relle et
prdite), celui-ci tant dautant plus petit que sa couleur est bleue.
Lavantage de cet algorithme rside dans sa rapidit calculatoire. Son inconvnient ma-
jeur rside dans le recours une heuristique. En effet, plus lvaluation de la longueur
de chemin sera complexe, pouvant faire intervenir dautres paramtres que la distance
(par exemple un cot associ la smantique), plus cette heuristique sera difcile ex-
pliciter. Ainsi, il est difcile dutiliser cet algorithme pour des planications de chemin
dont le but nest pas clairement identi dans le graphe topologique, comme pour des
recherches exploratoires o buts multiples.
volutions du A
*
Un certain nombre dvolutions ont t proposes pour amliorer
les proprits du A

. B. Logan et N. Alechina [77] proposent lalgorithme ABC (pour


A

with Bounded Cost), permettant dajouter des contraintes molles respecter lors de
la planication, comme des limitations de temps ou dnergie.
Lalgorithme IDA

[65] commence par effectuer une recherche en profondeur dans


le graphe. Tout dabord, une distance maximale de parcours D est estime comme
tant la distance au but. Lexploration commence alors avec le nud dorigine, puis
value rcursivement les voisins jusqu ce que lune des deux conditions suivantes soit
vrie : soit un chemin est trouv, il est alors minimal, soit un nud est parcouru dont
le cot est suprieur D. Dans ce dernier cas, la recherche continue avec une borne D
remise jour par la plus petite estimation de la distance au but value prcdemment.
Dans les faits, cet algorithme est plus lent que le A

traditionnel, mais ncessite moins


de mmoire.
Lalgorithme HPA

[24] (pour Hierarchical Pathnding A

) consiste redcouper
abstraire le graphe de lenvironnement an de hirarchiser la planication. Ensuite,
lalgorithme propose dassocier des pr-calculs de plus courts chemins entre des points
clefs de chaque partie abstraite. Ainsi, cet algorithme va pouvoir valuer un chemin de
haut niveau en ne manipulant que peu de nuds.
47
tude des circulations de personnes
Critres de planication de chemin
Diffrents critres peuvent tre valus pour le cot des algorithmes prcdents. Les
plus anciennes mthodes, ainsi que la plupart de celles utilises en animation, se basent
uniquement sur la distance sparant les nuds. Mais, comme lont montr les tudes
en psychologie prsentes au dbut de ce chapitre, cette information de distance est
ncessaire, mais certainement pas sufsante pour rendre compte de la complexit du
raisonnement humain. Ainsi, dans des simulations se voulant plus ralistes, dautres
critres dvaluation sont proposs.
H.H. Hochmair et V. Karlsson [57] introduisent la notion de dviation minimale, en
tenant compte des changements de direction dans le cot associ un chemin. Ils
prennent aussi en compte des facteurs qualitatifs via des prfrences, ainsi quune
connaissance relative lenvironnement. M. Duckham et L. Kulik [38] prennent en
compte le concept de charge cognitive associe la recherche dun chemin, avec une
stratgie de chemin le plus simple. Un autre paramtre, fondamentalement li aux
foules dindividus, est la congestion dune zone de lenvironnement [124]. Un facteur
de stress [96] peut aussi tre appliqu, li au nombre de personnes dans lenvironne-
ment immdiat ainsi qu la dviation par rapport au chemin le plus court.
On peut ainsi voir que de nombreuses mthodes sont proposes an de quantier et
qualier un chemin dans lenvironnement. Malgr tout, peu de ces mthodes associent
plusieurs critres la fois. Mme sil semble que la fusion de ces informations soit
ncessaire pour se rapprocher dune procdure raliste, le problme de trouver une base
de comparaison entre des donnes de nature diffrentes na pas encore, aujourdhui, t
rsolu. Le mlange des critres parat donc essentiel pour considrer lapplication des
mthodes de planication de chemin la simulation dhumains virtuels.
1.5.5 Synthse
Nous avons expos dans ce chapitre les techniques permettant une approche plus ra-
tionnelle des circulations de personnes. Nous avons ainsi trait la reprsentation de
lenvironnement, et son exploitation lors de la planication de chemin.
Le premier point que lon peut soulever est la difcult dassocier ralisme et perfor-
mances. Notamment concernant les reprsentations de lenvironnement, on a pu voir
que les versions approximatives offrent un accs rapide la description topologique,
alors que les approches exactes permettent la conservation maximale de linformation
gomtrique. Il est indniable que dans le cadre de simulations devant produire des
rsultats comparables au rel, le ralisme prend la place la plus importante.
Lautre point concerne les paramtres devant tre pris en compte pour valuer un che-
min. Certain de ces paramtres sont mis en avant par diffrentes tudes, mais aucune
comparaison de leur importance relative nest disponible. On peut nanmoins dduire
des tudes psychologiques que plusieurs de ces paramtres doivent tre pris en consi-
dration simultanment.
48
Techniques de validation
1.6 Techniques de validation
La simulation aussi bien que lanimation sont deux domaines ayant la volont de pro-
duire des rsultats aussi ralistes que possible. Ce qui va les diffrentier en premier
lieu est la dnition de ce ralisme. L o lanimation va chercher produire un ra-
lisme visuel probant, la simulation va plus se concentrer sur le ralisme des donnes
manipules et produites.
La difcult dans ce deuxime cas est de caractriser le ralisme de labondance des
donnes de sortie, difcilement comparables avec le rel. En effet, il nest pas rai-
sonnable de vouloir directement confronter un modle reproduisant les circulations de
personnes avec des trajectoires issues dexprimentations relles, mme obtenues dans
des situations environnementales identiques. La premire raison vient du fait quil est
impossible de contrler parfaitement une procdure exprimentale impliquant des hu-
mains. En effet, on ne peut garantir quun individu se comportera tel que dnit dans
un protocole exprimental, que ce soit du fait de son apprentissage des situations rp-
tes, ou de son incapacit produire un comportement constant et non bruit (comme
le maintient dune vitesse de marche donne). La deuxime explication est que les
modles existants font abstraction dun certain nombre de facteurs modiant les tra-
jectoires individuelles, tels que les relations sociales ou mme ltat desprit (press,
timide, etc.), qui vont donc tre sources de perturbations dans des expriences contr-
les. Les procds de validation se tournent donc vers des comparaisons plus macro-
scopiques, impliquant des enqutes grande chelle visant caractriser des attitudes
globales.
Ltape suivante de cette validation est donc lanalyse des rsultats de simulation,
an dattester de la pertinence du modle gnrateur. Cette analyse peut prendre deux
formes : soit qualitative par lobservation de phnomnes mergeants, soit quantitative
par ltude des donnes produites.
1.6.1 Analyse du rel
Lanalyse du rel est la premire tape dune validation. Elle vise caractriser les ph-
nomnes importants dune situation, devant tre reproduits lors de la simulation. Le but
est donc double : synthtiser les faits ncessaires et sufsants un cadre dtude et en
extraire les valeurs qualitatives et si possible quantitatives depuis des expriences. Ce
deuxime point est loin dtre trivial, reposant comme nous lavons dit prcdemment
sur des conditions majoritairement incontrlables.
Dans le cadre des circulations de personnes, deux produits de sortie sont extrme-
ment importants : les vitesses de mouvement ainsi que les trajectoires. Ces paramtres
doivent tre corrls aux caractristiques environnementales de lexprience : densits
de personnes, topologie des lieux, ou encore typologie de comportement (par exem-
ple pour une gare, diffrencier le voyageur de tourisme de lhabitu pour son trajet de
travail). Deux approches sont alors possibles pour tudier le rel.
Premirement, il est possible deffectuer une exprience dans un environnement contrl,
o lon mettra en situation ce que lon veut caractriser. Ainsi, D. Helbing et al. [53] ont
conduit des sries dexpriences mettant en scne des cas environnementaux typiques :
couloir, croisement, rtrcissement (Figure 1.22). De cette faon, ils ont pu qualier
49
tude des circulations de personnes
un certain nombre dorganisations mergeant du but assign aux participants, ainsi que
de la conguration topologique. On peut regretter ici que ces observations naient pas
t rapproches de diffrentes chelles environnementales, les dimensions de ltude
tant rarement observes dans la ralit. On peut alors douter de la pertinence de ces
mesures, celles-ci ne reprsentant pas vritablement un cas rel. Toujours en utilisant
des vidos, mais pour produire des rsultats quantitatifs cette fois-ci, W. Damen et
S.P. Hoogendoorn [33] ont reproduits des situations comparables celles tudies par
D. Helbing. Par lanalyse des vidos ils ont ensuite extraits les trajectoires des per-
sonnes ainsi que leurs vitesses corrles la densit. Ils se placent ainsi dans le mme
cadre que les niveaux de services, mais en spciant cette fois-ci plus fortement les
conditions globales o ont t effectues les mesures.
FIG. 1.22: Analyse du rel par exprience contrle. A gauche une photogra-
phie de lexprience, droite sa reprsentation schmatique.
Deuximement, il est possible dobserver des environnements non contrls, puis ex-
traire de ces observations les situations auxquelles elles se rapportent. Ainsi, J.L. Ber-
rou et al. [17] ont effectu une somme consquente de captures puis danalyses de vi-
dos dans diffrents lieux. Ils ont ensuite synthtis ces analyses sous forme de tables
indiquant les vitesses moyennes des populations observes (Figure 1.23). K. Teknomo
et al. [135] proposent aussi un systme bas sur lanalyse de vidos, visant auto-
matiser totalement le processus depuis lacquisition jusqu lextraction des valeurs
souhaites (densits etc.), en passant par lidentication des dplacements individuels.
FIG. 1.23: Analyse du rel par observations. A gauche une image tire dune
squence vido, droite la synthse des rsultats.
Dautres approches que lanalyse vido existent. Par exemple J. Kerridge et al. [63]
utilisent des dtecteurs pyrolectriques qui, une fois placs la verticale de la zone
tudie, vont permettre dextraire en temps rel les trajectoires individuelles par une
comparaison des variations de temprature. Ils reconstruisent ensuite, partir de ces
captures, des informations de densits, de ots, de vitesses, et aussi les comptages aux
entres/sorties.
50
Techniques de validation
1.6.2 Analyse du simul
Lanalyse du simul, et donc sa comparaison au rel, est la deuxime tape dune proc-
dure de validation. Cest une tape cruciale pour permettre lexploitation dun modle
en simulation. Elle permet en effet den attester la pertinence, mais aussi den xer le
cadre dapplication.
La plupart des justications de modles consiste en faire une comparaison qualitative
des situations observes. Ainsi, D. Helbing et al. [53] fondent la validit de leur
modle sur la reproduction macroscopique de congurations identiables, telles que la
formation de les ou la logique de croisements de ux. Ce type de validation est trs
souvent utilis en animation, le but y tant purement de reproduire visuellement les
mouvements pdestres. Elle reste nanmoins valable en simulation si lon considre
les phnomnes mergeants des circulations de personnes.
Une autre approche, plus quantitative, est aussi utilise en simulation. Le but est ici
de reproduire les mesures effectues sur le rel dans des simulations dont ltat initial
correspond. Ainsi, J.L. Berrou et al. [17] procdent la simulation de lieux lms, et
comparent les organisations spatiales obtenues, mais aussi les densits et vitesses de
dplacement, avec des relevs issus du cas rel (Figure 1.24). Une autre faon de pro-
cder est dextraire des donnes statistiques de la simulation [128], et de les comparer
aux valeurs que lon peut trouver dans la littrature, tels que les niveaux de services de
J.J. Fruin.
FIG. 1.24: Comparaison rel/simul. A gauche une image tire dune s-
quence vido, droite la mme situation reproduite par simula-
tion.
Certains essayent aussi de caractriser des rgles mathmatiques depuis les expriences
menes, pour obtenir un modle directement issu du rel. Ainsi, K. Teknomo et al. [133,
134] proposent une srie de formules visant caractriser les vitesses et espaces per-
sonnels des pitons. Le principe est dattester de la validit du modle par son labo-
ration directement partir des donnes quantitatives observes. Nanmoins, une telle
approche conduit lapproximation et la discrtisation du rel, aboutissant gnrale-
ment des modles au cadre dapplication trs restreint.
1.6.3 Synthse
Nous avons vu dans ce chapitre le principe de la validation des modles de circulation
de pitons. Cette thmatique est dautant plus importante aujourdhui que les modles
se complexient, devenant ainsi sensibles de plus en plus de paramtres environne-
mentaux.
51
tude des circulations de personnes
Les techniques que nous avons vues sont majoritairement bases sur lanalyse vido.
Celle-ci est avantageuse de par son faible cot et sa facilit de mise en uvre, of-
frant des conditions exprimentales idales. Nanmoins elle a deux principaux incon-
vnients. Premirement, si lon considre la caractrisation de phnomnes globaux,
lchelle dun btiment par exemple, cette mthode est difcilement applicable de
par sa faible couverture de lenvironnement. Il est alors possible dutiliser un grand
nombre de camras pour collecter de linformation sur des points clefs identis, mais
reste alors le problme de corrler les informations entre elles. Deuximement, si lon
se place au niveau microscopique cette fois-ci, pour lanalyse ne des logiques de na-
vigation, le problme de limprcision des rsultats se pose. En effet, les paramtres
inuents dun modle de navigation peuvent tre la distance danticipation, la variation
de vitesse, ou encore de direction. Ces variations peuvent tre trs faibles et ponc-
tuelles, risquant dtre perdues cause du bruit impliqu par la mthode danalyse des
vidos (par dtection de contours).
Concernant la comparaison rel/simul, deux approches sont utilises. La premire,
qualitative, sappuie sur les phnomnes mergeants observables des circulations de
personnes. La seconde, quantitative, repose sur les donnes caractristiques de ces si-
mulations, principalement les densits et vitesses des personnes. Il parat donc essentiel
de combiner ces deux approches, an de garantir au maximum la robustesse des rsul-
tats produits.
1.7 Conclusion
Nous nous sommes penchs tout au long de ce chapitre sur la caractrisation et la
reproduction de la circulation pdestre humaine. Nous avons ainsi pu aborder les prin-
cipes psychologiques rgissant cette navigation, des tudes statistiques portant sur le
dplacement, ainsi que les deux approches informatiques macroscopique et micro-
scopique simulant ce comportement. De nombreuses donnes, aussi bien qualitatives
que quantitatives, sont issues de ces diffrentes tudes, et peuvent tre appliques par
dautres modles que celui dorigine, dans des cadres restreints.
De manire gnrale, les modles microscopiques offrent le plus de souplesse dans
leur contrle, et sont ainsi ceux qui permettent denvisager le plus dvolutions. Les
modles microscopiques rcents sont gnralement organiss sous la forme de trois
tapes permettant de reproduire le phnomne de circulation pdestre. Premirement,
reprsenter lenvironnement par une certaine forme dabstraction pour en faciliter lex-
ploitation. Conjointement cette reprsentation, une phase dobservation a comme but
dextraire les informations dynamiques locales, comme le mouvement des autres enti-
ts. Deuximement, analyser les donnes de lenvironnement qui sont disposition. Ce
deuxime point se dcoupe en deux phases : lune globale, o lentit va valuer gros-
sirement son chemin par le processus de planication ; lautre locale, o lentit va
adapter sa locomotion an de grer son interaction avec les autres, par le processus de
navigation. Troisimement, effectuer le dplacement propre de lentit au sein de len-
vironnement, en tenant compte de son but gnral ainsi que des adaptations locales.
On voit bien ici se mettre en place la boucle perception - dcision - action voque en
psychologie.
Ces modles doivent ensuite tre valids par une comparaison au rel pour en attester la
52
Conclusion
pertinence. Cette tape est cruciale pour une application dans un cadre de simulation.
Elle se droule en deux phases, la premire ayant pour rle dextraire des donnes
depuis le rel, la deuxime cherchant comparer ces donnes au simul. Une telle
comparaison peut tre qualitative ou quantitative, ces deux aspects tant importants
pour ltude des phnomnes sous-jacents des circulations de personnes.
Pour nir, signalons que les mthodes de contrle de plus haut niveau du comportement
humain ne sont pas abordes par les modles que nous avons prsent ici. Nanmoins,
le dplacement au sein de lenvironnement nest en gnral pas une n en soi, mais
une action entreprise pour rpondre un but plus global. Il semble alors ncessaire de
proposer des modles pour grer cet aspect dcisionnel.
53
Chapitre 2
Modles de comportement
Bien que la capacit se mouvoir soit un comportement primordial de ltre humain, ce
qui le caractrise vraiment est sa capacit raisonner. En effet, un individu est capable
de symboliser mentalement les actions quil veut excuter, pour ensuite les organiser.
Il est ainsi capable dlaborer un plan comportemental lui permettant dordonner ses
actions, et de grer leurs liens de dpendance. Ce raisonnement va ainsi avoir un impact
direct sur son dplacement.
Les tches mentales prpondrantes concernant laction dun individu sur son environ-
nement sont sans doute les tches dinteraction. Celles-ci dnissent la manire dont
lindividu va pouvoir affecter dautres entits, et ainsi modier ltat du monde qui
lentoure. Ces tches dinteraction entrent elles mme dans un processus mental com-
plexe, pouvant tre directement dsires par lindividu, ou symboliser une tape de son
raisonnement. Nous allons dans ce chapitre tudier les modles existants qui tentent de
reproduire ce processus mental.
Dans un premier temps, section 2.1, nous allons rapidement survoler les approches
psychologiques dnissant le cadre de la pense humaine. Ensuite, section 2.2, nous
prsenterons les modles informatiques simulant le comportement humain. Nous nous
rapprocherons ensuite du chapitre prcdent en prsentant, section 2.3, les modles
permettant de situer la connaissance dans un environnement. Nous nirons, section 2.4,
avec les architectures multi-couches, qui vont associer des processus de dcision des
comportements ractifs, dont notamment la capacit se mouvoir.
2.1 Psychologie du comportement
Le comportement humain, bien quayant des effets pouvant tre caractriss assez
facilement, sous-entend des mcanismes aussi complexes que nombreux, tels que le
contrle musculaire, la perception, la mmoire, les motions, la communication, ou
encore la projection mentale. Plusieurs approches psychologiques et sociologiques
tentent de synthtiser et danalyser ce comportement humain, la plus approprie notre
cadre dapplication tant la psychologie cognitive.
Lapproche cognitive explicite les processus dacquisition puis dutilisation des connais-
55
Modles de comportement
sances et des performances les moyens dagir dans des situations standardises.
Pour se faire, deux moyens sont principalement utiliss. Premirement, limagerie c-
rbrale tudie de faon concrte la biologie de la pense [110]. Deuximement, une
mthode plus symbolique modlise le comportement par un ensemble de modules in-
terdpendants, pouvant sorganiser hirarchiquement [15].
Nous allons nous concentrer dans cette section sur cette mthode symbolique, bien plus
proche des modles informatiques. Nous verrons ainsi que lapproche cognitive est
particulirement adapte notre problmatique, et dtaillerons les quelques principes
ncessaires notre cadre dtude.
2.1.1 Linteraction au centre du comportement
Linteraction est dnie comme laction rciproque de deux corps. La thorie cognitive
du comportement place cette interaction au centre du processus comportemental hu-
main, en posant que lun des protagonistes est lindividu et lautre son environnement.
En se basant sur cette thorie, H. Mallot [82] constate que la plupart des fonctions
crbrales servent grer le comportement dun organisme vis--vis de son environ-
nement. Il met en place un schma de rtroaction expliquant le fonctionnement du
comportement (Figure 2.1). Ici, toute information assimile par lorganisme provient
de capteurs, tandis que toute action est produite par des effecteurs. Il explique quil
existe trois types de retour depuis les effecteurs vers les capteurs :
Lhomostasie qui est interne lorganisme, et soccupe de la rgulation des para-
mtres biologiques en fonction des variations du milieu ambiant.
Lacquisition qui sert la perception.
Linteraction avec lenvironnement, seul phnomne perceptible.
FIG. 2.1: Les boucles de rtroaction, daprs H. Mallot.
H. Mallot [83] effectue aussi une catgorisation des comportements humains en quatre
niveaux de complexit :
1. Premirement, les comportements rexes de type attraction / rpulsion peuvent
tre dnis par une interconnexion entre les capteurs et les effecteurs.
2. Le deuxime niveau dcrit des comportements de type manuvre qui ncessitent
une intgration spatio-temporelle.
56
Psychologie du comportement
3. Le troisime niveau soccupe de lapprentissage, et est intimement li aux don-
nes sensorielles.
4. Enn, le quatrime niveau, dnomm cognitif, tient compte du but courant de
lindividu, et sinscrit donc dans un processus plus long terme.
Une approche comparable cette classication est la thorie du contrle. Celle-ci est
issue de travaux en biologie, avec des expriences sur des tres vivants en situation
dasservissement. Son principe de base dnit que lorsque ltat dun organisme est
diffrent de celui dsir, lorganisme va modier son comportement par une srie dac-
tions an de minimiser cet cart. Ainsi, R. Lord et P. Levy [78] reprennent, avec cette
thorie du contrle, le principe de rtroaction tout en ltendant la rgulation des com-
portements sociaux. Pour eux, ces boucles de rtroaction sont organises hirarchique-
ment, avec une notion de complexit croissante, permettant une grande gnricit de
la prise de dcision. Ainsi, chaque niveau traitera dun ensemble de tches spciques,
tout en fonctionnant suivant le principe de minimisation derreur.
A. Newell [92] propose une classication de ces niveaux comportementaux hirar-
chiques (Figure 2.2). Il indique que chaque niveau a un fonctionnement propre, mais
peut communiquer avec et donc inuencer ses voisins immdiats, sans pour autant
avoir besoin de connatre leur fonctionnement interne. Ce principe est dautant plus
intressant en informatique, car directement transposable sous la forme dun modle
compos de botes noires, devant tre capables de communiquer des informations. La
difcult rside alors dans cette transmission dinformation, devant tre sufsamment
synthtique tout en conservant un maximum dexpressivit.
FIG. 2.2: Hirarchisation des comportements illustre par A. Newell dans sa
pyramide comportementale.
2.1.2 Symbolisation des connaissances
Lune des tapes indispensable dans le comportement des humains concerne la symbo-
lisation des connaissances. Cette symbolisation des connaissances permet un tre hu-
57
Modles de comportement
main de se reprsenter mentalement le monde dans lequel il volue, et donc de pouvoir
raisonner sur des choses quil ne peroit pas directement. Comme le signale A. Ber-
thoz [18], le processus de dcision est intimement li la capacit de ltre humain
de se projeter dans le futur, de se reprsenter mentalement une action et son effet sur
lui-mme et lenvironnement. Trois mcanismes entrent en compte dans cette symbo-
lisation des connaissances :
La perception : acquisition dinformations.
La mmoire : stockage de linformation.
Ce que nous nommerons la cognition : organisation et exploitation de linformation.
La perception
Le but de la perception nest pas de fournir la description gnrale dune
scne mais dextraire une information spcique pour la tche implique
dans lactivit en cours.
W. Warren [145]
Cette citation de W. Warren dnit la perception comme un processus actif, analysant
les informations perues au fur et mesure pour en extraire les donnes pertinentes
compte tenu de lactivit actuelle. Cette extraction de donnes peut tre considre
comme la premire phase de la symbolisation des connaissances, o ltre humain doit
associer une symbolique aux informations an de pouvoir les trier.
J.J. Gibson, avec son approche cologique de la perception [44], propose dassocier
les capacits daction directement aux objets perus dans lenvironnement. Il introduit
ainsi le terme daffordance, qui exprime une potentialit daction offerte par un objet
un individu. Il gnralise ce principe en prcisant que les affordances perues sont dif-
frentes pour un mme objet suivant lindividu qui lobserve. Grce cette thorie, un
environnement va pouvoir renseigner un observateur quelconque sur ses potentialits
dinteraction, lui permettant une symbolisation immdiate.
La mmoire
La mmoire est le deuxime mcanisme intervenant dans le raisonnement. Cest par la
mmorisation de fait dans lenvironnement que lindividu va pouvoir raisonner sur des
situations non observables directement. Cest aussi par un processus de renforcement
mmoriel que ltre humain est capable dapprendre des choses, que ce soit des faits
ou des actions, et ainsi de sadapter rapidement des situations connues.
Nous avons dj vu, dans le chapitre 1.1.1 (page 10), une sous partie du mcanisme m-
moriel humain concernant la topologie des lieux. De manire plus gnrale, R.C. At-
kinson et R.M. Shiffrin [8] ont propos un modle de la mmoire en deux parties, les
mmoires court et long terme, qui a ensuite t tendu avec la mmoire sensorielle
(Figure 2.3).
La mmoire sensorielle est directement en relation avec les capteurs de lindividu, ser-
vant ainsi de tampon aux stimuli perus par les cinq sens de ltre humain. La persis-
tance des informations y est trs courte, de lordre de la seconde. De mme, sa capacit
est limite et directement corrle au sens auquel elle est rattache. Le type dinfor-
mation quelle manipule est brute, sans aucun processus de symbolisation. Cest cette
58
Psychologie du comportement
FIG. 2.3: Le modle de mmoire en 3 parties.
mmoire qui permet ltre humain de ragir de traiter un vnement aprs sa
perception, comme entendre quelquun poser une question alors que lon ntait pas en
train de lcouter attentivement.
La mmoire court terme, aussi dnomme mmoire de travail, constitue le centre du
raisonnement humain. Cest dans cette mmoire que vont seffectuer les associations
dides, et ainsi la prise de dcision. Sa dure de vie est assez courte, une vingtaine de
secondes [107], et sa capacit denviron sept blocs dinformation [87]. Le type dinfor-
mation manipul ici est symbolique, chaque bloc reprsentant un concept identiable.
Par exemple, les lettres VTG prises de faon alatoires forment trois blocs mmoire,
mais mises dans lordre TGV (Train Grande Vitesse) nen forment plus quun car
associes un concept unique. Un processus de renforcement va permettre aux infor-
mations redondantes de la mmoire court terme de devenir plus permanentes, via un
phnomne de stockage.
Ce stockage est effectu dans la mmoire long terme. Sa dure de vie est trs longue,
considre permanente, et sa capacit de stockage est non limite. Le type dinforma-
tions stockes ici nest plus atomique, comme dans la mmoire court terme, mais
consiste plus en des schmas associatifs entre ces informations atomiques. Ces sch-
mas serviront ensuite lors du mcanisme de rappel, qui va rcuprer de linformation
pour la mmoire de travail par corrlations avec un ensemble de donnes qui y sont
manipules. L.R. Squire et N.J. Cohen [126] dcoupent cette mmoire long terme
en deux parties : la mmoire procdurale, qui manipulent des informations lies au
savoir faire, et la mmoire dclarative, qui concerne les informations lies la connais-
sance des choses. Comme nous le verrons par la suite, un tel dcoupage est utilis dans
llaboration de modles informatiques.
La cognition
Le dernier mcanisme impliquant la symbolisation des connaissances concerne leur
utilisation pour organiser les actions entreprises par ltre humain. Une telle organisa-
tion a pour but de slectionner les tches atomiques accomplir immdiatement, tout
en considrant ces tches dans leur ensemble, pouvant former un but complexe.
T. Shallice [123] propose deux mcanismes pour la slection daction. Premirement,
le pilotage automatique qui est utilis pour les actions routinires, correspondant aux
tches devenues tellement courantes pour lindividu quelles peuvent pratiquement tre
considres comme rexes. Deuximement, le systme attentionnel de supervision
qui est utilis pour les actions nouvelles, peu courantes, ou difciles. Un exemple illus-
59
Modles de comportement
trant ce principe est la conduite automobile : lors de lapprentissage, lindividu doit
se concentrer exclusivement sur sa tche, tandis quavec lhabitude, il peut effectuer
simultanment dautres actions, comme discuter ou couter de la musique, ne faisant
alors plus deffort mental pour changer de vitesse par exemple.
Selon W.J. Clancey [32], un but nest pas forcment un problme rsoudre, et une
action nest pas forcment induite par une tche accomplir. Il prcise que certaines
activits sont simplement motives par un aspect culturel. Clancey fait aussi tat dun
mcanisme dactivation comptitive impliqu dans la slection dactions, bas sur un
couplage des modes squentiel, permettant dordonner les actions, et parallle, permet-
tant de combiner plusieurs activits.
Certains comportements sont orients vers la rsolution de buts futurs, et donc ne sont
pas valus grce aux perceptions immdiates. Lexemple le plus simple est celui que
nous avons vu dans le chapitre prcdant, concernant la planication dun chemin, o
lindividu ne va certainement pas percevoir lintgralit de son parcours au moment
de son valuation. Il apparat alors que lapproche symbolique pure ne suft pas pour
rsoudre ces comportements, ncessitant une projection de lindividu dans le temps
et lespace. Cest cette ncessit que tente de rpondre la cognition incarne et si-
tue [149] : incarne car base sur des expriences corporelles relles, et situe car en
relation troite avec la reprsentation mentale quun individu peut avoir de son environ-
nement. Lintelligence dun humain est ici dnie comme la somme des expriences
corporelles acquises au travers de son interaction avec lenvironnement [143]. Mais
mme si ce principe parat totalement justi pour les comportements ractifs simples,
il nen reste pas moins ncessaire de maintenir une reprsentation symbolique, plus
abstraite, concernant les comportement cognitifs de plus haut niveau.
Selon M.E. Bratman [25], les intentions, contrairement aux dsirs, sont des pro-
attitudes qui contrlent la conduite. En revanche, les dsirs ordinaires ninuencent
laction que de faon potentielle . Il dnit ainsi deux mcanismes contrlant les
actions dun individu : une intention stable sur le long terme, et un dsir phmre.
Ces deux principes signalent une certaine stabilit du raisonnement, lindividu tant
capable de dlibrer entre plusieurs de ses dsirs, pour en extraire une intention quil
conservera sur le long terme, ne faisant que rarement lobjet dune nouvelle dlib-
ration lorsque dautres dsirs apparaissent. M.E. Bratman base cette thorie sur trois
constats concernant le raisonnement humain [26] :
1. Les ressources cognitives dun tre humain sont limites, chaque dlibration en
ncessitant une partie. Il est donc logique quil ne remette pas continuellement
en question les plans quil tablit.
2. An de pouvoir cooprer avec dautres agents rationnels, un tre humain doit leur
permettre de prdire son comportement. Ceci nest possible que si une relative
stabilit est maintenue vis vis du plan de ses actions.
3. Il est possible quun tre humain doive effectuer un choix dans des situations o
il na pas de prfrence pour les alternatives qui lui sont proposes. Il doit donc
tre capable de maintenir son choix une fois celui-ci fait.
2.1.3 Synthse
Nous avons succinctement prsent dans cette section des travaux dun domaine sp-
cialis de la psychologie que sont les sciences cognitives. Cette approche tente dexpli-
60
Modles de comportement
quer le comportement humain par un ensemble de modules spcialiss communiquant
les uns avec les autres. Nous pouvons retenir les principes suivants concernant le com-
portement humain :
Le premier mcanisme intervenant dans tout comportement est la perception.
Les bases du raisonnement sont intimement lies la mmoire individuelle.
Une hirarchisation du comportement semble exister, si ce nest au niveau de sa
reprsentation, au moins au niveau de son excution.
Linteraction avec lenvironnement est toujours implique dans un comportement,
que ce soit comme cause ou comme effet.
Le raisonnement dun individu implique des reprsentations mentales de son envi-
ronnement et de son propre corps.
Il existe une relative stabilit dans le raisonnement humain, une dcision prise ntant
que difcilement remise en question.
Nous verrons que certains de ces principes sont appliqus dans des modles infor-
matiques tentant de reproduire soit le comportement observable dun individu, soit sa
capacit raisonner. Malgr tout, compte tenu de la complexit et de lampleur du pro-
blme, aucune architecture logicielle ne permet aujourdhui de reproduire lintgralit
du comportement humain. Nous pouvons nanmoins conclure que si nous voulons nous
approcher dune simulation comportementale raliste, le modle informatique propos
devra prendre en considration ces principes rgissant le comportement, le plus im-
portant tant, dans notre cas dtude, le principe de projection dans le temps et dans
lespace.
2.2 Modles de comportement
La reproduction dune certaine forme de raisonnement humain tait lorigine du do-
maine de lintelligence articielle. Avec la dmocratisation des jeux vidos, puis des
logiciels de simulations, ce sujet est peu peu devenu une proccupation majeure des
communauts graphiques, rsultant en la cration de la thmatique danimation com-
portementale. Dabord consacre la reproduction du dplacement des individus, ce
domaine de recherche sest de plus en plus tourn vers la rsolution de comportements
plus complexes.
Au cours de cette section, nous prsenterons donc deux catgories dapproches utilises
pour simuler le comportement. Premirement, les modles ractifs o le raisonnement
court terme est prpondrant. Deuximement, les modles rationnels qui tentent de
reproduire le raisonnement long terme.
2.2.1 Comportement ractif
Les comportements ractifs sont ceux qui font le moins intervenir la capacit dcision-
nelle rchie dun tre humain, ne ncessitant que peu ou pas de symbolisation des
connaissances. Ce sont les comportements qui correspondent ltage conscient le plus
bas dans la pyramide de A. Newel (Figure 2.2, page 57). Ils peuvent tre classis en
deux catgories.
Tous dabord, les comportements rexes, issus dune raction automatique un v-
61
Modles de comportement
nement. On peut ici parler de comportement pr-cbl, o leffecteur de lorganisme
va directement ragir un stimulus peru par un capteur, sans avoir recours au proces-
sus de slection daction, et donc sans que linformation transite jusqu la mmoire
de travail. Les insectes fonctionnent pratiquement exclusivement avec ce type de com-
portement, et pour un tre humain on peut prendre pour exemple lquilibre, qui sera
conserv par une action rexe des muscles pilote par loreille interne.
La deuxime catgorie est plus proche de ltage dcisionnel. Elle correspond len-
semble des comportements spcialiss auxquels peuvent avoir recours les procdures
cognitives plus complexes. Ces comportements sont usage tellement courant que leur
renforcement les a ancrs au plus profond du processus dcisionnel, ne ncessitant
donc plus deffort conscient pour y avoir recours. Lexemple dj utilis de la conduite
automobile illustre cette catgorie de comportements, o un conducteur conrm ne
sera plus conscient quil change les vitesses au cours de son parcours, mais seulement
du chemin quil est en train de suivre.
Il existe principalement trois modles pour reproduire ces comportements : stimu-
lus/rponse, bass rgles, et les automates.
Stimulus/rponse
Les modles stimulus rponse sont directement bass sur le principe de pr-cblage.
Ils vont modliser le comportement comme la transformation de signaux tout au long
du parcours entre les capteurs et les effecteurs.
Les systmes base de rseaux de neurones [3] entrent dans cette catgorie. Ces r-
seaux sont capables dapproximer une fonction continue avec nimporte quel degr
de prcision. Il vont ainsi reprsenter le processus de dcision en essayant de repro-
duire ses caractristiques biologiques : un graphe de modules calculatoires trs simples
mais trs nombreux. Ce principe a t utilis par M. van de Panne [142] pour crer un
contrle lmentaire de la locomotion.
Le dfaut majeur de ces modles rside dans leur trs faible niveau dexpressivit. Il
est ainsi facile dexprimer un problme mathmatique boolen avec ces rseaux, mais
la cration dun comportement plus complexe conduit une explosion de la complexit
du graphe. De plus, chaque neurone du graphe ayant un fonctionnement indpendant,
la cration dune conguration prcise est elle aussi trs complique, ncessitant le
paramtrage complet du systme. Lavantage majeur de ces procdures est quelles
supportent lapprentissage par renforcement, do lutilisation des rseaux de neurones
en intelligence articielle, notamment pour la cration de classieurs [80].
Bass rgles
Tout comme la prcdente approche, les modles bass rgles vont traiter un ensemble
de stimuli produits par diffrents capteurs. Par contre, le processus de dcision peut ici
tre plus abstrait, permettant un module de traiter totalement une tche et de produire
le contrle adquat. Ces rgles peuvent tre planes, reprsentant des comportements
relativement indpendants, ou organises hirarchiquement, sous forme darbre, an
de grer lenchanement des actions.
Nous avons dj vu, dans la section concernant les modles microscopiques (Sec-
62
Modles de comportement
tion 1.4.2, page 35), un de ces modles bas rgle spcialis dans la gestion du compor-
tement de navigation, avec les ocks de C. Reynolds [121]. Ce principe a t repris par
F. Lamarche et al. [70] ainsi que W. Shao et al. [124], toujours en organisant les rgles
de faon plane et en les valuant itrativement pour converger vers un rsultat. Notons
que ces rgles planes ne sont gnralement utilises que pour simuler des comporte-
ments simples, comme des animaux, ou dans un cadre trs restreint pour lhumain. En
effet, avec la multiplication du nombre de rgles le problme de la concurrence prend
de plus en plus dampleur avec cette approche, qui ne dispose pas de mcanisme expli-
cite pour la gestion des conits. Une consquence en est lapparition de discontinuits
dans le comportement, pouvant aboutir des oscillations de la prise de dcision.
Lorganisation sous forme darbre se rapproche plus du processus dcisionnel [20].
Chaque nud de larbre reprsente ainsi une action atomique, et cest le parcours de
larbre, par des algorithmes classiques, qui simulera le processus de dcision. Notons
tout de mme que cette organisation est bijective avec les rgles planes, et ne constitue
donc quun instrument de modlisation. Nous reviendrons sur cette approche dans la
section suivante.
Automates
Les approches base dautomates sont les plus rcentes pour simuler les comporte-
ments. Ces approches se basent sur la forte expressivit procure par les reprsentations
en machines tats pour dcrire nement les tapes et enchanements dactions dun
comportement. Ainsi, chaque action dun comportement sera reprsente par un tat de
lautomate, tandis que les possibilits dadaptation seront identies par les transitions.
O. Renault et al. [120] ont t des pionniers dans lutilisation de cette technique pour
la simulation de navigation dtres humains. Du fait de sa souplesse dutilisation, ce
procd sest rapidement rpandu dans la communaut informatique. Certaines vo-
lutions ont ensuite permis une excution parallle et/ou hirarchique des automates,
autorisant respectivement des comportements simultans et ordonns. On a ainsi pu
voir apparatre les modles base de piles dautomates [94], o chaque comportement
spcialis est reprsent par un automate, qui sont empils dans lordre de leur ex-
cution. Nous pouvons aussi citer les Pat-Nets [14] o des automates parallles sont
utiliss. Enn, le modle HPTS [37] et son extension HPTS++ [69] qui gre la fois
le paralllisme, la hirarchisation, et la synchronisation entre automates.
Comme nous lavons dit prcdemment, le recours des automates permet une grande
souplesse dans lexpression des comportements. Malgr tout, cette approche est gn-
ralement utilise pour reprsenter des tches simples, de comportements ractifs. Deux
faits expliquent cela. Premirement, les actions sont gnralement dcrites avec une
granularit trs ne dans les automates, contraignant dautant plus lautonomie du sys-
tme. En effet, labstraction du comportement son simple but est ici peu envisageable,
un comportement ntant alors reprsent que par un automate un seul tat. Deuxi-
mement, tous les enchanements entre actions doivent tre prvus lavance pour tre
envisags lors de la rsolution. Cela rend dautant plus difcile laugmentation des
comportements grs, ncessitant une refonte des comportements dpendants dj dis-
ponibles, et conduisant potentiellement une explosion combinatoire des transitions
possibles entre tats.
Ces deux inconvnients sont en partie grs par les automates hirarchiques, qui im-
63
Modles de comportement
posent tout de mme de pouvoir discrtiser les comportements en des modules indpen-
dants. Lavantage majeur de cette approche comparativement aux rgles est sa gestion
de la continuit dans le comportement. En effet, les tats des automates constituent
implicitement une mmoire de contexte, les transitions pouvant alors tre vues comme
des rgles locales.
Synthse
Nous avons prsent ici les trois principales approches permettant de grer les com-
portements fondamentaux dun individu. Nous pouvons retenir que dans le cadre dun
systme qui se veut descriptif et contrlable, seules les deux dernires approches peu-
vent prsenter un intrt, les rseaux de neurones tant trop difciles maintenir et
interprter. Les avantages principaux de ces deux modles sont les suivantes : pour les
modles bass rgles, la grande facilit de mise en uvre et dextensibilit ; pour les
modles dautomates, la forte expressivit. Il serait alors intressant de proposer une
approche combinant ces avantages. Il semble a priori possible dassocier directement
ces modles, en utilisant par exemple les automates pour grer nement des tches phy-
siques, gnralement lexcution ge et indpendante, et les rgles pour organiser
macroscopiquement leur excution, facilitant leur volution potentielle.
2.2.2 Comportement rationnel
Les comportements rationnels correspondent la prise de dcision globale de la pense
humaine. Ils ne sont observables que par la srie dactions quils produisent, o plutt
quils organisent, pour arriver la rsolution dun but global plus ou moins complexe.
Certains comportements rationnels ne sont pas du tout observables, comme le drou-
lement dune pense, mais nous nous concentrerons plutt sur la faon dorganiser des
actions pour atteindre un but.
Au cur du mcanisme de dcision rside le procd de slection daction. Son but est
de trier les diffrentes tches requises par lhumain, pour slectionner celles pouvant
ou devant sexcuter immdiatement. Cest donc ce mcanisme qui se charge de la
discrimination entre plusieurs actions concurrentes vis--vis de ressources physiques
ou intellectuelles de lindividu.
Deux mthodes permettent cette slection daction (Figure 2.4) : la coopration, qui va
fusionner plusieurs tches, et la comptition, qui ne va en slectionner quune seule.
La mthode cooprative fonctionne gnralement sur des informations quantitatives,
en oprant via des fonctions arithmtiques comme la somme ou la moyenne. La m-
thode comptitive slectionne une tche via une fonction de cot associe, symbolisant
la priorit de laction entreprendre, ventuellement couple des informations quali-
tatives comme lutilisation de ressources.
Ce mcanisme est primordial pour la simulation du comportement rationnel. Nous al-
lons voir que les diffrentes approches tudies ci-aprs procdent cette slection en
utilisant lune des deux mthodes pr-cites, et parfois en les associant.
64
Modles de comportement
FIG. 2.4: Principe de la slection daction. Laction slectionne est le rsul-
tat dune opration de fusion et/ou de discrimination entre les tches
requises.
LAction Selection Mechanism
Le modle ASM, propos par P. Maes [81], fait merger la dcision par lactivation
et linhibition dynamique des actions. Dans ce systme multi-agents, chaque entit est
vue comme un ensemble de modules ayant chacun ses comptences spciques. Un
module de comptence est reprsente par quatre valeurs (c, a, d, ) :
c : les pr-conditions de laction, ncessaires pour son excution ;
a : les effets dajout de laction ;
d : les effets dinhibition de laction ;
: le niveau dactivation de laction.
Le modle peut alors crer des liens entre les modules, de succession et inversement
de prcdence, ou encore de conit. Finalement, la slection seffectue par lvaluation
du niveau dactivation des actions. Ce niveau est augment par les buts de lagent,
mais aussi par les successeurs dune action excutable, ou ses prdcesseurs dans le
cas contraire. Il est diminu par les actions entrant en conit avec laction courante. Ce
systme utilise donc une slection comptitive, base sur le niveau dactivation.
Plusieurs volutions de cet algorithme ont t proposes. Le plus proche de la thorie
de A. Newel est sans doute le modle de V. Decugis et J. Ferber [35], avec un ASM
hirarchique o les modules de plus bas niveau correspondent aux actions ractives,
tandis que ceux de haut niveau correspondent des comportements plus complexes.
Ce modle est trs intressant de par sa simplicit de mise en uvre, et son fort poten-
tiel dvolution (lajout dune nouvelle action y est relativement ais). Nanmoins, ce
modle nassure pas la robustesse de la dcision : si un plan existe, il nest pas forc-
ment obtenu par cette approche. De plus, le problme des oscillations caractristique
des rgles reste pos.
Le Situation Calculus
Le situation calculus, introduit par J. McCarthy et P.J. Hayes [84], est un modle bas
sur la projection dans le temps de lindividu, permettant dvaluer les consquences de
ses actions. Cette approche est base sur six concepts dnissant lenvironnement de
simulation, en utilisant une smantique base sur les mathmatiques boolennes :
65
Modles de comportement
Les situations. Elles reprsentent des tats complets du monde un instant donn. Ce
sont en quelque sorte des photographies instantanes, constitues de faits valides,
pouvant ensuite servir comme point de dpart du raisonnement.
Les uents. Ils dcrivent une proprit dynamique du monde. Ils sont reprsents par
une fonction dune situation, renvoyant ltat correspondant de la proprit.
Les causalits. Ce sont littralement des relations de cause effet, associant lmer-
gence dun uent un autre uent dans une situation donne.
Les actions. Elles servent modier les situations. Un ensemble de pr-conditions
doivent tre satisfaites dans la situation courante pour que laction puisse sex-
cuter. Les effets ainsi produits peuvent alors tre conditionnels, variant suivant la
situation.
Les stratgies. Ce sont des enchanements dactions produisant un comportement glo-
bal. Elles correspondent des tapes de raisonnement scriptes.
La connaissance et le savoir-faire. Ces deux facults permettent daugmenter labs-
traction des actions ralisables. Elles permettent ainsi de dcrire des actions po-
tentielles suivant le niveau de connaissance, ou encore des actions permettant
dacqurir de nouvelles connaissances.
Ce formalisme est largement utilis dans le domaine de lintelligence articielle car
il permet dexprimer des mondes trs complexes. La slection daction y est faite par
lvaluation de tous les enchanements dactions permettant daboutir la situation
dsire depuis la situation courante. Cette planication aura donc pour effet de pro-
duire une srie dactions raliser. Dans le domaine de lanimation comportementale,
J. Funge [42], avec son modle CML (pour Cognitive Modeling Language), spcia-
lise le situation calculus pour dcrire les comportements de haut niveau dun agent
autonome. Il introduit notamment le principe dincertitude avec les IVE uents (pour
Interval-Valued Epistemic uents), qui ne sont plus valeur unique, mais compris entre
deux bornes.
Pour conclure, nous pouvons retenir que le situation calculus tire sa force de son grand
pouvoir dexpressivit. Sa plus grande faiblesse, surtout concernant lanimation com-
portementale de foules dindividus, concerne la lenteur de sa planication dactions.
Les algorithmes utiliss vont en effet devoir valuer toutes les situations possibles de-
puis la situation courante pour dterminer lensemble de chemins aboutissant la si-
tuation dsire. Il existe quelques mthodes pour acclrer le traitement, surtout par
lagage de larbre de dcision, mais qui restent encore trop contraignantes pour de la
simulation de foules.
Le modle STRIPS
Le modle STRIPS (pour STanford Research Institute Problem Solver), introduit par
R.E. Fikes et N.J. Nilsson [40], est un formalisme simpli du situation calculus. Il
permet ainsi de proposer des algorithmes plus efcaces, la description y tant plus
contrainte. Le monde y est reprsent par un ensemble de faits, pouvant tre prsents
ou absents. Des actions peuvent ensuite tre dcrites, possdant des pr-conditions,
liste de faits devant tre vris, et des effets, sous la forme dune liste dajouts et
dune liste de retraits de faits du monde. La slection dactions va alors consister
planier une srie dactions menant de ltat courant du monde ltat dsir.
66
Modles de comportement
Plusieurs algorithmes existent pour effectuer cette planication. On peut notamment ci-
ter Graphplan [19], qui va reprsenter lvolution du monde par un graphe en couches,
alternant des nuds de type action et des nuds de type fait. La construction du graphe
part de ltat actuel du monde, puis va construire une srie de couches jusqu ce que
lune dentre elles ne contienne plus dactions concurrentes, i.e. qui invalident mu-
tuellement leurs pr-conditions ou leurs effets. Un algorithme va alors effectuer un
chanage arrire, en partant des buts souhaits et en retenant successivement la srie
dactions non concurrentes qui reviennent ltat courant du monde. Cet algorithme
garantit lobtention dune solution si elle existe, mais le dveloppement du graphe est
polynomial en temps et en espace de recherche. Une autre approche existe, nomme
HSP [23] (pour Heuristic Search Planning), qui va utiliser une heuristique pour li-
miter le dveloppement du graphe de recherche. Cette heuristique est extraite de la
dnition du monde sous la forme doprateurs STRIPS. Son principe est de ngliger
les exclusions mutuelles entre actions, et donc de ne considrer quun sous ensemble
du problme pos. Il existe plusieurs volutions de cet algorithme, dont certaines ont
une valuation de ltat courant du monde vers les buts, ou dans le sens inverse (aussi
dnomm de haut en bas, ou de bas en haut).
Le point fort du formalisme STRIPS rside dans les algorithmes de planication dac-
tions quil supporte. Il peut ainsi converger vers un rsultat plus vite et avec moins de
dveloppement que pour le situation calculus. Cela est rendu possible par lexploitation
des contraintes poses sur le mode de description du monde, passant outre lexpression
de la connaissance, et donc des actions et effets conditionnels plus abstraits.
Les comportements orients buts
Les comportements orients buts, connus sous le nom de BDI (Beliefs Desires Inten-
tions), sont une application directe des thories de M.E. Bratman [25]. Trois concepts
rgissent le fonctionnement de ce modle :
Les croyances sont les connaissances personnelles quun agent a du monde, pouvant
tre incompltes voir fausses. En effet, celles-ci sont bases sur les perceptions
de lindividu, et sa capacit apprhender la dynamique de son environnement.
Les dsirs sont les buts explicites de lagent, ce quil veut raliser plus ou moins
long terme.
Les intentions sont les plans comportementaux de lagent lui permettant dassouvir
ses dsirs.
A.S. Rao et M.P. Georgeff [115, 116] furent les premiers proposer une architecture
base sur les BDI. Le principe gnral de ce modle est de fournir lindividu un en-
semble de plans lui permettant daccomplir diffrents dsirs, faisant de lui une sorte
de systme expert. Lexcution de ces plans est conditionne par un ensemble de faits
relatifs lenvironnement et lindividu. Dans le cas o plusieurs plans sont slec-
tionns, un systme darbitrage est alors mis en uvre pour les dpartager. Une fois
quun plan est choisi, il devient une intention, et ses actions sont excutes lune aprs
lautre jusqu ce quune nouvelle slection soit ncessaire, soit cause dune modi-
cation des connaissances, soit du fait de la russite ou de lchec du plan. Chaque
action composant le plan peut alors devenir un sous-but, et provoquer ainsi lexcution
dun nouveau plan.
67
Modles de comportement
Ce modle peut sadapter trs rapidement la dynamique de lenvironnement, que
ce soit grce lvaluation des pr-conditions des actions en cours ou lmergence
de nouveaux plans. Sa plus grande faiblesse constitue aussi sa plus grande force : le
savoir-faire des individus est ici g, le systme ntant pas capable dinfrer des plans
qui nont pas t explicits. Ceci a pour consquence de contraindre lautonomie des
individus ce qui a t prvu lors de la description des actions. Mais cela permet aussi
dassurer que les entits simules neffectueront pas denchanements dactions fantai-
sistes, pouvant produire des comportements peu ralistes. Un autre grand avantage de
ce modle, surtout en ce qui concerne lanimation comportementale, est sa grande rapi-
dit dexcution. En effet, mme sils restent dpendants du nombre dactions prsentes
dans le systme, les choix imposs lalgorithme de dcision sont assez restreints.
Synthse
Nous avons vu dans ce chapitre les principales approches concernant une partie de
laspect rationnel du comportement : la slection dactions. La plupart des modles
prsents fonctionnent avec un niveau de reprsentation du monde trs abstrait, fourni
par un ensemble de rgles. On peut remarquer de manire gnrale que ces modles
de raisonnement sont assez peu situs, le plus souvent valus sans reprsentation to-
pologique de lenvironnement. Bien que certaines approches utilisent ces modles en
animation comportementale, le plus souvent pour un nombre trs restreint dentits
et de comportements, leur complexit calculatoire est trop importante pour que lon
puisse les appliquer dans le contexte de la simulation de foules dindividus. LASM r-
pond quant lui cette contrainte, mais les oscillations de sa prise de dcision incitent
lcarter.
Nanmoins, le dernier modle que nous avons abord, le BDI, semble offrir des pers-
pectives intressantes. De par sa simplicit de mise en uvre, le niveau de contrle quil
offre lors de la modlisation du monde, ainsi que sa rapidit dexcution, ce modle
peut constituer une piste avantageuse pour la simulation de foules. Son fort potentiel
de ractivit aux modications de lenvironnement est aussi capital pour considrer des
chelles de temps relativement courtes. Il faudrait cependant permettre une plus grande
libert lalgorithme de dcision de ce modle, notamment en introduisant une hirar-
chisation des dsirs. De plus, laspect situ est primordial dans le contexte dtude des
ux de personnes, et il faudrait donc corrler au maximum cette prise de dcision avec
la topologie des lieux.
2.2.3 Synthse
Nous avons pu nous familiariser dans cette section avec les deux catgories de modli-
sation du comportement. Dune part les comportements ractifs, relativement simples
et court terme, et dautre part les comportements rationnels, plus complexes et rgis-
sant le plan daction des individus sur le long terme.
Nous pouvons conclure que les modles bass rgles et automates, pour la gestion du
comportement ractif, sont directement exploitables. Nous avons pourtant voqu le
bnce de les coupler, an de proter du potentiel dvolution de lun ainsi que de la
robustesse de lautre.
68
Reprsentation des connaissances : les environnements informs
La plupart des modles de comportement rationnel semblent quant eux difcilement
exploitables, surtout de par leur complexit de rsolution. De plus, leur potentiel dinf-
rence du savoir-faire nest pas rellement indispensable la simulation des circulations
de personnes. Lun dentre eux, le modle BDI, semble tout de mme appropri car
il offre une approche plus descriptive du comportement. Nous devons tout de mme
mettre laccent sur le manque de lien avec la topologie, videmment trs important
pour ltude des circulations de personnes. Un autre point dsavantageux concerne la
faible autonomie des entits simules, dautant plus bride que les plans dactions sont
scripts.
2.3 Reprsentation des connaissances :
les environnements informs
Nous avons jusqu prsent prsent des catgories de modles permettant de consi-
drer diffrents aspects du comportement humain. Comme nous lavons remarqu, ce
qui leur fait particulirement dfaut est laspect situ du raisonnement. Cest une par-
tie de cet aspect que vont permettre de traiter les environnements informs, en ancrant
la connaissance dans la reprsentation topographique du monde. Ces environnements
pourront ensuite tre exploits par un algorithme de raisonnement pour situer la prise
de dcision. Ils pourront aussi tre utiliss seuls, plus dans un objectif danimation,
pour reproduire une interaction visuellement raliste. Bien sr, le couplage de ces deux
objectifs est envisag, constituant en quelque sorte le Graal de lanimation comporte-
mentale.
2.3.1 Le modle Parameterized Action Representation
Le modle PAR, introduit par N. Badler et al. [12], tente de rapprocher la description de
laction du langage naturel. Un systme PAR est compos des lments suivants [13] :
Les objets physiques qui sont concerns par des actions. Ceux-ci peuvent avoir des
proprits, et sont stocks hirarchiquement dans une base de donne topolo-
gique.
Lagent qui va effectuer laction, qui a un certain nombre de capacits.
Les conditions dapplication des actions, i.e. ce qui doit tre vri dans le monde
pour quune action puisse seffectuer. Elles peuvent tre relatives des objets
ou lagent. Il est prcis quen cas dchec, aucun sous-but nest lanc pour
parvenir des conditions favorables. Par contre, des actions peuvent remplacer
laction courante qui nest pas excutable.
Les actions prparatoires sont des couples condition/action. Si la condition est fausse,
alors laction est lance.
Les actions peuvent tre atomiques ou complexes. Dans ce dernier cas, laction est re-
prsente par une liste de sous-actions devant sexcuter en squence et/ou en pa-
rallle. Les actions sont stockes dans une base de donne hirarchique, permet-
tant de les spcialiser pour ensuite pouvoir les slectionner suivant le contexte.
Les conditions de terminaison stoppent laction lorsquelles sont vries.
69
Modles de comportement
Les effets sont des assertions qui sont excutes lorsque laction se termine, modiant
la base de donnes du monde.
Dans ce modle, laccent est mis sur la facilit de renseignement des actions, pour viser
un cadre dapplication o lutilisateur du simulateur sera capable dinteragir facilement
avec le systme. Ainsi, le systme pourra sadapter de nouvelles directives fournies
dans un langage proche de la langue naturelle. La mthode de slection dactions est
ici base sur des rgles (les conditions), et supervise par des automates parallles
communiquants nomms Pat-Net [14].
Pour conclure, ce modle est sduisant par sa mthode de renseignement. Nanmoins,
le lien avec la topologie y est assez faible, les actions ainsi que les objets ntant pas
directement lis lenvironnement mais stocks dans une base de donne globale. Ce
point est dautant plus contraignant pour notre cadre dapplication que la topologie y est
prpondrante. Il nest pas fait tat des performances du systme, mais nous pouvons
penser que le mode de slection doit bien se comporter en charge.
2.3.2 Les Smart Objects
Les smart objects, introduits par M. Kallmann et D. Thalmann [60], sont bass sur la
thorie cologique de la perception de J.J. Gibson. En effet, un smart object contient
lensemble des informations ncessaires une interaction. Ces informations sont en-
suite transmises lindividu lorsquil effectue linteraction.
Quatre type de donnes constituent un smart object [61] :
1. Les proprits intrinsques de lobjet, i.e. physiques, comme la taille, la forme,
ou le centre de masse de lobjet.
2. Les informations concernant linteraction, servant lacteur pour accomplir cette
interaction, comme lendroit o se positionner, ou encore lidentication des l-
ments ncessaires (comme une poigne ou un bouton).
3. Les comportements internes lobjet, pouvant tre dclenchs par une interac-
tion, et pouvant tre conditionns par des variables internes lobjet, comme la
fonction dimpression dune imprimante.
4. Les comportements attendus de lacteur lors de chaque interaction avec lobjet.
Les comportements de plus haut niveau sont ensuite dcrits grce des automates
tats nis. Les tats sont ici constitus par les actions de base pouvant tre accomplies
par ou avec lobjet. Une animation est alors pourvue, en se basant sur un ensemble de
gestes de base. Ces gestes sont adapts en temps rel par un processus de cinmatique
inverse et de la planication de mouvement [62], an de prendre en compte la position
relative de lagent vis vis de lobjet (Figure 2.5).
Cette premire approche de linteraction tait donc beaucoup plus oriente vers le ra-
lisme visuel immdiat que vers la rsolution comportementale long terme. Des tra-
vaux rcents tendent rejoindre cette vision comportementale plus globale [1]. En se
basant sur le formalisme STRIPS, et plus particulirement lalgorithme Graphplan, les
smart objects sont tendus en associant des pr-conditions et des effets aux actions.
Ces informations seront ensuite utilises dans le processus de dcision de lacteur (Fi-
gure 2.6), divis en quatre tapes :
1. Lacteur collecte les informations du monde relatives ses interactions.
70
Reprsentation des connaissances : les environnements informs
FIG. 2.5: Exemple de Smart Object : interaction avec un casier.
2. Lacteur prpare sa dcision en formalisant le problme.
3. La planication est effectue, produisant un ensemble de plans et de mondes
rsultants.
4. Le plan relatif au but de lacteur est droul, excutant les actions de bas niveau
correspondantes.
FIG. 2.6: Processus de planication avec les Smart Object.
Une autre amlioration a t apporte an de permettre la collaboration entre agents [2].
Toujours en utilisant Graphplan, la dlgation de tche permet un agent daider un
autre agent la rsolution dun but (Figure 2.7). Pour se faire, le concept de facilitateur
est introduit, qui est une sorte de superviseur auquel les agents vont pouvoir dlguer
transfrer des tches. Ce superviseur va ensuite valuer les autres agents du monde
pour en trouver un qui peut accomplir la tche, et lui transfrer ce but. Le superviseur
prvient ensuite lagent dorigine de lvolution de la tche dlgue.
Les smart objects constituent un bond en avant concernant la modlisation de linter-
action dans des environnements virtuels. Ils dmontrent que la thorie cologique de
J.J. Gibson est particulirement bien adapte ce cadre dapplication, simpliant gran-
dement la tche de description et ainsi la mise en uvre des simulations. Nanmoins,
quelques observations peuvent tre retenues quant ce modle. Tout dabord, le fait de
centraliser toute linformation dans les objets permet certes de simplier leur descrip-
tion, mais contraint aussi lvolutivit du systme sur le long terme. En effet, lajout
dune nouvelle interaction ncessite inexorablement la modication des objets qui la
supportent. De mme, le partage dune interaction entre plusieurs catgories dobjets
impose sa rednition successive. Lautre point qui nest a priori pas abord concerne la
71
Modles de comportement
FIG. 2.7: Dlgation de tches avec les Smart Object. Lagent Martin doit
porter une caisse dans une autre pice, et se rend compte quil doit
pour cela ouvrir une porte. Dans limpossibilit de laccomplir, il
dlgue cette tche lagent Gino.
dnition dagents autonomes proposant eux-mme des interactions. On peut intuitive-
ment imaginer que ces agents puissent tre dnis sur le mme principe, bien que leurs
aspects dynamique et autonome risquent de poser problme. Finalement, concernant
la planication dactions, les smart objects sont coupls aux STRIPS et en acquirent
donc les avantages et les inconvnients. Il nest donc pas envisageable dutiliser cette
approche pour des foules dindividus, surtout du fait des performances. Nous pouvons
conclure que ce modle est trs bien adapt la gestion de tches physiques, apportant
un ralisme visuel certain, mais peut-tre moins la gestion de comportements plus
long terme, pour un grand nombre dindividus.
2.3.3 Le modle STARFISH
Le modle STARFISH (pour Synoptic-objects Tracking Actions Received From Inter-
active Surfaces and Humanoids), introduit par M. Badawi et S. Donikian [11], est bas
sur la thorie des dpendances conceptuelles de R. Schanck [122]. Il est ici question de
la description physique de linteraction plutt que de sa gestion comportementale.
Ce modle associe une smantique linteraction [10], ou plutt la manipulation lors
de linteraction, avec un ensemble de huit primitives : Donner, Transfrer, Dplacer,
Bouger, Attraper, Ingrer, Parler, tre attentif. Ces actions gnriques sont alors sp-
cialises dynamiquement par lhumanode suivant le contexte. Toute action complexe
est alors construite sur la base de ces primitives, en les assemblant dans des automates
72
Reprsentation des connaissances : les environnements informs
tats nis grs par HPTS++ [69]. Ces actions sont ensuite directement lies aux
objets de lenvironnement, via des surfaces dinteraction, rejoignant ainsi la thorie
cologique de J.J. Gibson. Ces surfaces sont spcies sur la gomtrie des objets, et
suivent ainsi tout changement de position potentiel. De plus, le simple fait de modier
ces surfaces dun objet lautre permet, tout en gardant la mme procdure comporte-
mentale, de modier linteraction physique rsultante (Figure 2.8).
(a) Ouvrir une porte vers lextrieur.
(b) Ouvrir une porte vers lintrieur. (c) Ouvrir une porte coulissante.
FIG. 2.8: Interactions avec STARFISH. Linteraction physique sadapte auto-
matiquement aux capacits de lobjet manipul, sans avoir red-
nir la procdure comportementale.
Ce modle est donc born la gestion de comportements ractifs. Il adresse la fois
la faisabilit des actions et leur reprsentation visuelle. Le lien avec la topologie est ici
trs fort, les surfaces dinteraction tant directement disponibles dans la dnition de
lenvironnement. Pour notre cadre dapplication, ce modle pourrait offrir un compl-
ment avantageux en terme de restitution graphique. Il ne dispose nanmoins pas dune
vision de haut niveau de linteraction, permettant de linclure dans un plan comporte-
mental long terme.
2.3.4 Synthse
Nous avons vu tout au long de cette section trois modles permettant dinformer des en-
vironnements de simulation en vue de grer les interactions. Les cadres dapplication
de ces approches sont assez loigns de ltude des circulations de foules dindivi-
dus, se concentrant plus sur la restitution graphique. De manire gnrale, le lien entre
linteraction et la topologie dans la prise de dcision est assez peu abord. Nous re-
tiendrons nanmoins lapproche des smarts objects qui, en associant linteraction aux
objets de lenvironnement, propose dj ce lien au niveau de la description. Dautre
par, le modle STARFISH offre des perspectives sduisantes pour un couplage des
mcanismes de dcision. Il dispose en effet dun lien fort avec la topologie, grce aux
zones dinteractions, et associe une smantique linteraction, grce ses huit primi-
tives. Son intgration des comportements de plus haut niveau pourrait ainsi reposer
sur ces primitives, et se faire de manire quasi transparente.
Nous pouvons donc conclure quune approche semblable lun de ces deux modles
serait souhaitable. Nanmoins, la description de linteraction doit y tre plus axe sur
73
Modles de comportement
les implications comportementales que sur la reprsentation physique rsultante, cette
dernire nayant quun impact limit sur les circulations de personnes.
2.4 Modles multi-couches
Nous avons prsent dans la premire partie de cet tat de lart un comportement r-
actif fondamental de ltre humain quest sa capacit se dplacer. Ce comportement
sinscrit dans un mcanisme rationnel plus global de lindividu, que nous avons abord
dans cette deuxime partie. Les modles multi-couches permettent de considrer ces
deux aspects simultanment.
Ces modles tentent de couvrir un large spectre du fonctionnement humain, en corr-
lant des processus de dcision de plus ou moins haut niveau avec des processus ato-
miques plus spcialiss. De manire plus gnrale, nous pouvons retenir quun modle
est multi-couches sil traite plus dun tage de la pyramide comportementale de A. Ne-
well. Nous allons prsenter ici certains de ces modles, en prcisant pour chacun deux
quels types dapproches ils fusionnent et quelles problmatiques du comportement hu-
main ils abordent.
2.4.1 Approche gnrale
S. Goldenstein et al. [47] proposent un modle gnral de simulation pour reproduire
les comportements mergeants observables, tels que la foule ou les regroupements,
dans des environnements contraints. Ce modle se dcompose en trois couches ca-
pables de communiquer entre elles, chacune tant responsable dune partie des proces-
sus (Figure 2.9).
FIG. 2.9: Communication entre les trois couches du modle de S. Golden-
stein et al.
La couche locale. Cette couche se charge des actions ractives, telles que lvitement
dobstacle et la gestion du dplacement. Elle est reprsente par un modle base
de particules, associant des forces de rpulsion aux obstacles. S. Goldenstein
et al. indiquent que cette couche doit tre rapide, robuste, paramtrable, et ne doit
pas dpendre du nombre dentits prsentes dans lenvironnement (le domaine
de validit doit couvrir de faibles comme de fortes densits).
La couche environnementale. Cette couche contient les informations spatiales, telles
que les agents et les obstacles. Elle permet dvaluer lenvironnement immdiat
de chaque agent simul, ce qui servira piloter leur comportement. Ainsi, cette
74
Modles multi-couches
couche est notamment implique dans la dtection de collision, et dans ladap-
tation des entits cette ventualit. Elle est reprsente par une structure nom-
me KDS (pour Kinetic Data Structure), base sur une triangulation de Delaunay
dont les sommets reprsentent les entits. Cette structure est ensuite rafrachie en
tenant compte de la cohrence temporelle, an de limiter les calculs inutiles.
La couche de planication globale. Cette couche contrle le dplacement gnral des
individus au cours du temps, en leur indiquant chaque fois quils se dplacent
une nouvelle direction souhaitable. Bien que la valeur de sortie de cette couche
soit trs simple, elle peut tre produite par des processus complexes, pouvant
aussi inuencer des paramtres internes des agents, comme leur vitesse. Lexem-
ple que donnent S. Goldenstein et al. pour cette couche est limit la planica-
tion de chemin, mais ils indiquent quelle peut servir coordonner les actions
des agents pour la coopration, ou grer des comportements plus complexes.
Ils remarquent aussi que cette couche peut donner des ordres allant en contra-
diction avec la couche locale, poussant par exemple un individu se rapprocher
dun obstacle pour interagir, augmentant en mme temps les risques de collision.
Cette premire approche, bien quassez gnrale, permet de tirer quelques conclusions
assez intressantes. Tout dabord, comme le font remarquer les auteurs, lapproche
muti-couches a lavantage de permettre lvolution voire le remplacement de lune des
couches du systme sans avoir modier les autres. La seule contrainte respecter sera
dans ce cas de fournir les mmes possibilits de communication aux couches modies,
leur permettant de maintenir larchitecture actuelle. Lautre observation faite est quune
couche peut pousser une autre fonctionner de manire contraire son principe de
base, ncessitant une robustesse maximale de sa part. Il faut donc sassurer que ces
couches basses supportent lensemble des directives des couches plus leves, pouvant
ncessiter la gestion de cas particuliers.
2.4.2 Approche oriente vers les comportements sociaux
Cette approche introduit la gestion comportementale sociale dans le processus de dci-
sion des agents autonomes. Laspect social prpondrant est ici la formation de groupes,
quils soient induits par un dplacement uniforme, ou dnis par une relle relation
comme dans le cadre dune famille. Cest cette problmatique que sadresse S. Raupp
Musse [89] dans son modle multi-couches dnomm ViCrowd.
Ce modle est bas sur le principe, propos par S. Raupp Musse et al. [90], que la
capacit de dcision des agents autonomes ne leur soit pas seulement interne, mais
puisse tre disponible dans les objets ainsi que dans les entits plus abstraites que sont
les groupes. On sloigne donc ici de la notion de comportement mergent pour la
foule, pour se rapprocher dun comportement global plus supervis. Mais la notion de
but individuel reste tout de mme prsente dans ce modle, grce la gestion de trois
catgories de comportements [91] :
Comportement programm. Ce premier type de comportement permet un contrle
macroscopique des individus. Cest un comportement script qui dnit de ma-
nire gnrale lattitude dun ensemble de personnes.
Comportement ractif. Ce deuxime type de comportement permet aux entits si-
mules de ragir des situations. Un comportement ractif est dni comme un
75
Modles de comportement
couple vnement / raction. Un vnement dnit quand sous quelles condi-
tions le comportement doit tre activ, et qui il doit sappliquer, pouvant aller
de lindividu lensemble des entits simules. La raction dnit la srie dac-
tions dclenches par le comportement. Les vnements peuvent tre dclenchs
manuellement, en raction dautres comportements, ou encore scripts. Les
auteurs montrent un cadre dapplication de ces vnements pour simuler des
comportements bass rgles.
Comportement guid. Ce dernier type de comportement permet denrichir le mode
de contrle des individus avec des procdures de plus haut niveau. Ces compor-
tements sont fournis par un module externe capable dinterprter des actions en
langage naturel, qui sont ensuite restitues au systme sous la forme dune s-
rie dactions de base. Ce type de comportement est plus prioritaire que les deux
premiers, et peut donc les interrompre. Dans ce cas l, une mmoire de groupe
se rappelle des comportements arrts, pour permettre leur reprise par la suite.
Un ensemble de comportements de base sont spcis pour les groupes, comme la
runion ou la sparation (Figure 2.10). La mthode de navigation propose permet de
grer aussi bien lvitement dindividus que de groupes. Elle est base sur un principe
original de cheminement suivant une courbe de Bzier, dnie par un nombre impos
de points de contrles. Chaque collision dtecte aura pour consquence de dplacer
un point de contrle pour grer lvitement, dformant ainsi la trajectoire de lindividu.
FIG. 2.10: Un exemple de comportement de groupe : sparation dun groupe
en deux pour laccomplissement de deux buts diffrents.
Cette approche a prouv son efcacit en terme de restitution visuelle, produisant des
animations avec un mouvement macroscopique raliste. Elle a de plus lindniable
avantage dtre trs rapide, permettant la restitution de milliers dindividus en temps
rel. Nanmoins, on peut se poser la question du ralisme comportemental des ux
de personnes produits lorsque la notion de groupe nest plus dduite mais induite par
le systme. En effet, la notion de groupe mergeant dans les circulations contraintes
est certainement valide, mais le caractre phmre de lappartenance dun individu
ce type de groupe nest pas ngliger. Ainsi, pour simuler efcacement des lieux
dchanges, qui alternent circulations contraintes et grands espaces, avec des buts indi-
viduels tantt disperss tantt unis, ce systme aurait besoin dune gestion trop prcise
et frquente des formations/destructions de groupes. Il deviendrait donc certainement
difcile renseigner, et ses performances risqueraient aussi de diminuer fortement.
2.4.3 Approche base sur les motions
E. de Sevin [34] propose une approche multi-couche base sur les motions et mo-
tivations des individus. Quatre couches comportementales de plus en plus complexes
76
Modles multi-couches
forment ce modle (Figure 2.11) :
FIG. 2.11: Architecture du modle multi-couche bas sur les motions.
Ractive. Ces comportements sont utiliss pour faire face des situations imprvues,
et permettre des comportements opportunistes. Cette capacit de dcision rapide
(reprsente par la case choice sur la gure 2.11) analyse directement lenviron-
nement peru pour slectionner une action court terme situe. Cette slection
est effectue par un systme de classication hirarchique.
Pro-active. Cette couche comportementale se charge de planier des suites dactions
ractives permettant datteindre des buts de plus haut niveau (case planner sur
la gure 2.11). Elle permet donc de rsoudre des comportements orients but, et
de grer la concurrence entre des buts potentiellement conictuels. Cette couche
correspond ltage cognitif de la pyramide de A. Newell.
Base sur les motivations. Cette capacit de dcision permet de gnrer les buts
long terme de lindividu. Ces buts, dnomms motivations, sont classs en trois
catgories priorit dcroissante : basique, correspondant aux besoins physiques
vitaux (comme manger) ; essentielle, correspondant aux besoins physiologiques
infrieurs (comme dormir) ; secondaire, correspondant aux besoins non primor-
diaux (comme se divertir). Cette couche correspond ltage rationnel de la py-
ramide de A. Newell.
motionnelle. Cette dernire aptitude joue plus un rle de modration que de d-
cision. En effet, les motions de lindividu vont tre capables dinuencer les
paramtres dcisionnels des autres couches comportementales, comme le niveau
dactivation dune motivation. Cette couche correspond ltage social de la py-
ramide de A. Newell.
Larchitecture propose par ce modle est sduisante par son analogie avec les mo-
dles psychologiques, tel que la pyramide de A. Newell. On peut ainsi y retrouver des
couches comportementales spcialises, au fonctionnement indpendant, ne communi-
quant que de faon restreinte avec les autres processus dcisionnels. Nanmoins, las-
pect situ de la dcision nest que peu abord dans ce modle. Les deux comportements
les plus indispensables de ce point de vue, la planication de chemin et la navigation r-
active, ne sont pas dtaills ici, interdisant lexploitation de cette approche pour ltude
des circulations de personnes. Dautre part, laspect opportuniste du comportement,
77
Modles de comportement
vis vis des possibilits offertes par lenvironnement, semble restreint la gestion
dinteractions instancies a priori, imposant une rednition des comportements pour
permettre lvolution de lenvironnement. Finalement, cette approche semble plus ap-
proprie pour la gestion de comportements physiques prdtermins, tout en offrant
des perspectives intressantes quant larchitecture gnrale propose.
2.4.4 Approche grande chelle
B. Moulin et al. [88], avec le projet MAGS (pour Multi-Agent GeoSimulation), pro-
posent un modle denvergure permettant de simuler des milliers dentits, que ce soit
lchelle dune ville ou dun btiment [4]. Le modle nest pas ici born la simu-
lation dtres humains, mais peut aussi bien traiter des animaux, des objets mobiles
ou non, et ce dans un grand ventail de situations, telles que lvacuation ou ltude
des foules. Ce systme propose de simuler les entits avec des capacits de cognition
spatiale, que ce soit la perception, la navigation, ou encore le raisonnement.
Perception. Le systme MAGS simule une perception individuelle en se basant sur la
projection dun cne de vision 3D dans des cartes 2D (Figure 2.12), en tenant
compte dune carte dlvation pour grer les occlusions. Les cartes utilises
se prsentent sous la forme dimages, donc avec le formalisme des grilles. Dif-
frents types dinformations peuvent ainsi tre perus, chacune relative une
reprsentation de lenvironnement base sur une smantique diffrente :
caractristiques gographiques du terrain (lvation) ;
caractristiques topologiques du terrain (objets statiques, chemins) ;
autres agents simuls (voisinage mobile) ;
zones dynamiques avec des proprits spciales (fume, parfum) ;
vnements spciaux (explosions) ;
messages transmis par dautres agents.
La distance de vision peut tre congure, et le systme peut recourir une
vision de groupe, o un leader aura une perception totale alors que les autres
seront brids mais pourront se rfrer aux informations du leader.
(a) Projection du cne de vision dans une carte. (b) Carte des zones de navigation.
FIG. 2.12: Gestion de la perception et reprsentation des connaissances dans
le systme MAGS.
78
Modles multi-couches
Navigation. Deux modes de navigation sont possibles pour les entits simules. Pre-
mirement, un mode de suivi de chemin, peu coteux, o lagent se contente de
suivre une portion de chemin visible disponible dans la carte correspondante.
Deuximement, un mode dvitement dobstacles grant les espaces ouverts, o
lagent va chercher rejoindre le chemin pr-calcul le plus proche dans le sens
de sa destination en se basant sur la carte dlvation. Les deux modes utilisent
une mthode de lancer de rayon. Le rayon est initialis avec la direction di-
recte vers la destination de lagent, et avec une longueur infrieure sa distance
de perception. Si le rayon ne rencontre pas dobstacle, alors le mouvement est
considr valide. Dans le cas contraire, des rayons successifs sont lancs de part
et dautre de lentit jusqu en trouver un valide ou jusqu ce quun angle
maximum soit atteint, ce dernier cas dclenchant un traitement spcique. Cette
mthode correspond un algorithme A

qui ne serait pas valu jusquau bout,


et dont lheuristique est uniquement base sur la distance.
Connaissance et dcision. Chaque agent dispose de ses propres paramtres, repr-
sentant ltat de sa connaissance, ainsi que dune procdure comportementale,
reprsentant sa capacit de dcision. Cette procdure comportementale est base
rgles, reprsente sous la forme dun arbre dobjectifs, o les nuds racine sont
des buts complexes alors que les feuilles sont des buts atomiques. Chaque objec-
tif est compos dun ensemble de rgles dactivations, dactions effectuer, et
de rgles de compltion.
Le systme MAGS permet ainsi de simuler des milliers dindividus en temps rel, un
utilisateur pouvant de cette faon interagir directement avec la simulation (Figure 2.13).
Les objectifs de ce projet sont classer en deux catgories. Premirement, la simulation
de situations pour tudier leur impact sur des environnements grande chelle, comme
par exemple un accident paralysant un pont dans une ville. Deuximement, laide la
dcision dans des situations relles, o le logiciel sera renseign au fur et mesure de
lvolution de lvnement, permettant un utilisateur den avoir une vue densemble.
(a) Cartographie 2D. (b) Animation 3D.
FIG. 2.13: Visualisation en sortie du systme MAGS.
Lavantage certain de ce modle est sa capacit traiter rapidement des situations
grande chelle, tout en maintenant une approche microscopique. Son premier incon-
vnient, vis--vis de ltude des circulations de personnes, concerne le processus de
navigation employ. En effet, an de maintenir les performances du systme, la m-
79
Modles de comportement
thode de planication a volontairement t bride, ne prenant en compte que lenvi-
ronnement immdiat et le paramtre de distance. Cette technique permet dobtenir des
rsultats probants macroscopiquement, mais nest pas adapte ltude spcique des
ux de personnes, o un grand nombre de critres interviennent dans la planication
dun chemin (confre Section 1.5.4, page 45). Une autre caractristique, ne pouvant
saccorder avec des environnements larchitecture complexe, rside dans la faon de
reprsenter lespace. La technique de cartes multiples associant diverses smantiques
est en effet sduisante de par sa simplicit de mise en uvre ainsi que sa rapidit dex-
ploitation. Elle est nanmoins trs dpendante de la discrtisation employe (confre
Section 1.5.2, page 41), et ne peut tre utilise pour ltude ne des circulations de
personnes.
2.4.5 Synthse
Nous avons vu dans cette section diffrents modles multi-couches, introduisant le
comportement comme processus de dcision quant aux dplacements individuels ou
collectifs. La premire approche pose de manire gnrale les principes de la mod-
lisation multi-couches. Les trois autres approches sont difcilement exploitables dans
notre cadre dapplication, sadressant a des problmatiques dordre diffrent. Nan-
moins, elles permettent toutes de tirer quelques constats.
Tout dabord, lapproche multi-couches impose une certaine concurrence entre les mo-
dles, les couches dcisionnelles pouvant contrler les couches basses linverse de
leur mode de fonctionnement habituel. Ce constat fait ressortir une ncessit de ro-
bustesse de ces couches basses, leur permettant de suivre des ordres quelconques sans
tomber dans des cas particuliers provoquant un dysfonctionnement.
Ensuite, deux approches existent pour la simulation dun grand nombre dentits : lune
o la notion de groupe est mergeante, lautre o elle est explicite. Le groupe mergeant
permet un contrle plus n des entits, chacune delle pouvant suivre ses propres buts
et prendre une dcision indpendante. Le groupe explicite permet une conguration
plus aise de la simulation, o lutilisateur pourra spcier trs rapidement les attitudes
gnrales dun grand nombre dindividus. Une approche combine serait alors souhai-
table, o chaque individu serait indpendant avec un niveau dautonomie maximale
quant sa prise de dcision, mais fournissant aussi des outils pour spcier de faon
plus gnrale des archtypes de population.
Enn, nous pouvons voquer la question de la complexit des modles employs pour
chaque couche. On a pu constater que la contrainte dexcution en temps rel impose
une simplication des modles. Cela est acceptable pour de lanimation ou de la simu-
lation macroscopique, mais inappropri pour ltude des ux de personnes. En effet,
la prise de dcision quant la navigation y joue un rle trop important. Nous pouvons
conclure que pour proposer un modle dont les rsultats seraient exploitables, laspect
temps rel doit tre sacri au bnce du ralisme comportemental. Nanmoins, la
conservation dun temps interactif, tout du moins dans les phases de conguration et
dexploitation des rsultats, doit tre envisage an de permettre une utilisation aise
du modle.
80
Conclusion
2.5 Conclusion
Nous nous sommes penchs tout au long de ce chapitre sur le rle du processus de
dcision dans le comportement humain. Il apparat, comme premier constat, que lin-
teraction est prpondrante dans les comportements. Cette interaction permet lin-
dividu et lenvironnement de saffecter mutuellement dans des relations de cause
effet perceptibles. Nous pouvons donc en conclure que cette interaction est extrme-
ment importante pour ltude des dplacements de personnes, ayant un impact direct
sur les mouvements observables.
Concernant laspect rationnel, une hirarchisation du processus de dcision semble
exister, permettant dorganiser dans le temps les actions effectuer, ainsi que de r-
soudre les checs rencontrs. Plusieurs modles existent pour simuler cet aspect, prin-
cipalement en cherchant infrer des enchanements dactions relativement simples.
Cet aspect est relativement peu important dans notre cas dtude, les processus com-
portementaux pouvant tre considrs comme acquis dans le cadre denvironnements
assez courants, comme les gares. Des approches plus axes sur la description explicite
de ces plans dactions, telles que les BDI, semblent plus appropries. Il faut nanmoins
faire attention laisser une certaine libert au processus de dcision, an de ne pas
aboutir un modle trop script, o les entits simules excuteraient toutes la mme
srie dactions.
Ce dernier constat nous amne considrer trs fortement laspect situ du raisonne-
ment, faisant gnralement dfaut aux mthodes de rsolution que nous avons pu tu-
dier. Il est essentiel que la topologie des lieux ainsi quune notion temporelle entrent
en ligne de compte lors du choix des actions effectuer, ces deux aspect tant eux-
mme corrls. Mme intuitivement, il parat peu raisonnable de prendre une dcision
sans valuer le temps quil nous sera ncessaire pour laccomplir, ni organiser mentale-
ment les endroits successifs que nous allons devoir parcourir. Cest pourquoi ces deux
notions doivent tre ancres dans le processus de dcision.
Pour nir, nous pouvons remarquer que les modles multi-couches existants posent les
bases dune unication comportementale, traitant la fois les aspects ractifs et cogni-
tifs de la dcision. Ces modles utilisent gnralement des processus de dcision assez
simples, an de garantir une ractivit maximale du systme. Ils sont conus comme
un ensemble de modules spcialiss, communiquant entre eux mais au fonctionne-
ment relativement indpendant. Une telle architecture semble approprie, permettant
une volution aise du systme, et ventuellement le remplacement transparent de lun
des modules.
81
Discussion
Lobjectif de notre tude est la caractrisation des circulations de personnes dans des
environnements contraints. Ces derniers peuvent subir de fortes variations de densits
de populations, et permettent des procdures comportementales pouvant tre relative-
ment complexes.
Le dplacement pitonnier
Nous nous sommes donc naturellement penchs, dans la premire partie de cet tat
de lexistant, sur lobjectif premier de notre sujet que sont les mouvements pdestres
humains. Nous avons ainsi pu dcouvrir que cette problmatique est aborde depuis
un certain temps dj, dabord par les sciences humaines psychologie et sociologie
puis par la simulation informatique. Nous pouvons ainsi trouver dans la littrature
une somme consquente de donnes quantitatives, ainsi que plusieurs constats quali-
tatifs, dnissant des comportements pitonniers observables. Ces informations peu-
vent difcilement tre exploites directement lors de simulations, tant fondes sur des
approches trop statistiques, mais peuvent servir comme base de validation macrosco-
pique.
Concernant la modlisation informatique des mouvements de personnes, les modles
microscopiques sont retenir pour le niveau de contrle quils offrent. Ces modles
imposent tout dabord une certaine reprsentation de lenvironnement, servant de sub-
strat la simulation. Pour traiter cet aspect, deux approches sont possibles : lune plus
axe sur les performances, avec les reprsentations approximatives comme les grilles,
et lautre sur la conservation de linformation, avec les reprsentations exactes comme
la triangulation de Delaunay. Au vu des capacits actuelles des machines, le choix nest
peut-tre plus faire, et lon pourrait considrer une combinaison des deux an den
tirer le meilleur parti.
Laspect suivant quil faut traiter est la faon dvaluer un chemin au sein de len-
vironnement. Cette planication de chemin peut tre ralise par des algorithmes de
parcours de graphe, dsormais bien connus. Ce qui va rellement importer concerne
plutt la faon de quantier la longueur des chemins. Les premires mthodes propo-
ses, encore largement utilises aujourdhui dans le domaine de lanimation, se basent
uniquement sur la distance parcourir. Mais de nombreuses tudes montrent que ce
paramtre, bien quimpliqu, nest pas le seul prendre en compte. Il nous faut donc
proposer un processus de dcision bas la fois sur la distance, mais aussi sur la loi
des changements minimaux (rduction des variations de direction), sur lafuence des
lieux (densits), et sur des paramtres plus individuels comme la connaissance ou les
83
Discussion
prfrences.
La dernire partie prendre en compte concerne les mouvements locaux, ce que nous
nommons la navigation. Cest par ce processus que les individus simuls vont grer
leurs interactions court terme avec les obstacles statiques et dynamiques de len-
vironnement. Ce processus doit pouvoir sadapter des situations de faible et forte
densits, et ncessite imprativement des capacits danticipation. En effet, il est d-
montr que lindividu arrive maintenir un dplacement uniforme et quasi continu par
sa capacit prvoir le dplacement des autres. Il nous faut donc proposer un modle
trs fortement bas sur ce principe de prdiction, qui nest abord que brivement dans
les modles couramment utiliss.
La prise de dcision
Nous avons aussi vu que le dplacement individuel nest pas une n en soi, mais plu-
tt la consquence dun processus de raisonnement plus pouss. Cest pourquoi nous
avons prsent ce processus de prise de dcision dans la deuxime partie de notre tat
de lart. Pour commencer, nous avons dni quelques bases psychologiques dnis-
sant les grandes lignes de lanalyse du comportement humain par les sciences cogni-
tives. Celles-ci placent linteraction au centre du comportement, soit comme cause soit
comme consquence. Nous avons pu identier le principe de fonctionnement gnral
du mcanisme comportemental comme tant une boucle perception - dcision - action,
avec nanmoins certains comportements ractifs passant directement de la perception
laction. Pour le processus de dcision, nous avons pu identier quil fait intervenir
un mcanisme mmoriel compartiment, et quil peut tre spar en plusieurs couches
reprsentes par la pyramide de A. Newell.
Deux approches informatiques existent pour traiter le comportement. Tout dabord des
approches explicites, destines grer des comportements ractifs, et donc bases sur
la description dtaille de leur fonctionnement. Nous avons retenu deux de ces ap-
proches pour notre cadre dtude : base rgles, qui sduit par sa simplicit de mise
en uvre, et base sur les automates, qui sduit par sa grande expressivit. Il faudrait
alors considrer une approche combine, offrant un fort potentiel dvolution tout en
permettant la gestion de comportements aux enchanements complexes.
La deuxime srie dapproches, complmentaire la prcdente, concerne les compor-
tements dits rationnels. Ceux-ci vont chercher construire un plan dactions pour ac-
complir un but plus long terme. La plupart des modles existants se caractrisent par
la possibilit dextrapoler des enchanements de comportements simples, par lanalyse
des conditions ncessaires leur excution. Nous avons conclu que ce type dapproche
est difcilement exploitable dans notre cadre dapplication. En effet, cette mthode est
trs peu efcace en terme de temps de calcul, et donc ne peut passer lchelle dune
foule. De plus, il ne nous parat pas rellement ncessaire de grer des comportements
capables dinfrer un savoir-faire, tant donn que les procdures comportementales
de nos entits peuvent tre assez bien dcrites. Cest pourquoi, une approche descrip-
tive type BDI nous semble plus approprie, en y intgrant une hirarchisation de la
description de linteraction pour permettre une plus grande autonomie et diversit dans
lexcution des plans comportementaux.
Mais lun des points assez peu abord par ces approches concerne laspect situ du
raisonnement, son lien avec la topologie des lieux. Nous avons ainsi prsent une srie
84
Discussion
de modles fonds sur cet aspect situ, proposant des environnements informs o
linteraction est intimement lie sa localisation. Ces modles rejoignent ici la thorie
cologique de J.J. Gibson, plaant les capacits dinteractions lintrieur des objets
qui la proposent. Nanmoins, la plupart de ces modles sont essentiellement axs sur
laspect physique de linteraction, et donc sa reprsentation visuelle, plutt que laspect
comportemental, et donc ses implications dans les choix des individus. Nous retenons
tout de mme le modle des smarts objects, qui effectue un premier pas dans ce sens
en couplant des algorithmes rationnels. Le modle STARFISH est aussi trs attractif
car il associe une smantique linteraction physique, permettant un couplage encore
plus fort avec des modles dcisionnels. Il nous semble donc intressant de partir dans
cette direction, mais en proposant un mcanisme de description des objets permettant la
cration de procdures comportementales plus facilement. Nous souhaitons notamment
pouvoir intgrer dans la description de lenvironnement une certaine abstraction du
comportement, permettant datteindre deux niveaux de prise de dcision : lun gnral,
ne tenant compte que des implications rationnelles de linteraction, lautre situ, en
effectuant le choix dnitif en se basant fortement sur la topologie.
Pour nir, nous avons prsent quelques modles multi-couches, qui unient les com-
portements ractifs et rationnels, ainsi que les circulations de personnes. Nous avons
ainsi pu tirer quelques constats qui formeront le canevas du modle vers lequel nous
voulons nous diriger. Tout dabord, larchitecture modulaire de ces modles semble tout
fait approprie, tant du point de vue de la conception, permettant de classier les pro-
blmes, que du point de vue de lvolution, permettant damliorer ou remplacer une
couche indpendamment des autres. Ensuite, il mettent laccent sur les choix faire
pour reprsenter chaque couche. Il nest en effet pas possible, lchelle du nombre
dindividus que nous considrons, de concilier performances dexcution et ralisme
microscopique des agents autonomes. Certaines approches rsolvent ce problme en
regroupant les individus pour minimiser le nombre de dcisions prendre, dautres ne
ncessitent quune vue plus globale de la simulation et supportent donc lexploitation
de modles plus simples mais plus rapides. Pour notre cadre dtude nous considrons
que la dynamique microscopique est la plus importante, nous conduisant considrer
des modles plus labors au dtriment des performances. Nous chercherons tout de
mme conserver un temps interactif lors de certaines phases de la simulation, pour
permettre son utilisation dans des conditions favorables.
Conclusion
Nous pouvons conclure que le sujet envisag regroupe un trs grand nombre de probl-
matiques. Lensemble de celles-ci ont dj t abordes en informatique, mais relative-
ment rarement dans notre cadre dtude. De plus, peu de modles fdrateurs existent,
et ceux proposs ne couvrent pas lensemble de notre sujet. Il est indniable que lla-
boration dun tel modle constitue un challenge, tant sur le point de la conception que
de la validation. Ce dernier point est nanmoins fondamental si lon veut esprer pro-
curer des rsultats de simulation analysables au mme titre que des relevs faits in situ.
85
Deuxime partie
Contributions
87
Introduction
Ltude des circulations de personnes est une problmatique ncessitant dapprhender
le comportement humain. Ceci est dautant plus vrai dans notre domaine dapplica-
tion, qui est la caractrisation des ux de personnes dans les lieux dchanges, o ce
comportement nest pas seulement un dplacement dans un environnement mais inclut
aussi des interactions avec divers quipements. Nous avons ainsi identi dans la partie
prcdente plusieurs problmatiques quil est indispensable de traiter pour aboutir un
modle permettant des simulations ralistes.
Premirement, notre modle doit tre capable dassocier une smantique des ob-
jets de simulation. Cette tape est ncessaire tout modle comportemental, que lin-
formation soit spcie de faon globale ou directement au sein de lenvironnement.
Cette deuxime approche est la plus exploitable pour cette tude, grce sa mise en
uvre implicite de laspect situ du comportement. De plus, cette smantique doit pou-
voir tre tendue facilement, an de reprsenter des situations diverses et ainsi ne pas
contraindre ce modle la gestion de cas trop restreints. En effet, cette tude sinscri-
vant dans une collaboration avec la SNCF et AREP, les premiers lieux dchanges viss
sont les gares ferroviaires. Nanmoins, lapplication du modle dautres environne-
ments comportant des potentiels dinteraction a t envisage. Citons par exemple les
aroports, les stades, les mtros, ou encore les centres commerciaux.
Le deuxime point traiter concerne directement la reprsentation de ces environne-
ments. Celle-ci doit tre aussi proche du rel que possible, et permettre une extraction
rapide des informations ncessaires la circulation dentits autonomes. Parmi ces in-
formations on peut envisager lensemble des caractristiques gomtriques et topolo-
giques de lenvironnement, mais aussi lemplacement des lieux de linteraction. Ainsi,
le modle denvironnement doit intgrer les objets interactifs, et donc la smantique
qui y est associe, pour permettre la mise en uvre des aspects incarn et situ du
comportement.
Enn, le troisime et dernier point de notre architecture concerne les acteurs de la si-
mulation. Ceux-ci doivent faire preuve dun certain ralisme comportemental, surtout
concernant leur dplacement qui est lobjectif premier de cette tude. Ils doivent tre
dous dune autonomie maximale, associe une individualisation du processus de
dcision. Une boucle perception dcision action semble donc indique, avec une
subdivision du processus de dcision correspondant la classication de A. Newell.
Cette architecture devra ainsi permettre de simuler des entits non omniscientes, ca-
pables dapprhender leur environnement dun point de vue global, pour y valuer un
chemin, et dun point de vue local, pour grer leur dplacement immdiat et les inter-
actions individuelles en rsultant. De plus, lhumain virtuel devra motiver ces choix par
89
Introduction
les interactions quil doit effectuer au sein de lenvironnement, et donc tre dou dun
minimum de comportements rationnels autorisant la rsolution de procdures com-
portementales. Ce dernier aspect devra tre augmentable pour reter les volutions
potentielles de la smantique fournie avec les objets interactifs.
Nous allons donc prsenter dans cette partie nos contributions sous la forme de trois
modles. Nous commencerons, dans le chapitre 3, par prsenter notre modle dobjets
interactifs dnomm BIIO. Nous continuerons, dans le chapitre 4, avec notre reprsen-
tation de lenvironnement et lensemble des informations qui lui sont associes. Enn,
nous terminerons, dans le chapitre 5, en dcrivant notre modle dhumain virtuel et
lensemble de ses mcanismes comportementaux.
90
Chapitre 3
Les objets interactifs
Nous avons vu dans ltat de lart que linteraction se plaait au centre du comporte-
ment individuel, en ayant un impact fort sur les dplacements au sein dun environ-
nement. Ce principe est particulirement vrai dans notre cadre dapplication, ltude
de gares ferroviaires, o la procdure comportementale dun voyageur va le pousser
interagir avec une srie dquipements.
Deux mcanismes sont ncessaires la gestion de ces interactions. Premirement, un
tre humain doit pouvoir se reprsenter mentalement le monde qui lentoure sous forme
de concepts qui vont associer une smantique aux diffrents objets. Deuximement, il
doit pouvoir situer ces concepts dans lespace et dans le temps an de pouvoir orga-
niser ses actions. Nous allons dnir dans ce chapitre un modle dobjets interactifs
permettant de traiter le premier point, et reviendrons sur le second dans le chapitre
suivant. Notre modle se dnomme BIIO, pour Behavioral Interactive and Introspec-
tive Objects. Dans BIIO tout est objet, que ce soit les quipements, les humanodes, ou
encore des concepts plus abstraits comme les comportements.
Nous commencerons, dans la section 3.1, par dcrire les principes rgissant le fonc-
tionnement de ce modle. Nous continuerons, dans la section 3.2, en dnissant les
concepts introduits par BIIO, qui serviront de base toute description plus spcique
de linteraction. Nous dtaillerons ensuite, dans la section 3.3, laffordance qui repr-
sente un potentiel dinteraction dans notre modle. Nous nirons en prsentant, dans
les sections 3.4 et 3.5, les deux objets participant une interaction : linteracteur qui la
ralise, et leffecteur qui la propose.
3.1 BIIO : principes de fonctionnement
Larchitecture BIIO inclut initialement un certain nombre de concepts, formant notre
modle de simulation comportementale. Ces concepts prennent la forme dobjets BIIO
de haut niveau peu spcialiss qui serviront de base llaboration dobjets plus
complexes. En effet, BIIO est fortement ax sur la notion dhritage de proprits, per-
mettant de dnir des concepts gnriques qui seront ensuite spcialiss pour dcrire
les lments dun environnement. Nous reviendrons dans le chapitre suivant sur ces
objets de haut niveau, pour nous concentrer ici sur les principes rgissant leur fonc-
91
Les objets interactifs
tionnement. Ces principes formalisent des rgles gnrales dont la validit est garantie
pour lensemble de larchitecture et de ses volutions potentielles.
3.1.1 Constituants
Un objet BIIO est compos de deux sortes de constituants : des attributs et des fonc-
tionnalits.
Les attributs reprsentent les proprits internes dun objet, et donc son tat. Trois
catgories dattributs sont distinguer :
Les dnitions de type dobjet BIIO servent caractriser des catgories dobjets
manipulables. Ces attributs sont surtout utiliss par des objets gnrateurs ou conte-
neurs. Par exemple, un ascenseur dnira le type dobjet quil peut contenir, tel quun
humanode, autorisant toutes les instances de cette catgorie lemprunter.
Les instances dobjets BIIO reprsentent un tat aux caractristiques ges, mais
dont les valeurs peuvent voluer. Par exemple, un ascenseur aura comme attribut son
panneau de commandes, qui aura lui mme comme attributs ses boutons de contrle.
Les rfrences des instances dobjets BIIO reprsentent un tat dont les caract-
ristiques aussi bien que les valeurs peuvent voluer. Une rfrence va ainsi stocker
une instance dobjet qui pourra changer au cours du temps. Cet attribut indique le
type dobjet quil peut contenir, autorisant le stockage de nimporte quelle spcia-
lisation de ce type. Par exemple, un humanode pourra avoir une rfrence sur un
autre humanode pour indiquer un ventuel lien social.
Les fonctionnalits reprsentent les procdures accessibles sur lobjet. Elles per-
mettent de dcrire une action de lobjet sur lenvironnement de simulation. Une fonc-
tionnalit peut comporter des paramtres optionnels, composs des mmes catgories
que les attributs. Lexcution dune fonctionnalit peut aussi bien modier ltat in-
terne de lobjet que celui des paramtres, et peut bien entendu faire appel dautres
fonctionnalits de lobjet, ou des paramtres. Par exemple, un ascenseur pourra avoir
des fonctionnalits pour ouvrir ou fermer ses portes, ou encore pour se rendre ltage
pass en paramtre.
Les attributs aussi bien que les fonctionnalits peuvent tre soit locaux aux instances
dobjets, soit globaux pour le type dobjet. Des constituants locaux seront prsents et
diffrencis pour chaque instance dobjet de la simulation, tandis que des constituants
globaux seront uniques pour toutes les instances de ce type dobjet. Ce dernier cas
permet ainsi davoir un contrle gnral sur lensemble des objets dun mme type.
Par exemple, toujours pour un ascenseur, un attribut global pourra tre la vitesse de
dplacement vertical, permettant par sa modication dagir sur la rapidit de tous les
ascenseurs de la simulation, tandis quune fonctionnalit globale pourra tre douvrir
toutes les portes, permettant par son excution de simuler une procdure durgence.
3.1.2 Hritage
La notion dhritage permet de faciliter la cration de nouveaux objets, soit en spcia-
lisant des concepts existants, soit en les runissant. En effet, ce principe dnit quun
92
BIIO : principes de fonctionnement
objet dispose de lensemble des constituants, attributs comme fonctionnalits, de son
ou ses parents. Lunication de concepts se fait donc en crant un nouveau type dobjet
qui hrite de plusieurs types prdnis, associant ainsi lensemble de leurs capacits.
La spcialisation se fait par la rednition dans un nouveau type dobjet de fonctionna-
lits disponibles dans ses parents, ainsi que par lajout de nouveaux constituants. A titre
dexemple, un ascenseur unie les concepts dobjet lectrique et de conteneur dobjets,
tout en les spcialisant par lajout des constituants cits prcdemment.
Nanmoins, des contraintes sur les possibilits dhritage ont t introduites an de
grer certaines spcicits. Ainsi, un type dobjet peut avoir lune des trois possibilits
dhritage suivantes, du plus au moins contraint :
Aucune Lobjet ne peut servir de parent un autre objet. Ce cas permet de bloquer les
possibilits dextension dobjets ayant des contraintes de fonctionnement trop
complexes, an de garantir une certaine robustesse du modle.
Simple Lobjet peut servir de parent un autre objet, mais ne doit tre prsent quune
seule fois dans sa hirarchie : lunication de deux spcialisations de ce concept
est interdite. Ce cas permet de restreindre les possibilits dextension dun objet
considr comme globalement dni.
Multiple Principe dhritage le moins contraint, o des spcialisations de lobjet peu-
vent tre runies par la suite.
Notons quune spcialisation dobjet a un principe dhritage au moins aussi contraint
que le plus contraint de ses parents. Pour reprendre les exemples prcdents, lobjet
lectrique sera hritage multiple, tandis que lascenseur sera hritage simple, et un
ascenseur de modle spcique naura aucune possibilit dhritage.
3.1.3 Introspection
Lintrospection est le principe suivant lequel un objet est capable de communiquer ses
caractristiques sans que lon en ai un quelconque a priori. Ces caractristiques sont
aussi bien les attributs de lobjet, que ses fonctionnalits, ou encore sa place dans la
hirarchie des concepts. De plus, une introspection globale de BIIO permet dinterroger
la simulation sur lexistence de types dobjets, ou encore dinstances dobjets dun
certain nom.
Ce mcanisme autorise une trs grande gnricit lors de llaboration dune simula-
tion, permettant ainsi dtendre la varit des objets simuls sans pour autant avoir
modier le modle gnral. En effet, lintrospection rend possible la cration de fonc-
tionnalits manipulant des concepts de plus ou moins haut niveau, pouvant ensuite
sadapter automatiquement leurs spcialisations. Comme nous le verrons dans la par-
tie prsentant les rsultats, cette introspection peut aussi tre utilise dans un cadre
applicatif pour proposer des outils ddition gnriques : visualisation, dition, sauve-
garde de ltat des objets dune simulation.
3.1.4 Automatisation
Le principe dautomatisation est particulier dans le sens ou cest le seul tre optionnel.
En effet, il est propos dans BIIO sous la forme dun concept de haut niveau : lobjet
93
Les objets interactifs
automatis. A potentiel dhritage multiple, celui-ci comporte un attribut et deux fonc-
tionnalits (sans paramtre) :
Frquence Cet attribut indique la frquence de rafrachissement de lobjet automatis.
Initialisation Fonctionnalit usage unique, appele automatiquement au dmarrage
de la simulation.
Mise jour Fonctionnalit appele la frquence spcie pour lobjet, durant la si-
mulation.
Comme nous le verrons ensuite, lautomatisation sera utilise pour dclencher des
fonctionnalits internes aux objets simuls, ou encore pour effectuer des tches r-
ptitives. Par exemple, une horloge aura comme fonctionnalit automatique la mise
jour de son attribut horaire une fois par seconde.
3.2 Les concepts introduits par BIIO
Maintenant que nous avons numr les principes rgissant BIIO, dnissons les con-
cepts quil introduit sous forme dobjets de haut niveau. Ces concepts vont constituer
les a priori dun modle gnrique dobjets interactifs, qui ne sera rellement exploi-
table quaprs sa spcialisation. Nous allons aussi bien dnir ici des concepts trai-
tant du fonctionnement gnral de linteraction (comme la le dattente) que des con-
cepts ncessaires llaboration dun processus de raisonnement bas sur linteraction
(comme la tche cognitive).
3.2.1 Vue densemble
Les concepts introduits par BIIOsont fortement interdpendants. An den simplier la
description, nous allons exposer les relations existant entre ces concepts. Ces derniers
ne seront que succinctement prsents ici, car nous les dtaillerons dans la suite de
cette section. Deux types de relations seront dcrites : les relations de dclaration et
dexcution.
La gure 3.1 prsente les relations de dclaration existant entre les concepts. On peut y
voir quun objet physique gre une collection de ressources, reprsentant ses tats in-
ternes variables. Cet objet physique est spcialis en effecteur et en interacteur, qui sont
les intervenant dune interaction. Ces deux spcialisations disposent chacune dune col-
lection daffordances, reprsentant leurs possibilits dinteraction respectives. Linter-
acteur, qui correspond aux entits autonomes, comporte aussi une collection de tches
cognitives incarnant ses comportements. Leffecteur, qui correspond globalement aux
quipements, comporte quant lui une collection de les dattente et dutilisation.
Ces dernires, qui reprsentent la faon daccder une interaction, disposent cha-
cune dune zone dancrage stipulant leur localisation respective. Enn, une affordance
indique les types dinteracteur et deffecteur pouvant la raliser, ainsi que les les dat-
tente et dutilisation quelle implique.
La gure 3.2 prsente les relations dexcution existant entre les concepts. Lobjet phy-
sique se charge ici de la mise jour de ses ressources. Leffecteur se contente de la
gestion des les dattentes, les les dutilisation ayant un fonctionnement vnemen-
tiel. Linteracteur gre quant lui lexcution de ses affordances et tches cognitives,
94
Les concepts introduits par BIIO
FIG. 3.1: Relations de dclaration entre les concepts de BIIO. Les ches
en pointills reprsentent les relations, les ches continues repr-
sentent un lien dhritage.
et est capable de sabonner et de consulter les les dattente et dutilisation de len-
vironnement. Les affordances et les tches cognitives sinuencent mutuellement, et
contrlent le comportement de linteracteur. De plus, elles se servent des ressources de
ce dernier pour grer leur propre fonctionnement.
FIG. 3.2: Relations dexcution entre les concepts de BIIO. Les ches en
pointills reprsentent les relations, les ches continues repr-
sentent un lien dhritage.
Ces schmas reprsentent ainsi le cur du modle dinteraction propos avec BIIO.
Lintgralit du mcanisme comportemental y est rsum, et nous allons voir que la
simple spcialisation des concepts prsents ici permettra de grer un large ventail de
situations. Dtaillons maintenant ces concepts.
3.2.2 La ressource
La ressource symbolise une caractristique interne de nature temporaire de lobjet in-
teractif, quil soit un quipement ou un agent autonome. Ce caractre temporaire peut
95
Les objets interactifs
aussi bien tre lexistence mme de la ressource, que ses proprits. Comme nous le
verrons ensuite, les ressources seront utilises pour la rsolution des comportements
dinteraction. Une ressource peut tre de quatre types (Figure 3.3) :
FIG. 3.3: Diagramme de spcialisation des ressources.
Brute La ressource brute ne comporte aucune fonctionnalit. Elle nest utilise que
pour symboliser lexistence de quelque chose. Par exemple, un ticket de train
sera une ressource brute dun voyageur, ou encore llectricit pour un objet
lectrique.
Exclusive La ressource exclusive spcialise la ressource brute en lui ajoutant la fonc-
tionnalit de rservation, nautorisant quun seul mcanisme lutiliser au mme
instant. Par exemple, un membre dun humanode sera une ressource exclusive
utilisable par une seule activit physique la fois.
Partage La ressource partage permet elle aussi la rservation, mais cette fois-ci par
parties, autorisant ainsi plusieurs mcanismes se la partager. Par exemple, la
concentration dun humanode sera une ressource pouvant se partager entre plu-
sieurs comportements cognitifs.
Dynamique Spcialisation de la ressource partage, la ressource dynamique comporte
une fonctionnalit automatise la faisant voluer au cours du temps. Par exemple,
la soif pour un tre humain sera reprsente par une ressource dynamique, qui va
crotre automatiquement et tre consomme lorsque celui-ci boit.
3.2.3 Lobjet physique
Lobjet physique est le concept dcrivant un objet impliqu dans une interaction. Cet
objet est situ dans lespace, i.e. sa position est identie dans la description de lenvi-
ronnement. Nous reviendrons plus en dtail sur cette proprit dans le chapitre suivant,
mais rappelons tout de mme quelle est indispensable la gestion comportementale
des individus.
Lobjet physique dispose aussi dune collection de ressources, et se charge de leur
gestion. Celle-ci est ralise en deux temps, correspondant la spcialisations des deux
fonctionnalits du principe dautomatisation :
Initialisation. Lobjet interactif collecte lensemble des ressources ventuellement d-
clares comme attributs dune spcialisation. Cette collecte est rendue possible
grce au principe dintrospection de BIIO, et permet de centraliser les ressources
disponibles.
Mise jour. Lobjet interactif rafrachit ses ressources, une frquence de 1Hz. Ce
rafrachissement libre les ressources exclusives et partages, et incrmente les
ressources dynamiques.
96
Les concepts introduits par BIIO
Dautres fonctionnalits de gestion des ressources sont aussi dnies : ajout/retrait,
transfert un autre objet interactif, test dexistence (par type et/ou nom de ressource).
Grce lensemble de ces mcanismes, lobjet interactif devient une base de donnes
concernant ses propres ressources.
Pour nir, on peut noter que ce concept sera spcialis de deux faons (Figure 3.4) :
1. En interacteur, qui ralise une interaction.
2. En effecteur, qui propose une interaction.
Nous reviendrons plus en dtail sur ces spcialisations dans les sections 3.4 et 3.5.
FIG. 3.4: Diagramme de spcialisation des objets interactifs.
3.2.4 Les zones dancrage
Les zones dancrage dnissent des lieux dintrt dans lenvironnement. Elles seront
notamment utilises pour spcier les zones dattente et dutilisation dune interaction.
Une zone dancrage dnit une distance autorise d
a
, en dessous de laquelle une entit
peut considrer que la zone est atteinte.
FIG. 3.5: Diagramme de spcialisation des zones dancrage.
Trois spcialisations sont disponibles (Figure 3.5) :
Ponctuelle : spcie par un point dans lenvironnement. Ce type de zone sera uti-
lise pour reprsenter une position prcise dans lenvironnement (d
a
petit), ou
une zone uniforme autour dun point dintrt (comme pour la propagation dun
son). Un exemple type serait pour lidentication de la position dutilisation dun
composteur.
Segment : spcie par deux points dans lenvironnement. Ce type de zone sera utili-
se pour reprsenter des positions avec une certaine libert, comme pour indiquer
la position dutilisation dun objet avec une face interactive large (par exemple
un kiosque journaux).
97
Les objets interactifs
Polygone convexe : spci par trois points ou plus dans lenvironnement, formant
une gure convexe. Ce type de zone est la moins efcace en termes de traite-
ments, mais laisse la plus grande libert dans sa spcication. La contrainte de
convexit est impose uniquement pour des questions de performances. Ce type
de zone pourra typiquement tre utilise pour reprsenter la position dutilisation
dobjets observables, tel quun moniteur des dparts dans une gare, sous la forme
de triangle ou de trapze.
3.2.5 Les les dattente
Les les dattente dnissent les mcanismes dorganisation sociale pour lattente. D-
clares par les effecteurs, elles seront automatiquement utilises lors de linteraction
par les interacteurs. Une le dattente dnit un attribut et un ensemble de fonctionna-
lits :
Zone de premire attente Cette zone dancrage dnit le lieu atteindre par le pre-
mier attendant, les zones suivantes tant dtermines automatiquement.
Pr-abonnements Cet ensemble de fonctionnalits permet un interacteur de dclarer
son intention dinteraction un effecteur, et ainsi de savoir quels sont les autres
interacteurs avoir fait de mme. Ce mcanisme est le premier intervenir dans
le processus dinteraction, avant mme que linteracteur ne se mette utiliser ou
attendre un effecteur.
Abonnement Cet ensemble de fonctionnalits permet un interacteur de dclarer le
dbut de son attente, mais aussi de se tenir inform de lvolution de cette attente
(position dans la le, nombre total dattendants, interacteur immdiatement de-
vant, etc.).
Les deux fonctionnalits que nous avons prsentes permettent de simuler lexternali-
sation et la scrutation des individus quand linteraction avec un objet spcique. Le
fait de centraliser cette information au niveau de lobjet permet son ltrage implicite,
car seuls les agents impliqus dans une interaction avec cet objet y accderont.
Il existe trois les dattente spcialises (Figure 3.6) :
Aucune Ce type de le dattente est utilise dans le cadre dinteractions ne supportant
pas lattente. Les fonctionnalits de pr-abonnement ainsi que la zone de pre-
mire attente restent disponibles et ncessaires an de grer la concurrence entre
plusieurs utilisateurs. Par contre, les fonctionnalits dabonnement chouent sys-
tmatiquement. Les interactions typiques de ce mode dattente invalident la pos-
sibilit dinteraction une fois actives, comme monter la place du conducteur
dans une voiture, lattente devenant inutile pour les autres personnes voulant
ventuellement conduire.
FIFO (First In First Out) Cette spcialisation correspond aux les dattente organi-
ses, o lordre darrive dnit lordre dinteraction. Les fonctionnalits dabon-
nements lattente ont ici un fonctionnement vnementiel : lappel de ces fonc-
tionnalits provoque le rafrachissement des attributs internes (volution de la
position dans la le). Un exemple dinteraction serait le passage en caisse dans
un magasin.
Plus prs Cette spcialisation correspond aux les dattente dsorganises, o la dis-
tance leffecteur dnit lordre dinteraction. Les fonctionnalits dabonnement
98
Les concepts introduits par BIIO
lattente ont ici un fonctionnement frquentiel, comme la position dans la le
qui est dtermine dynamiquement par ordre de distance croissante leffecteur.
Un exemple dinteraction serait lutilisation dun composteur de tickets de train.
FIG. 3.6: Diagramme de spcialisation des les dattente.
3.2.6 Les les dutilisation
Les les dutilisation dnissent le principe dutilisation pour une interaction. Le terme
de le a t choisi pour se rapprocher de la dnomination de lattente, mais ne dnit en
rien ici un principe dorganisation sociale. Comme pour lattente, une le dutilisation
dnit comme attribut une zone dancrage dans laquelle doit se trouver un interac-
teur pour accomplir linteraction. De manire gnrale, un ensemble de fonctionnalits
sont aussi disponibles : position dutilisation libre ou non, temps moyen dutilisation
(calcul sur les deux dernires interactions).
Deux spcialisations sont proposes (Figure 3.7) :
Unique Un seul utilisateur est admis la fois. Ce type dutilisation peut tre associ
nimporte quel type dattente. Les trois exemples donns pour les les dattente
sont bass sur ce type dutilisation.
Multiple Plusieurs utilisateurs sont admis simultanment. Ce type dutilisation est g-
nralement associs aux objets observables tels quun tlviseur ou un tableau
gnral des dparts dans une gare. Le cas le plus courant dattente associ est
aucune, tant donn que lobjet peut forcment tre utilis directement.
FIG. 3.7: Diagramme de spcialisation des les dutilisation.
99
Les objets interactifs
3.2.7 La tche cognitive
Une tche cognitive reprsente un comportement relativement indpendant de linter-
acteur. Elle permet ainsi de contrler linteracteur, et donc lhumain virtuel, en organi-
sant le droulement de certaines procdures spcialises. A titre dexemple, lhumain
virtuel, que nous prsenterons dans le chapitre 5, dnit une tche cognitive interagir
qui pilote une interaction du dbut la n, que ce soit la recherche dun effecteur,
lattente, ou encore lexcution nale.
Le concept de tche cognitive propose deux fonctionnalits, qui devront tre spciali-
ses pour dnir des comportements :
Priorit Cette fonctionnalit dnit la priorit relative dune tche cognitive par rap-
port aux autres. Le choix dexprimer la priorit via une fonctionnalit plutt
quun attribut provient de son caractre fortement dynamique. Trois valeurs ty-
piques sont retenir :
< 0 Une tche cognitive priorit ngative est considre comme inactive,
et ne sera donc pas excute.
0 La priorit nulle correspond une tche paresseuse, qui sera toujours
excute en dernier.
in f ini Une priorit innie correspond une tche cruciale, qui sera toujours
excute en premier.
Excution Cette fonctionnalit est appele par linteracteur lorsque la priorit de la
tche cognitive le permet. Cest sa spcialisation qui permettra dorganiser des
comportements particuliers. La faon de spcialiser cette fonctionnalit est lais-
se totalement libre dans le modle, mais nous verrons par la suite que nous
utilisons gnralement des automates.
Notons ici que chaque tche cognitive doit grer son ventuelle concurrence vis--vis
des autres. Cette gestion se fait par la rservation de ressources disponibles dans lin-
teracteur. Ainsi, leur excution tant itrative, chaque tche tentera en premier lieu de
rserver les ressources qui lui sont ncessaires. En cas de succs, elle pourra poursuivre
son excution. En cas dchec, elle devra sarrter, lexcution passant alors la tche
suivante.
3.2.8 Conclusion
Nous avons prsent dans cette section lensemble des concepts ncessaires la gestion
de linteraction. Ceux-ci introduisent les notions de plus haut niveau de notre modle,
qui serviront de base llaboration des composants dune simulation. Le fonction-
nement des nouveaux objets interactifs sera alors implicitement rgit par les principes
exposs ici. Nanmoins, la gestion approfondie de linteraction na pas encore t abor-
de. Cest donc sur cette question que nous allons nous pencher dans les sections sui-
vantes.
3.3 Laffordance
Maintenant que nous avons dni lensemble des concepts ncessaires linteraction,
tudions plus particulirement la faon dont nous la spcions : laffordance.
100
Laffordance
3.3.1 Principe
Concept introduit par J.J. Gibson [43] (confre Section 2.1.2, page 58), laffordance est
une relation prsente implicitement dans le monde indiquant un interacteur la faon
dinteragir avec un effecteur. Ce principe est intgr dans notre modle sous la forme
dun objet BIIO, et tendu pour grer les implications de linteraction dans un plan
comportemental. Explicitons ses caractristiques.
Tout dabord, une affordance est dnie de manire globale, et non pas relativement
un effecteur ou un interacteur. Elle sera ensuite collecte automatiquement par ces
derniers, grce au principe dintrospection, an de participer au processus dinterac-
tion. Cette proprit a comme principal avantage de permettre une volution innie des
interactions simules sans pour autant avoir modier de quelque faon que ce soit
leurs intervenants.
An de permettre cette collecte, laffordance spcie ses intervenants potentiels sous
la forme de deux attributs : dnition des types dinteracteur et deffecteur les moins
spcialiss pouvant tre impliqus dans linteraction. Ainsi, grce au principe de hi-
rarchisation, toute spcialisation ventuelle de ces types dobjets pourra avoir accs
laffordance. Dautre part, le type dorganisation sociale pour une interaction est aussi
communiqu par laffordance. Ainsi, deux autres attributs dnissent les types de le
dattente et dutilisation mettre en uvre.
Finalement, le processus dinteraction est explicit sous la forme de cinq fonctionnali-
ts :
La pr-condition rationnelle.
La pr-condition locale.
La dure dinteraction.
Une procdure de contrle de lexcution de linteraction.
Une procdure de validation de linteraction.
Ces cinq fonctionnalits constituent la dnition mme de linteraction, que ce soit
ltat du monde ncessaire son accomplissement, la faon dagir sur celui-ci pour
lamener dans un tat propice, ou encore le droulement nal de linteraction et ses
consquences. Nous dtaillerons ces fonctionnalits dans la suite de cette section.
Notons pour nir que, grce au principe de hirarchisation, une spcialisation daffor-
dance peut rednir certains des attributs et fonctionnalits de ses parents. Cette possi-
bilit permettra entre autre de modier les intervenants possibles, ou les pr-requis et
consquences de linteraction.
3.3.2 Des concepts dinteraction hirarchiques
Comme nous lavons dit ci-dessus, le principe de hirarchisation de BIIO sert fa-
ciliter lextension du modle, mais peut aussi tre exploit an de dduire des liens
de dpendance conceptuelle. La hirarchisation des interactions va ainsi permettre une
hirarchisation du processus de raisonnement qui leur est associ.
En effet, lorsquune affordance est requise par un interacteur, nimporte laquelle de ses
spcialisations peut tre choisie et applique. De cette faon, il est possible de donner
comme but linteracteur une affordance peu spcialise, laissant son mcanisme
de slection daction la libert de choisir entre lensemble de ses spcialisations (ce
101
Les objets interactifs
mcanisme sera abord dans le modle dhumain virtuel, Section 5.3.2, page 148).
Une spcicit est considrer an dexploiter au mieux cette description hirar-
chique : les affordances instanciables ou non. Une affordance non instanciable ne peut
tre incarne dans lenvironnement, ne servant que de rfrence gnrale an de valider
sa hirarchie. Une affordance instanciable est quant elle reprsente dans lenviron-
nement, et peut tre accomplie par un interacteur. On peut ici faire le parallle entre un
but abstrait et un comportement physique observable. Par exemple, sur la Figure 3.8,
slectionner laffordance se rafrachir valide implicitement lensemble des affordances
reprsentes, tandis que slectionner utiliser un ventilateur ne donne accs qu cette
interaction particulire.
FIG. 3.8: Exemple de description hirarchique dune affordance : se rafra-
chir et boire sont deux affordances non instanciables, les trois autres
sont instanciables.
Une autre proprit exploite du principe de hirarchisation rside dans lunication
des comportements. Ainsi, il est possible de spcier des affordances simples pour
ensuite les unier en une affordance plus complexe, reprsentant le cumul de plusieurs
interactions. Par exemple, sur la Figure 3.9, linteraction se nourrir est spcialise en
deux affordances boire et manger, qui sont ensuite elles mme unies en faire un
repas, qui reprsente ainsi le cumul de ces deux spcialisations.
FIG. 3.9: Exemple dunication daffordances : se nourrir est spcialise en
boire et manger, qui sont elles mme unies en faire un repas.
Lavantage principal de cette exploitation de la hirarchisation rside encore une fois
dans lextensibilit du modle. En effet, il devient possible de faire voluer une pro-
cdure comportementale, et donc un enchanement dinteractions, en spcialisant les
affordances qui la composent. Ainsi, le schma gnral du processus reste inchang,
mais ses possibilits dexcution sont dcuples par la validation implicite des affor-
dances introduites.
102
Laffordance
3.3.3 Le rle comportemental de laffordance
Laffordance, en reprsentant les interactions disponibles dans lenvironnement, est au
cur du mcanisme comportemental que nous proposons. Nous allons voir quelle joue
un rle prpondrant dans le processus dcisionnel de nos agents autonomes. Ainsi,
elle va grer laccomplissement dune interaction particulire, mais aussi permettre de
linclure dans un schma gnral de raisonnement, et donc de dcrire lenchanement
logique permettant de rsoudre un but plus ou moins complexe. Ce mcanisme est
possible par la spcialisation des cinq fonctionnalits de laffordance, que nous allons
maintenant dtailler.
La pr-condition rationnelle
Cette fonctionnalit est seulement relative linteracteur qui cherche accomplir lin-
teraction. Son objectif est de valider laffordance compte tenu de ltat courant de cet
interacteur, et par extension de ses connaissances de lenvironnement. Pour se faire,
la pr-condition rationnelle teste les ressources de linteracteur ncessaires laffor-
dance, et propose en cas dchec des solutions pour amener cet interacteur dans un tat
favorable. Ces solutions peuvent tre de deux types :
Tches cognitives. Laffordance peut agir sur les tches cognitives de linteracteur (en
lancer, ou en stopper) si lchec est d un dfaut interne linteracteur.
Autres affordances. Laffordance peut agir sur dautres affordances (en lancer, ou en
stopper) si lchec est d un dfaut de linteracteur vis--vis de lenvironne-
ment.
La pr-condition rationnelle ne fait donc aucune rsolution rationnelle proprement
parler, mais se contente de suivre les restrictions dnies dans laffordance : si aucune
solution nest explicitement donne un chec, cette fonctionnalit se contente de blo-
quer linteraction, ne contenant pas elle mme de processus de rsolution automatique.
Nous nous plaons donc dans un processus de rsolution de type BDI (confre Sec-
tion 2.2.2, page 67), o le plan comportemental doit tre connu lavance. Par contre,
ce plan nest ici spci que localement, chaque interaction contenant seulement les
rsolutions des dfaillances qui lui sont propres. Bien entendu, lvaluation rationnelle
choue en premier lieu si linteracteur nest pas compatible avec laffordance.
Cette fonctionnalit soccupe aussi de maintenir ltat favorable de linteracteur. Ainsi,
elle doit vrier quaucune autre action entreprise par celui-ci ne va potentiellement
conduire un chec, et dans le cas contraire dsactiver ces tches.
On peut ici identier le problme de la concurrence, o deux affordances vont sin-
valider mutuellement pour un mme interacteur. Ce problme est implicitement vit
de part lexcution squentielle des interactions par linteracteur, naboutissant qu la
dsactivation des affordances les moins prioritaires. En effet, le dernier rle de la pr-
condition rationnelle est de signaler linteracteur la priorit de laffordance courante
en tenant compte de son tat interne. Nous reviendrons sur ce point dans le chapitre
consacr linteracteur, o la gestion des affordances est aborde.
Pour nir, remarquons que cette fonctionnalit peut dsactiver laffordance dans le
cas o ltat de linteracteur ne la ncessite plus. Ce cas intervient si lvolution de
lenvironnement, ou de linteracteur, valide le but mme de linteraction, ou invalide
toute possibilit de rsolution de celle-ci. Par exemple, pour une interaction composter
103
Les objets interactifs
un ticket de train, la pr-condition rationnelle terminera automatiquement linteraction
dans le cas o lheure de dpart est dpasse.
Pour conclure, cette fonctionnalit correspond la phase abstraite du processus de d-
cision dun individu. Elle induit le schma rationnel enchanant les interactions, avec
une approche de haut en bas : laffordance correspondant au but nal est lance, d-
clenche ventuellement dautres interactions ncessaires, qui peuvent ensuite faire de
mme, et ainsi de suite. Au nal, un graphe comportemental est obtenu dont seules
les feuilles constituent les interactions actives un moment donn. Par exemple, sur la
Figure 3.10, laffordance nale boire se termine si linteracteur na plus soif, ou lance
laffordance acheter boire sil na rien boire ; cette dernire sassure son tour
dobtenir assez dargent pour effectuer lachat. Nous reviendrons sur la gestion de ce
graphe rationnel dans la section 3.4 consacre linteracteur.
FIG. 3.10: Exemple denchanement rationnel daffordances : le but nal,
boire, peut dclencher une autre affordance pour combler lab-
sence dune ressource lui tant ncessaire.
La pr-condition locale
Cette fonctionnalit, cette fois-ci dpendante la fois de linteracteur et de leffecteur
slectionn, valide linteraction vis--vis de ltat de leffecteur. Pour se faire, la pr-
condition locale procde de la mme faon que la pr-condition rationnelle, mais en
se concentrant cette fois-ci sur leffecteur. En cas dchec, les mmes types de solu-
tions que prcdemment sont possibles : lancement et/ou arrt de tches cognitives et
daffordances chez linteracteur. Comme pour lautre pr-condition, celle-ci choue au-
tomatiquement si linteracteur ou leffecteur ne sont pas compatibles avec laffordance.
Cette fonctionnalit correspond donc la phase incarne du processus de dcision dun
individu. Un exemple de pr-condition locale serait le test de ltat de marche dun
quipement lectrique en vue de son utilisation, ou encore, pour reprendre le cas de
lascenseur, le test douverture des portes pour y entrer, dclenchant laffordance ap-
peler lascenseur en cas dchec.
valuation de la dure dinteraction
Cette fonctionnalit est la premire des trois grant le droulement de linteraction.
Les deux pr-conditions sont maintenant forcment valides. Lvaluation de la dure
dinteraction, sensible linteracteur et leffecteur, signale le temps total ncessaire
linteraction, un temps nul signiant que linteraction est immdiate. Contrairement
104
Laffordance
aux autres fonctionnalits, celle-ci ne peut en aucun cas agir sur les affordances ou les
tches cognitives de linteracteur, nayant quun rle informatif.
Le contrle dexcution de linteraction
Cette fonctionnalit contrle linteraction durant son excution. Relatif aux deux inter-
venants, ce contrle est capable de modier leur tat interne, que ce soit les ressources
(cration, transfert, consommation), ou encore les tches cognitives et affordances de
linteracteur. Ce contrle est appel par linteracteur une fois par seconde durant lin-
teraction, permettant de piloter ses tches plus ractives. Lutilisation typique de cette
fonctionnalit serait pour grer nement linteraction, par exemple la manipulation du
terminal lors de lutilisation dun guichet automatique, ou encore la gestion du regard
lors de la lecture dun panneau dinformation.
La validation de linteraction
Cette fonctionnalit est la dernire tre appele pour une affordance. Relative lin-
teracteur et leffecteur, la validation de linteraction intervient la n de la dure prvue
an de terminer lopration en cours. Elle peut ainsi modier les tats internes des deux
intervenants, an de symboliser les consquences de linteraction.
Dautre part, cette fonctionnalit se charge de supprimer laffordance chez linteracteur
dans le cas o elle nest plus ncessaire. En effet, certaines interactions peuvent avoir un
fonctionnement rptitif, ou incomplet, mme si lensemble des fonctionnalits ont t
couronnes de succs. Par exemple, la lecture dun tableau gnral des dparts dans une
gare peut ne pas rcuprer les informations ncessaires un voyageur, tout simplement
parce quelles ne sont pas encore afches ; dans ce cas, linteraction sexcute pendant
la dure prvue, symbolisant la recherche de linformation, mais une fois termine ne
se dsabonne pas des affordances actives de linteracteur ; ainsi, son excution recom-
mencera jusqu lobtention de linformation recherche, aprs quoi le dsabonnement
sera effectu.
3.3.4 Conclusion
Le concept daffordance est crucial dans notre modle dobjets interactifs. Il permet
la fois de dcrire les interactions prsentes dans le monde, mais aussi de dterminer
comment les raliser. Ce concept dnit aussi implicitement un processus de raisonne-
ment orient but, avec une approche de haut en bas. Cette approche prsente lavantage
certain de simplier lextrme le droulement logique dune tche complexe. En ef-
fet, il suft que linteracteur active une interaction, aussi complexe soit-elle, pour que le
schma logique denchanement se mette en place par le jeu des pr-conditions ration-
nelles. Ainsi, le modle dcisionnel tant totalement dcorrl du modle dinteracteur,
la varit des interactions quil est capable de grer est augmentable sans avoir mo-
dier son principe de fonctionnement.
105
Les objets interactifs
3.4 Linteracteur
Les interactions dnies, nous pouvons maintenant nous attacher la description de
lobjet BIIO qui va les raliser : linteracteur.
3.4.1 Principe
Comme nous lavons vu dans la section 3.2.3, page 96, linteracteur est un objet phy-
sique spcialis (Figure 3.11). A ce titre, il dispose donc de lintgralit de ses propri-
ts, que ce soit la golocalisation ou la gestion des ressources. Viennent sajouter cela
des constituants spciques.
FIG. 3.11: Linteracteur comme spcialisation de lobjet physique dans lar-
chitecture BIIO.
Premirement, linteracteur dispose de fonctionnalits pour un accs ais aux affor-
dances dnies dans le monde. Cet ensemble de fonctionnalits est capable, grce au
principe dintrospection, de collecter dynamiquement lensemble des affordances com-
patible avec linteracteur, tout en tenant compte de son ventuelle spcialisation. Ainsi,
des processus lis linteracteur, tels que les tches cognitives, peuvent connatre sans
aucun a priori les affordances disponibles dans lenvironnement. Actuellement peu uti-
lises dans notre modle, ces fonctionnalits forment une base pour lintroduction fu-
ture de processus dapprentissage, permettant de limiter le savoir-faire des interacteurs.
Toujours concernant les affordances, linteracteur comporte un gestionnaire permettant
dorganiser rationnellement leur excution. Comme nous allons le voir, ce gestionnaire
gre la pr-condition rationnelles des affordances, leur priorit, et ainsi leur concur-
rence, mais aussi leur dsactivation provisoire.
Une autre srie de fonctionnalits se charge cette fois-ci de la gestion des tches cog-
nitives de linteracteur. Celles-ci peuvent tre vues comme des processus de raisonne-
ment atomiques, ne soccupant que dune tche particulire. Sur le mme principe que
le gestionnaire daffordances, cet ensemble de fonctionnalits organise automatique-
ment lexcution de ces tches.
Notons que linteracteur que nous dcrivons ici, bien que proposant des fonctionnalits
totalement oprationnelles, ne constitue quune base devant tre nouveau spciali-
se pour devenir pleinement fonctionnelle. Nous verrons lune de ces spcialisations,
lhumain virtuel, dans le chapitre 5.
106
Linteracteur
3.4.2 Le gestionnaire daffordances
Le gestionnaire daffordances constitue chez linteracteur le centre logique du raison-
nement associ linteraction. Lui mme un objet BIIO, ce gestionnaire est un conte-
neur daffordances disposant de fonctionnalits permettant de les manipuler et den
automatiser le fonctionnement.
Catgorisation des affordances
Tout dabord, le gestionnaire daffordances les classie en deux catgories :
Inactive Les affordances inactives, bien que ncessaires linteracteur, sont en attente.
Une affordance peut choisir delle mme de passer dans ce mode dcision
prise par lune de ses fonctionnalits ou tre automatiquement dsactive par
le gestionnaire.
Active Les affordances actives sont aptes tre excutes par linteracteur. Ce mode
est assign par dfaut lors de la premire slection dune affordance.
Ainsi, linteracteur, et donc son ensemble de processus, peut connatre tout moment
ses affordances et leur tat.
Une excution hirarchique
Ensuite, un ensemble de fonctionnalits permettent lorganisation hirarchique de lex-
cution des affordances. Cette organisation, introduite par la pr-condition rationnelle
(Section 3.3.3, page 103), peut aussi bien rsulter de la pr-condition locale ou des
deux fonctionnalits de contrle. Pour obtenir une excution hirarchique, le gestion-
naire est capable de lancer des affordances lles pour dautres affordances, et ensuite de
renseigner tout processus sur la hirarchie obtenue. Bien entendu, le gestionnaire gre
le partage des affordances : si une mme affordance est la lle de plusieurs autres, elle
ne sera prsente quune seule fois dans le gestionnaire mais aura autant daffordances
parentes, produisant ainsi un graphe comportemental. Dans ce graphe, une affordance
peut avoir cinq tats :
Feuille Une affordance feuille na aucune affordance lle. Elle constitue une tape
immdiate du comportement dinteraction.
Nud Une affordance est dans cet tat si elle se situe lintrieur du graphe com-
portemental, i.e. si elle dispose daffordances lles et parentes. Elle constitue un
point de passage ultrieur du comportement dinteraction.
Racine Une affordance racine a t explicitement active par linteracteur. Elle consti-
tue un point de dpart du raisonnement concernant linteraction. Cet tat est non
exclusif, pouvant tre cumul avec lun des deux autres :
Racine/Nud Laffordance est explicitement requise par linteracteur, mais aussi
par une autre affordance en cours dexcution.
Racine/Feuille Laffordance est autonome, soit rationnellement valide sans n-
cessiter lexcution dune tierce interaction (et donc active), soit non so-
luble suivant ltat courant du monde (et donc inactive).
Lensemble de ces tats implique que le raisonnement de linteraction ne se prsente
non pas sous la forme dun seul graphe comportemental, mais par autant de graphes
107
Les objets interactifs
quil y a daffordances racines. Ces graphes sont ensuite unis automatiquement lors-
quils contiennent une affordance (feuille ou nud) commune.
La transition entre les tats feuille et nud est gre de faon particulire par le ges-
tionnaire :
Feuille Nud Ce changement dtat intervient lorsquune affordance ncessite lex-
cution dune autre affordance. Dans ce cas, le lancement de laffordance lle pro-
voque la dsactivation automatique de laffordance parente par le gestionnaire.
Nud Feuille Cette transition se produit lorsque toutes les lles dune affordance
se sont termines. Dans ce cas, le gestionnaire teste la pr-condition rationnelle
de laffordance et la ractive en cas de succs. Notons quun tel test est auto-
matiquement effectu chaque fois quune affordance lle se termine, mais ne
provoquera une potentielle ractivation que lorsque laffordance teste na plus
aucune lle. En effet, ce test systmatique est ncessaire an de garantir la rac-
tivit du processus de raisonnement.
On observe ainsi quune affordance nud est forcment inactive, alors quune affor-
dance feuille peut appartenir lune des deux catgories. En effet, le test de la pr-
condition rationnelle dtermine pour une affordance feuille sa catgorie : active en cas
de succs, inactive dans le cas contraire. Ainsi, une affordance peut tre en attente sans
pour autant proposer de solution (sous la forme dune affordance lle) permettant son
excution.
Pour conclure sur la hirarchisation de lexcution des affordances, signalons que les
oprateurs denchanement y sont implicitement grs :
ET Cette opration signie quun ensemble dinteractions doivent tre excutes dans
nimporte quel ordre. Loprateur est gr par le lancement simultan de len-
semble des affordances lles, qui seront toutes menes terme.
OU Cette opration signie quune seule interaction doit seffectuer parmi un en-
semble de possibilits. Loprateur est lui aussi gr par le lancement simultan
de lensemble des affordances lles, qui seront ensuite toutes stoppes par la pr-
condition rationnelle de laffordance parente lorsque lune dentre elles arrive
son terme.
PUIS Cette opration signie que plusieurs interactions doivent sexcuter dans un
ordre dtermin. Loprateur est gr grce lorganisation hirarchique, o la
dernire interaction est une racine tandis que la premire est une feuille.
Bien entendu, la combinaison de ces oprateurs est possible. On peut ici observer que
les enchanements ne sont pas exprims par une smantique particulire du gestionnaire
daffordances, mais indpendamment exploitables lors de la cration dune affordance,
via la spcialisation de la pr-condition rationnelle. Cette caractristique permet encore
une fois lextensibilit du modle dinteractions sans aucune modication du modle
dinteracteur, ni du gestionnaire daffordances.
Gestion de la concurrence
Le dernier point trait par le gestionnaire permettra deffectuer un choix lors de lex-
cution des interactions. En effet, le gestionnaire contient potentiellement autant daffor-
dances actives que de feuilles dans son organisation hirarchique, ncessitant donc une
mthode permettant de les ordonner et ventuellement de les dpartager. Cette mthode
108
Linteracteur
prend la forme dune gestion par priorits. Deux catgories de priorits sont accessibles
pour une affordance :
Locale Cette priorit P
L
est dnie par laffordance lors de lexcution de nimporte
laquelle de ses fonctionnalits (si ce nest lvaluation de la dure dinteraction).
Le gestionnaire affecte localement cette priorit une affordance, et ne la modi-
era daucune faon.
Hirarchique Cette priorit P
H
est automatiquement calcule par le gestionnaire pour
chaque affordance, et ne peut tre directement modie par un processus externe.
Son calcul se base sur les priorits locales de la hirarchie dune affordance de
rfrence.
Ainsi, le gestionnaire est renseign par les priorits locales et produit les priorits
hirarchiques. Ces priorits hirarchiques ont pour but de dpartager les affordances
feuilles actives.
Leur mode de calcul est dtaill dans lannexe A, page 241. Pour en synthtiser lobjec-
tif, ce calcul permet dobtenir une priorit proportionnelle limportance dune inter-
action dans le schma comportemental global de linteracteur. Cette priorit sera donc
dautant plus forte que linteraction participe de multiples plans comportementaux,
et que le but nal quelle permet datteindre est important.
Les priorits obtenues sont utilises par des fonctionnalits proposes par le gestion-
naire. Tout dabord, deux fonctionnalits les exploitent an dordonner respectivement
les affordances actives et inactives par priorit dcroissante. Ensuite, deux autres fonc-
tionnalits exploitent ces ordonnancements an de tester les pr-conditions rationnelles
des deux catgories daffordances, ractivant les affordances feuilles en cas de succs
ou les dsactivant en cas dchec. Ce test rationnel a aussi pour but de maintenir un
certain niveau de ractivit dans le processus de raisonnement : la pr-condition ra-
tionnelle pourra ainsi changer la priorit locale de laffordance, lancer ou stopper des
affordances lles, ou encore terminer laffordance courante.
3.4.3 Gestion des tches cognitives
Les tches cognitives reprsentent des processus de raisonnement atomiques de linter-
acteur. Leur rle principal est de fournir un certain niveau dabstraction au raisonne-
ment an de piloter les comportements plus ractifs. Elles sont donc intimement lies
lincarnation de cet interacteur, et ne peuvent pas tre spcies ce niveau conceptuel
(nous dcrirons des tches cognitives pour lhumain virtuel, Section 5.5, page 180).
Nanmoins, leur gestion gnrique peut tre propose, en se basant sur les fonctionna-
lits qui les constituent (confre Section 3.2.7, page 100).
Tout dabord, des fonctionnalits permettent le rfrencement de tches cognitives :
ajout et retrait, ainsi que recherche. La recherche dune tche peut se faire grce
son nom et/ou son type de spcialisation. Notons ici que seul le nom des tches est
contraint de par son unicit pour un interacteur donn, plusieurs tches du mme type
pouvant tre prsentes. Ces fonctionnalits sont accessibles par tous les processus de
linteracteur nimporte quel instant, dont notamment les affordances et les tches
cognitives elles-mmes.
Ensuite, une fonctionnalit permet la gestion de la concurrence entre tches cognitives
suivant le mme principe que le gestionnaire daffordances. Premirement, les tches
109
Les objets interactifs
cognitives sont ordonnes par priorit dcroissante. Cet ordonnancement procde si-
multanment au ltrage des tches dont la priorit est ngative, ces dernires tant tout
simplement ignores (Figure 3.12). Deuximement, la fonctionnalit procde lex-
cution des tches cognitives dans lordre dtermin prcdemment. Cette excution
itrative permet de grer la concurrence par la rservation de ressources exclusives ou
partages dans les tches cognitives spcialises.
Type Nom Priorit
Interagir A 12
Patienter B 0
Discuter C 6.1
Interagir D -1
Attirer lattention E inni
Ordonnancement
E
A
C
B
FIG. 3.12: Exemple dordonnancement de tches cognitives. A gauche, une
liste de tches contenues par linteracteur (la priorit est value
dynamiquement, lordre dans la liste correspond lordre dappa-
rition). A droite, la liste ordonne obtenue.
Nous verrons, lors des spcialisations pour lhumanode, que ce simple principe dex-
cution permet la gestion dun grand panel de comportements. Encore une fois, cette
gestion tant totalement gnrique, laspect cognitif de notre interacteur peut tre tendu
sans avoir modier son modle.
3.4.4 Conclusion
Linteracteur est lobjet physique qui ralise des interactions. Nous avons prsent len-
semble des processus gnriques dont il dispose an de grer cette interaction, et de
linclure dans un processus de dcision. Nanmoins, ce modle ncessite une nouvelle
spcialisation avant de devenir pleinement fonctionnel. En effet, linteracteur ne d-
crit que des mcanismes de haut niveau, devant tre coupls des tches plus ractives
(comme la navigation) an den faire un agent autonome. Nous reviendrons sur ce cou-
plage dans le chapitre consacr lhumain virtuel, qui incarnera cet interacteur dans
nos simulations. Nous verrons cette occasion que le modle dinteracteur est facile-
ment augmentable, grce son principe de fonctionnement nutilisant que des concepts
non spcialiss.
3.5 Leffecteur
Leffecteur est la spcialisation de lobjet physique complmentaire linteracteur. Il
propose les interactions ce dernier, tout en soccupant de grer lorganisation sociale
quelles ncessitent (pour lattente et lutilisation).
3.5.1 Principe
En tant que spcialisation du concept dobjet physique, leffecteur dispose de toutes ses
fonctionnalits : golocalisation, gestion des ressources, et automatisation (Figure 3.11).
110
Leffecteur
FIG. 3.13: Leffecteur comme spcialisation de lobjet physique dans lar-
chitecture BIIO.
Notons que le concept deffecteur peut tre utilis pour dnir un quipement mais
peut aussi reprsenter tout autre diffuseur dinteraction. Ainsi, il est possible dunier
un interacteur et un effecteur an de proposer des interactions sociales, telles que de-
mander son chemin, ou encore de spcialiser un effecteur pour symboliser un objet
interactif purement virtuel, tel quun dcor imaginaire dans le cadre dun spectacle de
rue.
Dans notre modle, leffecteur est passif dans linteraction, il se contente de diffuser de
linformation, tandis que linteracteur est actif, et utilise donc cette information pour
piloter linteraction. Malgr tout, leffecteur dispose dun certain nombre de fonction-
nalits permettant lorganisation de linteraction par linteracteur.
Ainsi, le premier ensemble de fonctionnalits de leffecteur consiste collecter ses
affordances compatibles dans le monde, suivant le mme principe que linteracteur. Le
but est de centraliser cette information pour faciliter son utilisation.
Un second ensemble de fonctionnalits utilise la collection daffordances an de connatre
les les dattente et dutilisation mettre en uvre. Comme nous le verrons, ces fonc-
tionnalits permettent de rendre leffecteur rellement utilisable par linteracteur.
Enn, une fonctionnalit permet leffecteur de signaler une affordance spontane
un interacteur. Cette fonctionnalit permettra de grer les interactions implicites dans
lenvironnement, i.e. non dsires par linteracteur mais induites par son comporte-
ment. Un exemple type est le cas de lascenseur, pour lequel une interaction spontane
est produite lorsquun individu se rend dun tage lautre.
3.5.2 Gestion des les dattente et dutilisation
Comme nous lavons voqu dans son principe de fonctionnement, leffecteur dispose
de fonctionnalits lui permettant de collecter ses affordances compatibles. Cette collec-
tion daffordances est ensuite exploite an de proposer automatiquement des objets
BIIO reprsentant les organisations sociales lors de linteraction.
Ainsi, la fonctionnalit dcrite ici cre les objets le dattente et dutilisation nces-
saires aux affordances. Pour se faire, elle parcourt la collection daffordances compa-
tibles avec le type deffecteur courant (le type le plus spcialis, disponible grce au
principe dintrospection). Cette fonctionnalit associe ensuite une instance de le dat-
tente et de le dutilisation chaque affordance valide. Les types de spcialisation pour
chacune des les crer sont directement rcuprs dans les attributs correspondant de
laffordance. Notons que si plusieurs affordances utilisent le mme type de le, alors
linstance cre est partage.
111
Les objets interactifs
Une fois cette fonctionnalit active, leffecteur courant dispose donc dune base de
donnes associant chaque affordance compatible une le dattente et une le dutili-
sation. Plusieurs fonctionnalits permettent ensuite daccder cette base de donnes,
soit pour rcuprer les instances de le correspondant une affordance donne, soit
pour la mettre jour dans le cas de lintroduction dune nouvelle affordance.
Encore une fois, toujours par lexploitation du principe dintrospection, cette fonction-
nalit gnrique permet lvolution du modle par lintroduction a posteriori de nou-
velles affordances. Ce potentiel dvolution ne ncessite alors aucune spcialisation de
leffecteur, mais seulement un appel la fonctionnalit de mise jour.
Une dernire fonctionnalit soccupe automatiquement de la mise jour frquentielle
des les dattentes dsorganises (les spcialisations du concept de le dattente plus
prs) disponibles au sein de leffecteur. Ce rafrachissement seffectue une fois par
seconde, par utilisation du principe dautomatisation.
3.5.3 Laffordance spontane
Nous avons pour le moment vu un ensemble de concepts permettant la gestion de com-
portements dinteraction orients but. La spcicit du comportement orient but est
quil sous-entend une prise de dcision par linteracteur : un comportement ne sera
activ que sil a t choisi.
Nanmoins, certains comportements dinteraction ne rpondent que partiellement ce
pr-requis, car ce sont des comportements mergeants dune situation particulire. Par
exemple, linteraction vue prcdemment de prendre lascenseur ne rete pas un but
en soi pour un humanode, mais peut merger du fait que lhumanode doive se rendre
un autre tage pour acheter un billet de train par exemple. Ainsi, le premier com-
portement ne peut entrer dans le schma logique denchanement des interactions du
deuxime, mais doit tout de mme tre activ lorsque des situations environnementales
le ncessitent.
Cest ce besoin que rpond la fonctionnalit daffordance spontane. Celle-ci est
capable, pour un interacteur donn, de renvoyer une ventuelle affordance activer
par dfaut pour leffecteur. Comme nous le verrons concernant lhumanode, le cadre
typique dutilisation de cette affordance concerne les objets traversables de lenviron-
nement : escaliers, ascenseurs, escalators, ou autres tapis roulants. Ainsi, chaque fois
que lhumanode rencontrera un de ces objets sur sa route, il pourra activer laffordance
spontane lui correspondant an de lutiliser.
Bien entendu, laffordance renvoye par cette fonctionnalit est dnie suivant le mme
principe que nimporte quelle affordance, et dispose donc des mmes capacits : spcia-
lisation, organisation hirarchique, etc. De plus, comme la fonctionnalit daffordance
spontane a accs linteracteur courant, elle peut choisir diffrentes affordances sui-
vant le type de spcialisation de cet interacteur. Enn, notons que cette fonctionnalit
peut ne renvoyer aucune affordance, signiant que lobjet ne comporte aucun compor-
tement spontan, ce dernier cas tant le fonctionnement par dfaut des effecteurs.
112
Conclusion et discussion
3.5.4 Conclusion
Leffecteur est lobjet physique qui situe linteraction dans lespace. Il dispose de m-
canismes gnriques permettant de proposer cette interaction aux interacteurs, et gre
ce titre les les dattente et dutilisation des affordances qui lui sont compatibles.
Leffecteur dispose aussi dun mcanisme daffordance spontane, indiquant aux in-
teracteurs une faon de lutiliser automatiquement. Lensemble de ces fonctionnalits
se basent sur des concepts de haut niveau, permettant leffecteur dtre facilement
spcialis. Il pourra ainsi tre utilis pour reprsenter des quipements immobiles, ou
encore tre uni avec un interacteur an de symboliser des individus proposant et
ralisant des interactions.
3.6 Conclusion et discussion
Nous avons propos avec BIIO un modle permettant la gestion des objets interactifs
dun point de vue comportemental. Les deux caractristiques principales de ce modle
sont sa gnricit et, ce qui peut paratre contradictoire, sa spcialisation la gestion
de linteraction.
Ces deux caractristiques font de ce modle un outil permettant la mise en uvre ai-
se et rapide de principes thoriques rattachs aux comportements dinteraction. Une
autre approche comportementale, base sur les thories cognitives, est aussi introduite
dans ce modle. Cette approche ne dnit plus, comme pour linteraction, une rela-
tion comportementale entre deux entits, mais un comportement interne une seule
entit. Nous avons ainsi introduit le concept de tche cognitive associe un interac-
teur, ne disposant quant elle que de peu de fonctionnalits gnriques. Deux raisons
ont principalement motiv cette restriction. Premirement, le cadre de notre tude est
essentiellement ax sur linteraction dans des lieux dchanges, pour laquelle le com-
portement cognitif nest pas primordial. Deuximement, le comportement cognitif est
fondamentalement li lentit, de par lapprhension de ses propres capacits, rendant
ce processus difcilement gnralisable. Ainsi, il nous a paru prfrable de ne proposer
que trs globalement un cadre ce principe comportemental, via lordonnancement des
tches cognitives, an de contraindre au minimum ses possibilits dextension (dont
nous verrons un exemple avec lhumanode virtuel).
Pour conclure, nous proposons avec BIIO un modle dobjets interactifs spcialis pour
notre cadre dtude, et fortement ouvert vers des sujets connexes. Celui-ci pose les
bases de la gestion comportementale avec linteraction, tout en restant sufsamment
gnrique sur les points quil naborde pas directement. Il permet une individualisation
de linteraction, les affordances tant lies un type dinteracteur et deffecteur.
113
Chapitre 4
Lenvironnement virtuel
Maintenant que nous avons dni les concepts de linteraction, attachons nous la
manire de localiser un agent et de situer son raisonnement. Pour se faire, nous allons
dcrire le support de la simulation : lenvironnement virtuel.
En effet, lenvironnement virtuel est au centre de notre problmatique. Il se doit dtre
aussi proche de la ralit que possible, et doit permettre lextraction de donnes non
seulement pour le droulement de la simulation, en vue dune utilisation par les agents
autonomes, mais aussi pour ltude a posteriori, en vue de la caractrisation des rsul-
tats. Ainsi, il va intgrer lensemble des informations ncessaires la prise de dcision
de nos agents autonomes, que ce soit la gomtrie et la topologie des lieux, ou en-
core lemplacement des diffrents quipements. Lenvironnement va de plus fournir un
accs ais et rapide un ensemble de donnes, tels que les ux de personnes ou la
caractrisation des espaces visibles.
Nous allons donc prsenter, section 4.1, la faon dont nous organisons les donnes
topologiques pour permettre une navigation optimale des entits. Nous continuerons,
section 4.2, avec lensemble des informations proposes directement par lenvironne-
ment, soit sous la forme de pr-calculs pour les donnes statiques, soit via des fonc-
tionnalits pour les donnes dynamiques. Nous nirons, section 4.3, par la prsentation
de la mise en uvre propose pour lier linteraction conceptuelle, vue dans le chapitre
prcdent, avec lenvironnement, an dobtenir une description de linteraction situe.
4.1 La reprsentation topologique
Le premier pas concernant la description dun environnement concerne la faon de re-
prsenter dorganiser sa topologie. Nous voulons ainsi tre capable de caractriser
les zones navigables et leurs antagonistes, les obstacles, ainsi que dassocier une pre-
mire smantique cette topologie en linformant avec la typologie des zones extraites.
Cette description est fondamentale, dnissant le canevas de la simulation, et posant
donc les premires contraintes de son excution, que ce soit en termes de performance
ou de ralisme. Les travaux dcrits ici ont t publis dans S. Paris et al. [99, 100].
115
Lenvironnement virtuel
4.1.1 Subdivision spatiale informe
Nous nous basons pour cette reprsentation topologique sur lalgorithme de subdivi-
sion de F. Lamarche [70], produisant des cellules convexes par une triangulation de
Delaunay ltre. Comme nous lavons remarqu au cours de ltat de lart, une telle
reprsentation reproduit exactement lenvironnement.
Pour rsumer son fonctionnement, un triangle englobant la scne est dni, qui repr-
sentera les limites de lenvironnement simul (Figure 4.1(a)). La subdivision est ensuite
effectue, en tenant compte des segments dnissant les murs (que nous nommerons
bordures rigides), produisant des cellules convexes en crant des bordures franchis-
sables (Figure 4.1(b)).
(a) Triangle englobant. (b) Dcomposition en cellules.
FIG. 4.1: Subdivision spatiale pralable labstraction.
Un graphe est extrait depuis cette subdivision, dont les nuds reprsentent les cellules
obtenues et dont les arcs reprsentent leurs relations de voisinage (Figure 4.2). Notons
que seules les cellules navigables sont extraites de la subdivision, le dcoupage interne
aux obstacles ntant pas ncessaire pour les dplacements dentits. Chaque nud du
graphe est typ suivant son degr de connexit c, avec une dnomination classique :
cul de sac (c = 1), couloir (c = 2), et carrefour (c 3). Une autre information est
aussi ajoute pour les cellules dont lun des sommets appartient au triangle englobant :
ces cellules sont dnommes virtuelles, signiant quelles ne correspondent pas lin-
trieur de lenvironnement simul, mais lextrieur. Pour nir, toute cellule qui est
la fois connexe une cellule virtuelle et une cellule non virtuelle est dnomme
entre/sortie.
Comme nous lavons remarqu lors de la prsentation de la subdivision dans ltat de
lart, et comme en atteste le cas relativement simple donn en exemple, ce premier
dcoupage produit normment de cellules, dpassant rapidement le millier. Principa-
lement pour des raisons de rapidit de calcul, mais aussi pour une question de facilit
dexploitation, il nest pas envisageable dexploiter directement ce graphe de subdivi-
sion. Nous devons alors proposer un processus complmentaire permettant une simpli-
cation des donnes topologiques manipules.
116
La reprsentation topologique
FIG. 4.2: Graphe topologique extrait de la subdivision.
4.1.2 Labstraction topologique
Labstraction topologique va permettre de condenser linformation concernant les zones
navigables de lenvironnement. Son but est donc double : rduire le nombre dlments
ncessaires pour dcrire lenvironnement, et proposer une dnition plus conceptuelle
et intuitive des zones navigables. Leffet recherch est ainsi de sloigner de la d-
nition gomtrique fournie la base, pour se rapprocher dune dnition plus proc-
durale, tout en cherchant conserver les informations essentielles. Nous allons nous
attacher ici la mthode permettant le regroupement, et laisserons les techniques de
conservation de linformation pour la section suivante.
Le principe de labstraction topologique est issu des thories psychologiques relatives
la reprsentation mentale de lenvironnement (confre Section 1.1.1, page 10). Nous
ne nous dirigeons nanmoins pas vers des mcanismes de cartes cognitives, celles-ci
devant tre individuelles, ce qui nest pas ralisable si lon considre un trs grand
nombre dagents autonomes. Nous proposons plutt une reprsentation commune
lensemble des entits simules.
Labstraction propose est fonde sur un mcanisme de regroupements successifs. Un
nouveau graphe est construit dont les nuds vont correspondre un sous-ensemble du
graphe source, produisant ainsi un graphe hirarchique de plus en plus abstrait. An de
permettre lexploitation de ce graphe hirarchique, son parcours transversal est permis :
chaque lment de base connat son quivalent abstrait, et inversement.
Nous limitons volontairement le nombre de graphes abstraits, principalement pour
deux raisons. Premirement, il faut garder lesprit que quelque soit le nombre et
la qualit des abstractions, les informations gomtriques contenues dans la subdivi-
sion spatiale seront toujours ncessaires lors de la navigation des entits. Ainsi, lex-
ploitation de ce graphe devra forcment effectuer sa traverse jusquau niveau le plus
bas pour en extraire les informations souhaites. Bien entendu, le cot de cette tra-
verse est directement proportionnel au nombre de couches composant le graphe hi-
rarchique. Deuximement, et cest sans doute lexplication la plus importante, lex-
pressivit du graphe diminue chaque abstraction. Par expressivit nous entendons la
capacit de discrimination que pourrait avoir un algorithme de parcours lors de la tra-
verse dune couche du graphe (pour de la planication de chemin par exemple). Ainsi,
si lon pousse trop loin labstraction, il se produira invitablement un moment o deux
couches successives seront identiques.
Nous avons ainsi choisi de ne proposer que deux niveaux dabstraction depuis le graphe
de subdivision, produisant un graphe hirarchique trois couches. Nous motiverons ce
117
Lenvironnement virtuel
choix dans la description de chacune des couches.
Premier niveau dabstraction
Le premier niveau dabstraction a pour but principal de ltrer le dcoupage obtenu
lors de la subdivision. En effet, la triangulation de Delaunay est une mthode trs sen-
sible aux alas gomtriques, tels que les courbes et autres dfauts dalignements (Fi-
gure 4.3). Ainsi, lorsque ce cas se prsente, un trs grand nombre de cellules sont
produites, augmentant dautant la complexit dexploitation du graphe rsultant.
(a) Couloirs courbes. (b) Petits dfauts dalignement.
FIG. 4.3: Alas gomtriques se rpercutant sur la subdivision. Pour chaque
gure, gauche la subdivision spatiale, droite le graphe obtenu.
Lobjectif est donc ici dextraire des groupes de cellules pouvant tre assimils une
smantique unique. Pour se faire, nous utilisons un algorithme de regroupement bas
sur deux heuristiques :
Conservation de la convexit. La premire heuristique va chercher conserver au
maximum laspect convexe des groupes obtenus. Cela a pour but principal de
conserver les proprits de visibilit obtenues par la triangulation de Delaunay,
mais aussi de conserver les espaces reprsentant les goulets dtranglement. Bien
sr, cette convexit ne peut tre entirement conserve, sous peine de bloquer
le regroupement trop rapidement, mais sera dgrade au minimum. Pour con-
gurer le niveau de dgradation, cette heuristique est sensible un paramtre k
(0 <k <1), o la valeur 1 correspond la conservation maximale de la convexit,
et 0 signie que la convexit nest plus maintenir. Pour valuer le niveau de
convexit, nous nous basons sur le facteur de couverture de la bote englobante
oriente (BEO) du groupe plutt que directement sur la surface de lenveloppe
convexe, an dobtenir des groupes la gomtrie la plus simple possible. Le
facteur de couverture FC dun groupe G est calcul comme suit :
FC(G) =
surface de G
surface de BEO(G)
avec 0 < FC(G) 1
Maximisation des carrefours. Cette deuxime heuristique restreint les possibilits de
voisinage dun groupe, pour maximiser le ratio de nuds de type carrefour. Les
rgles topologiques suivantes sont appliques :
1. Un carrefour ne peut pas tre voisin dun autre carrefour ;
2. Un couloir ne peut tre voisin que de nuds de type carrefour ;
3. Un cul de sac ne peut tre voisin que dun nud de type carrefour.
Lintrt de maximiser les carrefours est que ce sont les seuls nuds ncessi-
tant une prise de dcision lors du parcours du graphe, pour choisir vers quel
voisin se diriger. Les nuds dun autre type peuvent quant eux tre traverss
118
La reprsentation topologique
trivialement, les couloirs menant leur autre voisin et les culs de sac arrtant le
parcours. Ainsi, le fait daugmenter la proportion de carrefours aura pour effet
de maximiser le nombre de prises de dcisions relativement au nombre de nuds
parcourus, et donc rduira le temps dvaluation pass effectuer des oprations
non discriminantes.
Comme lon peut intuitivement sen douter, ces deux heuristiques sont concurrentes.
Nous grons cette concurrence en appliquant en premier lheuristique portant sur la
convexit, puis en appliquant la deuxime heuristique, qui pourra ventuellement fu-
sionner les groupes obtenus. Ainsi, nous assurons que les rgles topologiques nonces
sont vries la n du regroupement.
Dautre part, un regroupement particulier est effectu en ce qui concerne les cellules
virtuelles. Celles-ci reprsentant des zones de navigation externes lenvironnement,
elles nont que peu dimportance concernant lexploitation ultrieure du graphe. De
plus, la diffrence dchelle entre ces cellules virtuelles et les cellules internes len-
vironnement pourrait provoquer des artefacts de regroupement gnants. Ainsi, nous
effectuons au pralable un regroupement inconditionnel de toutes les cellules virtuelles
en un seul groupe particulier, dnomm groupe virtuel. Ce groupe virtuel est considr
comme tant de type carrefour, mais a un comportement neutre vis--vis des nuds
connexes de type carrefour et couloir (aucun regroupement possible).
Lalgorithme de regroupement est fortement rcursif, bas sur une exploration en pro-
fondeur du graphe avant de pouvoir prendre une dcision. Chaque tape de lalgorithme
traite une cellule en se basant sur sa typologie, avec les objectifs suivants :
1. Cellules virtuelles : Qualier lextrieur de lenvironnement.
2. Cellules de type couloir : Filtrer la discrtisation excessive de la subdivision
spatiale dans les zones peu ouvertes.
3. Cellules de type carrefour : Filtrer la discrtisation excessive de la subdivision
spatiale due des obstacles ponctuels, ou des dfauts dalignement sur les
bordures de zones ouvertes.
4. Cellules de type cul de sac : Terminaison de lalgorithme.
Dtaillons cet algorithme, dont le point de dpart est le traitement des cellules vir-
tuelles :
1. Cellules virtuelles : Regrouper toutes les cellules virtuelles en un groupe vir-
tuel, puis fusionner dans ce groupe toutes les cellules connexes de type cul de
sac. Continuer par ltape 2 ou 3 suivant le type des cellules connectes C
c
non
regroupes (les entres/sorties).
2. Cellules de type couloir :
Si le groupe prcdent G
p
est un carrefour, mais pas la cellule suivante C
s
,
et si FC(G
p
C
c
) > FC(C
c
C
s
), alors ajouter la cellule courante au groupe
prcdent, puis continuer avec la cellule suivante.
Sinon, crer un groupe temporaire G
c
de type couloir avec la cellule courante,
traiter la cellule suivante, puis :
Si G
p
= G
s
, fusionner G
c
avec lui ;
Sinon, si les groupes prcdent et suivant sont des carrefours :
Si FC(G
p
G
c
G
s
) > k. max
_
FC(G
p
); FC(G
c
); FC(G
s
)
_
, fusionner
les trois groupes ;
119
Lenvironnement virtuel
Sinon, ne rien faire.
Sinon, si le groupe suivant est un carrefour :
Si FC(G
c
G
s
) > k. max
_
FC(G
c
); FC(G
s
)
_
, fusionner le groupe cou-
rant et le suivant ;
Sinon, ne rien faire.
Sinon fusionner le groupe courant et le suivant, qui est soit un couloir, soit
un cul de sac.
3. Cellules de type carrefour : Crer un groupe de type carrefour contenant la
cellule courante ainsi que toutes les cellules voisines de type carrefour ou cul de
sac. Appliquer ensuite ltape 2 toutes les cellules voisines non groupes (de
type couloir). Finalement :
Si le groupe courant na quun seul voisin, le transformer en cul de sac ;
Sinon, si le groupe courant a exactement deux voisins, le transformer en cou-
loir et lui appliquer les tests de ltape 2 ;
Sinon, si FC(G
c
G
s
) > k. max
_
FC(G
c
); FC(G
s
)
_
pour nimporte quel G
s
compris dans les groupes voisins de type cul de sac, fusionner G
s
et G
c
puis
recommencer les tests de ltape 3 ;
Sinon, ne rien faire.
4. Cellules de type cul de sac : Crer un groupe de type cul de sac avec la cellule
courante. Notons que ce groupe sera ventuellement fusionn avec son voisin de
type couloir ou carrefour cause des tests des tapes 2 et 3.
Illustrons le comportement de cet algorithme sur le graphe obtenu lors de la subdivision
spatiale (Figure 4.4(a)). Nous ne tiendrons pas compte ici de lheuristique gomtrique
qui compliquerait inutilement lexemple. La gure 4.4(b) correspond lexploration
en profondeur du graphe de cellules. Le groupe virtuel est constitu, mais na pas en-
core absorb les cellules cul de sac connexes. Les sries de couloirs sont regroupes
(groupes 1 et 8), de mme que les carrefours voisins avec ventuellement les culs de sac
(groupes 2, 4, et 7). Le groupe 7 est transform en cul de sac, nayant plus quun seul
voisin. Enn, chaque couloir seul est attribu un groupe couloir temporaire (groupes
3, 5, et 6). La gure 4.4(c) correspond au dpilage des tests de lalgorithme. Le groupe
virtuel y absorbe la cellule cul de sac connexe P. Le groupe couloir 6 est fusionn
avec son voisin cul de sac 7. Le groupe couloir 8, tant connect deux fois au mme
groupe carrefour, est absorb par celui-ci. On obtient (Figure 4.4(d)) un graphe abstrait
ne contenant plus que sept nuds contre vingt six au dpart.
Deuxime niveau dabstraction
Bien que le premier niveau dabstraction rduise drastiquement le nombre de nuds
manipuler, les groupes obtenus sont encore trop proches du dcoupage gomtrique
de lenvironnement. Nous souhaitons produire des zones plus globales, caractrisant
rapidement la typologie des espaces, permettant ainsi une discrimination efcace lors
de lexploitation du graphe.
Nous proposons donc de crer une deuxime couche dabstraction. Celle-ci est base
sur les mmes heuristiques que la prcdente, fonctionnant cette fois-ci sur les groupes
pour obtenir des zones. La contrainte sur la convexit est cette fois-ci plus souple que
120
La reprsentation topologique
(a) Graphe de la subdivision. (b) tape intermdiaire.
(c) tape nale. (d) Graphe de la premire
abstraction.
FIG. 4.4: Droulement de la premire abstraction sur le cas de test.
pour les groupes (facteur k plus proche de 0).
Lalgorithme employ est le mme que prcdemment, avec tout de mme une rgle
supplmentaire permettant le grossissement des zones carrefour, toujours pour maximi-
ser leur nombre. Cette rgle est applique la n des tests de ltape 3 de lalgorithme
prcdent :
Si de tous les voisins de la zone courante, moins de trois sont de type couloir et au
moins un est de type cul de sac, absorber tous les voisins de type cul de sac et re-
commencer les tests de ltape 3.
tudions le comportement de cet algorithme sur lexemple prcdent (Figure 4.5(a)).
Ce cas tant assez simple, seule labsorption dun cul de sac par un carrefour (zone ) y
est applique (Figure 4.5(b)). On obtient un graphe beaucoup plus simple que celui de
la subdivision (Figure 4.5(c)), reprsentant trs globalement les chemins envisageables
dans lenvironnement.
(a) Graphe de la premire
abstraction.
(b) tape intermdiaire. (c) Graphe de la seconde
abstraction.
FIG. 4.5: Droulement de la seconde abstraction sur le cas de test.
121
Lenvironnement virtuel
Remarques gnrales
Nous avons dcrit ici une mthode dabstraction de la reprsentation de lenvironne-
ment. Comme indiqu, cette mthode a pour but principal damliorer les performances
lors de lexploitation de cet environnement, surtout lors de la planication de chemin.
Mais elle permet aussi dorganiser au mieux la topologie pour pouvoir en tirer des
informations, notamment les pr-calculs que lon va y stocker.
Concernant la rduction du nombre de nuds, nous avons men des expriences sur
des chelles environnementales diffrentes, du centre ville de Rennes une gare. De
manire gnrale, on peut observer une diminution de 85% du nombre de nuds avec
la premire abstraction, puis une rduction cumulative de 60% avec les zones, obtenant
ainsi moins de 6% du nombre de nuds dorigine. A titre dexemple, sur le cas rel de
la gare de St Denis Paris (Figure 4.6), la rduction du nombre de nuds est encore
plus importante, obtenant moins de 3% de leffectif dorigine.
(a) Subdivision spatiale.
(1526 cellules)
(b) Premire abstraction.
(153 groupes)
(c) Seconde abstraction.
(40 zones)
FIG. 4.6: Abstraction de la gare de St Denis Paris, dmontrant une rduction
de 97% du nombre de nuds manipuler. Les nuds virtuels appa-
raissent avec une couleur plus fonce que les autres sur le pourtour
de chaque gure.
4.1.3 Les nuds conceptuels
La dernire manipulation que lon effectue sur notre reprsentation de lenvironnement
consiste introduire des nuds conceptuels, permettant notamment de lorienter, mais
aussi de prparer son amlioration smantique. La dnomination conceptuelle a t
choisie car ces nuds, contrairement aux cellules de la subdivision, ne reprsentent
pas un espace physique, mais plutt une capacit interne du graphe.
Ainsi, ils nont aucune surface, et peuvent tre insrs sans altrer la topologie repr-
sente. Une spcicit est ici prendre en compte : an de garantir le fonctionnement
des algorithmes dabstraction, ces nuds ne peuvent tre regroups. Ils sont donc pr-
122
La reprsentation topologique
sents sous la mme forme atomique dans les trois niveaux hirarchiques du graphe.
Plusieurs utilisations sont faites de ces nuds. Ils permettent entre autre de reprsenter
plus prcisment les entres/sorties de lenvironnement, en leur associant un sens de
parcours. Ils peuvent aussi tre utiliss pour interconnecter plusieurs graphes hirar-
chiques, par exemple pour reprsenter les diffrents tages dun immeuble. Enn, nous
verrons dans la section 4.3 que ces nuds sont utiliss pour situer linteraction en re-
prsentant certains objets interactifs. Trois nouveaux types de nuds ont t introduits.
Le bouchon.
Le type bouchon peut avoir nimporte quel nombre de connexions entrantes, mais nen
a aucune sortante. Son but est de bloquer tout parcours de graphe.
Il permet ainsi une modication dynamique du graphe par simple redirection des arcs
existants, vitant dinvalider la typologie des nuds quils liaient auparavant. Cette
caractristique est capitale car elle permet de conserver les proprits de voisinage
introduites par lheuristique de regroupement. Si lon se contentait de supprimer et de
crer des connexions lorsque lon veut modier le graphe, on devrait alors modier
la typologie des nuds impliqus en consquence, puis mettre en place un processus
de vrication complexe pour assure la cohrence du graphe. Par exemple, un couloir
peut tre bouch en redirigeant lune de ses connexions vers un nud de type bouchon.
Il conserve ainsi sa qualit de couloir pour une restauration future, contrairement sa
ncessaire transformation en cul de sac si lon avait supprim cette connexion.
Le nud orient.
Comme son nom lindique, le nud orient permet dassigner un sens de parcours
au graphe. Ce nud est un couloir particulier, disposant des fonctionnalits pour tre
congur dynamiquement de quatre faons : libre (traverse non contrainte), bloqu
(aucune traverse possible), et les deux congurations contraintes (sens unique). Une
telle conguration est possible par la redirection des arcs partant et arrivant ce nud
vers un bouchon (Figure 4.7).
(a) Passage libre. (b) Passage bloqu.
(c) Sens unique depuis 0 vers 1. (d) Sens unique depuis 1 vers 0.
FIG. 4.7: Les quatre congurations possibles du nud orient.
Le cadre dutilisation typique de ce type de nud est la spcication du sens de par-
cours dun accs de lenvironnement. Ainsi, un nud orient est automatiquement in-
123
Lenvironnement virtuel
sr entre chaque cellule entre/sortie de la subdivision et la cellule virtuelle connexe.
Ce nud pourra ensuite tre rorient dynamiquement lors dune simulation pour chan-
ger le sens de parcours cet accs, en faisant une entre simple, ou une sortie, ou
bloquant ce passage.
Le nud dinterconnexion.
Ce dernier type de nud conceptuel est spcial dans le sens ou cest le seul ne pas
tre directement associ un graphe. En effet, ce nud sert interconnecter plusieurs
graphes entre eux, rsultant en llaboration dun graphe de plus haut niveau.
Un nud dinterconnexion est par convention un carrefour spcialis, nayant plus la
contrainte du nombre minimum de voisins. Il ne peut tre connect qu des nuds
orients, quant eux associs un graphe hirarchique donn.
Trois cadres dutilisation typique existent pour ce type de nud :
Interconnexion entre graphes de mme catgorie smantique. Ce premier cas per-
met de reprsenter les circulations verticales, telles que les cages descalier ou les
ascenseurs. Chaque tage sera ainsi dcrit par un graphe hirarchique complet,
des nuds orients seront placs au niveau des accs aux circulations verticales,
qui seront ensuite runis par autant de nuds dinterconnexion que ncessaire.
Interconnexion entre graphes de catgories smantiques diffrentes. Ce deuxime
cas permet de grer des environnements de nature diffrente par des graphes in-
dpendants. Par exemple, on peut avoir un graphe reprsentant les rues dune
ville, puis autant de graphes que de btiments dcrire, qui seront intercon-
nects au niveau de leurs accs avec la ville. Un autre exemple pourrait tre la
sparation entre une gare ferroviaire, une gare routire, et un mtro dans le cas
de ltude de lieux dchanges modalits multiples.
Reprsentation dune zone de type bote noire. Ce dernier cas permet de reprsen-
ter une zone de navigation de faon purement abstraite, en ne spciant que ses
points daccs. Un exemple pourrait tre la reprsentation dune salle dattente
dans une gare seulement par un nud dinterconnexion, pouvant donc tre tra-
vers mais dont la reprsentation des circulations internes nest pas requise pour
ltude.
Les nuds dinterconnexion introduisent donc un niveau supplmentaire dans la hi-
rarchie du graphe dabstraction. On peut en effet voir linterconnexion de plusieurs
graphes comme un nouveau graphe dont chaque nud reprsente un environnement
dans sa totalit. Les algorithmes de parcours peuvent ainsi exploiter cette nouvelle abs-
traction pour effectuer une recherche trs globale, avec lintroduction triviale dune
contrainte sur la traverse de certaines catgories de graphes. Par exemple, on peut
prendre le cas dune ville reprsente par un graphe, interconnect aux graphes repr-
sentant chacun un btiment, comme les habitations, la gare, le mtro, ou encore un
centre commercial. On pourra ensuite planier un chemin depuis lhabitation dune
entit simule jusqu la gare, en ignorant tout simplement les connexions ne donnant
pas sur lun de ces btiments depuis la ville.
124
Un environnement inform
4.2 Un environnement inform
La conservation de linformation est indispensable pour permettre lexploitation dune
abstraction de lenvironnement dans un cadre de simulation. Pour aller plus loin, labs-
traction doit non seulement tre capable de restituer les informations issues de la d-
nition graphique dorigine, mais aussi de les organiser au mieux pour autoriser leur
utilisation efcace et rapide.
Voil pourquoi nous proposons dinformer notre abstraction de lenvironnement avec
diverses donnes relatives aux circulations de personnes. Nous avons synthtis dans
ces informations les diffrents facteurs pouvant inuencer les dplacements pdestres
(confre Section 1.5.4, page 45), que ce soit lors de lvaluation long terme, ou de la
gestion locale du mouvement.
Notons pour nir que les informations que nous allons prsenter ici ne sont calcules
que sur le graphe intermdiaire dabstraction. En effet, nous ne calculons pas ces in-
formations pour le graphe de plus bas niveau, issu de la subdivision, cause du grand
nombre dlments quil produit, pouvant inclure un certain nombre de cellules d-
gnres (triangles quasiment plats dus des imprcisions mathmatiques). Si nous
avions fourni les informations ce niveau hirarchique, le modle aurait t surcharg
par la forte redondance et la multitude des donnes, le rendant peu utilisable. Dautre
part, le fait de fournir ces donnes pour le graphe intermdiaire nous permet de les d-
duire implicitement pour le graphe le plus abstrait, celui-ci ntant quun regroupement
et ayant donc accs aux informations du graphe sous-jacent.
4.2.1 Informations statiques
Le premier type dinformations que nous associons notre graphe topologique est bas
sur des donnes statiques de lenvironnement. Ainsi, nous proposons de pr-calculer
ces donnes et de les stocker directement dans les groupes, an den acclrer lac-
cs au cours de la simulation. Notons que bien que ces informations soient stockes
dans le premier niveau dabstraction, leur pr-calcul se base sur les informations issues
directement de la subdivision spatiale.
Caractristiques des groupes
Les caractristiques intrinsques des groupes sont sans doute les informations qui se-
ront utilises par le plus de mcanismes de la simulation. Ces caractristiques synth-
tisent la gomtrie du groupe suivant diffrents points de vue.
Tout dabord, nous proposons des caractristiques gomtriques globales du groupe :
Surface, barycentre : ces informations gnrales auront une frquence dutilisation
importante et sont donc directement stockes.
Bote englobante oriente : cette bote sert durant le processus dabstraction, et est
donc stocke directement dans le groupe, puis modie lors dune ventuelle
fusion entre plusieurs groupes.
Grille oriente : base sur la bote englobante oriente, cette grille (Figure 4.8) servira
pour le calcul dynamique des densits de personnes.
125
Lenvironnement virtuel
(a) Groupe sous-jacent. (b) Superposition de la grille.
FIG. 4.8: Grille oriente dun groupe de la gare St Lazare Paris. Le gra-
dient de noir bleu des cases indique leur surface utile. La case est
transparente si elle est non navigable ou si elle nappartient pas au
groupe.
Nous proposons ensuite des caractristiques lies la traverse du groupe, donc don-
nes pour chaque combinaison de deux frontires franchissables dun groupe. Ces va-
leurs sont obtenues par une planication de chemin dans les cellules regroupes, mi-
nimisant la distance. Lensemble de ces valeurs serviront au processus de planication
de chemin de lhumanode virtuel.
Plus petite largeur : cette information indique les goulets dtranglement lis la tra-
verse dun groupe.
Plus courte distance de traverse : cette information sert donner une borne mini-
male la distance parcourir pour traverser le groupe.
Vecteur direction : il correspond au vecteur direction associ la traverse du groupe.
Gestion de la perception
Nous avons identi, lors de ltude pralable de lexistant, que la perception est un
phnomne prpondrant dans le processus de navigation. Nous proposons donc un
mcanisme de pr-calcul ddi la prise en charge de cette perception.
Ce pr-calcul prend la forme dune valuation approximative des zones de lenviron-
nement visibles depuis des points clefs : les champs de visibilit potentiels (ou PVS
pour Potential Visibility Sets en anglais). Deux PVS sont ainsi associs chaque arc du
graphe, soit chaque bordure franchissable intergroupe, reprsentant les zones visibles
dans les deux directions.
Un PVS est organis sous forme darbre, dont la racine est la bordure courante, et dont
les nuds vont correspondre chaque autre bordure intergroupe visible. Ces nuds
stockent aussi le frustum de visibilit obtenu lors de la traverse de la bordure (Fi-
gure 4.9). Pour mmoire, un frustum de visibilit correspond, dans le plan, une pro-
jection du cne de vision. Cest donc un triangle dnissant la plus grande surface
visible libre dobstacles, dont lun des sommets est la position de rfrence pour un
observateur.
La construction dun PVS se fait par une planication de chemin dans le graphe topo-
logique, en propageant le frustum de visibilit. La position de rfrence peut prendre
nimporte quelle valeur sur la bordure dorigine, celle produisant le plus grand frustum
tant conserve. A chaque fois quune bordure inter-groupe est atteinte, lalgorithme
ajoute un nud correspondant dans larbre du PVS aprs avoir intersect le frustum
126
Un environnement inform
(a) Propagation du frustum de visibilit. (b) Arbre du PVS rsultant. Chaque nud cor-
respond une bordure intergroupe.
FIG. 4.9: Calcul dun PVS sur un cas de test, pour la bordure entre les groupes
1 et 2. Chaque frustum propag est reprsent avec une couleur
diffrente.
courant avec le segment support de la bordure. La condition darrt est vrie lorsque
langle douverture du frustum (langle du sommet correspondant la position de rf-
rence) est infrieur une borne donne.
A titre dexemple, on peut voir sur la gure 4.10 la caractrisation dun PVS pour
la gare de St Denis. La gure 4.10(a) illustre la propagation du frustum de visibilit
lors de la construction du PVS. La gure 4.10(b) reprsente la connectivit intergroupe
dductible directement partir du PVS.
(a) Frustum propag. (b) Connectivit intergroupe perue.
FIG. 4.10: Reprsentation dun PVS pour un accs de la gare St Denis Paris.
4.2.2 Informations dynamiques
La deuxime catgorie dinformations que lon veut pouvoir grer concerne les don-
nes dynamiques de lenvironnement. Bien sr, il ne sagit pas ici deffectuer des pr-
calculs, mais de proposer des fonctionnalits permettant la rcupration rapide de ces
informations.
Les informations concernes par ces processus sont les ux de personnes, les densits
de personnes, et la dtection du voisinage. En ce qui concerne ce dernier point, nous
utilisons directement le graphe de voisinage dcrit par F. Lamarche [71], bas sur une
triangulation de Delaunay entre les entits dynamiques, ltre par la topologie. Voici
comment nous procdons pour les autres points.
127
Lenvironnement virtuel
Flux de personnes
Les ux de personnes reprsentent leffectif des circulations lintrieur dun groupe
du graphe topologique, i.e. traversant ce groupe entre deux de ses bordures franchis-
sables. Nous les reprsentons en associant un compteur chaque paire de bordures du
groupe, rsultant en A
2
n
compteurs avec n le nombre de bordures du groupe. Un proces-
sus assign chaque entit dynamique de la simulation modiera ensuite ce compteur
lors de leur parcours.
Notons quavec ces ux nous ne caractrisons que les traverses compltes des groupes,
les compteurs associs ne tenant pas compte des circulations partant ou arrivant dans
le groupe. Ainsi, la somme des ux de personnes peut tre infrieure leffectif total
du groupe.
Densits globales et effectif de groupe
Les densits globales sont relatives la surface complte dun groupe, ce sont donc des
densits disperses. Leur calcul se base sur la surface pr-calcule du groupe, ainsi que
sur un compteur dynamique deffectif du groupe.
Ainsi, nous associons un compteur chaque groupe qui sera incrment automatique-
ment par une entit y entrant, et dcrment lorsquune entit en sort. Ce compteur
donne donc leffectif total du groupe, que ce soit les personnes immobiles ou en mou-
vement.
Densits locales
Les densits globales introduisent le problme de dispersion de linformation. En ef-
fet, elles ne tiennent pas compte des regroupements potentiels qui pourront gner la
circulation. Par exemple, dans le cas du groupe carrefour reprsent sur la gure 4.11,
la densit globale value sera toujours la mme quelle que soit la conguration des
personnes se trouvant lintrieur. Il est ainsi impossible de discriminer la traverse de
ce groupe suivant les bordures empruntes (A, B,C, D sur la gure).
(a) Population disperse. (b) Population regroupe.
FIG. 4.11: Dfaut du calcul de densit globale pour un groupe de 36m
2
. Dans
les deux congurations la densit globale est de 0.14p/m
2
, ne ren-
dant pas compte des ventuels regroupements.
128
Un environnement inform
Ce problme est dautant plus important que la densit des personnes sera un fac-
teur dvaluation de la planication de chemin de nos entits autonomes. Nous ap-
portons donc une solution ce problme via le calcul de densits locales, associes
chaque paire de bordures du groupe (correspondant ainsi lensemble des traverses
possibles).
An de calculer les densits locales, nous nous basons sur la grille oriente pr-calcule
pour chaque groupe. Cette grille est rgulire, i.e. compose de cases de tailles iden-
tiques. Chaque case est dimensionne pour respecter au mieux la bote englobante
oriente, autorisant ainsi une lgre variation de ses largeur et hauteur. De plus, la
surface dune case est choisie pour autoriser un gradient sufsant des densits de per-
sonnes. Si lon se base sur les tudes statistiques introduites dans ltat de lart (confre
Section 1.2, page 14), la densit est peu prs borne par 4p/m
2
, avec des valeurs si-
gnicatives de lordre de 0.3p/m
2
. Nous choisissons donc une surface initiale de 4m
2
pour les cases (2m de cts), rsultant en une graduation de 0.25p/m
2
pour les densits.
Chaque case de la grille se voit affecter deux compteurs :
Surface utile : cette valeur statique est obtenue en intersectant la case avec la topolo-
gie de lenvironnement (Figure 4.12(b)). Elle correspond la surface navigable
appartenant au groupe courant couverte par la case.
Effectif de population : cette valeur dynamique est remise jour automatiquement
par les entits se dplaant dans lenvironnement (Figure 4.12(c)). tant donn
la rapidit daccs une grille rgulire, le cot impliqu par cette mise jour
est ngligeable, dautant plus que sa frquence de rafrachissement peut tre trs
basse (de lordre de 1Hz) du fait des dimensions des cases et des vitesses poten-
tielles des entits.
(a) Environnement de test. (b) Dcoupage en grille rgulire oriente. Le gra-
dient de bleu rouge indique la surface utile.
(c) Compteurs de population mis jour. Le gradient
de vert rouge indique leffectif.
(d) valuation de la densit locale entre A et C (seul
un chemin est reprsent pour des questions de
lisibilit). Les cases dont la surface utile est trop
faible sont ignores.
FIG. 4.12: Mthode de calcul des densits locales sur un environnement de
test (lintgralit de lenvironnement est considr comme tant
un groupe du graphe).
Une fois cette reprsentation effectue, nous procdons une planication de chemin
frquentielle au sein de la grille, valuant chaque couple de bordures du groupe comme
129
Lenvironnement virtuel
autant dorigines / destinations. Cette planication utilise lalgorithme oodll, avec
une heuristique quantiant la traverse de chaque case grce trois donnes, soit par
ordre dimportance :
1. Minimisation de la densit locale D
l
=
effectif
surface utile
2. Maximisation de la surface utile.
3. Minimisation de la distance.
Nous utilisons ici lalgorithme oodll plutt que le A

car, bien quil soit plus lent sur


une planication unique, il permet deffectuer facilement des planications destina-
tions multiples, le rendant ainsi de plus en plus rapide avec laccroissement du nombre
de voisins du groupe. Il nous est ainsi possible, en une seule planication, dvaluer
les chemins depuis une bordure franchissable vers toutes les autres. Pour dtecter les
cases correspondant aux bordures franchissables du groupe, une projection directe du
segment est utilise. Une fois quun chemin est trouv entre deux bordures, la densit
maximale des cases traverser est retenue comme valeur de densit locale et stocke
dans le groupe (Figure 4.12(d)).
Lensemble de ce processus est effectu une fois par seconde pour chaque groupe du
graphe. Mme sil peut sembler coteux de prime abord, il faut savoir que la distri-
bution des calculs dans le temps est triviale : on peut rafrachir les valeurs dun sous-
ensemble de groupes diffrents moments, vitant une trop forte monte en charge un
seul instant. De plus, le processus de planication nest bas que sur des informations
de trs bas niveau, trs rapides calculer, et seffectue sur une grille qui est sans doute
la reprsentation la plus performante. Notons aussi que le calcul nest effectu que si
leffectif du groupe est positif. Enn, ce procd est dautant plus avantageux que laf-
uence de lenvironnement augmente, le calcul tant fait globalement, et chaque entit
pouvant ensuite accder aux informations avec un cot nul. A titre dexemple, la gare
de St Lazare Paris est abstraite en 472 groupes sur deux niveaux, dont les densi-
ts locales sont totalement rafrachies en 100ms sur un portable de vieille gnration
(Pentium M 1.6GHz).
4.3 Intgration des objets interactifs
Nous nirons ce chapitre ddi la description de lenvironnement de simulation avec
la faon dont nous y intgrons les objets interactifs physiques. Pour mmoire, un objet
physique dnit dans BIIO est golocalis, i.e. il connat sa position dans lespace,
mais aussi le nud du graphe topologique qui lui correspond. Le but premier de cette
golocalisation est de rendre les objets accessibles aux algorithmes bass sur notre
dnition topologique, dont notamment la planication de chemin et lvitement de
collision que nous verrons dans le chapitre concernant lhumanode virtuel.
Deux catgories dobjets interactifs sont ici prendre en compte : premirement, les
objets statiques dont la localisation spatiale est ge au cours dune simulation ; deuxi-
mement, les objets dynamiques pouvant se dplacer au cours dune simulation, voire
mme apparatre ou disparatre.
130
Intgration des objets interactifs
4.3.1 Les objets statiques
Les objets statiques sont xes dans lenvironnement. Ces objets sont dans la plupart
des cas des spcialisations de leffecteur, reprsentant des quipements accessibles
aux interacteurs. Trois sous-catgories de ces objets impliquent un traitement diffrent
concernant leur intgration la topologie.
Les objets obstacles
Les objets obstacles statiques doivent tre vits par des entits se dplaant dans len-
vironnement. Un exemple type serait un guichet de vente ou encore un composteur de
billets.
(a) Subdivision spatiale (b) Graphe topologique extrait
FIG. 4.13: Intgration dun objet obstacle statique au graphe topologique re-
prsentant lenvironnement de simulation. Le contour de lobjet
est pris en compte lors de la subdivision spatiale (a) comme au-
tant dobstacles, tandis que sa face interactive est intgre sous la
forme dun nud orient dans le graphe dabstraction (b).
tant immobiles, ces objets sont directement intgrs notre graphe topologique sous
la forme de nuds conceptuels orients (Figure 4.13). Pour mmoire, un nud concep-
tuel orient na aucune surface et comporte une notion de sens daccs (qui peut tre in-
valid). Ainsi, ce nud bncie de lensemble des proprits dcrites dans le chapitre
concernant lenvironnement virtuel (Chapitre 4, page 115), que ce soit ce qui concerne
les pr-calculs ou les algorithmes utilisables. Un objet obstacle statique pourra donc
tre pris pour cible dune planication de chemin simplement en prenant pour destina-
tion le nud qui lui correspond, et sera implicitement vit lors de la navigation de par
lintgration de son contour aux obstacles de lenvironnement.
Les objets traversables
Les objets traversables joignent plusieurs zones navigables de lenvironnement, tout en
tant eux-mme navigables lors de leur utilisation, ou obstacles dans le cas contraire.
Un exemple type serait un ascenseur, un escalier, ou encore un portique automatique
comme ceux rencontrs dans les mtros.
Sur le mme principe que les objets obstacles, les objets traversables sont directement
131
Lenvironnement virtuel
(a) Subdivision spatiale (b) Graphe topologique extrait
FIG. 4.14: Intgration dun objet traversable statique au graphe topologique
reprsentant lenvironnement de simulation. Le contour de lob-
jet est pris en compte lors de la subdivision spatiale (a) comme
autant dobstacles, chacune de ses faces interactives sont ensuite
intgres sous la forme dun nud orient dans le graphe dabs-
traction, puis associes par un nud de connexion (b).
intgrs sous la forme de nuds conceptuels. Cette fois-ci, chaque accs de lobjet sera
reprsent par un nud orient, lobjet dans son ensemble tant reprsent par le nud
dinterconnexion les runissant (Figure 4.14). Ainsi, il est possible dintgrer des ob-
jets traversables simples, comme le portique automatique, avec seulement deux nuds
orients, ou des objets traversables complexes, comme lascenseur ou une cage des-
caliers, avec autant de nuds orients quils ont daccs. De plus, le sens de parcours
de lobjet est intrinsquement disponible dans le graphe topologique grce la notion
de sens de traverse des nuds orients.
Les objets libres
Les objets libres sont disposs de telle faon quils ne gnent en rien la navigation,
mais seraient considrs comme des obstacles sils taient situs ailleurs. Un exemple
type serait un panneau dafchage accroch en hauteur sur un mur ou sur un pilier.
Le principe dintgration est ici diffrent des deux prcdents. En effet, ces objets
ntant pas directement accessibles depuis une zone navigable, ils ne peuvent tre re-
prsents par des nuds du graphe topologique. Au lieu de cela, ils sont cette fois-ci
associs des nuds standards du graphe, qui sont donc capables dindiquer len-
semble des objets libres quils contiennent. Cette mthode permet ainsi de bncier
indirectement des avantages du graphe topologique.
4.3.2 Les objets dynamiques
Les objets dynamiques sont mobiles dans lenvironnement. Ces objets peuvent indiff-
remment tre des spcialisations de linteracteur, comme lhumain virtuel, ou de lef-
fecteur, comme une valise, ou encore lunication des deux, comme un agent de service
dans un lieu publique.
Ntant pas xes, ces objets ne peuvent tre directement intgrs au graphe dabstrac-
tion de lenvironnement. Nous utilisons donc la mme technique ici que pour les objets
statiques libres : les objets dynamiques sont associs au nud du graphe correspondant
132
Conclusion et discussion
leur golocalisation. De plus, une procdure automatique est mise en uvre an de
transfrer lobjet dun nud lautre lors de son dplacement.
Une spcicit est ici prendre en compte concernant les pr-calculs disponibles pour
tout lment du graphe topologique. Nous avons propos auparavant des champs de
visibilit potentiels (PVS) pour des endroits clefs de lenvironnement. Ces PVS ne peu-
vent tre fournis directement pour des objets dynamiques, tant donn que leur position
est mobile par essence. Nanmoins, nous voulons offrir le mme niveau de perfor-
mances pour ces objets, qui feront une utilisation intensive des tests de visibilit. En
effet, lhumain virtuel que nous prsenterons par la suite entre dans cette catgorie, et
disposera dun comportement ractif dobservation qui sera utilis continuellement.
Nous proposons donc une mthode exploitant les PVS de lenvironnement dans un
cadre dynamique, dnomme champ de visibilit dynamique (dPVS en anglais, pour
dynamic PVS). Ceux-ci consistent en une connexion du frustum de lobjet en mou-
vement (information dynamique) aux PVS disponibles dans les alentours immdiats
(information statique). Pour se faire, un test dintersection est effectu entre le frus-
tum de lobjet et le frustum de la racine de chaque PVS du groupe qui le contient
(Figure 4.15). Si le test choue, le dPVS carte le PVS correspondant, et sil russit, le
dPVS se connecte sans aucun test supplmentaire.
FIG. 4.15: Calcul dun potentiel de visibilit dynamique pour un objet inter-
actif mobile : le dPVS est reli aux PVS du nud courant qui sont
visibles (1 et 2).
Le principe dintgration dcrit ici permet donc de planier un chemin vers un objet
dynamique (par la slection du nud qui le contient), de tenir compte de ces objets lors
de lvitement de collision (ceux-ci tant rfrencs dans le graphe topologique), et de
bncier efcacement dune information de visibilit les concernant.
4.4 Conclusion et discussion
Nous avons prsent dans ce chapitre notre reprsentation topologique de lenvironne-
ment et les informations sy rapportant.
133
Lenvironnement virtuel
Nous proposons ainsi une reprsentation exacte en 2D permettant de rester dle la
description dorigine. Nous effectuons une abstraction topologique de cette reprsen-
tation, produisant un graphe hirarchique, an den amliorer les performances et den
synthtiser lexpressivit. Nous avons aussi introduit des nuds conceptuels permettant
dinterconnecter plusieurs graphes, rendant ainsi possible la gestion des circulations
verticales (appel 2D
1/2
), mais aussi linterconnexion denvironnements de diverses
catgories smantiques (comme un mtro donnant accs une gare ferroviaire). Ce
processus est entirement automatis, le modle tant capable deffectuer labstraction
directement depuis la dnition gomtrique.
Lintrt majeur de ce type de reprsentation vient des informations que lon peut y as-
socier. Nous proposons ainsi un grand nombre de pr-calculs, qui pourront tre utiliss
par nos agents autonomes avec un trs faible cot. Nous proposons aussi des processus
automatiss grant efcacement les donnes dynamiques prsentes dans un environ-
nement. La notion de densit locale est ainsi introduite, permettant de caractriser les
regroupements de personnes pouvant gner la circulation. Ces informations nous per-
mettent donc de synthtiser et dorganiser les donnes environnementales, pour une
utilisation la fois par le modle dagent autonome, an de prendre ses dcisions, mais
aussi pour produire des rsultats de simulation pouvant tre analyss.
Pour nir, nous avons prsent les mthodes mises en uvre an de situer linter-
action, par lintroduction des objets interactifs directement dans notre graphe topo-
logique. Comme nous le verrons dans le chapitre suivant, cet aspect est primordial,
permettant aux algorithmes manipulant lenvironnement (dont surtout la planication
de chemin) de prendre directement en considration linteraction.
Pour conclure, nous avons fortement ax cette reprsentation sur le ralisme compor-
temental, essayant de conserver au maximum linformation. Nous navons nanmoins
pas nglig les performances, en proposant une multitude de mcanismes en partie d-
dis cet objectif. Cette description de lenvironnement a t conue en premier lieu
pour son application des environnements contraints relativement tendus, tels que les
gares ferroviaires. Nous pouvons nanmoins afrmer que des chelles environnemen-
tales connexes peuvent tre gres, telles quune ville ou une maison. Atitre dexemple,
nous avons test ce modle sur le centre ville de Rennes, reprsentant une surface de
plus d1km
2
.
134
Chapitre 5
Le comportement de
lhumain virtuel
Lhumain virtuel est lacteur exclusif de nos simulations. Notre objectif est de proposer
un modle dhumanode aussi raliste que possible dun point de vue comportemental.
Celui-ci doit tre dou de certaines aptitudes dun humain rel, comme lobservation, la
mmoire, ou la capacit se dplacer. Cette dernire doit rpondre aux logiques de d-
placement caractristiques des foules, tout en offrant un niveau de contrle individuel.
Lhumain virtuel doit aussi tre capable de prendre des dcisions relatives aux interac-
tions disponibles dans lenvironnement, quelles reprsentent ses objectifs long terme
ou bien un moyen de les atteindre. De plus, une certaine diversit de comportement doit
tre possible, an de se rapprocher au maximum de situations concrtes.
Nous allons donc dcrire dans ce chapitre notre modle dhumain virtuel. Nous com-
mencerons, section 5.1, par dnir le principe gnral de ce modle. Nous organise-
rons ensuite ce chapitre en dnissant tape par tape les mcanismes grant notre
humain virtuel, en allant du plus ractif au plus rchi. Ainsi, nous prsenterons dans
la section 5.2 les capacits dobservation et de mmorisation de notre entit. Nous
continuerons, section 5.3, avec la mthode de planication de chemin employe qui,
comme nous le verrons, est le premier pas vers un processus dcisionnel li lin-
teraction. Nous traiterons ensuite, section 5.4, le processus de navigation ractive de
notre agent autonome, effectuant les adaptations de trajectoires locales lors du dpla-
cement. Par la suite, nous exposerons dans la section 5.5 certaines tches cognitives
de lhumanode, soccupant du droulement de comportements cibls et relativement
indpendants. Pour nir, nous traiterons dans la section 5.6 les processus de dcision
de lagent autonome, guidant ces choix au sein de lenvironnement.
5.1 Principe gnral
Notre modle dobjets interactifs BIIO (Chapitre 3, page 91) permet de dcrire des
objets de simulation, dont notamment les interacteurs qui ralisent des interactions.
Notre modle dhumanode est une spcialisation de cet interacteur, augmentant ses
capacits par lajout dattributs et de fonctionnalits (Figure 5.1).
135
Le comportement de lhumain virtuel
FIG. 5.1: Lhumanode dans larchitecture BIIO : spcialisation de linterac-
teur augmentant ses capacits.
Notre humain virtuel dispose donc de toutes les proprits conceptuelles dun inter-
acteur, auxquelles vont sajouter des facults plus concrtes et incarnes telles que la
perception visuelle ou la navigation ractive. Nous allons voir que lensemble de ces
tches basiques sont intgres au sein du modle dhumain virtuel, pour obtenir un
agent totalement autonome capable de prendre ses propres dcisions. Cette intgration
repose sur la fameuse pyramide comportementale de A. Newell (Figure 5.2), en pro-
posant un modle pour chacun de ses tages, sauf ltage social qui ne sera pas abord
ici.
FIG. 5.2: A gauche, la pyramide comportementale originelle. A droite,
lquivalent de la pyramide comportementale dans notre modle.
Au centre, une indication des variations de complexit et frquence
de calcul suivant ltage dcisionnel.
Dtaillons chacun des tages de la pyramide tel quil se prsente dans notre modle.
Nous allons prsenter ici leur rle gnral, leur frquence typique de rafrachissement,
et les donnes quils peuvent changer. Notons que de ces changes ne se font quentre
tages adjacents dans la pyramide (Figure 5.3), conformment au modle psycholo-
gique originel.
Biomcanique La base de la pyramide est constitue des tches les moins conscientes
pour un humanode. Elle peut tre considre comme automatique, et ce titre sex-
cute avec la plus haute frquence du systme : 20Hz. Ce sont les modules de locomotion
et danimation qui incarnent la biomcanique de lhumain virtuel dans notre modle.
136
Principe gnral
FIG. 5.3: Diagramme de communication entre les diffrents tages de notre
modle. A gauche, la remonte dinformation, droite, le contrle
des tages infrieurs.
Ceux-ci ne prennent aucune dcision complexe, ils se contentent de suivre les direc-
tives donnes par ltage suprieur de la pyramide, telles que la direction et la vitesse
du mouvement. Nanmoins, ils communiquent cet tage suprieur leurs contraintes
physiques intrinsques, comme les possibilits dacclration ou de rotation.
Ractif Le premier tage de la pyramide est constitu de tches simples, atomiques,
pour lhumanode. Elles peuvent tre rafrachies automatiquement avec une frquence
faible (4Hz), et/ou en raction des vnements. Ces tches sont disponibles quel que
soit lhumanode simul, et constituent leur base comportementale. Leurs paramtres
de conguration sont manipulables par ltage cognitif de la pyramide, tandis que len-
semble de leurs donnes sont directement accessibles par ce dernier. Nous pouvons
citer dans les tches de cet tage les modules de planication de chemin, doptimisa-
tion visuelle, dobservation et de mise jour de la base de connaissance, ou encore
dvitement de collision.
Cognitif Le second tage de la pyramide est constitu de tches plus complexes,
mais restant relativement indpendantes les unes des autres dans leur processus dex-
cution, si ce nest par leur concurrence quant lutilisation de ressources. Ces tches
ne ncessitent pas un rafrachissement rapide, et sont donc mises jour une seule fois
par seconde simule. Elles peuvent fortement varier dun humanode lautre, et sont
spcies grce larchitecture BIIO (conf. Chapitre 3.2.7, page 100). Ainsi, cet tage
constitue la partie augmentable de notre modle dhumanode, pouvant tre tendu
facilement dans le futur par la cration de nouvelles tches cognitives. Les seules in-
formations transmises ltage suprieur, rationnel, sont la priorit dexcution choisie
par la tche ainsi que son tat. Nous reviendrons plus en dtails par la suite (Annexe C,
page 245) sur les tches standards de lhumain virtuel : observer, se dplacer, et inter-
agir.
Rationnel Le dernier tage de notre pyramide exploite directement les fonctionna-
lits de linteracteur, en les organisant dans le temps. Ainsi, il se charge dexcuter la
gestion des affordances et des tches cognitives des frquences faibles, de lordre de
1Hz. Cet tage se charge aussi dune certaine supervision du comportement individuel,
en sassurant que les tches cognitives qui lui sont ncessaires sont bien actives. Nous
navons pas ici la prtention de proposer un processus de raisonnement complet, mais
plutt un mcanisme de slection et dordonnancement des diffrents comportements.
137
Le comportement de lhumain virtuel
Cette approche a comme principal avantage de hirarchiser le processus dcisionnel,
en le dcoupant par tranches spcialises. Plus une tranche de la pyramide comporte-
mentale est leve, plus elle est complexe, mais elle bncie aussi dune plus forte
cohsion temporelle quant ses prises de dcision. De plus, chaque couche de ce mo-
dle a un fonctionnement relativement indpendant, ne communiquant avec les autres
que grce des donnes synthtiques identies. Ainsi, leur spcication peut se faire
sparment, sous la forme de botes noires respectant des contraintes minimales.
5.2 Accder aux informations de lenvironnement
Comme nous avons pu le dcouvrir dans ltat de lart, la premire ncessit dun tre
humain est de percevoir son environnement. Cette perception est alors synthtise et
stocke dans la mmoire pour son utilisation ultrieure.
Notre modle dhumanode applique ce principe la lettre. Nous allons donc dcrire
ses capacits de perception de lenvironnement, puis lorganisation de sa mmoire et
les informations quil y stocke. Notons que nous avons simpli le modle de mmoire
propos par les tudes psychologiques (confre Section 2.1.2, page 58), en supprimant
les mcanismes de renforcement et de rcupration, ainsi quen rduisant de manire
signicative la diversit des traitements effectus quant la symbolisation des connais-
sances. Ce choix a t fait pour des questions de performances, et se justie par le cadre
dutilisation de ce modle : les situations simules se droulent sur un laps de temps
trop court pour que de tels mcanismes soient ncessaires.
5.2.1 La perception visuelle
La premire capacit de notre agent autonome est donc la perception visuelle de son
environnement. Celle-ci a pour objectif dextraire des informations au fur et mesure
du dplacement. Nous pouvons assimiler le processus dcrit ici la mmoire perceptive
cumule la symbolisation des donnes (tape initiale de la mmoire court terme). En
effet, nous allons voir que les donnes perues par lhumain virtuel ne sont pas brutes,
i.e. seulement gomtriques, mais contiennent dj une smantique. Il ny a donc pas
de mcanisme dinterprtation associ cette perception, les donnes reues tant dj
identies.
Mcanisme bas sur les dPVS
Le mcanisme de perception est bas sur les dPVS calculs pour les objets physiques
dynamiques (confre Section 4.3.2, page 132). Comme nous lavons vu, un dPVS
consiste en une connection automatique du champ de vision de lentit avec les PVS
statiques de lenvironnement. Ce processus aboutit ainsi une structure de donnes
quivalente un PVS, sous la forme dun arbre reprsentant les zones potentiellement
visibles depuis la position courante de lhumanode.
Le mcanisme de perception consiste alors parcourir ce dPVS pour en extraire les
zones rellement visibles, en y propageant le champ de visibilit initial de lhumain
virtuel. Ce champ de visibilit est un frustum, reprsent par un triangle inni dont
138
Accder aux informations de lenvironnement
lun des sommets est la position de lentit, et dont langle douverture est de 120
(reprsent en rouge sur la gure 5.4). Lalgorithme va donc parcourir rcursivement
les PVS connects au dPVS, en intersectant chaque nud le frustum de visibilit avec
le frustum local du PVS, produisant un nouveau frustum de visibilit pour la branche
restante. Ds que le frustum rsultant a un angle douverture infrieur une limite
donne
min
, ce qui est notamment le cas lorsque lintersection choue, lalgorithme
sarrte. Dans ce cas, le nud est considr comme non visible, de mme que le reste
de la branche du PVS (cas reprsent par les sens interdits sur la gure 5.4).
FIG. 5.4: Processus dobservation bas sur les PVS. A gauche, lenvironne-
ment de test, avec les frusta des 3 PVS sortant du groupe A, ainsi
que du dPVS de lhumain virtuel. A droite, les arbres des PVS avec
une reprsentation des checs de lalgorithme dobservation.
Pour chaque nud de PVS valid de cette faon, un processus complmentaire plus n
est effectu. Un nuds de PVS reprsentant une bordure intergroupe du graphe topolo-
gique, ce traitement correspond lobservation dun groupe avec un champ de vision
quivalent au frustum produit par lalgorithme. Ce mme processus est aussi valu
pour le frustum initial, en considrant lobservation du groupe courant de lentit.
Donnes observes
Les donnes observes sont rcupres par le processus complmentaire lalgorithme
de parcours des PVS, et donc par une analyse ne des nuds slectionns. Comme nous
lavons introduit prcdemment, lhumanode ninterprte pas des donnes purement
gomtriques, mais va directement slectionner les informations avec leur smantique
dans la reprsentation de lenvironnement. Cette slection peut donc tre assimile la
mmoire court terme dun tre humain, o sont stockes de manire phmre len-
semble des informations visibles linstant prsent. La persistance de ces informations
correspond au temps entre deux rafrachissements de lalgorithme dobservation.
Le premier type dinformations rcupres concerne directement la topologie. Ainsi,
chaque bordure intergroupe visible, extraite de chaque nud de PVS slectionn, est
retenue par lagent autonome. Ces bordures sont stockes dans une liste non trie (Fi-
gure 5.5), et seront utilises dans ltape suivante pour construire une mmoire topolo-
gique.
Le second type dinformations rcupres concerne les objets interactifs prsents dans
lenvironnement. Comme nous lavons indiqu prcdemment (confre Section 4.3,
page 130), les objets interactifs BIIO sont intgrs notre description de lenvironne-
139
Le comportement de lhumain virtuel
ment. La slection des objets visibles se base sur cette intgration, suivant deux proc-
ds lis aux deux typologies dobjets :
Objets statiques obstacles : ces objets sont directement prsents sous la forme dun
nud orient dans le graphe topologique. Ainsi, ds que le nud correspondant
lobjet est valid par le parcours des PVS, lobjet est slectionn sans aucun
test supplmentaire.
Objets dynamiques ou libres : ces objets sont prsents dans une liste du groupe les
contenant. Lorsquun nud de PVS est slectionn, un test supplmentaire est ef-
fectu pour le groupe correspondant avec le frustum intersect obtenu. Par exem-
ple, sur la gure 5.5, lorsque la bordure AF est slectionne, le groupe F est
test. La slection est alors un simple test dappartenance de lobjet au frustum
intersect, lobjet tant approuv si le test russit.
Comme pour les donnes topologiques, une liste non ordonne est produite contenant
lensemble des objets slectionns (Figure 5.5). Cette liste sera ensuite utilise par des
processus de plus haut niveau, dont notamment la tche cognitive interagir, pour leur
fonctionnement interne.
FIG. 5.5: Donnes observes dans lenvironnement. A gauche, lenvironne-
ment de test avec ajout dobjets interactifs (carrs colors) et indica-
tion quant aux frusta intersects de lhumanode virtuel (en rouge).
A droite, les deux listes de donnes perues par analyse des PVS.
Nous avons ajout des contraintes individuelles concernant ces deux processus com-
plmentaires de slection :
Distance maximale. Une distance maximale D
max
perceptible est associe chacune
des deux donnes perues. Ds que cette distance est dpasse, les donnes cor-
respondantes ne peuvent plus tre perues. Si les deux distances sont dpasses,
le parcours du PVS vu prcdemment sarrte, devenant inutile. Notons que la
distance maximale associe aux donnes topologiques est forcment suprieure
ou gale celle associe aux objets.
Angle douverture minimal. Sur le mme principe que la distance maximale, un angle
douverture minimal
min
du frustum de visibilit est ncessaire pour permettre
la perception.
Facteur de densit. Le facteur de densit f
d
permet de simuler approximativement
la baisse des capacits de perception en fonction des densits de populations
entourant lhumain virtuel. Ce facteur va augmenter articiellement la distance
de parcours du regard D
r
suivant la formule suivante : D

r
= D
r
(1 +
f
d
d
l
4
)
Ce calcul se base donc sur la densit locale d
l
entre deux bordures intergroupes
perues, en bornant sa valeur 4pers./m
2
.
140
Accder aux informations de lenvironnement
5.2.2 Base de connaissances
La deuxime faon qua notre agent autonome daccder aux informations de lenvi-
ronnement est issue de sa capacit mmoriser des faits via une base de connaissances
individuelle, puis sy rfrer dans le futur. Cette connaissance correspond la m-
moire long terme, mais ne va traiter quun sous-ensemble restreint dinformations, et
sans avoir recours une quelconque capacit dabstraction individuelle des donnes.
La base de connaissances de notre entit est purement topologique, avec des processus
permettant dextrapoler dautres informations corrles. Nous avons fait ce choix sur-
tout pour des questions doccupation mmoire, les humanodes devant tre simuls par
milliers avec une capacit de stockage limite. Nous introduirons nanmoins un autre
mcanisme pouvant tre assimil une mmoire, mais qui sera gr localement par les
tches cognitives. Dautre part, les processus de renforcement et de rappel sont carts
dans notre approche, les diffrents processus de lagent autonome ayant directement
accs cette mmoire.
Connaissance topologique
La base de connaissances individuelle prend la forme dune liste associative, couplant
un marqueur temporel chaque bordure intergroupe du graphe topologique (reprsen-
te droite sur la gure 5.6). La taille mmoire de cette base est donc de lordre de
O(n
b
) avec n
b
le nombre total de bordures intergroupes du graphe.
FIG. 5.6: Gestion de la connaissance topologique. Agauche, lenvironnement
de test avec un exemple de parcours dun humain virtuel HV. Au
centre, les bordures perues par HV linstant t courant. A droite,
la connaissance topologique totale de HV, aprs prise en compte de
sa perception courante (les dates passes t sont arbitraires).
Le marqueur temporel peut prendre deux valeurs spciales ou une date absolue :
jamais La bordure est totalement inconnue, i.e. lentit ne connat mme pas son exis-
tence. Nous verrons par la suite que cette valeur empche tout processus de lhu-
manode de tenir compte de la zone de lenvironnement correspondante.
connu La bordure est seulement connue, i.e. lentit connat son existence, mais ne
la pas vue au cours de la simulation courante. Nous verrons par la suite que
cette valeur permet lentit de tenir compte de la zone correspondante, mais
lempche dvaluer toute information dynamique pouvant sy rattacher.
141
Le comportement de lhumain virtuel
date absolue Cette date correspond au moment o lentit a vue la bordure pour la
dernire fois, celle-ci tant donc forcment connue. Cette catgorie de valeurs
permettra lentit dvaluer des informations dynamiques se rattachant la
zone de lenvironnement, tout en tenant compte du temps coul.
La mise jour de cette base de connaissances est triviale : chaque fois quune bor-
dure est enregistre dans les donnes perues de lentit, le marqueur temps qui lui
correspond est rafrachi avec la date courante de la simulation. tant donn laspect
squentiel de cette base, cette opration seffectue en un temps constant.
Linitialisation de la connaissance peut tre faite de plusieurs faons, suivant le niveau
dhabitude des lieux que lon veut assigner lindividu. Tout dabord, la base est en-
tirement formate avec lune des deux valeurs spciales du marqueur temporel :
jamais pour un individu peu ou pas familier des lieux ;
connu si cest un usager trs courant (il connat lenvironnement dans ses moindres
dtails).
Cette premire initialisation peut ensuite tre rafne dans le cas des non habitus
(valeur jamais), an de leur fournir une connaissance approximative des lieux. Ainsi,
un processus associe la valeur connu certaines bordures, en se basant sur deux types
de congurations :
1. En listant une une les bordures considrer comme connues, processus labo-
rieux mais contrl.
2. En spciant des couples de bordures de dpart et darrive, puis en appliquant
un algorithme de planication de chemin pour les relier. Une fois le chemin
trouv, toutes les bordures qui le composent sont mises jour avec la valeur
connu.
Notons que de telles initialisations peuvent tre effectues a priori, an de crer des
typologies de connaissances des lieux, qui pourront ensuite tre directement affectes
aux agents autonomes. Par exemple dans une gare, on peut crer une typologie voya-
geur affaire qui connat seulement les chemins entre les quais des trains de banlieue et
les sorties, et une catgorie passant qui connat seulement les chemins entre les accs
vers la ville.
Extrapolation des informations
Nous venons de voir que la connaissance de notre agent autonome est limite la date
o il a peru diffrentes zones. Malgr tout, celui-ci a besoin dautres informations
pour effectuer certaines de ses tches, comme par exemple valuer son chemin. Ainsi,
il va devoir tre capable de se rappeler de certaines informations prsentes lintrieur
des zones de lenvironnement quil a pu voir, et potentiellement dextrapoler ces infor-
mations si elles sont caractre dynamique. Pour se faire, lagent autonome a recours
sa base de connaissances individuelle, quil va corrler avec les informations environ-
nementales globales disponibles dans le graphe topologique. Dtaillons les diffrentes
donnes gres.
Position des objets statiques. La position des objets statiques est la plus simple
grer. Cette information est directement tire de la connaissance topologique : si une
bordure correspondant au nud orient dun objet statique est connue, alors la position
de lobjet lest aussi.
142
Accder aux informations de lenvironnement
Position des objets dynamiques. Connatre la position des objets dynamiques re-
vient connatre la liste des objets contenus par un groupe du graphe topologique.
Nous avons volontairement simpli ce processus an de ne pas surcharger la gestion
mmorielle de nos entits. Ainsi, la liste des objets contenus par un groupe est ac-
cessible par lagent autonome sil a aperu une bordure du groupe depuis moins dun
certain temps. Cette valeur peut tre adapte suivant la catgorie dobjets considrs,
pour reter diffrentes estimations de leur vitesse de dplacement.
Caractristiques des objets. Les caractristiques internes des objets, i.e. la valeur
de leurs attributs, est une information caractre dynamique, et donc prissable. Pour
savoir si les informations actuellement contenues par lobjet peuvent tre exploites,
car sufsamment proches de ce qui a t peru, il faut valuer le temps qui sest coul
depuis cette perception. Comme la seule information de temps disponible est lie aux
bordures intergroupes, il faut faire correspondre lobjet considr avec une de ces bor-
dures. Pour se faire, le PVS (ou le dPVS) de lobjet est parcouru, en retenant la date
correspondant la bordure qui a t vue pour la dernire fois. Cette date est alors
value pour savoir si linformation contenue par lobjet peut tre lue, ou si elle est
considre comme prime. Dans ce dernier cas, linformation est ignore. Ce proces-
sus intervient principalement pour lvaluation de la condition locale des affordances,
seulement effectue si leffecteur considr a t vu il y a peu de temps. Nous xons
cette date de premption une valeur arbitraire de cinq minutes.
Valeurs de densits locales et globales, ainsi que compteurs de ux. Ces informa-
tions sont rcupres sur le mme principe que les deux prcdentes. Ainsi, un temps
de rfrence est valu pour symboliser la date o linformation a t perue : la date
la plus proche des bordures du groupe pour la densit globale, la date la plus loigne
des deux bordures impliques pour la densit locale et le ux. Ce temps est ensuite
test pour savoir si linformation contenue par le graphe topologique est sufsamment
proche de ce qui a t peru. Dans le cas contraire, linformation est ignore.
Nous pouvons donc voir que les informations environnementales ne sont pas direc-
tement stockes par la mmoire individuelle de lagent autonome, mais directement
exploites dans la dnition globale de lenvironnement. Ce principe permet de limiter
la charge de stockage de la connaissance, mais introduit un biais dans les informa-
tions dont lentit se rappelle : ces informations ont potentiellement chang depuis la
dernire perception.
Autre mcanisme mmoriel
Nous devons tout de mme spcier quun autre mcanisme de lagent autonome peut
tre assimil une mmoire. En effet, en temps que spcialisation de linteracteur BIIO,
lhumain virtuel dispose de toutes ses fonctionnalits, dont notamment la gestion des
ressources. Comme nous lavons voqu dans la section 3.2, page 94, ces ressources
peuvent tre cres, dtruites, et modies dynamiquement, et reprsenter nimporte
quel type de donnes. Elles correspondent donc un mcanisme mmoriel de court
long terme.
143
Le comportement de lhumain virtuel
Nous ne dtaillerons pas plus leur fonctionnement, nayant aucun processus ddi autre
que leur gestion gnrique par lobjet interactif physique. Notons simplement que ces
ressources pourront tre utilises spciquement par certaines tches cognitives ou
affordances, an de stocker des symbolisations persistantes de lhumanode, comme
ltat dune donne environnementale importante. Citons par exemple la destination
dun voyageur au dpart dans une gare, ou encore le quai o se trouve son train.
5.2.3 Conclusion
Nous venons de prsenter les deux premiers mcanismes de lhumain virtuel : sa per-
ception et sa mmoire. La perception constitue le premier comportement ractif de
notre modle. Elle permet dextraire la smantique visible de lenvironnement, et donc
de rendre nos entits non omniscientes. La mmoire est complmentaire cette percep-
tion, permettant la persistance des informations rcupres. Nous avons ainsi propos
un modle simpli de connaissance topologique rpondant aux contraintes de sto-
ckage imposes par nos objectifs. Il a tout de mme t voqu la possibilit dtendre
le mcanisme mmoriel de manire gnrique, grce la notion de ressources intro-
duite par BIIO. Nous verrons que ces deux mcanismes sont fondamentaux dans notre
architecture dhumain virtuel, car ils participent la plupart des autres comportements
ractifs ou cognitifs.
5.3 La planication de chemin
Maintenant que notre humain virtuel est capable dapprhender son environnement,
nous allons voir son premier mcanisme dcisionnel visant planier un chemin. Cette
tche peut tre considre comme ractive dans notre classication, car sufsamment
habituelle pour un tre humain pour ne pas ncessiter une attention trop soutenue. Nous
allons voir que ce processus ne se charge pas seulement dune valuation topologique
du chemin, mais quil prend une part active dans le raisonnement li linteraction,
permettant de situer ce dernier.
5.3.1 Un algorithme hirarchique
Commenons par dnir le fonctionnement gnral de la planication de chemin. Son
objectif est de fournir un rsultat gomtrique simple, permettant de guider la locomo-
tion de lhumanode, en se basant sur la dnition topologique abstraite de lenviron-
nement, permettant davoir une vue plus gnrale des endroits parcourir. Le parallle
peut tre fait aisment avec un humain rel, qui value son chemin de faon globale,
au niveau de la ville par exemple, mais qui ne rafne ce chemin que localement pour
se concentrer sur les interactions immdiates. Ce principe est dautant plus intressant
pour notre modlisation quil permet daccrotre les performances de notre algorithme,
celui-ci nayant besoin de neffectuer des analyses que par parties dans des reprsenta-
tions de plus en plus nes.
Nous tirons donc avantage ici de la dnition hirarchique de lenvironnement, en pro-
posant une planication de chemin elle aussi hirarchique. Notre algorithme va en effet
144
La planication de chemin
traiter successivement les trois couches du graphe topologique, en commenant par la
plus abstraite. Les tapes de lalgorithme sont donc (Figure 5.7) :
FIG. 5.7: Planication de chemin hirarchique. Seule la premire tape des
rafnements successifs est reprsente pour des questions de lisibi-
lit.
1. Planier de faon globale dans le graphe des zones de lenvironnement. Cette
tape est celle qui effectue rellement la dcision du chemin, pouvant tre spcialise de
diffrentes faons pour rechercher des catgories spciques de destinations (position
dans lespace, caractristique dun nud, objet contenu, etc.). Le chemin produit est
une succession de zones traverser, commenant par la zone courante de lhumain
virtuel.
2. Rafner le chemin en planiant dans les groupes de lenvironnement inclus
dans les zones composant le chemin. Cette tape intermdiaire est totalement gn-
rique, utilisant un algorithme de parcours des graphes de type A

. Cette planication
se fait par parties, pour relier successivement deux zones connexes du chemin depuis
le groupe courant jusquau premier groupe de la zone suivante. Le chemin produit est
donc une succession de groupes traverser, en commenant par le groupe courant de
lagent autonome. Notons que ce chemin nest pas rafn dans sa totalit, mais seule-
ment jusqu la premire zone non visible par lhumanode. Pour dterminer quelle est
la premire zone non visible, le PVS de la premire bordure du chemin est test : une
bordure du chemin nest pas visible si elle ne fait pas partie de ce PVS, i.e. elle nest
pas reprsente par un nud.
3. Rafner totalement le chemin obtenu sous forme de groupes en planiant dans
le graphe correspondant la subdivision. Cette tape nale produit un chemin com-
pos dune succession de cellules de la subdivision, en commenant par la cellule cou-
rante de lentit. Encore une fois, cette tape est totalement gnrique utilisant un al-
gorithme de parcours des graphes de type A

. De la succession de cellules peut tre


extrait une succession de bordures franchissables, constituant le niveau de reprsenta-
tion gomtrique du chemin valu.
Nous reviendrons plus tard dans cette section sur lvaluation du chemin global, celle-
ci dpendant de la condition de n spcie. Concernant le chemin intermdiaire, la
traverse des nuds du graphe y est quantie en se basant sur une heuristique multi-
critres, sur laquelle nous reviendrons aussi par la suite. Ces deux premires tapes de
planication ont toutes les deux une spcicit quant aux nuds valus : seuls les arcs
connus du graphe sont emprunts, i.e. seulement ceux dont ltat est diffrent de jamais
dans la base de connaissances individuelle. Cette proprit permet ainsi dinclure la
connaissance des entits dans leur processus de dplacement, et renforce ainsi laspect
non omniscient de lhumain virtuel.
145
Le comportement de lhumain virtuel
Indpendamment de ces considrations, lalgorithme dvaluation du chemin interm-
diaire (Algorithme 1) fonctionne par parties en se focalisant sur un couple de zones
la fois. Il utilise la dnomination suivante :
Z
i
la zone numro i du chemin global, dont notamment :
Z
0
pour la zone courante de lhumanode ;
Z
f in
pour la dernire entre du chemin.
Ch le chemin en construction, compos dune succession de groupes ;
G
i
le groupe du chemin en construction suivant les mmes conventions que Z
i
;
RAFFINER(g , dest) lalgorithme de rafnement du chemin global, produisant un
chemin intermdiaire entre le groupe dorigine g et la destination dest (qui peut tre
un groupe ou une zone) ;
BORDURE(g
a
, g
b
) une fonctionnalit permettant de rcuprer la bordure entre les
groupes g
a
et g
b
;
PVS(b , g) une fonctionnalit permettant de rcuprer le PVS partant dune bordure
b et orient vers le groupe g.
Algorithme 1 valuation du chemin intermdiaire par parties
ENTRES: G
crt
le groupe courant de lhumanode, G
dest
son groupe de destination.
1: g G
crt
2: i 1
3: Ch RAFFINER(g , Z
1
)
4: pvs PVS(BORDURE(G
0
, G
1
) , G
1
)
5: TANTQUE g pvs Z
i
= Z
f in
FAIRE
6: g G
f in
7: i i +1
8: Ch Ch RAFFINER(g , Z
i
)
9: FIN TANTQUE
10: SI Z
i
= Z
f in
ALORS
11: Ch Ch

RAFFINER(G
f in
, G
dest
)
12: FINSI
13: RENVOYER Ch
Dtaillons le fonctionnement de cet algorithme. Ligne 3, le chemin intermdiaire est
initialis avec le rafnement depuis le groupe courant de lhumanode vers la premire
zone du chemin global. Cela permet, ligne 4, dextraire le PVS de rfrence qui servira
pour effectuer le test de visibilit. Entre les lignes 5 et 11, les zones sont rafnes deux
deux tant quelles sont visibles ou jusqu ce que la dernire soit atteinte. La ligne
12 permet de rafner la dernire zone du chemin si elle est visible, depuis son entre
jusquau groupe de destination.
Nous ne dtaillerons pas la troisime et dernire tape de lalgorithme de planication,
qui fonctionne exactement de la mme manire que la seconde, mais sans faire de test
de visibilit.
Si lon considre le parcours total du chemin, on se rend compte que celui-ci sera to-
talement valu dans les trois couches du graphe. Comparativement une valuation
directe dans la couche la plus basse, lintrt de cette approche provient du dcoupage
du problme dans des sous-ensembles de dimension bien infrieure. Tout dabord, le
graphe le plus abstrait a des dimensions bien infrieures au graphe de la subdivision
146
La planication de chemin
(confre Section 4.1.2, page 122), rendant son exploration autrement plus efcace. En-
suite, les deux tapes de rafnement sont contraintes lexploration du sous-graphe
inclus dans un seul nud de niveau suprieur, rfutant automatiquement tout lment
extrieur. Ces deux tapes sont donc extrmement rapides, neffectuant que peu de
choix dans des espaces de recherche trs limits. Ainsi, la somme des valuations hi-
rarchiques a une complexit de calcul bien infrieure une valuation plane dans le
graphe le moins abstrait, dautant plus que labstraction est uniforme et efcace sur les
deux couches abstraites.
Deux autres intrts rsultent de la planication par parties. Premirement, elle permet
de rpartir les calculs dans le temps, le rafnement du chemin ne seffectuant quau fur
et mesure que lentit se dplace et peroit de nouvelles zones. Deuximement, elle
permet de limiter la perte de calcul lorsquun chemin est invalid, parce que lentit
change de destination par exemple, ou parce quune zone de lenvironnement devient
inaccessible.
5.3.2 Modes de planication globale
Nous avons mis en vidence que le rel choix du chemin, permettant datteindre une
destination, est effectu par la planication globale sur la couche la plus abstraite. Trois
spcialisations de cette planication sont proposes, permettant datteindre trois cat-
gories de destinations. Chacune de ces spcialisations se diffrencie par lvaluation de
la condition de n de lalgorithme de parcours de graphe, qui est ici de type oodll.
Rappelons que nous utilisons ce type dalgorithme, bien que plus lent quun A

, pour
deux raisons :
Il ne ncessite pas dheuristique estimant la distance au but. Comme nous le verrons
par la suite, celle-ci serait extrmement difcile valuer compte tenu du nombre
de critres entrant en jeu, voire mme impossible dans les cas o la destination nest
pas connue a priori.
Il obtient le chemin optimal sil existe. Par chemin optimal nous entendons celui qui
minimise les critres dvaluation, et pas seulement la distance. Cette proprit est
fondamentale si lon veut pouvoir caractriser des circulations de personnes ralistes.
Nous allons donc prsenter les trois types de destination envisageables pour lvalua-
tion dun chemin : atteindre un lieu, explorer son environnement, et choisir une in-
teraction. Nous indiquerons pour chacun de ces modes les cas dchec potentiels qui,
comme nous le verrons dans la section 5.5, page 180, se rpercuterons sur certaines
des tches cognitives de lhumanode. Nous introduirons enn la notion de condition
darrt oue, permettant la recherche de chemin dtre plus exible lorsquelle doit
elle mme choisir une destination.
Atteindre un lieu
Ce premier mode correspond une planication de chemin classique, visant atteindre
un lieu identi dans lenvironnement. Ce lieu est donc connu a priori, et communiqu
la procdure. Il y a deux possibilits dchec de cette mthode :
1. Sil nexiste pas de chemin entre la position courante de lhumain virtuel et la
destination spcie. Ce cas peut se produire si les deux positions sont dans
147
Le comportement de lhumain virtuel
des environnements diffrents non interconnects, ou si les interconnexions en
question sont sens unique mais toutes orientes de la destination vers la position
courante.
2. Sil nexiste pas de chemin connu entre la position courante et la destination.
Ce cas se produit si lentit a une connaissance partielle de lenvironnement, ne
permettant pas de relier les nuds courant et nal du graphe.
Explorer son environnement
Ce second mode de planication est plus conceptuel, cherchant a atteindre des zones
mconnues par lentit. Aucune destination nest ici spcie au dpart de lvaluation,
la position cible tant le rsultat du processus. Deux types dexploration peuvent tre
envisages :
1. Dcouvrir de nouvelles zones. La condition de n est donc ici datteindre une
bordure dont ltat est jamais dans la connaissance individuelle.
2. Rafrachir sa connaissance. La condition de n est donc ici datteindre une bor-
dure qui a t vue depuis plus dun certain temps t donn.
Ces deux conditions peuvent tre values simultanment, la recherche de nouvelles
zones tout en voulant rafrachir ses connaissances sur le monde. Cette mthode peut
chouer si lentit connat parfaitement son environnement, et donc si lensemble des
bordures ont t vues depuis moins de t.
Choisir une interaction
Ce dernier mode de planication participe au processus de dcision quant aux inter-
actions effectuer. Nous aborderons la pr-slection des interactions dans les sections
suivantes, avec la tche cognitive interagir (confre Section C, page 245) et laspect
rationnel de lhumanode (confre Section 5.6, page 186). Partons pour le moment du
principe que lagent autonome dsire effectuer un certain nombre dinteractions, consi-
dres comme rationnellement valides. Cette procdure va ainsi planier un chemin
dans lenvironnement, la recherche dun effecteur autorisant lune de ces interac-
tions. La condition darrt est donc vrie lorsquun nud du graphe associ avec un
de ces effecteurs est rencontr. Deux cas peuvent alors se produire :
1. La connaissance de ce nud est considre comme prime, la condition est
alors valide sans test supplmentaire.
2. La connaissance de ce nud permet daccder aux proprits des objets quil
contient, un test supplmentaire est alors effectu. Ainsi, la pr-condition locale
de laffordance est value, en tenant compte de lhumanode courant et de lef-
fecteur slectionn, ne validant la condition darrt quen cas de russite.
Cette procdure peut chouer si aucun effecteur compatible avec lune des affordances
dsire nest trouv.
Condition darrt oue
Pour une planication standard, destination connue a priori, lalgorithme oodll
peut accepter le premier chemin quil trouve, son optimalit tant garantie. Ce prdicat
148
La planication de chemin
nest plus vri pour les deux autres modes que nous proposons. Nous nentrerons
pas dans les dtails de la quantication de la longueur du chemin ici (elle sera aborde
plus loin dans cette section), mais sachons que celle-ci est dpendante, pour ces deux
planications, de lvaluation de la condition de n. Ainsi, on ne peut juger de la qualit
dun chemin sans lavoir compar un autre, potentiellement plus loin en terme de
distance.
Pour illustrer ce principe, prenons le cas de la recherche exploratoire, dont la quan-
tication est sensible ce que nous nommerons le potentiel de dcouverte associ
un nud. Il est possible que lalgorithme de parcours trouve tout dabord un chemin
vers un nud ayant un faible potentiel de dcouverte, car celui-ci est plus prs, alors
que le meilleur choix serait un chemin plus long mais amenant dans une zone avec un
fort potentiel de dcouverte. Un autre exemple plus concret serait pour la mthode de
choix dune interaction. Il est possible que lalgorithme trouve dabord un effecteur
valide proximit, mais avec une grande le dattente, alors quun autre est disponible
quelques mtres plus loin sans que personne ne lutilise.
Pour rsoudre ce problme, nous avons introduit la notion de condition darrt oue
dans les deux derniers modes de planication de chemin. Ce type de condition dar-
rt va permettre lalgorithme de continuer lgrement son exploration, alors quun
chemin a dj t trouv, pour vrier si une meilleure destination nest pas dispo-
nible. Pour se faire, lalgorithme (Algorithme 2) est paramtr avec un certain niveau
de libert l. Celui-ci autorise la poursuite de lexploration jusqu une distance de
libert D
max
= d +l (ligne 6) lorsquune condition darrt est valide une distance
d (ligne 5). Si une autre condition darrt est valide, elle nest retenue que si sa dis-
tance de libert est infrieure celle stocke (lignes 7-10). Lexploration se termine ds
que lalgorithme a couvert lensemble du graphe, ou ds quun nud se trouvant une
distance suprieure D
max
est atteint (ligne 4).
Algorithme 2 Exploration avec condition darrt oue
ENTRES: l le niveau de libert de lexploration.
1: dest aucune
2: D
max

3: Z Z
crt
4: TANTQUE Z = aucune DISTANCE(Z) < D
max
FAIRE
5: SI CONDITIONARRT(Z) = vrai ALORS
6: D
crt
DISTANCE(Z) + QUANTIFICATION(Z) +l
7: SI D
crt
< D
max
ALORS
8: D
max
D
crt
9: dest Z
10: FINSI
11: FINSI
12: Z ZONESUIVANTE
13: FIN TANTQUE
14: RENVOYER dest
149
Le comportement de lhumain virtuel
5.3.3 Heuristique multi-critres
Les diffrentes tapes de la planication de chemin hirarchique sont bases sur des
algorithmes de parcours de graphe. Ces algorithmes ncessitent une heuristique an de
quantier la traverse de chaque nud, pour au nal pouvoir juger de la qualit dun
chemin. Le meilleur chemin sera celui qui, en atteignant la destination, minimise la
somme des quantications des nuds traverser.
Principe
Nous avons vu dans ltat de lart (confre Section 1.5.4, page 45) que de nombreux
facteurs peuvent entrer en ligne de compte lors de lvaluation dun chemin. Nous
proposons une mthode permettant de tenir compte de plusieurs de ces facteurs simul-
tanment. Ceux-ci tant de natures diffrentes, une base de comparaison autorisant leur
fusion doit tre choisie.
Nous proposons dutiliser une unit temporelle, en convertissant chaque facteur de
planication en un temps de traverse correspondant Q
f
:
Q =

f facteurs
(Q
f
)
Cette conversion correspond parfois une valeur relle (comme pour la distance par-
courir une certaine vitesse), parfois une valeur estime de perte de temps par lagent
autonome (comme pour la traverse dune zone de forte densit). Ainsi, nous prenons
en compte des facteurs quantitatifs, valus de la mme manire par toutes les entits,
et des facteurs qualitatifs, valus subjectivement par chaque entit suivant un degr de
prfrence P
f q
individuel. Ce degr de prfrence correspond la quantit maximale
de temps attribue par lhumanode un facteur, si celui-ci est son paroxysme. Pour
juger du niveau de ralisation dun facteur qualitatif, une valeur V
f q
lui est attribue par
un processus gnral, avec 0 V
f q
1, ou la valeur spciale V
f q
=si le facteur est
considr comme infranchissable. Ainsi, la quantication dun facteur qualitatif sera :
Q
f q
= P
f q
.V
f q
Nous allons prsenter deux catgories de quantication : la premire gnrique, sap-
pliquant tous les types de planication, la deuxime spcique, et donc diffrente
pour chaque type de planication globale. Les gures prsentes utiliseront la lgende
de la gure 5.8.
FIG. 5.8: Lgende utilise pour les facteurs de planication de chemin.
150
La planication de chemin
Quantication gnrique
La quantication gnrique est value pour tous les nuds quel que soit le type de
planication utilis. Elle commence par tenir compte dune valeur quantitative, puis
applique des modicateurs qualitatifs.
Certaines des valeurs considres sont dynamiques, telles que les densits de per-
sonnes. Leur valuation a recours au processus mmoriel de lagent autonome, ces
donnes tant ignores en cas dchec (dans le cas o les informations sont consid-
res comme primes).
Distance parcourir. La quantication est initialise avec la distance parcourir
pour traverser un nud, qui est le seul facteur quantitatif. Pour des questions de per-
formances, cette distance est directement rcupre dans les valeurs pr-calcules des
nuds abstraits du graphe (Figure 5.9).
(a) Cellules. (b) Groupes et zones.
FIG. 5.9: Facteur de distance lors de la planication de chemin. (a) La dis-
tance est calcule pour les cellules de la subdivision. (b) La distance
est obtenue dans les valeurs pr-calcules des groupes, et dduite
pour les zones.
La distance D est convertie en temps grce la vitesse de lhumanode v
hum
:
Q
distance
=
D
v
hum
Cette vitesse est obtenue en bornant la vitesse dsire de lentit v
des
par la vitesse
maximale possible pour le nud suivant la densit locale de population d
loc
sy trou-
vant, par application directe des niveaux de service de J.J. Fruin :
v
hum
=
_

_
v
des
si d
pop
< 0.3
(3.79d
loc
) 0.37 si 0.3 d
loc
3
0 si d
loc
> 3
Notons que cette valuation de vitesse maximale nest faite que pour les nuds dont
la connaissance est able, permettant daccder linformation de densit. Dans le cas
contraire, v
des
est directement applique. Dautre part, lorsque la vitesse de traverse est
value 0, le nud est alors considr comme infranchissable avec une quantication
innie.
Largeur du chemin. Ce second facteur, qualitatif, permet dintroduire une prf-
rence pour les espaces de circulation larges plutt qutroits. Son calcul se base sur la
largeur de chemin assigne aux nuds du graphe topologique (Figure 5.10).
151
Le comportement de lhumain virtuel
(a) Cellules. (b) Groupes et zones.
FIG. 5.10: Facteur de largeur du chemin. (a) La largeur est celle de la pre-
mire bordure traverse pour les cellules. (b) La largeur est celle
de la bordure la plus troite lintrieur des groupes et zones.
La valeur associe ce facteur qualitatif se base sur une largeur maximale signicative
pour lentit, proportionnelle sa distance inter-paules d
ep
, compare la largeur
effective du nud l
n
:
V
largeur
=
_

_
si l
n
< d
ep
0 si l
n
> d
ep
11
1.1
l
n
d
ep
10
sinon
Direction courante. Cet autre facteur qualitatif introduit le critre de minimisation
des changements de direction tout au long du chemin. Son calcul se base sur la direction
de traverse assigne aux nuds du graphe topologique (Figure 5.11).
(a) Cellules. (b) Groupes et zones.
FIG. 5.11: Facteur de direction courante le long du chemin. La direction
lentre du nud est compare celle ncessaire sa traverse.
La valeur associe ce facteur qualitatif compare la direction de lentit lentre du
nud

dir
pre
celle de traverse

dir
crt
. La direction lentre

dir
pre
est la direction de
traverse du nud prcdent, ou la direction entre la position de lentit et la premire
bordure au dpart de la planication. De la mme manire, la direction de traverse

dir
crt
est celle entre la dernire bordure et la position darrive pour le dernier nud
de la planication. Les deux directions sont normes pour le calcul de la valeur du
facteur :
V
dirc
=
1
2
(1

dir
pre

dir
crt
)
Densits de personnes. Ce facteur qualitatif nest valu que pour les nuds dont
la connaissance a t rafrachie rcemment. Il permet dintroduire une notion de pr-
frence pour les emplacements peu peuples de lenvironnement, vitant ainsi les en-
droits trop congestionns. Son calcul se base sur les densits globales d
glob
de popula-
152
La planication de chemin
tion associes aux groupes et zones, le facteur tant ignor pour les cellules.
V
den
=
_
_
_
d
glob
3
si d
glob
3
sinon
Flux de populations. Tout comme les densits de personnes, ce facteur qualitatif
nest valu que pour les nuds dont la connaissance a t rafrachie rcemment. Son
but est de pousser lentit rejoindre des circulations de personnes compatibles avec
son sens de parcours. Son calcul se base sur les compteurs de ux associs aux groupes
et zones, le facteur tant ignor pour les cellules.
Rappelons quun ux F
i, j
est associ chaque couple de bordures (i, j) dun groupe,
reprsentant le nombre de personnes se dplaant entre ces bordures. Avec n le nombre
de bordures dun groupe, et s le numro de la bordure de sortie pour la planication en
cours, les ux compatibles avec le sens de parcours dune entit sont quivalents :
F
comp
=

i[1,n]\s
F
i,s
Ainsi, on obtient comme valeur pour ce facteur de ux de populations :
V
f lux
= 1
F
comp
population du groupe
Quantication spcialise
Maintenant que nous avons vu les diffrents facteurs pris en compte par toutes les
planications de chemin, tudions plus prcisment les critres spciques chaque
catgorie de planication globale. Le but est ici de prendre en considration, et donc de
quantier, lattrait dun nud du graphe par rapport lobjectif de la recherche de che-
min. Nous allons donc passer en revue les trois catgories de destinations envisageables
avec la faon de les quantier.
Atteindre un lieu. Ce processus de planication cherche atteindre un lieu identi
par sa position. Nous introduisons ici un facteur de minimisation de lcart la direc-
tion de la destination. Ce facteur qualitatif permet lentit de prfrer les chemins les
plus directs vers sa destination. Son calcul se base sur la direction de traverse assi-
gne aux nuds du graphe topologique

dir
crt
, compare une direction estime vers
la destination (Figure 5.12).
La direction vers la destination

dir
dest
correspond la direction entre la bordure den-
tre de la zone et la position nale atteindre. Les deux directions sont normes pour
le calcul de la valeur du facteur :
V
dird
=
1
2
(1

dir
dest

dir
crt
)
Explorer son environnement. Ce processus de planication cherche amliorer les
connaissances topologiques individuelles. Nous introduisons ici un facteur de maximi-
sation du potentiel de dcouverte. Le but de ce facteur qualitatif est de pousser lentit
153
Le comportement de lhumain virtuel
(a) Cellules. (b) Groupes et zones.
FIG. 5.12: Facteur de direction vers la destination. La direction vers la desti-
nation est compare celle ncessaire la traverse du nud.
se diriger vers les endroits pouvant amliorer au maximum ses connaissances. Le
potentiel de dcouverte dun nud P
dec
est valu de la faon suivante :
P
dec
=
10card(bordures inconnues) +card(bordures mconnues)
10card(bordures)
Une bordure est inconnue si elle a un tat jamais dans la base de connaissances. Une
bordure est mconnue si elle a un tat simplement connu, ou si sa date de dernire
visibilit est assez ancienne pour conclure la premption des informations quelle
contient. La valeur de ce facteur est alors la suivante :
V
dec
= 1P
dec
Choisir une interaction Cette dernire procdure de planication vise choisir un
couple affordance/effecteur. Le but est donc double ici : choisir parmi lensemble des
interactions immdiatement dsires par lhumanode, et choisir parmi lensemble des
effecteurs de lenvironnement permettant cette interaction. Comme lon peut sen dou-
ter, ces deux dcisions sont intimement lies, les tres humains ayant un comportement
opportuniste les poussant utiliser en premier lieu les quipements les plus accessibles.
Nous utilisons deux quantications spcialises pour rsoudre cette concurrence, lune
qualitative et lautre quantitative.
Le facteur qualitatif se base sur la priorit hirarchique P
H
des interactions prs-
lectionnes par lhumanode, i.e. actives au moment de la planication (confre Sec-
tion 3.4.2, page 107). Nous calculons tout dabord le poids total des interactions :
P
inter
=

P
H
(affordances actives)
Ensuite, quand un nud contient un effecteur, celui-ci est quanti vis vis des af-
fordances actives quil propose aff
act
, qui est lintersection entre lensemble des affor-
dances actives de lhumanode et lensemble des affordances de leffecteur :
V
prio
= 1

aaff
act
P
H
(a)/P
inter
Le facteur quantitatif se base quant lui sur les temps dattente et dutilisation associs
aux affordances raliser. Ces temps sont estims pour chaque affordance a dnie
prcdemment, grce leffectif de la le dattente E
A
(a), le nombre de personnes
pr-abonnes N
P
(a), et le temps dexcution moyen T(a), tous trois dpendant de laf-
fordance et de leffecteur valu (confre Chapitre 3, page 91). La valeur spciale inni
154
La planication de chemin
est affecte cette quantication dans le cas o laffordance ne supporte pas lattente
et si aucune position dutilisation nest disponible. Si lhumanode est dj abonn
leffecteur, N
P
(a) est considr comme nul, et E
A
(a) ne tient compte que des personnes
se trouvant devant ; de plus, T(a) est diminu de 10% dans ce cas l pour exprimer la
persistence de la prise de dcision. Ainsi, la quantication de temps dutilisation est
calcule de la faon suivante :
Q
uti
=

aaff
act
T(a) [1+E
A
(a) +
1
2
.N
P
(a)]
Au nal, la quantication dun effecteur vis vis des affordances actives de lhuma-
node sera :
Q
af f
= Q
uti
+P
prio
V
prio
Remarquons que bien que nous ayons class ce type de quantication spcialement
pour la planication ddie linteraction, la quantication du temps dutilisation Q
uti
est aussi ncessaire de manire plus gnrale. En effet, le cas particulier des objets tra-
versables ncessite cette quantication, an dvaluer le temps de parcours des nuds
correspondants. Dans ce cas, Q
uti
nest plus valu en tenant compte des affordances
dsires de lhumanode, mais de laffordance spontane de leffecteur traversable. En-
suite, Q
uti
est directement ajout la quantication du nud, quelle que soit la pro-
cdure de planication employe. Notons que si aucune affordance spontane nest
disponible pour lobjet, la quantication dutilisation prend alors la valeur spciale in-
ni interdisant le parcours de ce nud. Par exemple, ce cas peut se produire en simulant
une personne en fauteuil roulant qui cherche atteindre un tage suprieur, et dont les
chemins passant par les escaliers se verront bloqus au prot de ceux passant par les
ascenseurs.
5.3.4 Analyse du chemin valu
Maintenant que nous avons dni comment valuer un chemin dans lenvironnement,
voyons plus en dtail la faon dont nous traitons les donnes produites. Le rsultat de
cette planication dispose dune composante abstraite, indiquant globalement le par-
cours sous forme de zone traverser, et dune composante gomtrique ne, indiquant
localement la succession de segments franchir (ce sont les bordures inter-cellules).
An de permettre une exploitation simple de ce chemin, nous allons synthtiser ces
informations de deux faons diffrentes.
Interactions mergeantes
Le but est ici dintgrer au raisonnement de nos entits des interactions non dsires
avant la planication, mais dont le besoin merge de lvaluation du chemin. Ces inter-
actions mergeantes sont issues des objets traversables rencontrs le long du chemin,
et sont symbolises par leur affordance spontane.
La premire tape de ce processus consiste donc dtecter la prsence dun de ces
objets dans le chemin. Quelle que soit la mthode de planication utilise, le chemin
abstrait est toujours exprim sous la forme dune succession de zones traverser. Dans
155
Le comportement de lhumain virtuel
le cas o des objets traversables sont emprunter, les nuds du graphe topologique qui
leur correspondent se retrouvent dans le chemin nal. Par exemple, sur la gure 5.13,
lhumain virtuel doit emprunter deux escaliers pour se rendre de la zone A la zone
E. Le chemin produit comporte ainsi deux nuds correspondants des objets traver-
sables : B et D. La dtection dune interaction mergeante est alors triviale, puisquil
suft de rechercher le premier nud du chemin supportant un objet traversable, puis
den extraire laffordance spontane. Ainsi, dans le cas o plusieurs objets traversables
sont emprunts, seul le premier produit une interaction mergeante, les suivants tant
traits au fur et mesure de la progression dans lenvironnement.
(a) Environnement de dmonstration, avec chemin et nom des
zones en rouge.
(b) Chemin abstrait quivalent,
avec les nuds correspondant
des objets traversables en bleu.
FIG. 5.13: Exemple de chemin avec interaction mergeante. Lhumain virtuel
doit traverser les escaliers B et D pour se rendre dans la zone E.
Maintenant que nous avons identi une affordance mergeante, il suft pour lacti-
ver de linscrire dans le gestionnaire daffordances de linteracteur. Celle-ci bncie
alors des mmes capacits de traitement que nimporte quelle autre affordance, telle
que lexcution hirarchique.Notons nanmoins quen tant quaffordance mergeante,
et donc non dsire a priori, celle-ci ne participe pas la quantication du processus de
planication effectuant un choix entre plusieurs interactions. Dautre part, si un nou-
veau chemin vient tre plani, et que celui-ci ne comporte pas le nud traversable
de cette affordance mergeante, elle est immdiatement retire des affordances gres
par lhumain virtuel.
Pour nir, on peut remarquer que cette interaction mergeante constitue une synthse
dinformation vnementielle, ayant lieu chaque fois que le processus de planication
global est effectu, ou que le nud support de cette interaction est dpil du chemin.
Optimisation visuelle
Loptimisation visuelle a pour but de synthtiser la portion visible du chemin de bas
niveau, pour obtenir une information simple pouvant tre directement interprte par
le processus de navigation ractive. Nous allons donc extraire de ce chemin 2 informa-
tions :
1. Une direction de mouvement optimale, reprsente par un vecteur norm

dir
opt
.
2. Une distance maximale de mouvement sans obstacle dist
mov
, suivant la direction
prcdente.
Ces deux informations doivent tre sensibles aux donnes suivantes :
156
La planication de chemin
La succession de bordures traverser produites par le chemin de bas niveau. Cette
succession de bordures correspond la portion visible du chemin. De plus, les seg-
ments supportant les bordures sont garantis libres dobstacles statiques deux deux,
grce aux proprits de la subdivision spatiale qui les a gnres.
La premire bordure non visible du chemin de haut niveau. La navigation de lhu-
main virtuel doit en effet le pousser se diriger vers cette bordure, an de minimiser
ses changements de direction.
La premire tape de cette optimisation visuelle est le calcul dun frustum compos,
de manire quivalente la mthode des PVS. Ce frustum a pour origine la position
de lagent autonome, et va intersecter successivement les bordures du chemin. Cette
intersection nest pas directement calcule avec le segment support de la bordure, mais
prend la forme de la tangente au cercle reprsentant lentit projet sur chaque sommet
du segment de la bordure (en gris sur la gure 5.14(b)). Notons que la construction de
ce frustum compos peut tre stoppe avant davoir trait lensemble des segments du
chemin, cause de la rduction des passages due la projection du cercle de lentit.
Ainsi, cette construction va aussi identier la vritable prochaine bordure non visible
(en rouge sur la gure 5.14(b)).
(a) Environnement de dmonstration, avec cellules diffrenties et bordures
du chemin nommes (dcoupage arbitraire). La trajectoire optimale ob-
tenue par optimisation visuelle est reprsente en vert.
(b) Calcul du frustum compos (en vert) et de la prochaine bor-
dure non visible (en rouge).
(c) Analyse du frustum pour extraire
la direction optimale.
FIG. 5.14: Optimisation visuelle dun chemin. Les bordures sont reprsentes
avec une surface pour des questions de lisibilit.
157
Le comportement de lhumain virtuel
Ltape suivante analyse les donnes de la premire tape, avec 2 cas possibles :
1. Il y a une prochaine bordure non visible (cas de la gure 5.14). On doit choisir un
point rfrant P
re f
qui servira dattracteur. Pour cela, la portion visible de la der-
nire bordure du chemin est considre (en bleu sur la gure 5.14(c)), lextrmit
la plus proche de la destination tant choisie (en haut sur la gure).
2. Il ny a pas de prochaine bordure non visible (lensemble du chemin est visible) :
Si la destination est lintrieur du frustum compos,

dir
opt
devient le vecteur
norm de la position courante la destination, et dist
mov
est la distance les
sparant.
Sinon, on choisit un point rfrant P
re f
qui servira dattracteur de la mme
faon que prcdemment.
Si un point rfrant P
re f
est choisi, la trajectoire passant par celui-ci est mise en concur-
rence avec la trajectoire passant par le centre du frustum. La principe suivant est utilis :
plus on se trouve prs de P
re f
, plus il est attractif, et inversement, plus on en est loin,
plus le centre du frustum est attractif. Le point attracteur P
att
est donc un barycentre
pondr entre le centre de la portion du dernier segment P
cen
et le point rfrant P
re f
.
En se basant sur les distances reprsentes sur la gure 5.14(c), le calcul est le suivant :
P
att
= (1) P
re f
+P
cen
avec =
m
2
m
2
+n
2
La direction optimale

dir
opt
devient alors celle partant de la position de lhumanode
et passant par P
att
. La distance maximale de mouvement dist
mov
est au minimum celle
sparant lagent autonome de P
att
. Nanmoins, an de laisser une certaine libert de
mouvement lagent, nous recherchons la distance maximale libre dobstacle passant
par ce point. Cette distance est obtenue par un lanc de rayon dans lenvironnement
suivant

dir
opt
.
Pour conclure avec loptimisation visuelle, on peut remarquer que son fonctionnement
est frquentiel, devant tre mis jour chaque fois que lentit se dplace dans lenvi-
ronnement. Nanmoins, la simplicit de lvaluation et la cohsion temporelle du calcul
du frustum permettent cette mthode de rester peu coteuse. De plus, nous verrons
par la suite que son rafrachissement est synchronis avec les poses dempruntes de
lhumanode, i.e. chaque nouveau pied dappui. Lintrt majeur de cette mthode est
de produire des trajectoires laspect continu et courbe, en neffectuant quun simple
calcul de barycentre, trs rapide.
5.3.5 Rafrachissement de la planication
Ce dernier aspect de la planication de chemin concerne sa mise jour au fur et
mesure du dplacement. Quatre objectifs sont viss :
1. Supprimer les portions de chemin parcourues.
2. Dclencher les rafnements successifs lorsque de nouvelles zones globales de-
viennent visibles.
3. Permettre la rcupration du chemin lorsque lentit sen carte, cause de la
navigation ractive par exemple.
4. Remettre en question le chemin actuel suivant certains vnements de lenviron-
nement.
158
La planication de chemin
Pour traiter le premier point, il suft de dpiler les lments de chaque chemin jusqu
trouver le nud courant de lentit (Algorithme 3). Ce traitement est donc effectu
chaque fois que lentit se dplace, et plus exactement chaque fois quelle change de
cellule de la subdivision. Dautre part, cest ce premier traitement qui pourra dtecter
si lentit est sortie du chemin (point 3), en demandant REPLANIFIER (ligne 3) o
RAFFINER de nouveau le chemin erron (lignes 11 et 18).
Algorithme 3 Suivre le chemin
ENTRES: C
crt
, G
crt
, Z
crt
les cellule, groupe et zone courants de lentit.
1: TANTQUE Z
0
= Z
crt
FAIRE
2: SI card(Chemin
Z
) = 0 ALORS
3: RENVOYER REPLANIFIER
4: FINSI
5: Chemin
C
Chemin
C
\ c, ZONE(c) = Z
0
6: Chemin
G
Chemin
G
\ g, ZONE(g) = Z
0
7: Chemin
Z
Chemin
Z
\ Z
0
8: FIN TANTQUE
9: TANTQUE G
0
= G
crt
FAIRE
10: SI card(Chemin
G
) = 0 ALORS
11: RENVOYER RAFFINERGROUPES
12: FINSI
13: Chemin
C
Chemin
C
\ c, GROUPE(c) = G
0
14: Chemin
G
Chemin
G
\ G
0
15: FIN TANTQUE
16: TANTQUE C
0
=C
crt
FAIRE
17: SI card(Chemin
C
) = 0 ALORS
18: RENVOYER RAFFINERCELLULES
19: FINSI
20: Chemin
C
Chemin
C
\ C
0
21: FIN TANTQUE
Un rafnement supplmentaire est effectu lorsque lentit peroit une nouvelle bor-
dure de son chemin abstrait. Nous ne dtaillerons pas lalgorithme ici, celui-ci cor-
respondant exactement la construction du chemin par parties (Algorithme 1) en ne
traitant pas nouveau les portions dj disponibles.
La rcupration du chemin lorsque lentit sen carte est dclenche par lalgorithme
lorsque la zone courante de lentit nest plus reprsente dans le chemin global. Une
nouvelle planication est alors demande, rvaluant compltement lensemble des
chemins hirarchiques.
Enn, la remise en question du chemin est faite de faon plus frquentielle. Elle inter-
vient lorsquune nouvelle information dynamique est perue, qui peut avoir un impact
sur lun des critres dvaluation du chemin. Cela se produit lorsquune bordure de
lenvironnement est observe alors que son tat actuel dans la connaissance de lindi-
vidu tait considr comme prim. Deux cas peuvent alors dboucher sur une rva-
luation :
1. La bordure appartient au chemin. Les facteurs de quantication associs sont
alors valus, et si lun deux dpasse un seuil x individuellement, le chemin
est rvalu. Cela permet lentit de rester ractive aux perturbations impr-
159
Le comportement de lhumain virtuel
vues. Ce cas peut se produire par exemple si lentit saperoit quun attroupe-
ment bloque son chemin, reprsent par le facteur de densit.
2. La bordure nappartient pas au chemin actuel. Ici aussi les facteurs de quanti-
cation sont valus, mais compars cette fois-ci une valeur moyenne extraite
du chemin actuel. Si ces nouveaux facteurs peuvent aboutir une amlioration
consquente du chemin, car leur valeur est bien infrieure celle actuelle, le che-
min est rvalu. Cela permet lentit de rester opportuniste aux modications
de lenvironnement. Comme illustration, on peut reprendre lexemple prcdent
en linversant, lentit pouvant sengager nouveau dans une zone dont laf-
uence a fortement diminue.
5.3.6 Conclusion
Nous avons prsent dans cette section lensemble des mcanismes impliqus dans la
planication de chemin. Les caractristiques principales mises en avant sont :
laspect hirarchique, permettant une amlioration sensible des performances ;
les trois catgories de planication, rpondant diffrentes problmatiques ;
la fusion dune multitudes de critres, permettant dindividualiser le processus de
dcision ;
la synthse du chemin produit en des informations simples et concises, permettant
une exploitation de type bote noire ;
la ractivit de lvaluation, permettant la prise en compte automatique des modi-
cations environnementales.
Tous ces points font de cette planication de chemin un module indpendant de notre
humanode virtuel, pouvant tre assimil un comportement ractif pr-cbl. Ce mo-
dule comportemental pourra ainsi tre pilot par des processus de plus haut niveau,
simplement en effectuant des requtes sur lune des trois spcialisations de recherche
de chemin. Le rsultat produit sera alors toujours le mme, synthtis sous la forme
dune direction optimale de mouvement et dune distance maximale. Nous allons voir,
dans la section suivante, que ce rsultat est ensuite exploit par un autre comportement
ractif de lindividu, an de grer cette fois-ci les adaptations locales lors du dplace-
ment.
5.4 La navigation ractive
Le comportement ractif prcdent, la planication de chemin, a permis de raliser
une dcision de dplacement presque exclusivement base sur les obstacles statiques
de lenvironnement. An de considrer la dynamique dautres entits, lhumain virtuel
ncessite un comportement complmentaire considrant lenvironnement dun point
de vue plus local et immdiat. Cette tche, dnomme navigation ractive, va ainsi
permettre lagent autonome dviter les collisions avec ses voisins, tout en essayant
de respecter au mieux les directives des autres comportements.
Son objectif global est de permettre lentit de se rendre sa destination, qui est repr-
sente par la direction choisie lors de la planication de chemin. Nous verrons que le
modle propos permet nanmoins de considrer des objectifs secondaires, autorisant
un comportement opportuniste lhumain virtuel.
160
La navigation ractive
5.4.1 Principe
Les tudes psychologiques prsentes dans ltat de lart (confre Section 1.1.2, page 11)
dcrivent certains mcanismes intervenant dans la locomotion pdestre. Notre modle
a pour objectif de reproduire ces mcanismes, que nous synthtiserons suivant quatre
principes :
Prdiction. Le principe de prdiction signie quun tre humain est capable danti-
ciper les dplacements des autres. Ainsi, il peut se projeter dans lavenir pour
valuer les risques dinteractions futures.
Robustesse. Le principe de robustesse signie que les adaptations de trajectoire dci-
des par le piton sont valides pour un certain laps de temps. Ce principe dcoule
directement de la prdiction, ltre humain basant sa dcision sur une extrapola-
tion juge sufsamment crdible.
Minimisation des ajustements. Le principe prcdent signiait que ltre humain mi-
nimise la frquence de ses adaptations, celui-ci indique quil minimise leur am-
pleur. Ce principe peut tre compar aux lois biomcaniques de minimisation de
leffort, ltre humain choisissant la solution la plus prenne sur le long terme.
Ractivit. Ce dernier principe est loppos du prcdent, signiant que ltre hu-
main peut accomplir une adaptation brutale en raction un vnement soudain.
Nanmoins, le principe de prdiction permet gnralement danticiper de telles
situations an de prparer leur ventuelle apparition.
Lapproche globale retenue pour ce modle est proche de celle introduite par F. Feurtey
(confre Section 1.4.3, page 36) : une reprsentation en (x, y, t) des collisions. Consi-
drons une entit de rfrence E
re f
, qui est en train de naviguer, et une entit voisine
E
voi
, viter. Lentit de rfrence peut prendre nimporte quelle direction et vitesse,
puisque ce sont les lments que nous cherchons caractriser. Sa reprsentation en
(x, y, t) peut alors prendre la forme dun cne (Figure 5.15(a)), reprsentant les varia-
tions de position de son centre de gravit une vitesse donne. La position de lentit
voisine P
voi
est quant elle extrapole en tenant compte de ses direction

D
voi
et vitesse
V
voi
courantes, considres comme constantes :
P
voi
(t) = P
voi
+t.V
voi
.

D
voi
La zone de lenvironnement viter correspond alors un cercle autour de cette po-
sition paramtrique, rsultant en un cylindre oblique en tenant compte du temps (Fi-
gure 5.15(b)). Le rayon de ce cercle est choisi pour reprsenter la distance minimale
conserver entre la position des deux entits, soit la somme de leur rayons incrmente
dune distance de scurit D
sec
paramtrable :
R = R
voi
+R
re f
+D
sec
Ltape suivante consiste identier les collisions futures. En conservant les repr-
sentations prcdentes, les collisions futures sont les surfaces dintersection entre le
cylindre et le cne (Figure 5.16(a)). Le calcul analytique de cette intersection est pos-
sible, bien que relativement complexe. Nanmoins, ces surfaces ne reprsentent les
potentiels de collision qu une vitesse donne de lentit de rfrence, et il nous faut
considrer lensemble de ses vitesses potentielles, variant de 0 sa vitesse maximale
V
max
. Ainsi, le calcul devient une intersection de volumes, o tous les cnes possibles
de lentit de rfrence sont pris en compte (Figure 5.16(b)). Le calcul analytique de-
161
Le comportement de lhumain virtuel
(a) Extrapolation du dplacement de lentit de r-
frence.
(b) Extrapolation de la zone de collision potentielle.
FIG. 5.15: Extrapolation des dplacements dans le temps et lespace.
vient ce moment l impossible.
La solution propose est de discrtiser le temps, permettant de ramener le problme
en deux dimensions. Ainsi, nous conservons la continuit des valeurs recherches, que
sont la vitesse et la direction de mouvement. Le mcanisme suivant consiste quantier
les collisions dtectes, la dcision ntant alors plus quune simple minimisation de
cot.
Pour nir, nous devons remarquer que ce processus de navigation ractive ne doit pas
tre seulement sensible aux obstacles viter, mais doit aussi tre capable dintgrer
des entits attractives. Ces entits peuvent reprsenter des liens sociaux entre huma-
nodes, ou encore les zones dutilisation ou dattente dobjets interactifs. Nous prsen-
terons la faon dont nous intgrons cette catgorie dinformation, en nimpliquant que
des modications mineures la mthode grant les obstacles.
Cette approche de navigation ractive peut tre dcoupe en cinq tapes (Figure 5.17),
que nous dtaillerons par la suite :
1. Slection des entits inuentes : permet dextraire de lenvironnement immdiat
dun humain virtuel les lments prendre en compte lors de la navigation.
2. Prdiction et discrtisation : permet dextrapoler le dplacement des entits in-
uentes en une reprsentation simplie.
3. Quantication des informations : permet dassocier un cot aux informations
produites lors de ltape prcdente.
4. Fusion des donnes : permet de combiner lensemble des reprsentations prc-
dentes, an den simplier la comparaison.
5. Prise de dcision : effectue le choix de dplacement nal, qui sera communiqu
directement au module biomcanique de lhumain virtuel.
162
La navigation ractive
(a) Dtection des collisions pour une vitesse donne, et projection de la zone dans le plan.
(b) Dtection des collisions pour un ensemble de vitesses de lentit de r-
frence, et projections des zone dans le plan.
FIG. 5.16: Dtection des collisions sur un cas simple. Les zones de collision
sont de gomtrie complexe, pouvant tre unique (cas reprsent),
ou double (cas ou le cylindre pntre et ressort du cne).
163
Le comportement de lhumain virtuel
FIG. 5.17: Vue densemble et intgration de la navigation ractive.
5.4.2 Slection des entits inuentes
La premire tape de notre approche consiste slectionner les entits inuentes de
la navigation ractive. Lobjectif est de prendre en considration sufsamment denti-
ts pour sassurer que lenvironnement immdiat est reprsent, mais de limiter leur
nombre pour ne pas surcharger le modle, que ce soit en quantit dinformations ou
en temps de calcul. Ce principe correspond la ralit, o un tre humain ne va te-
nir compte que dun nombre limit dentits environnentes. Deux catgories dentits
doivent tre slectionnes : les obstacles et les attracteurs.
Slection des obstacles statiques et dynamiques.
Les obstacles environnants peuvent tre de deux types : statiques ou dynamiques.
Nous limitons la gestion des obstacles mobiles aux autres humanodes virtuels de la
simulation. Les humanodes sont slectionns sils se trouvent une distance maximale
D
dyn
de lentit de rfrence. Cette premire slection est ensuite ltre par visibilit,
seules les entits ntant pas occultes par un obstacle statique tant conserve. Enn,
les entits qui se trouvent dans le demi-cercle antrieur de lentit de rfrence sont bien
values comme dynamiques, mais celles se trouvant dans le demi-cercle postrieur
sont considres comme ayant une vitesse nulle. Ce dernier cas signie que lentit de
rfrence est consciente de la prsence dautres personnes, mais ne peut estimer leur
dplacement.
Les obstacles statiques correspondent aux murs de lenvironnement, ainsi quaux diff-
rents objets physiques statiques. Ces derniers tant directement intgrs la subdivision
ainsi quau graphe topologique, lensemble de la slection se limite donc rcuprer
les segments contraints environnants lentit. Tout comme pour les entits dynamiques,
cette slection est borne par une distance D
sta
, et ltre par visibilit.
Les deux distances pr-cites doivent suivre les contraintes suivantes, an de permettre
un fonctionnement optimal du processus de navigation ractive :
164
La navigation ractive
D V
max
.t La distance doit tre suprieure la distance maximumque peut parcourir
une entit en un pas de temps, an dviter des collisions non prdites.
D V
max
.k
n
.t La distance doit tre infrieure la distance maximale que peut par-
courir lentit durant la totalit du temps prdit, les obstacles plus loigns nayant
que peu ou pas dimpact sur la dcision.
Slection des attracteurs.
La slection des attracteurs est un processus plus rchi que pour les obstacles. Ces
attracteurs vont reprsenter des buts secondaires dans lenvironnement, permettant no-
tamment un comportement opportuniste de lhumain virtuel. Ils sont indiqus par des
processus externes la navigation ractive, principalement par les tches cognitives
que nous verrons dans la section suivante. Par exemple, les tches cognitives grant
linteraction utiliseront ces attracteurs pour indiquer les zones dattente et dutilisation
dun effecteur.
Au sein de la navigation ractive, les attracteurs sont disponibles sous la forme dune
liste de zones dancrage dnies par BIIO (confre Section 3.2.4, page 97). Cette liste
est traite sans ltrage supplmentaire. Le seul pr-requis concernant un attracteur est
que celui-ci doit tre visible par lentit de rfrence. Nous pouvons donc remarquer
que les zones dancrage ne seront inscrites dans la liste quaprs un test pralable utili-
sant le processus dobservation de lhumain virtuel.
5.4.3 Prdiction : une discrtisation du temps
Maintenant que les entits voisines ont t slectionnes, il faut prdire les collisions
et attractions dont elles seront responsables. Le but est de synthtiser ces informations
par un procd rapidement calculable, et dgradant au minimum les informations que
nous voulons caractriser : les vitesses autorises suivant les directions de mouvement.
Pour se faire, nous avons choisi de discrtiser le temps, en valuant les dplacements
par intervalles successifs. Ces intervalles sont de taille croissante, an de couvrir une
distance temporelle maximale tout en conservant une certaine prcision pour lavenir
proche. Nous utilisons donc les intervalles suivants :
[0; t
0
[, [t
0
; t
1
[, . . . , [t
n1
; t
n
[
avec t
i
= k
i
.t
Pour chaque borne t
i
, le facteur k 1 reprsente la rapidit de croissance de linter-
valle, tandis que le facteur t > 0 reprsente sa prcision. Plus le facteur k est grand, et
plus la prcision se dgrade rapidement dans les intervalles successifs, une valeur de 1
signiant que la prcision est conserve sur tous les intervalles (ils seront tous de mme
taille). Plus le facteur t est faible, plus la prcision est importante, augmentant dau-
tant le nombre dintervalles considrer pour prdire sur une dure xe. Le dernier
facteur impliqu est n, qui dtermine la date maximale considre par la prdiction.
Dans notre cadre dapplication, nous proposons dutiliser k = 2, t = 1s, et n = 3,
signiant que nous considrons une date maximale de prdiction de huit secondes.
165
Le comportement de lhumain virtuel
Le facteur de croissance k utilis nous permet dobtenir une bonne prcision pour les
deux premiers intervalles, couvrant chacun une seconde. Cette valeur a pour but de se
rapprocher de lunit de temps ncessaire un tre humain pour faire un pas, moment
o il effectue gnralement ses adaptations de mouvement.
Dtaillons maintenant les calculs effectuer pour obtenir cette discrtisation, que ce
soit pour les entits dynamiques, mais aussi statiques. Nous verrons dans un troisime
temps ladaptation de cette mthode aux entits attractives.
Discrtisation des obstacles dynamiques
Les obstacles dynamiques de lenvironnement correspondent aux autres humanodes
virtuels. Nous allons tudier la mthode pour prendre en compte une seule de ces entits
voisines, et gnraliserons ce processus lensemble du voisinage slectionn plus loin
dans cette section. Le principe est de dcouper lespace entourant lentit de rfrence
en quartiers successifs, reprsentant chacun les caractristiques de la prdiction pour
un intervalle de temps. Nous obtenons ainsi n +2 quartiers couvrant lensemble des
directions possibles : un pour chaque intervalle, et un supplmentaire pour lespace
libre.
La premire tape est donc de prdire la position de lentit voisine chaque borne
des intervalles de temps t
i
. On peut voir sur la gure 5.18(a) ces projections, avec
une indication des zones de collision potentielles correspondantes (cercles de rayon
R
voi
+R
re f
). Lensemble des directions couvertes par chaque intervalle correspond aux
valeurs comprises entre chaque zone de collision, soit toutes les directions se situant
entre les tangentes extrieures aux cercles reprsentant ces zones. Les quartiers ainsi
obtenus sont reprsents sur la gure 5.18(b) par les tangentes colores, apparies deux
deux. Le recouvrement des quartiers entre eux sera abord par la suite, nous les
considrerons pour le moment indpendamment les uns des autres.
La deuxime tape consiste exprimer la collision potentielle associe chaque inter-
valle de temps, et donc chaque quartier dans lespace. Le but tant de dterminer la vi-
tesse autorise suivant la direction, nous nous servons directement de cette valeur pour
quantier les quartiers. On doit ici remarquer que pour viter une collision, direc-
tion de mouvement ge, une entit peut soit acclrer pour passer devant lautre, soit
dclrer pour passer derrire. Nous associons donc deux bornes de vitesses chaque
intervalle, lune reprsentant la vitesse maximale autorise pour passer derrire lautre
V
lente
, lautre reprsentant la vitesse minimale adopter pour passer devant V
rapide
. Ces
vitesses sont calculables analytiquement, suivant la notation introduite dans les prin-
cipes de la navigation :
V
lente
(t)=
_
_
_
_

P
re f
P
voi
(t)
_
_
_
_
R)
t
V
rapide
(t)=
_
_
_
_

P
re f
P
voi
(t)
_
_
_
_
+R)
t
Chaque quartier est donc congur par ces deux vitesses, par les angles de direction
extremum
1
et
2
, et par lintervalle de temps quil symbolise (Figure 5.19(a)).
Les deux valeurs que nous stockons pour chaque intervalle [; ] sont la valeur mini-
male de V
lente
(t) et maximale de V
rapide
(t). On obtient ainsi les bornes de vitesses ga-
166
La navigation ractive
(a) Positions de lentit voisine lorigine et pour chaque borne dintervalle
de temps t
i
, ainsi que zones de collision potentielle correspondantes.
(b) Valeurs limites des directions couvertes par chaque intervalle de temps,
sous la forme de tangentes colores apparies deux deux.
FIG. 5.18: Discrtisation du temps pour une entit voisine dynamique. Les
paramtres utiliss pour les intervalles de temps sont ceux intro-
duits dans notre modle : k = 2, t = 1s, et n = 3
ranties libres de collision : si lentit de rfrence choisit une direction comprise dans
ce quartier, et une vitesse en dehors de [minV
lente
; maxV
rapide
], alors aucune collision
nest redouter avec lentit voisine concerne pour ce laps de temps. Nous devons
pour nir faire tat du cas particulier du premier quartier, correspondant lintervalle
[0; t]. Celui-ci se voit toujours affect une vitesse rapide innie, symbolisant le fait
quil est impossible de passer au travers dune entit voisine : on ne peut la prcder
sur cet intervalle, tant donn quil correspond sa position initiale.
Une fois que tous les quartiers ont t congurs de la sorte, on obtient une couver-
ture 360de lespace environnant lentit de rfrence, avec des quartiers pouvant se
chevaucher, et une zone libre dont les vitesses ne sont pas contraintes (Figure 5.19(b)).
Nous verrons par la suite comment ces informations sont fusionnes an dobtenir des
quartiers indpendants, puis comment une dcision est prise dans cette reprsentation.
167
Le comportement de lhumain virtuel
(a) Paramtres intrinsques du troisime quartier produit. En bleu, espaces
de vitesses libres de collision pour lentit de rfrence.
(b) Vue densemble des quatre quartiers correspondant des collisions. Le
cinquime quartier, libre de toute collision, nest pas reprsent pour des
questions de lisibilit.
FIG. 5.19: Quantication des espaces-temps des collisions, et vue den-
semble du dcoupage produit.
Discrtisation des obstacles statiques
En plus des obstacles dynamiques, une entit en mouvement doit tre capable de na-
viguer au sein dobstacles statiques, tels que les murs. Nous allons prsenter ici une
mthode de discrtisation de ces obstacles, an dobtenir un dcoupage en quartiers de
lespace similaire celui vu prcdemment. Lobjectif est ainsi dexprimer lensemble
des donnes lies la navigation grce la mme smantique, an den permettre la
fusion pour aboutir une prise de dcision unique, tenant compte simultanment de
tous les facteurs. Nous assimilerons tous ces obstacles des segments de droite, en
partant du principe que toute forme gomtrique peut tre exprime de cette faon.
Le premier point traiter est donc lobtention de quartiers comparables ceux des
entits dynamiques. Les obstacles statiques tant par dnition immobiles, une discr-
168
La navigation ractive
tisation du temps nest pas ici directement applicable. Nous effectuons la place une
discrtisation de lespace, qui servira par la suite dduire une discrtisation tempo-
relle, et qui vise les mmes buts : conserver une certaine prcision dans lenvironne-
ment proche de lentit de rfrence, tout en permettant de se projeter assez loin dans
le futur.
Nous choisissons comme origine de la discrtisation spatiale le point le plus proche
de lentit de rfrence appartenant lobstacle (P
0
sur la gure 5.20(a)). Ce point est
le projet de P
re f
sur lobstacle, ou lextrmit du segment la plus proche si la projec-
tion est extrieure. Nous dcoupons ensuite le segment suivant les mme intervalles
que pour les entits dynamiques, mais appliqus cette fois-ci la vitesse dsire de
lentit de rfrence, suivant le vecteur direction support du segment (vers chacune des
extrmits). Nous obtenons ainsi une srie de points supports par le segment, spars
par des intervalles de distance croissants depuis le point le plus proche de lentit de
rfrence. Ds quun intervalle produit un point en dehors du segment, le dcoupage
est arrt, et lextrmit du segment la plus proche remplace le point produit (points P
3
et P

4
sur la gure 5.20(a)).
(a) Discrtisation de lespace suivant un principe quivalent la discrti-
sation temporelle. Le point le plus proche de lobstacle statique P
0
est
choisi comme origine, puis un dcoupage est effectu suivant des mul-
tiples de la vitesse dsire de lentit de rfrence V
re f
.
(b) Chaque quartier obtenu est congur de la mme faon que pour une
entit dynamique. Leur vitesse rapide est toujours innie, car il est im-
possible de passer au travers dun obstacle.
FIG. 5.20: Discrtisation de lespace pour les obstacles statiques. Un dcou-
page de lespace en quartiers est obtenu par un procd quivalent
aux entits dynamiques.
169
Le comportement de lhumain virtuel
Les quartiers sont ensuite obtenus en reliant directement le centre de lentit de rf-
rence chaque point des intervalles. Seules les extrmits ne sont pas relies de cette
faon, mais via la tangente extrieure un cercle de mme rayon que lentit (plus
la distance de scurit). Cette spcicit permet de prvoir le passage proximit de
lobstacle (comme langle dun carrefour).
Une fois les quartiers obtenus, il reste les congurer. Nous employons ici exactement
la mme smantique que pour les entits dynamiques, an de permettre la comparaison
des quartiers quelle que soit leur origine (Figure 5.20(b)). La vitesse rapide est ici un
non-sens, car il est impossible de prcder un obstacle immobile ; celle-ci est donc
toujours innie pour les quartiers obtenus. La vitesse lente, correspondant la vitesse
admissible pour ne pas percuter lobstacle, est obtenue ici grce la distance minimale
D lobstacle dans chaque quartier :
D
[P

;P
+1
]
=
_
_

P
re f
P

_
_
R
re f
Par un procd dinversion du calcul, on obtient lintervalle de temps [t
a
; t
a+1
] corres-
pondant au quartier, avec une vitesse lente de grandeur comparable la vitesse courante
de lentit, couvrant au maximum la distance pr-cite :
V
lente
= D
[P

;P
+1
]
/t
a+1
= D
[P

;P
+1
]
/(k
a+1
.t)
soit k
a+1
= D
[P

;P
+1
]
/(V
lente
.t)
soit a = log
k
(D
[P

;P
+1
]
) log
k
(V
lente
) log
k
(t) 1
On injecte dans cette dernire formule la vitesse dsire de lentit de rfrence (V
lente
=
V
re f
), pour obtenir lexposant du facteur de croissance a de lintervalle, qui est arrondi
lentier infrieur. On en dduit lintervalle de temps correspondant [t
a
; t
a+1
], avec
par convention t
1
= 0. Pour nir, la vitesse lente assigne au quartier est obtenue en
rinjectant t
a+1
dans la premire formule.
Nous obtenons par lensemble de ces procds une reprsentation en quartiers succes-
sifs dun obstacle, cette fois-ci sans aucun recouvrement. Cette mthode est applique
lensemble des obstacles statiques avoisinant lentit de rfrence.
Discrtisation des entits attractives
An de permettre la fusion de linformation, les entits attractives de lenvironnement
doivent tre reprsentes par des caractristiques identiques aux obstacles. Nous pro-
posons donc deffectuer les mmes traitements que prcdemment, en adaptant nan-
moins la conguration des quartiers produits.
Le premier point quil faut relever, quelle que soit la nature de lentit attractive consi-
dre, est que la vitesse rapide permettant de la prcder est un non-sens. En effet, on
ne cherche pas ici viter lentit, mais la rejoindre, la vitesse rapide devenant non
contrainte, et donc toujours nulle.
Position relative un attracteur dynamique. La premire catgorie de zone attrac-
tive que nous allons traiter correspond un lien social avec une entit dynamique. Son
170
La navigation ractive
cadre dutilisation typique est le suivi de personnes, que ce soit au sein dun groupe
de personnes dni (comme une structure familiale), ou pour grer une le dattente.
Cette zone attractive est exprime par une position relative une entit dynamique,
et donc trois facteurs : une direction relative

D
rel
, une distance relative suivant la di-
rection prcdente d
rel
, et une distance moyenne autorise la position optimale d
aut
.
Nous appliquons alors le mme principe de discrtisation que pour les obstacles dy-
namiques, en considrant une entit virtuelle E
vir
positionne relativement lentit
voisine E
voi
. Cette entit virtuelle a les paramtres prcits, de rayon d
aut
, et utilisant
les mmes direction et vitesse que lentit voisine (Figure 5.21(a)). Les quartiers sont
ensuite obtenus de la mme faon que pour un obstacle, et congurs suivant les mmes
paramtres. La vitesse lente est calcule de faon ce quelle englobe lentit virtuelle,
pour exprimer le fait que lon veuille rejoindre cette position sans la dpasser :
V
lente
(t) =
_
_
_

P
re f
P
vir
(t)
_
_
_+d
aut
t
(a) Considration dune entit virtuelle relative lentit
voisine.
(b) Discrtisation temporelle. La vitesse lente
permet de se superposer lentit virtuelle.
FIG. 5.21: Discrtisation dune entit attractive dynamique.
Gestion des attracteurs statiques. Les autres zones attractives que nous proposons
de grer sont statiques, et correspondent aux zones dancrage dnies pour les objets
interactifs (confre Section 3.2.4, page 97) :
Zone ponctuelle : elle est dnit par un point dans lespace, avec une distance autori-
se, donnant au nal un cercle. Son traitement est identique celui dune entit
dynamique avec une vitesse nulle.
Zone supporte par un segment : elle aussi dispose dune distance autorise. Son
traitement est identique un obstacle statique, auquel on applique les congura-
tions particulires de vitesse : V
rapide
=0 et V
lente
englobant la distance autorise,
et donc le segment.
Zone supporte par un polygone convexe : avec aussi une distance autorise. Son
traitement est spar en trois tapes :
1. Filtrage de lensemble des segments visibles par lentit de rfrence.
2. Traitement spar de chaque segment restant de la mme manire que pour
une zone supporte par un segment.
171
Le comportement de lhumain virtuel
3. Fusion des quartiers obtenus lors de ltape 2.
Ces attracteurs sont utilises pour reprsenter les zones dancrage des les dattente et
dutilisation des effecteurs de lenvironnement. Nous verrons par la suite quils sont
communiqus par la tche cognitive grant linteraction lorsque cela est ncessaire.
5.4.4 Quantication des informations de navigation
Maintenant que nous avons exprim lensemble des collisions ventuelles grce une
smantique synthtique, voyons comment il est possible de les traiter pour en extraire
la meilleure option de mouvement. Rappelons que nous cherchons caractriser une
direction et une vitesse optimale de dplacement, en essayant de maximiser la dure
de validit de cette dcision. Nous allons ainsi quantier les quartiers obtenus lors
de ltape prcdente, pour permettre par la suite de fusionner facilement les cots et
caractristiques des quartiers se chevauchant.
Quantication des obstacles
Commenons par nous pencher sur le cas le plus courant, savoir les obstacles de len-
vironnement. Le cot assign chaque quartier doit tenir compte des facteurs suivants,
sachant que plus il est faible, meilleur est le quartier :
1. Plus les directions couvertes par le quartier sont loignes de la direction sou-
haite, plus le cot est lev. Si la direction est comprise par le quartier, cette
quantication est nulle. Ce facteur cherche respecter la direction souhaite par
lentit, i.e. obtenue lors de la planication de chemin.
2. Plus ladaptation en vitesse est forte pour viter la collision, plus le cot est
lev. Si aucune adaptation de vitesse nest ncessaire, cette quantication est
nulle. Ce facteur cherche respecter la vitesse dsire par lentit (choisie par un
autre processus de dcision, comme les tches cognitives).
3. Plus lintervalle de temps relatif au quartier est loign, plus le cot est faible.
Ce facteur exprime lincertitude relative une collision loigne dans le temps
en diminuant son importance relative.
Les deux premiers facteurs doivent disposer de bornes maximales, au del desquelles
le quartier est considr comme impraticable, son cot tant alors x linni. De
plus, ces facteurs doivent avoir un impact variable et personnel sur la prise de dci-
sion de lindividu, certains prfrant conserver leur trajectoire et dautres leur vitesse.
Une autre remarque concerne le deuxime facteur, qui doit tre spar en deux sous-
facteurs, lun exprimant ladaptation en dclration, et lautre en acclration.
Nous proposons de calculer chaque facteur indpendamment, sous la forme dune
valeur norme. Cette mthode nous permettra ensuite dvaluer un cot nal sen-
sible des degrs de prfrences individuels. Soit F
dir
le facteur relatif la direc-
tion, F
vit
le facteur relatif la vitesse, et F
tem
celui relatif lintervalle de temps, avec
F [0; 1] , et C
max
le cot maximal envisageable, le cot nal est alors :
Cot
obstacle
= (.F
dir
+(1).F
vit
).F
tem
.C
max
Si lun des facteurs est inni, le cot nal devient lui aussi inni, quelles que soient les
autres valeurs. La valeur de pondration [0; 1] est un degr de prfrence personnel
172
La navigation ractive
permettant de rendre plus ou moins prioritaire la conservation de lun des deux premiers
facteurs :
0 Conservation de la vitesse.
1 Conservation de la direction.
=
1
2
Valeur neutre.
Enn, C
max
permet dintroduire une quantication absolue pour le quartier trait, pou-
vant tre sensible la smantique de lobstacle considr. tudions plus en dtails
chaque partie du cot calcul.
Facteur de direction F
dir
Le facteur de direction est valu en comparant la direction
souhaite D
re f
aux directions comprises dans le quartier. Deux cas peuvent se produire
(Figure 5.22) :
(a) La direction dsire D
re f
est lintrieur du quartier. Dans ce cas F
dir
est opti-
mum, et a une valeur nulle.
(b) La direction D
re f
est spare du quartier par un angle minimal . Dans ce cas le
facteur est calcul de la faon suivante :
F
dir
=
_
_
_
si
max
1cos()
2
sinon
Avec
max
la dviation angulaire maximale autorise lors de la navigation (para-
mtre personnel, pouvant varier suivant la situation).
(a) (b)
FIG. 5.22: valuation du facteur de direction lors de la quantication dun
quartier. (a) La direction dsire se trouve dans le quartier, lcart
est nul. (b) La direction dsire est en dehors du quartier, lcart
angulaire est retenu.
Notons que ce facteur peut aussi tre inuenc par le signe de sin(), an de reprsenter
une prdisposition de lentit tourner gauche (sin > 0) ou droite (sin < 0). Un
facteur complmentaire de rduction est simplement appliqu F
dir
dans le cas o la
direction est privilgie, avec 0 < < 1 :
F

dir
=
_
_
_
.F
dir
si la direction est privilgie
F
dir
sinon
173
Le comportement de lhumain virtuel
Facteur de vitesse F
vit
Ce facteur est valu par comparaison de deux sous-facteurs
correspondants lacclration F
acc
et la dclration F
dec
, pondrs par une valeur de
prfrence personnelle [0; 1] :
F
vit
=
_

_
0 si V
re f
/ [V
lente
;V
rapide
]
F
acc
si .F
acc
< (1).F
dec
F
dec
sinon
Ce facteur est donc nul si la vitesse dsire V
re f
nest pas contrainte par le quartier, ou
prend la valeur de meilleur sous-facteur dans le cas contraire. Suivant le mme principe
que la valeur de la formule gnrale du cot, la valeur permet de privilgier la
dclration ( 1) ou lacclration ( 0). Les sous-facteurs sont valus grce
aux distances sparant la vitesse de rfrence V
re f
de la vitesse lente (distance d
lente
) et
de la vitesse rapide (distance d
rapide
), en tenant compte de la vitesse maximale possible
V
max
:
F
dec
=
_
_
_
si d
lente
decel
max
d
lente
V
re f
sinon
F
acc
=
_
_
_
si d
rapide
accel
max
d
rapide
V
max
V
rapide
sinon
Des bornes maximales dadaptation en dclration decel
max
et acclration accel
max
sont aussi prises en compte an de contraindre les facteurs correspondants.
Facteur temporel F
tem
. Ce dernier facteur est sensible lloignement dans le temps
de la collision contenue par le quartier. Il est calcul grce la borne maximale t
b
de lintervalle de temps [t
a
; t
b
] associ au quartier, compare la date prdite la plus
loigne T = k
n
.t :
F
tem
= 1.
t
b
T+1
La dernire valeur de prfrence [0; 1] introduite ici permet de faire varier le degr
de conance en une prdiction future, depuis une conance absolue ( 0) une
incertitude forte ( 1).
Cot maximal C
max
Le cot maximal nest pas valu pour effectuer le calcul du
cot global, mais constitue une donne dentre du processus. Ce cot pourra tre
choisi diffremment suivant lobstacle considr an dintroduire une caractrisation
individualise. Par exemple, le cot maximal associ aux murs pourra tre lgrement
infrieur celui associ aux autres humanodes, an dinduire une plus forte conserva-
tion de lespace personnel vis vis des entits dynamiques.
Quantication des attracteurs
La quantication des attracteurs doit produire un cot dautant plus faible que le quar-
tier contient un attracteur proche dans lespace et dans le temps. Ce principe permet de
renforcer un lien dattraction lorsque llment correspondant est proximit.
174
La navigation ractive
Ainsi, nous choisissons dexprimer un cot global ngatif pour les quartiers attractifs,
dont la valeur absolue va crotre suivant la ralisation de diffrents facteurs F, corres-
pondant ceux voqus prcdemment. Dans ce cot, deux facteurs vont sopposer :
dune part le facteur de direction, qui exprime le besoin de conserver la direction ob-
tenue lors de la planication de chemin, dautre part le facteur de vitesse, qui exprime
lattirance quexerce le quartier sur lentit. Nous proposons la formule suivante, utili-
sant la mme smantique que pour les obstacles :
Cot
attracteur
= min( 0 ; .F
dir
(1).F

vit
).F
tem
.C
max
Cest donc sensiblement la mme mthode de calcul que pour les obstacles, les fac-
teurs de direction et vitesse ntant plus associatifs mais concurrents. Dtaillons les
composantes de ce calcul.
Facteur de vitesse F

vit
Le facteur de vitesse est ici valu de faon particulire. En
effet, nous avons vu que les quartiers attracteurs nont pas de vitesse rapide, le sous-
facteur dacclration devenant donc inutile. Quant au sous-facteur de dclration, il
ne reprsente plus une gne occasionne lentit cause du changement de vitesse,
mais plutt la force du lien dattraction voqu prcdemment. Ainsi, plus la vitesse
sera contrainte, plus ce lien devra tre fort (F
dec
1) :
F

vit
= F

dec
=
_
_
_
0 si V
lente
>V
max
1
V
lente
V
max
sinon
Composantes inchanges. Les facteurs F
dir
et F
tem
, ainsi que le cot maximal C
max

0, restent identiques ceux valus pour les obstacles, leur signication tant la mme.
Notons que bien que C
max
soit positif, la formule de calcul du cot global donnera une
valeur ngative ou nulle. Ce cot maximal pourra varier pour reprsenter diffrents ni-
veaux absolus dattraction, pouvant par exemple tre assez faible vis vis dun autre
humanode reprsentant un collgue de travail, et plus fort entre les membres dune
famille se dplaant ensemble.
Synthse
La quantication de chaque quartier a permis de synthtiser ses caractristiques en un
cot unique. Ce cot est sensible des facteurs qualitatifs pouvant varier suivant la s-
mantique de lentit qui a produit le quartier. Ces facteurs sont pour lassociation ou
la concurrence entre vitesse et changement de direction, pour le penchant tourner
dans une direction donne, pour la concurrence entre acclration et dclration, et
enn pour lvaluation du niveau de conance en la prdiction. La mthode de calcul
fonctionne par dgradation dun cot maximal C
max
reprsentant la qualit globale de
lentit correspondant au quartier. Cette approche permet de tenir compte des principes
de locomotion humains, tout en les synthtisant en une valeur pouvant tre manipule
facilement. Nous allons voir par la suite que ce cot va grandement simplier la com-
paraison des collisions et attractions entre elles, pour en extraire la meilleur option de
mouvement.
175
Le comportement de lhumain virtuel
5.4.5 Fusion des informations
Maintenant que nous avons dni et quanti les informations lies la navigation, tu-
dions la faon dont nous allons les fusionner pour aboutir une reprsentation unique
de lespace et du temps. Le but est donc ici de synthtiser toutes les donnes produites
pour prparer leur analyse en vue dune prise de dcision. Cette fusion nintervient
quaprs lvaluation des cots an de permettre ceux-ci de tenir compte de la s-
mantique des entits voisines. En effet, cette information ne sera plus accessible une
fois la fusion effectue, un quartier pouvant alors correspondre plusieurs attractions
et collisions. Comme nous nous sommes efforcs de conserver la mme smantique
tout au long des tapes prcdentes, la fusion ne consiste alors quen un dcoupage
des quartiers se chevauchant sur plusieurs des discrtisations effectues. Nous allons
tudier cette mthode de fusion en prenant le cas de la discrtisation obtenue pour
une entit dynamique (Figure 5.19(b), page 168), le processus restant identique si lon
considre plusieurs discrtisations dorigines diffrentes.
La premire tape consiste donc obtenir des quartiers ne sintersectant pas dans
lespace. Le principe est ici trivial, consistant en une simple intersection angulaire.
Pour chaque intersection entre deux quartiers Q

et Q

, trois quartiers sont produits :


Q
A
=Q
\
, Q
B
=Q
\
, Q
C
=Q

. Si plus de deux quartiers se recouvrent, le procd


est rpt en traitant les quartiers deux deux (Figure 5.23).
FIG. 5.23: Intersection des quartiers se recouvrant dans lespace. A gauche,
les quartiers obtenus lors de ltape de discrtisation se recouvrent.
A droite, les quartiers obtenus aprs fusion sont indpendants.
Chaque quartier ainsi produit doit tre congur pour synthtiser les informations des
quartiers dorigine, i.e. les vitesses lente et rapide, ainsi que lintervalle de temps cor-
respondant, et le cot total. Si le quartier na quun seul gnrateur (comme Q
A
et Q
B
de lexemple prcdent), les valeurs sont directement copies. Dans le cas o le quar-
tier a plusieurs gnrateurs (comme Q
C
de lexemple prcdent), les valeurs suivantes
sont retenues :
Cot(C) =
_
Cot(); Cot()
_
Le cot nal est simplement la somme des cots de
chaque quartier parent. Si lun des cots parents est inni, le cot produit lest
aussi.
[t
i
; t
i+1
](C) = min
_
[t
j
; t
j+1
](); [t
l
; t
l+1
]()
_
Lintervalle de temps retenu est le plus court
des intervalles des parents, et donc le plus proche dans le temps. Cela rete le
fait que la prennit des informations stockes est borne par linformation la
176
La navigation ractive
plus proche dans le temps.
V
lente
(C) = min
_
V
lente
();V
lente
()
_
La vitesse lente retenue est aussi la plus faible
de celles des parents (Figure 5.24). Cela symbolise le fait que la rduction de
vitesse la plus importante prime sur les autres, i.e. lobstacle ncessitant la plus
forte adaptation est le plus important.
V
rapide
(C) La vitesse rapide requiert quant elle un traitement spcique, relatif la
distance d sparant les bornes de vitesses des deux quartiers. Cette distance est
la valeur sparant la vitesse rapide la plus faible de la vitesse lente la plus forte.
Deux cas peuvent alors se produire (Figure 5.24) :
d < La distance est infrieure une valeur > 0 donne, y compris d 0
(Figure 5.24(a)). La vitesse rapide conserve est alors la plus grande. Par
exemple sur la gure 5.24(b), cela symbolise le fait que lentit ne peut
risquer de passer devant lobstacle 1, car elle se retrouverait trop vite en
conit avec lobstacle 2.
d > La vitesse rapide conserve est la plus faible, i.e. lintervalle de vitesses
le plus loign est ignor. Par exemple sur la gure 5.24(c), cela symbolise
le fait que lentit ne tient compte que de lobstacle 1, le 2 ne ncessitant
que des adaptations trop loignes.
Nous choisissons =V
re f
dans notre cadre dapplication, en partant du principe
quune marge contenant la vitesse dsire est sufsante pour ltrer des adapta-
tions secondaires.
(a) (b) (c)
FIG. 5.24: Fusion des intervalles de vitesses pour deux quartiers. Chaque seg-
ment reprsente les vitesses interdites pour un quartier. (a) Vitesses
se recouvrant. (b) Vitesses spares par une faible distance. (c) Vi-
tesses spares par une forte distance.
Une fois que ce processus a t appliqu lensemble des quartiers produits par les
tapes prcdentes, nous obtenons une couverture totale de lespace environnant len-
tit de rfrence, sans aucun recouvrement. Ce processus est applicable directement
nimporte quel quartier, quil reprsente un attracteur ou un obstacle, sans quaucun
processus particulier ne soit ncessaire.
5.4.6 Prise de dcision
La dernire tape du mcanisme de navigation ractive est la prise de dcision, permet-
tant de restituer la meilleure option de dplacement sous la forme dune direction et
dune vitesse. Ce choix seffectue en trois tapes, en se basant sur les caractristiques
des quartiers obtenus lors de ltape prcdente :
177
Le comportement de lhumain virtuel
1. Slection du meilleur quartier.
2. Extraction de la direction de mouvement de ce quartier.
3. Extraction de la vitesse de mouvement de ce quartier.
Dtaillons chacune de ces tapes.
Slection du meilleur quartier.
La slection du meilleur quartier Q
m
seffectue directement par comparaison des cots
associs, en retenant le quartier ayant le cot le plus faible (Figure 5.25(a)). La com-
plexit de cette tape est donc linairement proportionnelle au nombre total de quartiers
produits. Dans le cas ou plusieurs quartiers ont un cot minimal, celui le plus proche de
la direction dsire est retenu. Les informations contenues par le quartier ont une vali-
dit thorique correspondant la borne maximale de lintervalle de temps quil dnit.
Nanmoins, la ractivit voque dans les principes de la navigation ractive impose
de remettre en cause la slection mme de ce quartier une frquence assez leve.
Ainsi, pour maintenir ce principe, lensemble du processus de navigation ractive de-
vra tre rvalu rgulirement, mme si dans les faits la cohrence temporelle de cette
dernire slection risque dtre assez forte.
(a) (b)
FIG. 5.25: Prise de dcision la n du processus de navigation ractive.
(a) Le quartier dont le cot est le plus faible est choisi. (b) La
direction supporte par le quartier (en bleu) la plus proche de la di-
rection souhaite (en rouge) est retenue. Le choix de vitesse nest
pas reprsent.
Extraction de la direction de mouvement.
La direction de mouvement est directement extraite du meilleur quartier Q
m
, en se
basant sur la direction dsire

D
des
. Le principe employ est le mme que lors de lva-
178
La navigation ractive
luation du facteur de direction pour la quantication des quartiers. Deux cas peuvent
se produire :

D
des
Q
m
La direction dsire appartient au quartier, elle est donc conserve.

D
des
/ Q
m
La direction dsire nappartient pas au quartier, cest donc la direction
appartenant au quartier qui est la plus proche (en distance angulaire) de

D
des
qui
est retenue (Figure 5.25(b)).
Extraction de la vitesse de mouvement.
La vitesse de mouvement V
m
est value depuis les donnes du meilleur quartier Q
m
,
en se basant sur la vitesse dsire V
re f
. Deux cas peuvent se produire :
V
re f
V
lente
(V
re f
V
rapide
V
rapide
= 0) La vitesse dsire nest pas contrainte par
le quartier, elle est donc conserve : V
m
=V
re f
. La deuxime partie du test prend
en compte le cas particulier des quartiers reprsentant uniquement des attrac-
teurs, et donc avec une vitesse rapide nulle.
V
re f
>V
lente
(V
re f
<V
rapide
V
rapide
= 0) La vitesse dsire est cette fois-ci contrainte
par le quartier. Une vitesse intermdiaire V

m
est ici dtermine, correspondant
la meilleur option de vitesse moyenne sur lintervalle de temps correspondant au
quartier. Cette vitesse est soit la vitesse lente, soit la vitesse rapide (si celle-ci
nest pas nulle ou innie), suivant la quantication des sous-facteurs de dcl-
ration et dacclration ainsi que la valeur de prfrence personnelle (confre
Section 5.4.4, page 174) :
V

m
=
_
_
_
V
rapide
si V
rapide
= 0.F
acc
< (1).F
dec
V
lente
sinon
La vitesse dadaptationV
m
est alors choisie de telle faon quelle nimpose quune
faible variation pour la seconde venir, tout en garantissant une variation conti-
nue sur lintervalle de temps correspondant au quartier, aboutissant une vitesse
moyenne V

m
. Cette faon de procder a pour objectif dviter des adaptations
trop brutales pour des prdictions moyen terme, dont la validit nest quhy-
pothtique, et ainsi de rduire les discontinuits dans le mouvement. Pour se
faire, nous exprimons la vitesse sous la forme dune suite arithmtique v
n
ayant
pour raison une acclration instantane A. Cette dernire correspond la varia-
tion de vitesse durant un pas de temps t. En considrant lintervalle de temps
[t
a
.t; t
b
.t] correspondant au quartier, le problme se pose alors de la faon sui-
vante :
v
0
=V
re f
v
n+1
= v
n
+A
tel que
t=t
b

t=1
v
t
t
b
=V

m
Le but est donc de trouver lacclration instantane A telle que la vitesse moyenne
durant les prochains t
b
laps de temps soit V

m
. Aprs dveloppement de lquation
prcdente, on obtient :
A =
2
t
b
+1
.(V

m
+V
re f
)
179
Le comportement de lhumain virtuel
Pour nir, la vitesse optimale V
m
est choisie comme tant celle adopter durant
le prochain laps t, soit :
V
m
= v
1
=V
re f
+A =
2.V

m
+(t
b
1).V
re f
t
b
+1
Notons que la dure de validit de cette vitesse nest que dun laps de temps t,
devant tre recalcule pour suivre les variations de la suite arithmtique.
5.4.7 Conclusion
La navigation forme le dernier comportement ractif de lhumain virtuel. Elle permet
de tenir compte des informations ponctuelles inuenant son dplacement. Lapproche
que nous proposons permet dappliquer les principes noncs en psychologie : prdic-
tion, robustesse, minimisation des ajustements, et ractivit.
Son avantage majeur est de permettre la fusion efcace dinformations de nature dif-
frente, que ce soit des obstacles gnant la circulation, ou des attracteurs incarnant les
objectifs secondaires de lhumanode. Son fonctionnement est indpendant des autres
comportements, si ce nest la prise en charge de leurs directives. Dautre part, ce com-
portement est individualis par lintroduction de facteurs qualitatifs pour la quantica-
tion des lments de lenvironnement.
Enn, la mthode de calcul propose permet de simplier lespace de recherche des
solutions grce une discrtisation du temps. Cela permet datteindre le niveau de per-
formances ncessaire la simulation dune multitude dindividus, tout en conservant
le ralisme indispensable notre cadre dtude.
5.5 Les tches cognitives
Nous avons jusqu prsent dcrit un certain nombre de comportements ractifs, effec-
tuant des traitements automatiss de tches spciques. Ces comportements ncessitent
un certain niveau de contrle externe, que ce soit pour rgler leur mode de fonction-
nement, ou simplement pour les dclencher. Les tches cognitives se chargent de cette
rgulation au sein dun processus comportemental plus abstrait, i.e. plus loign de
la dnition physique de lenvironnement pour se rapprocher dune symbolisation in-
terne. Ces modules comportementaux seront ainsi capables de prendre des dcisions
relatives aux comportements ractifs, sans pour autant avoir besoin de connatre les
dtails de leur fonctionnement.
Nous allons voir que certaines de ces tches cognitives sont uniques au sein de lhuma-
node, se chargeant dun comportement singulier comme lobservation, et que dautres
sont prsentes plusieurs fois, grant des comportements identiques et concurrents comme
le droulement de linteraction. Rappelons que ces tches cognitives sont des spcia-
lisations du concept introduit par BIIO (confre Section 3.2.7, page 100). A ce titre,
elle peuvent exploiter les ressources gres dans linteracteur, et disposent dune prio-
rit dnissant leur ordre relatif dexcution. Nous verrons par la suite que ces tches
cognitives sont prsentes dans un processus global automatique de lindividu, qui les
rafrachira une frquence de 1Hz.
180
Les tches cognitives
Nous allons maintenant dcrire les trois tches cognitives proposes avec lhumain
virtuel : observer, se dplacer, et interagir. Les automates utiliss se basent sur la s-
mantique prsente en annexe B, page 243.
5.5.1 Choix du mode dobservation
Cette premire tche cognitive se charge de piloter lobservation de lhumain virtuel.
Le but est ici dactiver ou dinhiber la rcupration de certaines catgories dinforma-
tions, suivant le contexte comportemental de lentit. Ainsi, il nest pas question ici de
piloter la physique de lobservation (orientation du regard par exemple), mais plutt
lquivalent du processus dabstraction prsent entre la mmoire perceptive et court
terme (confre Section 2.1.2, page 58).
Nous proposons deux modes dobservation :
Regarder. Ce premier mode correspond lobservation passive, que lon effectue im-
plicitement en se dplaant. Cet tat de lobservation ne va se charger que de
rcuprer les informations topologiques perues, sans mettre jour la liste dob-
jets interactifs ventuellement visibles.
Chercher. Ce second mode correspond lobservation active, signiant quun objet
particulier est recherch par lentit. Dans cet tat, le comportement ractif dob-
servation met jour les deux listes de perception de lentit, que ce soit topolo-
gique ou les objets visibles. Ces objets visibles pourront ensuite tre analyss par
dautres tches cognitives qui sont la recherche dinformations.
Ces deux modes sont concurrents, et se synchronisent par lvaluation dune ressource
mise disposition dans lhumain virtuel. Cette ressource, simplement dnomme ob-
servation, est une ressource partage (nous expliquerons cette ncessit dans la section
ddie la gestion de linteraction, Section 5.5.3, page 183). On peut ainsi symboliser
cette tche cognitive par un automate (Figure 5.26) comportant deux tats, correspon-
dants chacun des deux modes pr-cits. Une valuation libre de la ressource observa-
tion signie quelle est disponible 100%, et utilise quelle prsente nimporte quel
autre taux dutilisation. Cette tche cognitive prend donc ses dcisions par lvaluation
dune donne externe, qui sera modie par dautres processus comportementaux.
FIG. 5.26: Lautomate observer choisit les informations visuelles prendre
en compte : uniquement topologiques, ou aussi smantiques.
Pour nir, signalons que cette tche cognitive est toujours active dans lhumanode, et
nest reprsente quune seule fois. Cette proprit est directement issue de la ralit,
lhumain virtuel nayant piloter quun seul mcanisme de perception visuelle. Sa
181
Le comportement de lhumain virtuel
priorit ne varie jamais, et est toujours nulle, signiant que le contrle de lobservation
est une tche paresseuse de lhumain virtuel (elle est toujours value en dernier).
5.5.2 Choix du mode de dplacement
Cette deuxime tche cognitive choisit le mode de dplacement actuel de lhumain vir-
tuel. Encore une fois, il ne sagit pas ici davoir un contrle physique sur la locomotion
de lentit, mais plutt de cataloguer le but global de ce dplacement.
Nous proposons trois modes de dplacement :
Attendre. Ce premier mode correspond labsence de directive de dplacement. Cest
donc un mode par dfaut, qui dnit ce que fait lentit si elle na pas explicite-
ment besoin de se dplacer. Ce mode va donc chercher limiter les interactions
de lhumanode avec les autres entits mobiles, tout en minimisant son dplace-
ment. Pour se faire, des objets interactifs particuliers sont utiliss, dnissant des
zones dattente sans reprsentation physique. Cet tat se contente alors dame-
ner lhumanode dans la zone dattente la plus proche, via une planication de
chemin, puis de congurer sa vitesse dsire la vitesse nulle.
Dambuler. Ce second mode est passif, correspondant au dplacement standard. Il
est activ ds quun autre processus dcisionnel de lhumanode slectionne une
destination dans lenvironnement. Ce mode ninuence en rien le dplacement de
lentit, qui est dj congur par le processus annexe ayant choisi la destination.
Explorer. Ce dernier mode est complmentaire au prcdent, prenant le relais lorsque
la destination choisie est inconnue. Dans ce cas, lexploration de lenvironne-
ment est active, en utilisant la planication de chemin correspondante, jusqu
ce quune destination compatible soit trouve ou que la destination change.
Ces trois modes sont concurrents, et peuvent tre grs, comme pour la tche dobser-
vation, par trois tats dun automate (Figure 5.27). La dcision sy opre en deux temps.
FIG. 5.27: Lautomate se dplacer choisit la tche de dplacement actuelle :
explorer lenvironnement, trouver une zone dattente, ou encore
dambuler vers la destination choisie.
Premirement par lvaluation dune ressource partage prsente dans lhumanode,
dnomme navigation (cette ressource est explicite au mme titre que la ressource
observation dans la partie suivante consacre linteraction). Si cette ressource est uti-
lise, cest quune autre tche cognitive a command un dplacement, le dplacement
passant alors en mode dambuler. Dans le cas contraire, le contexte comportemental
182
Les tches cognitives
de lagent autonome est test pour savoir si des interactions sont actuellement requises.
Si cest le cas, et sachant quaucune destination nest explicitement choisie, cest que
lhumanode est incapable de trouver un effecteur valide dans lenvironnement : il passe
donc en mode exploratoire. Autrement, lhumanode na pour le moment pas dactivit
ncessitant de mouvement, et il passe donc en mode dattente. On peut ainsi voir que
cette tche cognitive base ses dcisions sur des donnes provenant dautres processus
de lhumain virtuel.
Pour les mmes raisons que la tche dobservation, cette tche de rgulation est tou-
jours active dans lhumanode, et reprsente une seule fois. Sa priorit suit aussi la
mme rgle, tant toujours de valeur nulle.
5.5.3 Gestion de linteraction
Cette dernire tche cognitive est aussi la plus complexe. Elle se charge dorganiser
compltement le droulement dune interaction, depuis son activation jusqu lutili-
sation de leffecteur la permettant. Ainsi, cest cette tche qui effectue le lien entre les
affordances gres par linteracteur, et le dplacement de lentit au sein de lenviron-
nement.
Cette tche est multiple pour un individu, i.e. elle peut tre prsente plusieurs fois,
chaque instance grant une affordance diffrente. Comme ce processus a un impact
direct sur le dplacement de lhumain virtuel, les diffrentes instances doivent tre ca-
pables de grer leur concurrence quant ce type de contrle. Nous allons prsenter cette
tche cognitive sous la forme dun automate hirarchique, dont chaque sous-automate
se charge dune partie du processus dinteraction (Figure 5.28), dont notamment la
gestion de la concurrence. Nous exposerons globalement le rle de chacun de ces sous-
automates, une description plus dtaille tant fournie en annexe (confre Annexe C,
page 245).
FIG. 5.28: Vue densemble des changements de modalit dinteraction.
Chaque sous-automate de linteraction est reprsent, avec les
transitions possibles vers dautres sous-automates. Une transition
symbolise lactivation dun des tats de lautomate cibl. Les
conditions ne sont pas reprsentes dans un souci de lisibilit.
Interagir est le premier automate tre activ, par lattribution dune affordance g-
rer (nous reviendrons sur cette attribution avec le raisonnement de lhumanode, Cha-
pitre 5.6, page 186). Cet automate analyse ltat de laffordance dans le gestionnaire de
183
Le comportement de lhumain virtuel
linteracteur pour prendre sa dcision. Si laffordance est active, le processus dinter-
action dbute. Si laffordance est inactive (car sa pr-condition rationnelle a chou, ou
quelle comporte des sous-buts), le processus se met en attente. Enn, si laffordance
nest plus requise (elle est absente du gestionnaire), le processus met n linteraction.
Lautomate utilisation possible est activ si laffordance est rationnellement plausible.
Cest lui qui gre la concurrence entre plusieurs interactions pour le pilotage de lhu-
manode, grce la consommation des deux ressources partages de lhumanode :
la navigation et lobservation. La premire tche cognitive dinteraction entrant dans
ce mode, ordonne grce la priorit hirarchique de laffordance gre, pourra ainsi
passer en interaction active aprs avoir consomm 60% de la ressource navigation,
interdisant ce mode aux interactions suivantes. Au maximum quatre tches suivantes
pourront passer en mode ractif, par la consommation de 25% de lobservation. Les
autres tches seront rediriges dans un tat tampon dattente des ressources, jusqu ce
que celles-ci soient libres ou que la priorit de laffordance gre fasse remonter la
tche dans la squence dvaluation des interactions. Remarquons pour nir que cest
lexcution de cet automate, consommant les ressources, qui va directement inuencer
les deux autres tches cognitives vues prcdemment : les gestions de lobservation et
du dplacement.
Mode actif de linteraction
Le mode actif de linteraction est reprsent par les automates gauche de la gure 5.28.
Son premier automate est la recherche active, qui se charge de parcourir lenvironne-
ment pour se rendre proximit dun effecteur compatible avec laffordance courante.
Ainsi, cet automate sassure quun chemin est plani jusqu un endroit contenant
un tel effecteur, puis attend que cet effecteur soit visible, le comportement ractif de
navigation se chargeant automatiquement du mouvement de lhumanode. Lautomate
gre ensuite le pr-abonnement leffecteur, dclarant lintention de lagent autonome
dutiliser celui-ci, et sassure de la validit de la pr-condition locale de laffordance.
En cas de succs, lutilisation de leffecteur peut commencer. Notons que les tests rela-
tifs laffordance et leffecteur sont rcurrents dans cet automate, intervenants chaque
rafrachissement mme si lutilisation active est dmarre.
Lautomate suivant gre lutilisation active de leffecteur slectionn. Celui-ci choisit
si lindividu doit attendre pour linteraction, ou sil peut rejoindre la zone dancrage
de la le dutilisation de leffecteur associe laffordance courante. Une fois la zone
dancrage rejointe, lutilisation relle peut dmarrer.
Le dernier automate de ce mode soccupe de lattente active. Celui-ci applique donc
lorganisation sociale associe la le dattente de leffecteur pour laffordance cou-
rante. Il dispose aussi dun tat terminal dchec, dans le cas ou laffordance ne sup-
porte pas lattente.
Mode ractif de linteraction
Le mode ractif de linteraction est reprsent par les automates droite de la -
gure 5.28.
Son premier automate pilote la recherche ractive dun effecteur compatible avec laf-
184
Les tches cognitives
fordance courante. Ainsi, cet automate na aucun contrle sur la planication de che-
min, mais se contente danalyser les objets interactifs perus par lhumanode au cours
de son dplacement. Si un objet compatible est dtect, lautomate sassure alors de la
validit de la pr-condition locale, dclare lintention dutilisation, et lance lutilisation
ractive. Comme pour le mode actif, le test de la pr-condition locale est rcurrent,
mme une fois que lutilisation est dmarre.
Lutilisation ractive dclenche lutilisation nale des effecteurs la vole. Celle-ci
sassure tout dabord quune zone dutilisation est libre pour laffordance courante,
et dans le cas contraire invalide leffecteur slectionn. On peut ainsi en dduire que
les effecteurs avec des zones dutilisation multiples, comme des objets interaction
visuelle, seront plus propices ce mode ractif de linteraction. Si une zone est libre,
lautomate va alors inuencer la navigation de lentit, en lattirant vers la position
propice une interaction. Il nest donc pas question ici de donner un ordre formel au
comportement ractif de navigation, mais plutt de le pousser considrer cette option
de dplacement. Si la position dutilisation est atteinte, lutilisation relle peut alors
commencer.
Utilisation nale
Ce dernier automate, commun aux deux modes dinteraction, permet rellement duti-
liser un effecteur. Lorsque cet automate est lanc, lhumanode virtuel se trouve la
position dutilisation pour laffordance courante et leffecteur slectionn. La premire
action entreprise consiste alors inscrire lagent autonome la le dutilisation corres-
pondante. Ensuite, le temps dutilisation est valu, durant lequel un tat dattente soc-
cupe dexcuter le contrle durant linteraction de laffordance. Aprs cela, le contrle
en n dinteraction de laffordance est excut. Lautomate est alors capable dana-
lyser les affordances actives de lhumanode, pour vrier si la position actuelle peut
nouveau tre utilise, permettant ainsi denchaner les interactions auprs du mme
effecteur.
5.5.4 Conclusion
Nous avons prsent dans cette section trois types de tches cognitives dont dispose
lhumain virtuel. Les deux premires, grant lobservation et le dplacement, sont
uniques et toujours prsentes quel que soit lindividu. Ce sont des tches soccupant
du fonctionnement gnral de lentit, prenant des dcisions relativement son tat
comportemental global. La troisime tche cognitive, grant linteraction, est quant
elle multiple pour un individu, reprsentant chaque fois une affordance diffrente.
Ainsi, certains individus pourront navoir aucune tche interagir, tandis que dautres
en auront plusieurs concurrentes, suivant la procdure comportementale quils sont en
train de suivre. Il est donc ncessaire de fournir lhumain virtuel un mcanisme den-
core plus haut niveau, lui permettant de dmarrer et de congurer ces tches cognitives
dinteraction.
185
Le comportement de lhumain virtuel
5.6 Le processus de raisonnement
Nous avons jusqu prsent dcrit un ensemble de modules comportementaux allant
du ractif au cognitif. Ces processus ne sont capables de prendre des dcisions que de
faon relativement isole, sans tenir compte dun plan comportemental plus gnral.
Nous proposons donc un ensemble de mcanismes permettant de simuler ce raison-
nement plus global. Sans aller jusqu la complexit de mcanismes dapprentissage
ou dinfrence, nous offrons tout de mme un aspect rationnel permettant de grer des
activits long terme. Nous allons voir que ce modle est capable de sadapter di-
vers alas environnementaux, et permet lorganisation de comportements concurrents.
Ces buts sont atteints par la gestion des couches comportementales intermdiaires de
lagent autonome, que sont les affordances et les tches cognitives.
5.6.1 Gestion des affordances
Les affordances reprsentent les interactions disponibles dans lenvironnement de si-
mulation. Celle-ci vont reprsenter les buts de lhumain virtuel, choisis de manire
explicite, ou des sous-buts, permettant de rsoudre des objectifs intermdiaires. Lhu-
main virtuel doit tre capable dorganiser ces interactions de manire rationnelle, an
de dterminer celles devant tre excutes chaque instant.
Nous avons vu dans la partie ddie linteracteur (confre Section 3.4.2, page 107)
que celui-ci dispose dun gestionnaire permettant une organisation hirarchique des
affordances quil souhaite accomplir. Cette organisation correspond donc directement
la construction dun plan comportemental long terme. En tant que spcialisation
de linteracteur, lhumanode virtuel a accs ce gestionnaire, et na ainsi plus qu
lintgrer son processus comportemental global.
Les fonctionnalits du gestionnaire qui doivent tre incluses sont :
1. Lordonnancement des affordances par ordre de priorit. Rappelons que deux
fonctionnalits du gestionnaire permettent cet ordonnancement, lune pour les
affordances rationnellement valides, et lautre pour celles qui sont inactives. Cet
ordonnancement sert donner un ordre dvaluation au test des pr-conditions
rationnelles des affordances.
2. Lvaluation des pr-conditions rationnelles des affordances. Ici aussi deux fonc-
tionnalits se chargent de ces tests, lune pour les affordances actives et lautre
pour les inactives. Ce sont ces valuations qui vont produire dventuels sous-
buts, permettant lmergence du plan comportemental.
La gure 5.29 montre le processus dappel mis en uvre pour ces quatre fonction-
nalits. Les affordances actives sont traites une frquence de 1Hz, an de garantir
une certaine ractivit du systme. Cela correspond la focalisation dun tre humain
sur les tches quil souhaite accomplir immdiatement. Les affordances inactives sont
quant elles traites une frquence plus faible, toutes les vingt secondes. Cette va-
leur a t arbitrairement choisie pour donner une latence importante la dcision ne
concernant pas les actions immdiates. Cela permet aussi de conserver un minimum de
ractivit pour des actions pouvant tre ractives par des modications des conditions
environnementales, i.e. non dpendantes de lactivit de lhumanode.
186
Le processus de raisonnement
FIG. 5.29: La gestion des affordances par lhumanode prend la forme dun
automate dclenchant les fonctionnalits du gestionnaire de lin-
teracteur intervalles de temps rguliers.
5.6.2 Gestion des tches cognitives
Comme pour les affordances, linteracteur dispose de mcanismes gnriques permet-
tant la gestion des tches cognitives (confre Section 3.4.3, page 109). Ces fonction-
nalits sont capables dorganiser automatiquement lexcution des tches, sans pour
autant connatre leur but ni mme leur fonctionnement interne. Comme pour les affor-
dances, laspect rationnel de lhumanode intgre ces fonctionnalits son processus
comportemental global.
Nanmoins, une fonctionnalit supplmentaire est ici ajoute, se chargeant de lancer
ou stopper automatiquement certaines tches. Cette supervision permet lagent au-
tonome de ne pas surcharger son moteur de dcision, tout en garantissant la prsence
des processus comportementaux atomiques ncessaires. La supervision soccupe ex-
clusivement des tches interagir, celles dobservation et de dplacement tant toujours
prsentes. Les tapes de la supervision sont les suivantes :
1. Lancement ou arrt dune tche dinteraction reprsentant laffordance mer-
geante de la planication de chemin (confre Section 5.3.4, page 155). Rappe-
lons quune interaction merge de la planication de chemin chaque fois quun
objet traversable, tel quun escalier, doit tre emprunt. La supervision sassure
donc que cette interaction soit reprsente par une tche cognitive dinteraction,
et avec la priorit la plus haute de toutes celles prsentes. La tche est supprime
si linteraction mergeante nest plus requise.
2. Dmarrage automatique de tches dinteractions correspondant aux cinq affor-
dances actives les plus prioritaires. Cette tape sassure que des comportements
cognitifs reprsentent les besoins dinteraction immdiats de lhumain virtuel. Le
nombre cinq a t choisi conformment au possibilits dexcution concurrente :
une interaction peut tre en mode actif, et quatre en ractif simultanment.
3. Arrt automatique des tches interagir au del de dix simultanes, par ordre de
priorit croissante des affordances correspondantes. Cette tape permet de ne
pas surcharger ltage cognitif de lhumanode, en supprimant les tches dinter-
action qui seront de toute faon incapables de sexcuter, du fait de la gestion
de la concurrence. Une marge de cinq tches dinteractions supplmentaires est
conserve, pour faciliter la reprise du processus dans les cas de chute ponctuelle
187
Le comportement de lhumain virtuel
de la priorit.
On peut voir sur la gure 5.30 la squence dappels aux diffrentes fonctionnalits.
Lintervalle de temps de une seconde entre deux rafrachissements a t choisi arbitrai-
rement en tenant compte de la ractivit ncessaire dans le contrle des tches cogni-
tives, et de la cohrence temporelle plus forte de cet tage comportemental vis vis
de ltage ractif. Lordonnancement est le premier tre effectu, tant ncessaire la
supervision. Lexcution intervient en dernier, aprs dventuels ajouts ou suppressions
de tches cognitives.
FIG. 5.30: La gestion des tches cognitives par lhumanode a recours aux
fonctionnalits de linteracteur intervalles de temps rguliers.
5.6.3 Intgration gnrale
Maintenant que nous avons dnit les deux processus de contrle de plus haut niveau
de lhumanode, nous pouvons synthtiser les diffrentes tapes du comportement pour
voir comment elles sintgrent au sein de lagent autonome.
La gure 5.31 reprsente ainsi le processus comportemental global de lhumain virtuel.
Il se prsente sous la forme dun automate comportant un ensemble dactions corres-
pondant chacune des tapes de la pyramide comportementale de notre modle. Cet
automate est rafrachit la frquence la plus haute du systme, et slectionne les actions
effectuer suivant leur cohrence temporelle.
Ainsi, la locomotion de lhumanode est rafrachie la frquence de lautomate, se
chargeant de lanimation et du dplacement de lindividu suivant les directives de la
navigation ractive. Ce processus na pas t prsent dans ce chapitre sur lhumain
virtuel car nous ne nous y sommes pas intress directement. Nous laborderons dans
la partie venir sur les rsultats (confre Chapitre 6.1.1, page 199), en prsentant le
moteur danimation externe que nous avons utilis.
A chaque fois que lentit pose un pied sur le sol, une squence de comportements
ractifs est dclenche :
Mise jour du chemin plani, puis optimisation visuelle pour en extraire la direc-
tion de mouvement optimale.
Observation de lenvironnement, suivant les directives de la tche cognitive corres-
pondante, aboutissant la mise jour des listes de la mmoire court terme.
Navigation ractive, prenant en compte les obstacles mobiles ou statiques, ainsi que
les ventuels attracteurs spcis par les tches cognitives dinteraction.
Cet aspect vnementiel a t choisi en partant du principe quun individu ne modie
sa trajectoire que lorsquil a un appui au sol.
Enn, une squence de comportements cognitifs et rationnels est dclenche chaque
188
Le processus de raisonnement
FIG. 5.31: Lautomate se comporter gre lexcution intgrale de lhuma-
node. Il est appel la frquence la plus haute et se charge de
lancer les actions allant du biomcanique (locomotion) au raison-
nement.
seconde :
Mise jour des ressources contenues par lhumanode, par lappel de la fonctionna-
lit de lobjet interactif physique parent.
Gestion des affordances, correspondant lautomate vu dans la section 5.6.1.
Gestion des tches cognitives, correspondant lautomate vu dans la section 5.6.2.
Laspect cognitif nest reprsent dans cette squence dactions que par la dernire
partie, concernant lexcution des tches cognitives.
5.6.4 Conclusion
Nous avons prsent dans cette section les deux gestionnaires servant de processus
rationnel lhumain virtuel. Le premier se charge dune gestion de haut niveau des
affordances requises par lentit, et ainsi de leur aspect rationnel. Le second organise
lexcution des tches cognitives, et rend ainsi possible la gestion de la concurrence
entre comportements.
Ce qui caractrise en premier lieu ces processus rationnels est leur abstraction totale
du mode de fonctionnement des sous processus quils organisent. En effet, leur activit
est totalement gnrique, base sur les concepts introduits par BIIO. Cet aspect permet
de conserver les avantages fournis par notre modle dobjets interactifs, notamment
le potentiel dvolution, tout en intgrant les divers concepts dans une architecture
spcique dnie.
Ainsi, chaque module comportemental que nous avons dni jusqu prsent sagence
dans un processus global, la mcanique ge. Ces modules peuvent alors fonctionner
de faon relativement indpendante, comme autant de botes noires communiquant des
informations minimales. Une telle catgorisation a lavantage de permettre le rempla-
cement ais dun modle, tout en gardant une architecture globale fonctionnelle.
189
Le comportement de lhumain virtuel
5.7 Conclusion et discussion
Nous avons prsent dans ce chapitre notre modle dhumain virtuel. Larchitecture
propose est fortement axe sur les principes voqus par la psychologie cognitive.
Ainsi, notre agent autonome se subdivise en modules comportementaux au fonction-
nement indpendant, communiquants entre-eux grce des informations synthtiques.
Ces modules sont ensuite intgrs dans un processus global, rgissant le dclenchement
des actions de lhumanode au cours du temps. Nous navons pas abord la couche bio-
mcanique dans cette architecture, pour laquelle nous utiliserons un modle externe,
que nous introduirons dans la partie sur les rsultats.
Le premier module propos est le comportement ractif de perception visuelle. Celui-ci
permet lentit danalyser son environnement au fur et mesure de ses dplacements.
La perception est couple un mcanisme mmoriel exclusivement topologique. Cette
premire tape permet de rendre les humains virtuels non omniscients, et constitue un
premier pas vers llaboration de comportements opportunistes. Le modle propos ici
est volontairement brid, en ngligeant les principes dabstraction individuelle de lin-
formation, ainsi que de renforcement et rcupration dans la mmoire. Nous justions
ce choix par le domaine dapplication cibl, avec la simulation de situations de courte
dure, qui est sufsamment restreint pour ne pas ncessiter ces mcanismes.
Le second comportement ractif propos est la planication de chemin. Celle-ci per-
met dvaluer un dplacement global, tout en rpondant trois objectifs diffrents :
rejoindre une position identie, explorer lenvironnement, ou choisir un couple inter-
action/effecteur. Ce dernier objectif permet ainsi de situer la prise de dcision relative
linteraction. On peut relever un point faible de cette mthode : elle ne tient pas compte
du contexte comportemental pour choisir leffecteur nal. En effet, le choix ne seffec-
tue quen considrant les affordances actives de manire plane, sans tenir compte de la
poursuite du plan comportemental. Ainsi, lenchanement des interactions nintervient
pas dans la dcision, ce qui rsultera en une lacune au niveau de leur regroupement
spatial. Malgr tout, la planication de chemin reste un mcanisme robuste, grant
lensemble des autres cas pouvant se prsenter, et individualis, par lvaluation de
multiples critres comportant des degrs de prfrence. Les algorithmes proposs sont
de plus efcaces en termes de calcul, fonctionnant sur des espaces de recherche trs
restreints.
Le troisime et dernier comportement ractif de lindividu gre sa navigation ractive.
Celle-ci permet aussi lindividu dvaluer son chemin, mais un niveau local cette
fois-ci, en vitant les collisions avec les entits de lenvironnement immdiat de lhu-
manode. Ce comportement applique les principes de dplacement pdestre noncs
en psychologie et sociologie, an de proposer une rsolution permettant lmergence
de phnomnes ralistes. La dcision est ici aussi individualise, par lintroduction de
prfrences personnelles quant aux adaptations possibles. Enn, des entits attractives
peuvent tre gres par ce comportement, constituant un pas supplmentaire vers la
rsolution de comportements opportunistes.
Ces comportements ractifs sont ensuite grs par des tches cognitives, qui procdent
une prise de dcision plus abstraite. Trois tches sont ainsi proposes, les deux pre-
mires tant trs proches de ltage ractif pour contrler lobservation et le dplace-
ment de lindividu, la dernire en tant plus loigne pour contrler le droulement
dune interaction. Cette troisime tche cognitive va ainsi organiser totalement une
190
Conclusion et discussion
affordance, que ce soit sa concurrence avec les autres vis--vis des ressources de lhu-
main virtuel, ou la recherche dun effecteur compatible dans lenvironnement, ou en-
core la gestion de lorganisation sociale lie lattente. Cet tage comportemental est
de plus fortement ouvert, protant de la gnricit introduite par BIIO pour permettre
lvolution aise du modle dhumain virtuel.
Pour nir, des processus de raisonnement simplis organisent de faon plus globale
le comportement individuel. Ces mcanismes sont loin de reprsenter la complexit du
raisonnement humain, mais permettent tout de mme la gestion de procdures com-
portementales long terme. Ils sont constitus des fonctionnalits gnriques fournies
avec linteracteur BIIO, auxquelles sajoutent un mcanisme de supervision des tches
cognitives.
Nous pouvons conclure que le modle propos forme une architecture raliste dhu-
main virtuel, o les principaux tages comportementaux de A. Newell sont reprsen-
ts. Ce modle permet la simulation dhumains virtuels non omniscients, aux compor-
tements individuels et opportunistes, avec une grande autonomie quant la prise de
dcision. Il reste de plus trs ouvert, en proposant un mcanisme gnral dni sup-
portant lextension de certains de ses constituants, tels que les tches cognitives et les
affordances.
191
Conclusion et perspectives
Nous avons prsent dans cette partie les trois modles constituant nos contributions.
Tout dabord, nous avons propos avec BIIO une architecture dobjets interactifs qui
dlimite le cadre de nos simulations. Ce modle nonce les concepts ncessaires
la description et la gestion de linteraction dun point de vue comportemental. Il
dnit ainsi un certain nombre dobjets interactifs plus ou moins abstraits, dots de
fonctionnalits gnriques pouvant sadapter des spcialisations ultrieures. Plusieurs
de ces spcialisations seront prsentes dans les rsultats de cette thse.
Rappelons que ce modle ne sintresse que peu linteraction physique entre un in-
dividu et un quipement, tout au plus en spciant des zones de lenvironnement
atteindre. Par consquence, il se concentre plus sur le ralisme comportemental dune
simulation que sur son ralisme visuel, comme pourrait le faire un modle de type
Starsh [11] ou smart object [60]. Une volution souhaitable de ce modle serait donc
vers la gestion ne de linteraction physique, dont le point de dpart pourrait tre la
spcialisation des procdures de contrle de laffordance.
Un autre aspect du comportement non abord par se modle concerne la rsolution
rationnelle. Celle-ci est simule par lenchanement hirarchique des affordances, qui
ne contient daucune manire de processus de planication dactions. En effet, mme
si ce principe dexcution permet une certaine libert dans la rsolution globale dun
but complexe, les possibilits de rsolution doivent toutes tre exprimes dans les pr-
conditions de laffordance, le modle ne pouvant pas les dduire automatiquement.
Ainsi, une autre volution avantageuse pour ce modle serait lintroduction de pro-
cessus rationnels plus complexes. Par exemple, la dduction automatique dactions
entreprendre pourrait tre propose en fonction des pr-requis dune interaction de rf-
rence. Un processus dapprentissage pourrait aussi tre mis en place, o un interacteur
naurait pas forcment accs lintgralit des affordances qui lui sont compatibles.
Il pourrait aussi augmenter ses possibilits dinteraction en spcialisant et en uniant
dynamiquement des affordances connues.
Nous avons ensuite propos un modle de reprsentation de lenvironnement de simu-
lation. Celui-ci se base sur une reprsentation exacte de la gomtrie des lieux, puis en
effectue une abstraction informe sous la forme dun graphe hirarchique. Une typolo-
gie est associe aux nud du graphe topologique, permettant de caractriser globale-
ment les zones de circulation tout en gardant un lien avec leur dnition gomtrique
ne. De plus, ce graphe peut tre tendu par son interconnexion avec dautres environ-
nements utilisant la mme reprsentation. Ensuite, un certain nombre de donnes sont
193
Conclusion et perspectives
introduites, qui permettront une exploitation rapide et efcace de lenvironnement par
les entits qui y voluent. Pour nir, les objets interactifs sont associs la topologie,
permettant de situer linteraction dans lespace.
Comme nous lavons vu au travers de plusieurs exemples, cette approche permet de
reprsenter des environnements de taille diverse, allant de la ville la maison. Une
perspective dutilisation attrayante serait de reprsenter lintgralit dune ville grce
ce modle, en inter-connectant plusieurs environnements de catgorie smantique
diffrente. Il serait ainsi possible de reprsenter les rues de la ville par un graphe dabs-
traction, puis chaque btiment par un autre graphe qui sera connect celui de la ville.
Nous pouvons assurer quune telle construction est possible, tout en envisageant que
son exploitation se ferait avec une complexit de calcul raisonnable grce laspect
hirarchique de la reprsentation.
Pour nir, nous avons propos un modle dhumain virtuel rpondant aux exigences
de ralisme de notre cadre dtude. Ce modle est organis suivant le principe de
A. Newell, sous forme de pyramide comportementale compose de modules au fonc-
tionnement indpendant changeant des informations synthtiques. Lagent autonome
rsultant dispose de comportements ractifs lui permettant dapprhender son envi-
ronnement, en le percevant et en sen souvenant, et de linuencer, en sy dplaant.
Lhumain virtuel dispose alors de processus dcisionnels plus abstraits, les tches cog-
nitives, qui vont contrler cette couche ractive. Cet tage comportemental constitue
lune des parties augmentable de lhumanode, de nouvelles tches pouvant tre ajou-
tes facilement par leur gestion gnrique. Lautre partie augmentable dcoule de la
gestion des affordances, elle aussi totalement gnrique. Enn, des processus de rai-
sonnement principalement issus de linteracteur BIIO sont mis en uvre, et intgrs au
sein de larchitecture comportementale de lhumain virtuel.
Ce modle tant une spcialisation directe de linteracteur BIIO, les mmes perspec-
tives dvolution quant laspect rationnel du comportement sont envisageable : lap-
prentissage ainsi que la planication daction. Une autre perspective intressante consiste
lamlioration du mode de planication effectuant un choix dinteraction dans lenvi-
ronnement. Comme nous lavons soulign prcdemment, ce choix seffectue indpen-
damment du contexte, ne tenant pas compte de la succession dinteractions effectuer.
Une exploitation de lexcution rationnelle hirarchique des affordances serait alors
envisageable, o la planication ne chercherait plus minimiser un cot uniquement
sensible une affordance seule, mais plutt une branche du graphe comportemental.
Enn, une troisime perspective est envisager, concernant lintroduction dun com-
portement social plus marqu. Celui-ci pourrait prendre la forme dune tche cognitive
qui, en se basant sur des informations de lenvironnement immdiat de lhumanode,
pourrait notamment inuencer son comportement de navigation ractive. Elle pourrait
ainsi introduire un certain nombre de conventions sociales, comme le fait de laisser le
passage quelquun.
Pour conclure, nous avons propos un ensemble de modles interdpendants rpondant
notre problmatique, quest ltude des circulations de personnes dans des lieux fort
potentiel dinteraction. Larchitecture propose dispose dlments gs, au fonction-
nement dni, ainsi que de composants extensibles, garantissant son potentiel dvo-
lution. Le ralisme comportemental est au centre de cette approche, qui ne nglige
nanmoins pas les performances.
194
Troisime partie
Rsultats
195
Introduction
Lobjectif premier de ces travaux est ltude des circulations de personnes par des si-
mulations. Pour se faire, nous avons propos dans la partie prcdente un ensemble de
modles qui permettent datteindre un certain niveau de complexit du comportement
humain. Nanmoins, une dernire tape est ncessaire an de concrtiser ces travaux.
En effet, ces modles ne peuvent tre utiliss sans tre unis dans une application.
Deux autres problmatiques apparaissent alors, concernant dune part la manire de
renseigner une simulation, et dautre part la faon de restituer ses rsultats. Nous al-
lons ainsi proposer une architecture complte, qui permettra de rpondre ces attentes
tout en restant sufsamment ouverte pour garantir son volutivit. Un autre aspect
traiter concerne la validation des rsultats obtenus. Ceux-ci devant permettre ltude
de situations et denvironnements concrets, il est en effet ncessaire de les confronter
au rel pour en assurer la pertinence. Enn, comme nous lavons not auparavant, une
simulation doit tre sufsamment rapide pour tre utilise comme outil de travail. Elle
doit pouvoir supporter une interaction de lutilisateur pendant son excution, au moins
dans une phase de rglage, ce qui impose de garantir un certain niveau de performances.
Nous allons donc prsenter dans cette dernire partie les rsultats obtenus durant cette
thse. Nous commencerons, dans le chapitre 6, par dcrire le logiciel qui intgre les
modles proposs. Du nom de SIMULEM, cette application concrtise les travaux pr-
sents et dmontre leur faisabilit. Nous aborderons ensuite, dans le chapitre 7, la ques-
tion de la validation des modles par leur confrontation des donnes exprimentales,
ainsi que leur comparaison aux constats disponibles dans la littrature. Nous termi-
nerons, dans le chapitre 8, par une analyse des performances des diffrents modules
composant lhumain virtuel.
197
Chapitre 6
Une architecture logicielle
ddie la simulation
Dans cette premire partie des rsultats, nous allons dcrire larchitecture logicielle
mise en uvre pour effectuer les simulations. Cette architecture a pour but de faciliter
le renseignement et le droulement dune simulation, tout en intgrant lensemble des
modles vus prcdemment.
Un logiciel du nom de SIMULEM
1
incarne cette architecture. Celui-ci est issu dune
collaboration entre AREP
2
, la SNCF
3
, et lquipe Bunraku. Cette collaboration sef-
fectue dans le cadre dun projet soutenu par lANR
4
. Ce projet a couvert la dernire an-
ne de la thse prsente ici, et continuera pendant un an aprs son achvement. Deux
ingnieurs, Delphine Lefebvre et Vincent Delannoy, ont particip successivement au
dveloppement de lapplication.
Nous allons commencer par prsenter de faon gnrale cette architecture, puis d-
taillerons chaque partie en suivant un exemple qui illustrera leur principe de fonction-
nement.
6.1 Vue densemble
6.1.1 Les modles utiliss
Rappelons tout dabord les modles utiliss dans cette architecture logicielle. Celle-
ci intgre bien entendu lensemble des modles proposs dans les contributions, mais
aussi dautres modles non abords dans ces travaux.
Premirement, la reprsentation de lenvironnement sous forme de graphe topologique
est couple un algorithme de dtection de voisinage. Ce dernier nous permet de dter-
miner rapidement lensemble des entits voisines et visibles dune entit de rfrence.
1
Simuler les Espaces de la Mobilit
2
Amnagement Recherche Ples dchanges
3
Socit Nationale des Chemins de Fer Franais
4
Agence Nationale de la Recherche, Projet SIMULEM, ANR05RNTL02501
199
Une architecture logicielle ddie la simulation
Nous utilisons lalgorithme propos par F. Lamarche et al. [70], qui se base sur une
triangulation de Delaunay ltre par visibilit (Figure 6.1(a)).
Deuximement, lhumain virtuel ncessite un mcanisme grant sa locomotion. Ce
processus correspond la couche la plus basse de la pyramide de A. Newell (confre
Section 5.1, page 135), reprsentant la biomcanique de lhumanode. Nous utilisons
pour cela le modle de R. Kulpa et al. [67], dnomm MKM (pour Manageable Kine-
matic Motion). Celui-ci permet dadapter des mouvements capturs la morphologie
dun humain virtuel, ainsi que de les mlanger et les ajuster pour suivre des directives
de dplacement (Figure 6.1(b)). Notre choix sest tourn vers ce modle car il produit
des mouvements valides vis--vis des lois biomcaniques, quil permet un contrle n
des dplacements, et quil offre des performances avantageuses (le moteur permet de
simuler plusieurs centaines dindividus diffrents en temps rel). De plus, MKM sup-
porte une restitution graphique soit sous forme davatar 3D, o toute la chane articu-
laire sera anime, soit sous forme dimposteur g, amliorant ainsi les performances
dafchage tout en conservant la cohrence de la locomotion.
(a) Triangulation de Delaunay ltre par
visibilit. Les points rouges sont les en-
tits dynamiques, relies leurs plus
proches voisins visibles par les arcs
noirs. Les arcs verts sont ltrs.
(b) A gauche, le squelette contrl par MKM ; droite, une
animation produite.
FIG. 6.1: Les deux modles complmentaires utiliss.
6.1.2 Larchitecture
Larchitecture logicielle propose sorganise sous la forme de quatre modules intgrs
au sein dune mme application (Figure 6.2) :
Dnition des types dobjets grs : Ce premier module sert crer les objets BIIO
ncessaires dans le cadre de la simulation dsire.
Conguration de la simulation : Ce second module permet de congurer la simula-
tion, que ce soit son environnement, les objets et acteurs qui la compose, ou
encore des donnes terrain.
Simulation : Ce troisime module droule une simulation et permet den extraire des
informations ncessaires la caractrisation des rsultats. Il prsente aussi les
premiers rsultats en ligne, sous forme danimation 3D et de cartes 2D.
Exploitation des rsultats : Ce dernier module permet une analyse en profondeur des
donnes extraites dune simulation.
200
Dnition des objets de simulation
FIG. 6.2: Larchitecture logicielle de simulation.
Lobjectif de cette modularit est double. Tout dabord, elle permet des utilisateurs
de comptences diffrentes dintervenir sur llaboration dune simulation. En effet, la
premire tape ncessite un informaticien pour la spcication des objets BIIO, tan-
dis que les suivantes peuvent tre conduites par des utilisateurs standards, tels que des
architectes. Ensuite, cette modularit permet la rutilisation des produits de sortie de
chaque tape. Ainsi, les objets BIIO crs pour une simulation pourront tre directe-
ment fournis pour dautres simulations de mme catgorie, ou encore les rsultats pro-
duits par plusieurs simulations pourront tre analyss conjointement lors de la dernire
tape dexploitation.
6.2 Dnition des objets de simulation
La premire tape de larchitecture logicielle concerne llaboration dobjets BIIO sp-
ciques pour la simulation. An de sintgrer aux modles existants, ces nouveaux ob-
jets sont des spcialisations des concepts introduits par le modle dobjets interactifs
(confre Chapitre 3, page 91).
Le fonctionnement de cette tape est fortement bas sur le principe dintrospection
mis en uvre par BIIO, permettant ce module de proposer les types dobjets dj
existant comme base de cration. Ce module se prsente sous la forme de botes de
dialogue automatisant la cration de plugins de simulation. On peut voir sur la gure 6.3
certaines de ces interfaces, dont :
1. La liste des plugins spciques la simulation. La vue courante ne contient quun
seul plugin, dnomm ObjetsDeLaGare, contenant un certain nombre dobjets
spcialiss.
2. Un rsum des congurations effectues pour lentre slectionne dans la liste
prcdente. Nous ne nous attarderons pas sur ces paramtres fonctionnels.
201
Une architecture logicielle ddie la simulation
3. dition dun type dobjet. Les diffrents constituants de lobjet BIIOpeuvent tre
congurs ici : dnition gnrale, attributs contenus, fonctionnalits proposes,
ou encore valeur par dfaut. La vue actuelle prsente la dnition gnrale dun
composteur :
Nom : Lidentiant principal de ce type dobjet dans la simulation.
Hritage : Le principe dhritage admis pour cet objet.
Description : Texte informatif dcrivant lobjet.
Synonymes : Des synonymes pouvant tre utiliss la place de lidentiant
principal de lobjet. Ceux-ci permettent dintgrer facilement un type dob-
jet une autre simulation utilisant une smantique diffrente pour identier
les quipements.
Parents : Les parents directs de lobjet actuel dans la hirarchie des concepts de
BIIO. Lobjet actuel hritera de lensemble des constituants de ses parents.
4. Slection parmi les concepts existant dans BIIO. Cette bote de dialogue est no-
tamment utilise pour choisir un parent, ou le type dun attribut. Elle liste len-
semble des concepts prsents dans le moteur de simulation, quils soient fournis
par dfaut, via des plugins gnraux, ou encore via les plugins locaux la simu-
lation courante. La mise jour de cet outil est automatique, en se basant sur le
principe dintrospection de BIIO.
FIG. 6.3: Module de cration dobjets BIIO. (1) Liste des plugins de la si-
mulation. (2) Informations spciques lentre slectionne dans
ltape prcdente. (3) Conguration dun type dobjet. (4) Slec-
tion dun concept existant dans BIIO.
Une fois que les congurations ncessaires sont effectues, ce module est capable dex-
porter ses donnes de deux faons. Tout dabord, les types dobjets dnis pour la
202
Conguration de la simulation
simulation courante sont sauvegards au format XML, permettant leur modication ul-
trieure. Lutilisateur pourra ainsi faire voluer les constituants des objets a posteriori,
ou encore ajouter de nouveaux concepts pour enrichir la simulation. Ensuite, ce module
prend en charge la cration des plugins, en ayant recours la compilation de chiers
sources C++ gnrs automatiquement. Ces plugins seront par la suite disponibles et
fonctionnels pour la simulation en cours. De plus, ils pourront tre transfrs dautres
simulations, ou devenir des plugins gnraux disponibles dans toutes les nouvelles si-
mulations.
Pour notre exemple de gare virtuelle, nous spcions dans ce module les catgories
dobjets BIIO suivantes (confre Annexe D, page 257 pour plus de dtails) :
quipements : composteur de tickets ; tableau des dparts ; automate de vente de ti-
ckets de trains.
Usager : voyageur standard.
Accs : accs rue ; accs aux quais.
Ressources : destination ; ticket de train.
Affordances : prendre le train ; sortir de la gare ; acheter un ticket ; changer un ticket ;
composter son ticket ; lire le tableau des dparts.
6.3 Conguration de la simulation
La conguration de la simulation se dcoupe en deux tapes successives :
1. Import dun environnement de simulation.
2. Conguration des donnes de simulation.
6.3.1 Import de lenvironnement de simulation
Lenvironnement de simulation dnit aussi bien la topographie des lieux que le posi-
tionnement initial des diffrents quipements. Celui-ci est tout dabord spci par les
architectes via le logiciel AutoCAD, communment utilis dans ce milieu. En respec-
tant une certaine norme, ils peuvent :
dcrire les obstacles statiques de la simulation (le contour des btiments) ;
positionner les quipements ncessaires, comme les composteurs dans une gare ;
spcier des zones de circulation particulires, comme les accs vers les quais ou la
ville, ou encore les escaliers.
Le logiciel dispose dun outil permettant dimporter ce chier AutoCAD, den vrier
la conformit, et den extraire lensemble des informations pr-cites. Ces donnes
peuvent alors tre sauvegardes au format XML, an den permettre la rutilisation
dune simulation lautre. Depuis ce chier XML, le logiciel peut ensuite crer le
graphe dabstraction reprsentant la topologie des lieux, et gnrer les objets BIIO qui
ont t spcis. Ces objets seront alors accessibles lors de la simulation, an dtre
congurs de manire plus ne et interactivement.
Par exemple, on peut voir sur la gure 6.4(a) le chier dentre AutoCAD de notre
environnement de test. Certaines informations contenue par ce chier ne peuvent tre
reprsentes graphiquement, dautres sont indiques sur la gure :
203
Une architecture logicielle ddie la simulation
(a) Lenvironnement sous AutoCAD. (b) Les trois couches du graphe dabstraction. Dans
le sens de lecture : cellules, groupes, zones.
FIG. 6.4: Import dun environnement de simulation depuis un chier Auto-
CAD. Les numros de la gure (a) sont explicits dans le texte.
1. Les trois accs de cette gare vers la ville.
2. Quatre automates point de vente (APV), permettant dacheter et dchanger un
ticket de train.
3. Quatre moniteurs indiquant les horaires et voies daccs des trains (ces objets
sont de catgorie libre, ne gnant pas la circulation).
4. Quatre composteurs de tickets.
5. Les deux voies daccs aux trains de cette gare.
La gure 6.4(b) reprsente les trois couches du graphe topologique automatiquement
construit depuis les donnes importes.
6.3.2 Conguration des donnes de simulation
Les donnes de simulation reprsentent lensemble des informations ncessaires
lexcution dune simulation. An de rpondre aux besoins particuliers de la simu-
lation de gares ferroviaires, nous avons dvelopp des interfaces de saisie spciques
qui englobent les interfaces gnriques fournies pour BIIO (sur les gures suivantes,
gauche linterface spcique, droite linterface gnrique). Dtaillons les possibilits
offertes pour cette tape de conguration.
204
Conguration de la simulation
Conguration gnrale
La conguration gnrale de la simulation permet den spcier les paramtres envi-
ronnementaux. On peut voir sur la gure 6.5 les diffrents choix possibles :
FIG. 6.5: Conguration gnrale dune simulation : chiers sources, date de
dpart de la simulation, etc.
Le chier denvironnement utiliser, correspondant limport vu prcdemment.
La reprsentation graphique de lenvironnement utiliser.
La date de dpart de la simulation (en temps simul), qui servira de rfrence lors de
son droulement.
Deux options contrlant la production de rsultats, permettant de la dsactiver pour
gagner en performances lors dune phase de test, ou dafcher diverses cartes pour
avoir une vision synthtique de lvolution de la simulation.
Une option contrlant le type de reprsentation graphique utiliser pour les huma-
nodes : avatar anim pour une meilleure restitution visuelle, ou imposteur pour de
meilleures performances.
Conguration des populations
La conguration des populations permet daffecter des paramtres gnraux aux in-
dividus crs lors de la simulation. Deux niveaux de conguration sont disponibles
(Figure 6.6) :
Population. Une population est une rpartition darchtypes dnissant en quelles
proportions ils la composent.
Archtype. Un archtype permet de congurer les paramtres internes des huma-
nodes gnrs, tels que :
La rpartition homme/femme (uniquement utilise pour la reprsentation gra-
phique actuellement).
La vitesse moyenne de marche, et son cart type.
Les facteurs inuenant la navigation.
205
Une architecture logicielle ddie la simulation
FIG. 6.6: Conguration des populations et des archtypes.
Le rayon moyen, et son cart type.
Les chiers graphiques utiliss pour la reprsentation.
Le pourcentage de voyageurs au dpart ayant un ticket de train lors de leur
entre en gare.
Limport/export de ces donnes seules est possible, permettant leur rutilisation. Lutili-
sateur pourra ainsi crer une bibliothque de populations quil sera en mesure dutiliser
dune tude lautre.
Conguration des trains
La conguration des trains couvre deux sujets (Figure 6.7) :
Le matriel : il dnit les caractristiques physique dun train, comme le nombre de
rames, la capacit en nombre de voyageurs, la position des portes, ou encore les
dbits en monte et en descente.
La qualit : elle dnit les paramtres du train relatifs la gare. Ils sont au nombre de
deux : les dlais de prcaution, correspondant la rpartition dans le temps des
voyageurs en partance, et la distribution aux accs, correspondant leur rparti-
tion dans lespace la cration.
Ici aussi, limport/export de ces donnes seules est possible, pour les mmes raisons
que prcdemment.
Conguration des donnes dexploitation
Les donnes dexploitation sont les informations relatives aux voyages possibles dans
la gare. Elles se prsentent sous la forme dun tableau associant chaque train une
conguration permettant de dduire les usagers crer. On y retrouve (Figure 6.8) :
Le numro du train, tel quil peut apparatre sur un ticket.
Les horaires de dpart et darrive.
206
Conguration de la simulation
FIG. 6.7: Conguration des trains : matriel roulant (attributs relatifs lqui-
pement) et qualit (attributs relatifs la gare).
FIG. 6.8: Conguration des donnes dexploitation de la gare.
Les villes de dpart et de destination du train.
La qualit et le matriel du train utiliser, slectionns parmi ceux dnis prc-
demment.
Le type de population concern par ce train, slectionn parmi ceux dnis prc-
demment.
La voie daccs au train, slectionne parmi celles dnies dans lenvironnement.
Les pourcentages de remplissage du train au dpart et larrive.
207
Une architecture logicielle ddie la simulation
Un chargeur depuis les donnes SNCF est ici fourni, permettant denregistrer directe-
ment une table provenant de leurs logiciels.
Une fois cette conguration effectue, le logiciel est capable de dduire les voyageurs
crer aux diffrents accs de la gare, leur moment de cration (respectant le dlai
de prcaution), ainsi que le processus comportemental leur affecter (monter dans un
train pour les voyageurs au dpart, sortir de la gare pour ceux larrive).
Conguration globale des quipements et comportements
Cette dernire possibilit de conguration permet de modier les paramtres par dfaut
(affects la cration) ainsi que gnraux (uniques pour un type dobjet donn) des
quipements et des affordances de la simulation (Figure 6.9). Lutilisateur pourra ainsi
agir sur lensemble du processus comportemental des usagers depuis cette interface.
FIG. 6.9: Conguration globale des quipements et affordances disponibles
dans la simulation.
6.4 Droulement dune simulation
Le module suivant permet de lancer lexcution de la simulation. Il propose les pre-
miers rsultats en ligne sous la forme dune animation en 3D du droulement de la
simulation. Lutilisateur peut continuer interagir avec le logiciel durant cette excu-
tion de trois faons :
1. Il peut contrler la vitesse dexcution grce une tlcommande (Figure 6.10).
Celle-ci donne accs :
Un mode lecture o le temps de simulation scoule.
Un mode pause o le temps de simulation est g, les autres contrles restant
actifs.
Larrt de la simulation, rinitialisant toutes les donnes.
Des indications quant au temps simul et au temps rel courant.
208
Droulement dune simulation
FIG. 6.10: Contrle de la vitesse dexcution : lecture - pause - arrt,
ratio temps rel / temps simul dsir, etc.
Une indication quant au ratio temps rel / temps simul courant.
Le choix dun ratio temporel dsir (limit par les performances de la ma-
chine), ou un mode non contraint allant la vitesse maximale.
2. Lutilisateur peut aussi se dplacer dans la restitution 3D de la simulation, an
dobserver des situations particulires. Cette interaction reste possible mme
lorsque la simulation est en pause, autorisant ainsi ltude approfondie dun ph-
nomne phmre. Diffrentes camras sont disponibles :
Libre, o lutilisateur peut se dplacer librement (Figure 6.11(a)) ;
Vue de dessus, qui permet une restitution similaire aux plans 2D(Figure 6.11(b)) ;
Vue rapproche, o la camra suit lobjet slectionn (Figure 6.12).
(a) Camra libre.
(b) Vues de dessus.
FIG. 6.11: Deux vues dans la restitution 3D de la simulation.
209
Une architecture logicielle ddie la simulation
3. Enn, lutilisateur peut consulter linterface gnrique fournie avec BIIO, re-
posant sur le principe dintrospection. Cette interface lui permet daccder aux
attributs des objets interactifs de la simulation, soit pour les consulter, soit pour
les modier dynamiquement. Cette dernire possibilit permettra lutilisateur
de dclencher certains vnements pour tudier leur impact, comme le fait de
mettre en panne un automate de vente de tickets.
Par exemple, sur la gure 6.12, linterface gnrique de lobjet slectionn pour
la vue locale est automatiquement ouverte, permettant de voir que lusager dis-
pose dune ressource destination congure pour Rennes, mais pas encore de
ressource ticket.
FIG. 6.12: Vue approfondie dun objet de simulation. A gauche, la
vue locale pour un individu slectionn (encadr). A droite,
linterface gnrique fournie avec BIIO, permettant de vi-
sualiser ltat interne de lobjet slectionn, et den modi-
er dynamiquement les attributs.
Pour conclure, ce module permet deux modes de simulation. Premirement, une simu-
lation interactive o lutilisateur pourra tudier nement lvolution des situations, et
ventuellement modier les conditions de dpart pour mettre en vidence certains cas
particuliers. Deuximement, une simulation rapide o lutilisateur va laisser le systme
voluer sa cadence maximale an de produire des rsultats analysables.
Un exemple du droulement dune simulation est fourni en annexe (confre Annexe D,
page 257), illustrant le processus comportemental complet dun voyageur au dpart.
210
Exploitation des rsultats
6.5 Exploitation des rsultats
Ce dernier module permet la synthse des rsultats produits par la simulation, et ainsi
la caractrisation des niveaux de services de lenvironnement tudi. Conformment
aux besoins recueillis auprs des utilisateurs naux de ce logiciel de simulation (les
urbanistes de la socit AREP), nous proposons plusieurs reprsentations de ces rsul-
tats.
Graphiques
Ce premier type dinformation permet de localiser linformation dans le temps en la re-
prsentant sous forme de graphique en 2D. Trois types de graphiques sont disponibles,
utilisant tous une chelle temporelle pour laxe des abscisses :
Jauge : La jauge reprsente leffectif total de population lintrieur de la gare au
cours du temps (Figure 6.13(b)). Elle permet de se rendre compte rapidement de
limpact des donnes dexploitation sur lafuence.
Flux : Les ux reprsentent le nombre de personnes empruntant un accs donn au
cours du temps (Figure 6.13(c)). Le graphique est double, contenant les ux en-
trant et sortant par laccs. Il permet dtudier le niveau dutilisation dun accs.
Temps de traverse : Les temps de traverss reprsentent le temps pass en gare pour
des populations circulant entre deux accs (Figure 6.13(d)). Ils permettent dtu-
dier la facilit daccs aux divers quipements pour les voyageurs au dpart, ainsi
que laisance de circulation de lensemble des usagers.
Tous ces graphiques disposent dun ensemble de paramtres contrlant leur gnration,
tels que le laps de temps reprsenter ou lchantillonnage des donnes.
Cartes
Ce second type de reprsentation permet de localiser linformation dans lespace en
afchant des gradients de couleur en superposition du plan 2D de lenvironnement.
Chaque carte peut tre calcule avec des informations moyennes sur un laps de temps,
ou une information instantane un moment donn. Trois catgories de valeurs peuvent
tre reprsentes :
Jauges : Les jauges reprsentent un nombre cumul de personnes diffrentes passant
par un endroit donn au cours du temps (Figure 6.14(a)). Elles permettent de
mettre en vidence les lieux de forte frquentation.
Densits de personnes : Les densits de personnes reprsentent le nombre dhuma-
nodes par mtre carr (Figure 6.14(b)). Elles permettent de mettre en vidence
les lieux de rassemblement et les zones obstrues en cas de forte afuence.
Vitesses : Les vitesses de dplacements ne reprsentent que la vlocit des huma-
nodes, sans tenir compte de leur direction (Figure 6.14(c)). Elles permettent
de mettre en vidence les zones dattente et de passage.
Diffrentes options peuvent tre choisies pour produire ces cartes :
le laps de temps reprsenter ;
la prcision de la grille supportant la reprsentation ;
la borne maximale de lchelle utiliser (calcule automatiquement par dfaut).
211
Une architecture logicielle ddie la simulation
(a) Dnomination des accs de la gare. (b) Graphique de jauge.
(c) Graphiques de ux : gauche, pour un accs rue ; droite pour une voie de trains.
(d) Graphique de temps de traverse : gauche, pour des voyageurs au dpart ; droite, pour des voyageurs
larrive.
FIG. 6.13: Rsultats de simulation sous forme de graphiques. La dnomina-
tion des accs de la gare est fournie titre dindication pour la
lecture des graphiques (b) et (c).
212
Conclusion
(a) Carte de jauges.
(b) Carte de densits. (c) Carte de vitesses.
FIG. 6.14: Rsultats sous forme de cartes. Les trois exemples fournis se d-
roulent sur le mme laps de temps, permettant de corrler leurs
rsultats. La situation comporte des voyageurs au dpart achetant
leur ticket et observant les moniteurs, ainsi que des voyageurs
larrive depuis les deux voies. Les donnes dexploitation utili-
ses sont les mme que pour la gure 6.13.
6.6 Conclusion
Nous avons prsent dans ce chapitre larchitecture logicielle SIMULEM intgrant
lensemble des modles prsents dans cette thse. Celle-ci gre la chane de simu-
lation complte, depuis sa spcication de plus bas niveau, avec lajout de composants
BIIO, jusqu lexploitation nale des rsultats.
Son aspect modulaire a permis une volution progressive de cette architecture, et auto-
rise encore lenrichissement de ses constituants. Son laboration sest faite conjointe-
ment avec les utilisateurs naux (les architectes et urbanistes de la socit AREP) an
de dterminer la meilleure faon de concevoir les diffrents lments, dont notamment
lexpression des rsultats de simulation.
Lapplication propose se veut aussi gnrique que possible, an de pouvoir tre utili-
213
Une architecture logicielle ddie la simulation
se dans un large ventail de situations et denvironnements, tels que des aroports ou
des mtros. Elle permet ainsi dexploiter le fort potentiel dvolution offert par BIIO,
pour intgrer par la suite de nouveaux objets interactifs, et donc de nouvelles pro-
cdures comportementales. Nous proposons nanmoins un module de conguration
ddi aux gares ferroviaires, an de simplier le renseignement de telles simulations.
Les perspectives dvolutions de lapplication concernent essentiellement llaboration
de plugins de simulation. Ceux-ci, issus du premier module de larchitecture, seront
fournis en standard aux utilisateurs pour permettre la simulation de situations plus ou
moins complexes. A terme, il est envisag de fournir la totalit des quipements dis-
ponibles dans le catalogue des gares, ainsi que les procdures comportementales asso-
cies. On peut citer notamment : les panneaux dinformations statiques, les moniteurs
dinformations dynamiques, les divers points de vente, lensemble des circulations ver-
ticales, et les lments dattente.
Une autre perspective concerne llaboration de bibliothques de congurations ty-
piques des classes de populations. Cela ncessitera lextension des possibilits de con-
guration associes aux archtypes, pour inclure lensemble des facteurs inuenant la
planication de chemin et la navigation ractive. Ensuite, une caractrisation de ces
facteurs par des exprimentations sur le rel permettra dtablir les valeurs associer,
et de fournir des archtypes pr-congurs.
214
Chapitre 7
Validation des rsultats
La validation des rsultats est une problmatique essentielle pour un modle destin
reproduire des situations relles. Notre application venant tout juste dentrer dans sa
phase oprationnelle, nous navons pu conduire quun nombre limit de tests. Malgr
tout, nous avons pu commencer cette phase de validation concernant le modle de
navigation ractive, sur lequel nous allons nous concentrer dans cette section. Nous
reviendrons lors de la conclusion sur les autres phases de validation envisages dans un
avenir proche.
La validation du modle de navigation ractive est effectue par ltude des phno-
mnes macroscopiques en rsultant. Tout dabord, des exprimentations ont t me-
nes an de caractriser lattitude des pitons dans diverses situations, exploite pour
le moment par une analyse qualitative des logiques de dplacement. Ensuite, les vi-
tesses de marche produites par le modle suivant diffrentes densits et situations ont
t compares aux valeurs disponibles dans la littrature.
7.1 Validation des logiques de dplacement
La premire validation que nous avons effectue concerne les logiques de dplacement
des pitons dans diffrentes situations. Cette tape vise donc caractriser les ph-
nomnes danticipation ainsi que les organisations spatiales mergeantes des ux de
personnes. Cette tape a t publie rcemment dans [98].
Cette validation ncessite un protocole exprimental permettant le recueil des donnes
caractriser. Lanalyse de vidos produites sur le terrain na pu tre utilise dans cette
phase pour deux raisons : premirement, en raison du manque de prcision des donnes
quil est possible den extraire, ainsi que de lautomatisation difcile de cette extrac-
tion ; deuximement, cause du manque de contrle sur les conditions exprimentales
impliqu par cette technique. Cest pourquoi nous avons propos un protocole bas
sur lanalyse de captures de mouvements dans des conditions contrles. Cette capture
permet dextraire des positions cls sur le corps des participants (Figure 7.1) avec une
prcision de lordre du millimtre et de la dizaine de millisecondes. Deux sries dex-
primentations ont t ralises avec le concours des membres de lquipe Bunraku
auteurs du modle MKM [67] (utilisant habituellement cette technique pour extraire
215
Validation des rsultats
les mouvements de base servant lanimation), sous la direction de J. Pettr.
FIG. 7.1: Protocole exprimental bas sur la capture de mouvements. Les
marqueurs capturs sont mis en vidence sur la photographie.
7.1.1 tude prcise de lvitement de collision
Le premier protocole exprimental nimplique que deux participants la fois. Le but
est ici de caractriser les adaptations des pitons permettant dviter une collision
unique. Ceux-ci doivent effectuer une tche de navigation simple, dans un environ-
nement libre dobstacles, suivant des trajectoires sintersectant avec diffrents angles.
An de contrler le moment de la collision potentielle, les participants sont dsyn-
chroniss par des signaux de dpart afchs sur des crans chaque extrmit de leur
trajectoire (Figure 7.2). Ces signaux sont dclenchs suivant les directives fournies un
FIG. 7.2: Protocole exprimental deux participants. A gauche, un schma
des conditions de lexprimentation : des signaux dsynchronisent
les participants suivant les directives fournies. A droite, une photo-
graphie de lexprience.
216
Validation des logiques de dplacement
logiciel, et les conditions sont enregistres an de pouvoir les corrler aux diffrentes
captures. Un total de 145 squences ont t captures suivant ce protocole, impliquant
6 participants diffrents avec des trajectoires formant des angles de 90et 60.
Nous avons effectu une premire analyse de ces donnes captures par lextraction des
trajectoires produites. Tout dabord, comme illustr sur la gure 7.3(a), les trajectoires
sont reprsentes dans lespace, en indiquant des positions clefs suivant une chelle
temporelle. Cette reprsentation permet davoir une vue densemble de la squence
et des adaptations de trajectoires et de vitesse au cours du temps. Ensuite, les mmes
donnes sont exprimes sous forme de courbes (Figure 7.3(b)), permettant de corrler
les adaptations de chaque participant (P1 et P2) la distance les sparant ainsi qu
la distance de croisement prdite. On peut ainsi constater avec lexemple fourni sur la
gure 7.3, suivant le laps de temps considr :
61s 62s : P1 sest dj adapt en acclrant et en dviant lgrement sur la droite.
Il essaye ainsi de passer devant P2 qui a un comportement normal. Nanmoins,
P2 a une vitesse de rfrence trop importante en comparaison de P1 et cette
premire rsolution conduit un chec.
62s 62.5s : P1 change de stratgie et dclre.
62.5 64s : Les deux participants ont une raction combine : P1 continue dclrer
et dvie vers sa gauche, tandis que P2 acclre en dviant aussi vers sa gauche
pour faciliter la rsolution du conit.
Aprs 64s : La collision a t vite. On remarque que ladaptation de vitesse est cor-
rige pour tendre vers une valeur plus standard, de mme que la trajectoire qui
ne prend maintenant en compte que lobjectif nal.
(a) Trajectoires produite lors dune exprimenta-
tion (en rouge et orange). Les segments bleus
indiquent la distance entre les participants.
(b) Analyse comparative des adaptations de trajectoire
et de vitesse au cours du temps : au centre, les dis-
tances entre participants, aux extrmits les don-
nes de P1 et P2.
FIG. 7.3: Rsultats dune exprience deux participants. Les deux gures
prsentent la mme squence capture.
Le rebouclage des donnes sur le modle de navigation de lhumain virtuel na pas
encore t opr. Nous pouvons nanmoins tirer quelques constats de leur analyse,
validant qualitativement les principes appliqus dans ce modle :
217
Validation des rsultats
Des adaptations surviennent si la distance minimale prdite entre les trajectoires est
infrieure 0.5m. Cette valeur nous permet de dtecter automatiquement les portions
de dplacement o une adaptation est effectivement ralise, celle-ci pouvant tre de
trs faible amplitude.
Lanticipation est de plusieurs secondes avant une collision potentielle. Nous navons
pu dduire une borne maximale cause de la taille trop restreinte du champ de
capture lors de ces expriences.
Ladaptation pour viter une collision prend la forme dun changement de trajec-
toire et de vitesse. Le changement de trajectoire est born par une dviation assez
faible, tandis que le changement de vitesse peut tre trs important, pouvant aller
jusqu larrt complet de lindividu. Plus la collision est temporellement proche,
plus ladaptation en vitesse joue un rle prpondrant.
Linteraction entre les pitons est gre par un comportement dajustements rac-
tifs, pouvant tre remis en question plusieurs fois avant de converger vers une solu-
tion stable sur le long terme. Ce comportement explique notamment le phnomne
dinter-blocage lorsque deux individus effectuent des corrections symtriques simul-
tanes.
Enn, la correction du mouvement pdestre est un mcanisme prcis et dterministe,
nintervenant que lorsquune collision potentielle est dtecte. Dans le cas contraire,
la trajectoire et la vitesse restent stables tout au long du parcours.
7.1.2 tude macroscopique des phnomnes mergeants
La deuxime srie dexprimentations, toujours base sur la capture de mouvements,
met cette fois en scne un nombre plus consquent de participants. Le but est ici dex-
traire les organisations spatiales mergeantes des interactions entre pitons dans des
situations de moyenne forte densit. Vingt quatre participants ont contribu ces
expriences, limite impose par les dimensions du local utilis pour la capture de mou-
vements.
Plusieurs congurations environnementales ont t produites par le positionnement de
divers obstacles (prsentes Annexe E, page 265). Des marqueurs de captures ont t
assigns ces obstacles an dattester de leur immobilit dans les squences captures,
ainsi que de fournir leurs positions et dimensions.
Les squences captures nous ont permis de conrmer certaines informations quali-
tatives prsentes dans la littrature, ainsi que den rvler de nouvelles. Nous avons
ainsi pu attester de la validit de notre modle par la reproduction de ces phnomnes
(Figure 7.4), tels que :
loccupation maximale de la largeur dun couloir lorsquun ux de personnes unidi-
rectionnel lemprunte ;
la formation de les de largeur proportionnelle la taille des ux qui la composent,
dans le cas de ux opposs ;
une prdisposition anticiper les changements de trajectoire avant les zones de
confrontation (cette partie est reproduite par le module doptimisation visuelle de
la trajectoire) ;
ladaptation brutale intervenant en absence de visibilit lors de larrive un carre-
four en ux dense.
Nanmoins, certains phnomnes observs sont issus de comportements plus rationnels
ou sociaux, et ne peuvent tre directement reproduits par notre modle de navigation
218
Validation des vitesses de dplacement
(a) Formation de les proportionnelles
la taille des ux opposs. Deux
groupes sont en confrontation, qui
est rsolue par la formation de deux
les visuellement identiables.
(b) Adaptation tardive et brutale en absence de visibilit. Dans le
sens de lecture : deux groupes dindividus arrivent langle
dun couloir ; ils saperoivent tardivement ; lun des indivi-
dus de gauche peut schapper sur la droite, lautre se re-
trouve coinc par le ux oppos.
FIG. 7.4: Reproduction de phnomnes macroscopiques par le modle de na-
vigation. Les ches rouges signalent la direction aprs optimisa-
tion visuelle, les bleues celle obtenue par la navigation ractive.
ractive. Deux exemples entrent dans cette catgorie :
1. le comportement de cder le passage, pour permettre la traverse de personnes
bloques par un ux plus dense ;
2. lanticipation de collisions induites par la possibilit dapparition dentits de-
puis des zones non visibles de lenvironnement, en se basant uniquement sur la
topologie.
7.1.3 Conclusion
Cette premire tape de validation qualitative permet dattester de la pertinence de
notre modle vis vis de phnomnes mergeants du dplacement pitonnier. Pour ce
faire, nous avons tout dabord conduit une srie dexprimentations relles, utilisant le
procd de capture de mouvements. Nous avons ensuite analys les donnes recueillies
pour en extraire qualitativement les principes rgissant la locomotion humaine. Enn,
nous avons pu vrier que ces principes taient bien reproduits par notre modle. Nous
avons tout de mme not que certains phnomnes ncessitent une participation plus
active du mcanisme dcisionnel dun tre humain, ne pouvant ce titre tre directe-
ment appliqus par un mcanisme ractif.
7.2 Validation des vitesses de dplacement
Cette seconde validation sappuie sur les vitesses de dplacement produites par notre
modle de navigation ractive, en fonction des densits de personnes et de la situation
globale. Ces vitesses seront compares celles nonces par J.J. Fruin [41] et K. To-
gawa [138], dans leurs tudes statistique et macroscopique.
219
Validation des rsultats
Les situations tudies ne comportent que des voyageurs larrive, an de ne pas
fausser les vitesses extraites par les comportements dattente des voyageurs au dpart.
Les relevs ont t faits sur lenvironnement de test prsent tout au long de cette partie,
en faisant arriver les voyageurs par la voie V1 (en bas gauche du plan) et en les faisant
sortir par laccs rue A3 (en haut droite du plan). De cette faon, nous concentrons
les ux entre deux entres/sorties de lenvironnement, rsultant en la traverse dun
couloir et dun hall avec des obstacles ponctuels.
Les afuences tudies sont les suivantes (Figure 7.5) :
Dbit ponctuel : cette afuence libre des voyageurs intervalles de temps trs espa-
cs. Elle ne sert que de point de repre, an dattester du maintien de la vitesse
dsire en absence de contraintes.
Faible afuence (Figure 7.5(a)) : cette afuence correspond un dbit faible de voya-
geurs, permettant de conserver une aisance de circulation maximale. Aucun cas
de blocage nest observ dans cette situation.
Afuence moyenne (Figure 7.5(b)) : cette afuence correspond un dbit plus sou-
tenu de voyageurs, impliquant une rpartition plus leve du ux de personnes.
Encore une fois, aucun cas de blocage nest observ.
Forte afuence (Figure 7.5(c)) : cette afuence permet datteindre les limites dagran-
dissement du ux dans certaines zones parcourues. On voit ainsi apparatre les
premiers cas de blocage au niveau des obstacles dans le hall (piliers et guichets).
Nanmoins, ces blocages se rsorbent assez rapidement.
Trs forte afuence (Figure 7.5(d)) : cette afuence impose au ux de personnes une
couverture maximale des zones de parcours contraintes, dont notamment le cou-
loir de dpart. Les mmes blocages que prcdemment sont observables, mais
cette fois-ci de faon plus persistante. On observe ainsi une fuite du ux vers les
zones ouvertes adjacentes.
Chaque situation a t simule en imposant une vitesse dsire de 1.34m/s aux entits,
correspondant une vitesse de marche standard dans les pays europens. Les donnes
recueillies ont t retranscrites sous forme de graphique, simultanment aux valeurs
fournies par J.J. Fruin et K. Togawa (Figure 7.6). La formule fournie par K. Togawa,
sensible la densit en personnes par mtre carr, a de plus t borne la vitesse
dsire V
d
des entits :
V = min(V
d
.
0.8
;V
d
)
Analysons les rsultats prsents par ce graphique suivant la situation :
Dbit ponctuel : On peut vrier que cette valeur de vitesse pour une densit unique
respecte la vitesse dsire. Cela valide lobservation faite sur les squences de
captures de mouvement selon laquelle le dplacement reste constant et optimum
en absence de perturbations.
Faible afuence : La vitesse se maintient aux alentours de celle dsire, mme pour la
densit maximale mise en vidence de 1.5p/m
2
. Cela signie que les personnes
disposent de sufsamment despace latral pour sorganiser an de maintenir
leur distance de scurit frontale pour cette vitesse. Cela se justie par le fait
que le ux soit sens unique, nimpliquant des adaptations que vis--vis des
personnes adjacentes (pour les densits leves) et de devant (mais restant assez
loignes), allant toutes dans la mme direction.
220
Validation des vitesses de dplacement
Jauges Densits Vitesses
(a) Faible afuence.
(b) Afuence moyenne.
(c) Forte afuence.
(d) Trs forte afuence.
FIG. 7.5: Situations simules pour lextraction de courbes densit/vitesse.
Chaque situation est prsente par des cartes de jauges, de densi-
ts, et de vitesses.
221
Validation des rsultats
FIG. 7.6: Comparaisons des vitesses obtenues par le modle aux donnes de
la littrature. Chaque situation est reprsente par sa propre courbe,
simultanment aux valeurs de J.J. Fruin et K. Togawa.
Afuence moyenne : La vitesse se maintient aux alentours de celle dsire jusqu
une densit de 1p/m
2
, puis chute pour les densits plus leves. La courbe pro-
duite suit presque parfaitement celle de K. Togawa. Comparativement la situa-
tion prcdente, la chute de la vitesse sexplique par un encombrement global
plus important, le modle ragissant alors des collisions potentielles proches
dans le temps. Ainsi, du fait de la hausse du nombre dentits voisines, les pos-
sibilits de changement de direction samenuisent au prot dune rduction de
la vitesse. La densit maximale observe tmoigne nanmoins dune capacit du
modle conserver la uidit du trac grce la prdiction.
Forte afuence : La vitesse maximale dans cette situation est plus faible que celle
dsire. Cela se justie par la forte augmentation de lencombrement global,
le modle adaptant automatiquement le dplacement dune entit percevant une
obstruction, mme lorsque sa densit locale reste faible. Le restant de la courbe
dcrot proportionnellement laugmentation de la densit, pour rejoindre les
valeurs de K. Togawa partir de 1.3p/m
2
.
Trs forte afuence : La vitesse maximale est ici bien plus faible que celle dsire,
pour les mmes raisons que prcdemment. La variation des vitesses est plus
forte, avec une dcroissance rapide jusqu des valeurs trs faibles pour les fortes
densits. En corrlant ces donnes aux cartes de la gure 7.5(d), on se rend
compte que la situation gnrale, avec des blocages importants, a un impact fort
sur les vitesses de dplacement.
Ce graphique met en vidence plusieurs proprits du modle de navigation ractive.
Premirement, il permet bien de rduire les vitesses de dplacement des entits avec
laugmentation des densits de population, avec toutefois une tendance plus marque
que celles prsentes dans la littrature. Deuximement, il met en vidence une raction
222
Conclusion et perspectives
globale intimement corrle la situation, la diminution de la vitesse suivant la densit
pouvant mme disparatre dans des cas peu contraints.
De manire gnrale, les rsultats prsents ici sont quantitativement ralistes. De plus,
notre modle de navigation ractive permet de considrer des facteurs environnemen-
taux non applicables dans les modles statistiques ou macroscopiques. Pour ces raisons,
nous pouvons conclure que ce modle permet damliorer la simulation des circulations
de personnes par rapport aux approches prcdentes.
7.3 Conclusion et perspectives
Nous avons prsent tout au long de ce chapitre les premires phases de validation
opre au cours de cette thse. Cette validation sest concentre sur le modle de na-
vigation ractive, celui-ci tant lun des plus importants vis--vis de lobjectif de ces
travaux.
Nous avons dmontr que notre modle produisait des phnomnes mergeants corres-
pondant la ralit, attestant de la pertinence qualitative de nos rsultats. Nous avons
aussi pu constater que notre modle adaptait correctement les vitesses de dplacement
en fonction des densits de personnes, attestant cette fois-ci de la pertinence quantita-
tive de nos rsultats. De plus, nous avons mis en vidence que notre approche ragissait
diffremment suivant la situation globale dans lenvironnement simul. Cette tendance
se vrie visuellement sur nos donnes (captures de mouvement aussi bien que vidos
diverses), mais constituera lune des prochaines tapes prvues danalyse quantitative.
Une autre perspective concernant la validation est le rebouclage des donnes de cap-
ture de mouvements avec le modle. Nous prvoyons ainsi de simuler des situations
identiques aux expriences, puis den extraire les aires de Goffman comme prsent
en annexe E, page 265, pour en faire une tude comparative. Nous souhaitons aussi
automatiser une srie de simulations an dextraire les paramtres pour les facteurs
dadaptation (prfrence pour le changement de direction, lacclration, ou la dc-
lration) les plus proches du rel. De plus, une autre analyse devra tre conduite pour
trouver un modle plus n de slection du voisinage suivant la situation (distance prise
en compte suivant lenvironnement et la densit de population).
Dautre part, nous avons mis en vidence la ncessit dun modle plus rationnel pour
piloter la navigation ractive dans des cas spciques (absence de visibilit et com-
portements sociaux). Grce au fort potentiel dvolution de notre approche, il semble
possible de grer ces comportements supplmentaires via des tches cognitives, sans
avoir modier larchitecture gnrale. Cette possibilit constitue donc une nouvelle
perspective dvolution de notre modle dhumain virtuel.
Enn, une autre perspective concerne la validation du modle de planication de che-
min. En effet, celui-ci est pour le moment congur avec des degrs de prfrence
arbitraires pour lensemble des facteurs individuels. Il parat essentiel de conduire une
srie dexprimentations relles pour caractriser leur importance relative, le but nal
tant de proposer des congurations types reprsentant diffrentes catgories de popu-
lations.
223
Chapitre 8
Analyse des performances
dexcution
Mme si les performances de la simulation ne sont pas lobjectif premier de ces tra-
vaux, nous avons tout de mme voqu la ncessit de maintenir un certain niveau de
ractivit de lapplication an den permettre une utilisation confortable. Le modle
qui va avoir limpact maximal sur les performances est celui de lhumain virtuel. En
effet, celui-ci est rafrachit la plus haute frquence du systme, et est utilis par un
nombre consquent dentits simules.
Nous allons tudier les performances des diffrents modules composant lhumain vir-
tuel, en utilisant le dcoupage suivant :
Biomcanique. Le module de locomotion et danimation, incarn par le modle MKM,
reprsente totalement cette couche. Nous ne tiendrons pas compte ici des calculs
relatifs au rendu.
Ractif. Cette couche sera scinde en plusieurs parties :
Planication de chemin initiale : elle correspond la premire requte de pla-
nication de chemin, toutes catgories de destinations confondues. Cette
tche effectue donc la recherche de chemin dans la couche la plus abstraite
du graphe topologique.
Suivi de chemin : cela correspond chaque mise jour de chemin au cours du
dplacement de lentit. Cette tche se charge donc des rafnements suc-
cessifs dans les deux couches les moins abstraites du graphe topologique,
ainsi que de loptimisation visuelle.
Observation : elle correspond lextraction des informations par le parcours des
PVS. Cette tche se charge ainsi de la construction de la mmoire perceptive
et court terme de lhumanode.
Navigation ractive : elle correspond au processus complet de navigation de
lentit, depuis la rcupration de la direction de mouvement dsire, jus-
qu la dcision de la meilleure option de dplacement.
Cognitif et rationnel. Nous proposons dvaluer les performances de ces deux couches
conjointement, en les subdivisant en trois parties :
225
Analyse des performances dexcution
Supervision : elle correspond aux tapes de lancement et darrt automatique
de tches cognitives.
Gestion des tches cognitives : cette tape se charge de lordonnancement et de
lexcution des tches cognitives actives.
Gestion des affordances : cette tape se charge de lordonnancement des affor-
dances, ainsi que du test de leur pr-condition rationnelle.
8.1 Frquences de rafrachissement
Le premier point spcier est la frquence de rafrachissement de chaque module. En
effet, certains des modles disposent dune frquence attribue une fois pour toutes,
mais dautres sont valus en raction des vnements, et auront donc une frquence
moyenne mergeante.
Nous avons conduit une srie de tests sur diffrentes situations, rsultant en la rparti-
tion des frquences prsente sur la gure 8.1. Les frquences mergeantes sont relati-
vement stables dune situation lautre.
FIG. 8.1: Frquences de rafrachissement de lhumain virtuel. Les valeurs ob-
tenues sont relativement stables dans diffrentes situations.
On saperoit sur ce graphique que la frquence la plus leve du systme est de 10Hz.
Il sagit de la borne minimale maintenir pour assurer une restitution visuelle uide par
le module danimation. Cette valeur peut tre augmente sans aucune consquence sur
le fonctionnement des autres modules. Nanmoins, le module de locomotion/animation
est lun des plus coteux de larchitecture, et laugmentation de sa frquence conduit
une chute proportionnelle des performances. Une autre frquence contrainte est celle
des couches cognitive et rationnelle, qui respecte bien le 1Hz spci dans le modle.
Voyons maintenant les frquences non imposes, relatives la couche ractive de lhu-
main virtuel. Tout dabord, la recherche initiale dun chemin dispose dune frquence
mergeante trs faible, avec en moyenne un rafrachissement toutes les dix secondes.
La premire raison dune valeur si faible est que cette tape nest explicitement requise
qu de rares occasions par les tches cognitives, an de slectionner un couple af-
fordance/effecteur dans lenvironnement ou de procder un dplacement par dfaut
(attente ou exploration). La deuxime raison est que laspect ractif de cette plani-
cation, remettant en cause le chemin courant, nest dclench que trs ponctuellement
le long du parcours de lhumanode, lors de la perception dinformations considres
226
Temps dexcution
comme primes. Une autre frquence de rafrachissement mergeante est celle du
suivi de chemin, valu conjointement la navigation ractive. Ces deux comporte-
ments sont dclenchs par chaque nouveau pied dappui de lhumain virtuel, et donc
une frquence infrieure 2Hz compte tenu de la vitesse de marche de nos entits. La
dernire frquence mergeante est celle de lobservation, qui est ici infrieure 1Hz.
Notre modle spciait quelle devait tre value la mme frquence que la navi-
gation ractive, mais nous avons introduit ici une optimisation base sur la cohrence
temporelle des informations observes. Ainsi, les donnes perues ne sont rafrachies
lors dun nouveau pied dappui que si elles datent de plus dune seconde, et conserves
dans le cas contraire.
Le premier constat que lon peut tirer de ces donnes est la libert offerte par le mo-
dle dhumanode quant sa frquence de rafrachissement. En effet, on peut voir que
malgr une frquence initiale de 10Hz, lensemble des frquences mergeantes est in-
frieur 2Hz. Cette valeur est donc la borne minimale de rafrachissement respecter
par le moteur de simulation pour garantir un fonctionnement normal de lhumain vir-
tuel. Le deuxime constat provient lui aussi de cette frquence minimale, relativement
au modle de navigation ractive. On peut ici se rendre compte que son valuation se
fait un rythme trs faible, bien infrieur aux pr-requis dautres modles existants
(notamment celui de D. Helbing qui ncessite une frquence leve pour converger).
Cette valeur est dautant plus intressante quelle permet de se rapprocher dun ordre
de grandeur raliste.
8.2 Temps dexcution
tudions maintenant les temps dexcution constats pour chaque module. Les valeurs
prsentes ici ont t obtenues avec un Pentium 3.6GHz, quip de 2Go de mmoire
et dune Quadro FX 3450/4000 SDI. Le systme dexploitation utilis est Windows XP
Professionnel.
Les performances que nous allons prsenter sont synthtises de deux faons :
1. Le cot par appel, qui reprsente le temps moyen dexcution dune procdure
indpendamment de sa frquence de rafrachissement.
2. La proportion de temps consomme pour une seconde simule, qui reprsente le
cumul de temps allou chaque procdure relativement aux autres sur un nombre
de rafrachissements correspondant la frquence maximale du systme.
Nous avons effectu des relevs de performances dexcution sur trois catgories de
situations reprsentatives (Figure 8.2), toutes appliques lenvironnement de test pr-
sent dans ce chapitre :
Figure 8.2(a) : Une entit seule au dpart.
Cette situation comporte la chane comportementale complte du voyageur au
dpart (confre Annexe D, page 257), celui-ci se trouvant seul dans la gare. La
dure par appel la plus importante est ici celle de la planication de chemin
initiale. En effet, cest la mthode de planication la plus coteuse qui est em-
ploye, an de slectionner un couple affordance/effecteur pour les interactions
ncessaires. La navigation ractive prsente son cot le plus faible, ne tenant
compte que des obstacles statiques le long du parcours. Quant aux tages cogni-
tif et rationnel, ils prsentent leur cot le plus important, ayant en charge la pro-
227
Analyse des performances dexcution
Dure par appel. Proportion pour 1s simule.
(a) Entit seule au dpart. T
H
= 1.28ms
(b) Afuence moyenne (dpart/arrive). T
H
= 1.63ms
(c) Forte afuence (dpart/arrive). T
H
= 2.06ms
FIG. 8.2: Comparaison des temps dexcution de lhumain virtuel. Trois si-
tuations sont prsentes, inuant sur les temps de calcul des dif-
frents modules. Le temps rel T
H
ncessaire la simulation dun
humanode pendant une seconde est indiqu.
228
Temps dexcution
cdure la plus complexe de nos usagers. Malgr cela, on peut se rendre compte
que les performances de ces tages sont bien meilleures que tous les autres mo-
dules de lhumain virtuel. La proportion de temps pour une seconde simule
la plus importante est celle du module danimation/locomotion, celui-ci ayant un
cot par appel assez important, tout en tant rafrachit la frquence maximale
du systme. Lautre cumul de temps important est celui de la navigation ractive
qui a aussi un cot par appel consquent.
Figure 8.2(b) : Plusieurs entits au dpart et larrive en afuence moyenne.
Cette seconde situation comporte aussi bien des voyageurs au dpart qu larri-
ve (avec une procdure comportementale bien plus simple), avec une afuence
moyenne produisant ponctuellement de fortes densits mais pas de blocage. On
peut voir que le cot par appel des tages cognitif et rationnel, ainsi que des
planications de chemin et de lobservation, sont trs fortement rduits. Cela est
d aux voyageurs larrive qui sous exploitent ces modules comportementaux.
Le module danimation/locomotion subit une lgre baisse de performances, im-
pute aux changements de mouvements plus frquents du fait dadaptations lo-
cales augmentant avec la densit. Enn, la navigation ractive double son temps
dexcution, cause de la prise en compte des entits voisines. La proportion
de temps pour une seconde simule est principalement rpartie entre la loco-
motion et la navigation, toujours cause de leur frquence et de laugmentation
de leurs cots par appel.
Figure 8.2(b) : Plusieurs entits au dpart et larrive en forte afuence.
Cette dernire situation est identique la prcdente, avec une augmentation de
lafuence pouvant conduire des blocages ponctuels. On voit que le cot par
appel des tages cognitif et rationnel, ainsi que des planications de chemin,
de lobservation, et de la locomotion, se maintiennent. Par contre, la navigation
ractive subit encore une hausse du fait de laugmentation dentits voisines
prendre en compte, cause de la hausse globale des densits de populations.
Cette tendance se rpercute sur la proportion de temps pour une seconde si-
mule, avec une augmentation de la part alloue la navigation.
Par lanalyse de ces graphiques, et dautres exprimentations non prsentes ici, on
peut synthtiser les constats suivants :
Le module de locomotion/animation a des performances constantes quelle que soit
la situation considre, si ce nest le cas de lentit seule qui ne ncessitera que trs
peu dadaptations de mouvement locales.
La planication de chemin initiale nest pas sensible au nombre dentits simules,
mais seulement au mode de recherche envisag (confre Section 5.3.2, page 147),
ainsi qu la taille du graphe topologique le plus abstrait de lenvironnement.
Le suivi de chemin est extrmement performant dans tous les cas.
Lobservation de lenvironnement est sensible au mode choisi par sa tche cognitive
(confre Section 5.5.1, page 181), ainsi qu la complexit gomtrique de lenvi-
ronnement.
La navigation ractive est extrmement sensible aux densits locales de populations,
et donc au nombre dentits voisines prendre en compte.
La supervision rationnelle a un temps dexcution ngligeable et relativement constant
quelle que soit la procdure comportementale.
La gestion des tches cognitives et des affordances est directement dpendante de la
complexit des procdures comportementales de lentit. Nanmoins, la dgradation
des performances de la gestion des tches cognitives est limite par la supervision ra-
229
Analyse des performances dexcution
tionnelle, qui maximise le nombre de traitements simultans (confre Section 5.6.2,
page 187).
8.3 Conclusion
Nous nous sommes pench dans ce chapitre sur lanalyse des performances du mo-
dle dhumain virtuel, qui prend la part la plus importante lors de lexcution dune
simulation.
Nous avons vu dans un premier temps que la frquence dexcution de ce modle a
des contraintes assez faibles, bien en de des modles existants dans la littrature. De
plus, le modle peut sadapter automatiquement une modication de cette frquence,
grce la prise en charge de rafrachissements vnementiels. Ces points permettent de
conserver la cohrence de la simulation quelles que soient les variations de frquence
imposes : il est possible de la rduire fortement pour acclrer lexcution, ou de
laugmenter pour obtenir des animations plus uides.
Nous avons ensuite prsent les temps dexcution des diverses parties du modle. Mal-
gr que leur optimisation nai pas t une de nos contraintes, on a pu constater quelles
mettent des rsultats avantageux. Les performances offertes permettent donc denvi-
sager des domaines dapplication connexes, comme les jeux vidos, o lexcution en
temps rel est une contrainte forte.
230
Conclusion et perspectives
Nous avons abord tout au long de cette partie les rsultats obtenus lors de cette thse.
Ces rsultats prennent tout dabord la forme dune architecture ddie la simulation
du nom de SIMULEM. Ce logiciel concrtise lensemble des modles prsents comme
contributions, tout en apportant un certain nombre de fonctionnalits permettant de les
exploiter. Il permet ainsi de grer la chane de simulation complte, depuis lajout de
nouveaux objets interactifs, jusqu lexploitation nale des donnes produites. Son
architecture est fortement base sur le principe dintrospection propos par BIIO, qui
est exploit pour fournir des botes de dialogue gnriques. Un module de congura-
tion spcique est nanmoins fourni, an de rpondre au mieux aux spcicits de la
simulation de gares ferroviaires. Cet outil reste ouvert quant ses possibilits dvo-
lutions, que ce soit par son aspect modulaire ou par sa gestion automatique de plugins
de simulation. Les perspectives le concernant sont donc essentiellement axe sur lla-
boration de tels plugins, permettant ainsi daugmenter considrablement le gradient de
situations et de typologies denvironnements pouvant tre simuls.
Le second aspect des rsultats qui a t prsent concerne la validation des modles
proposs. Comme nous lavons soulign, lapplication entrant tout juste dans sa phase
oprationnelle, peu de tests ont actuellement pu tre conduits. Nous avons nanmoins
commenc cette validation pour le modle de navigation ractive. Des expriences de
capture de mouvements ont ainsi t ralises, permettant pour le moment une valida-
tion qualitative de phnomnes mergeants. Les rsultats de ces expriences peuvent
nanmoins tre analyss plus profondment, et un rebouclage des donnes quantita-
tives avec le modle reste accomplir. Une autre validation a t propose concer-
nant les variations de vitesses en fonction des densits de personnes. Nous avons ainsi
compar des courbes obtenues par la simulation de diffrentes situations aux valeurs
disponibles dans la littrature. Nous obtenons des variations globalement comparables,
mais mettant en vidence un impact fort de la situation globale. Il est donc envisag
de reproduire ces situations dans des exprimentations pour en vrier le bien fond,
la littrature ne proposant que des observations gnrales ne tenant pas compte de ce
facteur.
La validation des autres parties de notre modle dhumain virtuel est aussi envisage, et
notamment la planication de chemin. La poursuite du projet SIMULEM prvoit cette
validation par simulation dun cas rel, et sa comparaison des donnes relles. Lenvi-
ronnement choisi est la gare de Rennes, dans lequel une campagne de comptage va tre
lance. Cette exprimentation permettra ainsi de caractriser les afuences certains
points clefs de la gare au cours du temps. Aprs conguration de donnes dexploi-
tation identiques dans le logiciel, la mme situation sera simule pour en vrier la
231
Conclusion et perspectives
pertinence. Cette phase de tests nous permettra ainsi de proposer un premier rglage
gnrique des diffrentes variables du modle dhumain virtuel.
Pour nir, nous avons prsent une analyse des performances de nos agents autonomes.
Nous avons ainsi pu mettre en avant la faible frquence dappel des comportements r-
actifs, sapprochant de la ralit. Nous avons aussi constat que les temps dexcution
obtenus, sans tre comparables ceux de mthodes danimation pure ou dapproches
grande chelle comme MAGS [88], sont tout de mme avantageux. Ce constat per-
met donc denvisager une exploitation de ce modle dans des domaines connexes, tels
que le jeu vido. Notons tout de mme que les deux processus les plus coteux, la
navigation ractive et la locomotion, gagneraient tre optimiss.
232
Conclusion et
perspectives gnrales
Nous avons trait au sein de ce document la problmatique de ltude des circulations
de personnes via la simulation. Cette problmatique est renforce dans notre cadre
dapplication par la ncessit de tenir compte des besoins dinteraction des humains.
Nous pouvons conclure de faon gnrale que les contributions prsentes dans ce
document rpondent la problmatique pose. De plus, la mise en uvre des modles
t ralise, prouvant leur faisabilit. Enn, les travaux proposs sont tourns vers
lavenir, en autorisant de nombreuses volutions.
Lexistant
Nous avons commenc par analyser ltat de lexistant concernant les circulations de
personnes, et lanimation comportementale. Cela nous a permis de nous familiariser
avec certaines des caractristiques du comportement humain, comme la prise de d-
cision. Nous avons fait de ces caractristiques les contraintes de notre approche, en
observant quelles avaient un impact fort sur les circulations de personnes. Nous avons
aussi couvert les diffrentes mthodes permettant de simuler ces circulations. Ces ap-
proches ont permis de rcolter un nombre consquent de donnes quantitatives et qua-
litatives quant aux mouvements pdestres. Elles ont aussi dnies le cadre du modle
vers lequel nous voulions nous diriger. Nous avons enn mis en vidence la ncessit
dune tape de validation de modles, garantissant leur pertinence dans un cadre de
simulation.
Les modles proposs
Dans un deuxime temps, nous avons proposs des modles permettant de simuler les
circulations de personnes. Ces modles sarticulent autour de trois problmatiques :
la symbolisation des connaissances, la reprsentation de lenvironnement, et lhumain
virtuel.
233
Conclusion et perspectives gnrales
Les objets interactifs
Notre modle dobjets interactifs, dnomm BIIO, fournit les concepts ncessaires
la description de linteraction. Ce modle dcrit ainsi les symboles les plus abstraits
reprsentant les intervenants dune interaction, ainsi que les mcanismes gnriques
qui permettent leur gestion. Cette gnricit est primordiale dans ce modle, qui se
veut trs ouvert. Ainsi, il propose un principe de hirarchisation de la description pour
lensemble de ses constituants, facilitant son volution. Cette hirarchisation est aussi
utilise par des fonctionnalits gnriques, dont notamment pour la gestion des com-
portements dinteraction (les affordances). Cette gestion est mise en place un niveau
abstrait, dit rationnel, permettant llaboration implicite dun plan comportemental non
situ.
Les perspectives dvolutions de ce modle sont nombreuses, sa conception mme tant
oriente vers cet objectif. Nous avons tout de mme identi deux points qui apporte-
raient un bnce indniable cette approche. Premirement, rappelons que la gestion
comportementale y est hautement descriptive, ne disposant daucun mcanisme din-
frence permettant la dduction dun plan comportemental. Il serait alors souhaitable
de coupler ce modle un tel mcanisme, an den tendre les potentialits de gestion
comportementale. Deuximement, BIIO ne sintresse pour le moment quaux impli-
cations de linteraction dans le processus dcisionnel, et laisse donc de ct sa repr-
sentation visuelle. Son couplage un modle spcialis dans cet objectif permettrait
donc dtendre son champ dapplication. Nous avons identi deux modles pouvant
rpondre cette perspective. Tout dabord, les smart objects qui ont dj prouv quune
telle collaboration peut tre mise en uvre par leur couplage avec des modles de rai-
sonnement. Ensuite, STARFISH qui utilise des lments de description de linteraction
physique proches de ceux introduits par BIIO (notamment en ce qui concerne les zones
dancrage).
Lenvironnement virtuel
Le second modle propos concerne la description informe de lenvironnement. Nous
avons fond ce modle sur une reprsentation de type exacte, garantissant la conser-
vation de linformation gomtrique. Cette reprsentation est ensuite abstraite, an de
sloigner dune dnition gomtrique au prot dune description plus conceptuelle.
Elle permet ainsi de caractriser des zones globales de circulation, et dinterconnecter
des environnements lchelle et la signication diffrentes (comme une gare avec un
mtro). Cette abstraction est ensuite informe grce de nombreuses donnes relatives
aux circulations de personnes, an de fournir efcacement les informations qui seront
ncessaires aux entits simules. Pour nir, les objets interactifs du premier modle
sont lis cette reprsentation, permettant ainsi de situer la connaissance dans les-
pace.
En ce qui concerne les perspectives dvolution de ce modle, nous avons plus pro-
pos de nouveaux cadres dapplication quune extension de ses possibilits. Ainsi,
nous avons soulign que la reprsentation grande chelle dune ville pourrait tre
atteinte, tout en conservant une complexit localement faible ainsi que la totalit de
linformation gomtrique. Il est donc envisageable dexprimer avec ce modle plu-
sieurs environnements interconnects, reprsentant chacun une typologie de zone de
circulation diffrente : la ville dans son ensemble (ses rues), les habitations, et des bti-
234
Conclusion et perspectives gnrales
ment spciques (gare, stade, mtro, etc.). Il serait alors possible de simuler diffrentes
chelles environnementales en se fondant sur une unique reprsentation.
Lhumain virtuel
Le troisime modle propos concerne lhumain virtuel, acteur exclusif de nos simu-
lations. Cet agent autonome est directement li aux concepts introduits par BIIO, tant
lui-mme une spcialisation de linteracteur dni dans ce modle. Son architecture
sorganise de faon similaire la pyramide de A. Newell, restant ainsi dle la tho-
rie cognitive du comportement.
Cette architecture comprend tout dabord un ensemble de comportements ractifs lis
au dplacements de personnes. Le premier de ces comportement dote lhumain virtuel
de capacits de perception visuelle, couples un mcanisme mmoriel. Cela permet
lagent autonome de ne plus tre omniscient vis--vis de lenvironnement. Le se-
cond comportement ractif prend une part plus active dans la dcision de lhumain
virtuel, en lui permettant de planier un chemin. Cette planication se dcoupe en trois
modes la destination plus ou moins abstraite : atteindre un lieu, explorer lenvironne-
ment, et choisir une interaction. De manire gnrale, la planication est sensible la
connaissance topologique de lhumanode, ainsi qu un ensemble de facteurs environ-
nementaux et personnels. Enn, elle permet, grce au mode choisissant une interaction,
de situer le raisonnement de lhumain virtuel. Son troisime et dernier comportement
ractif est li au dplacement local de lindividu, avec la navigation ractive. Celle-ci
applique les principes issus des tudes psychologiques : la prdiction, la robustesse, la
minimisation des ajustements, et la ractivit. Elle est de plus sensible des facteurs
personnels guidant les adaptations de lhumanode. Enn, elle permet non seulement
dviter les collisions avec des obstacles, mais autorise aussi la rsolution de compor-
tements opportunistes ou secondaires, comme le suivit de personnes.
Lensemble de ces comportements ractifs est ensuite pilot par un tage plus abstrait,
compos de tches cognitives. Celles-ci sont spcies par spcialisation du concept
introduit par BIIO, et constituent donc la partie augmentable du modle dhumain vir-
tuel. On y trouve trois tches fournies en standard : la gestion de lobservation, du d-
placement, et de linteraction. Enn, un tage supplmentaire de la pyramide organise
lexcution gnrale de lhumain virtuel, en intgrant lensemble des comportements
prcdents. Cet tage est compos de deux gestionnaires issus de BIIO : lun pour les
affordances, lautre pour les tches cognitives. Il dispose aussi dun processus de su-
pervision des tches dinteraction permettant dassurer quelles reprsentent bien les
buts immdiats de lhumain virtuel.
Les perspectives dvolution de ce modle concernent essentiellement ses lments de
base. Ainsi, il serait possible dajouter de nouveaux comportements ractifs an de g-
rer dautres aspects de lhumanode, comme par exemple la perception auditive. Nous
pouvons aussi envisager dajouter de nouvelles tches cognitives, comme la gestion de
laspect social pour inuencer la navigation. Une autre perspective dvolution est la
spcialisation de lhumain virtuel. En effet, en temps quobjet BIIO, il bncie impli-
citement des avantages de ce modle, dont la hirarchisation des concepts. En le sp-
cialisant, nous pouvons ainsi crer des affordances accessibles seulement certaines
catgories de populations. Par exemple, il serait possible davoir une spcialisation en
personne mobilit rduite pour qui les escaliers seront inutilisables. Cela sera rensei-
235
Conclusion et perspectives gnrales
gn simplement en indiquant laffordance correspondante que linteracteur autoris
appartient une autre branche de spcialisation.
Les rsultats
La dernire partie de ces travaux fut consacre aux rsultats obtenus.
Loutil de simulation
Lensemble des contributions expose ont t intgres dans un logiciel du nom de
SIMULEM. Celui-ci permet de rpondre lobjectif nal de ces travaux : simuler des
environnements et en extraire des donnes relatives aux circulations de personnes. Cet
outil est organis en quatre modules, permettant darriver cet objectif mais aussi de
faire voluer les objets interactifs de la simulation. Le logiciel exploite donc BIIO au
cur de son architecture, tirant ainsi avantage des principes proposs par ce modle,
dont notamment lintrospection qui est utilise pour fournir des botes de dialogue
gnriques. Les rsultats de simulations proposs par ce logiciel se prsentent sous la
forme de diagrammes ou de cartes, comme cela a t dni avec les utilisateurs naux.
Les perspectives dvolution de cette application sont classer en deux catgories.
Tout dabord, il est prvu dexploiter les fonctionnalits de BIIO an de proposer une
collection dobjets de simulation couvrant lensemble du potentiel dune gare : les pan-
neaux dinformation, les points de vente, ou encore les circulations verticales. Ensuite,
il est prvu dtendre les capacits de ce logiciel pour atteindre des cadres dapplication
connexes. On peut citer la simulation daroports, de mtros, de centres commerciaux,
ou encore de stades.
tape de validation
La validation sest concentre sur le modle de navigation ractive, en le comparant
a des donnes relles et issues de la littrature. Les donnes relles ont t obtenues
par un procd de capture de mouvements dans des expriences contrles, permettant
datteindre une prcision bien meilleure quavec des vidos. Celles-ci nous ont permis
dattester qualitativement de la pertinence du modle, par la reproduction de phno-
mnes mergeants. La comparaison des donnes quantitatives issues de la littrature
a ensuite t faite, en se basant sur les valeurs de vitesse de dplacement en fonction
de la densit. Les rsultats du modle ont ainsi t compares avec succs aux donnes
de J.J. Fruin et K. Togawa.
Les perspectives en matires de validation concernent tout dabord lexploitation plus
pousse des donnes relles captures. Cette phase vient dtre aborde avec lextrac-
tion des ovales de Goffman dans diffrentes situations, mais un rebouclage avec le
modle reste faire. La validation des autres parties du modle dhumanode est aussi
prvue, notamment pour la planication de chemin. A cette occasion, une campagne
denqutes sur le terrain est sur le point dtre mene, dans la gare de Rennes. Cet
environnement rel sera ensuite simul, et les donnes recueillies serviront de base de
comparaison.
236
Conclusion et perspectives gnrales
Performances des modles
La dernire partie de ce document fut consacre ltude des performances dexcution
du modle dhumain virtuel. Les diffrents tages de la pyramide comportementale ont
ainsi t tests sur diffrents cas. Nous avons pu identier que les deux mcanismes les
plus coteux de ce modle taient la navigation ractive et la locomotion. Nanmoins,
nous avons vu que les temps dexcution restaient dans des limites acceptables pour
un logiciel de simulation. Nous avons aussi soulign la faible frquence de rafrachis-
sement des diffrents tages, se rapprochant plus dchelles relles que les modles
prsents dans la littrature.
Ces performances nous permettent denvisager des cadres dutilisation connexes pour
lhumain virtuel. On peut par exemple citer lanimation temps rel pour des chelles
moyennes de populations, ou encore les jeux vidos.
237
Annexes
239
Annexe A
Ordonnancement des
affordances
Nous avons abord dans la section 3.4.2, page 107, la gestion de la concurrence entre
plusieurs affordances actives de linteracteur. Cette gestion prend la forme dune excu-
tion itrative des pr-conditions rationnelles. Lordre dappel est quant lui dtermin
par un processus dordonnancement, en se basant sur les priorits des affordances.
Rappelons que le gestionnaire daffordance de linteracteur attribue deux priorits
chaque interaction :
Locale (P
L
). Cette priorit est choisie par lune des fonctionnalits de laffordance.
Hirarchique (P
H
). Cette priorit est calcule par le gestionnaire en se basant sur la
prcdente.
La priorit hirarchique doit donner plus dimportance aux affordances essentielles
pour linteracteur. Elle va donc tre plus forte pour les affordances permettant de faire
avancer un maximum de plans comportementaux, tout en tant vivement inuence par
le but nal de ce plan. La mthode de calcul employe est la suivante :
P
H
(crt) = max
aracines
P
L
(a) +0.1
_
P
L
(crt) +

bparentes
P
H
(b)
_
Une priorit hirarchiques est donc constitue de la valeur maximale de priorit locale
pour lensemble des racines de la hirarchie, incrmente par 10% de la somme des
priorits hirarchiques de toutes les parentes ainsi que de la priorit locale de laffor-
dance courante.
Dtaillons ce calcul sur un exemple (Figure A.1). Trois affordances sont explicitement
requises par linteracteur : A, B, et F. Laffordance A require lexcution des affor-
dances C, D, et E ; laffordance B require seulement lexcution de E ; laffordance
F est autonome. Lordonnancement doit ici permettre de dpartager les affordances
feuilles C, D, E, et F via leur priorit hirarchique :
P
H
(C) = P
L
(A)+0.1
_
P
L
(C)+1.1P
L
(A)
_
= 1.11P
L
(A) +0.1P
L
(C)
241
Ordonnancement des affordances
P
H
(D) = P
L
(A)+0.1
_
P
L
(D)+1.1P
L
(A)
_
= 1.11P
L
(A) +0.1P
L
(D)
P
H
(E) = max
_
P
L
(A),P
L
(B)
_
+0.1
_
P
L
(E)+1.1
_
P
L
(A)+P
L
(B)
_
= 1.11max
_
P
L
(A), P
L
(B)
_
+0.11min
_
P
L
(A), P
L
(B)
_
+0.1P
L
(E)
P
H
(F) = 1.1P
L
(F)
FIG. A.1: Exemple dexcution hirarchique daffordances : les affordances
racines sont indiques en gras (A,B,F), le lien hirarchique avec les
ches.
On voit donc que C et D ne sont dpartages que par 10% de leur priorit locale.
Concernant E, deux cas peuvent se produire :
Si A est plus prioritaire que B, E sera dpartage de C et D en se basant faiblement
sur leur priorit locale et sur la priorit de B.
Dans le cas contraire, la concurrence seffectuera fortement sur les priorits de A et
B, les priorits locales devant tre dix fois plus fortes que lcart pour jouer un rle.
Finalement, F est dpartage des autres feuilles en se basant fortement sur la valeur de
priorit locale de leur racine principale.
Cette mthode de calcul a les consquences suivantes :
Une affordance lle a forcment une priorit suprieure lensemble de ses parentes.
Deux affordances surs (lles dune mme affordance) ne sont dpartages que
par leur priorit locale, ou par des branches diffrentes du graphe comportemental
quelles unient.
Plus une affordance a de parentes (plus elle unie de branches comportementales),
plus sa priorit hirarchique est leve.
Plus une affordance est profonde dans la hirarchie, plus sa priorit hirarchique est
leve.
La priorit locale de la racine la plus importante de la hirarchie a un impact 10 fois
suprieur la priorit locale de laffordance value.
Une affordance uniquement racine ou racine/feuille a pour priorit hirarchique sa
priorit locale incrmente de 10%.
La priorit hirarchique, en plus de permettre lordonnancement des affordances dans
le gestionnaire de linteracteur, a un impact fort sur la slection daction par lhumain
virtuel. Cette slection est effectue par lun des trois modes de planication de che-
min (confre Section 5.3.2, page 148) : le choix dun couple affordance/effecteur. Ce
mode se base sur une quantication de chemin standard, laquelle est ajoute un fac-
teur directement dpendant de cette priorit. Ainsi, plus cette priorit sera leve, plus
lhumain virtuel sera enclin effectuer linteraction correspondante, mme si celle-ci
ncessite une priode dattente.
242
Annexe B
Smantique des automates
De nombreux automates sont utiliss dans le chapitre concernant lhumain virtuel
(Chapitre 5, page 135), notamment en ce ce qui concerne les tches cognitives (Sec-
tion 5.5, page 180). Nous allons prsenter ici leur mode de fonctionnement, avec la
smantique utilise pour les dcrire :
Automate courant, i.e. dcrit actuellement.
tat dans le sens standard des automates : chaque rafrachisse-
ment, si ltat a une transition valide il lemprunte, sinon ltat
est conserv.
Action excuter : lorsque lautomate transite dans une action,
celle ci est excute puis les transitions sortantes sont immdia-
tement values (au contraire dun tat qui attendra le prochain
rafrachissement).
tat particulier reprsentant lexcution dun sous-automate :
lentre dans cet tat provoque le lancement du sous-automate.
Lors du rafrachissement, les transitions de lautomate courant
sont toujours testes avant lexcution du sous-automate. Ce der-
nier nest arrt que lorsquun tat diffrent est atteint, et non
pas si une transition emprunte provoque la sortie puis le retour
immdiat dans ce sous-automate (aprs lexcution dune srie
dactions). Bien entendu, larrt de lautomate courant provoque
larrt dun ventuel sous-automate.
Transition conditionnelle : cette transition nest emprunte que
lorsque sa condition est valide.
243
Smantique des automates
Transition temporelle : cette transition conditionnelle spciali-
se est emprunte ds que le temps t sest coul depuis lentre
dans le dernier tat, et seulement si aucune transition condition-
nelle standard nest valide. Le compteur temporel nest pas r-
initialis lors de lexcution dune srie dactions se terminant
dans le mme tat que celui de dpart. Si plusieurs transitions
temporelles peuvent tre franchies, celle avec le temps de rf-
rence le plus important est choisie.
Transition inconditionnelle : cette transition est emprunte si au-
cune transition conditionnelle ou temporelle ne peut ltre.
Entre de lautomate : reprsente le point de dpart de lauto-
mate, lorsque celui-ci est dmarr.
Comme peut le laisser penser leur smantique, les automates utiliss ont un fonction-
nement hirarchique. Cette hirarchisation de la description a t choisie dans lunique
but de la simplier, en spcialisant au maximum chaque automate.
244
Annexe C
La tche cognitive interagir
Nous allons dtailler dans cette annexe la tche cognitive la plus complexe de notre
modle dhumain virtuel qui gre le droulement dune interaction. Le sujet trait ici est
donc relatif la section concernant les tches cognitives de lhumanode (Section 5.5.3,
page 183).
C.1 Principe
La tche cognitive interagir gre lensemble du processus permettant linteraction de
lhumanode virtuel avec un effecteur via une affordance. Elle ne prend en charge
quune seule affordance de lhumanode, mais peut tout de mme enchaner les in-
teractions par la slection automatique daffordances compatibles avec un effecteur en
cours dutilisation. Une telle interaction ncessite bien entendu lexcution de laffor-
dance, mais aussi la recherche pralable dun effecteur, le dplacement de lhumanode
au sein de lenvironnement an datteindre leffecteur, la gestion dune ventuelle le
dattente, etc. La complexit de cette tche est encore augmente par le fait que lhuma-
node peut avoir plusieurs besoins dinteraction simultans, via diffrentes affordances,
rendant cette tche multiple pour une seule entit et auto-concurrente.
An den simplier la description nous allons tout au long de cette annexe dcrire un
ensemble dautomates hirarchiques (Figure C.1), permettant de traiter chaque sous-
tche indpendamment lune de lautre. Comme nous le verrons ensuite, la concurrence
entre plusieurs de ces automates hirarchiques est intrinsquement gre grce des
tats tampons dattente et lutilisation de ressources.
C.2 Contrle haut niveau : dcision dinteraction
La premire tche se charge du contrle haut niveau de linteraction. Cet automate
interagir joue le rle dinhibiteur pour ltrer les affordances inactives (car mises en
pause), et se charge de terminer la tche lorsque laffordance nest plus requise par
lhumanode.
245
La tche cognitive interagir
FIG. C.1: Vue densemble des changements de modalit dinteraction.
FIG. C.2: Lautomate interagir dcide si linteraction est possible dans ltat
actuel de laffordance, et gre la terminaison de la tche actuelle.
Comme nous pouvons le voir gure C.2, lautomate interagir est relativement simple,
ne disposant que de 2 tats et dun sous-automate.
Son excution commence par le test de ltat de laffordance, qui est une action redon-
dante tant que lautomate est actif. Cette action a trois possibilits de transition.
Premirement, si laffordance nest plus requise par lhumanode, i.e. nexiste plus dans
le gestionnaire daffordances, lautomate prend n, ce qui a pour consquence de d-
truire la tche cognitive.
Deuximement, si laffordance est inactive, i.e. en pause dans le gestionnaire daffor-
dances, lautomate transite dans un tat passif dattente rationnelle.
Troisimement, si laffordance est active, le sous-automate en charge de choisir le type
dinteraction effectuer est dmarr.
C.3 Choix du type dinteraction : active ou ractive
Ce second automate, dmarr par lautomate interagir, a pour rle de choisir le type
dinteraction possible pour laffordance actuelle : active si laffordance a toute lat-
tention de lhumanode, ractive si une autre affordance est plus prioritaire pour lhu-
manode. Lorsque cet automate est excut, il est assur de disposer dune affordance
rationnellement valide.
246
Interaction active
FIG. C.3: Lautomate utilisation possible choisit le mode de recherche de
leffecteur, et se met en veille si les ressources sont puises ou si
aucun effecteur valide nest connu dans lenvironnement.
Comme nous pouvons le voir gure C.3, lautomate utilisation possible gre la concur-
rence ventuelle avec dautres tches cognitives interagir, via lutilisation de 2 res-
sources : les potentiels de navigation et dobservation de lhumanode.
Au dmarrage, lautomate essaye dutiliser la ressource de navigation 60% de son
potentiel maximal an de passer en recherche active, interdisant de se fait que 2 tches
interagir puissent tre en mode actif simultanment. Comme nous le verrons ensuite,
cest dessein que la ressource navigation nest pas utilise ici 100%.
En cas dchec, lautomate tente alors dutiliser la ressource dobservation 25% an
de passer en recherche ractive, autorisant ainsi 4 tches interagir passer dans ce
mode en mme temps quune cinquime, elle active.
Si la ressource observation est elle aussi occupe, lautomate transite dans un tat passif
dattente des ressources. Comme nous pouvons le constater, le test des ressources est
redondant pour les 3 tats prcdents (utilisation active, ractive, et attente), permettant
cette sous-tche de changer de mode chaque rafrachissement.
Une dernire transition, depuis la recherche active, gre lchec de la slection dun
effecteur pour laffordance courante. En effet, en mode recherche active, lhumanode
tente de planier un chemin dans lenvironnement vers un effecteur compatible avec
laffordance courante. Ce processus peut chouer pour diverses raisons (aucun effecteur
connu compatible, ou tous les effecteurs connus ont chous le test de pr-condition
locale de laffordance courante), faisant quitter le mode actif cet automate pour un
tat passif en attente dexploration. Cet tat tampon ne relance les tests des ressources
que dans le cas o une nouvelle zone est dcouverte dans lenvironnement (contenant
potentiellement un effecteur compatible), ou si un effecteur a t automatiquement s-
lectionn pour laffordance courante.
C.4 Interaction active
Nous allons dcrire ici lensemble des sous-automates rgissant le mode actif de lin-
teraction. Ce mode est caractris par son unicit parmi lensemble des tches interagir
247
La tche cognitive interagir
sexcutant simultanment. De plus, ce mode est forcment actif si au moins une tche
interagir a caractris sa possibilit dutilisation. Le principe de ce mode est daccor-
der les possibilits de planication de chemin ainsi que de navigation de lhumanode
laffordance courante.
C.4.1 Recherche active
La premire procdure du mode actif se charge de rechercher un effecteur compatible
avec laffordance courante. La russite aussi bien que lchec de cette recherche sont
grs par cet automate, qui se charge ensuite damener lhumanode dans une zone de
visibilit de leffecteur, puis de lancer la procdure dutilisation active.
FIG. C.4: Lautomate recherche active se charge de slectionner un effecteur
valide pour laffordance vise, puis de latteindre.
Comme nous pouvons le voir gure C.4, lautomate recherche active est sans doute
le plus complexe des automates hirarchiques de la tche interagir, et ce de par son
nombre de transitions.
Lautomate dbute par laction de planication vers laffordance. Cette action va lan-
cer une planication de chemin dans lenvironnement connu de lhumanode an de
slectionner un effecteur compatible avec laffordance courante. Comme nous lavons
vu prcdemment (conf. Chapitre 5.3.2, page 148), une telle planication de chemin
a comme condition darrt le fait datteindre un effecteur compatible avec lune des
affordances actives de plus haute priorit de lhumanode. Ainsi, deux cas peuvent se
produire :
La planication choisit un effecteur compatible avec laffordance courante, cest un
succs. A partir de ce point, un effecteur compatible est slectionn et exploitable
pour dautres actions.
La planication choue ou choisit un effecteur compatible avec une autre affordance
active, cest un chec. Dans ce cas cet automate se termine (tat Fin), et lautomate
parent utilisation possible passe en mode dattente exploratoire. Notons que dans
le cas ou un effecteur pour une autre affordance est slectionn, une tche cognitive
248
Interaction active
interagir correspondante est automatiquement cre.
La deuxime action de cet automate est de tester si leffecteur choisi est visible.
Si leffecteur nest pas encore visible, lautomate transite dans ltat permettant datteindre
leffecteur, qui se charge de piloter la navigation de lhumanode. Cet tat dispose dune
transition automatique lui permettant de tester nouveau la visibilit chaque rafra-
chissement, mais aussi dune transition temporelle qui va remettre en cause leffecteur
courant via une nouvelle planication toutes les 20 secondes.
Si leffecteur devient visible, lautomate dclare celui-ci lintention qua lhumanode
de lutiliser. Cette action tente dabonner lhumanode la liste dutilisateurs potentiels
de leffecteur pour laffordance courante. Dans le cas dun chec, par exemple si lef-
fecteur ne propose plus laffordance courante, lautomate retourne dans son action de
planication de dpart (qui ignorera leffecteur courant). Si cet automate est arrt, ou
si un autre effecteur est slectionn pour laffordance courante, lhumanode est auto-
matiquement dsabonn.
Une fois lhumanode abonn, la pr-condition locale de laffordance est teste pour
leffecteur courant. Dans le cas dun chec, lautomate retourne encore une fois dans
laction de planication de dpart.
En cas de succs, la ressource de navigation est totalement consomme et le sous-
automate dutilisation active est dmarr. Comme nous le verrons par la suite, la consom-
mation totale de la ressource de navigation assure le contrle total du mouvement de
lhumanode la tche en cours (cette ressource tant ncessaire en faible proportion
dans le mode ractif).
Une fois en mode dutilisation active, lautomate a 4 possibilits de transition. Pre-
mirement, si lutilisation de leffecteur courant est un chec, une nouvelle slection
deffecteur est lance. Deuximement, toutes les 20 secondes, une remise en cause
de leffecteur courant est faite via une planication. Si ce deuxime processus aboutit
au mode utilisation active avec le mme effecteur, le sous-automate nest pas red-
marr ; sinon il est arrt ou rinitialis. Troisimement, toutes les 2 secondes, la pr-
condition locale de laffordance est rvalue. Enn, la transition par dfaut se contente
de consommer la ressource de navigation.
C.4.2 Utilisation active
Lutilisation active est la deuxime tape du mode actif. Pour mmoire, lorsque cet
automate est dmarr, un effecteur valide pour laffordance courante est slectionn
et visible. Laffordance courante est quant elle forcment active pour lhumanode.
Enn, cette tche a le contrle total de la navigation de lhumanode. Cela va lui per-
mettre damener lhumanode la position dutilisation de leffecteur, aprs avoir gr
une ventuelle le dattente.
Comme nous pouvons le voir gure C.5, lautomate dutilisation active se charge de
placer lhumanode dans les conditions favorables lexcution de laffordance cou-
rante grce leffecteur slectionn.
Sa premire action consiste tester la disponibilit dune zone dutilisation. Si aucune
zone dutilisation nest disponible, car leffecteur ne propose plus laffordance ou parce
quil est actuellement occup vis--vis de laffordance courante, lautomate passe en
249
La tche cognitive interagir
FIG. C.5: Lautomate utilisation active se charge damener lhumanode jus-
qu la zone dutilisation de leffecteur. Il gre aussi le lancement
ventuel de la sous-tche grant la le dattente.
mode dattente active. Lentre dans ce mode a pour effet de dsabonner lhumanode
de la liste dintention de leffecteur (lintention devenant une attente effective). Une
seule transition depuis lattente active permet de tester nouveau la zone dutilisation,
dans le cas o lhumanode se trouve en position de premier attendant.
Si la zone dutilisation est disponible, la position dutilisation est alors value. Si cette
position est atteinte (confre Section 3.2.4, page 97, sur les zones dancrage), lauto-
mate peut alors passer en mode dutilisation.
Si la position dutilisation nest pas atteinte, lautomate transite alors vers ltat at-
teindre la zone qui va grer la navigation de lhumanode au sein de lenvironnement.
Cet tat recommence lensemble des tests prcdents chaque rafrachissement.
Concernant le mode dutilisation, deux points sont retenir. Premirement, tout comme
le mode dattente active, lentre dans ce mode dsabonne lhumanode de la liste din-
tention de leffecteur (lintention devenant une utilisation effective), mais en plus dsa-
bonne lhumanode dune ventuelle le dattente. Deuximement, une transition per-
met lautomate de vrier que la position dutilisation reste atteinte pour ce mode.
Ainsi, si pour une raison ou une autre lhumanode vient quitter la zone dutilisation
(dplacement fortuit de leffecteur, ou mme de lhumanode), celui-ci cherchera lat-
teindre de nouveau tout en restant abonn comme utilisateur.
Pour nir, notons que larrt de lautomate dutilisation active provoque le dsabonne-
ment automatique et immdiat une ventuelle le dattente et/ou dutilisation.
C.4.3 Attente active
Ce troisime, et dernier, automate du mode actif de linteraction gre le positionnement
dans la le dattente de lhumanode. De plus, il a la possibilit dinvalider leffecteur
courant si son utilisation est impossible. Une fois dmarr, et si leffecteur nest pas
invalid, cet automate a une excution innie, et ne sera interrompu que par la transition
de lautomate parent dutilisation active.
La premire action de cet automate consiste tester la disponibilit dune zone dat-
tente. La zone dattente est communique par leffecteur slectionn relativement
laffordance courante. Si leffecteur ne propose plus laffordance, ou si laffordance ne
250
Interaction active
FIG. C.6: Lautomate attente active gre le positionnement de lhumanode
dans la le dattente. Cet automate peut dcider que leffecteur est
inutilisable.
supporte pas lattente, cette action est un chec et elle transite dans ltat invalidant
leffecteur.
Dans le cas o une zone dattente est disponible, lautomate teste si la position dattente
est atteinte. La position dattente correspond (voir Chapitre 3.2.5, page 98) :
Lancre de premire attente si la le dattente est vide, ou si lhumanode est le
premier attendant, ou encore si la le dattente est de type plus proche.
Une zone dancrage ponctuelle derrire lattendant prcdant dans tous les autres
cas.
Si la position dattente nest pas atteinte, lautomate transite dans un tat se chargeant
de piloter la navigation de lhumanode an datteindre la zone dattente. Cet tat re-
commencera alors les tests depuis la premire action chaque rafrachissement.
Si la position dattente est atteinte, une action se charge de signaler lhumanode la
le dattente. Ce signalement va abonner lhumanode comme attendant, si ce nest pas
dj fait, ou alors simplement sassurer que lhumanode est toujours abonn. En effet,
leffecteur peut de lui-mme dsabonner ses attendant (par exemple sil est dsactiv),
et cette action permet de prendre ce fait en considration. Dans le cas dun chec, cette
action transite alors dans ltat invalidant leffecteur.
Dans le cas dun succs, lautomate transite alors dans un tat passif o lhumanode
se contente de patienter.
Pour nir, notons que ni larrt ni aucune transition de cet automate ne se charge du
dsabonnement de lhumanode la le dattente :
Si lautomate transite dans ltat invalidant leffecteur, alors lhumanode nest pas
(ou plus) abonn une le dattente.
Si cet automate est arrt par son parent (utilisation active), cest que lhumanode
est premier attendant et cherche utiliser leffecteur. Dans ce cas, il doit rester atten-
dant tant quil nest pas utilisateur an dempcher les autres attendants de transiter
de la mme faon. Cest ensuite lautomate utiliser qui dsabonnera automatique-
ment lhumanode de la le dattente.
Si cet automate est interrompu un plus haut niveau, cest son parent (utilisation
active) qui se charge du dsabonnement.
251
La tche cognitive interagir
C.5 Interaction ractive
Traitons maintenant le deuxime mode dinteraction de lhumanode : linteraction r-
active. Ce mode est utilis par les quatre tches cognitives dinteraction de priorit
directement infrieure la tche en mode actif. Ainsi, ce mode est forcment repr-
sent si au moins deux tches interagir ont caractris leur possibilit dutilisation.
Son but est de permettre des interactions opportunistes en surveillant lenvironnement
visuel immdiat de lhumanode : si un effecteur compatible avec laffordance courante
est repr, ce mode va tenter de lutiliser en passant. Ainsi, linteraction ractive na
quun contrle trs limit sur la navigation de lhumanode au sein de lenvironnement,
se contentant tout au plus de linuencer, et ne pilote en aucun cas la planication de
chemin.
C.5.1 Recherche ractive
La premire procdure du mode ractif se charge de la recherche visuelle dun effec-
teur compatible avec laffordance courante. La russite aussi bien que lchec de cette
recherche sont grs par cet automate, qui se charge ventuellement de lancer lutilisa-
tion ractive.
FIG. C.7: Lautomate recherche ractive soccupe de rechercher visuelle-
ment un effecteur valide pour laffordance vise dans lenviron-
nement de lhumanode.
Mme sil nest pas aussi complexe que la recherche active, lautomate de recherche
ractive (Figure C.7) dispose tout de mme dun nombre important de transitions.
Sa premire action consiste slectionner un effecteur visible compatible avec laffor-
dance. Cette action accde au donnes smantiques produites par la procdure dobser-
vation (Section 5.2.1, page 138), et y recherche un effecteur compatible. Dans le cas
o plusieurs effecteurs compatibles sont prsents, celui dont la zone dutilisation est la
plus proche est retenu. Si la recherche est un chec, laction transite dans un tat passif
252
Interaction ractive
dattente de visibilit qui recommencera le test lors du prochain rafrachissement.
Si un effecteur est slectionn, lautomate tente alors de lui dclarer son intention, de la
mme faon que pour une recherche active. Si la dclaration dintention choue, lef-
fecteur est invalid et le processus recommence.
Une fois lintention dclare, la pr-condition locale de laffordance est teste vis--vis
de leffecteur courant. Ici encore, un chec provoque linvalidation de leffecteur et le
recommencement du processus.
Si la pr-condition locale est valide, lautomate passe alors en mode dutilisation rac-
tive en dmarrant le sous-automate correspondant. Cet tat va remettre en cause lef-
fecteur courant toutes les 2 secondes, en relanant une slection par visibilit. Dans le
cas o cette slection aboutit au mode dutilisation ractive avec le mme effecteur,
le sous-automate correspondant nest pas redmarr ; sinon il est stopp ou rinitialis.
Notons que la slection par visibilit est aussi relance dans le cas ou le sous-automate
dutilisation ractive choue pour leffecteur slectionn. Lautre transition possible
depuis cet tat se contente dassurer que leffecteur reste visible, et redmarre le pro-
cessus dans le cas contraire.
Un point important est noter quant linvalidation des effecteurs. Ceux-ci sont bien
entendu ignors lors dune nouvelle slection par visibilit, mais seulement durant une
seconde (le rafrachissement courant de lautomate). En effet, une slection ultrieure,
mais temporellement proche, pourra slectionner nouveau cet effecteur dont les pro-
prits auront potentiellement changes : russite de la pr-condition locale, ou encore,
comme nous le verrons ensuite, libration de la zone dutilisation. Dautre part, on
peut remarquer ici que, contrairement au mode recherche active, cet automate ne r-
serve aucune ressource supplmentaire. En effet, le fait de cibler un effecteur nest pas
considr ici comme une action rchie de lhumanode, mais plus comme une ac-
tion automatique, rexe. Comme nous allons le voir ci aprs, lutilisation ractive va
ncessiter quant elle une participation plus consciente de lhumanode.
C.5.2 Utilisation ractive
Lutilisation ractive est la deuxime et dernire tape du mode ractif. Pour mmoire,
lorsque cet automate est dmarr, un effecteur valide pour laffordance courante est
slectionn et visible. Laffordance courante est quant elle forcment active pour
lhumanode. Cette tche va se charger de dclencher lutilisation de leffecteur racti-
vement lentre de lhumanode dans la zone dutilisation. Mme si elle ne peut pas
contrler directement le mouvement de lhumanode, nous allons voir que cette tche
va tout de mme tre capable de linuencer. Bien entendu, cet automate interdit toute
participation une le dattente.
La premire action de lutilisation ractive (Figure C.8) consiste tester la disponibi-
lit de la zone dutilisation. Une zone dutilisation nest disponible que si une position
dutilisation est libre, et si leffecteur na aucun attendant pour laffordance courante.
Si aucune zone dutilisation nest disponible, leffecteur est invalid. On peut donc ici
noter que les zones dutilisation utilisateurs multiple seront beaucoup plus propices
une utilisation ractive.
Dans le cas o une zone dutilisation est libre, laction suivante tente de consommer
253
La tche cognitive interagir
FIG. C.8: Lautomate utilisation ractive inuence la navigation de lhuma-
node an de lamener dans la zone dutilisation de leffecteur (si
celle-ci est disponible).
40% de la ressource de navigation, correspondant au taux laiss libre par une autre
tche cognitive dinteraction en mode actif. En cas de succs, une action est lance qui
va inuencer la navigation de lhumanode en considrant la zone dutilisation comme
attractive. En effet, elle introduit un cot ngatif dans la caractrisation de lenvironne-
ment immdiat de lhumanode (confre Section 5.4, page 160), proportionnellement
au ratio de priorits entre laffordance courante et laffordance en mode dinteraction
active. Ainsi, lhumanode va prfrer emprunter cette zone lors de sa navigation, le
poussant mme ralentir sil sy trouve dj.
Laction suivante teste si la position dutilisation est atteinte. Si cest le cas, le sous-
automate utiliser est dmarr, et les tests reprendront partir de la consommation de
ressource lors du prochain rafrachissement. Dans le cas contraire, laction transite dans
un tat passif qui recommence lensemble des tests.
C.6 Utiliser leffecteur
Lutilisation de leffecteur est la dernire tche de linteraction. Quelle soit dmar-
re par le mode actif ou le mode ractif, cette tche dispose dune affordance active
excuter, ainsi que dun effecteur compatible, visible, et dont la zone dutilisation
est atteinte et disponible pour lhumanode. Cette tche va ainsi se contenter deffec-
tuer linteraction proprement parler, mais va aussi tre capable denchaner des in-
teractions compatibles avec leffecteur courant. Notons nanmoins que cette tche est
interruptible tout instant par la transition de lun de ses automates parents.
La premire action de lautomate utiliser (Figure C.9) consiste inscrire lhumanode
comme utilisateur. Cette inscription a pour effet immdiat de dsabonner lhumanode
dune ventuelle le dattente ou liste dintention. Si cette inscription choue, car lef-
fecteur ne propose plus laffordance par exemple, laction transite dans un tat invali-
dant leffecteur courant.
Une fois lutilisateur inscrit, linscription restant valide jusqu larrt de cet automate,
254
Synthse et conclusion
FIG. C.9: Lautomate utiliser excute laffordance vise. Ensuite, il est ca-
pable de slectionner une nouvelle affordance active compatible
avec la zone dutilisation de leffecteur courant.
une action value le temps dutilisation T
u
pour laffordance. Cette valuation se fait
par une requte directe et unique la procdure associe de laffordance (confre Sec-
tion 3.3.3, page 103). Si le temps dutilisation T
u
est nul, laction transite immdiate-
ment vers laction appliquant laffordance.
Dans le cas contraire, ltat dutilisation en cours est atteint. Cet tat appelle la proc-
dure de contrle durant linteraction de laffordance chaque rafrachissement.
Une fois le temps dutilisation T
u
coul, laction appliquant laffordance est excute
qui se contente dappeler la procdure de contrle en n dinteraction de laffordance.
La dernire action de cet automate tente de slectionner une nouvelle affordance com-
patible avec la zone dutilisation courante, et donc leffecteur courant. Cette action de
recyclage permet lhumanode denchaner des interactions avec un effecteur, sans
avoir recommencer lensemble du processus. Ainsi, les affordances valides du ges-
tionnaire de lhumanode sont consultes, dans lordre des priorits dcroissantes, et
leur pr-condition locale est value. Si celle-ci russie, cest que leffecteur courant
est valide pour cette affordance, qui remplace alors laffordance courante de cette tche
cognitive dinteraction. Ainsi, si une affordance compatible est trouve, le processus re-
commence partir de lvaluation du temps dinteraction.
Si aucune autre affordance nest compatible, alors linteraction avec cet effecteur est
termine et lautomate prend n.
C.7 Synthse et conclusion
Nous avons dtaill dans cette annexe la tche cognitive dinteraction de lhumanode.
Cette tche prend en charge lexcution complte dune affordance de lhumanode,
et permet aussi bien une interaction aiguille, contrlant la circulation de lhumain
virtuel, quopportuniste, reprant des possibilits dutilisation la vole.
Laspect le plus important de cette tche est sa gestion de la concurrence quant au
contrle de lhumanode. Cette gestion seffectue en interne, grce lutilisation suc-
255
La tche cognitive interagir
cessive de deux ressources par les tches dinteraction sexcutant itrativement. On
peut ainsi voir sur la table C.1 deux congurations possibles pour six tches dinterac-
tion en cours dexcution. Dans la conguration 1 lhumanode est en train dattendre
pour utiliser leffecteur de laffordance A, tout en effectuant linteraction C. Ce cas
pourrait correspondre une personne faisant la queue devant un guichet de vente, tout
en consultant un panneau dafchage visible depuis sa position courante. La congura-
tion 2 est plus complexe, dmontrant quelques cas dchec des automates. Ici, la tche
A na pu trouver deffecteur compatible, librant ainsi les ressources pour la tche B qui
dirige lhumanode vers un effecteur utilisable. La tche C est pour le moment en at-
tente de ractivation rationnelle de son affordance, tandis que les trois tches suivantes
recherchent visuellement un effecteur compatible.
Congurations : 1 2
Tche A Attente active Attente exploratoire
Tche B Recherche ractive Recherche active
Tche C Utilisation ractive Attente dactivation
Tche D Recherche ractive Recherche ractive
Tche E Recherche ractive Recherche ractive
Tche F Attente ressources Recherche ractive
Ressources consommes :
navigation / observation
100% / 100% 60% / 75%
TAB. C.1: Deux exemples de concurrence entre tches dinteraction. Les
tches sont listes par ordre de priorit dcroissante, et leur tat
est donn pour chaque conguration. La consommation totale des
ressources est indique.
Pour conclure, on peut remarquer que ce principe permet de grer un large panel de
comportements dinteraction. La gestion totalement abstraite des affordances en fait
un systme gnrique, supportant lintroduction de nouvelles interactions sans aucune
modication. De plus, des cas particuliers de concurrence vis--vis dautres ressources
peuvent tre grs directement par les affordances, en provoquant un chec de lune de
leurs pr-conditions (rationnelle ou locale). En effet, comme la tche cognitive din-
teraction se base sur ces pr-conditions pour valuer ses possibilits de droulement,
la modication de ces pr-condition aura un impact direct sur les modalits dinter-
action atteignables. Ainsi, il est possible de spcialiser cette gestion de linteraction a
posteriori, sans avoir en modier le mcanisme gnral.
256
Annexe D
Simulation dune gare virtuelle
Nous allons dtailler dans cette annexe la procdure comportementale dun voyageur
au dpart dans une gare. Nous commencerons par traiter, dans la section D.1, les spcia-
lisations dobjets interactifs ncessaires. Nous continuerons, dans la section D.2, avec
une description illustre du processus comportemental obtenu lors de la simulation.
D.1 Dnition des objets de simulation
La simulation dun voyageur au dpart ncessite la spcialisation des concepts intro-
duits par BIIO (confre Chapitre 3, page 91). Les objets spcialiser sont (confre
Section 6.2, page 201) :
quipements : composteur de tickets ; tableau des dparts ; automate de vente de ti-
ckets de trains.
Usager : voyageur standard.
Accs : accs rue ; accs aux quais.
Ressources : destination ; ticket de train.
Affordances : prendre le train ; sortir de la gare ; acheter un ticket ; changer un ticket ;
composter son ticket ; lire le tableau des dparts.
Nous ne nous attarderons pas sur les trois premires catgories, dont la spcialisation
est triviale, pour nous concentrer sur les ressources et les affordances.
D.1.1 Les ressources
Les deux ressources mentionnes, la destination et le ticket de train, sont des spciali-
sations directes de la ressource brute de BIIO (Figure D.1). En effet, lhumain virtuel
na pas besoin de partager celles-ci entre diffrents processus comportementaux, mais
seulement de sen servir comme mmoire temporaire (pour la destination) ou comme
symbolisation dun objet possd (pour le ticket).
Pour spcialiser ces ressources nous leur ajoutons seulement des attributs, aucune fonc-
tionnalit supplmentaire ntant ncessaire. Dcrivons leurs nouveaux constituants :
257
Simulation dune gare virtuelle
FIG. D.1: Ressources du voyageur au dpart.
Destination. Deux catgories de destinations sont reprsentes par cette ressource :
Accs : Cet attribut est une rfrence un objet interactif de type accs (vers
la rue ou les quais). Il correspond la destination locale du voyageur au
dpart, et donc la voie o il doit prendre son train. Cet attribut peut aussi
reprsenter une porte de sortie de la gare dans le cas des voyageurs lar-
rive. Sa valeur initiale est vide pour le voyageur au dpart.
Nom de la destination : Cet attribut est un champ textuel reprsentant
la ville de destination dun voyageur au dpart. Cet attribut est vide pour
un voyageur larrive.
Ticket de train. Le ticket de train comporte les mmes informations quun ticket rel :
Compost : Cet attribut boolen dnit ltat correspondant du ticket. Sa va-
leur initiale est faux.
Horaire : Cet attribut correspond la date de dpart du train. Sa valeur initiale
est affecte par les donnes dexploitation de la gare.
Destination : Cet attribut est un champ textuel correspondant la ville de
destination du train. Sa valeur initiale correspond celle de la ressource
prcdente.
Identifiant du train : Cet attribut est un entier identiant de manire
unique le train. Sa valeur initiale est obtenue dans les donnes dexploita-
tion.
D.1.2 Les affordances
Les affordances des voyageurs vont produire leur procdure comportementale globale.
La procdure du voyageur au dpart est la plus complexe, ncessitant un certain nombre
dinteractions avant son aboutissement.
Nous ne dcrirons que les spcialisations de la pr-condition rationnelle et du contrle
en n dinteraction pour ces affordances, les autres fonctionnalits tant triviales. Rap-
pelons que la pr-condition rationnelle permet lexcution hirarchique des affordances,
et donc lmergence dun plan comportemental. La gure D.2 illustre ce plan compor-
temental pour le voyageur au dpart, en indiquant les liens de dpendance entre les
diffrentes tches.
tudions chacune de ces affordances. Les spcialisations des fonctionnalits seront
donnes sous forme dalgorithmes utilisant du pseudo-code. La gestion des priorits
des affordances ne sera pas explicit pour des questions de lisibilit. Le facteur tempo-
rel dans la prise de dcision (comme ne pas composter son ticket si le dpart du train
258
Dnition des objets de simulation
FIG. D.2: Procdure comportementale du voyageur au dpart.
est imminent) est omis pour les mmes raisons. Enn, larrt ventuel des affordances
lles si elles ne sont plus ncessaires est aussi absent des algorithmes pour ne pas les
surcharger. Les procdures suivantes sont considres comme dnies :
o.a renvoie lattribut a de lobjet interactif o.
RESSOURCE(I, "n") renvoie la ressource de linteracteur I nomme n.
AJOUTER(I, R) ajoute la ressource R linteracteur I.
RETIRER(I, R) retire la ressource R de linteracteur I.
LANCER(I, a) lance laffordance racine a pour linteracteur I.
LANCERFILLE( f ) lance laffordance lle f pour laffordance courante.
SUPPRIMER(I) supprime linteracteur I de la simulation.
HEURECOURANTE renvoie le temps simul courant.
CRERTICKET(d) cre une ressource ticket de train conforme la destination d.
Cette procdure peut ne rien renvoyer si les donnes dexploitation ne disposent
daucun train en partance conforme. Si un ticket est cr, il est entirement congur
et non compost.
VOIE(t) renvoie lobjet interactif reprsentant la voie daccs pour le train t comme
indiqu dans les donnes dexploitation.
Prendre le train. Cette affordance est le but nal du voyageur au dpart, et lui est
donc assigne au dpart de la simulation. Elle va sassurer que les conditions favorables
la prise dun train sont runies (Algorithme 4).
Sortir de la gare. Cette affordance est le but nal du voyageur larrive, et un but
secondaire du voyageur au dpart sil est dans limpossibilit de prendre son train. Elle
na aucune pr-condition rationnelle, et son contrle en n dinteraction se contente de
supprimer linteracteur.
Acheter un ticket. Cette affordance gre lachat dun ticket de train et est capable de
commander la sortie de la gare si plus aucun train ne part pour la destination souhaite
(Algorithme 5).
changer un ticket. Cette affordance gre lchange dun ticket de train et est ca-
pable de commander la sortie de la gare si plus aucun train ne part pour la destination
259
Simulation dune gare virtuelle
souhaite (Algorithme 6).
Composter son ticket. Cette affordance se contente de modier ltat courant du
ticket (Algorithme 7).
Lire le tableau des dparts. Cette affordance permet un voyageur quip dun
ticket de trouver la voie daccs son train (Algorithme 8).
On peut constater dans les diffrents algorithmes que la prise de dcision est locale
dans les affordances. Ainsi, une pr-condition rationnelle ne valide le processus com-
portemental que pour laffordance courante, laissant les ventuelles affordances lles
rsoudre leurs propres pr-conditions. Cet aspect conforte lvolutivit mise en avant
avec BIIO, en facilitant lajout dun comportement dinteraction au sein dune proc-
dure comportementale dj dnie.
Algorithme 4 Laffordance prendre le train
Pr-condition rationnelle(Voyageur) :
dest RESSOURCE(Voyageur, "Destination")
SI dest = aucune dest.nom = "" ALORS
LANCER(Voyageur, sortir de la gare)
RENVOYER faux
FINSI
ticket RESSOURCE(Voyageur, "Ticket de train")
SI ticket = aucun ALORS
LANCERFILLE(acheter un ticket)
RENVOYER faux
FINSI
SI ticket.destination != dest.nom ticket.horaire < HEURECOURANTE ALORS
LANCERFILLE(changer un ticket)
RENVOYER faux
FINSI
valide vrai
SI dest.accs = aucun ALORS
LANCERFILLE(lire le tableau des dparts)
valide faux
FINSI
SI ticket.compost = faux ALORS
LANCERFILLE(composter son ticket)
valide faux
FINSI
RENVOYER valide
Fin dinteraction(Voyageur,Voie de train) :
SUPPRIMER(Voyageur)
260
Dnition des objets de simulation
Algorithme 5 Laffordance acheter un ticket
Pr-condition rationnelle(Voyageur) :
dest RESSOURCE(Voyageur, "Destination")
SI dest = aucune dest.nom = "" ALORS
RENVOYER faux
FINSI
ticket RESSOURCE(Voyageur, "Ticket de train")
SI ticket = aucun ALORS
RENVOYER faux
FINSI
RENVOYER vrai
Fin dinteraction(Voyageur,Automate de vente) :
dest RESSOURCE(Voyageur, "Destination")
ticket CRERTICKET(dest)
SI ticket = aucun ALORS
LANCER(Voyageur, sortir de la gare)
SINON
AJOUTER(Voyageur, ticket)
FINSI
Algorithme 6 Laffordance changer un ticket
Pr-condition rationnelle(Voyageur) :
dest RESSOURCE(Voyageur, "Destination")
SI dest = aucune dest.nom = "" ALORS
RENVOYER faux
FINSI
ticket RESSOURCE(Voyageur, "Ticket de train")
SI ticket = aucun ALORS
RENVOYER faux
FINSI
RENVOYER vrai
Fin dinteraction(Voyageur,Automate de vente) :
ticket RESSOURCE(Voyageur, "Ticket de train")
RETIRER(Voyageur, ticket)
dest RESSOURCE(Voyageur, "Destination")
ticket CRERTICKET(dest)
SI ticket = aucun ALORS
LANCER(Voyageur, sortir de la gare)
SINON
AJOUTER(Voyageur, ticket)
FINSI
261
Simulation dune gare virtuelle
Algorithme 7 Laffordance composter son ticket
Pr-condition rationnelle(Voyageur) :
ticket RESSOURCE(Voyageur, "Ticket de train")
SI ticket = aucun ticket.compost = vrai ALORS
RENVOYER faux
FINSI
RENVOYER vrai
Fin dinteraction(Voyageur,Composteur) :
ticket RESSOURCE(Voyageur, "Ticket de train")
ticket.compost vrai
Algorithme 8 Laffordance lire le tableau des dparts
Pr-condition rationnelle(Voyageur) :
ticket RESSOURCE(Voyageur, "Ticket de train")
SI ticket = aucun ticket.compost = vrai ALORS
RENVOYER faux
FINSI
RENVOYER vrai
Fin dinteraction(Voyageur,Tableau des dparts) :
ticket RESSOURCE(Voyageur, "Ticket de train")
dest RESSOURCE(Voyageur, "Destination")
dest.accs = VOIE(ticket.IDtrain)
D.2 Simulation complte du voyageur au dpart
Maintenant que nous avons dni les composants BIIO ncessaires la simulation dun
voyageur au dpart, illustrons le droulement de sa procdure comportementale. Pour
se faire, nous allons suivre un voyageur unique de la gare tout au long des interactions
quil va effectuer.
Le voyageur au dpart entre dans la gare avec une destination (prsente dans ses res-
sources), mais pas de ticket. Son comportement assign est prendre le train. Cette
affordance, dtectant labsence de ticket, lance laffordance lle acheter un ticket. Ces
deux affordances sont automatiquement reprsentes sous la forme de tches cognitives
dinteraction, et le voyageur se dirige vers lautomate de vente le plus accessible.
262
Simulation complte du voyageur au dpart
Le voyageur a ni dacheter son ticket. Ce dernier est maintenant disponible sous forme
de ressource. La pr-condition rationnelle de laffordance prendre le train ajoute main-
tenant les interactions composter son ticket et lire le tableau des dparts. Cest la tche
cognitive reprsentant cette dernire qui est la plus prioritaire, le voyageur se dirige
donc vers le moniteur le plus accessible.
Le voyageur est dans la zone dutilisation du
moniteur des dparts et commence le regar-
der.
Le voyageur a ni dutiliser le moniteur.
Grce cette interaction il a pu dterminer
que son train partirait voie 1 (information sto-
cke dans la ressource destination). La tche
dinteraction composter le ticket est mainte-
nant la prochaine tape.
263
Simulation dune gare virtuelle
Le voyageur a atteint le composteur choisi.
Sa tche cognitive dinteraction dcide donc
de commencer linteraction.
Nous en dcidons autrement et mettons en
panne le composteur utilis.
La pr-condition locale de laffordance com-
poster le ticket invalide donc leffecteur cou-
rant, et la tche cognitive se charge de plani-
er un chemin vers un autre composteur va-
lide. Il y en a un juste ct et le voyageur
sy rend.
Lutilisation du composteur sest droule
sans encombre, le ticket tant dsormais
compost. Laffordance prendre le train est
maintenant valide dun point de vue ration-
nel. Le voyageur se rend donc la voie de
dpart de son train pour effectuer sa dernire
interaction.
264
Annexe E
Exprimentations impliquant
des foules
Cette annexe prsente les exprimentations de captures de mouvements impliquant des
foules. Celles-ci ont t conduites dans le cadre dun processus de validation du modle
de navigation ractive (confre Section 7.1.2, page 218). Les donnes produites ont t
exploites de deux faons.
Premirement, elles ont t analyses quantitativement lors du stage de Master de
Loc Letreust [76], sous la direction de Julien Pettr. Ce stage visait caractriser
les ovales de Goffman depuis les diffrentes situations captures. Deux ovales ont t
produits pour chaque situation, correspondant lun aux entits dont la vitesse est inf-
rieure la moyenne de la squence, et lautre suprieure (un mme participant pouvant
appartenir successivement ces deux catgories, suivant ses adaptations). Ces ovales
sont reprsents dans la partie droite de la gure E.1, respectivement en bleu et vert.
Ces donnes ayant t acquises rcemment, le rebouclage sur le modle de navigation
na pas encore t fait, mais est prvu pour un avenir proche.
Deuximement, les donnes ont t analyses qualitativement an dextraire les orga-
nisations spatiales mergeant dans diffrentes situations. Cette tude purement visuelle
a permis de conrmer les observations que lon trouve dans la littrature, et den pr-
ciser de nouvelles. Ces observations sont indiques en lgende de chaque situation sur
la gure E.1. Nous avons pu constater que notre modle de navigation ractive repro-
duisait ces phnomnes mergeant, attestant ainsi de sa validit macroscopique.
Nous avons pu remarquer, aprs une srie de comparaisons rel / simul, quun pro-
cessus complmentaire plus rationnel serait ncessaire dans certains cas. Par exemple,
la diminution automatique de la vitesse en arrivant un croisement sans visibilit (Fi-
gure E.1(g)) ne peut tre reproduit par un mcanisme purement ractif. En effet, ce
cas ncessite une prise de conscience du risque potentiel, sans que celui-ci ne soit in-
carn dans lenvironnement. Ce mcanisme pourrait tre simul par lajout dune tche
cognitive notre modle dhumain virtuel, analysant la topologie environnante pour
introduire des obstacles dynamiques ctifs dans le module de navigation.
Exprimentations impliquant des foules
Conditions Ovales de Goffman
(a) Couloir avec circulation sens unique.
Mise en vidence de loccupation maximale de lespace.
(b) Couloir avec circulations contre-sens et ux quilibrs.
Mise en vidence de la formation de les.
FIG. E.1: suite sur la page suivante.
266
Conditions Ovales de Goffman
(c) Couloir avec circulation contre-sens, lun des ux tant moins important.
Mise en vidence du rapport existant entre la largeur des les et la
dimension des ux qui les composent.
(d) Croisement sans ux oppos.
Mise en vidence dune rduction de la vitesse permettant la diminution du
nombre de collisions potentielles imminentes.
FIG. E.1: suite sur la page suivante.
267
Exprimentations impliquant des foules
Conditions Ovales de Goffman
(e) Croisement avec ux opposs.
Mise en vidence de la formation de paquets dindividus traversants la zone
de collisions potentielles.
(f) Croisement avec ux multiples.
Mise en vidence de changements de direction anticips an de limiter les
interactions dans les zones encombres.
FIG. E.1: suite sur la page suivante.
268
Conditions Ovales de Goffman
(g) Croisement avec occultation visuelle.
Mise en vidence dun ralentissement automatique et dune adaptation
brusque en absence dinformation visuelle.
FIG. E.1: Expriences impliquant des foules dindividus. Chaque situation
est illustre gauche, et les ovales de Goffman dduits sont indi-
ques droite. Les informations qualitatives mises en vidence par
ltude des squences sont indiques sous chaque situation.
269
Bibliographie
[1] T. Abaci, J. Ciger, et D. Thalmann. Planning with smart objects. Dans Interna-
tional Conferences in Central Europe on Computer Graphics, Visualization and
Computer Vision, janvier 2006. 2.3.2
[2] Tolga Abaci, Jan Ciger, et Daniel Thalmann. Speculative planning with de-
legation. Dans CW 04 : Proceedings of the 2004 International Conference
on Cyberworlds (CW04), pages 100106, Washington, DC, USA, 2004. IEEE
Computer Society. 2.3.2
[3] Herv Abdi. A neural network primer. Journal of Biological Systems, 2(3) :247
283, 1994. 2.2.1
[4] W. Ali et B. Moulin. 2d-3d multiagent geosimulation with knowledge-based
agents of customers shopping behavior in a shopping mall. Dans COSIT 2005,
dit par A.G. Kohn et D.M. Mark, volume 3693 de LNCS, pages 445458.
Springer-Verlag, 2005. 2.4.4
[5] Rasmus Andersen, Jean Louis Berrou, et Alex Gerodimos. On some limita-
tions of grid-based (ca) pedestrian simulation models. Dans First International
Workshop on Crowd Simulation (V-Crowds05). VRlab, EPFL, 2005. 1.5.2
[6] J. Archea. The evacuation of non-ambulatory patients from hospital and nursing
home res : Aframework for a model. Technical report, novembre 1979. NBSIR
79-1906. 1.3.2
[7] O. Arikan, S. Chenney, et D. A. Forsyth. Efcient multi-agent path planning.
Dans Computer Animation and Simulation 01, pages 151162. Springer-Verlag,
2001. 1.5.2
[8] Richard C. Atkinson et Richard M. Shiffrin. The Psychology of Learning and
Motivation : Advances in Research and Theory, volume 2, chapter Human me-
mory : A proposed system and its control processes, pages 89195. Academic
Press, 1968. 2.1.2
[9] Mir Azimzadeh et Bjrn Klarqvist. Phenomenal space : attitudes and methods.
Dans Space Syntax, 4th International Symposium, University College of Lon-
don, 2003. 1.1.2
[10] Marwan Badawi. Synoptic objects describing generic interaction processes to
autonomous agents in an informed virtual environment. Thse de Doctorat,
INSA de Rennes, dcembre 2006. 2.3.3
[11] Marwan Badawi et Stphane Donikian. Autonomous agents interacting with
their virtual environment through synoptic objects. Dans Computer Animation
and Social Agents, 2004. 2.3.3, 5.7
271
Bibliographie
[12] N.I. Badler, R. Bindiganavale, J. Allbeck, W. Schuler, L. Zhao, S.J. Lee, H. Shin,
et M. Palmer. Parameterized action representation and natural language instruc-
tions for dynamic behavior modication of embodied agents. Dans AAAI Spring
Symposium, 2000. 2.3.1
[13] Norman I. Badler, Rama Bindiganavale, Jan Allbeck, William Schuler, Liwei
Zhao, et Martha Palmer. Parameterized action representation for virtual human
agents. Embodied conversational agents, pages 256284, 2000. 2.3.1
[14] Norman I. Badler, Barry D. Reich, et Bonnie L. Webber. Towards personalities
for animated agents with reactive and planning behaviors. Dans Creating Per-
sonalities for Synthetic Actors, Towards Autonomous Personality Agents, pages
4357, London, UK, 1997. Springer-Verlag. 2.2.1, 2.3.1
[15] Bram Bakker. The adaptative behavior approach to psychology. Dans Cognitive
Processing, volume 1, pages 3970, 2000. 2.1
[16] J. Barraquand et J.-C. Latombe. Robot motion planning : a distributed repre-
sentation approach. Internation Journal of Robotics Research, 10(6) :628649,
1991. 1.5.3
[17] Jean Louis Berrou, Jonathan Beecham, Philippe Quaglia, Marios A. Kagarlis, et
Alex Gerodimos. Pedestrian and Evacuation Dynamics, chapter Calibration and
validation of the Legion simulation model using empirical data, pages 167181.
Springer Berlin Heidelberg, 2005. 1.6.1, 1.6.2
[18] Alain Bertoz. La dcision. 2003. 2.1.2
[19] A. L. Blum et M. L. Furst. Fast planning through planning graph analysis.
Articial Intelligence, 90(1/2) :281300, Fvrier 1997. 2.2.2
[20] B. M. Blumberg. Olds Tricks, New Dogs : Ethology and Interactive Creatures.
Thse de Doctorat, Massachussetts Institute of Technology, Fvrier 1997. 2.2.1
[21] J.-D. Boisonnat et M. Yvinec. Gomtrie algorithmique. Collection Informa-
tique. EDISCIENCE international, 1995. 1.5.1
[22] J.-D. Boissonnat et M. Yvinec. Algorithmic Geometry. Cambridge University
Press, 1998. 1.5.1
[23] B. Bonet et H. Geffner. Planning as heuristic search. Articial Intelligence,
129(1/2) :533, 2001. 2.2.2
[24] Adi Botea, Martin Mller, et Jonathan Schaeffer. Near optimal hierarchical path-
nding. Journal of Game Development, 1(1) :728, 2004. 1.5.4
[25] Michael E. Bratman. Intentions, Plans, and Practical Reason. Harvard Univer-
sity Press, 1987. 2.1.2, 2.2.2
[26] Michael E. Bratman. Faces of Intention. Cambridge Studies in Philosophy.
Cambridge University Press, 1999. 2.1.2
[27] Adriana Braun, Soraia R. Musse, Luiz P. L. de Oliveira, et Bardo E. J. Bodmann.
Modeling individual behaviors in crowd simulation. Dans CASA 03 : Procee-
dings of the 16th International Conference on Computer Animation and Social
Agents (CASA 2003), page 143, Washington, DC, USA, 2003. IEEE Computer
Society. 1.4.1
[28] Werner Brilon. A new german capacity manual. Dans The Second International
Symposium on Highway Capacity, dit par Rahmi Akelik, pages 152164,
Sydney, Australie, aot 1994. Australian Road Research Board Ltd. 1.2.2
272
Bibliographie
[29] S. Caselli, M. Reggiani, et R. Rocchi. Heuristic methods for randomized path
planning in potential elds, 2001. 1.5.3
[30] L. P. Chew. Constrained delaunay triangulations. Dans Proceedings of the third
annual symposium on Computational geometry, pages 215222. ACM Press,
1987. 1.5.1
[31] M. G. Choi, J. Lee, et S. Y. Shin. Planning biped locomotion using mo-
tion capture data and probabilistic roadmaps. ACM Transactions on Graphics,
22(2) :182203, 2003. 1.5.2
[32] William J. Clancey. Situated Cognition : On Human Knowledge and Compu-
ter Representations (Learning in Doing : Social, Cognitive and Computational
Perspectives). Cambridge University Press, August 1997. 2.1.2
[33] Winnie Daamen et Serge P. Hoogendoorn. Experimental research of pedestrian
walking behavior. Transportation Research Record, 1828 :2030, 20036. 1.6.1
[34] Etienne de Sevin. An Action Selection Architecture for Autonomous Virtual Hu-
mans in Persistent Worlds. Thse de Doctorat, cole Polytechnique de Lau-
sanne, 2006. 2.4.3
[35] V. Decugis et J. Ferber. Action selection in an autonomous agent with a hierar-
chical distributed reactive planning architecture. Dans Proceedings of the 2nd
International Conference on Autonomous Agents (Agents98), dit par Katia P.
Sycara et Michael Wooldridge, pages 354361, New York, Mai 1998. ACM
Press. 2.2.2
[36] Stphane Donikian. Modlisation, contrle et animation dagents virtuels auto-
nomes voluant dans des environnements informs et structurs. Habilitation
Diriger des Recherches, IRISA/IFSIC, 2004. 1.1.3
[37] Stphane Donikian et Eric Rutten. Reactivity, concurrency, data-ow and hierar-
chical preemption for behavioural animation. Dans Programming Paradigms in
Graphics, dit par R.C. Veltkamp et E.H. Blake. Springer-Verlag, 1995. 2.2.1
[38] M. Duckham et L. Kulik. "Simplest Paths" : Automated route selection for
navigation. Dans Spatial Information Theory : Foundations of Geographic In-
formation Science, dit par W. Kuhn, M. F. Worboys, et S. Timpf, volume 2825
de Lecture Notes in Computer Science, pages 182199, Berlin : Springer, 2003.
1.5.4
[39] F. Feurtey. Simulating the collision avoidance behavior of pedestrians. Rapport
de DEA, The University of Tokyo, School of Engineering, 2000. 1.4.3
[40] R. E. Fikes et N. J. Nilsson. Strips : A new approach to the application of
theorem proving to problem solving. Articial Intelligence, 2(3/4), 1971. 2.2.2
[41] John J. Fruin. Pedestrian planning and design. New-York : Metropolitan asso-
ciation of urban designers and environmental planners, Inc., 1971. 1.2, 1.2.1,
1.3.5, 7.2
[42] J. Funge, X. Tu, et D. Terzopoulos. Cognitive modeling : Knowledge, reasoning
and planning for intelligent characters. Dans Proceedings of the Conference
on Computer Graphics (Siggraph99), dit par Alyn Rockwood, pages 2938,
N.Y., Aot 1999. ACM Press. 2.2.2
[43] J. J. Gibson. The Theory of Affordances. Lawrence Erlbaum Associates, Hills-
dale, NJ, 1977. 3.3.1
273
Bibliographie
[44] J.J. Gibson. The Ecological Approach to Visual Perception, chapter 8 : The
Theory of Affordances, pages 127143. Lawrence Erlbaum Associates, 1986.
2.1.2
[45] Christian Gloor, Pascal Stucki, et Kai Nagel. Hybrid techniques for pedestrian
simulations. Dans 4
t
h Swiss Transport Research Conference, Monte Verit, As-
cona, 2004. 1.5.3
[46] E. Goffman. Relations in public : microstudies of the public order. New York :
Basic books, 1971. 1.1.2
[47] S. Goldenstein, M. Karavelas, D. Metaxas, L. Guibas, E. Aaron, et A. Goswami.
Scalable nonlinear dynamical systems for agent steering and crowd simulation.
Computers and Graphics, 25(6) :983998, 2001. 2.4.1
[48] Classement des tablissements recevant du public. Gouvernement Franais.
1.2.3
[49] Rgles de scurit applicables aux gares (GA). Gouvernement Franais. 1.2.3
[50] Robin Green. Steering behaviours. Dans Tutorial at SigGraph00, 2000. 1.4.2
[51] Christopher Hartman et Bedrich Benes. Autonomous boids : Research articles.
Computer Animation and Virtual Worlds, 17(3,4) :199206, 2006. 1.4.2
[52] Dirk Helbing, Lubos Buzna, Anders Johansson, et Torsten Werner. Self-
organized pedestrian crowd dynamics : Experiments, simulations, and design
solutions. Transportation Science, 39(1) :124, 2005. 1.4.1
[53] Dirk Helbing, Lubos Buzna, et Torsten Werner. Self-organized pedestrian crowd
dynamics and design solutions. Dans Trafc Forum 12, 2003. 1.6.1, 1.6.2
[54] Dirk Helbing, I. Farkas, et Tamas Vicsek. Simulating dynamical features of
escape panic. Nature, 407 :487490, 2000. 1.4.1
[55] L. F. Henderson. The statistics of crowd uids. Nature, 229 :381383, 1971.
1.3.1
[56] B. Hillier, A. Penn, J. Hanson, T. Grajewski, et J. Xu. Natural movement : or,
conguration and attraction in urban pedestrian movement. Environment and
Planning B : Planning and Design, 20 :2966, 1993. 1.1.2
[57] Hartwig H. Hochmair et Victoria Karlsson. Investigation of preference between
the least-angle strategy and the initial segment strategy for route selection in
unknown environments. Lecture Notes in Computer Science, 3343 :79 97,
2005. 1.5.4
[58] K. E. Hoff III, J. Keyser, M. Lin, D. Manocha, et T. Culver. Fast computation
of generalized Voronoi diagrams using graphics hardware. Computer Graphics,
33 :277286, 1999. 1.5.2
[59] M. Kallmann, H. Bieri, et D. Thalmann. Fully dynamic constrained delaunay
triangulations. Geometric Modelling for Scientic Visualization, 2003. 1.5.1
[60] M. Kallmann et D. Thalmann. Modeling objects for interaction tasks. Dans
EGCAS, 1998. 2.3.2, 5.7
[61] M. Kallmann et D. Thalmann. Modeling behaviors of interactive objects for
real time virtual environments. Journal of Visual Languages and Computing,
13 :177195, 2002. 2.3.2
[62] Marcello Kallmann, Amaury Aubel, Tolga Abaci, et Daniel Thalmann. Planning
collision free reaching motions for interactive object manipulation and grasping.
Dans Computer Graphics Forum, volume 22, pages 313322, 2003. 2.3.2
274
Bibliographie
[63] Jon Kerridge, Stefan Keller, Tim Chamberlain, et Neil Sumpter. Pedestrian and
Evacuation Dynamics, chapter Collecting Pedestrian Trajectory Data In Real-
time, pages 2739. Springer Berlin Heidelberg, 2005. 1.6.1
[64] Roberta L. Klatzky. Allocentric and egocentric spatial representations : Deni-
tions, distinctions, and interconnections. Dans Spatial Cognition : An Interdis-
ciplinary Approach to Representing and Processing Spatial Knowledge, volume
1404/1998 de Lecture Notes in Computer Science. Springer Berlin / Heidelberg,
1998. 1.1.1
[65] R. E. Korpf. Depth-rst iterative-deepening : An optimal admissible tree search.
Articial intelligence, 27(1) :97109, 1985. 1.5.4
[66] J. J. Kuffner. Goal-directed navigation for animated characters using real-time
path planning and control. Lecture Notes in Computer Science, 1537 :171179,
1998. 1.5.2
[67] R. Kulpa, F. Multon, et B. Arnaldi. Specic representation of motions for
interactive animation with several characters. Computer Graphics Forum,
24(3) :343352, 2005. 6.1.1, 7.1
[68] T. I. Lakoba, D. J. Kaup, et N. M. Finkelstein. Modications of the helbing-
molnr-farkas-vicsek social force model for pedestrian evolution. Simulation,
81(5) :339352, 2005. 1.4.1
[69] F. Lamarche et S. Donikian. Automatic orchestration of behaviours through
the management of resources and priority levels. Dans Proceedings of the
First International Joint Conference on Autonomous Agents and Multiagent Sys-
tems (AAMAS02), dit par Maria Gini, Toru Ishida, Cristiano Castelfranchi, et
W. Lewis Johnson, pages 13091316. ACM Press, Juillet 2002. 2.2.1, 2.3.3
[70] F. Lamarche et S. Donikian. Crowds of virtual humans : a new approach for real
time navigation in complex and structured environments. Computer Graphics
Forum, Eurographics04, 2004. 1.4.2, 1.5.1, 1.5.1, 1.5.1, 2.2.1, 4.1.1, 6.1.1
[71] Fabrice Lamarche. Humanode virtuels, raction et cognition : une architecture
pour leur autonomie. Thse de Doctorat, I.F.S.I.C., Universit de Rennes I,
IRISA-INRIA, Campus de Beaulieu, 35042 Rennes cedex, France, dcembre
2003. 1.5.1, 4.2.2
[72] Emmanuel Lardeux. La Modlisation des Mouvements de Foule. Thse de Doc-
torat, U.F.R. Mathmatiques et Informatique, Universit de Rennes I, septembre
1992. 1.3.6
[73] J.-C. Latombe. Robot Motion Planning. Boston : Kluwer Academic Publishers,
Boston, 1991. 1.5
[74] J. R. E. Lee et R. Watson. Regards et habitudes des passants, volume 57-58 de
Les annales de la recherche urbaine. 1992. 1.1.2
[75] Jed Lengyel, Mark Reichert, Bruce R. Donald, et Donald P. Greenberg. Real-
time robot motion planning using rasterizing computer graphics hardware. Dans
SIGGRAPH 90 : Proceedings of the 17th annual conference on Computer gra-
phics and interactive techniques, pages 327335. ACM Press, 1990. 1.5.4
[76] Loc Letreust. Dveloppement doutils pour lanalyse du mouvement piton.
Rapport de DEA, sous la direction de Julien Pettr, Equipe de recherche Bun-
raku, 2007. E
275
Bibliographie
[77] B. Logan et N. Alechina. A* with bounded costs. Dans Proceedings of the
Fifteenth National Conference on Articial Intelligence (AAAI-98), pages 444
449, 1998. 1.5.4
[78] Robert G. Lord et P. E. Levy. Moving from cognition to action : A control
theory perspective. Applied Psychology : an internationnal review, 43(3) :335
398, 1994. 2.1.1
[79] Cline Loscos, David Marchal, et Alexandre Meyer. Intuitive crowd behaviour
in dense urban environments using local laws. Dans TPCG 03 : Proceedings
of the Theory and Practice of Computer Graphics 2003, page 122, Washington,
DC, USA, 2003. IEEE Computer Society. 1.4.2, 1.4.3
[80] David J.C. MacKay. Information Theory, Inference and Learning Algorithms.
Cambridge University Press, 2003. 2.2.1
[81] P. Maes. Situated agents can have goals. Dans Designing Autonomous Agents,
dit par Patti Maes, pages 4970. MIT Press, 1990. 2.2.2
[82] H. A. Mallot. Behavior-oriented approaches to cognition : Theoretical perspec-
tives. Theory in biosciences, 116 :196200, 1997. 2.1.1
[83] Hanspeter A. Mallot. Spatial cognition : Behavioral competences, neural me-
chanisms and evolutionary scaling. Kognitionswissenschaft, 8(1) :4048, 1999.
2.1.1
[84] J. McCarthy et P. J. Hayes. Some philosophical problems from the standpoint
of articial intelligence. Dans Machine Intelligence 4, dit par B. Meltzer
et D. Michie, pages 463502. Edinburgh University Press, 1969. reprinted in
McC90. 2.2.2
[85] S. J. Melinek et S. Booth. An analysis of evacuation times from buildings. Dans
CIB Symposium on the control of smoke movement in building res, Watford,
U.K., 1975. Building research establishment, Fire research station. 1.3.4
[86] Joseph S. Milazzo, Nagui M. Rouphail, Joseph E. Hummer, et D. Patrick Al-
len. Quality of service for uninterrupted pedestrian facilities. Dans Highway
Capacity Manual, dit par 78th Annual Meeting of the US Transportation Re-
search Board, Washington, DC, janvier 1999. Transportation Research Board.
1.2.2
[87] George A. Miller. The magical number seven, plus or minus two : Some limits
on our capacity for processing information. Psychological Review, 63 :8197,
1956. 2.1.2
[88] Bernard Moulin, Walid Chaker, Jimmy Perron, Patrick Pelletier, Jimmy Hogan,
et Edouard Gbei. Mags project : Multi-agent geosimulation and crowd simu-
lation. Dans COSIT 2003, dit par Worboys Kuhn, Timpf, Lecture Notes in
Computer Science, pages 151168. Springer Verlag, 2003. 2.4.4, 8.3
[89] Soraia Raupp Musse. Human crowd modelling with various levels of behaviour
control. Thse de Doctorat, EPFL : cole Polytechnique Fdrale de Lausanne,
Lausanne, Suisse, 2000. 1.4.2, 2.4.2
[90] Soraia Raupp Musse, Marcelo Kallmann, et Daniel Thalmann. Level of auto-
nomy for virtual human agents. Dans ECAL 99 : Proceedings of the 5th Eu-
ropean Conference on Advances in Articial Life, pages 345349, London, UK,
1999. Springer-Verlag. 2.4.2
276
Bibliographie
[91] Soraia Raupp Musse et Daniel Thalmann. Hierarchical model for real time si-
mulation of virtual human crowds. IEEE Transactions on Visualization and
Computer Graphics, 7(2) :152164, 2001. 2.4.2
[92] Allen Newell. Unied theories of cognition. Harvard University Press, Cam-
bridge, Massachusetts, 1990. 2.1.1
[93] N.J. Nilsson. Principles of articial intelligence. Springer-Verlag, 1982. 1.5.4
[94] H. Noser et D. Thalmann. Sensor based synthetic actors in a tennis game si-
mulation. Dans Computer Graphics International 97, pages 189198. IEEE
Computer Society Press, 1997. 2.2.1
[95] Daniel OConnor, Jake Pauls, et al. Engineering guide to human behavior in re.
Technical report, Society of Fire Protection Enginners (SFPE), tats-Unis, aot
2002. 1.3.6
[96] Toshihiro Osaragi. Modeling of pedestrian behavior and its applications to spa-
tial evaluation. Dans AAMAS 04 : Proceedings of the Third International Joint
Conference on Autonomous Agents and Multiagent Systems, pages 836843,
Washington, DC, USA, 2004. IEEE Computer Society. 1.5.4
[97] M. H. Overmars. Recent developments in motion planning. Dans International
Conference on Computational Science (3), pages 313, 2002. 1.5.2
[98] Sbastien Paris, Julien Pettr, et Stphane Donikian. Pedestrian reactive naviga-
tion for crowd simulation : a predictive approach. Computer Graphics Forum,
Eurographics07, 2007. 7.1
[99] Sbastien Paris, Stphane Donikian, et Nicolas Bonvalet. Towards more realistic
and efficient virtual environment description and usage. Dans First International
Workshop on Crowd Simulation (V-Crowds05). VRlab, EPFL, nov 2005. 4.1
[100] Sbastien Paris, Stphane Donikian, et Nicolas Bonvalet. Environmental abs-
traction and path planning techniques for realistic crowd simulation. Computer
Animation and Virtual Worlds, 17 :325335, 2006. 4.1
[101] Amit Patel. Amits game programming information. Web Site, 2007.
http://theory.stanford.edu/~amitp/GameProgramming/
AStarComparison.html. 1.20, 1.21
[102] Jake Pauls. Evacuation and other safety measures in high-rise buildings. vo-
lume 81, chapter 1, pages 528534. ASHRAE Transactions, 1975. 1.3.5
[103] Jake Pauls. Development of knowledge about means of egress. Dans Fire tech-
nology, volume 20, chapter 2, pages 2840. mai 1984. 1.3.5
[104] Jake Pauls. The movement of people in buildings and design solutions for means
of egress. Dans Fire technology, volume 20, chapter 1, pages 2740. Springer
Netherlands, fvrier 1984. 1.3.5
[105] Nuria Pelechano et Norman I. Badler. Modeling crowd and trained leader be-
havior during building evacuation. IEEE Comput. Graph. Appl., 26(6) :8086,
2006. 1.4.1
[106] I. Peschl. Passage capacity of door opennings in panic situations. BAUN,
26(2) :6267, 1971. 1.4.1
[107] Lloyd R. Peterson et Margaret J. Peterson. Short-term retention of individiual
verbal items. Journal of Experimental Psychology, 58 :193198, 1959. 2.1.2
277
Bibliographie
[108] Julien Pettr, Pablo de Heras Ciechomski, Jonathan Mam, Barbara Yersin, Jean-
Paul Laumond, et Daniel Thalmann. Real-time navigating crowds : scalable si-
mulation and rendering. Computer Animation and Virtual Worlds, 17(3-4) :445
455, 2006. 1.5.2
[109] J. Pettr, J.-P. Laumond, et T. Simon. A 2-stages locomotion planner for digital
actors. Dans Proc. of the 2003 ACM SIGGRAPH/Eurographics Symposium on
Computer Animation (SCA03), pages 258264, 2003. 1.5.2
[110] Elizabeth A. Phelps. The Nature of Cognition, chapter Brain versus Behavioral
Studies of Cognition, pages 295322. The MIT Press, 1999. 2.1
[111] Abishai Polus, Joseph Schofer, et Ariela Ushpiz. Pedestrian Flow and Level of
Service, volume 109(1) de Journal of Transportation Engineering, pages 4556.
American Society of Civil Engineers, janvier 1983. 1.2.2
[112] V. M. Predtechenskii et A. I. Milinskii. Planning for foot trafc ow in buil-
dings. Amerind Publishing CO Pvt Ltd, New Dehli, India, National Bureau of
Standards edition, 1978. 1.3.6
[113] N. Pronost, G. Dumont, G. Berillon, et G. Nicolas. Morphological and stance
interpolations in database for simulating bipedalism of virtual humans. The
Visual Computer, 22(1) :413, janvier 2006. (document)
[114] Puskarev et Zupan. Public transit and land use planning. Indiana University
Press, janvier 1977. 1.2.2
[115] A. S. Rao et M. P. Georgeff. Modeling rational agents within a BDI-architecture.
Dans Proceedings of the 2nd International Conference on Principles of Know-
ledge Representation and Reasoning (KR91), dit par James Allen, Richard
Fikes, et Erik Sandewall, pages 473484. Morgan Kaufmann publishers Inc. :
San Mateo, CA, USA, 1991. 2.2.2
[116] A. S. Rao et M. P. Georgeff. BDI-agents : from theory to practice. Dans Procee-
dings of the First Intl. Conference on Multiagent Systems, San Francisco, 1995.
2.2.2
[117] B. Reich, H. Ko, W. Becket, et N. I. Badler. Terrain reasoning for human loco-
motion. Dans Computer Animation, pages 9961005. IEEE, 1994. 1.5.3
[118] Marc Relieu. Voir et se mouvoir en marchant dans la ville. Dans Le courrier du
CNRS : Villes, pages 107109. CNRS, 1996. 1.1.2
[119] Marc Relieu et Louis Qur. Les risques urbains : Acteurs, systmes de prven-
tion, chapter Mobilit, perception et scurit dans les espaces urbains. Anthro-
pos : Collection ville. 1998. 1.1.2
[120] O. Renault, N. Thalmann, et D. Thalmann. A vision-based approach to behavio-
ral animation. Visualization and Computer Animation, 1 :1821, 1990. 2.2.1
[121] C. W. Reynolds. Flocks, herds, and schools : A distributed behavioral model.
Computer Graphics, 21(4) :2534, 1987. 1.4.2, 2.2.1
[122] Roger C. Schanck. The fourteen primitive actions and their inferences. Internal
Memo of the Stanford Articial Intelligence Laboratory, mars 1973. 2.3.3
[123] T. Shallice. Specic Impairments of Planning. Royal Society of London Philo-
sophical Transactions Series B, 298 :199209, juin 1982. 2.1.2
[124] Wei Shao et Demetri Terzopoulos. Autonomous pedestrians. Dans SCA 05 :
Proceedings of the 2005 ACM SIGGRAPH/Eurographics symposium on Com-
puter animation, pages 1928, New York, NY, USA, 2005. ACM Press. 1.4.2,
1.5.2, 1.5.4, 2.2.1
278
Bibliographie
[125] Stylianou Soteris et Chrysanthou Yiorgos. Crowd self-organization, streaming
and short path smoothing. WSCG, 14, January 2006. 1.4.3
[126] L.R. Squire et N.J Cohen. Neurobiology of Learning and Memory, chapter Hu-
man memory and amnesia, pages 364. Guilford Press, 1984. 2.1.2
[127] Sibylle D. Steck et Hanspeter A. Mallot. The role of global and local land-
marks in virtual environment navigation. Presence : Teleoperators and Virtual
Environments, 9(1) :6983, 2000. 1.1.2
[128] G. Keith Still. Crowd Dynamics. Thse de Doctorat, University of Warwick,
Department of Mathematics, aot 2000. (document), 1.8, 1.6.2
[129] K. Takahashi, T. Tanaka, et S. Kose. An evacuation model for use in re safety
design of buildings. Dans Fire Safety Science Proceedings of the Second Inter-
national Symposium, pages 551560, Tokyo, juin 1988. Hemisphere Publishing
Company, New York. 1.3.7
[130] Yordphol Tanaboriboon et Jocelyn A. Guyano. Level of service standards for
pedestrian facilities in bangkok : A case study. ITE Journal, novembre 1989.
1.2.2
[131] F. Tecchia et Y. Chrysanthou. Real time rendering of densely populated urban
environments. Dans RenderingTechniques 00 (10th EurographicsWorkshop on
Rendering), pages 4556, Brno, Czech Republic, 2000. Springer-Verlag. 1.5.2
[132] Franco Tecchia, Cline Loscos, et Yiorgos Chrysanthou. Visualizing crowds in
real-time. Computer Graphics Forum, 21(4) :753765, 2002. 1.5.2
[133] Kardi Teknomo, Yasushi Takeyama, et Hajime Inamura. Determination of pe-
destrian ow performance based on video tracking and microscopic simula-
tions. Dans Proceedings of Infrastructure Planning Conference, volume 23,
pages 639642, 2000. 1.6.2
[134] Kardi Teknomo, Yasushi Takeyama, et Hajime Inamura. Measuring microscopic
ow performance for pedestrians. Dans Proceeding of the 9th World Conference
on Transport Research, 2001. 1.6.2
[135] Kardi Teknomo, Yasushi Takeyama, et Hajime Inamura. Tracking system to
automate data collection of microscopic pedestrian trafc ow. Dans Proceeding
of The 4th Eastern Asia Society For Transportation Studies, volume 3, pages 11
25, 2001. 1.6.1
[136] Romain Thomas et Stphane Donikian. A navigation architecture for agents
based on a human-like memory and cognitive map model. Dans Computer Ani-
mation and Social Agents, dit par Nadia Magnenat-Thalmann, Dinesh Pai,
Ana Paiva, et Enhua Wu, pages 8393. Computer Graphics Society, 2006. 1.1.1
[137] S. Thrun et A. Bcken. Integrating grid-based and topological maps for mobile
robot navigation. Dans Proc. of the AAAI Thirteenth National Conference on
Articial Intelligence, pages 944951. AAAI Press / MIT Press, 1996. 1.5.2
[138] K. Togawa. Study on re escapes based on observations of multitude currents.
Technical report, Ministry of construction, 1955. 1.3.3, 1.4.1, 7.2
[139] Ariane Tom et Michel Denis. Referring to landmark or street information in
route directions : What difference does it make ? Dans Spatial Information
Theory, volume 2825/2003, pages 362374. Springer Berlin / Heidelberg, 2003.
1.1.2
279
Bibliographie
[140] Transportation Research Board, Washington, DC. Highway Capacity Manual,
2000. 1.2.2
[141] Adrien Treuille, Seth Cooper, et Zoran Popovi c. Continuum crowds. Dans
SIGGRAPH 06 : ACM SIGGRAPH 2006 Papers, pages 11601168, New York,
NY, USA, 2006. ACM Press. 1.4.3, 1.5.3
[142] M. van de Panne et E. Fiume. Sensor-actuator networks. Dans Computer Gra-
phics (SIGGRAPH 93 Proceedings), dit par James T. Kajiya, volume 27,
pages 335342, Aot 1993. 2.2.1
[143] Paul Vogt. The physical symbol grounding problem. Cognitive Systems Re-
search, 3(3) :429457, 2002. 2.1.2
[144] David Waller, Jack M. Loomis, Reginald G. Golledge, et Andrew C. Beall. Place
learning in humans : The role of distance and direction information. Spatial
Cognition and Computation, 2(4) :333354, 2002. 1.1.1
[145] W.H. Warren. Handbook of perception and cognition : Perception of Space and
Motion, chapter Self-Motion : Visual Perception and Visual Control, pages 263
325. Academic Press, 1995. 1.1.2, 2.1.2
[146] Karl F. Wender, Daniel Haun, Bjrn Rasch, et Matthias Blmke. Context effects
in memory for routes. Dans Spatial Cognition III, volume 2685/2003 de Lecture
Notes in Computer Science. Springer Berlin / Heidelberg, 2003. 1.1.1
[147] Jan M. Wiener et Hanspeter A. Mallot. ne-to-coarse route planning and
navigation in regionalized environments. Spatial Cognition & Computation,
3(4) :331358, 2003. 1.1.1, 1.1.2
[148] A. Yahja, A. Stentz, S. Singh, et B. L. Brumitt. Framed-quadtree path planning
for mobile robots operating in sparse environnements. Dans IEEE Conference
on Robotics and Automation (ICRA), Leuven, Belgium, Mai 1998. 1.5.2
[149] T. Ziemke. Introduction to the special issue on situated and embodied cognition.
Cognitive Systems Research, 3 :271274, 2002. 2.1.2
280
Table des gures
1 Variation dafuence dans un lieu dchange . . . . . . . . . . . . . . 1
2 Exemples dinteractions dans une gare . . . . . . . . . . . . . . . . . 2
3 Deux logiciels commerciaux danalyse des foules . . . . . . . . . . . 3
tat de lart
1.1 Reprsentation mentale hirarchique pour la planication de chemin . 12
1.2 Aire de Goffman . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3 Reprsentation des diffrents niveaux de service. . . . . . . . . . . . 15
1.4 Relation en densit de personnes et vitesse/dbit . . . . . . . . . . . . 16
1.5 Comparaison de plusieurs niveaux de services . . . . . . . . . . . . . 19
1.6 Vitesse de progression le long dune circulation horizontale. . . . . . 27
1.7 Dpendance entre le dbit unitaire, la densit, et le type dun passage. 28
1.8 Dcompositions dune pice en units. . . . . . . . . . . . . . . . . . 30
1.9 vacuation dune pice encombre. . . . . . . . . . . . . . . . . . . 31
1.10 vacuation dune pice dgage. . . . . . . . . . . . . . . . . . . . . 31
1.11 Modle de particules . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.12 Les trois rgles comportementales du modles Flocks of Boids . . . . 35
1.13 Modle prdictif de navigation de F. Feurtey. . . . . . . . . . . . . . 36
1.14 Exemple de triangulation de Delaunay . . . . . . . . . . . . . . . . . 40
1.15 Triangulations de Delaunay ltres . . . . . . . . . . . . . . . . . . . 40
1.16 Exemple de grilles rgulires . . . . . . . . . . . . . . . . . . . . . . 42
1.17 Utilisation de grille en animation. . . . . . . . . . . . . . . . . . . . 42
1.18 Exemple de carte de cheminement . . . . . . . . . . . . . . . . . . . 43
1.19 Exemple de carte de champs de potentiels . . . . . . . . . . . . . . . 44
1.20 Lalgorithme de Dijkstra . . . . . . . . . . . . . . . . . . . . . . . . 46
1.21 Lalgorithme A

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.22 Analyse du rel par exprience contrle. . . . . . . . . . . . . . . . 50
1.23 Analyse du rel par observations. . . . . . . . . . . . . . . . . . . . . 50
1.24 Comparaison rel/simul . . . . . . . . . . . . . . . . . . . . . . . . 51
2.1 Boucles de rtroaction . . . . . . . . . . . . . . . . . . . . . . . . . 56
281
Table des gures
2.2 Hirarchisation des comportements . . . . . . . . . . . . . . . . . . . 57
2.3 Modle de mmoire en 3 parties . . . . . . . . . . . . . . . . . . . . 59
2.4 Principe de la slection daction . . . . . . . . . . . . . . . . . . . . 65
2.5 Exemple de Smart Object . . . . . . . . . . . . . . . . . . . . . . . . 71
2.6 Processus de planication avec les Smart Object. . . . . . . . . . . . 71
2.7 Dlgation de tches avec les Smart Object . . . . . . . . . . . . . . 72
2.8 Interactions avec STARFISH . . . . . . . . . . . . . . . . . . . . . . 73
2.9 Les 3 couches du modle de S. Goldenstein . . . . . . . . . . . . . . 74
2.10 Exemple de comportement de groupe . . . . . . . . . . . . . . . . . 76
2.11 Architecture du modle multi-couche bas sur les motions. . . . . . 77
2.12 Gestion de la perception et reprsentation des connaissances dans le
systme MAGS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.13 Visualisation en sortie du systme MAGS. . . . . . . . . . . . . . . . 79
Contributions
3.1 Relations de dclaration entre les concepts de BIIO. . . . . . . . . . . 95
3.2 Relations dexcution entre les concepts de BIIO. . . . . . . . . . . . 95
3.3 Diagramme de spcialisation des ressources . . . . . . . . . . . . . . 96
3.4 Diagramme de spcialisation des objets interactifs . . . . . . . . . . . 97
3.5 Diagramme de spcialisation des zones dancrage . . . . . . . . . . . 97
3.6 Diagramme de spcialisation des les dattente . . . . . . . . . . . . 99
3.7 Diagramme de spcialisation des les dutilisation . . . . . . . . . . . 99
3.8 Exemple de description hirarchique dune affordance . . . . . . . . 102
3.9 Exemple dunication daffordances . . . . . . . . . . . . . . . . . . 102
3.10 Exemple denchanement rationnel daffordances . . . . . . . . . . . 104
3.11 Linteracteur dans larchitecture BIIO . . . . . . . . . . . . . . . . . 106
3.12 Exemple dordonnancement de tches cognitives . . . . . . . . . . . 110
3.13 Leffecteur dans larchitecture BIIO . . . . . . . . . . . . . . . . . . 111
4.1 Subdivision spatiale pralable labstraction. . . . . . . . . . . . . . 116
4.2 Graphe topologique extrait de la subdivision. . . . . . . . . . . . . . 117
4.3 Alas gomtriques se rpercutant sur la subdivision. . . . . . . . . . 118
4.4 Droulement de la premire abstraction. . . . . . . . . . . . . . . . . 121
4.5 Droulement de la seconde abstraction. . . . . . . . . . . . . . . . . 121
4.6 Abstraction dun environnement rel. . . . . . . . . . . . . . . . . . 122
4.7 Congurations du nud orient. . . . . . . . . . . . . . . . . . . . . 123
4.8 Grille oriente sur un cas de test. . . . . . . . . . . . . . . . . . . . . 126
4.9 Calcul dun PVS sur un cas de test. . . . . . . . . . . . . . . . . . . . 127
4.10 Reprsentation dun PVS sur un cas rel. . . . . . . . . . . . . . . . . 127
4.11 Dfaut du calcul de densit globale. . . . . . . . . . . . . . . . . . . 128
4.12 Mthode de calcul des densits locales. . . . . . . . . . . . . . . . . 129
282
Table des gures
4.13 Intgration dun objet obstacle statique lenvironnement . . . . . . . 131
4.14 Intgration dun objet traversable statique lenvironnement . . . . . 132
4.15 Potentiel de visibilit dynamiques . . . . . . . . . . . . . . . . . . . 133
5.1 Lhumanode dans larchitecture BIIO . . . . . . . . . . . . . . . . . 136
5.2 La pyramide comportementale . . . . . . . . . . . . . . . . . . . . . 136
5.3 change dinformations dans la pyramide comportementale . . . . . . 137
5.4 Processus dobservation bas sur les PVS. . . . . . . . . . . . . . . . 139
5.5 Donnes observes dans lenvironnement. . . . . . . . . . . . . . . . 140
5.6 Gestion de la connaissance topologique. . . . . . . . . . . . . . . . . 141
5.7 Planication de chemin hirarchique. . . . . . . . . . . . . . . . . . . 145
5.8 Lgende utilise pour les facteurs de planication de chemin. . . . . . 150
5.9 Facteur de distance lors de la planication de chemin. . . . . . . . . . 151
5.10 Facteur de largeur du chemin. . . . . . . . . . . . . . . . . . . . . . . 152
5.11 Facteur de direction courante le long du chemin. . . . . . . . . . . . . 152
5.12 Facteur de direction vers la destination. . . . . . . . . . . . . . . . . 154
5.13 Exemple de chemin avec interaction mergeante. . . . . . . . . . . . 156
5.14 Optimisation visuelle dun chemin. . . . . . . . . . . . . . . . . . . . 157
5.15 Extrapolation des dplacements dans le temps et lespace. . . . . . . . 162
5.16 Dtection des collisions sur un cas simple. . . . . . . . . . . . . . . . 163
5.17 Vue densemble et intgration de la navigation ractive. . . . . . . . . 164
5.18 Discrtisation du temps pour une entit voisine dynamique. . . . . . . 167
5.19 Quantication des espaces-temps des collisions. . . . . . . . . . . . . 168
5.20 Discrtisation de lespace pour les obstacles statiques. . . . . . . . . . 169
5.21 Discrtisation dune entit attractive dynamique. . . . . . . . . . . . . 171
5.22 Facteur de direction pour la navigation. . . . . . . . . . . . . . . . . 173
5.23 Intersection des quartiers se recouvrant dans lespace. . . . . . . . . . 176
5.24 Fusion des intervalles de vitesses pour deux quartiers. . . . . . . . . . 177
5.25 Prise de dcision lors de la navigation. . . . . . . . . . . . . . . . . . 178
5.26 Automate observer . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
5.27 Automate se dplacer . . . . . . . . . . . . . . . . . . . . . . . . . . 182
5.28 Vue densemble des changements de mode dinteraction . . . . . . . 183
5.29 Gestion des affordances par lhumanode . . . . . . . . . . . . . . . . 187
5.30 Gestion des tches cognitives par lhumanode . . . . . . . . . . . . . 188
5.31 Automate se comporter . . . . . . . . . . . . . . . . . . . . . . . . . 189
Rsultats
6.1 Les deux modles complmentaires utiliss. . . . . . . . . . . . . . . 200
6.2 Larchitecture logicielle de simulation. . . . . . . . . . . . . . . . . . 201
6.3 Module de cration dobjets BIIO. . . . . . . . . . . . . . . . . . . . 202
283
Table des gures
6.4 Import dun environnement de simulation. . . . . . . . . . . . . . . . 204
6.5 Conguration gnrale dune simulation. . . . . . . . . . . . . . . . . 205
6.6 Conguration des populations. . . . . . . . . . . . . . . . . . . . . . 206
6.7 Conguration des trains. . . . . . . . . . . . . . . . . . . . . . . . . 207
6.8 Conguration des donnes dexploitation. . . . . . . . . . . . . . . . 207
6.9 Conguration des interactions. . . . . . . . . . . . . . . . . . . . . . 208
6.10 Contrle de la vitesse dexcution. . . . . . . . . . . . . . . . . . . . 209
6.11 Deux vues dans la restitution 3D de la simulation. . . . . . . . . . . . 209
6.12 Vue approfondie dun objet de simulation. . . . . . . . . . . . . . . . 210
6.13 Rsultats sous forme de graphiques. . . . . . . . . . . . . . . . . . . 212
6.14 Rsultats sous forme de cartes. . . . . . . . . . . . . . . . . . . . . . 213
7.1 Protocole exprimental bas sur la capture de mouvements. . . . . . . 216
7.2 Protocole exprimental deux participants. . . . . . . . . . . . . . . 216
7.3 Rsultats dune exprience deux participants. . . . . . . . . . . . . 217
7.4 Phnomnes macroscopiques avec le modle de navigation. . . . . . . 219
7.5 Situations simules pour lextraction de courbes densit/vitesse. . . . 221
7.6 Courbes densit / vitesse du modle de navigation. . . . . . . . . . . 222
8.1 Frquences de rafrachissement de lhumain virtuel. . . . . . . . . . . 226
8.2 Comparaison des temps dexcution de lhumain virtuel. . . . . . . . 228
Annexes
A.1 Exemple dexcution hirarchique daffordances . . . . . . . . . . . 242
C.2 Automate interagir . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
C.3 Automate utilisation possible . . . . . . . . . . . . . . . . . . . . . . 247
C.4 Automate recherche active . . . . . . . . . . . . . . . . . . . . . . . 248
C.5 Automate utilisation active . . . . . . . . . . . . . . . . . . . . . . . 250
C.6 Automate attente active . . . . . . . . . . . . . . . . . . . . . . . . . 251
C.7 Automate recherche ractive . . . . . . . . . . . . . . . . . . . . . . 252
C.8 Automate utilisation ractive . . . . . . . . . . . . . . . . . . . . . . 254
C.9 Automate utiliser . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
D.1 Ressources du voyageur au dpart. . . . . . . . . . . . . . . . . . . . 258
D.2 Procdure comportementale du voyageur au dpart. . . . . . . . . . . 259
E.1 Expriences impliquant des foules dindividus. . . . . . . . . . . . . 269
284
Liste des tableaux
tat de lart
1.1 Les niveaux de services de J.J. Fruin. . . . . . . . . . . . . . . . . . . 15
1.2 Les niveaux de services du HCM. . . . . . . . . . . . . . . . . . . . 17
1.3 Les niveaux de services de Puskarev et Zupan. . . . . . . . . . . . . . 17
1.4 Les niveaux de services de W. Brilon . . . . . . . . . . . . . . . . . . 18
1.5 Les niveaux de services de Polus et al. . . . . . . . . . . . . . . . . . 18
1.6 Les niveaux de services de Tanaboriboon et Guyano. . . . . . . . . . 18
1.7 Catgories des tablissements publics. . . . . . . . . . . . . . . . . . 20
1.8 Caractristiques moyennes de tailles de diverses populations. . . . . . 21
1.9 Surfaces projetes pour diffrents types de population . . . . . . . . . 26
Annexes
C.1 Exemples de concurrence entre tches dinteraction. . . . . . . . . . . 256
285
Liste des Algorithmes
Contributions
1 valuation du chemin intermdiaire par parties . . . . . . . . . . . . 146
2 Exploration avec condition darrt oue . . . . . . . . . . . . . . . . 149
3 Suivre le chemin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
Annexes
4 Laffordance prendre le train . . . . . . . . . . . . . . . . . . . . . . 260
5 Laffordance acheter un ticket . . . . . . . . . . . . . . . . . . . . . 261
6 Laffordance changer un ticket . . . . . . . . . . . . . . . . . . . . 261
7 Laffordance composter son ticket . . . . . . . . . . . . . . . . . . . 262
8 Laffordance lire le tableau des dparts . . . . . . . . . . . . . . . . 262
287
Quelques chiffres
Voici quelques chiffres relatifs ces travaux :
4 ans de thse ;
308 pages de manuscrit de thse ;
5 publications, dont 2 revues internationales, 1 revue nationale, 1 article international,
et 1 poster international ;
1 projet de lAgence Nationale de la Recherche dmarr (SIMULEM) ;
1 outil de simulation passant en phase dexploitation ;
19 modules (packages) interdpendants pour lensemble des modles de simulation ;
1317 chiers sources pour le dveloppement et le test des modles, dont 772 chiers h,
516 chiers cpp et 29 chiers ui ;
252 000 lignes de codes environ (avec documentation Doxygen) pour le dveloppe-
ment et le test des modles ;
18 ingnieurs mois pour le dveloppement des interfaces homme/machine et le portage
Linux/Windows, rpartis entre 2 ingnieurs ;
307 chiers sources pour les interfaces, dont 136 chiers h, 127 chiers cpp et 44
chiers ui ;
32 000 lignes de codes environ (avec documentation Doxygen) pour les interfaces ;
12 200 ajouts et mises jours subversion ;
0 humain virtuel bless pendant la ralisation des dmonstrations ;
3 stagiaires de master, dont 1 ayant particip llaboration de BIIO, et 2 ayant utilis
les modles.
289
Caractrisation des niveaux de services et modlisation
des circulations de personnes dans les lieux dchanges
Simuler les circulations de personnes dans des environnements publics est un pro-
blme complexe, faisant intervenir des domaines varis tels que la psychologie, la so-
ciologie, la biomcanique, ou larchitecture. Ce sujet gagne encore en complexit pour
les lieux dchanges tels que des gares ferroviaires, o les logiques de dplacement sont
intimement lies aux procdures comportementales des individus. Notre solution per-
met tout dabord la description dun environnement de simulation : sa gomtrie, sa to-
pologie, et les quipements quil contient. Une multitude dagents autonomes modlise
ensuite les usagers, avec des capacits de dcision individuelles : comportements rac-
tifs, tels que lobservation ou lvitement de collision prdictif, base de connaissances
lie lenvironnement, ainsi que processus cognitifs et pseudo-rationnels. Lintgration
de nos modles dans une application ddie nous permet enn de dmontrer la qualit
de notre approche. Les rsultats se prsentent la fois sous la forme dune animation
3D interactive, et de diffrents niveaux de services, allant de cartes de densits ou de
vitesses, des graphiques dafuence.
Mots cls : Simulation de foule, Animation comportementale, Environnement in-
form, Navigation ractive, Planication de chemin, Niveaux de services
Characterization of the levels of services and modeling
of the movements of people inside exchange areas
Simulating the movements of people in public environments is a complex problem,
based on various domains such as sociology, psychology, biomechanics, or architec-
ture. This topic still gains in complexity for exchange areas such as train stations,
which impose logics of circulation closely related to individual behavioural procedures.
We propose in this thesis a complete architecture allowing to simulate the activity of
crowds of people in such environments. Our solution rst allows the description of
a simulation environment: its geometry, its topology, and the equipments it contains.
A multitude of autonomous agents are used to represent the users. They can make
their own decisions thanks to individual processes: reactive behaviours, such as ob-
servation or predictive navigation, knowledge database related to the environment, and
cognitive and pseudo-rational behaviours. The integration of our models in a dedicated
application nally shows the quality of our approach. The results are presented by an
interactive 3D animation, and various levels of services, like densities of people and
speeds maps, or graphs of ows of people.
Keywords: Crowd simulation, Behavioral animation, Informed environment, Reac-
tive navigation, Path planning, Levels of services

Você também pode gostar