Escolar Documentos
Profissional Documentos
Cultura Documentos
o
dordre: 3594
THSE
Prsente devant
lUniversit de Rennes 1
pour obtenir
le grade de : DOCTEUR DE LUNIVERSIT DE RENNES 1
Mention INFORMATIQUE
par
Sbastien PARIS
quipe daccueil : Bunraku - IRISA
cole Doctorale : Matisse
Composante universitaire : IFSIC
Titre de la thse :
Caractrisation des niveaux de services
et modlisation des circulations de personnes
dans les lieux dchanges
soutenue le 10 octobre 2007 devant la commission dexamen
M. : Daniel HERMAN Prsident
MM. : Daniel THALMANN Rapporteurs
Bernard MOULIN
MM. : Cline LOSCOS Examinateurs
Jean-Louis BERROU
M. : Nicolas BONVALET Invit
M. : Stphane DONIKIAN Directeur
Les aptitudes du systme humain percevoir et identier un dbit
lev de donnes sensorielles shuntent pour la plupart lapprhen-
sion verbale et analytique. Nous sommes gnralement conscients
dune reconnaissance cognitive aprs les faits. Dans cette pers-
pective, ce que nous entendons par conscience doit tre considr
comme une aptitude rexe danalyse dont les applications sont
assez limites.
Frank Herbert, Destination : vide, 1966
iii
Remerciements
Jai volu plus de quatre ans lIRISA, au sein de lquipe SIAMES puis Bunraku, sa
nouvelle dnomination. Le temps pass (trop vite) au sein de cette quipe a marqu un
tournant de ma vie, tant professionnelle que personnelle. Laboutissement de ces quatre
ans consiste certes en lobtention de mon diplme, mais aussi en lassouvissement de
ma passion quest ltude et la modlisation du comportement humain, et enn en la
cration de certaines amitis qui, je lespre, perdureront encore longtemps.
Je tiens en premier lieu remercier mon directeur de thse scientique Stphane Doni-
kian, sans qui ces travaux nauraient jamais vu le jour. Merci tout dabord de mavoir
donn lopportunit de rejoindre lquipe SIAMES il y a plus de 4 ans au cours de mon
stage de DEA. Merci ensuite de mavoir fais conance pour ce projet ambitieux, en me
proposant le sujet de thse le plus passionnant que jaurais pu esprer. Merci ensuite
pour la grande latitude que tu mas laiss durant cette thse, tout en restant disponible
pour en xer les lignes directrices, renforant dautant plus laspect formateur de ce
doctorat. Enn, merci pour ton soutien et ton implication an que cette thse se termine
dans les meilleures conditions possibles. Je souhaite aussi remercier mon directeur de
thse industriel Nicolas Bonvalet, qui a su donner un cadre applicatif des plus motivant
ces travaux. Merci tout dabord davoir rendu ce projet possible, via une collabora-
tion avec lquipe Bunraku. Merci ensuite pour ton implication an de continuer ces
travaux avec le montage du projet SIMULEM. Merci aussi davoir facilit le dialogue
entre le monde informatique et le monde de lurbanisme et de larchitecture. Merci en-
n de mavoir laiss une grande libert concernant la modlisation thorique, tout en
me faisant bncier de lexpertise dAREP quant ltude des ux de personnes.
Je tiens ensuite remercier lensemble des membres de mon jury pour leur prsence le
jour de ma soutenance, dautant plus que certains venaient dassez loin. Ce fut un rel
honneur de prsenter mes travaux devant une assemble aussi prestigieuse quagrable.
Des remerciements personnels ne sont pas de trop. Merci au Professeur Daniel Her-
man davoir accept de prsider mon jury, ainsi que pour son discours logieux la
suite des dlibrations. Votre prsence me t dautant plus honneur que, comme vous
lavez voqu lors de la soutenance, cette thse sera peut-tre la dernire que vous
prsiderez. Merci au Professeur Bernard Moulin davoir rapport ma thse, pour lin-
trt certain quil porte mes travaux, ainsi que pour son apprciation logieuse. Votre
grande sympathie durant les quelques jours que vous avez pass Rennes locca-
sion de ma soutenance tmoigne de votre amabilit. Je tiens aussi vous remercier
tout particulirement pour votre implication an de moffrir un post-doctorat, me per-
mettant ainsi de continuer assouvir ma passion au sein de votre quipe. Merci au
Professeur Daniel Thalmann davoir rapport ma thse, pour son apprciation trs fa-
vorable de mes travaux, et pour ses compliments quant au manuscrit. Jespre que votre
v
Remerciements
venue Rennes fut agrable, et que nous aurons de nouveau loccasion de nous rencon-
trer. Merci au Docteur Cline Loscos davoir particip mon jury, pour sa sympathie
lorsque nous nous sommes rencontrs, et pour ses compliments quant au manuscrit et
la soutenance. Les quelques discussions que nous avons eu furent fort agrables, et
jespre que nous aurons lopportunit den entamer de nouvelles. Merci Monsieur
Jean-Louis Berrou davoir particip mon jury, pour ses compliments quant laccom-
plissement des travaux, ainsi que pour le regard objectif du point de vue industriel quil
a pu apporter. Je suis dsol que vous nayez pu assister la soutenance cause dalas
de transports, et tiens vous remercier pour les avis expriments que vous avez pu
mettre lors des questions du jury.
Je tiens ensuite remercier chaleureusement Fabrice (Babooz) Lamarche pour ces
presque cinq ans passs ses cts dans le "bureau du bonheur". Je ne compte plus
le nombre de discussions, toujours passionnes et parfois endiables, que nous avons
eu. Ces changes ont normment particip laboutissement de mes travaux, tout en
me permettant enn de dialoguer avec quelquun parlant le mme langage que moi
(le C++ bien entendu). Merci aussi pour tes nombreux conseils tout au long de mon
doctorat, et notamment quant la rdaction de ce manuscrit et la prparation de la
soutenance.
Je voudrais aussi remercier particulirement Julien Pettr avec qui jai eu grand plaisir
travailler depuis son arrive dans lquipe. Merci pour ta sympathie et les discus-
sions que nous avons eu quant la simulation de foules et dautres sujets. Merci aussi
pour tes conseils durant la n de ma thse, particulirement concernant la rdaction du
manuscrit et la prparation de la soutenance.
Je tiens ensuite remercier Delphine Lefebvre, notre ingnieur SIMULEM, avec qui ce
fut un plaisir de travailler. Comme je lai souvent dit, ton exprience et tes aptitudes
en dveloppement ont rellement permis de faire de ce projet une application de si-
mulation. Tu as su parfaitement grer des objectifs complexes avec une facilit et une
autonomie dconcertantes. Je te remercie tout particulirement pour les dernires se-
maines de ma thse, o tu as pris en charge llaboration de la dmonstration nale an
de rduire la saturation de mon emploi du temps.
Je voudrais aussi remercier Vincent Delannoy (avec deux n), qui fut lingnieur SIMU-
LEM pendant six mois. Tu dois tre lun des collgues (comme on dit dans le Sud) les
plus sympathiques que je nai jamais eu, tout en tant lun des plus efcaces et impli-
qus dans son travail : je nai eu le plaisir de passer des nuits blanches (de prparation
de dmo) quavec peu de personnes, et pourtant dj deux avec toi...
Je voudrais ensuite remercier plusieurs des omo zukari que je nai pas cit auparavant,
qui font de cette quipe plus quun simple lieu de travail.
Tout dabord, je remercie Bruno Arnaldi dont lesprit danalyse et de critique construc-
tive ont atteint le stade de lgende, et pour sa capacit rester accessible malgr un
agenda en mode ubiquit. Ensuite, je remercie Kadi Bouatouch qui a toujours t trs
amical, de trs bon conseil, et dont les compliments quant mon boulot mont tou-
jours soutenu. Je remercie aussi Georges Dumont pour son esprit aussi dsopilant que
diligent, contribuant faire de cette quipe un endroit si agrable. Je souhaite de plus
remercier Rmi Cozot pour sa sympathie et les discussions que nous avons pu avoir
propos du monde du jeu vido quil connat si bien. Je tiens particulirement vous
remercier tous les quatres pour vos conseils aviss quant la prparation de la soute-
nance de cette thse.
Je voudrais aussi remercier les autres permanents, Thierry Duval pour sa grande sym-
vi
Remerciements
pathie, Alain Chauffaut pour sa disponibilit, Anatole Lecuyer que jai eu le plaisir de
"rencontrer", Valrie Gouranton pour sa bonne humeur, et Yves Bekkers que jai eu le
plaisir de ctoyer durant mon passage Bunraku. Je remercie aussi Anglique Jarnoux,
notre assistante de projet, qui a toujours t agrable et avenante, et qui sest occupe
dorganiser la venue des membres de mon jury.
Dautres membres ou ex-membres de lquipe me sont aussi particulirement chers,
tant devenus des amis au l des ans. Je remercie tout dabord Marwan (KB) pour son
amiti, qui sest forge tout au long de nos annes de thse. Je te remercie de mavoir
fait dcouvrir lart culinaire Libanais, et pour tous les bons moments que nous avons
partags, que ce soit autour dune table de Donj ou dune bibine. Je remercie aussi
Nico (Lo***) [113] (NDA : a cest fait) pour son amiti, qui sest renforce depuis
cette anne lointaine o nous tions en DEA. Je te remercie pour ton attitude de bon
vivant, ton imitation Bretonne du gars du Sud, et pour tous les bons moments que nous
avons partags, le plus souvent autour dune bonne table ou dun bon verre. Je remer-
cie ensuite Nico (Maccione) et sa moiti Flo pour leur amiti, qui sest dveloppe tout
au long des annes passes Bunraku. Je vous remercie pour votre esprit ftard, votre
bonne humeur, et votre franc parl. Jespre que nous nous reverrons bientt, et que
vous comprendrez enn, en vivant en Italie, que le Sud cest quand mme vachement
mieux que la Bretagne... Je remercie aussi Jean-Marie et sa moiti Audrey pour leur
amiti, elle aussi forge durant mes annes de thse. Merci pour votre sympathie, pour
les bons petits plats que vous nous faites, et flicitations pour le petit bonhomme qui
vient juste darriver. Merci de plus Mickal (Norris), dont jai fait la connaissance
lors de mon stage de DEA et que jai eu le plaisir de retrouver la n de mon docto-
rat. Merci pour ton humour rafrachissant, de parler couramment le C++, et de veiller
sur nous grand matre de lunivers. Je remercie de mme Romain pour son amiti
dveloppe durant les trois ans que nous avons pass ensemble dans le "bureau du
bonheur". Merci pour notre diplme de ptanque, et pour tous les bons moments pas-
ss, le plus souvent avec une chope ou un dart la main. Je remercie aussi Vincent Q.
pour son amiti, rapidement forge aprs ton arrive dans Bunraku. Merci pour ton
franc parl dconcertant, ta bonne humeur, et les franches rigolades qui en dcoulent.
Je souhaite aussi remercier Xavier, lminent Yann R. (merci pour lafche de thse),
Yann, et encore Yann, Fabien (PA), Steph, Loc, Benoit, Julien, et Nico, qui participent
tous la bonne humeur qui rgne dans lquipe Bunraku.
Je remercie de plus les lles de la cafet, dont notamment Pirouette et Lolo, dont les
sourires, la bonne humeur, et les cafs mont accompagn durant ces annes de travail
intensif... Je remercie de mme le personnel technique de lIRISA, dont notamment
Alain Crenn (merci pour le DVD de la soutenance), pour leur disponibilit et efcacit.
Je voudrais ensuite remercier ma mre et son ami Jean-Paul davoir assist ma sou-
tenance, en bravant la fracheur Bretonne. Je suis content que vous ayez pu venir, et
espre que vous voyez maintenant un peu plus en quoi a consist ce doctorat.
Finalement, je voudrais grandement remercier la personne qui a le plus compte pour
moi au cours de ces annes de thse, ma moiti Stphanie. Merci davoir support des
horaires de travail si prenants, ma courbe de stress exponentielle, et mon caractre si
facile... Merci pour ton appui, ta gentillesse, et ta comprhension. Merci de mavoir
soutenu dans les moments difciles, et de ttre investie pour me prter main forte.
Merci aussi de tenter laventure au Canada avec moi ; jespre que cela sera aussi pas-
sionnant pour toi que cela devrait ltre pour moi.
vii
Versions
1.11 12 novembre 2007
Dernires corrections avant impression.
1.1 30 octobre 2007
Corrections demandes par les rapporteurs et membres de jury :
Introduction gnrale tendue.
Ajout des comportements bass sur les besoins physiques dans ltat de lart
(Chapitre 2.4.3, page 76).
Changement du titre du chapitre 5, page 135 de Lhumain virtuel en Le
comportement de lhumain virtuel.
Corrections de fautes de typo diverses.
Modications supplmentaires :
Retrait de la prface Pr-version.
Ajout de la prface Remerciements.
Ajout de la prface Versions.
Ajout de la postface Quelques chiffres.
Modication du style de bibliographie de Anglais vers Franais.
Corrections de dnitions multiples de label L
A
T
E
X.
1.01 4 septembre 2007
Modication des rsums pour appliquer les directives de la bibliothque
(1000 caractres au maximum).
1.0 29 juillet 2007
Publication pour membres du jury.
Version complte.
0.9 18 juillet 2007
Dpt pour lcole doctorale MATISSE et lUniversit de Rennes I.
ix
Table des matires
Introduction gnrale 1
I tat de lart 5
Introduction 7
1 tude des circulations de personnes 9
1.1 Le comportement de navigation pitonnier . . . . . . . . . . . . . . . 10
1.1.1 Reprsentation mentale de lenvironnement de navigation . . 10
1.1.2 Processus mentaux de navigation . . . . . . . . . . . . . . . 11
1.1.3 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2 Modles statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.2.1 Approche historique : les niveaux de services de J.J. Fruin . . 14
1.2.2 Autres caractrisations en niveaux de services . . . . . . . . . 16
1.2.3 Lapproche Franaise plus gnrale . . . . . . . . . . . . . . 19
1.2.4 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3 Modles macroscopiques . . . . . . . . . . . . . . . . . . . . . . . . 21
1.3.1 Le modle gazeux . . . . . . . . . . . . . . . . . . . . . . . 21
1.3.2 Le modle hydraulique . . . . . . . . . . . . . . . . . . . . . 21
1.3.3 Le modle de Togawa . . . . . . . . . . . . . . . . . . . . . 22
1.3.4 Le modle de Melinek et Booth . . . . . . . . . . . . . . . . 23
1.3.5 Le modle de Pauls . . . . . . . . . . . . . . . . . . . . . . . 24
1.3.6 Le modle de Predtechenskii et Milinskii . . . . . . . . . . . 26
1.3.7 Le modle de Takahashi, Tanaka, et Kose . . . . . . . . . . . 30
1.3.8 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.4 La navigation ractive . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.4.1 Le modle de particules . . . . . . . . . . . . . . . . . . . . 33
1.4.2 Le modle base de rgles . . . . . . . . . . . . . . . . . . . 35
1.4.3 Un modle gomtrique prdictif . . . . . . . . . . . . . . . 36
1.4.4 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.5 Reprsentation de lenvironnement et recherche de chemin . . . . . . 38
1.5.1 Reprsentations exactes de lenvironnement . . . . . . . . . . 38
1.5.2 Reprsentations approximatives de lenvironnement . . . . . 41
1.5.3 Le modle de champs de potentiels . . . . . . . . . . . . . . 44
1.5.4 Planication de chemin . . . . . . . . . . . . . . . . . . . . . 45
xi
Table des matires
1.5.5 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
1.6 Techniques de validation . . . . . . . . . . . . . . . . . . . . . . . . 49
1.6.1 Analyse du rel . . . . . . . . . . . . . . . . . . . . . . . . . 49
1.6.2 Analyse du simul . . . . . . . . . . . . . . . . . . . . . . . 51
1.6.3 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
1.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2 Modles de comportement 55
2.1 Psychologie du comportement . . . . . . . . . . . . . . . . . . . . . 55
2.1.1 Linteraction au centre du comportement . . . . . . . . . . . 56
2.1.2 Symbolisation des connaissances . . . . . . . . . . . . . . . 57
2.1.3 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.2 Modles de comportement . . . . . . . . . . . . . . . . . . . . . . . 61
2.2.1 Comportement ractif . . . . . . . . . . . . . . . . . . . . . 61
2.2.2 Comportement rationnel . . . . . . . . . . . . . . . . . . . . 64
2.2.3 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.3 Reprsentation des connaissances : les environnements informs . . . 69
2.3.1 Le modle Parameterized Action Representation . . . . . . . 69
2.3.2 Les Smart Objects . . . . . . . . . . . . . . . . . . . . . . . 70
2.3.3 Le modle STARFISH . . . . . . . . . . . . . . . . . . . . . 72
2.3.4 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
2.4 Modles multi-couches . . . . . . . . . . . . . . . . . . . . . . . . . 74
2.4.1 Approche gnrale . . . . . . . . . . . . . . . . . . . . . . . 74
2.4.2 Approche oriente vers les comportements sociaux . . . . . . 75
2.4.3 Approche base sur les motions . . . . . . . . . . . . . . . . 76
2.4.4 Approche grande chelle . . . . . . . . . . . . . . . . . . . 78
2.4.5 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
Discussion 83
II Contributions 87
Introduction 89
3 Les objets interactifs 91
3.1 BIIO : principes de fonctionnement . . . . . . . . . . . . . . . . . . . 91
3.1.1 Constituants . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.1.2 Hritage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.1.3 Introspection . . . . . . . . . . . . . . . . . . . . . . . . . . 93
3.1.4 Automatisation . . . . . . . . . . . . . . . . . . . . . . . . . 93
3.2 Les concepts introduits par BIIO . . . . . . . . . . . . . . . . . . . . 94
3.2.1 Vue densemble . . . . . . . . . . . . . . . . . . . . . . . . . 94
3.2.2 La ressource . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3.2.3 Lobjet physique . . . . . . . . . . . . . . . . . . . . . . . . 96
3.2.4 Les zones dancrage . . . . . . . . . . . . . . . . . . . . . . 97
xii
Table des matires
3.2.5 Les les dattente . . . . . . . . . . . . . . . . . . . . . . . . 98
3.2.6 Les les dutilisation . . . . . . . . . . . . . . . . . . . . . . 99
3.2.7 La tche cognitive . . . . . . . . . . . . . . . . . . . . . . . 100
3.2.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
3.3 Laffordance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
3.3.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
3.3.2 Des concepts dinteraction hirarchiques . . . . . . . . . . . 101
3.3.3 Le rle comportemental de laffordance . . . . . . . . . . . . 103
3.3.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
3.4 Linteracteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
3.4.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
3.4.2 Le gestionnaire daffordances . . . . . . . . . . . . . . . . . 107
3.4.3 Gestion des tches cognitives . . . . . . . . . . . . . . . . . 109
3.4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
3.5 Leffecteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
3.5.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
3.5.2 Gestion des les dattente et dutilisation . . . . . . . . . . . 111
3.5.3 Laffordance spontane . . . . . . . . . . . . . . . . . . . . . 112
3.5.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
3.6 Conclusion et discussion . . . . . . . . . . . . . . . . . . . . . . . . 113
4 Lenvironnement virtuel 115
4.1 La reprsentation topologique . . . . . . . . . . . . . . . . . . . . . 115
4.1.1 Subdivision spatiale informe . . . . . . . . . . . . . . . . . 116
4.1.2 Labstraction topologique . . . . . . . . . . . . . . . . . . . 117
4.1.3 Les nuds conceptuels . . . . . . . . . . . . . . . . . . . . . 122
4.2 Un environnement inform . . . . . . . . . . . . . . . . . . . . . . . 125
4.2.1 Informations statiques . . . . . . . . . . . . . . . . . . . . . 125
4.2.2 Informations dynamiques . . . . . . . . . . . . . . . . . . . . 127
4.3 Intgration des objets interactifs . . . . . . . . . . . . . . . . . . . . 130
4.3.1 Les objets statiques . . . . . . . . . . . . . . . . . . . . . . . 131
4.3.2 Les objets dynamiques . . . . . . . . . . . . . . . . . . . . . 132
4.4 Conclusion et discussion . . . . . . . . . . . . . . . . . . . . . . . . 133
5 Le comportement de lhumain virtuel 135
5.1 Principe gnral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.2 Accder aux informations de lenvironnement . . . . . . . . . . . . . 138
5.2.1 La perception visuelle . . . . . . . . . . . . . . . . . . . . . 138
5.2.2 Base de connaissances . . . . . . . . . . . . . . . . . . . . . 141
5.2.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
5.3 La planication de chemin . . . . . . . . . . . . . . . . . . . . . . . 144
5.3.1 Un algorithme hirarchique . . . . . . . . . . . . . . . . . . 144
5.3.2 Modes de planication globale . . . . . . . . . . . . . . . . . 147
5.3.3 Heuristique multi-critres . . . . . . . . . . . . . . . . . . . 150
5.3.4 Analyse du chemin valu . . . . . . . . . . . . . . . . . . . 155
5.3.5 Rafrachissement de la planication . . . . . . . . . . . . . . 158
xiii
Table des matires
5.3.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
5.4 La navigation ractive . . . . . . . . . . . . . . . . . . . . . . . . . . 160
5.4.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
5.4.2 Slection des entits inuentes . . . . . . . . . . . . . . . . . 164
5.4.3 Prdiction : une discrtisation du temps . . . . . . . . . . . . 165
5.4.4 Quantication des informations de navigation . . . . . . . . . 172
5.4.5 Fusion des informations . . . . . . . . . . . . . . . . . . . . 176
5.4.6 Prise de dcision . . . . . . . . . . . . . . . . . . . . . . . . 177
5.4.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
5.5 Les tches cognitives . . . . . . . . . . . . . . . . . . . . . . . . . . 180
5.5.1 Choix du mode dobservation . . . . . . . . . . . . . . . . . 181
5.5.2 Choix du mode de dplacement . . . . . . . . . . . . . . . . 182
5.5.3 Gestion de linteraction . . . . . . . . . . . . . . . . . . . . . 183
5.5.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
5.6 Le processus de raisonnement . . . . . . . . . . . . . . . . . . . . . 186
5.6.1 Gestion des affordances . . . . . . . . . . . . . . . . . . . . 186
5.6.2 Gestion des tches cognitives . . . . . . . . . . . . . . . . . 187
5.6.3 Intgration gnrale . . . . . . . . . . . . . . . . . . . . . . 188
5.6.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
5.7 Conclusion et discussion . . . . . . . . . . . . . . . . . . . . . . . . 190
Conclusion et perspectives 193
III Rsultats 195
Introduction 197
6 Une architecture logicielle ddie la simulation 199
6.1 Vue densemble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
6.1.1 Les modles utiliss . . . . . . . . . . . . . . . . . . . . . . 199
6.1.2 Larchitecture . . . . . . . . . . . . . . . . . . . . . . . . . . 200
6.2 Dnition des objets de simulation . . . . . . . . . . . . . . . . . . . 201
6.3 Conguration de la simulation . . . . . . . . . . . . . . . . . . . . . 203
6.3.1 Import de lenvironnement de simulation . . . . . . . . . . . 203
6.3.2 Conguration des donnes de simulation . . . . . . . . . . . 204
6.4 Droulement dune simulation . . . . . . . . . . . . . . . . . . . . . 208
6.5 Exploitation des rsultats . . . . . . . . . . . . . . . . . . . . . . . . 211
6.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
7 Validation des rsultats 215
7.1 Validation des logiques de dplacement . . . . . . . . . . . . . . . . 215
7.1.1 tude prcise de lvitement de collision . . . . . . . . . . . 216
7.1.2 tude macroscopique des phnomnes mergeants . . . . . . 218
7.1.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
7.2 Validation des vitesses de dplacement . . . . . . . . . . . . . . . . . 219
7.3 Conclusion et perspectives . . . . . . . . . . . . . . . . . . . . . . . 223
xiv
Table des matires
8 Analyse des performances dexcution 225
8.1 Frquences de rafrachissement . . . . . . . . . . . . . . . . . . . . . 226
8.2 Temps dexcution . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
8.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
Conclusion et perspectives 231
Conclusion et perspectives gnrales 233
Annexes 239
A Ordonnancement des affordances 241
B Smantique des automates 243
C La tche cognitive interagir 245
C.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
C.2 Contrle haut niveau : dcision dinteraction . . . . . . . . . . . . . 245
C.3 Choix du type dinteraction : active ou ractive . . . . . . . . . . . . 246
C.4 Interaction active . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
C.4.1 Recherche active . . . . . . . . . . . . . . . . . . . . . . . . 248
C.4.2 Utilisation active . . . . . . . . . . . . . . . . . . . . . . . . 249
C.4.3 Attente active . . . . . . . . . . . . . . . . . . . . . . . . . . 250
C.5 Interaction ractive . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
C.5.1 Recherche ractive . . . . . . . . . . . . . . . . . . . . . . . 252
C.5.2 Utilisation ractive . . . . . . . . . . . . . . . . . . . . . . . 253
C.6 Utiliser leffecteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
C.7 Synthse et conclusion . . . . . . . . . . . . . . . . . . . . . . . . . 255
D Simulation dune gare virtuelle 257
D.1 Dnition des objets de simulation . . . . . . . . . . . . . . . . . . . 257
D.1.1 Les ressources . . . . . . . . . . . . . . . . . . . . . . . . . 257
D.1.2 Les affordances . . . . . . . . . . . . . . . . . . . . . . . . . 258
D.2 Simulation complte du voyageur au dpart . . . . . . . . . . . . . . 262
E Exprimentations impliquant des foules 265
Bibliographie 271
Table des gures 281
Liste des tableaux 285
Liste des Algorithmes 287
xv
Introduction gnrale
Lvaluation des btiments publics, et plus particulirement ceux comportant une forte
afuence, est depuis longtemps une ncessit en matire de scurit. Mais depuis peu,
un nouveau cadre dvaluation voit le jour o un btiment nest plus seulement jug par
rapport des normes de scurit, mais aussi expertis en fonction de la qualit de ser-
vices quil offre aux usagers. Cest dans ce cadre que se placent ces travaux : analyser
par la simulation des lieux publics, potentiellement forte afuence, et plus particuli-
rement les lieux dchanges que sont les gares. Cette catgorie denvironnement a t
choisie pour rpondre aux besoins des partenaires industriels de cette tude : la socit
AREP
1
, et la SNCF
2
.
La socit AREP est une liale de la SNCF en charge de ltude et la validation de pro-
jets architecturaux. Ces projets peuvent reprsenter soit de nouveaux btiments, soit des
btiments existant en cours de rnovation, an daccueillir une plus forte afuence par
exemple. Les btiments tudis sont principalement des lieux dchange, tels que les
gares, qui ont deux caractristiques principales. Premirement, lafuence globale dans
le btiment peut trs fortement varier (Figure 1) sur des chelles de temps courtes, de
lordre de lheure voire de la minute. Cette variation dafuence rsulte en des densits
FIG. 1: Variation dafuence dans un lieu dchange : les deux illustrations
reprsentent le mme endroit deux moment de la journe.
de personnes htrognes dans le temps et dans lespace. Deuximement, les btiments
tudis proposent un certain nombre dinteractions avec des quipements aux usagers,
leur permettant de raliser des processus comportementaux plus ou moins complexes.
Par exemple, un voyageur au dpart dans une gare (Figure 2) devra accomplir certaines
tches avant de prendre son train, comme sassurer quil dispose dun billet valide,
1
Amnagement Recherche Ples dchanges
2
Socit Nationale des Chemins de Fer Franais
1
Introduction gnrale
composter ce billet, ou encore reprer son quai.
FIG. 2: Exemples dinteractions avec lenvironnement dans une gare : le
voyageur au dpart doit utiliser une srie dquipement an de rali-
ser ses objectifs.
Lanalyse de ces btiments par la simulation implique lextraction de donnes carac-
tristiques, qui doivent de ce fait tre aussi ralistes que possible. Le ralisme que
nous voquons ne concerne pas ncessairement laspect visuel de la simulation, qui
est ici secondaire, mais plutt celui des chelles de valeur des donnes. Ainsi, laspect
primordial des simulations de circulations de personnes concerne la dynamique des
foules dindividus qui voluent au sein dun environnement. Cette dynamique peut tre
synthtise par des informations localises, telles que les densits de personnes et les
vitesses de dplacement. Cest cette synthse que reprsentent les niveaux de services,
en distinguant des intervalles de densits de personnes suivant une chelle qualiant
laisance de circulation.
Mais avant mme de chercher reproduire les logiques de dplacement pdestre, il
faut tre capable den saisir le dessein. En effet, le mouvement dun piton nest pas
une n en soi, mais sinsre dans une logique comportementale impliquant des m-
canismes plus abstraits. Cela est particulirement vrai pour les gares ferroviaires, o
de nombreuses interactions vont guider les voyageurs au travers de lenvironnement.
Les diffrents enchanements de ces interactions vont ainsi constituer des procdures
comportementales, dont limpact sur les circulations globales de personnes est pr-
pondrant. Cest pourquoi le deuxime aspect capital de notre tude est plus loign
de la description physique des mouvements de personnes, pour se rapprocher de leur
implication dans un mcanisme rationnel.
Notre problmatique peut donc tre rsume en trois points. Premirement, elle sous-
entend la description dun environnement de simulation, non seulement dun point de
vue topographique, mais aussi smantique. Cette smantique permettra dancrer une
symbolique au sein des constituants de la simulation, pour autoriser la mise en uvre
de mcanismes comportementaux. Deuximement, notre sujet implique llaboration
dun humain virtuel aussi raliste que possible compte tenu des contraintes de per-
formances impose par la simulation de foules. Celui-ci sera donc dot dune chane
comportementale intgrant les capacits qui peuvent inuencer son dplacement, telles
que la perception visuelle, la navigation, ou la prise de dcision relative linteraction.
Troisimement, notre problmatique ne sera rsolue quaprs avoir mis cet humain vir-
tuel en situation, et lavoir analys. Cette dernire tape consiste ainsi fournir un outil
permettant de renseigner un environnement virtuel, de procder une simulation, et
enn den extraire des rsultats.
Quelques logiciels commerciaux existent dj pour simuler et analyser les mouvements
2
Introduction gnrale
de foule. On peut citer par exemple Legion, dont les modles sont peu communiqus,
ou Myriad, qui se base sur les travaux de G.K. Still [128] (Figure 3). Nanmoins, ces
applications ne rpondent pas totalement notre problmatique, surtout concernant
limpact des comportements dinteraction sur les dplacements de personnes.
(a) Legion de la socit Legion Limited (b) Myriad de la socit Crowd Dynamics
FIG. 3: Deux logiciels commerciaux danalyse des foules caractrisant les
ux de personnes. Ces illustrations prsentent des exemples de pro-
duit de sortie de ces logiciels.
Pour rpondre cette problmatique, nous organiserons ce document en trois parties.
Tout dabord, nous tudierons lexistant concernant lanimation comportementale dans
la partie I. Nous y aborderons aussi des sujets inhrents ltude du comportement
humain, tels que la sociologie et la psychologie. Ensuite, nous prsenterons nos contri-
butions dans la partie II, avec un modle dobjets interactifs, la reprsentation de len-
vironnement de simulation, et le modle dhumain virtuel. Enn, nous exposerons nos
rsultats dans la partie III, que ce soit lapplication de simulation qui met en uvre
les modles proposs, ou les tapes de validation qui permettent den assurer la perti-
nence. Certains points plus techniques des contributions et des rsultats seront dtaills
en annexe de ce document.
3
Premire partie
tat de lart
5
Introduction
Bien quaborde depuis un certain temps dj, la simulation de foule reste encore au-
jourdhui un sujet trs ouvert. Ainsi, de nombreuses recherches traitent encore ce vaste
sujet, que ce soit dans le seul but de produire une animation dont laspect semble ra-
liste, ou encore deffectuer des simulations permettant la caractrisation et ltude de ce
phnomne. De nombreuses thmatiques peuvent intervenir dans le cadre de la simula-
tion de foules, telles que la psychologie, la sociologie, les sciences cognitives, et mme
la biophysique. Nous allons nous attacher dans cette partie dresser un tat de lexis-
tant concernant la simulation de foule et les sujets sy rapportant. Nous aborderons ce
phnomne en parcourant les diffrentes mthodes permettant soit de le caractriser,
soit de le reproduire.
Dans un premier temps, nous prsenterons dans le chapitre 1 les tudes caractrisant les
circulations de personnes, comportement de base ncessaire toute simulation denti-
ts mobiles. Nous exposerons ainsi les diffrentes mthodes permettant danalyser le
dplacement des personnes, allant de la psychologie au modle algorithmique spcia-
lis, tout en laissant de cts les processus de contrle comportementaux de plus haut
niveau.
Dans un deuxime temps, chapitre 2, nous pousserons un peu plus loin nos investiga-
tions concernant la gestion comportementale de lindividu. Nous nous focaliserons sur
la reprsentation des connaissances, son lien avec lenvironnement, ainsi que son uti-
lisation principalement pour des comportements dinteraction. Nous introduirons ainsi
les premires mthodes simulant le raisonnement, sans toutefois descendre un niveau
de complexit quivalent au domaine de lintelligence articielle.
7
Chapitre 1
tude des circulations de
personnes
La capacit se mouvoir est sans aucun doute lun des comportements lmentaires les
plus indispensables pour un individu. Cest pourquoi ce sujet est lun des plus anciens
concernant la simulation de personnes. Il dispose ainsi dun grand nombre de modles
et dacquis, mais reste tout de mme trs ouvert encore aujourdhui. En effet, de par
sa complexit, ce thme de recherche fait souvent lobjet dune tude volontairement
partielle et spcialise un cadre dapplication.
Nous allons exposer cette complexit, dans la section 1.1, en faisant un rapide tour
dhorizon des thories psychologiques et sociologiques lies la reprsentation men-
tale de lenvironnement ainsi qu la navigation. Nous continuerons dans la section 1.2
avec un certain nombre de modles statistiques qui ont rpertori et classi des don-
nes concernant les ux de personnes. Nous prsenterons ensuite, dans la section 1.3,
les premiers modles informatiques permettant de simuler les foules, dits macrosco-
piques, surtout utiliss dans le cadre de simulation dvacuations. Nous poursuivrons,
dans la section 1.4, avec les modles de navigation ractive, permettant de reproduire
individuellement les logiques de navigation locales. Nous complterons la prsentation
de cette technique, dans la section 1.4, avec dautre modles complmentaires permet-
tant cette fois-ci de simuler les logiques de navigation globales, par la reprsentation de
lenvironnement puis un procd de planication de chemin. Nous terminerons, dans
la section 1.6, en faisant le point sur les techniques de validation permettant de vrier
la validit des modles de circulation de personnes.
Nous ferrons ressortir pour chacun des modles prsents leurs points forts et leurs
faiblesses, ainsi que leur cadre dapplication de prdilection. Nous indiquerons dans
quel sens ses modles pourraient tre amliors et/ou inclus dans dautres modles
plus complexes.
9
tude des circulations de personnes
1.1 Le comportement de navigation pitonnier
Les premires tudes stant intresses la caractrisation du comportement de navi-
gation pitonnier furent ralises par les psychologues et autres sociologues. Ceux-ci,
se basant sur une observation du rel, ont distingu certains comportements rcurrents,
allant mme parfois jusqu proposer des modles les explicitant.
Sans chercher tre exhaustif dans ce domaine, nous allons synthtiser dans ce cha-
pitre un ensemble dtudes qui ont servi ou pourraient servir llaboration de
modles informatiques. Nous classieront les travaux prsents en deux parties. Nous
commencerons avec les thories traitant de la reprsentation mentale dun environne-
ment. Puis, nous nous pencherons sur les thories tentant dexpliquer le comportement
de navigation pitonnier, avec dune part la planication de chemin, et dautre part la
locomotion.
1.1.1 Reprsentation mentale de lenvironnement de navigation
Avant mme de pouvoir se dplacer dans son environnement, ltre humain a besoin
de se le reprsenter. Cette reprsentation mentale va en effet lui servir raisonner sur
cet environnement, que ce soit pour valuer un chemin an datteindre une localisation
prcise, ou encore pour organiser les tches quil doit effectuer (comme les interactions
avec des objets). Cest la reprsentation mentale permettant le premier type de rai-
sonnement la navigation que nous allons nous attacher ici, pour revenir plus tard
dans ce document sur le second type de raisonnement.
Cette reprsentation mentale, dite topologique, permet un tre humain de se reprer
dans lenvironnement. Elle passe par une phase dabstraction, cest--dire une inter-
prtation personnelle de la gomtrie des lieux. Une telle abstraction, dnomme carte
cognitive spatiale, est base sur deux concepts. Premirement, llaboration dune
carte sous-entend une construction mentale durable, faisant intervenir des processus
mmoriels permettant une conservation de linformation au cours du temps. Deuxi-
mement, le recours un mcanisme cognitif signie que cette reprsentation est ob-
tenue par un procd actif, rchi, de ltre humain, celui-ci raisonnant sur ce quil
peroit de son environnement pour lorganiser.
Labstraction mentale dun environnement peut tre vue comme un systme de ltrage,
o ltre humain ne va pas stocker lensemble de la gographie perue, mais plutt en
extraire des lieux marquants (landmarks en anglais). Ces zones dintrt sont des en-
droits dont la localisation est mieux connue, et serviront ensuite de point de repre
dautres lieux adjacents. Waller et al. [144] indiquent que ces lieux marquant, une fois
associs entre eux, forment une mmoire spatiale implique dans plusieurs tches men-
tales. Nanmoins, Wender et al. [146] signalent que la mmoire spatiale ne se rsume
pas la simple association de lieux marquants. Par lintermdiaire dexpriences, ils
montrent que la construction dune carte cognitive spatiale ne se fait pas en une seule
tape, mais est un phnomne redondant au cours du temps. Tout dabord ltre humain
extrait des lieux marquants, puis des chemins, et enn une organisation topographique
des lieux. Ensuite, il est capable de se rappeler dun chemin en se servant de cette carte
cognitive spatiale, grce un mcanisme de rappel depuis la mmoire. Celui-ci est
dpendant du contexte comportemental et environnemental de lindividu.
10
Le comportement de navigation pitonnier
An dagencer ces lieux marquants, R.L. Klatzky [64] dcrit deux sortes de reprage
pour ltre humain : allocentrique et gocentrique. La mthode gocentrique organise
les lments perus relativement la position de lentit qui les peroit. A loppos,
la mthode allocentrique organise les lments globalement, suivant un repre absolu
totalement dcorrl de tout point de vue subjectif et perceptif.
Pour nir, des tudes spcient que la reprsentation mentale de lespace est hirar-
chique. Ainsi, J. Wiener et H. Mallot [147] dnissent la notion de niveaux de dtails
dans les reprsentations spatiales lies au processus de navigation. Ils indiquent quun
minimum de deux niveaux hirarchiques sont utiliss, le premier tant form dun en-
semble de places, le second de rgions constitues dagglomrats de places.
Le principe de carte cognitive spatiale est utilis dans certains modles informatiques,
comme les IHT-graph de R. Thomas et al. [136]. Nanmoins, de part leur complexit
calculatoire, ces modles ne sont gnralement utiliss que pour la simulation dun
nombre trs limit dhumains, bien en de de leffectif ncessaire une foule. Comme
nous le verrons dans les sections suivantes, dautre modles plus simples exploitent
tout de mme la thorie de reprsentation spatiale, en ne retenant que certains de ses
principes (comme une abstraction simplie).
1.1.2 Processus mentaux de navigation
Une fois que ltre humain dispose dune reprsentation mentale de son environne-
ment, il peut lexploiter an dorganiser son dplacement. Ces processus mentaux sont
scinds en trois groupes principaux :
1. Raisonnement spatial, o lindividu va associer les tches quil doit effectuer
avec leur localisation, puis procder une slection.
2. Planication dun chemin, permettant lindividu dvaluer son dplacement au
sein de lenvironnement jusqu la tche slectionne, et donc de se projeter dans
le temps et lespace.
3. Navigation et locomotion, qui vont grer le dplacement local dun individu tout
au long du chemin plani.
Nous nous intresserons ici aux deux derniers groupes de tches, et reviendrons sur le
processus de raisonnement spatial plus tard dans ce document.
Planication dun chemin
La planication de chemin (aussi dnomme navigation dans la littrature anglaise)
consiste lister les lieux par lesquels passer pour relier la position courante dun hu-
main sa destination. Ce processus mental est bien entendu trs fortement li la repr-
sentation mentale de lespace, tant une exploitation directe des informations contenues
dans la carte cognitive spatiale de lindividu.
Dautres informations peuvent tout de mme intervenir dans ce processus. Par exemple,
A. Tom et M. Denis [139] ont tudi les degrs dutilisation des lieux marquant et des
noms de rues dans la planication de chemin. Ils indiquent que, du fait de leur plus
faible corrlation la topographie, les noms de rues sont beaucoup moins utiliss.
11
tude des circulations de personnes
Concernant le fonctionnement de la tche de planication de chemin, plusieurs tudes
montrent quil sagit dun procd hirarchique. Ainsi, S. Steck et H. Mallot [127]
indiquent que des lieux marquants locaux et globaux interviennent dans le processus,
mais de faon diffrente suivant les personnes : certaines nutilisent que lun ou lautre,
ou encore les deux la fois. De plus, J. Wiener et H. Mallot [147] introduisent dans
leur carte mentale hirarchique les concepts de place et rgion dnissant deux niveaux
dabstraction topologique. Ils expliquent que la planication de chemin se fait dabord
localement au niveau des places, puis globalement au niveau des rgions ds que le
processus sloigne du lieu marquant courant de lindividu (Figure 1.1).
FIG. 1.1: Reprsentation mentale hirarchique pour la planication de che-
min selon J. Wiener et H. Mallot. En haut, lenvironnement de test,
et son quivalent mental en a. En b les conditions de dpart (posi-
tion et destinations), et en c les chemins hirarchiques.
Locomotion
La locomotion est le comportement humain permettant le dplacement de lindividu
au sein de lenvironnement, jouant de ce fait un rle central dans de nombreuses acti-
vits. Celui-ci se doit dtre grandement adaptatif, notamment du fait de sa gestion de
lvitement de collision avec dautres entits prsentes dans lenvironnement. Ainsi,
W.H. Warren [145] indique que la vision exerce un contrle fondamental sur la loco-
motion humaine.
M. Relieu [118] indique que le lien social entre pitons est caractris par le silence
et lindiffrence. An de maintenir cet tat de fait, E. Goffman [46] nonce que trois
comportements sont mis en uvre lors de la locomotion :
Lexternalisation est le processus par lequel les gens fournissent constamment des
informations sur leurs intentions de dplacement, que ce soit la direction, la vi-
tesse, ou encore la longueur de pas. Cette transmission se fait par des successions
de mouvements corporels, devant tre perceptibles par lentourage du piton.
12
Le comportement de navigation pitonnier
La scrutation est le processus complmentaire lexternalisation. Celui-ci permet
un piton de regrouper slectivement les informations mises par son entourage.
La minimisation des ajustements signale que le piton rduit lamplitude et le nombre
de changements dorientation au cours de son trajet. Cela implique une antici-
pation dans la modication des trajectoires, an de la rendre perceptible assez
tt par lentourage, dans le but dviter une coordination ainsi quune interaction
proche.
De plus, J.R.E. Lee et R. Watson [74] remarquent que les conditions socio-culturelles
inuent sur la minimisation des interactions, notamment par la prise en compte im-
plicite du code de la route dans lorganisation globale des ux (comme lvitement
droite).
Concernant linteraction locale lors de la locomotion, E. Goffman introduit la rgion
ovale de scurit (Figure 1.2). Sa profondeur est dpendante de la vitesse du piton,
dnissant ainsi une zone danticipation, tandis que sa largeur dtermine des para-
mtres daisance personnelle, dsignant la distance acceptable pour passer ct dun
obstacle, dont notamment une personne. De manire plus gnrale, M. Relieu [119]
nonce le principe de discrimination urbaine, signalant que le piton focalise son at-
tention lintrieur de sa rgion courante pour en extraire une information pertinente.
FIG. 1.2: Reprsentation de laire de Goffman (en vert).
A Distance danticipation. B Distance latrale de scurit.
Concernant lorganisation dans lespace de la locomotion, B. Hillier et al. [56] in-
diquent que la plupart des mouvements pitonniers suivent les lignes de vue pour le
choix du chemin local, tentant ainsi de maximiser la distance couverte par le regard.
M. Azimazadeh et B. Klarqvist [9] signalent que cette proprit a un impact direct
sur le choix dun chemin, et permet dexpliquer le fait que des chemins aller et retour
soient gnralement diffrents.
1.1.3 Synthse
Le rapide survol des tudes psychologiques et sociologiques dans ce chapitre nous a
permis de nous familiariser avec les rgles rgissant le comportement pitonnier (le
lecteur intress trouvera une tude plus complte faite par S. Donikian [36]). Ainsi,
13
tude des circulations de personnes
nous avons pu voir dans un premier temps que la reprsentation mentale de lenvi-
ronnement dun tre humain est bien plus axe sur la topologie que sur la gographie
des lieux, avec des processus de classication abstraits et hirarchiques. Ensuite, cette
reprsentation mentale est utilise pour planier un chemin, encore une fois de faon
hirarchique, en tant trs prcis pour les lieux observables, et plus gnral pour le
reste du chemin. Pour nir, plusieurs rgles rgissent le dplacement court terme du
piton, dont notamment la prdiction quant aux collisions, ainsi que la minimisation
des adaptations.
Lensemble de ces constats caractrisent lattitude de navigation humaine. Le schma
comportemental qui en ressort est constitu de trois tapes successives et interconnec-
tes : perception de lenvironnement, analyse de linformation, puis dplacement au
sein de lenvironnement. Cette boucle perception - dcision - action constitue ainsi le
principe de fonctionnement gnral de ltre humain, tout au moins en ce qui concerne
son dplacement.
Pour conclure, il parat vident que la reproduction des proprits nonces soit une
condition minimale de validit lors de llaboration dun modle informatique. Nan-
moins, la mise en uvre exacte de ces processus semble difcile, surtout pour le pas-
sage lchelle dune foule, de part la complexit des modles ncessaires et le nombre
de facteurs entrant en ligne de compte. Cest pourquoi, comme nous le verrons dans
la suite de ce chapitre, les modles existants se concentrent gnralement sur la re-
production dune partie des caractristiques observes dans la navigation humaine, en
contraignant aussi le cadre dapplication (et donc de validit).
1.2 Modles statistiques
Les tudes statistiques furent les premires tre utilises pour caractriser les mou-
vements de personnes. Elles sont encore employes aujourdhui, mais plus pour un
aspect de validation. Leur objectif est de synthtiser les mouvements de personnes par
une quantication de leur impact sur lenvironnement. Ces tudes se concentrent donc
surtout sur des valeurs de densits et dbits observables, permettant ainsi den dduire
des vitesses moyennes de dplacement. Une faon deffectuer cette synthse a t pro-
pose par J.J. Fruin [41] grce des niveaux de services. Ceux-ci se basent toujours sur
des densits et dbits de personnes, mais qualient aussi de manire plus descriptive
laisance de dplacement. Nous allons nous concentrer sur cette approche dans cette
section, en parcourant les diffrentes classications de la littrature. Nous tudierons
aussi le cas de la lgislation franaise, an de nous rendre compte des caractristiques
minimales quune tude des circulations de personnes doit mettre en vidence.
1.2.1 Approche historique : les niveaux de services de J.J. Fruin
Lune des premires tudes de ux de pitons a t ralise par J.J. Fruin [41] en 1971
aux tats-Unis. Celui-ci propose dvaluer divers lieux dchanges en prenant comme
caractristique la libert de mouvements des pitons qui les traversent : vitesse de cir-
culation, risques de collisions, confort, scurit. Ainsi, il met au point une graduation
en niveaux de services (Table 1.1) allant de A pour le meilleur F pour le moins bon.
La caractrisation de chaque niveau de service (Level Of Service en anglais), du point
14
Modles statistiques
Niveau de
service
Densits Dbit
personnes/m
2
m
2
/personne pers./min/m
A < 0.3 > 3.2 < 23
B 0.3 0.4 2.3 3.2 23 33
C 0.4 0.7 1.4 2.3 33 49
D 0.7 1.1 0.9 1.4 49 66
E 1.1 2 0.5 0.9 66 82
F > 2 < 0.5 variable
TAB. 1.1: Les niveaux de services de J.J. Fruin : chaque niveau correspond
un intervalle de densits de personnes, et un dbit moyen observ.
de vue du comportement des pitons, est dicte par J.J. Fruin de la faon suivante :
A Jusqu cette densit Figure 1.3(a) chaque voyageur peut se dplacer la vitesse
quil dsire, les collisions restant improbables.
B-C Ici Figure 1.3(b) les voyageurs peuvent encore se mouvoir avec une relative
facilit, viter les conits et choisir leur vitesse.
C-D Avec cette densit Figure 1.3(c) les dpassements deviennent plus difciles, la
faible distance sparant chaque personne incite les pitons rduire leur vitesse.
D-E Cette zone critique Figure 1.3(d) impose une vitesse gnrale faible, le dpla-
cement des voyageurs devient irrgulier, les dplacements et autres changements
de direction sont quasiment impossibles.
E-F Enn, avec une telle densit Figure 1.3(e) les contacts entre pitons sont in-
vitables, interdisant tout dpassement.
(a) 0.3 pers./m
2
(LOS A-B) (b) 0.4 pers./m
2
(LOS B-C) (c) 0.7 pers./m
2
(LOS C-D)
(d) 1.1 pers./m
2
(LOS D-E) (e) 2 pers./m
2
(LOS E-F)
FIG. 1.3: Reprsentation des valeurs limites de transition entre les diffrents
niveaux de service.
15
tude des circulations de personnes
Pour ce qui est des espaces publics, J.J. Fruin recommande dutiliser un espace dimen-
sionnant de niveau de service C, mesur en priode de pointe. Ceci permet de crer une
marge de scurit en cas de trs forte afuence.
Enn, J.J. Fruin indique la relation quil peut exister entre un niveau de service, caract-
ris par une densit de personnes, et la vitesse de dplacement des pitons (Figure 1.4).
On peut ainsi remarquer que plus le niveau de service est lev (proche de A), plus la
vitesse de dplacement est importante. Le dbit, quant lui, varie dans le sens inverse
(plus le niveau de service est faible, plus le dbit est fort), avec un renversement de cette
caractristique pour le niveau de service le plus mauvais (F), la vitesse de dplacement
devenant alors quasi nulle.
FIG. 1.4: Relation entre les densits de personnes et la vitesse de dplacement
possible, ainsi que le dbit de population. Les niveaux de services
sont indiqus suivant la densit de personnes.
1.2.2 Autres caractrisations en niveaux de services
J.J. Fruin a ouvert la voie de nombreuses autres classications en niveaux de services.
Nous allons voir que ces autres rpartitions sont parfois trs loignes les unes des
autres, allant mme jusqu considrer des ordres de grandeurs diffrents quant aux
densits de personnes.
Transportation Research Board (T.R.B.)
Le T.R.B., aux tats-Unis, en se basant sur les tudes de J.J. Fruin, a mis une classi-
cation en niveaux de services dans le Highway Capacity Manual [140] (H.C.M.).
Bien que les niveaux de services soient toujours subdiviss en six catgories, de A F,
on peut remarquer que les valeurs sont plus compactes, ne variant que de 0.43 1.33
personnes par m
2
(Table 1.2).
16
Modles statistiques
Niveau de
service
Densits Dbit
personnes/m
2
m
2
/personne pers./min/m
A < 0.43 > 2.3 < 6.6
B 0.43 0.77 1.3 2.3 6.6 23
C 0.77 1 1 1.3 23 33
D 1 1.25 0.8 1 33 49
E 1.25 1.33 0.75 0.8 49 82
F > 1.33 < 0.75 variable
TAB. 1.2: Les niveaux de services du HCM.
Comme valeurs dimensionnantes, Joseph S. Milazzo et al. [86] prconisent, dans le
H.C.M., le niveau B en heures de pointe, ce qui correspond en valeurs au niveau C
recommand par J.J. Fruin.
Puskarev et Zupan
Puskarev et Zupan [114], toujours aux tats-Unis, proposent quant eux une classi-
cation en sept niveaux (Table 1.3), cette fois ci caractriss non plus par des lettres,
mais par leur description.
Niveau de
service
Densits Dbit
personnes/m
2
m
2
/personne pers./min/m
Open < 0.02 > 49 < 1.6
Unimpeded 0.02 0.08 12 49 1.6 7
Impeded 0.08 0.25 4 12 7 20
Constrained 0.25 0.5 2 4 20 33
Crowded 0.5 0.67 1.5 2 33 46
Congested 0.67 1 1 1.5 46 59
Jammed 1 5 0.2 1 0 59
TAB. 1.3: Les niveaux de services de Puskarev et Zupan.
On peut remarquer que la classication est ici tire vers le haut, avec une plus grande
subdivision des niveaux de services levs. Elle devient nanmoins plus difcile uti-
liser, lcart entre chaque niveau tant trs faible.
W. Brilon
W. Brilon [28], en Allemagne, a rig une classication en six niveaux de services la
manire de J.J. Fruin (Table 1.4).
Cette classication est assez proche de celle du H.C.M. avant sa rvision en 2000. Elle
comporte des niveaux faibles peu scuritaires, mais des niveaux levs allouant bien
plus despace par personne que J.J. Fruin (10m
2
contre 3.2m
2
pour le niveau A).
Comme valeur dimensionnante, W. Brilon recommande le niveau D comme maximum,
ce qui correspond la valeur conseille par J.J. Fruin.
17
tude des circulations de personnes
Niveau de
service
Densits
personnes/m
2
m
2
/personne
A < 0.1 > 10
B 0.1 0.3 3.3 10
C 0.3 0.5 2 3.3
D 0.5 0.7 1.4 2
E 0.7 1.8 0.56 1.4
F > 1.8 < 0.56
TAB. 1.4: Les niveaux de services de W. Brilon
Polus et al.
Polus et al. [111], en Isral, ont quant eux choisi une classication en cinq niveaux
de services (Table 1.5).
Niveau de
service
Densits Dbit
personnes/m
2
m
2
/personne pers./min/m
A < 0.6 > 1.67 < 40
B 0.6 0.75 1.33 1.67 40 50
C
1
0.75 1.25 0.8 1.33 50 75
C
2
1.25 2 0.5 0.8 75 95
D indtermin
TAB. 1.5: Les niveaux de services de Polus et al.
Cette classication est moins scuritaire que toutes celles vues jusqu prsent, son
niveau le plus lev correspondant au niveau C de J.J. Fruin.
Tanaboriboon et Guyano
Y. Tanaboriboon & J. A. Guyano [130], en Thalande, se conforment une classica-
tion en sept niveaux de services (Table 1.6).
Niveau de
service
Densits Dbit
personnes/m
2
m
2
/personne pers./min/m
A < 0.4 > 2.38 < 28
B 0.4 0.6 1.6 2.38 28 40
C 0.6 1 1 1.6 40 61
D 1 1.5 0.65 1 61 81
E 1.5 2.7 0.37 0.65 81 101
F > 2.7 < 0.37 variable
TAB. 1.6: Les niveaux de services de Tanaboriboon et Guyano.
Cette classication est la moins scuritaire, avec plus de 2.7 personnes/m
2
dans son
niveau le plus bas.
18
Modles statistiques
Conclusion
Les diffrentes classications en niveaux de services prsentes sont assez distantes les
unes des autres (Figure 1.5). Cette htrognit peut sexpliquer par les diffrences de
condition dvaluation. En effet, les densits de personnes mesures sont fortement
corrles aux situations observes, ainsi quaux catgories de populations. Ainsi, pour
pouvoir tre analyse, une mesure doit tre corrle aux mensurations des populations
observes, mais aussi leur objectif gnral. Ce dernier pourra en effet avoir un im-
pact majeur sur leur vitesse dsire de dplacement, qui est par exemple leve en cas
dvacuation, et basse en cas de lieu de promenade.
FIG. 1.5: Comparaison des niveaux de services prsents. On voit apparatre
une forte disparit des valeurs, ainsi que des allures des courbes.
1.2.3 Lapproche Franaise plus gnrale
Une catgorisation en niveaux de services nest pour le moment pas disponible en
France. Les seules valeurs dimensionnantes fournies ofciellement dnissent les rgles
de scurit, donc des maxima ne pas dpasser. En effet, la loi prvoit une dure
dvacuation de dix minutes pour nimporte quel type de btiment public, les dbits et
densits tant fonctions de cette rgle.
Tout dabord, le lgislateur a rpertori les tablissements pouvant recevoir du public
suivant le type de leur exploitation [48], dont le type GA pour les gares. Ces types sont
alors classis suivant lafuence quils peuvent supporter (Table 1.7).
Ensuite, il est prcis les effectifs et dbits maximum dexploitation, par exemple pour
une gare [49] :
100 pers./min/m dans un couloir,
1 pers./m
2
pour les zones o le public stationne, 0.5 pers./m
2
pour celles o le public
stationne et transite.
19
tude des circulations de personnes
Groupe Catgorie Afuence
1 > 1500 pers.
I 2 701 1500 pers.
3 301 700 pers.
4 <= 300 pers.
II 5 spcial
TAB. 1.7: Catgories des tablissements publics.
Enn, ces dbits sont valus statistiquement en considrant la notion dunit de pas-
sage
1
. Ces units de passage dnissent les largeurs des ouvertures servant lvacua-
tion dun btiment. Elles sont dnies de la faon suivante :
une unit de passage fait 0.9 m de largeur ;
deux units de passage font 1.4 m de largeur ;
n units de passage (n > 2) font 0.6n m de largeur.
On peut remarquer que les densits prcites correspondent respectivement aux ni-
veaux D et C chez J.J. Fruin, et C/D et B pour le H.C.M. Quant au dbit envisag
par les normes franaises, il se trouve bien au dessus du plus grand dbit envisag par
J.J. Fruin ou le H.C.M. (soit 82 pers./min/m).
1.2.4 Synthse
Nous avons vu que plusieurs dcoupages en niveaux de services ont t faits, mais que
ceux-ci comportent de nombreuses diffrences, surtout dun pays lautre.
Ceci vient principalement des conditions socio-culturelles de chaque pays. Par exemple
les Thalandais ont besoin de moins despace personnel que les Amricains pour se
sentir laise. De plus, les tudes sont ralises partir de donnes htroclites : gares
pour J.J. Fruin, bazars pour Y. Tanaboriboon et J. A. Guyano.
Une autre raison de ces fortes disparits provient de la mthode destimation des ux.
Celle-ci prend en compte la corpulence des pitons (surface projete au sol) pour esti-
mer le nombre de personnes par mtre carr. Bien entendu, une variation de la corpu-
lence utilise (Table 1.8) par les diffrentes tudes entrane une variation des rsultats.
Pour conclure, ces modles statistiques prsentent des valeurs dimensionnantes rutili-
sables dans des modles informatiques. Certes lhtrognit des donnes considres
contraignent leur gnralisation, mais les valeurs observes sont tout de mme globale-
ment comparables. Ainsi, les tables associant des densits de population des vitesses
et dbits observs pourront servir de deux faons diffrentes et exclusives, dans un mo-
dle informatique. Premirement, comme valeurs de contrle : on pourra ainsi directe-
ment associer une vitesse de dplacement une condition de densit. Deuximement,
comme valeurs de comparaison : on pourra ainsi valuer la abilit dun modle de
navigation en confrontant ses rsultats ceux estims dans ces donnes statistiques.
1
Article CO 36 de la Rglementation de Scurit contre lIncendie dans les tablissements Recevant du
Public
20
Modles macroscopiques
Population Largeur Profondeur Surface
(cm) (cm) (m
2
)
tats-Unis (H) 51.5 29 0.23
tats-Unis (F) 44 30 0.21
France (H) 51.5 28 0.23
France (F) 47 29.5 0.22
Inde (H) 45.5 23.5 0.17
Inde (F) 39 25.5 0.16
Suisse (H) 51 25.5 0.2
Suisse (F) 42.5 30 0.2
Moyenne 46.5 27.6 0.2
Maximum 51.5 30 0.23
TAB. 1.8: Caractristiques moyennes de tailles de diverses populations [128].
1.3 Modles macroscopiques
Les modles de simulation macroscopique sont historiquement les premiers modles
informatiques ayant permis des simulations de foules. En effet, ceux-ci simulent la to-
talit des individus par un ensemble de fonctions mathmatiques, ne ncessitant quune
puissance de calcul assez faible. Ainsi, ces modles abandonnent tout comportement
individuel volu, au prot dune simulation trs rapide dun grand nombre dentits.
Nous verrons que le but de ces modles rside dans la caractrisation dun phnomne
particulier gnralement reproductible dans des conditions environnementales ges.
1.3.1 Le modle gazeux
L.F. Henderson [55] propose ds 1971 dassimiler les dplacements de personnes dans
des conditions de faible densit ceux de molcules de gaz. En se basant sur la thorie
cintique des gaz de Maxwell-Boltzmann, il fait le parallle entre la densit des pitons
et celle des particules dun gaz, en assimilant leur diffrence dtats (arrt, marche,
course) aux diffrences dnergie des gaz. Ce modle sappuie sur deux hypothses
concernant les pitons, en laissant de ct toutes rgles sociales (comme les afnits
liant certaines personnes) :
Leurs positions et vitesses sont indpendantes les unes des autres ;
Leur vitesse est indpendante de leur position.
Ces premiers constats, mme sils peuvent paratre vidents aujourdhui, sont la base
de toute simulation dhumanodes virtuels.
1.3.2 Le modle hydraulique
Un modle hydraulique a t propos par J. Archea [6] pour simuler des foules de forte
densit. Il assimile ici le mouvement des personnes au travers de couloirs, escaliers, et
portes, celui de leau au travers de tuyaux, vannes, ou autres.
La simulation de lvacuation du btiment se fait en deux tapes :
21
tude des circulations de personnes
1. Initialisation du mouvement de lensemble des individus recevant simultanment
un message dalerte (ouverture des vannes) ;
2. Simulation de lvacuation (coulement de leau d la force de gravitation).
Ce modle se base sur les hypothses suivantes :
Prise de conscience et dcision de lvacuation immdiate et simultane de tous les
individus ;
Rpartition uniforme des occupants ;
Dbits uniformes ;
Flux unidirectionnels ;
Trajets prdnis.
Mme si ce modle a trouv de nombreuses applications, notamment du fait de sa
facilit de mise en uvre, il souffre de la simplicit des hypothses sur lesquelles il
repose : en ralit les personnes ne partent pas en mme temps, et leurs directions ne
sont pas aussi facilement prvisibles.
1.3.3 Le modle de Togawa
K. Togawa [138] propose un modle bas sur des observations ralises sur une p-
riode de dix ans dans des tablissements recevant du public. Il donne ainsi une formule
permettant de calculer la vitesse de marche dune foule par rapport sa densit :
V =V
0
.
0.8
avec V
0
= 1.3 m.s
1
= densit en personnes / m
2
Le dbit est alors dduit par :
N = .V =V
0
.
0.2
avec N = dbit en personnes / s / m, 1.3 < N < 1.7
K. Togawa suggre quelques modications suivant le degr dinclinaison du plan de
circulation :
Si le sens est ascendant, V est rduite de 2% par degr dangle dinclinaison ;
Si le sens est descendant, la vitesse augmente pour des pentes faibles, mais diminue
pour des pentes fortes.
Ce modle a t appliqu dans le cadre de la simulation de lvacuation dun immeuble
en cas dincendie. Le produit de sortie de cette simulation est un temps total dvacua-
tion, dni comme la somme des temps :
de dtection du feu ;
dalarme ;
de prparation ;
et dvacuation net, qui est lui-mme la somme des temps dvacuation des escaliers
et des circulations horizontales.
Le temps dvacuation des circulations horizontales est calcul ainsi :
T =
P
C
c
. L
e
+
L
h
v
22
Modles macroscopiques
avec T = temps dvacuation en secondes
P = nombre de personnes dans le btiment
L
e
= largeur des zones de circulation et des issues en mtres
C
c
= coefcient de circulation (valu 1.3 pers. / m / s)
L
h
= longueur totale maximale des chemins dvacuation
v = vitesse de circulation (gnralement 0.6 m / s)
Le temps de parcours dun escalier est quant lui calcul par, quel que soit le sens de
parcours :
t = 4H
avec t = temps de parcours en secondes
H = hauteur dun tage en mtres
K. Togawa remarque que, pour lvacuation des tablissements plusieurs tages, la
largeur seule des escaliers nest pas sufsante pour prdire leur dbit. Il pense que les
paramtres les plus signicatifs sont la hauteur des marches et lallure des personnes.
Il constate que le temps de parcours dun escalier est inversement proportionnel son
angle et sa hauteur, et que la vitesse moyenne en descente est de 0.5 m/s.
Pour conclure, le modle de K. Togawa propose un ensemble de rgles permettant
une valuation approximative du dbit maximal admissible en sortie dun btiment. Il
semble difcile dintgrer telles quelles ces rgles dans un modle plus complexe, mais
elles peuvent tout de mme servir comme valeur de comparaison lors dune premire
tape de validation.
1.3.4 Le modle de Melinek et Booth
S. J. Melinek et S. Booth [85] ont amlior le modle de K. Togawa en prenant en
compte les ventuels phnomnes de saturation. Ils dcoupent un btiment en cellules
(une par tage) et calculent le temps dvacuation pour chacune delles.
Les personnes sont supposes tre proximit des escaliers, et leur ot continu et
ne rencontrant pas dobstacle. Il est aussi admis que les personnes quittant le rez-de-
chausse ne rduisent pas le dbit des niveaux suprieurs.
Il est dnit :
Q
r
= occupation du niveau r en personnes
b
r
= largeur de lescalier entre les niveaux r et (r 1) en mtres
N
= dbit unitaire par mtre de largeur des escaliers descendants (gnralement 1.1
pers / m / s)
t
s
= temps mis par une personne pour descendre librement un tage (gnralement
16 s)
La population P
r
des niveaux r et suprieurs se calcule ainsi :
P
r
=
n
i=r
Q
i
Le temps minimum pour descendre lescalier situ entre les niveaux r et (r 1) est :
P
r
N
.b
r
23
tude des circulations de personnes
Le temps pour que la queue de la foule atteigne le rez-de-chausse est :
r.t
s
Le temps minimum dvacuation T
r
des niveaux r et suprieurs est donc :
T
r
=
P
r
N
.b
r
+r.t
s
, r {1, ..., n}
soit :
T
r
=
n
i=r
Q
i
N
.b
r
+r.t
s
, r {1, ..., n}
Dans les cas o plusieurs escaliers sont disponibles un tage r, b
r
est considr
comme tant la somme de leurs largeurs. En supposant que le nombre doccupants
et la largeur descaliers soient identiques chaque niveau, on pose Q = Q
r
et b = b
r
.
On obtient donc le temps minimum T
r
dvacuation des tages r et suprieurs par :
T
r
=
(nr +1).Q
N
.b
+r.t
s
Deux cas sont alors possibles pour le temps net dvacuation T
e
:
Q
N
.b
>t
s
T
r
est maximum pour r = 1
Q
N
.b
<t
s
_
_
T
e
=
n.Q
N
.b
+t
s
(saturation chaque niveau)
T
r
est maximum pour r = n
T
e
=
Q
N
.b
+n.t
s
(aucune saturation)
Malheureusement, les temps prdits par ce modle sont gnralement bien infrieurs
ceux observs en situation relle (avec un cart denviron deux minutes). S. J. Melinek
et S. Booth proposent donc de rajouter systmatiquement ces deux minutes aux temps
calculs car ils estiment quelles correspondent au dlai de rponse lalarme ainsi
quau temps daccs aux escaliers.
Comme pour le modle de K. Togawa, le modle prsent ici fournit des approxima-
tions quant aux dbits maximum de personnes dans des situations particulires. Les
corrections approximatives apportes par S. J. Melinek et S. Booth peuvent amener
douter quant la gnralisation de leur modle. En effet, il est difcilement concevable
de pouvoir approximer la complexit du comportement humain par une approxima-
tion constante du temps de rponse un stimulus externe. Ainsi, dautres situations
ncessiteront certainement des corrections diffrentes.
1.3.5 Le modle de Pauls
J. L. Pauls [102, 103, 104] oriente son tude sur lobservation dexercices dvacuation
dimmeubles de bureaux de grande hauteur au Canada. Celui-ci justie lutilisation de
son modle par le fait que de tels exercices, mens en situations relles, peuvent tre
considrs comme potentiellement dangereux.
24
Modles macroscopiques
Son tude porte surtout sur lvacuation au niveau des escaliers, en tablissant la loi
suivante :
f = 0.206.p
0.27
avec f = dbit unitaire en pers. / s / m de largeur descalier
p = nombre de personnes par mtre de largeur descalier
J. Pauls afne son modle quantitatif par des prcisions qualitatives provenant de di-
verses observations (vidos, photographies). Il dveloppe ainsi le concept de largeur
effective dun escalier en constatant quun espace dune quinzaine de centimtres est
systmatiquement laisse entre les vacuants et les murs latraux. La largeur effective
correspond donc la largeur rellement utilise dun escalier, soit la largeur relle di-
minue de trente centimtres. Ainsi, il indique que la formule permettant de calculer le
dbit est :
Q = 0.206.(L0.3).(
P
L0.3
)
0.27
avec Q = dbit en pers. / s
L = largeur effective en mtres
P = nombre de personnes vacuant (P = p.L)
Le temps dvacuation est alors li la population initiale du btiment et la largeur
effective des escaliers par :
L
P
= 8040.T
1.37
avec L = largeur effective en mtres
P = nombre de personnes vacuant
T = temps dvacuation en secondes (au maximum 600)
J. Pauls prcise que le rapport
L
P
doit tre ajust pour tenir compte de paramtres in-
uenant lvacuation comme la forme des marches, les caractristiques de la popula-
tion (y compris vestimentaire), ou encore la position de lescalier dans le btiment.
J. Pauls se rapproche des tudes menes par J. J. Fruin [41] en mettant en vidence
la notion de distance minimale quun piton tablit avec ses voisins, directement issue
du concept psychologique despace personnel qui explique en grande partie lagence-
ment des pitons. Il note ce propos quun individu rduit plus facilement son espace
longitudinal que latral.
Dans tous les cas, le piton adopte de prfrence une position qui respecte un espace
personnel sufsant, impliquant que toute la largeur dun passage est exploite lex-
ception des quinze centimtres latraux. Cest pourquoi J. Pauls remet en cause la
notion dunit de passage, juge inadquate et irraliste , utilise dans certaines
rglementations (notamment la lgislation franaise).
Pour conclure, ce modle met en vidence les notions de distance de scurit latrale
et de couverture optimale de lespace. Ces constats renforcent les observations qualita-
tives faites en psychologie et sociologie. Les formules nonces peuvent quant elles
tre utilises pour grer macroscopiquement les circulations verticales. Il faut nan-
moins garder lesprit quune approche aussi gnrale aura du mal reproduire les
particularits du comportement humain.
25
tude des circulations de personnes
1.3.6 Le modle de Predtechenskii et Milinskii
V. M. Predtechenskii et A. I. Milinskii [112] proposent un modle uidique dtermi-
niste bas sur lanalyse statistique dun trs grand nombre de mouvements de foules.
Ces travaux ont eu un impact fort en Europe, et continuent encore aujourdhui a tre
utiliss aux tats-Unis, notamment par la Society of Fire Protection Engineers [95]. Ils
introduisent les notions dintensit et de dbit unitaire (produit de la densit et de la
vitesse du mouvement) an de dterminer la capacit dune issue.
La grandeur fondamentale de ce modle est la densit locale de la foule, exprime
comme le rapport entre la somme des projections horizontales des individus et la sur-
face totale occupe par la foule. Lencombrement dune personne est ici calcule en
fonction de son physique, de son ge ainsi que de sa tenue vestimentaire, et correspond
environ une ellipse :
s =
4
.l.e
avec s = surface au sol occupe par lindividu en m
2
l = largeur de lindividu en mtres
e = paisseur de lindividu en mtres
V. M. Predtechenskii et A. I. Milinskii fournissent quelques valeurs types pour diff-
rentes classes de population (Table 1.9).
ge Encombrement
Largeur paisseur Surface
en m en m en m
2
Enfant 0.3 0.34 0.17 0.21 0.04 0.056
Adolescent 0.38 0.43 0.22 0.27 0.067 0.09
Adulte : Vtements dt 0.46 0.26 0.1
Vtements de mi-saison 0.48 0.3 0.113
Vtements dhiver 0.5 0.32 0.125
Avec paquets lgers 0.75 0.4 0.235
Portant un enfant 0.75 0.48 0.285
Avec bagages 0.9 1.1 0.75 0.53 0.65
TAB. 1.9: Surfaces projetes pour diffrents types de population
La densit maximale tablie par le modle et valide par lobservation est de 0.92 m
2
de personnes par m
2
de surface (not m
2
p
/m
2
s
pour le reste du document), soit environ 7
adultes en vtements dhiver, en admettant quil ny ait pas de dformation de lellipse.
Dans la ralit les individus sont compresss, et ainsi la densit limite peut atteindre
1.15 m
2
p
/m
2
s
(soit 9 adultes), impliquant un fort risque dasphyxie et de malaise. Le
maximum donn pour une foule en mouvement est de 1.04 m
2
p
/m
2
s
(soit 8 adultes), la
vitesse et le dbit devenant pratiquement nuls.
La formule estimant la densit locale dun ot de personnes est :
D =
P.S
.l
26
Modles macroscopiques
avec D = densit locale en m
2
p
/m
2
s
P = nombre de personnes du ot
S = surface projete individuelle des personnes du ot en m
2
= largeur du ot en mtres, identique celle du passage
l = longueur du ot en mtres
La vitesse de ce groupe de personnes est alors une fonction dterministe de la densit :
v = f (D) m/s. V. M. Predtechenskii et A. I. Milinskii, sur la base dobservations, ont
ensuite rig une classication en trois catgories de vitesses, associes trois types de
conditions dvacuation : Confortable, Normale, Urgente (Figure 1.6). Emmanuel Lar-
deux [72], dans son analyse de ce modle, note que les termes Lente, Moyenne et Ra-
pide seraient ici plus appropris, vitant ainsi la confusion entre des aspects purement
cinmatiques (rapidit) et des causes potentielles (confort). Par exemple, des vitesses
faibles (catgorie Confortable) peuvent tre choisies an de tenir compte dune entrave
au dplacement (prsence de fume, handicap, ou autre).
Vitesse (m/min)
Densit (m
2
p
/m
2
s
)
FIG. 1.6: Vitesse de progression le long dune circulation horizontale en
fonction de la densit et des conditions dvacuation.
Par lexploitation directe de ces valeurs, on peut calculer le dbit de passage pour une
section de largeur : Q = D.v. m
2
/min. Mais cest gnralement le dbit unitaire
q = D.v m/min (aussi appel intensit) qui est utilis. Ce dbit unitaire est fonction de
la densit : il crot avec elle jusqu un certain seuil, puis diminue. La fonction qui les
lie dpend du type de passage considr : une circulation horizontale prsentera une
variation diffrente de celle dune issue ou dun escalier, ce dernier tant aussi sensible
au sens de franchissement. On peut remarquer sur la gure 1.7 que pour des densits
faibles ou moyennes (< 0.5 m
2
p
/m
2
s
), le dbit dun escalier descendant est suprieur
celui dun escalier ascendant. Puis, cette tendance sinverse, sexpliquant par le fait que
lavantage davoir fournir un effort moindre dans la descente, lorsque lescalier est
27
tude des circulations de personnes
peu encombr, est compens par linconvnient du risque de chute, lorsque la densit
augmente.
Dbit unitaire (m/min)
Densit (m
2
p
/m
2
s
)
FIG. 1.7: Dpendance entre le dbit unitaire, la densit de population, et le
type dun passage (conditions normales).
Pour simuler lvacuation dun btiment, on propage les densits et dbits des blocs
occups initialement. Trois types de propagations peuvent alors apparatre : transition,
conuence, et divergence.
Transition : elle a lieu lors dune modication de largeur du chemin dvacuation pen-
dant la propagation du ot de personnes.
Q
n+1
= Q
n
q
n+1
= q
n
.
n
n+1
Conuence : cest la fusion de plusieurs ots distincts de personnes.
Q
n+1
=
i=1
Q
n
i
q
n+1
=
i=1
q
n
i
.
n
n+1
28
Modles macroscopiques
Divergence : cest la sparation dun ot principal en ots secondaires. Cette spara-
tion peut se faire proportionnellement la largeur des circulations secondaires
(premire formule), ou selon une autre pondration (seconde formule, utilisant
une famille de pondrations
i
).
Q
(n+1)
i
= Q
n
(n+1)
i
j=1
(n+1)
j
Q
(n+1)
i
= Q
n
i
j=1
j
On a alors deux cas possibles :
1. Si le dbit impos la section aval est infrieur son dbit maximum q
max
absorbable (en se basant sur les courbes du modle Figure 1.6 et Fi-
gure 1.7 dpendant du type du bloc et des conditions dvacuation), le
dbit est conserv.
q
n+1
= q
n
.
n
n+1
q
max
La densit, ainsi que la vitesse, de la section aval se dduisent ensuite de
son dbit q
n+1
grce aux courbes.
2. Si le dbit impos la section aval est suprieur son dbit maximum q
max
absorbable, il y a apparition dun phnomne de congestion, ou blocage.
q
n+1
= q
n
.
n
n+1
> q
max
Une zone de forte densit (0.92 m
2
p
/m
2
s
) se cre alors dans la section amont,
au niveau de linterface entre les deux sections, et le dbit dans la section
aval se stabilise au dbit correspondant cette densit maximale.
q
n+1
= q(D
max
)
Le front entre la zone forte densit et le ot de personnes continuant
afuer se propage alors dans la section amont une vitesse v
p
ngative :
v
p
=
q(D
max
).
n+1
n
q
n
D
max
D
n
Puis, lorsque le ot amont nest plus aliment, le front se dissipe la vitesse
v
d
:
v
d
= v
n+1
.
n+1
n
De faon plus gnrale, la vitesse de transition entre deux ots de dbits q
1
/ q
2
et de
densits D
1
/ D
2
est :
v
t
=
q
2
q
1
D
2
D
1
29
tude des circulations de personnes
Pour conclure, on remarquera que les calculs imposs par le modle de V. M. Predte-
chenskii et A. I. Milinskii sont trs fastidieux. Nanmoins, ils fournissent des informa-
tions assez prcises, notamment en ce qui concerne les phnomnes de blocage. Il est
indniable que la richesse des donnes quantitatives fournies avec ce modle pourra
tre exploite dans dautres tudes.
1.3.7 Le modle de Takahashi, Tanaka, et Kose
K. Takahashi, T. Tanaka et S. Kose [129] proposent un modle en 1988 au Japon. Ils
dcrivent un btiment sous la forme de huit types dlments, dont deux reprsentant
des espaces virtuels :
Une pice est un espace pourvu dissues, contenant initialement des personnes.
Un couloir est un espace pourvu dune entre et dune sortie, initialement vide. Il
peut tre divis en units pour les besoins du calcul.
Un escalier est un espace reliant entre eux deux tages, fonctionnant comme un
chemin.
Un vestibule est un espace avec une entre et une sortie vers un escalier, fonctionnant
comme un chemin et permettant, par comptage, de juger de ltat dvacuation dun
tage.
Un hall est un espace entres et sorties multiples, connectes par des chemins
multiples.
Un refuge est une destination nale dvacus.
Un lien est un espace imaginaire sans capacit qui rgule un ot dvacus linter-
section de deux lments.
Une zone dentassement est un espace imaginaire qui reoit les vacus ne pouvant
passer immdiatement llment suivant.
Le modle suppose des mouvements homognes dvacuants (vitesse constante, mo-
dle uidique) et une rpartition initiale uniforme dans les pices. Au dpart de lva-
cuation, les occupants de chaque pice vont vers la sortie, en privilgiant la plus proche
si elles sont multiples. Ainsi, une pice avec plusieurs sorties sera dcoupe en units
(Figure 1.8(a)). Pour les cas o lissue ne se trouve pas dans un coin, on dcoupe celle-
ci en deux units (Figure 1.8(b)).
(a) Issues multiples.
(b) Issue non latrale.
FIG. 1.8: Dcompositions dune pice en units.
30
Modles macroscopiques
On a alors deux types de mouvements possibles :
1. Si la pice est meuble, les trajets sont en zigzag (Figure 1.9).
(a) (b) (c)
FIG. 1.9: vacuation dune pice encombre.
Les formules associes sont les suivantes :
P
t
=
_
(v.t)
2
2
0 t
a
v
(Figure 1.9(a))
.(a.v.t
a
2
v
)
a
v
<t
b
v
(Figure 1.9(b))
a.b
(a+bv.t)
2
v
b
v
<t
a+b
v
(Figure 1.9(c))
o t = temps coul depuis le dpart, en secondes
v = vitesse de marche en m / s
= densit initiale doccupation en personnes / m
2
P
t
= nombre dvacus arrivant la sortie avant linstant t
2. Si la pice ne contient pas dobstacle la marche, le trajet est centripte(Figure 1.10).
(a) (b) (c)
FIG. 1.10: vacuation dune pice dgage.
Les formules associes sont les suivantes :
P
t
=
_
.(v.t)
2
4
0 t
a
v
(Figure 1.10(a))
.
v.t
2
.(
2
1
.v.t +a. sin
1
)
a
v
<t
b
v
(Figure 1.10(b))
.
v.t
2
.(
2
1
2
.v.t
+a. sin
1
+b. sin
2
)
b
v
<t
a
2
+b
2
v
(Figure 1.10(c))
o
1
= arccos
a
v.t
2
= arccos
b
v.t
31
tude des circulations de personnes
En prenant comme principe que les personnes cherchent vacuer le plus vite possible,
on peut considrer que dans une pice ayant plusieurs sorties, elles choisissent celle qui
optimisera le temps global dvacuation. Le temps optimal tant :
T
min
=
i
Occ
i
i
P
ext
i
La distribution chaque issue est :
Occ
i
= P
ext
i
.T
min
avec P
ext
i
= dbit de la sortie i en personnes / s
Occ
i
= nombre de personnes la sortie i avant redistribution
Occ
i
= nombre de personnes la sortie i aprs redistribution
Notons que P
ext
i
peut changer au cours du temps en fonction des conditions la sortie i.
Les escaliers et les vestibules sont quant eux diviss en units dont la longueur cor-
respond la progression des vacuants en un pas de calcul t, soit v.t. Ainsi, chaque
pas de calcul, les occupants dune unit passent la suivante. Enn, les halls sont traits
de la mme manire que les pices.
Les auteurs ont compar leurs rsultats des observations effectues deux reprises
grce des camras vidos. Les premires concernent lvacuation de sept amphi-
thtres lors de lexposition internationale de Tsukuba au Japon en 1985. Ils ont constat
de meilleures prdictions en effectuant une subdivision des amphithtres en sous-
units quavec lapproche en zigzag. La seconde vrication t effectue dans un
immeuble de cinquante tages Tokyo. Dans les deux cas les temps obtenus grce
au modle sont infrieurs denviron 10% aux temps observs. Largument invoqu est
encore une fois le temps de prparation des occupants.
Pour conclure, on peut remarquer que ce modle est plus n que lensemble de ceux
vus prcdemment. En effet, celui-ci repose sur une description plus prcise de len-
vironnement, introduisant le concept dabstraction topologique an de simplier ce
dernier, ainsi que les premires notions de smantique avec la caractrisation des es-
paces. La marge derreur dans les rsultats observe est encore une fois due la trop
grande simplicit du modle, ne tenant pas compte de toute la complexit du compor-
tement humain. Malgr tout, ce modle ouvre la voie des approches plus complexes,
posant les bases de la description topologique dun environnement.
1.3.8 Synthse
Nous avons prsent tout au long de ce chapitre les premiers modles informatiques
ayant permis de simuler des foules de pitons. Ces modles se caractrisent tous par
une abstraction totale du comportement individuel, pour se concentrer sur une approche
macroscopique quantitative de la foule. Cest pourquoi ces modles ont t trs utili-
ss dans le cadre de simulations dvacuation, o le comportement individuel peut tre
quasiment ignor, se rduisant sa plus simple expression : se dplacer vers la sor-
tie la plus proche. Cest pourquoi nous pouvons penser que ces modles seraient trs
difcilement exploitables dans des situations plus varies, o limpact des dcisions
individuelles ne serait plus ngligeable.
32
La navigation ractive
Nanmoins, la plupart de ces approches sont bases sur des tudes statistiques cons-
quentes, issues dobservations du rel indpendantes du modle de synthse. Ces tudes
restent donc exploitables pour des simulations plus volues, ne serait-ce que pour va-
lider globalement les rsultats, ou encore comme donnes de conguration. Elles ne
sont nanmoins pas sufsantes, ne couvrant pas un spectre assez large du comporte-
ment humain.
Pour nir, nous pouvons aussi mettre en avant que ces modles font tat de certaines
organisations spatiales pour ne pas dire sociales observes dans les foules dindivi-
dus. Ces schmas indiquent globalement lattitude des individus lorsquils sont placs
dans certaines conditions de densit et avec certains buts (gnralement atteindre un
endroit prcis). Comme nous le verrons dans le chapitre suivant, la reproduction de
ces congurations est trs souvent utilise comme justication pour des modles plus
complexes.
1.4 La navigation ractive
Les mthodes de navigation ractive ont succd au mthodes macroscopiques, en ne
considrant plus cette fois-ci les entits simules dans leur globalit, mais de faon
indpendante. Cette nouvelle approche sinscrit dans le cadre de la simulation micro-
scopique, o chaque entit est dote de son propre processus de dcision, et sadapte
donc en regard des variations de son environnement. Cette navigation ractive est donc
un sous-ensemble du processus de dcision individuel, qui ce concentre sur la faon de
grer les interactions locales lies au dplacement pdestre.
Ces modles ont tout dabord t utiliss seuls, principalement pour de la simulation
dvacuation o les buts individuels sont borns au dplacement court terme. Ils se-
ront ensuite exploits dans des modles plus complexes, capables de prendre en charge
des comportements plus volus. Nous reviendrons sur ces processus de dcision vo-
lus dans les chapitres suivants, pour nous concentrer ici sur les principaux algorithmes
utiliss uniquement pour lvitement de collision.
1.4.1 Le modle de particules
Introduit par I. Peschl [106] en 1971, ce modle fait lanalogie entre le dplacement
dindividus en forte densit, nayant quasiment pas de libert de dplacement, et lcou-
lement de particules dans des compartiments. Ce modle est donc un rafnement du
modle macroscopique uidique, discrtisant le uide par autant dentits reprsentant
les pitons. I. Peschl indique dans son tude que cette modlisation est pertinente pour
le cas o une forte densit de personnes est conne et en tat de panique. Quand le
ot se dirige vers une unique issue, on voit apparatre un phnomne dagglutination.
Au nal, le dbit de lissue devient quasi nul. Le parallle peut tre fait avec des billes
introduites dans un rcipient perc, qui tombent grce la force de la gravit mais sont
bloques cause de la pousse croissante quelles exercent.
Le modle de particules permet dapprhender le phnomne darche observ par
K. Togawa [138] en 1955 (Figure 1.11). I. Peschl, en faisant des expriences la fois
sur des personnes et sur des billes de mtal, a dduit les rgles suivantes :
33
tude des circulations de personnes
Quand la largeur dune issue augmente, la probabilit dapparition dune arche di-
minue tandis que la variation du dbit augmente.
La probabilit dapparition dune arche crot avec la densit.
Le ux est linairement proportionnel la largeur de lissue.
Les pulsations du ux travers une issue sont induites, le plus souvent, par la for-
mation et la rsorption des arches.
FIG. 1.11: Phnomne dagglutination dans le modle de particules de
D. Helbing. Une arche se forme au cours du temps, due la
congestion au niveau de la sortie.
D. Helbing [54] tend ce principe avec un systme de forces socio-psychologiques tra-
duisant deux caractristiques : premirement la tendance garder une certaine distance
avec les autres pitons, deuximement la friction intervenant lors de la rsolution dun
contact entre plusieurs pitons. Le cadre dapplication principal de ce modle est la ges-
tion du comportement de panique, qui ne ncessite quune procdure comportementale
simple (aller vers un endroit, gnralement une sortie). La validit de cette approche
est atteste par la reproduction de mouvements macroscopiques observables en fortes
densits [52]. Des modles ont ensuite tendu celui de D. Helbing dautres cadres
dapplication. Ainsi, A. Braun et al. [27] introduisent un lien social entre les entits au
niveau de leur connaissance mutuelle, permettant une entraide en cas de panique. De la
mme manire, N. Pelechano et N. I. Badler [105] exploitent le modle de D. Helbing
pour la simulation dvacuation dimmeubles, en prenant en compte trois catgories de
population : les entrans, les meneurs, et les suiveurs. Ces trois archtypes vont alors
disposer de diffrentes forces dattraction/rpulsion reprsentant leur attitude globale.
Enn, T.I. Lakoba et al. [68] font tat de la non validit du modle de D. Helbing
dans des cas de faibles densits. Ils remarquent que les distances danticipation sont
trop faibles, provoquant des acclrations irralistes, et que les forces de rpulsions,
utilises pour viter linterpntration, sont trop fortes. Ils proposent ensuite une mo-
dication des quations et paramtres permettant de conserver un ralisme visuel dans
un plus large spectre de densits de personnes.
Nous avons vu que de nombreux modles dans la littrature exploitent le modle de
particules, et particulirement celui de D. Helbing, pour la gestion de la navigation p-
destre. Ces modles ont dmontr leur adquation aux situations dvacuations. Deux
raisons principales tendent restreindre les modles de particules cette catgorie
dutilisation. Premirement, ils ne proposent pas de gestion comportementale volue,
ce qui est acceptable dans les cas dvacuation o le but des entits consiste seulement
sortir de lenvironnement, mais insufsant pour des situations moins contraintes o
les individus auront des objectifs varis. Deuximement, le principe de prdiction lors
du dplacement nest abord que trs succinctement dans ces modles. Cela se justie
pour lvacuation, qui impose une distance interpersonnelle trs faible, mais devient
plus gnant lorsque les densits de personnes diminuent, autorisant des adaptations de
34
La navigation ractive
mouvement plus anticipes. Ainsi, il semble difcile dexploiter de tels modles pour
des simulations denvironnements et de situations quelconques, prsentant une certaine
diversit de comportements et un gradient de densits suivant les zones.
1.4.2 Le modle base de rgles
Craig Reynolds [121], avec son modle Flocks of Boids, introduit la notion de simu-
lation microscopique base de rgles. Ici, le dplacement de chaque individu est rgit
par des rgles de comportement de la forme si condition alors action .
Trois rgles sont proposes par C. Reynolds dans le cadre de lanimation de nues
(Figure 1.12) :
Sparation an dviter dventuelles collision avec ses voisins.
Alignement an de rguler sa vitesse par rapport lensemble du groupe.
Cohsion an de rester proche de ses voisins.
(a) Sparation (b) Alignement (c) Cohsion
FIG. 1.12: Les trois rgles comportementales du modles Flocks of Boids
De telles rgles dinter-relations conduisent ainsi un comportement de groupe mer-
geant. Mais, dans ce modle ocks of boids, lautonomie de lentit est bride par le fait
que son comportement est uniquement dni en fonction de celui de ses voisins. On a
alors deux catgories dindividus : des leaders qui choisissent rellement la trajectoire,
et des suiveurs qui se contentent dvoluer suivant le mouvement gnral en appliquant
les rgles dvitement. C. Hartman et B. Benes [51] proposent de ne pas xer le lea-
der lors de la simulation, mais plutt dintroduire une nouvelle rgle permettant une
entit standard de prendre la place du dcideur actuel.
Dautre approches, comme celle de W. Shao et D. Terzopoulos [124] ou F. Lamarche et
S. Donikian [70], exploitent tout de mme le concept de rgles sans avoir recours un
leader : les diffrentes possibilits dadaptation de lentit sont itrativement values
lors du dplacement, ce dernier tant cette fois-ci guid par un processus de contrle
indpendant. Cette technique est aussi utilise dans le monde du jeu vido [50], o les
possibilits de contrle offertes par les rgles sduisent. De plus, la faible complexit
dvaluation des modles base de rgles est exploite par le domaine de lanima-
tion [79] an de peupler des environnements avec des milliers dindividus capables de
se dplacer, et mme daccomplir certains comportements assez simples.
Pour conclure, les modles base de rgles proposent une approche plus souple de la
navigation microscopique, permettant dintroduire des adaptations varies dans diff-
rentes situations. Nanmoins, le caractre itratif de la dcision rend difcile la fusion
dinformations, les rgles tant indpendantes les unes des autres. Une solution, ex-
ploite par W. Shao et D. Terzopoulos [124] ou encore S. Raupp Musse [89], est de
35
tude des circulations de personnes
crer des rgles grant directement un ensemble dinformations, comme un groupe de
personnes voluant dans lenvironnement. Mais cette approche a le dsavantage de sp-
cialiser le modle, rendant encore une fois sa gnralisation difcile : an de grer le
gradient des situations pouvant apparatre lors de la navigation, un modle base de
rgles devra spcier lensemble des adaptations pouvant intervenir pour lensemble
des congurations.
1.4.3 Un modle gomtrique prdictif
F. Feurtey [39] propose une approche prdictive de lvitement de collision. Il repr-
sente lenvironnement de navigation des entit en 3D, dans un repre (x, y, t).
Dans ce repre, lensemble des dplacements possibles pour une entit donne se re-
prsente sous la forme dun cne, dont la pente correspond la vitesse maximale V
M
de lentit, et dont le sommet est sa position actuelle M. Le cercle des dplacements
admissibles en un laps de temps t est donc le cercle inclut par le cne dont le rayon
est V
M
.t (Figure 1.13(a)). Ensuite, une collision est reprsente dans le cne sous la
forme dun segment, dans le cas o la trajectoire dune entit voisine lintersecte. Pour
reprsenter limprcision de la prdiction de la trajectoire, en cas de changement de
direction, la zone de collision potentielle est tendue par un triangle (Figure 1.13(c)).
(a) (b) (c)
FIG. 1.13: Modle prdictif de navigation de F. Feurtey. (a) Reprsentation
dans (x, y, t) du dplacement dune entit. (b) Les trois adaptations
de trajectoire possibles pour viter une collision. (c) Recherche de
la meilleure trajectoire suivant les collisions prdites.
F. Feurtey part du principe que pour viter des collisions, un individu applique trois
rgles avec diffrentes priorits (Figure 1.13(b)) :
1. Prserver sa direction.
2. Prserver sa vitesse.
3. Prserver le temps ncessaire au dplacement.
Il propose de synthtiser ces rgles dans une fonction de cot C
P
calcule pour chaque
point P non contraint du cercle des dplacements admissibles de rayon r
M
. Cette fonc-
tion de cot est sensible au point V reprsentant la projection de lentit de rfrence
36
La navigation ractive
sa vitesse actuelle, et au point G qui est son but (reprsents sur la gure 1.13(c)) :
C
P
= K
1
GP
2.r
M
+K
2
angle(OV,OP)
180
+K
i
|OPOV|
2.r
M
avec i =
_
3 si OP OV
4 si OP < OV
Dans cette formule, les paramtres K sont des constantes reprsentant les poids relatifs
des diffrentes catgories dadaptation :
K
1
est le cot dloignement par rapport au but actuel.
K
2
est le cot de changement de direction.
K
3
est le cot dacclration.
K
4
est le cot de dclration.
Le meilleur mouvement est alors celui correspondant au point P qui minimise cette
fonction de cot, lauteur ne prcisant pas la mthode de recherche employe.
Cette mthode prsente lavantage indniable dtre fonde sur les logiques de locomo-
tion humaine, dont notamment les diffrentes capacits dadaptation et le mcanisme
de prdiction. On retrouve ainsi des rfrences dans la littrature [79, 141, 125] quant
aux principes mis en avant par cette dmarche, sans pour autant quelle soit rutilise
du fait de certains de ses inconvnients. Son premier point faible est quelle ne propose
pas de mthode pour inclure les obstacles statiques de lenvironnement, tels que les
murs, qui jouent pourtant un rle prpondrant dans la prise de dcision de la naviga-
tion. Un autre dsavantage est que cette mthode considre les collisions sparment
les unes des autres en appliquant sa fonction de cot, bien que celles-ci soient unies
en une seule reprsentation. Ce second point bride le principe de prdiction, en n-
gligeant des liens de dpendances entre plusieurs collisions (comme deux personnes
marchant cte cte). Enn, F. Furtey indique que le passage lchelle na pu tre
ralis, sans doute cause de la complexit de la mthode de recherche dune solution.
Ainsi, il ne fait tat dexpriences nimpliquant quun nombre trs limit dentits, une
douzaine, bien en de de leffectif ncessaire lmergence dune foule.
Pour conclure, il semble que la reprsentation propose par cette mthode dans le temps
et lespace soit un bon point de dpart pour un processus de navigation ractive, tout
comme le fait de considrer plusieurs possibilits de rsolution de conit. Il faut nan-
moins tendre la mthode de calcul an de fusionner les informations quant la prise
de dcision, dinclure les obstacles statiques de lenvironnement, et damliorer la com-
plexit du traitement pour permettre son application des foules dindividus.
1.4.4 Synthse
Nous avons expos dans ce chapitre trois techniques permettant de simuler individuel-
lement les circulations de personnes. Nous nous sommes concentrs ici sur le caractre
ractif de la dcision lors du mouvement pdestre : la navigation ractive.
La premire conclusion que lon peut tirer des modles prsents est quaucun de ceux-
ci ne permet, seul, de grer toutes les situations potentielles des mouvements de per-
sonnes. Certains sont plus axs sur lobtention de performances de calcul, dautres sur
la robustesse de la rsolution, certains donnent une grande part lorganisation sociale,
37
tude des circulations de personnes
et dautres appuient plus sur la dcision individuelle. Le danger lors de la rutilisation
de ces modles est donc de les exploiter en dehors du contexte pour lequel ils ont t
crs, et valids.
Dautre part, ces modles nabordent pas le caractre plus global de la dcision relative
au dplacement. Nous verrons par la suite que dautres techniques sont ncessaires
pour traiter ce sujet, et sont gnralement utilises conjointement aux modles exposs
ici.
Pour conclure, nous pouvons retenir comme points forts des mthodes voques : lor-
ganisation macroscopique mergeant du modle de particules, le large ventail de situa-
tions pouvant tre couvert par le modle base de rgles, et le fort lien avec les logiques
de dplacement pdestres du modle gomtrique prdictif. Il serait alors intressant
de se diriger vers un modle permettant un contrle n comme avec les rgles, tout en
conservant les schma sociaux mis en vidence avec les particules. Nous pouvons de
plus afrmer que le modle gomtrique prdictif doit tre le support de la dcision de
lindividu, celui-ci permettant la mise en place de mcanismes dadaptation ralistes.
1.5 Reprsentation de lenvironnement
et recherche de chemin
Comme nous lavons voqu dans la section prcdente, lvolution des modles in-
formatiques avec lapproche microscopique sest intress laspect individuel de la
dcision relative au dplacement. Cest cet aspect que sintresse la planication de
chemin. Le but de la planication de chemin nest plus, comme avec la navigation r-
active, de grer les interactions locales entre individus, mais de trouver globalement les
endroits par lesquels passer pour atteindre une destination.
On voit donc apparatre avec ces modles la ncessit dune description topologique,
permettant de reprsenter et dorganiser lenvironnement de simulation. Cette descrip-
tion topologique peut tre plus ou moins ne, exacte ou approximative, et peut ven-
tuellement contenir des informations smantiques. Les algorithmes utiliss en anima-
tion comportementale pour reprsenter lenvironnement sont troitement lis ceux
employs en robotique [73], domaine o cette reprsentation tient un rle prpond-
rant.
Cette description est ensuite exploite par des algorithmes de recherche de chemin.
Ceux-ci peuvent se baser sur diffrentes informations issues de lenvironnement, quelles
soit gomtriques comme les distances, ou qualitatives comme la charge cognitive as-
socie au chemin. Cette planication de chemin constitue un premier pas vers des mo-
dles de dcision plus pousss, ouvrant la voie une gestion comportementale indivi-
duelle.
1.5.1 Reprsentations exactes de lenvironnement
Les reprsentations exactes de lenvironnement vont chercher organiser les donnes
spatiales tout en conservant intgralement les informations quelles contiennent lori-
gine. La mthode utilise consiste gnralement dcouper lespace navigable en cel-
lules convexes de diffrentes formes. Il existe plusieurs modles pour effectuer cette
38
Reprsentation de lenvironnement et recherche de chemin
subdivision, mais nous nous attacherons ici la plus utilise quest la triangulation de
Delaunay, ainsi qu ses volutions.
Triangulation de Delaunay
La triangulation de Delaunay [22] cre un ensemble de triangles en runissant des
points fournis en entre. Lalgorithme dunication respecte pour contrainte que le
cercle circonscrit un triangle ne contienne aucun autre point que les trois sommets qui
le composent. Une consquence de cette proprit est que langle minimum dun tri-
angle produit est maximis. La complexit de lalgorithme dunication est en O(n. lnn),
avec n le nombre de points fournis en entre.
La proprit la plus intressante de cette triangulation est que chaque point y est reli
son plus proche voisin par larte dun triangle. Ainsi, cette triangulation peut tre uti-
lise pour reprsenter lespace navigable, les points dentre tant issus des obstacles.
Une autre utilisation possible de cette triangulation est cette fois dynamique lors de
la simulation [70], pour calculer un graphe de voisinage entre les entits mobiles, qui
serviront cette fois-ci de point dentre.
Triangulation de Delaunay contrainte
La triangulation de Delaunay contrainte [30] permet de modrer les contraintes de la
version standard an de conserver certaines artes de la dnition graphique dorigine.
Pour se faire, la contrainte du cercle circonscrit un triangle est modie, pour spcier
que tout point inclus dans ce cercle ne peut tre reli tous les points du triangle sans
intersecter un segment contraint.
Cette triangulation tend la proprit du plus proche voisin en permettant dy associer
une notion de visibilit. Si lon considre que les artes contraintes coupent la visibilit
dun point lautre, la proprit de plus proche voisin devient : chaque point est reli
son plus proche voisin visible.
La triangulation de Delaunay contrainte est aussi utilise pour obtenir une subdivision
spatiale en triangles [59], en introduisant les obstacles la navigation sous la forme
dautant de segments contraints (Figure 1.14). Il a t prouv [21] que le nombre de
triangles produits lors dune telle subdivision est linaire en fonction du nombre de
points, indiquant que la discrtisation est donc directement proportionnelle la com-
plexit gomtrique de lenvironnement. Cette proprit prsente un avantage certain
comparativement aux mthodes approximatives, o la discrtisation est fonction de la
prcision dsire de la reprsentation.
Triangulation de Delaunay ltre
La triangulation de Delaunay ltre [70] est une extension de la version contrainte.
Deux types de ltrages sont proposs, lun ayant pour effet daugmenter le nombre de
triangles produits an dafner la reprsentation de lenvironnement, lautre de le di-
minuer an de tenir compte de la visibilit pour llaboration dun graphe de voisinage.
Premirement, concernant son application la subdivision spatiale, la triangulation
39
tude des circulations de personnes
(a) Environnement dorigine (b) Triangulation de Delaunay contrainte
FIG. 1.14: Exemple de triangulation de Delaunay contrainte.
de Delaunay est ltre par lajout progressif de contraintes reprsentant les goulets
dtranglement (Figure 1.15(a)). Ainsi, en considrant lensemble des artes produites,
on est sr de reprsenter tous les rtrcissements prsents dans lenvironnement.
Deuximement, concernant son application aux graphes de voisinage, la triangulation
de Delaunay est ltre sur un principe quivalent la triangulation contrainte, en sup-
primant les artes intersectant des obstacles de lenvironnement (Figure 1.15(b)). Ainsi,
cette triangulation peut servir dterminer trivialement quels sont les voisins directs
visibles dune entit, et avec un simple parcours de graphe peut slectionner les entits
visibles une certaine distance.
1) 2)
3) 4)
(a) Filtrage pour subdivision spatiale. 1) Environnement
dorigine. 2) Triangulation de Delaunay contrainte.
3) Calcul des plus courtes distances des sommets aux
segments voisins. 4) Triangulation ltre.
(b) Filtrage pour graphe de voisinage.
Seules les artes noires seront conser-
ves, nentrant pas en collision avec les
obstacles de lenvironnement.
FIG. 1.15: Exemples de triangulations de Delaunay ltres.
Synthse
Pour conclure concernant les reprsentations exactes de lenvironnement, nous allons
retenir deux points forts. Tout dabord, ces reprsentations sont totalement indpen-
dantes dune quelconque prcision dsire, reproduisant exactement lenvironnement
dorigine tout en lorganisant de manire plus accessible. Ainsi, il sera possible par ces
40
Reprsentation de lenvironnement et recherche de chemin
reprsentations dextraire la dnition graphique source, pour son ventuelle utilisation
dans des processus plus prcis. Ensuite, ces reprsentations exposent plusieurs propri-
ts, comme le calcul des plus proches voisins, permettant par la suite dautomatiser un
certain nombre de calculs moindre cots.
Nanmoins, un point faible est associ ces techniques, rsidant dans la profusion des
cellules produites. En effet, pour des environnements gomtrie complexe, notam-
ment contenant des courbes, le nombre de triangles obtenus augmente trs rapidement.
Mme si leffectif des triangles reste linaire en fonction du nombre dobstacles traits,
cela rduira tout de mme les performances dalgorithmes se basant sur cette dnition.
Une solution propose par F. Lamarche et al. [71, 70] consiste abstraire la subdivision
obtenue, par des regroupements successifs, permettant de hirarchiser les processus et
ainsi de rduire le nombre de cellules manipuler chaque tape. Il faut tout de mme
noter que pour rester avantageuse en terme de ralisme, une telle abstraction doit per-
mettre de conserver un maximum dinformations. Dans le cas contraire, elle risque
de fausser les dcisions prises par des algorithmes lexploitant directement (comme la
planication de chemin).
1.5.2 Reprsentations approximatives de lenvironnement
Les reprsentations approximatives de lenvironnement sont sans doute les plus uti-
lises en animation comportementale, du fait de leur facilit de mise en uvre. Ces
reprsentations vont dcrire lespace libre de navigation avec des formes gom-
triques simples telles que des carrs ou des segments. Deux modles entrent dans cette
catgorie : les modles base de grilles, et les cartes de cheminement.
Modles base de grilles
Le premier modle de reprsentation approximative utilise des grilles rgulires, for-
mes de cellules carres en deux dimensions (Figure 1.16(a)) et cubiques en trois di-
mensions. Lenvironnement est donc pav par ces cellules, qui peuvent avoir trois tats :
libre, partiellement obstrue, et obstacle.
La prcision de la reprsentation obtenue dpend directement de la taille des cellules
utilises : plus les cellules sont grandes, moins la reprsentation est prcise. Bien en-
tendu, laugmentation de la prcision induit une augmentation proportionnelle de loc-
cupation mmoire. Loccupation mmoire de cette mthode constitue ainsi son premier
point faible, se rpercutant directement sur la complexit de recherche de chemin lin-
trieur de lenvironnement [137].
Pour rduire ce problme, une volution de ce modle est apparue sous la forme des
grilles hirarchiques [148, 124]. Cette mthode dcrit lespace navigable par une suc-
cession de grilles de plus en plus prcises, organises sous forme darbre. Lalgorithme
de construction va commencer par paver lenvironnement avec les cases les moins pr-
cises, puis dcouper rcursivement les cases partiellement obstrues, en quatre parties
pour la 2D (formation dun quadtree Figure 1.16(b)), ou en huit pour la 3D (for-
mation dun octree). Lalgorithme arrte les subdivisions ds quune prcision xe est
atteinte, ou si la case produite nest plus partiellement obstrue. Cette mthode est donc
dautant plus avantageuse que lenvironnement est peu dense en obstacles.
41
tude des circulations de personnes
(a) Grille rgulire (b) Quadtree de profondeur 3
FIG. 1.16: Exemple de grilles rgulires.
Les mthodes base de grilles sont fortement utilise en animation comportemen-
tale [66, 131] du fait de leur simplicit de mise en uvre et de leur rapidit dexploi-
tation. On peut ainsi voir des animations de milliers dindividus [132] bases sur ce
mode de reprsentation (Figure 1.17).
FIG. 1.17: Utilisation de grille en animation.
Les grilles sont trs difcilement gnralisables des environnements quelconques,
notamment sils comportent des obstacles non aligns sur les axes, et dans un cadre
de simulation o lindividu devra se dplacer nement. Nanmoins, la rapidit daccs
aux informations quelle produit fait de cette mthode un complment envisageable
une approche plus ne de reprsentation de lenvironnement. Pour nir, il faut remar-
quer que le niveau de discrtisation de la grille introduit implicitement une limite aux
densits de populations que lon peut simuler [5]. Cela rend aussi le dplacement des
entits discret, et les contraint gnralement avoir une taille standardise.
Cartes de cheminement
Les cartes de cheminement discrtisent lespace navigable sous la forme dun rseau
de chemins. Ce rseau est obtenu en reliant des points clefs rpartis lintrieur de
lenvironnement (Figure 1.18). Plusieurs mthodes existent pour crer des cartes de
cheminement, diffrentes dans la manire de crer et de relier ces points clefs.
42
Reprsentation de lenvironnement et recherche de chemin
(a) Calculs sur lenvironnement dorigine (b) Exemple de carte de cheminement
FIG. 1.18: Exemple de carte de cheminement. A gauche, triangulation de De-
launay (gris) de lenvironnement dorigine, et carte de chemine-
ment dduite (bleu). A droite, un exemple de carte de chemine-
ment obtenue.
Graphe de visibilit. Cette mthode utilise les sommets des polygones reprsentant
les obstacles comme points clefs. Les points clefs sont ensuite relis deux deux sils
sont mutuellement visibles, cest dire si lon peut tracer une ligne droite passant
par les deux points sans rencontrer dobstacle. Les graphes ainsi crs minimisent les
distances parcourues [7], assurant dobtenir des chemins de longueur minimale. La
taille du graphe gnr est ici dpendante du nombre de points mutuellement visibles,
et est donc dautant plus importante que lenvironnement est ouvert avec des obstacles
ponctuels et disparates.
Diagramme de Vorono gnralis. Cette mthode est base sur une notion dqui-
distance aux obstacles de lenvironnement. Pour se faire, un ensemble de sites sont
valus au sein de lenvironnement, correspondant aux obstacles, dont les intersections
vont former les points clefs. Les chemins ainsi gnrs maximisent la distance aux
obstacles. Ce calcul savre complexe, mais son approximation peut tre obtenue ra-
pidement par des mthodes utilisant les cartes graphiques [58], o le calcul est obtenu
directement en effectuant le rendu des sites. Une autre mthode utilise la triangulation
de Delaunay pour obtenir les points clefs du diagramme de Vorono gnralis, en se
servant du centre des triangles calculs. La carte de cheminement ainsi produite peut
tre considre comme un condens des informations de la triangulation, ne contenant
plus la dnition gomtrique des obstacles de lenvironnement.
Cartes de cheminement probabilistes. Avec cette mthode, la dnition gom-
trique de lenvironnement nest pas utilise comme support direct de la construction.
En effet, les points clefs sont ici obtenus par une distribution alatoire au sein de len-
vironnement navigable [97]. Deux points sont ensuite relis sil existe un chemin libre
de collision entre eux. Ce test est effectu en se basant sur la gomtrie de lenvi-
ronnement, mais aussi sur la taille de lentit qui se dplace. Cette mthode est plus
largement utilise en planication de mouvement [31, 109] quen navigation, an de
43
tude des circulations de personnes
gnrer des dplacements assez complexes (sauter, se baisser, marcher sur des piliers).
Pour conclure, les cartes de cheminement prsentent le net avantage de fournir une des-
cription trs condense de lenvironnement, ne ncessitant une prise de dcision quau
niveau des points clefs. Nanmoins, leur dnition seule nest pas sufsante pour grer
la complexit de la locomotion humaine. Par exemple, leur exploitation devient trs
difcile lorsquil sagit de grer le croisement des entits le long dun mme chemin.
Certaines mthodes [108] proposent de rgler ce problme en subdivisant chaque che-
min dans sa largeur, les grant ainsi comme un ensemble de rails parallles entre les-
quels vont pouvoir transiter les entits en mouvement. Mais, mme si une telle mthode
produit des animations visuellement plausibles, son fonctionnement est trop loign du
comportement humain pour tre exploit dans des simulations ralistes. Les reprsen-
tations sous forme de cartes de cheminement semblent donc bien adaptes un proces-
sus de planication de chemin gnral, ne tenant pas compte des autres entits, mais
beaucoup moins un processus de navigation, grant lui les mouvements locaux.
1.5.3 Le modle de champs de potentiels
Le modle base de champs de potentiels consiste en une dnition de lenvironnement
permettant directement de rsoudre les dplacements de personnes. Les champs de
potentiels caractrisent les obstacles de lenvironnement par des forces de rpulsion,
et les buts par des forces dattraction [117, 141]. Un gradient de forces, ou champ de
potentiel, est alors dduit en chaque point de lenvironnement comme tant une somme
pondre, le plus souvent par la distance, des potentiels de rpulsion et du potentiel li
au but (Figure 1.19). La navigation dune entit est alors simule par une descente de
gradient depuis sa position dans lenvironnement.
(a) Environnement dorigine (b) Exemple de champs de potentiels
FIG. 1.19: Carte de champs de potentiels : en noir les obstacles (rpulsion),
en blanc les zones de navigation (attraction). Le gradient de gris
exprime la valeur de potentiel dans lenvironnement. Cet exemple
contient 6 minima locaux : zones isoles potentiel dattraction
maximal.
Les mthodes bases sur les champs de potentiels savrent simples et efcaces, mais
posent le problme des minima locaux : zones de lenvironnement o un potentiel mi-
44
Reprsentation de lenvironnement et recherche de chemin
nimal isol apparat (Figure 1.19(b)). Ainsi, la mthode de navigation associe va pous-
ser lentit se dplacer vers le minimum local le plus proche, qui ne reprsente pas
forcment son but. Pour pallier ce type de problme, des mthodes base de marche
alatoire sont utilises. Par exemple, dans RPP (Random Path Planner) [16], lorsquun
minimum local est atteint, un ensemble de congurations alatoires sont tires puis tes-
tes avec une phase de sortie du minimum et une phase de convergence vers le prochain
minimum. Les informations sont alors stockes dans un graphe dont les nuds sont les
minima locaux et les arcs traduisent des chemins entre deux minima. Dautre mthodes
existent base de tirage alatoire de direction suivre [29], plutt que de conguration,
pour chapper au minimum local. Ces mthodes ne sont cependant pas trs adaptes
lanimation comportementale. Les comportements induits par les tirages alatoires,
sils sont acceptables pour des robots, ne le sont pas pour des humanodes car ils sont
en dehors de la logique de navigation humaine qui comporte une part importante de
planication.
De manire gnrale, les mthodes base de champs de potentiels ne sont pas appli-
cables directement la simulation dhumains, du fait du manque de souplesse dans la
mthode de contrle. On peut nanmoins trouver quelques cas dapplication grande
chelle [45], o le comportement individuel est noy dans la caractrisation globale
des mouvements de milliers dindividus. Notons tout de mme que cette technique a
deux grands avantages quil serait bon de conserver dans une volution permettant une
dcision individuelle plus importante. Premirement, cette mthode permet la fusion
de linformation au sein de lenvironnement, traduisant tout ce qui intervient dans la
navigation par des potentiels qui sont mlangs. Deuximement, et cest une cons-
quence directe du premier point, ces mthodes introduisent une abstraction trs forte
de lenvironnement, grce laquelle lindividu ne raisonne plus sur des entits per-
ues indpendantes (que ce soit la topologie des lieux ou les autres individus), mais
directement sur une abstraction spcialise pour sa tche de dplacement.
1.5.4 Planication de chemin
An dexploiter une reprsentation de lenvironnement, quelle soit approximative ou
exacte, les simulations microscopiques ont gnralement recours un procd nomm
planication de chemin. Ce procd peut tre compar un comportement expos en
psychologie, qui a pour but dextraire un chemin reliant la position courante de len-
tit une destination donne. Une mthode classique pour effectuer cette planication
consiste utiliser des algorithmes de parcours de graphe, bien que certaines mthodes
utilisent dautres techniques (comme la descente de gradient pour le cas des champs
de potentiel, Chapitre 1.5.3, page 44). En effet, toutes les reprsentations topologiques
que nous avons introduites sont exploitables sous la forme dun graphe de points de
passages, o les nuds reprsentent les zones navigables et les arcs les connexions
entre ces zones.
Algorithmes de parcours
Diffrents algorithmes de parcours de graphe peuvent tre utiliss dans le cadre de
la planication de chemin. Ceux que nous dcrirons ici se basent sur un critre de
minimisation de cot pour extraire le plus court chemin. Ce cot reprsente souvent
45
tude des circulations de personnes
une notion de distance spatiale, mais nous verrons dans la section suivante que des
heuristiques plus complexes peuvent tre utilises.
Dijkstra Lalgorithme de Dijkstra, aussi dnomm ood-ll [75], permet de trouver
lensemble des meilleurs chemins entre deux nuds du graphe. Cet algorithme utilise
une le de priorit o il stocke pour chaque nud explor deux informations :
la distance parcourue depuis le nud de dpart jusquau nud courant ;
le nud prcdent, i.e. parcouru avant le nud courant.
Lalgorithme commence avec un nud source correspondant gnralement la posi-
tion courante de lentit, qui na donc aucun prdcesseur et un compteur de distance
nul. Cet algorithme fonctionne directement sur le graphe topologique, quil soit expli-
cite (par exemple avec les cartes de cheminement) ou implicite (par exemple avec les
grilles). An de trouver un chemin entre deux nuds, en admettant que la longueur
de ce chemin soit l, lalgorithme explorera par propagation circulaire lensemble des
nuds se trouvant une distance infrieure l (Figure 1.20).
(a) Environnement non contraint (b) Environnement avec obstacle concave
FIG. 1.20: Fonctionnement de lalgorithme de Dijkstra dans des cas
contraints ou non [101]. Le carr rose reprsente le nud source,
le mauve la destination. Le gradient de bleus correspond la dis-
tance lorigine, le plus clair tant le plus loign.
Les intrts majeurs de cet algorithme sont sa robustesse (si un chemin existe il sera
forcment trouv) et son abstraction totale de la destination, si ce nest comme condi-
tion de n. Son point faible est sa complexit calculatoire, tant de lordre de O(A+
N. logN) o A est le nombre darcs du graphe, et N son nombre de nuds. Malgr
tout, ce point faible peut aussi tre un avantage, lalgorithme supportant des recherches
guides par un but plus conceptuel, associ la smantique des nuds parcourus.
A
*
Dans les cas o la performance de la recherche est primordiale, comme en anima-
tion comportementale (dans le cas des jeux vidos par exemple), lalgorithme A
[93]
est plus utilis. Celui-ci fonctionne dune faon similaire lalgorithme de Dijkstra,
mais en ajoutant un cot prdictif aux nuds correspondant au reste du chemin par-
courir. Le cot total est donc la longueur relle du chemin jusquau nud, incrmente
par une valeur prdite pour le chemin menant au but, calcule par une heuristique.
Lalgorithme va ainsi parcourir les nuds dans lordre croissant de leurs cots associs
(Figure 1.21). La rapidit de convergence de cet algorithme est directement dpen-
dante de la qualit de lheuristique employe. Dans le cas de la recherche de plus court
46
Reprsentation de lenvironnement et recherche de chemin
chemin, lheuristique employe est une estimation de distance, gnralement la norme
gomtrique sparant le nud courant du but.
(a) Environnement non contraint (b) Environnement avec obstacle concave
FIG. 1.21: Fonctionnement de lalgorithme A
with Bounded Cost), permettant dajouter des contraintes molles respecter lors de
la planication, comme des limitations de temps ou dnergie.
Lalgorithme IDA
) consiste redcouper
abstraire le graphe de lenvironnement an de hirarchiser la planication. Ensuite,
lalgorithme propose dassocier des pr-calculs de plus courts chemins entre des points
clefs de chaque partie abstraite. Ainsi, cet algorithme va pouvoir valuer un chemin de
haut niveau en ne manipulant que peu de nuds.
47
tude des circulations de personnes
Critres de planication de chemin
Diffrents critres peuvent tre valus pour le cot des algorithmes prcdents. Les
plus anciennes mthodes, ainsi que la plupart de celles utilises en animation, se basent
uniquement sur la distance sparant les nuds. Mais, comme lont montr les tudes
en psychologie prsentes au dbut de ce chapitre, cette information de distance est
ncessaire, mais certainement pas sufsante pour rendre compte de la complexit du
raisonnement humain. Ainsi, dans des simulations se voulant plus ralistes, dautres
critres dvaluation sont proposs.
H.H. Hochmair et V. Karlsson [57] introduisent la notion de dviation minimale, en
tenant compte des changements de direction dans le cot associ un chemin. Ils
prennent aussi en compte des facteurs qualitatifs via des prfrences, ainsi quune
connaissance relative lenvironnement. M. Duckham et L. Kulik [38] prennent en
compte le concept de charge cognitive associe la recherche dun chemin, avec une
stratgie de chemin le plus simple. Un autre paramtre, fondamentalement li aux
foules dindividus, est la congestion dune zone de lenvironnement [124]. Un facteur
de stress [96] peut aussi tre appliqu, li au nombre de personnes dans lenvironne-
ment immdiat ainsi qu la dviation par rapport au chemin le plus court.
On peut ainsi voir que de nombreuses mthodes sont proposes an de quantier et
qualier un chemin dans lenvironnement. Malgr tout, peu de ces mthodes associent
plusieurs critres la fois. Mme sil semble que la fusion de ces informations soit
ncessaire pour se rapprocher dune procdure raliste, le problme de trouver une base
de comparaison entre des donnes de nature diffrentes na pas encore, aujourdhui, t
rsolu. Le mlange des critres parat donc essentiel pour considrer lapplication des
mthodes de planication de chemin la simulation dhumains virtuels.
1.5.5 Synthse
Nous avons expos dans ce chapitre les techniques permettant une approche plus ra-
tionnelle des circulations de personnes. Nous avons ainsi trait la reprsentation de
lenvironnement, et son exploitation lors de la planication de chemin.
Le premier point que lon peut soulever est la difcult dassocier ralisme et perfor-
mances. Notamment concernant les reprsentations de lenvironnement, on a pu voir
que les versions approximatives offrent un accs rapide la description topologique,
alors que les approches exactes permettent la conservation maximale de linformation
gomtrique. Il est indniable que dans le cadre de simulations devant produire des
rsultats comparables au rel, le ralisme prend la place la plus importante.
Lautre point concerne les paramtres devant tre pris en compte pour valuer un che-
min. Certain de ces paramtres sont mis en avant par diffrentes tudes, mais aucune
comparaison de leur importance relative nest disponible. On peut nanmoins dduire
des tudes psychologiques que plusieurs de ces paramtres doivent tre pris en consi-
dration simultanment.
48
Techniques de validation
1.6 Techniques de validation
La simulation aussi bien que lanimation sont deux domaines ayant la volont de pro-
duire des rsultats aussi ralistes que possible. Ce qui va les diffrentier en premier
lieu est la dnition de ce ralisme. L o lanimation va chercher produire un ra-
lisme visuel probant, la simulation va plus se concentrer sur le ralisme des donnes
manipules et produites.
La difcult dans ce deuxime cas est de caractriser le ralisme de labondance des
donnes de sortie, difcilement comparables avec le rel. En effet, il nest pas rai-
sonnable de vouloir directement confronter un modle reproduisant les circulations de
personnes avec des trajectoires issues dexprimentations relles, mme obtenues dans
des situations environnementales identiques. La premire raison vient du fait quil est
impossible de contrler parfaitement une procdure exprimentale impliquant des hu-
mains. En effet, on ne peut garantir quun individu se comportera tel que dnit dans
un protocole exprimental, que ce soit du fait de son apprentissage des situations rp-
tes, ou de son incapacit produire un comportement constant et non bruit (comme
le maintient dune vitesse de marche donne). La deuxime explication est que les
modles existants font abstraction dun certain nombre de facteurs modiant les tra-
jectoires individuelles, tels que les relations sociales ou mme ltat desprit (press,
timide, etc.), qui vont donc tre sources de perturbations dans des expriences contr-
les. Les procds de validation se tournent donc vers des comparaisons plus macro-
scopiques, impliquant des enqutes grande chelle visant caractriser des attitudes
globales.
Ltape suivante de cette validation est donc lanalyse des rsultats de simulation,
an dattester de la pertinence du modle gnrateur. Cette analyse peut prendre deux
formes : soit qualitative par lobservation de phnomnes mergeants, soit quantitative
par ltude des donnes produites.
1.6.1 Analyse du rel
Lanalyse du rel est la premire tape dune validation. Elle vise caractriser les ph-
nomnes importants dune situation, devant tre reproduits lors de la simulation. Le but
est donc double : synthtiser les faits ncessaires et sufsants un cadre dtude et en
extraire les valeurs qualitatives et si possible quantitatives depuis des expriences. Ce
deuxime point est loin dtre trivial, reposant comme nous lavons dit prcdemment
sur des conditions majoritairement incontrlables.
Dans le cadre des circulations de personnes, deux produits de sortie sont extrme-
ment importants : les vitesses de mouvement ainsi que les trajectoires. Ces paramtres
doivent tre corrls aux caractristiques environnementales de lexprience : densits
de personnes, topologie des lieux, ou encore typologie de comportement (par exem-
ple pour une gare, diffrencier le voyageur de tourisme de lhabitu pour son trajet de
travail). Deux approches sont alors possibles pour tudier le rel.
Premirement, il est possible deffectuer une exprience dans un environnement contrl,
o lon mettra en situation ce que lon veut caractriser. Ainsi, D. Helbing et al. [53] ont
conduit des sries dexpriences mettant en scne des cas environnementaux typiques :
couloir, croisement, rtrcissement (Figure 1.22). De cette faon, ils ont pu qualier
49
tude des circulations de personnes
un certain nombre dorganisations mergeant du but assign aux participants, ainsi que
de la conguration topologique. On peut regretter ici que ces observations naient pas
t rapproches de diffrentes chelles environnementales, les dimensions de ltude
tant rarement observes dans la ralit. On peut alors douter de la pertinence de ces
mesures, celles-ci ne reprsentant pas vritablement un cas rel. Toujours en utilisant
des vidos, mais pour produire des rsultats quantitatifs cette fois-ci, W. Damen et
S.P. Hoogendoorn [33] ont reproduits des situations comparables celles tudies par
D. Helbing. Par lanalyse des vidos ils ont ensuite extraits les trajectoires des per-
sonnes ainsi que leurs vitesses corrles la densit. Ils se placent ainsi dans le mme
cadre que les niveaux de services, mais en spciant cette fois-ci plus fortement les
conditions globales o ont t effectues les mesures.
FIG. 1.22: Analyse du rel par exprience contrle. A gauche une photogra-
phie de lexprience, droite sa reprsentation schmatique.
Deuximement, il est possible dobserver des environnements non contrls, puis ex-
traire de ces observations les situations auxquelles elles se rapportent. Ainsi, J.L. Ber-
rou et al. [17] ont effectu une somme consquente de captures puis danalyses de vi-
dos dans diffrents lieux. Ils ont ensuite synthtis ces analyses sous forme de tables
indiquant les vitesses moyennes des populations observes (Figure 1.23). K. Teknomo
et al. [135] proposent aussi un systme bas sur lanalyse de vidos, visant auto-
matiser totalement le processus depuis lacquisition jusqu lextraction des valeurs
souhaites (densits etc.), en passant par lidentication des dplacements individuels.
FIG. 1.23: Analyse du rel par observations. A gauche une image tire dune
squence vido, droite la synthse des rsultats.
Dautres approches que lanalyse vido existent. Par exemple J. Kerridge et al. [63]
utilisent des dtecteurs pyrolectriques qui, une fois placs la verticale de la zone
tudie, vont permettre dextraire en temps rel les trajectoires individuelles par une
comparaison des variations de temprature. Ils reconstruisent ensuite, partir de ces
captures, des informations de densits, de ots, de vitesses, et aussi les comptages aux
entres/sorties.
50
Techniques de validation
1.6.2 Analyse du simul
Lanalyse du simul, et donc sa comparaison au rel, est la deuxime tape dune proc-
dure de validation. Cest une tape cruciale pour permettre lexploitation dun modle
en simulation. Elle permet en effet den attester la pertinence, mais aussi den xer le
cadre dapplication.
La plupart des justications de modles consiste en faire une comparaison qualitative
des situations observes. Ainsi, D. Helbing et al. [53] fondent la validit de leur
modle sur la reproduction macroscopique de congurations identiables, telles que la
formation de les ou la logique de croisements de ux. Ce type de validation est trs
souvent utilis en animation, le but y tant purement de reproduire visuellement les
mouvements pdestres. Elle reste nanmoins valable en simulation si lon considre
les phnomnes mergeants des circulations de personnes.
Une autre approche, plus quantitative, est aussi utilise en simulation. Le but est ici
de reproduire les mesures effectues sur le rel dans des simulations dont ltat initial
correspond. Ainsi, J.L. Berrou et al. [17] procdent la simulation de lieux lms, et
comparent les organisations spatiales obtenues, mais aussi les densits et vitesses de
dplacement, avec des relevs issus du cas rel (Figure 1.24). Une autre faon de pro-
cder est dextraire des donnes statistiques de la simulation [128], et de les comparer
aux valeurs que lon peut trouver dans la littrature, tels que les niveaux de services de
J.J. Fruin.
FIG. 1.24: Comparaison rel/simul. A gauche une image tire dune s-
quence vido, droite la mme situation reproduite par simula-
tion.
Certains essayent aussi de caractriser des rgles mathmatiques depuis les expriences
menes, pour obtenir un modle directement issu du rel. Ainsi, K. Teknomo et al. [133,
134] proposent une srie de formules visant caractriser les vitesses et espaces per-
sonnels des pitons. Le principe est dattester de la validit du modle par son labo-
ration directement partir des donnes quantitatives observes. Nanmoins, une telle
approche conduit lapproximation et la discrtisation du rel, aboutissant gnrale-
ment des modles au cadre dapplication trs restreint.
1.6.3 Synthse
Nous avons vu dans ce chapitre le principe de la validation des modles de circulation
de pitons. Cette thmatique est dautant plus importante aujourdhui que les modles
se complexient, devenant ainsi sensibles de plus en plus de paramtres environne-
mentaux.
51
tude des circulations de personnes
Les techniques que nous avons vues sont majoritairement bases sur lanalyse vido.
Celle-ci est avantageuse de par son faible cot et sa facilit de mise en uvre, of-
frant des conditions exprimentales idales. Nanmoins elle a deux principaux incon-
vnients. Premirement, si lon considre la caractrisation de phnomnes globaux,
lchelle dun btiment par exemple, cette mthode est difcilement applicable de
par sa faible couverture de lenvironnement. Il est alors possible dutiliser un grand
nombre de camras pour collecter de linformation sur des points clefs identis, mais
reste alors le problme de corrler les informations entre elles. Deuximement, si lon
se place au niveau microscopique cette fois-ci, pour lanalyse ne des logiques de na-
vigation, le problme de limprcision des rsultats se pose. En effet, les paramtres
inuents dun modle de navigation peuvent tre la distance danticipation, la variation
de vitesse, ou encore de direction. Ces variations peuvent tre trs faibles et ponc-
tuelles, risquant dtre perdues cause du bruit impliqu par la mthode danalyse des
vidos (par dtection de contours).
Concernant la comparaison rel/simul, deux approches sont utilises. La premire,
qualitative, sappuie sur les phnomnes mergeants observables des circulations de
personnes. La seconde, quantitative, repose sur les donnes caractristiques de ces si-
mulations, principalement les densits et vitesses des personnes. Il parat donc essentiel
de combiner ces deux approches, an de garantir au maximum la robustesse des rsul-
tats produits.
1.7 Conclusion
Nous nous sommes penchs tout au long de ce chapitre sur la caractrisation et la
reproduction de la circulation pdestre humaine. Nous avons ainsi pu aborder les prin-
cipes psychologiques rgissant cette navigation, des tudes statistiques portant sur le
dplacement, ainsi que les deux approches informatiques macroscopique et micro-
scopique simulant ce comportement. De nombreuses donnes, aussi bien qualitatives
que quantitatives, sont issues de ces diffrentes tudes, et peuvent tre appliques par
dautres modles que celui dorigine, dans des cadres restreints.
De manire gnrale, les modles microscopiques offrent le plus de souplesse dans
leur contrle, et sont ainsi ceux qui permettent denvisager le plus dvolutions. Les
modles microscopiques rcents sont gnralement organiss sous la forme de trois
tapes permettant de reproduire le phnomne de circulation pdestre. Premirement,
reprsenter lenvironnement par une certaine forme dabstraction pour en faciliter lex-
ploitation. Conjointement cette reprsentation, une phase dobservation a comme but
dextraire les informations dynamiques locales, comme le mouvement des autres enti-
ts. Deuximement, analyser les donnes de lenvironnement qui sont disposition. Ce
deuxime point se dcoupe en deux phases : lune globale, o lentit va valuer gros-
sirement son chemin par le processus de planication ; lautre locale, o lentit va
adapter sa locomotion an de grer son interaction avec les autres, par le processus de
navigation. Troisimement, effectuer le dplacement propre de lentit au sein de len-
vironnement, en tenant compte de son but gnral ainsi que des adaptations locales.
On voit bien ici se mettre en place la boucle perception - dcision - action voque en
psychologie.
Ces modles doivent ensuite tre valids par une comparaison au rel pour en attester la
52
Conclusion
pertinence. Cette tape est cruciale pour une application dans un cadre de simulation.
Elle se droule en deux phases, la premire ayant pour rle dextraire des donnes
depuis le rel, la deuxime cherchant comparer ces donnes au simul. Une telle
comparaison peut tre qualitative ou quantitative, ces deux aspects tant importants
pour ltude des phnomnes sous-jacents des circulations de personnes.
Pour nir, signalons que les mthodes de contrle de plus haut niveau du comportement
humain ne sont pas abordes par les modles que nous avons prsent ici. Nanmoins,
le dplacement au sein de lenvironnement nest en gnral pas une n en soi, mais
une action entreprise pour rpondre un but plus global. Il semble alors ncessaire de
proposer des modles pour grer cet aspect dcisionnel.
53
Chapitre 2
Modles de comportement
Bien que la capacit se mouvoir soit un comportement primordial de ltre humain, ce
qui le caractrise vraiment est sa capacit raisonner. En effet, un individu est capable
de symboliser mentalement les actions quil veut excuter, pour ensuite les organiser.
Il est ainsi capable dlaborer un plan comportemental lui permettant dordonner ses
actions, et de grer leurs liens de dpendance. Ce raisonnement va ainsi avoir un impact
direct sur son dplacement.
Les tches mentales prpondrantes concernant laction dun individu sur son environ-
nement sont sans doute les tches dinteraction. Celles-ci dnissent la manire dont
lindividu va pouvoir affecter dautres entits, et ainsi modier ltat du monde qui
lentoure. Ces tches dinteraction entrent elles mme dans un processus mental com-
plexe, pouvant tre directement dsires par lindividu, ou symboliser une tape de son
raisonnement. Nous allons dans ce chapitre tudier les modles existants qui tentent de
reproduire ce processus mental.
Dans un premier temps, section 2.1, nous allons rapidement survoler les approches
psychologiques dnissant le cadre de la pense humaine. Ensuite, section 2.2, nous
prsenterons les modles informatiques simulant le comportement humain. Nous nous
rapprocherons ensuite du chapitre prcdent en prsentant, section 2.3, les modles
permettant de situer la connaissance dans un environnement. Nous nirons, section 2.4,
avec les architectures multi-couches, qui vont associer des processus de dcision des
comportements ractifs, dont notamment la capacit se mouvoir.
2.1 Psychologie du comportement
Le comportement humain, bien quayant des effets pouvant tre caractriss assez
facilement, sous-entend des mcanismes aussi complexes que nombreux, tels que le
contrle musculaire, la perception, la mmoire, les motions, la communication, ou
encore la projection mentale. Plusieurs approches psychologiques et sociologiques
tentent de synthtiser et danalyser ce comportement humain, la plus approprie notre
cadre dapplication tant la psychologie cognitive.
Lapproche cognitive explicite les processus dacquisition puis dutilisation des connais-
55
Modles de comportement
sances et des performances les moyens dagir dans des situations standardises.
Pour se faire, deux moyens sont principalement utiliss. Premirement, limagerie c-
rbrale tudie de faon concrte la biologie de la pense [110]. Deuximement, une
mthode plus symbolique modlise le comportement par un ensemble de modules in-
terdpendants, pouvant sorganiser hirarchiquement [15].
Nous allons nous concentrer dans cette section sur cette mthode symbolique, bien plus
proche des modles informatiques. Nous verrons ainsi que lapproche cognitive est
particulirement adapte notre problmatique, et dtaillerons les quelques principes
ncessaires notre cadre dtude.
2.1.1 Linteraction au centre du comportement
Linteraction est dnie comme laction rciproque de deux corps. La thorie cognitive
du comportement place cette interaction au centre du processus comportemental hu-
main, en posant que lun des protagonistes est lindividu et lautre son environnement.
En se basant sur cette thorie, H. Mallot [82] constate que la plupart des fonctions
crbrales servent grer le comportement dun organisme vis--vis de son environ-
nement. Il met en place un schma de rtroaction expliquant le fonctionnement du
comportement (Figure 2.1). Ici, toute information assimile par lorganisme provient
de capteurs, tandis que toute action est produite par des effecteurs. Il explique quil
existe trois types de retour depuis les effecteurs vers les capteurs :
Lhomostasie qui est interne lorganisme, et soccupe de la rgulation des para-
mtres biologiques en fonction des variations du milieu ambiant.
Lacquisition qui sert la perception.
Linteraction avec lenvironnement, seul phnomne perceptible.
FIG. 2.1: Les boucles de rtroaction, daprs H. Mallot.
H. Mallot [83] effectue aussi une catgorisation des comportements humains en quatre
niveaux de complexit :
1. Premirement, les comportements rexes de type attraction / rpulsion peuvent
tre dnis par une interconnexion entre les capteurs et les effecteurs.
2. Le deuxime niveau dcrit des comportements de type manuvre qui ncessitent
une intgration spatio-temporelle.
56
Psychologie du comportement
3. Le troisime niveau soccupe de lapprentissage, et est intimement li aux don-
nes sensorielles.
4. Enn, le quatrime niveau, dnomm cognitif, tient compte du but courant de
lindividu, et sinscrit donc dans un processus plus long terme.
Une approche comparable cette classication est la thorie du contrle. Celle-ci est
issue de travaux en biologie, avec des expriences sur des tres vivants en situation
dasservissement. Son principe de base dnit que lorsque ltat dun organisme est
diffrent de celui dsir, lorganisme va modier son comportement par une srie dac-
tions an de minimiser cet cart. Ainsi, R. Lord et P. Levy [78] reprennent, avec cette
thorie du contrle, le principe de rtroaction tout en ltendant la rgulation des com-
portements sociaux. Pour eux, ces boucles de rtroaction sont organises hirarchique-
ment, avec une notion de complexit croissante, permettant une grande gnricit de
la prise de dcision. Ainsi, chaque niveau traitera dun ensemble de tches spciques,
tout en fonctionnant suivant le principe de minimisation derreur.
A. Newell [92] propose une classication de ces niveaux comportementaux hirar-
chiques (Figure 2.2). Il indique que chaque niveau a un fonctionnement propre, mais
peut communiquer avec et donc inuencer ses voisins immdiats, sans pour autant
avoir besoin de connatre leur fonctionnement interne. Ce principe est dautant plus
intressant en informatique, car directement transposable sous la forme dun modle
compos de botes noires, devant tre capables de communiquer des informations. La
difcult rside alors dans cette transmission dinformation, devant tre sufsamment
synthtique tout en conservant un maximum dexpressivit.
FIG. 2.2: Hirarchisation des comportements illustre par A. Newell dans sa
pyramide comportementale.
2.1.2 Symbolisation des connaissances
Lune des tapes indispensable dans le comportement des humains concerne la symbo-
lisation des connaissances. Cette symbolisation des connaissances permet un tre hu-
57
Modles de comportement
main de se reprsenter mentalement le monde dans lequel il volue, et donc de pouvoir
raisonner sur des choses quil ne peroit pas directement. Comme le signale A. Ber-
thoz [18], le processus de dcision est intimement li la capacit de ltre humain
de se projeter dans le futur, de se reprsenter mentalement une action et son effet sur
lui-mme et lenvironnement. Trois mcanismes entrent en compte dans cette symbo-
lisation des connaissances :
La perception : acquisition dinformations.
La mmoire : stockage de linformation.
Ce que nous nommerons la cognition : organisation et exploitation de linformation.
La perception
Le but de la perception nest pas de fournir la description gnrale dune
scne mais dextraire une information spcique pour la tche implique
dans lactivit en cours.
W. Warren [145]
Cette citation de W. Warren dnit la perception comme un processus actif, analysant
les informations perues au fur et mesure pour en extraire les donnes pertinentes
compte tenu de lactivit actuelle. Cette extraction de donnes peut tre considre
comme la premire phase de la symbolisation des connaissances, o ltre humain doit
associer une symbolique aux informations an de pouvoir les trier.
J.J. Gibson, avec son approche cologique de la perception [44], propose dassocier
les capacits daction directement aux objets perus dans lenvironnement. Il introduit
ainsi le terme daffordance, qui exprime une potentialit daction offerte par un objet
un individu. Il gnralise ce principe en prcisant que les affordances perues sont dif-
frentes pour un mme objet suivant lindividu qui lobserve. Grce cette thorie, un
environnement va pouvoir renseigner un observateur quelconque sur ses potentialits
dinteraction, lui permettant une symbolisation immdiate.
La mmoire
La mmoire est le deuxime mcanisme intervenant dans le raisonnement. Cest par la
mmorisation de fait dans lenvironnement que lindividu va pouvoir raisonner sur des
situations non observables directement. Cest aussi par un processus de renforcement
mmoriel que ltre humain est capable dapprendre des choses, que ce soit des faits
ou des actions, et ainsi de sadapter rapidement des situations connues.
Nous avons dj vu, dans le chapitre 1.1.1 (page 10), une sous partie du mcanisme m-
moriel humain concernant la topologie des lieux. De manire plus gnrale, R.C. At-
kinson et R.M. Shiffrin [8] ont propos un modle de la mmoire en deux parties, les
mmoires court et long terme, qui a ensuite t tendu avec la mmoire sensorielle
(Figure 2.3).
La mmoire sensorielle est directement en relation avec les capteurs de lindividu, ser-
vant ainsi de tampon aux stimuli perus par les cinq sens de ltre humain. La persis-
tance des informations y est trs courte, de lordre de la seconde. De mme, sa capacit
est limite et directement corrle au sens auquel elle est rattache. Le type dinfor-
mation quelle manipule est brute, sans aucun processus de symbolisation. Cest cette
58
Psychologie du comportement
FIG. 2.3: Le modle de mmoire en 3 parties.
mmoire qui permet ltre humain de ragir de traiter un vnement aprs sa
perception, comme entendre quelquun poser une question alors que lon ntait pas en
train de lcouter attentivement.
La mmoire court terme, aussi dnomme mmoire de travail, constitue le centre du
raisonnement humain. Cest dans cette mmoire que vont seffectuer les associations
dides, et ainsi la prise de dcision. Sa dure de vie est assez courte, une vingtaine de
secondes [107], et sa capacit denviron sept blocs dinformation [87]. Le type dinfor-
mation manipul ici est symbolique, chaque bloc reprsentant un concept identiable.
Par exemple, les lettres VTG prises de faon alatoires forment trois blocs mmoire,
mais mises dans lordre TGV (Train Grande Vitesse) nen forment plus quun car
associes un concept unique. Un processus de renforcement va permettre aux infor-
mations redondantes de la mmoire court terme de devenir plus permanentes, via un
phnomne de stockage.
Ce stockage est effectu dans la mmoire long terme. Sa dure de vie est trs longue,
considre permanente, et sa capacit de stockage est non limite. Le type dinforma-
tions stockes ici nest plus atomique, comme dans la mmoire court terme, mais
consiste plus en des schmas associatifs entre ces informations atomiques. Ces sch-
mas serviront ensuite lors du mcanisme de rappel, qui va rcuprer de linformation
pour la mmoire de travail par corrlations avec un ensemble de donnes qui y sont
manipules. L.R. Squire et N.J. Cohen [126] dcoupent cette mmoire long terme
en deux parties : la mmoire procdurale, qui manipulent des informations lies au
savoir faire, et la mmoire dclarative, qui concerne les informations lies la connais-
sance des choses. Comme nous le verrons par la suite, un tel dcoupage est utilis dans
llaboration de modles informatiques.
La cognition
Le dernier mcanisme impliquant la symbolisation des connaissances concerne leur
utilisation pour organiser les actions entreprises par ltre humain. Une telle organisa-
tion a pour but de slectionner les tches atomiques accomplir immdiatement, tout
en considrant ces tches dans leur ensemble, pouvant former un but complexe.
T. Shallice [123] propose deux mcanismes pour la slection daction. Premirement,
le pilotage automatique qui est utilis pour les actions routinires, correspondant aux
tches devenues tellement courantes pour lindividu quelles peuvent pratiquement tre
considres comme rexes. Deuximement, le systme attentionnel de supervision
qui est utilis pour les actions nouvelles, peu courantes, ou difciles. Un exemple illus-
59
Modles de comportement
trant ce principe est la conduite automobile : lors de lapprentissage, lindividu doit
se concentrer exclusivement sur sa tche, tandis quavec lhabitude, il peut effectuer
simultanment dautres actions, comme discuter ou couter de la musique, ne faisant
alors plus deffort mental pour changer de vitesse par exemple.
Selon W.J. Clancey [32], un but nest pas forcment un problme rsoudre, et une
action nest pas forcment induite par une tche accomplir. Il prcise que certaines
activits sont simplement motives par un aspect culturel. Clancey fait aussi tat dun
mcanisme dactivation comptitive impliqu dans la slection dactions, bas sur un
couplage des modes squentiel, permettant dordonner les actions, et parallle, permet-
tant de combiner plusieurs activits.
Certains comportements sont orients vers la rsolution de buts futurs, et donc ne sont
pas valus grce aux perceptions immdiates. Lexemple le plus simple est celui que
nous avons vu dans le chapitre prcdant, concernant la planication dun chemin, o
lindividu ne va certainement pas percevoir lintgralit de son parcours au moment
de son valuation. Il apparat alors que lapproche symbolique pure ne suft pas pour
rsoudre ces comportements, ncessitant une projection de lindividu dans le temps
et lespace. Cest cette ncessit que tente de rpondre la cognition incarne et si-
tue [149] : incarne car base sur des expriences corporelles relles, et situe car en
relation troite avec la reprsentation mentale quun individu peut avoir de son environ-
nement. Lintelligence dun humain est ici dnie comme la somme des expriences
corporelles acquises au travers de son interaction avec lenvironnement [143]. Mais
mme si ce principe parat totalement justi pour les comportements ractifs simples,
il nen reste pas moins ncessaire de maintenir une reprsentation symbolique, plus
abstraite, concernant les comportement cognitifs de plus haut niveau.
Selon M.E. Bratman [25], les intentions, contrairement aux dsirs, sont des pro-
attitudes qui contrlent la conduite. En revanche, les dsirs ordinaires ninuencent
laction que de faon potentielle . Il dnit ainsi deux mcanismes contrlant les
actions dun individu : une intention stable sur le long terme, et un dsir phmre.
Ces deux principes signalent une certaine stabilit du raisonnement, lindividu tant
capable de dlibrer entre plusieurs de ses dsirs, pour en extraire une intention quil
conservera sur le long terme, ne faisant que rarement lobjet dune nouvelle dlib-
ration lorsque dautres dsirs apparaissent. M.E. Bratman base cette thorie sur trois
constats concernant le raisonnement humain [26] :
1. Les ressources cognitives dun tre humain sont limites, chaque dlibration en
ncessitant une partie. Il est donc logique quil ne remette pas continuellement
en question les plans quil tablit.
2. An de pouvoir cooprer avec dautres agents rationnels, un tre humain doit leur
permettre de prdire son comportement. Ceci nest possible que si une relative
stabilit est maintenue vis vis du plan de ses actions.
3. Il est possible quun tre humain doive effectuer un choix dans des situations o
il na pas de prfrence pour les alternatives qui lui sont proposes. Il doit donc
tre capable de maintenir son choix une fois celui-ci fait.
2.1.3 Synthse
Nous avons succinctement prsent dans cette section des travaux dun domaine sp-
cialis de la psychologie que sont les sciences cognitives. Cette approche tente dexpli-
60
Modles de comportement
quer le comportement humain par un ensemble de modules spcialiss communiquant
les uns avec les autres. Nous pouvons retenir les principes suivants concernant le com-
portement humain :
Le premier mcanisme intervenant dans tout comportement est la perception.
Les bases du raisonnement sont intimement lies la mmoire individuelle.
Une hirarchisation du comportement semble exister, si ce nest au niveau de sa
reprsentation, au moins au niveau de son excution.
Linteraction avec lenvironnement est toujours implique dans un comportement,
que ce soit comme cause ou comme effet.
Le raisonnement dun individu implique des reprsentations mentales de son envi-
ronnement et de son propre corps.
Il existe une relative stabilit dans le raisonnement humain, une dcision prise ntant
que difcilement remise en question.
Nous verrons que certains de ces principes sont appliqus dans des modles infor-
matiques tentant de reproduire soit le comportement observable dun individu, soit sa
capacit raisonner. Malgr tout, compte tenu de la complexit et de lampleur du pro-
blme, aucune architecture logicielle ne permet aujourdhui de reproduire lintgralit
du comportement humain. Nous pouvons nanmoins conclure que si nous voulons nous
approcher dune simulation comportementale raliste, le modle informatique propos
devra prendre en considration ces principes rgissant le comportement, le plus im-
portant tant, dans notre cas dtude, le principe de projection dans le temps et dans
lespace.
2.2 Modles de comportement
La reproduction dune certaine forme de raisonnement humain tait lorigine du do-
maine de lintelligence articielle. Avec la dmocratisation des jeux vidos, puis des
logiciels de simulations, ce sujet est peu peu devenu une proccupation majeure des
communauts graphiques, rsultant en la cration de la thmatique danimation com-
portementale. Dabord consacre la reproduction du dplacement des individus, ce
domaine de recherche sest de plus en plus tourn vers la rsolution de comportements
plus complexes.
Au cours de cette section, nous prsenterons donc deux catgories dapproches utilises
pour simuler le comportement. Premirement, les modles ractifs o le raisonnement
court terme est prpondrant. Deuximement, les modles rationnels qui tentent de
reproduire le raisonnement long terme.
2.2.1 Comportement ractif
Les comportements ractifs sont ceux qui font le moins intervenir la capacit dcision-
nelle rchie dun tre humain, ne ncessitant que peu ou pas de symbolisation des
connaissances. Ce sont les comportements qui correspondent ltage conscient le plus
bas dans la pyramide de A. Newel (Figure 2.2, page 57). Ils peuvent tre classis en
deux catgories.
Tous dabord, les comportements rexes, issus dune raction automatique un v-
61
Modles de comportement
nement. On peut ici parler de comportement pr-cbl, o leffecteur de lorganisme
va directement ragir un stimulus peru par un capteur, sans avoir recours au proces-
sus de slection daction, et donc sans que linformation transite jusqu la mmoire
de travail. Les insectes fonctionnent pratiquement exclusivement avec ce type de com-
portement, et pour un tre humain on peut prendre pour exemple lquilibre, qui sera
conserv par une action rexe des muscles pilote par loreille interne.
La deuxime catgorie est plus proche de ltage dcisionnel. Elle correspond len-
semble des comportements spcialiss auxquels peuvent avoir recours les procdures
cognitives plus complexes. Ces comportements sont usage tellement courant que leur
renforcement les a ancrs au plus profond du processus dcisionnel, ne ncessitant
donc plus deffort conscient pour y avoir recours. Lexemple dj utilis de la conduite
automobile illustre cette catgorie de comportements, o un conducteur conrm ne
sera plus conscient quil change les vitesses au cours de son parcours, mais seulement
du chemin quil est en train de suivre.
Il existe principalement trois modles pour reproduire ces comportements : stimu-
lus/rponse, bass rgles, et les automates.
Stimulus/rponse
Les modles stimulus rponse sont directement bass sur le principe de pr-cblage.
Ils vont modliser le comportement comme la transformation de signaux tout au long
du parcours entre les capteurs et les effecteurs.
Les systmes base de rseaux de neurones [3] entrent dans cette catgorie. Ces r-
seaux sont capables dapproximer une fonction continue avec nimporte quel degr
de prcision. Il vont ainsi reprsenter le processus de dcision en essayant de repro-
duire ses caractristiques biologiques : un graphe de modules calculatoires trs simples
mais trs nombreux. Ce principe a t utilis par M. van de Panne [142] pour crer un
contrle lmentaire de la locomotion.
Le dfaut majeur de ces modles rside dans leur trs faible niveau dexpressivit. Il
est ainsi facile dexprimer un problme mathmatique boolen avec ces rseaux, mais
la cration dun comportement plus complexe conduit une explosion de la complexit
du graphe. De plus, chaque neurone du graphe ayant un fonctionnement indpendant,
la cration dune conguration prcise est elle aussi trs complique, ncessitant le
paramtrage complet du systme. Lavantage majeur de ces procdures est quelles
supportent lapprentissage par renforcement, do lutilisation des rseaux de neurones
en intelligence articielle, notamment pour la cration de classieurs [80].
Bass rgles
Tout comme la prcdente approche, les modles bass rgles vont traiter un ensemble
de stimuli produits par diffrents capteurs. Par contre, le processus de dcision peut ici
tre plus abstrait, permettant un module de traiter totalement une tche et de produire
le contrle adquat. Ces rgles peuvent tre planes, reprsentant des comportements
relativement indpendants, ou organises hirarchiquement, sous forme darbre, an
de grer lenchanement des actions.
Nous avons dj vu, dans la section concernant les modles microscopiques (Sec-
62
Modles de comportement
tion 1.4.2, page 35), un de ces modles bas rgle spcialis dans la gestion du compor-
tement de navigation, avec les ocks de C. Reynolds [121]. Ce principe a t repris par
F. Lamarche et al. [70] ainsi que W. Shao et al. [124], toujours en organisant les rgles
de faon plane et en les valuant itrativement pour converger vers un rsultat. Notons
que ces rgles planes ne sont gnralement utilises que pour simuler des comporte-
ments simples, comme des animaux, ou dans un cadre trs restreint pour lhumain. En
effet, avec la multiplication du nombre de rgles le problme de la concurrence prend
de plus en plus dampleur avec cette approche, qui ne dispose pas de mcanisme expli-
cite pour la gestion des conits. Une consquence en est lapparition de discontinuits
dans le comportement, pouvant aboutir des oscillations de la prise de dcision.
Lorganisation sous forme darbre se rapproche plus du processus dcisionnel [20].
Chaque nud de larbre reprsente ainsi une action atomique, et cest le parcours de
larbre, par des algorithmes classiques, qui simulera le processus de dcision. Notons
tout de mme que cette organisation est bijective avec les rgles planes, et ne constitue
donc quun instrument de modlisation. Nous reviendrons sur cette approche dans la
section suivante.
Automates
Les approches base dautomates sont les plus rcentes pour simuler les comporte-
ments. Ces approches se basent sur la forte expressivit procure par les reprsentations
en machines tats pour dcrire nement les tapes et enchanements dactions dun
comportement. Ainsi, chaque action dun comportement sera reprsente par un tat de
lautomate, tandis que les possibilits dadaptation seront identies par les transitions.
O. Renault et al. [120] ont t des pionniers dans lutilisation de cette technique pour
la simulation de navigation dtres humains. Du fait de sa souplesse dutilisation, ce
procd sest rapidement rpandu dans la communaut informatique. Certaines vo-
lutions ont ensuite permis une excution parallle et/ou hirarchique des automates,
autorisant respectivement des comportements simultans et ordonns. On a ainsi pu
voir apparatre les modles base de piles dautomates [94], o chaque comportement
spcialis est reprsent par un automate, qui sont empils dans lordre de leur ex-
cution. Nous pouvons aussi citer les Pat-Nets [14] o des automates parallles sont
utiliss. Enn, le modle HPTS [37] et son extension HPTS++ [69] qui gre la fois
le paralllisme, la hirarchisation, et la synchronisation entre automates.
Comme nous lavons dit prcdemment, le recours des automates permet une grande
souplesse dans lexpression des comportements. Malgr tout, cette approche est gn-
ralement utilise pour reprsenter des tches simples, de comportements ractifs. Deux
faits expliquent cela. Premirement, les actions sont gnralement dcrites avec une
granularit trs ne dans les automates, contraignant dautant plus lautonomie du sys-
tme. En effet, labstraction du comportement son simple but est ici peu envisageable,
un comportement ntant alors reprsent que par un automate un seul tat. Deuxi-
mement, tous les enchanements entre actions doivent tre prvus lavance pour tre
envisags lors de la rsolution. Cela rend dautant plus difcile laugmentation des
comportements grs, ncessitant une refonte des comportements dpendants dj dis-
ponibles, et conduisant potentiellement une explosion combinatoire des transitions
possibles entre tats.
Ces deux inconvnients sont en partie grs par les automates hirarchiques, qui im-
63
Modles de comportement
posent tout de mme de pouvoir discrtiser les comportements en des modules indpen-
dants. Lavantage majeur de cette approche comparativement aux rgles est sa gestion
de la continuit dans le comportement. En effet, les tats des automates constituent
implicitement une mmoire de contexte, les transitions pouvant alors tre vues comme
des rgles locales.
Synthse
Nous avons prsent ici les trois principales approches permettant de grer les com-
portements fondamentaux dun individu. Nous pouvons retenir que dans le cadre dun
systme qui se veut descriptif et contrlable, seules les deux dernires approches peu-
vent prsenter un intrt, les rseaux de neurones tant trop difciles maintenir et
interprter. Les avantages principaux de ces deux modles sont les suivantes : pour les
modles bass rgles, la grande facilit de mise en uvre et dextensibilit ; pour les
modles dautomates, la forte expressivit. Il serait alors intressant de proposer une
approche combinant ces avantages. Il semble a priori possible dassocier directement
ces modles, en utilisant par exemple les automates pour grer nement des tches phy-
siques, gnralement lexcution ge et indpendante, et les rgles pour organiser
macroscopiquement leur excution, facilitant leur volution potentielle.
2.2.2 Comportement rationnel
Les comportements rationnels correspondent la prise de dcision globale de la pense
humaine. Ils ne sont observables que par la srie dactions quils produisent, o plutt
quils organisent, pour arriver la rsolution dun but global plus ou moins complexe.
Certains comportements rationnels ne sont pas du tout observables, comme le drou-
lement dune pense, mais nous nous concentrerons plutt sur la faon dorganiser des
actions pour atteindre un but.
Au cur du mcanisme de dcision rside le procd de slection daction. Son but est
de trier les diffrentes tches requises par lhumain, pour slectionner celles pouvant
ou devant sexcuter immdiatement. Cest donc ce mcanisme qui se charge de la
discrimination entre plusieurs actions concurrentes vis--vis de ressources physiques
ou intellectuelles de lindividu.
Deux mthodes permettent cette slection daction (Figure 2.4) : la coopration, qui va
fusionner plusieurs tches, et la comptition, qui ne va en slectionner quune seule.
La mthode cooprative fonctionne gnralement sur des informations quantitatives,
en oprant via des fonctions arithmtiques comme la somme ou la moyenne. La m-
thode comptitive slectionne une tche via une fonction de cot associe, symbolisant
la priorit de laction entreprendre, ventuellement couple des informations quali-
tatives comme lutilisation de ressources.
Ce mcanisme est primordial pour la simulation du comportement rationnel. Nous al-
lons voir que les diffrentes approches tudies ci-aprs procdent cette slection en
utilisant lune des deux mthodes pr-cites, et parfois en les associant.
64
Modles de comportement
FIG. 2.4: Principe de la slection daction. Laction slectionne est le rsul-
tat dune opration de fusion et/ou de discrimination entre les tches
requises.
LAction Selection Mechanism
Le modle ASM, propos par P. Maes [81], fait merger la dcision par lactivation
et linhibition dynamique des actions. Dans ce systme multi-agents, chaque entit est
vue comme un ensemble de modules ayant chacun ses comptences spciques. Un
module de comptence est reprsente par quatre valeurs (c, a, d, ) :
c : les pr-conditions de laction, ncessaires pour son excution ;
a : les effets dajout de laction ;
d : les effets dinhibition de laction ;
: le niveau dactivation de laction.
Le modle peut alors crer des liens entre les modules, de succession et inversement
de prcdence, ou encore de conit. Finalement, la slection seffectue par lvaluation
du niveau dactivation des actions. Ce niveau est augment par les buts de lagent,
mais aussi par les successeurs dune action excutable, ou ses prdcesseurs dans le
cas contraire. Il est diminu par les actions entrant en conit avec laction courante. Ce
systme utilise donc une slection comptitive, base sur le niveau dactivation.
Plusieurs volutions de cet algorithme ont t proposes. Le plus proche de la thorie
de A. Newel est sans doute le modle de V. Decugis et J. Ferber [35], avec un ASM
hirarchique o les modules de plus bas niveau correspondent aux actions ractives,
tandis que ceux de haut niveau correspondent des comportements plus complexes.
Ce modle est trs intressant de par sa simplicit de mise en uvre, et son fort poten-
tiel dvolution (lajout dune nouvelle action y est relativement ais). Nanmoins, ce
modle nassure pas la robustesse de la dcision : si un plan existe, il nest pas forc-
ment obtenu par cette approche. De plus, le problme des oscillations caractristique
des rgles reste pos.
Le Situation Calculus
Le situation calculus, introduit par J. McCarthy et P.J. Hayes [84], est un modle bas
sur la projection dans le temps de lindividu, permettant dvaluer les consquences de
ses actions. Cette approche est base sur six concepts dnissant lenvironnement de
simulation, en utilisant une smantique base sur les mathmatiques boolennes :
65
Modles de comportement
Les situations. Elles reprsentent des tats complets du monde un instant donn. Ce
sont en quelque sorte des photographies instantanes, constitues de faits valides,
pouvant ensuite servir comme point de dpart du raisonnement.
Les uents. Ils dcrivent une proprit dynamique du monde. Ils sont reprsents par
une fonction dune situation, renvoyant ltat correspondant de la proprit.
Les causalits. Ce sont littralement des relations de cause effet, associant lmer-
gence dun uent un autre uent dans une situation donne.
Les actions. Elles servent modier les situations. Un ensemble de pr-conditions
doivent tre satisfaites dans la situation courante pour que laction puisse sex-
cuter. Les effets ainsi produits peuvent alors tre conditionnels, variant suivant la
situation.
Les stratgies. Ce sont des enchanements dactions produisant un comportement glo-
bal. Elles correspondent des tapes de raisonnement scriptes.
La connaissance et le savoir-faire. Ces deux facults permettent daugmenter labs-
traction des actions ralisables. Elles permettent ainsi de dcrire des actions po-
tentielles suivant le niveau de connaissance, ou encore des actions permettant
dacqurir de nouvelles connaissances.
Ce formalisme est largement utilis dans le domaine de lintelligence articielle car
il permet dexprimer des mondes trs complexes. La slection daction y est faite par
lvaluation de tous les enchanements dactions permettant daboutir la situation
dsire depuis la situation courante. Cette planication aura donc pour effet de pro-
duire une srie dactions raliser. Dans le domaine de lanimation comportementale,
J. Funge [42], avec son modle CML (pour Cognitive Modeling Language), spcia-
lise le situation calculus pour dcrire les comportements de haut niveau dun agent
autonome. Il introduit notamment le principe dincertitude avec les IVE uents (pour
Interval-Valued Epistemic uents), qui ne sont plus valeur unique, mais compris entre
deux bornes.
Pour conclure, nous pouvons retenir que le situation calculus tire sa force de son grand
pouvoir dexpressivit. Sa plus grande faiblesse, surtout concernant lanimation com-
portementale de foules dindividus, concerne la lenteur de sa planication dactions.
Les algorithmes utiliss vont en effet devoir valuer toutes les situations possibles de-
puis la situation courante pour dterminer lensemble de chemins aboutissant la si-
tuation dsire. Il existe quelques mthodes pour acclrer le traitement, surtout par
lagage de larbre de dcision, mais qui restent encore trop contraignantes pour de la
simulation de foules.
Le modle STRIPS
Le modle STRIPS (pour STanford Research Institute Problem Solver), introduit par
R.E. Fikes et N.J. Nilsson [40], est un formalisme simpli du situation calculus. Il
permet ainsi de proposer des algorithmes plus efcaces, la description y tant plus
contrainte. Le monde y est reprsent par un ensemble de faits, pouvant tre prsents
ou absents. Des actions peuvent ensuite tre dcrites, possdant des pr-conditions,
liste de faits devant tre vris, et des effets, sous la forme dune liste dajouts et
dune liste de retraits de faits du monde. La slection dactions va alors consister
planier une srie dactions menant de ltat courant du monde ltat dsir.
66
Modles de comportement
Plusieurs algorithmes existent pour effectuer cette planication. On peut notamment ci-
ter Graphplan [19], qui va reprsenter lvolution du monde par un graphe en couches,
alternant des nuds de type action et des nuds de type fait. La construction du graphe
part de ltat actuel du monde, puis va construire une srie de couches jusqu ce que
lune dentre elles ne contienne plus dactions concurrentes, i.e. qui invalident mu-
tuellement leurs pr-conditions ou leurs effets. Un algorithme va alors effectuer un
chanage arrire, en partant des buts souhaits et en retenant successivement la srie
dactions non concurrentes qui reviennent ltat courant du monde. Cet algorithme
garantit lobtention dune solution si elle existe, mais le dveloppement du graphe est
polynomial en temps et en espace de recherche. Une autre approche existe, nomme
HSP [23] (pour Heuristic Search Planning), qui va utiliser une heuristique pour li-
miter le dveloppement du graphe de recherche. Cette heuristique est extraite de la
dnition du monde sous la forme doprateurs STRIPS. Son principe est de ngliger
les exclusions mutuelles entre actions, et donc de ne considrer quun sous ensemble
du problme pos. Il existe plusieurs volutions de cet algorithme, dont certaines ont
une valuation de ltat courant du monde vers les buts, ou dans le sens inverse (aussi
dnomm de haut en bas, ou de bas en haut).
Le point fort du formalisme STRIPS rside dans les algorithmes de planication dac-
tions quil supporte. Il peut ainsi converger vers un rsultat plus vite et avec moins de
dveloppement que pour le situation calculus. Cela est rendu possible par lexploitation
des contraintes poses sur le mode de description du monde, passant outre lexpression
de la connaissance, et donc des actions et effets conditionnels plus abstraits.
Les comportements orients buts
Les comportements orients buts, connus sous le nom de BDI (Beliefs Desires Inten-
tions), sont une application directe des thories de M.E. Bratman [25]. Trois concepts
rgissent le fonctionnement de ce modle :
Les croyances sont les connaissances personnelles quun agent a du monde, pouvant
tre incompltes voir fausses. En effet, celles-ci sont bases sur les perceptions
de lindividu, et sa capacit apprhender la dynamique de son environnement.
Les dsirs sont les buts explicites de lagent, ce quil veut raliser plus ou moins
long terme.
Les intentions sont les plans comportementaux de lagent lui permettant dassouvir
ses dsirs.
A.S. Rao et M.P. Georgeff [115, 116] furent les premiers proposer une architecture
base sur les BDI. Le principe gnral de ce modle est de fournir lindividu un en-
semble de plans lui permettant daccomplir diffrents dsirs, faisant de lui une sorte
de systme expert. Lexcution de ces plans est conditionne par un ensemble de faits
relatifs lenvironnement et lindividu. Dans le cas o plusieurs plans sont slec-
tionns, un systme darbitrage est alors mis en uvre pour les dpartager. Une fois
quun plan est choisi, il devient une intention, et ses actions sont excutes lune aprs
lautre jusqu ce quune nouvelle slection soit ncessaire, soit cause dune modi-
cation des connaissances, soit du fait de la russite ou de lchec du plan. Chaque
action composant le plan peut alors devenir un sous-but, et provoquer ainsi lexcution
dun nouveau plan.
67
Modles de comportement
Ce modle peut sadapter trs rapidement la dynamique de lenvironnement, que
ce soit grce lvaluation des pr-conditions des actions en cours ou lmergence
de nouveaux plans. Sa plus grande faiblesse constitue aussi sa plus grande force : le
savoir-faire des individus est ici g, le systme ntant pas capable dinfrer des plans
qui nont pas t explicits. Ceci a pour consquence de contraindre lautonomie des
individus ce qui a t prvu lors de la description des actions. Mais cela permet aussi
dassurer que les entits simules neffectueront pas denchanements dactions fantai-
sistes, pouvant produire des comportements peu ralistes. Un autre grand avantage de
ce modle, surtout en ce qui concerne lanimation comportementale, est sa grande rapi-
dit dexcution. En effet, mme sils restent dpendants du nombre dactions prsentes
dans le systme, les choix imposs lalgorithme de dcision sont assez restreints.
Synthse
Nous avons vu dans ce chapitre les principales approches concernant une partie de
laspect rationnel du comportement : la slection dactions. La plupart des modles
prsents fonctionnent avec un niveau de reprsentation du monde trs abstrait, fourni
par un ensemble de rgles. On peut remarquer de manire gnrale que ces modles
de raisonnement sont assez peu situs, le plus souvent valus sans reprsentation to-
pologique de lenvironnement. Bien que certaines approches utilisent ces modles en
animation comportementale, le plus souvent pour un nombre trs restreint dentits
et de comportements, leur complexit calculatoire est trop importante pour que lon
puisse les appliquer dans le contexte de la simulation de foules dindividus. LASM r-
pond quant lui cette contrainte, mais les oscillations de sa prise de dcision incitent
lcarter.
Nanmoins, le dernier modle que nous avons abord, le BDI, semble offrir des pers-
pectives intressantes. De par sa simplicit de mise en uvre, le niveau de contrle quil
offre lors de la modlisation du monde, ainsi que sa rapidit dexcution, ce modle
peut constituer une piste avantageuse pour la simulation de foules. Son fort potentiel
de ractivit aux modications de lenvironnement est aussi capital pour considrer des
chelles de temps relativement courtes. Il faudrait cependant permettre une plus grande
libert lalgorithme de dcision de ce modle, notamment en introduisant une hirar-
chisation des dsirs. De plus, laspect situ est primordial dans le contexte dtude des
ux de personnes, et il faudrait donc corrler au maximum cette prise de dcision avec
la topologie des lieux.
2.2.3 Synthse
Nous avons pu nous familiariser dans cette section avec les deux catgories de modli-
sation du comportement. Dune part les comportements ractifs, relativement simples
et court terme, et dautre part les comportements rationnels, plus complexes et rgis-
sant le plan daction des individus sur le long terme.
Nous pouvons conclure que les modles bass rgles et automates, pour la gestion du
comportement ractif, sont directement exploitables. Nous avons pourtant voqu le
bnce de les coupler, an de proter du potentiel dvolution de lun ainsi que de la
robustesse de lautre.
68
Reprsentation des connaissances : les environnements informs
La plupart des modles de comportement rationnel semblent quant eux difcilement
exploitables, surtout de par leur complexit de rsolution. De plus, leur potentiel dinf-
rence du savoir-faire nest pas rellement indispensable la simulation des circulations
de personnes. Lun dentre eux, le modle BDI, semble tout de mme appropri car
il offre une approche plus descriptive du comportement. Nous devons tout de mme
mettre laccent sur le manque de lien avec la topologie, videmment trs important
pour ltude des circulations de personnes. Un autre point dsavantageux concerne la
faible autonomie des entits simules, dautant plus bride que les plans dactions sont
scripts.
2.3 Reprsentation des connaissances :
les environnements informs
Nous avons jusqu prsent prsent des catgories de modles permettant de consi-
drer diffrents aspects du comportement humain. Comme nous lavons remarqu, ce
qui leur fait particulirement dfaut est laspect situ du raisonnement. Cest une par-
tie de cet aspect que vont permettre de traiter les environnements informs, en ancrant
la connaissance dans la reprsentation topographique du monde. Ces environnements
pourront ensuite tre exploits par un algorithme de raisonnement pour situer la prise
de dcision. Ils pourront aussi tre utiliss seuls, plus dans un objectif danimation,
pour reproduire une interaction visuellement raliste. Bien sr, le couplage de ces deux
objectifs est envisag, constituant en quelque sorte le Graal de lanimation comporte-
mentale.
2.3.1 Le modle Parameterized Action Representation
Le modle PAR, introduit par N. Badler et al. [12], tente de rapprocher la description de
laction du langage naturel. Un systme PAR est compos des lments suivants [13] :
Les objets physiques qui sont concerns par des actions. Ceux-ci peuvent avoir des
proprits, et sont stocks hirarchiquement dans une base de donne topolo-
gique.
Lagent qui va effectuer laction, qui a un certain nombre de capacits.
Les conditions dapplication des actions, i.e. ce qui doit tre vri dans le monde
pour quune action puisse seffectuer. Elles peuvent tre relatives des objets
ou lagent. Il est prcis quen cas dchec, aucun sous-but nest lanc pour
parvenir des conditions favorables. Par contre, des actions peuvent remplacer
laction courante qui nest pas excutable.
Les actions prparatoires sont des couples condition/action. Si la condition est fausse,
alors laction est lance.
Les actions peuvent tre atomiques ou complexes. Dans ce dernier cas, laction est re-
prsente par une liste de sous-actions devant sexcuter en squence et/ou en pa-
rallle. Les actions sont stockes dans une base de donne hirarchique, permet-
tant de les spcialiser pour ensuite pouvoir les slectionner suivant le contexte.
Les conditions de terminaison stoppent laction lorsquelles sont vries.
69
Modles de comportement
Les effets sont des assertions qui sont excutes lorsque laction se termine, modiant
la base de donnes du monde.
Dans ce modle, laccent est mis sur la facilit de renseignement des actions, pour viser
un cadre dapplication o lutilisateur du simulateur sera capable dinteragir facilement
avec le systme. Ainsi, le systme pourra sadapter de nouvelles directives fournies
dans un langage proche de la langue naturelle. La mthode de slection dactions est
ici base sur des rgles (les conditions), et supervise par des automates parallles
communiquants nomms Pat-Net [14].
Pour conclure, ce modle est sduisant par sa mthode de renseignement. Nanmoins,
le lien avec la topologie y est assez faible, les actions ainsi que les objets ntant pas
directement lis lenvironnement mais stocks dans une base de donne globale. Ce
point est dautant plus contraignant pour notre cadre dapplication que la topologie y est
prpondrante. Il nest pas fait tat des performances du systme, mais nous pouvons
penser que le mode de slection doit bien se comporter en charge.
2.3.2 Les Smart Objects
Les smart objects, introduits par M. Kallmann et D. Thalmann [60], sont bass sur la
thorie cologique de la perception de J.J. Gibson. En effet, un smart object contient
lensemble des informations ncessaires une interaction. Ces informations sont en-
suite transmises lindividu lorsquil effectue linteraction.
Quatre type de donnes constituent un smart object [61] :
1. Les proprits intrinsques de lobjet, i.e. physiques, comme la taille, la forme,
ou le centre de masse de lobjet.
2. Les informations concernant linteraction, servant lacteur pour accomplir cette
interaction, comme lendroit o se positionner, ou encore lidentication des l-
ments ncessaires (comme une poigne ou un bouton).
3. Les comportements internes lobjet, pouvant tre dclenchs par une interac-
tion, et pouvant tre conditionns par des variables internes lobjet, comme la
fonction dimpression dune imprimante.
4. Les comportements attendus de lacteur lors de chaque interaction avec lobjet.
Les comportements de plus haut niveau sont ensuite dcrits grce des automates
tats nis. Les tats sont ici constitus par les actions de base pouvant tre accomplies
par ou avec lobjet. Une animation est alors pourvue, en se basant sur un ensemble de
gestes de base. Ces gestes sont adapts en temps rel par un processus de cinmatique
inverse et de la planication de mouvement [62], an de prendre en compte la position
relative de lagent vis vis de lobjet (Figure 2.5).
Cette premire approche de linteraction tait donc beaucoup plus oriente vers le ra-
lisme visuel immdiat que vers la rsolution comportementale long terme. Des tra-
vaux rcents tendent rejoindre cette vision comportementale plus globale [1]. En se
basant sur le formalisme STRIPS, et plus particulirement lalgorithme Graphplan, les
smart objects sont tendus en associant des pr-conditions et des effets aux actions.
Ces informations seront ensuite utilises dans le processus de dcision de lacteur (Fi-
gure 2.6), divis en quatre tapes :
1. Lacteur collecte les informations du monde relatives ses interactions.
70
Reprsentation des connaissances : les environnements informs
FIG. 2.5: Exemple de Smart Object : interaction avec un casier.
2. Lacteur prpare sa dcision en formalisant le problme.
3. La planication est effectue, produisant un ensemble de plans et de mondes
rsultants.
4. Le plan relatif au but de lacteur est droul, excutant les actions de bas niveau
correspondantes.
FIG. 2.6: Processus de planication avec les Smart Object.
Une autre amlioration a t apporte an de permettre la collaboration entre agents [2].
Toujours en utilisant Graphplan, la dlgation de tche permet un agent daider un
autre agent la rsolution dun but (Figure 2.7). Pour se faire, le concept de facilitateur
est introduit, qui est une sorte de superviseur auquel les agents vont pouvoir dlguer
transfrer des tches. Ce superviseur va ensuite valuer les autres agents du monde
pour en trouver un qui peut accomplir la tche, et lui transfrer ce but. Le superviseur
prvient ensuite lagent dorigine de lvolution de la tche dlgue.
Les smart objects constituent un bond en avant concernant la modlisation de linter-
action dans des environnements virtuels. Ils dmontrent que la thorie cologique de
J.J. Gibson est particulirement bien adapte ce cadre dapplication, simpliant gran-
dement la tche de description et ainsi la mise en uvre des simulations. Nanmoins,
quelques observations peuvent tre retenues quant ce modle. Tout dabord, le fait de
centraliser toute linformation dans les objets permet certes de simplier leur descrip-
tion, mais contraint aussi lvolutivit du systme sur le long terme. En effet, lajout
dune nouvelle interaction ncessite inexorablement la modication des objets qui la
supportent. De mme, le partage dune interaction entre plusieurs catgories dobjets
impose sa rednition successive. Lautre point qui nest a priori pas abord concerne la
71
Modles de comportement
FIG. 2.7: Dlgation de tches avec les Smart Object. Lagent Martin doit
porter une caisse dans une autre pice, et se rend compte quil doit
pour cela ouvrir une porte. Dans limpossibilit de laccomplir, il
dlgue cette tche lagent Gino.
dnition dagents autonomes proposant eux-mme des interactions. On peut intuitive-
ment imaginer que ces agents puissent tre dnis sur le mme principe, bien que leurs
aspects dynamique et autonome risquent de poser problme. Finalement, concernant
la planication dactions, les smart objects sont coupls aux STRIPS et en acquirent
donc les avantages et les inconvnients. Il nest donc pas envisageable dutiliser cette
approche pour des foules dindividus, surtout du fait des performances. Nous pouvons
conclure que ce modle est trs bien adapt la gestion de tches physiques, apportant
un ralisme visuel certain, mais peut-tre moins la gestion de comportements plus
long terme, pour un grand nombre dindividus.
2.3.3 Le modle STARFISH
Le modle STARFISH (pour Synoptic-objects Tracking Actions Received From Inter-
active Surfaces and Humanoids), introduit par M. Badawi et S. Donikian [11], est bas
sur la thorie des dpendances conceptuelles de R. Schanck [122]. Il est ici question de
la description physique de linteraction plutt que de sa gestion comportementale.
Ce modle associe une smantique linteraction [10], ou plutt la manipulation lors
de linteraction, avec un ensemble de huit primitives : Donner, Transfrer, Dplacer,
Bouger, Attraper, Ingrer, Parler, tre attentif. Ces actions gnriques sont alors sp-
cialises dynamiquement par lhumanode suivant le contexte. Toute action complexe
est alors construite sur la base de ces primitives, en les assemblant dans des automates
72
Reprsentation des connaissances : les environnements informs
tats nis grs par HPTS++ [69]. Ces actions sont ensuite directement lies aux
objets de lenvironnement, via des surfaces dinteraction, rejoignant ainsi la thorie
cologique de J.J. Gibson. Ces surfaces sont spcies sur la gomtrie des objets, et
suivent ainsi tout changement de position potentiel. De plus, le simple fait de modier
ces surfaces dun objet lautre permet, tout en gardant la mme procdure comporte-
mentale, de modier linteraction physique rsultante (Figure 2.8).
(a) Ouvrir une porte vers lextrieur.
(b) Ouvrir une porte vers lintrieur. (c) Ouvrir une porte coulissante.
FIG. 2.8: Interactions avec STARFISH. Linteraction physique sadapte auto-
matiquement aux capacits de lobjet manipul, sans avoir red-
nir la procdure comportementale.
Ce modle est donc born la gestion de comportements ractifs. Il adresse la fois
la faisabilit des actions et leur reprsentation visuelle. Le lien avec la topologie est ici
trs fort, les surfaces dinteraction tant directement disponibles dans la dnition de
lenvironnement. Pour notre cadre dapplication, ce modle pourrait offrir un compl-
ment avantageux en terme de restitution graphique. Il ne dispose nanmoins pas dune
vision de haut niveau de linteraction, permettant de linclure dans un plan comporte-
mental long terme.
2.3.4 Synthse
Nous avons vu tout au long de cette section trois modles permettant dinformer des en-
vironnements de simulation en vue de grer les interactions. Les cadres dapplication
de ces approches sont assez loigns de ltude des circulations de foules dindivi-
dus, se concentrant plus sur la restitution graphique. De manire gnrale, le lien entre
linteraction et la topologie dans la prise de dcision est assez peu abord. Nous re-
tiendrons nanmoins lapproche des smarts objects qui, en associant linteraction aux
objets de lenvironnement, propose dj ce lien au niveau de la description. Dautre
par, le modle STARFISH offre des perspectives sduisantes pour un couplage des
mcanismes de dcision. Il dispose en effet dun lien fort avec la topologie, grce aux
zones dinteractions, et associe une smantique linteraction, grce ses huit primi-
tives. Son intgration des comportements de plus haut niveau pourrait ainsi reposer
sur ces primitives, et se faire de manire quasi transparente.
Nous pouvons donc conclure quune approche semblable lun de ces deux modles
serait souhaitable. Nanmoins, la description de linteraction doit y tre plus axe sur
73
Modles de comportement
les implications comportementales que sur la reprsentation physique rsultante, cette
dernire nayant quun impact limit sur les circulations de personnes.
2.4 Modles multi-couches
Nous avons prsent dans la premire partie de cet tat de lart un comportement r-
actif fondamental de ltre humain quest sa capacit se dplacer. Ce comportement
sinscrit dans un mcanisme rationnel plus global de lindividu, que nous avons abord
dans cette deuxime partie. Les modles multi-couches permettent de considrer ces
deux aspects simultanment.
Ces modles tentent de couvrir un large spectre du fonctionnement humain, en corr-
lant des processus de dcision de plus ou moins haut niveau avec des processus ato-
miques plus spcialiss. De manire plus gnrale, nous pouvons retenir quun modle
est multi-couches sil traite plus dun tage de la pyramide comportementale de A. Ne-
well. Nous allons prsenter ici certains de ces modles, en prcisant pour chacun deux
quels types dapproches ils fusionnent et quelles problmatiques du comportement hu-
main ils abordent.
2.4.1 Approche gnrale
S. Goldenstein et al. [47] proposent un modle gnral de simulation pour reproduire
les comportements mergeants observables, tels que la foule ou les regroupements,
dans des environnements contraints. Ce modle se dcompose en trois couches ca-
pables de communiquer entre elles, chacune tant responsable dune partie des proces-
sus (Figure 2.9).
FIG. 2.9: Communication entre les trois couches du modle de S. Golden-
stein et al.
La couche locale. Cette couche se charge des actions ractives, telles que lvitement
dobstacle et la gestion du dplacement. Elle est reprsente par un modle base
de particules, associant des forces de rpulsion aux obstacles. S. Goldenstein
et al. indiquent que cette couche doit tre rapide, robuste, paramtrable, et ne doit
pas dpendre du nombre dentits prsentes dans lenvironnement (le domaine
de validit doit couvrir de faibles comme de fortes densits).
La couche environnementale. Cette couche contient les informations spatiales, telles
que les agents et les obstacles. Elle permet dvaluer lenvironnement immdiat
de chaque agent simul, ce qui servira piloter leur comportement. Ainsi, cette
74
Modles multi-couches
couche est notamment implique dans la dtection de collision, et dans ladap-
tation des entits cette ventualit. Elle est reprsente par une structure nom-
me KDS (pour Kinetic Data Structure), base sur une triangulation de Delaunay
dont les sommets reprsentent les entits. Cette structure est ensuite rafrachie en
tenant compte de la cohrence temporelle, an de limiter les calculs inutiles.
La couche de planication globale. Cette couche contrle le dplacement gnral des
individus au cours du temps, en leur indiquant chaque fois quils se dplacent
une nouvelle direction souhaitable. Bien que la valeur de sortie de cette couche
soit trs simple, elle peut tre produite par des processus complexes, pouvant
aussi inuencer des paramtres internes des agents, comme leur vitesse. Lexem-
ple que donnent S. Goldenstein et al. pour cette couche est limit la planica-
tion de chemin, mais ils indiquent quelle peut servir coordonner les actions
des agents pour la coopration, ou grer des comportements plus complexes.
Ils remarquent aussi que cette couche peut donner des ordres allant en contra-
diction avec la couche locale, poussant par exemple un individu se rapprocher
dun obstacle pour interagir, augmentant en mme temps les risques de collision.
Cette premire approche, bien quassez gnrale, permet de tirer quelques conclusions
assez intressantes. Tout dabord, comme le font remarquer les auteurs, lapproche
muti-couches a lavantage de permettre lvolution voire le remplacement de lune des
couches du systme sans avoir modier les autres. La seule contrainte respecter sera
dans ce cas de fournir les mmes possibilits de communication aux couches modies,
leur permettant de maintenir larchitecture actuelle. Lautre observation faite est quune
couche peut pousser une autre fonctionner de manire contraire son principe de
base, ncessitant une robustesse maximale de sa part. Il faut donc sassurer que ces
couches basses supportent lensemble des directives des couches plus leves, pouvant
ncessiter la gestion de cas particuliers.
2.4.2 Approche oriente vers les comportements sociaux
Cette approche introduit la gestion comportementale sociale dans le processus de dci-
sion des agents autonomes. Laspect social prpondrant est ici la formation de groupes,
quils soient induits par un dplacement uniforme, ou dnis par une relle relation
comme dans le cadre dune famille. Cest cette problmatique que sadresse S. Raupp
Musse [89] dans son modle multi-couches dnomm ViCrowd.
Ce modle est bas sur le principe, propos par S. Raupp Musse et al. [90], que la
capacit de dcision des agents autonomes ne leur soit pas seulement interne, mais
puisse tre disponible dans les objets ainsi que dans les entits plus abstraites que sont
les groupes. On sloigne donc ici de la notion de comportement mergent pour la
foule, pour se rapprocher dun comportement global plus supervis. Mais la notion de
but individuel reste tout de mme prsente dans ce modle, grce la gestion de trois
catgories de comportements [91] :
Comportement programm. Ce premier type de comportement permet un contrle
macroscopique des individus. Cest un comportement script qui dnit de ma-
nire gnrale lattitude dun ensemble de personnes.
Comportement ractif. Ce deuxime type de comportement permet aux entits si-
mules de ragir des situations. Un comportement ractif est dni comme un
75
Modles de comportement
couple vnement / raction. Un vnement dnit quand sous quelles condi-
tions le comportement doit tre activ, et qui il doit sappliquer, pouvant aller
de lindividu lensemble des entits simules. La raction dnit la srie dac-
tions dclenches par le comportement. Les vnements peuvent tre dclenchs
manuellement, en raction dautres comportements, ou encore scripts. Les
auteurs montrent un cadre dapplication de ces vnements pour simuler des
comportements bass rgles.
Comportement guid. Ce dernier type de comportement permet denrichir le mode
de contrle des individus avec des procdures de plus haut niveau. Ces compor-
tements sont fournis par un module externe capable dinterprter des actions en
langage naturel, qui sont ensuite restitues au systme sous la forme dune s-
rie dactions de base. Ce type de comportement est plus prioritaire que les deux
premiers, et peut donc les interrompre. Dans ce cas l, une mmoire de groupe
se rappelle des comportements arrts, pour permettre leur reprise par la suite.
Un ensemble de comportements de base sont spcis pour les groupes, comme la
runion ou la sparation (Figure 2.10). La mthode de navigation propose permet de
grer aussi bien lvitement dindividus que de groupes. Elle est base sur un principe
original de cheminement suivant une courbe de Bzier, dnie par un nombre impos
de points de contrles. Chaque collision dtecte aura pour consquence de dplacer
un point de contrle pour grer lvitement, dformant ainsi la trajectoire de lindividu.
FIG. 2.10: Un exemple de comportement de groupe : sparation dun groupe
en deux pour laccomplissement de deux buts diffrents.
Cette approche a prouv son efcacit en terme de restitution visuelle, produisant des
animations avec un mouvement macroscopique raliste. Elle a de plus lindniable
avantage dtre trs rapide, permettant la restitution de milliers dindividus en temps
rel. Nanmoins, on peut se poser la question du ralisme comportemental des ux
de personnes produits lorsque la notion de groupe nest plus dduite mais induite par
le systme. En effet, la notion de groupe mergeant dans les circulations contraintes
est certainement valide, mais le caractre phmre de lappartenance dun individu
ce type de groupe nest pas ngliger. Ainsi, pour simuler efcacement des lieux
dchanges, qui alternent circulations contraintes et grands espaces, avec des buts indi-
viduels tantt disperss tantt unis, ce systme aurait besoin dune gestion trop prcise
et frquente des formations/destructions de groupes. Il deviendrait donc certainement
difcile renseigner, et ses performances risqueraient aussi de diminuer fortement.
2.4.3 Approche base sur les motions
E. de Sevin [34] propose une approche multi-couche base sur les motions et mo-
tivations des individus. Quatre couches comportementales de plus en plus complexes
76
Modles multi-couches
forment ce modle (Figure 2.11) :
FIG. 2.11: Architecture du modle multi-couche bas sur les motions.
Ractive. Ces comportements sont utiliss pour faire face des situations imprvues,
et permettre des comportements opportunistes. Cette capacit de dcision rapide
(reprsente par la case choice sur la gure 2.11) analyse directement lenviron-
nement peru pour slectionner une action court terme situe. Cette slection
est effectue par un systme de classication hirarchique.
Pro-active. Cette couche comportementale se charge de planier des suites dactions
ractives permettant datteindre des buts de plus haut niveau (case planner sur
la gure 2.11). Elle permet donc de rsoudre des comportements orients but, et
de grer la concurrence entre des buts potentiellement conictuels. Cette couche
correspond ltage cognitif de la pyramide de A. Newell.
Base sur les motivations. Cette capacit de dcision permet de gnrer les buts
long terme de lindividu. Ces buts, dnomms motivations, sont classs en trois
catgories priorit dcroissante : basique, correspondant aux besoins physiques
vitaux (comme manger) ; essentielle, correspondant aux besoins physiologiques
infrieurs (comme dormir) ; secondaire, correspondant aux besoins non primor-
diaux (comme se divertir). Cette couche correspond ltage rationnel de la py-
ramide de A. Newell.
motionnelle. Cette dernire aptitude joue plus un rle de modration que de d-
cision. En effet, les motions de lindividu vont tre capables dinuencer les
paramtres dcisionnels des autres couches comportementales, comme le niveau
dactivation dune motivation. Cette couche correspond ltage social de la py-
ramide de A. Newell.
Larchitecture propose par ce modle est sduisante par son analogie avec les mo-
dles psychologiques, tel que la pyramide de A. Newell. On peut ainsi y retrouver des
couches comportementales spcialises, au fonctionnement indpendant, ne communi-
quant que de faon restreinte avec les autres processus dcisionnels. Nanmoins, las-
pect situ de la dcision nest que peu abord dans ce modle. Les deux comportements
les plus indispensables de ce point de vue, la planication de chemin et la navigation r-
active, ne sont pas dtaills ici, interdisant lexploitation de cette approche pour ltude
des circulations de personnes. Dautre part, laspect opportuniste du comportement,
77
Modles de comportement
vis vis des possibilits offertes par lenvironnement, semble restreint la gestion
dinteractions instancies a priori, imposant une rednition des comportements pour
permettre lvolution de lenvironnement. Finalement, cette approche semble plus ap-
proprie pour la gestion de comportements physiques prdtermins, tout en offrant
des perspectives intressantes quant larchitecture gnrale propose.
2.4.4 Approche grande chelle
B. Moulin et al. [88], avec le projet MAGS (pour Multi-Agent GeoSimulation), pro-
posent un modle denvergure permettant de simuler des milliers dentits, que ce soit
lchelle dune ville ou dun btiment [4]. Le modle nest pas ici born la simu-
lation dtres humains, mais peut aussi bien traiter des animaux, des objets mobiles
ou non, et ce dans un grand ventail de situations, telles que lvacuation ou ltude
des foules. Ce systme propose de simuler les entits avec des capacits de cognition
spatiale, que ce soit la perception, la navigation, ou encore le raisonnement.
Perception. Le systme MAGS simule une perception individuelle en se basant sur la
projection dun cne de vision 3D dans des cartes 2D (Figure 2.12), en tenant
compte dune carte dlvation pour grer les occlusions. Les cartes utilises
se prsentent sous la forme dimages, donc avec le formalisme des grilles. Dif-
frents types dinformations peuvent ainsi tre perus, chacune relative une
reprsentation de lenvironnement base sur une smantique diffrente :
caractristiques gographiques du terrain (lvation) ;
caractristiques topologiques du terrain (objets statiques, chemins) ;
autres agents simuls (voisinage mobile) ;
zones dynamiques avec des proprits spciales (fume, parfum) ;
vnements spciaux (explosions) ;
messages transmis par dautres agents.
La distance de vision peut tre congure, et le systme peut recourir une
vision de groupe, o un leader aura une perception totale alors que les autres
seront brids mais pourront se rfrer aux informations du leader.
(a) Projection du cne de vision dans une carte. (b) Carte des zones de navigation.
FIG. 2.12: Gestion de la perception et reprsentation des connaissances dans
le systme MAGS.
78
Modles multi-couches
Navigation. Deux modes de navigation sont possibles pour les entits simules. Pre-
mirement, un mode de suivi de chemin, peu coteux, o lagent se contente de
suivre une portion de chemin visible disponible dans la carte correspondante.
Deuximement, un mode dvitement dobstacles grant les espaces ouverts, o
lagent va chercher rejoindre le chemin pr-calcul le plus proche dans le sens
de sa destination en se basant sur la carte dlvation. Les deux modes utilisent
une mthode de lancer de rayon. Le rayon est initialis avec la direction di-
recte vers la destination de lagent, et avec une longueur infrieure sa distance
de perception. Si le rayon ne rencontre pas dobstacle, alors le mouvement est
considr valide. Dans le cas contraire, des rayons successifs sont lancs de part
et dautre de lentit jusqu en trouver un valide ou jusqu ce quun angle
maximum soit atteint, ce dernier cas dclenchant un traitement spcique. Cette
mthode correspond un algorithme A
r
= D
r
(1 +
f
d
d
l
4
)
Ce calcul se base donc sur la densit locale d
l
entre deux bordures intergroupes
perues, en bornant sa valeur 4pers./m
2
.
140
Accder aux informations de lenvironnement
5.2.2 Base de connaissances
La deuxime faon qua notre agent autonome daccder aux informations de lenvi-
ronnement est issue de sa capacit mmoriser des faits via une base de connaissances
individuelle, puis sy rfrer dans le futur. Cette connaissance correspond la m-
moire long terme, mais ne va traiter quun sous-ensemble restreint dinformations, et
sans avoir recours une quelconque capacit dabstraction individuelle des donnes.
La base de connaissances de notre entit est purement topologique, avec des processus
permettant dextrapoler dautres informations corrles. Nous avons fait ce choix sur-
tout pour des questions doccupation mmoire, les humanodes devant tre simuls par
milliers avec une capacit de stockage limite. Nous introduirons nanmoins un autre
mcanisme pouvant tre assimil une mmoire, mais qui sera gr localement par les
tches cognitives. Dautre part, les processus de renforcement et de rappel sont carts
dans notre approche, les diffrents processus de lagent autonome ayant directement
accs cette mmoire.
Connaissance topologique
La base de connaissances individuelle prend la forme dune liste associative, couplant
un marqueur temporel chaque bordure intergroupe du graphe topologique (reprsen-
te droite sur la gure 5.6). La taille mmoire de cette base est donc de lordre de
O(n
b
) avec n
b
le nombre total de bordures intergroupes du graphe.
FIG. 5.6: Gestion de la connaissance topologique. Agauche, lenvironnement
de test avec un exemple de parcours dun humain virtuel HV. Au
centre, les bordures perues par HV linstant t courant. A droite,
la connaissance topologique totale de HV, aprs prise en compte de
sa perception courante (les dates passes t sont arbitraires).
Le marqueur temporel peut prendre deux valeurs spciales ou une date absolue :
jamais La bordure est totalement inconnue, i.e. lentit ne connat mme pas son exis-
tence. Nous verrons par la suite que cette valeur empche tout processus de lhu-
manode de tenir compte de la zone de lenvironnement correspondante.
connu La bordure est seulement connue, i.e. lentit connat son existence, mais ne
la pas vue au cours de la simulation courante. Nous verrons par la suite que
cette valeur permet lentit de tenir compte de la zone correspondante, mais
lempche dvaluer toute information dynamique pouvant sy rattacher.
141
Le comportement de lhumain virtuel
date absolue Cette date correspond au moment o lentit a vue la bordure pour la
dernire fois, celle-ci tant donc forcment connue. Cette catgorie de valeurs
permettra lentit dvaluer des informations dynamiques se rattachant la
zone de lenvironnement, tout en tenant compte du temps coul.
La mise jour de cette base de connaissances est triviale : chaque fois quune bor-
dure est enregistre dans les donnes perues de lentit, le marqueur temps qui lui
correspond est rafrachi avec la date courante de la simulation. tant donn laspect
squentiel de cette base, cette opration seffectue en un temps constant.
Linitialisation de la connaissance peut tre faite de plusieurs faons, suivant le niveau
dhabitude des lieux que lon veut assigner lindividu. Tout dabord, la base est en-
tirement formate avec lune des deux valeurs spciales du marqueur temporel :
jamais pour un individu peu ou pas familier des lieux ;
connu si cest un usager trs courant (il connat lenvironnement dans ses moindres
dtails).
Cette premire initialisation peut ensuite tre rafne dans le cas des non habitus
(valeur jamais), an de leur fournir une connaissance approximative des lieux. Ainsi,
un processus associe la valeur connu certaines bordures, en se basant sur deux types
de congurations :
1. En listant une une les bordures considrer comme connues, processus labo-
rieux mais contrl.
2. En spciant des couples de bordures de dpart et darrive, puis en appliquant
un algorithme de planication de chemin pour les relier. Une fois le chemin
trouv, toutes les bordures qui le composent sont mises jour avec la valeur
connu.
Notons que de telles initialisations peuvent tre effectues a priori, an de crer des
typologies de connaissances des lieux, qui pourront ensuite tre directement affectes
aux agents autonomes. Par exemple dans une gare, on peut crer une typologie voya-
geur affaire qui connat seulement les chemins entre les quais des trains de banlieue et
les sorties, et une catgorie passant qui connat seulement les chemins entre les accs
vers la ville.
Extrapolation des informations
Nous venons de voir que la connaissance de notre agent autonome est limite la date
o il a peru diffrentes zones. Malgr tout, celui-ci a besoin dautres informations
pour effectuer certaines de ses tches, comme par exemple valuer son chemin. Ainsi,
il va devoir tre capable de se rappeler de certaines informations prsentes lintrieur
des zones de lenvironnement quil a pu voir, et potentiellement dextrapoler ces infor-
mations si elles sont caractre dynamique. Pour se faire, lagent autonome a recours
sa base de connaissances individuelle, quil va corrler avec les informations environ-
nementales globales disponibles dans le graphe topologique. Dtaillons les diffrentes
donnes gres.
Position des objets statiques. La position des objets statiques est la plus simple
grer. Cette information est directement tire de la connaissance topologique : si une
bordure correspondant au nud orient dun objet statique est connue, alors la position
de lobjet lest aussi.
142
Accder aux informations de lenvironnement
Position des objets dynamiques. Connatre la position des objets dynamiques re-
vient connatre la liste des objets contenus par un groupe du graphe topologique.
Nous avons volontairement simpli ce processus an de ne pas surcharger la gestion
mmorielle de nos entits. Ainsi, la liste des objets contenus par un groupe est ac-
cessible par lagent autonome sil a aperu une bordure du groupe depuis moins dun
certain temps. Cette valeur peut tre adapte suivant la catgorie dobjets considrs,
pour reter diffrentes estimations de leur vitesse de dplacement.
Caractristiques des objets. Les caractristiques internes des objets, i.e. la valeur
de leurs attributs, est une information caractre dynamique, et donc prissable. Pour
savoir si les informations actuellement contenues par lobjet peuvent tre exploites,
car sufsamment proches de ce qui a t peru, il faut valuer le temps qui sest coul
depuis cette perception. Comme la seule information de temps disponible est lie aux
bordures intergroupes, il faut faire correspondre lobjet considr avec une de ces bor-
dures. Pour se faire, le PVS (ou le dPVS) de lobjet est parcouru, en retenant la date
correspondant la bordure qui a t vue pour la dernire fois. Cette date est alors
value pour savoir si linformation contenue par lobjet peut tre lue, ou si elle est
considre comme prime. Dans ce dernier cas, linformation est ignore. Ce proces-
sus intervient principalement pour lvaluation de la condition locale des affordances,
seulement effectue si leffecteur considr a t vu il y a peu de temps. Nous xons
cette date de premption une valeur arbitraire de cinq minutes.
Valeurs de densits locales et globales, ainsi que compteurs de ux. Ces informa-
tions sont rcupres sur le mme principe que les deux prcdentes. Ainsi, un temps
de rfrence est valu pour symboliser la date o linformation a t perue : la date
la plus proche des bordures du groupe pour la densit globale, la date la plus loigne
des deux bordures impliques pour la densit locale et le ux. Ce temps est ensuite
test pour savoir si linformation contenue par le graphe topologique est sufsamment
proche de ce qui a t peru. Dans le cas contraire, linformation est ignore.
Nous pouvons donc voir que les informations environnementales ne sont pas direc-
tement stockes par la mmoire individuelle de lagent autonome, mais directement
exploites dans la dnition globale de lenvironnement. Ce principe permet de limiter
la charge de stockage de la connaissance, mais introduit un biais dans les informa-
tions dont lentit se rappelle : ces informations ont potentiellement chang depuis la
dernire perception.
Autre mcanisme mmoriel
Nous devons tout de mme spcier quun autre mcanisme de lagent autonome peut
tre assimil une mmoire. En effet, en temps que spcialisation de linteracteur BIIO,
lhumain virtuel dispose de toutes ses fonctionnalits, dont notamment la gestion des
ressources. Comme nous lavons voqu dans la section 3.2, page 94, ces ressources
peuvent tre cres, dtruites, et modies dynamiquement, et reprsenter nimporte
quel type de donnes. Elles correspondent donc un mcanisme mmoriel de court
long terme.
143
Le comportement de lhumain virtuel
Nous ne dtaillerons pas plus leur fonctionnement, nayant aucun processus ddi autre
que leur gestion gnrique par lobjet interactif physique. Notons simplement que ces
ressources pourront tre utilises spciquement par certaines tches cognitives ou
affordances, an de stocker des symbolisations persistantes de lhumanode, comme
ltat dune donne environnementale importante. Citons par exemple la destination
dun voyageur au dpart dans une gare, ou encore le quai o se trouve son train.
5.2.3 Conclusion
Nous venons de prsenter les deux premiers mcanismes de lhumain virtuel : sa per-
ception et sa mmoire. La perception constitue le premier comportement ractif de
notre modle. Elle permet dextraire la smantique visible de lenvironnement, et donc
de rendre nos entits non omniscientes. La mmoire est complmentaire cette percep-
tion, permettant la persistance des informations rcupres. Nous avons ainsi propos
un modle simpli de connaissance topologique rpondant aux contraintes de sto-
ckage imposes par nos objectifs. Il a tout de mme t voqu la possibilit dtendre
le mcanisme mmoriel de manire gnrique, grce la notion de ressources intro-
duite par BIIO. Nous verrons que ces deux mcanismes sont fondamentaux dans notre
architecture dhumain virtuel, car ils participent la plupart des autres comportements
ractifs ou cognitifs.
5.3 La planication de chemin
Maintenant que notre humain virtuel est capable dapprhender son environnement,
nous allons voir son premier mcanisme dcisionnel visant planier un chemin. Cette
tche peut tre considre comme ractive dans notre classication, car sufsamment
habituelle pour un tre humain pour ne pas ncessiter une attention trop soutenue. Nous
allons voir que ce processus ne se charge pas seulement dune valuation topologique
du chemin, mais quil prend une part active dans le raisonnement li linteraction,
permettant de situer ce dernier.
5.3.1 Un algorithme hirarchique
Commenons par dnir le fonctionnement gnral de la planication de chemin. Son
objectif est de fournir un rsultat gomtrique simple, permettant de guider la locomo-
tion de lhumanode, en se basant sur la dnition topologique abstraite de lenviron-
nement, permettant davoir une vue plus gnrale des endroits parcourir. Le parallle
peut tre fait aisment avec un humain rel, qui value son chemin de faon globale,
au niveau de la ville par exemple, mais qui ne rafne ce chemin que localement pour
se concentrer sur les interactions immdiates. Ce principe est dautant plus intressant
pour notre modlisation quil permet daccrotre les performances de notre algorithme,
celui-ci nayant besoin de neffectuer des analyses que par parties dans des reprsenta-
tions de plus en plus nes.
Nous tirons donc avantage ici de la dnition hirarchique de lenvironnement, en pro-
posant une planication de chemin elle aussi hirarchique. Notre algorithme va en effet
144
La planication de chemin
traiter successivement les trois couches du graphe topologique, en commenant par la
plus abstraite. Les tapes de lalgorithme sont donc (Figure 5.7) :
FIG. 5.7: Planication de chemin hirarchique. Seule la premire tape des
rafnements successifs est reprsente pour des questions de lisibi-
lit.
1. Planier de faon globale dans le graphe des zones de lenvironnement. Cette
tape est celle qui effectue rellement la dcision du chemin, pouvant tre spcialise de
diffrentes faons pour rechercher des catgories spciques de destinations (position
dans lespace, caractristique dun nud, objet contenu, etc.). Le chemin produit est
une succession de zones traverser, commenant par la zone courante de lhumain
virtuel.
2. Rafner le chemin en planiant dans les groupes de lenvironnement inclus
dans les zones composant le chemin. Cette tape intermdiaire est totalement gn-
rique, utilisant un algorithme de parcours des graphes de type A
. Cette planication
se fait par parties, pour relier successivement deux zones connexes du chemin depuis
le groupe courant jusquau premier groupe de la zone suivante. Le chemin produit est
donc une succession de groupes traverser, en commenant par le groupe courant de
lagent autonome. Notons que ce chemin nest pas rafn dans sa totalit, mais seule-
ment jusqu la premire zone non visible par lhumanode. Pour dterminer quelle est
la premire zone non visible, le PVS de la premire bordure du chemin est test : une
bordure du chemin nest pas visible si elle ne fait pas partie de ce PVS, i.e. elle nest
pas reprsente par un nud.
3. Rafner totalement le chemin obtenu sous forme de groupes en planiant dans
le graphe correspondant la subdivision. Cette tape nale produit un chemin com-
pos dune succession de cellules de la subdivision, en commenant par la cellule cou-
rante de lentit. Encore une fois, cette tape est totalement gnrique utilisant un al-
gorithme de parcours des graphes de type A
, pour
deux raisons :
Il ne ncessite pas dheuristique estimant la distance au but. Comme nous le verrons
par la suite, celle-ci serait extrmement difcile valuer compte tenu du nombre
de critres entrant en jeu, voire mme impossible dans les cas o la destination nest
pas connue a priori.
Il obtient le chemin optimal sil existe. Par chemin optimal nous entendons celui qui
minimise les critres dvaluation, et pas seulement la distance. Cette proprit est
fondamentale si lon veut pouvoir caractriser des circulations de personnes ralistes.
Nous allons donc prsenter les trois types de destination envisageables pour lvalua-
tion dun chemin : atteindre un lieu, explorer son environnement, et choisir une in-
teraction. Nous indiquerons pour chacun de ces modes les cas dchec potentiels qui,
comme nous le verrons dans la section 5.5, page 180, se rpercuterons sur certaines
des tches cognitives de lhumanode. Nous introduirons enn la notion de condition
darrt oue, permettant la recherche de chemin dtre plus exible lorsquelle doit
elle mme choisir une destination.
Atteindre un lieu
Ce premier mode correspond une planication de chemin classique, visant atteindre
un lieu identi dans lenvironnement. Ce lieu est donc connu a priori, et communiqu
la procdure. Il y a deux possibilits dchec de cette mthode :
1. Sil nexiste pas de chemin entre la position courante de lhumain virtuel et la
destination spcie. Ce cas peut se produire si les deux positions sont dans
147
Le comportement de lhumain virtuel
des environnements diffrents non interconnects, ou si les interconnexions en
question sont sens unique mais toutes orientes de la destination vers la position
courante.
2. Sil nexiste pas de chemin connu entre la position courante et la destination.
Ce cas se produit si lentit a une connaissance partielle de lenvironnement, ne
permettant pas de relier les nuds courant et nal du graphe.
Explorer son environnement
Ce second mode de planication est plus conceptuel, cherchant a atteindre des zones
mconnues par lentit. Aucune destination nest ici spcie au dpart de lvaluation,
la position cible tant le rsultat du processus. Deux types dexploration peuvent tre
envisages :
1. Dcouvrir de nouvelles zones. La condition de n est donc ici datteindre une
bordure dont ltat est jamais dans la connaissance individuelle.
2. Rafrachir sa connaissance. La condition de n est donc ici datteindre une bor-
dure qui a t vue depuis plus dun certain temps t donn.
Ces deux conditions peuvent tre values simultanment, la recherche de nouvelles
zones tout en voulant rafrachir ses connaissances sur le monde. Cette mthode peut
chouer si lentit connat parfaitement son environnement, et donc si lensemble des
bordures ont t vues depuis moins de t.
Choisir une interaction
Ce dernier mode de planication participe au processus de dcision quant aux inter-
actions effectuer. Nous aborderons la pr-slection des interactions dans les sections
suivantes, avec la tche cognitive interagir (confre Section C, page 245) et laspect
rationnel de lhumanode (confre Section 5.6, page 186). Partons pour le moment du
principe que lagent autonome dsire effectuer un certain nombre dinteractions, consi-
dres comme rationnellement valides. Cette procdure va ainsi planier un chemin
dans lenvironnement, la recherche dun effecteur autorisant lune de ces interac-
tions. La condition darrt est donc vrie lorsquun nud du graphe associ avec un
de ces effecteurs est rencontr. Deux cas peuvent alors se produire :
1. La connaissance de ce nud est considre comme prime, la condition est
alors valide sans test supplmentaire.
2. La connaissance de ce nud permet daccder aux proprits des objets quil
contient, un test supplmentaire est alors effectu. Ainsi, la pr-condition locale
de laffordance est value, en tenant compte de lhumanode courant et de lef-
fecteur slectionn, ne validant la condition darrt quen cas de russite.
Cette procdure peut chouer si aucun effecteur compatible avec lune des affordances
dsire nest trouv.
Condition darrt oue
Pour une planication standard, destination connue a priori, lalgorithme oodll
peut accepter le premier chemin quil trouve, son optimalit tant garantie. Ce prdicat
148
La planication de chemin
nest plus vri pour les deux autres modes que nous proposons. Nous nentrerons
pas dans les dtails de la quantication de la longueur du chemin ici (elle sera aborde
plus loin dans cette section), mais sachons que celle-ci est dpendante, pour ces deux
planications, de lvaluation de la condition de n. Ainsi, on ne peut juger de la qualit
dun chemin sans lavoir compar un autre, potentiellement plus loin en terme de
distance.
Pour illustrer ce principe, prenons le cas de la recherche exploratoire, dont la quan-
tication est sensible ce que nous nommerons le potentiel de dcouverte associ
un nud. Il est possible que lalgorithme de parcours trouve tout dabord un chemin
vers un nud ayant un faible potentiel de dcouverte, car celui-ci est plus prs, alors
que le meilleur choix serait un chemin plus long mais amenant dans une zone avec un
fort potentiel de dcouverte. Un autre exemple plus concret serait pour la mthode de
choix dune interaction. Il est possible que lalgorithme trouve dabord un effecteur
valide proximit, mais avec une grande le dattente, alors quun autre est disponible
quelques mtres plus loin sans que personne ne lutilise.
Pour rsoudre ce problme, nous avons introduit la notion de condition darrt oue
dans les deux derniers modes de planication de chemin. Ce type de condition dar-
rt va permettre lalgorithme de continuer lgrement son exploration, alors quun
chemin a dj t trouv, pour vrier si une meilleure destination nest pas dispo-
nible. Pour se faire, lalgorithme (Algorithme 2) est paramtr avec un certain niveau
de libert l. Celui-ci autorise la poursuite de lexploration jusqu une distance de
libert D
max
= d +l (ligne 6) lorsquune condition darrt est valide une distance
d (ligne 5). Si une autre condition darrt est valide, elle nest retenue que si sa dis-
tance de libert est infrieure celle stocke (lignes 7-10). Lexploration se termine ds
que lalgorithme a couvert lensemble du graphe, ou ds quun nud se trouvant une
distance suprieure D
max
est atteint (ligne 4).
Algorithme 2 Exploration avec condition darrt oue
ENTRES: l le niveau de libert de lexploration.
1: dest aucune
2: D
max
3: Z Z
crt
4: TANTQUE Z = aucune DISTANCE(Z) < D
max
FAIRE
5: SI CONDITIONARRT(Z) = vrai ALORS
6: D
crt
DISTANCE(Z) + QUANTIFICATION(Z) +l
7: SI D
crt
< D
max
ALORS
8: D
max
D
crt
9: dest Z
10: FINSI
11: FINSI
12: Z ZONESUIVANTE
13: FIN TANTQUE
14: RENVOYER dest
149
Le comportement de lhumain virtuel
5.3.3 Heuristique multi-critres
Les diffrentes tapes de la planication de chemin hirarchique sont bases sur des
algorithmes de parcours de graphe. Ces algorithmes ncessitent une heuristique an de
quantier la traverse de chaque nud, pour au nal pouvoir juger de la qualit dun
chemin. Le meilleur chemin sera celui qui, en atteignant la destination, minimise la
somme des quantications des nuds traverser.
Principe
Nous avons vu dans ltat de lart (confre Section 1.5.4, page 45) que de nombreux
facteurs peuvent entrer en ligne de compte lors de lvaluation dun chemin. Nous
proposons une mthode permettant de tenir compte de plusieurs de ces facteurs simul-
tanment. Ceux-ci tant de natures diffrentes, une base de comparaison autorisant leur
fusion doit tre choisie.
Nous proposons dutiliser une unit temporelle, en convertissant chaque facteur de
planication en un temps de traverse correspondant Q
f
:
Q =
f facteurs
(Q
f
)
Cette conversion correspond parfois une valeur relle (comme pour la distance par-
courir une certaine vitesse), parfois une valeur estime de perte de temps par lagent
autonome (comme pour la traverse dune zone de forte densit). Ainsi, nous prenons
en compte des facteurs quantitatifs, valus de la mme manire par toutes les entits,
et des facteurs qualitatifs, valus subjectivement par chaque entit suivant un degr de
prfrence P
f q
individuel. Ce degr de prfrence correspond la quantit maximale
de temps attribue par lhumanode un facteur, si celui-ci est son paroxysme. Pour
juger du niveau de ralisation dun facteur qualitatif, une valeur V
f q
lui est attribue par
un processus gnral, avec 0 V
f q
1, ou la valeur spciale V
f q
=si le facteur est
considr comme infranchissable. Ainsi, la quantication dun facteur qualitatif sera :
Q
f q
= P
f q
.V
f q
Nous allons prsenter deux catgories de quantication : la premire gnrique, sap-
pliquant tous les types de planication, la deuxime spcique, et donc diffrente
pour chaque type de planication globale. Les gures prsentes utiliseront la lgende
de la gure 5.8.
FIG. 5.8: Lgende utilise pour les facteurs de planication de chemin.
150
La planication de chemin
Quantication gnrique
La quantication gnrique est value pour tous les nuds quel que soit le type de
planication utilis. Elle commence par tenir compte dune valeur quantitative, puis
applique des modicateurs qualitatifs.
Certaines des valeurs considres sont dynamiques, telles que les densits de per-
sonnes. Leur valuation a recours au processus mmoriel de lagent autonome, ces
donnes tant ignores en cas dchec (dans le cas o les informations sont consid-
res comme primes).
Distance parcourir. La quantication est initialise avec la distance parcourir
pour traverser un nud, qui est le seul facteur quantitatif. Pour des questions de per-
formances, cette distance est directement rcupre dans les valeurs pr-calcules des
nuds abstraits du graphe (Figure 5.9).
(a) Cellules. (b) Groupes et zones.
FIG. 5.9: Facteur de distance lors de la planication de chemin. (a) La dis-
tance est calcule pour les cellules de la subdivision. (b) La distance
est obtenue dans les valeurs pr-calcules des groupes, et dduite
pour les zones.
La distance D est convertie en temps grce la vitesse de lhumanode v
hum
:
Q
distance
=
D
v
hum
Cette vitesse est obtenue en bornant la vitesse dsire de lentit v
des
par la vitesse
maximale possible pour le nud suivant la densit locale de population d
loc
sy trou-
vant, par application directe des niveaux de service de J.J. Fruin :
v
hum
=
_
_
v
des
si d
pop
< 0.3
(3.79d
loc
) 0.37 si 0.3 d
loc
3
0 si d
loc
> 3
Notons que cette valuation de vitesse maximale nest faite que pour les nuds dont
la connaissance est able, permettant daccder linformation de densit. Dans le cas
contraire, v
des
est directement applique. Dautre part, lorsque la vitesse de traverse est
value 0, le nud est alors considr comme infranchissable avec une quantication
innie.
Largeur du chemin. Ce second facteur, qualitatif, permet dintroduire une prf-
rence pour les espaces de circulation larges plutt qutroits. Son calcul se base sur la
largeur de chemin assigne aux nuds du graphe topologique (Figure 5.10).
151
Le comportement de lhumain virtuel
(a) Cellules. (b) Groupes et zones.
FIG. 5.10: Facteur de largeur du chemin. (a) La largeur est celle de la pre-
mire bordure traverse pour les cellules. (b) La largeur est celle
de la bordure la plus troite lintrieur des groupes et zones.
La valeur associe ce facteur qualitatif se base sur une largeur maximale signicative
pour lentit, proportionnelle sa distance inter-paules d
ep
, compare la largeur
effective du nud l
n
:
V
largeur
=
_
_
si l
n
< d
ep
0 si l
n
> d
ep
11
1.1
l
n
d
ep
10
sinon
Direction courante. Cet autre facteur qualitatif introduit le critre de minimisation
des changements de direction tout au long du chemin. Son calcul se base sur la direction
de traverse assigne aux nuds du graphe topologique (Figure 5.11).
(a) Cellules. (b) Groupes et zones.
FIG. 5.11: Facteur de direction courante le long du chemin. La direction
lentre du nud est compare celle ncessaire sa traverse.
La valeur associe ce facteur qualitatif compare la direction de lentit lentre du
nud
dir
pre
celle de traverse
dir
crt
. La direction lentre
dir
pre
est la direction de
traverse du nud prcdent, ou la direction entre la position de lentit et la premire
bordure au dpart de la planication. De la mme manire, la direction de traverse
dir
crt
est celle entre la dernire bordure et la position darrive pour le dernier nud
de la planication. Les deux directions sont normes pour le calcul de la valeur du
facteur :
V
dirc
=
1
2
(1
dir
pre
dir
crt
)
Densits de personnes. Ce facteur qualitatif nest valu que pour les nuds dont
la connaissance a t rafrachie rcemment. Il permet dintroduire une notion de pr-
frence pour les emplacements peu peuples de lenvironnement, vitant ainsi les en-
droits trop congestionns. Son calcul se base sur les densits globales d
glob
de popula-
152
La planication de chemin
tion associes aux groupes et zones, le facteur tant ignor pour les cellules.
V
den
=
_
_
_
d
glob
3
si d
glob
3
sinon
Flux de populations. Tout comme les densits de personnes, ce facteur qualitatif
nest valu que pour les nuds dont la connaissance a t rafrachie rcemment. Son
but est de pousser lentit rejoindre des circulations de personnes compatibles avec
son sens de parcours. Son calcul se base sur les compteurs de ux associs aux groupes
et zones, le facteur tant ignor pour les cellules.
Rappelons quun ux F
i, j
est associ chaque couple de bordures (i, j) dun groupe,
reprsentant le nombre de personnes se dplaant entre ces bordures. Avec n le nombre
de bordures dun groupe, et s le numro de la bordure de sortie pour la planication en
cours, les ux compatibles avec le sens de parcours dune entit sont quivalents :
F
comp
=
i[1,n]\s
F
i,s
Ainsi, on obtient comme valeur pour ce facteur de ux de populations :
V
f lux
= 1
F
comp
population du groupe
Quantication spcialise
Maintenant que nous avons vu les diffrents facteurs pris en compte par toutes les
planications de chemin, tudions plus prcisment les critres spciques chaque
catgorie de planication globale. Le but est ici de prendre en considration, et donc de
quantier, lattrait dun nud du graphe par rapport lobjectif de la recherche de che-
min. Nous allons donc passer en revue les trois catgories de destinations envisageables
avec la faon de les quantier.
Atteindre un lieu. Ce processus de planication cherche atteindre un lieu identi
par sa position. Nous introduisons ici un facteur de minimisation de lcart la direc-
tion de la destination. Ce facteur qualitatif permet lentit de prfrer les chemins les
plus directs vers sa destination. Son calcul se base sur la direction de traverse assi-
gne aux nuds du graphe topologique
dir
crt
, compare une direction estime vers
la destination (Figure 5.12).
La direction vers la destination
dir
dest
correspond la direction entre la bordure den-
tre de la zone et la position nale atteindre. Les deux directions sont normes pour
le calcul de la valeur du facteur :
V
dird
=
1
2
(1
dir
dest
dir
crt
)
Explorer son environnement. Ce processus de planication cherche amliorer les
connaissances topologiques individuelles. Nous introduisons ici un facteur de maximi-
sation du potentiel de dcouverte. Le but de ce facteur qualitatif est de pousser lentit
153
Le comportement de lhumain virtuel
(a) Cellules. (b) Groupes et zones.
FIG. 5.12: Facteur de direction vers la destination. La direction vers la desti-
nation est compare celle ncessaire la traverse du nud.
se diriger vers les endroits pouvant amliorer au maximum ses connaissances. Le
potentiel de dcouverte dun nud P
dec
est valu de la faon suivante :
P
dec
=
10card(bordures inconnues) +card(bordures mconnues)
10card(bordures)
Une bordure est inconnue si elle a un tat jamais dans la base de connaissances. Une
bordure est mconnue si elle a un tat simplement connu, ou si sa date de dernire
visibilit est assez ancienne pour conclure la premption des informations quelle
contient. La valeur de ce facteur est alors la suivante :
V
dec
= 1P
dec
Choisir une interaction Cette dernire procdure de planication vise choisir un
couple affordance/effecteur. Le but est donc double ici : choisir parmi lensemble des
interactions immdiatement dsires par lhumanode, et choisir parmi lensemble des
effecteurs de lenvironnement permettant cette interaction. Comme lon peut sen dou-
ter, ces deux dcisions sont intimement lies, les tres humains ayant un comportement
opportuniste les poussant utiliser en premier lieu les quipements les plus accessibles.
Nous utilisons deux quantications spcialises pour rsoudre cette concurrence, lune
qualitative et lautre quantitative.
Le facteur qualitatif se base sur la priorit hirarchique P
H
des interactions prs-
lectionnes par lhumanode, i.e. actives au moment de la planication (confre Sec-
tion 3.4.2, page 107). Nous calculons tout dabord le poids total des interactions :
P
inter
=
P
H
(affordances actives)
Ensuite, quand un nud contient un effecteur, celui-ci est quanti vis vis des af-
fordances actives quil propose aff
act
, qui est lintersection entre lensemble des affor-
dances actives de lhumanode et lensemble des affordances de leffecteur :
V
prio
= 1
aaff
act
P
H
(a)/P
inter
Le facteur quantitatif se base quant lui sur les temps dattente et dutilisation associs
aux affordances raliser. Ces temps sont estims pour chaque affordance a dnie
prcdemment, grce leffectif de la le dattente E
A
(a), le nombre de personnes
pr-abonnes N
P
(a), et le temps dexcution moyen T(a), tous trois dpendant de laf-
fordance et de leffecteur valu (confre Chapitre 3, page 91). La valeur spciale inni
154
La planication de chemin
est affecte cette quantication dans le cas o laffordance ne supporte pas lattente
et si aucune position dutilisation nest disponible. Si lhumanode est dj abonn
leffecteur, N
P
(a) est considr comme nul, et E
A
(a) ne tient compte que des personnes
se trouvant devant ; de plus, T(a) est diminu de 10% dans ce cas l pour exprimer la
persistence de la prise de dcision. Ainsi, la quantication de temps dutilisation est
calcule de la faon suivante :
Q
uti
=
aaff
act
T(a) [1+E
A
(a) +
1
2
.N
P
(a)]
Au nal, la quantication dun effecteur vis vis des affordances actives de lhuma-
node sera :
Q
af f
= Q
uti
+P
prio
V
prio
Remarquons que bien que nous ayons class ce type de quantication spcialement
pour la planication ddie linteraction, la quantication du temps dutilisation Q
uti
est aussi ncessaire de manire plus gnrale. En effet, le cas particulier des objets tra-
versables ncessite cette quantication, an dvaluer le temps de parcours des nuds
correspondants. Dans ce cas, Q
uti
nest plus valu en tenant compte des affordances
dsires de lhumanode, mais de laffordance spontane de leffecteur traversable. En-
suite, Q
uti
est directement ajout la quantication du nud, quelle que soit la pro-
cdure de planication employe. Notons que si aucune affordance spontane nest
disponible pour lobjet, la quantication dutilisation prend alors la valeur spciale in-
ni interdisant le parcours de ce nud. Par exemple, ce cas peut se produire en simulant
une personne en fauteuil roulant qui cherche atteindre un tage suprieur, et dont les
chemins passant par les escaliers se verront bloqus au prot de ceux passant par les
ascenseurs.
5.3.4 Analyse du chemin valu
Maintenant que nous avons dni comment valuer un chemin dans lenvironnement,
voyons plus en dtail la faon dont nous traitons les donnes produites. Le rsultat de
cette planication dispose dune composante abstraite, indiquant globalement le par-
cours sous forme de zone traverser, et dune composante gomtrique ne, indiquant
localement la succession de segments franchir (ce sont les bordures inter-cellules).
An de permettre une exploitation simple de ce chemin, nous allons synthtiser ces
informations de deux faons diffrentes.
Interactions mergeantes
Le but est ici dintgrer au raisonnement de nos entits des interactions non dsires
avant la planication, mais dont le besoin merge de lvaluation du chemin. Ces inter-
actions mergeantes sont issues des objets traversables rencontrs le long du chemin,
et sont symbolises par leur affordance spontane.
La premire tape de ce processus consiste donc dtecter la prsence dun de ces
objets dans le chemin. Quelle que soit la mthode de planication utilise, le chemin
abstrait est toujours exprim sous la forme dune succession de zones traverser. Dans
155
Le comportement de lhumain virtuel
le cas o des objets traversables sont emprunter, les nuds du graphe topologique qui
leur correspondent se retrouvent dans le chemin nal. Par exemple, sur la gure 5.13,
lhumain virtuel doit emprunter deux escaliers pour se rendre de la zone A la zone
E. Le chemin produit comporte ainsi deux nuds correspondants des objets traver-
sables : B et D. La dtection dune interaction mergeante est alors triviale, puisquil
suft de rechercher le premier nud du chemin supportant un objet traversable, puis
den extraire laffordance spontane. Ainsi, dans le cas o plusieurs objets traversables
sont emprunts, seul le premier produit une interaction mergeante, les suivants tant
traits au fur et mesure de la progression dans lenvironnement.
(a) Environnement de dmonstration, avec chemin et nom des
zones en rouge.
(b) Chemin abstrait quivalent,
avec les nuds correspondant
des objets traversables en bleu.
FIG. 5.13: Exemple de chemin avec interaction mergeante. Lhumain virtuel
doit traverser les escaliers B et D pour se rendre dans la zone E.
Maintenant que nous avons identi une affordance mergeante, il suft pour lacti-
ver de linscrire dans le gestionnaire daffordances de linteracteur. Celle-ci bncie
alors des mmes capacits de traitement que nimporte quelle autre affordance, telle
que lexcution hirarchique.Notons nanmoins quen tant quaffordance mergeante,
et donc non dsire a priori, celle-ci ne participe pas la quantication du processus de
planication effectuant un choix entre plusieurs interactions. Dautre part, si un nou-
veau chemin vient tre plani, et que celui-ci ne comporte pas le nud traversable
de cette affordance mergeante, elle est immdiatement retire des affordances gres
par lhumain virtuel.
Pour nir, on peut remarquer que cette interaction mergeante constitue une synthse
dinformation vnementielle, ayant lieu chaque fois que le processus de planication
global est effectu, ou que le nud support de cette interaction est dpil du chemin.
Optimisation visuelle
Loptimisation visuelle a pour but de synthtiser la portion visible du chemin de bas
niveau, pour obtenir une information simple pouvant tre directement interprte par
le processus de navigation ractive. Nous allons donc extraire de ce chemin 2 informa-
tions :
1. Une direction de mouvement optimale, reprsente par un vecteur norm
dir
opt
.
2. Une distance maximale de mouvement sans obstacle dist
mov
, suivant la direction
prcdente.
Ces deux informations doivent tre sensibles aux donnes suivantes :
156
La planication de chemin
La succession de bordures traverser produites par le chemin de bas niveau. Cette
succession de bordures correspond la portion visible du chemin. De plus, les seg-
ments supportant les bordures sont garantis libres dobstacles statiques deux deux,
grce aux proprits de la subdivision spatiale qui les a gnres.
La premire bordure non visible du chemin de haut niveau. La navigation de lhu-
main virtuel doit en effet le pousser se diriger vers cette bordure, an de minimiser
ses changements de direction.
La premire tape de cette optimisation visuelle est le calcul dun frustum compos,
de manire quivalente la mthode des PVS. Ce frustum a pour origine la position
de lagent autonome, et va intersecter successivement les bordures du chemin. Cette
intersection nest pas directement calcule avec le segment support de la bordure, mais
prend la forme de la tangente au cercle reprsentant lentit projet sur chaque sommet
du segment de la bordure (en gris sur la gure 5.14(b)). Notons que la construction de
ce frustum compos peut tre stoppe avant davoir trait lensemble des segments du
chemin, cause de la rduction des passages due la projection du cercle de lentit.
Ainsi, cette construction va aussi identier la vritable prochaine bordure non visible
(en rouge sur la gure 5.14(b)).
(a) Environnement de dmonstration, avec cellules diffrenties et bordures
du chemin nommes (dcoupage arbitraire). La trajectoire optimale ob-
tenue par optimisation visuelle est reprsente en vert.
(b) Calcul du frustum compos (en vert) et de la prochaine bor-
dure non visible (en rouge).
(c) Analyse du frustum pour extraire
la direction optimale.
FIG. 5.14: Optimisation visuelle dun chemin. Les bordures sont reprsentes
avec une surface pour des questions de lisibilit.
157
Le comportement de lhumain virtuel
Ltape suivante analyse les donnes de la premire tape, avec 2 cas possibles :
1. Il y a une prochaine bordure non visible (cas de la gure 5.14). On doit choisir un
point rfrant P
re f
qui servira dattracteur. Pour cela, la portion visible de la der-
nire bordure du chemin est considre (en bleu sur la gure 5.14(c)), lextrmit
la plus proche de la destination tant choisie (en haut sur la gure).
2. Il ny a pas de prochaine bordure non visible (lensemble du chemin est visible) :
Si la destination est lintrieur du frustum compos,
dir
opt
devient le vecteur
norm de la position courante la destination, et dist
mov
est la distance les
sparant.
Sinon, on choisit un point rfrant P
re f
qui servira dattracteur de la mme
faon que prcdemment.
Si un point rfrant P
re f
est choisi, la trajectoire passant par celui-ci est mise en concur-
rence avec la trajectoire passant par le centre du frustum. La principe suivant est utilis :
plus on se trouve prs de P
re f
, plus il est attractif, et inversement, plus on en est loin,
plus le centre du frustum est attractif. Le point attracteur P
att
est donc un barycentre
pondr entre le centre de la portion du dernier segment P
cen
et le point rfrant P
re f
.
En se basant sur les distances reprsentes sur la gure 5.14(c), le calcul est le suivant :
P
att
= (1) P
re f
+P
cen
avec =
m
2
m
2
+n
2
La direction optimale
dir
opt
devient alors celle partant de la position de lhumanode
et passant par P
att
. La distance maximale de mouvement dist
mov
est au minimum celle
sparant lagent autonome de P
att
. Nanmoins, an de laisser une certaine libert de
mouvement lagent, nous recherchons la distance maximale libre dobstacle passant
par ce point. Cette distance est obtenue par un lanc de rayon dans lenvironnement
suivant
dir
opt
.
Pour conclure avec loptimisation visuelle, on peut remarquer que son fonctionnement
est frquentiel, devant tre mis jour chaque fois que lentit se dplace dans lenvi-
ronnement. Nanmoins, la simplicit de lvaluation et la cohsion temporelle du calcul
du frustum permettent cette mthode de rester peu coteuse. De plus, nous verrons
par la suite que son rafrachissement est synchronis avec les poses dempruntes de
lhumanode, i.e. chaque nouveau pied dappui. Lintrt majeur de cette mthode est
de produire des trajectoires laspect continu et courbe, en neffectuant quun simple
calcul de barycentre, trs rapide.
5.3.5 Rafrachissement de la planication
Ce dernier aspect de la planication de chemin concerne sa mise jour au fur et
mesure du dplacement. Quatre objectifs sont viss :
1. Supprimer les portions de chemin parcourues.
2. Dclencher les rafnements successifs lorsque de nouvelles zones globales de-
viennent visibles.
3. Permettre la rcupration du chemin lorsque lentit sen carte, cause de la
navigation ractive par exemple.
4. Remettre en question le chemin actuel suivant certains vnements de lenviron-
nement.
158
La planication de chemin
Pour traiter le premier point, il suft de dpiler les lments de chaque chemin jusqu
trouver le nud courant de lentit (Algorithme 3). Ce traitement est donc effectu
chaque fois que lentit se dplace, et plus exactement chaque fois quelle change de
cellule de la subdivision. Dautre part, cest ce premier traitement qui pourra dtecter
si lentit est sortie du chemin (point 3), en demandant REPLANIFIER (ligne 3) o
RAFFINER de nouveau le chemin erron (lignes 11 et 18).
Algorithme 3 Suivre le chemin
ENTRES: C
crt
, G
crt
, Z
crt
les cellule, groupe et zone courants de lentit.
1: TANTQUE Z
0
= Z
crt
FAIRE
2: SI card(Chemin
Z
) = 0 ALORS
3: RENVOYER REPLANIFIER
4: FINSI
5: Chemin
C
Chemin
C
\ c, ZONE(c) = Z
0
6: Chemin
G
Chemin
G
\ g, ZONE(g) = Z
0
7: Chemin
Z
Chemin
Z
\ Z
0
8: FIN TANTQUE
9: TANTQUE G
0
= G
crt
FAIRE
10: SI card(Chemin
G
) = 0 ALORS
11: RENVOYER RAFFINERGROUPES
12: FINSI
13: Chemin
C
Chemin
C
\ c, GROUPE(c) = G
0
14: Chemin
G
Chemin
G
\ G
0
15: FIN TANTQUE
16: TANTQUE C
0
=C
crt
FAIRE
17: SI card(Chemin
C
) = 0 ALORS
18: RENVOYER RAFFINERCELLULES
19: FINSI
20: Chemin
C
Chemin
C
\ C
0
21: FIN TANTQUE
Un rafnement supplmentaire est effectu lorsque lentit peroit une nouvelle bor-
dure de son chemin abstrait. Nous ne dtaillerons pas lalgorithme ici, celui-ci cor-
respondant exactement la construction du chemin par parties (Algorithme 1) en ne
traitant pas nouveau les portions dj disponibles.
La rcupration du chemin lorsque lentit sen carte est dclenche par lalgorithme
lorsque la zone courante de lentit nest plus reprsente dans le chemin global. Une
nouvelle planication est alors demande, rvaluant compltement lensemble des
chemins hirarchiques.
Enn, la remise en question du chemin est faite de faon plus frquentielle. Elle inter-
vient lorsquune nouvelle information dynamique est perue, qui peut avoir un impact
sur lun des critres dvaluation du chemin. Cela se produit lorsquune bordure de
lenvironnement est observe alors que son tat actuel dans la connaissance de lindi-
vidu tait considr comme prim. Deux cas peuvent alors dboucher sur une rva-
luation :
1. La bordure appartient au chemin. Les facteurs de quantication associs sont
alors valus, et si lun deux dpasse un seuil x individuellement, le chemin
est rvalu. Cela permet lentit de rester ractive aux perturbations impr-
159
Le comportement de lhumain virtuel
vues. Ce cas peut se produire par exemple si lentit saperoit quun attroupe-
ment bloque son chemin, reprsent par le facteur de densit.
2. La bordure nappartient pas au chemin actuel. Ici aussi les facteurs de quanti-
cation sont valus, mais compars cette fois-ci une valeur moyenne extraite
du chemin actuel. Si ces nouveaux facteurs peuvent aboutir une amlioration
consquente du chemin, car leur valeur est bien infrieure celle actuelle, le che-
min est rvalu. Cela permet lentit de rester opportuniste aux modications
de lenvironnement. Comme illustration, on peut reprendre lexemple prcdent
en linversant, lentit pouvant sengager nouveau dans une zone dont laf-
uence a fortement diminue.
5.3.6 Conclusion
Nous avons prsent dans cette section lensemble des mcanismes impliqus dans la
planication de chemin. Les caractristiques principales mises en avant sont :
laspect hirarchique, permettant une amlioration sensible des performances ;
les trois catgories de planication, rpondant diffrentes problmatiques ;
la fusion dune multitudes de critres, permettant dindividualiser le processus de
dcision ;
la synthse du chemin produit en des informations simples et concises, permettant
une exploitation de type bote noire ;
la ractivit de lvaluation, permettant la prise en compte automatique des modi-
cations environnementales.
Tous ces points font de cette planication de chemin un module indpendant de notre
humanode virtuel, pouvant tre assimil un comportement ractif pr-cbl. Ce mo-
dule comportemental pourra ainsi tre pilot par des processus de plus haut niveau,
simplement en effectuant des requtes sur lune des trois spcialisations de recherche
de chemin. Le rsultat produit sera alors toujours le mme, synthtis sous la forme
dune direction optimale de mouvement et dune distance maximale. Nous allons voir,
dans la section suivante, que ce rsultat est ensuite exploit par un autre comportement
ractif de lindividu, an de grer cette fois-ci les adaptations locales lors du dplace-
ment.
5.4 La navigation ractive
Le comportement ractif prcdent, la planication de chemin, a permis de raliser
une dcision de dplacement presque exclusivement base sur les obstacles statiques
de lenvironnement. An de considrer la dynamique dautres entits, lhumain virtuel
ncessite un comportement complmentaire considrant lenvironnement dun point
de vue plus local et immdiat. Cette tche, dnomme navigation ractive, va ainsi
permettre lagent autonome dviter les collisions avec ses voisins, tout en essayant
de respecter au mieux les directives des autres comportements.
Son objectif global est de permettre lentit de se rendre sa destination, qui est repr-
sente par la direction choisie lors de la planication de chemin. Nous verrons que le
modle propos permet nanmoins de considrer des objectifs secondaires, autorisant
un comportement opportuniste lhumain virtuel.
160
La navigation ractive
5.4.1 Principe
Les tudes psychologiques prsentes dans ltat de lart (confre Section 1.1.2, page 11)
dcrivent certains mcanismes intervenant dans la locomotion pdestre. Notre modle
a pour objectif de reproduire ces mcanismes, que nous synthtiserons suivant quatre
principes :
Prdiction. Le principe de prdiction signie quun tre humain est capable danti-
ciper les dplacements des autres. Ainsi, il peut se projeter dans lavenir pour
valuer les risques dinteractions futures.
Robustesse. Le principe de robustesse signie que les adaptations de trajectoire dci-
des par le piton sont valides pour un certain laps de temps. Ce principe dcoule
directement de la prdiction, ltre humain basant sa dcision sur une extrapola-
tion juge sufsamment crdible.
Minimisation des ajustements. Le principe prcdent signiait que ltre humain mi-
nimise la frquence de ses adaptations, celui-ci indique quil minimise leur am-
pleur. Ce principe peut tre compar aux lois biomcaniques de minimisation de
leffort, ltre humain choisissant la solution la plus prenne sur le long terme.
Ractivit. Ce dernier principe est loppos du prcdent, signiant que ltre hu-
main peut accomplir une adaptation brutale en raction un vnement soudain.
Nanmoins, le principe de prdiction permet gnralement danticiper de telles
situations an de prparer leur ventuelle apparition.
Lapproche globale retenue pour ce modle est proche de celle introduite par F. Feurtey
(confre Section 1.4.3, page 36) : une reprsentation en (x, y, t) des collisions. Consi-
drons une entit de rfrence E
re f
, qui est en train de naviguer, et une entit voisine
E
voi
, viter. Lentit de rfrence peut prendre nimporte quelle direction et vitesse,
puisque ce sont les lments que nous cherchons caractriser. Sa reprsentation en
(x, y, t) peut alors prendre la forme dun cne (Figure 5.15(a)), reprsentant les varia-
tions de position de son centre de gravit une vitesse donne. La position de lentit
voisine P
voi
est quant elle extrapole en tenant compte de ses direction
D
voi
et vitesse
V
voi
courantes, considres comme constantes :
P
voi
(t) = P
voi
+t.V
voi
.
D
voi
La zone de lenvironnement viter correspond alors un cercle autour de cette po-
sition paramtrique, rsultant en un cylindre oblique en tenant compte du temps (Fi-
gure 5.15(b)). Le rayon de ce cercle est choisi pour reprsenter la distance minimale
conserver entre la position des deux entits, soit la somme de leur rayons incrmente
dune distance de scurit D
sec
paramtrable :
R = R
voi
+R
re f
+D
sec
Ltape suivante consiste identier les collisions futures. En conservant les repr-
sentations prcdentes, les collisions futures sont les surfaces dintersection entre le
cylindre et le cne (Figure 5.16(a)). Le calcul analytique de cette intersection est pos-
sible, bien que relativement complexe. Nanmoins, ces surfaces ne reprsentent les
potentiels de collision qu une vitesse donne de lentit de rfrence, et il nous faut
considrer lensemble de ses vitesses potentielles, variant de 0 sa vitesse maximale
V
max
. Ainsi, le calcul devient une intersection de volumes, o tous les cnes possibles
de lentit de rfrence sont pris en compte (Figure 5.16(b)). Le calcul analytique de-
161
Le comportement de lhumain virtuel
(a) Extrapolation du dplacement de lentit de r-
frence.
(b) Extrapolation de la zone de collision potentielle.
FIG. 5.15: Extrapolation des dplacements dans le temps et lespace.
vient ce moment l impossible.
La solution propose est de discrtiser le temps, permettant de ramener le problme
en deux dimensions. Ainsi, nous conservons la continuit des valeurs recherches, que
sont la vitesse et la direction de mouvement. Le mcanisme suivant consiste quantier
les collisions dtectes, la dcision ntant alors plus quune simple minimisation de
cot.
Pour nir, nous devons remarquer que ce processus de navigation ractive ne doit pas
tre seulement sensible aux obstacles viter, mais doit aussi tre capable dintgrer
des entits attractives. Ces entits peuvent reprsenter des liens sociaux entre huma-
nodes, ou encore les zones dutilisation ou dattente dobjets interactifs. Nous prsen-
terons la faon dont nous intgrons cette catgorie dinformation, en nimpliquant que
des modications mineures la mthode grant les obstacles.
Cette approche de navigation ractive peut tre dcoupe en cinq tapes (Figure 5.17),
que nous dtaillerons par la suite :
1. Slection des entits inuentes : permet dextraire de lenvironnement immdiat
dun humain virtuel les lments prendre en compte lors de la navigation.
2. Prdiction et discrtisation : permet dextrapoler le dplacement des entits in-
uentes en une reprsentation simplie.
3. Quantication des informations : permet dassocier un cot aux informations
produites lors de ltape prcdente.
4. Fusion des donnes : permet de combiner lensemble des reprsentations prc-
dentes, an den simplier la comparaison.
5. Prise de dcision : effectue le choix de dplacement nal, qui sera communiqu
directement au module biomcanique de lhumain virtuel.
162
La navigation ractive
(a) Dtection des collisions pour une vitesse donne, et projection de la zone dans le plan.
(b) Dtection des collisions pour un ensemble de vitesses de lentit de r-
frence, et projections des zone dans le plan.
FIG. 5.16: Dtection des collisions sur un cas simple. Les zones de collision
sont de gomtrie complexe, pouvant tre unique (cas reprsent),
ou double (cas ou le cylindre pntre et ressort du cne).
163
Le comportement de lhumain virtuel
FIG. 5.17: Vue densemble et intgration de la navigation ractive.
5.4.2 Slection des entits inuentes
La premire tape de notre approche consiste slectionner les entits inuentes de
la navigation ractive. Lobjectif est de prendre en considration sufsamment denti-
ts pour sassurer que lenvironnement immdiat est reprsent, mais de limiter leur
nombre pour ne pas surcharger le modle, que ce soit en quantit dinformations ou
en temps de calcul. Ce principe correspond la ralit, o un tre humain ne va te-
nir compte que dun nombre limit dentits environnentes. Deux catgories dentits
doivent tre slectionnes : les obstacles et les attracteurs.
Slection des obstacles statiques et dynamiques.
Les obstacles environnants peuvent tre de deux types : statiques ou dynamiques.
Nous limitons la gestion des obstacles mobiles aux autres humanodes virtuels de la
simulation. Les humanodes sont slectionns sils se trouvent une distance maximale
D
dyn
de lentit de rfrence. Cette premire slection est ensuite ltre par visibilit,
seules les entits ntant pas occultes par un obstacle statique tant conserve. Enn,
les entits qui se trouvent dans le demi-cercle antrieur de lentit de rfrence sont bien
values comme dynamiques, mais celles se trouvant dans le demi-cercle postrieur
sont considres comme ayant une vitesse nulle. Ce dernier cas signie que lentit de
rfrence est consciente de la prsence dautres personnes, mais ne peut estimer leur
dplacement.
Les obstacles statiques correspondent aux murs de lenvironnement, ainsi quaux diff-
rents objets physiques statiques. Ces derniers tant directement intgrs la subdivision
ainsi quau graphe topologique, lensemble de la slection se limite donc rcuprer
les segments contraints environnants lentit. Tout comme pour les entits dynamiques,
cette slection est borne par une distance D
sta
, et ltre par visibilit.
Les deux distances pr-cites doivent suivre les contraintes suivantes, an de permettre
un fonctionnement optimal du processus de navigation ractive :
164
La navigation ractive
D V
max
.t La distance doit tre suprieure la distance maximumque peut parcourir
une entit en un pas de temps, an dviter des collisions non prdites.
D V
max
.k
n
.t La distance doit tre infrieure la distance maximale que peut par-
courir lentit durant la totalit du temps prdit, les obstacles plus loigns nayant
que peu ou pas dimpact sur la dcision.
Slection des attracteurs.
La slection des attracteurs est un processus plus rchi que pour les obstacles. Ces
attracteurs vont reprsenter des buts secondaires dans lenvironnement, permettant no-
tamment un comportement opportuniste de lhumain virtuel. Ils sont indiqus par des
processus externes la navigation ractive, principalement par les tches cognitives
que nous verrons dans la section suivante. Par exemple, les tches cognitives grant
linteraction utiliseront ces attracteurs pour indiquer les zones dattente et dutilisation
dun effecteur.
Au sein de la navigation ractive, les attracteurs sont disponibles sous la forme dune
liste de zones dancrage dnies par BIIO (confre Section 3.2.4, page 97). Cette liste
est traite sans ltrage supplmentaire. Le seul pr-requis concernant un attracteur est
que celui-ci doit tre visible par lentit de rfrence. Nous pouvons donc remarquer
que les zones dancrage ne seront inscrites dans la liste quaprs un test pralable utili-
sant le processus dobservation de lhumain virtuel.
5.4.3 Prdiction : une discrtisation du temps
Maintenant que les entits voisines ont t slectionnes, il faut prdire les collisions
et attractions dont elles seront responsables. Le but est de synthtiser ces informations
par un procd rapidement calculable, et dgradant au minimum les informations que
nous voulons caractriser : les vitesses autorises suivant les directions de mouvement.
Pour se faire, nous avons choisi de discrtiser le temps, en valuant les dplacements
par intervalles successifs. Ces intervalles sont de taille croissante, an de couvrir une
distance temporelle maximale tout en conservant une certaine prcision pour lavenir
proche. Nous utilisons donc les intervalles suivants :
[0; t
0
[, [t
0
; t
1
[, . . . , [t
n1
; t
n
[
avec t
i
= k
i
.t
Pour chaque borne t
i
, le facteur k 1 reprsente la rapidit de croissance de linter-
valle, tandis que le facteur t > 0 reprsente sa prcision. Plus le facteur k est grand, et
plus la prcision se dgrade rapidement dans les intervalles successifs, une valeur de 1
signiant que la prcision est conserve sur tous les intervalles (ils seront tous de mme
taille). Plus le facteur t est faible, plus la prcision est importante, augmentant dau-
tant le nombre dintervalles considrer pour prdire sur une dure xe. Le dernier
facteur impliqu est n, qui dtermine la date maximale considre par la prdiction.
Dans notre cadre dapplication, nous proposons dutiliser k = 2, t = 1s, et n = 3,
signiant que nous considrons une date maximale de prdiction de huit secondes.
165
Le comportement de lhumain virtuel
Le facteur de croissance k utilis nous permet dobtenir une bonne prcision pour les
deux premiers intervalles, couvrant chacun une seconde. Cette valeur a pour but de se
rapprocher de lunit de temps ncessaire un tre humain pour faire un pas, moment
o il effectue gnralement ses adaptations de mouvement.
Dtaillons maintenant les calculs effectuer pour obtenir cette discrtisation, que ce
soit pour les entits dynamiques, mais aussi statiques. Nous verrons dans un troisime
temps ladaptation de cette mthode aux entits attractives.
Discrtisation des obstacles dynamiques
Les obstacles dynamiques de lenvironnement correspondent aux autres humanodes
virtuels. Nous allons tudier la mthode pour prendre en compte une seule de ces entits
voisines, et gnraliserons ce processus lensemble du voisinage slectionn plus loin
dans cette section. Le principe est de dcouper lespace entourant lentit de rfrence
en quartiers successifs, reprsentant chacun les caractristiques de la prdiction pour
un intervalle de temps. Nous obtenons ainsi n +2 quartiers couvrant lensemble des
directions possibles : un pour chaque intervalle, et un supplmentaire pour lespace
libre.
La premire tape est donc de prdire la position de lentit voisine chaque borne
des intervalles de temps t
i
. On peut voir sur la gure 5.18(a) ces projections, avec
une indication des zones de collision potentielles correspondantes (cercles de rayon
R
voi
+R
re f
). Lensemble des directions couvertes par chaque intervalle correspond aux
valeurs comprises entre chaque zone de collision, soit toutes les directions se situant
entre les tangentes extrieures aux cercles reprsentant ces zones. Les quartiers ainsi
obtenus sont reprsents sur la gure 5.18(b) par les tangentes colores, apparies deux
deux. Le recouvrement des quartiers entre eux sera abord par la suite, nous les
considrerons pour le moment indpendamment les uns des autres.
La deuxime tape consiste exprimer la collision potentielle associe chaque inter-
valle de temps, et donc chaque quartier dans lespace. Le but tant de dterminer la vi-
tesse autorise suivant la direction, nous nous servons directement de cette valeur pour
quantier les quartiers. On doit ici remarquer que pour viter une collision, direc-
tion de mouvement ge, une entit peut soit acclrer pour passer devant lautre, soit
dclrer pour passer derrire. Nous associons donc deux bornes de vitesses chaque
intervalle, lune reprsentant la vitesse maximale autorise pour passer derrire lautre
V
lente
, lautre reprsentant la vitesse minimale adopter pour passer devant V
rapide
. Ces
vitesses sont calculables analytiquement, suivant la notation introduite dans les prin-
cipes de la navigation :
V
lente
(t)=
_
_
_
_
P
re f
P
voi
(t)
_
_
_
_
R)
t
V
rapide
(t)=
_
_
_
_
P
re f
P
voi
(t)
_
_
_
_
+R)
t
Chaque quartier est donc congur par ces deux vitesses, par les angles de direction
extremum
1
et
2
, et par lintervalle de temps quil symbolise (Figure 5.19(a)).
Les deux valeurs que nous stockons pour chaque intervalle [; ] sont la valeur mini-
male de V
lente
(t) et maximale de V
rapide
(t). On obtient ainsi les bornes de vitesses ga-
166
La navigation ractive
(a) Positions de lentit voisine lorigine et pour chaque borne dintervalle
de temps t
i
, ainsi que zones de collision potentielle correspondantes.
(b) Valeurs limites des directions couvertes par chaque intervalle de temps,
sous la forme de tangentes colores apparies deux deux.
FIG. 5.18: Discrtisation du temps pour une entit voisine dynamique. Les
paramtres utiliss pour les intervalles de temps sont ceux intro-
duits dans notre modle : k = 2, t = 1s, et n = 3
ranties libres de collision : si lentit de rfrence choisit une direction comprise dans
ce quartier, et une vitesse en dehors de [minV
lente
; maxV
rapide
], alors aucune collision
nest redouter avec lentit voisine concerne pour ce laps de temps. Nous devons
pour nir faire tat du cas particulier du premier quartier, correspondant lintervalle
[0; t]. Celui-ci se voit toujours affect une vitesse rapide innie, symbolisant le fait
quil est impossible de passer au travers dune entit voisine : on ne peut la prcder
sur cet intervalle, tant donn quil correspond sa position initiale.
Une fois que tous les quartiers ont t congurs de la sorte, on obtient une couver-
ture 360de lespace environnant lentit de rfrence, avec des quartiers pouvant se
chevaucher, et une zone libre dont les vitesses ne sont pas contraintes (Figure 5.19(b)).
Nous verrons par la suite comment ces informations sont fusionnes an dobtenir des
quartiers indpendants, puis comment une dcision est prise dans cette reprsentation.
167
Le comportement de lhumain virtuel
(a) Paramtres intrinsques du troisime quartier produit. En bleu, espaces
de vitesses libres de collision pour lentit de rfrence.
(b) Vue densemble des quatre quartiers correspondant des collisions. Le
cinquime quartier, libre de toute collision, nest pas reprsent pour des
questions de lisibilit.
FIG. 5.19: Quantication des espaces-temps des collisions, et vue den-
semble du dcoupage produit.
Discrtisation des obstacles statiques
En plus des obstacles dynamiques, une entit en mouvement doit tre capable de na-
viguer au sein dobstacles statiques, tels que les murs. Nous allons prsenter ici une
mthode de discrtisation de ces obstacles, an dobtenir un dcoupage en quartiers de
lespace similaire celui vu prcdemment. Lobjectif est ainsi dexprimer lensemble
des donnes lies la navigation grce la mme smantique, an den permettre la
fusion pour aboutir une prise de dcision unique, tenant compte simultanment de
tous les facteurs. Nous assimilerons tous ces obstacles des segments de droite, en
partant du principe que toute forme gomtrique peut tre exprime de cette faon.
Le premier point traiter est donc lobtention de quartiers comparables ceux des
entits dynamiques. Les obstacles statiques tant par dnition immobiles, une discr-
168
La navigation ractive
tisation du temps nest pas ici directement applicable. Nous effectuons la place une
discrtisation de lespace, qui servira par la suite dduire une discrtisation tempo-
relle, et qui vise les mmes buts : conserver une certaine prcision dans lenvironne-
ment proche de lentit de rfrence, tout en permettant de se projeter assez loin dans
le futur.
Nous choisissons comme origine de la discrtisation spatiale le point le plus proche
de lentit de rfrence appartenant lobstacle (P
0
sur la gure 5.20(a)). Ce point est
le projet de P
re f
sur lobstacle, ou lextrmit du segment la plus proche si la projec-
tion est extrieure. Nous dcoupons ensuite le segment suivant les mme intervalles
que pour les entits dynamiques, mais appliqus cette fois-ci la vitesse dsire de
lentit de rfrence, suivant le vecteur direction support du segment (vers chacune des
extrmits). Nous obtenons ainsi une srie de points supports par le segment, spars
par des intervalles de distance croissants depuis le point le plus proche de lentit de
rfrence. Ds quun intervalle produit un point en dehors du segment, le dcoupage
est arrt, et lextrmit du segment la plus proche remplace le point produit (points P
3
et P
4
sur la gure 5.20(a)).
(a) Discrtisation de lespace suivant un principe quivalent la discrti-
sation temporelle. Le point le plus proche de lobstacle statique P
0
est
choisi comme origine, puis un dcoupage est effectu suivant des mul-
tiples de la vitesse dsire de lentit de rfrence V
re f
.
(b) Chaque quartier obtenu est congur de la mme faon que pour une
entit dynamique. Leur vitesse rapide est toujours innie, car il est im-
possible de passer au travers dun obstacle.
FIG. 5.20: Discrtisation de lespace pour les obstacles statiques. Un dcou-
page de lespace en quartiers est obtenu par un procd quivalent
aux entits dynamiques.
169
Le comportement de lhumain virtuel
Les quartiers sont ensuite obtenus en reliant directement le centre de lentit de rf-
rence chaque point des intervalles. Seules les extrmits ne sont pas relies de cette
faon, mais via la tangente extrieure un cercle de mme rayon que lentit (plus
la distance de scurit). Cette spcicit permet de prvoir le passage proximit de
lobstacle (comme langle dun carrefour).
Une fois les quartiers obtenus, il reste les congurer. Nous employons ici exactement
la mme smantique que pour les entits dynamiques, an de permettre la comparaison
des quartiers quelle que soit leur origine (Figure 5.20(b)). La vitesse rapide est ici un
non-sens, car il est impossible de prcder un obstacle immobile ; celle-ci est donc
toujours innie pour les quartiers obtenus. La vitesse lente, correspondant la vitesse
admissible pour ne pas percuter lobstacle, est obtenue ici grce la distance minimale
D lobstacle dans chaque quartier :
D
[P
;P
+1
]
=
_
_
P
re f
P
_
_
R
re f
Par un procd dinversion du calcul, on obtient lintervalle de temps [t
a
; t
a+1
] corres-
pondant au quartier, avec une vitesse lente de grandeur comparable la vitesse courante
de lentit, couvrant au maximum la distance pr-cite :
V
lente
= D
[P
;P
+1
]
/t
a+1
= D
[P
;P
+1
]
/(k
a+1
.t)
soit k
a+1
= D
[P
;P
+1
]
/(V
lente
.t)
soit a = log
k
(D
[P
;P
+1
]
) log
k
(V
lente
) log
k
(t) 1
On injecte dans cette dernire formule la vitesse dsire de lentit de rfrence (V
lente
=
V
re f
), pour obtenir lexposant du facteur de croissance a de lintervalle, qui est arrondi
lentier infrieur. On en dduit lintervalle de temps correspondant [t
a
; t
a+1
], avec
par convention t
1
= 0. Pour nir, la vitesse lente assigne au quartier est obtenue en
rinjectant t
a+1
dans la premire formule.
Nous obtenons par lensemble de ces procds une reprsentation en quartiers succes-
sifs dun obstacle, cette fois-ci sans aucun recouvrement. Cette mthode est applique
lensemble des obstacles statiques avoisinant lentit de rfrence.
Discrtisation des entits attractives
An de permettre la fusion de linformation, les entits attractives de lenvironnement
doivent tre reprsentes par des caractristiques identiques aux obstacles. Nous pro-
posons donc deffectuer les mmes traitements que prcdemment, en adaptant nan-
moins la conguration des quartiers produits.
Le premier point quil faut relever, quelle que soit la nature de lentit attractive consi-
dre, est que la vitesse rapide permettant de la prcder est un non-sens. En effet, on
ne cherche pas ici viter lentit, mais la rejoindre, la vitesse rapide devenant non
contrainte, et donc toujours nulle.
Position relative un attracteur dynamique. La premire catgorie de zone attrac-
tive que nous allons traiter correspond un lien social avec une entit dynamique. Son
170
La navigation ractive
cadre dutilisation typique est le suivi de personnes, que ce soit au sein dun groupe
de personnes dni (comme une structure familiale), ou pour grer une le dattente.
Cette zone attractive est exprime par une position relative une entit dynamique,
et donc trois facteurs : une direction relative
D
rel
, une distance relative suivant la di-
rection prcdente d
rel
, et une distance moyenne autorise la position optimale d
aut
.
Nous appliquons alors le mme principe de discrtisation que pour les obstacles dy-
namiques, en considrant une entit virtuelle E
vir
positionne relativement lentit
voisine E
voi
. Cette entit virtuelle a les paramtres prcits, de rayon d
aut
, et utilisant
les mmes direction et vitesse que lentit voisine (Figure 5.21(a)). Les quartiers sont
ensuite obtenus de la mme faon que pour un obstacle, et congurs suivant les mmes
paramtres. La vitesse lente est calcule de faon ce quelle englobe lentit virtuelle,
pour exprimer le fait que lon veuille rejoindre cette position sans la dpasser :
V
lente
(t) =
_
_
_
P
re f
P
vir
(t)
_
_
_+d
aut
t
(a) Considration dune entit virtuelle relative lentit
voisine.
(b) Discrtisation temporelle. La vitesse lente
permet de se superposer lentit virtuelle.
FIG. 5.21: Discrtisation dune entit attractive dynamique.
Gestion des attracteurs statiques. Les autres zones attractives que nous proposons
de grer sont statiques, et correspondent aux zones dancrage dnies pour les objets
interactifs (confre Section 3.2.4, page 97) :
Zone ponctuelle : elle est dnit par un point dans lespace, avec une distance autori-
se, donnant au nal un cercle. Son traitement est identique celui dune entit
dynamique avec une vitesse nulle.
Zone supporte par un segment : elle aussi dispose dune distance autorise. Son
traitement est identique un obstacle statique, auquel on applique les congura-
tions particulires de vitesse : V
rapide
=0 et V
lente
englobant la distance autorise,
et donc le segment.
Zone supporte par un polygone convexe : avec aussi une distance autorise. Son
traitement est spar en trois tapes :
1. Filtrage de lensemble des segments visibles par lentit de rfrence.
2. Traitement spar de chaque segment restant de la mme manire que pour
une zone supporte par un segment.
171
Le comportement de lhumain virtuel
3. Fusion des quartiers obtenus lors de ltape 2.
Ces attracteurs sont utilises pour reprsenter les zones dancrage des les dattente et
dutilisation des effecteurs de lenvironnement. Nous verrons par la suite quils sont
communiqus par la tche cognitive grant linteraction lorsque cela est ncessaire.
5.4.4 Quantication des informations de navigation
Maintenant que nous avons exprim lensemble des collisions ventuelles grce une
smantique synthtique, voyons comment il est possible de les traiter pour en extraire
la meilleure option de mouvement. Rappelons que nous cherchons caractriser une
direction et une vitesse optimale de dplacement, en essayant de maximiser la dure
de validit de cette dcision. Nous allons ainsi quantier les quartiers obtenus lors
de ltape prcdente, pour permettre par la suite de fusionner facilement les cots et
caractristiques des quartiers se chevauchant.
Quantication des obstacles
Commenons par nous pencher sur le cas le plus courant, savoir les obstacles de len-
vironnement. Le cot assign chaque quartier doit tenir compte des facteurs suivants,
sachant que plus il est faible, meilleur est le quartier :
1. Plus les directions couvertes par le quartier sont loignes de la direction sou-
haite, plus le cot est lev. Si la direction est comprise par le quartier, cette
quantication est nulle. Ce facteur cherche respecter la direction souhaite par
lentit, i.e. obtenue lors de la planication de chemin.
2. Plus ladaptation en vitesse est forte pour viter la collision, plus le cot est
lev. Si aucune adaptation de vitesse nest ncessaire, cette quantication est
nulle. Ce facteur cherche respecter la vitesse dsire par lentit (choisie par un
autre processus de dcision, comme les tches cognitives).
3. Plus lintervalle de temps relatif au quartier est loign, plus le cot est faible.
Ce facteur exprime lincertitude relative une collision loigne dans le temps
en diminuant son importance relative.
Les deux premiers facteurs doivent disposer de bornes maximales, au del desquelles
le quartier est considr comme impraticable, son cot tant alors x linni. De
plus, ces facteurs doivent avoir un impact variable et personnel sur la prise de dci-
sion de lindividu, certains prfrant conserver leur trajectoire et dautres leur vitesse.
Une autre remarque concerne le deuxime facteur, qui doit tre spar en deux sous-
facteurs, lun exprimant ladaptation en dclration, et lautre en acclration.
Nous proposons de calculer chaque facteur indpendamment, sous la forme dune
valeur norme. Cette mthode nous permettra ensuite dvaluer un cot nal sen-
sible des degrs de prfrences individuels. Soit F
dir
le facteur relatif la direc-
tion, F
vit
le facteur relatif la vitesse, et F
tem
celui relatif lintervalle de temps, avec
F [0; 1] , et C
max
le cot maximal envisageable, le cot nal est alors :
Cot
obstacle
= (.F
dir
+(1).F
vit
).F
tem
.C
max
Si lun des facteurs est inni, le cot nal devient lui aussi inni, quelles que soient les
autres valeurs. La valeur de pondration [0; 1] est un degr de prfrence personnel
172
La navigation ractive
permettant de rendre plus ou moins prioritaire la conservation de lun des deux premiers
facteurs :
0 Conservation de la vitesse.
1 Conservation de la direction.
=
1
2
Valeur neutre.
Enn, C
max
permet dintroduire une quantication absolue pour le quartier trait, pou-
vant tre sensible la smantique de lobstacle considr. tudions plus en dtails
chaque partie du cot calcul.
Facteur de direction F
dir
Le facteur de direction est valu en comparant la direction
souhaite D
re f
aux directions comprises dans le quartier. Deux cas peuvent se produire
(Figure 5.22) :
(a) La direction dsire D
re f
est lintrieur du quartier. Dans ce cas F
dir
est opti-
mum, et a une valeur nulle.
(b) La direction D
re f
est spare du quartier par un angle minimal . Dans ce cas le
facteur est calcul de la faon suivante :
F
dir
=
_
_
_
si
max
1cos()
2
sinon
Avec
max
la dviation angulaire maximale autorise lors de la navigation (para-
mtre personnel, pouvant varier suivant la situation).
(a) (b)
FIG. 5.22: valuation du facteur de direction lors de la quantication dun
quartier. (a) La direction dsire se trouve dans le quartier, lcart
est nul. (b) La direction dsire est en dehors du quartier, lcart
angulaire est retenu.
Notons que ce facteur peut aussi tre inuenc par le signe de sin(), an de reprsenter
une prdisposition de lentit tourner gauche (sin > 0) ou droite (sin < 0). Un
facteur complmentaire de rduction est simplement appliqu F
dir
dans le cas o la
direction est privilgie, avec 0 < < 1 :
F
dir
=
_
_
_
.F
dir
si la direction est privilgie
F
dir
sinon
173
Le comportement de lhumain virtuel
Facteur de vitesse F
vit
Ce facteur est valu par comparaison de deux sous-facteurs
correspondants lacclration F
acc
et la dclration F
dec
, pondrs par une valeur de
prfrence personnelle [0; 1] :
F
vit
=
_
_
0 si V
re f
/ [V
lente
;V
rapide
]
F
acc
si .F
acc
< (1).F
dec
F
dec
sinon
Ce facteur est donc nul si la vitesse dsire V
re f
nest pas contrainte par le quartier, ou
prend la valeur de meilleur sous-facteur dans le cas contraire. Suivant le mme principe
que la valeur de la formule gnrale du cot, la valeur permet de privilgier la
dclration ( 1) ou lacclration ( 0). Les sous-facteurs sont valus grce
aux distances sparant la vitesse de rfrence V
re f
de la vitesse lente (distance d
lente
) et
de la vitesse rapide (distance d
rapide
), en tenant compte de la vitesse maximale possible
V
max
:
F
dec
=
_
_
_
si d
lente
decel
max
d
lente
V
re f
sinon
F
acc
=
_
_
_
si d
rapide
accel
max
d
rapide
V
max
V
rapide
sinon
Des bornes maximales dadaptation en dclration decel
max
et acclration accel
max
sont aussi prises en compte an de contraindre les facteurs correspondants.
Facteur temporel F
tem
. Ce dernier facteur est sensible lloignement dans le temps
de la collision contenue par le quartier. Il est calcul grce la borne maximale t
b
de lintervalle de temps [t
a
; t
b
] associ au quartier, compare la date prdite la plus
loigne T = k
n
.t :
F
tem
= 1.
t
b
T+1
La dernire valeur de prfrence [0; 1] introduite ici permet de faire varier le degr
de conance en une prdiction future, depuis une conance absolue ( 0) une
incertitude forte ( 1).
Cot maximal C
max
Le cot maximal nest pas valu pour effectuer le calcul du
cot global, mais constitue une donne dentre du processus. Ce cot pourra tre
choisi diffremment suivant lobstacle considr an dintroduire une caractrisation
individualise. Par exemple, le cot maximal associ aux murs pourra tre lgrement
infrieur celui associ aux autres humanodes, an dinduire une plus forte conserva-
tion de lespace personnel vis vis des entits dynamiques.
Quantication des attracteurs
La quantication des attracteurs doit produire un cot dautant plus faible que le quar-
tier contient un attracteur proche dans lespace et dans le temps. Ce principe permet de
renforcer un lien dattraction lorsque llment correspondant est proximit.
174
La navigation ractive
Ainsi, nous choisissons dexprimer un cot global ngatif pour les quartiers attractifs,
dont la valeur absolue va crotre suivant la ralisation de diffrents facteurs F, corres-
pondant ceux voqus prcdemment. Dans ce cot, deux facteurs vont sopposer :
dune part le facteur de direction, qui exprime le besoin de conserver la direction ob-
tenue lors de la planication de chemin, dautre part le facteur de vitesse, qui exprime
lattirance quexerce le quartier sur lentit. Nous proposons la formule suivante, utili-
sant la mme smantique que pour les obstacles :
Cot
attracteur
= min( 0 ; .F
dir
(1).F
vit
).F
tem
.C
max
Cest donc sensiblement la mme mthode de calcul que pour les obstacles, les fac-
teurs de direction et vitesse ntant plus associatifs mais concurrents. Dtaillons les
composantes de ce calcul.
Facteur de vitesse F
vit
Le facteur de vitesse est ici valu de faon particulire. En
effet, nous avons vu que les quartiers attracteurs nont pas de vitesse rapide, le sous-
facteur dacclration devenant donc inutile. Quant au sous-facteur de dclration, il
ne reprsente plus une gne occasionne lentit cause du changement de vitesse,
mais plutt la force du lien dattraction voqu prcdemment. Ainsi, plus la vitesse
sera contrainte, plus ce lien devra tre fort (F
dec
1) :
F
vit
= F
dec
=
_
_
_
0 si V
lente
>V
max
1
V
lente
V
max
sinon
Composantes inchanges. Les facteurs F
dir
et F
tem
, ainsi que le cot maximal C
max
0, restent identiques ceux valus pour les obstacles, leur signication tant la mme.
Notons que bien que C
max
soit positif, la formule de calcul du cot global donnera une
valeur ngative ou nulle. Ce cot maximal pourra varier pour reprsenter diffrents ni-
veaux absolus dattraction, pouvant par exemple tre assez faible vis vis dun autre
humanode reprsentant un collgue de travail, et plus fort entre les membres dune
famille se dplaant ensemble.
Synthse
La quantication de chaque quartier a permis de synthtiser ses caractristiques en un
cot unique. Ce cot est sensible des facteurs qualitatifs pouvant varier suivant la s-
mantique de lentit qui a produit le quartier. Ces facteurs sont pour lassociation ou
la concurrence entre vitesse et changement de direction, pour le penchant tourner
dans une direction donne, pour la concurrence entre acclration et dclration, et
enn pour lvaluation du niveau de conance en la prdiction. La mthode de calcul
fonctionne par dgradation dun cot maximal C
max
reprsentant la qualit globale de
lentit correspondant au quartier. Cette approche permet de tenir compte des principes
de locomotion humains, tout en les synthtisant en une valeur pouvant tre manipule
facilement. Nous allons voir par la suite que ce cot va grandement simplier la com-
paraison des collisions et attractions entre elles, pour en extraire la meilleur option de
mouvement.
175
Le comportement de lhumain virtuel
5.4.5 Fusion des informations
Maintenant que nous avons dni et quanti les informations lies la navigation, tu-
dions la faon dont nous allons les fusionner pour aboutir une reprsentation unique
de lespace et du temps. Le but est donc ici de synthtiser toutes les donnes produites
pour prparer leur analyse en vue dune prise de dcision. Cette fusion nintervient
quaprs lvaluation des cots an de permettre ceux-ci de tenir compte de la s-
mantique des entits voisines. En effet, cette information ne sera plus accessible une
fois la fusion effectue, un quartier pouvant alors correspondre plusieurs attractions
et collisions. Comme nous nous sommes efforcs de conserver la mme smantique
tout au long des tapes prcdentes, la fusion ne consiste alors quen un dcoupage
des quartiers se chevauchant sur plusieurs des discrtisations effectues. Nous allons
tudier cette mthode de fusion en prenant le cas de la discrtisation obtenue pour
une entit dynamique (Figure 5.19(b), page 168), le processus restant identique si lon
considre plusieurs discrtisations dorigines diffrentes.
La premire tape consiste donc obtenir des quartiers ne sintersectant pas dans
lespace. Le principe est ici trivial, consistant en une simple intersection angulaire.
Pour chaque intersection entre deux quartiers Q
et Q
D
des
. Le principe employ est le mme que lors de lva-
178
La navigation ractive
luation du facteur de direction pour la quantication des quartiers. Deux cas peuvent
se produire :
D
des
Q
m
La direction dsire appartient au quartier, elle est donc conserve.
D
des
/ Q
m
La direction dsire nappartient pas au quartier, cest donc la direction
appartenant au quartier qui est la plus proche (en distance angulaire) de
D
des
qui
est retenue (Figure 5.25(b)).
Extraction de la vitesse de mouvement.
La vitesse de mouvement V
m
est value depuis les donnes du meilleur quartier Q
m
,
en se basant sur la vitesse dsire V
re f
. Deux cas peuvent se produire :
V
re f
V
lente
(V
re f
V
rapide
V
rapide
= 0) La vitesse dsire nest pas contrainte par
le quartier, elle est donc conserve : V
m
=V
re f
. La deuxime partie du test prend
en compte le cas particulier des quartiers reprsentant uniquement des attrac-
teurs, et donc avec une vitesse rapide nulle.
V
re f
>V
lente
(V
re f
<V
rapide
V
rapide
= 0) La vitesse dsire est cette fois-ci contrainte
par le quartier. Une vitesse intermdiaire V
m
est ici dtermine, correspondant
la meilleur option de vitesse moyenne sur lintervalle de temps correspondant au
quartier. Cette vitesse est soit la vitesse lente, soit la vitesse rapide (si celle-ci
nest pas nulle ou innie), suivant la quantication des sous-facteurs de dcl-
ration et dacclration ainsi que la valeur de prfrence personnelle (confre
Section 5.4.4, page 174) :
V
m
=
_
_
_
V
rapide
si V
rapide
= 0.F
acc
< (1).F
dec
V
lente
sinon
La vitesse dadaptationV
m
est alors choisie de telle faon quelle nimpose quune
faible variation pour la seconde venir, tout en garantissant une variation conti-
nue sur lintervalle de temps correspondant au quartier, aboutissant une vitesse
moyenne V
m
. Cette faon de procder a pour objectif dviter des adaptations
trop brutales pour des prdictions moyen terme, dont la validit nest quhy-
pothtique, et ainsi de rduire les discontinuits dans le mouvement. Pour se
faire, nous exprimons la vitesse sous la forme dune suite arithmtique v
n
ayant
pour raison une acclration instantane A. Cette dernire correspond la varia-
tion de vitesse durant un pas de temps t. En considrant lintervalle de temps
[t
a
.t; t
b
.t] correspondant au quartier, le problme se pose alors de la faon sui-
vante :
v
0
=V
re f
v
n+1
= v
n
+A
tel que
t=t
b
t=1
v
t
t
b
=V
m
Le but est donc de trouver lacclration instantane A telle que la vitesse moyenne
durant les prochains t
b
laps de temps soit V
m
. Aprs dveloppement de lquation
prcdente, on obtient :
A =
2
t
b
+1
.(V
m
+V
re f
)
179
Le comportement de lhumain virtuel
Pour nir, la vitesse optimale V
m
est choisie comme tant celle adopter durant
le prochain laps t, soit :
V
m
= v
1
=V
re f
+A =
2.V
m
+(t
b
1).V
re f
t
b
+1
Notons que la dure de validit de cette vitesse nest que dun laps de temps t,
devant tre recalcule pour suivre les variations de la suite arithmtique.
5.4.7 Conclusion
La navigation forme le dernier comportement ractif de lhumain virtuel. Elle permet
de tenir compte des informations ponctuelles inuenant son dplacement. Lapproche
que nous proposons permet dappliquer les principes noncs en psychologie : prdic-
tion, robustesse, minimisation des ajustements, et ractivit.
Son avantage majeur est de permettre la fusion efcace dinformations de nature dif-
frente, que ce soit des obstacles gnant la circulation, ou des attracteurs incarnant les
objectifs secondaires de lhumanode. Son fonctionnement est indpendant des autres
comportements, si ce nest la prise en charge de leurs directives. Dautre part, ce com-
portement est individualis par lintroduction de facteurs qualitatifs pour la quantica-
tion des lments de lenvironnement.
Enn, la mthode de calcul propose permet de simplier lespace de recherche des
solutions grce une discrtisation du temps. Cela permet datteindre le niveau de per-
formances ncessaire la simulation dune multitude dindividus, tout en conservant
le ralisme indispensable notre cadre dtude.
5.5 Les tches cognitives
Nous avons jusqu prsent dcrit un certain nombre de comportements ractifs, effec-
tuant des traitements automatiss de tches spciques. Ces comportements ncessitent
un certain niveau de contrle externe, que ce soit pour rgler leur mode de fonction-
nement, ou simplement pour les dclencher. Les tches cognitives se chargent de cette
rgulation au sein dun processus comportemental plus abstrait, i.e. plus loign de
la dnition physique de lenvironnement pour se rapprocher dune symbolisation in-
terne. Ces modules comportementaux seront ainsi capables de prendre des dcisions
relatives aux comportements ractifs, sans pour autant avoir besoin de connatre les
dtails de leur fonctionnement.
Nous allons voir que certaines de ces tches cognitives sont uniques au sein de lhuma-
node, se chargeant dun comportement singulier comme lobservation, et que dautres
sont prsentes plusieurs fois, grant des comportements identiques et concurrents comme
le droulement de linteraction. Rappelons que ces tches cognitives sont des spcia-
lisations du concept introduit par BIIO (confre Section 3.2.7, page 100). A ce titre,
elle peuvent exploiter les ressources gres dans linteracteur, et disposent dune prio-
rit dnissant leur ordre relatif dexcution. Nous verrons par la suite que ces tches
cognitives sont prsentes dans un processus global automatique de lindividu, qui les
rafrachira une frquence de 1Hz.
180
Les tches cognitives
Nous allons maintenant dcrire les trois tches cognitives proposes avec lhumain
virtuel : observer, se dplacer, et interagir. Les automates utiliss se basent sur la s-
mantique prsente en annexe B, page 243.
5.5.1 Choix du mode dobservation
Cette premire tche cognitive se charge de piloter lobservation de lhumain virtuel.
Le but est ici dactiver ou dinhiber la rcupration de certaines catgories dinforma-
tions, suivant le contexte comportemental de lentit. Ainsi, il nest pas question ici de
piloter la physique de lobservation (orientation du regard par exemple), mais plutt
lquivalent du processus dabstraction prsent entre la mmoire perceptive et court
terme (confre Section 2.1.2, page 58).
Nous proposons deux modes dobservation :
Regarder. Ce premier mode correspond lobservation passive, que lon effectue im-
plicitement en se dplaant. Cet tat de lobservation ne va se charger que de
rcuprer les informations topologiques perues, sans mettre jour la liste dob-
jets interactifs ventuellement visibles.
Chercher. Ce second mode correspond lobservation active, signiant quun objet
particulier est recherch par lentit. Dans cet tat, le comportement ractif dob-
servation met jour les deux listes de perception de lentit, que ce soit topolo-
gique ou les objets visibles. Ces objets visibles pourront ensuite tre analyss par
dautres tches cognitives qui sont la recherche dinformations.
Ces deux modes sont concurrents, et se synchronisent par lvaluation dune ressource
mise disposition dans lhumain virtuel. Cette ressource, simplement dnomme ob-
servation, est une ressource partage (nous expliquerons cette ncessit dans la section
ddie la gestion de linteraction, Section 5.5.3, page 183). On peut ainsi symboliser
cette tche cognitive par un automate (Figure 5.26) comportant deux tats, correspon-
dants chacun des deux modes pr-cits. Une valuation libre de la ressource observa-
tion signie quelle est disponible 100%, et utilise quelle prsente nimporte quel
autre taux dutilisation. Cette tche cognitive prend donc ses dcisions par lvaluation
dune donne externe, qui sera modie par dautres processus comportementaux.
FIG. 5.26: Lautomate observer choisit les informations visuelles prendre
en compte : uniquement topologiques, ou aussi smantiques.
Pour nir, signalons que cette tche cognitive est toujours active dans lhumanode, et
nest reprsente quune seule fois. Cette proprit est directement issue de la ralit,
lhumain virtuel nayant piloter quun seul mcanisme de perception visuelle. Sa
181
Le comportement de lhumain virtuel
priorit ne varie jamais, et est toujours nulle, signiant que le contrle de lobservation
est une tche paresseuse de lhumain virtuel (elle est toujours value en dernier).
5.5.2 Choix du mode de dplacement
Cette deuxime tche cognitive choisit le mode de dplacement actuel de lhumain vir-
tuel. Encore une fois, il ne sagit pas ici davoir un contrle physique sur la locomotion
de lentit, mais plutt de cataloguer le but global de ce dplacement.
Nous proposons trois modes de dplacement :
Attendre. Ce premier mode correspond labsence de directive de dplacement. Cest
donc un mode par dfaut, qui dnit ce que fait lentit si elle na pas explicite-
ment besoin de se dplacer. Ce mode va donc chercher limiter les interactions
de lhumanode avec les autres entits mobiles, tout en minimisant son dplace-
ment. Pour se faire, des objets interactifs particuliers sont utiliss, dnissant des
zones dattente sans reprsentation physique. Cet tat se contente alors dame-
ner lhumanode dans la zone dattente la plus proche, via une planication de
chemin, puis de congurer sa vitesse dsire la vitesse nulle.
Dambuler. Ce second mode est passif, correspondant au dplacement standard. Il
est activ ds quun autre processus dcisionnel de lhumanode slectionne une
destination dans lenvironnement. Ce mode ninuence en rien le dplacement de
lentit, qui est dj congur par le processus annexe ayant choisi la destination.
Explorer. Ce dernier mode est complmentaire au prcdent, prenant le relais lorsque
la destination choisie est inconnue. Dans ce cas, lexploration de lenvironne-
ment est active, en utilisant la planication de chemin correspondante, jusqu
ce quune destination compatible soit trouve ou que la destination change.
Ces trois modes sont concurrents, et peuvent tre grs, comme pour la tche dobser-
vation, par trois tats dun automate (Figure 5.27). La dcision sy opre en deux temps.
FIG. 5.27: Lautomate se dplacer choisit la tche de dplacement actuelle :
explorer lenvironnement, trouver une zone dattente, ou encore
dambuler vers la destination choisie.
Premirement par lvaluation dune ressource partage prsente dans lhumanode,
dnomme navigation (cette ressource est explicite au mme titre que la ressource
observation dans la partie suivante consacre linteraction). Si cette ressource est uti-
lise, cest quune autre tche cognitive a command un dplacement, le dplacement
passant alors en mode dambuler. Dans le cas contraire, le contexte comportemental
182
Les tches cognitives
de lagent autonome est test pour savoir si des interactions sont actuellement requises.
Si cest le cas, et sachant quaucune destination nest explicitement choisie, cest que
lhumanode est incapable de trouver un effecteur valide dans lenvironnement : il passe
donc en mode exploratoire. Autrement, lhumanode na pour le moment pas dactivit
ncessitant de mouvement, et il passe donc en mode dattente. On peut ainsi voir que
cette tche cognitive base ses dcisions sur des donnes provenant dautres processus
de lhumain virtuel.
Pour les mmes raisons que la tche dobservation, cette tche de rgulation est tou-
jours active dans lhumanode, et reprsente une seule fois. Sa priorit suit aussi la
mme rgle, tant toujours de valeur nulle.
5.5.3 Gestion de linteraction
Cette dernire tche cognitive est aussi la plus complexe. Elle se charge dorganiser
compltement le droulement dune interaction, depuis son activation jusqu lutili-
sation de leffecteur la permettant. Ainsi, cest cette tche qui effectue le lien entre les
affordances gres par linteracteur, et le dplacement de lentit au sein de lenviron-
nement.
Cette tche est multiple pour un individu, i.e. elle peut tre prsente plusieurs fois,
chaque instance grant une affordance diffrente. Comme ce processus a un impact
direct sur le dplacement de lhumain virtuel, les diffrentes instances doivent tre ca-
pables de grer leur concurrence quant ce type de contrle. Nous allons prsenter cette
tche cognitive sous la forme dun automate hirarchique, dont chaque sous-automate
se charge dune partie du processus dinteraction (Figure 5.28), dont notamment la
gestion de la concurrence. Nous exposerons globalement le rle de chacun de ces sous-
automates, une description plus dtaille tant fournie en annexe (confre Annexe C,
page 245).
FIG. 5.28: Vue densemble des changements de modalit dinteraction.
Chaque sous-automate de linteraction est reprsent, avec les
transitions possibles vers dautres sous-automates. Une transition
symbolise lactivation dun des tats de lautomate cibl. Les
conditions ne sont pas reprsentes dans un souci de lisibilit.
Interagir est le premier automate tre activ, par lattribution dune affordance g-
rer (nous reviendrons sur cette attribution avec le raisonnement de lhumanode, Cha-
pitre 5.6, page 186). Cet automate analyse ltat de laffordance dans le gestionnaire de
183
Le comportement de lhumain virtuel
linteracteur pour prendre sa dcision. Si laffordance est active, le processus dinter-
action dbute. Si laffordance est inactive (car sa pr-condition rationnelle a chou, ou
quelle comporte des sous-buts), le processus se met en attente. Enn, si laffordance
nest plus requise (elle est absente du gestionnaire), le processus met n linteraction.
Lautomate utilisation possible est activ si laffordance est rationnellement plausible.
Cest lui qui gre la concurrence entre plusieurs interactions pour le pilotage de lhu-
manode, grce la consommation des deux ressources partages de lhumanode :
la navigation et lobservation. La premire tche cognitive dinteraction entrant dans
ce mode, ordonne grce la priorit hirarchique de laffordance gre, pourra ainsi
passer en interaction active aprs avoir consomm 60% de la ressource navigation,
interdisant ce mode aux interactions suivantes. Au maximum quatre tches suivantes
pourront passer en mode ractif, par la consommation de 25% de lobservation. Les
autres tches seront rediriges dans un tat tampon dattente des ressources, jusqu ce
que celles-ci soient libres ou que la priorit de laffordance gre fasse remonter la
tche dans la squence dvaluation des interactions. Remarquons pour nir que cest
lexcution de cet automate, consommant les ressources, qui va directement inuencer
les deux autres tches cognitives vues prcdemment : les gestions de lobservation et
du dplacement.
Mode actif de linteraction
Le mode actif de linteraction est reprsent par les automates gauche de la gure 5.28.
Son premier automate est la recherche active, qui se charge de parcourir lenvironne-
ment pour se rendre proximit dun effecteur compatible avec laffordance courante.
Ainsi, cet automate sassure quun chemin est plani jusqu un endroit contenant
un tel effecteur, puis attend que cet effecteur soit visible, le comportement ractif de
navigation se chargeant automatiquement du mouvement de lhumanode. Lautomate
gre ensuite le pr-abonnement leffecteur, dclarant lintention de lagent autonome
dutiliser celui-ci, et sassure de la validit de la pr-condition locale de laffordance.
En cas de succs, lutilisation de leffecteur peut commencer. Notons que les tests rela-
tifs laffordance et leffecteur sont rcurrents dans cet automate, intervenants chaque
rafrachissement mme si lutilisation active est dmarre.
Lautomate suivant gre lutilisation active de leffecteur slectionn. Celui-ci choisit
si lindividu doit attendre pour linteraction, ou sil peut rejoindre la zone dancrage
de la le dutilisation de leffecteur associe laffordance courante. Une fois la zone
dancrage rejointe, lutilisation relle peut dmarrer.
Le dernier automate de ce mode soccupe de lattente active. Celui-ci applique donc
lorganisation sociale associe la le dattente de leffecteur pour laffordance cou-
rante. Il dispose aussi dun tat terminal dchec, dans le cas ou laffordance ne sup-
porte pas lattente.
Mode ractif de linteraction
Le mode ractif de linteraction est reprsent par les automates droite de la -
gure 5.28.
Son premier automate pilote la recherche ractive dun effecteur compatible avec laf-
184
Les tches cognitives
fordance courante. Ainsi, cet automate na aucun contrle sur la planication de che-
min, mais se contente danalyser les objets interactifs perus par lhumanode au cours
de son dplacement. Si un objet compatible est dtect, lautomate sassure alors de la
validit de la pr-condition locale, dclare lintention dutilisation, et lance lutilisation
ractive. Comme pour le mode actif, le test de la pr-condition locale est rcurrent,
mme une fois que lutilisation est dmarre.
Lutilisation ractive dclenche lutilisation nale des effecteurs la vole. Celle-ci
sassure tout dabord quune zone dutilisation est libre pour laffordance courante,
et dans le cas contraire invalide leffecteur slectionn. On peut ainsi en dduire que
les effecteurs avec des zones dutilisation multiples, comme des objets interaction
visuelle, seront plus propices ce mode ractif de linteraction. Si une zone est libre,
lautomate va alors inuencer la navigation de lentit, en lattirant vers la position
propice une interaction. Il nest donc pas question ici de donner un ordre formel au
comportement ractif de navigation, mais plutt de le pousser considrer cette option
de dplacement. Si la position dutilisation est atteinte, lutilisation relle peut alors
commencer.
Utilisation nale
Ce dernier automate, commun aux deux modes dinteraction, permet rellement duti-
liser un effecteur. Lorsque cet automate est lanc, lhumanode virtuel se trouve la
position dutilisation pour laffordance courante et leffecteur slectionn. La premire
action entreprise consiste alors inscrire lagent autonome la le dutilisation corres-
pondante. Ensuite, le temps dutilisation est valu, durant lequel un tat dattente soc-
cupe dexcuter le contrle durant linteraction de laffordance. Aprs cela, le contrle
en n dinteraction de laffordance est excut. Lautomate est alors capable dana-
lyser les affordances actives de lhumanode, pour vrier si la position actuelle peut
nouveau tre utilise, permettant ainsi denchaner les interactions auprs du mme
effecteur.
5.5.4 Conclusion
Nous avons prsent dans cette section trois types de tches cognitives dont dispose
lhumain virtuel. Les deux premires, grant lobservation et le dplacement, sont
uniques et toujours prsentes quel que soit lindividu. Ce sont des tches soccupant
du fonctionnement gnral de lentit, prenant des dcisions relativement son tat
comportemental global. La troisime tche cognitive, grant linteraction, est quant
elle multiple pour un individu, reprsentant chaque fois une affordance diffrente.
Ainsi, certains individus pourront navoir aucune tche interagir, tandis que dautres
en auront plusieurs concurrentes, suivant la procdure comportementale quils sont en
train de suivre. Il est donc ncessaire de fournir lhumain virtuel un mcanisme den-
core plus haut niveau, lui permettant de dmarrer et de congurer ces tches cognitives
dinteraction.
185
Le comportement de lhumain virtuel
5.6 Le processus de raisonnement
Nous avons jusqu prsent dcrit un ensemble de modules comportementaux allant
du ractif au cognitif. Ces processus ne sont capables de prendre des dcisions que de
faon relativement isole, sans tenir compte dun plan comportemental plus gnral.
Nous proposons donc un ensemble de mcanismes permettant de simuler ce raison-
nement plus global. Sans aller jusqu la complexit de mcanismes dapprentissage
ou dinfrence, nous offrons tout de mme un aspect rationnel permettant de grer des
activits long terme. Nous allons voir que ce modle est capable de sadapter di-
vers alas environnementaux, et permet lorganisation de comportements concurrents.
Ces buts sont atteints par la gestion des couches comportementales intermdiaires de
lagent autonome, que sont les affordances et les tches cognitives.
5.6.1 Gestion des affordances
Les affordances reprsentent les interactions disponibles dans lenvironnement de si-
mulation. Celle-ci vont reprsenter les buts de lhumain virtuel, choisis de manire
explicite, ou des sous-buts, permettant de rsoudre des objectifs intermdiaires. Lhu-
main virtuel doit tre capable dorganiser ces interactions de manire rationnelle, an
de dterminer celles devant tre excutes chaque instant.
Nous avons vu dans la partie ddie linteracteur (confre Section 3.4.2, page 107)
que celui-ci dispose dun gestionnaire permettant une organisation hirarchique des
affordances quil souhaite accomplir. Cette organisation correspond donc directement
la construction dun plan comportemental long terme. En tant que spcialisation
de linteracteur, lhumanode virtuel a accs ce gestionnaire, et na ainsi plus qu
lintgrer son processus comportemental global.
Les fonctionnalits du gestionnaire qui doivent tre incluses sont :
1. Lordonnancement des affordances par ordre de priorit. Rappelons que deux
fonctionnalits du gestionnaire permettent cet ordonnancement, lune pour les
affordances rationnellement valides, et lautre pour celles qui sont inactives. Cet
ordonnancement sert donner un ordre dvaluation au test des pr-conditions
rationnelles des affordances.
2. Lvaluation des pr-conditions rationnelles des affordances. Ici aussi deux fonc-
tionnalits se chargent de ces tests, lune pour les affordances actives et lautre
pour les inactives. Ce sont ces valuations qui vont produire dventuels sous-
buts, permettant lmergence du plan comportemental.
La gure 5.29 montre le processus dappel mis en uvre pour ces quatre fonction-
nalits. Les affordances actives sont traites une frquence de 1Hz, an de garantir
une certaine ractivit du systme. Cela correspond la focalisation dun tre humain
sur les tches quil souhaite accomplir immdiatement. Les affordances inactives sont
quant elles traites une frquence plus faible, toutes les vingt secondes. Cette va-
leur a t arbitrairement choisie pour donner une latence importante la dcision ne
concernant pas les actions immdiates. Cela permet aussi de conserver un minimum de
ractivit pour des actions pouvant tre ractives par des modications des conditions
environnementales, i.e. non dpendantes de lactivit de lhumanode.
186
Le processus de raisonnement
FIG. 5.29: La gestion des affordances par lhumanode prend la forme dun
automate dclenchant les fonctionnalits du gestionnaire de lin-
teracteur intervalles de temps rguliers.
5.6.2 Gestion des tches cognitives
Comme pour les affordances, linteracteur dispose de mcanismes gnriques permet-
tant la gestion des tches cognitives (confre Section 3.4.3, page 109). Ces fonction-
nalits sont capables dorganiser automatiquement lexcution des tches, sans pour
autant connatre leur but ni mme leur fonctionnement interne. Comme pour les affor-
dances, laspect rationnel de lhumanode intgre ces fonctionnalits son processus
comportemental global.
Nanmoins, une fonctionnalit supplmentaire est ici ajoute, se chargeant de lancer
ou stopper automatiquement certaines tches. Cette supervision permet lagent au-
tonome de ne pas surcharger son moteur de dcision, tout en garantissant la prsence
des processus comportementaux atomiques ncessaires. La supervision soccupe ex-
clusivement des tches interagir, celles dobservation et de dplacement tant toujours
prsentes. Les tapes de la supervision sont les suivantes :
1. Lancement ou arrt dune tche dinteraction reprsentant laffordance mer-
geante de la planication de chemin (confre Section 5.3.4, page 155). Rappe-
lons quune interaction merge de la planication de chemin chaque fois quun
objet traversable, tel quun escalier, doit tre emprunt. La supervision sassure
donc que cette interaction soit reprsente par une tche cognitive dinteraction,
et avec la priorit la plus haute de toutes celles prsentes. La tche est supprime
si linteraction mergeante nest plus requise.
2. Dmarrage automatique de tches dinteractions correspondant aux cinq affor-
dances actives les plus prioritaires. Cette tape sassure que des comportements
cognitifs reprsentent les besoins dinteraction immdiats de lhumain virtuel. Le
nombre cinq a t choisi conformment au possibilits dexcution concurrente :
une interaction peut tre en mode actif, et quatre en ractif simultanment.
3. Arrt automatique des tches interagir au del de dix simultanes, par ordre de
priorit croissante des affordances correspondantes. Cette tape permet de ne
pas surcharger ltage cognitif de lhumanode, en supprimant les tches dinter-
action qui seront de toute faon incapables de sexcuter, du fait de la gestion
de la concurrence. Une marge de cinq tches dinteractions supplmentaires est
conserve, pour faciliter la reprise du processus dans les cas de chute ponctuelle
187
Le comportement de lhumain virtuel
de la priorit.
On peut voir sur la gure 5.30 la squence dappels aux diffrentes fonctionnalits.
Lintervalle de temps de une seconde entre deux rafrachissements a t choisi arbitrai-
rement en tenant compte de la ractivit ncessaire dans le contrle des tches cogni-
tives, et de la cohrence temporelle plus forte de cet tage comportemental vis vis
de ltage ractif. Lordonnancement est le premier tre effectu, tant ncessaire la
supervision. Lexcution intervient en dernier, aprs dventuels ajouts ou suppressions
de tches cognitives.
FIG. 5.30: La gestion des tches cognitives par lhumanode a recours aux
fonctionnalits de linteracteur intervalles de temps rguliers.
5.6.3 Intgration gnrale
Maintenant que nous avons dnit les deux processus de contrle de plus haut niveau
de lhumanode, nous pouvons synthtiser les diffrentes tapes du comportement pour
voir comment elles sintgrent au sein de lagent autonome.
La gure 5.31 reprsente ainsi le processus comportemental global de lhumain virtuel.
Il se prsente sous la forme dun automate comportant un ensemble dactions corres-
pondant chacune des tapes de la pyramide comportementale de notre modle. Cet
automate est rafrachit la frquence la plus haute du systme, et slectionne les actions
effectuer suivant leur cohrence temporelle.
Ainsi, la locomotion de lhumanode est rafrachie la frquence de lautomate, se
chargeant de lanimation et du dplacement de lindividu suivant les directives de la
navigation ractive. Ce processus na pas t prsent dans ce chapitre sur lhumain
virtuel car nous ne nous y sommes pas intress directement. Nous laborderons dans
la partie venir sur les rsultats (confre Chapitre 6.1.1, page 199), en prsentant le
moteur danimation externe que nous avons utilis.
A chaque fois que lentit pose un pied sur le sol, une squence de comportements
ractifs est dclenche :
Mise jour du chemin plani, puis optimisation visuelle pour en extraire la direc-
tion de mouvement optimale.
Observation de lenvironnement, suivant les directives de la tche cognitive corres-
pondante, aboutissant la mise jour des listes de la mmoire court terme.
Navigation ractive, prenant en compte les obstacles mobiles ou statiques, ainsi que
les ventuels attracteurs spcis par les tches cognitives dinteraction.
Cet aspect vnementiel a t choisi en partant du principe quun individu ne modie
sa trajectoire que lorsquil a un appui au sol.
Enn, une squence de comportements cognitifs et rationnels est dclenche chaque
188
Le processus de raisonnement
FIG. 5.31: Lautomate se comporter gre lexcution intgrale de lhuma-
node. Il est appel la frquence la plus haute et se charge de
lancer les actions allant du biomcanique (locomotion) au raison-
nement.
seconde :
Mise jour des ressources contenues par lhumanode, par lappel de la fonctionna-
lit de lobjet interactif physique parent.
Gestion des affordances, correspondant lautomate vu dans la section 5.6.1.
Gestion des tches cognitives, correspondant lautomate vu dans la section 5.6.2.
Laspect cognitif nest reprsent dans cette squence dactions que par la dernire
partie, concernant lexcution des tches cognitives.
5.6.4 Conclusion
Nous avons prsent dans cette section les deux gestionnaires servant de processus
rationnel lhumain virtuel. Le premier se charge dune gestion de haut niveau des
affordances requises par lentit, et ainsi de leur aspect rationnel. Le second organise
lexcution des tches cognitives, et rend ainsi possible la gestion de la concurrence
entre comportements.
Ce qui caractrise en premier lieu ces processus rationnels est leur abstraction totale
du mode de fonctionnement des sous processus quils organisent. En effet, leur activit
est totalement gnrique, base sur les concepts introduits par BIIO. Cet aspect permet
de conserver les avantages fournis par notre modle dobjets interactifs, notamment
le potentiel dvolution, tout en intgrant les divers concepts dans une architecture
spcique dnie.
Ainsi, chaque module comportemental que nous avons dni jusqu prsent sagence
dans un processus global, la mcanique ge. Ces modules peuvent alors fonctionner
de faon relativement indpendante, comme autant de botes noires communiquant des
informations minimales. Une telle catgorisation a lavantage de permettre le rempla-
cement ais dun modle, tout en gardant une architecture globale fonctionnelle.
189
Le comportement de lhumain virtuel
5.7 Conclusion et discussion
Nous avons prsent dans ce chapitre notre modle dhumain virtuel. Larchitecture
propose est fortement axe sur les principes voqus par la psychologie cognitive.
Ainsi, notre agent autonome se subdivise en modules comportementaux au fonction-
nement indpendant, communiquants entre-eux grce des informations synthtiques.
Ces modules sont ensuite intgrs dans un processus global, rgissant le dclenchement
des actions de lhumanode au cours du temps. Nous navons pas abord la couche bio-
mcanique dans cette architecture, pour laquelle nous utiliserons un modle externe,
que nous introduirons dans la partie sur les rsultats.
Le premier module propos est le comportement ractif de perception visuelle. Celui-ci
permet lentit danalyser son environnement au fur et mesure de ses dplacements.
La perception est couple un mcanisme mmoriel exclusivement topologique. Cette
premire tape permet de rendre les humains virtuels non omniscients, et constitue un
premier pas vers llaboration de comportements opportunistes. Le modle propos ici
est volontairement brid, en ngligeant les principes dabstraction individuelle de lin-
formation, ainsi que de renforcement et rcupration dans la mmoire. Nous justions
ce choix par le domaine dapplication cibl, avec la simulation de situations de courte
dure, qui est sufsamment restreint pour ne pas ncessiter ces mcanismes.
Le second comportement ractif propos est la planication de chemin. Celle-ci per-
met dvaluer un dplacement global, tout en rpondant trois objectifs diffrents :
rejoindre une position identie, explorer lenvironnement, ou choisir un couple inter-
action/effecteur. Ce dernier objectif permet ainsi de situer la prise de dcision relative
linteraction. On peut relever un point faible de cette mthode : elle ne tient pas compte
du contexte comportemental pour choisir leffecteur nal. En effet, le choix ne seffec-
tue quen considrant les affordances actives de manire plane, sans tenir compte de la
poursuite du plan comportemental. Ainsi, lenchanement des interactions nintervient
pas dans la dcision, ce qui rsultera en une lacune au niveau de leur regroupement
spatial. Malgr tout, la planication de chemin reste un mcanisme robuste, grant
lensemble des autres cas pouvant se prsenter, et individualis, par lvaluation de
multiples critres comportant des degrs de prfrence. Les algorithmes proposs sont
de plus efcaces en termes de calcul, fonctionnant sur des espaces de recherche trs
restreints.
Le troisime et dernier comportement ractif de lindividu gre sa navigation ractive.
Celle-ci permet aussi lindividu dvaluer son chemin, mais un niveau local cette
fois-ci, en vitant les collisions avec les entits de lenvironnement immdiat de lhu-
manode. Ce comportement applique les principes de dplacement pdestre noncs
en psychologie et sociologie, an de proposer une rsolution permettant lmergence
de phnomnes ralistes. La dcision est ici aussi individualise, par lintroduction de
prfrences personnelles quant aux adaptations possibles. Enn, des entits attractives
peuvent tre gres par ce comportement, constituant un pas supplmentaire vers la
rsolution de comportements opportunistes.
Ces comportements ractifs sont ensuite grs par des tches cognitives, qui procdent
une prise de dcision plus abstraite. Trois tches sont ainsi proposes, les deux pre-
mires tant trs proches de ltage ractif pour contrler lobservation et le dplace-
ment de lindividu, la dernire en tant plus loigne pour contrler le droulement
dune interaction. Cette troisime tche cognitive va ainsi organiser totalement une
190
Conclusion et discussion
affordance, que ce soit sa concurrence avec les autres vis--vis des ressources de lhu-
main virtuel, ou la recherche dun effecteur compatible dans lenvironnement, ou en-
core la gestion de lorganisation sociale lie lattente. Cet tage comportemental est
de plus fortement ouvert, protant de la gnricit introduite par BIIO pour permettre
lvolution aise du modle dhumain virtuel.
Pour nir, des processus de raisonnement simplis organisent de faon plus globale
le comportement individuel. Ces mcanismes sont loin de reprsenter la complexit du
raisonnement humain, mais permettent tout de mme la gestion de procdures com-
portementales long terme. Ils sont constitus des fonctionnalits gnriques fournies
avec linteracteur BIIO, auxquelles sajoutent un mcanisme de supervision des tches
cognitives.
Nous pouvons conclure que le modle propos forme une architecture raliste dhu-
main virtuel, o les principaux tages comportementaux de A. Newell sont reprsen-
ts. Ce modle permet la simulation dhumains virtuels non omniscients, aux compor-
tements individuels et opportunistes, avec une grande autonomie quant la prise de
dcision. Il reste de plus trs ouvert, en proposant un mcanisme gnral dni sup-
portant lextension de certains de ses constituants, tels que les tches cognitives et les
affordances.
191
Conclusion et perspectives
Nous avons prsent dans cette partie les trois modles constituant nos contributions.
Tout dabord, nous avons propos avec BIIO une architecture dobjets interactifs qui
dlimite le cadre de nos simulations. Ce modle nonce les concepts ncessaires
la description et la gestion de linteraction dun point de vue comportemental. Il
dnit ainsi un certain nombre dobjets interactifs plus ou moins abstraits, dots de
fonctionnalits gnriques pouvant sadapter des spcialisations ultrieures. Plusieurs
de ces spcialisations seront prsentes dans les rsultats de cette thse.
Rappelons que ce modle ne sintresse que peu linteraction physique entre un in-
dividu et un quipement, tout au plus en spciant des zones de lenvironnement
atteindre. Par consquence, il se concentre plus sur le ralisme comportemental dune
simulation que sur son ralisme visuel, comme pourrait le faire un modle de type
Starsh [11] ou smart object [60]. Une volution souhaitable de ce modle serait donc
vers la gestion ne de linteraction physique, dont le point de dpart pourrait tre la
spcialisation des procdures de contrle de laffordance.
Un autre aspect du comportement non abord par se modle concerne la rsolution
rationnelle. Celle-ci est simule par lenchanement hirarchique des affordances, qui
ne contient daucune manire de processus de planication dactions. En effet, mme
si ce principe dexcution permet une certaine libert dans la rsolution globale dun
but complexe, les possibilits de rsolution doivent toutes tre exprimes dans les pr-
conditions de laffordance, le modle ne pouvant pas les dduire automatiquement.
Ainsi, une autre volution avantageuse pour ce modle serait lintroduction de pro-
cessus rationnels plus complexes. Par exemple, la dduction automatique dactions
entreprendre pourrait tre propose en fonction des pr-requis dune interaction de rf-
rence. Un processus dapprentissage pourrait aussi tre mis en place, o un interacteur
naurait pas forcment accs lintgralit des affordances qui lui sont compatibles.
Il pourrait aussi augmenter ses possibilits dinteraction en spcialisant et en uniant
dynamiquement des affordances connues.
Nous avons ensuite propos un modle de reprsentation de lenvironnement de simu-
lation. Celui-ci se base sur une reprsentation exacte de la gomtrie des lieux, puis en
effectue une abstraction informe sous la forme dun graphe hirarchique. Une typolo-
gie est associe aux nud du graphe topologique, permettant de caractriser globale-
ment les zones de circulation tout en gardant un lien avec leur dnition gomtrique
ne. De plus, ce graphe peut tre tendu par son interconnexion avec dautres environ-
nements utilisant la mme reprsentation. Ensuite, un certain nombre de donnes sont
193
Conclusion et perspectives
introduites, qui permettront une exploitation rapide et efcace de lenvironnement par
les entits qui y voluent. Pour nir, les objets interactifs sont associs la topologie,
permettant de situer linteraction dans lespace.
Comme nous lavons vu au travers de plusieurs exemples, cette approche permet de
reprsenter des environnements de taille diverse, allant de la ville la maison. Une
perspective dutilisation attrayante serait de reprsenter lintgralit dune ville grce
ce modle, en inter-connectant plusieurs environnements de catgorie smantique
diffrente. Il serait ainsi possible de reprsenter les rues de la ville par un graphe dabs-
traction, puis chaque btiment par un autre graphe qui sera connect celui de la ville.
Nous pouvons assurer quune telle construction est possible, tout en envisageant que
son exploitation se ferait avec une complexit de calcul raisonnable grce laspect
hirarchique de la reprsentation.
Pour nir, nous avons propos un modle dhumain virtuel rpondant aux exigences
de ralisme de notre cadre dtude. Ce modle est organis suivant le principe de
A. Newell, sous forme de pyramide comportementale compose de modules au fonc-
tionnement indpendant changeant des informations synthtiques. Lagent autonome
rsultant dispose de comportements ractifs lui permettant dapprhender son envi-
ronnement, en le percevant et en sen souvenant, et de linuencer, en sy dplaant.
Lhumain virtuel dispose alors de processus dcisionnels plus abstraits, les tches cog-
nitives, qui vont contrler cette couche ractive. Cet tage comportemental constitue
lune des parties augmentable de lhumanode, de nouvelles tches pouvant tre ajou-
tes facilement par leur gestion gnrique. Lautre partie augmentable dcoule de la
gestion des affordances, elle aussi totalement gnrique. Enn, des processus de rai-
sonnement principalement issus de linteracteur BIIO sont mis en uvre, et intgrs au
sein de larchitecture comportementale de lhumain virtuel.
Ce modle tant une spcialisation directe de linteracteur BIIO, les mmes perspec-
tives dvolution quant laspect rationnel du comportement sont envisageable : lap-
prentissage ainsi que la planication daction. Une autre perspective intressante consiste
lamlioration du mode de planication effectuant un choix dinteraction dans lenvi-
ronnement. Comme nous lavons soulign prcdemment, ce choix seffectue indpen-
damment du contexte, ne tenant pas compte de la succession dinteractions effectuer.
Une exploitation de lexcution rationnelle hirarchique des affordances serait alors
envisageable, o la planication ne chercherait plus minimiser un cot uniquement
sensible une affordance seule, mais plutt une branche du graphe comportemental.
Enn, une troisime perspective est envisager, concernant lintroduction dun com-
portement social plus marqu. Celui-ci pourrait prendre la forme dune tche cognitive
qui, en se basant sur des informations de lenvironnement immdiat de lhumanode,
pourrait notamment inuencer son comportement de navigation ractive. Elle pourrait
ainsi introduire un certain nombre de conventions sociales, comme le fait de laisser le
passage quelquun.
Pour conclure, nous avons propos un ensemble de modles interdpendants rpondant
notre problmatique, quest ltude des circulations de personnes dans des lieux fort
potentiel dinteraction. Larchitecture propose dispose dlments gs, au fonction-
nement dni, ainsi que de composants extensibles, garantissant son potentiel dvo-
lution. Le ralisme comportemental est au centre de cette approche, qui ne nglige
nanmoins pas les performances.
194
Troisime partie
Rsultats
195
Introduction
Lobjectif premier de ces travaux est ltude des circulations de personnes par des si-
mulations. Pour se faire, nous avons propos dans la partie prcdente un ensemble de
modles qui permettent datteindre un certain niveau de complexit du comportement
humain. Nanmoins, une dernire tape est ncessaire an de concrtiser ces travaux.
En effet, ces modles ne peuvent tre utiliss sans tre unis dans une application.
Deux autres problmatiques apparaissent alors, concernant dune part la manire de
renseigner une simulation, et dautre part la faon de restituer ses rsultats. Nous al-
lons ainsi proposer une architecture complte, qui permettra de rpondre ces attentes
tout en restant sufsamment ouverte pour garantir son volutivit. Un autre aspect
traiter concerne la validation des rsultats obtenus. Ceux-ci devant permettre ltude
de situations et denvironnements concrets, il est en effet ncessaire de les confronter
au rel pour en assurer la pertinence. Enn, comme nous lavons not auparavant, une
simulation doit tre sufsamment rapide pour tre utilise comme outil de travail. Elle
doit pouvoir supporter une interaction de lutilisateur pendant son excution, au moins
dans une phase de rglage, ce qui impose de garantir un certain niveau de performances.
Nous allons donc prsenter dans cette dernire partie les rsultats obtenus durant cette
thse. Nous commencerons, dans le chapitre 6, par dcrire le logiciel qui intgre les
modles proposs. Du nom de SIMULEM, cette application concrtise les travaux pr-
sents et dmontre leur faisabilit. Nous aborderons ensuite, dans le chapitre 7, la ques-
tion de la validation des modles par leur confrontation des donnes exprimentales,
ainsi que leur comparaison aux constats disponibles dans la littrature. Nous termi-
nerons, dans le chapitre 8, par une analyse des performances des diffrents modules
composant lhumain virtuel.
197
Chapitre 6
Une architecture logicielle
ddie la simulation
Dans cette premire partie des rsultats, nous allons dcrire larchitecture logicielle
mise en uvre pour effectuer les simulations. Cette architecture a pour but de faciliter
le renseignement et le droulement dune simulation, tout en intgrant lensemble des
modles vus prcdemment.
Un logiciel du nom de SIMULEM
1
incarne cette architecture. Celui-ci est issu dune
collaboration entre AREP
2
, la SNCF
3
, et lquipe Bunraku. Cette collaboration sef-
fectue dans le cadre dun projet soutenu par lANR
4
. Ce projet a couvert la dernire an-
ne de la thse prsente ici, et continuera pendant un an aprs son achvement. Deux
ingnieurs, Delphine Lefebvre et Vincent Delannoy, ont particip successivement au
dveloppement de lapplication.
Nous allons commencer par prsenter de faon gnrale cette architecture, puis d-
taillerons chaque partie en suivant un exemple qui illustrera leur principe de fonction-
nement.
6.1 Vue densemble
6.1.1 Les modles utiliss
Rappelons tout dabord les modles utiliss dans cette architecture logicielle. Celle-
ci intgre bien entendu lensemble des modles proposs dans les contributions, mais
aussi dautres modles non abords dans ces travaux.
Premirement, la reprsentation de lenvironnement sous forme de graphe topologique
est couple un algorithme de dtection de voisinage. Ce dernier nous permet de dter-
miner rapidement lensemble des entits voisines et visibles dune entit de rfrence.
1
Simuler les Espaces de la Mobilit
2
Amnagement Recherche Ples dchanges
3
Socit Nationale des Chemins de Fer Franais
4
Agence Nationale de la Recherche, Projet SIMULEM, ANR05RNTL02501
199
Une architecture logicielle ddie la simulation
Nous utilisons lalgorithme propos par F. Lamarche et al. [70], qui se base sur une
triangulation de Delaunay ltre par visibilit (Figure 6.1(a)).
Deuximement, lhumain virtuel ncessite un mcanisme grant sa locomotion. Ce
processus correspond la couche la plus basse de la pyramide de A. Newell (confre
Section 5.1, page 135), reprsentant la biomcanique de lhumanode. Nous utilisons
pour cela le modle de R. Kulpa et al. [67], dnomm MKM (pour Manageable Kine-
matic Motion). Celui-ci permet dadapter des mouvements capturs la morphologie
dun humain virtuel, ainsi que de les mlanger et les ajuster pour suivre des directives
de dplacement (Figure 6.1(b)). Notre choix sest tourn vers ce modle car il produit
des mouvements valides vis--vis des lois biomcaniques, quil permet un contrle n
des dplacements, et quil offre des performances avantageuses (le moteur permet de
simuler plusieurs centaines dindividus diffrents en temps rel). De plus, MKM sup-
porte une restitution graphique soit sous forme davatar 3D, o toute la chane articu-
laire sera anime, soit sous forme dimposteur g, amliorant ainsi les performances
dafchage tout en conservant la cohrence de la locomotion.
(a) Triangulation de Delaunay ltre par
visibilit. Les points rouges sont les en-
tits dynamiques, relies leurs plus
proches voisins visibles par les arcs
noirs. Les arcs verts sont ltrs.
(b) A gauche, le squelette contrl par MKM ; droite, une
animation produite.
FIG. 6.1: Les deux modles complmentaires utiliss.
6.1.2 Larchitecture
Larchitecture logicielle propose sorganise sous la forme de quatre modules intgrs
au sein dune mme application (Figure 6.2) :
Dnition des types dobjets grs : Ce premier module sert crer les objets BIIO
ncessaires dans le cadre de la simulation dsire.
Conguration de la simulation : Ce second module permet de congurer la simula-
tion, que ce soit son environnement, les objets et acteurs qui la compose, ou
encore des donnes terrain.
Simulation : Ce troisime module droule une simulation et permet den extraire des
informations ncessaires la caractrisation des rsultats. Il prsente aussi les
premiers rsultats en ligne, sous forme danimation 3D et de cartes 2D.
Exploitation des rsultats : Ce dernier module permet une analyse en profondeur des
donnes extraites dune simulation.
200
Dnition des objets de simulation
FIG. 6.2: Larchitecture logicielle de simulation.
Lobjectif de cette modularit est double. Tout dabord, elle permet des utilisateurs
de comptences diffrentes dintervenir sur llaboration dune simulation. En effet, la
premire tape ncessite un informaticien pour la spcication des objets BIIO, tan-
dis que les suivantes peuvent tre conduites par des utilisateurs standards, tels que des
architectes. Ensuite, cette modularit permet la rutilisation des produits de sortie de
chaque tape. Ainsi, les objets BIIO crs pour une simulation pourront tre directe-
ment fournis pour dautres simulations de mme catgorie, ou encore les rsultats pro-
duits par plusieurs simulations pourront tre analyss conjointement lors de la dernire
tape dexploitation.
6.2 Dnition des objets de simulation
La premire tape de larchitecture logicielle concerne llaboration dobjets BIIO sp-
ciques pour la simulation. An de sintgrer aux modles existants, ces nouveaux ob-
jets sont des spcialisations des concepts introduits par le modle dobjets interactifs
(confre Chapitre 3, page 91).
Le fonctionnement de cette tape est fortement bas sur le principe dintrospection
mis en uvre par BIIO, permettant ce module de proposer les types dobjets dj
existant comme base de cration. Ce module se prsente sous la forme de botes de
dialogue automatisant la cration de plugins de simulation. On peut voir sur la gure 6.3
certaines de ces interfaces, dont :
1. La liste des plugins spciques la simulation. La vue courante ne contient quun
seul plugin, dnomm ObjetsDeLaGare, contenant un certain nombre dobjets
spcialiss.
2. Un rsum des congurations effectues pour lentre slectionne dans la liste
prcdente. Nous ne nous attarderons pas sur ces paramtres fonctionnels.
201
Une architecture logicielle ddie la simulation
3. dition dun type dobjet. Les diffrents constituants de lobjet BIIOpeuvent tre
congurs ici : dnition gnrale, attributs contenus, fonctionnalits proposes,
ou encore valeur par dfaut. La vue actuelle prsente la dnition gnrale dun
composteur :
Nom : Lidentiant principal de ce type dobjet dans la simulation.
Hritage : Le principe dhritage admis pour cet objet.
Description : Texte informatif dcrivant lobjet.
Synonymes : Des synonymes pouvant tre utiliss la place de lidentiant
principal de lobjet. Ceux-ci permettent dintgrer facilement un type dob-
jet une autre simulation utilisant une smantique diffrente pour identier
les quipements.
Parents : Les parents directs de lobjet actuel dans la hirarchie des concepts de
BIIO. Lobjet actuel hritera de lensemble des constituants de ses parents.
4. Slection parmi les concepts existant dans BIIO. Cette bote de dialogue est no-
tamment utilise pour choisir un parent, ou le type dun attribut. Elle liste len-
semble des concepts prsents dans le moteur de simulation, quils soient fournis
par dfaut, via des plugins gnraux, ou encore via les plugins locaux la simu-
lation courante. La mise jour de cet outil est automatique, en se basant sur le
principe dintrospection de BIIO.
FIG. 6.3: Module de cration dobjets BIIO. (1) Liste des plugins de la si-
mulation. (2) Informations spciques lentre slectionne dans
ltape prcdente. (3) Conguration dun type dobjet. (4) Slec-
tion dun concept existant dans BIIO.
Une fois que les congurations ncessaires sont effectues, ce module est capable dex-
porter ses donnes de deux faons. Tout dabord, les types dobjets dnis pour la
202
Conguration de la simulation
simulation courante sont sauvegards au format XML, permettant leur modication ul-
trieure. Lutilisateur pourra ainsi faire voluer les constituants des objets a posteriori,
ou encore ajouter de nouveaux concepts pour enrichir la simulation. Ensuite, ce module
prend en charge la cration des plugins, en ayant recours la compilation de chiers
sources C++ gnrs automatiquement. Ces plugins seront par la suite disponibles et
fonctionnels pour la simulation en cours. De plus, ils pourront tre transfrs dautres
simulations, ou devenir des plugins gnraux disponibles dans toutes les nouvelles si-
mulations.
Pour notre exemple de gare virtuelle, nous spcions dans ce module les catgories
dobjets BIIO suivantes (confre Annexe D, page 257 pour plus de dtails) :
quipements : composteur de tickets ; tableau des dparts ; automate de vente de ti-
ckets de trains.
Usager : voyageur standard.
Accs : accs rue ; accs aux quais.
Ressources : destination ; ticket de train.
Affordances : prendre le train ; sortir de la gare ; acheter un ticket ; changer un ticket ;
composter son ticket ; lire le tableau des dparts.
6.3 Conguration de la simulation
La conguration de la simulation se dcoupe en deux tapes successives :
1. Import dun environnement de simulation.
2. Conguration des donnes de simulation.
6.3.1 Import de lenvironnement de simulation
Lenvironnement de simulation dnit aussi bien la topographie des lieux que le posi-
tionnement initial des diffrents quipements. Celui-ci est tout dabord spci par les
architectes via le logiciel AutoCAD, communment utilis dans ce milieu. En respec-
tant une certaine norme, ils peuvent :
dcrire les obstacles statiques de la simulation (le contour des btiments) ;
positionner les quipements ncessaires, comme les composteurs dans une gare ;
spcier des zones de circulation particulires, comme les accs vers les quais ou la
ville, ou encore les escaliers.
Le logiciel dispose dun outil permettant dimporter ce chier AutoCAD, den vrier
la conformit, et den extraire lensemble des informations pr-cites. Ces donnes
peuvent alors tre sauvegardes au format XML, an den permettre la rutilisation
dune simulation lautre. Depuis ce chier XML, le logiciel peut ensuite crer le
graphe dabstraction reprsentant la topologie des lieux, et gnrer les objets BIIO qui
ont t spcis. Ces objets seront alors accessibles lors de la simulation, an dtre
congurs de manire plus ne et interactivement.
Par exemple, on peut voir sur la gure 6.4(a) le chier dentre AutoCAD de notre
environnement de test. Certaines informations contenue par ce chier ne peuvent tre
reprsentes graphiquement, dautres sont indiques sur la gure :
203
Une architecture logicielle ddie la simulation
(a) Lenvironnement sous AutoCAD. (b) Les trois couches du graphe dabstraction. Dans
le sens de lecture : cellules, groupes, zones.
FIG. 6.4: Import dun environnement de simulation depuis un chier Auto-
CAD. Les numros de la gure (a) sont explicits dans le texte.
1. Les trois accs de cette gare vers la ville.
2. Quatre automates point de vente (APV), permettant dacheter et dchanger un
ticket de train.
3. Quatre moniteurs indiquant les horaires et voies daccs des trains (ces objets
sont de catgorie libre, ne gnant pas la circulation).
4. Quatre composteurs de tickets.
5. Les deux voies daccs aux trains de cette gare.
La gure 6.4(b) reprsente les trois couches du graphe topologique automatiquement
construit depuis les donnes importes.
6.3.2 Conguration des donnes de simulation
Les donnes de simulation reprsentent lensemble des informations ncessaires
lexcution dune simulation. An de rpondre aux besoins particuliers de la simu-
lation de gares ferroviaires, nous avons dvelopp des interfaces de saisie spciques
qui englobent les interfaces gnriques fournies pour BIIO (sur les gures suivantes,
gauche linterface spcique, droite linterface gnrique). Dtaillons les possibilits
offertes pour cette tape de conguration.
204
Conguration de la simulation
Conguration gnrale
La conguration gnrale de la simulation permet den spcier les paramtres envi-
ronnementaux. On peut voir sur la gure 6.5 les diffrents choix possibles :
FIG. 6.5: Conguration gnrale dune simulation : chiers sources, date de
dpart de la simulation, etc.
Le chier denvironnement utiliser, correspondant limport vu prcdemment.
La reprsentation graphique de lenvironnement utiliser.
La date de dpart de la simulation (en temps simul), qui servira de rfrence lors de
son droulement.
Deux options contrlant la production de rsultats, permettant de la dsactiver pour
gagner en performances lors dune phase de test, ou dafcher diverses cartes pour
avoir une vision synthtique de lvolution de la simulation.
Une option contrlant le type de reprsentation graphique utiliser pour les huma-
nodes : avatar anim pour une meilleure restitution visuelle, ou imposteur pour de
meilleures performances.
Conguration des populations
La conguration des populations permet daffecter des paramtres gnraux aux in-
dividus crs lors de la simulation. Deux niveaux de conguration sont disponibles
(Figure 6.6) :
Population. Une population est une rpartition darchtypes dnissant en quelles
proportions ils la composent.
Archtype. Un archtype permet de congurer les paramtres internes des huma-
nodes gnrs, tels que :
La rpartition homme/femme (uniquement utilise pour la reprsentation gra-
phique actuellement).
La vitesse moyenne de marche, et son cart type.
Les facteurs inuenant la navigation.
205
Une architecture logicielle ddie la simulation
FIG. 6.6: Conguration des populations et des archtypes.
Le rayon moyen, et son cart type.
Les chiers graphiques utiliss pour la reprsentation.
Le pourcentage de voyageurs au dpart ayant un ticket de train lors de leur
entre en gare.
Limport/export de ces donnes seules est possible, permettant leur rutilisation. Lutili-
sateur pourra ainsi crer une bibliothque de populations quil sera en mesure dutiliser
dune tude lautre.
Conguration des trains
La conguration des trains couvre deux sujets (Figure 6.7) :
Le matriel : il dnit les caractristiques physique dun train, comme le nombre de
rames, la capacit en nombre de voyageurs, la position des portes, ou encore les
dbits en monte et en descente.
La qualit : elle dnit les paramtres du train relatifs la gare. Ils sont au nombre de
deux : les dlais de prcaution, correspondant la rpartition dans le temps des
voyageurs en partance, et la distribution aux accs, correspondant leur rparti-
tion dans lespace la cration.
Ici aussi, limport/export de ces donnes seules est possible, pour les mmes raisons
que prcdemment.
Conguration des donnes dexploitation
Les donnes dexploitation sont les informations relatives aux voyages possibles dans
la gare. Elles se prsentent sous la forme dun tableau associant chaque train une
conguration permettant de dduire les usagers crer. On y retrouve (Figure 6.8) :
Le numro du train, tel quil peut apparatre sur un ticket.
Les horaires de dpart et darrive.
206
Conguration de la simulation
FIG. 6.7: Conguration des trains : matriel roulant (attributs relatifs lqui-
pement) et qualit (attributs relatifs la gare).
FIG. 6.8: Conguration des donnes dexploitation de la gare.
Les villes de dpart et de destination du train.
La qualit et le matriel du train utiliser, slectionns parmi ceux dnis prc-
demment.
Le type de population concern par ce train, slectionn parmi ceux dnis prc-
demment.
La voie daccs au train, slectionne parmi celles dnies dans lenvironnement.
Les pourcentages de remplissage du train au dpart et larrive.
207
Une architecture logicielle ddie la simulation
Un chargeur depuis les donnes SNCF est ici fourni, permettant denregistrer directe-
ment une table provenant de leurs logiciels.
Une fois cette conguration effectue, le logiciel est capable de dduire les voyageurs
crer aux diffrents accs de la gare, leur moment de cration (respectant le dlai
de prcaution), ainsi que le processus comportemental leur affecter (monter dans un
train pour les voyageurs au dpart, sortir de la gare pour ceux larrive).
Conguration globale des quipements et comportements
Cette dernire possibilit de conguration permet de modier les paramtres par dfaut
(affects la cration) ainsi que gnraux (uniques pour un type dobjet donn) des
quipements et des affordances de la simulation (Figure 6.9). Lutilisateur pourra ainsi
agir sur lensemble du processus comportemental des usagers depuis cette interface.
FIG. 6.9: Conguration globale des quipements et affordances disponibles
dans la simulation.
6.4 Droulement dune simulation
Le module suivant permet de lancer lexcution de la simulation. Il propose les pre-
miers rsultats en ligne sous la forme dune animation en 3D du droulement de la
simulation. Lutilisateur peut continuer interagir avec le logiciel durant cette excu-
tion de trois faons :
1. Il peut contrler la vitesse dexcution grce une tlcommande (Figure 6.10).
Celle-ci donne accs :
Un mode lecture o le temps de simulation scoule.
Un mode pause o le temps de simulation est g, les autres contrles restant
actifs.
Larrt de la simulation, rinitialisant toutes les donnes.
Des indications quant au temps simul et au temps rel courant.
208
Droulement dune simulation
FIG. 6.10: Contrle de la vitesse dexcution : lecture - pause - arrt,
ratio temps rel / temps simul dsir, etc.
Une indication quant au ratio temps rel / temps simul courant.
Le choix dun ratio temporel dsir (limit par les performances de la ma-
chine), ou un mode non contraint allant la vitesse maximale.
2. Lutilisateur peut aussi se dplacer dans la restitution 3D de la simulation, an
dobserver des situations particulires. Cette interaction reste possible mme
lorsque la simulation est en pause, autorisant ainsi ltude approfondie dun ph-
nomne phmre. Diffrentes camras sont disponibles :
Libre, o lutilisateur peut se dplacer librement (Figure 6.11(a)) ;
Vue de dessus, qui permet une restitution similaire aux plans 2D(Figure 6.11(b)) ;
Vue rapproche, o la camra suit lobjet slectionn (Figure 6.12).
(a) Camra libre.
(b) Vues de dessus.
FIG. 6.11: Deux vues dans la restitution 3D de la simulation.
209
Une architecture logicielle ddie la simulation
3. Enn, lutilisateur peut consulter linterface gnrique fournie avec BIIO, re-
posant sur le principe dintrospection. Cette interface lui permet daccder aux
attributs des objets interactifs de la simulation, soit pour les consulter, soit pour
les modier dynamiquement. Cette dernire possibilit permettra lutilisateur
de dclencher certains vnements pour tudier leur impact, comme le fait de
mettre en panne un automate de vente de tickets.
Par exemple, sur la gure 6.12, linterface gnrique de lobjet slectionn pour
la vue locale est automatiquement ouverte, permettant de voir que lusager dis-
pose dune ressource destination congure pour Rennes, mais pas encore de
ressource ticket.
FIG. 6.12: Vue approfondie dun objet de simulation. A gauche, la
vue locale pour un individu slectionn (encadr). A droite,
linterface gnrique fournie avec BIIO, permettant de vi-
sualiser ltat interne de lobjet slectionn, et den modi-
er dynamiquement les attributs.
Pour conclure, ce module permet deux modes de simulation. Premirement, une simu-
lation interactive o lutilisateur pourra tudier nement lvolution des situations, et
ventuellement modier les conditions de dpart pour mettre en vidence certains cas
particuliers. Deuximement, une simulation rapide o lutilisateur va laisser le systme
voluer sa cadence maximale an de produire des rsultats analysables.
Un exemple du droulement dune simulation est fourni en annexe (confre Annexe D,
page 257), illustrant le processus comportemental complet dun voyageur au dpart.
210
Exploitation des rsultats
6.5 Exploitation des rsultats
Ce dernier module permet la synthse des rsultats produits par la simulation, et ainsi
la caractrisation des niveaux de services de lenvironnement tudi. Conformment
aux besoins recueillis auprs des utilisateurs naux de ce logiciel de simulation (les
urbanistes de la socit AREP), nous proposons plusieurs reprsentations de ces rsul-
tats.
Graphiques
Ce premier type dinformation permet de localiser linformation dans le temps en la re-
prsentant sous forme de graphique en 2D. Trois types de graphiques sont disponibles,
utilisant tous une chelle temporelle pour laxe des abscisses :
Jauge : La jauge reprsente leffectif total de population lintrieur de la gare au
cours du temps (Figure 6.13(b)). Elle permet de se rendre compte rapidement de
limpact des donnes dexploitation sur lafuence.
Flux : Les ux reprsentent le nombre de personnes empruntant un accs donn au
cours du temps (Figure 6.13(c)). Le graphique est double, contenant les ux en-
trant et sortant par laccs. Il permet dtudier le niveau dutilisation dun accs.
Temps de traverse : Les temps de traverss reprsentent le temps pass en gare pour
des populations circulant entre deux accs (Figure 6.13(d)). Ils permettent dtu-
dier la facilit daccs aux divers quipements pour les voyageurs au dpart, ainsi
que laisance de circulation de lensemble des usagers.
Tous ces graphiques disposent dun ensemble de paramtres contrlant leur gnration,
tels que le laps de temps reprsenter ou lchantillonnage des donnes.
Cartes
Ce second type de reprsentation permet de localiser linformation dans lespace en
afchant des gradients de couleur en superposition du plan 2D de lenvironnement.
Chaque carte peut tre calcule avec des informations moyennes sur un laps de temps,
ou une information instantane un moment donn. Trois catgories de valeurs peuvent
tre reprsentes :
Jauges : Les jauges reprsentent un nombre cumul de personnes diffrentes passant
par un endroit donn au cours du temps (Figure 6.14(a)). Elles permettent de
mettre en vidence les lieux de forte frquentation.
Densits de personnes : Les densits de personnes reprsentent le nombre dhuma-
nodes par mtre carr (Figure 6.14(b)). Elles permettent de mettre en vidence
les lieux de rassemblement et les zones obstrues en cas de forte afuence.
Vitesses : Les vitesses de dplacements ne reprsentent que la vlocit des huma-
nodes, sans tenir compte de leur direction (Figure 6.14(c)). Elles permettent
de mettre en vidence les zones dattente et de passage.
Diffrentes options peuvent tre choisies pour produire ces cartes :
le laps de temps reprsenter ;
la prcision de la grille supportant la reprsentation ;
la borne maximale de lchelle utiliser (calcule automatiquement par dfaut).
211
Une architecture logicielle ddie la simulation
(a) Dnomination des accs de la gare. (b) Graphique de jauge.
(c) Graphiques de ux : gauche, pour un accs rue ; droite pour une voie de trains.
(d) Graphique de temps de traverse : gauche, pour des voyageurs au dpart ; droite, pour des voyageurs
larrive.
FIG. 6.13: Rsultats de simulation sous forme de graphiques. La dnomina-
tion des accs de la gare est fournie titre dindication pour la
lecture des graphiques (b) et (c).
212
Conclusion
(a) Carte de jauges.
(b) Carte de densits. (c) Carte de vitesses.
FIG. 6.14: Rsultats sous forme de cartes. Les trois exemples fournis se d-
roulent sur le mme laps de temps, permettant de corrler leurs
rsultats. La situation comporte des voyageurs au dpart achetant
leur ticket et observant les moniteurs, ainsi que des voyageurs
larrive depuis les deux voies. Les donnes dexploitation utili-
ses sont les mme que pour la gure 6.13.
6.6 Conclusion
Nous avons prsent dans ce chapitre larchitecture logicielle SIMULEM intgrant
lensemble des modles prsents dans cette thse. Celle-ci gre la chane de simu-
lation complte, depuis sa spcication de plus bas niveau, avec lajout de composants
BIIO, jusqu lexploitation nale des rsultats.
Son aspect modulaire a permis une volution progressive de cette architecture, et auto-
rise encore lenrichissement de ses constituants. Son laboration sest faite conjointe-
ment avec les utilisateurs naux (les architectes et urbanistes de la socit AREP) an
de dterminer la meilleure faon de concevoir les diffrents lments, dont notamment
lexpression des rsultats de simulation.
Lapplication propose se veut aussi gnrique que possible, an de pouvoir tre utili-
213
Une architecture logicielle ddie la simulation
se dans un large ventail de situations et denvironnements, tels que des aroports ou
des mtros. Elle permet ainsi dexploiter le fort potentiel dvolution offert par BIIO,
pour intgrer par la suite de nouveaux objets interactifs, et donc de nouvelles pro-
cdures comportementales. Nous proposons nanmoins un module de conguration
ddi aux gares ferroviaires, an de simplier le renseignement de telles simulations.
Les perspectives dvolutions de lapplication concernent essentiellement llaboration
de plugins de simulation. Ceux-ci, issus du premier module de larchitecture, seront
fournis en standard aux utilisateurs pour permettre la simulation de situations plus ou
moins complexes. A terme, il est envisag de fournir la totalit des quipements dis-
ponibles dans le catalogue des gares, ainsi que les procdures comportementales asso-
cies. On peut citer notamment : les panneaux dinformations statiques, les moniteurs
dinformations dynamiques, les divers points de vente, lensemble des circulations ver-
ticales, et les lments dattente.
Une autre perspective concerne llaboration de bibliothques de congurations ty-
piques des classes de populations. Cela ncessitera lextension des possibilits de con-
guration associes aux archtypes, pour inclure lensemble des facteurs inuenant la
planication de chemin et la navigation ractive. Ensuite, une caractrisation de ces
facteurs par des exprimentations sur le rel permettra dtablir les valeurs associer,
et de fournir des archtypes pr-congurs.
214
Chapitre 7
Validation des rsultats
La validation des rsultats est une problmatique essentielle pour un modle destin
reproduire des situations relles. Notre application venant tout juste dentrer dans sa
phase oprationnelle, nous navons pu conduire quun nombre limit de tests. Malgr
tout, nous avons pu commencer cette phase de validation concernant le modle de
navigation ractive, sur lequel nous allons nous concentrer dans cette section. Nous
reviendrons lors de la conclusion sur les autres phases de validation envisages dans un
avenir proche.
La validation du modle de navigation ractive est effectue par ltude des phno-
mnes macroscopiques en rsultant. Tout dabord, des exprimentations ont t me-
nes an de caractriser lattitude des pitons dans diverses situations, exploite pour
le moment par une analyse qualitative des logiques de dplacement. Ensuite, les vi-
tesses de marche produites par le modle suivant diffrentes densits et situations ont
t compares aux valeurs disponibles dans la littrature.
7.1 Validation des logiques de dplacement
La premire validation que nous avons effectue concerne les logiques de dplacement
des pitons dans diffrentes situations. Cette tape vise donc caractriser les ph-
nomnes danticipation ainsi que les organisations spatiales mergeantes des ux de
personnes. Cette tape a t publie rcemment dans [98].
Cette validation ncessite un protocole exprimental permettant le recueil des donnes
caractriser. Lanalyse de vidos produites sur le terrain na pu tre utilise dans cette
phase pour deux raisons : premirement, en raison du manque de prcision des donnes
quil est possible den extraire, ainsi que de lautomatisation difcile de cette extrac-
tion ; deuximement, cause du manque de contrle sur les conditions exprimentales
impliqu par cette technique. Cest pourquoi nous avons propos un protocole bas
sur lanalyse de captures de mouvements dans des conditions contrles. Cette capture
permet dextraire des positions cls sur le corps des participants (Figure 7.1) avec une
prcision de lordre du millimtre et de la dizaine de millisecondes. Deux sries dex-
primentations ont t ralises avec le concours des membres de lquipe Bunraku
auteurs du modle MKM [67] (utilisant habituellement cette technique pour extraire
215
Validation des rsultats
les mouvements de base servant lanimation), sous la direction de J. Pettr.
FIG. 7.1: Protocole exprimental bas sur la capture de mouvements. Les
marqueurs capturs sont mis en vidence sur la photographie.
7.1.1 tude prcise de lvitement de collision
Le premier protocole exprimental nimplique que deux participants la fois. Le but
est ici de caractriser les adaptations des pitons permettant dviter une collision
unique. Ceux-ci doivent effectuer une tche de navigation simple, dans un environ-
nement libre dobstacles, suivant des trajectoires sintersectant avec diffrents angles.
An de contrler le moment de la collision potentielle, les participants sont dsyn-
chroniss par des signaux de dpart afchs sur des crans chaque extrmit de leur
trajectoire (Figure 7.2). Ces signaux sont dclenchs suivant les directives fournies un
FIG. 7.2: Protocole exprimental deux participants. A gauche, un schma
des conditions de lexprimentation : des signaux dsynchronisent
les participants suivant les directives fournies. A droite, une photo-
graphie de lexprience.
216
Validation des logiques de dplacement
logiciel, et les conditions sont enregistres an de pouvoir les corrler aux diffrentes
captures. Un total de 145 squences ont t captures suivant ce protocole, impliquant
6 participants diffrents avec des trajectoires formant des angles de 90et 60.
Nous avons effectu une premire analyse de ces donnes captures par lextraction des
trajectoires produites. Tout dabord, comme illustr sur la gure 7.3(a), les trajectoires
sont reprsentes dans lespace, en indiquant des positions clefs suivant une chelle
temporelle. Cette reprsentation permet davoir une vue densemble de la squence
et des adaptations de trajectoires et de vitesse au cours du temps. Ensuite, les mmes
donnes sont exprimes sous forme de courbes (Figure 7.3(b)), permettant de corrler
les adaptations de chaque participant (P1 et P2) la distance les sparant ainsi qu
la distance de croisement prdite. On peut ainsi constater avec lexemple fourni sur la
gure 7.3, suivant le laps de temps considr :
61s 62s : P1 sest dj adapt en acclrant et en dviant lgrement sur la droite.
Il essaye ainsi de passer devant P2 qui a un comportement normal. Nanmoins,
P2 a une vitesse de rfrence trop importante en comparaison de P1 et cette
premire rsolution conduit un chec.
62s 62.5s : P1 change de stratgie et dclre.
62.5 64s : Les deux participants ont une raction combine : P1 continue dclrer
et dvie vers sa gauche, tandis que P2 acclre en dviant aussi vers sa gauche
pour faciliter la rsolution du conit.
Aprs 64s : La collision a t vite. On remarque que ladaptation de vitesse est cor-
rige pour tendre vers une valeur plus standard, de mme que la trajectoire qui
ne prend maintenant en compte que lobjectif nal.
(a) Trajectoires produite lors dune exprimenta-
tion (en rouge et orange). Les segments bleus
indiquent la distance entre les participants.
(b) Analyse comparative des adaptations de trajectoire
et de vitesse au cours du temps : au centre, les dis-
tances entre participants, aux extrmits les don-
nes de P1 et P2.
FIG. 7.3: Rsultats dune exprience deux participants. Les deux gures
prsentent la mme squence capture.
Le rebouclage des donnes sur le modle de navigation de lhumain virtuel na pas
encore t opr. Nous pouvons nanmoins tirer quelques constats de leur analyse,
validant qualitativement les principes appliqus dans ce modle :
217
Validation des rsultats
Des adaptations surviennent si la distance minimale prdite entre les trajectoires est
infrieure 0.5m. Cette valeur nous permet de dtecter automatiquement les portions
de dplacement o une adaptation est effectivement ralise, celle-ci pouvant tre de
trs faible amplitude.
Lanticipation est de plusieurs secondes avant une collision potentielle. Nous navons
pu dduire une borne maximale cause de la taille trop restreinte du champ de
capture lors de ces expriences.
Ladaptation pour viter une collision prend la forme dun changement de trajec-
toire et de vitesse. Le changement de trajectoire est born par une dviation assez
faible, tandis que le changement de vitesse peut tre trs important, pouvant aller
jusqu larrt complet de lindividu. Plus la collision est temporellement proche,
plus ladaptation en vitesse joue un rle prpondrant.
Linteraction entre les pitons est gre par un comportement dajustements rac-
tifs, pouvant tre remis en question plusieurs fois avant de converger vers une solu-
tion stable sur le long terme. Ce comportement explique notamment le phnomne
dinter-blocage lorsque deux individus effectuent des corrections symtriques simul-
tanes.
Enn, la correction du mouvement pdestre est un mcanisme prcis et dterministe,
nintervenant que lorsquune collision potentielle est dtecte. Dans le cas contraire,
la trajectoire et la vitesse restent stables tout au long du parcours.
7.1.2 tude macroscopique des phnomnes mergeants
La deuxime srie dexprimentations, toujours base sur la capture de mouvements,
met cette fois en scne un nombre plus consquent de participants. Le but est ici dex-
traire les organisations spatiales mergeantes des interactions entre pitons dans des
situations de moyenne forte densit. Vingt quatre participants ont contribu ces
expriences, limite impose par les dimensions du local utilis pour la capture de mou-
vements.
Plusieurs congurations environnementales ont t produites par le positionnement de
divers obstacles (prsentes Annexe E, page 265). Des marqueurs de captures ont t
assigns ces obstacles an dattester de leur immobilit dans les squences captures,
ainsi que de fournir leurs positions et dimensions.
Les squences captures nous ont permis de conrmer certaines informations quali-
tatives prsentes dans la littrature, ainsi que den rvler de nouvelles. Nous avons
ainsi pu attester de la validit de notre modle par la reproduction de ces phnomnes
(Figure 7.4), tels que :
loccupation maximale de la largeur dun couloir lorsquun ux de personnes unidi-
rectionnel lemprunte ;
la formation de les de largeur proportionnelle la taille des ux qui la composent,
dans le cas de ux opposs ;
une prdisposition anticiper les changements de trajectoire avant les zones de
confrontation (cette partie est reproduite par le module doptimisation visuelle de
la trajectoire) ;
ladaptation brutale intervenant en absence de visibilit lors de larrive un carre-
four en ux dense.
Nanmoins, certains phnomnes observs sont issus de comportements plus rationnels
ou sociaux, et ne peuvent tre directement reproduits par notre modle de navigation
218
Validation des vitesses de dplacement
(a) Formation de les proportionnelles
la taille des ux opposs. Deux
groupes sont en confrontation, qui
est rsolue par la formation de deux
les visuellement identiables.
(b) Adaptation tardive et brutale en absence de visibilit. Dans le
sens de lecture : deux groupes dindividus arrivent langle
dun couloir ; ils saperoivent tardivement ; lun des indivi-
dus de gauche peut schapper sur la droite, lautre se re-
trouve coinc par le ux oppos.
FIG. 7.4: Reproduction de phnomnes macroscopiques par le modle de na-
vigation. Les ches rouges signalent la direction aprs optimisa-
tion visuelle, les bleues celle obtenue par la navigation ractive.
ractive. Deux exemples entrent dans cette catgorie :
1. le comportement de cder le passage, pour permettre la traverse de personnes
bloques par un ux plus dense ;
2. lanticipation de collisions induites par la possibilit dapparition dentits de-
puis des zones non visibles de lenvironnement, en se basant uniquement sur la
topologie.
7.1.3 Conclusion
Cette premire tape de validation qualitative permet dattester de la pertinence de
notre modle vis vis de phnomnes mergeants du dplacement pitonnier. Pour ce
faire, nous avons tout dabord conduit une srie dexprimentations relles, utilisant le
procd de capture de mouvements. Nous avons ensuite analys les donnes recueillies
pour en extraire qualitativement les principes rgissant la locomotion humaine. Enn,
nous avons pu vrier que ces principes taient bien reproduits par notre modle. Nous
avons tout de mme not que certains phnomnes ncessitent une participation plus
active du mcanisme dcisionnel dun tre humain, ne pouvant ce titre tre directe-
ment appliqus par un mcanisme ractif.
7.2 Validation des vitesses de dplacement
Cette seconde validation sappuie sur les vitesses de dplacement produites par notre
modle de navigation ractive, en fonction des densits de personnes et de la situation
globale. Ces vitesses seront compares celles nonces par J.J. Fruin [41] et K. To-
gawa [138], dans leurs tudes statistique et macroscopique.
219
Validation des rsultats
Les situations tudies ne comportent que des voyageurs larrive, an de ne pas
fausser les vitesses extraites par les comportements dattente des voyageurs au dpart.
Les relevs ont t faits sur lenvironnement de test prsent tout au long de cette partie,
en faisant arriver les voyageurs par la voie V1 (en bas gauche du plan) et en les faisant
sortir par laccs rue A3 (en haut droite du plan). De cette faon, nous concentrons
les ux entre deux entres/sorties de lenvironnement, rsultant en la traverse dun
couloir et dun hall avec des obstacles ponctuels.
Les afuences tudies sont les suivantes (Figure 7.5) :
Dbit ponctuel : cette afuence libre des voyageurs intervalles de temps trs espa-
cs. Elle ne sert que de point de repre, an dattester du maintien de la vitesse
dsire en absence de contraintes.
Faible afuence (Figure 7.5(a)) : cette afuence correspond un dbit faible de voya-
geurs, permettant de conserver une aisance de circulation maximale. Aucun cas
de blocage nest observ dans cette situation.
Afuence moyenne (Figure 7.5(b)) : cette afuence correspond un dbit plus sou-
tenu de voyageurs, impliquant une rpartition plus leve du ux de personnes.
Encore une fois, aucun cas de blocage nest observ.
Forte afuence (Figure 7.5(c)) : cette afuence permet datteindre les limites dagran-
dissement du ux dans certaines zones parcourues. On voit ainsi apparatre les
premiers cas de blocage au niveau des obstacles dans le hall (piliers et guichets).
Nanmoins, ces blocages se rsorbent assez rapidement.
Trs forte afuence (Figure 7.5(d)) : cette afuence impose au ux de personnes une
couverture maximale des zones de parcours contraintes, dont notamment le cou-
loir de dpart. Les mmes blocages que prcdemment sont observables, mais
cette fois-ci de faon plus persistante. On observe ainsi une fuite du ux vers les
zones ouvertes adjacentes.
Chaque situation a t simule en imposant une vitesse dsire de 1.34m/s aux entits,
correspondant une vitesse de marche standard dans les pays europens. Les donnes
recueillies ont t retranscrites sous forme de graphique, simultanment aux valeurs
fournies par J.J. Fruin et K. Togawa (Figure 7.6). La formule fournie par K. Togawa,
sensible la densit en personnes par mtre carr, a de plus t borne la vitesse
dsire V
d
des entits :
V = min(V
d
.
0.8
;V
d
)
Analysons les rsultats prsents par ce graphique suivant la situation :
Dbit ponctuel : On peut vrier que cette valeur de vitesse pour une densit unique
respecte la vitesse dsire. Cela valide lobservation faite sur les squences de
captures de mouvement selon laquelle le dplacement reste constant et optimum
en absence de perturbations.
Faible afuence : La vitesse se maintient aux alentours de celle dsire, mme pour la
densit maximale mise en vidence de 1.5p/m
2
. Cela signie que les personnes
disposent de sufsamment despace latral pour sorganiser an de maintenir
leur distance de scurit frontale pour cette vitesse. Cela se justie par le fait
que le ux soit sens unique, nimpliquant des adaptations que vis--vis des
personnes adjacentes (pour les densits leves) et de devant (mais restant assez
loignes), allant toutes dans la mme direction.
220
Validation des vitesses de dplacement
Jauges Densits Vitesses
(a) Faible afuence.
(b) Afuence moyenne.
(c) Forte afuence.
(d) Trs forte afuence.
FIG. 7.5: Situations simules pour lextraction de courbes densit/vitesse.
Chaque situation est prsente par des cartes de jauges, de densi-
ts, et de vitesses.
221
Validation des rsultats
FIG. 7.6: Comparaisons des vitesses obtenues par le modle aux donnes de
la littrature. Chaque situation est reprsente par sa propre courbe,
simultanment aux valeurs de J.J. Fruin et K. Togawa.
Afuence moyenne : La vitesse se maintient aux alentours de celle dsire jusqu
une densit de 1p/m
2
, puis chute pour les densits plus leves. La courbe pro-
duite suit presque parfaitement celle de K. Togawa. Comparativement la situa-
tion prcdente, la chute de la vitesse sexplique par un encombrement global
plus important, le modle ragissant alors des collisions potentielles proches
dans le temps. Ainsi, du fait de la hausse du nombre dentits voisines, les pos-
sibilits de changement de direction samenuisent au prot dune rduction de
la vitesse. La densit maximale observe tmoigne nanmoins dune capacit du
modle conserver la uidit du trac grce la prdiction.
Forte afuence : La vitesse maximale dans cette situation est plus faible que celle
dsire. Cela se justie par la forte augmentation de lencombrement global,
le modle adaptant automatiquement le dplacement dune entit percevant une
obstruction, mme lorsque sa densit locale reste faible. Le restant de la courbe
dcrot proportionnellement laugmentation de la densit, pour rejoindre les
valeurs de K. Togawa partir de 1.3p/m
2
.
Trs forte afuence : La vitesse maximale est ici bien plus faible que celle dsire,
pour les mmes raisons que prcdemment. La variation des vitesses est plus
forte, avec une dcroissance rapide jusqu des valeurs trs faibles pour les fortes
densits. En corrlant ces donnes aux cartes de la gure 7.5(d), on se rend
compte que la situation gnrale, avec des blocages importants, a un impact fort
sur les vitesses de dplacement.
Ce graphique met en vidence plusieurs proprits du modle de navigation ractive.
Premirement, il permet bien de rduire les vitesses de dplacement des entits avec
laugmentation des densits de population, avec toutefois une tendance plus marque
que celles prsentes dans la littrature. Deuximement, il met en vidence une raction
222
Conclusion et perspectives
globale intimement corrle la situation, la diminution de la vitesse suivant la densit
pouvant mme disparatre dans des cas peu contraints.
De manire gnrale, les rsultats prsents ici sont quantitativement ralistes. De plus,
notre modle de navigation ractive permet de considrer des facteurs environnemen-
taux non applicables dans les modles statistiques ou macroscopiques. Pour ces raisons,
nous pouvons conclure que ce modle permet damliorer la simulation des circulations
de personnes par rapport aux approches prcdentes.
7.3 Conclusion et perspectives
Nous avons prsent tout au long de ce chapitre les premires phases de validation
opre au cours de cette thse. Cette validation sest concentre sur le modle de na-
vigation ractive, celui-ci tant lun des plus importants vis--vis de lobjectif de ces
travaux.
Nous avons dmontr que notre modle produisait des phnomnes mergeants corres-
pondant la ralit, attestant de la pertinence qualitative de nos rsultats. Nous avons
aussi pu constater que notre modle adaptait correctement les vitesses de dplacement
en fonction des densits de personnes, attestant cette fois-ci de la pertinence quantita-
tive de nos rsultats. De plus, nous avons mis en vidence que notre approche ragissait
diffremment suivant la situation globale dans lenvironnement simul. Cette tendance
se vrie visuellement sur nos donnes (captures de mouvement aussi bien que vidos
diverses), mais constituera lune des prochaines tapes prvues danalyse quantitative.
Une autre perspective concernant la validation est le rebouclage des donnes de cap-
ture de mouvements avec le modle. Nous prvoyons ainsi de simuler des situations
identiques aux expriences, puis den extraire les aires de Goffman comme prsent
en annexe E, page 265, pour en faire une tude comparative. Nous souhaitons aussi
automatiser une srie de simulations an dextraire les paramtres pour les facteurs
dadaptation (prfrence pour le changement de direction, lacclration, ou la dc-
lration) les plus proches du rel. De plus, une autre analyse devra tre conduite pour
trouver un modle plus n de slection du voisinage suivant la situation (distance prise
en compte suivant lenvironnement et la densit de population).
Dautre part, nous avons mis en vidence la ncessit dun modle plus rationnel pour
piloter la navigation ractive dans des cas spciques (absence de visibilit et com-
portements sociaux). Grce au fort potentiel dvolution de notre approche, il semble
possible de grer ces comportements supplmentaires via des tches cognitives, sans
avoir modier larchitecture gnrale. Cette possibilit constitue donc une nouvelle
perspective dvolution de notre modle dhumain virtuel.
Enn, une autre perspective concerne la validation du modle de planication de che-
min. En effet, celui-ci est pour le moment congur avec des degrs de prfrence
arbitraires pour lensemble des facteurs individuels. Il parat essentiel de conduire une
srie dexprimentations relles pour caractriser leur importance relative, le but nal
tant de proposer des congurations types reprsentant diffrentes catgories de popu-
lations.
223
Chapitre 8
Analyse des performances
dexcution
Mme si les performances de la simulation ne sont pas lobjectif premier de ces tra-
vaux, nous avons tout de mme voqu la ncessit de maintenir un certain niveau de
ractivit de lapplication an den permettre une utilisation confortable. Le modle
qui va avoir limpact maximal sur les performances est celui de lhumain virtuel. En
effet, celui-ci est rafrachit la plus haute frquence du systme, et est utilis par un
nombre consquent dentits simules.
Nous allons tudier les performances des diffrents modules composant lhumain vir-
tuel, en utilisant le dcoupage suivant :
Biomcanique. Le module de locomotion et danimation, incarn par le modle MKM,
reprsente totalement cette couche. Nous ne tiendrons pas compte ici des calculs
relatifs au rendu.
Ractif. Cette couche sera scinde en plusieurs parties :
Planication de chemin initiale : elle correspond la premire requte de pla-
nication de chemin, toutes catgories de destinations confondues. Cette
tche effectue donc la recherche de chemin dans la couche la plus abstraite
du graphe topologique.
Suivi de chemin : cela correspond chaque mise jour de chemin au cours du
dplacement de lentit. Cette tche se charge donc des rafnements suc-
cessifs dans les deux couches les moins abstraites du graphe topologique,
ainsi que de loptimisation visuelle.
Observation : elle correspond lextraction des informations par le parcours des
PVS. Cette tche se charge ainsi de la construction de la mmoire perceptive
et court terme de lhumanode.
Navigation ractive : elle correspond au processus complet de navigation de
lentit, depuis la rcupration de la direction de mouvement dsire, jus-
qu la dcision de la meilleure option de dplacement.
Cognitif et rationnel. Nous proposons dvaluer les performances de ces deux couches
conjointement, en les subdivisant en trois parties :
225
Analyse des performances dexcution
Supervision : elle correspond aux tapes de lancement et darrt automatique
de tches cognitives.
Gestion des tches cognitives : cette tape se charge de lordonnancement et de
lexcution des tches cognitives actives.
Gestion des affordances : cette tape se charge de lordonnancement des affor-
dances, ainsi que du test de leur pr-condition rationnelle.
8.1 Frquences de rafrachissement
Le premier point spcier est la frquence de rafrachissement de chaque module. En
effet, certains des modles disposent dune frquence attribue une fois pour toutes,
mais dautres sont valus en raction des vnements, et auront donc une frquence
moyenne mergeante.
Nous avons conduit une srie de tests sur diffrentes situations, rsultant en la rparti-
tion des frquences prsente sur la gure 8.1. Les frquences mergeantes sont relati-
vement stables dune situation lautre.
FIG. 8.1: Frquences de rafrachissement de lhumain virtuel. Les valeurs ob-
tenues sont relativement stables dans diffrentes situations.
On saperoit sur ce graphique que la frquence la plus leve du systme est de 10Hz.
Il sagit de la borne minimale maintenir pour assurer une restitution visuelle uide par
le module danimation. Cette valeur peut tre augmente sans aucune consquence sur
le fonctionnement des autres modules. Nanmoins, le module de locomotion/animation
est lun des plus coteux de larchitecture, et laugmentation de sa frquence conduit
une chute proportionnelle des performances. Une autre frquence contrainte est celle
des couches cognitive et rationnelle, qui respecte bien le 1Hz spci dans le modle.
Voyons maintenant les frquences non imposes, relatives la couche ractive de lhu-
main virtuel. Tout dabord, la recherche initiale dun chemin dispose dune frquence
mergeante trs faible, avec en moyenne un rafrachissement toutes les dix secondes.
La premire raison dune valeur si faible est que cette tape nest explicitement requise
qu de rares occasions par les tches cognitives, an de slectionner un couple af-
fordance/effecteur dans lenvironnement ou de procder un dplacement par dfaut
(attente ou exploration). La deuxime raison est que laspect ractif de cette plani-
cation, remettant en cause le chemin courant, nest dclench que trs ponctuellement
le long du parcours de lhumanode, lors de la perception dinformations considres
226
Temps dexcution
comme primes. Une autre frquence de rafrachissement mergeante est celle du
suivi de chemin, valu conjointement la navigation ractive. Ces deux comporte-
ments sont dclenchs par chaque nouveau pied dappui de lhumain virtuel, et donc
une frquence infrieure 2Hz compte tenu de la vitesse de marche de nos entits. La
dernire frquence mergeante est celle de lobservation, qui est ici infrieure 1Hz.
Notre modle spciait quelle devait tre value la mme frquence que la navi-
gation ractive, mais nous avons introduit ici une optimisation base sur la cohrence
temporelle des informations observes. Ainsi, les donnes perues ne sont rafrachies
lors dun nouveau pied dappui que si elles datent de plus dune seconde, et conserves
dans le cas contraire.
Le premier constat que lon peut tirer de ces donnes est la libert offerte par le mo-
dle dhumanode quant sa frquence de rafrachissement. En effet, on peut voir que
malgr une frquence initiale de 10Hz, lensemble des frquences mergeantes est in-
frieur 2Hz. Cette valeur est donc la borne minimale de rafrachissement respecter
par le moteur de simulation pour garantir un fonctionnement normal de lhumain vir-
tuel. Le deuxime constat provient lui aussi de cette frquence minimale, relativement
au modle de navigation ractive. On peut ici se rendre compte que son valuation se
fait un rythme trs faible, bien infrieur aux pr-requis dautres modles existants
(notamment celui de D. Helbing qui ncessite une frquence leve pour converger).
Cette valeur est dautant plus intressante quelle permet de se rapprocher dun ordre
de grandeur raliste.
8.2 Temps dexcution
tudions maintenant les temps dexcution constats pour chaque module. Les valeurs
prsentes ici ont t obtenues avec un Pentium 3.6GHz, quip de 2Go de mmoire
et dune Quadro FX 3450/4000 SDI. Le systme dexploitation utilis est Windows XP
Professionnel.
Les performances que nous allons prsenter sont synthtises de deux faons :
1. Le cot par appel, qui reprsente le temps moyen dexcution dune procdure
indpendamment de sa frquence de rafrachissement.
2. La proportion de temps consomme pour une seconde simule, qui reprsente le
cumul de temps allou chaque procdure relativement aux autres sur un nombre
de rafrachissements correspondant la frquence maximale du systme.
Nous avons effectu des relevs de performances dexcution sur trois catgories de
situations reprsentatives (Figure 8.2), toutes appliques lenvironnement de test pr-
sent dans ce chapitre :
Figure 8.2(a) : Une entit seule au dpart.
Cette situation comporte la chane comportementale complte du voyageur au
dpart (confre Annexe D, page 257), celui-ci se trouvant seul dans la gare. La
dure par appel la plus importante est ici celle de la planication de chemin
initiale. En effet, cest la mthode de planication la plus coteuse qui est em-
ploye, an de slectionner un couple affordance/effecteur pour les interactions
ncessaires. La navigation ractive prsente son cot le plus faible, ne tenant
compte que des obstacles statiques le long du parcours. Quant aux tages cogni-
tif et rationnel, ils prsentent leur cot le plus important, ayant en charge la pro-
227
Analyse des performances dexcution
Dure par appel. Proportion pour 1s simule.
(a) Entit seule au dpart. T
H
= 1.28ms
(b) Afuence moyenne (dpart/arrive). T
H
= 1.63ms
(c) Forte afuence (dpart/arrive). T
H
= 2.06ms
FIG. 8.2: Comparaison des temps dexcution de lhumain virtuel. Trois si-
tuations sont prsentes, inuant sur les temps de calcul des dif-
frents modules. Le temps rel T
H
ncessaire la simulation dun
humanode pendant une seconde est indiqu.
228
Temps dexcution
cdure la plus complexe de nos usagers. Malgr cela, on peut se rendre compte
que les performances de ces tages sont bien meilleures que tous les autres mo-
dules de lhumain virtuel. La proportion de temps pour une seconde simule
la plus importante est celle du module danimation/locomotion, celui-ci ayant un
cot par appel assez important, tout en tant rafrachit la frquence maximale
du systme. Lautre cumul de temps important est celui de la navigation ractive
qui a aussi un cot par appel consquent.
Figure 8.2(b) : Plusieurs entits au dpart et larrive en afuence moyenne.
Cette seconde situation comporte aussi bien des voyageurs au dpart qu larri-
ve (avec une procdure comportementale bien plus simple), avec une afuence
moyenne produisant ponctuellement de fortes densits mais pas de blocage. On
peut voir que le cot par appel des tages cognitif et rationnel, ainsi que des
planications de chemin et de lobservation, sont trs fortement rduits. Cela est
d aux voyageurs larrive qui sous exploitent ces modules comportementaux.
Le module danimation/locomotion subit une lgre baisse de performances, im-
pute aux changements de mouvements plus frquents du fait dadaptations lo-
cales augmentant avec la densit. Enn, la navigation ractive double son temps
dexcution, cause de la prise en compte des entits voisines. La proportion
de temps pour une seconde simule est principalement rpartie entre la loco-
motion et la navigation, toujours cause de leur frquence et de laugmentation
de leurs cots par appel.
Figure 8.2(b) : Plusieurs entits au dpart et larrive en forte afuence.
Cette dernire situation est identique la prcdente, avec une augmentation de
lafuence pouvant conduire des blocages ponctuels. On voit que le cot par
appel des tages cognitif et rationnel, ainsi que des planications de chemin,
de lobservation, et de la locomotion, se maintiennent. Par contre, la navigation
ractive subit encore une hausse du fait de laugmentation dentits voisines
prendre en compte, cause de la hausse globale des densits de populations.
Cette tendance se rpercute sur la proportion de temps pour une seconde si-
mule, avec une augmentation de la part alloue la navigation.
Par lanalyse de ces graphiques, et dautres exprimentations non prsentes ici, on
peut synthtiser les constats suivants :
Le module de locomotion/animation a des performances constantes quelle que soit
la situation considre, si ce nest le cas de lentit seule qui ne ncessitera que trs
peu dadaptations de mouvement locales.
La planication de chemin initiale nest pas sensible au nombre dentits simules,
mais seulement au mode de recherche envisag (confre Section 5.3.2, page 147),
ainsi qu la taille du graphe topologique le plus abstrait de lenvironnement.
Le suivi de chemin est extrmement performant dans tous les cas.
Lobservation de lenvironnement est sensible au mode choisi par sa tche cognitive
(confre Section 5.5.1, page 181), ainsi qu la complexit gomtrique de lenvi-
ronnement.
La navigation ractive est extrmement sensible aux densits locales de populations,
et donc au nombre dentits voisines prendre en compte.
La supervision rationnelle a un temps dexcution ngligeable et relativement constant
quelle que soit la procdure comportementale.
La gestion des tches cognitives et des affordances est directement dpendante de la
complexit des procdures comportementales de lentit. Nanmoins, la dgradation
des performances de la gestion des tches cognitives est limite par la supervision ra-
229
Analyse des performances dexcution
tionnelle, qui maximise le nombre de traitements simultans (confre Section 5.6.2,
page 187).
8.3 Conclusion
Nous nous sommes pench dans ce chapitre sur lanalyse des performances du mo-
dle dhumain virtuel, qui prend la part la plus importante lors de lexcution dune
simulation.
Nous avons vu dans un premier temps que la frquence dexcution de ce modle a
des contraintes assez faibles, bien en de des modles existants dans la littrature. De
plus, le modle peut sadapter automatiquement une modication de cette frquence,
grce la prise en charge de rafrachissements vnementiels. Ces points permettent de
conserver la cohrence de la simulation quelles que soient les variations de frquence
imposes : il est possible de la rduire fortement pour acclrer lexcution, ou de
laugmenter pour obtenir des animations plus uides.
Nous avons ensuite prsent les temps dexcution des diverses parties du modle. Mal-
gr que leur optimisation nai pas t une de nos contraintes, on a pu constater quelles
mettent des rsultats avantageux. Les performances offertes permettent donc denvi-
sager des domaines dapplication connexes, comme les jeux vidos, o lexcution en
temps rel est une contrainte forte.
230
Conclusion et perspectives
Nous avons abord tout au long de cette partie les rsultats obtenus lors de cette thse.
Ces rsultats prennent tout dabord la forme dune architecture ddie la simulation
du nom de SIMULEM. Ce logiciel concrtise lensemble des modles prsents comme
contributions, tout en apportant un certain nombre de fonctionnalits permettant de les
exploiter. Il permet ainsi de grer la chane de simulation complte, depuis lajout de
nouveaux objets interactifs, jusqu lexploitation nale des donnes produites. Son
architecture est fortement base sur le principe dintrospection propos par BIIO, qui
est exploit pour fournir des botes de dialogue gnriques. Un module de congura-
tion spcique est nanmoins fourni, an de rpondre au mieux aux spcicits de la
simulation de gares ferroviaires. Cet outil reste ouvert quant ses possibilits dvo-
lutions, que ce soit par son aspect modulaire ou par sa gestion automatique de plugins
de simulation. Les perspectives le concernant sont donc essentiellement axe sur lla-
boration de tels plugins, permettant ainsi daugmenter considrablement le gradient de
situations et de typologies denvironnements pouvant tre simuls.
Le second aspect des rsultats qui a t prsent concerne la validation des modles
proposs. Comme nous lavons soulign, lapplication entrant tout juste dans sa phase
oprationnelle, peu de tests ont actuellement pu tre conduits. Nous avons nanmoins
commenc cette validation pour le modle de navigation ractive. Des expriences de
capture de mouvements ont ainsi t ralises, permettant pour le moment une valida-
tion qualitative de phnomnes mergeants. Les rsultats de ces expriences peuvent
nanmoins tre analyss plus profondment, et un rebouclage des donnes quantita-
tives avec le modle reste accomplir. Une autre validation a t propose concer-
nant les variations de vitesses en fonction des densits de personnes. Nous avons ainsi
compar des courbes obtenues par la simulation de diffrentes situations aux valeurs
disponibles dans la littrature. Nous obtenons des variations globalement comparables,
mais mettant en vidence un impact fort de la situation globale. Il est donc envisag
de reproduire ces situations dans des exprimentations pour en vrier le bien fond,
la littrature ne proposant que des observations gnrales ne tenant pas compte de ce
facteur.
La validation des autres parties de notre modle dhumain virtuel est aussi envisage, et
notamment la planication de chemin. La poursuite du projet SIMULEM prvoit cette
validation par simulation dun cas rel, et sa comparaison des donnes relles. Lenvi-
ronnement choisi est la gare de Rennes, dans lequel une campagne de comptage va tre
lance. Cette exprimentation permettra ainsi de caractriser les afuences certains
points clefs de la gare au cours du temps. Aprs conguration de donnes dexploi-
tation identiques dans le logiciel, la mme situation sera simule pour en vrier la
231
Conclusion et perspectives
pertinence. Cette phase de tests nous permettra ainsi de proposer un premier rglage
gnrique des diffrentes variables du modle dhumain virtuel.
Pour nir, nous avons prsent une analyse des performances de nos agents autonomes.
Nous avons ainsi pu mettre en avant la faible frquence dappel des comportements r-
actifs, sapprochant de la ralit. Nous avons aussi constat que les temps dexcution
obtenus, sans tre comparables ceux de mthodes danimation pure ou dapproches
grande chelle comme MAGS [88], sont tout de mme avantageux. Ce constat per-
met donc denvisager une exploitation de ce modle dans des domaines connexes, tels
que le jeu vido. Notons tout de mme que les deux processus les plus coteux, la
navigation ractive et la locomotion, gagneraient tre optimiss.
232
Conclusion et
perspectives gnrales
Nous avons trait au sein de ce document la problmatique de ltude des circulations
de personnes via la simulation. Cette problmatique est renforce dans notre cadre
dapplication par la ncessit de tenir compte des besoins dinteraction des humains.
Nous pouvons conclure de faon gnrale que les contributions prsentes dans ce
document rpondent la problmatique pose. De plus, la mise en uvre des modles
t ralise, prouvant leur faisabilit. Enn, les travaux proposs sont tourns vers
lavenir, en autorisant de nombreuses volutions.
Lexistant
Nous avons commenc par analyser ltat de lexistant concernant les circulations de
personnes, et lanimation comportementale. Cela nous a permis de nous familiariser
avec certaines des caractristiques du comportement humain, comme la prise de d-
cision. Nous avons fait de ces caractristiques les contraintes de notre approche, en
observant quelles avaient un impact fort sur les circulations de personnes. Nous avons
aussi couvert les diffrentes mthodes permettant de simuler ces circulations. Ces ap-
proches ont permis de rcolter un nombre consquent de donnes quantitatives et qua-
litatives quant aux mouvements pdestres. Elles ont aussi dnies le cadre du modle
vers lequel nous voulions nous diriger. Nous avons enn mis en vidence la ncessit
dune tape de validation de modles, garantissant leur pertinence dans un cadre de
simulation.
Les modles proposs
Dans un deuxime temps, nous avons proposs des modles permettant de simuler les
circulations de personnes. Ces modles sarticulent autour de trois problmatiques :
la symbolisation des connaissances, la reprsentation de lenvironnement, et lhumain
virtuel.
233
Conclusion et perspectives gnrales
Les objets interactifs
Notre modle dobjets interactifs, dnomm BIIO, fournit les concepts ncessaires
la description de linteraction. Ce modle dcrit ainsi les symboles les plus abstraits
reprsentant les intervenants dune interaction, ainsi que les mcanismes gnriques
qui permettent leur gestion. Cette gnricit est primordiale dans ce modle, qui se
veut trs ouvert. Ainsi, il propose un principe de hirarchisation de la description pour
lensemble de ses constituants, facilitant son volution. Cette hirarchisation est aussi
utilise par des fonctionnalits gnriques, dont notamment pour la gestion des com-
portements dinteraction (les affordances). Cette gestion est mise en place un niveau
abstrait, dit rationnel, permettant llaboration implicite dun plan comportemental non
situ.
Les perspectives dvolutions de ce modle sont nombreuses, sa conception mme tant
oriente vers cet objectif. Nous avons tout de mme identi deux points qui apporte-
raient un bnce indniable cette approche. Premirement, rappelons que la gestion
comportementale y est hautement descriptive, ne disposant daucun mcanisme din-
frence permettant la dduction dun plan comportemental. Il serait alors souhaitable
de coupler ce modle un tel mcanisme, an den tendre les potentialits de gestion
comportementale. Deuximement, BIIO ne sintresse pour le moment quaux impli-
cations de linteraction dans le processus dcisionnel, et laisse donc de ct sa repr-
sentation visuelle. Son couplage un modle spcialis dans cet objectif permettrait
donc dtendre son champ dapplication. Nous avons identi deux modles pouvant
rpondre cette perspective. Tout dabord, les smart objects qui ont dj prouv quune
telle collaboration peut tre mise en uvre par leur couplage avec des modles de rai-
sonnement. Ensuite, STARFISH qui utilise des lments de description de linteraction
physique proches de ceux introduits par BIIO (notamment en ce qui concerne les zones
dancrage).
Lenvironnement virtuel
Le second modle propos concerne la description informe de lenvironnement. Nous
avons fond ce modle sur une reprsentation de type exacte, garantissant la conser-
vation de linformation gomtrique. Cette reprsentation est ensuite abstraite, an de
sloigner dune dnition gomtrique au prot dune description plus conceptuelle.
Elle permet ainsi de caractriser des zones globales de circulation, et dinterconnecter
des environnements lchelle et la signication diffrentes (comme une gare avec un
mtro). Cette abstraction est ensuite informe grce de nombreuses donnes relatives
aux circulations de personnes, an de fournir efcacement les informations qui seront
ncessaires aux entits simules. Pour nir, les objets interactifs du premier modle
sont lis cette reprsentation, permettant ainsi de situer la connaissance dans les-
pace.
En ce qui concerne les perspectives dvolution de ce modle, nous avons plus pro-
pos de nouveaux cadres dapplication quune extension de ses possibilits. Ainsi,
nous avons soulign que la reprsentation grande chelle dune ville pourrait tre
atteinte, tout en conservant une complexit localement faible ainsi que la totalit de
linformation gomtrique. Il est donc envisageable dexprimer avec ce modle plu-
sieurs environnements interconnects, reprsentant chacun une typologie de zone de
circulation diffrente : la ville dans son ensemble (ses rues), les habitations, et des bti-
234
Conclusion et perspectives gnrales
ment spciques (gare, stade, mtro, etc.). Il serait alors possible de simuler diffrentes
chelles environnementales en se fondant sur une unique reprsentation.
Lhumain virtuel
Le troisime modle propos concerne lhumain virtuel, acteur exclusif de nos simu-
lations. Cet agent autonome est directement li aux concepts introduits par BIIO, tant
lui-mme une spcialisation de linteracteur dni dans ce modle. Son architecture
sorganise de faon similaire la pyramide de A. Newell, restant ainsi dle la tho-
rie cognitive du comportement.
Cette architecture comprend tout dabord un ensemble de comportements ractifs lis
au dplacements de personnes. Le premier de ces comportement dote lhumain virtuel
de capacits de perception visuelle, couples un mcanisme mmoriel. Cela permet
lagent autonome de ne plus tre omniscient vis--vis de lenvironnement. Le se-
cond comportement ractif prend une part plus active dans la dcision de lhumain
virtuel, en lui permettant de planier un chemin. Cette planication se dcoupe en trois
modes la destination plus ou moins abstraite : atteindre un lieu, explorer lenvironne-
ment, et choisir une interaction. De manire gnrale, la planication est sensible la
connaissance topologique de lhumanode, ainsi qu un ensemble de facteurs environ-
nementaux et personnels. Enn, elle permet, grce au mode choisissant une interaction,
de situer le raisonnement de lhumain virtuel. Son troisime et dernier comportement
ractif est li au dplacement local de lindividu, avec la navigation ractive. Celle-ci
applique les principes issus des tudes psychologiques : la prdiction, la robustesse, la
minimisation des ajustements, et la ractivit. Elle est de plus sensible des facteurs
personnels guidant les adaptations de lhumanode. Enn, elle permet non seulement
dviter les collisions avec des obstacles, mais autorise aussi la rsolution de compor-
tements opportunistes ou secondaires, comme le suivit de personnes.
Lensemble de ces comportements ractifs est ensuite pilot par un tage plus abstrait,
compos de tches cognitives. Celles-ci sont spcies par spcialisation du concept
introduit par BIIO, et constituent donc la partie augmentable du modle dhumain vir-
tuel. On y trouve trois tches fournies en standard : la gestion de lobservation, du d-
placement, et de linteraction. Enn, un tage supplmentaire de la pyramide organise
lexcution gnrale de lhumain virtuel, en intgrant lensemble des comportements
prcdents. Cet tage est compos de deux gestionnaires issus de BIIO : lun pour les
affordances, lautre pour les tches cognitives. Il dispose aussi dun processus de su-
pervision des tches dinteraction permettant dassurer quelles reprsentent bien les
buts immdiats de lhumain virtuel.
Les perspectives dvolution de ce modle concernent essentiellement ses lments de
base. Ainsi, il serait possible dajouter de nouveaux comportements ractifs an de g-
rer dautres aspects de lhumanode, comme par exemple la perception auditive. Nous
pouvons aussi envisager dajouter de nouvelles tches cognitives, comme la gestion de
laspect social pour inuencer la navigation. Une autre perspective dvolution est la
spcialisation de lhumain virtuel. En effet, en temps quobjet BIIO, il bncie impli-
citement des avantages de ce modle, dont la hirarchisation des concepts. En le sp-
cialisant, nous pouvons ainsi crer des affordances accessibles seulement certaines
catgories de populations. Par exemple, il serait possible davoir une spcialisation en
personne mobilit rduite pour qui les escaliers seront inutilisables. Cela sera rensei-
235
Conclusion et perspectives gnrales
gn simplement en indiquant laffordance correspondante que linteracteur autoris
appartient une autre branche de spcialisation.
Les rsultats
La dernire partie de ces travaux fut consacre aux rsultats obtenus.
Loutil de simulation
Lensemble des contributions expose ont t intgres dans un logiciel du nom de
SIMULEM. Celui-ci permet de rpondre lobjectif nal de ces travaux : simuler des
environnements et en extraire des donnes relatives aux circulations de personnes. Cet
outil est organis en quatre modules, permettant darriver cet objectif mais aussi de
faire voluer les objets interactifs de la simulation. Le logiciel exploite donc BIIO au
cur de son architecture, tirant ainsi avantage des principes proposs par ce modle,
dont notamment lintrospection qui est utilise pour fournir des botes de dialogue
gnriques. Les rsultats de simulations proposs par ce logiciel se prsentent sous la
forme de diagrammes ou de cartes, comme cela a t dni avec les utilisateurs naux.
Les perspectives dvolution de cette application sont classer en deux catgories.
Tout dabord, il est prvu dexploiter les fonctionnalits de BIIO an de proposer une
collection dobjets de simulation couvrant lensemble du potentiel dune gare : les pan-
neaux dinformation, les points de vente, ou encore les circulations verticales. Ensuite,
il est prvu dtendre les capacits de ce logiciel pour atteindre des cadres dapplication
connexes. On peut citer la simulation daroports, de mtros, de centres commerciaux,
ou encore de stades.
tape de validation
La validation sest concentre sur le modle de navigation ractive, en le comparant
a des donnes relles et issues de la littrature. Les donnes relles ont t obtenues
par un procd de capture de mouvements dans des expriences contrles, permettant
datteindre une prcision bien meilleure quavec des vidos. Celles-ci nous ont permis
dattester qualitativement de la pertinence du modle, par la reproduction de phno-
mnes mergeants. La comparaison des donnes quantitatives issues de la littrature
a ensuite t faite, en se basant sur les valeurs de vitesse de dplacement en fonction
de la densit. Les rsultats du modle ont ainsi t compares avec succs aux donnes
de J.J. Fruin et K. Togawa.
Les perspectives en matires de validation concernent tout dabord lexploitation plus
pousse des donnes relles captures. Cette phase vient dtre aborde avec lextrac-
tion des ovales de Goffman dans diffrentes situations, mais un rebouclage avec le
modle reste faire. La validation des autres parties du modle dhumanode est aussi
prvue, notamment pour la planication de chemin. A cette occasion, une campagne
denqutes sur le terrain est sur le point dtre mene, dans la gare de Rennes. Cet
environnement rel sera ensuite simul, et les donnes recueillies serviront de base de
comparaison.
236
Conclusion et perspectives gnrales
Performances des modles
La dernire partie de ce document fut consacre ltude des performances dexcution
du modle dhumain virtuel. Les diffrents tages de la pyramide comportementale ont
ainsi t tests sur diffrents cas. Nous avons pu identier que les deux mcanismes les
plus coteux de ce modle taient la navigation ractive et la locomotion. Nanmoins,
nous avons vu que les temps dexcution restaient dans des limites acceptables pour
un logiciel de simulation. Nous avons aussi soulign la faible frquence de rafrachis-
sement des diffrents tages, se rapprochant plus dchelles relles que les modles
prsents dans la littrature.
Ces performances nous permettent denvisager des cadres dutilisation connexes pour
lhumain virtuel. On peut par exemple citer lanimation temps rel pour des chelles
moyennes de populations, ou encore les jeux vidos.
237
Annexes
239
Annexe A
Ordonnancement des
affordances
Nous avons abord dans la section 3.4.2, page 107, la gestion de la concurrence entre
plusieurs affordances actives de linteracteur. Cette gestion prend la forme dune excu-
tion itrative des pr-conditions rationnelles. Lordre dappel est quant lui dtermin
par un processus dordonnancement, en se basant sur les priorits des affordances.
Rappelons que le gestionnaire daffordance de linteracteur attribue deux priorits
chaque interaction :
Locale (P
L
). Cette priorit est choisie par lune des fonctionnalits de laffordance.
Hirarchique (P
H
). Cette priorit est calcule par le gestionnaire en se basant sur la
prcdente.
La priorit hirarchique doit donner plus dimportance aux affordances essentielles
pour linteracteur. Elle va donc tre plus forte pour les affordances permettant de faire
avancer un maximum de plans comportementaux, tout en tant vivement inuence par
le but nal de ce plan. La mthode de calcul employe est la suivante :
P
H
(crt) = max
aracines
P
L
(a) +0.1
_
P
L
(crt) +
bparentes
P
H
(b)
_
Une priorit hirarchiques est donc constitue de la valeur maximale de priorit locale
pour lensemble des racines de la hirarchie, incrmente par 10% de la somme des
priorits hirarchiques de toutes les parentes ainsi que de la priorit locale de laffor-
dance courante.
Dtaillons ce calcul sur un exemple (Figure A.1). Trois affordances sont explicitement
requises par linteracteur : A, B, et F. Laffordance A require lexcution des affor-
dances C, D, et E ; laffordance B require seulement lexcution de E ; laffordance
F est autonome. Lordonnancement doit ici permettre de dpartager les affordances
feuilles C, D, E, et F via leur priorit hirarchique :
P
H
(C) = P
L
(A)+0.1
_
P
L
(C)+1.1P
L
(A)
_
= 1.11P
L
(A) +0.1P
L
(C)
241
Ordonnancement des affordances
P
H
(D) = P
L
(A)+0.1
_
P
L
(D)+1.1P
L
(A)
_
= 1.11P
L
(A) +0.1P
L
(D)
P
H
(E) = max
_
P
L
(A),P
L
(B)
_
+0.1
_
P
L
(E)+1.1
_
P
L
(A)+P
L
(B)
_
= 1.11max
_
P
L
(A), P
L
(B)
_
+0.11min
_
P
L
(A), P
L
(B)
_
+0.1P
L
(E)
P
H
(F) = 1.1P
L
(F)
FIG. A.1: Exemple dexcution hirarchique daffordances : les affordances
racines sont indiques en gras (A,B,F), le lien hirarchique avec les
ches.
On voit donc que C et D ne sont dpartages que par 10% de leur priorit locale.
Concernant E, deux cas peuvent se produire :
Si A est plus prioritaire que B, E sera dpartage de C et D en se basant faiblement
sur leur priorit locale et sur la priorit de B.
Dans le cas contraire, la concurrence seffectuera fortement sur les priorits de A et
B, les priorits locales devant tre dix fois plus fortes que lcart pour jouer un rle.
Finalement, F est dpartage des autres feuilles en se basant fortement sur la valeur de
priorit locale de leur racine principale.
Cette mthode de calcul a les consquences suivantes :
Une affordance lle a forcment une priorit suprieure lensemble de ses parentes.
Deux affordances surs (lles dune mme affordance) ne sont dpartages que
par leur priorit locale, ou par des branches diffrentes du graphe comportemental
quelles unient.
Plus une affordance a de parentes (plus elle unie de branches comportementales),
plus sa priorit hirarchique est leve.
Plus une affordance est profonde dans la hirarchie, plus sa priorit hirarchique est
leve.
La priorit locale de la racine la plus importante de la hirarchie a un impact 10 fois
suprieur la priorit locale de laffordance value.
Une affordance uniquement racine ou racine/feuille a pour priorit hirarchique sa
priorit locale incrmente de 10%.
La priorit hirarchique, en plus de permettre lordonnancement des affordances dans
le gestionnaire de linteracteur, a un impact fort sur la slection daction par lhumain
virtuel. Cette slection est effectue par lun des trois modes de planication de che-
min (confre Section 5.3.2, page 148) : le choix dun couple affordance/effecteur. Ce
mode se base sur une quantication de chemin standard, laquelle est ajoute un fac-
teur directement dpendant de cette priorit. Ainsi, plus cette priorit sera leve, plus
lhumain virtuel sera enclin effectuer linteraction correspondante, mme si celle-ci
ncessite une priode dattente.
242
Annexe B
Smantique des automates
De nombreux automates sont utiliss dans le chapitre concernant lhumain virtuel
(Chapitre 5, page 135), notamment en ce ce qui concerne les tches cognitives (Sec-
tion 5.5, page 180). Nous allons prsenter ici leur mode de fonctionnement, avec la
smantique utilise pour les dcrire :
Automate courant, i.e. dcrit actuellement.
tat dans le sens standard des automates : chaque rafrachisse-
ment, si ltat a une transition valide il lemprunte, sinon ltat
est conserv.
Action excuter : lorsque lautomate transite dans une action,
celle ci est excute puis les transitions sortantes sont immdia-
tement values (au contraire dun tat qui attendra le prochain
rafrachissement).
tat particulier reprsentant lexcution dun sous-automate :
lentre dans cet tat provoque le lancement du sous-automate.
Lors du rafrachissement, les transitions de lautomate courant
sont toujours testes avant lexcution du sous-automate. Ce der-
nier nest arrt que lorsquun tat diffrent est atteint, et non
pas si une transition emprunte provoque la sortie puis le retour
immdiat dans ce sous-automate (aprs lexcution dune srie
dactions). Bien entendu, larrt de lautomate courant provoque
larrt dun ventuel sous-automate.
Transition conditionnelle : cette transition nest emprunte que
lorsque sa condition est valide.
243
Smantique des automates
Transition temporelle : cette transition conditionnelle spciali-
se est emprunte ds que le temps t sest coul depuis lentre
dans le dernier tat, et seulement si aucune transition condition-
nelle standard nest valide. Le compteur temporel nest pas r-
initialis lors de lexcution dune srie dactions se terminant
dans le mme tat que celui de dpart. Si plusieurs transitions
temporelles peuvent tre franchies, celle avec le temps de rf-
rence le plus important est choisie.
Transition inconditionnelle : cette transition est emprunte si au-
cune transition conditionnelle ou temporelle ne peut ltre.
Entre de lautomate : reprsente le point de dpart de lauto-
mate, lorsque celui-ci est dmarr.
Comme peut le laisser penser leur smantique, les automates utiliss ont un fonction-
nement hirarchique. Cette hirarchisation de la description a t choisie dans lunique
but de la simplier, en spcialisant au maximum chaque automate.
244
Annexe C
La tche cognitive interagir
Nous allons dtailler dans cette annexe la tche cognitive la plus complexe de notre
modle dhumain virtuel qui gre le droulement dune interaction. Le sujet trait ici est
donc relatif la section concernant les tches cognitives de lhumanode (Section 5.5.3,
page 183).
C.1 Principe
La tche cognitive interagir gre lensemble du processus permettant linteraction de
lhumanode virtuel avec un effecteur via une affordance. Elle ne prend en charge
quune seule affordance de lhumanode, mais peut tout de mme enchaner les in-
teractions par la slection automatique daffordances compatibles avec un effecteur en
cours dutilisation. Une telle interaction ncessite bien entendu lexcution de laffor-
dance, mais aussi la recherche pralable dun effecteur, le dplacement de lhumanode
au sein de lenvironnement an datteindre leffecteur, la gestion dune ventuelle le
dattente, etc. La complexit de cette tche est encore augmente par le fait que lhuma-
node peut avoir plusieurs besoins dinteraction simultans, via diffrentes affordances,
rendant cette tche multiple pour une seule entit et auto-concurrente.
An den simplier la description nous allons tout au long de cette annexe dcrire un
ensemble dautomates hirarchiques (Figure C.1), permettant de traiter chaque sous-
tche indpendamment lune de lautre. Comme nous le verrons ensuite, la concurrence
entre plusieurs de ces automates hirarchiques est intrinsquement gre grce des
tats tampons dattente et lutilisation de ressources.
C.2 Contrle haut niveau : dcision dinteraction
La premire tche se charge du contrle haut niveau de linteraction. Cet automate
interagir joue le rle dinhibiteur pour ltrer les affordances inactives (car mises en
pause), et se charge de terminer la tche lorsque laffordance nest plus requise par
lhumanode.
245
La tche cognitive interagir
FIG. C.1: Vue densemble des changements de modalit dinteraction.
FIG. C.2: Lautomate interagir dcide si linteraction est possible dans ltat
actuel de laffordance, et gre la terminaison de la tche actuelle.
Comme nous pouvons le voir gure C.2, lautomate interagir est relativement simple,
ne disposant que de 2 tats et dun sous-automate.
Son excution commence par le test de ltat de laffordance, qui est une action redon-
dante tant que lautomate est actif. Cette action a trois possibilits de transition.
Premirement, si laffordance nest plus requise par lhumanode, i.e. nexiste plus dans
le gestionnaire daffordances, lautomate prend n, ce qui a pour consquence de d-
truire la tche cognitive.
Deuximement, si laffordance est inactive, i.e. en pause dans le gestionnaire daffor-
dances, lautomate transite dans un tat passif dattente rationnelle.
Troisimement, si laffordance est active, le sous-automate en charge de choisir le type
dinteraction effectuer est dmarr.
C.3 Choix du type dinteraction : active ou ractive
Ce second automate, dmarr par lautomate interagir, a pour rle de choisir le type
dinteraction possible pour laffordance actuelle : active si laffordance a toute lat-
tention de lhumanode, ractive si une autre affordance est plus prioritaire pour lhu-
manode. Lorsque cet automate est excut, il est assur de disposer dune affordance
rationnellement valide.
246
Interaction active
FIG. C.3: Lautomate utilisation possible choisit le mode de recherche de
leffecteur, et se met en veille si les ressources sont puises ou si
aucun effecteur valide nest connu dans lenvironnement.
Comme nous pouvons le voir gure C.3, lautomate utilisation possible gre la concur-
rence ventuelle avec dautres tches cognitives interagir, via lutilisation de 2 res-
sources : les potentiels de navigation et dobservation de lhumanode.
Au dmarrage, lautomate essaye dutiliser la ressource de navigation 60% de son
potentiel maximal an de passer en recherche active, interdisant de se fait que 2 tches
interagir puissent tre en mode actif simultanment. Comme nous le verrons ensuite,
cest dessein que la ressource navigation nest pas utilise ici 100%.
En cas dchec, lautomate tente alors dutiliser la ressource dobservation 25% an
de passer en recherche ractive, autorisant ainsi 4 tches interagir passer dans ce
mode en mme temps quune cinquime, elle active.
Si la ressource observation est elle aussi occupe, lautomate transite dans un tat passif
dattente des ressources. Comme nous pouvons le constater, le test des ressources est
redondant pour les 3 tats prcdents (utilisation active, ractive, et attente), permettant
cette sous-tche de changer de mode chaque rafrachissement.
Une dernire transition, depuis la recherche active, gre lchec de la slection dun
effecteur pour laffordance courante. En effet, en mode recherche active, lhumanode
tente de planier un chemin dans lenvironnement vers un effecteur compatible avec
laffordance courante. Ce processus peut chouer pour diverses raisons (aucun effecteur
connu compatible, ou tous les effecteurs connus ont chous le test de pr-condition
locale de laffordance courante), faisant quitter le mode actif cet automate pour un
tat passif en attente dexploration. Cet tat tampon ne relance les tests des ressources
que dans le cas o une nouvelle zone est dcouverte dans lenvironnement (contenant
potentiellement un effecteur compatible), ou si un effecteur a t automatiquement s-
lectionn pour laffordance courante.
C.4 Interaction active
Nous allons dcrire ici lensemble des sous-automates rgissant le mode actif de lin-
teraction. Ce mode est caractris par son unicit parmi lensemble des tches interagir
247
La tche cognitive interagir
sexcutant simultanment. De plus, ce mode est forcment actif si au moins une tche
interagir a caractris sa possibilit dutilisation. Le principe de ce mode est daccor-
der les possibilits de planication de chemin ainsi que de navigation de lhumanode
laffordance courante.
C.4.1 Recherche active
La premire procdure du mode actif se charge de rechercher un effecteur compatible
avec laffordance courante. La russite aussi bien que lchec de cette recherche sont
grs par cet automate, qui se charge ensuite damener lhumanode dans une zone de
visibilit de leffecteur, puis de lancer la procdure dutilisation active.
FIG. C.4: Lautomate recherche active se charge de slectionner un effecteur
valide pour laffordance vise, puis de latteindre.
Comme nous pouvons le voir gure C.4, lautomate recherche active est sans doute
le plus complexe des automates hirarchiques de la tche interagir, et ce de par son
nombre de transitions.
Lautomate dbute par laction de planication vers laffordance. Cette action va lan-
cer une planication de chemin dans lenvironnement connu de lhumanode an de
slectionner un effecteur compatible avec laffordance courante. Comme nous lavons
vu prcdemment (conf. Chapitre 5.3.2, page 148), une telle planication de chemin
a comme condition darrt le fait datteindre un effecteur compatible avec lune des
affordances actives de plus haute priorit de lhumanode. Ainsi, deux cas peuvent se
produire :
La planication choisit un effecteur compatible avec laffordance courante, cest un
succs. A partir de ce point, un effecteur compatible est slectionn et exploitable
pour dautres actions.
La planication choue ou choisit un effecteur compatible avec une autre affordance
active, cest un chec. Dans ce cas cet automate se termine (tat Fin), et lautomate
parent utilisation possible passe en mode dattente exploratoire. Notons que dans
le cas ou un effecteur pour une autre affordance est slectionn, une tche cognitive
248
Interaction active
interagir correspondante est automatiquement cre.
La deuxime action de cet automate est de tester si leffecteur choisi est visible.
Si leffecteur nest pas encore visible, lautomate transite dans ltat permettant datteindre
leffecteur, qui se charge de piloter la navigation de lhumanode. Cet tat dispose dune
transition automatique lui permettant de tester nouveau la visibilit chaque rafra-
chissement, mais aussi dune transition temporelle qui va remettre en cause leffecteur
courant via une nouvelle planication toutes les 20 secondes.
Si leffecteur devient visible, lautomate dclare celui-ci lintention qua lhumanode
de lutiliser. Cette action tente dabonner lhumanode la liste dutilisateurs potentiels
de leffecteur pour laffordance courante. Dans le cas dun chec, par exemple si lef-
fecteur ne propose plus laffordance courante, lautomate retourne dans son action de
planication de dpart (qui ignorera leffecteur courant). Si cet automate est arrt, ou
si un autre effecteur est slectionn pour laffordance courante, lhumanode est auto-
matiquement dsabonn.
Une fois lhumanode abonn, la pr-condition locale de laffordance est teste pour
leffecteur courant. Dans le cas dun chec, lautomate retourne encore une fois dans
laction de planication de dpart.
En cas de succs, la ressource de navigation est totalement consomme et le sous-
automate dutilisation active est dmarr. Comme nous le verrons par la suite, la consom-
mation totale de la ressource de navigation assure le contrle total du mouvement de
lhumanode la tche en cours (cette ressource tant ncessaire en faible proportion
dans le mode ractif).
Une fois en mode dutilisation active, lautomate a 4 possibilits de transition. Pre-
mirement, si lutilisation de leffecteur courant est un chec, une nouvelle slection
deffecteur est lance. Deuximement, toutes les 20 secondes, une remise en cause
de leffecteur courant est faite via une planication. Si ce deuxime processus aboutit
au mode utilisation active avec le mme effecteur, le sous-automate nest pas red-
marr ; sinon il est arrt ou rinitialis. Troisimement, toutes les 2 secondes, la pr-
condition locale de laffordance est rvalue. Enn, la transition par dfaut se contente
de consommer la ressource de navigation.
C.4.2 Utilisation active
Lutilisation active est la deuxime tape du mode actif. Pour mmoire, lorsque cet
automate est dmarr, un effecteur valide pour laffordance courante est slectionn
et visible. Laffordance courante est quant elle forcment active pour lhumanode.
Enn, cette tche a le contrle total de la navigation de lhumanode. Cela va lui per-
mettre damener lhumanode la position dutilisation de leffecteur, aprs avoir gr
une ventuelle le dattente.
Comme nous pouvons le voir gure C.5, lautomate dutilisation active se charge de
placer lhumanode dans les conditions favorables lexcution de laffordance cou-
rante grce leffecteur slectionn.
Sa premire action consiste tester la disponibilit dune zone dutilisation. Si aucune
zone dutilisation nest disponible, car leffecteur ne propose plus laffordance ou parce
quil est actuellement occup vis--vis de laffordance courante, lautomate passe en
249
La tche cognitive interagir
FIG. C.5: Lautomate utilisation active se charge damener lhumanode jus-
qu la zone dutilisation de leffecteur. Il gre aussi le lancement
ventuel de la sous-tche grant la le dattente.
mode dattente active. Lentre dans ce mode a pour effet de dsabonner lhumanode
de la liste dintention de leffecteur (lintention devenant une attente effective). Une
seule transition depuis lattente active permet de tester nouveau la zone dutilisation,
dans le cas o lhumanode se trouve en position de premier attendant.
Si la zone dutilisation est disponible, la position dutilisation est alors value. Si cette
position est atteinte (confre Section 3.2.4, page 97, sur les zones dancrage), lauto-
mate peut alors passer en mode dutilisation.
Si la position dutilisation nest pas atteinte, lautomate transite alors vers ltat at-
teindre la zone qui va grer la navigation de lhumanode au sein de lenvironnement.
Cet tat recommence lensemble des tests prcdents chaque rafrachissement.
Concernant le mode dutilisation, deux points sont retenir. Premirement, tout comme
le mode dattente active, lentre dans ce mode dsabonne lhumanode de la liste din-
tention de leffecteur (lintention devenant une utilisation effective), mais en plus dsa-
bonne lhumanode dune ventuelle le dattente. Deuximement, une transition per-
met lautomate de vrier que la position dutilisation reste atteinte pour ce mode.
Ainsi, si pour une raison ou une autre lhumanode vient quitter la zone dutilisation
(dplacement fortuit de leffecteur, ou mme de lhumanode), celui-ci cherchera lat-
teindre de nouveau tout en restant abonn comme utilisateur.
Pour nir, notons que larrt de lautomate dutilisation active provoque le dsabonne-
ment automatique et immdiat une ventuelle le dattente et/ou dutilisation.
C.4.3 Attente active
Ce troisime, et dernier, automate du mode actif de linteraction gre le positionnement
dans la le dattente de lhumanode. De plus, il a la possibilit dinvalider leffecteur
courant si son utilisation est impossible. Une fois dmarr, et si leffecteur nest pas
invalid, cet automate a une excution innie, et ne sera interrompu que par la transition
de lautomate parent dutilisation active.
La premire action de cet automate consiste tester la disponibilit dune zone dat-
tente. La zone dattente est communique par leffecteur slectionn relativement
laffordance courante. Si leffecteur ne propose plus laffordance, ou si laffordance ne
250
Interaction active
FIG. C.6: Lautomate attente active gre le positionnement de lhumanode
dans la le dattente. Cet automate peut dcider que leffecteur est
inutilisable.
supporte pas lattente, cette action est un chec et elle transite dans ltat invalidant
leffecteur.
Dans le cas o une zone dattente est disponible, lautomate teste si la position dattente
est atteinte. La position dattente correspond (voir Chapitre 3.2.5, page 98) :
Lancre de premire attente si la le dattente est vide, ou si lhumanode est le
premier attendant, ou encore si la le dattente est de type plus proche.
Une zone dancrage ponctuelle derrire lattendant prcdant dans tous les autres
cas.
Si la position dattente nest pas atteinte, lautomate transite dans un tat se chargeant
de piloter la navigation de lhumanode an datteindre la zone dattente. Cet tat re-
commencera alors les tests depuis la premire action chaque rafrachissement.
Si la position dattente est atteinte, une action se charge de signaler lhumanode la
le dattente. Ce signalement va abonner lhumanode comme attendant, si ce nest pas
dj fait, ou alors simplement sassurer que lhumanode est toujours abonn. En effet,
leffecteur peut de lui-mme dsabonner ses attendant (par exemple sil est dsactiv),
et cette action permet de prendre ce fait en considration. Dans le cas dun chec, cette
action transite alors dans ltat invalidant leffecteur.
Dans le cas dun succs, lautomate transite alors dans un tat passif o lhumanode
se contente de patienter.
Pour nir, notons que ni larrt ni aucune transition de cet automate ne se charge du
dsabonnement de lhumanode la le dattente :
Si lautomate transite dans ltat invalidant leffecteur, alors lhumanode nest pas
(ou plus) abonn une le dattente.
Si cet automate est arrt par son parent (utilisation active), cest que lhumanode
est premier attendant et cherche utiliser leffecteur. Dans ce cas, il doit rester atten-
dant tant quil nest pas utilisateur an dempcher les autres attendants de transiter
de la mme faon. Cest ensuite lautomate utiliser qui dsabonnera automatique-
ment lhumanode de la le dattente.
Si cet automate est interrompu un plus haut niveau, cest son parent (utilisation
active) qui se charge du dsabonnement.
251
La tche cognitive interagir
C.5 Interaction ractive
Traitons maintenant le deuxime mode dinteraction de lhumanode : linteraction r-
active. Ce mode est utilis par les quatre tches cognitives dinteraction de priorit
directement infrieure la tche en mode actif. Ainsi, ce mode est forcment repr-
sent si au moins deux tches interagir ont caractris leur possibilit dutilisation.
Son but est de permettre des interactions opportunistes en surveillant lenvironnement
visuel immdiat de lhumanode : si un effecteur compatible avec laffordance courante
est repr, ce mode va tenter de lutiliser en passant. Ainsi, linteraction ractive na
quun contrle trs limit sur la navigation de lhumanode au sein de lenvironnement,
se contentant tout au plus de linuencer, et ne pilote en aucun cas la planication de
chemin.
C.5.1 Recherche ractive
La premire procdure du mode ractif se charge de la recherche visuelle dun effec-
teur compatible avec laffordance courante. La russite aussi bien que lchec de cette
recherche sont grs par cet automate, qui se charge ventuellement de lancer lutilisa-
tion ractive.
FIG. C.7: Lautomate recherche ractive soccupe de rechercher visuelle-
ment un effecteur valide pour laffordance vise dans lenviron-
nement de lhumanode.
Mme sil nest pas aussi complexe que la recherche active, lautomate de recherche
ractive (Figure C.7) dispose tout de mme dun nombre important de transitions.
Sa premire action consiste slectionner un effecteur visible compatible avec laffor-
dance. Cette action accde au donnes smantiques produites par la procdure dobser-
vation (Section 5.2.1, page 138), et y recherche un effecteur compatible. Dans le cas
o plusieurs effecteurs compatibles sont prsents, celui dont la zone dutilisation est la
plus proche est retenu. Si la recherche est un chec, laction transite dans un tat passif
252
Interaction ractive
dattente de visibilit qui recommencera le test lors du prochain rafrachissement.
Si un effecteur est slectionn, lautomate tente alors de lui dclarer son intention, de la
mme faon que pour une recherche active. Si la dclaration dintention choue, lef-
fecteur est invalid et le processus recommence.
Une fois lintention dclare, la pr-condition locale de laffordance est teste vis--vis
de leffecteur courant. Ici encore, un chec provoque linvalidation de leffecteur et le
recommencement du processus.
Si la pr-condition locale est valide, lautomate passe alors en mode dutilisation rac-
tive en dmarrant le sous-automate correspondant. Cet tat va remettre en cause lef-
fecteur courant toutes les 2 secondes, en relanant une slection par visibilit. Dans le
cas o cette slection aboutit au mode dutilisation ractive avec le mme effecteur,
le sous-automate correspondant nest pas redmarr ; sinon il est stopp ou rinitialis.
Notons que la slection par visibilit est aussi relance dans le cas ou le sous-automate
dutilisation ractive choue pour leffecteur slectionn. Lautre transition possible
depuis cet tat se contente dassurer que leffecteur reste visible, et redmarre le pro-
cessus dans le cas contraire.
Un point important est noter quant linvalidation des effecteurs. Ceux-ci sont bien
entendu ignors lors dune nouvelle slection par visibilit, mais seulement durant une
seconde (le rafrachissement courant de lautomate). En effet, une slection ultrieure,
mais temporellement proche, pourra slectionner nouveau cet effecteur dont les pro-
prits auront potentiellement changes : russite de la pr-condition locale, ou encore,
comme nous le verrons ensuite, libration de la zone dutilisation. Dautre part, on
peut remarquer ici que, contrairement au mode recherche active, cet automate ne r-
serve aucune ressource supplmentaire. En effet, le fait de cibler un effecteur nest pas
considr ici comme une action rchie de lhumanode, mais plus comme une ac-
tion automatique, rexe. Comme nous allons le voir ci aprs, lutilisation ractive va
ncessiter quant elle une participation plus consciente de lhumanode.
C.5.2 Utilisation ractive
Lutilisation ractive est la deuxime et dernire tape du mode ractif. Pour mmoire,
lorsque cet automate est dmarr, un effecteur valide pour laffordance courante est
slectionn et visible. Laffordance courante est quant elle forcment active pour
lhumanode. Cette tche va se charger de dclencher lutilisation de leffecteur racti-
vement lentre de lhumanode dans la zone dutilisation. Mme si elle ne peut pas
contrler directement le mouvement de lhumanode, nous allons voir que cette tche
va tout de mme tre capable de linuencer. Bien entendu, cet automate interdit toute
participation une le dattente.
La premire action de lutilisation ractive (Figure C.8) consiste tester la disponibi-
lit de la zone dutilisation. Une zone dutilisation nest disponible que si une position
dutilisation est libre, et si leffecteur na aucun attendant pour laffordance courante.
Si aucune zone dutilisation nest disponible, leffecteur est invalid. On peut donc ici
noter que les zones dutilisation utilisateurs multiple seront beaucoup plus propices
une utilisation ractive.
Dans le cas o une zone dutilisation est libre, laction suivante tente de consommer
253
La tche cognitive interagir
FIG. C.8: Lautomate utilisation ractive inuence la navigation de lhuma-
node an de lamener dans la zone dutilisation de leffecteur (si
celle-ci est disponible).
40% de la ressource de navigation, correspondant au taux laiss libre par une autre
tche cognitive dinteraction en mode actif. En cas de succs, une action est lance qui
va inuencer la navigation de lhumanode en considrant la zone dutilisation comme
attractive. En effet, elle introduit un cot ngatif dans la caractrisation de lenvironne-
ment immdiat de lhumanode (confre Section 5.4, page 160), proportionnellement
au ratio de priorits entre laffordance courante et laffordance en mode dinteraction
active. Ainsi, lhumanode va prfrer emprunter cette zone lors de sa navigation, le
poussant mme ralentir sil sy trouve dj.
Laction suivante teste si la position dutilisation est atteinte. Si cest le cas, le sous-
automate utiliser est dmarr, et les tests reprendront partir de la consommation de
ressource lors du prochain rafrachissement. Dans le cas contraire, laction transite dans
un tat passif qui recommence lensemble des tests.
C.6 Utiliser leffecteur
Lutilisation de leffecteur est la dernire tche de linteraction. Quelle soit dmar-
re par le mode actif ou le mode ractif, cette tche dispose dune affordance active
excuter, ainsi que dun effecteur compatible, visible, et dont la zone dutilisation
est atteinte et disponible pour lhumanode. Cette tche va ainsi se contenter deffec-
tuer linteraction proprement parler, mais va aussi tre capable denchaner des in-
teractions compatibles avec leffecteur courant. Notons nanmoins que cette tche est
interruptible tout instant par la transition de lun de ses automates parents.
La premire action de lautomate utiliser (Figure C.9) consiste inscrire lhumanode
comme utilisateur. Cette inscription a pour effet immdiat de dsabonner lhumanode
dune ventuelle le dattente ou liste dintention. Si cette inscription choue, car lef-
fecteur ne propose plus laffordance par exemple, laction transite dans un tat invali-
dant leffecteur courant.
Une fois lutilisateur inscrit, linscription restant valide jusqu larrt de cet automate,
254
Synthse et conclusion
FIG. C.9: Lautomate utiliser excute laffordance vise. Ensuite, il est ca-
pable de slectionner une nouvelle affordance active compatible
avec la zone dutilisation de leffecteur courant.
une action value le temps dutilisation T
u
pour laffordance. Cette valuation se fait
par une requte directe et unique la procdure associe de laffordance (confre Sec-
tion 3.3.3, page 103). Si le temps dutilisation T
u
est nul, laction transite immdiate-
ment vers laction appliquant laffordance.
Dans le cas contraire, ltat dutilisation en cours est atteint. Cet tat appelle la proc-
dure de contrle durant linteraction de laffordance chaque rafrachissement.
Une fois le temps dutilisation T
u
coul, laction appliquant laffordance est excute
qui se contente dappeler la procdure de contrle en n dinteraction de laffordance.
La dernire action de cet automate tente de slectionner une nouvelle affordance com-
patible avec la zone dutilisation courante, et donc leffecteur courant. Cette action de
recyclage permet lhumanode denchaner des interactions avec un effecteur, sans
avoir recommencer lensemble du processus. Ainsi, les affordances valides du ges-
tionnaire de lhumanode sont consultes, dans lordre des priorits dcroissantes, et
leur pr-condition locale est value. Si celle-ci russie, cest que leffecteur courant
est valide pour cette affordance, qui remplace alors laffordance courante de cette tche
cognitive dinteraction. Ainsi, si une affordance compatible est trouve, le processus re-
commence partir de lvaluation du temps dinteraction.
Si aucune autre affordance nest compatible, alors linteraction avec cet effecteur est
termine et lautomate prend n.
C.7 Synthse et conclusion
Nous avons dtaill dans cette annexe la tche cognitive dinteraction de lhumanode.
Cette tche prend en charge lexcution complte dune affordance de lhumanode,
et permet aussi bien une interaction aiguille, contrlant la circulation de lhumain
virtuel, quopportuniste, reprant des possibilits dutilisation la vole.
Laspect le plus important de cette tche est sa gestion de la concurrence quant au
contrle de lhumanode. Cette gestion seffectue en interne, grce lutilisation suc-
255
La tche cognitive interagir
cessive de deux ressources par les tches dinteraction sexcutant itrativement. On
peut ainsi voir sur la table C.1 deux congurations possibles pour six tches dinterac-
tion en cours dexcution. Dans la conguration 1 lhumanode est en train dattendre
pour utiliser leffecteur de laffordance A, tout en effectuant linteraction C. Ce cas
pourrait correspondre une personne faisant la queue devant un guichet de vente, tout
en consultant un panneau dafchage visible depuis sa position courante. La congura-
tion 2 est plus complexe, dmontrant quelques cas dchec des automates. Ici, la tche
A na pu trouver deffecteur compatible, librant ainsi les ressources pour la tche B qui
dirige lhumanode vers un effecteur utilisable. La tche C est pour le moment en at-
tente de ractivation rationnelle de son affordance, tandis que les trois tches suivantes
recherchent visuellement un effecteur compatible.
Congurations : 1 2
Tche A Attente active Attente exploratoire
Tche B Recherche ractive Recherche active
Tche C Utilisation ractive Attente dactivation
Tche D Recherche ractive Recherche ractive
Tche E Recherche ractive Recherche ractive
Tche F Attente ressources Recherche ractive
Ressources consommes :
navigation / observation
100% / 100% 60% / 75%
TAB. C.1: Deux exemples de concurrence entre tches dinteraction. Les
tches sont listes par ordre de priorit dcroissante, et leur tat
est donn pour chaque conguration. La consommation totale des
ressources est indique.
Pour conclure, on peut remarquer que ce principe permet de grer un large panel de
comportements dinteraction. La gestion totalement abstraite des affordances en fait
un systme gnrique, supportant lintroduction de nouvelles interactions sans aucune
modication. De plus, des cas particuliers de concurrence vis--vis dautres ressources
peuvent tre grs directement par les affordances, en provoquant un chec de lune de
leurs pr-conditions (rationnelle ou locale). En effet, comme la tche cognitive din-
teraction se base sur ces pr-conditions pour valuer ses possibilits de droulement,
la modication de ces pr-condition aura un impact direct sur les modalits dinter-
action atteignables. Ainsi, il est possible de spcialiser cette gestion de linteraction a
posteriori, sans avoir en modier le mcanisme gnral.
256
Annexe D
Simulation dune gare virtuelle
Nous allons dtailler dans cette annexe la procdure comportementale dun voyageur
au dpart dans une gare. Nous commencerons par traiter, dans la section D.1, les spcia-
lisations dobjets interactifs ncessaires. Nous continuerons, dans la section D.2, avec
une description illustre du processus comportemental obtenu lors de la simulation.
D.1 Dnition des objets de simulation
La simulation dun voyageur au dpart ncessite la spcialisation des concepts intro-
duits par BIIO (confre Chapitre 3, page 91). Les objets spcialiser sont (confre
Section 6.2, page 201) :
quipements : composteur de tickets ; tableau des dparts ; automate de vente de ti-
ckets de trains.
Usager : voyageur standard.
Accs : accs rue ; accs aux quais.
Ressources : destination ; ticket de train.
Affordances : prendre le train ; sortir de la gare ; acheter un ticket ; changer un ticket ;
composter son ticket ; lire le tableau des dparts.
Nous ne nous attarderons pas sur les trois premires catgories, dont la spcialisation
est triviale, pour nous concentrer sur les ressources et les affordances.
D.1.1 Les ressources
Les deux ressources mentionnes, la destination et le ticket de train, sont des spciali-
sations directes de la ressource brute de BIIO (Figure D.1). En effet, lhumain virtuel
na pas besoin de partager celles-ci entre diffrents processus comportementaux, mais
seulement de sen servir comme mmoire temporaire (pour la destination) ou comme
symbolisation dun objet possd (pour le ticket).
Pour spcialiser ces ressources nous leur ajoutons seulement des attributs, aucune fonc-
tionnalit supplmentaire ntant ncessaire. Dcrivons leurs nouveaux constituants :
257
Simulation dune gare virtuelle
FIG. D.1: Ressources du voyageur au dpart.
Destination. Deux catgories de destinations sont reprsentes par cette ressource :
Accs : Cet attribut est une rfrence un objet interactif de type accs (vers
la rue ou les quais). Il correspond la destination locale du voyageur au
dpart, et donc la voie o il doit prendre son train. Cet attribut peut aussi
reprsenter une porte de sortie de la gare dans le cas des voyageurs lar-
rive. Sa valeur initiale est vide pour le voyageur au dpart.
Nom de la destination : Cet attribut est un champ textuel reprsentant
la ville de destination dun voyageur au dpart. Cet attribut est vide pour
un voyageur larrive.
Ticket de train. Le ticket de train comporte les mmes informations quun ticket rel :
Compost : Cet attribut boolen dnit ltat correspondant du ticket. Sa va-
leur initiale est faux.
Horaire : Cet attribut correspond la date de dpart du train. Sa valeur initiale
est affecte par les donnes dexploitation de la gare.
Destination : Cet attribut est un champ textuel correspondant la ville de
destination du train. Sa valeur initiale correspond celle de la ressource
prcdente.
Identifiant du train : Cet attribut est un entier identiant de manire
unique le train. Sa valeur initiale est obtenue dans les donnes dexploita-
tion.
D.1.2 Les affordances
Les affordances des voyageurs vont produire leur procdure comportementale globale.
La procdure du voyageur au dpart est la plus complexe, ncessitant un certain nombre
dinteractions avant son aboutissement.
Nous ne dcrirons que les spcialisations de la pr-condition rationnelle et du contrle
en n dinteraction pour ces affordances, les autres fonctionnalits tant triviales. Rap-
pelons que la pr-condition rationnelle permet lexcution hirarchique des affordances,
et donc lmergence dun plan comportemental. La gure D.2 illustre ce plan compor-
temental pour le voyageur au dpart, en indiquant les liens de dpendance entre les
diffrentes tches.
tudions chacune de ces affordances. Les spcialisations des fonctionnalits seront
donnes sous forme dalgorithmes utilisant du pseudo-code. La gestion des priorits
des affordances ne sera pas explicit pour des questions de lisibilit. Le facteur tempo-
rel dans la prise de dcision (comme ne pas composter son ticket si le dpart du train
258
Dnition des objets de simulation
FIG. D.2: Procdure comportementale du voyageur au dpart.
est imminent) est omis pour les mmes raisons. Enn, larrt ventuel des affordances
lles si elles ne sont plus ncessaires est aussi absent des algorithmes pour ne pas les
surcharger. Les procdures suivantes sont considres comme dnies :
o.a renvoie lattribut a de lobjet interactif o.
RESSOURCE(I, "n") renvoie la ressource de linteracteur I nomme n.
AJOUTER(I, R) ajoute la ressource R linteracteur I.
RETIRER(I, R) retire la ressource R de linteracteur I.
LANCER(I, a) lance laffordance racine a pour linteracteur I.
LANCERFILLE( f ) lance laffordance lle f pour laffordance courante.
SUPPRIMER(I) supprime linteracteur I de la simulation.
HEURECOURANTE renvoie le temps simul courant.
CRERTICKET(d) cre une ressource ticket de train conforme la destination d.
Cette procdure peut ne rien renvoyer si les donnes dexploitation ne disposent
daucun train en partance conforme. Si un ticket est cr, il est entirement congur
et non compost.
VOIE(t) renvoie lobjet interactif reprsentant la voie daccs pour le train t comme
indiqu dans les donnes dexploitation.
Prendre le train. Cette affordance est le but nal du voyageur au dpart, et lui est
donc assigne au dpart de la simulation. Elle va sassurer que les conditions favorables
la prise dun train sont runies (Algorithme 4).
Sortir de la gare. Cette affordance est le but nal du voyageur larrive, et un but
secondaire du voyageur au dpart sil est dans limpossibilit de prendre son train. Elle
na aucune pr-condition rationnelle, et son contrle en n dinteraction se contente de
supprimer linteracteur.
Acheter un ticket. Cette affordance gre lachat dun ticket de train et est capable de
commander la sortie de la gare si plus aucun train ne part pour la destination souhaite
(Algorithme 5).
changer un ticket. Cette affordance gre lchange dun ticket de train et est ca-
pable de commander la sortie de la gare si plus aucun train ne part pour la destination
259
Simulation dune gare virtuelle
souhaite (Algorithme 6).
Composter son ticket. Cette affordance se contente de modier ltat courant du
ticket (Algorithme 7).
Lire le tableau des dparts. Cette affordance permet un voyageur quip dun
ticket de trouver la voie daccs son train (Algorithme 8).
On peut constater dans les diffrents algorithmes que la prise de dcision est locale
dans les affordances. Ainsi, une pr-condition rationnelle ne valide le processus com-
portemental que pour laffordance courante, laissant les ventuelles affordances lles
rsoudre leurs propres pr-conditions. Cet aspect conforte lvolutivit mise en avant
avec BIIO, en facilitant lajout dun comportement dinteraction au sein dune proc-
dure comportementale dj dnie.
Algorithme 4 Laffordance prendre le train
Pr-condition rationnelle(Voyageur) :
dest RESSOURCE(Voyageur, "Destination")
SI dest = aucune dest.nom = "" ALORS
LANCER(Voyageur, sortir de la gare)
RENVOYER faux
FINSI
ticket RESSOURCE(Voyageur, "Ticket de train")
SI ticket = aucun ALORS
LANCERFILLE(acheter un ticket)
RENVOYER faux
FINSI
SI ticket.destination != dest.nom ticket.horaire < HEURECOURANTE ALORS
LANCERFILLE(changer un ticket)
RENVOYER faux
FINSI
valide vrai
SI dest.accs = aucun ALORS
LANCERFILLE(lire le tableau des dparts)
valide faux
FINSI
SI ticket.compost = faux ALORS
LANCERFILLE(composter son ticket)
valide faux
FINSI
RENVOYER valide
Fin dinteraction(Voyageur,Voie de train) :
SUPPRIMER(Voyageur)
260
Dnition des objets de simulation
Algorithme 5 Laffordance acheter un ticket
Pr-condition rationnelle(Voyageur) :
dest RESSOURCE(Voyageur, "Destination")
SI dest = aucune dest.nom = "" ALORS
RENVOYER faux
FINSI
ticket RESSOURCE(Voyageur, "Ticket de train")
SI ticket = aucun ALORS
RENVOYER faux
FINSI
RENVOYER vrai
Fin dinteraction(Voyageur,Automate de vente) :
dest RESSOURCE(Voyageur, "Destination")
ticket CRERTICKET(dest)
SI ticket = aucun ALORS
LANCER(Voyageur, sortir de la gare)
SINON
AJOUTER(Voyageur, ticket)
FINSI
Algorithme 6 Laffordance changer un ticket
Pr-condition rationnelle(Voyageur) :
dest RESSOURCE(Voyageur, "Destination")
SI dest = aucune dest.nom = "" ALORS
RENVOYER faux
FINSI
ticket RESSOURCE(Voyageur, "Ticket de train")
SI ticket = aucun ALORS
RENVOYER faux
FINSI
RENVOYER vrai
Fin dinteraction(Voyageur,Automate de vente) :
ticket RESSOURCE(Voyageur, "Ticket de train")
RETIRER(Voyageur, ticket)
dest RESSOURCE(Voyageur, "Destination")
ticket CRERTICKET(dest)
SI ticket = aucun ALORS
LANCER(Voyageur, sortir de la gare)
SINON
AJOUTER(Voyageur, ticket)
FINSI
261
Simulation dune gare virtuelle
Algorithme 7 Laffordance composter son ticket
Pr-condition rationnelle(Voyageur) :
ticket RESSOURCE(Voyageur, "Ticket de train")
SI ticket = aucun ticket.compost = vrai ALORS
RENVOYER faux
FINSI
RENVOYER vrai
Fin dinteraction(Voyageur,Composteur) :
ticket RESSOURCE(Voyageur, "Ticket de train")
ticket.compost vrai
Algorithme 8 Laffordance lire le tableau des dparts
Pr-condition rationnelle(Voyageur) :
ticket RESSOURCE(Voyageur, "Ticket de train")
SI ticket = aucun ticket.compost = vrai ALORS
RENVOYER faux
FINSI
RENVOYER vrai
Fin dinteraction(Voyageur,Tableau des dparts) :
ticket RESSOURCE(Voyageur, "Ticket de train")
dest RESSOURCE(Voyageur, "Destination")
dest.accs = VOIE(ticket.IDtrain)
D.2 Simulation complte du voyageur au dpart
Maintenant que nous avons dni les composants BIIO ncessaires la simulation dun
voyageur au dpart, illustrons le droulement de sa procdure comportementale. Pour
se faire, nous allons suivre un voyageur unique de la gare tout au long des interactions
quil va effectuer.
Le voyageur au dpart entre dans la gare avec une destination (prsente dans ses res-
sources), mais pas de ticket. Son comportement assign est prendre le train. Cette
affordance, dtectant labsence de ticket, lance laffordance lle acheter un ticket. Ces
deux affordances sont automatiquement reprsentes sous la forme de tches cognitives
dinteraction, et le voyageur se dirige vers lautomate de vente le plus accessible.
262
Simulation complte du voyageur au dpart
Le voyageur a ni dacheter son ticket. Ce dernier est maintenant disponible sous forme
de ressource. La pr-condition rationnelle de laffordance prendre le train ajoute main-
tenant les interactions composter son ticket et lire le tableau des dparts. Cest la tche
cognitive reprsentant cette dernire qui est la plus prioritaire, le voyageur se dirige
donc vers le moniteur le plus accessible.
Le voyageur est dans la zone dutilisation du
moniteur des dparts et commence le regar-
der.
Le voyageur a ni dutiliser le moniteur.
Grce cette interaction il a pu dterminer
que son train partirait voie 1 (information sto-
cke dans la ressource destination). La tche
dinteraction composter le ticket est mainte-
nant la prochaine tape.
263
Simulation dune gare virtuelle
Le voyageur a atteint le composteur choisi.
Sa tche cognitive dinteraction dcide donc
de commencer linteraction.
Nous en dcidons autrement et mettons en
panne le composteur utilis.
La pr-condition locale de laffordance com-
poster le ticket invalide donc leffecteur cou-
rant, et la tche cognitive se charge de plani-
er un chemin vers un autre composteur va-
lide. Il y en a un juste ct et le voyageur
sy rend.
Lutilisation du composteur sest droule
sans encombre, le ticket tant dsormais
compost. Laffordance prendre le train est
maintenant valide dun point de vue ration-
nel. Le voyageur se rend donc la voie de
dpart de son train pour effectuer sa dernire
interaction.
264
Annexe E
Exprimentations impliquant
des foules
Cette annexe prsente les exprimentations de captures de mouvements impliquant des
foules. Celles-ci ont t conduites dans le cadre dun processus de validation du modle
de navigation ractive (confre Section 7.1.2, page 218). Les donnes produites ont t
exploites de deux faons.
Premirement, elles ont t analyses quantitativement lors du stage de Master de
Loc Letreust [76], sous la direction de Julien Pettr. Ce stage visait caractriser
les ovales de Goffman depuis les diffrentes situations captures. Deux ovales ont t
produits pour chaque situation, correspondant lun aux entits dont la vitesse est inf-
rieure la moyenne de la squence, et lautre suprieure (un mme participant pouvant
appartenir successivement ces deux catgories, suivant ses adaptations). Ces ovales
sont reprsents dans la partie droite de la gure E.1, respectivement en bleu et vert.
Ces donnes ayant t acquises rcemment, le rebouclage sur le modle de navigation
na pas encore t fait, mais est prvu pour un avenir proche.
Deuximement, les donnes ont t analyses qualitativement an dextraire les orga-
nisations spatiales mergeant dans diffrentes situations. Cette tude purement visuelle
a permis de conrmer les observations que lon trouve dans la littrature, et den pr-
ciser de nouvelles. Ces observations sont indiques en lgende de chaque situation sur
la gure E.1. Nous avons pu constater que notre modle de navigation ractive repro-
duisait ces phnomnes mergeant, attestant ainsi de sa validit macroscopique.
Nous avons pu remarquer, aprs une srie de comparaisons rel / simul, quun pro-
cessus complmentaire plus rationnel serait ncessaire dans certains cas. Par exemple,
la diminution automatique de la vitesse en arrivant un croisement sans visibilit (Fi-
gure E.1(g)) ne peut tre reproduit par un mcanisme purement ractif. En effet, ce
cas ncessite une prise de conscience du risque potentiel, sans que celui-ci ne soit in-
carn dans lenvironnement. Ce mcanisme pourrait tre simul par lajout dune tche
cognitive notre modle dhumain virtuel, analysant la topologie environnante pour
introduire des obstacles dynamiques ctifs dans le module de navigation.
Exprimentations impliquant des foules
Conditions Ovales de Goffman
(a) Couloir avec circulation sens unique.
Mise en vidence de loccupation maximale de lespace.
(b) Couloir avec circulations contre-sens et ux quilibrs.
Mise en vidence de la formation de les.
FIG. E.1: suite sur la page suivante.
266
Conditions Ovales de Goffman
(c) Couloir avec circulation contre-sens, lun des ux tant moins important.
Mise en vidence du rapport existant entre la largeur des les et la
dimension des ux qui les composent.
(d) Croisement sans ux oppos.
Mise en vidence dune rduction de la vitesse permettant la diminution du
nombre de collisions potentielles imminentes.
FIG. E.1: suite sur la page suivante.
267
Exprimentations impliquant des foules
Conditions Ovales de Goffman
(e) Croisement avec ux opposs.
Mise en vidence de la formation de paquets dindividus traversants la zone
de collisions potentielles.
(f) Croisement avec ux multiples.
Mise en vidence de changements de direction anticips an de limiter les
interactions dans les zones encombres.
FIG. E.1: suite sur la page suivante.
268
Conditions Ovales de Goffman
(g) Croisement avec occultation visuelle.
Mise en vidence dun ralentissement automatique et dune adaptation
brusque en absence dinformation visuelle.
FIG. E.1: Expriences impliquant des foules dindividus. Chaque situation
est illustre gauche, et les ovales de Goffman dduits sont indi-
ques droite. Les informations qualitatives mises en vidence par
ltude des squences sont indiques sous chaque situation.
269
Bibliographie
[1] T. Abaci, J. Ciger, et D. Thalmann. Planning with smart objects. Dans Interna-
tional Conferences in Central Europe on Computer Graphics, Visualization and
Computer Vision, janvier 2006. 2.3.2
[2] Tolga Abaci, Jan Ciger, et Daniel Thalmann. Speculative planning with de-
legation. Dans CW 04 : Proceedings of the 2004 International Conference
on Cyberworlds (CW04), pages 100106, Washington, DC, USA, 2004. IEEE
Computer Society. 2.3.2
[3] Herv Abdi. A neural network primer. Journal of Biological Systems, 2(3) :247
283, 1994. 2.2.1
[4] W. Ali et B. Moulin. 2d-3d multiagent geosimulation with knowledge-based
agents of customers shopping behavior in a shopping mall. Dans COSIT 2005,
dit par A.G. Kohn et D.M. Mark, volume 3693 de LNCS, pages 445458.
Springer-Verlag, 2005. 2.4.4
[5] Rasmus Andersen, Jean Louis Berrou, et Alex Gerodimos. On some limita-
tions of grid-based (ca) pedestrian simulation models. Dans First International
Workshop on Crowd Simulation (V-Crowds05). VRlab, EPFL, 2005. 1.5.2
[6] J. Archea. The evacuation of non-ambulatory patients from hospital and nursing
home res : Aframework for a model. Technical report, novembre 1979. NBSIR
79-1906. 1.3.2
[7] O. Arikan, S. Chenney, et D. A. Forsyth. Efcient multi-agent path planning.
Dans Computer Animation and Simulation 01, pages 151162. Springer-Verlag,
2001. 1.5.2
[8] Richard C. Atkinson et Richard M. Shiffrin. The Psychology of Learning and
Motivation : Advances in Research and Theory, volume 2, chapter Human me-
mory : A proposed system and its control processes, pages 89195. Academic
Press, 1968. 2.1.2
[9] Mir Azimzadeh et Bjrn Klarqvist. Phenomenal space : attitudes and methods.
Dans Space Syntax, 4th International Symposium, University College of Lon-
don, 2003. 1.1.2
[10] Marwan Badawi. Synoptic objects describing generic interaction processes to
autonomous agents in an informed virtual environment. Thse de Doctorat,
INSA de Rennes, dcembre 2006. 2.3.3
[11] Marwan Badawi et Stphane Donikian. Autonomous agents interacting with
their virtual environment through synoptic objects. Dans Computer Animation
and Social Agents, 2004. 2.3.3, 5.7
271
Bibliographie
[12] N.I. Badler, R. Bindiganavale, J. Allbeck, W. Schuler, L. Zhao, S.J. Lee, H. Shin,
et M. Palmer. Parameterized action representation and natural language instruc-
tions for dynamic behavior modication of embodied agents. Dans AAAI Spring
Symposium, 2000. 2.3.1
[13] Norman I. Badler, Rama Bindiganavale, Jan Allbeck, William Schuler, Liwei
Zhao, et Martha Palmer. Parameterized action representation for virtual human
agents. Embodied conversational agents, pages 256284, 2000. 2.3.1
[14] Norman I. Badler, Barry D. Reich, et Bonnie L. Webber. Towards personalities
for animated agents with reactive and planning behaviors. Dans Creating Per-
sonalities for Synthetic Actors, Towards Autonomous Personality Agents, pages
4357, London, UK, 1997. Springer-Verlag. 2.2.1, 2.3.1
[15] Bram Bakker. The adaptative behavior approach to psychology. Dans Cognitive
Processing, volume 1, pages 3970, 2000. 2.1
[16] J. Barraquand et J.-C. Latombe. Robot motion planning : a distributed repre-
sentation approach. Internation Journal of Robotics Research, 10(6) :628649,
1991. 1.5.3
[17] Jean Louis Berrou, Jonathan Beecham, Philippe Quaglia, Marios A. Kagarlis, et
Alex Gerodimos. Pedestrian and Evacuation Dynamics, chapter Calibration and
validation of the Legion simulation model using empirical data, pages 167181.
Springer Berlin Heidelberg, 2005. 1.6.1, 1.6.2
[18] Alain Bertoz. La dcision. 2003. 2.1.2
[19] A. L. Blum et M. L. Furst. Fast planning through planning graph analysis.
Articial Intelligence, 90(1/2) :281300, Fvrier 1997. 2.2.2
[20] B. M. Blumberg. Olds Tricks, New Dogs : Ethology and Interactive Creatures.
Thse de Doctorat, Massachussetts Institute of Technology, Fvrier 1997. 2.2.1
[21] J.-D. Boisonnat et M. Yvinec. Gomtrie algorithmique. Collection Informa-
tique. EDISCIENCE international, 1995. 1.5.1
[22] J.-D. Boissonnat et M. Yvinec. Algorithmic Geometry. Cambridge University
Press, 1998. 1.5.1
[23] B. Bonet et H. Geffner. Planning as heuristic search. Articial Intelligence,
129(1/2) :533, 2001. 2.2.2
[24] Adi Botea, Martin Mller, et Jonathan Schaeffer. Near optimal hierarchical path-
nding. Journal of Game Development, 1(1) :728, 2004. 1.5.4
[25] Michael E. Bratman. Intentions, Plans, and Practical Reason. Harvard Univer-
sity Press, 1987. 2.1.2, 2.2.2
[26] Michael E. Bratman. Faces of Intention. Cambridge Studies in Philosophy.
Cambridge University Press, 1999. 2.1.2
[27] Adriana Braun, Soraia R. Musse, Luiz P. L. de Oliveira, et Bardo E. J. Bodmann.
Modeling individual behaviors in crowd simulation. Dans CASA 03 : Procee-
dings of the 16th International Conference on Computer Animation and Social
Agents (CASA 2003), page 143, Washington, DC, USA, 2003. IEEE Computer
Society. 1.4.1
[28] Werner Brilon. A new german capacity manual. Dans The Second International
Symposium on Highway Capacity, dit par Rahmi Akelik, pages 152164,
Sydney, Australie, aot 1994. Australian Road Research Board Ltd. 1.2.2
272
Bibliographie
[29] S. Caselli, M. Reggiani, et R. Rocchi. Heuristic methods for randomized path
planning in potential elds, 2001. 1.5.3
[30] L. P. Chew. Constrained delaunay triangulations. Dans Proceedings of the third
annual symposium on Computational geometry, pages 215222. ACM Press,
1987. 1.5.1
[31] M. G. Choi, J. Lee, et S. Y. Shin. Planning biped locomotion using mo-
tion capture data and probabilistic roadmaps. ACM Transactions on Graphics,
22(2) :182203, 2003. 1.5.2
[32] William J. Clancey. Situated Cognition : On Human Knowledge and Compu-
ter Representations (Learning in Doing : Social, Cognitive and Computational
Perspectives). Cambridge University Press, August 1997. 2.1.2
[33] Winnie Daamen et Serge P. Hoogendoorn. Experimental research of pedestrian
walking behavior. Transportation Research Record, 1828 :2030, 20036. 1.6.1
[34] Etienne de Sevin. An Action Selection Architecture for Autonomous Virtual Hu-
mans in Persistent Worlds. Thse de Doctorat, cole Polytechnique de Lau-
sanne, 2006. 2.4.3
[35] V. Decugis et J. Ferber. Action selection in an autonomous agent with a hierar-
chical distributed reactive planning architecture. Dans Proceedings of the 2nd
International Conference on Autonomous Agents (Agents98), dit par Katia P.
Sycara et Michael Wooldridge, pages 354361, New York, Mai 1998. ACM
Press. 2.2.2
[36] Stphane Donikian. Modlisation, contrle et animation dagents virtuels auto-
nomes voluant dans des environnements informs et structurs. Habilitation
Diriger des Recherches, IRISA/IFSIC, 2004. 1.1.3
[37] Stphane Donikian et Eric Rutten. Reactivity, concurrency, data-ow and hierar-
chical preemption for behavioural animation. Dans Programming Paradigms in
Graphics, dit par R.C. Veltkamp et E.H. Blake. Springer-Verlag, 1995. 2.2.1
[38] M. Duckham et L. Kulik. "Simplest Paths" : Automated route selection for
navigation. Dans Spatial Information Theory : Foundations of Geographic In-
formation Science, dit par W. Kuhn, M. F. Worboys, et S. Timpf, volume 2825
de Lecture Notes in Computer Science, pages 182199, Berlin : Springer, 2003.
1.5.4
[39] F. Feurtey. Simulating the collision avoidance behavior of pedestrians. Rapport
de DEA, The University of Tokyo, School of Engineering, 2000. 1.4.3
[40] R. E. Fikes et N. J. Nilsson. Strips : A new approach to the application of
theorem proving to problem solving. Articial Intelligence, 2(3/4), 1971. 2.2.2
[41] John J. Fruin. Pedestrian planning and design. New-York : Metropolitan asso-
ciation of urban designers and environmental planners, Inc., 1971. 1.2, 1.2.1,
1.3.5, 7.2
[42] J. Funge, X. Tu, et D. Terzopoulos. Cognitive modeling : Knowledge, reasoning
and planning for intelligent characters. Dans Proceedings of the Conference
on Computer Graphics (Siggraph99), dit par Alyn Rockwood, pages 2938,
N.Y., Aot 1999. ACM Press. 2.2.2
[43] J. J. Gibson. The Theory of Affordances. Lawrence Erlbaum Associates, Hills-
dale, NJ, 1977. 3.3.1
273
Bibliographie
[44] J.J. Gibson. The Ecological Approach to Visual Perception, chapter 8 : The
Theory of Affordances, pages 127143. Lawrence Erlbaum Associates, 1986.
2.1.2
[45] Christian Gloor, Pascal Stucki, et Kai Nagel. Hybrid techniques for pedestrian
simulations. Dans 4
t
h Swiss Transport Research Conference, Monte Verit, As-
cona, 2004. 1.5.3
[46] E. Goffman. Relations in public : microstudies of the public order. New York :
Basic books, 1971. 1.1.2
[47] S. Goldenstein, M. Karavelas, D. Metaxas, L. Guibas, E. Aaron, et A. Goswami.
Scalable nonlinear dynamical systems for agent steering and crowd simulation.
Computers and Graphics, 25(6) :983998, 2001. 2.4.1
[48] Classement des tablissements recevant du public. Gouvernement Franais.
1.2.3
[49] Rgles de scurit applicables aux gares (GA). Gouvernement Franais. 1.2.3
[50] Robin Green. Steering behaviours. Dans Tutorial at SigGraph00, 2000. 1.4.2
[51] Christopher Hartman et Bedrich Benes. Autonomous boids : Research articles.
Computer Animation and Virtual Worlds, 17(3,4) :199206, 2006. 1.4.2
[52] Dirk Helbing, Lubos Buzna, Anders Johansson, et Torsten Werner. Self-
organized pedestrian crowd dynamics : Experiments, simulations, and design
solutions. Transportation Science, 39(1) :124, 2005. 1.4.1
[53] Dirk Helbing, Lubos Buzna, et Torsten Werner. Self-organized pedestrian crowd
dynamics and design solutions. Dans Trafc Forum 12, 2003. 1.6.1, 1.6.2
[54] Dirk Helbing, I. Farkas, et Tamas Vicsek. Simulating dynamical features of
escape panic. Nature, 407 :487490, 2000. 1.4.1
[55] L. F. Henderson. The statistics of crowd uids. Nature, 229 :381383, 1971.
1.3.1
[56] B. Hillier, A. Penn, J. Hanson, T. Grajewski, et J. Xu. Natural movement : or,
conguration and attraction in urban pedestrian movement. Environment and
Planning B : Planning and Design, 20 :2966, 1993. 1.1.2
[57] Hartwig H. Hochmair et Victoria Karlsson. Investigation of preference between
the least-angle strategy and the initial segment strategy for route selection in
unknown environments. Lecture Notes in Computer Science, 3343 :79 97,
2005. 1.5.4
[58] K. E. Hoff III, J. Keyser, M. Lin, D. Manocha, et T. Culver. Fast computation
of generalized Voronoi diagrams using graphics hardware. Computer Graphics,
33 :277286, 1999. 1.5.2
[59] M. Kallmann, H. Bieri, et D. Thalmann. Fully dynamic constrained delaunay
triangulations. Geometric Modelling for Scientic Visualization, 2003. 1.5.1
[60] M. Kallmann et D. Thalmann. Modeling objects for interaction tasks. Dans
EGCAS, 1998. 2.3.2, 5.7
[61] M. Kallmann et D. Thalmann. Modeling behaviors of interactive objects for
real time virtual environments. Journal of Visual Languages and Computing,
13 :177195, 2002. 2.3.2
[62] Marcello Kallmann, Amaury Aubel, Tolga Abaci, et Daniel Thalmann. Planning
collision free reaching motions for interactive object manipulation and grasping.
Dans Computer Graphics Forum, volume 22, pages 313322, 2003. 2.3.2
274
Bibliographie
[63] Jon Kerridge, Stefan Keller, Tim Chamberlain, et Neil Sumpter. Pedestrian and
Evacuation Dynamics, chapter Collecting Pedestrian Trajectory Data In Real-
time, pages 2739. Springer Berlin Heidelberg, 2005. 1.6.1
[64] Roberta L. Klatzky. Allocentric and egocentric spatial representations : Deni-
tions, distinctions, and interconnections. Dans Spatial Cognition : An Interdis-
ciplinary Approach to Representing and Processing Spatial Knowledge, volume
1404/1998 de Lecture Notes in Computer Science. Springer Berlin / Heidelberg,
1998. 1.1.1
[65] R. E. Korpf. Depth-rst iterative-deepening : An optimal admissible tree search.
Articial intelligence, 27(1) :97109, 1985. 1.5.4
[66] J. J. Kuffner. Goal-directed navigation for animated characters using real-time
path planning and control. Lecture Notes in Computer Science, 1537 :171179,
1998. 1.5.2
[67] R. Kulpa, F. Multon, et B. Arnaldi. Specic representation of motions for
interactive animation with several characters. Computer Graphics Forum,
24(3) :343352, 2005. 6.1.1, 7.1
[68] T. I. Lakoba, D. J. Kaup, et N. M. Finkelstein. Modications of the helbing-
molnr-farkas-vicsek social force model for pedestrian evolution. Simulation,
81(5) :339352, 2005. 1.4.1
[69] F. Lamarche et S. Donikian. Automatic orchestration of behaviours through
the management of resources and priority levels. Dans Proceedings of the
First International Joint Conference on Autonomous Agents and Multiagent Sys-
tems (AAMAS02), dit par Maria Gini, Toru Ishida, Cristiano Castelfranchi, et
W. Lewis Johnson, pages 13091316. ACM Press, Juillet 2002. 2.2.1, 2.3.3
[70] F. Lamarche et S. Donikian. Crowds of virtual humans : a new approach for real
time navigation in complex and structured environments. Computer Graphics
Forum, Eurographics04, 2004. 1.4.2, 1.5.1, 1.5.1, 1.5.1, 2.2.1, 4.1.1, 6.1.1
[71] Fabrice Lamarche. Humanode virtuels, raction et cognition : une architecture
pour leur autonomie. Thse de Doctorat, I.F.S.I.C., Universit de Rennes I,
IRISA-INRIA, Campus de Beaulieu, 35042 Rennes cedex, France, dcembre
2003. 1.5.1, 4.2.2
[72] Emmanuel Lardeux. La Modlisation des Mouvements de Foule. Thse de Doc-
torat, U.F.R. Mathmatiques et Informatique, Universit de Rennes I, septembre
1992. 1.3.6
[73] J.-C. Latombe. Robot Motion Planning. Boston : Kluwer Academic Publishers,
Boston, 1991. 1.5
[74] J. R. E. Lee et R. Watson. Regards et habitudes des passants, volume 57-58 de
Les annales de la recherche urbaine. 1992. 1.1.2
[75] Jed Lengyel, Mark Reichert, Bruce R. Donald, et Donald P. Greenberg. Real-
time robot motion planning using rasterizing computer graphics hardware. Dans
SIGGRAPH 90 : Proceedings of the 17th annual conference on Computer gra-
phics and interactive techniques, pages 327335. ACM Press, 1990. 1.5.4
[76] Loc Letreust. Dveloppement doutils pour lanalyse du mouvement piton.
Rapport de DEA, sous la direction de Julien Pettr, Equipe de recherche Bun-
raku, 2007. E
275
Bibliographie
[77] B. Logan et N. Alechina. A* with bounded costs. Dans Proceedings of the
Fifteenth National Conference on Articial Intelligence (AAAI-98), pages 444
449, 1998. 1.5.4
[78] Robert G. Lord et P. E. Levy. Moving from cognition to action : A control
theory perspective. Applied Psychology : an internationnal review, 43(3) :335
398, 1994. 2.1.1
[79] Cline Loscos, David Marchal, et Alexandre Meyer. Intuitive crowd behaviour
in dense urban environments using local laws. Dans TPCG 03 : Proceedings
of the Theory and Practice of Computer Graphics 2003, page 122, Washington,
DC, USA, 2003. IEEE Computer Society. 1.4.2, 1.4.3
[80] David J.C. MacKay. Information Theory, Inference and Learning Algorithms.
Cambridge University Press, 2003. 2.2.1
[81] P. Maes. Situated agents can have goals. Dans Designing Autonomous Agents,
dit par Patti Maes, pages 4970. MIT Press, 1990. 2.2.2
[82] H. A. Mallot. Behavior-oriented approaches to cognition : Theoretical perspec-
tives. Theory in biosciences, 116 :196200, 1997. 2.1.1
[83] Hanspeter A. Mallot. Spatial cognition : Behavioral competences, neural me-
chanisms and evolutionary scaling. Kognitionswissenschaft, 8(1) :4048, 1999.
2.1.1
[84] J. McCarthy et P. J. Hayes. Some philosophical problems from the standpoint
of articial intelligence. Dans Machine Intelligence 4, dit par B. Meltzer
et D. Michie, pages 463502. Edinburgh University Press, 1969. reprinted in
McC90. 2.2.2
[85] S. J. Melinek et S. Booth. An analysis of evacuation times from buildings. Dans
CIB Symposium on the control of smoke movement in building res, Watford,
U.K., 1975. Building research establishment, Fire research station. 1.3.4
[86] Joseph S. Milazzo, Nagui M. Rouphail, Joseph E. Hummer, et D. Patrick Al-
len. Quality of service for uninterrupted pedestrian facilities. Dans Highway
Capacity Manual, dit par 78th Annual Meeting of the US Transportation Re-
search Board, Washington, DC, janvier 1999. Transportation Research Board.
1.2.2
[87] George A. Miller. The magical number seven, plus or minus two : Some limits
on our capacity for processing information. Psychological Review, 63 :8197,
1956. 2.1.2
[88] Bernard Moulin, Walid Chaker, Jimmy Perron, Patrick Pelletier, Jimmy Hogan,
et Edouard Gbei. Mags project : Multi-agent geosimulation and crowd simu-
lation. Dans COSIT 2003, dit par Worboys Kuhn, Timpf, Lecture Notes in
Computer Science, pages 151168. Springer Verlag, 2003. 2.4.4, 8.3
[89] Soraia Raupp Musse. Human crowd modelling with various levels of behaviour
control. Thse de Doctorat, EPFL : cole Polytechnique Fdrale de Lausanne,
Lausanne, Suisse, 2000. 1.4.2, 2.4.2
[90] Soraia Raupp Musse, Marcelo Kallmann, et Daniel Thalmann. Level of auto-
nomy for virtual human agents. Dans ECAL 99 : Proceedings of the 5th Eu-
ropean Conference on Advances in Articial Life, pages 345349, London, UK,
1999. Springer-Verlag. 2.4.2
276
Bibliographie
[91] Soraia Raupp Musse et Daniel Thalmann. Hierarchical model for real time si-
mulation of virtual human crowds. IEEE Transactions on Visualization and
Computer Graphics, 7(2) :152164, 2001. 2.4.2
[92] Allen Newell. Unied theories of cognition. Harvard University Press, Cam-
bridge, Massachusetts, 1990. 2.1.1
[93] N.J. Nilsson. Principles of articial intelligence. Springer-Verlag, 1982. 1.5.4
[94] H. Noser et D. Thalmann. Sensor based synthetic actors in a tennis game si-
mulation. Dans Computer Graphics International 97, pages 189198. IEEE
Computer Society Press, 1997. 2.2.1
[95] Daniel OConnor, Jake Pauls, et al. Engineering guide to human behavior in re.
Technical report, Society of Fire Protection Enginners (SFPE), tats-Unis, aot
2002. 1.3.6
[96] Toshihiro Osaragi. Modeling of pedestrian behavior and its applications to spa-
tial evaluation. Dans AAMAS 04 : Proceedings of the Third International Joint
Conference on Autonomous Agents and Multiagent Systems, pages 836843,
Washington, DC, USA, 2004. IEEE Computer Society. 1.5.4
[97] M. H. Overmars. Recent developments in motion planning. Dans International
Conference on Computational Science (3), pages 313, 2002. 1.5.2
[98] Sbastien Paris, Julien Pettr, et Stphane Donikian. Pedestrian reactive naviga-
tion for crowd simulation : a predictive approach. Computer Graphics Forum,
Eurographics07, 2007. 7.1
[99] Sbastien Paris, Stphane Donikian, et Nicolas Bonvalet. Towards more realistic
and efficient virtual environment description and usage. Dans First International
Workshop on Crowd Simulation (V-Crowds05). VRlab, EPFL, nov 2005. 4.1
[100] Sbastien Paris, Stphane Donikian, et Nicolas Bonvalet. Environmental abs-
traction and path planning techniques for realistic crowd simulation. Computer
Animation and Virtual Worlds, 17 :325335, 2006. 4.1
[101] Amit Patel. Amits game programming information. Web Site, 2007.
http://theory.stanford.edu/~amitp/GameProgramming/
AStarComparison.html. 1.20, 1.21
[102] Jake Pauls. Evacuation and other safety measures in high-rise buildings. vo-
lume 81, chapter 1, pages 528534. ASHRAE Transactions, 1975. 1.3.5
[103] Jake Pauls. Development of knowledge about means of egress. Dans Fire tech-
nology, volume 20, chapter 2, pages 2840. mai 1984. 1.3.5
[104] Jake Pauls. The movement of people in buildings and design solutions for means
of egress. Dans Fire technology, volume 20, chapter 1, pages 2740. Springer
Netherlands, fvrier 1984. 1.3.5
[105] Nuria Pelechano et Norman I. Badler. Modeling crowd and trained leader be-
havior during building evacuation. IEEE Comput. Graph. Appl., 26(6) :8086,
2006. 1.4.1
[106] I. Peschl. Passage capacity of door opennings in panic situations. BAUN,
26(2) :6267, 1971. 1.4.1
[107] Lloyd R. Peterson et Margaret J. Peterson. Short-term retention of individiual
verbal items. Journal of Experimental Psychology, 58 :193198, 1959. 2.1.2
277
Bibliographie
[108] Julien Pettr, Pablo de Heras Ciechomski, Jonathan Mam, Barbara Yersin, Jean-
Paul Laumond, et Daniel Thalmann. Real-time navigating crowds : scalable si-
mulation and rendering. Computer Animation and Virtual Worlds, 17(3-4) :445
455, 2006. 1.5.2
[109] J. Pettr, J.-P. Laumond, et T. Simon. A 2-stages locomotion planner for digital
actors. Dans Proc. of the 2003 ACM SIGGRAPH/Eurographics Symposium on
Computer Animation (SCA03), pages 258264, 2003. 1.5.2
[110] Elizabeth A. Phelps. The Nature of Cognition, chapter Brain versus Behavioral
Studies of Cognition, pages 295322. The MIT Press, 1999. 2.1
[111] Abishai Polus, Joseph Schofer, et Ariela Ushpiz. Pedestrian Flow and Level of
Service, volume 109(1) de Journal of Transportation Engineering, pages 4556.
American Society of Civil Engineers, janvier 1983. 1.2.2
[112] V. M. Predtechenskii et A. I. Milinskii. Planning for foot trafc ow in buil-
dings. Amerind Publishing CO Pvt Ltd, New Dehli, India, National Bureau of
Standards edition, 1978. 1.3.6
[113] N. Pronost, G. Dumont, G. Berillon, et G. Nicolas. Morphological and stance
interpolations in database for simulating bipedalism of virtual humans. The
Visual Computer, 22(1) :413, janvier 2006. (document)
[114] Puskarev et Zupan. Public transit and land use planning. Indiana University
Press, janvier 1977. 1.2.2
[115] A. S. Rao et M. P. Georgeff. Modeling rational agents within a BDI-architecture.
Dans Proceedings of the 2nd International Conference on Principles of Know-
ledge Representation and Reasoning (KR91), dit par James Allen, Richard
Fikes, et Erik Sandewall, pages 473484. Morgan Kaufmann publishers Inc. :
San Mateo, CA, USA, 1991. 2.2.2
[116] A. S. Rao et M. P. Georgeff. BDI-agents : from theory to practice. Dans Procee-
dings of the First Intl. Conference on Multiagent Systems, San Francisco, 1995.
2.2.2
[117] B. Reich, H. Ko, W. Becket, et N. I. Badler. Terrain reasoning for human loco-
motion. Dans Computer Animation, pages 9961005. IEEE, 1994. 1.5.3
[118] Marc Relieu. Voir et se mouvoir en marchant dans la ville. Dans Le courrier du
CNRS : Villes, pages 107109. CNRS, 1996. 1.1.2
[119] Marc Relieu et Louis Qur. Les risques urbains : Acteurs, systmes de prven-
tion, chapter Mobilit, perception et scurit dans les espaces urbains. Anthro-
pos : Collection ville. 1998. 1.1.2
[120] O. Renault, N. Thalmann, et D. Thalmann. A vision-based approach to behavio-
ral animation. Visualization and Computer Animation, 1 :1821, 1990. 2.2.1
[121] C. W. Reynolds. Flocks, herds, and schools : A distributed behavioral model.
Computer Graphics, 21(4) :2534, 1987. 1.4.2, 2.2.1
[122] Roger C. Schanck. The fourteen primitive actions and their inferences. Internal
Memo of the Stanford Articial Intelligence Laboratory, mars 1973. 2.3.3
[123] T. Shallice. Specic Impairments of Planning. Royal Society of London Philo-
sophical Transactions Series B, 298 :199209, juin 1982. 2.1.2
[124] Wei Shao et Demetri Terzopoulos. Autonomous pedestrians. Dans SCA 05 :
Proceedings of the 2005 ACM SIGGRAPH/Eurographics symposium on Com-
puter animation, pages 1928, New York, NY, USA, 2005. ACM Press. 1.4.2,
1.5.2, 1.5.4, 2.2.1
278
Bibliographie
[125] Stylianou Soteris et Chrysanthou Yiorgos. Crowd self-organization, streaming
and short path smoothing. WSCG, 14, January 2006. 1.4.3
[126] L.R. Squire et N.J Cohen. Neurobiology of Learning and Memory, chapter Hu-
man memory and amnesia, pages 364. Guilford Press, 1984. 2.1.2
[127] Sibylle D. Steck et Hanspeter A. Mallot. The role of global and local land-
marks in virtual environment navigation. Presence : Teleoperators and Virtual
Environments, 9(1) :6983, 2000. 1.1.2
[128] G. Keith Still. Crowd Dynamics. Thse de Doctorat, University of Warwick,
Department of Mathematics, aot 2000. (document), 1.8, 1.6.2
[129] K. Takahashi, T. Tanaka, et S. Kose. An evacuation model for use in re safety
design of buildings. Dans Fire Safety Science Proceedings of the Second Inter-
national Symposium, pages 551560, Tokyo, juin 1988. Hemisphere Publishing
Company, New York. 1.3.7
[130] Yordphol Tanaboriboon et Jocelyn A. Guyano. Level of service standards for
pedestrian facilities in bangkok : A case study. ITE Journal, novembre 1989.
1.2.2
[131] F. Tecchia et Y. Chrysanthou. Real time rendering of densely populated urban
environments. Dans RenderingTechniques 00 (10th EurographicsWorkshop on
Rendering), pages 4556, Brno, Czech Republic, 2000. Springer-Verlag. 1.5.2
[132] Franco Tecchia, Cline Loscos, et Yiorgos Chrysanthou. Visualizing crowds in
real-time. Computer Graphics Forum, 21(4) :753765, 2002. 1.5.2
[133] Kardi Teknomo, Yasushi Takeyama, et Hajime Inamura. Determination of pe-
destrian ow performance based on video tracking and microscopic simula-
tions. Dans Proceedings of Infrastructure Planning Conference, volume 23,
pages 639642, 2000. 1.6.2
[134] Kardi Teknomo, Yasushi Takeyama, et Hajime Inamura. Measuring microscopic
ow performance for pedestrians. Dans Proceeding of the 9th World Conference
on Transport Research, 2001. 1.6.2
[135] Kardi Teknomo, Yasushi Takeyama, et Hajime Inamura. Tracking system to
automate data collection of microscopic pedestrian trafc ow. Dans Proceeding
of The 4th Eastern Asia Society For Transportation Studies, volume 3, pages 11
25, 2001. 1.6.1
[136] Romain Thomas et Stphane Donikian. A navigation architecture for agents
based on a human-like memory and cognitive map model. Dans Computer Ani-
mation and Social Agents, dit par Nadia Magnenat-Thalmann, Dinesh Pai,
Ana Paiva, et Enhua Wu, pages 8393. Computer Graphics Society, 2006. 1.1.1
[137] S. Thrun et A. Bcken. Integrating grid-based and topological maps for mobile
robot navigation. Dans Proc. of the AAAI Thirteenth National Conference on
Articial Intelligence, pages 944951. AAAI Press / MIT Press, 1996. 1.5.2
[138] K. Togawa. Study on re escapes based on observations of multitude currents.
Technical report, Ministry of construction, 1955. 1.3.3, 1.4.1, 7.2
[139] Ariane Tom et Michel Denis. Referring to landmark or street information in
route directions : What difference does it make ? Dans Spatial Information
Theory, volume 2825/2003, pages 362374. Springer Berlin / Heidelberg, 2003.
1.1.2
279
Bibliographie
[140] Transportation Research Board, Washington, DC. Highway Capacity Manual,
2000. 1.2.2
[141] Adrien Treuille, Seth Cooper, et Zoran Popovi c. Continuum crowds. Dans
SIGGRAPH 06 : ACM SIGGRAPH 2006 Papers, pages 11601168, New York,
NY, USA, 2006. ACM Press. 1.4.3, 1.5.3
[142] M. van de Panne et E. Fiume. Sensor-actuator networks. Dans Computer Gra-
phics (SIGGRAPH 93 Proceedings), dit par James T. Kajiya, volume 27,
pages 335342, Aot 1993. 2.2.1
[143] Paul Vogt. The physical symbol grounding problem. Cognitive Systems Re-
search, 3(3) :429457, 2002. 2.1.2
[144] David Waller, Jack M. Loomis, Reginald G. Golledge, et Andrew C. Beall. Place
learning in humans : The role of distance and direction information. Spatial
Cognition and Computation, 2(4) :333354, 2002. 1.1.1
[145] W.H. Warren. Handbook of perception and cognition : Perception of Space and
Motion, chapter Self-Motion : Visual Perception and Visual Control, pages 263
325. Academic Press, 1995. 1.1.2, 2.1.2
[146] Karl F. Wender, Daniel Haun, Bjrn Rasch, et Matthias Blmke. Context effects
in memory for routes. Dans Spatial Cognition III, volume 2685/2003 de Lecture
Notes in Computer Science. Springer Berlin / Heidelberg, 2003. 1.1.1
[147] Jan M. Wiener et Hanspeter A. Mallot. ne-to-coarse route planning and
navigation in regionalized environments. Spatial Cognition & Computation,
3(4) :331358, 2003. 1.1.1, 1.1.2
[148] A. Yahja, A. Stentz, S. Singh, et B. L. Brumitt. Framed-quadtree path planning
for mobile robots operating in sparse environnements. Dans IEEE Conference
on Robotics and Automation (ICRA), Leuven, Belgium, Mai 1998. 1.5.2
[149] T. Ziemke. Introduction to the special issue on situated and embodied cognition.
Cognitive Systems Research, 3 :271274, 2002. 2.1.2
280
Table des gures
1 Variation dafuence dans un lieu dchange . . . . . . . . . . . . . . 1
2 Exemples dinteractions dans une gare . . . . . . . . . . . . . . . . . 2
3 Deux logiciels commerciaux danalyse des foules . . . . . . . . . . . 3
tat de lart
1.1 Reprsentation mentale hirarchique pour la planication de chemin . 12
1.2 Aire de Goffman . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3 Reprsentation des diffrents niveaux de service. . . . . . . . . . . . 15
1.4 Relation en densit de personnes et vitesse/dbit . . . . . . . . . . . . 16
1.5 Comparaison de plusieurs niveaux de services . . . . . . . . . . . . . 19
1.6 Vitesse de progression le long dune circulation horizontale. . . . . . 27
1.7 Dpendance entre le dbit unitaire, la densit, et le type dun passage. 28
1.8 Dcompositions dune pice en units. . . . . . . . . . . . . . . . . . 30
1.9 vacuation dune pice encombre. . . . . . . . . . . . . . . . . . . 31
1.10 vacuation dune pice dgage. . . . . . . . . . . . . . . . . . . . . 31
1.11 Modle de particules . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.12 Les trois rgles comportementales du modles Flocks of Boids . . . . 35
1.13 Modle prdictif de navigation de F. Feurtey. . . . . . . . . . . . . . 36
1.14 Exemple de triangulation de Delaunay . . . . . . . . . . . . . . . . . 40
1.15 Triangulations de Delaunay ltres . . . . . . . . . . . . . . . . . . . 40
1.16 Exemple de grilles rgulires . . . . . . . . . . . . . . . . . . . . . . 42
1.17 Utilisation de grille en animation. . . . . . . . . . . . . . . . . . . . 42
1.18 Exemple de carte de cheminement . . . . . . . . . . . . . . . . . . . 43
1.19 Exemple de carte de champs de potentiels . . . . . . . . . . . . . . . 44
1.20 Lalgorithme de Dijkstra . . . . . . . . . . . . . . . . . . . . . . . . 46
1.21 Lalgorithme A
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.22 Analyse du rel par exprience contrle. . . . . . . . . . . . . . . . 50
1.23 Analyse du rel par observations. . . . . . . . . . . . . . . . . . . . . 50
1.24 Comparaison rel/simul . . . . . . . . . . . . . . . . . . . . . . . . 51
2.1 Boucles de rtroaction . . . . . . . . . . . . . . . . . . . . . . . . . 56
281
Table des gures
2.2 Hirarchisation des comportements . . . . . . . . . . . . . . . . . . . 57
2.3 Modle de mmoire en 3 parties . . . . . . . . . . . . . . . . . . . . 59
2.4 Principe de la slection daction . . . . . . . . . . . . . . . . . . . . 65
2.5 Exemple de Smart Object . . . . . . . . . . . . . . . . . . . . . . . . 71
2.6 Processus de planication avec les Smart Object. . . . . . . . . . . . 71
2.7 Dlgation de tches avec les Smart Object . . . . . . . . . . . . . . 72
2.8 Interactions avec STARFISH . . . . . . . . . . . . . . . . . . . . . . 73
2.9 Les 3 couches du modle de S. Goldenstein . . . . . . . . . . . . . . 74
2.10 Exemple de comportement de groupe . . . . . . . . . . . . . . . . . 76
2.11 Architecture du modle multi-couche bas sur les motions. . . . . . 77
2.12 Gestion de la perception et reprsentation des connaissances dans le
systme MAGS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.13 Visualisation en sortie du systme MAGS. . . . . . . . . . . . . . . . 79
Contributions
3.1 Relations de dclaration entre les concepts de BIIO. . . . . . . . . . . 95
3.2 Relations dexcution entre les concepts de BIIO. . . . . . . . . . . . 95
3.3 Diagramme de spcialisation des ressources . . . . . . . . . . . . . . 96
3.4 Diagramme de spcialisation des objets interactifs . . . . . . . . . . . 97
3.5 Diagramme de spcialisation des zones dancrage . . . . . . . . . . . 97
3.6 Diagramme de spcialisation des les dattente . . . . . . . . . . . . 99
3.7 Diagramme de spcialisation des les dutilisation . . . . . . . . . . . 99
3.8 Exemple de description hirarchique dune affordance . . . . . . . . 102
3.9 Exemple dunication daffordances . . . . . . . . . . . . . . . . . . 102
3.10 Exemple denchanement rationnel daffordances . . . . . . . . . . . 104
3.11 Linteracteur dans larchitecture BIIO . . . . . . . . . . . . . . . . . 106
3.12 Exemple dordonnancement de tches cognitives . . . . . . . . . . . 110
3.13 Leffecteur dans larchitecture BIIO . . . . . . . . . . . . . . . . . . 111
4.1 Subdivision spatiale pralable labstraction. . . . . . . . . . . . . . 116
4.2 Graphe topologique extrait de la subdivision. . . . . . . . . . . . . . 117
4.3 Alas gomtriques se rpercutant sur la subdivision. . . . . . . . . . 118
4.4 Droulement de la premire abstraction. . . . . . . . . . . . . . . . . 121
4.5 Droulement de la seconde abstraction. . . . . . . . . . . . . . . . . 121
4.6 Abstraction dun environnement rel. . . . . . . . . . . . . . . . . . 122
4.7 Congurations du nud orient. . . . . . . . . . . . . . . . . . . . . 123
4.8 Grille oriente sur un cas de test. . . . . . . . . . . . . . . . . . . . . 126
4.9 Calcul dun PVS sur un cas de test. . . . . . . . . . . . . . . . . . . . 127
4.10 Reprsentation dun PVS sur un cas rel. . . . . . . . . . . . . . . . . 127
4.11 Dfaut du calcul de densit globale. . . . . . . . . . . . . . . . . . . 128
4.12 Mthode de calcul des densits locales. . . . . . . . . . . . . . . . . 129
282
Table des gures
4.13 Intgration dun objet obstacle statique lenvironnement . . . . . . . 131
4.14 Intgration dun objet traversable statique lenvironnement . . . . . 132
4.15 Potentiel de visibilit dynamiques . . . . . . . . . . . . . . . . . . . 133
5.1 Lhumanode dans larchitecture BIIO . . . . . . . . . . . . . . . . . 136
5.2 La pyramide comportementale . . . . . . . . . . . . . . . . . . . . . 136
5.3 change dinformations dans la pyramide comportementale . . . . . . 137
5.4 Processus dobservation bas sur les PVS. . . . . . . . . . . . . . . . 139
5.5 Donnes observes dans lenvironnement. . . . . . . . . . . . . . . . 140
5.6 Gestion de la connaissance topologique. . . . . . . . . . . . . . . . . 141
5.7 Planication de chemin hirarchique. . . . . . . . . . . . . . . . . . . 145
5.8 Lgende utilise pour les facteurs de planication de chemin. . . . . . 150
5.9 Facteur de distance lors de la planication de chemin. . . . . . . . . . 151
5.10 Facteur de largeur du chemin. . . . . . . . . . . . . . . . . . . . . . . 152
5.11 Facteur de direction courante le long du chemin. . . . . . . . . . . . . 152
5.12 Facteur de direction vers la destination. . . . . . . . . . . . . . . . . 154
5.13 Exemple de chemin avec interaction mergeante. . . . . . . . . . . . 156
5.14 Optimisation visuelle dun chemin. . . . . . . . . . . . . . . . . . . . 157
5.15 Extrapolation des dplacements dans le temps et lespace. . . . . . . . 162
5.16 Dtection des collisions sur un cas simple. . . . . . . . . . . . . . . . 163
5.17 Vue densemble et intgration de la navigation ractive. . . . . . . . . 164
5.18 Discrtisation du temps pour une entit voisine dynamique. . . . . . . 167
5.19 Quantication des espaces-temps des collisions. . . . . . . . . . . . . 168
5.20 Discrtisation de lespace pour les obstacles statiques. . . . . . . . . . 169
5.21 Discrtisation dune entit attractive dynamique. . . . . . . . . . . . . 171
5.22 Facteur de direction pour la navigation. . . . . . . . . . . . . . . . . 173
5.23 Intersection des quartiers se recouvrant dans lespace. . . . . . . . . . 176
5.24 Fusion des intervalles de vitesses pour deux quartiers. . . . . . . . . . 177
5.25 Prise de dcision lors de la navigation. . . . . . . . . . . . . . . . . . 178
5.26 Automate observer . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
5.27 Automate se dplacer . . . . . . . . . . . . . . . . . . . . . . . . . . 182
5.28 Vue densemble des changements de mode dinteraction . . . . . . . 183
5.29 Gestion des affordances par lhumanode . . . . . . . . . . . . . . . . 187
5.30 Gestion des tches cognitives par lhumanode . . . . . . . . . . . . . 188
5.31 Automate se comporter . . . . . . . . . . . . . . . . . . . . . . . . . 189
Rsultats
6.1 Les deux modles complmentaires utiliss. . . . . . . . . . . . . . . 200
6.2 Larchitecture logicielle de simulation. . . . . . . . . . . . . . . . . . 201
6.3 Module de cration dobjets BIIO. . . . . . . . . . . . . . . . . . . . 202
283
Table des gures
6.4 Import dun environnement de simulation. . . . . . . . . . . . . . . . 204
6.5 Conguration gnrale dune simulation. . . . . . . . . . . . . . . . . 205
6.6 Conguration des populations. . . . . . . . . . . . . . . . . . . . . . 206
6.7 Conguration des trains. . . . . . . . . . . . . . . . . . . . . . . . . 207
6.8 Conguration des donnes dexploitation. . . . . . . . . . . . . . . . 207
6.9 Conguration des interactions. . . . . . . . . . . . . . . . . . . . . . 208
6.10 Contrle de la vitesse dexcution. . . . . . . . . . . . . . . . . . . . 209
6.11 Deux vues dans la restitution 3D de la simulation. . . . . . . . . . . . 209
6.12 Vue approfondie dun objet de simulation. . . . . . . . . . . . . . . . 210
6.13 Rsultats sous forme de graphiques. . . . . . . . . . . . . . . . . . . 212
6.14 Rsultats sous forme de cartes. . . . . . . . . . . . . . . . . . . . . . 213
7.1 Protocole exprimental bas sur la capture de mouvements. . . . . . . 216
7.2 Protocole exprimental deux participants. . . . . . . . . . . . . . . 216
7.3 Rsultats dune exprience deux participants. . . . . . . . . . . . . 217
7.4 Phnomnes macroscopiques avec le modle de navigation. . . . . . . 219
7.5 Situations simules pour lextraction de courbes densit/vitesse. . . . 221
7.6 Courbes densit / vitesse du modle de navigation. . . . . . . . . . . 222
8.1 Frquences de rafrachissement de lhumain virtuel. . . . . . . . . . . 226
8.2 Comparaison des temps dexcution de lhumain virtuel. . . . . . . . 228
Annexes
A.1 Exemple dexcution hirarchique daffordances . . . . . . . . . . . 242
C.2 Automate interagir . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
C.3 Automate utilisation possible . . . . . . . . . . . . . . . . . . . . . . 247
C.4 Automate recherche active . . . . . . . . . . . . . . . . . . . . . . . 248
C.5 Automate utilisation active . . . . . . . . . . . . . . . . . . . . . . . 250
C.6 Automate attente active . . . . . . . . . . . . . . . . . . . . . . . . . 251
C.7 Automate recherche ractive . . . . . . . . . . . . . . . . . . . . . . 252
C.8 Automate utilisation ractive . . . . . . . . . . . . . . . . . . . . . . 254
C.9 Automate utiliser . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
D.1 Ressources du voyageur au dpart. . . . . . . . . . . . . . . . . . . . 258
D.2 Procdure comportementale du voyageur au dpart. . . . . . . . . . . 259
E.1 Expriences impliquant des foules dindividus. . . . . . . . . . . . . 269
284
Liste des tableaux
tat de lart
1.1 Les niveaux de services de J.J. Fruin. . . . . . . . . . . . . . . . . . . 15
1.2 Les niveaux de services du HCM. . . . . . . . . . . . . . . . . . . . 17
1.3 Les niveaux de services de Puskarev et Zupan. . . . . . . . . . . . . . 17
1.4 Les niveaux de services de W. Brilon . . . . . . . . . . . . . . . . . . 18
1.5 Les niveaux de services de Polus et al. . . . . . . . . . . . . . . . . . 18
1.6 Les niveaux de services de Tanaboriboon et Guyano. . . . . . . . . . 18
1.7 Catgories des tablissements publics. . . . . . . . . . . . . . . . . . 20
1.8 Caractristiques moyennes de tailles de diverses populations. . . . . . 21
1.9 Surfaces projetes pour diffrents types de population . . . . . . . . . 26
Annexes
C.1 Exemples de concurrence entre tches dinteraction. . . . . . . . . . . 256
285
Liste des Algorithmes
Contributions
1 valuation du chemin intermdiaire par parties . . . . . . . . . . . . 146
2 Exploration avec condition darrt oue . . . . . . . . . . . . . . . . 149
3 Suivre le chemin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
Annexes
4 Laffordance prendre le train . . . . . . . . . . . . . . . . . . . . . . 260
5 Laffordance acheter un ticket . . . . . . . . . . . . . . . . . . . . . 261
6 Laffordance changer un ticket . . . . . . . . . . . . . . . . . . . . 261
7 Laffordance composter son ticket . . . . . . . . . . . . . . . . . . . 262
8 Laffordance lire le tableau des dparts . . . . . . . . . . . . . . . . 262
287
Quelques chiffres
Voici quelques chiffres relatifs ces travaux :
4 ans de thse ;
308 pages de manuscrit de thse ;
5 publications, dont 2 revues internationales, 1 revue nationale, 1 article international,
et 1 poster international ;
1 projet de lAgence Nationale de la Recherche dmarr (SIMULEM) ;
1 outil de simulation passant en phase dexploitation ;
19 modules (packages) interdpendants pour lensemble des modles de simulation ;
1317 chiers sources pour le dveloppement et le test des modles, dont 772 chiers h,
516 chiers cpp et 29 chiers ui ;
252 000 lignes de codes environ (avec documentation Doxygen) pour le dveloppe-
ment et le test des modles ;
18 ingnieurs mois pour le dveloppement des interfaces homme/machine et le portage
Linux/Windows, rpartis entre 2 ingnieurs ;
307 chiers sources pour les interfaces, dont 136 chiers h, 127 chiers cpp et 44
chiers ui ;
32 000 lignes de codes environ (avec documentation Doxygen) pour les interfaces ;
12 200 ajouts et mises jours subversion ;
0 humain virtuel bless pendant la ralisation des dmonstrations ;
3 stagiaires de master, dont 1 ayant particip llaboration de BIIO, et 2 ayant utilis
les modles.
289
Caractrisation des niveaux de services et modlisation
des circulations de personnes dans les lieux dchanges
Simuler les circulations de personnes dans des environnements publics est un pro-
blme complexe, faisant intervenir des domaines varis tels que la psychologie, la so-
ciologie, la biomcanique, ou larchitecture. Ce sujet gagne encore en complexit pour
les lieux dchanges tels que des gares ferroviaires, o les logiques de dplacement sont
intimement lies aux procdures comportementales des individus. Notre solution per-
met tout dabord la description dun environnement de simulation : sa gomtrie, sa to-
pologie, et les quipements quil contient. Une multitude dagents autonomes modlise
ensuite les usagers, avec des capacits de dcision individuelles : comportements rac-
tifs, tels que lobservation ou lvitement de collision prdictif, base de connaissances
lie lenvironnement, ainsi que processus cognitifs et pseudo-rationnels. Lintgration
de nos modles dans une application ddie nous permet enn de dmontrer la qualit
de notre approche. Les rsultats se prsentent la fois sous la forme dune animation
3D interactive, et de diffrents niveaux de services, allant de cartes de densits ou de
vitesses, des graphiques dafuence.
Mots cls : Simulation de foule, Animation comportementale, Environnement in-
form, Navigation ractive, Planication de chemin, Niveaux de services
Characterization of the levels of services and modeling
of the movements of people inside exchange areas
Simulating the movements of people in public environments is a complex problem,
based on various domains such as sociology, psychology, biomechanics, or architec-
ture. This topic still gains in complexity for exchange areas such as train stations,
which impose logics of circulation closely related to individual behavioural procedures.
We propose in this thesis a complete architecture allowing to simulate the activity of
crowds of people in such environments. Our solution rst allows the description of
a simulation environment: its geometry, its topology, and the equipments it contains.
A multitude of autonomous agents are used to represent the users. They can make
their own decisions thanks to individual processes: reactive behaviours, such as ob-
servation or predictive navigation, knowledge database related to the environment, and
cognitive and pseudo-rational behaviours. The integration of our models in a dedicated
application nally shows the quality of our approach. The results are presented by an
interactive 3D animation, and various levels of services, like densities of people and
speeds maps, or graphs of ows of people.
Keywords: Crowd simulation, Behavioral animation, Informed environment, Reac-
tive navigation, Path planning, Levels of services