Poly Anim t1

Le traitement des images
tome 1
I. Bloch, Y. Gousseau, H. Ma tre, D. Matignon,
B. Pesquet-Popescu, F. Schmitt, M. Sigelle, F. Tupin
Polycopi e du cours ANIM D epartement TSI - T el ecom-Paris version 5.0 8 d ecembre 2005
Table des mati` eres

1 Vision et perception 1.1 Anatomie du syst` eme visuel humain . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 1.1.2 1.1.3 1.2 1.2.1 1.2.2 Lil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Les voies optiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Les aires sup erieures de la vision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Comportement passif du syst` eme visuel . . . . . . . . . . . . . . . . . . . . . . . . . . . Comportement actif du syst` eme visuel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 13 13 14 14 14 15 17 25 25 25 26 26 26 27 28 29 29 32 33 34 34 35 35 36 36 37 37 37
Comment percevons nous les images ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Propri et es statistiques des images 2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 2.1.2 2.2 2.2.1 2.2.2 2.3 2.4 Pourquoi e tudier des propri et es statistiques . . . . . . . . . . . . . . . . . . . . . . . . . Quelles images . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Propri et es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sensibilit e aux modications dhistogrammes . . . . . . . . . . . . . . . . . . . . . . . .
Lamplitude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Les sauts de lamplitude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . La fonction dautocorr elation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 A une dimension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2 2.4.3 En multi-dimensions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Le spectre de densit e de puissance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Entropie dordre 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Entropie des sauts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Entropie dordre N . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Entropie conditionnelle, redondance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Retour sur un paradoxe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Processus de Markov Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mais ... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.5
Entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 2.5.2 2.5.3 2.5.4 2.5.5
2.6
Un mod` ele dimage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.1 2.6.2
4 2.7 Critique de la d emarche pr ec edente . . . . 2.7.1 La stationnarit e . . . . . . . . . . 2.7.2 La causalit e . . . . . . . . . . . . 2.7.3 La monodimensionnalit e . . . . . 2.7.4 Vers un mod` ele complet dimage ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
` TABLE DES MATIERES

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 38 38 38 39 41 41 42 43 44 44 44 45 46 47 48 50 50 55 55 56 56 57 57 58 58 58 60 65 67 68 69 70 72 74 77 78 78 78
L echantillonnage des images, la repr esentation fractale 3.1 Les signaux monodimensionnels a ` bande limit ee . . . . . . . . . . . . . 3.1.1 Echantillonnage du signal . . . . . . . . . . . . . . . . . . . . . 3.1.2 Reconstruction du signal e chantillonn ea ` la fr equence de Nyquist 3.1.3 Reconstruction dans le cas de sur echantillonnage . . . . . . . . . 3.2 Signaux r eels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Les limitations physiques du spectre . . . . . . . . . . . . . . . . 3.2.2 Filtrage du signal . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Lextension en dimension . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Le mod` ele fractal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1 La dimension fractale . . . . . . . . . . . . . . . . . . . . . . . . 3.4.2 Lhomoth etie interne . . . . . . . . . . . . . . . . . . . . . . . . 3.4.3 Que faire de la th eorie fractale ? . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
Repr esentations discr` etes 4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Pavages et maillages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 D enitions et contraintes . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.2 Pavages plans r eguliers . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.3 Pavages plans semi-r eguliers . . . . . . . . . . . . . . . . . . . . . . . 4.2.4 Dualit e pavage / maillage . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Topologie discr` ete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Quelques approches . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.2 Topologie a ` partir de la notion de voisinage e l ementaire . . . . . . . . 4.3.3 Nombre dEuler : un exemple de caract eristique topologique dun objet 4.4 Repr esentations g eom etriques . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.1 Discr etisation dune droite continue . . . . . . . . . . . . . . . . . . . 4.4.2 Caract erisation dun segment de droite discret . . . . . . . . . . . . . . 4.4.3 Droites analytiques discr` etes . . . . . . . . . . . . . . . . . . . . . . . 4.4.4 Cercles discrets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.5 Pavage de Vorono et triangulation de Delaunay . . . . . . . . . . . . . 4.5 Exemples de structures al eatoires . . . . . . . . . . . . . . . . . . . . . . . . . 4.6 Fonction distance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.1 D enition de distances discr` etes . . . . . . . . . . . . . . . . . . . . . 4.6.2 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .

4.6.3 Algorithmes de calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5 79 81 81 82 82 83 85 85 85 86 88 88 89 90 91 91 91 92 92 93 93 93 95 95 97 97 98 100 104 105 106 108 108 109 109 110 110 110 110
5 Restauration des images 5.1 Le ltrage inverse . . . . . . . . . . . . . . . 5.1.1 Approche analytique . . . . . . . . . 5.1.2 Approche alg ebrique . . . . . . . . . 5.1.3 Discussion . . . . . . . . . . . . . . 5.1.4 Conclusions (provisoires) . . . . . . 5.2 D efauts singuliers et mal conditionn es . . . . 5.2.1 D efauts singuliers . . . . . . . . . . . 5.2.2 Syst` eme mal conditionn e. . . . . . . 5.2.3 D ecomposition en valeurs singuli` eres 5.3 Restauration des signaux bidimensionnels . . 5.4 La restauration it erative . . . . . . . . . . . . 5.4.1 M ethode de Jacobi . . . . . . . . . . 5.4.2 M ethode de Gauss-Seidel . . . . . . 5.4.3 M ethode de plus grande pente . . . . 5.4.4 M ethode du gradient conjugu e . . . . 5.4.5 M ethodes de projection (POCS) . . . 5.5 Lestimation des d efauts . . . . . . . . . . . 5.5.1 D etermination par calibrage . . . . . 5.5.2 D etermination statistique . . . . . . . 5.6 R eduction des effets de bord . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
6 Morphologie math ematique 6.1 Introduction et pr eliminaires . . . . . . . . . . . . . . . 6.2 Les quatre op erations . . . . . . . . . . . . . . . . . . . 6.2.1 Notion d element structurant et cadre ensembliste 6.2.2 Erosion et dilatation binaires . . . . . . . . . . . 6.2.3 Erosion et dilatation de fonctions . . . . . . . . 6.2.4 Ouverture et fermeture binaires . . . . . . . . . 6.2.5 Ouverture et fermeture num eriques . . . . . . . 6.3 Cadre topologique . . . . . . . . . . . . . . . . . . . . . 6.4 Cadre alg ebrique . . . . . . . . . . . . . . . . . . . . . 6.4.1 Treillis . . . . . . . . . . . . . . . . . . . . . . 6.4.2 Erosion et dilatation alg ebriques, adjonctions . . 6.4.3 Lien avec les op erateurs morphologiques . . . . 6.4.4 Ouverture et fermeture alg ebriques . . . . . . . 6.5 Cadre probabiliste . . . . . . . . . . . . . . . . . . . . . 6.5.1 Ensembles ferm es al eatoires . . . . . . . . . . . 6.5.2 Un exemple : le sch ema bool een . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
6 6.6

Applications de l erosion et de la dilatation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 6.6.1 6.6.2 6.6.3 6.6.4 6.7 6.7.1 6.7.2 6.7.3 6.7.4 6.7.5 6.7.6 6.8 6.8.1 6.8.2 6.8.3 6.8.4 6.8.5 6.9 6.9.1 6.9.2 6.9.3 Mesures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 Erod e ultime . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 Rehaussement de contraste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 Gradient morphologique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 Filtres altern es s equentiels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 Filtres auto-duaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 Chapeau haut-de-forme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 Granulom etries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 Ouverture surfacique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 Ouverture annulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 Transformation en tout ou rien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 Amincissement et e paississement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 Squelette . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Squelette discret . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 SKIZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 Distance g eod esique et boules g eod esiques . . . . . . . . . . . . . . . . . . . . . . . . . 119 Op erations morphologiques g eod esiques, reconstruction . . . . . . . . . . . . . . . . . . 120 Squelette g eod esique par zones dinuence . . . . . . . . . . . . . . . . . . . . . . . . . 121
Applications de louverture et de la fermeture . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
Transformation en tout ou rien et op erateurs d eriv es . . . . . . . . . . . . . . . . . . . . . . . . . 116
G eod esie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.10 Ligne de partage des eaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 6.10.1 D enition et propri et es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 6.10.2 Applications en segmentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 6.11 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 7 D enition et simulation dun champ de Markov 7.1 7.1.1 7.1.2 7.1.3 7.1.4 7.1.5 7.1.6 7.1.7 7.2 7.2.1 7.2.2 7.2.3 127
D enition et simulation dun champ de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 Description de limage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 Mod elisation probabiliste de limage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 Champs de Markov - Champs de Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 Echantillonnage de MRF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 Le recuit simul e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 Quelques MRF fondamentaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 Applications : restauration et segmentation . . . . . . . . . . . . . . . . . . . . . . . . . 137 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 Mod elisation bay esienne et fonction de co ut . . . . . . . . . . . . . . . . . . . . . . . . . 141 Estimateur MAP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
Estimateurs dans un cadre markovien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

7.2.4 Estimateur MPM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.5 Estimateur TPM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.6 Comparaison des estimateurs MAP, MPM, et TPM . . . . . . . . . . . . . . . . Estimation des param` etres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.2 Donn ees compl` etes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.3 Donn ees incompl` etes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Processus de bords . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.1 Processus de bords explicites et implicites . . . . . . . . . . . . . . . . . . . . . 7.4.2 Algorithmes de minimisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . Quelques applications des champs markoviens . . . . . . . . . . . . . . . . . . . . . . . 7.5.1 Applications sur le graphe des pixels . . . . . . . . . . . . . . . . . . . . . . . . 7.5.2 Segmentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Applications sur des graphes de primitives . . . . . . . . . . . . . . . . . . . . . . . . . 7.6.1 Graphes de r egions : application a ` la segmentation dune image dIRM c er ebrale 7.6.2 Graphes de segments : application a ` la d etection du r eseau routier . . . . . . . . 7.6.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7 144 145 146 148 148 149 152 160 160 161 162 162 164 167 167 168 170 175 176 176 176 177 177 177 178 181 181 182 183 185 186 186 187 189 190 193 193 197 197
7.3
7.4
7.5
7.6
8 Equations aux d eriv ees partielles et traitement dimages 8.1 L equation de la chaleur et ses limitations . . . . . . . . . . . . . . . 8.1.1 Quelques notations . . . . . . . . . . . . . . . . . . . . . . . 8.1.2 Pourquoi l equation de la chaleur . . . . . . . . . . . . . . . 8.1.3 Equation de la chaleur et noyau gaussien . . . . . . . . . . . 8.1.4 Application aux images . . . . . . . . . . . . . . . . . . . . . 8.1.5 L equation de la chaleur inverse . . . . . . . . . . . . . . . . 8.1.6 Limitations, invariance par changement de contraste . . . . . 8.2 Equations de diffusion non-lin eaires . . . . . . . . . . . . . . . . . . 8.2.1 Notations et structure locale des images . . . . . . . . . . . . 8.2.2 L equation de Malik et Perona . . . . . . . . . . . . . . . . . 8.2.3 Mouvement par courbure moyenne et variantes . . . . . . . . 8.2.4 L equation de Rudin-Osher-Fatemi . . . . . . . . . . . . . . . 8.2.5 Le ltre de choc de Rudin . . . . . . . . . . . . . . . . . . . 8.3 EDP et analyse multi- echelles . . . . . . . . . . . . . . . . . . . . . 8.3.1 D enition et propri et es des analyses multi- echelles . . . . . . 8.3.2 Pourquoi les analyse multi- echelles sont r egies par des E.D.P. 8.3.3 Classication des analyses multi- echelles . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
9 Ondelettes et traitement dimages 9.1 Principes de lanalyse lin eaire des images . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2 Trames . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2.1 Objectif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8 9.2.2 D enition . . . . . . . . 9.2.3 Propri et es . . . . . . . . 9.2.4 Trame duale . . . . . . . 9.2.5 Algorithme des trames . 9.2.6 Exemples de trames . . Poursuite adaptative . . . . . . . 9.3.1 Motivation . . . . . . . 9.3.2 Algorithme de poursuite 9.3.3 Am eliorations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 198 198 200 201 202 202 203 204 209 209 209 209 211 211 211 211 213 213 213 216 216 217 218 218 219 221 223 224 225 225 226 227 228 229 230 230 231 232
9.3
10 Les pr etraitements 10.1 Les traitements photom etriques ou colorim etriques 10.1.1 Lin earit e . . . . . . . . . . . . . . . . . . 10.1.2 Homog en eit e . . . . . . . . . . . . . . . . 10.1.3 Binarisation, seuillage . . . . . . . . . . . 10.1.4 Augmentation de contraste . . . . . . . . . 10.2 Suppression des bruits . . . . . . . . . . . . . . . 10.2.1 Filtrages lin eaires . . . . . . . . . . . . . . 10.2.2 Filtrage de rang . . . . . . . . . . . . . . . 10.2.3 Filtrages morphologiques . . . . . . . . . 10.2.4 Filtrages par e quations de diffusion . . . . 10.3 Les ltres adaptatifs . . . . . . . . . . . . . . . . . 10.3.1 Les ltres a ` coefcients adaptatifs . . . . . 10.3.2 Les ltres a ` fen etres adaptatives . . . . . . 10.4 Le r ee chantillonnage des images . . . . . . . . . . 10.4.1 Interpolation avec des polyn omes . . . . . 10.4.2 Interpolation par des B-splines . . . . . . . 10.4.3 Interpolation adaptative . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
11 La d etection des contours dans les images 11.1 Un mod` ele continu de contour. . . . . . . . . . . . . . 11.2 Les approches classiques . . . . . . . . . . . . . . . . 11.2.1 Les d etecteurs de gradient par ltrage . . . . . 11.2.2 Les d etecteurs de gradient par masques . . . . 11.2.3 Pr e- et post traitements . . . . . . . . . . . . . 11.2.4 Les d etecteurs de passage par z ero du laplacien 11.2.5 Les d etecteurs par masquage adapt e . . . . . . 11.3 Les approches analytiques . . . . . . . . . . . . . . . 11.3.1 Les crit` eres de Canny . . . . . . . . . . . . . . 11.3.2 Les ltres de Deriche et Shen et Castan . . . . 11.3.3 Lextension a ` 2D . . . . . . . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .

11.3.4 Variantes autour des ltres analytiques . . 11.4 Les contours actifs = les snakes . . . . . . . . . . 11.4.1 Une approche physique des contours . . . 11.4.2 Mise en e quation des contours actifs . . . 11.4.3 Les ensembles de niveaux (level sets) . . 11.4.4 Les mod` eles g eod esiques actifs . . . . . 11.5 La poursuite et la fermeture des contours . . . . . 11.5.1 M ethodes de recherche dans des graphes 11.5.2 Les automates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9 233 234 234 235 237 238 238 239 240 243 243 243 244 245 245 245 247 248 248 249 250 250 251 253 253 254 257 257 258 259 259 259 259 260 260 260 261 265 266
12 La segmentation par r egions 12.1 Les m ethodes sur histogramme . . . . . . . . . . . . . . . . . . 12.1.1 Avec apprentissage . . . . . . . . . . . . . . . . . . . . 12.1.2 Seuillage sans apprentissage . . . . . . . . . . . . . . . 12.1.3 M ethodes de classication . . . . . . . . . . . . . . . . 12.1.4 S election sur lhistogramme et dans limage . . . . . . . 12.1.5 S election sur histogramme et r egularisation . . . . . . . 12.2 Les m ethodes par transformation de r egions . . . . . . . . . . . 12.2.1 La croissance de r egion . . . . . . . . . . . . . . . . . . 12.2.2 Le partage de r egion . . . . . . . . . . . . . . . . . . . 12.2.3 La r eunion de r egion . . . . . . . . . . . . . . . . . . . 12.2.4 Les pyramides . . . . . . . . . . . . . . . . . . . . . . 12.3 Les graphes dadjacence . . . . . . . . . . . . . . . . . . . . . 12.4 La m ethode MDL = Minimum Description Length . . . . . . . 12.5 Lapproche de Mumford et Shah . . . . . . . . . . . . . . . . . 12.5.1 Approche formelle . . . . . . . . . . . . . . . . . . . . 12.5.2 Les variantes autour de la formulation de Mumford-Shah 13 Les textures 13.1 Quest ce quune texture ? . . . . . . . . . . . . . . . . . . 13.1.1 Distribution al eatoire ou r eguli` ere ? . . . . . . . . . 13.1.2 Les e chelles des textures . . . . . . . . . . . . . . . 13.1.3 Analyse ou synth` ese . . . . . . . . . . . . . . . . . 13.2 Mod` eles de texture . . . . . . . . . . . . . . . . . . . . . . 13.2.1 Un mod` ele biologiquement plausible . . . . . . . . 13.2.2 Mod` eles stochastiques . . . . . . . . . . . . . . . . 13.3 Analyse et reconnaissance de textures . . . . . . . . . . . . 13.3.1 Sch ema g en eral . . . . . . . . . . . . . . . . . . . . 13.3.2 Approches par mesures statistiques . . . . . . . . . 13.3.3 La d etection d energie dans des canaux fr equentiels . 13.3.4 Les ltres optimis es . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
10 13.3.5 Les mod elisations autor egressives . . . 13.4 Les approches par champs markoviens . . . . . 13.4.1 La m ethode de Manjunath et Chellappa 13.4.2 La m ethode de Kervrann et Heitz . . . 13.5 Les m ethodes structurales . . . . . . . . . . . . 13.6 Textures h et erog` enes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 267 268 269 270 270 271 271 273 273 273 274 274 275 276 277 279 280 280 280 281 282 285 286 288 288 290 292 293 295 295 295 296 297 298 300 300 301 302
14 Description de contours et de formes 14.1 Fonction caract eristique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2 Description de formes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.1 Repr esentation par les moments . . . . . . . . . . . . . . . . . . . . 14.2.2 Repr esentation par les moments invariants . . . . . . . . . . . . . . . 14.2.3 Bo tes englobantes et bo tes minimales . . . . . . . . . . . . . . . . 14.3 Polygones de Guzman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.4 Cha nes de Freeman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.4.1 D enition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.4.2 Les propri et es des cha nes de Freeman . . . . . . . . . . . . . . . . . 14.4.3 Reconnaissance des formes par des cha nes de Freeman . . . . . . . 14.5 Descripteurs de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.5.1 Descripteur par tangente . . . . . . . . . . . . . . . . . . . . . . . . 14.5.2 Repr esentation complexe . . . . . . . . . . . . . . . . . . . . . . . . 14.6 Approximations polynomiales . . . . . . . . . . . . . . . . . . . . . . . . . 14.6.1 Approximation dun nuage de points par une droite unique . . . . . . 14.6.2 Approximations polygonales, simplication de contours polygonaux . 14.6.3 Approximation par des splines . . . . . . . . . . . . . . . . . . . . . 14.7 Transformation de Hough . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.7.1 D enitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.7.2 Mise en uvre de la TH . . . . . . . . . . . . . . . . . . . . . . . . 14.7.3 D etections par TH . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ements de g 15 El eom etrie tridimensionnelle 15.1 G eom etrie projective . . . . . . . . . . . . . . . . . . . . . . 15.1.1 Espace projectif et coordonn ees homog` enes . . . . . . 15.1.2 Espaces projectifs , et . . . . . . . . . . . . 15.1.3 Expression lin eaire de probl` emes g eom etriques . . . . 15.1.4 Stratication, groupes de transformations et invariants 15.2 Repr esentations des rotations de I R . . . . . . . . . . . . . . 15.2.1 Les angles dEuler . . . . . . . . . . . . . . . . . . . 15.2.2 Exponentielle dune matrice anti-sym etrique . . . . . 15.2.3 Forme canonique et th eor` eme de Rodriguez . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
11
15.2.4 Quaternions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302 15.3 G eom etrie diff erentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 15.3.1 Courbes, rep` ere de Frenet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 15.3.2 Courbes sur une surface, formes fondamentales . . . . . . . . . . . . . . . . . . . . . . . 306 15.3.3 Courbures sur des surfaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308 15.3.4 Une notation fr equente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 15.3.5 Interpr etations g eom etriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 15.3.6 Principales m ethodes de calcul des courbures . . . . . . . . . . . . . . . . . . . . . . . . 311 15.3.7 G eom etrie diff erentielle dans des volumes num eriques . . . . . . . . . . . . . . . . . . . 313 16 Formation de limage et couleur 315
16.1 Formation des images . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 16.1.1 Imagerie coh erente et incoh erente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 16.1.2 Interaction mati` ere rayonnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317 16.1.3 Les sources de lumi` ere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320 16.2 D enition des diff erents espaces couleur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320 16.2.1 Trivariance et primaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320 16.2.2 Choix dun espace de couleur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321 16.2.3 Lespace RVB de la CIE 1931 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322 16.2.4 Lespace XYZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324 16.2.5 Lespace Lab et le rep` ere TLC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325 16.2.6 Lespace YC1C2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327 16.2.7 Lespace TLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327 16.2.8 Le syst` eme visuel hypoth etique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328 16.2.9 Lespace TLC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330 16.2.10 Les espaces de la t el evision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330 16.3 Mod elisation de la perception color ee des images . . . . . . . . . . . . . . . . . . . . . . . . . . 331 16.4 Les traitements des images en couleur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
16.4.1 Un ordre pour lespace
? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
16.4.2 Quest ce quune couleur repr esentative dun nuage ? . . . . . . . . . . . . . . . . . . . . 335 16.4.3 Comment calculer une palette ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335 16.4.4 Comment ltrer 2 couleurs ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336 16.4.5 La d etection des contours des images en couleur . . . . . . . . . . . . . . . . . . . . . . 336 16.4.6 Repr esentation par quaternions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337 16.4.7 Couleur et quaternion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337 A D ecomposition en Valeurs Singuli` eres : SVD 339
A.1 D enition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339 A.2 Lien avec le rang et interpr etation de la d ecomposition . . . . . . . . . . . . . . . . . . . . . . . 339 A.3 Normes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340
12

341 341 341 342
` la r B Applications de la SVD a esolution des syst` emes lin eaires B.1 Conditionnement dun syst` eme lin eaire non singulier . . . . . . . . . . . . . . . . . . . . . . . . B.2 Pseudo-inverse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.3 Solutions robustes dun syst` eme lin eaire, moindres carr es . . . . . . . . . . . . . . . . . . . . . .
C Optimisation sous contraintes 345 C.1 Contraintes e galit es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 C.2 Contraintes in egalit es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
Chapitre 1
La vision et la perception humaines

Chapitre r edig e par Francis S CHMITT
1.1 Anatomie du syst` eme visuel humain

1.1.1 Lil
Lil est le r ecepteur de la vision [LeGrand, 1956, Pirenne et Crouzy, 1972]. Il rec oit les rayons lumineux, en forme une image et transmet celle-ci au cerveau par le nerf optique, cf. gure 1.1. Limage est form ee a ` partir du cristallin qui joue le r ole dune lentille de focale variable, sur la r etine, couche photosensible qui tapisse le fond de lil (surface a ` peu pr` es sph erique). Liris contr ole le diam` etre de la pupille, comme un diaphragme automatique contr olant l energie arrivant sur la r etine. Les muscles oculomoteurs assurent lorientation de lil et la convergence des deux yeux sur le point dint er et. Convergence et focalisation sont g en eralement coupl ees dans la vision r eexe.
F IG . 1.1 Sch ema de lil humain et photographie du fond de la r etine. Le champ visuel nest pas circulaire, il est de 90 du c ot e temporal, de 60 du c ot e nasal, de 50 et 80 vers le haut et vers le bas. La r etine est le transducteur qui transforme le signal optique en signaux e lectriques. La surface de la r etine est tr` es h et erog` ene, aussi bien en nature de r ecepteurs quen densit e, cf. gure 1.1. Cette h et erog en eit e permet a ` des zones diff erentes dassumer des fonctions compl ementaires. Le centre de la r etine assure la vision color ee et la vision des d etails a ` fort niveau d eclairement (vision photopique). Le pourtour assure la vision achromatique a ` faible niveau de lumi` ere (vision scotopique), la vision des 13

14
CHAPITRE 1. VISION ET PERCEPTION
mouvements rapides, la perception globale des sc` enes et la vision achromatique a ` faible niveau de lumi` ere (vision scotopique). Lacuit e visuelle est maximale sur la fov ea (zone de la r etine correspondant a ` laxe du regard). La zone do` u part le nerf optique ne capte pas la lumi` ere (elle est appel ee tache aveugle). La r etine est constitu ee de nombreux types de cellules nerveuses : les cellules photo-r eceptrices (c ones et batonnets), les cellules bipolaires, ganglionnaires et amacrines. Ces cellules constituent 2 voies crois ees : la voie directe et la voie indirecte, interconnect ees de fac on complexe. Dans la fov ea, la r etine adopte un sch ema beaucoup plus simple : il ny a que des c ones (et pas de batonnets) et chaque c one nest connect e qu` a une cellule bipolaire elle m eme connect ee a ` une seule cellule ganglionnaire. Lacuit e visuelle baisse r eguli` erement lorsquon s eloigne de la fov ea. Les c ones sont principalement concentr es dans la fov ea et leur densit e d ecro t tr` es rapidement vers le pourtour de lil. Ils sont au nombre de 6 a ` 7 millions. Dans la fov ea ils sont tr` es petits (de 1 a ` 2 microns) et tr` es serr es (entre 2 et 10 microns). Les c ones sont peu sensibles, mais une m eme bre nerveuse ne regroupe quun tout petit nombre de c ones, assurant une bonne discrimination angulaire. Dans toutes les op erations de traitement dimage, on consid` ere que limage est observ ee en vision par les c ones. La vision chromatique est assur ee par 3 types de c ones dont la sensibilit e diff` ere selon le type de pigment quils contiennent. Ces c ones sont appel es L, M et S en fonction des longueurs dondes auxquels ils ont leur pic de sensibilit e : L= Long autour du jaune vert (585 nm), M= Middle autour du vert (550 nm) et S=Short autour du bleu (430 nm). Les b atonnets sont au contraire plus dens ement localis es sur une couronne centr ee a ` 20 de la fov ea environ. Leur densit e est nulle a ` la fov ea mais demeure tr` es forte encore a ` plus de 60 de celle-ci. Ils sont tr` es nombreux (de 80 a ` 150 millions), dun diam` etre moyen de 3 microns. Ils ont une tr` es bonne r eponse temporelle (cest en p eriph erie de lil que passent les e toiles lantes), une tr` es bonne sensibilit e (ils assurent la vision nocturne scotopique). Ils ont tous la m eme r eponse spectrale (` a peu pr` es ind ependante de la longueur donde) ( la nuit tous les chats sont gris. ).

1.1.2 Les voies optiques

Elles sont constitu ees de lensemble des cellules nerveuses qui partent de la r etine et aboutissent au cortex visuel primaire. Le nerf optique tout dabord part de lil et aboutit au chiasma optique, une structure o` u se croise une partie et se m elange une autre partie des bres des nerfs optiques issus de chacun des yeux. Sorties du chiasma optique les bres se distribuent soit vers le Tubercule Quadrijumeau Ant erieur soit vers le Corps Genouill e Lat eral puis ensuite vers les aires du Cortex Visuel Primaire situ ees a ` larri` ere des lobes occipitaux. (... a eter ...) ` compl
1.1.3 Les aires sup erieures de la vision

(... a eter ...) ` compl
1.2 Comment percevons nous les images ?

Ce nest pas en g en eral le genre de question que lon se pose lorsque lon est face a ` un e cran de t el evision ou de cin ema ou lorsque lon est plong e dans des bandes dessin ees. Le syst` eme visuel fournit d ej` aa ` notre cerveau une quantit e dinformation sufsamment grande a ` traiter pour quon ne se pose pas encore le probl` eme suppl ementaire de savoir comment tout cela fonctionne. C a marche et c a marche m eme bien ; merci dame Nature ! Ce type de pr eoccupation est en fait laiss e au soin de diverses esp` eces de coupeur de cheveux en quatre : psychologues, physiologistes et autres individus comme ces ing enieurs qui traitent des images.
1.2. COMMENT PERCEVONS NOUS LES IMAGES ?
15
Sachant que limage est un des supports physiques les plus privil egi es pour transmettre un message a ` notre cerveau, interrogeons-nous donc sur la mani` ere dont ce message est transmis, d ecod e et synth etis e par le syst` eme nerveux. Cest une question extr emement complexe qui nest encore que tr` es partiellement e lucid ee et quon va essayer de d ebroussailler grossi` erement. Les divers types dapproche du ph enom` ene de vision sont compar es dans [Gordon, 1998]. Il nest pas question de faire ici un large tour dhorizon de l etat de nos connaissances sur le comportement du syst` eme visuel face a ` linformation contenue dans les images. Tout au plus allons-nous essayer de donner une vague vue synth etique qui n evitera naturellement pas l ecueil dune sch ematisation excessive. Le but, en fait, est de sensibiliser le lecteur sur le ph enom` ene de la perception visuelle. Nous esp erons que nous aurons ainsi loccasion de lui procurer quelques sujets de distraction et de r eexion. Il pourra e galement se r ef erer a ` [Gregory, 1966], [Cornsweet, 1973], [Murch, 1973] ou [Carterette et Friedman, 1975]. On peut distinguer dans le traitement de linformation image par notre syst` eme visuel deux proc edures distinctes : une qui correspondrait a ` un comportement passif du syst` eme et lautre a ` un comportement actif. Nous allons voir successivement a ` quoi correspondent ces deux aspects, sans cependant insister trop sur le premier qui est un tantinet technique et qui pourrait par l` a para tre un peu trop r ebarbatif.

1.2.1 Comportement passif du syst` eme visuel

Cest ce comportement qu etudient essentiellement les physiologistes et les ing enieurs qui mettent au point de nouveaux syst` emes de traitement dimage. Ces derniers personnages ont besoin de bien conna tre les propri et es statiques et dynamiques du syst` eme visuel pour pouvoir adapter, en fonction de ces contraintes, les caract eristiques physiques de limage comme sa dimension, sa r esolution, sa luminosit e, son contraste... L etude de ces propri et es se fait par des exp eriences de psychophysique : un individu plac e dans des conditions dobservation parfaitement sp eciques regarde un signal donn e, appel e stimulus, pouvant prendre des formes tr` es diverses suivant la nature du ph enom` ene e tudi e. Le probl` eme est de relier les grandeurs physiques de ce stimulus aux grandeurs perceptives de la r eponse quil engendre chez lobservateur. Dans la pratique on distingue deux types dexp eriences : celles de d etection et celles de perception. La r eponse du syst` eme visuel est en effet diff erente suivant que lon met en jeu de petites ou de grandes variations du signal. Lorsque celles-ci sont faibles, limportant est de savoir si elles sont au-dessus ou en-dessous du seuil de d etection du syst` eme visuel. Lobservateur aura par cons equent vu ou non la variation du signal et pourra donner une r eponse assez objective sans trop se cr eer dangoisses m etaphysiques. Dans les exp eriences de perception o` u les variations du signal sont tr` es grandes, le probl` eme est plus d elicat.
F IG . 1.2 La perception des diff erentes gradations dune e chelle de gris d epend du niveau lumineux du fond. Illustrons cela par un exemple et demandez-vous comment vous proc ederiez pour fabriquer une e chelle de gris dune dizaine de tons allant du blanc au noir et dont les e carts de luminosit e vous para traient le plus homog` ene possible, dun point de vue perceptif bien s ur. Vous vous apercevriez alors que cet exercice vous demande des processus intellectuels beaucoup plus e labor es que celui de fournir une r eponse a ` la simple question vu ou pas vu ? . Il

16
vous faudra entre autres d enir un crit` ere de jugement qui vous permettra apr` es entra nement de mieux s electionner vos gris. Cel` a souligne laspect plus subjectif de telles exp eriences de perception compar ees a ` celles permettant de mesurer les seuils de d etection. La gure 1.2 montre limportance des conditions selon lesquelles on op` ere et quil est n ecessaire de bien contr oler : en changeant la luminosit e du fond on modie s erieusement la sensation que procure une e chelle de gris d etermin ee. Le comportement passif du syst` eme visuel sexplique globalement par le fait que cest essentiellement un syst` eme biophysique. Ses propri et es d ecoulent des caract eristiques de sa structure, a ` commencer par lil et la r etine, pour nir avec limmense complexit e de ses connexions nerveuses (cf. section 1.1.2). Ce comportement peut donner lieu a ` quelques ph enom` enes particuli` erement d emonstratifs comme ceux des gures 1.2 a ` 1.5, d us aux interactions spatiales entre les r egions de limage ayant des luminosit es diff erentes. Ces exemples indiquent a ` quel point linformation image une fois prise en charge par le syst` eme visuel peut e tre rapidement transform ee et d eform ee. indexcontraste simultan e

F IG . 1.3 Ph enom` enes dus aux interactions spatiales dans limage. En haut a ` gauche une bande de Mach (cest a ` dire un renforcement local du contraste) appara t a ` la n dune variation spatiale continue de la luminance et est plus claire que le fond blanc sur lequel elle se situe. En haut a ` droite, le contraste simultan e est un exemple classique de linteraction de la couleur dun fond sur celle dun m edaillon : les neufs petits carr es ont le m eme niveau de gris. En bas, le centre des croisements de la grille blanche dHermann para t plus sombre except e celui que lon xe du regard : la partie centrale de la r etine ne traite pas limage de la m eme mani` ere que sa partie p eriph erique. A la gure 1.2 les plages dans l echelle de gris ne sont pas perc ues comme uniformes alors quelles le sont physiquement.Les trois ph enom` enes de la gure 1.3, trouvent leur origine aux niveaux des interconnexions nerveuses des cellules r etiniennes qui effectuent un v eritable ltrage lin eaire. Mais d` es quintervient un contour, des ph enom` enes non lin eaires (gure 1.4) peuvent se produire. Les contours dans certains cas peuvent procurer des
17
` gauche, la seule adjonction dun contour au F IG . 1.4 Ph enom` enes dus aux interactions spatiales dans limage. A ` droite, dans milieu de la barre grise au motif du haut permet dobtenir un net contraste simultan e (motif du bas). A lillusion de Titchener les deux cercles centraux sont de taille e gale.
F IG . 1.5 Ph enom` enes dus aux interactions spatiales dans limage. Les contours vrais ou faux (` a gauche) jouent par leur orientation un r ole primordial dans certains effets : les diagonales dans lillusion de Z ollner (au centre) sont parall` eles et la spirale de Snearl (` a droite) nest form ee... que de cercles concentriques. r esultats assez spectaculaires sur la gure 1.5. Leur explication nest pas aussi claire que dans le cas de la gure 1.3 a ` gauche, mais se situerait cependant au niveau de la structure neurophysiologique des voies visuelles o` u des cellules extr emement sp ecialis ees dans le traitement des contours ont e t e d ecouvertes. Mais il existe des illusions notamment sur la dimension des formes (gure 1.4 a ` droite), pour lesquelles on nest plus en mesure de donner une explication dordre neurophysiologique. Elles correspondraient a ` des processus mentaux beaucoup plus complexes. Le syst` eme visuel ne jouerait d ej` a plus dans ce cas un r ole aussi passif.
1.2.2 Comportement actif du syst` eme visuel

Le r ole actif du syst` eme visuel se situe essentiellement au niveau des aires sup erieures du cerveau o` u linformation image arrive apr` es toute une s erie de transformations et de codages que nous navons fait quentrevoir. L` a, linformation y est rassembl ee et synth etis ee par des op erations mentales tr` es nombreuses mais encore inconnues. Regardez le trap` eze e l ementaire de la gure 1.7-A. Suivant le contexte spatial o` u on le place (B ou C) on en modie radicalement la perception puisquon aura tendance a ` le voir en position debout ou allong ee. La pr esence d el ements de perspective ou de gradients de texture donne en effet de fortes indications sur les distances relatives des objets et permet a ` lobservateur de mieux structurer lespace quil regarde. Vous constaterez ainsi que les d eformations planes dans la gure 1.8 sont nalement interpr et ees comme un volume cach e sous
18
F IG . 1.6 Dans cet e chiquier, les deux carr es marqu es A et B ont le m eme niveau de gris. Plusieurs ph enom` enes se conjuguent pour renforcer cette illusion. certains rel` event de processus de contraste simultan e, dautres de ph enom` enes dinterpr etation de la sc` ene. c E. H. Adelson.
F IG . 1.7 La perception des formes est modi ee selon le contexte spatial o` u elle est situ ee.
un damier r egulier. Ces indications peuvent aussi agir sur des m ecanismes mentaux particuliers comme celui de la constance de la taille et provoquer de fortes illusions g eom etriques comme la gure 1.9. On y v erie pourtant que les trois motifs sont absolument identiques et que par cons equent les images r etiniennes quils forment ont la m eme taille. Ces exemples soulignent le caract` ere actif avec lequel le cerveau reconstruit linformation image mais nindiquent pas la mani` ere avec laquelle il proc` ede pour y parvenir. Comment faisons-nous pour reconna tre les formes, analyser les sc` enes ? Actuellement ces questions nont pas encore trouv e de r eponses satisfaisantes. Quelques approches par le biais de la th eorie de linformation ont e t e tent ees, mais semblent e tre rest ees jusquici st eriles. En fait une constatation toute simple permet de montrer combien il est difcile dattaquer le probl` eme de cette mani` ere. La photographie 1.10 a ` gauche nest rien dautre que le positif de la photo de lauteur, dont la gure de droite est le n egatif. Or, il est extr emement difcile de reconna tre une personne sur un n egatif sans un entra nement pr ealable. Et cependant la quantit e dinformation contenue dans un positif ou un n egatif est
19
F IG . 1.8 R ole des gradients de texture dans l Arlequin

de Vasarely (cf. texte).
F IG . 1.9 Illusion g eom etrique sur la taille provoqu ee par la perspective. la m eme. Lapproche adopt ee par les gestaltistes ([Wertheimer, 1944] ou [Gordon, 1998] chapitre 3), tr` es diff erente, a donn e de meilleurs r esultats. Pour eux, la perception des signes, des objets ne sexpliquerait pas par un processus de concat enation ou de sommation en s erie de leurs diff erentes parties. lis seraient perc us comme un tout. Regardez les 3 segments de la gure 1.11. Lorsquils nissent par se rapprocher sufsamment pour se rejoindre, ils forment une gure triangulaire que lon perc oit en soi plut ot que comme le r esultat de ce rapprochement. Cette construction suivrait un certain nombre de lois indiqu ees a ` la gure 1.12. Ces lois poussent a ` croire quil existerait une sorte de principe de simplicit e qui dirigerait le cerveau et lui permettrait de limiter au maximum ses efforts pour reconstruire linformation. Cest une id ee un peu na ve, mais prenez par exemple le cas des surfaces subjectives de la gure 1.13. Le triangle blanc a ` droite na pas de contour r eel pourtant on le perc oit tr` es vivement. Il para t m eme e tre plus lumineux que le fond. Or, quy a-t-il dans cette image ? Trois angles et trois disques tronqu es. Ces formes paraissent incompl` etes au cerveau. Il lui suft alors de faire lhypoth` ese suppl ementaire de la pr esence dun triangle blanc recouvrant ces formes pour que limage sorganise plus simplement.
F IG . 1.10 Positif et n egatif de la photo de lauteur. Vous pouvez v erier.
20
F IG . 1.11 Le triangle est perc u comme une unit e graphique en soi. Vous constatez que le cerveau ne se contente pas de percevoir que ce qui existe dans le signal. Il nh esite pas a ` le compl eter si cela larrange, cest-` a-dire si cela lui permet de faire son travail de synth` ese a ` moindre frais. Ce que le cerveau rajoute au signal pour effectuer ces op erations constructives d epend bien s ur de limage mais aussi de la m emoire. Plus la m emoire pourra apporter d el ements signicatifs pour comprendre limage regard ee et moins vous aurez besoin de signal pour percevoir linformation. Cest vrai pour la lecture. Lorsque vous appreniez a ` lire vous e tiez oblig e de d etailler chaque caract` ere. Maintenant ceux-ci d elent a ` toute vitesse devant vos yeux. Il est des cas o` u le cerveau peut construire pour une image donn ee plusieurs solutions distinctes. Ces solutions sexcluent mutuellement car on ne perc oit que lune des deux et le passage de lune a ` lautre demande un important effort intellectuel. La gure 1.14 est un exemple c el` ebre de ces gures ambigu es. Certains reconna tront une vieille femme et dautres une jeune femme fort e l egante. Pourquoi ? Il est difcile de r epondre. Peut- etre les amoureux verront plus facilement la jeune femme alors que les maris tourment es par leur belle-m` ere verront plut ot la plus a g ee. De nombreux facteurs psychologiques interviennent et la m emoire joue encore ici un r ole pr epond erant surtout si on la stimule s electivement, par exemple en vous racontant au pr ealable des histoires de vieilles rombi` eres ou au contraire des histoires de belles romantiques. Inversement avec les images en fausse perspective de la gure 1.15 a ` gauche, le cerveau ne parvient pas a ` ` la photo 1.15, a construire de solution coh erente ce qui provoque m eme une certaine g ene mentale. A ` droite, cette g ene diminue et m eme dispara t. Car il faut r e echir pour sapercevoir que les escaliers de cette maison sont dun genre sp ecial. Cest le caract` ere r ealiste de la photographie avec ses multitudes de petits d etails qui permet au cerveau de saffranchir de cette construction impossible. Nous terminerons en signalant que le r ole actif du syst` eme visuel se manifeste aussi au niveau de lanalyse physique de limage, cest-` a-dire dans la mani` ere avec laquelle vous la regardez. Peut- etre nen avez-vous pas vraiment conscience, mais vos yeux bougent beaucoup et pas nimporte comment. Yarbus a enregistr e leurs mouvements [Kolers, 1972]. La gure 1.16 en haut montre comment dans une premi` ere e tape laxe visuel du regard balaye limage en suivant tr` es approximativement les contours principaux. Puis dans une deuxi` eme phase, le regard se stabilise sur des points particuliers o` u linformation est tr` es importante comme les yeux et la bouche dun visage ou tout autre d etail inhabituel. Mais ce qui est particuli` erement int eressant cest de savoir que ce type de lecture varie e norm ement suivant les pr eoccupations de lobservateur. Sur la gure 1.16 en bas ont e t e enregistr ees diff erentes lectures de la photographie gurant en haut a ` gauche et faites par un m eme individu. On a simplement pos ea ` ce dernier une question pr ecise correspondant a ` la sc` ene repr esent ee par cette photographie en lui demandant dy r epondre apr` es quelques secondes dobservation. On peut remarquer alors quil va chercher linformation l` a o` u elle est la plus signicative pour r esoudre son probl` eme. Enn, que tout cela ne vous tourmente pas. Dans deux minutes vous aurez compl` etement oubli e que votre syst` eme visuel joue un r ole passif ou actif et vous continuerez a ` regarder autour de vous comme si de rien n etait.

21
F IG . 1.12 Lois de la perception (dapr` es les gestaltistes). En haut a ` gauche - lois de similitude : on regroupe les zones ayant des caract eristiques similaires. En haut a ` droite - loi de continuit e : au lieu de percevoir 3 formes c ote a ` c ote, on pr ef` ere voir une ligne courbe et une ligne rectangulaire superpos ee. Au centre - loi de proximit e : on perc oit plut ot 5 triplets de 3 points que 3 lignes de 5 points. En bas a ` gauche - loi de fermeture : on perc oit deux formes ferm ees se touchant en un point plut ot que deux courbes quelconques se croisant. En bas a ` droite - le fait quon perc oive deux trames de carr es imbriqu ees, plut ot que la simple juxtaposition de l el ement indiqu e en noir est une cons equence de ces lois.
F IG . 1.13 Deux triangles subjectifs qui nont pas de contours (dapr` es G. Kanizsa, Scientic American, avril 76).
22
F IG . 1.14
Jeune lle ou vieille femme ?
gure ambigu e de R. Leeper.
F IG . 1.15 Quelques constructions impossibles (` a gauche), ... qui nont pas arr et e cet architecte (photographie A.P. Lamoth), a ` droite.
23
F IG . 1.16 Chemin que suit laxe du regard (dapr` es Yarbus et Kolers [Kolers, 1972]) : en haut, lorsquon observe une image ; en bas lorsquon demande a ` lobservateur de se souvenir de diverses choses concernant limage.
24
Chapitre 2
Propri et es statistiques des images

Chapitre r edig e par Henri M A I TRE
2.1 Introduction
tudier des propri 2.1.1 Pourquoi e et es statistiques
Lanalyse des propri et es statistiques des images est dict ee par le souci dadapter des traitements ult erieurs comme le ltrage, la restauration, le codage ou la reconnaissance des formes au signal dimage. Les techniques de base mises en uvre pour supprimer un bruit ou pour rehausser un signal affaibli reposent toutes sur des hypoth` eses sur ce quest le signal et ce quest le bruit, cest-` a-dire sur des mod elisations du signal et du bruit. Les techniques statistiques, reprises par les m ethodes de traitement de signal, font ainsi abondamment lhypoth` ese que les signaux sont gaussiens ou uniform ement r epartis dans un intervalle par exemple et les bruits blancs, cest-` a-dire a ` corr elation microscopique. De ces mod` eles, on peut d eduire par des encha nements rigoureux loptimalit e dun ltre ou lestimation de ses performances, en moyenne ou dans le pire des cas. La validit e ou la qualit e du ltre du codeur ou du d etecteur d ependra en pratique de lad equation des hypoth` eses qui sont a ` la base de son calcul et des propri et es pr esent ees par le signal r eellement trait e. On a donc tr` es t ot mesur e les propri et es statistiques des images, et essay e den d eduire des mod` eles permettant dexpliquer les images. Ces mod elisations statistiques ont cependant tr` es peu d echo dans notre vie quotidienne car elles ont beaucoup moins dutilisation que des descriptions structurelles ou syntaxiques qui donnent de chaque image une repr esentation a ` base de langage naturel et de g eom etrie, comme par exemple : une femme au sourire e es sur la poitrine devant un paysage de montagne. nigmatique, les bras crois Dans lobjectif dun traitement automatique par ordinateur, la repr esentation statistique est cependant tr` es utile, car elle nourrit imm ediatement des algorithmes plus ou moins e labor es manipulant les pixels, composants e l ementaires de limage. Luniversalit e de codeurs comme JPEG ou MPEG, qui reposent beaucoup sur ce type de propri et es, atteste de lint er et technique de ces e tudes. Notre d emarche sera la suivante : dans un premier temps nous passerons en revue les mesures statistiques les plus simples, celles qui sont obtenues par balayage mono-dimensionnel de limage. Nous en d eduirons un mod` ele, assez universellement utilis e. Nous en montrerons les limites. Nous pr esenterons quelques propri et es bidimensionnelles mal couvertes par ce mod` ele. Nous sugg ererons des am eliorations du mod` ele de base.

25
26
ES STATISTIQUES DES IMAGES CHAPITRE 2. PROPRIET
2.1.2 Quelles images

Une e tude exp erimentale doit distinguer deux types dimages tr` es diff erents : les images incoh erentes (cest le cas des images vid eo ainsi que de la plupart des photos satellitaires ou m edicales) obtenues avec les sources de lumi` ere naturelle ou des rayonnement incoh erents, les images coh erentes, telles que celles obtenues par holographie, par imagerie radar ou ultrasonore, en imagerie sismique. nergie des radiations e Les premi` eres sont obtenues par la sommation en e mises par les divers objets associ es dans un pixel e l ementaire. Les secondes sont form ees de la sommation en amplitude complexe des rayonnements issus des objets constituant un m eme pixel. Ces rayonnements, selon quils sont en phase ou en opposition de phase, cr eeront un pixel clair ou sombre, ces variations d ependant moins des objets qui constituent le pixel que des conditions de propagation, les termes de phase d ependant notamment de la g eom etrie dobservation. Ces images, compte tenu de l etat de surface souvent grossier des objets a ` l echelle de la longueur donde incidente, sont g en eralement entach ees dun tr` es important bruit appel e chatoiement (en radar), ou tavelure (en astronomie), ou granularit e (en optique) et speckle en anglais. Les propri et es statistiques des images coh erentes seront toujours tr` es diff erentes de celles des images incoh erentes. Ce chapitre traite des images incoh erentes, les plus fr equentes. Les propri et es des images coh erentes seront cependant rappel ees lorsquelles sont bien connues.
Op era
Fillettes F IG . 2.1 Trois images
Vlsi quelconques .
Notre propos est aussi de cerner les propri et es des images en g en eral, les images usuellement rencontr ees. Mais ces termes m eme d enissent mal notre objet, car il ny a pas de normalit e en image. Ils excluent cependant clairement des images trop simples : le carr e blanc sur un fond blanc des peintres, l echiquier ou la grille, ainsi que esentant des motifs tr` es particuliers (rosaces, mosa ques, etc. Nous pr eciserons les images pathologiques repr lorsque ce sera n ecessaire ce qui peut e tre normal ou anormal en traitement dimage. Retenons cependant que des images normales forment lessentiel des sc` enes en vid eo, des images satellitaires, des images m edicales, des images de robotique ou de microscopie.

2.2 Lamplitude
2.2.1 Propri et es
Nous repr , soit discr` ete des deux variables esenterons limage par une fonction soit continue despace et ou et .Nous utiliserons e galement fr e quemment la restriction monodimensionnelle obtenue par balayage ligne a ` ligne que nous e crirons lorsquaucune ambigu t e ne sera a ` craindre. Nous limiterons parfois les variables et a ` et ! pour rendre compte de la dimension nie des images. Mais nous prendrons

2.2. LAMPLITUDE
27
F IG . 2.2 Les histogrammes des 3 images de la gure 2.1 alors et ! tr` es grands. Les propri et es les plus simples auxquelles on sint eresse tout dabord sont li ees a ` lamplitude de limage. Dans la plupart des cas, les images sont repr esent ees sur 8 bits, parfois sur 10, 12 pour des images de tr` es bonne qualit e ou, exceptionnellement, 16. La premi` ere description dint er et est lhistogramme de lamplitude qui exprime la fr equence dapparition des divers niveaux. Les images e tant constitu ees de tr` es nombreux e chantillons (entre 100 000 et plusieurs millions), on invoque souvent le th eor` eme central limite pour justier lhypoth` ese que lamplitude de limage serait gaussienne. Cela nest g en eralement pas vrai. Les exemples de la gure 2.2 pr esentent des histogrammes typiques des trois images de la gure 2.1. Ils sont quelconques et toute autre allure serait e galement possible : lhistogramme dune image nest pas plus gaussien quuniforme.
2.2.2 Sensibilit e aux modications dhistogrammes

On peut e tudier plus en d etail la d ependance de lapparence de limage a ` son histogramme. Dint eressants travaux ont ainsi e t e men es par Estournet [Estournet, 1969] qui a fait r ealiser plusieurs copies dune m eme photo sur des supports vari es : papiers photographiques de marques, de gradations et de duret es diff erentes. Lanalyse de ces documents sur la gure 2.3 montre clairement de grandes diff erences dhistogrammes, diff erences bien plus remarquables que celles qui affectent les images elles-m eme. Estournet en d eduit que lhistogramme de limage, non seulement nest pas signicatif de limage (puisque de toute e vidence beaucoup dimages auront des histogrammes tr` es voisins compte tenu de la faible dimension des histogrammes), mais aussi peut e tre modi e articiellement sans que laspect ext erieur de limage nen soit beaucoup affect e, et surtout sans que la signication de limage ne soit alt er ee. Cette d emarche peut e tre pouss ee plus loin. Est-il possible quune image ait un histogramme quelconque ? Pour r epondre a ` cette question, nous allons utiliser un programme qui modie les niveaux de gris de limage par un transcodage garantissant que limage r esultat aura un histogramme pr ed etermin e. Imposons nous une contrainte pour assurer que laspect de limage demeurera assez inchang e : que les relations dordre entre niveaux de gris ne soient pas perdues, cest-` a-dire que si et sont deux niveaux de gris v eriant , alors on les transfor-
28
F IG . 2.3 Histogrammes dune m eme image obtenus pour des pr esentations sur des papiers de natures diff erentes : a ` gauche, duret e du papier, a ` droite, aspect du papier (dapr` es [Estournet, 1969]). mera en et tels que . Un tel programme est ais ea ` concevoir. Appliqu ea ` des images il donne les r esultats de la gure 2.4 , o` u les histogrammes darriv ee sont respectivement une loi uniforme, une somme de 2 gaussiennes et une sinuso de. Nous percevons bien s ur des diff erences dans les images ainsi cr ee es, mais les images demeurent parfaitement reconnaissables et leur interpr etation nen est pas affect ee. Cette exp erience nous conrme le r ole tr` es superciel de lhistogramme dont lallure nest li ee que de tr` es loin aux e l ements signicatifs de limage. Est ce que ces conclusions sont toujours valables ? Non bien s ur, puisque des images tr` es particuli` eres peuvent avoir des histogrammes tr` es sp eciques : un e chiquier sera compos e de deux pics et un texte noir sur blanc de deux modes nettement s epar es. Si nous prenons un champ de vagues tr` es r egulier, ou un mur cr epi, il est possible e galement que lon obtienne des histogrammes gaussiens. Dans le cas des images obtenues avec des illuminations coh erentes, on peut mener th eoriquement le calcul de la loi de probabilit e de lamplitude r e echie par une surface uniforme rugueuse (hypoth` ese dite de speckle pleinement d evelopp e [Goodman, 1976]). On montre alors quon obtient, pour probabilit e du module de lamplitude complexe, une loi de Rayleigh :

(2.1)
On v erie sur limage 2.5 que lhistogramme suit pr ecis ement ce mod` ele.
2.3 Les sauts de lamplitude

D enissons un saut erence entre le damplitude comme la diff niveaux de gris de deux pixels adjacents long dune ligne : . La variable varie g en eralement de -255 a ` +255. Etudions exp erimentalement la probabilit e de . La gure 2.6 pr esente ces probabilit es. Nous remarquons que : elles ont un maximum tr` es marqu e pour , ce qui exprime que le saut nul est le plus probable, elles sont sym etriques, elles ont une d ecroissance tr` es rapide et r eguli` ere. Au vu de ces courbes il a e t e propos e de mod eliser la probabilit e du saut damplitude par une gaussienne de moyenne nulle, dont le seul param` etre, l ecart-type , est une caract eristique de limage. La probabilit e du saut de lamplitude pourra alors s ecrire :

' !$# & % !
"!
(2.2)
2.4. LA FONCTION DAUTOCORRELATION
29
F IG . 2.4 Modication dhistogramme. En haut a ` gauche : image originale, en haut a ` droite somme de 2 gaussiennes, en bas a ` gauche sinuso de, en bas a ` droite r epartition uniforme.
Certaines images a ` transitions douces se caract erisent par une faible valeur de , dautres par une forte. Ce domaine de variation de est typiquement de 3 a ` 15. Il est clair que des contre-exemples peuvent e tre ais ement trouv es dimages dont lhistogramme na pas les propri et es ci-dessus. Un d egrad e r egulier du blanc au noir pr esenterait un histogramme non sym etrique avec des valeurs uniform ement r eparties dans le demi-espace gauche. Un e chiquier ne pr esenterait que trois types de transitions, des transitions nulles, des positives a ` +255 et des n egatives a ` -255. Ces exemples nentrent bien s ur pas dans nos hypoth` eses dimages normales.
2.4 La fonction dautocorr elation

une dimension 2.4.1 A
Une autre grandeur est dun grand int er et pour les traiteurs de signaux, cest la fonction dautocorr elation. A cela deux raisons : tout dabord elle exprime dune fac on tr` es compl` ete les d ependances spatiales du signal, dautre
30
F IG . 2.5 Agrandissement dune image de radar a ` vision lat erale (radar ERS-1) sur une r egion agricole de lUkraine ( c Cnes) montrant limportance du bruit de coh erence, et histogramme de la sc` ene compl` ete, tr` es proche dune loi de Rayleigh.
F IG . 2.6 Une image des gradients horizontaux dun extrait de limage Fillettes toute limage pour lafchage) et 4 histogrammes de sauts de 4 images diff erentes.

(la valeur 127 a e t e ajout ee a `
part elle permet un acc` es commode au domaine de Fourier par linterm ediaire du th eor` eme de Wiener-Khinchine 1. La fonction dautocorr elation dune fonction discr` ete est d enie par :

(2.3)
o` u le symbole exprime lesp erance math ematique de la variable al eatoire . La fonction dautocorr elation se calcule usuellement par :

Les images sont des signaux r eels ( ). Ce sont des signaux positifs dont on retire la valeur moyenne # pour calculer la fonction dautocorr elation centr ee :
1 Le th eor` eme de Wiener-Khinchine e tablit que la fonction dautocorr elation est transform ee de Fourier (TF) du spectre de densit e de puissance [Blanc-Lapierre et Picinbono, 1981].
!"
(2.4)
31

!"

#
(2.5)
et on calcule une fonction dautocorr elation ee centr ee en rapportant cette fonction a ` son maximum norm (qui est e galement la variance de ) :

'
" # #

(2.6)

#
(2.7)
Cette fonction dispose de nombreuses propri et es int eressantes : elle a un maximum a ` lorigine ( e gal a ` 1) ; elle est born ee a ` lintervalle ; ) ; elle est paire ( si elle poss` ede un autre maximum e gal a ` 1 en un autre point , alors elle ede une innit e de maxima aux poss` positions , et elle est p eriodique de p eriode , ainsi que la fonction elle-m eme ; il existe des relations simples eriv ees de la fonction dautocorr elation et les fonctions dauto entre les d corr elation des d eriv ees de . On pr esente sur la gure 2.7 la fonction dautocorr elation dune image, pour des d ecalages de 1 a ` 27 points. On note un maximum marqu ea ` lorigine (souvent accompagn e dune discontinuit e de la d eriv ee), suivi dune d ecroissance rapide et r eguli` ere. Si lon observe la d ecroissance de sur un plus long domaine, on constate que ses amplitudes deviennent tr` es faibles, exprimant une faible corr elation des pixels de limage tr` es e loign es les uns des autres.

fruits nice tifany singe lena
F IG . 2.7 A gauche sont superpos ees les valeurs mesur ees dune fonction dautocorr elation (sur limage a ` la loi exponentielle th eorique la plus proche, a ` droite 5 fonctions de corr elation dimages diff erentes.
Lena )
Ce comportement tr` es g en eral a permis de mod eliser la fonction dautocorr elation norm ee centr ee par une fonction exponentielle :
Le param` etre est le second param` etre caract eristique de limage, on voit sur la gure 2.7 que les images a ` variation lente ont une corr elation tr` es e tal ee (et donc un tr` es faible ). Au contraire, les images a ` variations tr` es rapides ont une autocorr elation pointue et un grand. Le domaine de variation de est typiquement de 0,01 a ` 0,3.
'
(2.8)
32
F IG . 2.8 Les 5 images ayant servis a ` calculer les corr elations de la gure 2.7 : Nice, Fruits, Tifany, Lena et Singe. Les contre-exemples de fonctions dont lauto-corr elation nest pas exponentielle sont ais es a ` trouver, en particulier, parmi les fonctions p eriodiques. Si les fonctions purement p eriodiques sont rares dans les images naturelles, les images pr esentant un motif qui se r ep` ete abondent (grilles, murs, vignes, tissus, etc.). Dautres ont des motifs moyens (foule dans des gradins, fac ades dimmeubles dans une rue, etc.). Ces images auront une autocorr elation compos ee de deux motifs multipli es : lun p eriodique, lautre exponentiellement d ecroissant exprimant la perte du motif avec la distance (cf. gure 2.9).
F IG . 2.9 Allure de lautocorr elation dune image avec un fort contenu p eriodique : th eorique a ` gauche et mesur ee (sur Fillettes), a ` droite.
2.4.2 En multi-dimensions
Si lon consid` ere maintenant non plus le signal le long dune ligne de limage, mais selon une direction quelconque, on retrouve un comportement semblable de la fonction dautocorr elation, mais avec peut- etre des coefcients diff erents selon les directions. Ainsi, il ne sera pas surprenant de trouver une forte corr elation verticale
33
dans un paysage de sous-bois de sapins alors quelle sera faible horizontalement. On voit sur la gure 2.10 des mesures sur une image r eelle re etant cette vari et e. La fonction dauto-corr elation bidimensionnelle exprime bien les propri et es disotropie de la sc` ene.
F IG . 2.10 Corr elation obtenue dans les directions horizontales (en haut) et verticales (en bas) pour limage Bateaux .

Si lon veut mod eliser ce comportement, on est amen ea ` choisir lun des deux mod` eles bidimensionnels suivants : (2.9) o` u
est une forme quadratique en
et , &

Image Bateaux corrlation horizontale
(2.10)
corrlation verticale
F IG . 2.11 Courbes disocorr elation pour le mod` ele non-s eparable (` a gauche) et pour le mod` ele s eparable (au centre) et courbes disocorr elation mesur ee sur limage Bateaux (le quart inf erieur du plan est repr esent e).

Cette deuxi` eme forme est moins satisfaisante pour la continuit e de la fonction dautocorr elation, mais elle est cependant tr` es souvent retenue car sa forme s eparable la rend tr` es commode demploi (s eparation en deux procesus ind ependants en ligne et en colonne), particuli` erement dans le plan de Fourier (cf. gure 2.11).
2.4.3 Le spectre de densit e de puissance

D ecoulant du th eor` eme de Wiener-Khinchine, e de puissance poss edera donc une forme le spectre de densit d etermin ee [Bracewell, 1978]. Soit la TF de , soit la variable associ e e a ` la variable despace (fr equence spatiale) et notons par le spectre de densit e de puissance de :

(2.11) (2.12)
34
F IG . 2.12 Spectre de densit e de puissance dimages a ` autocorr elation exponentielle (
et
)
On voit sur cette fonction (distribution de Lorentz, gure 2.12) des propri et es bien connues des opticiens : l energie est maximale a ` lorigine ( ), cest-` a-dire, en th eorie de la diffraction [Franc on, 1970], sur laxe optique, elle va en diminuant r eguli` erement vers les hautes fr equences spatiales (positives ou n egatives), dautant plus vite que la corr elation est plus forte ( faible) [Nicolas, 1995].
2.5 Entropie
Suivant les id ees de Shannon, lentropie est une mesure statistique du contenu dinformation dun message. Elle est donc adapt ee a ` caract eriser les images, chacune dentre-elles e tant prise comme un message sp ecique. 2 Lid ee dentropie sappuie, bien s ur, sur lanalogie de la physique : thermodynamique de Clausius ou statistique de Boltzman et attribue a ` des congurations particuli` erement improbables un plus grand contenu dinformation quaux congurations tr` es fr equentes.
2.5.1 Entropie dordre 0
Suivant lid ee pr ec edente, Hartley en 1925 attribue a ` un symbole e mis par une source stationnaire avec une probabilit e , la quantit e dinformation : (2.13)
exprim e en bit par symbole si le logarithme est a ` base 2. Shannon [Shannon, 1948] d enit alors linformation moyenne par symbole ou entropie par :

(2.14)
Consid erant une image comme une source stationnaire de pixels, lentropie se mesure donc a ` partir du seul histogramme de lamplitude. Utilisant les propri et es de la fonction log , on montre que lentropie est maximale pour une r epartition uni . Pour les images, cela conduit le plus souvent a forme de probabilit e ` une entropie inf erieure a `

2 cest une des approches possibles de la d enition de linformation. Une autre approche repose sur la th eorie de la complexit e [Delahaye, 1994] et mesure linformation apport ee par un message par la longueur du plus petit programme capable de d ecrire cette information. Cest lapproche de Kolmogorov [Kolmogorov, 1965], elle est compl et ee par la notion de profondeur logique de Benett qui distingue les s equences complexes mais calculables, de celles complexes mais al eatoires, au moyen du nombre de pas e l ementaires accomplis par le programme pour retrouver linformation. Le lecteur curieux trouvera dans [Ma tre, 1996] une application de ces principes aux images.
2.5. ENTROPIE
35
8 bits [Gallager, 1966] Les chiffres ordinairement rencontr es vont de 4 a ` 7,5 bits pour des images normalement contrast ees, utilisant lessentiel de la dynamique des niveaux de gris. Leffet dune quantication uniforme de limage (r eduction des niveaux de gris) conduit a ` une r eduction r eguli` ere de lentropie avec une pente presqu egale a ` (cf. gure 2.13).
F IG . 2.13 D ecroissance de lentropie pour 3 images en fonction de la quantication des niveaux de gris.
2.5.2 Entropie des sauts

En utilisant les propri et es soulign ees ci-dessus, on peut en particulier calculer lentropie des sauts dintensit e dont la probabilit e est gaussienne :
! % !
Cette entropie a le mauvais go ut d etre n egative pour de tr` es faibles valeurs de , mais il faut alors prendre en compte laspect discret des niveaux de quantication de limage et remplacer le r esultat obtenu en continu ci-dessus par sa forme discr` ete.
!
2.5.3 Entropie dordre N

Dans lapproche pr ec edente on consid erait chaque pixel ind ependant des autres. Cela re` ete bien mal ce que nous connaissons maintenant sur la corr elation entre pixels. Il nest pas difcile d etendre les id ees pr ec edentes a ` une source qui e mettrait non plus 1 pixel ind e pendamment des autres, mais 2 (ou 3, 4, etc.). On prend alors le e et lon d enit par analogie lentropie de la couple (d esign e par et ) comme symbole, il a une probabilit source dordre 1 par :

(2.15)
On d emontre sans peine que :
lune des e galit es e tant v eri ee si les pixels sont ind ependants, lautre si leur d ependance est lin eaire. Cette extension se reconduit naturellement pour des sources dordre , cest-` a-dire compos ees de symboles ind ependants constitu es de pixels, a ` partir de la connaissance des probabilit e s jointes de ces pixels. Notons cependant que cette probabilit ee tant un tableau de dimension , (o` u est le nombre de niveaux de gris dans limage), elle devient de plus en plus difcile a ` calculer.

36
2.5.4 Entropie conditionnelle, redondance

Si lon consid` ere 2 images exactement superposables (par exemple deux canaux dune image satellitaire ou le canal rouge et le canal vert dun signal vid eo), que lon d enote par et les valeurs en un m eme pixel , on peut d enir bien s ur lentropie et lentropie de chaque image :

et

:

on peut e galement d enir lentropie jointe de

(2.16)
` , comme linformation moyenne, pour mais on peut aussi d enir lentropie conditionnelle de par rapport a toutes les valeurs de , de linformation conditionnelle apport ee par sachant :

par moyennage sur tous les couples

Linformation apport ee par

sur
est alors exprim ee par :

(2.17)
On v erie que : Cette grandeur est appel ee la redondance de

et . On peut v erier les propri et es suivantes :
Le codage pr edictif en vigueur dans les ann ees 80 (codage MICD : Modulation par Impulsions Cod ees Diff erentielle ou DPCM [Guillois, 1996b, Barlaud et Labit, 2002]) sest beaucoup appuy e sur la recherche des meilleures con gurations de pixels permettant de minimiser lentropie conditionnelle du :

2.5.5 Retour sur un paradoxe

Reprenant le petit exercice de modication dhistogramme pr esent e dans la section 2.2.2, on peut sinterroger sur l evolution de lentropie au cours des op erations effectu ees. Reprenons par exemple limage des Bateaux dont lentropie originale e tait de 6,1. Apr` es la troisi` eme modication dhistogramme (gure 2.4), son entropie est pass ee
` 2.6. UN MODELE DIMAGE
37
a ` 8 bits par pixel. Comment explique-t-on ce gain en information moyenne ? O` u est pratiquement localis ee cette information ? Que peut en faire lutilisateur ? Pour r epondre a ` ces questions, il faut bien s ur analyser en d etail les sch emas de transformation, et en en imaginant dastucieux, il est possible de se convaincre que lon peut effectivement ajouter une information utile, par exemple en donnant une image moins bruit ee (ou au contraire plus contrast ee), ou en incorporant quelque bit de parit e ou autre marqueur permettant dassurer des v erications sur lint egrit e de la transmission, lidentit e de lauteur ou autre.
2.6 Un mod` ele dimage

2.6.1 Processus de Markov Gauss
Partant des deux r esultats pr ec edemment expos es (probabilit e des sauts gaussienne et autocorr elation a ` d ecroissance exponentielle), il est venu assez naturellement a ` lid ee de proposer le mod` ele g en erateur de signal dimage suivant : ` temps discret, et a ` accroissements gaussiens. limage est un processus markovien, a Rappelons [Cullmann, 1975] que les processus markoviens a ` temps discret sont des processus qui se d eveloppent le long dune suite ordonn e e dinstants (ici les pixels le long de la ligne) et dont la probabilit e de se trouver ` lins a tant dans l etat est fonction du seul e tat a ` linstant : et de la probabilit e de transition . Si le processus est stationnaire, cette probabilit e ne d epend pas de , si ses accroissements sont gaussiens, alors cette probabilit e est de la forme :

La probabilit e conditionnelle se repr esente, dans le langage des cha nes de Markov, par une matrice de taille , o` u repr esente le nombre de niveaux de gris. Cela permet d ecrire :
!# %
!
!
gale a ` 1 pour une ligne donn ee), mais non bi-stochastique. ! est une matrice stochastique (somme des colonnes e Ce mod` ele tr` es simple est tr` es utile pour d eterminer de nombreuses propri et es des images. Il a permis en particulier de nombreux travaux sur le codage pr edictif (MICD ou DPCM) [Guillois, 1996b, Barlaud et Labit, 2002].
2.6.2 Mais ...

Mais ce mod` ele simple laisse plusieurs probl` emes mal r esolus : la stationnarit e est difcile a ` obtenir avec des processus markoviens. En effet, le processus de Markov est stationnaire si a une limite quand tend vers linni. Or on peut e crire :

cela ne tendra vers une limite ind ependante du premier point de la ligne que si ! est une matrice dont la seule valeur propre de module 1 est 1, cest-` a-dire si ! est r eguli` ere (toutes les colonnes de ! sont e gales) ; en labsence de stationnarit e , on a affaire a ` un processus de diffusion (de Wiener-Levy), et lon montre que ee a ` celle du point 0 par : la variance du point est li
!

et sa fonction dautocorr elation d epend du point o` u elle est calcul ee [Fleuret, 1977]. Tout cela montre que lon ne peut pousser trop loin ce mod` ele gaussien markovien. Il rend n eanmoins bien compte de quelques propri et es tr` es g en erales et demeure a ` ce titre souvent utilis e.
38
2.7 Critique de la d emarche pr ec edente

Plut ot que de torturer les e quations pour les plier aux donn ees exp erimentales, il est pr ef erable de questionner les hypoth` eses sous-jacentes au mod` eles pr ec edent pour trouver les faiblesses de la d emarche. Nous en noterons 3 grandes familles, tournant autour de trois notions importantes : la stationnarit e, la causalit e et la dimensionnalit e.
2.7.1 La stationnarit e
Nous navons pas port e attention jusquici a ` lhypoth` ese de stationnarit e qui est pourtant sous-jacente a ` toutes les estimations que nous avons faites jusqu` a pr esent, quil sagisse damplitude, de saut ou de corr elation. Quexprimet-elle ? Que les estimations que nous faisons sont ind ependantes du point de limage o` u elles sont faites, cest-` a-dire que les symboles expriment des estimations repr esentatives de limage globalement et non dun champ particulier de celle-ci. Cela e carte de nos mod` eles des images qui s eloignent trop clairement de cette hypoth` ese : par exemple un paysage dont la partie haute (le ciel) est tr` es clair et uniforme tandis que le sol est sombre et riche en d etails. Dans ce cas, ni les propri et es du premier ordre (moyenne, variance, entropie), ni les propri et es dordre sup erieur comme la corr elation ne peuvent s evaluer globalement pour limage enti` ere. Ecartera-t-on ainsi toutes les images ou existe-t-il des documents qui v erient cette hypoth` ese de stationnarit e ? Cest une question d elicate a ` laquelle nous pouvons r epondre par deux voies : par une approche th eorique si lon conna t la source dimage, son contenu et les raisons de ses variations ; par une approche exp erimentale o` u lon confronte a ` limage originale une version modi ee de celle-ci faite en sorte quelle v erie lhypoth` ese de stationnarit e. La premi` ere approche permet dimaginer des congurations particuli` eres, homog` enes, par exemple un champ de houle, un tissu biologique, ou un portion de ciel, certaines images satellitaires . . .Mais pour les sc` enes ordinaires, il appara t e videmment que les images sont compos ees dobjets ind ependants : (une table, un meuble, un arbre) dont les propri et es sont ind ependantes et possiblement tr` es diff erentes. La seconde exp erience montre quil est pratiquement tr` es difcile de concevoir des images ordinaires qui soient stationnaires.
2.7.2 La causalit e
Elle est sous-jacente a ` la plupart des signaux temporels, mais perd son sens pour les images pour lesquelles il nexiste pas d ecoulement irr eversible du temps, a ` moins quelles naient e t e balay ees comme par exemple en t el evision. La causalit e est lune des propri et es fortes des processus markoviens qui na pas de signication pour limage. Recr eer une causalit e en 2D impose aussi des arbitraires et lon d enit ainsi des pass es qui peuvent e tre quart de plan, ou demi-plan, selon les besoins (cf. gure 2.14). Ces r eexions sont a ` la base des travaux conduits sur les ltres de Kalman bidimensionnels [Wood, 1981].

2.7.3 La monodimensionnalit e
La structure bidimensionnelle de limage rend sa mod elisation plus complexe. Les sch emas a ` 1D se combinent difcilement a ` 2D sans perdre certaines de leurs propri et es, ainsi en est-il des cha nes de Markov. Lextension peut prendre plusieurs formes : une formulation selon 2 e quations coupl ees en lignes et en colonnes, ou une formulation directement planaire.
EDENTE 2.7. CRITIQUE DE LA DEMARCHE PREC
39
F IG . 2.14 Pr ediction dun point par pass e quart de plan , a ` gauche, et pass e demi-plan , a ` droite. Les zones gris ees constituent le pass e du point au centre du rep` ere, au sens de la causalit e markovienne.

Ainsi Roesser a propos e un processus du type :

o` u est la partie al eatoire du processus (typiquement gaussien), limage nale e tant donn ee par :

et Attasi [Attasi, 1975] :

"

Dautres mod` eles peuvent e tre trouv es dans les r ef erences [Huang, 1976] et [Huang, 1981].
2.7.4 Vers un mod` ele complet dimage ?

Reprenant attentivement les propri et es du mod` ele pr esent e en 2.6.1 a ` la lumi` ere des remarques pr ec edentes, on constate que les e carts majeurs aux lois ci-dessus apparaissent pour les sauts de transition e lev es (les queues des courbes de la gure 2.6) que la loi gaussienne sous-estime consid erablement. Ces points sont ceux des transitions importantes, donc des contours de limage. Le mod` ele 2.6.1 suppose un champ uniform ement couvert dune seule texture et non la pr esence dobjets vari es s epar es par des contours. Peut-on alors construire un mod` ele global dimage prenant en compte ces propri et es ? Lobjectif est de rendre compte simultan ement des trois limites soulign ees ci-dessus. De nombreuses propri et es bidimensionnelles ont e t e mesur ees dans les images pour compl eter les analyses a ` 1D et les relier a ` des propri et es mono-dimensionnelles [Ma tre, 1977]. Ainsi diverses e tudes ont port e sur la mesure des probabilit es les plus vari ees : la probabilit e dapparition de deux contours successifs a ` une distance le long dune droite quelquonque, la probabilit e de la longueur de plages constantes a ` pr` es le long dune ligne, la probabilit e de lorientation des contours, la probabilit e de la surface dune aire constante a ` pr` es, etc. La conclusion la plus utile de ces e tude concerne les longueurs de plages, ou distances entre contours qui suivent assez bien un r epartition poissonnienne :
# # #
40
o` u # d enote la longueur moyenne de la longueur de plage, valeur sp ecique dune image donn ee. Cette propri et ea souvent e t e utilis ee dans des sch emas de codage ou de d etection, elle est cependant tr` es difcile a ` inclure dans des mod` eles et aucun mod` ele aujourdhui disponible nest capable de lint egrer a ` notre connaissance. La prise en compte des d ependances non-causales entre pixels a abouti a ` labandon presque g en eral de la piste des cha nes de Markov au prot des champs de Markov (cf. chapitre 7). Dans les champs de Markov, un pixel ne d epend plus simplement des 2 ou 3 pixels qui lont pr ec ed e lors du balayage r egulier de limage, mais dun voisinage qui lentoure et qui fait porter les d ependances de fac on sym etrique entre les points (voisinage de 4 points, ou de 8 points dans la plupart des cas). Linconv enient des champs markoviens est de ne plus se pr eter a ` des techniques de ltrage directes, mais de faire appel a ` des techniques it eratives g en eralement plus co uteuses en temps machine, et plus difciles a ` optimiser. La prise en compte des propri et es de non-stationnarit e des images a incit e les auteurs a ` abandonner lid ee dun mod` ele global au prot dun mod` ele en mosa que, dans lequel limage est constitu ee dune partition de plages, chacune relevant dun mod` ele semblable a ` celui que nous avons evelopp e en 2.6.1, cest-` a-dire chaque plage d suivant une loi de Markov-Gauss d enie par la valeur moyenne # , le param` etre de probabilit e de transition , le param` etre de d ecroissance de la corr elation . Ce mod` ele d enit deux grandeurs qui seront fondamentales pour tout le traitement des images : les contours qui repr esentent les transitions dune plage a ` une autre, et les textures qui d ecrivent les propri et es statistiques de chaque plage. Cest le mod` ele qui sera le plus utilis e pour les op erations de reconnaissance des formes, de ltrage et de d etection. Cest aussi un mod` ele qui est particuli` erement explor e pour les techniques de codage avanc e (MPEG-4 : codage par objets [Barlaud et Labit, 2002]), ainsi que pour la restauration des images pr eservant les contours.
Chapitre 3
L echantillonnage des images, la repr esentation fractale

Chapitre r edig e par Henri M A I TRE Chronologiquement, lune des toutes premi` eres e tapes du traitement num erique des images est la t ache d echantillonnage qui r eduit lensemble continu du monde observable en une s erie de valeurs discr` etes. Nous ninsisterons pas sur limportance de cette e tape en traitement des images, tant il est e vident que cest par elle que lon contr ole la nesse des d etails enregistr es, et par l` a m eme, la nature de linformation retenue dans limage num erique. Cette e tape saccompagne dune quantication des niveaux de gris et tr` es souvent d ebouche ensuite soit sur la compression, soit sur le traitement. Mais en traitement des images, l echantillonnage appara t en de nombreuses autres occasions que lors de lacquisition. En effet, les images sont tr` es souvent appel ees a è tre r e- echantillonn ees, par exemple pour des conversions de format (passage dun format SECAM a ` un format NTSC1 en t el evision num erique), ou pour en transformer la g eom etrie (corriger une perspective, orienter une forme dans un rep` ere convenable ou recaler limage sur une r ef erence). Toutes ces e tapes posent a ` nouveau le probl` eme de l echantillonnage et n ecessitent les m emes pr ecautions que lacquisition elle-m eme. Dans tout le champ du traitement du signal, l echantillonnage est abord ea ` laide de la th eorie classique propos ee par Nyquist et Shannon. Cette th eorie sapplique bien s ur aux images et nous la d evelopperons donc dans un premier temps. Nous verrons cependant quelle est parfois mal adapt ee. Nous verrons e galement que certains objets peuvent e tre tr` es mal trait es par cette approche. Cest le cas des objets fractales que nous pr esenterons en n de chapitre.
` bande limit 3.1 Les signaux monodimensionnels a ee

La th eorie de l echantillonnage sapplique a ` des signaux , fonctions dune variable continue , dont la bande passante est limit ee, cest-` a-dire dont la transform ee de Fourier (TF) , fonction de , variable associ ee 2 a ` ,
formats SECAM et NTSC sont les normes de repr esentation des signaux de t el evision utilis es en France et aux Etats-Unis [Guillois, 1996a]. 2A une variable temporelle correspond une variable fr equentielle, exprim ee en Hertz ; a ` une variable spatiale, correspond une fr equence spatiale , exprim ee en .
1 Les
41
42
CHAPITRE 3. LECHANTILLONNAGE DES IMAGES, LA REPRESENTATION FRACTALE
poss` ede un support ni

3.1.1 Echantillonnage du signal

Le th eor` eme d tablit l equivalence, sous certaines conditions, entre un signal continu , echantillonnage e . Cette e connu pour tout , et un ensemble d e chantillons discrets quivalence se traduit en particulier par la possibilit e de calculer a ` partir des valeurs et r eciproquement la possibilit e de calculer a ` partir de . Les conditions sont les suivantes ; les sont les valeurs du signal prises a ` des positions r eguli` eres ; ces positions sont s epar ees dun intervalle au plus e gal a ` .

f(x)
F(u)
u x f(x) et g -U G(u) U
p x U 1/p-U 1/p u
F IG . 3.1 Echantillonnage dun signal continu . Le signal r esultant discret a un spectre
. , a` spectre
a ` support born e, avec un pas d echantillonnage
Ces e chantillons sont donc en nombre inni et ont pour valeur :

Ce que nous e crirons aussi :
la fonction e tant le peigne de Dirac de p eriode . La TF se d eduit de par r ep etition de p eriode (cf. gure 3.1) et att enuation de . Comme , sur lintervalle , et co ncident exactement (au facteur pr` es). Pour reconstruire le signal, il est int eressant de distinguer le cas o` u le signal a e t ee chantillonn ea ` la fr equence la plus basse, , appel ee fr equence de Nyquist, du cas o` u lon choisit un nombre plus e lev e d echantillons .
"!
!

"! # # #

` BANDE LIMITEE 3.1. LES SIGNAUX MONODIMENSIONNELS A

f(x) F(u)
43
u x f(x)i et g -U W(u) G(u) U
p x U 1/p u
F IG . 3.2 Echantillonnage a ` la fr equence de Nyquist. Le ltre de reconstruction dun signal continu , cest-` est le ltre canonique a-dire la fonction porte.
chantillonn ` la fr 3.1.2 Reconstruction du signal e ea equence de Nyquist

Dans le cas o` u lon choisit juste le nombre minimal d echantillons, on se trouve dans la situation particuli` ere d ecrite sur la gure 3.2 o` u les ordres parasites dus a ` l echantillonnage affectent toutes les fr equences imm e diatement sup e rieures a ` . La reconstruction est alors totalement contrainte. Elle se fait par le ltre unique tel que :

(3.1)
La reconstruction de
a ` partir de s ecrit alors :

ou de fac on e quivalente :
La fonction qui v erie les relations 3.1 sappelle la fonction canonique d echantillonnage. Nous en verrons lusage plus loin. Dans le cas monodimensionnel qui nous int eresse ici, nous avons :

et la reconstruction, en dehors des valeurs connues cardinaux pond er es par les valeurs des e chantillons :
, prend la forme classique dune sommation de sinus
Pour les positions des e chantillons , on v erie que les contributions de tous les autres e chantillons sannulent (cela exprime lind ependance des e chantillons a ` la fr equence de Nyquist). On voit donc que les e chantillons pris ` a la distance forment une base pour la reconstruction des signaux dont la bande est limit ee a ` lintervalle .

44
3.1.3 Reconstruction dans le cas de sur echantillonnage
Si lon choisit de prendre plus d echantillons quil nest strictement n ecessaire ( la situation d ecrite sur la gure 3.1, o` u certaines fr equences, comprises entre et d energie. Lors de la reconstruction, tout ltre v eriant :
# (3.2) est satisfaisant pour la reconstruction. Il existera donc de nombreuses formules de reconstruction du type : seront autant de fonctions de reconstruction (cf. gure 3.3). Il ny a donc en general plus independance o` u les
on se trouve dans # ,),ne contiennent pas

entre les e chantillons, mais au contraire redondance. Ces e chantillons ne forment plus une base mais un syst` eme g en erateur. La redondance peut e tre exploit ee de diverses fac ons, par exemple pour corriger des distorsions, les plus adapt es a ` att enuer leffet dun bruit ou combler des pertes. Elle permet e galement de choisir les ltres nos contraintes. Elle se paie par un signal plus volumineux. Parmi toutes les fonctions de reconstruction possibles, la fonction canonique vue en e q.3.1 se distingue car elle garantit que la reconstruction quelle procure, m eme en pr esence de bruit, sera la plus d` ele au signal original selon un crit` ere d ecart quadratique moyen.
G(u)
1 2 3
u U 1/p-U
F IG . 3.3 Trois ltres possibles pour reconstruire exactement un signal sur echantillonn e (les ltres sont egatifs). Ils diff` erent par leurs valeurs dans lintervalle compris entre et . sym etriques pour les n
!
3.2 Signaux r eels

quelque e A chelle que nous lobservions, lunivers nous appara t comme une fonction des deux variables despace, d enie en tout point et continue en presque tout point et dot ee de d etails aussi ns que nous le souhaitons. Il en est ainsi des vues a eriennes, des sc` enes de la rue quotidienne et m emes des microphotographies, tant les structures observ ees sont usuellement grandes devant les discontinuit es de la mati` ere : mol eculaires ou atomiques. Lunivers ne se pr esente donc pas comme une fonction a ` spectre born e comme nous le souhaiterions, mais comme une fonction a ` spectre a ` support quasi-inni.
3.2.1 Les limitations physiques du spectre

Mais lunivers sobserve a ` travers des instruments (microscope, lentille, cam era) dont la r esolution est limit ee en particulier par la diffraction (cf. [P erez, 1991]). Ce sont ces instruments qui introduisent g e n e ralement la limi de lunivers, on en tation en bande passante exig ee par l echantillonnage. Au lieu de mesurer limage exacte
3.2. SIGNAUX REELS

mesure une image d egrad ee
45
La limite fr equentielle est alors impos ee par le support de , fonction de transfert du syst` eme. Cest donc a ` ce signal que lon appliquera les recommandations issues de la th eorie de Shannon et expos ees dans les lignes pr ec edentes (Section 3.1). Les limites des optiques Pour tous les syst` emes dont loptique est parfaite et limit ee par le seul diam` etre de la pupille dentr ee, et dans le cas dune imagerie incoh erente, loptique introduit un ltrage bidimensionnel, fonction de la seule variable :
par la r du syst` eponse impulsionnelle eme dobservation :
#
% % ! !
(3.3)
Cette fonction est connue sous le nom de tache dAiry [P erez, 1991], est la fonction de Bessel dordre 1 et la distance focale de loptique utilis ee. Un tel ltre nest malheureusement pas un ltre passe-bas parfait mais il est g en eralement consid er e comme approximativement nul au-del` a des fr equences .
!
Les capteurs solides Une autre limitation du spectre du signal est introduite lorsquon utilise des d etecteurs solides (matrices ou lignes de photod etecteurs). Ces d etecteurs sont constitu es dun assemblage de d etecteurs e l ementaires plac es dans le plan image du syst` eme optique, chacun e tant charg e de mesurer un e chantillon. L echantillon ainsi mesur e nest donc pas ponctuel mais il r esulte de lint egration de l energie sur la surface du capteur e l ementaire. Le ltrage a pour r eponse impulsionnelle une fonction porte dont, pour des raisons de construction, la largeur est n ecessairement inf erieure au pas d echantillonnage (donn e par la distance entre capteurs). Un tel syst` e me est lui aussi un mauvais ` support large dune part et ne sannule qu` a ltre passe-bas puisque sa fonction de transfert (la fonction ) est a lext erieur de la bande passante compatible avec le pas d echantillonnage dautre part. Lui aussi laissera place a ` du repliement de spectre si lon ne prend pas soin de ltrer optiquement le signal.
3.2.2 Filtrage du signal
Pour de nombreuses applications, le pas d echantillonnage , dont d ecoule le d ebit de l echantillonneur, est la grandeur limitante dun syst` eme dimagerie. Cest par exemple le cas pour certaines applications de t el esurveillance ou de t el ed etection qui utilisent un canal de transmission a ` d ebit r eduit. Dans ces cas, le probl` eme de l echantillonnage est pris a ` lenvers et cest la bande passante de loptique qui est ajust ee pour assurer la relation . On adapte donc la d egradation du signal au taux d echantillonnage que lon peut effectuer. Comment choisir alors si est x e? Une id ee tentante est de de fac on que son spectre eborde pas de ltrer parfaitement le signal original ne d la bande de fr equence . Cela conduit a ` choisir e gale a ` la fonction porte . Cette solution est ais ee si lon dispose de la TF du signal , comme en optique coh erente [Cozannet et al., 1981], ou en radar [Ma tre, 2001]. Il suft alors de supprimer les fr equences au-del` a de . Lorsque lon ne peut acc eder directement au domaine spectral, un tel ltrage passe-bas id eal est difcile a ` r ealiser puisquil n ecessite que lon convole le signal ` support inni. On choisit alors dapprocher eration en convolant par un sinus cardinal, fonction a cette op par une fonction a ` support presque-compact et dont le spectre est proche de la fonction porte. Cette approximation entra ne deux types derreurs (cf. gure 3.4) :
46

H(u) erreur de flou
H(u) erreur de repliement de spectre u

U
F IG . 3.4 erent du passe-bas Les deux types derreurs introduites par le ltrage dun signal par un ltre diff id eal lors de son e chantillonnage. Ils sont pr esent es ici dans lespace de Fourier. A lint erieur de la bande, lerreur est une distorsion des fr equences appel ee ou en traitement dimages, a ` lext erieur de la bande, l energie non annul ee viendra se replier lors de l echantillonnage et cr eera le d efaut de repliement de spectre. 1. tout dabord, a ` lint erieur de la bande passante sur limage. Son e nergie est donn ee par :
, des frequences seront attenuees, introduisant un ou

2. dautre part, a ` lext erieur, des fr equences ne seront pas annul ees. Lors de l echantillonnage, ces fr equences r epliqu ees dans les ordres parasites viendront sins erer dans la bande conserv ee, introduisant une distorsion du signal appel ee repliement de spectre ou aliasing. L energie concern ee est :
Parmi les fonctions les equemment utilis ees, nous plus fr pouvons citer les suivantes : la fonction porte : qui conduit a ` ; la fonction triangle (convolution de 2 portes) : qui conduit a ` la spline cubique (convolution dune porte et dun triangle) :
; , qui conduit a o` u: ` ! ! la fonction gaussienne qui a pour fonction de transfert la gaussienne de variance

"!
3.3 Lextension en dimension
"
Lextension de la th eorie de l echantillonnage a ` des espaces de dimension ( pour limage, $ pour les s equences dimages ou pour les volumes en imagerie sismique et m edicale, pour une s equence de volumes temporels, etc.) est simpli ee par la lin earit e des op erations dans le domaine spectral qui permettent de d ecomposer la d emarche en autant de probl` emes d echantillonnage que de dimensions. Mais il r ev` ele cependant des diff erences notables d` es que et entra ne une complexit e croissante du choix de la base d echantillonnage avec . noterons par % et & les variables vectorielles conjugu ees despace et de fr equence. A une image continue Nous % est associ ee sa transform ee de Fourier & .

#

&
$
%
&
% %
` 3.4. LE MODELE FRACTAL

u2 p1
47
p2 1/p 2
u1
1/p 1
F IG . 3.5 Echantillonnage dun signal bidimensionnel selon 2 pas d echantillonnage et (` a gauche). Le spectre de limage est reproduit aux nuds du r eseau r eciproque (` a doite). Le domaine est le domaine o` u nest pas nul ; le domaine est la maille de r ep etition du motif.

` spectre born e sil existe tel que & & . Se donner un e chantillonnage Un signal de dimension est a de lespace, cest choisir un ensemble de vecteurs d echantillonnage formant une base de lespace image. A ces vecteurs est associ e par transform ee de Fourier le r eseau r eciproque de vecteurs de base qui pave lespace des fr equences (cf. gure 3.5). La reconstruction du signal continu se fera exactement si les ordres parasites ne se superposent pas au spectre du signal. On voit quil est simple d echantillonner un signal de dimension de fac on a ` v erier lin egalit e stricte de Shannon. Il suft de choisir tous les pas d echantillonnage de fac on que . Cette condition sufsante pour faire un e chantillonnage parfait nest cependant pas n ecessaire et conduit g en eralement a ` un tr` es fort sur echantillonnage et donc a ` une grande redondance dans les e chantillons ainsi mesur es. On d enit lefcacit e de l echantillonnage par le rapport du volume o` u le spectre nest pas nul, sur le volume e l ementaire de r ep etition du spectre par les :

!
On v erie que l echantillonnage au crit` ere de Nyquist (cf. Section 3.1.2) correspond au cas , sans redondance. Sil est facile dadapter le pas d echantillonnage dun signal monodimensionnel de fac on a ` e liminer la redondance, cest beaucoup plus difcile pour , et tr` es souvent impossible. En effet, on ne pourra assurer que si le 2D, eme g eom etrie que , cest-` a-dire si lon peut paver lespace a ` partir de translat es de . A domaine a la m les seules formes v eriant cette propri et e sont les parall elogrammes ou des hexagones, mais il est exceptionnel de trouver des sc` enes dont le spectre est born e par de telles gures. En cons equence, pour la dimension 2 et les dimensions sup erieures, ont doit g en eralement accepter des e chantillonnages redondants. On peut alors chercher a ` maximiser . Dans le cas g en eral dun spectre quelconque, cette optimisation se fait de fac on empirique. Un cas ere de ). Les e chantillonnages qui tr` es fr equemment rencontr e est celui de spectres isotropes ( est une sph` simposent alors sont b atis sur le maillage hexagonal (cf. gure 3.6) : a ` 2D cest le maillage hexagonal lui-m eme ; a ` 3D cest le maillage hexagonal compact ou le maillage cubique centr e qui conduit a ` des maillages appel es en quinconce en vid eo (quinconce ligne et quinconce trame). Les e chantillonnages b atis sur le maillage carr e sont plus redondants mais leur simplicit e de mise en uvre les a rendus populaires malgr e leur efcacit e m ediocre et leurs faibles propri et es topologiques (cf. Chapitre 4).
3.4 Le mod` ele fractal

Nous allons voir maintenant un mod` ele dunivers qui soppose en tous points a ` lapproche pr ec edemment d evelopp ee de l echantillonnage. Cest le mod` ele fractal.
48

u3
U2
u2
A13 B11 A22 A11 A21 A31 A41 A33 A42 A51 A43
A13
A23
A33
A44
B31
A12
A22 B13
A32
A42
u1
B11 U1 A11 Z11 A21 A31 Z42 A41
Z42 Z11
F IG . 3.6 Echantillonnage de signaux tridimensionnels a ` spectre isotrope. Les spectres sont repr esent es par des sph` eres. la vue de gauche repr esente une vue perspective du domaine de Fourier, celle de droite une vue de dessus depuis esent e un e chantillonnage hexagonal dans le plan (sph` eres la direction des positifs. On a repr ) et 2 sch emas diff erents : lhexagonal compact et le cubique centr e . Dans les deux cas, la couche sup e rieure (repr esent ee par les sph` eres ) est plac ee dans les trous de la couche de fac on que chaque sph` ere soit tangente a ` 3 sph` eres . Mais dans le sch ema hexagonal compact (B11 et Z11), la couche inf erieure est a ` e (B13 et Z42) elle occupe les sites inoccup es de la laplomb de la couche tandis que dans le cas cubique centr couche .
La notion de dimension fractale a e t e introduite par Mandelbrot [Mandelbrot, 1977] pour rendre compte du comportement surprenant de certains objets soumis a ` des mesures de plus en plus nes. On saperc oit alors que le r esultat de la mesure (longueur, p erim` etre ou surface) d epend fortement de la pr ecision de linstrument utilis e, et que ce r esultat, invariablement, cro t sans limite apparente pour des pr ecisions de plus en plus grandes. Cette propri et e est bien illustr ee par lexemple dune c ote rocailleuse, tir e de [Richardson, 1961], dont la longueur ne cesse de cro tre, selon quon la mesure sur une carte, sur le terrain en voiture, en v elo, a ` pied, ou avec un double d ecim` etre. Chaque nouvelle m ethode nous permet de contourner des rochers nouveaux, de sintroduire dans des anfractuosit es plus petites, ce qui rallonge dautant lestimation faite auparavant. Mandelbrot a soulign e que ce comportement, qui soppose r esolument a ` toutes les notions de lanalyse math ematique classique (fond ee sur la r egularit e et la continuit e des fonctions, au moins dans des petits domaines), est en fait tr` es commun et peut e tre ais ement e tendu a ` des objets les plus vari es : suspension deau savonneuse et ses innies cascades de particules en e mulsion, e ponges aux formes tortur ees, e tagement de v eg etations dans les sous-bois, ramications sans n des connexions nerveuses, embo tement des crat` eres a ` la surface de la lune, et bien dautres encore. Sur la gure 3.7, nous avons repr esent e certains de ces objets, tels que la nature nous les propose, v eritables casse-t etes pour le traiteur dimage. Une e ponge, ou un poumon, pr esentent, par exemple, une surface continue, mais si d echiquet ee, si perc ee dalv eoles, si ponctu ee de protub erances de toutes tailles quelle appara t nalement remplir tout lespace : tout le poumon nest que surface int erieure vers le syst` eme sanguin, ext erieure vers les bronches et latmosph` ere (cf. gure 3.9). Cette propri et e dune surface de remplir tout un volume nest pas sans rappeler les courbes pathologiques de Peano ou de Von Koch (g. 3.8). Cest cette analogie avec ces courbes c el` ebres que Mandelbrot utilise pour d enir deux qualit es qui seront pour nous pr ecieuses : la dimension fractale et lhomoth etie interne. De la m eme fac on un ph enom` ene, apparemment ponctuel, pourra avoir une dimension plus grande que 0, et une surface dans lespace pourra avoir une dimension sup erieure a ` 2.
3.4.1 La dimension fractale

Elle exprime la propri et e (soulign ee plus haut) dune courbe qui passe plus ou moins par tous les points dun plan. On conna t de longue date les dimensions 1, 2, ou 3 attach ees respectivement aux courbes, aux surfaces, ou
49
F IG . 3.7 Evolution de la longueur de quelques fronti` eres et c otes en fonction de la mesure utilis ee pour calculer cette longueur (dapr` es [Richardson, 1961] cit ee dans [Mandelbrot, 1977]) - e chelles logarithmiques.
F IG . 3.8 La courbe de von Koch est un cas d ecole de courbe fractale. Elle se construit a ` partir dun segment de droite qui est divis e en 3 et remplac e par 4 segments de taille 1/3. La dimension fractale vaut alors .
!
aux volumes. Mandelbrot postule quil existe des courbes de dimension interm ediaire entre 1 et 2, des surfaces de dimension sup erieure a ` 2, et que ces objets poss` edent justement la propri et e de navoir pas de longueur ou de surface pr ecise, pas plus quun volume na de surface, ou un carr e de longueur. Cette dimension, interm ediaire entre les valeurs enti` eres, a e t e baptis ee du n eologisme fractale an quaucune confusion ne soit faite entre une surface classique (de dimension ). Lune et lautre passent, par exemple, par tous les points dun plan, mais si lune est une vraie fonction de deux variables, lautre nest que fonction dune seule variable (ensemble totalement ordonn e). Comment mesure-t-on une dimension, classique ou fractale ? Tout dabord, conform ement a ` la d emarche math ematique, il nous faut nous munir dune mesure. Cest une op eration en apparence d elicate, mais en pratique
50
tr` es simple. Elle est discut ee dans [Mandelbrot, 1977], et nous nen reprendrons pas les termes ici. Disons simplement que si nous disposons, par exemple, dune famille de confettis de rayons d ecroissants, alors nous sommes a ` m eme d evaluer aussi bien des longueurs ou des surfaces classiques, que des courbes fractales. Pour cela, ayant confront ea ` un e talon universel la taille du confetti (nous le d enoterons ), il ne nous reste plus qu` a recouvrir la courbe de ces confettis, de fac on quaucun point de la courbe ne soit plus visible. Le produit du nombre de confettis par la taille e l ementaire : est une bonne mesure de la grandeur qui nous int eresse lorsque tend vers 0 : longueur ou par exemple. Mesurons ainsi un segment de droite ou une courbe classique. surface par 10, est multipli e par 10 et la longueur totale est constante. Cette variation, lin eaire, de Si lon divise et est caract eristique des dimensions 1. Si lon mesure laire dun carr e, chaque fois que est divis e par 10, il faut 100 fois plus de confettis pour recouvrir la surface. La d ependance quadratique indique une dimension 2. R ep et ee sur une courbe fractale, erience mettra en e vidence une dimension interm ediaire entre 1 et 2 : lexp par exemple, pour la courbe de Von Koch de la gure 3.8, ou bien 1,25 pour la courbe de lAngleterre conform ement a ` la gure 3.7. Ainsi, la dimension fractale est d etermin ee par le graphe de . Si ce graphe est lin eaire la dimension est donn ee par : (3.4)
!
sinon par son asymptote :
'

(3.5)
3.4.2 Lhomoth etie interne

Lhomoth etie interne est une id ee assez intuitive que certaines formes se retrouvent identiques a ` elles-m eme lorsquon les observe a ` des e chelles diff e rentes : 1 de nuage est identique a `1 , la c ote de Bretagne est un massif granitique de quelques centaines de km de long, mais la Pointe du Finist` ere quelle contient semble poss eder les m emes propri et es, de m eme quun rocher isol e de cette Pointe ou un morceau de granit de ce rocher, la courbe de von Koch (gure 3.8) est exactement identique a ` elle m eme lors dune division d echelle de 3. un mouvement brownien observ e pendant 1 s ou pendant 10 s semble le m eme. Lhomoth etie interne peut e tre exacte (g eom etriquement comme pour la courbe de von Koch, ou en loi statistique comme pour le mouvement brownien), ou approch ee, comme pour beaucoup de ph enom` enes physiques. Lorsque plusieurs homoth etie sappliquent a ` une m eme structure, on emploie le terme de cascade dhomoth eties (comme par exemple pour la courbe de von Koch). La dimension (fractale) de lobjet ecessaires pour reconstruire un objet dune et le nombre de structures n taille donn ee a ` partir dune r eplique fois plus petite sont li es par la relation :

(3.6)
Par exemple, un segment de ` segments fois plus petits mis bout a ` bout, un carr droite est identique a e est semblable a ` carr es de c ot e fois plus petit judicieusement assembl es, et il faut segments de taille fois plus petite pour reconstruire un ocon de von Koch.
3.4.3 Que faire de la th eorie fractale ?

Voyons maintenant de quelle fac on ces surprenantes propri et es interviennent lors de l etape d echantillonnage dune image.
51
Tout dabord, lexistence de formes fractales conforte notre opinion que lapproche de Nyquist-Shannon est parfois impuissante a ` rendre compte de la structure dun objet, par le simple fait quil ny a pas de fr equence quelle r limite qui le caract erise de fac on certaine. A esolution faudra-t-il en effet analyser une coupe de poumon pour e valuer la surface des e changes doxyg` ene ? Les seules r eponses rigoureuses seraient, l` a-encore, des majorants bien incompatibles avec nos moyens de traitement : par exemple les plus grosses structures mol eculaires, ou bien les plus nes structures cellulaires. Cest pourquoi, dans de nombreuses e tudes (en biologie, m etallurgie, ou m eme t el ed etection des ressources terrestres), des travaux identiques, men es sur des e chantillonnages diff erents conduisent a ` des r esultats discordants. Le d epouillement automatique des donn ees entra ne souvent une conance trop grande dans les r esultats pour quune remise en question des hypoth` eses fondamentales soit consentie. En second point, lorsquelle est clairement perc ue, la notion de forme fractale permet de r ealiser une e conomie de temps danalyse et de traitement. Pour cela, il nous faut conna tre dune part la dimension fractale de lobjet, dautre part lexistence et la limite de son homoth etie interne. Cette derni` ere connaissance est un des points-clefs de lanalyse et sa connaissance nous est habituellement enseign ee par le sp ecialiste : biologiste, m etallurgiste, etc. On sait que larchitecture intime de lunivers est h et erog` ene : les constructions nucl eaires pr ec` edent les structures atomiques, qui elles-m emes engendrent les e dices mol eculaires, et ainsi de suite. Clairement, de cette architecture d ecoulent les discontinuit es dans les diverses structures, et donc dans les dimensions fractales. La limite dhomoth etie est issue de cette double notion de discontinuit e ; elle nous informe que, jusqu` a une certaine e chelle de r esolution, la fonction des structures est bien celle qui nous concerne ( e changes gazeux dans le cas des poumons). Nous choisissons alors un pas grossier d echantillonnage , tr` es sup erieur a ` la limite qui serait n ecessaire pour rendre compte de la totalit e du ph enom` ene. De la mesure faite a ` cette e chelle (exprim e e en unit e ), et de la dimension fractale D, nous d eduisons alors la valeur vraie (exprim ee en unit es ) par la relation :

(3.7)
F IG . 3.9 Quelques exemples de fractales : arbre bronchique de lhomme recalcul ea ` partir du corps du Human Visual Project par Jorge Marquez. Soulignons a ` ce point la propri et e remarquable du pixel (point e l ementaire dimage) de fournir une mesure universelle (au sens o` u nous lavons entendu au paragraphe 3.4.1). Contrairement au double d ecim` etre, le pixel permet de mesurer non seulement des longueurs ( ), mais aussi des surfaces ( ) ou des volumes ( ). Et l equation 3.5 demeure valable, tant pour des formes classiques que fractales pour variant de 0a ` 3. Ainsi cette notion de forme fractale m erite-t-elle une attention particuli` ere ; elle bouleverse nos sch emas traditionnels de lunivers peupl e de bonnes fonctions, continues, d erivables, mesurables, etc. Elle se montre
52
F IG . 3.10 La for et e tag ee de Peano, une for et fractale articielle.
F IG . 3.11 Corail synth etique et naturel n eanmoins un outil remarquable pour repr esenter beaucoup des objets rencontr es chaque jour. Elle sest montr ee particuli` erement pr ecieuse pour d ecrire les objets de la g eomorphologie : rivi` eres, lignes de cr etes, etc. Enn les approches fractales ont pr et e leur nom a ` des outils de compression et de codage dimages (le codage fractal). Ces techniques utilisent les propri et es du point xe de certaines transformations contractantes du plan (g en eralement des combinaisons dhomoth eties, de rotations et de changements de contraste) [Fisher, 1995]. Cela permet de ne transmettre, pour chaque imagette issue de la sc` ene a ` transmettre, que la seule transformation qui permet dobtenir cette imagette a ` partir dune autre plus grande issue dune autre partie de limage (cascade interne).
53
F IG . 3.12 Electrod eposition de cuivre, cest un exemple de percolation fractale. La cascade dhomoth etie est illustr ee par la petite fen etre de limage gauche, agrandie sur limage droite (dapr` es [Bunde et Havlin, 1994]).
F IG . 3.13 Un lac en for et guyanaise vu par le satellite radar ERS-1 c ESA.
F IG . 3.14 D echarge e lectrique claquant un di elctrique (dapr` es [Bunde et Havlin, 1991]).
54
F IG . 3.15 Foug` ere simul ee par 5 attracteurs superpos es (dapr` es [Peitgen et Saupe, 1988]).)
Chapitre 4
Repr esentations discr` etes

Chapitre r edig e par Isabelle B LOCH
4.1 Introduction
Le traitement des images par ordinateur n ecessite de disposer de repr esentations discr` etes des sc` enes observ ees. On dispose alors dun e chantillonnage de ou dans ou , qui est de plus ni, ce qui justie de repr esenter les images sous forme matricielle. Pour traiter de tels ensembles de points, deux solutions sont possibles : soit on plonge les points discrets de dans , et on les traite comme sils appartenaient a ` un espace continu ; ce sont alors souvent des proc ed es de g eom etrie algorithmique qui sont mis en uvre ; soit on d enit directement les traitements dans lespace discret, en essayant den pr eserver les effets et les propri et es. Le choix de lune ou lautre de ces solutions d epend beaucoup du type de traitement a ` effectuer, du type de repr esentation sur lequel sappuie ce traitement, des propri et es souhait ees, de la complexit e des calculs, etc. Par exemple, on garantit de meilleures propri et es de connexit e avec des rotations continues que des rotations discr` etes. Au contraire, les op erations morphologiques de base sont beaucoup plus simples a ` effectuer dans un espace discret (voir le chapitre 6 sur la morphologie math ematique). Dans les cas o` u les deux approches sont possibles, elles ne sont pas toujours e quivalentes, et il est souvent difcile de garantir que la transformation appliqu ee a ` une version discr` ete dun objet fournira le m eme r esultat que la discr etisation du r esultat de la transformation continue.

Dans ce chapitre, nous nous int eressons surtout aux probl` emes de repr esentations g eom etriques discr` etes, qui serviront de support aux traitements et transformations effectu es directement dans . Des exemples de tels traitements seront abord es en particulier dans le chapitre de morphologie math ematique (chapitre 6). Nous aborderons ici succinctement les pavages et maillages (section 4.2), sur lesquels sont d enies les images discr` etes, puis les questions de topologie (section 4.3), les probl` emes de repr esentations de quelques structures g eom etriques simples, d eterministes (section 4.4) ou al eatoires (section 4.5), et enn la d enition et le calcul de distances discr` etes (section 4.6). Un expos e plus d etaill e sur tous ces points ainsi que sur dautres aspects de la g eom etrie discr` ete en traitement dimages peut e tre trouv e dans [Chassery et Montanvert, 1991, Klette et Rosenfeld, 2004]. Les principes d ecrits peuvent e tre appliqu es aussi bien a ` la synth` ese qu` a lanalyse dimages. La g eom etrie discr` ete constitue toujours un axe de recherche important dans ces deux domaines.
55
56
` CHAPITRE 4. REPRESENTATIONS DISCRETES
4.2 Pavages et maillages

4.2.1 D enitions et contraintes
Un pavage est une partition de lespace continu ( ) en cellules e l ementaires (tout lespace est recouvert par les cellules, et les cellules nont pas dintersection deux a ` deux). Cette d enition, la plus g en erale, peut donner lieu a ` une innit e de solutions si lon nimpose pas de contraintes suppl ementaires sur la forme et la disposition des cellules. En pratique, des contraintes sont impos ees : dune part par les capteurs, dont la surface sensible a g en eralement une structure r eguli` ere, et dautre part par lutilisation que lon souhaite faire de la repr esentation, qui impose une certaine r egularit e et simplicit e, ainsi que certaines propri et es sur le pavage r esultant sur lesquelles nous reviendrons. Deux m ethodes peuvent e tre envisag ees pour construire un tel pavage : 1. La premi` ere consiste a ` se donner une distribution de points dans lespace. Puis a ` chaque point est associ ee une cellule , de telle sorte quelle nintersecte aucune autre cellule et quelle ne laisse pas de vide dans lespace. La solution la plus simple consiste a ` choisir pour lensemble des points de lespace qui sont les plus proches de que de tout autre point de la distribution. Dans le cas o` u la distribution des points est r eguli` ere, on aboutit a ` un pavage classique, tel que ceux que nous verrons dans la section suivante. Dans le cas o` u la distribution est irr eguli` ere, on aboutit a ` un pavage de Vorono , que nous d ecrirons plus en d etails dans la section 4.4. Les points de la distribution peuvent e tre interpr et es comme des germes, a ` partir desquels on fait cro tre des cellules a ` vitesse constante, jusqu` a ce que tout lespace soit rempli (voir gure 4.1).

F IG . 4.1 Deux exemples de construction dun pavage par propagation a ` partir dune distribution de points r eguli` ere.
2. La deuxi` eme solution consiste a ` se donner au contraire un mod` ele a priori de cellule e l ementaire, et a ` reproduire ce mod` ele en juxtaposant les cellules pour construire une partition de lespace [Grunbaum et Shepard, 1989]. Cela nest bien s ur pas possible avec nimporte quel mod` ele de cellule. On impose g en eralement que celui-ci soit un polygone (ou poly` edre) convexe, r egulier, et que dans la juxtaposition les sommets soient en contact avec dautres sommets mais pas avec des ar etes (typiquement, la conguration de la gure 4.2 ne satisfait pas cette derni` ere condition).
4.2. PAVAGES ET MAILLAGES
57
F IG . 4.2 Exemple dune conguration o` u les sommets du pavage ne sont pas en co ncidence avec dautres sommets. Notons quen d eformant ce maillage, on peut obtenir un pavage hexagonal qui est le pavage r egulier associ ea ` cette distribution de points, comme on le verra par la suite.
4.2.2 Pavages plans r eguliers

Les contraintes les plus strictes que lon puisse imposer aux cellules e l ementaires est quelles soient toutes identiques et r eguli` eres , cest-` a-dire quelles soient des polygones dont tous les c ot es et tous les angles soient e gaux, et que chaque sommet soit en contact avec un nombre xe de sommets dautres cellules. Avec de telles cellules, on obtient des pavages dits r eguliers . On montre que, dans le plan, il nexiste que trois types de pavages r eguliers, correspondant respectivement a ` des cellules triangulaires1, carr ees et hexagonales. Ils sont illustr es sur la gure 4.3.

triangulaire
carr
hexagonal
F IG . 4.3 Les trois pavages r eguliers du plan.
4.2.3 Pavages plans semi-r eguliers

Si lon rel ache un peu les contraintes pr ec edentes, en permettant aux cellules d etre de types diff erents (avec des nombres de c ot es pouvant varier dune cellule a ` lautre), tout en conservant le nombre constant de cellules adjacenctes, on obtient des pavages semi-r eguliers [Grunbaum et Shepard, 1989]. Il existe 21 solutions respectant ces contraintes. Seules 11 d enissent effectivement une partition (dont les 3 r eguli` eres vues pr ec edemment). Deux de ces solutions sont illustr ees sur la gure 4.4. Lensemble de ces solutions est d ecrit dans [Chassery et Montanvert, 1991]. Si lon rel ache plus de contraintes, on peut obtenir des pavages non uniformes, ou m eme compl` etement irr eguliers (voir par exemple les dessins dEscher [Locher et al., 1972]).

1 Notons que le pavage triangulaire est r egulier au sens o` u nous lavons d eni, mais quil nest pas uniforme car les triangles nont pas tous la m eme orientation.
58
F IG . 4.4 Deux exemples de congurations semi-r eguli` eres permettant de paver le plan.
4.2.4 Dualit e pavage / maillage

` partir dun pavage, on associe a constituant le pavage un point situ ` lint erieur de A ` chaque cellule e a cette cellule. Par exemple, peut e tre le centre de gravit e de (il sera bien a ` lint erieur de si lon se restreint comme ci-dessus a ` des cellules convexes). Dans ce cas, on retrouve bien s ur des et des qui correspondent a ` la construction du pavage a ` partir dune distribution de points. Ce sont ces points qui sont appel es pixels en traitement dimages. Un maillage est alors d eni de la mani` ere suivante : a ` tout point on associe les points tels que et ont que lon peut construire une ar ete commune (dans le plan). Le maillage est constitu e de tous les segments de cette mani` ere. Ce maillage d enit dans lespace un nouveau pavage, dont les cellules sont centr ees sur les sommets du pavage initial. Il y a donc dualit e entre pavage et maillage. Pour les pavages r eguliers, qui sont les plus utilis es, cette dualit e se traduit de la mani` ere suivante (voir gure 4.5) : le maillage associ e au pavage triangulaire est hexagonal, le maillage associ e au pavage carr e est carr e, le maillage associ e au pavage hexagonal est triangulaire. Le maillage carr e est certainement le plus utilis e. Le maillage hexagonal nest cependant pas sans int er et car il poss` ede de meilleures propri et es disotropie et de topologie que le maillage carr e. Le maillage triangulaire nest en revanche presque jamais utilis e. Dans lespace discret a ` 3 dimensions, le maillage cubique est le plus utilis e. Cest aussi le seul qui soit r egulier. On trouve aussi quelques applications de maillages cubiques a ` faces centr ees ou rhombodod eca edriques.
4.3 Topologie discr` ete

Dans cette section, nous abordons les probl` emes de topologie sur les maillages discrets. Nous verrons en particulier que la topologie discr` ete classique nest pas adapt ee et quune approche fond ee sur la d enition de voisinages est pr ef erable.
4.3.1 Quelques approches

Consid erons tout dabord la topologie discr` ete classique. Pour cette topologie, tout point de lensemble discret consid er e est un ouvert. Comme un ensemble connexe est un ensemble qui ne peut pas se d ecomposer en r eunion de deux ouverts non vides disjoints, les seuls ensembles connexes que lon puisse construire avec cette topologie sont r eduits a ` des singletons. Cependant du point de vue de lanalyse dimages et de la reconnaissance des formes, on a besoin de d enir des objets, que lon consid` ere comme des entit es connexes g en eralement constitu ees de plusieurs points. La topologie discr` ete classique ne permet pas de r epondre a ` ces exigences, et elle nest donc pas adapt ee aux besoins du traitement dimages.
` 4.3. TOPOLOGIE DISCRETE
59
F IG . 4.5 Dualit e entre les maillages et les pavages r eguliers du plan. Plusieurs approches ont e t e tent ees an de d enir des topologies plus satisfaisantes. Nous d ecrivons ici succinctement lune delles [Chassery et Chenin, 1980, Khalimsky et al., 1990]. Elle consiste (dans le plan) a ` construire une base topologique de . Une topologie est alors une classe densembles de telle que chaque e l ement de soit r eunion d enombrable d el ements de la base topologique, et telle que :
2.
1.
Sur une trame carr ee, on peut par de la mani` ere suivante : pour tout exemple construire la base topologique point de , de coordonn ees , on associe a ` lensemble d eni par (voir gure 4.6) :
Les ensembles 1.
2. si et de cette base.
ainsi construits v erient bien les conditions suivantes : ,

sont deux e l ements de la base topologique, alors

est une r eunion d el ements
60
1 1 2 3 4 5 6 7 P 2 3 4 5

6 7 8 i
F IG . 4.6 D enition dune base topologique dans le plan discret sur une trame carr ee. Ce type de construction a un inconv enient majeur : la forme du voisinage induit par les autour de chaque point d epend de la position du point dans lespace. En particulier, la topologie ainsi construite nest pas invariante par translation. De plus, ce type de construction ne garantit pas toutes les propri et es souhait ees, en particulier le th eor` eme de Jordan. Enn, si cette construction reste possible sur une trame triangulaire (voir gure 4.7), elle ne lest pas sur une trame hexagonale.
Q P
F IG . 4.7 D enition dune base topologique dans le plan discret sur une trame triangulaire. Sur cette gure, , , , .

` partir de la notion de voisinage e l 4.3.2 Topologie a ementaire

Pour le traitement dimages, il est donc difcile de d enir des notions topologiques satisfaisantes et op erationnelles a ` partir de la construction douverts. Il est pr ef erable de d enir dabord les notions de voisinage e l ementaire, puis de connexit e, qui est une des notions topologiques essentielles pour linterpr etation des images et la reconnaissance des formes [Rosenfeld, 1970, Rosenfeld, 1979]. Pour cela, on consid` ere limage discr` ete comme un graphe. Les nuds du graphe sont les points discrets (les pixels de limage). Les arcs sont d enis par les relations de voisinage entre les points. Par exemple, sur une trame carr ee, on peut consid erer que deux points sont voisins si une et une seule de leurs cordonn ees diff` ere dune unit e. Chaque point (encadr e sur la gure 4.8 a) a ainsi 4 voisins, et on parle de 4-connexit e. Le graphe correspondant est illustr e sur la gure 4.9. Si lon ajoute dans le graphe les arcs reliant les points aussi en diagonale (dont les deux coordonn ees diff` erent dune unit e), chaque point a alors 8 voisins, et on parle de 8-connexit e (gure 4.8 b). En 4-connexit e, tr` es peu de directions de lespace sont repr esent ees, en 8-connexit e, tous les voisins ne sont pas a ` la m eme distance du point central.
61
(a)
(b)
(c)
F IG . 4.8 Connexit e sur une trame discr` ete carr ee (a : 4-connexit e, b : 8-connexit e), ou hexagonale (c : 6connexit e).
noeuds du graphe arcs dfinissant les voisins et la connexit
F IG . 4.9 Graphe d enissant la 4-connexit e sur une trame carr ee. Sur une trame hexagonale, la connexit e la plus naturelle est la 6-connexit e (gure 4.8 c). Chaque point a 6 voisins qui sont tous a ` m eme distance du point central et les 6 directions repr esent ees sont e quir eparties, ce qui constitue un des avantages de la trame hexagonale. Sur une trame triangulaire, trois types de voisinages e l ementaires peuvent e tre d enis, correspondant respectivement a ` la 3-, 9- et 12-connexit e. Ces d enitions sont illustr ees sur la gure 4.10. Dans une repr esentation matricielle des images, lacc` es aux voisins dun point de coordonn ees se fait tr` es ais ement sur une trame carr ee. Ce sont : en 4-connexit e : les points de coordonn ees , , , , en 8-connexit e : les points de coordonn e es , , , , , , , . Sur une trame hexagonale, lacc` es aux voisins est un peu plus d elicat. En effet, sil est toujours possible de repr esenter une image de mani` ere matricielle, il faut consid erer que, g eom etriquement, les lignes sont d ecal ees les unes par rapport aux autres. Les indices des voisins dun point d ependent donc de la parit e de la ligne sur laquelle se situe le point. erot ees comme lindique la gure 4.11, alors les voisins dun point de Si les lignes sont num coordonn ees sont : si est pair : , , , , , , si est impair : , , , , , . Sur une trame triangulaire, de la m eme mani` ere, les indices des voisins d ependent de la parit e de la ligne sur laquelle se trouve le point consid er e (et bien s ur de la connexit e choisie). Si lon se place maintenant en dimension trois sur une trame cubique, trois types de voisinages e l ementaires sont classiquement d enis, correspondant respectivement a ` la 6-, 18- et 26-connexit e. Si lon repr esente chaque point de limage 3D comme un cube e l ementaire, les 6-voisins correspondent aux cubes adjacents a ` par une face, les 18-voisins comprennent les 6 pr ec edents et ceux qui sont adjacents a ` par une ar ete, et les 26-voisins

&
" $
" & & "
" "
62
noeuds du graphe arcs dfinissant les voisins et la connexit
F IG . 4.10 Graphes d enissant la 8-connexit e sur une trame carr ee, la 6-connexit e sur une trame hexagonale, et les 3-, 9- et 12-connexit es sur une trame triangulaire (seuls quelques arcs sont repr esent es pour la trame triangulaire).
sobtiennent en ajoutant les cubes adjacents par un sommet (voir gure 4.12). Une fois que sont d enis les voisinages e l ementaires, les notions de connexit e sen d eduisent ais ement, gr ace a ` linterpr etation en termes de th eorie des graphes [Berge, 1958]. Un chemin est ainsi d eni comme une suite de sommets du graphe telle que deux points cons ecutifs de la suite soient joints par un arc du graphe, o` u les arcs sont d enis en fonction de la connexit e choisie. Par exemple, sur une trame carr ee, on d enit : un 4-chemin comme une suite de points tels que :
$


1 1 2 3 4 5 1 2 3 4 i
63
F IG . 4.11 Les indices des voisins dun point sur une trame hexagonale d ependent de la parit e de la ligne sur laquelle se trouve le point.
F IG . 4.12 Les trois types de voisinages e l ementaires pour une image 3D d enie sur une trame cubique. un 8-chemin comme une suite de points

tels que :
Les composantes connexes sen d eduisent alors en reprenant les d enitions classiques des graphes. On obtient ainsi sur une trame carr ee : une composante 4-connexe est un ensemble de points tel que pour tout couple de points de , il existe un 4-chemin dextr emit es et et dont tous les points soient dans ; une composante 8-connexe est un ensemble de points tel que pour tout couple de points de , il existe un 8-chemin dextr emit es et et dont tous les points soient dans . Ces d enitions sont illustr ees sur la gure 4.13. De mani` ere analogue, on d enit sur une trame hexagonale les notions de 6-chemin et de composante 6connexe. Sur une trame triangulaire, les chemins peuvent e tre 3-, 9- ou 12-connexes, de m eme que les composantes connexes.

Sur une trame carr ee, des paradoxes peuvent appara tre pour certaines congurations locales de points de lobjet et de son compl ementaire. Sur la gure 4.14, en 8-connexit e, les points a et d de lobjet sont voisins ainsi que les points b et c du compl ementaire. Cela signie que les composantes connexes de lobjet et du compl ementaire se croisent . Si on se place au contraire en 4-connexit e, ni les points a et d, ni les points b et c ne sont voisins,

64
Chemin 4-connexe Chemin 8-connexe
Fond Objets 2 composantes 4-connexes 1 composante 8-connexe
F IG . 4.13 Illustration des d enitions des chemins et composantes connexes sur une trame carr ee, en 4- et 8connexit es. laissant ainsi une zone qui nest ni lobjet ni son compl ementaire. Ce paradoxe peut e tre e vit e si lon consid` ere des connexit es diff erentes pour lobjet et pour son compl ementaire. Sur une trame hexagonale, ce type de ph enom` ene ne se produit pas et on travaille en 6-connexit e aussi bien pour la forme que pour le fond.
a c
b d
a c
b d
F IG . 4.14 Paradoxe sur une trame discr` ete carr ee en 8- et 4-connexit e. Un des r esultats importants qui permet de garantir de bonnes propri et es topologiques aux objets (et d eviter ce type de paradoxe) est le th eor` eme de Jordan. Dans le cas continu, il sexprime sous la forme suivante : toute courbe simple ferm ee s epare lespace en deux composantes connexes, lint erieur et lext erieur de la courbe. Avec les d enitions de la connexit e discr` ete donn ees ci-dessous, on montre les deux r esultats suivants : sur une trame carr ee, tout 4-chemin (respectivement 8-chemin) simple ferm e 2 s epare lespace en deux composantes 8-connexes (respectivement 4-connexes), lint erieur et lext erieur (voir lillustration de la gure 4.15) ; sur une trame hexagonale, tout 6-chemin simple ferm e s epare lespace en deux composantes 6-connexes.
2 Un 4-chemin simple ferm e 17 est un 4-chemin !('0#132 6 54 et seulement si & .

tel que ,
"!#%$
si et seulement si &
!('
, et
est un 4-voisin de
)$
si

Extrieur
65
Intrieur
Chemin 4-connexe Points intrieurs (composante 8-connexe)
F IG . 4.15 Illustration du th eor` eme de Jordan dans le cas continu et dans le cas discret sur une trame carr ee (les points ext erieurs ne sont pas repr esent es).
Le premier de ces r esultats fait appara tre une dualit e entre la 4- et la 8-connexit e [Kong et Rosenfeld, 1989]. Ainsi, pour garantir que le th eor` eme de Jordan soit respect e, il faut changer de connexit e quand on passe dun objet a ` son compl ementaire. On consid erera donc par exemple un objet en 4-connexit e et son compl ementaire en 8-connexit e, ou le contraire. Sur lexemple de la gure 4.15, les points de lint erieur du chemin 4-connexe forment bien une composante 8-connexe, mais deux composantes 4-connexes. Le r esultat nest donc pas vrai si on prend la m eme connexit e pour les points du chemin et pour le compl ementaire du chemin. Le deuxi` eme r esultat montre quau contraire ce type de probl` eme ne se pose pas en 6-connexit e. La trame hexagonale pr esente donc de meilleures propri et es topologiques que la trame carr ee. Sur une trame triangulaire, il existe de mani` ere analogue une dualit e entre la 3- et la 12-connexit e, mais, comme nous lavons soulign e, cette trame est peu usit ee. En dimension 3 sur une trame cubique, il existe une dualit e entre la 6- et la 26-connexit e, et on a un analogue du th eor` eme de Jordan en consid erant cette fois une surface simple ferm ee. La difcult e rencontr ee en 4- et 8-connexit es vient de ce que lappartenance des fronti` eres dun pixel a ` un objet ou a ` son compl ementaire nest pas clairement d enie. Elle peut e tre lev ee dans le cadre des complexes cellulaires [Kovalesky, 1989]. Chaque pixel ou voxel est d ecompos e en e l ements de dimension locale variant de 0 (les sommets) a ` 2 (lint erieur du carr e repr esentant un pixel) ou 3 (lint erieur du cube repr esentant un voxel), et lappartenance de chacun de ses e l ements aux objets et a ` leur compl ementaire est d enie. Ces structures ne posent pas de probl` emes topologiques et le th eor` eme de Jordan est v eri e, ainsi que lillustre la gure 4.16. Ces structures peuvent e galement e tre g en eralis ees a ` trois dimensions [Cointepas et al., 2001]. Il faut cependant noter que ces structures sont un peu plus lourdres a ` manipuler que les pixels ou les voxels car elles sont plus volumineuses et non homog` enes (plusieurs types d el ements, dont les voisinages sont e galement diff erents).
4.3.3 Nombre dEuler : un exemple de caract eristique topologique dun objet

Un objet ou un ensemble de points peut e tre caract eris e par plusieurs types de mesures topologiques. Les plus simples sont le nombre de composantes connexes dont il est constitu e et le nombre de trous quil contient. La diff erence entre ces deux nombres est appel e nombre dEuler, et est utilis e dans des probl` emes de reconnaissance des formes, comme un des attributs qui caract erisent un objet. le nombre de trous, le nombre dEuler Si lon appelle le nombre de composantes connexes dun objet et

66
F IG . 4.16 Le th eor` eme de Jordan est toujours v eri e dans le mod` ele des complexes cellulaires. Chaque pixel et d etermine la connexit e de la courbe est d ecompos e en carr e, ar ete et sommet. La couleur des points noire et celle du fond.

vaut . La connexit e utilis ee pour calculer le nombre de trous et le nombre de composantes connexes doit respecter les contraintes du th eor` eme de Jordan discret. Sur lexemple de la gure 4.17, le nombre dEuler vaut si on consid` ere les objets en 8-connexit e et les trous en 4-connexit e, et 0 si on choisit les conventions inverses.

Objet Trou
F IG . 4.17 Nombre dEuler sur une trame carr ee : si on consid` ere les objets en 8-connexit e et les trous en 4 connexit e, et , donc . Avec les conventions inverses, et , donc .

Le nombre dEuler peut e tre calcul e par simple d enombrement de congurations locales, d ecrites dans la gure 4.18. Avec les notations de cette gure, on montre que : si on consid` ere les objets en 8-connexit e et les trous en 4-connexit e, alors :

si on consid` ere les objets en 4-connexit e et les trous en 8-connexit e, alors :

Le lecteur pourra v erier les r esultats de ces formules sur lexemple de la gure 4.17. Il est remarquable que ces caract eristiques ne fassent intervenir que des points de lobjet, alors que le nombre dEuler implique a ` la fois lobjet et son compl ementaire. Cet exemple est e galement particuli` erement int eressant
4.4. REPRESENTATIONS GEOM ETRIQUES

v e
67
F IG . 4.18 Congurations locales pour le calcul du nombre dEuler.
car il montre quil est possible de calculer le nombre dEuler uniquement avec des caract eristiques locales, bien quil sagisse dune mesure globale sur un objet. Le calcul est donc beaucoup plus facile, et la mise en uvre informatique avec ces caract eristiques locales est imm ediate, alors que le calcul direct des nombres de composantes connexes et de trous serait plus difcile. Cet exemple illustre ainsi une id ee quon retrouvera souvent en traitement dimages, qui consiste a ` ramener des notions globales a ` des calculs qui peuvent se faire simplement localement. On voit appara tre ici un int er et suppl ementaire de la notion de voisinages e l ementaires, puisque ce sont les points d enis par ces voisinages qui interviennent dans les calculs locaux.
4.4 Repr esentations g eom etriques

Si la plupart des entit es g eom etriques simples (droites, cercles, courbes) sont parfaitement ma tris ees dans le cas continu, leurs repr esentations discr` etes soul` event deux types de probl` emes : comment repr esenter sur une trame discr` ete une entit e g eom etrique continue, et quelles sont les propri et es de cette repr esentation par rapport aux propri et es v eri ees dans le cas continu ? a ` partir dune entit e g eom etrique discr` ete, quelles sont les repr esentations continues qui lui correspondent ? Si lon prend lexemple de la droite, il est possible de se donner des r` egles (comme on le verra plus loin) qui permettent de d eterminer les points de la trame repr esentant une droite continue. Inversement, e tant donn e un ensemble de points de la trame, on peut v erier sils correspondent ou non a ` la discr etisation dune droite continue suivant ces r` egles. Si cest le cas, on trouvera en g en eral quil ny a pas unicit e de la droite continue dont lensemble de points est la discr etisation, mais que les droites possibles constituent tout un faisceau. On pourra se reporter a ` la r ef erence [Chassery et Montanvert, 1991] pour une e tude de ces probl` emes dans le cas de courbes quelconques. Ici, nous nous restreignons a ` l etude des droites et des cercles. Puis nous abordons les pavages de Vorono et les triangulations de Delaunay, qui permettent de repr esenter les images de mani` ere structur ee, non pas syst ematique comme avec les pavages r eguliers, mais en fonction du contenu des images. Dans toute la suite, on se placera dans le cas 2D, sur une trame carr ee. Les r esultats peuvent en g en eral e tre e tendus a ` dautres types de trames et a ` des espaces de dimension sup erieure.
68
4.4.1 Discr etisation dune droite continue

Une premi` ere m ethode de discr etisation des droites ethode dite du pav e semi-ouvert . Le pav e semiest la m ouvert associ e a ` un point discret de coordonn e es est lensemble des points de dont les coordonn ees v erient :

"
La m ethode de discr etisation par pav e semi-ouvert consiste alors a ` garder dans la repr esentation discr` ete tout point de la trame tel que le pav e semi-ouvert qui lui est associ e ait une intersection non vide avec lentit ea ` discr etiser. La gure 4.19 illustre le r esultat dans le cas dun segment de droite.
Pav semi-ouvert Reprsentation discrte de la droite continue
F IG . 4.19 Discr etisation dun segment de droite par la m ethode du pav e semi-ouvert. Lensemble discret ainsi obtenu ne constitue pas n ecessairement un chemin simple au sens de la 4- ou de la 8-connexit e. Sur lexemple de la gure 4.19, lensemble de points obtenu nest pas 4-connexe, et au sens de la 8-connexit e, certains points ont plus de 2 voisins. Si lon cherche maintenant a ` discr etiser la fronti` ere du demi-plan ferm e limit e par la droite (plut ot que la droite elle-m eme), en imposant une contrainte dunilat eralit e, on obtient cette fois un chemin 8-connexe [Dorst et Smeulders, 1984]. La m ethode consiste a ` garder les points discrets sils sont situ es dun m eme c ot e de la droite et tels que le segment vertical du maillage qui en part coupe la droite. Ce proc ed e est illustr e sur la gure 4.20. On remarquera que le r esultat obtenu est diff erent de celui obtenu avec la m ethode du pav e semi-ouvert, partant de la m eme droite continue. Il est possible de combiner ces deux m ethodes, en associant a ` chaque point du maillage un segment semiouvert, centr e en ce point et vertical. Un point discret est alors conserv e si le segment qui en est issu intersecte la droite continue. Le r esultat de ce proc ed e est illustr e sur la gure 4.21. On obtient toujours un chemin 8-connexe, mais o` u les points discrets sont r epartis des deux c ot es de la droite continue3.
3 Le r esultat est e quivalent a ` celui quon obtiendrait avec lalgorithme de Bresenham, fr equemment utilis e en synth` ese dimages, qui minimise lerreur locale en chacun des points du trac e [H egron, 1985].
69
Reprsentation discrte de la droite continue
F IG . 4.20 Discr etisation dun segment de droite par la contrainte dunilat eralit e.
Reprsentation discrte de la droite continue
F IG . 4.21 Discr etisation dun segment de droite par la m ethode de segment vertical semi-ouvert.
4.4.2 Caract erisation dun segment de droite discret

Consid erons maintenant le probl` eme inverse : e tant donn e un ensemble de points discrets, est-il la discr etisation dun segment de droite continue ? En utilisant les caract erisations pr ec edentes, cela revient a ` v erier quil existe un segment de droite dont la discr etisation selon les r` egles choisies donne exactement lensemble des points discrets. Cette d emarche nest pas toujours tr` es op erationnelle, et on lui pr ef` ere deux autres m ethodes, lune reposant sur la propri et e de la corde, et lautre sur une description syntaxique dun segment de droite discret.

ee). On dit que Soit un ensemble de points discrets (toujours en dimension deux et sur une trame carr la propri et e de la corde si et seulement si :
v erie
(continu) joignant a o` u d esigne le segment de ` , et norme dans ( ).

d esigne la distance obtenue a ` partir de la
La gure 4.22 pr esente un cas o` u la propri et e de la corde est v eri ee et un cas o` u elle ne lest pas.
70
Q R P
F IG . 4.22 Lensemble de points discrets de gauche v erie la propri et e de la corde, celui de droite ne la v erie pas (le point du segment est a ` une distance de plus de 1 de tout point discret de ).

Un segment discret v eriant la propri et e de la corde satisfait aux caract eristiques utilis ees dans la m ethode de discr etisation du segment semi-ouvert [Rosenfeld, 1974, Ronse, 1985, Santalo, 1940]. Une deuxi` eme caract erisation op erationnelle de segments de droite discrets repose sur leur description syntaxique [Pham, 1986]. En effet, un segment de droite discret est constitu e dune suite de points, que lon peut suivre en observant les changements de direction. La caract erisation est alors la suivante : on appelle section une sous-suite de points maximale sans changement de direction (les 8 directions possibles sont celles d enies par la 8-connexit e sur la trame carr ee, comme lindique la gure 4.23), dans un segment de droite discret, les sections ne peuvent avoir que deux directions distinctes, qui sont cons ecutives (selon le sch ema de la gure 4.23), pour une de ces directions, les sections sont toutes de longueur 1, et pour lautre direction, les sections sont , o` u la valeur de d epend de la pente de la droite. de longueur ou On peut donc utiliser cette caract erisation, illustr ee sur la gure 4.24, pour v erier si lensemble de points consid er e est bien un segment de droite discret.

F IG . 4.23 Les 8 directions possibles sur une trame carr ee. Deux directions sont cons ecutives si leurs num eros diff` erent de 1 (modulo 8).
4.4.3 Droites analytiques discr` etes

On consid` ere ici le probl` eme des droites discr` etes dun point de vue diff erent. Au lieu dessayer de discr etiser une droite par une suite de points connexes, on cherche au contraire a ` savoir quels sont les points dintersection avec la trame dune droite continue quelconque. sera alors rep esent ee par les points dintersection avec les points du maillage. Une droite d equation
71
n+1
F IG . 4.24 Caract erisation syntaxique dun segment de droite discret. Pour que cette intersection soit non vide, il faut que la pente de la droite soit de la forme :
avec et entiers, premiers entre eux, et v eriant :
si limage est de taille , et pour une pente de droite inf erieure a ` 1 (les autres cas sobtiennent par sym etrie). Les pentes de droites possibles forment donc une suite de Farey dordre , not e e [Franel, 1924]. Pour une image de taille , les droites possibles telles que sont repr esent ees sur la gure 4.25 ; on a dans ce cas :

Le nombre de droites possibles augmente bien s ur avec la taille de limage. Par exemple pour
Le cardinal de ecutifs de En particulier, si les fractions , , sont des termes cons
$ ! % . Des propri est de lordre de et es des suites de Farey permettent de les construire.
, on a :
# # #

, on a les relations suivantes :
On peut ainsi calculer le nombre de droites possibles suivant la taille de limage, mais aussi les nombres doccurrences de ces droites en fonction de la pente . En effet, si lon essaye de retrouver une droite dans une image a ` partir de deux points discrets, on trouvera plus souvent certaines droites que dautres. Par exemple, les droites de pente 0 et 1 sur la gure 4.25 seront obtenues pour plus de couples de points que les autres droites. Pour certaines transformations, ce ph enom` ene constitue un v eritable biais li ea ` la discr etisation dont il va falloir tenir compte. Par exemple, si lon essaye de d etecter des contours rectilignes en comptant les couples de points
72
p/q = 0
p/q = 1/3
p/q = 1/2
p/q = 2/3

p/q = 1
F IG . 4.25 Les droites possibles (dintersection non vide avec lensemble des points de la trame) sur une image .
qui contribuent a ` un contour dorientation donn ee (transformation de Hough [Ma tre, 1985a, Ma tre, 1986], voir chapitre 14), on d etectera beaucoup plus facilement les contours de pente 0 ou 1 que des contours de pente tr` es faible par exemple. Si lon cherche maintenant quelles sont les longueurs possibles de segments discrets, on arrive a ` des conclusions de m eme type. Soit le carr e dune longueur de segment. est obtenu comme la distance quadratique entre deux points discrets, donc de coordonn ees enti` eres. est donc solution dune e quation diophantienne de la forme :
avec et entiers. On retrouvera pour les cercles le m eme type d equation, qui sera e tudi e plus en d etails a ` cette occasion. Cette e quation na pas toujours de solution. En effet, on constate que, suivant la parit e de et , est congru a ` 0, 1 ou 2 modulo 4. Les valeurs de qui sont congrues a ` 3 modulo 4 ne peuvent donc jamais e tre obtenues. La gure 4.26 illustre lirr egularit e des nombres doccurrences de sur une image et sur une image . La d ecroissance g en erale des courbes obtenues est li ee au fait que les images sont born ees. Pour plus de d etails sur les droites et courbes discr` etes, on pourra consulter [Debled-Rennesson et Reveill` es, 1995].

4.4.4 Cercles discrets

De la m eme mani` ere que pour les droites, le nombre de points discrets qui sont situ es sur un cercle continu peut varier beaucoup, et de mani` ere irr eguli` ere suivant le rayon. Pour certaines valeurs du rayon, il ny a pas de solution. Ici encore, l equation a ` r esoudre est : o` u , et sont entiers, repr esente le carr e du rayon et la distance quadratique dun point discret au centre du cercle (on suppose que le centre co ncide avec un des points de la trame). On trouve ainsi 4 points sur un cercle de rayon , 4 points pour , aucun point pour , etc., comme lillustre la gure 4.27.
73
F IG . 4.26 Distribution des carr es des longueurs des segments discrets sur une image .

et sur une image
n=1 n=2 n=3
F IG . 4.27 Intersection de cercles continus avec des points de la trame carr ee. Le nombre de solutions de cette e quation est donn e par nombres premiers :
o` u est d ecompos e en facteurs premiers sous la forme :
#

, calcul ea ` partir de la d ecomposition de

en
o` u les repr esentent les facteurs premiers congrus a ` 1 modulo 4, et les ceux qui sont congrus a ` 3 modulo 4. Par exemple, pour on obtient 8 points, pour et on obtient 12 points. En effet, est congru a ` 1 modulo 4. Le seul terme qui intervient dans correspond donc a ` , avec et $ ,un . On remarque dans ces formules que, d` e s quintervient dans la d e composition de terme congru a ` 3 modulo 4 avec un exposant impair, alors .

#
En pratique, la d enition dun cercle discret limit ee aux points dintersection avec le maillage est tr` es restrictive. On pr ef` ere donc souvent consid erer que le cercle a une certaine e paisseur , et donc regarder plut ot lintersection dune couronne circulaire avec les points du maillage4 .
4 On
peut bien s ur faire la m eme chose avec des droites et des segments, en consid erant des bandes.
74 Si
est l epaisseur de la couronne, on cherche alors le nombre de points satisfaisant l equation :
toujours avec
et

entiers. Le nombre de solutions est simplement donn e par :
Par et , on trouve . Ici encore, la grande variabilit e de la fonction exemple, pour entra ne des biais dans les m ethodes danalyse ou de synth` ese dimages, ainsi que de reconnaissance des formes, quil ne faut pas n egliger. Il existe des m ethodes de correction, prenant en compte la forme des distributions obtenues. Pour plus de d etails sur les cercles et sph` eres discrets, on pourra consulter [Andres, 1994].
4.4.5 Pavage de Vorono et triangulation de Delaunay
Nous nous attachons maintenant a ` des repr esentations structur ees adapt ees au contenu des images. Nous pr esentons ici les pavages de Vorono , qui constituent un exemple de syst` eme de repr esentation structur ee pour linterpr etation de formes. Nous en verrons un autre exemple tr` es diff erent avec le squelette dans le chapitre 6 sur la morphologie math ematique. ` chacun de ces germes, on associe un , appel es germes. A On se donne un ensemble de points domaine du plan d eni par :

$
d esigne une distance du plan. Si lon choisit pour la distance euclidienne, alors sont des polygones convexes. En effet, si les lon prend tout dabord , alors la s eparation entre et est la m ediatrice des deux points. Les pour quelconque sont donc des intersections de demi-plans, donc des polygones convexes (pas forc ement born es). La gure 4.28 illustre cette d enition (pour la distance euclidienne), ainsi que la convexit e des pav es obtenus. Notons que le pavage obtenu correspond a ` la premi` ere des m ethodes d ecrites pour construire des pavages dans la section 4.2. Les pav es sont appel es polygones de Vorono , et sont form es dar etes et de sommets de Vorono . La d enition du pavage de Vorono se g en eralise directement a ` des germes quelconques (plus n ecessairement ponctuels) mais, dans ce cas, les pav es obtenus ne sont pas n ecessairement polygonaux. Dans le cas discret, la d enition du pavage de Vorono demeure inchang ee. Cependant, au lieu de la distance euclidienne, on en utilise g en eralement des approximations : les distances discr` etes, telles quelles seront vues dans la section 4.6, qui permettent des calculs rapides tout en fournissant une bonne approximation de la distance euclidienne. Le pavage de Vorono a les propri et es suivantes [Klein, 1989] : 1. sil nexiste pas de quadruplets de germes cocirculaires, tout sommet de Vorono est e quidistant de 3 germes exactement, 2. tout sommet du diagramme de Vorono est centre dun cercle passant par 3 germes et ne contenant aucun autre germe, ce cercle est appel e cercle de Delaunay, 3. est non born e si et seulement si appartient a ` la fronti` ere de lenveloppe convexe des . Si lon joint par des segments les 3 germes e quidistants dun sommet de Vorono , on obtient une triangulation de lensemble de , appel ee triangulation de Delaunay. Le r esultat obtenu pour les points de la gure 4.28 est illustr e sur la gure 4.29.
o` u
!

75
germe polygone de Vorono arte sommet
F IG . 4.28 Pavage de Vorono a ` partir dun ensemble de points.
F IG . 4.29 Triangulation de Delaunay dun ensemble de points.
La triangulation de Delaunay et le pavage de Vorono sont deux structures de lespace duales lune de lautre, comme lillustre la gure 4.30. En effet, a ` chaque ar ete de Vorono correspond une ar ete de la triangulation, qui lui est orthogonale ; chaque germe est un sommet de la triangulation, et chaque sommet de Vorono est le centre dun triangle de Delaunay. La deuxi` eme propri et e est illustr ee sur la gure 4.31. La triangulation de Delaunay est celle qui v erie que le cercle circonscrit a ` chaque triangle ne contienne aucun sommet de la triangulation. On a donc ici une premi` ere application g eom etrique du pavage de Vorono et de la triangulation de Delaunay. La troisi` eme propri et e permet de d eduire directement lenveloppe convexe dun ensemble de points, ce qui nous donne une deuxi` eme application g eom etrique de ces deux notions. Il existe beaucoup dautres applications. Nous nen mentionnerons plus quune ici, qui concerne le calcul de la
76
triangulation de Delaunay pavage de Vorono
F IG . 4.30 Dualit e entre triangulation de Delaunay et pavage de Vorono .
germe cercle de Delaunay triangulation de Delaunay
F IG . 4.31 Propri et es g eom etriques de la triangulation de Delaunay.
distance minimum entre deux ensembles de points
o` u d esigne la distance euclidienne entre les points et . Pour calculer cette distance minimum, il suft deffectuer la triangulation de Delaunay de la r eunion de tous les points , et de d eterminer lar ete la plus courte ayant une extr emit e dans et lautre dans .

et

. Cette distance est d enie par :
Enn, mentionnons quelques algorithmes de calcul du pavage de Vorono [Toussaint, 1985, Preparata et Shamos, 1988]. Il existe des algorithmes r ecursifs qui sont optimaux (en termes de complexit e algorithmique), mais dont la mise en uvre nest pas tr` es facile. Il existe e galement des algorithmes incr ementaux, dont la complexit e dans le cas le pire nest pas optimale, mais qui sont plus simples a ` mettre en uvre [Green et Sibson, 1978]. Le principe consiste a ` rajouter les points un a ` un et a ` modier le pavage pr ec edemment obtenu. Lint er et est que lajout point dun nentra ne que des modications locales du pavage. Supposons que lon connaisse le pavage de . Lorsquon ajoute , on commence par rechercher le germe ( ) le plus proche de . La m ediatrice de est le support dune nouvelle ar ete du pavage. En se donnant un sens de parcours de cette m ediatrice, on recherche lintersection avec une ar ete du pavage pr ec edent. Le germe correspondant, voisin de , est le nouveau point et on it` ere la proc edure jusqu` a ce quon revienne au point de d epart. On tourne ainsi

4.5. EXEMPLES DE STRUCTURES ALEATOIRES
77
autour de pour construire le pav e qui lui est associ e. Les parties dar etes du pavage pr ec edent qui tombent dans ce nouveau pav e sont alors supprim ees. La gure 4.32 illustre le principe de cette construction.
nouveau germe nouvelles artes de Vorono
F IG . 4.32 Construction incr ementale du pavage de Vorono .
4.5 Exemples de structures al eatoires

Dans nombre dapplications, en particulier pour lanalyse de textures, quelles soient binaires ou a ` niveaux de gris, il est n ecessaire de g en erer des germes al eatoires dans limage. Une des structures al eatoires ponctuelles les plus utilis ees repose sur des distributions de Poisson 5 . Une distribution de points de Poisson v erie et es suivantes [Serra, 1982a] : les propri si est un compact, et la variable al eatoire es dans , alors compte les points de Poisson tomb qui est une variable al eatoire desp erance , o` u est la densit e du processus de Poisson et le volume du compact (sa surface dans le cas du plan) ; si et sont deux compacts tels que et sont deux variables al eatoires , alors ind ependantes ; la variable al eatoire , pour compact v erie :
avec : , (dans densit e constante, ); le cas dune e tant donn es points dans , suit une loi uniforme sur . Si lon essaye de g en eraliser la notion de points de Poisson a ` des structures plus complexes, on est confront ea ` des difcult es de g en eration de ces structures. Par exemple, la g en eration de droites de Poisson nest pas imm ediate. Lid ee la plus simple serait de se donner une distribution de points de Poisson dans le plan, et en chaque point, de tracer une droite dont la direction est choisie de mani` ere uniforme. Malheureusement la distribution de droites ainsi obtenue nest pas de Poisson. Une autre solution, plus compliqu ee mais fournissant effectivement une distribution de Poisson, consiste a ` faire touner un axe autour dun point . Quand balaye un secteur angulaire
5 Elles
constituent par exemple une des composantes des sch emas bool eens que nous arborderons au chapitre 6.
78
, et on trace les droites orthogonales a ` passant pas ces points. On obtient ainsi un ensemble de droites de Poisson. Elles peuvent e tre utilis ees par exemple pour d enir des pavages al eatoires isotropes.
e , on tire sur la droite des points de Poisson de densit
4.6 Fonction distance

La fonction distance est une transformation qui permet de passer dune image binaire a ` une image num erique o` u la valeur de chaque point repr esente la distance a ` lobjet le plus proche. Bien que le concept soit global, la fonction distance peut e tre calcul ee de mani` ere locale en propageant des distances locales (entre points voisins) d enies dans un masque. Ce type dalgorithme e vite de calculer de mani` ere exhaustive les distances dun point a ` tous les points de lobjet pour en trouver le minimum, ce qui serait prohibitivement long. La contre-partie est quon ne calcule alors quune approximation de la distance euclidienne. Les exigences sont alors dobtenir, par des algorithmes rapides, une bonne approximation de la distance euclidienne. Ces m ethodes, appel ees aussi distances du chanfrein [Borgefors, 1996], sont un exemple o` u un proc ed e algorithmique permet de lever les difcult es li ees a ` la discr etisation de lespace. Nous verrons dans le chapitre 6 que la fonction distance a de nombreuses applications en morphologie math ematique (outre toutes les applications n ecessitant une estimation de la distance entre objets comme le recalage).
4.6.1 D enition de distances discr` etes

Les distances discr` etes sont d enies comme des distances sur un graphe, dans lequel les nuds sont les pixels ou voxels, et les arcs sont d enis par un ensemble de vecteurs de base. Ils peuvent repr esenter les relations de connexit ee l ementaires (par exemple 4 ou 8 connexit e), mais e galement relier des points plus e loign es. Ils repr esentent les directions selon lesquelles on peut se d eplacer pour aller dun point a ` un autre. Soit lensemble de ces vecteurs de base, qui engendrent le graphe, et auxquels on associe des longueurs . On impose les conditions suivantes : , , . On d enit alors la distance entre deux nuds et (deux points) comme :

des axes de coordonn ees). Cette distance est exactement la longueur du plus court chemin entre et sur le graphe erier ais ement que toutes les propri et es dune distance sont bien satisfaites. engendr e par . On peut v En pratique, les et sont repr esent es par des masques. Chaque point du masque est lextr emit e dun et a pour coefcient le correspondant, qui repr esente la distance locale entre ce point et le point central du masque (celui-ci est affect e du coefcient 0).
si est la longueur associ o` u est un facteur d echelle (typiquement ee au vecteur e l e selon un mentaire

4.6.2 Exemples
Pour la qualit e de lapproximation, il est possible de jouer sur deux param` etres : la taille du masque (donc le nombre de directions repr esent ees, ou encore le nombre de ) et les coefcients du masque (donc les ). Plusieurs crit` eres ont e t e propos es pour estimer cette qualit e, le plus fr equemment utilis ee tant de minimiser le maximum de la diff erence avec la distance euclidienne. Les masques les plus employ es sont illustr es sur la gure 4.33. Les deux
4.6. FONCTION DISTANCE
79
premiers correspondent respectivement a ` la 4- et a ` la 8-connexit e sur une trame carr ee. Le troisi` eme (gure 4.33 c) permet davoir une erreur faible ( %) par rapport a ` la distance euclidienne en modiant les coefcients (toutes les distances sont alors multipli ees par 3). Le dernier (gure 4.33 d) donne une erreur inf erieure a ` 2% en jouant a ` la fois sur les coefcients et sur la taille du masque (toutes les distances sont alors multipli ees par 5).
11 1 1 0 1 1 1 1 1 1 0 1 1 1 1 4 3 4 3 0 3 4 3 4 11 11 7 5 7 11 5 0 5
11 7 5 7 11 11 11
F IG . 4.33 Exemples de masques pour la distance du chanfrein.
4.6.3 Algorithmes de calcul

Une premi` ere famille dalgorithmes op` ere sur une repr esentation classique de limage, sous forme de tableau. Les algorithmes de cette famille peuvent e tre de deux types : parall` ele ou s equentiel. Nous les illustrons sur le probl` eme du calcul de la fonction distance (distance de chaque point de limage au point des objets le plus proche, au sens de la distance discr` ete d enie plus haut). Si repr esente limage a ` lit eration et le masque choisi, lalgorithme parall` ele sexprime de la mani` ere suivante : les points de lobjet sont mis a ` 0 et les points du compl e mentaire a ` une valeur innie (en pratique, la plus grande valeur stockable), pour former limage ; puis la formule suivante est it er ee jusqu` a convergence :

support

Linconv enient majeur de cet algorithme est que le nombre dit erations d epend de la taille de limage, de la taille de lobjet et de sa forme. De plus deux images doivent e tre gard ees en m emoire. Cet algorithme sapplique a ` nimporte quelle trame et nimporte quel masque. Lalgorithme s equentiel ne n ecessite que deux it erations. Il proc` ede en deux balayages en sens oppos es de limage et le masque est divis e en deux parties et contenant les points d e j` a examin e s dans le sens courant de balayage. Pour , on effectue lop eration suivante ( e tant calcul ee comme pr ec edemment) :

support

Cet algorithme v erie lexigence de la rapidit e. Il ne n ecessite quune image en m emoire et sapplique e galement a ` nimporte quelle trame et nimporte quel masque. Une deuxi` eme famille dalgorithmes repose sur les contours des objets. En effet, les points situ es a ` lint erieur des objets ont toujours une distance nulle a ` lobjet, et les points les plus proches des points ext erieurs aux objets sont toujours des points situ es sur les contours des objets. Ainsi, seuls ceux-ci interviennent r eellement dans le calcul. Un premier type dalgorithme dans cette famille repose sur une structure de cha ne pour repr esenter les contours des objets. Le principe du calcul de la fonction distance consiste a ` d eplacer ces contours par des r` egles de r ee criture, pour d eterminer successivement les points a ` une distance 1 des objets, puis les points a ` une distance
80
2, etc. [Vincent, 1992]. Une e tape dajustement est parfois n ecessaire, par exemple quand le d eplacement dun contour conduit a ` connecter deux objets. Ce type dalgorithme ne n ecessite quune image en m emoire. Lacc` es aux voisins doit e tre facile car il est fr equemment utilis e dans les r` egles de r e- ecriture. Il est tr` es rapide, mais ne peut pas e tre g en eralis ea ` des images 3D car il ny a pas dordre naturel sur les points de la surface dun objet 3D permettant de les repr esenter sous forme de cha ne. Les r` egles de r e- ecriture et dajustement comportent beaucoup de cas particuliers et la proc edure compl` ete est donc un peu d elicate. Un deuxi` eme type dalgorithme repose sur une repr esentation des points de contours sous la forme dune simple le dattente FIFO (rst in, rst out). Cette pile est initialis ee par les points de contours des objets (lordre na pas dimportance). Lalgorithme extrait alors le premier point de la pile, et recherche ses voisins. Pour chaque voisin , si celui-ci est a ` lext erieur des objets, il est ajout ea ` la pile, et on lui affecte une valeur de distance qui vaut ). Cet algorithme est e celle de plus la distance locale entre et ( si galement tr` es rapide, g en eralisable a ` 3D, et n ecessite e galement un acc` es rapide aux voisins.
Notons que ces diff erentes classes dalgorithmes sont utilis ees pour de nombreuses autres transformations.
Chapitre 5
Restauration des images

Chapitre r edig e par Henri M A I TRE La restauration des images est lop eration qui corrige des images d egrad ees et reconstruit un signal de bonne qualit ea ` partir dun signal de m ediocre qualit e. On distingue parfois la restauration dimage de lam elioration dimages en ce que la seconde sattache a ` corriger des d efauts g en eralement inconnus par des techniques heuristiques tandis que la seconde se consacre a ` corriger des d efauts connus par inversion du d efaut. N eanmoins, les progr` es r ecents de la restauration permettent aujourdhui denvisager des restaurations aveugles dans lesquelles le d efaut est inconnu. Mais la restauration aveugle partage avec la restauration lobjectif dinverser le d efaut, d efaut qui est donc appris au cours du processus dinversion. La pr eoccupation de conna tre le d efaut nexiste pas en am elioration et les traitements qui y sont propos es sont souvent moins formalis es. Ils sont pr esent es au chapitre 10. L equation fondamentale de la restauration relie une image originale a ` une image d egrad ee par linterm ediaire dun op erateur : (5.1)
Une e quation aussi g en erale ne poss` ede pas de solution universelle et lon est amen ea ` r eduire le probl` eme au seul cas o` u: est un op erateur lin eaire ; est un op erateur spatialement invariant. Dans ces conditions, on montre que l equation 5.1 prend alors la forme dune convolution :

o` u est la r eponse impulsionnelle du d efaut. Cest cette seule op eration que nous traiterons dans ce chapitre. Pour cette raison, la restauration sera r eduite pour nous a ` une op eration de d econvolution ou de ltrage. De plus nous ne sommes concern es ici que par le cas de d efauts parfaitement connus, cest-` a-dire pour lesquels nous disposons de la r eponse impulsionnelle . Nous allons, dans ce chapitre, examiner tout dabord linversion de l equation pr ec edente. Nous e tudierons ensuite les conditions pour que la restauration dun signal se passe bien. Enn nous proposerons des techniques pour e valuer le d efaut entachant limage, d efaut que nous aurons jusqualors suppos e connu.

(5.2)
5.1 Le ltrage inverse

Nous consid ererons tout dabord la restauration des signaux monodimensionnels et repousserons laspect biet tri-dimensionnel a ` la section 5.3. Nous allons examiner deux fac ons diff erentes daborder ce probl` eme : dune part de fac on analytique, dautre part de fac on alg ebrique et nous soulignerons les correspondances entre elles. 81
82
CHAPITRE 5. RESTAURATION DES IMAGES
5.1.1 Approche analytique

L equation 5.2 se r ecrit de fac on d evelopp ee sous la forme :

Par TF, cette e quation nous donne :
"

(5.3)
qui, si toutes les conditions sont remplies, (nous y reviendrons plus loin), permet dobtenir une estim ee TF de par :
puis, par TF inverse, une estim ee
de
de la

Nous voyons sont remplies (existence du ltre , existence de la TF inverse), le que, si toutes les conditions signal restaur e et le signal id eal sont e gaux. Il y a restauration parfaite. Cette restauration est obtenue par ltrage lin eaire de limage d efectueuse. Logiquement, le ltre est appel e ltre inverse, sa fonction de transfert est en effet linverse de la fonction de transfert du d efaut . Nous reviendrons plus loin sur les probl` emes associ es aux conditions dexistence du ltre inverse :
(5.4)
(5.5)
5.1.2 Approche alg ebrique

Dans cette approche, nous supposons les signaux e chantillonn es conform ement aux recommandations e tablies dans le chapitre 3 et repr esent es par des vecteurs1 . Nous reviendrons e galement plus tard sur les cons equences de cet e chantillonnage. L equation 5.3 peut se r ecrire de fac on discr` ete sous la forme :

soit, en d enissant par
la matrice de terme g en eral

(5.6)
:
(5.7)
sous une forme vectorielle :
(5.8)
Cette e quation fournit une solution imm ediate au probl` eme de restauration, par inversion dun syst` eme lin eaire (nous supposerons l` a-aussi que les conditions de cette inversion existent) : (5.9)
1 Comme
aux chapitres pr ec edents, nous repr esenterons les vecteurs par des caract` eres gras lorsquil y aura un risque dambigu t e
5.1. LE FILTRAGE INVERSE
83
5.1.3 Discussion
On voit ainsi que selon que lon choisit une approche discr` ete (alg ebrique), ou continue (analytique), on est conduit a ` des solutions en apparence diff erentes : l equation 5.4 ou l equation 5.9. Notons tout dabord que la nature continue du signal nest pas la cause des outils diff erents employ es puisque, a ` partir de l equation 5.6, il est e galement possible dappliquer une TF aux deux membres de l equation pour aboutir a ` une solution, discr` ete, mais mettant en uvre des transform ees de Fourier et non des inverses de matrices. Expliquons en quoi ces deux approches sont bien les deux faces dun m eme probl` eme [Andrews et Hunt, 1977]. L equation 5.7 exprime la propri et e dinvariance par translation du d efaut ; la matrice est une matrice de T oplitz (nous la noterons pour cela ) : elle s ecrit sous la forme remarquable :
$ $ . . . ... ...

. . . .. . ..

$
. . .
(5.10)
La forme des matrices T oplitz rappelle celle des matrices circulantes. Elles nen diff` erent que par les termes repli es aux coins sup erieur droit et inf erieur gauche. Une matrice circulante construite sur , au lieu dutiliser la d enition 5.7, a pour d enition :
o` u
est la dimension de la matrice, ce qui conduit a `:

$ . . . . . . . .. .. .
. . . .. .
(5.11)

..
. . .
Il est connu que les matrices circulantes ont toutes pour vecteurs propres les racines de lunit e [Lelong-Ferrand et Arnaudi` es, 1971], et ce qui permet de les e crire : , avec :
$
$
Leurs valeurs propres valent :
On montre de plus que les matrices et sont asymptotiquement e quivalentes, sous les conditions suivantes, que nous discuterons plus loin : "! que la dimension du syst` eme soit tr` es grande ( ), que le d efaut soit a ` support e troit.

84 Remplac ons donc
(qui e tait e gal a `
) par
dans l equation 5.9, nous obtenons :
que nous pouvons r ecrire :
Nous reconnaissons maintenant, en les regroupant a ` partir de la droite, les divers termes qui constituent lapproche analytique : le produit , qui repr esente la TF discr` te de g, d enot ee ; e le produit par les termes diagonaux qui constituent les termes courants de la matrice inverse. Or , cest donc linverse de la fonction de transfert du d efaut ; puis la transform ee de Fourier inverse, accomplie par le produit matriciel par . On voit donc quil y a bien e quivalence des deux approches dans le cas o` u le d efaut est correctement repr esent e par une matrice circulante : lapproche par inversion de matrice est linversion directe du d efaut, tandis que lapproche par TF est linversion par projection du signal sur la base des vecteurs propres de lop erateur d. Mais nous avons vu e galement que lorsque lon repr esente le signal par un ensemble ni d echantillons, la ` quelles matrice qui d ecoule des hypoth` eses de lin earit e et dinvariance spatiale nest pas circulante mais T oplitz. A conditions y a-t-il donc e quivalence entre et ? Nous avons vu que la diff erence entre les deux matrices r eside dans les termes des coins sup erieur droit et inf erieur gauche qui apparaissent lors du passage de T oplitz a ` circulante. Ce sont les termes de la demi-r eponse impulsionnelle gauche qui ont disparu sur la gauche du signal, et de m eme a ` droite. Ces diff erences seront n egligeables si la taille du d efaut est tr` es petite devant la dimension du signal. Pourquoi lapproche continue ( equation 5.3) conduit-elle a une solution par TF quelle que-soit la taille ! ! du d efaut ? Parce que dans cette approche, la TF est faite de a ` ,e liminant de fait les effets de bord. Si lon souhaite discr etiser les divers signaux, sous lhypoth` ese quils v erient la contrainte de spectre born e, il nous d faudra e galement prendre un nombre inni d echantillons (cf. chapitre 3) et l equivalence ecoule alors de la convergence asymptotique quelle que soit la taille, nie, du d efaut 2 .
!
!
!
F IG . 5.1 Dans une matrice T oplitz (` a gauche), le signal est tronqu e aux bords. Dans une matrice circulante (` a droite), les effets de bord sont repli es : on consid` ere que le signal est p eriodique au d etriment dune bonne lisibilit e du signal (merci Fred).
2 Dans un cas tout a ` fait exceptionnel, si le signal est p eriodique, les 2 approches sont e quivalentes avec un nombre ni d echantillons. En effet sa TF peut e tre obtenue par une s erie de Fourier sur une p eriode.
5.2. DEFAUTS SINGULIERS ET MAL CONDITIONNES
85
5.1.4 Conclusions (provisoires)

Nous disposons donc, en fait, de 3 approches diff erentes pour restaurer le signal si celui-ci est repr esent e sous forme e chantillonn ee : linversion la plus ordinaire de la matrice , sans tenir compte de ses propri et es sp eciques, (m ethode du pivot de Gauss, ou m ethode de Gauss Seidel par exemple) [Durant, 1961, Porte et Vignes, 1974, Golub et van Loan, 1996]. Elle permet dinverser tous les d efauts lin eaires, m eme sils ne sont pas spatialement invariants (ce qui d epasse les intentions afch ees en d ebut de ce chapitre mais tre tr` es pr ecieux dans de nombreuses peut e applications de traitement dimages). Sa complexit e est en . linversion de la matrice T oplitz , qui ne permet de corriger que les d efauts spatialement invariants, mais en tenant compte de la dimension nie des signaux et des effets de bord. Sa complexit e est en (algorithmes de Trench ou de Zohar, exploitant la r ep etition des termes le long des diagonales pour r esoudre des sous-syst` emes dordre croissant) [Zohar, 1974]. linversion de la matrice circulante , qui n egligera les effets esolutions rapides de bord mais permettra des r (la TF Rapide de Cooley et Tuckey a une complexit e en , en utilisant les propri et es de sym etrie des racines de lunit e pour regrouper les termes des op erations du changement de base) [Cooley et Tukey, 1965].
complexit e
matrice quelconque matrice T oplitz
matrice circulante
domaine de validit e tous d efauts lin eaires d efauts lin eaires spatialement invariants d efauts lin eaires spatialement invariants a ` r eponse impulsionnelle e troite
TAB . 5.1 Les diverses repr esentations des d efauts, leur complexit e et leur domaine dapplication. D` es que les signaux sont un peu longs (quelques centaines d echantillons), on voit donc lint er et dadopter une repr esentation par matrice circulante, m eme si lon risque de d egrader la solution trouv ee par des effets de bord non d esid er es. Nous verrons plus loin 5.6 comment on peut att enuer les effets de bord lors de la restauration dimages.
5.2 D efauts singuliers et mal conditionn es

Nous avons n eglig e de nombreux aspects des signaux r eels dans les lignes pr ec edentes. Reprenons donc les conditions dapplication de la restauration dans des cas plus g en eraux.
5.2.1 D efauts singuliers

Nous avons e vit e jusqu` a pr esent d evoquer le probl` eme principal du ltre inverse : le d e tre non faut peut e inversible. Cela se traduit, soit par la pr esence de valeurs nulles dans la fonction de transfert (repr esentation continue), soit par la singularit e de la matrice (repr esentation discr` ete). On dit dans ce cas que le d efaut est singulier [Porte et Vignes, 1974, Forsythe et Moler, 1967]. Le ltre inverse, sil e tait calcul e sans pr e caution, don nerait alors une divergence inacceptable. Dans lapproche analytique, il est clair que si pour certaines fr equences, alors ne porte plus aucune information sur a ` ces fr equences. Sans autre information sur le signal a ` restaurer, nous devrons nous r esoudre a ` ne rien savoir sur les fr equences de ; cette constatation nous conduit a ` proposer une solution pour tenir compte de la singularit e du d efaut, souvent appel ee solution principale au sens de Bracewell [Bracewell, 1995], version am e lior e e du ltre inverse. Nous la repr e sentons par sa fonction de transfert, not ee qui v erie :
86

(5.12)
Ce ltre est identique au ltre inverse si le d efaut nest pas singulier, mais ne diverge plus en cas de singularit e. Dans une repr esentation vectorielle ( equation 5.8), deux types de probl` emes se pr esentent : 1. dune part la matrice peut e tre rectangulaire, 2. dautre part, elle peut ne pas e tre de rang plein. Ces deux probl` emes trouvent une solution par la matrice pseudo inverse [Albert, 1976, Hestenes, 1975, Decreusefond et Maruani, 2005] qui est solution de l equation (issue de l equation 5.6) :
Cette matrice a la propri et e suivante : son rang est e gal a ` celui de la plus grande matrice carr ee r eguli` ere issue de . Si est r eguli` ere, est e gale a ` . Comme lindique le dernier facteur , si est singuli` ere, a une valeur propre nulle pour tout vecteur propre appartenant au noyau de . La restauration consiste donc bien a ` inverser le plus eme r egulier issu de , et dannuler toutes les composantes de appartenant au noyau grand syst` de (ou de , qui est le m eme).
5.2.2 Syst` eme mal conditionn e

Conditionnement
est, non seulement parfois singuli` ere, mais e galement souvent mal conditionn ee [DUR], Mais la matrice cest-` a-dire que certaines de ses valeurs propres non nulles sont tr` es faibles, quelles ne pourront e tre invers ees exactement, et risquent, selon la m ethode mise en uvre, de donner des r esultats diff erents. On d enit le degr e de conditionnement dun syst` eme lin eaire comme le rapport de sa plus grande a ` sa plus petite valeur propre :
Un syst` eme est mal conditionn e si est typiquement de lordre de linverse de la pr ecision de la machine sur laquelle on travaille. Il doit alors e tre r egularis e. De nombreuses techniques ont e t e propos ees pour r egulariser l equation 5.2 [Twomey, 1965, Phillips, 1962, Tikonov et Arsenine, 1974]. Nous pr esentons ici lapproche analytique propos ee par Wiener [Hellstrom, 1967]. Le ltre de Wiener Wiener suppose que l equation 5.2 est perturb ee par un bruit corr el e au signal. L equation 5.2 devient alors :

additif, al eatoire, de moyenne nulle, non
Wiener recherche une solution lin eaire (donc par convolution de avec un ltre d enot e ). Il veut une solution qui minimise lesp erance de lerreur quadratique int egrale entre le signal et son estim ee, esp erance estim ee sur toutes les r ealisations possibles du bruit :

"
5.2. DEFAUTS SINGULIERS ET MAL CONDITIONNES

Appliquant le th eor` eme de Parseval, on obtient :
87
remplac ant par , permutant int egrale et esp erance, et imposant a ` chaque composante contribution a ` , on obtient :
"

de minimiser sa
o` u
et
sont respectivement les densit es de puissance du bruit et du signal :
(5.13)
(5.14) (5.15)
Nous voyons le r ole du ltre de Wiener : dans le cas dun d efaut singulier, et en labsence de bruit, il conduit a ` une solution e quivalente a ` celle du ltre inverse. Lorsque le d efaut est singulier, il est e gal a ` la solution de Bracewell. Mais si , sans e tre nul, devient faible, le rapport du d enominateur lemporte sur le terme quadratique , et fait tendre le ltre vers 0. Le ltre ne corrige plus, mais en ces valeurs o` u le signal est faible devant le bruit, le bruit nest pas ampli e par le ltre.
defaut
defaut filtre de Wiener 0,01
filtre inverse
filtre de Wiener 0,03
F IG . 5.2 A gauche : fonction de transfert ( ) dun d efaut de boug ea ` vitesse constante et le ltre inverse permettant de le corriger. A droite, deux ltres de Wiener de ce m eme d efaut obtenus a ` partir de deux valeurs suppos diff erentes du rapport es constants.
!
Des ltres de Wiener identiques existent pour lapproche alg ebrique. En r` egle g en erale, une solution alg ebrique r egularis ee de l equation 5.6 utilise une matrice inverse approch ee de sous la forme :
a ` partir des matrices de covariance de signal et de bruit et de la matrice identit e .
o` u est une matrice diagonale a ` termes strictement positifs et major es par 1. u Pour les composantes o` est tr` es faible, la correction sera celle du ltre inverse, pour les composantes o` u est e gal a ` 1, il ny aura aucune correction si est tr` es faible. De la m eme fac on, on d eduit le ltre de Wiener matriciel :
(5.16)
88 Estimation des spectres de densit e de puissance
Les deux termes de densit e spectrale et rev etent une importance particuli` ere dans la r egularisation du ltrage dans lapproche de Wiener. Ils sont malheureusement le plus souvent inconnus lors de la r esolution dun probl` eme particulier. Une fac on tr` es r epandue de circonvenir cette ignorance consiste a ` consid erer le rapport signal a ` bruit ee a ` partir des connaissances acquises sur le capteur, comme une constante qui est, soit estim soit recherch ee par des essais successifs de restauration par des valeurs de variables. Une m ethode un peu plus rigoureuse consiste a ` exploiter les propri et es statistiques des images naturelles telles que nous les avons vues au chapitre 2. Consid erant le bruit blanc de variance , et limage comme un processus markovien a ` accroissements gaussiens, caract eris e par la d ecroissance de sa corr elation (cf. e quation 2.12), le terme de r egularisation prend la forme :
Il reste alors a ` estimer les seules inconnues et .

5.2.3 D ecomposition en valeurs singuli` eres

La repr esentation en valeurs singuli` eres vient g en eraliser aux syst` emes non carr es la d ecomposition en valeurs propres et fournit un cadre th eorique unicateur pour pr esenter les r esultats acquis a ` ce point. Partant de la formulation vectorielle de l equation 5.8, la d ecomposition en valeurs singuli` eres (Singular Value Decomposition ou sous la forme : SVD [Golub et van Loan, 1996]) propose d ecrire la matrice rectangulaire
propres de o` u est une matrice unitaire, matrice des vecteurs , est la matrice transpos ee ( egale a ` la matrice inverse) de la matrice des vecteurs propres de et une matrice diagonale a ` valeurs r eelles positives ordonn ees par ordre d ecroissant.
(5.17) (5.18) (5.19)
et, avec les notations d ej` a employ ees :
La restauration de l equation 5.8 se ram` ene alors a ` la succession dop erations suivantes : 1. pour toutes les valeurs propres de tr` es sup erieures au bruit affectant le signal et engendr e par les calculs, inverser le syst` eme, cest-` a-dire, multiplier par linverse de la valeur singuli` ere correspondante chaque composante du signal ; 2. pour toute valeur singuli` ere nulle ou tr` es inf erieure au bruit, et en labsence dune information a ` priori sur le signal, annuler les composantes du signal ; 3. pour les valeurs singuli` eres tr` es proches du bruit, mettre en uvre toute technique de r egularisation qui appara tra appropri ee, en tirant parti au mieux des connaissances existant sur le signal. Cette d emarche serait a ` conseiller syst ematiquement si sa complexit e en nen rendait la mise en uvre pratiquement impossible.

5.3 Restauration des signaux bidimensionnels

Lapproche analytique de la restauration saccomode bien s ur de signaux de toutes dimensions, puisque la transform ee de Fourier s etend naturellement aux espaces de dimensions sup erieures a ` 1. Lextension des ltres inverses ou de Wiener est triviale.
5.4. LA RESTAURATION ITERATIVE
89
Dans le cas de lapproche alg ebrique, lextension est plus d elicate, puisque limage ne se pr esente pas sous forme dun vecteur monodimensionnel ; il convient donc de la ramener a ` cette forme, a ` laide de se quon appelle la forme d evelopp ee des images [Pratt, 1975]. Cette forme sobtient en rangeant les lignes de limage dans un vecteur , de dimension tr` es grande, (` a composantes si limage est de c ot e ), les unes apr` es les autres.
La relation 5.6 devient alors :
o` u est maintenant une matrice T oplitz-blocs-T oplitz, cest-` a-dire une matrice de taille , compos ee de matrices de T oplitz, chacune de taille , agenc ees de fac on T oplitz, cest a ` dire de fac on que des matrices identiques se retrouvent sur une m eme diagonale :

. . . . . .
$ $ $ $

.. .. . . .. .. .
. . .
$
. . .
(5.20)
avec :

$ $ $ $ . . ... ... .

. . .
. . . . .
..
(5.21)
$
..
On montre sans peine que les matrices T oplitz-blocs-T oplitz sont asymptotiquement e quivalentes aux matrices circulantes-blocs-circulantes, qui admettent pour vecteurs propres les bases trigonom etriques a ` 2 dimensions. Par cette r ecriture en forme d evelopp ee, il est possible de conserver pour les images tous les r esultats formels obtenus en alg` ebre des matrices et qui forment la base de la restauration alg ebrique. Remarquons cependant que dans le cas des images, compte tenu de la valeur de (de lordre de 500), on se contente de l ecriture formelle, la mise en uvre pratique se faisant toujours par transform ee de Fourier rapide (ou e ventuellement par les m ethodes it eratives que nous verrons maintenant) mais pratiquement jamais par inversion directe de matrice. La g en eralisation se fait sans probl` eme aux approches par SVD, ainsi qu` a des signaux de dimension plus grande, mais la mise en uvre est de plus en plus difcile.
5.4 La restauration it erative

Nous avons vu dans les sections 5.1.1 et 5.1.2 ci-dessus des m ethodes de restauration que lon appelle directes, car elles proposent une solution explicite des e quations 5.2 ou 5.6. Nous voyons maintenant des solutions qui
90
passent par le calcul dune s erie de fonctions , convergent vers lestim ee recherch ee et qui permettent donc de sapprocher par e tapes de la restauration. Ces m ethodes reposent g en eralement sur une r ecriture de l equation 5.2 (respectivement 5.6), en d ecomposant la fonction (resp. la matrice de d efaut ) en 2 termes :
en approximant par la s erie qui v erie :

et en r esolvant : On choisit g en eralement

(5.22)
et
de fac on quils soient ais ement inversibles an dobtenir :
et la solution initiale peut e tre choisie, soit identiquement nulle, soit al eatoire, soit enn, le plus souvent, e gale a ` limage d efectueuse .

5.4.1 M ethode de Jacobi

Cest la plus simple des m ethodes, on prend
qui, sil converge, v erie bien :

e gal a ` lunit e, ce qui conduit au sch ema : . La quantit e est appel e r esidu de lit eration.
(5.23)
Les conditions de cette convergence sont ais ement discut ees a ` partir de la TF de l equation 5.23 :
qui, si lon choisit , donne par r ecurrence : e quation qui converge vers :
avec ses qualit es (restauration exacte dans les cas r eguliers et bien conditionn es), et ses d efauts (divergence dans le cas de syst` eme singulier, instabilit e dans le cas de mauvais conditionnement). On peut cependant y ajouter des qualit es propres aux techniques it eratives : 1. il nest pas n ecessaire dinverser le d efaut, mais il suft de lappliquer fois aux solutions successives de lit eration (cela permet en particulier, pour des syst` emes dimagerie disponibles a ` lutilisateur, de ne pas d eterminer le d efaut, mais dutiliser le syst` eme d efectueux lui-m eme pour se corriger [Ma tre, 1981]) ; 2. si le d efaut est tr` es compact (support de tr` es e troit), lop eration de convolution peut e tre r eduite a ` un nombre tr` es petit dop erations, et la solution it erative est alors beaucoup moins co uteuse que le ltrage inverse ; 3. lop erateur peut voir les r esultats des it erations successives de la restauration et intervenir sur elle en interrompant par exemple la correction en cas de divergence du syst` eme (lexp erience montre que ce sont g en eralement les valeurs propres les mieux conditionn ees qui sont lobjet des corrections des premi` eres it erations, la divergence nintervenant quapr` es une premi` ere phase de restauration [Ma tre, 1981]) ; 4. la correction it erative se pr ete bien a ` lintroduction, dans la recherche de la solution optimale, de connaissances a ` priori ou de contraintes non lin eaires (par exemple contraindre limage solution a è tre positive, ou damplitude born ee, ou a ` support e troit, etc.).
si et seulement si . On reconna t donc une op eration e quivalente au ltrage inverse ( equation 5.2),
'

5.4. LA RESTAURATION ITERATIVE
91
En cas de convergence de la m ethode de Jacobi, il est possible de modier le sch ema de l equation 5.23 en introduisant un facteur de relaxation choisi entre 0 et 2 et permettant, soit dacc elerer la convergence ( ) on parle alors de sur-relaxation, soit dam eliorer son conditionnement ( 1) :

5.4.2 M ethode de Gauss-Seidel

Elle ne prend de forme int eressante quen e criture alg ebrique ( equation 5.8). Elle repose sur lutilisation de la matrice unit e pour , et dune d ecomposition de en deux matrices, lune nayant que des z eros au dessus de la diagonale, lautre sur et en-dessous de la diagonale. Cette forme permet dutiliser a ` lit eration les valeurs d ej` a corrig ees a ` cette it eration pour corriger les suivantes, selon le sch ema :

5.4.3 M ethode de plus grande pente

Utilisant le r esidu
a ` la
it eration, la m ethode de la plus grande pente s ecrit, alg ebriquement :

Ces formules sont des expressions classiques en analyse num erique ; en traitement des images, on leur pr ef` ere des techniques dont la convergence est g en eralement assur ee vers la solution principale au sens de Bracewell (ou vers la matrice pseudo-inverse de norme minimale) comme la m ethode du gradient conjugu e ou les m ethodes de projection (m ethodes POCS).
5.4.4 M ethode du gradient conjugu e

Elle se propose, non pas de r esoudre l equation lin eaire 5.4, mais de minimiser la forme quadratique associ ee :

dans lhypoth` ese o` u

est une matrice d enie non-n egative par la r ecurrence :

n Si la matrice nest pas d enie non eme, si elle nest ee), on r esout, comme on la vu en egative (ou m pas carr section 5.2.1, le syst` eme au lieu du syst` eme . Les avantages de la m ethode du gradient conjugu e sont tout dabord sa convergence inconditionnelle (vers la solution pseudo-inverse), et ensuite sa tr` es grande vitesse de convergence [Hestenes, 1975].
92
5.4.5 M ethodes de projection (POCS)

Elles forment une famille de m ethodes extr emement populaires depuis quelques ann ees, qui proc` edent en calculant it erativement les projections de l equation 5.4 sur des vari et es lin eaires choisies de lespace des solutions (droites, plans, voire surfaces convexes). Elles prennent la forme g en erale [Householder et Bauer, 1960] :

o` u
est un vecteur choisi par lutilisateur.
5.5 Lestimation des d efauts

Nous avons suppos e jusque l` a que le d efaut e tait parfaitement connu. Cette hypoth` ese nest que rarement vraie. Il sagit principalement des cas o` u la physique de lacquisition est parfaitement ma tris ee. Par exemple dans les applications dimagerie de tr` es haute qualit e, la limite de r esolution est souvent impos ee par la diffraction qui introduit un d efaut d etermin e par le plus petit diaphragme du syst` eme. Dans le cas douvertures circulaires et de focale , on retrouve pour r eponse impulsionnelle la fonction de Bessel d ej` a rencontr ee a ` de diam` etre l equation 3.3 :
% % ! !

(5.24)
On est e galement dans ces conditions favorables lorsque le syst` eme dimagerie e autour de l equation est constitu de convolution 5.2 an de permettre de mesurer indirectement une grandeur inaccessible. Cest le cas de la tomographie par exemple, ou de limagerie sismique ou encore dans les syst` emes a ` synth` ese douverture comme on en rencontre en radar [Ma tre, 2001], en acoustique ou en astronomie [Roddier, 1999]. Ainsi, en tomographie m edicale [Grangeat, 2001], le signal mesur e est lint egrale, le long de la ligne de propagation des rayons X, du signal int eressant , la densit e des tissus biologiques observ es. Lorsque la source de rayons X et le capteur se d eplacent en translation et en rotation autour du patient, les signaux et sont li es par une r eponse impulsionnelle [Grangeat, 2001].
!
R x L S x L R
F IG . 5.3 Construction de limage en tomographie m edicale. est la source de rayons X, mesure est lint egrale le long de de latt enuation des rayons X due aux tissus.
est le r ecepteur. Une
5.6. REDUCTION DES EFFETS DE BORD
93
5.5.1 D etermination par calibrage

Il sagit surtout u il est possible d etalonner le syst` eme optique, cest a ` dire de placer en entr ee du des cas o` syst` eme un signal parfaitement connu. On d e termine alors le d e faut par inversion de l e quation 5.2 mais cette fois en inversant , dans la mesure du possible. Cest ede en astronomie ainsi quen t el ed etection, en utilisant pour soit des e toiles isol ees ainsi que lon proc` (alors ) soit des mires naturelles (ponts, routes), ou articielles trac ees au sol.
5.5.2 D etermination statistique
Mais dans de nombreux cas on ne dispose que de la seule image d efectueuse . Il est alors tr` es difcile de remonter au d efaut sans aucune information a priori sur celui-ci. Heureusement on sait souvent quelle classe de d efaut peut avoir affect e limage. Cest le plus souvent un d efaut de mise au point, ou un d efaut de boug e, lobjet ou la cam era e tant en mouvement pendant la prise de vue. Il sagit alors de conrmer le d efaut, puis de d eterminer son ampleur. Une bonne fac on de proc eder consiste a è tudier le spectre de densit e de puissance de limage d efectueuse. Dapr` es l equation 5.4, il sexprime par :

Or la plupart des d efauts pr esentent des z eros dans leur fonction de transfert

(5.25)
. Cest ainsi vrai pour :
1. les boug es a ` vitesse constante dont la r eponse impulsionnelle est une fonction porte dans la direction du d eplacement et de largeur x ee par la vitesse et le temps de pose : est alors un sinus cardinal ;
2. les d efauts de mise au point dont la r eponse impulsionnelle est un cercle et la fonction de transfert une fonction de Bessel de premi` ere esp` ece semblable a ` celle de l equation 5.24, mais dans le plan des fr equences. On voit sur l equation 5.25 que ces z eros se retrouvent dans le spectre , alors quils sont tr` es improbables dans le spectre dune image (cf. chapitre 2). En d etectant ces z eros, il est alors possible de conrmer la pr esence du d efaut et de d eterminer les param` etres qui le caract erisent.
5.6 R eduction des effets de bord

Nous avons vu quil e tait tr` es souvent pr ef erable, pour des questions defcacit e de calcul, dutiliser la forme circulante du d efaut plut ot que sa forme T oplitz. On est alors conduit a ` commettre une erreur de reconstruction puisque lon fait implicitement intervenir par p eriodisation de limage, des signaux a ` droite et a ` gauche, ainsi quen haut et en bas, qui ne sont pas les signaux qui ont contribu e au d efaut. Comment r eduire leffet de ces signaux parasites ? Une premi` ere solution, de m ediocre qualit e, consiste a ` prolonger limage de marges uniformes (par exemple de niveau e gal a ` la valeur moyenne de limage), puis de proc eder a ` la d econvolution de limage ainsi agrandie. On peut e galement r ep eter la premi` ere et la derni` ere ligne ou la premi` ere et la derni` ere colonnes a ` cet effet. Pr ef erable est lapproche qui consiste a ` reproduire limage par une sym etrie miroir sur tous ses bords. Les images r epliques ainsi cr ee es poss edant un spectre de densit e de puissance tr` es proche de celui du signal dorigine, perturbent assez peu la restauration et donnent des r esultats souvent de bonne qualit e. Ces deux approches se traduisent lune et lautre par un accro ssement des calculs puisque tout se passe comme si lon traitait en pratique une image plus grande.
94
Chapitre 6
Morphologie math ematique

Chapitre r edig e par Isabelle B LOCH
6.1 Introduction et pr eliminaires

La morphologie math ematique est une th eorie essentiellement non lin eaire, utilis ee en particulier en analyse dimages, dont le but est l etude des objets en fonction de leur forme, de leur taille, des relations avec leur voisinage (en particulier topologiques), de leur texture, et de leurs niveaux de gris ou de leur couleur. Par les transformations quelle propose, elle se situe a ` diff erents niveaux du traitement dimages (ltrage, segmentation, mesures, analyse de texture) et fournit ainsi des outils pour la reconnaissance des formes. La morphologie math ematique, d evelopp ee a ` lorigine pour l etude des mat eriaux poreux, trouve maintenant ses applications dans de nombreux domaines du traitement dimages, aussi bien 2D que 3D, en biologie et cytologie quantitative, en imagerie m edicale, en imagerie a erienne et satellitaire, en robotique et vision par ordinateur, en contr ole industriel non destructif, dans les e tudes sur les documents et les uvres dart. Hors du domaine du traitement des images, on trouve des applications par exemple en analyse de donn ees, ou encore en th eorie des jeux. La morphologie math ematique a e t e d evelopp ee a ` lorigine a ` l Ecole des Mines de Paris. Elle repose essentiellement sur les travaux de G. Matheron effectu es dans les ann ees 60-70, puis sur ceux de J. Serra et de son e quipe. Depuis ces premiers d eveloppements, elle a pris une ampleur internationale et plusieurs e quipes sy consacrent. Elle sappuie sur la th eorie des ensembles, des treillis, de la topologie des ferm es et des probabilit es. Elle sapplique ainsi a ` des structures alg ebriques vari ees (ensembles, fonctions, mais e galement ensembles ous ou propositions logiques), pouvant avoir un caract` ere al eatoire (pour lanalyse de textures par exemple). Ce chapitre nest quune introduction a ` la morphologie math ematique. Il en donne succinctement les bases math ematiques, d ecrit les op erations de base et leurs principales propri et es, et pr esente des exemples doutils de ltrage et de segmentation qui en sont d eduits. On se placera de mani` ere g en erale dans lespace , puis on d enira les notions discr` etes associ ees, dans ou . Une pr esentation d etaill ee peut e tre trouv ee dans les ouvrages [Serra, 1982a, Serra (Ed.), 1988, Dougherty (Ed.), 1992, Schmitt et Mattioli, 1994a, Soille, 1999].
On trouve a ` la base des transformations de morphologie math ematique quatre principes fondamentaux qui guident leur construction et qui sont v eri es pour la plupart des op e rations. Ils sont exprim es ci-dessous pour une op eration quelconque, agissant sur un ensemble ou une fonction d enie sur . Compatibilit e avec les translations : Ce principe exprime lind ependance des transformations par rapport a `

95
96 lorigine de lespace1 :
CHAPITRE 6. MORPHOLOGIE MATHEMATIQUE

Compatibilit e avec les homoth eties : Ce principe assure lind ependance des transformations par rapport a ` un param` etre d echelle :
Connaissance locale : Pour conna tre de : born e
d esigne la restriction de au domaine . Semi-continuit e : ce principe (voir d enitions 18 et 22) assure la robustesse des transformations. Outre ces propri et es fondamentales, les op erateurs de morphologie math ematique peuvent avoir des propri et es alg ebriques dont les principales sont d enies ci-dessous. ou des fonctions de dans est D enition 1. Croissance : Une transformation sur des ensembles de croissante si :

o` u
dans un domaine
de
born e
, il suft de conna tre dans un domaine

D enition 2. Extensivit e et anti-extensivit e : Une transformation de dans est extensive si :

est anti-extensive si :

sur des ensembles de
ou des fonctions
D enition 3. Idempotence : Une transformation idempotente si :

ou des fonctions de
dans
est
D enition 4. Dualit e : Deux transformations duales par rapport a ementation si : ` la compl
et
o` u
d esigne le compl ementaire de
ou des fonctions de
dans
sont
dans
'
(cest-` a-dire
),
1 Cette
propri et e est appel ee aussi invariance spatiale dans dautres th eories du traitement dimages.
6.2. LES QUATRE OPERATIONS
97
Notons que pour des images num eriques, repr esent ees par des fonctions a ` valeurs positives et born ees par une valeur maximale ! , la dualit e sexprime par :
Nous verrons dans la suite que ce principe de dualit e exprime le fait que deux op erations, qui ne sont pas linverse lune de lautre, ont des effets contraires (les op erations de morphologie math ematique e tant g en eralement non inversibles).
Pour d ecrire de mani` ere tr` es synth etique la bo te a ` outils de la morphologie math ematique, il faut retenir les points suivants : les transformations sont non lin eaires, elles sont fond ees sur des op erations de type sup et inf ; les transformations sont g en eralement non inversibles, et elles perdent donc de linformation ; le travail du morphologue consiste alors a ` d eterminer les transformations adapt ees a ` son probl` eme, cest-` a-dire qui vont simplier les images en retenant linformation pertinente ; des propri et es analytiques et alg ebriques sont attach ees aux op erations, ce qui permet dassurer des propri et es pr ecises sur les objets ou images issues des transformations ; cest sur ces propri et es que lon sappuie pour encha ner les transformations an de r esoudre un probl` eme particulier ; aux transformations sont e galement associ es des algorithmes, qui permettent de les appliquer de mani` ere efcace. Les parties suivantes sattachent a ` d ecrire plus pr ecis ement ces concepts pour les principales op erations morphologiques.
6.2 Les quatre op erations

6.2.1 Notion d element structurant et cadre ensembliste
Des premi` eres applications a ` l etude des milieux poreux est n ee lapproche ensembliste de la morphologie math ematique. Elle sapplique a ` des images ou objets binaires et les e tudie sous langle de leurs relations avec un ensemble x e. Cet ensemble, dont on choisit la forme et la taille, est appel ee l ement structurant. Les relations sont de type ensembliste (r eunion, intersection, etc.). Etant donn e un e l ement structurant et une relation, limage (ou lobjet) de d epart est transform e en translatant l el ement structurant en tout point et en examinant si la relation entre lobjet et l el ement structurant translat e est v eri ee. Les propri et es des op erations ainsi d enies et des images transform ees d ecoulent de la th eorie des ensembles. Cest selon ce principe que seront par exemple d enies la dilatation et l erosion binaires. L el ement structurant d enit un voisinage autour de chaque point de limage et ce sont donc des propri et es locales des objets qui sont ainsi mises en e vidence. En pratique, les images sont d enies sur des trames discr` etes. Le probl` eme consiste alors a è tudier dans quelle mesure les d enitions et les propri et es des transformations d ecrites pour lespace continu sont transposables a ` un espace discret. Les trames les plus utilis ees en dimension 2 sont la trame carr ee (ou rectangulaire) et la trame hexagonale o` u les points sont dispos es en quinconce. Plus de d etails peuvent e tre trouv es dans la partie sur la g eom etrie discr` ete (chapitre 4) ou dans les r ef erences qui y sont cit ees. Les voisinages e l ementaires associ es aux diff erentes trames constituent les e l ements structurants e l ementaires (de taille 1) utilis es en morphologie math ematique. Effectuer une dilatation de taille signie alors effectuer fois une it eration de taille 1, par un de ces e l ements structurants.
98
6.2.2 Erosion et dilatation binaires

Les d enitions qui suivent reposent sur la d enition classique de laddition de Minkowski de deux ensembles, qui correspond a ` laddition vectorielle :
Dans toute cette partie, on consid erera des ensembles de . Un e l ement structurant est e galement un ensemble dont on se donne la forme et la taille, et dont on particularise un point (lorigine) quon appelle le centre (qui nest pas forc ement le centre g eom etrique). D enition 5. Dilatation binaire : La dilatation binaire dun ensemble par un e ement structurant est d enie l comme lensemble obtenu par addition de Minkowski de par le sym etrique de par rapport a ` son centre :
(6.1)
(6.2)
Il existe des d enitions l eg` erement diff erentes, pour lesquelles la dilatation est e gale a ` laddition de Minkowski. Cela implique des modications des propri et es, en particulier dans les relations de dualit e, mais permet une meilleure conformit e avec le cadre alg ebrique que nous verrons plus loin. L equation 6.2 est e quivalente aux expressions suivantes :

!
o` u d esigne e de l el ement structurant au point (cest-` a-dire le centre de l el ement structurant le translat co ncide avec ). Dans cette formulation ( equation 6.3) apparaissent clairement les concepts de lapproche ensembliste : ici la relation impos ee entre la forme e tudi ee et l el ement structurant est lintersection. Ainsi, un point appartient a ` lobjet r esultat si l el ement structurant centr e en ce point intersecte lobjet initial. Propri et es de la dilatation. La dilatation a les propri et es suivantes (les d emonstrations sont imm ediates en utilisant les formules 6.2 ou 6.3) : ` , elle est extensive ( ) si le centre de appartient a elle est croissante ( ), , elle commute avec la r eunion mais pas avec lintersection :

(6.3)
elle v erie une relation dit eration (associativit e) :
Ces propri et es alg ebriques ont des cons equences importantes sur les applications de cette transformation, a ` la fois du point de vue algorithmique et du point de vue des propri et es des objets obtenus. Par exemple, la relation dit eration permet de calculer une dilatation par un disque de rayon 2 soit directement, soit comme une suite de deux dilatations par un disque de rayon 1. De plus, la dilatation v erie les 4 principes fondamentaux donn es en introduction. Exemples. La dilatation par un segment centr ea ` une de ses extr emit es a pour effet d etendre lobjet dans la direction oppos ee a ` celle du segment (alors que laddition de Minkowski e tend lobjet dans la direction du
99
segment). Notons que la distinction entre addition de Minkowski et dilatation tombe d` es quon utilise des e l ements structurants sym etriques, ce qui est souvent le cas. La dilatation par un disque a pour effet daugmenter la taille des objets selon la taille du disque, de relier entre elles les composantes proches et de boucher les petits trous (plus petits que l el ement structurant). La gure 6.1 illustre ces effets.
F IG . 6.1 Exemple de dilatation binaire (de gauche a ` droite : image initiale, dilatation par un disque de taille 3, diff erence : en blanc, les parties rajout ees par la dilatation). D enition 6. Erosion binaire : L erosion dun ensemble
!
!
par un e ement structurant l
est d enie par : (6.4) (6.5)
L equation 6.4 correspond a ` lapproche ensembliste, o` u cette fois la relation impos ee entre l ement structurant el et la forme est linclusion. L equation 6.5 fait r ef erence a ` la soustraction de Minskowski not ee . Propri et es de l erosion. La propri et e essentielle de l erosion est quelle est la transformation duale de la dilatation par rapport a ` la compl ementation : (6.6)
Ainsi, il est e quivalent d eroder un objet ou de dilater son compl ementaire. Cette propri et e peut e galement e tre pr esent ee comme d enition, dont on d eduit alors les expressions 6.4 et 6.5. L erosion a les propri et es alg ebriques suivantes (elles peuvent e tre d emontr ees soit directement a ` partir des formules 6.4 et 6.5, soit d eduites de celles de la dilatation gr ace a ` la formule de dualit e 6.6) : elle est anti-extensive si le centre de appartient a ` , elle est croissante, , elle satisfait les relations suivantes par rapport a ` la r eunion et a ` lintersection (en particulier, elle commute avec lintersection) :

elle satisfait la relation dit eration suivante :
100
la succession dune e rosion et dune dilatation v erie linclusion suivante :
(6.7)
De plus, l erosion v erie les 4 principes e nonc es en introduction. Exemples. L erosion par un disque a les effets suivants : lobjet est diminu e selon la taille de l el ement structurant, les composantes connexes de lobjet plus petites que l el ement structurant sont supprim ees, les parties des objets reli ees par des isthmes plus ns que l el ement structurant sont d econnect ees. La gure 6.2 illustre ces effets.
F IG . 6.2 Exemple d erosion binaire (de gauche a ` droite : image initiale, e rosion par un disque de taille 3, diff erence : en blanc, les parties supprim ees par l erosion). Liens avec la fonction distance. La fonction distance (voir chapitre 4) a de nombreuses applications en morphologie math ematique (outre toutes les applications n ecessitant une estimation de la distance entre objets comme le recalage). En voici quelques exemples : elle permet deffectuer tr` es rapidement des dilatations et e rosions de taille quelconque : en effet, la fonction distance calcul ee avec les masques de la gure 4.33 a et b (chapitre 4) fournit des courbes de niveaux autour de lobjet qui correspondent exactement aux points qui seraient rajout es a ` lobjet par des dilatations successives par les e l ements structurants e l ementaires ; il suft alors de seuiller la fonction distance a ` la taille de dilatation souhait ee pour obtenir, en deux passes seulement, le dilat e (pour l erosion, on proc` ede de m eme, en calculant cette fois la distance des points de lobjet au compl ementaire) ; elle permet de r ealiser des dilatations et e rosions par des e l ements structurants proches dun disque (par exemple avec le masque de la gure 4.33 d, chapitre 4) ; elle permet dobtenir tr` es rapidement les e rod es ultimes dun ensemble dobjets (cest-` a-dire les compo santes connexes de qui disparaissent par une e rosion de taille ), comme maxima r egionaux de la fonction distance ; elle peut e tre utilis ee pour le calcul de squelettes. La gure 6.3 montre que les courbes diso-distances a ` lint erieur des objets sont les e rod es successifs de ces objets.

6.2.3 Erosion et dilatation de fonctions

La g en eralisation des transformations binaires a ` des transformations num eriques (sur des fonctions) peut seffectuer de deux mani` eres :
101
F IG . 6.3 Les courbes diso-distances a ` lint erieur des objets sont les e rod es successifs. 1. soit en remplac ant dans les d enitions tous les concepts ensemblistes par leurs e quivalents fonctionnels :

! "!
(6.8)
2. soit en consid erant le sous-graphe de la fonction (voir d enition 23) comme un ensemble binaire (dans un espace de dimension ) et en lui appliquant les op erations binaires. quivalentes (pour des fonctions semi-continues sup erieurement a ` valeurs dans ! Ces deux approches sont e et des e l ements structurants born es) mais la premi` ere est plus op erationnelle. Les e quivalences des expressions 6.8 se retrouveront dans les d enitions et les propri et es qui suivent. Cette g en eralisation est indispensable pour pouvoir traiter des images a ` niveaux de gris. Nous consid ererons tout dabord des e l ements structurants binaires, puis nous donnerons les d enitions g en erales des transformations sur des fonctions avec des e l ements structurants fonctionnels. D enition 7. Dilatation fonctionnelle ( el ement structurant binaire) : La dilatation dune fonction par un enie par : e ement structurant est la fonction d l

(6.9)
L equation 6.9 fait appara tre explicitement que les valeurs de intervenant dans le r esultat de lop eration en un point sont celles prises dans un voisinage de ce point, ce voisinage e tant d eni par l el ement structurant 2. Propri et es. La dilatation a les propri et es suivantes (analogues des propri et es de la dilatation binaire) : elle est extensive si le centre de appartient a ` , elle croissante, est , , elle v erie les quatre principes e nonc es en introduction. Exemples. Sur une image a ` niveaux de gris, la dilatation par un disque augmente les niveaux de gris, propage les maxima locaux des niveaux de gris (dans une r egion correspondant a ` la taille et a ` la forme de l el ement structurant). La gure 6.4 illustre ces effets.

2 On
a le m eme r esultat pour la dilatation binaire.
102
F IG . 6.4 Exemple de dilatation num erique (de gauche a ` droite : image initiale, consid er ee comme une fonction sur lespace a ` deux dimensions, dilatation par un disque de taille 3). D enition 8. Erosion fonctionnelle ( el ement structurant binaire) : L erosion dune fonction enie par : structurant est la fonction d
!
par un e ement l (6.10)

Ici encore, la valeur prise en un point d epend uniquement des valeurs de dans un voisinage, d eni par , de ce point. Propri et es. L erosion a les propri et es suivantes (similaires a ` celles de l erosion binaire) : elle est duale de la dilatation, elle est anti-extensive si le centre de appartient a ` , elle est croissante, , , elle v erie les quatre principes de lintroduction. Exemples. L erosion dune image a ` niveaux de gris par un disque a pour effet de diminuer les niveaux, et de propager les minima dans une r egion d enie par l el ement structurant. La gure 6.5 illustre ces effets. Notons que la dilatation et l erosion sont des cas particuliers de ltres de rang (voir chapitre 10). Dans un tel ltre, les niveaux de gris des voisins dun point sont class es par ordre croissant et la valeur de ce point est remplac ee par celle dun rang donn e. Le min utilis e dans l erosion correspond donc a ` un ltre de rang 1 et le max de la dilatation a ` un ltre de ranf (si le voisinage comporte points). Cependant ce ne sont pas des ltres au sens morphologique du terme. Cas discret. Une fois les notions de topologie d enies sur la trame discr` ete, la transposition des d enitions morphologiques de base ne pose pas de probl` eme. Elles sexpriment de la m eme mani` ere que dans le cas continu, ou plus simplement puisque les sup et les inf deviennent des max et des min lorsque l el ement la dilatation par un e l e ment structurant de taille 1 en struturant contient un nombre ni de points. Par exemple, 4-connexit e, sexprime en tout point ! de coordonn ees de la trame par :

que soit une fonction ou un ensemble. Cette formule fournit en m eme temps un moyen op erationnel simple pour calculer la dilatation.

103
F IG . 6.5 Exemple d erosion num erique (de gauche a ` droite : image initiale et e rosion par un disque de taille 3). Il est remarquable de noter que toutes les propri et es de la dilatation, de l erosion, de louverture et de la fermeture (qui seront vues plus loin) sont encore valables sur une trame discr` ete (si lon exclut celles li ees a ` la semi-continuit e qui nont pas de sens dans ce cas)3 . Si la transposition de ces op erations de base est si ais ee, cest que celles-ci impliquent essentiellement des notions ensemblistes ( eventuellement g en eralis ees a ` des fonctions comme nous lavons vu plus haut) et des concepts topologiques tr` es simples, de voisinage entre points uniquement. Des transformations plus complexes impliquant des notions topologiques plus globales (pr eservation de la connexit e et de lhomotopie dun objet par exemple) sont beaucoup plus d elicates a ` transposer. Ce sera le cas par exemple du squelette (voir parties 6.8.3 et 6.8.4) : les d enitions continues ont de tr` es bonnes propri et es mais leur transposition directe au cas discret en fait perdre la plupart. On est alors conduit a ` red enir le squelette directement dans lespace discret, par des proc ed es qui garantissent les propri et es que lon veut conserver. Sans aller chercher des transformations aussi complexes, une simple rotation peut d egrader les propri et es topologiques dun objet (par exemple lui faire perdre sa connexit e, ou faire appara tre des trous l` a o` u il ny en avait pas). dans Consid des ements a-dire des fonctions de erons maintenant e l structurants fonctionnels, cest-` ! telles que est born e. D enition 9. Dilatation par une fonction : La dilatation dune fonction par une fonction est la fonction d enie par : (6.11)

!

D enition 10. Erosion par une fonction : L erosion dune fonction par :

par une fonction
est la fonction d enie (6.12)
Lint er et de ces e l ements structurants est quils permettent de r ealiser des op erations plus nes quavec des e l ements structurants binaires. Par exemple, il est ainsi possible de modier un relief (l ecr eter par exemple) dans nimporte quelle direction, et pas seulement parall` element au plan de limage comme avec des e l ements structurants binaires (plans).
3 Notons que dans lexpression de la dualit e entre dilatation et e rosion, et entre ouverture et fermeture, l el ement structurant reste le m eme des deux c ot es de l egalit e.
104
6.2.4 Ouverture et fermeture binaires
L equation 6.7 montre, si on lexprime pour , que la dilatation nest pas linverse de l erosion. Par exemple, si lon effectue dabord une e rosion puis une dilatation, les composantes connexes de lobjet qui ont e t e supprim ees par l erosion (` a cause de leur petite taille) ne peuvent plus e tre recouvr ees par la dilatation et sont donc d enitivement perdues. On construit donc ainsi une nouvelle transformation par composition dune e rosion et dune dilatation, appel ee ouverture. D enition 11. Ouverture binaire : Louverture de lensemble par l el ement structurant est d enie par :

(6.13)
Propri et es. Louverture a les propri es alg ebriques suivantes : et elle est anti-extensive ( )4 , ), elle est croissante ( ). elle est idempotente ( Ces propri et es sont fondamentales puisquelles font de louverture un ltre morphologique. , et si d esigne louvert de par un e l ement structurant de taille , On a de plus . Louverture v erie les 4 principes fondamentaux (comme compos ee de deux op erations les satisfaisant). Exemples. Louverture a pour effet de supprimer les parties des objets plus petites que l el ement structurant, et de lisser les contours en supprimant les petites excroissances (trop nes pour pouvoir contenir l el ement structurant). Cest leffet de ltrage d ecrit alg ebriquement ci-dessus. Elle ne r eduit pas syst ematiquement toutes les structures comme le fait l erosion. La gure 6.6 illustre ces effets.
F IG . 6.6 Exemple douverture binaire (de gauche a ` droite : image initiale, ouverture par un disque de taille 3, diff erence : en blanc, les parties supprim ees par louverture). D enition 12. Fermeture binaire : La fermeture de lensemble
par l el ement structurant
est d enie par : (6.14)
Propri et es. La fermeture a les propri es alg ebriques suivantes : et elle est extensive ( ), elle est croissante,
4 Contrairement
a ` la dilatation et a ` l erosion, cette propri et e est vraie sans restriction sur l el ement structurant.
105
elle est idempotente. De m eme que pour louverture, ces propri es font de louverture un ltre morphologique. et On , et si d esigne le ferm e de par un e l ement structurant de taille , a de plus . La fermeture v erie les 4 principes fondamentaux (comme compos ee de deux op erations les satisfaisant). Enn, la fermeture est lop eration duale de louverture par rapport a ` la compl ementation :
(6.15)
ce qui permet de d eduire les propri et es et laction dune des op erations de celles de lautre. Exemples. La fermeture a pour effet de boucher les trous des objets qui sont plus petits que l el ement structurant. Elle lisse les contours des objets en rajoutant des points dans les concavit es e troites (dans lesquelles ne peut pas se glisser l el ement structurant). On retrouve leffet de ltrage, dual de celui de louverture, d ecrit par les trois propri et es alg ebriques ci-dessus. La gure 6.7 illustre ces effets.
F IG . 6.7 Exemple de fermeture binaire (de gauche a ` droite : image initiale, fermeture par un disque de taille 3, diff erence : en blanc, les parties rajout ees par la fermeture).
6.2.5 Ouverture et fermeture num eriques

D enition 13. Ouverture num erique : (par un e ement structurant binaire) Louverture dune fonction l enie comme dans le cas binaire par : e ement structurant est d l
par un (6.16)
Propri et es. Louverture est croissante, anti-extensive et idempotente, ce qui lui conf` ere une nature de ltre morphologique. Exemples. Louverture sur une image a ` niveaux de gris a pour effet d ecr eter les pics (si on consid` ere le sousgraphe de la fonction comme un relief) qui sont plus e troits que l el ement structurant. La gure 6.8 illustre ces effets. D enition 14. Fermeture num erique : (par un e ement structurant binaire) La fermeture dune fonction par l un e ement structurant est d enie comme dans le cas binaire par : l
(6.17)
106
F IG . 6.8 Exemple douverture num erique (de gauche a ` droite : image initiale et ouverture par un disque de taille 3). Propri et es. La fermeture est duale de louverture. De plus, comme dans le cas binaire, elle est croissante, extensive et idempotente, ce qui lui conf` ere une nature de ltre morphologique. Exemples. La fermeture a leffet dual de louverture : elle comble les vall ees qui sont plus e troites que l el ement structurant. La gure 6.9 illustre ces effets.
F IG . 6.9 Exemple de fermeture num erique (de gauche a ` droite : image initiale et fermeture par un disque de taille 3).
6.3 Cadre topologique

Nous avons vu plus haut les fondements ensemblistes de la morphologie math ematique. Celle-ci repose ensuite sur des concepts de topologie. Dans cette approche, on cherche a ` d enir le voisinage non plus dun point mais dun ensemble. Deux types de topologies sont utilis ees en morphologie math ematique : la topologie en tout ou rien sur les ferm es et la topologie myope d enie sur les compacts. La topologie myope a lavantage d etre reli ee a ` la distance de Hausdorff, m etrique bien adapt ee a ` la comparaison de formes dans de nombreuses applications.
6.3. CADRE TOPOLOGIQUE
107
Dans la suite, on note lensemble des ferm es de , lensemble de ses ouverts, et lensemble de ses compacts, pour la topologie usuelle de . D enition 15. Topologie en tout ou rien : La topologie en tout ou rien sur est engendr ee par la famille :
o` u , et .

La topologie en tout ou rien est donc engendr ee par les ferm es qui, e tant donn es un compact et une famille douverts, nintersectent pas le compact et intersectent chacun des ouverts. La convergence pour la topologie en tout ou rien est d enie de la mani` ere suivante : es converge vers si pour tout ouvert D enition 16. Convergence dans : Une suite de ferm qui intersecte et tout compact qui nintersecte pas , on a :

On montre que la r eunion de dans est continue pour cette d enition mais que lintersection ne lest pas. Cela nous conduit a ` introduire les notions de semi-continuit e. , not ee D erieure et sup erieure : La limite inf erieure dune suite de ferm enition 17. Limites inf e s est lintersection des points dadh erence de la suite, et sa limite sup erieure, not ee est la r eunion des points dadh erence. D enition 18. Semi-continuit e : Une application dun ensemble dans est semi-continue sup erieurement de convergeant vers : (s.c.s.) si pour tout de et toute suite
De m eme ,

est semi-continue inf erieurement (s.c.i.) si :

Notons quune application est continue ssi elle est a ` la fois s.c.s. et s.c.i. Lintersection de dans est s.c.s. Ces propri et es de lintersection et de la r eunion seront directement utilis ees pour en d eduire des propri et es des transformations de morphologie math ematique construites selon lapproche ensembliste. On a ainsi les r esultats suivants : la dilatation dun ferm e par un compact est continue (le r esultat est un ferm e), cest-` a-dire a ` la fois s.c.s. et s.c.i., la dilatation dun compact par un compact (le r esultat est un compact), est continue lapplication de dans qui a ` associe est s.c.s., de m eme, lapplication de dans qui a ` associe est s.c.s., lapplication de dans qui a ` associe est s.c.s., de m eme, lapplication de dans ` associe est s.c.s., qui a lapplication de dans qui a ` associe est s.c.s., de m eme, lapplication de dans qui a ` associe est s.c.s. Ces propri et es fortes de la dilatation et de l erosion en termes de continuit e lorsque l el ement structurant est compact incitent a ` choisir pour les applications des e l ements structurants compacts. D enition 19. Topologie myope : La topologie myope sur est engendr ee par la famille :

o` u
et .

108
La topologie myope est plus ne que la topologie induite sur par la topologie en tout ou rien sur e quivalente sur ` la topologie induite par la distance de Hausdorff. a D enition 20. Distance de Hausdorff : La distance de Hausdorff entre deux compacts non vides et d enie par :
o` u euclidienne classique sur
où est la distance est la distance classique dun point a ` un compact (

, et est
).
Cette distance est souvent utilis ee pour comparer deux ensembles et estimer leur proximit e. Notons que cette distance est tr` es sensible aux d eformations qui peuvent se produire a ` la surface des objets 5 .
6.4 Cadre alg ebrique

Le cadre alg ebrique g en eral de la morphologie math ematique est celui des treillis et de la notion fondamentale dadjonction [Heijmans et Ronse, 1990, Ronse et Heijmans, 1991, Heijmans, 1991].
6.4.1 Treillis
D enition 21. Treillis : Un treillis est un ensemble muni dune el ements relation dordre , tel que toute paire d (ou toute famille nie) poss` ede une borne sup erieure (not ee ) et une borne inf erieure (not ee ). Un treillis est complet si toute famille d el ements (nie ou non) poss` ede un plus petit majorant et un plus grand minorant. Un treillis complet contient en particulier un plus petit e l ement et un plus grand e l ement. Lensemble des fonctions de dans est un treillis complet, pour la relation dordre d enie par :

La semi-continuit e pour des fonctions est d enie de la mani` ere suivante. erieurement en si : D enition 22. Semi-continuit e dune fonction : Une fonction est semi-continue sup
o` u
est un voisinage de
dans

. De m eme,

est semi-continue inf erieurement si :
` toute fonction D enition 23. Sous-graphe : A
de
dans , on associe son sous-graphe

Remarquons quune fonction est s.c.s. ssi son sous-graphe est ferm e. Lensemble des fonctions s.c.s. de dans est un treillis complet, pour la relation dordre d enie par :

5 Le probl` eme de la d enition dune distance entre objets est r eput e difcile et la plupart des distances utilis ees, comme la distance de Hausdorff, ne donnent quune information partielle sur la ressemblance des objets. La distance de Hausdorff est cependant bien adapt ee a ` une grande classe de probl` emes, en particulier gr ace a ` ses liens e troits avec la morphologie math ematique.
6.4. CADRE ALGEBRIQUE
109
Cette propri et e montre lint er et du cadre fourni par les treillis pour la morphologie math ematique. Un autre int er et vient du fait que les op erations de morphologie math ematique sont fond ees sur des sup et des inf comme nous lavons vu dans la partie 6.2. La notion de sous-graphe permet de faire un lien direct avec lapproche ensembliste dune part puisque les sous-graphes sont des ensembles de , et avec lapproche topologique dautre part puisque la topologie utilis ee sur lespace des fonctions s.c.s. est celle induite par la topologie en tout ou rien sur .
6.4.2 Erosion et dilatation alg ebriques, adjonctions

D enition 24. Dans , une dilatation alg ebrique est d enie de mani` ere g en erale comme un treillis complet une fonction sur qui commute avec le sup, cest-a ` -dire telle que :

(6.18)
est une famille ( eventuellement vide) d el ements de . rosion alg De mani` ere similaire, une e ebrique est une fonction sur telle que :
o` u
qui commute avec linf, cest-a ` -dire (6.19)
Notons que cette d enition suft a ` garantir que les dilatations et e rosions alg ebriques sont croissantes. Une propri et e fondamentale dans le cadre des treillis est celle dadjonction. sur est une adjonction si est seulement si : D enition 25. Une paire dop erateurs

(6.20)
Propri et erations alg ebriques et adjonctions : es. On a les relations suivantes entre op si est une adjonction, alors est une e rosion alg ebrique et est une dilatation alg ebrique ; un op erateur croissant est une dilatation alg ebrique si et seulement si il existe un op erateur tel que soit une adjonction ; est alors une e rosion alg ebrique et vaut :

un op erateur croissant est une e rosion alg ebrique si et seulement si il existe un op erateur soit une adjonction ; est alors une dilatation alg ebrique et vaut :
tel que
6.4.3 Lien avec les op erateurs morphologiques
Sur le treillis bool een des parties de ou (la relation dordre est alors linclusion), le dilat e de nimporte quelle partie peut e tre exprim e comme la r eunion des dilat es des singletons qui la composent :

De plus, tout dilatation invariante par translation peut sexprimer comme une dilatation morphologique, d enie a ` partir dun e l ement structurant comme dans la section 6.2. Des r esultats similaires sont valables pour les e rosions.
110
6.4.4 Ouverture et fermeture alg ebriques

D enition 26. Une op eration croissante est une ouverture alg ebrique si et seulement si elle est anti-extensive et idempotente, et une fermeture alg ebrique si et seulement si elle est extensive et idempotente. Si d esigne lidentit e sur le treillis, on a pour toute adjonction :
De plus, et sont toujours idempotentes, ce sont donc des exemples douverture et fermeture alg ebriques respectivement, appel ees ouverture et fermeture morphologiques.
&
(6.21)
6.5 Cadre probabiliste

6.5.1 Ensembles ferm es al eatoires
Enn, une partie de la morphologie math ematique repose sur une approche probabiliste, en particulier sur le concept densemble ferm e al eatoire. Le principe consiste a ` consid erer les e quations ensemblistes utilis ees dans la premi` ere approche comme des e v enements et a ` leur affecter une probabilit e. Ces e v enements seront donc du type , . Lensemble des valeurs (ou r ealisations) consid er e ici est lensemble des ferm es . Lensemble des e v enements est d eni par la tribu bor elienne sur engendr ee par les e v enements particuliers qui nous int eressent, appel ee encore tribu morphologique. ee par les ouverts D enition 27. Tribu morphologique : La tribu morphologique est la tribu sur engendr de la topologie en tout ou rien sur , cest-a et les pour tous les compacts de et tous les ` -dire par les ouverts de :

conduit alors a La donn ee dune probabilit e sur lespace mesurable ` la notion densemble ferm e al eatoire. D enition 28. Ensemble ferm e al eatoire e al eatoire , not e est d etermin e : Un ensemble ferm par la donn ee dune probabilit e sur . D enition 29. Capacit e de Choquet : La capacit e de Choquet dun ensemble ferm e al eatoire est la fonctionnelle d enie par :

La capacit e de Choquet joue un r ole analogue a ` celui de la fonction de r epartition dune probabilit e sur . On montre quun ensemble ferm e al eatoire est enti` erement caract eris e par sa capacit e de Choquet. En pratique, cela fournit un moyen op e ratoire de caract e risation dun ph e nom` e ne al e atoire, puisque la connaissance des est sufsante, ce qui limite les mesures a ` effectuer. Les applications de ces concepts concernent des mesures de ph enom` enes al eatoires, comme par exemple des sch emas bool eens, ou lanalyse de textures.
6.5.2 Un exemple : le sch ema bool een

Un sch ema bool een stationnaire est d eni comme la r eunion de compacts al eatoires de m eme loi translat es aux points dun processus de Poisson [Schmitt et Mattioli, 1994a]. Sa capacit e de Choquet est une fonction de la densit e du processus de Poisson sous-jacent et de la moyenne du volume du dilat e du compact al eatoire.
6.6. APPLICATIONS DE LEROSION ET DE LA DILATATION

Soit un processus de Poisson dintensit e du processus tombent dans vaut :
111 , la probabilit e pour que points
avec , o` u d esigne le volume de . De plus, si deux compacts et sont disjoints, alors les variables al eatoires qui comptent les points tombant dans et dans sont ind ependantes (voir chapitre 4, section 4.5). On appelle e al eatoire . Le sch ema bool een grain primaire un ensemble ferm dintensit e et de grain primaire est alors d eni par :
). Pour tout compact

(6.22)
o` u les sont des compacts al eatoires ind ependants de m eme loi et translat es aux points du processus de Poisson. On garantit que cette r eunion est un ferm e en imposant que le volume moyen de est ni, pour e gal a ` la boule unit e. Un tel sch ema bool een est stable par r eunion. On a alors la caract erisation suivante en fonction de la capacit e de Choquet :

(6.23)
o` u d esigne le volume moyen. Cette caract erisation permet de d enir des proc edures dinf erence des param` etres du mod` ele, a ` une translation pr` es [Schmitt et Mattioli, 1994a].

(6.24)
6.6 Applications de l erosion et de la dilatation

6.6.1 Mesures
Nous donnons dans cette partie succinctement quelques exemples de transformations qui associent a ` un objet une mesure, que nous r epartissons dans deux classes. La premi` ere classe est issue de la g eom etrie int egrale et vise a ` calculer des longueurs, des surfaces, des volumes, des int egrales de courbure moyenne, par linterm ediaire des fonctionnelles de Minkowski. Le lien avec la morphologie math ematique est fourni par les formules de Steiner, qui permettent de calculer les fonctionnelles de Minkowski du dilat e dun compact dapr` es celles du compact [Hadwiger, 1957, Santalo, 1976]. La deuxi` eme classe vise des applications de reconnaissance des formes et e tudie le comportement dobjets visa ` -vis de transformations morphologiques appropri ees aux caract eristiques a ` mettre en e vidence [Schmitt et Mattioli, 1994a]. Par exemple, les courbes granulom etriques (donnant la surface des objets s electionn es par la transformation quand varie) permettent d etudier eom etrique, la distribution de tailles des objets. Autre exemple, le covariogramme g donnant la surface de (o` u est un segment de longueur dans une direction ) quand varie, permet dobserver le comportement des objets quand on l erode dans une direction. Il peut en particulier discriminer des ensembles dobjets de m eme surface globale mais dont la r epartition des composantes connexes en taille et dans lespace varie.
6.6.2 Erod e ultime

L erod e ultime est la r eunion de toutes les composantes dun objet binaire qui disparaissent dune e rosion a ` lautre dans une s equence d erosions par un e l ement structurant e l ementaire . Plus formellement, l erod e ultime dun ensemble est d eni par : (6.25)
112
o` u d esigne l erod e de de taille et d esigne les composantes connexes de qui ont une intersection non vide avec . L erod e ultime dun ensemble est exactement lensemble des maxima r egionaux de la fonction distance a ` ` ). lint erieur de (distance des points de a

6.6.3 Rehaussement de contraste
Le rehaussement de contraste morphologique dune fonction est d eni a ` partir dune fonction minorante et . Le r dune fonction majorante et de deux param` etres et tels que , et esultat de cette transformation est obtenu en faisant basculer les points vers la fonction minorante ou vers la fonction majorante suivant la r` egle suivante :

avec . La morphologie math ematique fournit naturellement des fonctions minorantes (resp. majorantes) a ` partir de transformations anti-extensives (resp. extensives) comme l e rosion de par un e l e ment structurant centr e, ou encore louverture de (resp. dilatation ou fermeture). La gure 6.10 donne un exemple de rehaussement de contraste a ` partir des dilatation et e rosion des gures 6.4 et 6.5.
si si si

F IG . 6.10 Exemple de rehaussement de contraste morphologique.
6.6.4 Gradient morphologique

Soit le disque ferm e de rayon unit e. Le gradient morphologique dune fonction continu par la fonction suivante :
est d eni dans le cas

et dans le cas discret par :
6.7. APPLICATIONS DE LOUVERTURE ET DE LA FERMETURE
113

Cette transformation trouve ses applications dans la d etection de contours. La gure 6.11 donne un exemple de gradient obtenu par diff erence des dilatation et e rosion de taille 1.
F IG . 6.11 Exemple de gradient morphologique.
6.7 Applications de louverture et de la fermeture

6.7.1 Filtres altern es s equentiels
Nous avons vu que les ouvertures et fermetures e taient des ltres morphologiques. Sans entrer dans la th eorie des ltres morphologiques, nous ne d ecrirons ici que les ltres altern es s equentiels, qui sont beaucoup utilis es en pratique, et qui sont construits a ` partir de suites douvertures et de fermetures de tailles croissantes. Dans le cas discret, un tel ltre appliqu ea ` une fonction sexprime comme :

Notons quon obtient bien ainsi des op erations croissantes et idempotentes (donc des ltres morphologiques). Ils sont utilis es en pratique pour ltrer progressivement le bruit positif (pics e troits) et le bruit n egatif (vall ees etermin e en fonction de la taille minimale des e troites). Le dernier e l ement structurant utilis e (de taille ) est d objets de limage que lon veut conserver apr` es le ltrage. La gure 6.12 donne des exemples de ltres altern es s equentiels.
6.7.2 Filtres auto-duaux

Les ltres auto-duaux sont des transformations qui agissent sur les fonctions ind ependemment du contraste local et traitent donc les parties claires et les parties sombres de la m eme mani` ere. Le ltre m edian est un exemple de tel ltre. Un exemple est le centre morphologique, d eni a ` partir dune famille dop erateurs par :

(6.26)
114
F IG . 6.12 Filtres altern es s equentiels : image initiale, tailles maximales de 1, 2 et 3.
o` u d esigne lidentit e. Les travaux de H. Heijmans se sont attach es a ` formaliser cette notion de ltres auto-duaux dans un cadre alg ebrique.
6.7.3 Chapeau haut-de-forme

La transformation du chapeau haut-de-forme dune fonction discret, comme la fonction :
est d enie, aussi bien en continu quen
pour un e l ement structurant
donn e. Lop eration duale est la fonction :
Cette transformation extrait les pics e troits (plus e troits que l el ement structurant) quelle que soit leur hauteur absolue. Elle permet par exemple dextraire des lignes nes de niveau intense par rapport a ` leur voisinage (telles que des routes dans une image satellitaire). Lop eration duale extrait au contraire des vall ees e troites. La gure 6.13 donne un exemple de chapeau haut de forme obtenu pour une ouverture de taille 3.
6.7. APPLICATIONS DE LOUVERTURE ET DE LA FERMETURE
115
F IG . 6.13 Exemple de chapeau haut de forme obtenu pour une ouverture de taille 3. Si lon applique cette transformation avec des e l ements structurants fonctionnels, par exemple des sph` eres de , on s electionne alors les contours abrupts dans limage, ou encore les pics de courbure plus forte que l el ement structurant.
6.7.4 Granulom etries

Les granulom etries sont des op erations de tamisage qui servent a ` s electionner successivement des particules de tailles donn ees croissantes. D enition 30. Granulom etrie : Une granulom etrie sur un ensemble de parties de est une famille de fonctions param etr ees (avec ) d enies sur telle que :
1. ( anti-extensive), ( croissante), 2. ( decroissante par rapport au paramètre), 3. . 4.

Il est clair, dapr` es cette d enition, que la famille douvertures par des boules de rayon d enit une granu est une granulom est une ouverture pour tout et la lom etrie. On montre m eme que e trie si et seulement si pour . classe des ensembles de invariants par est incluse dans celle des invariants par Ainsi, si on applique a ` un ensemble une suite douvertures de tailles croissantes (par des boules), on s electionnera dabord les plus petites parties de lensemble (celles qui sont supprim ees par louverture), puis des parties de plus en plus grosses. La gure 6.14 montre une courbe de granulom etrie obtenue sur une image binaire par ouvertures de diff erentes tailles. Lorsque la taille de louverture correspond a ` la taille caract eristique de la plupart des objets, un saut appara t dans la courbe.
6.7.5 Ouverture surfacique

Les ouvertures peuvent combiner un crit` ere sur un attribut, par exemple la taille des objets, permettant ainsi de ltrer des petits objets ou des petites parties claires. Une ouverture surfacique de param` etre est ainsi d enie par :
est connexe et
(6.27)
116
F IG . 6.14 Image binaire et sa courbe de granulom etrie. o` u
est la surface de (ou son volume en 3D). d esigne une ouverture par et

On d enit bien s ur de mani` ere duale des fermetures surfaciques.
6.7.6 Ouverture annulaire

Louverture annulaire est d enie comme le min entre limage originale et son dilat e par un e l ement structurant en forme danneau. Puisque l el ement structurant ne contient alors pas lorigine, la propri et e dextensivit e de la dilatation nest pas v eri ee. Cette op eration sert par exemple a ` r ecup erer des groupes serr es dobjets dans une image en e liminant des parties isol ees (la dilatation de telles parties ne les contient pas).
6.8 Transformation en tout ou rien et op erateurs d eriv es

6.8.1 Transformation en tout ou rien
Les transformations vues jusqu` a pr esent sont toutes fond ees sur le m eme principe : elles examinent si une certaine conguration de points (d enie par l el ement structurant) v erie une relation avec lobjet e tudi e. La transformation en tout ou rien propose dexaminer des congurations o` u certains points v erient une relation avec lobjet et dautres v erient une relation avec le compl ementaire de lobjet. Ainsi les e l ements structurants consid er es dans cette transformation sont d ecompos es en deux parties et (de m eme origine). D el ement structurant 31. Transformation en tout ou rien : La transformation en tout ou rien de par l enition est d enie par :

Notons que puisque avoir simultan ement
, lorigine ne peut pas appartenir a ` la fois a ` et (ce qui est heureux...).
et a `
, donc on ne peut pas
paississement 6.8.2 Amincissement et e

Deux nouvelles transformations sont d eduites de la transformation en tout ou rien :
6.8. TRANSFORMATION EN TOUT OU RIEN ET OPERATEURS DERIV ES

paississement : Lamincissement de D enition 32. Amincissement et e est d eni par : et l epaississement par :
117
par l el ement structurant

(6.28) (6.29)
Lamincissement, op eration anti-extensive, supprime donc de des points qui sont dans une conguration particuli` ere, s electionn es par la transformation en tout ou rien. Les e l ements structurants appropri es sont ceux epaississement rajoute au contraire a ` les points s electionn es par la pour lesquels lorigine appartient a ` . L transformation en tout ou rien et est une op eration extensive. Les e l ements structurants appropri es sont ceux pour lesquels lorigine appartient a ` . Ces deux transformations sont duales lune de lautre au sens suivant :
avec si . Il existe tout un alphabet d el ements structurants, appel e alphabet de Golay en trame hexagonale, qui permet deffectuer une grande vari e t e dop e rations [Serra, 1982a]. Par exemple : si est l el ement structurant e l ementaire sur la trame consid er ee et est vide, la transformation en tout ou rien est une e rosion et lamincissement correspondant extrait la fronti` ere des objets ; si les congurations recherch ees par la transformation en tout ou rien correpondent a ` un point du compl ementaire entour e de points de lobjet formant une conguration localement non convexe, l epaississement correspondant (appliqu e it erativement jusqu` a convergence) permet de calculer le plus petit convexe discret contenant lobjet de d epart ; si est le point central de l el ement structurant e l ementaire et contient les autres, la transformation en tout ou rien s electionne les points isol es de lobjet ; etc. Nous verrons dans la suite que des congurations particuli` eres permettent dextraire le squelette dun objet par amincissement.
6.8.3 Squelette
Le squelette est une notion tr` es utile en reconnaissance de formes : en effet, il sagit dune repr esentation des objets, quon souhaite intuitivement compacte (lignes nes centr ees dans les objets), homotopique a ` lobjet de d epart (m eme nombre de composantes connexes et m eme nombre de trous), et inversible. En morphologie math ematique, on arrive a ` une d enition du squelette dans le cas continu qui a de bonnes propri et es par rapport a ` ces exigences. En revanche, le passage au discret est tr` es d elicat pour cette transformation. Dans le cas continu, le squelette est d eni comme lensemble des centres des boules maximales incluses dans lobjet (une boule e tant maximale si elle ne peut e tre incluse dans aucune autre boule incluse dans lobjet). On travaille g en eralement sur les ferm es en morphologie math ematique. Cependant, dans le cas du squelette, cela conduit a ` de mauvaises propri et es : le squelette dun ensemble connexe nest pas n ecessairement connexe, il nest pas n ecessairement ferm e, et lapplication qui a ` un ferm e associe ladh erence de son squelette nest ni s.c.s., ni s.c.i. On travaillera donc, pour le cas du squelette, sur des ouverts. D enition 33. Squelette : Le squelette dun ouvert est lensemble des centres des boules ouvertes maximales incluses dans . En appelant lensemble des centres des boules ouvertes maximales de rayon donn e , on obtient le squelette comme r eunion de tels ensembles :

118 On peut montrer que :
o` u de
(resp.
esigne la boule ouverte (resp. ferm ee) de rayon . Cela fournit une caract erisation du squelette # ) d
(et un moyen op eratoire pour le calculer) a ` partir de ses e rod es et des ouverts de ses e rod es :
(6.30)
Lobjet de d epart peut e tre reconstruit a ` partir de son squelette (et donc la propri et e dinversibilit e est satisfaite) :

Pour la d enition 33, on montre de plus que lapplication qui a ` associe ladh erence de son squelette # est s.c.i. de dans , que si est connexe alors # est connexe, et que le squelette est n au sens suivant : lint erieur du squelette est vide. Le squelette ainsi d eni v erie donc bien les propri et es quon en attend intuitivement.

6.8.4 Squelette discret

Si lon transpose maintenant directement ces notions au cas discret, le squelette sexprime (en discr etisant l equation 6.30) comme :
(6.31)
o` u est l el ement structurant e l ementaire sur la trame. Cette d enition, que lon trouve aussi sous le nom daxe m edian, correspond aux centres des boules maximales (discr` etes) incluses dans lobjet. Si la propri et e dinversibilit e est conserv ee avec l equation 6.31, les autres sont perdues, en particulier la pr eservation de la connexit e. Deux classes de m ethodes ont alors e t e propos ees pour r esoudre ce probl` eme : la premi` ere tente de relier entre eux les points d etect es par l equation 6.31 pour en faire une ligne m ediane qui satisfasse les propri et es de connexit e ; la deuxi` eme tente de trouver dautres d enitions, directement discr` etes, en supprimant it erativement des points a ` la surface de lobjet. La m ethode que propose la morphologie math ematique rel` eve de cette deuxi` eme approche. Elle sappuie sur la notion damincissement ( equation 6.28), en utilisant des e l ements structurants qui suppriment des points de lobjet sans changer sa topologie (voir gure 6.15). Il sagit donc dun amincissement homotopique. On arrive ainsi a ` un squelette qui v erie les propri et es de connexit e, qui donne une bonne repr esentation des formes, mais qui nest plus inversible (il ne contient pas n ecessairement les centres des boules maximales) et qui nest pas n ecessairement d epaisseur unit e. La gure 6.16 illustre la diff erence entre les centres des boules maximales et le squelette par amincissement dans le cas discret.
6.8.5 SKIZ
Consid le compl ementaire de lobjet . On note les composantes connexes de lobjet erons maintenant lensemble des points plus proches de que ). Dans , on appelle zone dinuence de des pour :
!
Cette notion permet de d enir celle de squelette par zones dinuence (SKIZ) :
6.9. GEOD ESIE
119
1 . 0 1
1 . 0
ement structurant utilis F IG . 6.15 El e en 6-connexit e pour obtenir le squelette dun objet par amincissement : cet e l ement structurant, ainsi que les 5 qui en sont d eduits par rotations, sont appliqu es it erativement jusqu` a convergence.
F IG . 6.16 Centres des boules maximales (au centre) et squelette par amincissement (` a droite).
D enition 34. Squelette par zones dinuence : Le squelette par zone dinuence de qui nappartiennent a ` aucune des zones dinuence : Skiz
est lensemble des points
Le squelette par zones dinuence est un sous-ensemble du squelette de , il nest pas forc ement connexe et contient en g en eral moins de barbules que le squelette de (ce qui est souvent exploit e dans les applications).
6.9 G eod esie

6.9.1 Distance g eod esique et boules g eod esiques
Les transformations g eod esiques sont celles qui sont contraintes par un ensemble donn e (on les appelle aussi conditionnelles). Elles sont fortement li ees a ` la notion de distance g eod esique : la distance g eod esique conditionnellement a ` un ensemble entre deux points de est la longueur du plus court chemin joignant ces deux points en restant dans lensemble. On consid` ere alors des e l ements structurants qui sont des boules de la distance g eod esique.
D enition 35. Boule g eod esique : La boule g eod esique de centre ensemble de est d enie par :

et de rayon
conditionnellement au sous-
!
(6.32)
120
6.9.2 Op erations morphologiques g eod esiques, reconstruction

D enition 36. Dilatation g eod esique ou conditionnelle : La dilatation g eod esique de dilatation de conditionnellement a enie par : ` ) par une boule de rayon est d
o` u
designe la boule geodesique de centre

dans
(appel ee aussi
et de rayon .
!
(6.33)
En pratique dans un espace discret, lexpression 6.33 se calcule tr` es simplement a ` partir de la dilatation euclidienne ( equation 6.3) par l el ement structurant e l ementaire puisquelle est alors e quivalente a `:
o` u lexposant signie que lop eration est it er ee fois. D enition 37. Erosion g eod esique : L erosion g eod esique de dans
(6.34)
par une boule de taille est d enie par :

et est ainsi reli ee a e (faisant intervenir le compl ementaire ` la dilatation par dualit
de
dans
(6.35) ).
Louverture et la fermeture g eod esiques sont d enies a ` partir de l erosion et de la dilatation g eod esiques, de mani` ere analogue au cas euclidien ( equations 6.13 et 6.14). De la dilatation g eod esique, on d eduit la notion de reconstruction de a ` partir de marqueurs d enis par un ensemble . eod esique de dans D enition 38. Reconstruction binaire : La reconstruction de dans est la dilatation g par une boule de rayon inni, cest-a qui ont une intersection non vide ` -dire, les composantes connexes de avec .
Les notions de transformations g esiques ou conditionnelles s etendent au cas num erique par linterm ediaire eod des sections de la fonction consid er ee :

D enition 39. Dilatation g eod esique num erique : La dilatation g eod esique de par ses sections a eod esique binaire : ` partir de la dilatation g
dans , pour
est d enie
et l erosion g eod esique est d enie par dualit e. Dans le cas discret, on retrouve des formules analogues a ` celles obtenues dans le cas binaire, pour la dilatation :
o` u
est l el ement structurant e l ementaire et lexposant signie que lop eration est it er ee fois, et pour l erosion :

Comme dans le cas binaire, la reconstruction num erique de est appel ee fonction de marquage.
dans est d enie par
. La fonction
6.10. LIGNE DE PARTAGE DES EAUX
121
6.9.3 Squelette g eod esique par zones dinuence
). La Soient un ensemble et un ensemble ` deux ( de composantes connexes disjointes deux a zone dinuence g eod esique de conditionnellement a ` est lensemble des points de plus proches de que des autres composantes au sens de la distance g eod esique dans :

(6.36)
Le squelette g eod esique par zone dinuence est alors d eni par :

(6.37)
6.10 Ligne de partage des eaux

6.10.1 D enition et propri et es
La ligne de partage des eaux est une notion tr` es importante pour les probl` emes de segmentation. Intuitivement, elle est d enie par analogie g eographique comme le compl ementaire des bassins versants, un bassin versant e tant la zone associ ee a ` un minimum r egional telle quune goutte deau tombant dans cette zone et suivant la ligne de plus grande pente sarr etera dans ce minimum (gure 6.17).
ligne de partage des eaux
bassins versants
minimum
minimum
F IG . 6.17 Ligne de partage des eaux. La transposition de cette d enition intuitive en termes math ematiques ne va pas sans poser de nombreux probl` emes (d enition dune ligne de plus grande pente, probl` eme des plateaux, etc.). La plupart des d enitions sont algorithmiques, cest-` a-dire que la ligne de partage des eaux est d enie dapr` es le moyen qui pemet de la construire. Un des algorithmes les plus populaires est lalgorithme dimmersion qui consiste a ` remplir progressivement les bassins versants (` a partir des minima r egionaux) pour d eterminer leurs limites [Vincent et Soille, 1991, Vincent, 1992, Soille, 1999]. Ce nest que r ecemment que des approches math ematiques rigoureuses ont e t e propos ees dans le cas continu [Schmitt et Mattioli, 1994a]. Lavantage de la ligne de partage des eaux pour la segmentation est quelle fournit des r egions d elimit ees par des contours ferm es formant une partition de limage. La gure 6.18 donne un exemple de ligne de partage des eaux sur une image de gradient.
122
6.10.2 Applications en segmentation

Une technique puissante de segmentation par morphologie math ematique, qui conna t des d eveloppements importants et de plus en plus dapplications, consiste a ` effectuer un marquage puis une reconstruction, e ventuellement pr ec ed es de pr e-traitements (rehaussement de contraste, ltrage, en particulier par des ltres altern es s equentiels). Nous donnons ici deux exemples dapplication de ces techniques, pour s eparer des objets binaires se recouvrant partiellement dune part, et pour segmenter des images num eriques a ` laide de la ligne de partage des eaux dautre part. Supposons quon ait un ensemble dobjets binaires de forme relativement circulaire, et se recouvrant partiellement. La s eparation de tels objets peut seffectuer par morphologie math ematique si le recouvrement nest pas trop important : les composantes connexes de limage apparaissent alors avec un r etr ecissement qui correspond au lieu o` u la s eparation doit e tre effectu ee. Les marqueurs g en eralement utilis es pour ce type dobjets sont les e rod es ultimes, cest-` a-dire les maxima r egionaux de la fonction distance a ` lint erieur de lobjet. En effet, une particule isol ee donnera lieu a ` un seul e rod e ultime connexe, deux particules se recouvrant partiellement (donc ne formant quune seule composante connexe dans limage) auront un e rod e ultime compos e de deux composantes connexes qui marquent donc bien chacune des particules, etc. L etape de reconstruction permet ensuite de retrouver chaque particule a ` partir de son marqueur. Elle doit satisfaire deux exigences : pr eserver le nombre de composantes connexes de l erod e ultime (puisque chacune delles est associ ee a ` une particule) et donc ne pas les connecter, et rester dans lensemble de d epart (qui repr esente toutes les particules). La premi` ere exigence conduit a ` utiliser des transformations homotopiques, et la seconde a ` conditionner les transformations par donc a ` se placer dans un cadre g eod esique. Une premi` ere solution consiste a ` calculer le squelette par zones dinuence de lensemble des marqueurs conditionnellement a ` . Linconv enient de cette m ethode est que les lignes de s eparation peuvent e tre mal positionn ees : elles sont situ ees a ` mi-distance des marqueurs, et cela nest pas adapt ea ` la s eparation de deux particules de tailles diff erentes. Une deuxi` eme solution consiste a ` reconstruire les particules par dilatation g eod esique des marqueurs (conditionnellement a ` ), en prenant en compte la taille de l erosion n ecessaire pour arriver a ` l erod e ultime de chaque particule (cest-` a-dire la valeur du maximum r egional correspondant de la fonction distance). Une troisi` eme solution consiste a ` calculer la ligne de partage des eaux de la fonction distance invers ee (o` u ` cause des irr les maxima deviennent des minima). A egularit es sur les bords des objets, on peut aboutir a ` une sursegmentation. Celle-ci peut e tre e vit ee en reconstruisant la distance diminu ee dune faible valeur sous la fonction distance avant de linverser pour appliquer la ligne de partage des eaux. Cette proc edure est illustr ee sur une image binaire sur la gure 6.19. Prenons maintenant lexemple dune image a ` niveaux de gris. La ligne de partage des eaux fournit un bon outil de segmentation. Elle peut e tre appliqu ee directement sur limage initiale si lon cherche a ` d etecter les lignes de cr ete de limage pour faire la segmentation, sur une image de gradient (repr esentant une image de contours num eriques), sur le r esultat dun chapeau haut-de-forme si lon souhaite mettre en e vidence des structures nes lin eaires (sombres ou claires), etc. Le choix de limage sur laquelle la ligne de partage des eaux est appliqu ee d epend bien s ur du probl` eme pos e, et doit e tre effectu e dans une premi` ere e tape. Linconv enient de la ligne de partage des eaux est quelle fournit souvent une image sur-segment ee. La technique de marquage permet alors dimposer des minima a ` la ligne de partage des eaux pour e viter ce probl` eme. Les marqueurs doivent e tre d etermin es a ` lint erieur et a ` lext erieur des objets que lon souhaite segmenter. Pour cela, diff erentes techniques peuvent e tre envisag ees (ltrage par ltre altern e s equentiel de limage de gradient, recherche de minima ou maxima r egionaux, etc.). Les minima sont impos es a ` partir de ces marqueurs par la technique suivante : soit limage sur laquelle on souhaite appliquer la ligne de partage des eaux, et la fonction de marquage prenant la valeur 0 aux points des ! marqueurs d etect es et (en pratique maximale) aux points du compl ementaire des marqueurs. En la valeur effectuant l erosion g eod esique de par un e l ement structurant de taille innie conditionnellement
6.11. CONCLUSION
123
a ` (cest-` a-dire une reconstruction num erique), on obtient une version modi ee de o` u les minima sont uniquement ceux qui ont e t e d enis par les marqueurs. Cest sur cette image que la ligne de partage des eaux est alors calcul ee, assurant ainsi que les bassins versants correspondent soit a ` lobjet a ` segmenter soit au fond, et quon obtient un contour ferm e autour de lobjet. La gure 6.20 donne un exemple de ligne de partage des eaux sur une image de gradient apr` es reconstruction.
6.11 Conclusion
De nombreuses extensions peuvent e tre trouv ees dans la litt erature sur la morphologie math ematique, ainsi que des liens avec dautres domaines. Par exemple, l el ement structurant peut e tre interpr et e comme une relation binaire et les op erations de morphologie math ematique sont donc applicables a ` des structures telles que des graphes, o` u les e l ements structurants sont d enis en fonction des arcs du graphe [Vincent, 1989]. Parmi les nombreux liens, citons ceux qui existent avec les e quations de diffusion (voir chapitre 8) et l equation eikonale [Schmitt et Mattioli, 1994a], ainsi quavec les approches multi- echelles (pyramides [Goutsias et Heijmans, 2000], ondelettes [Heijmans et Goutsias, 2000]).
124
F IG . 6.18 Ligne de partage des eaux appliqu ee sur une image de gradient (en haut), et sur une image de gradient ferm e (au milieu). En bas : superposition de la ligne de partage des eaux sur limage originale, sans et avec fermeture du gradient.
6.11. CONCLUSION
125
F IG . 6.19 Image intiale, fonction distance, ligne de partage des eaux appliqu ee sur la distance invers ee, ligne de partage des eaux appliqu ee a ` partir de la reconstruction de la distance moins 2 sous la distance.
F IG . 6.20 Image de gradient apr` es reconstruction en imposant des marqueurs (` a gauche) et ligne de partage des eaux appliqu ee sur cette image (` a droite), limitant la sursegmentation.
126
Chapitre 7
D enition et simulation dun champ de Markov

Chapitre r edig e par Florence T UPIN et Marc S IGELLE Linformation v ehicul ee par une image va bien au-del` a de la seule donn ee des niveaux de gris en chaque site (pixel), et la description se fait en termes de zones, contours, structures d enis par les contrastes, textures, etc. qui peuvent e tre pr esents dans limage. Le niveau de gris en un site nest donc souvent pas signicatif en lui-m eme, mais dans ses relations et interactions avec les pixels voisins. Cette propri et e des images, a ` savoir les interactions locales entre niveaux de gris voisins pour d enir les diff erentes r egions de limage, va nous permettre dutiliser un formalisme markovien dans de nombreux traitements, quil sagisse de restauration, de segmentation ou plus tard danalyse compl` ete des images. Le principe est de d enir des e nergies locales entre groupes de sites re etant les interactions entre niveaux de gris. L energie globale est alors reli ee a ` la probabilit e dapparition de limage dans le cadre des champs de Gibbs. Dans ce chapitre, nous introduisons tout dabord de fac on intuitive la notion d energie locale avant de d enir plus formellement un champ de Markov et d enoncer le th eor` eme d equivalence entre champs de Markov et champs de Gibbs. Les algorithmes d echantillonnage dun champ de Markov ( echantillonneur de Gibbs et algorithme de M etropolis) sont ensuite pr esent es, ainsi que les mod` eles markoviens les plus courants. Lutilisation des champs markoviens en traitement dimages dans un cadre bay esien montre la n ecessit e de pouvoir acc eder aux congurations les plus probables dun champ markovien et nous am` ene a ` la pr esentation du recuit simul e. Dans les parties suivantes, nous abordons les diff erents estimateurs (MAP, MPM, TPM), le probl` eme de lestimation des param` etres du champ, les processus de bords, avant de mentionner lapplication de la mod elisation markovienne a ` des graphes de primitives de plus haut niveau que les pixels.
7.1 D enition et simulation dun champ de Markov

7.1.1 Description de limage
Limage est form ee dun ensemble ni de sites correspondant aux pixels. est donc essentiellement un r eseau discret ni, partie de , si on note la dimension de lespace (2 le plus classiquement, 3 pour les volumes, ` chaque site est associ etc.). A e un descripteur, repr esentant l etat du site et qui peut e tre son niveau de gris, une e tiquette, ou une information plus complexe, et prenant ses valeurs dans . La notion dinteractions locales n ecessite de structurer les relations spatiales entre les diff erents sites du r eseau.
127
128 Pour ce faire, on munit
CHAPITRE 7. DEFINITION ET SIMULATION DUN CHAMP DE MARKOV
dun syst` eme de voisinage
tels que
! ! !

d eni de la fac on suivante :
` partir dun syst` A eme de voisinage, un syst` eme de cliques peut e tre d eduit : une clique est soit un singleton de , soit un ensemble de sites tous voisins les uns des autres. En fonction du syst` eme de voisinage utilis e, le syst` eme de cliques sera diff erent et fera intervenir plus ou moins de sites comme illustr e sur la gure 7.1. On notera lensemble des cliques relatif a ` , et lensemble des cliques de cardinal .
C1 4-connexit
C2
C1 8-connexit
C2
C3
C4
F IG . 7.1 Les cliques associ ees a ` deux syst` emes de voisinage en dimension 2. Les interactions locales entre niveaux de gris (ou descripteurs) de sites voisins peuvent alors sexprimer comme epend des niveaux de gris un potentiel de clique. Soit une clique, on lui associe le potentiel dont la valeur d (ou descripteurs) des pixels constituant la clique. En poursuivant ce raisonnement, on peut d enir l energie globale de limage comme la somme des potentiels de toutes les cliques :

et l energie locale en un site comme la somme des potentiels de toutes les cliques auxquelles il appartient :
!
Nous avons jusquici consid er e le cas dune image pour illustrer les notions de voisinage, de clique et de potentiel, mais le formalisme markovien se d enit tr` es g en eralement sur tout graphe. Soit un ensemble de sites d enombrable (sommets du graphe), et une relation de voisinage, les cliques sont alors d enies comme les sousgraphes complets du graphe. Cest lutilisation de graphes plus g en eraux que ceux d enis sur la grille de limage qui permet des traitements de plus haut niveau.
7.1.2 Mod elisation probabiliste de limage

La d enition des champs de Markov qui sera donn ee dans la section suivante n ecessite une mod elisation probabiliste de limage. Ainsi, limage dont nous disposons va e tre consid er ee comme une r ealisation dun champ al eatoire. Soit un site de limage, on peut en effet lui associer une variable al eatoire (v.a) prenant ses valeurs
7.1. DEFINITION ET SIMULATION DUN CHAMP DE MARKOV

dans
niveau de gris ! en nest ainsi quune r ealisation de la v.a ! . On d enit alors le champ al eatoire $ . Le ! prenant ses valeurs dans . On trouvera aussi le terme de processus al eatoire pour ;
129
en toute rigueur, processus devrait e tre r eserv e au cas dun ensemble dindexation continu, et champ au cas discret. Dans ce limage consid er ee est simplement une r ealisation du champ. La probabilit e cadre probabiliste, globale de , , permet dacc eder en quelque sorte a ` la vraisemblance de limage, et les probabilit es conditionnelles locales dune valeur en un site permettent de mesurer le lien statistique entre un niveau de gris et le reste de limage. Lhypoth` ese markovienne permet d evaluer ces quantit es. Notons que nous nous plac ons dans le cas o` u , lespace de valeurs des descripteurs, est quanti e, ce qui nous permet de manipuler des probabilit es. Dans le cas o` u cet espace est continu, il faut remplacer par une densit e de probabilit e, mais dans ce cas le th eor` eme que nous allons voir ci-dessous nest plus valable.
7.1.3 Champs de Markov - Champs de Gibbs

D enition dun champ de Markov
la valeur du descripteur prise au site et Consid erons site . La d enition dun champ de Markov est alors la suivante :
la conguration de limage except e le
est un champ de Markov ssi la probabilit e conditionnelle locale en un site nest fonction que de la conguration du voisinage du site consid er e
ce qui sexprime de fac on formelle par :
! ! ! !
! !!
Ainsi, le niveau de gris en un site ne d epend que des niveaux de gris des pixels voisins de ce site. Cette hypoth` ese markovienne se justie bien dans le cas de la plupart des images naturelles constitu ees de zones homog` enes ou textur ees ainsi que pour une large gamme dimages de synth` ese. Plus g en eralement, une connaissance locale de limage suft souvent a ` r ealiser son interpr etation partielle et donc cette hypoth` ese markovienne sera souvent justi ee sur des graphes plus globaux que le graphe des pixels. Notons quen labsence de contrainte sur le syst` eme de voisinage, tous les champs al eatoires peuvent e tre consid er es comme markoviens a ` condition de prendre un voisinage sufsamment grand. Lint er et de cette mod elisation r eside bien s ur dans le cas o` u la propri et e markovienne est v eri ee pour des voisinages restreints permettant des calculs rapides. Equivalence entre champs de Markov et champs de Gibbs La mod elisation markovienne prend toute sa puissance gr ace au th eor` eme que nous allons voir maintenant. En effet, celui-ci permettra dacc eder aux expressions des probabilit es conditionnelles locales. Il nous faut au pr ealable d enir un certain nombre de notions relatives aux mesures et champs de Gibbs. D enition dune mesure de Gibbs : La mesure de Gibbs de fonction d energie (ou dhamiltonien) est la probabilit e d enie sur par :
avec
1 On
notera g en eralement en lettres majuscules les variables al eatoires et en minuscules leurs r ealisations.
130 o` u

est le syst` eme de cliques associ e au syst` eme de voisinage

'
de
est une constante de normalisation appel ee fonction de partition de Gibbs. En pratique,
il est quasi impossible de calculer cette constante a ` cause du tr` es grand nombre de congurations possibles. Ne serait-ce que dans le cas dune image binaire (Card ) et de taille , on a congurations possibles ! est abusive car ne e La notation couramment ee pour pend pas de lensemble de la congu utilis d ration mais seulement de restreinte a ` la clique ( ). Nous pouvons maintenant d enir le champ de Gibbs de potentiel associ e au syst` eme de voisinage : cest le champ al eatoire dont la probabilit e est une mesure de Gibbs associ ee au syst` eme de voisinage , ce qui implique :

'
'
L energie globale dun champ de Gibbs poss` ede donc la propri et e de se d ecomposer sous forme dune somme d energies locales, qui comme on le verra par la suite permettront dacc eder aux probabilit es conditionnelles locales. Notons ici que plus une conguration dun champ de Gibbs a une e nergie faible, plus elle est probable. Le th eor` eme de Hammersley-Clifford [Besag, 1974] e tablit alors le r esultat fondamental suivant sous les hypoth` eses : enombrable, ni ou d le syst` eme de voisinage est born e, lespace des e tats est discret ` et X est un champ de Markov relativement a si et seulement si X est un champ ` . de Gibbs de potentiel associ ea Par exemple, si nous consid erons un champ de Markov de voisinage 4-connexe, nous pouvons e crire l energie de la conguration sous la forme :

!

!
!

Notons que rien ninterdit la non-stationnarit e du champ, cest-` a-dire la variation des potentiels en fonction de la dans [Descombes, 1993]. Dautre part, rien nimpose la sym etrie des potentiels localisation de la clique limage et on peut avoir . Le th eor` eme de Hammersley-Clifford, et la forme bien sp ecique de probabilit e de qui en r esulte, va permettre de lier les probabilit es globales et locales comme nous allons le voir maintenant. En effet si nous cherchons a è crire la probabilit e conditionnelle locale , nous avons gr ace au r esultat pr ec edent :
! $

!! ! ! ! ! ! ! ! ! !

D enissons l energie locale
! ! !
! par :
! ! !

en notant l energie globale

2 Il
sous la forme :
! ). Cette e nergie locale ne fait donc intervenir que les voisins de . On peut alors e crire
! !
est toujours possible de trouver un syst` eme de voisinage permettant de d ecomposer ; le cas extr eme correspondant a ` des sites tous voisins les uns des autres.
131
!

!
!
! ! ! !
En simpliant lexpression de la probabilit e conditionnelle locale en supprimant les termes communs qui font intervenir les cliques ne contenant pas le site au num erateur et au d enominateur, on a :
! !
! !
'
! ! ! ! ! ! ! !
!

'
!
! ! ! ! ! ! ! !
(7.1)
Lexpression obtenue, qui ne fait intervenir que les potentiels des cliques contenant le site (ce qui nous permet de retrouver au passage ese markovienne), est tr` es importante. En effet, autant il nest pas possible partant lhypoth` dune conguration dacc eder a ` sa probabilit ea ` cause de la constante de normalisation, autant il est possible de calculer en chaque site la probabilit e conditionnelle locale. Cette expression sera a ` la base de tous les algorithmes de simulation de champs markoviens que nous verrons dans la section suivante. Remarque : Le th eor` eme de Hammersley-Clifford nest valable que lorsquaucune conguration nest interdite (condition ). Des solutions ont e t e propos ees, lorsquil est souhaitable de supprimer certaines congurations irr ealistes (par exemple avoir une route a ` lint erieur dune zone de mer, ou de los dans la mati` ere blanche du cerveau).

7.1.4 Echantillonnage de MRF

Si nous r esumons les r esultats pr ec edents, la d enition dun champ de Markov passe par la d enition de sa fonction d energie . Celle-ci n ecessite la d enition dun syst` eme de voisinage, qui d enit alors le syst` eme de cliques, et de fonctions de potentiel associ ees aux cliques. Ces fonctions de potentiel permettent dacc eder a ` la probabilit e globale dune conguration, et aux probabilit es conditionnelles locales. Le probl` eme qui se pose alors est, e tant d eni un champ de Markov, comment pouvons-nous r ealiser le tirage dune conguration (une image ici) en suivant la loi de probabilit e de Gibbs caract eristique de ce champ ? Deux algorithmes ont e t e propos es pour synth etiser des r ealisations dun champ de Markov qui sont : l echantillonneur de Gibbs, lalgorithme de M etropolis que nous allons d ecrire maintenant.
L echantillonneur de Gibbs Cet algorithme, propos e par Geman et Geman [Geman et Geman, 1984a], repose sur la construction it erative dune suite dimages. A la convergence, i.e apr` es un nombre dit erations sufsant, les images construites sont des r ealisations tir ees selon la loi de Gibbs globale. La m ethode de construction de limage a ` lit eration , partant de limage a ` lit eration se fait par mises a ` ` l jour successives des sites de limage. A etape :
choix dun site ;
132

au site , selon la conguration des voisins locale :
! !
!
pour limage
mise a ` jour du site par tirage al eatoire selon la loi
! ! ! ! !

, calcul de la probabilit e conditionnelle
! !
!.
On consid` ere que lalgorithme a converg e apr` es un grand nombre dit erations ou lorsque le nombre de changements est faible. Le choix du site consid er ea ` l etape peut se faire de nimporte quelle fac on a ` condition de balayer tous les sites un tr` es grand nombre de fois (th eoriquement un nombre inni de fois). Les m ethodes usuelles consistent a ` tirer un site selon une loi uniforme, ou effectuer un balayage classique, ligne par ligne, de limage. Cet algorithme construit en r ealit e une suite dimages qui sont les observations dune suite de champs al eatoires constituant une cha ne de Markov pour un certain noyau de transition. On peut montrer le th eor` eme suivant, lorsque la s equence balaye chaque site une innit e de fois :

o` u est la mesure de Gibbs associ ee au champ de Markov consid e. Ainsi, apr` es un grand nombre dit erations, e r les images g e n e r e es sont des r e alisations de la loi globale , et cela ind e pendemment de la conguration initiale . La preuve de ce th eor` eme, et donc de la convergence de lalgorithme, est donn ee dans [Winkler, 1995]. On parle de l echantillonneur de Gibbs comme dun algorithme de relaxation, car il proc` ede par mises a ` jour successives des sites, et probabiliste car celle-ci est fond ee sur un tirage al eatoire.
Lalgorithme de Metropolis L echantillonneur de Gibbs est un algorithme tr` es utilis e en traitement dimages pour la synth` ese de champs de Markov. N eanmoins, un algorithme ant erieur et issu de la physique statistique avait e t e mis au point dans les ann ees 50 par Metropolis [Metropolis et al., 1953]. Cet algorithme repose sur un principe similaire a ` l echantillonneur de Gibbs, et il sagit e galement dun algorithme de relaxation probabiliste. Le principe est l` a encore de construire une suite dimages qui seront des tirages selon la loi du champ de Markov apr` es un nombre sufsamment grand dit erations. Mais la mise a ` jour en un site seffectue de fac on diff erente. Ainsi a ` l etape :
choix dun site
calcul de la variation d energie pour le passage du label du site de ! a ` ! ! ! ! !

tirage al eatoire dun descripteur dans selon une loi uniforme ;

deux cas sont alors possibles : 1. 2.
, le changement est accepte : ! ; , le changement est accepte ou refuse par tirage selon les probabilites

et
"
Le syst` eme de balayage des sites et le crit` ere darr et sont similaires a ` ceux de l echantillonneur de Gibbs. La diff erence avec l echantillonneur de Gibbs r eside dans le tirage au sort du nouveau niveau de gris (ou descripteur), au lieu de consid erer la loi d enie par tous les descripteurs. Comme on ne consid` ere que la variation e nerg etique entre les 2 congurations, lalgorithme de Metropolis est plus rapide a ` chaque e tape que l echantillonneur de Gibbs, qui lui n ecessite le calcul de la fonction de partition locale. Mais la convergence peut e tre plus lente car le taux
133
dacceptation est strictement inf erieur a ` 1 (les transitions ne sont pas toujours accept ees, contrairement au cas de l echantillonneur de Gibbs). L` a encore, le principe est de construire une cha ne de Markov selon un certain noyau de transition (diff erent de celui intervenant dans l echantillonneur de Gibbs). Le th eor` eme pr ec edent est alors encore v eri e pour lalgorithme de Metropolis.
7.1.5 Le recuit simul e

Nous avons vu dans les paragraphes pr ec edents comment e chantillonner selon la loi de probabilit e de Gibbs ` chaque application des pr associ ee au champ de Markov. A ec edents algorithmes, une nouvelle r ealisation est obtenue. Il peut e tre utile e galement de pouvoir calculer la ou les congurations les plus probables qui correspondent aux e tats d energie minimale. Cest lalgorithme du recuit simul e qui permet de trouver ces r ealisations. Avant de pr esenter cet algorithme, nous avons besoin de quelques r esultats sur les distributions de Gibbs avec param` etre de temp erature que nous pr esentons maintenant. Distribution de Gibbs avec temp erature Une distribution de Gibbs avec param` etre de temp erature est une probabilit e qui s ecrit :
avec
'
et
. Le terme de temp erature provient de lanalogie avec la physique
statistique. Il est int eressant d etudier le comportement de cette distribution pour des valeurs extr emes du param` etre de temp erature. "! :
On a
et comme
, on obtient
Card
Donc

converge vers la probabilit e uniforme sur , i.e pour une temp erature innie tous les e tats sont e quiprobables. : l energie minimale et lensemble des congurations atteignant l energie minimale Notons sont les minima globaux de l energie). On peut e crire :

' '

'
'

134
Si , on a et pour . Donc si nest pas un minimum global de l energie. Si , on a : (il y a une somme nie de termes qui tendent vers 0 au d enominateur). Ce qui signie que lorsque la temp erature est nulle est uniform ement distribu ee sur les minima globaux de l energie, i.e sur les congurations les plus probables. Cest ce r esultat qui est a ` la base de lalgorithme de recuit simul e.

Algorithme du recuit simul e Cet algorithme est d edi ea ` la recherche dune conguration d energie minimale dun champ de Gibbs (on ne cherche plus ici a è chantillonnner contrairement a ` pr ec edemment). Lid ee dint egrer un param` etre de temp erature et de simuler un recuit a e t e initialement propos ee par Kirkpatrick [Kirkpatrick et al., 1982] et reprise par Geman et Geman [Geman et Geman, 1984a] qui ont propos e lalgorithme suivant. Comme les algorithmes de simulation, cest un algorithme it eratif qui construit la solution au fur et a ` mesure. le num e ro de lit e ration) : Le d eroulement de lalgorithme est le suivant (en notant
choix dune temp erature initiale
sufsamment lev ee e
a ` l etape
choix dune conguration initiale quelconque simulation dune conguration
lalgorithme de M ; la simulation peut se faire par l echantillonneur de Gibbs etropolis ; on ou r ealise en g en eral un balayage complet de limage a ` la temp erature ; diminution lente de la temp erature :
pour la loi de Gibbs d energie
'
a ` partir de la conguration
arr et lorsque le taux de changement est faible.
La d ecroissance logarithmique de la temp erature est un rythme tr` es lent ; en pratique des d ecroissances g eom etriques sont utilis ees, souvent sans d egradation notable des r esultats obtenus. La constante intervenant dans la d ecroissance d epend de la variation e nerg etique globale maximale sur lespace des congurations. La gure 7.1.5 montre l evolution du paysage e nerg etique repr esent e en 1 dimension au fur et a ` mesure de la d ecroissance en temp erature. Au d epart, toutes les congurations sont e quiprobables puis les minima e nerg etiques apparaissent et saccentuent. Notons que contrairement aux algorithmes de l echantillonneur de Gibbs et de M etropolis qui e chantillonnent selon la loi de Gibbs et qui sont en mesure de donner toutes les congurations possibles, les images obtenues par recuit simul e sont uniques et doivent en th eorie correspondre aux minima globaux de l energie. Il existe une preuve de convergence de cet algorithme, qui repose a ` nouveau sur la construction dune cha ne de Markov, mais qui est h et erogg` ene cette fois-ci a ` cause de la variation du param` etre de temp erature [Geman et Geman, 1984a]. Intuitivement, le recuit simul e permet datteindre un optimum global, car il accepte des remont ees en e nergie. Avec la d ecroissance de la temp erature, ces sauts e nerg etiques sont progressivement supprim es au fur et a ` mesure quon se rapproche de loptimum global. La descente en temp erature doit donc se faire sufsamment lentement pour que lalgorithme ne reste pas pi eg e dans un minimum local de l energie. Algorithme des modes conditionnels it er es (ICM) Malheureusement, lalgorithme du recuit simul e est tr` es lourd en temps de calcul puisquil demande la g en eration dun grand nombre de congurations au fur et a ` mesure que la temp erature d ecro t. Des algorithmes sous-optimaux sont donc souvent utilis es en pratique. Besag [Besag, 1986] a ainsi propos e un autre algorithme, beaucoup plus

nergie
135
a b
temprature T
a: b:
, transition acceptee , transition selon une probabilite
xloc
x glob
espace des configurations
rapide, mais pour lequel nous navons pas de preuve de convergence vers un minimum global. Il sagit de lICM, Iterated Conditional Mode, que nous allons pr esenter ici. Cet algorithme est un algorithme it eratif modiant a ` chaque e tape les valeurs de lensemble des sites de limage. Mais a ` la diff erence de ces algorithmes qui e taient stochastiques par essence, la modication dune valeur se fait ici de fac on d eterministe. On construit donc, partant dune conguration initiale , une suite dimages , convergeant vers une approximation du MAP recherch e. Soit un tour la visite de tous les sites de limage, on parlera dans la suite dit erations a ` chaque mise a ` jour dun site et d etape a ` chaque mise a ` jour de toute limage (i.e accomplissement dun tour). Le d eroulement de l etape seffectue de la fac on suivante : on parcourt tous les sites et en chaque site, on effectue les deux op erations suivantes :
1. calcul des probabilit es conditionnelles locales, pour toutes les valeurs possibles de
dans
du site :
(en pratique, calcul plus simplement des e nergies conditionnelles locales) 2. mise a ` jour de la valeur par le
maximisant la probabilit e conditionnelle locale :

Argmax
(ou de fac on e quivalente, minimisant l energie conditionnelle locale). Le processus sarr ete lorsque le nombre de changements dune e tape a ` lautre devient sufsamment faible. On peut montrer que l energie globale de la conguration diminue a ` chaque it eration. Cet algorithme, contrairement au recuit simul e, est tr` es rapide (une dizaine de balayages permettent darriver a ` convergence) et peu co uteux en temps de calcul puisquil ne n ecessite que le calcul des e nergies conditionnelles locales. En contrepartie, ses performances d ependent tr` es fortement de linitialisation (par rapport a ` la forme du paysage e nerg etique) puisquil converge vers un minimum local. LICM sapparente a ` une descente en gradient (on fait baisser l energie a ` chaque it eration) ou a ` un recuit simul e gel ea ` temp erature nulle, et peut donc rester bloqu e dans le minimum
136
e nerg etique local le plus proche de linitialisation. Le recuit simul e, au contraire, gr ace au param` etre de temp erature et aux remont ees en e nergie quil autorise permet dacc eder au minimum global. Notons quil a e galement e t e propos e dutiliser la programmation dynamique pour estimer le MAP [Derin et Elliott, 1987a]. Mais il est alors n ecessaire d etre dans une conguration simple de segmentation (peu d etiquettes, dimensions raisonnables) et seule une approximation peut e tre obtenue.
7.1.6 Quelques MRF fondamentaux

Nous pr esentons ici quelques uns des champs de Markov les plus utilis es. Comme indiqu e pr ec edemment, ces champs sont d enis par leur voisinage et leurs fonctions de potentiel. Ils sont illustr es par le tirage de r ealisations selon l echantillonneur de Gibbs. Mod` ele dIsing : Ce mod` ele est le plus ancien (1925 [Ising, 1925]) et a e t e d evelopp e lors de l e etisme en tude du ferro-magn physique statistique. Lespace des descripteurs est celui des e tats des spins, i.e (espace binaire), et le voisinage est constitu e par les 4 ou 8 plus proches voisins dans un espace bidimensionnel. Les potentiels sont des potentiels en tout ou rien :

! !
Ce qui s ecrit e galement . Les potentiels des cliques dordre 1 (clique constitu ee par un seul spin) sont de la forme s ecrit :
! ! !
si si
! . L energie totale
!
est la constante de couplage entre sites voisins et repr esente un champ magn etique externe. Lorsque est positif, les congurations les plus probables (i.e d energies plus faibles) sont celles pour lesquelles les spins sont egatif, au contraire, on favorisera lalternance de m eme signe (ferro-magn etisme), alors que dans le cas de n de spins de signes oppos es (anti-ferromagn etisme). La valeur (signe et valeur absolue) de conditionne donc la r egularit e du mod` ele dIsing. Quant au champ magn etique externe relatif au potentiel dordre 1, il favorise a priori par son signe un spin ou un autre. La gure 7.2 montre des r ealisations de mod` eles dIsing pour diff erents param` etres (la r egularisation appel ee critique correspond a ` lapparition des zones homog` enes). Mod` ele de Potts : Il sagit dune extension du mod` ele dIsing [Wu, 1982] pour un espace -aire, i.e. . Il peut sagir de plusieurs niveaux de gris, mais plus souvent pour ce mod` ele, d etiquettes (labels) pouvant repr esenter une classication de limage (par exemple les classes eau, for et, champ, ville). Le voisinage consid er e est 4- ou 8-connexe et les potentiels sont comme pr ec edemment en tout ou rien mais d enis seulement pour les cliques dordre 2 :

! !
si si
Lorsque est positif, les congurations les plus probables correspondent a ` des sites voisins de m eme niveau de gris ou descripteur, ce qui donne des r e alisations constitu e es par des larges zones homog` e nes. La taille de ces regions est gouvern ee par la valeur de . Des exemples de r ealisations pour diff erentes valeurs de sont montr es gure 7.3.
137
F IG . 7.2 Le mod` ele dIsing plan et 4-connexe pour diff erentes valeurs etres - Simulations en raccorde de param` ment torique ; a. Image al eatoire : , b.r e gularisation faible, ; c. r e gularisation critique : ; d. r egularisation forte : .

Il est possible de d enir des mod` eles utilisant des pond erations diff erentes en fonction des directions des cliques, et de privil egier ainsi certaines directions. Ce mod` ele permet e galement de prendre en compte diff erentes relations entre egions (i.e. entre diff erentes les r valeurs des descripteurs). On peut par exemple d enir des pond erations pour . Dans notre exemple de classication en 4 e tiquettes eau, for et, champ, ville, une conguration de sites avec les e tiquettes champ / for e t peut e tre suppos e e plus probable quune conguration ville / for e t , do` u des valeurs et diff erentes [Sigelle, 1993]. Mod` ele markovien gaussien : Ce mod` ele est r eserv e aux images en niveaux de gris et ne convient pas bien aux images d etiquettes. Le voisinage est 4 ou 8-connexe et l energie est de la forme :

!

!
! !
Le premier terme correspondant aux cliques dordre 2 est egularisation, qui favorise les faibles un terme de r diff erences de niveaux de gris entre sites voisins pour . Le second terme peut correspondre a ` un terme dattache aux donn ees dans le cas o` u on poss` ede une image de donn ees ext erieures. Le rapport pond` ere les inuences respectives de lattache aux donn ees et de la r egularisation, et les valeurs absolues des param` etres caract erisent le caract` ere plus ou moins piqu e ou e quir eparti au contraire de la distribution.
7.1.7 Applications : restauration et segmentation

Nous avons e tudi e dans la section pr ec edente des algorithmes de simulation permettant de g en erer des r ealisations dun champ de Markov donn e. Nous abordons ici leur utilisation en tant quoutils de traitements dimages pour
138
F IG . 7.3 Le Mod` ele de Potts 2D et 4-connexe pour diff erentes valeurs de param` etres (m = 4) - Simulations en raccordement torique ; a. Image al e atoire : , b.r e gularisation faible, ; c. r egularisation critique : ; d. r egularisation forte : .

deux grandes applications de bas niveau : la restauration dimages et la segmentation.
Cadre bay esien Pour ces deux applications, on peut mod eliser le probl` eme dans esien de la fac on suivante. un cadre bay Nous disposons dune certaine donn e e (image) que nous noterons et que nous pouvons consid e rer comme une r ealisation dun champ al eatoire . Nous cherchons une r ealisation de limage restaur ee ou segment ee, que tiquettes (labels) dans le cas de la nous pouvons mod eliser comme un champ de Markov . est le champ des e segmentation, le champ des intensit es dans le cas de la restauration. Les espaces de congurations ne sont donc pas n ecessairement les m emes pour et . Ces deux champs sont li es par le processus dacquisition de limage, qui conduit du champ id eal , le processus image originel que nous cherchons, au champ bruit e que nous observons. La restauration ou la segmentation ont pour objectif dinverser le processus et donc de remonter a ` une r ealisation de a ` partir de lobservation des donn e es bruit e es . On parle dans ce contexte de champ de Markov cach e pour , ou de donn ees incompl` etes puisque nest pas une r ealisation de . On peut par exemple utiliser le crit` ere du maximum a la conguration maximisant la posteriori et rechercher probabilit e de conditionnellement a ` la donn ee i.e . Or la r` egle de Bayes permet d ecrire :
!
Expression dans laquelle il sagit alors danalyser chacun des termes et , sachant que est une constante (ind ependante de la r ealisation ). Le premier terme d ecrit justement le processus dobservation et dacquisition des donn ees. Lhypoth` ese la plus courante (dont la validit e


reste a ` justier) consiste a ` supposer lind ependance conditionnelle des pixels (bruit non corr el e par exemple) :
139
! ! ! ! !
Cette e criture nest plus valable lorsquil y a une convolution par la fonction de transfert du syst` eme dacquisition, mais on peut montrer que le champ a posteriori reste markovien. Par ailleurs, on fait sur le champ recherch e une hypoth` ese markovienne selon un voisinage et un mod` ele donn e d ependant de lapplication. On peut alors e crire :
Si on revient maintenant a ` la distribution a posteriori, celle-ci sexprime par :
avec :
!
!
! ! !
Par cons equent, sous les hypoth` eses pr ec edentes, on constate que la distribution a posteriori est une distribution de Gibbs et que donc le champ conditionnellement a ` est e galement un champ de Markov (th eor` eme de Hammersley-Clifford). Ainsi, il est possible de simuler des r ealisations de ce champ a ` laide de l e chantillonneur eresse est celle maximisant la de Gibbs ou de lalgorithme de Metropolis. Mais la conguration qui nous int probabilit e a posteriori, donc la r e alisation la plus probable du champ de Gibbs, ou encore celle qui minimise l energie . Lalgorithme du recuit simul e d ecrit plus haut permet datteindre ce (ou ces) e tat(s) d energie minimale.
(7.2)
Cas de la restauration
Reprenons la d emarche pr ec edente et exprimons plus en d etails l energie dans un cas particulier de restauration. Dans le cas o` u le processus dacquisition entra ne une d egradation de limage sous forme dun bruit blanc gaussien de variance , on a la probabilit e conditionnelle suivante :
La probabilit e a priori permet dintroduire les contraintes que nous souhaitons imposer a ` la solution (i.e. que nous supposons pour le processus originel). En faisant lhypoth` ese que est markovien nous nous restreignons a ` des contraintes locales, le plus souvent de r egularit e entre sites voisins. On choisit fr equemment un mod` ele avec des potentiels dordre 2 :
! ! ! # &%
! !
!

!

On a alors l energie suivante correspondant a ` la distribution de Gibbs du champ a posteriori :
!
!
! !
(7.3)
140
Le champ conditionnellement a ` est donc un champ de Gibbs pour le m eme syst` eme de voisinage que . La constante pond` e re linuence entre le terme dattache aux donn e es (cliques dordre 1) qui impose des niveaux de gris de limage restaur ee proches de ceux de la donn ee bruit ee, et le terme de r egularisation (cliques dordre 2) qui impose une solution constitu ee de zones homog` enes. Le mod` ele pour peut e tre soit markovien gaussien, soit plus adapt ea ` la restauration des contours avec une fonction appropri ee. En effet, le mod` ele gaussien qui correspond a ` un fonction quadratique favorise des niveaux de gris proches pour des pixels voisins dans tous les cas. Or si on consid` ere une image naturelle cet aspect est n efaste a ` proximit e des contours car il favorisera ont e t e propos e es pour mod eliser les potentiels des la pr esence dun d egrad e. Aussi, de nombreuses fonctions cliques dordre 2 : . Lid ee est de supprimer la p enalisation lorsque la variation de niveaux de gris est sup erieure a ` une certaine valeur consid er ee comme repr esentant un contour. La partie 7.4 d etaille ces aspects.
! !
Cas de la segmentation
Dans ce contexte, le champ markovien est eni sur d un autre espace de congurations que car seulement quelques e tiquettes sont consid er ees : (correspondant aux diff erentes classes cherch ees). Dans (champ des labels) a ` ne d e crit pas tant le processus dacquisition que ce cas le processus de passage de lapparence des classes dans limage. Le terme traduit donc la probabilit e de r ealisation dune conguration donn ee connaissant son e tiquetage (i.e. connaissant la classe de chaque pixel). En supposant lind ependance des sites les uns par rapport aux autres, et en supposant que le niveau de gris en un site ne d epend que de l etiquette en ce site, on a :

! ! !
Les valeurs des probabilit es conditionnelles sont donn ees par lhistogramme conditionnel des niveaux de gris pour une classe donn ee. Par exemple, si on suppose que chaque classe a une distribution gaussienne de moyenne et d ecart-type , on a :
! ! ! # % ! Si comme pr ec edemment on fait une hypoth` ese markovienne sur et quon se limite aux cliques dordre 2, on a : ! !
Do` u l energie a posteriori :
!

! # & %
Le champ des e tiquettes conditionnellement a ` est markovien et d energie de Gibbs . L` a encore, comme pour la restauration, le terme dordre 1 exprime le respect des donn ees (le niveau de gris doit correspondre a ` la classe), et le terme dordre 2 la contrainte de r egularisation introduite. On choisit souvent un mod` ele de Potts pour , ce qui donne une image segment ee avec de larges zones homog` enes. La gure 7.4 montre un exemple de segmentation dune image satellitaire obtenue par le radar a ` ouverture synth etique ERS-1. Lutilisation du mod` ele de Potts pour le terme dattache aux donn ees donne des r egions compactes. Dans les deux applications pr ec edentes il est n ecessaire de pouvoir d eterminer le ou les e tats d energie minimale qui correspondent au maximum de la probabilit e dun champ markovien. Lalgorithme du recuit simul e pr esent e permet de trouver ces congurations. Nous reviendrons sur ce point en pr esentant dautres estimateurs de la solution dans la section suivante.

(7.4)
7.2. ESTIMATEURS DANS UN CADRE MARKOVIEN
141
7.2 Estimateurs dans un cadre markovien

7.2.1 Introduction
Nous avons vu pr ec edemment comment il e tait possible dutiliser le formalisme markovien a ` des ns de restauration et de segmentation. On se situe alors dans le cadre de donn ees incompl` etes (on parle aussi de champs de Markov cach es) car la r ealisation dont on dispose est une r ealisation bruit ee (ou plus g en eralement vue a ` travers le syst` eme dacquisition) du champ de Markov originel. En notant le champ dont on observe une r e alisation, et le champ initial, lobjectif est alors dobtenir la meilleure r e alisation de connaissant lobservation , au trement dit, reconstruire de mani` ere optimale vis-` a-vis dun certain crit` ere. Dans le pr e c e dent paragraphe, nous nous e tions int eress es a ` la r ealisation maximisant la probabilit e a posteriori , et nous avions vu un algorithme permettant dobtenir cette r ealisation : le recuit simul e. En r ealit e dautres choix sont possibles, auxquels correspondent dautres m ethodes de r esolution, et que nous allons aborder dans ce chapitre.
7.2.2 Mod elisation bay esienne et fonction de cout

Si nous reprenons rapidement le raisonnement effectu e pr ec edemment, on peut e crire, en appliquant la r` egle de Bayes :
!
142
a. Image radar originale c ERS-1
b. Image segment ee en r egions F IG . 7.4 Exemple de segmentation markovienne sur une image ERS-1 du Flevoland.

alors On montre
143
que sous certaines hypoth` eses (ind ependance des sites dans la probabilit e conditionnelle et hypoth` ese markovienne pour le champ ), la distribution a posteriori est une distribution de Gibbs et donc que le champ conditionnellement a ` la donn ee est markovien. Cette propri et e nest pas n ecessaire pour les notions suivantes, mais elle sera primordiale pour les algorithmes de r esolution. Le probl` eme est alors de eterminer une estimation optimisant un certain crit` ere, o` u est une fonction d d eterministe de la donn ee : avec
esienne proc` ede alors ut, Lestimation bay comme suit. On se donne une fonction de co , qui repr esente le co ut de remplacer
par
d enie de
dans
, et qui poss` ede les propri et es suivantes :

Lestimateur optimal, i.e la fonction cest a ` dire :
opt . La fonction opt minimise donc lerreur moyenne conditionnellement a ` , et lestimateur optimal est Suivant les fonctions de co ut envisag ees, on obtient diff erents estimateurs et diff erentes m ethodes de r esolution associ ees.
7.2.3 Estimateur MAP
Consid erons la fonction de co ut suivante :

optimale est alors la fonction minimisant lesp erance (not ee

) du cout,

si
sinon
Cette fonction consiste donc a ` p enaliser toute diff erence entre deux congurations, et ce, quel que soit le nombre de sites en lesquels elles diff` erent. Nous pouvons alors e crire :
!

Par cons equent, la fonction opt minimisant lesp erance pour cette fonction de co ut est celle qui maximimise la probabilit e a posteriori : opt Argmax
!
Il nous faut donc trouver la r ealisation , fonction de , maximisant la probabilit e a posteriori . On parle de lestimateur MAP (maximum a posteriori) ou de maximum de vraisemblance a posteriori. On retrouve donc, avec cette fonction de co ut en tout ou rien, la d emarche intuitive que nous avions pr esent ee dans la partie pr ec edente 7.1.7 a ` savoir chercher la conguration maximisant la probabilit e conditionnellement a ` la donn ee disponible. Les solutions algorithmiques associ ees a ` cet estimateur sont le recuit simul e et lICM que nous avons pr esent es dans le paragraphe 7.1.5, utilis es avec la distribution a posteriori avec param` etre de temp erature.
144
7.2.4 Estimateur MPM

Consid erons maintenant la fonction de co ut d enie par :
!
! !
!
1 I

La fonction de co ut p enalise cette fois-ci une conguration proportionnellement au nombre de diff erences entre deux congurations. Elle para t donc plus naturelle que la fonction de co ut en tout ou rien pr ec edente. Dans le cas dune fonction de co ut d enie comme somme de co uts en chaque site, on peut montrer le r esultat suivant :
!
!
! !
!!
Or
! !
! !
, donc on peut faire appara tre les probabilit es conditionnelles et
esp erances en chaque site :
!
! !

! ! !
! !
! !!
On passe donc de la probabilit e conditionnelle globale dune conguration a ` la probabilit e conditionnelle en un site. Il sagit dune somme de termes positifs, et par cons e quent la fonction optimale minimise en chaque site lesp erance conditionnelle du co ut local . Ce r esultat est valable pour toutes les fonctions de co ut d enies par une somme de co uts en chaque site. Dans le cas de la fonction d enie ci-dessus, on a alors comme pr ec edemment :
! ! !

Ainsi, la valeur optimale de
! ! !
!!
ou de
en chaque site est telle que :
opt
Argmax
i.e. on maximise en chaque site la marginale a posteriori . On obtient donc des estimateurs du maximum a posteriori locaux, a ` calculer en chaque pixel contrairement a ` la recherche pr ec edente qui e tait globale. Lestimateur est appel e maximum de vraisemblance a posteriori local ou maximum posterior marginal (pour maximum a posteriori de la marginale) abr eg e en MPM. Dun point de vue algorithmique, la taille de lespace des congurations ne permet pas un calcul direct des quantit es . Aussi r ealise-t-on en pratique des approximations de type Monte-Carlo. En effet, supposons que lon soit capable de tirer des r ealisations de selon sa loi conditionnelle a ` , et notons les . Il est alors possible de calculer une approximation de lestimateur MPM. Le tirage des r ealisations ne pose quant a ` lui pas de probl` eme particulier car nous avons vu dans le paragrpahe pr ec edent 7.1.4 comment tirer des r ealisations dun champ de Gibbs avec l echantillonneur de Gibbs et lalgorithme de M e tropolis. Or sous les hypoth` eses rappel ees en d ebut de la section 7.2.1, la probabilit e a posteriori est une distribution de Gibbs.
!!
!
!
!!
$
Supposons donc que nous disposions de e chantillons de tir es selon la loi a posteriori et que nous cherchions a ` estimer la distribution conditionnelle en chaque site . Nous allons estimer cette quantit e par la fr equence empirique de au site dans les e chantillons de , i.e :
145
! !
Lestimation ee en chaque site en choisissant la valeur de au sens du MPM est alors donn .
!!
!

1 I

dans
maximisant
7.2.5 Estimateur TPM

Consid erons maintenant la fonction de co ut d enie par :
!
! !
Il sagit de lerreur quadratique et elle p enalise cette fois-ci directement la somme des diff erences entre les deux congurations. Elle peut donc e tre plus adapt ee dans certains cas que les pr ec edentes, puisquelle tient compte non seulement du nombre de diff erences comme le MPM, mais aussi de leurs valeurs. Dans ce cas, on a en utilisant le r esultat e tabli pr ec edemment :
! ! ! ! ! ! ! soit minimum. Nous allons e On cherche donc , telle que ! crire cette esp erance sous une nouvelle forme en utilisant la moyenne conditionnelle au site , ! ! ! ! ! ! : ! ! ! ! ! ! ! ! ! ! !
o` u est une constante ne d ependant pas de donc nintervenant pas dans la minimisation. Par cons equent, le minimum de lerreur est atteint pour la fonction telle que :
opt !
! !
Cet estimateur consiste a ` prendre en chaque site la moyenne conditionnelle locale donn ee par la loi a posteriori, do` u le nom de TPM (Thresholded Posteriori Mean). Dun point de vue algorithmique, la d emarche est similaire a ` celle effectu ee dans le paragraphe pr ec edent pour le MPM. On approxime lesp erance conditionnelle en chaque site par la moyenne empirique en ce site des e chantillons tir es selon la loi a posteriori :
! !
!
Lestimation au sens du TPM est alors donn ee en chaque site par sa moyenne empirique. Remarquons que cet estimateur est mal adapt ea ` une probl ematique de segmentation car la moyenne des e tiquettes na alors aucun sens.
146
7.2.6 Comparaison des estimateurs MAP, MPM, et TPM

Nous comparons dans cette section les trois estimateurs dans le cadre de la restauration. Dans le cas du MAP, les r esultats sont obtenus par ICM et par recuit simul e. Limage a ` restaurer (gure 7.5.a) est une image bruit ee par un bruit blanc gaussien. L energie a posteriori utilis ee s ecrit :
!
! !
et

!
avec
Comme indiqu e dans le paragraphe 7.1.7, cette fonction permet de seuiller les p enalit es impos ees par le terme de r egularisation en pr esence de contours dans limage. Les param` etres utilis es sont x es aux valeurs suivantes ( ecart-type du bruit), (saut en amplitude : a ` partir duquel on consid` ere quil y a un contour), pond eration de linuence relative des deux termes). Linitialisation est donn ee par limage a ` restaurer. Pour tous les estimateurs, on r ealise 600 it erations. Dans le cas du recuit simul e, la temp erature initiale est de 6. Les r esultats sont montr es sur la gure 7.5.

147
a. Image originale bruit ee.
b. R esultat de la restauration avec lestimateur MAP et lalgorithme du recuit simul e.
c. R esultat de la restauration avec d. R esultat de la restauration avec lestimateur MAP et lalgorithme lestimateur TPM. ICM. F IG . 7.5 Comparaison des algorithmes ICM, Recuit Simul e et TPM en restauration.
148
On constate visuellement que le meilleur r esultat est obtenu par le MAP du recuit simul e. Comme limage originale est une assez bonne initialisation, il ny a pas de grandes diff erences entre les algorithmes de recuit simul e et dICM pour lestimateur du MAP. Ce nest pas vrai d` es que linitialisation s ecarte du r esultat a ` obtenir et les diff erences avec le recuit simul e peuvent e tre tr` es importantes. Par ailleurs, on constate que lestimateur TPM, qui est par d enition plus local, donne un r esultat plus bruit e et moins r egularis e. Cette analyse visuelle est conrm ee par l etude statistique qui peut e tre effectu ee sur des zones homog` enes de limage. Le tableau ci-dessous donne les statistiques dune zone sombre et dune zone claire de limage originale et pour les diff erents r esultats de restauration. Les e carts-types les plus faibles sont obtenus pour lestimateur MAP. Statistiques sur limage originale zone 1 zone 2 Estimateur MAP ICM zone 1 zone 2 Estimateur TPM zone 1 zone 2 Estimateur MAP recuit simul e zone 1 zone 2
135.7 90.9 136.7 91.6 136.2 91.6 136.2 91.9
27.8 27.1 11.5 6.9 11.3 6.9 10.3 6.1
TAB . 7.1 Statistiques sur des zones homog` enes pour les diff erents r esultats de restauration On notera e galement que des points isol es de faible ou fort niveau de gris subsistent dans limage restaur ee. Cela est li ea ` lutilisation de la fonction qui ne r egularise plus au-del` a dun certain seuil contr ol e par la valeur de . En ce qui concerne les temps de calcul, les m ethodes se r epartissent comme suit : lalgorithme le plus rapide pour converger est sans conteste lICM, les algorithmes de recuit simul e et de TPM (ou MPM) e tant a ` peu pr` es e quivalents. En effet, plus le nombre dit erations est grand, meilleure est lestimation de la moyenne a posteriori. Les conclusions qui sont donn ees ici ne sont pas n ecessairement valables pour une application en segmentation. Lestimateur du TPM peut en effet dans certains cas donner de meilleurs r esultats que le MAP. Par ailleurs, lICM peut sav erer tr` es utile lorsquon conna t une conguration proche de la conguration optimale.
7.3 Estimation des param` etres

7.3.1 Introduction
Le probl` eme de lestimation de param` etres (encore appel es hyperparam` etres dans la litt erature), revient tr` es fr equemment en traitement dimage par champs de Markov. Donnons-en plusieurs exemples : 1. On se donne une r ealisation dun champ de Markov associ e au mod` ele dIsing, mais on ne conna t pas ses param` etres. Quels sont-ils ? 2. On veut g en eraliser ceci a ` une image de texture donn ee dont on conna t le mod` ele sous-jacent (par exemple un mod` ele gaussien en 4-connexit e ) mais pas les param` etres, qui sont du type : moyenne locale, variance locale, poids de la r egularisation locale. Quels sont-ils ? Leur connaissance pourrait bien en effet servir a ` la classication dimages compos ees de zones textur ees en se basant sur lestimation locale de tels param` etres. On classierait alors selon les valeurs de ces attributs locaux.
` 7.3. ESTIMATION DES PARAMETRES
149
3. On veut segmenter une image, et pour cela apprendre les param` etres de chaque classe, ainsi que le coefcient optimal du mod` ele de r egularisation adapt ea ` cette t ache. On sait en effet que le r esultat dune segmentation par estimateur MAP par exemple d epend fondamentalement du poids respectif de la r egularisation par rapport a ` celui de lattache aux donn ees. Il faut donc l` a aussi estimer ce poids dune fac on optimale dans un sens a ` d enir. Lensemble forme un probl` eme r eput e difcile. Nous ne d ementirons pas ici la difcut e de ces probl` emes, accentu ee par le fait que de tr` es nombreuses variantes ont e t e mises au point dans la litt erature pour le r esoudre. Certaines tentatives de comparaison de ces approches ont d eja e t e effectu ees [Pieczynski, 1994]. Nous exposerons ici les variantes les plus fr equemment utilis ees. Elles se d ecomposent en deux classes fondamentales : le cas des donn ees dites compl` etes, correspondant aux deux premiers probl` emes cit es plus haut : un e chantillon dune distribution de Gibbs est connu. Il sagit de remonter aux param` etres de cette distribution. le cas des donn ees dites incompl` etes. L` a non seulement le r esultat de traitement est inconnu, mais les param` etres sont e galement a ` estimer.

7.3.2 Donn ees compl` etes

Notons dans ce qui va suivre une conguration observ ee relativement a ` une distribution de Gibbs donn ee dont l e nergie associ e e puisse s e crire sous la forme dune fonction lin e aire dun param` e tre , par exemple , o` u est un potentiel donn e. Un principe naturel en vue de la recherche de est d ecrire la vraisemblance de la donn ee :
et de chercher par exemple la valeur de lhyperparam` etre maximisant cette vraisemblance . Le probl` eme essentiel est que lon ne sait en g en eral pas calculer exactement la fonction de partition . M eme pour des mod` eles aussi simples et fondamentaux que ceux dIsing et de Potts, le r esultat (analytique) est obtenu apr` es des calculs excessivement compliqu es [Onsager, 1944, Landau et Lifschitz, 1961]. Dans les autres cas on sera donc amen e: soit a ` effectuer des approximations de la fonction de partition globale au moyen des fonctions de partition conditionnelles locales (codages paragraphe 7.3.2, pseudo-vraisemblance paragraphe 7.3.2) soit a ` employer des algorithmes it eratifs (gradient stochastique paragraphe 7.3.2) a ` partir de la vraisemblance exacte, mais dont il sagit alors de prouver la convergence ainsi que le type doptimum trouv e (local, global).

M ethode des codages Le principe de la m ethode des codages [Besag, 1974] est le suivant. Une fois d eni un syst` eme de voisinage pour un champ de Markov, nous sommes capables de d enir un certain nombre de sous r eseaux, chacun form e de sites/pixels ind ependants les uns des autres : chacun de ces sous r eseaux est appel e un codage. Par exemple avec un voisinage en 4 connexit e il existe deux codages comme le montre la gure ci dessous (` a gauche), et 4 codages diff erents dans le cas de la 8-connexit e (` a droite) :
150

3 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 2 3 2 3 4 1 4 1 4 3 2 3 2 3 4 1 4 1 4 3 2 3 2 3
Nous allons poser le probl` eme destimation dans le cadre de chaque codage. Pour un codage donn e les diff erents sites/pixels le constituant sont ind ependants les uns des autres puisquils ne sont pas des voisins pour le champ de Markov de d epart. La probabilit e globale dun codage se trouvera donc e tre le produit des probabilit es individuelles de chacun des sites du codage. Or du fait de la structure de Markov du champ de d epart cette probabilit e individuelle se trouve e tre la probabilit e conditionnelle locale du site/pixel dans le champ de Markov. Pour un codage Cod donn e nous pouvons donc e crire :
! ! ! Cod !
Cod
!
! ! ! !
(7.5)
Cod
Etant donn e la structure des probabilit es locales telles quelles ont e t e d ecrites dans les chapitres pr ec edents la fonction de vraisemblance devient calculable, puique les fonctions de partition conditionnelles locales le sont. Dans le cas o` u la d ependance des e nergies locales est lin eaire vis-` a vis des param` etres, la log-vraisemblance associ ee,

! ! ! Cod !
Cod
!
!
Cod
est une fonction concave du (des) param` etre(s), car somme de fonctions concaves [Sigelle, 1997]. Elle se pr ete donc bien a ` la recherche dun optimum par une m ethode classique de type gradient. On peut e galement montrer quil sagit dans ce cas dun simple probl` eme de moindres carr es [Derin et al., 1985]. Pseudo-vraisemblance Il appara t en fait exp erimentalement que la m ethode des codages nest pas able. La m ethode du maximum de vraisemblance vrai para t quant a ` elle incalculable. Des algorithmes ont cependant e t ee tudi es pour tenter de r esoudre ce probl` eme [Younes, 1988], voir paragraphe 7.3.2. En fait nous allons utiliser une m ethode interm ediaire qui aura de bonnes propri et es : la m ethode du pseudo-maximum de vraisemblance [Grafgne, 1987]. Du maximum de vraisemblance vrai, nous allons prendre lid ee de travailler sur lensemble de limage et non s epar ement sur des r eseaux ind ependants. De la m ethode de codage, nous conservons lid ee de manipuler une fonction de vraisemblance produit des probabilit es locales de chacun des sites/pixels. Cette fonction sera appel ee pseudo-maximum de vraisemblance, et elle s ecrira :
!
! ! ! ! !
(7.6)
ou, encore, en consid erant le logarithme de cette fonction, et lexpression de la probabilit e locale de chaque site/pixel : (7.7)

!
151
Maintenant lexpression devient calculable, puisque reli ee a ` la fonction de normalisation de la probabilit e conditionnelle locale telle quelle a e t e d ecrite dans le paragraphe 7.1.3. Donc un raisonnement identique a ` celui du paragraphe pr ec edent conduit au fait que la log-pseudo-vraisemblance est une fonction concave des param` etres lorsque l energie en d epend de fac on lin eaire. Les algorithmes usuels de type gradient ou gradient conjugu e sappliquent donc aussi ici naturellement a ` la recherche de loptimum (qui est unique comme pr ec edemment). Il sagit alors de qualier la valeur des param` etres obtenus par cette m ethode par rapport a ` la valeur vraie. Des r esultats th eoriques importants ont e t e obtenus a ` ce sujet [Grafgne, 1987, Guyon, 1992] : la m ethode de la pseudovraisemblance est consistante et convergente.
Algorithme du gradient stochastique Partons de la vraisemblance exacte du param` etre. Elle s ecrit bien s ur :
La valeur de lhyperparam` etre satisfaisant au principe du maximum de vraisemblance donc v erier l equation :
Comme I E

doit
(7.8)
equation [Sigelle, 1997], cette valeur optimale est donc unique et doit satisfaire l
suivante :
I E
"
Il sagit l` a de ce que lon appelle une e quation stochastique. Comme remarqu e en introduction de la Section 7.3.2 cette e quation ne peut e tre r esolue exactement, pour la raison que I E , qui d erive de la fonction de partition , ne peut en g en eral e tre calcul e de fac on analytique exacte. On est donc amen ea ` employer des algorithmes bas es sur un sch ema it eratif de type Newton-Raphson, mais adapt e a ` ce cadre stochastique. Un sch e ma rigoureux conduirait a ` chaque e tape a `: I E I E
(7.9)
cest-` a-dire au sch ema it eratif :
Lid ee est alors de remplacer les grandeurs statistiques mises en jeu par leurs valeurs empiriques approch ees. Ainsi pour lesp erance du potentiel de r egularisation , on prendra sa moyenne empirique au cours dune seule it eration (cest a ` dire la valeur effective obtenue !) dun e chantillonneur de Gibbs ou de Metropolis men e avec la valeur courante du param` etre. Quant a ` la variance de ce potentiel, on lestime encore plus cr ument par une grandeur positive x ee ! On peut montrer que le prix a ` payer pour cette approximation est lintroduction dun terme correctif suppl ementaire en
I E var

dans le sch ema it eratif a ` lit eration
. Cest le principe de lalgorithme de pour
gradient stochastique [Younes, 1988] :

arbitraire tir e au hasard
obtenu par une dynamique de Il est tr` es important de noter ici que ( ), e chantillon de la distribution Gibbs (ou de Metropolis) associ ee a ` la valeur courante du param` etre , est g en er ea ` partir de l echantillon

(7.10)
152
obtenu a ` lit eration pr ec edente (cest a ` dire lors de la valeur pr ec edente du param` etre). On peut alors montrer que cet algorithme stochastique converge presque s urement, en termes de probabilit e, vers la valeur optimale lorsque le coefcient est choisi sufsamment grand.
7.3.3 Donn ees incompl` etes

Dans cette section, nous abordons le probl` eme de lestimation des param` etres dans le cas des donn ees incompl` etes dites encore manquantes. Dans ce cas nous connaissons une observation ,e chantillon de la v.a. , mais elle est appel ee incompl` ete (ou d egrad ee), car reli e e a ` une sc` e ne originale , non-d e grad e e, dont le champ al e atoire correspondant sera not e . La relation entre et seffectue via une loi de probabilit e conditionnelle repr esentant lattache aux donn ees (cf. 7.1.7) dont nous explicitons la d ependance p.r. a ` un param` etre positif :
Ainsi, dans le cas dun bruit blanc gaussien additif en restauration ou en d econvolution et lapproximation discr` ete nie, on a :

o` u
est la matrice associ ee a ` la r eponse impulsionnelle de la fonction de ou (lidentit e en restauration) et
la variable cach ee . On suppose aussi que lon dispose dune connaissance a priori sur la sc` ene a ` retrouver , que ce soit en segmentation ou restauration, via la distribution de Gibbs suivante :
%
. On notera que la fonction de partition
est ici ind ependante de
Nous aurons besoin dans la suite de ce chapitre dutiliser la distribution de Gibbs a posteriori :
de fonction e nergie , et de fonction de partition associ ee . Nous commencerons par g en eraliser, dans un cadre de Maximum de Vraisemblance (MV), la m ethode de gradient stochastique vue au paragraphe pr ec edent lorsque la loi dobservation (attache aux donn ees) est compl` e tement connue, cest-` a-dire que nous nous focaliserons sur lestimation du meilleur param` etre de r egularisation . Puis nous comparerons cette m ethode a ` des variantes importantes similaires r epertori ees dans la litt erature. Nous aborderons ensuite lestimation des param` etres dattache aux donn ees, en particulier dans le cadre de la segmentation dimages. Cela nous permettra de d ecrire ensuite la seconde grande classe de m ethodes adapt ee a ` lestimation des param` etres : lEM (Expectation-Maximisation).
!
!
!
Gradient stochastique g en eralis e [Younes, 1989] On va prouver dans cette partie que lestimation du param` etre de r egularisation connaissant la forme du potentiel a priori ne peut e tre dissoci ee dans la plupart des cas de la forme de lattache aux donn ees, suppos ee connue ici par simplicit e, cest a ` dire que est connu. On suppose acc eder par exemple dune fac on ou dune autre a ` la variance dun bruit gaussien en restauration dimage bruit ee (et a ` la r eponse impulsionnelle du ou si lon est en
153
d econvolution). Dans le cas suppos e o` u aucune information a priori sur le param` etre de r egularisation nest disponible, cest-` a-dire lorsque suit la distribution uniforme sur , la vraisemblance de ce param` e tre est la grandeur ad e quate a ` e tudier connais sant lobservation incompl` ete et le param` etre . Elle peut se calculer de fac on e l egante [Peyrard, 2001] en remarquant que la loi jointe de lobservation et des variables cach ees s ecrit :
Si au moins une valeur de
! ! ! nannule pas , on en d eduit que :

Toute valeur optimale du param` etre de r egularisation satisfait donc l equation suivante :

(7.11)
o` u lon rappelle que I E est lesp erance dune v.a. sous la distribution de Gibbs a priori d energie , tandis que I E signie lesp erance statistique sous la distribution de Gibbs a posteriori. Notons e galement que les deux grandeurs statistiques I E et I E sont des fonctions monotones d ecroissantes de , ce qui implique que plusieurs valeurs optimales de lhyperparam` etre peuvent exister (voir g.7.3.3).
I E
I E
"
I E
I E
(7.12)
^ 1
()
^ 2 ,()
F IG . 7.6 Valeur(s) optimale(s) du param` etre de r egularisation en donn ees incompl` etes.
Impl ementation : directement :
Si lon applique un sch ema de Newton-Raphson a ` l equation stochastique (7.12) on obtient
E I
I E
IE IE

I E var
I E var
(7.13)
Il faut dabord noter que dans ce sch ema le d enominateur du dernier terme peut e tre de signe quelconque contrairement au cas des donn ees compl` etes (7.10), ce qui est reli ea ` lexistence de plusieurs solutions possibles en donn ees
154
incompl` etes. Maintenant, en sinspirant du raisonnement effectu e pour le gradient stochastique pour les donn ees compl` etes, on saperc oit quil est n ecessaire dapproximer des quantit es statistiques (moyenne, variance) reli ees aux distributions a posteriori et a priori. On a donc besoin d echantillonner deux champs de Markov en g en eral : celui li ea ` la r egularisation pure (champ a priori) et le champ de Markov post erieur comprenant lattachement aux donn ees. Le sch ema empirique qui en r esulte naturellement est donc le suivant [Younes, 1989] :

un e chantillon un e chantillon
g en er e par g en er e par
(distribution a priori)
(distribution a posteriori)

avec la proc edure d evolution de lhyperparam` etre :
et var (qui n ecessitent donc en fait au moins deux e chantillons pour chacune des distributions et a ` chaque e tape du sch ema d evolution de lhyperparam` etre). Ainsi en segmentation, on doit e chantillonner aussi bien la distribution a posteriori, ce qui sera par ailleurs utile en vue de la segmentation a ` convergence des param` etres par lun des estimateurs MPM ou TPM, que la distribution a priori qui correspond au mod` ele de r egularisation pur : mod` eles dIsing, de Potts, g en eralisation, et ceci pour la valeur courante du (des) hyperparam` etre(s). La convergence de cette m ethode est a ` montrer dans le cadre g en eral des algorithmes stochastiques [M etivier et Priouret, 1987], qui d epasse largement lobjet de ce chapitre. Comparaison avec dautres variantes destimation Dans ce paragraphe on pr esente dautres m ethodes usuelles destimation des hyperparam` etres en donn ees incompl` etes, qui sont en fait reli ees a ` dautres estimateurs que le maximum de vraisemblance. Toute la subtilit e r eside ici dans le choix de la fonction de type vraisemblance a ` maximiser. On va voir en effet que de tr` es l eg` eres diff erences conduisent a ` des formes fort diff erentes d equations stochastiques, et donc des r esultats destimation a priori fort diff erents. On suppose dans les deux premiers cas quun r esultat optimal de restauration (ou segmentation) est connu a ` l etape destimation o` u lon se situe. Une premi` ere approche consiste a ` utiliser la loi jointe de lobservation et du r esultat connaissant la valeur courante des hyperparam` etres [Lakshmanan et Derin, 1989a, Descombes et al., 1999]. On peut alors e crire que le param` etre optimal doit satisfaire :
Il faut noter en particulier la pr esence des estimateurs empiriques des variances var

var
var
En utilisant comme ec edemment le fait que lattache aux donn ees (resp. la r egularisation) est ind ependante de pr lhyperparam` etre (resp. de ), on obtient :
Et comme le premier terme (attache aux donn ees) ne d epend pas de ,

On retombe de vraisemblance pour alors sur lestimateur au sens du maximum le champ de Markov a priori d energie et pour la donn ee ici compl` ete , cest a ` dire : I E . On peut donc utiliser une technique de gradient stochastique classique pour estimer ce param` etre (cf. paragraphe 7.3.2). On peut ensuite it erer
155
en effectuant le traitement d esir e (restauration, segmentation) avec les nouvelles valeurs des hyperparam` etres obtenues. On obtient donc une nouvelle conguration optimale a ` partir de laquelle on peut re-estimer les param` etres, et ainsi de suite [Khoumri, 1997, Zerubia et Blanc-F eraud, 1998]. La m ethode est th eoriquement convergente vers les valeurs optimales des param` etres et de la conguration. Une seconde approche consiste a ` utiliser la probabilit e du r esultat conditionnellement a ` lobservation et aux hyperparam` etres. Dans ce cas, le param` etre optimal doit v erier :
En appliquant la seconde formule de Bayes et en utilisant le m eme argument dind ependance des diff erentes lois de probabilit es vis-` a-vis des diff erents hyperparam` etres mis en jeu, on obtient :

!
On tombe cette fois pour la distribution de a pos sur lestimateur au sens du maximum de vraisemblance Gibbs teriori d energie et pour la donn ee compl` ete , cest-` a-dire : I E . Les deux m ethodes aboutissent donc a ` lestimation dun param` etre unique, et peuvent donc e tre impl ement ees avec une technique de gradient stochastique classique [Younes, 1988, Khoumri, 1997]. Nous citerons e galement lalternative des m ethodes MCMCML (Monte Carlo Markov Chains Maximum Likelihood) [Descombes et al., 1999]. Il est tr` es int eressant de comparer les deux r esultats pr ec edents avec le v eritable gradient stochastique g en eralis e vu pr ec edemment. On rappelle que celui-ci permet de maximiser la probabilit e du param` etre de r egularisation conditionnellement a ` lobservation uniquement [Younes, 1989] :
En toute rigueur, il est lestimateur exact au sens du MV du param` etre de r egularisation. Les deux autres cit es pr ec edemment ont essentiellement lavantage d etre plus rapides, car ne n ecessitant quun e chantillonnage a ` chaque e tape, et permettant de faire alterner le traitement dimage d esir e avec lestimation des param` etres. En pratique, les trois estimateurs cit es aboutissent a ` des valeurs du param` etre de r egularisation semblables, ce qui provient du fait que les mod` eles adopt es pour lattache aux donn ees et pour la r egularisation sont souvent choisis en coh erence avec lobservation fournie. Estimation des hyperparam` etres dattache aux donn ees : le cas de la segmentation Supposons que lon veuille estimer e galement les param` etres intervenant dans lattache aux donn ees, que nous regrouperons sous une variable . Ainsi, dans le cas important de la segmentation o` u le niveau de gris de cha , est cune des r egions dune image est suppos e e suivre une loi gaussienne de moyenne et de variance lensemble . Nous e tudierons ici lestimation de ces param` etres dans le cas gaussien par raison de commodit e. La probabilit e des observations conditionellement aux labels s ecrit donc :
& % ! #

!
On peut e crire la distribution a posteriori sous la forme :
!
156
avec comme d enition de la fonction e nergie a posteriori effective :
!

!

(7.14)
et comme fonction de partition a posteriori associ ee . La vraisemblance des param` etres dattache aux donn ees s ecrit donc selon le m eme principe que pr ec edemment
&%
Int eressons nous a ` maximiser cette quantit e vis-` a-vis dun des param` etres de . Il faut remarquer ici que les . Do` u lon fonctions e nergie mises en jeu d ependent de fac on non-lin eaire de lensemble de param` etres d eduit pour chacun des param` etres :
Pr ecisons quil sagit bien rance a posteriori. Pour analyser la d ependance pr ecise de l energie a posteriori de lesp e vis-a-vis des param` etres , il est commode de re- ecrire la formule (7.14) en employant les fonctions caract eristiques dappartenance a ` chaque classe :

I E
"

(7.15)
!
!
1 I

Il en r esulte des formules importantes pour la suite :

Examinons dabord le cas dun param` etre de moyenne donn e. On peut montrer que (si
I ! ! 1 ! !
1 I
(7.16)

! ! ! ! !

!
):
(7.17)
Linterpr etation physique en est claire : on obtient le barycentre des observations en chaque site de limage pond er ees par la probabilit e a posteriori davoir une classe d etermin ee. De la m eme fac on, on obtient pour les variances de chaque classe :

!
!

(7.18)
les pouvant e tre calcul es par la formule (7.17). Le r esultat est similaire a ` une variance empirique, mais avec pond eration en chaque site par la probabilit e a posteriori que ce site ait le label e tudi e. En d enitive on aboutit donc a ` des e quations (7.17) et (7.18) auto-coh erentes, de forme bien plus complexe que celles des gradients stochastiques simple et g en eralis e. On aimerait pouvoir les remplacer par des formes it eratives simples : cest ce qui va justier lemploi des m ethodes de type EM, a ` adapter dans le cadre gibbsien d eni ici.

Expectation-maximization (EM)
157
R ecapitulons les r esultats pr ec edents obtenus concernant lestimation au Maximum de Vraisemblance des hyperparam` etres dans le cas des donn ees incompl` etes : pour lhyperparam` etre de r egularisation nous sommes arriv es a ` l equation stochastique :
I E

I E
pour les param` etres dattache aux donn ees en segmentation avec d equations :

! ! ! ! ! ! ! ! ! !

classes nous sommes arriv es au syst` eme

Nous en avons conclu quil serait esirable de r esoudre ces e quations de mani` ere it erative. Par exemple si les d e taient connues (ou apprises) a ` une e tape donn ee on pourrait les injecter dans probabilit es a posteriori la premi` ere e quation a ` condition de pouvoir estimer pour toute valeur de lesp erance a priori du potentiel de r egularisation ainsi que dans le deuxi` eme syst` eme. Ces deux arguments vont nous fournir les principes de lEM, avec un certain nombre de r esultats th eoriques tr` es puissants a ` la cl e. La m ethode EM est par essence it erative. Des r esultats th eoriques tr` es g en eraux montrent que la vraisemblance des param` etres estim es cro t a ` chaque it eration de lalgorithme associ e [Baum et al., 1970, Redner et Walker, 1984]. On pourra e galement consulter en particulier [Chalmond, 1999] pour une pr esentation claire de cette m ethode. De plus cette m ethode permet dune certaine fac on loptimisation s epar ee des hyperparam` etres dattache aux donn ees et de celui de r egularisation. En effet elle consid` ere essentiellement la probabilit e jointe de lobservation et des donn ees cach ees (un e tiquetage de limage par exemple), cest-` a-dire le produit de la loi dobservation et de la probabilit e a priori. soient connus a ` l e tape courante . On suppose aussi que lon a acc` es dune Supposons que les param` etres et fac on ou dune autre aux statistiques li ees a ` la loi a posteriori des donn ees cach ees courantes (ppartie Expectation de lEM, voir plus loin). On d enit alors la notation :

I E
La partie optimisation (Maximisation) de lEM consiste a ` rechercher :

Du fait de la s eparabilit e de la loi jointe, la fonction objectif
I E

I E I E
secrit : !
Cela correspond donc a ` loptimisation s epar ee :

158
On rappelle que la vraisemblance des param` etres cro t en fonction de lit eration par cette m ethode ce qui aboutit a ` terme a ` un optimum local pour les valeurs des param` etres. Examinons plus pr ecis ement ce qui se passe pour chacune des cat egories de param` etres : en ce qui concerne le param` etre de r egularisation, cela correspondra a `:
I E

"
I E

(7.19)
cest-` a-dire en vertu de r esultats suppos es maintenant acquis : I E

I E
Supposons que lon sache dune mani` ere ou dune autre calculer ou estimer lesp erance a posteriori du potentiel de r egularisation pour la valeur courante des param` etres. Ainsi, en pratique, on approxime cette quantit e par sa moyenne empirique au cours dun e chantillonneur de Gibbs (ou de Metropolis) pris pour la valeur courante des param` etres 3 . On est alors ramen ea ` un probl` eme destimation du param` etre de r egularisation pour la donn ee compl` ete I E ! On peut donc appliquer la technique du pseudo-maximum de vraisemblance [Chalmond, 1989] ou bien encore celle du gradient stochastique [Younes, 1991] pour re-estimer la nouvelle valeur du param` etre de r egularisation. pour les param` etres dattache aux donn ees, on a vu plus haut que

!

Le principe EM s ecrit donc - pour les param` etres de moyenne : I E

- pour les param` etres de variances : I E

! ! ! ! ! ! ! !

(7.20)
! !

!

!

!
!

(7.21)

Deux remarques insistantes : 1. Ce sont bien les distributions a posteriori qui sont mises en jeu dans lestimation it erative (eqs. 7.20 et 7.21). Elles sont donc a ` re-estimer a ` chaque it eration . Une mani` ere bien naturelle est de remplacer ces probabilit es a ` l etape courante du processus EM par la fr equence empirique dapparition des labels lors dune s erie d echantillonnages de la distribution de Gibbs a posteriori courante men es a ` laide dun e chantillonneur de type Gibbs ou Metropolis
3 Ceci
correspond a ` l etape Estimation de lalgorithme EM.
159
[Chalmond, 1989]. Notons pour cela
le nombre dit erations effectu e avec l echantillonneur ainsi s electionn e:
Notons e galement
!
e chantillonnages. On peut donc e crire : param` etres de moyennes et de variance de chaque classe :
le nombre de fois que le label a e t e tir e en un site

!

au cours de lensemble de ces
, et il en r esulte les estimations empiriques des

De la m eme fac on, notons la s erie dimages e chantillons ainsi obtenue pour lesp erance a posteriori du potentiel de r egularisation I E

! ! ! ! ! ! ! ! ! !

. On obtient pour

Cest donc ensuite que lon proc ede a ` l etape destimation EM comme indiqu e plus haut, a ` partir de ces valeurs empiriques a posteriori. 2. On retrouve le caract` ere it eratif que nous voulions anticiper a ` propos des e quations plus haut. L` a aussi, a ` convergence, on doit satisfaire a ` la forme exacte des e quations (7.17) et (7.18) obtenues par le Maximum de Vraisemblance. Variantes Une variante importante, ee ICE ou Iterative Conditional Estimation est la suivante [Pieczynski, 1994]. appel chantillons obtenus pr ec edemment a ` une e tape courante de lEM. On pourrait sonConsid erons les e ger a ` estimer moyenne et variance des classes pour chacun deux consid er e comme segmentation courante, puis prendre la moyenne empirique (arithm etique) des valeurs ainsi obtenues

!1 I I 1 ! ! 1 I ! I ! 1 !

Cette estimation est diff erente de lEM. On peut montrer quelle correspond en fait a ` lestimateur de la moyenne a posteriori des param` etres. Conclusion pour lestimation en donn ees incompl` etes On voit donc au terme de cette partie que lestimation en donn ees incompl` etes se pr ete a ` un nombre tr` es riche de variantes. On pourrait ainsi parfaitement juger pr ef erable destimer certains types de param` etres comme
160
moyenne et variance par lEM, tandis que lon adopterait la m ethode de Lakhsmanan-Derin pour le param` etre de r egularisation, ou r eciproquement ! Ces variantes m eritent encore d etre examin ees et compar ees entre elles de fac on exhaustive, dans la lign ee de lapproche suivie dans [Pieczynski, 1994]. Il faut aussi pr eciser que les m ethodes utilisant un e chantillonnage de la distribution a posteriori (comme lEM) permettent en m eme temps de fournir une s erie de congurations e chantillons se pr etant favorablement a ` la segmentation ou a ` la restauration dans le cadre des estimateurs de type TPM ou MPM, lorsque la convergence des param` etres vers leur valeur optimale est suppos ee atteinte.
7.4 Processus de bords

Lun des grands domaines dapplication des mod` eles markoviens est la restauration comme nous lavons mentionn e au paragraphe 7.1.7. Connaissant une r ealisation , on cherche une solution minimisant le crit` ere :
Le terme de r egularisation permet alors dagir directement sur les d eriv ees de la solution cherch ee. Dans le cas dun potentiel quadratique, il sagit dune r egularisation de Tikhonov qui entra ne un fort lissage de la solution au d etriment des discontinuit es souvent naturellement pr esentes dans limage. De nombreux travaux ont port e sur lintroduction de discontinuit es et sur les avantages potentiels que cela impliquait dans la recherche de la solution. Nous nous limiterons ici a ` des cliques dordre deux, cest-` a-dire a ` lintroduction de contraintes sur la d eriv ee premi` ere de la solution cherch ee. Nous mettons en e vidence l equivalence entre processus de bords et certaines fonctions avant de pr esenter quelques algorithmes d eterministes doptimisation.

7.4.1 Processus de bords explicites et implicites

D` es larticle fondateur de Geman et Geman [Geman et Geman, 1984a], lintroduction de processus de bords permettant de d esactiver leffet de lissage entre deux sites est envisag e. Celui-ci, que nous noterons dans la suite est d eni sur une grille duale de celle de limage et est souvent d ecompos e en deux sous champs, lun repr esentant les interactions verticales et lautre les interactions horizontales . Il sagit souvent (mais pas n ecessairement) de processus de bords bool eens, prenant la valeur 1 en pr esence de discontinuit es et 0 en son absence. Le terme de r egularisation s ecrit alors [Blake et Zissermann, 1987] [Geiger et Girosi, 1991] :

! !
Dune fac on intuitive, en labsence de discontinuit es, on a et on retrouve un potentiel quadratique visant a ` lisser la solution. En revanche, en pr esence de discontinuit e( , la p enalit e est arbitraire et vaut 4 de fac on a ` limiter le nombre de discontinuit es introduites par le mod` ele. Ce mod` ele (mod` ele de la membrane mince -weak membrane-) est tr` es simple et nintroduit pas dinteractions entre les e l ements du processus bords. En r ealit e, il nest pas n ecessaire dintroduire explicitement un processus de bords de fonction et un choix (et judicieux peut procurer le m eme r esultat. En effet, notons le terme
! !

! !
(7.22)
! !
4 Ce
et ). param` etre peut varier pour des mod` eles anisotropes ou non stationnaires (on a alors
7.4. PROCESSUS DE BORDS

de m eme pour

), alors on cherche la solution
! ! !

telle que
! ! !
!
161
soit minimale. Or :

!

! !

en notant :
Par cons equent, la quadratique est remplac ee dans ce mod` ele par une quadratique tronqu ee (gure 7.7). Lutili sation dun processus de bords explicite est dans ce cas e quivalente a ` lutilisation de la fonction (on parle de etermine a ` partir de quelle valeur du gradient on introduira une processus de bords implicite). La valeur de d discontinuit e.
F IG . 7.7 Fonctions quadratique, quadratique tronqu ee et la fonction de r egularisation propos ee par Geman et McClure pr eservant les discontinuit es. Un tr` es grand nombre de fonctions de r egularisation pr eservant les discontinuit es ont e t e propos ees et e tudi ees (on pourra se r ef erer a ` [Charbonnier et al., 1996] pour une e tude comparative). La fonction suivante, qui pr esente lint er et d etre d erivable partout, est tr` es utilis ee en restauration [Geman et McClure, 1985] :

Notons quil est int eressant dutiliser des fonctionnelles convexes pour la recherche de la solution, mais la prise en . compte des discontinuit es repose sur le comportement de Le choix dun processus de bords implicite ou explicite va donner lieu a ` diff erents algorithmes de minimisation. En effet, le recuit simul e permettant dacc eder au minimum global de l energie est un algorithme long et co uteux. Il peut dans de nombreux cas e tre remplac e par un algorithme d eterministe pour acc el erer la recherche de la solution.
7.4.2 Algorithmes de minimisation

Nous donnons ici le principe des quelques algorithmes d eterministes : GNC [Blake et Zissermann, 1987] : Blake et Zisserman ont propos e un algorithme d eterministe appel e le GNC (Graduated Non Convexity) pour loptimisation du crit` ere (sous sa forme implicite). Le principe de lalgorithme consiste a ` approximer le crit` ere par une fonction convexe qui permet de d enir une bonne solution initiale (calcul ee par une descente de gradient par exemple, puisque la solution est dans ce cas unique).
162
Puis le crit` ere est modi e graduellement perdant sa propri et e de convexit e pour se rapprocher du crit` ere ` chaque e initial. A tape une solution est trouv ee de fac on d eterministe en utilisant pour initialisation la solution donn ee par l etape pr ec edente. Si des preuves de convergence peuvent e tre obtenues dans certains cas particuliers, cette d emarche nassure cependant pas de trouver le minimum global pour toutes les fonctions d energie. MFA [Geiger et Girosi, 1991] : une autre approche est le recuit par champ moyen MFA (Mean Field Annealing) qui utilise cette fois un processus bords explicite. Lalgorithme met en uvre une descente de temp erature au cours de laquelle a ` chaque e tape une solution (image restaur ee et processus de bords) est estim ee au sens du champ moyen. On a des expressions explicites pour le processus de bords, tandis que est estim ee de fac on it erative. Artur et Legend [Charbonnier, 1994] : Charbonnier a e galement propos e deux algorithmes d eterministes appel es Artur et Legend pour loptimisation. Il utilise un processus de bords explicite et exploite le fait qu` a x e, le crit` ere est quadratique en (donc convexe et minimisable rapidement par une descente de type gradient), tandis qu` a x ee, il existe une expression analytique du processus de bords. Malgr e de nombreuses diff erences (notamment sur les propri et es de convergence et sur leur g en eralit e), il sagit toujours dalgorithmes it eratifs minimisant des suites d energies (GNC ou MFA) ou faisant varier les variables auxiliaires (le processus de bords pour Artur et Legend) au cours des it erations. Une comparaison est effectu ee dans [Charbonnier, 1994] et [Zerubia et Chellapa, 1993].
7.5 Quelques applications des champs markoviens

Cette partie pr esente quelques applications des champs markoviens en traitement dimages pour illustrer les potentialit es de ce domaine. On sint eressera dans un premier temps a ` des applications de bas niveau (analyse de textures et segmentation) avant de pr esenter des applications manipulant des graphes construits a ` partir de primitives plus complexes (r egions, segments).
7.5.1 Applications sur le graphe des pixels

Cette premi` ere partie pr esente trois applications de bas-niveau, i.e qui travaillent sur le graphe des pixels : La premi` ere est une analyse de textures sappuyant sur un mod` ele markovien ; elle permet de discriminer diff erentes textures de limage a ` laide des param` etres du champ extraits ; un exemple dapplications pour la d etection des zones urbaines en imagerie satellitaire est donn e; La seconde est un simple exemple de segmentation appliqu ee en imagerie radar mettant en e vidence la souplesse de ce mod` ele pour prendre en compte des statistiques tr` es vari ees dans les images et d etaillant quelques aspects pratiques de segmentation ; on se placera dans un cadre supervis e pour le param` etre de r egularisation, cest a ` dire que celui-ci sera x e de fac on empirique ; La troisi` eme application pr esent ee est un sch ema de fusion markovien, relativement g en eral qui permet de combiner plusieurs sources dinformations ; un exemple est donn e dans le cas de lanalyse dimages satellitaires NOAA dans plusieurs bandes spectrales. Analyse de textures Nous nous int eressons dans cette partie a ` lutilisation des mod` eles markoviens pour discriminer diff erents types de textures dans les images. Lid ee est de se placer dans le cas de donn ees compl` etes, i.e de faire lhypoth` ese que limage dont nous disposons est la r ealisation dun champ markovien, et dextraire les param` etres de ce champ. La variabilit e des param` etres en fonction du type de textures devant alors permettre de r ealiser une classication de limage.
7.5. QUELQUES APPLICATIONS DES CHAMPS MARKOVIENS
163
Nous avons d ej` a vu au paragraphe 7.3.2 un certain nombre de techniques (m ethode des codages, maximum de pseudo-vraisemblance, gradient stochastique) pour calculer les param` etres dun champ markovien. Toutes ces m ethodes, qui ne pr esupposent pas de mod` ele pour le champ, sont assez lourdes a ` mettre en uvre. Nous allons supposer ici que nous nous situons dans le cadre dun champ markovien gaussien pour lequel nous pouvons obtenir une exacte des param` etres. Dans le cas dun champ markovien gaussien, nous pouvons e crire l energie expression sous la forme :
! !
Avec cette e criture, les param` etres caract erisant le champ et que nous cherchons a ` estimer sont donc la temp erature (correspondant a ` une sorte de variance g en eralis ee), la moyenne et la pond eration du terme dattache aux donn ees de l energie, .
La m ethode des queues de com` etes La m ethode que nous allons voir a e t e propos ee dans [Descombes, 1993]. Consid erons la probabilit e conditionnelle en un site :
! !!
En notant
le nombre de sites voisins de , et
!
la moyenne locale des niveaux de gris des voisins du site ,
, on peut montrer quon a :
! !!
! ! ! !
!
"
!
On a donc remplac e le conditionnement local par lensemble des voisins de , par une seule variable conditionnante , ce qui am eliorera la robustesse des estimateurs. En effet, le nombre de sites concern e s par un condi sera bien plus grand que celui des sites concern es par une conguration du tionnement par voisinage. Nous constatons que est une loi gaussienne, de moments (moyenne et variance) suivants :
!!
Lesp erance et la variance de ! conditionnellement a ` ! e tant fonction des param` etres , et que nous recherchons, il nous suft destimer ces moments de fac on empirique. La variance ne d ependant pas de la valeur conditionnante ! , on notera le moment th eorique par . Pour faire ces estimations, on construit limage dite des queues de com` etes en raison de son aspect, qui est simplement limage des fr equences normalis ees des niveaux ! du voisinage. Si on met les valeurs ! en colonne ! conditionnellement de gris a ` la moyenne de et celles ! ! ! de ! en ligne, chaque ligne de limage des queues de com` e tes repr e sente , i.e une gaussienne de " ! moyenne et de variance .
var
I E
!!
! ! ! !
" !
On consid` ere alors pour la variance, lestimateur suivant : var
!!
164
en notant var lestimation empirique de la variance faite selon une ligne des queues de com` etes. Cet estimateur permet daccorder a ` chaque probabilit e conditionnelle locale une importance proportionnelle au nombre d echantillons qui la constituent et entra ne une plus grande robustesse de lestimation. En ce qui concerne lesp erance, nous avons la relation suivante :
I E
!!
!!
! !
Par cons equent, les esp erances des probabilit es conditionnelles se situent sur une droite. Lestimation empririque E permet de faire une estimation aux moindres carr e s des param` e tres et de la droite. des moyennes I Une fois estim es empiriquement , , , on peut d eduire , , et par les relations :
!! !
! ! ! !
En es des param` etres de la droite, on peut exprimer directement , explicitant lestimation aux moindres carr , et en fonction des moments dordre 1 et 2, conditionn e s ou non. On retrouve dans ce cas pour , la moyenne empirique des .
` la d Application a etection des zones urbaines Cet exemple dapplication est tir e de la th` ese de X. Descombes [Descombes, 1993]. On peut utiliser les r esultats pr ec edents pour analyser les textures pr esentes sur une image satellitaire SPOT. Limage e tant par essence non stationnaire (sinon lanalyse aurait peu dint er et !), le calcul des param` etres se fait localement, sur une fen etre glissante centr ee en chaque pixel. La abilit e des estimateurs saccro t avec la taille de la fen etre, en m eme temps, et de fac on antagoniste, que le risque de consid erer des m elanges de textures diff erentes a ` lint erieur de la fen etre d etude. Une solution pour rem edier a ` ce probl` eme peut e tre de ne consid erer que les e chantillons les plus repr esent es. En cas de m elange, les e chantillons appartiendront a ` la texture la plus pr esente dans la fen etre. Le param` etre de temp erature, est un bon indicateur du milieu urbain qui se pr esente sur une image SPOT sous une forme assez textur ee, type poivre et sel avec alternance de niveaux de gris faibles et forts. En effet, ce param` etre qui mesure en quelque sorte le chahut de la zone, a des valeurs plus e lev ees dans les r egions urbaines. Il permet dobtenir une bonne discrimination du milieu urbain.
7.5.2 Segmentation
Nous allons aborder dans cette partie une application tr` es classique des champs markoviens qui est la segmentation. Nous commenc ons par rappeler le principe de la segmentation markovienne en prenant lexemple des images radar [Tupin, 1997], puis pr esentons une m ethode de fusion dans un cadre markovien [Descombes, 1993]. Segmentation dune image radar Cet exemple dapplication est tir e de la th` ese de F. Tupin [Tupin, 1997].
7.5. QUELQUES APPLICATIONS DES CHAMPS MARKOVIENS
165
La mod elisation est similaire a ` celle qui a e t e pr esent ee dans le paragraphe 7.1.7. Ecrivons a ` nouveau les deux termes intervenant dans la probabilit e a posteriori. Pour la probabilit e du champ des observations conditionnellement au champ des e tiquettes, en supposant lind ependance des pixels, on a :
! ! ! ! !
Les images radar sont des images tr` es bruit ees par le ph enom` ene de speckle. En revanche, le processus dacquisition est bien mod elis e statistiquement et on a lexpression suivante pour une image radar en amplitude :
! ! ! !
avec un param` etre du syst` eme connu5 appel e nombre de vues, la fonction Gamma, et les moyennes en intensit e (carr e de lamplitude) des diff erentes classes consid er ees. Le champ des e tiquettes est suppos e markovien avec un mod` ele de Potts qui vise a ` obtenir des zones homog` enes compactes sur limage segment ee :
avec , et . Le champ a posteriori r esultant est donc markovien et son e nergie s ecrit :

!

!

En choisissant lestimateur MAP, la solution est obtenue par recuit simul e avec une d ecroissance g eom etrique en temp erature, et une temp erature initiale x ee arbitrairement. Le choix des classes se fait de la fac on suivante. On se xe le nombre de classes (15 dans les illustrations ci-dessous) et on applique un algorithme de k-moyennes dont le r esultat6 sert a ` calculer les valeurs des moyennes en intensit e des diff erentes classes. Notons que ces classes nont pas de contenu s emantique et que la segmentation correspond ici a ` un d ecoupage de limage. Le choix de qui pond` ere linuence entre attache aux donn e es et r e gularisation se fait de fac on ad hoc apr` es quelques essais. Laugmentation de entra ne une augmentation de la taille des zones obtenues par la segmentation. Il serait bien s ur possible destimer ce param` etre a ` laide dune des m ethodes d ecrites au chapitre 3. Notons que ce mod` ele nest pas adapt ea ` la pr eservation des cibles ponctuelles et des lignes qui sont des congurations de forte e nergie pour le champ des e tiquettes (il faut donc une forte attache aux donn ees pour que ces congurations subsistent dans le r esultat nal). Il est bien s ur possible de prendre en compte un champ externe pour mieux respecter les lignes par exemple [Tupin et al., 1996] ou dutiliser un mod` ele plus appropri e [Descombes et al., 1995]. Le tableau ci-dessous 7.2 r esume les param` etres utilis es et la gure 7.4 montre le r esultat de la segmentation. Sch ema de fusion dans un cadre markovien Principe du sch ema de fusion Nous nous plac ons maintenant dans le cas o` u plusieurs sources dinformation sont disponibles pour r ealiser la classication de limage. Ces diff erentes sources peuvent provenir de lextraction de diff erents param` etres a ` partir dune m eme image ou directement de plusieurs capteurs.
les produits PRI du satellite ERS1 . r esultat des k-moyennes est tr` es bruit ea ` cause du bruit multiplicatif pr esent sur les images radars et labsence de modes dans lhistogramme. Il ne peut donc pas dans ce cas e tre utilis e directement comme r esulat de segmentation.
5 Pour 6 Le
166
TAB . 7.2 Valeurs des param` etres de la segmentation Temp erature initiale Facteur de d ecroissance g eom etrique Param` etre de r egularisation Nombre de classes Nombre dit erations pour les k-moyennes 5 0,95 0,4 15 20
Notons le vecteur dattributs correspondant aux diff erentes sources avec dinformations le nombre de donn ees (ou canaux) et ! le nombre de classes . La probabilit e a posteriori s ecrit :

$
Si nous faisons lhypoth` ese que les sources sont ind ependantes entre elles, et les pixels de chaque source entre eux, on a :
!
!
!
! ! ! ! ! ! $ ! ! ! ! ! ! ! ! ! ! ! !
!

! ! !
Le potentiel dattache aux donn ees r esultant sexprime alors sous forme dune somme des potentiels individuels de chaque source :
! ! ! ! !
! ! !
Les diff erentes sources ne renseignant pas de la m eme fac on sur toutes les classes, il est possible dintroduire des coefcients de pond eration exprimant la conance (la abilit e) quon veut accorder a ` chacune des sources par rapport a ` une classe. On notera la conance accord ee a ` la source pour la classe . Il faut par ailleurs ne favoriser aucune classe, donc les coefcients doivent v erier donn ees s ecrit alors :
! ! ! ! !

! ! !

. Lexpression de lattache aux
En pratique, il nest pas toujours n ecessaire de faire des mod elisations statistiques compliqu ees pour calculer les potentiels dattache aux donn ees. Souvent des potentiels tr` es simples, lin eaires par morceaux, permettent dobtenir de bons r esultats. On attache un potentiel faible (typiquement 0) a ` la plage de niveaux de gris qui correspond a ` la classe consid er ee et un potentiel e lev e (typiquement 1) ailleurs. Cette d enition peut se faire de fac on supervis ee en analysant lhistogramme ou de fac on automatique par une recherche des modes de lhistogramme de limage (analyse multi- echelle [Aurdal, 1997], recuit simul e sur lhistogramme [Bloch et Maitre, 1997], etc.). La d enition des coefcients de abilit e des sources est souvent ematique. On se limite en g en eral a ` plus probl des remarques de bon sens en affectant lorsque la source nest pas signicative pour la classe , 0.5 si linformation d elivr ee est approximative, et 1 si la source est pertinente (avant normalisation).
7.6. APPLICATIONS SUR DES GRAPHES DE PRIMITIVES
167
` lanalyse des images SPOT Application a Cet exemple dapplication est tir e de la th` ese de X. Descombes [Descombes, 1993]. On trouvera dautres exemples dans [Tupin et al., 1996] [Aurdal, 1997]. Nous d ecrivons ici lapplication de ce sch ema a ` lanalyse de plusieurs canaux d elivr es par le satellite NOAA. Il sagit de 5 canaux de basse r esolution (1.1km) correspondant aux domaines visible, proche infra-rouge, moyen infra-rouge et 2 canaux thermiques. Les classes quon cherche a ` discriminer sont les suivantes : mer, nuages, continent sans relief, continent avec relief et icebergs. Une premi` ere e tape consiste a ` d enir les sources que nous allons utiliser. La m ethodes des queues de com` ete que nous avons pr esent ee plus haut permet en effet de d eduire de chaque image, 3 images de param` etres (moyenne locale, temp erature et param` etre dattache aux donn ees ). Au total 20 images sont donc disponibles, dont les plus signicatives pour notre objectif, sont s electionn ees : limage 1 (visible), limage de temp erature et limage de moyenne associ ees, limage 3 (moyen infra-rouge) et limage de temp erature associ ee (soit 5 en tout). Pour chacune de ces images, une analyse supervis ee de lhistogramme est effectu ee, permettant de d enir les potentiels (lin eaires par morceaux) et la pertinence du canal pour chaque classe. Le terme dattache aux donn ees de l energie a posteriori est alors d eni comme mentionn e pr ec edemment. Quant au terme de r egularisation, les classes recherch ees e tant relativement compactes, on utilise un mod` ele de Potts.
7.6 Applications sur des graphes de primitives

Comme nous lavons mentionn e dans la section 7.1, le formalisme markovien est d eni sur tout graphe et son champ dapplications est donc bien plus vaste que la simple grille des pixels. De nombreux probl` emes se pr etent a ` la manipulation de primitives plus complexes, soit pour des raisons de rapidit e comme dans le premier exemple que nous d ecrivons ci-dessous, soit parce quil sagit dun probl` eme plus proche de linterpr etation dimage, difcile a ` traiter au niveau du pixel et n ecessitant lintroduction dinformations de haut niveau comme dans le second exemple d ecrit.
` la segmentation dune image dIRM c 7.6.1 Graphes de r egions : application a er ebrale

Cet exemple dapplication est tir e de la th` ese de T. G eraud [G eraud et al., 1995]. Pour acc el erer la segmentation des images, plusieurs applications partent dune sur-segmentation de limage qui est ensuite am elior ee en fusionnant les r egions. Cette fusion, qui procure la segmentation nale, peut se faire dans un cadre markovien. Le graphe est construit a ` partir des r egions de la sur-segmentation, chaque r egion correspondant a ` un sommet du graphe et la relation de voisinage e tant d enie par la relation dadjacence entre les r egions. Le terme dattache aux donn ees d epend alors des attributs de la r egion (niveau de gris moyen des pixels la constituant, moments dordre sup erieur, etc.) et le terme de r egularisation d epend de lapplication, un potentiel de Potts pouvant e tre utilis e lorsquon essaye de trouver des zones relativement compactes. Lobjectif de lexemple d ecrit ici est de r ealiser une segmentation dimages IRM c er ebrales. Les classes consid er ees sont la mati` ere grise, blanche, le liquide c ephalo-rachidien, les ventricules et une classe ASI repr esentant les autres structures internes (noyaux caud es, thalamus, putamen) qui sont difciles a ` segmenter et auxquelles on sint eresse particuli` erement dans cette application. Le nombre de pixels de ces images volumiques (256 ) limite lutilisation de m ethodes markoviennes en raison du temps de calcul. Par contre, lutilisation dun graphe de r egions construit a ` partir dune sur-segmentation, en r eduisant drastiquement le nombre de sites permet de r ealiser un recuit simul ea ` un co ut raisonnable. Sur-segmentation : L etape de sur-segmentation 3D est r ealis ee par un algorithme calculant la ligne de partage des eaux sur limage du gradient apr` es fermeture morphologique pour r eduire le nombre de bassins. Limage r esultat est constitu ee de zones de niveaux de gris homog` enes, auxquelles on associe les attributs suivants : volume

168
(not e vol), niveau de gris moyen (qui sera lobservation du champ des donn ees), coordonn ees du centre du bassin. Le r esultat de cette m ethode appliqu ee a ` limage 7.8.a est montr e sur la gure 7.8.b. Relaxation markovienne : Un graphe est construit comme indiqu e pr ec edemment a ` partir de la sursegmentation (g. 7.8.c). On associe aux arcs du graphe la surface dadjascence entre les deux r egions (not ee surf). Les potentiels du champ markovien sont alors d enis comme suit : Terme dattache aux donn ees : vol
! ! !
!
! !

(d eduit dune e tude statistique des classes [G eraud et al., 1995]) Terme de r egularisation : surf
!

Seuls les potentiels des cliques dordre 2 sont choisis non nuls. La matrice est une matrice dadjascence permettant de pond erer les voisinages entre classes suivant quils sont favoris es ou non [Sigelle, 1993]. Le crit` ere utilis e est un crit` ere MAP et la solution est obtenue par un recuit simul e. Le temps de calcul est de moins dune minute pour un graphe de 32 000 sites. Les r esultats pour les ASI sont montr es sur la gure 7.8.c.
` la d 7.6.2 Graphes de segments : application a etection du r eseau routier

Cet exemple dapplication est tir e de la th` ese de F. Tupin [Tupin, 1997]. Nous nous int eressons dans cette application a ` la d etection du r eseau routier et hydrographique dans le cas des images radar. Le bruit de speckle pr esent sur ces images ne permet pas dobtenir de tr` es bons r esultats de bas niveau et les d etecteurs de lignes m eme adapt es a ` ce type dimagerie ont des taux de fausses alarmes e lev es si on veut obtenir des taux de d etection sufsants. Lid ee est donc de faire suivre l etape de bas niveau de d etection des lignes par une e tape de plus haut niveau, dans laquelle on injectera des informations a priori sur la forme des routes. Le cadre markovien, par linterm ediaire du terme a priori se pr ete bien a ` lintroduction de connaissances sur les objets recherch es, a ` condition que celles-ci puissent sexprimer de fac on locale a ` l echelle du graphe. Dans le cas du r eseau cette hypoth` ese (qui assure que le champ soit markovien) est v eri ee, puisse que la pratique montre quil nous suft dinformations locales au niveau des segments pour prendre une d ecision (pr esence ou absence de r eseau routier). La d emarche adopt ee pour la d etection du r eseau est donc la suivante. L etape de bas niveau permet de d etecter des segments candidats. Parmi ceux-ci, certains appartiennent aux objets a ` d etecter, quand dautres sont de fausses d etections. On fait alors lhypoth` ese que les segments d etect es et toutes les connexions possibles entre ces segments contiennent le r eseau routier. Les connexions possibles ne sont pas toutes les connexions, mais les connexions raisonnables : entre des segments sufsamment proches, et a ` peu pr` es align es par exemple. Lensemble de ces segments (ceux d etect es et les connexions) consituent les sommets du graphe (voir gure 7.9). La relation de voisinage entre deux segments est d enie par le partage dune extr emit e par ces 2 segments. Les gures ci-dessous illustrent les e tapes de la construction du graphe sur un extrait dimage radar (g. 7.12). Une fois ce graphe construit, on d enit un champ dobservation associ e et un champ d etiquettes (les e tiquettes e tant simplement 0 pour non-route et 1 pour route) dont on cherche la conguration optimale au sens du crit` ere MAP. Les termes de l energie sont d enis de la fac on suivante : Terme dattache aux donn ees : lobservation en un enie comme la r eponse moyenne du d etecteur site est d de lignes le long de ce segment ; les potentiels pour les labels 0 et 1 sont alors obtenus par une e tape dapprentissage le long de quelques segments appartenant a ` une vraie route et de quelques segments de fausse alarme ; la gure 7.10 montre les fr equences des observations (approximant les ) et les potentiels lin eaires par morceaux qui en sont d eduits (g. 7.11) ;
! !! !
!! !
169
a. Image c er ebrale IRM.
b. Sur-segmentation.
c. Extrait du graphe
d. R esultat de la segmentation concernant les ASI
F IG . 7.8 Etapes de la segmentation sur le graphe des r egions
Energie a priori : elle permet justement dint egrer toutes les connaissances a priori quon veut prendre en compte pour la d etection du r eseau, par exemple du type : (i) les routes sont longues et, dans labsolu, elles ne sarr etent pas ; (ii) elles ont une courbure relativement faible ; (iii) un segment de route est plus souvent connect e en une extr emit ea ` un unique segment de route qu` a plusieurs. Ces a priori peuvent sexprimer en d enissant les potentiels des cliques dordre maximal (rappelons quune clique est un ensemble de sites tous voisins les uns des autres, donc dans notre cas, un ensemble de segments qui se rejoignent en un m eme point) ; quatre param` etres sufsent pour les contraintes mentionn ees pr ec edemment : un param` etre contr olant les extr emit es (qui vise a ` d efavoriser la conguration dune clique o` u un seul segment a le label route) ; deux param` etres contr olant la longueur des routes (qui visent a ` favoriser des congurations o` u il y deux segments routes qui se joignent en une extr emit e et qui sont align es) ; un param` etre contr olant les carrefours (qui vise a ` d efavoriser les congurations o` u une multitude de segments sont route).

170
reprsentation image 6
Graphe correspondant 6 7 1
1 3
4 5 2 Segments de Sd
7 5
Noeuds de G Segments de Sd Artes de G Extrmit dun segment

F IG . 7.9 Construction du graphe de segments
a. Fr equences des observations sur des segments-routes etect es manuellement (ap d proximant ).
!! !
b. Fr equence des observations sur des segments-non routes (approximant ).
!! !
F IG . 7.10 Fr equences conditionnelles des observations sur une zone test. Lapprentissage de ces param` etres se fait difcilement par les m ethodes du chapitre 3. En revanche l etude de congurations extr emes (cha ne de segments tous a ` route, etc.), plus connue sous le nom de Bo tes qualitatives dAzencott [Azencott, 1992], permet de xer des intervalles de valeurs pour ces param` etres. Un exemple de r esultat obtenu par recuit simul e est montr e sur la gure 7.13.
7.6.3 Conclusion
Ce chapitre ne se veut pas une pr esentation exhaustive des applications possibles des champs markoviens, mais pr esente quelques unes de leurs potentialit es dans des domaines et a ` des niveaux de traitement dimage vari es. Leur grande souplesse permet en effet dintroduire toutes sortes dinformations, que ce soit pour le terme dattache aux donn ees, que ce soit pour les a priori possibles, ou m eme encore sur la forme du graphe a ` utiliser.

V(d|1) 1
171
V(d|0) 1
d 0 t1 t2 1 0 1
F IG . 7.11 Potentiels lin eaires par morceaux utilis es A c ot e de la multitude dapplications qui peuvent trouver une solution dans un cadre markovien, souvrent des champs de recherche plus th eoriques sur lestimation des param` etres et lacc el eration des techniques de recherche de solution.
172
a. Image originale centr ee sur Aix en Provence c ESA .
b. Ensemble des 839 segments d etect es.
c. Ensemble des 8891 segments constituant les sites du graphe. F IG . 7.12 Les e tapes de la construction du graphe
173
a. Image originale (Wieringermeer) c ESA.
b. Image des segments d etect es.
c. R esultat de la d etection markovienne.
d. Carte recal ee de la zone de limage.
F IG . 7.13 D etection des routes sur le Wieringermeer
174
Chapitre 8
Equations aux d eriv ees partielles et traitement dimages

Chapitre r edig e par Yann G OUSSEAU
Un exemple classique d equation aux d eriv ees partielles est l equation de la chaleur, qui s ecrit, pour une fonction de dans :

def

(8.1)
dans , qui d avec des conditions aux bords de . La solution de cette e quation est une fonction ecrit de la propagation au cours du temps de la chaleur dans un milieu isotrope ( est la quantit e de chaleur au point et a ` linstant ). Les e quations aux d eriv ees partielles (E.D.P.) apparaissent naturellement dans de nombreux domaines de la physique, mais leur utilisation en traitement des images peut sembler e trange au premier abord : a ` quoi correspond l evolution dans le temps ou l etat stationnaire ? Lorsque l equation (8.1) est appliqu e e a ` une image esigne plus le temps mais est etre d echelle. Partant dune image et r esolvant cette e quation, , ne d un param` nous obtenons une suite dimages , images simpli ees a ` l echelle . Les E.D.P. apparaissent donc dans le cadre danalyses multi- echelles, et sont a ` ce titre utilis ees en d ebruitage, en restauration, ou en traitement pr ealable a ` des applications en reconnaissance des formes. Ces e quations sont e galement essentielles dans le cadre des probl` emes variationnels, ou lon cherche une image (ou une repr esentation associ ee a ` limage) qui minimise une certaine e nergie. La descente de gradient associ ee a ` cette e nergie fait alors appara tre une E.D.P. dont la r esolution fournit une solution au probl` eme doptimisation consid er e. Cette approche est utilis ee dans des domaines aussi vari es que la d etection de contours, la restauration, le recallage dimages, etc. Dans ce chapitre, nous envisagerons les E.D.P. essentiellement sous langle de lanalyse multi- echelles. En particulier nous naborderons quen passant le lien entre E.D.P. et probl` emes variationnels. Les r esultats math ematiques seront admis, et laccent sera mis sur quelques exemples d equations illustrant les points nous paraissant les plus importants. Apr` es avoir pr ecis e leffet de l equation de la chaleur sur les images, nous expliquerons pourquoi certaines e quations non-lin eaires sont mieux adapt ees a ` leur structure, et donnerons un aperc u de limportance des E.D.P. dans le cadre de lanalyse multi- echelles.

175
176
PARTIELLES ET TRAITEMENT DIMAGES CHAPITRE 8. EQUATIONS AUX DERIV EES
8.1 L equation de la chaleur et ses limitations

8.1.1 Quelques notations
indicatrice dun ensemble de sera not ee . Pour une fonction r eelle , que nous supposons d eriv ees partielles :
n rentrer dans le vif du sujet, il est ecessaire de pr eciser quelques notations. not e Avant de Un point de . Lasera et sa norme . Le produit scalaire entre et est fonction
(deux fois continuement diff erentiable) nous noterons ses

Le gradient de
est d eni par :

Le laplacien de
est d eni par :

8.1.2 Pourquoi l equation de la chaleur

Dans les ann ees 60, Gabor a remarqu e que la diff erence entre une image nette et cette m eme image oue e tait en premi` ere approximation proportionelle au laplacien de , . Le petit calcul qui suit explique ce ph enom` ene dans le cas o` u limage est rendue oue par moyennage locale. Pour positif, nous d enissons lop erateur de moyennage local par :
o` u est le disque de centre % et de rayon . En effectuant un d eveloppement de Taylor au voisinage de % il % est facile de voir que
o` u est une fonction qui tend vers 0 si tend vers 0. Si nous notons alors ! lop erateur correspondant a ` applications successives tends vers un nombre positif et vers de ! , il est possible de montrer que, si linni, alors ! , solution de l equation % converge vers %
%
%

'

(8.2)
Ce r esultat signie que si lon construit une suite dimages de plus en plus liss ees en partant de , on ob tient asymptotiquement une suite solution de l equation de la chaleur (le facteur 1/8 peut e tre supprim e en normalisant le ltre). Plus g en eralement, ce type de relation reste v eri e si ! est remplac e par un op erateur de convolution avec un noyau isotrope de masse unit e (cest a ` dire que ) sufsamment r egulier (voir [Guichard et Morel, 2002]). En ce sens, l equation de la chaleur est caract eristique dun grand nombre de ltrages lin eaires, et nous allons donc maintenant nous int eresser a ` cette e quation, en commenc ant par donner une construction explicite de ses solutions.

8.1. LEQUATION DE LA CHALEUR ET SES LIMITATIONS
177
8.1.3 Equation de la chaleur et noyau gaussien

Soit le cube unit e. Soit une fonction int egrable de dans (une image). Nous prolongeons par sym etrie par rapport aux axes et , de fac on a ` obtenir une fonction d enie sur . Puis nous prolongeons cette fonction a ` entier par p e riodisation. Ce prolongement a pour but de pouvoir appliquer des convolutions a ` . Nous obtenons ainsi une fonction sym etrique par rapport aux axes, 2-p eriodique en chacune de ses variables. Nous noterons dans la suite lensemble des fonctions int egrables ayant ces propri et es. Cest dans le cadre de cet espace (dont un e l ement peut e tre vu comme une image repr esent ee par une fonction de dans ) que nous donnons la forme des solutions de l equation de la chaleur. Soit

et
. Alors

%
%
est solution de l equation de la chaleur dans
, cest a ` dire que (8.3)

Ce r esultat est ici admis, le lecteur int eress e peut se reporter a ` [Guichard et Morel, 2002]. Les bases math ematiques n ecessaires a ` la compr ehension de ces r esultats pourront e tre trouv ees dans [Rudin, 1998]. Pour une e tude plus compl` ete de l equation de la chaleur et ` [Evans, 1998]. Num eriquement, de nombreuses autres E.D.P., on se reportera a en convoluant limage originale avec des noyaux gaussiens et en utinous obtenons donc les fonctions lisant des conditions de sym etrie miroir aux bords de limage. Dans ce chapitre, nous naborderons pas les aspects num eriques li es aux E.D.P., et nous renvoyons le lecteur int er ess e aux r ef erences [Weickert et al., 1998] et [Guichard et Morel, 2002].

8.1.4 Application aux images

Comme nous lindiquions en introduction, les E.D.P. servent entre autre a ` simplier graduellement les images, selon le param` etre , de mani` ere a ` en simplier la structure et a ` supprimer le bruit. Sur la gure 8.1, nous pr esentons une s erie dimages auxquelles a e t e appliqu ee l equation de la chaleur (8.1) pour diff erents temps . Nous remarquons que les images sont de plus en plus simpli ees lorsque augmente. En particulier, une telle s erie peut e tre utilis ee lors de la recherche de structures g eom etriques, tels des contours. A chaque valeur de ( e chelle ) correspond un ensemble de structures, qui doivent ensuite e tre trait ees ensemble. Une telle approche est pr esent ee dans larticle [Witkin, 1983b]. Cependant, nous remarquons e galement que la structure des images est fortement alt er ee par l equation de diffusion (8.1). Les images deviennent oues. En particulier, les discontinuit es ( contours ) sont liss es. Ces d efauts de l equation de la chaleur seront pr ecis es au paragraphe 8.1.6.
8.1.5 L equation de la chaleur inverse
Nous avons vu pr e c edemment que l equation de la chaleur permet de lisser une image a ` l echelle , et que partant dune image , nous obtenons une suite dimages , images de plus en plus oues. Nous avons e galement mentionn e que cette suite dimages e tait asymptotiquement repr esentative dun grand nombre de ltrages lin eaires. Dans le cadre de la restauration dimages, il semble donc raisonnable, partant dune image originale oue, de lui appliquer l equation de la chaleur inverse, cest a ` dire
Cette m ethode donne des r esultats satisfaisant pour des valeurs de petites (gure 8.3), mais est num eriquement tr` es instable ce qui limite grandement son utilisation. En effet, l equation (8.4) est mal pos ee, et est tr` es sensible
(8.4)
178
F IG . 8.1 Application de l equation de la chaleur. De haut en bas et de gauche a ` droite : image originale ; images auxquelles a e t e appliqu ee l equation (8.1), respectivement pour des temps . On remarque en particulier que les d etails disparaissent et que les images deviennent oues lorsque augmente.
$$
aux conditions initiales. Ainsi, le r esultat explose pour des temps tr` es rapidement atteints en pratique, et cette explosion est encore acc el er ee si lon bruite limage, ou si on la quantie. Cette instabilit e est illustr ee sur la gure 8.4, o` u lon applique successivement l equation de la chaleur et l equation inverse. Pour (images (c) et (d)), nous remarquons lapparition doscillations sur limage restaur ee. En pr esence de bruit, (images (e) et (f)), nous ne voyons presque plus rien, car certaines valeurs sont devenues tr` es grandes en valeur absolue devant les valeurs maximales de limage originale. Il est ainsi impossible dutiliser cette e quation pour r esoudre un probl` eme du type d econvolution en pr esence de bruit, et son utilit e se limite a ` lam elioration dimage, avec des temps tr` es petits (voir gure 8.3, (a), (b)). Au chapitre 8.2.5, nous pr esenterons une e quation non-lin eaire qui permet une restauration stable num eriquement.
8.1.6 Limitations, invariance par changement de contraste

Comme nous lavons vu sur les exemples qui pr ec` edent, l equation de la chaleur permet de simplier graduellement une image et de se d ebarrasser doscillations ind esirables, au prix dune d egradation de leur structure. Cette
8.1. LEQUATION DE LA CHALEUR ET SES LIMITATIONS
179
F IG . 8.2 Gauche : quelques lignes de niveau de limage originale (pour les niveaux multiples de 30) ; droite, # lignes de niveau de l evolution au temps . On remarque que le long des contours, endroit o` u les lignes de niveau saccumulent, l equation de la chaleur 8.1 les e loigne les unes des autres.
F IG . 8.3 de la chaleur inverse. A gauche : image originale Equation pour .

;a ` droite : application de l equation (8.4)
d egradation enissons lensemble de niveau , associ e est agrante sur les ensembles de niveau de limage. Nous d a ` limage d enie sur le domaine , par

Un contour dans une image correspond a ` un saut brusque de niveau de gris, et donc a ` une accumulation des fronti` eres des ensembles de niveau, appel ees lignes de niveau. Ceci est visible sur la gure 8.2, o` u nous montrons une image et quelques-unes de ses lignes de niveau (pour tous les niveaux multiples de 30). Sur la m eme gure, a ` droite, nous montrons ce que sont devenues ces lignes apr` es lissage par l equation de la chaleur. Nous voyons nettement que les lignes se sont e cart ees les unes des autres, ce qui se traduit sur limage par un effet de ou. Limage a donc e t e simpli ee, mais ses contours ont e t e d etruits. Plus formellement, l equation de la chaleur nest pas invariante par changement de contraste. Nous appelons changement de contraste une transformation
o` u est une fonction croissante de dans . Il est bien connu que ce type de changement nalt` ere pas notre perception de la structure dune image, et il suft pour sen convaincre de se munir de lunettes de soleil ou de changer les r eglages dune t el evision. Insistons sur le fait que nous parlons ici de perception de la structure, et que ceci nest pas contradictoire avec le fait quun changement de contraste peut am eliorer la qualit e dune image, voir
180
(a)
(b)
(c)
(d)
(e)
(f)
F IG . 8.4 (a) : diffusion selon l equation de la chaleur (8.1) pour ; (b) : diffusion inverse selon (8.4) a ` partir de limage (a), pour ; (c) et (d) : m eme exp erience, avec , on remarque un d ebut dinstabilit e ; (e) et (f) : m eme exp erience avec , mais un bruit gaussien d ecart type 1 a e t e ajout ea ` la premi` ere image. Les valeurs de niveau de gris explosent en plusieurs points et le r esultat est inexploitable.
8.2. EQUATIONS DE DIFFUSION NON-LINEAIRES
181
le chapitre 10. Par ailleurs, des changements de contraste interviennent dans la cha ne dacquisition des images. Pour ces raisons, nous nous int eressons aux modications dimage invariantes par changement de contraste : nous dirons quun op erateur (agissant sur les images) est invariant par changement de contraste si :
' si d esigne lop erateur envoyant une image sur , pour toute fonction r eelle , croissante et continue. Or solution de l equation de la chaleur au temps avec comme condition initiale, il est facile de voir que
(8.5)
nest plus solution de l equation (8.1) (le v erier !), et donc que nest pas invariant par changement de contraste. Pr ecisons que linvariance par changement de contraste est li ee a ` l evolution des de la fac on ensembles de niveau suivante : si est un op erateur v eriant (8.5) et monotone (cest a ` dire que si , alors ), alors

(8.6)
Linvariance par changement de contraste est donc e quivalente a ` une action sur les lignes de niveau. Plus g en eralement, l equation (8.6) permet de ramener l etude des op erateurs sur les images invariants par changement de contraste a ` celle dop erateurs g eom etriques agissant sur des ensembles du plan. Bien que nous ne d etaillons pas ici cet aspect, nous voyons poindre le lien entre ces e quations aux d eriv ees partielles et la morphologie math ematique (voir le chapitre 6) : toute linformation dune image est contenue dans ses ensembles de niveau. Le lecteur int eress e se reportera a ` louvrage [Guichard et Morel, 2002]. Nous verrons au paragraphe 8.3.3 que, sous des hypoth` eses assez faibles, la pr eservation des discontinuit es implique lutilisation d equations non-lin eaires. Nous allons maintenant voir comment lutilisation de ces e quations permet de simplier les images en respectant mieux leur structure.
8.2 Equations de diffusion non-lin eaires

La recherche dE.D.P. permettant une analyse multi- echelles des images tout en pr eservant leurs discontinuit es ae t ea ` lorigine dun grand nombre d equations dans les ann ees 90. Dans ce chapitre, nous pr esentons quelquesunes de ces e quations, qui ont en commun de modier les images en fonction de leur structure locale. Pour mieux comprendre leurs effets, il est n ecessaire de donner quelques d enitions et r esultats sur la structure locale des fonctions de deux variables, ce qui est lobjet du paragraphe suivant.
8.2.1 Notations et structure locale des images
Nous consid erons une fonction de dans , supposons , et nous plac ons en un point de . En ce point, passe la ligne de niveau associ ee au param` etre , cest a ` direla fronti` e re de , courbe deux fois diff erentiable. Le long de cette ligne, la fonction est constante e gale a ` . Un premier r e sultat important est que le gradient de en , cest a ` dire le vecteur , est perpendiculaire a ` cette ligne de niveau (lorsquil est non nul). Si nous supposons que , nous pouvons d enir un syst` eme de coordonn ees locales en ce point (voir la gure 8.5) :

et
avec . Nous d enissons la matrice hessienne de :

182

curv
PSfrag replacements

F IG . 8.5
pour quadratique associ ee, cest a ` dire que pour deux vecteurs et , nous et notons e galement la forme avons , o` u est le transpos e de . Nous pouvons montrer les formules suivantes, qui permettent de calculer les d eriv ees secondes selon et avec les coordonn ees euclidiennes :
curv Ceci est e quivalent a `:

et
Pour nir, nous d enissons la courbure de limage au point

" !

(o` u lon a suppos e que

) par :
curv
div

formule o` u la divergence est d enie, pour une fonction vectorielle div

par :
On peut montrer que curv ligne de niveau passant par , cest a ` dire linverse du rayon est la courbure de la du cercle osculateur a ` la courbe en (voir la gure 8.5). %
8.2.2 L equation de Malik et Perona

Lintroduction des e quations de diffusion non-lin eaires dans le domaine du traitement des images remonte a ` un article de Malik et Perona de 1987, ([Perona et Malik, 1990a]). Remarquons que l equation de la chaleur (8.1) peut s ecrire
div
La faiblesse de cette e quation est que la diffusion est identique en tout point de limage (cette e quation mod elise initialement la diffusion de la chaleur dans un milieu isotrope). En particulier, comme nous lavons vu au paragraphe pr ec edent, limage est liss ee aussi bien dans les zones homog` enes que le long des contours. Lid ee de Malik
183
et Perona est de lisser limage dans les zones homog` enes, et de ne pas faire e voluer limage le long des contours, voire de rehausser ces derniers, comme nous allons le voir plus pr ecis ement. L equation correspondante s ecrit :
ecroissante, valant 1 en z ero, et tendant vers 0 en linni. L se rapproche donc de avec une fonction d equation de , un des choix (8.1) aux points o` u est proche de 0. A titre dexemple, nous consid ererons fonction propos e par larticle original de Malik et Perona. Pour comprendre ce qui se passe aux points o` u est grand, nous r ee crivons l equation sous la forme

(8.7)

avec les notations du paragraphe 8.2.1. Contrairement au cas de l equation de la chaleur (8.1), qui peut se r ee crire , l evolution varie en fonction des valeurs de (norme et direction). Le premier terme de l equation (8.8) repr esente une diffusion uni-dimensionnelle dans la direction orthogonale au gradient, alors que le deuxi` eme terme prend des valeurs positives ou n egatives selon la valeur de , ce qui correspond respectivement a ` une e quation de la chaleur directe ou inverse (comme e tudi e au paragraphe 8.1.5). Remarquons limportance du param` etre , qui impose le type de diffusion en fonction des valeurs de . Ainsi, cette e quation se propose de r esoudre a ` la fois un probl` eme danalyse (limage est simpli ee a ` l echelle ), et un probl` eme de restauration (rehaussement des contours), qui d epend dun seuil sur le contraste. Signalons e galement que rien ne garantit lexistence et lunicit e des solutions e ventuelles de cette e quation. Enn remarquons que lors de lutilisation de cette e quation comme pr etraitement avant un d etecteur de contours du type Canny (voir le chapitre 11), le choix . Sur la gure 8.6, nous montrons les e du param` e tre correspondra au seuil que lon se xe pour volutions de limage de la gure 8.1 sous leffet de l equation (8.7). A nouveau, nous obtenons une suite dimages de plus en plus simpli ees, ce qui sera utile par exemple pour une recherche de structures. Remarquez que les contours sont mieux pr eserv es que sur la gure 8.1, mais quils ne sont pas trait es de la m eme fac on selon les valeurs du contraste (de ). En particulier, les bords du chapeau tr` es contrast es sont renforc es (comportement du type e quation de la chaleur inverse), alors que les bords de la roue moins contrast es deviennent ous lorsque augmente.

(8.8)

8.2.3 Mouvement par courbure moyenne et variantes

Le type le plus simple d equation de diffusion du type anisotrope s ecrit :
(8.9)
et a originellement e t e introduite par Sethian, [Sethian, 1985]. Il y a diffusion dans la direction perpendiculaire au gradient, alors quil ne se passe rien dans la direction du gradient. Avec les r esultats de la section 8.2.1, cette e quation peut se r ee crire :
curv

Signalons que l equation (8.9) est invariante par changement de contraste. Nous verrons plus loin que ce type de mouvement selon la courbure est in evitable si lon sint eresse aux e quations invariantes par changement de contraste. Rappelons que les modications dimages invariantes par changement de contraste peuvent e tre vues comme une e volution des ensembles de niveau de limage, ce qui est exprim e par l equation (8.6). Il est possible de montrer que l equation (8.9) fait e voluer les lignes de niveau de limage courbure, cest a ` dire quen selon leur % chaque point , la ligne de niveau passant par (cest a ` dire la courbe ) e volue dans la direction de sa normale en (la direction de ), a ` la vitesse curv . En particulier, les lignes droites n evoluent pas sous leffet de (8.9), et les oscillations brusques tendent a ` dispara tre. Du fait de ces propri et es, cette e quation a e t e
184
F IG . 8.6 Equation eme image de d epart que sur la gure 8.1. De haut en bas et de gauche de Malik et Perona. M a ` droite : .
$$
propos ee dans le cadre de lanalyse de formes, voir [Kimia et al., 1992]. Nous illustrons leffet de cette e quation evolution du chapeau : les bords rectilignes e voluent gure 8.7, pour plusieurs temps . Remarquez en particulier l peu tandis que la pointe voit sa courbure diminuer avec le temps . Observez e galement la diff erence avec la gure 8.6 : les contours restent nets tant quils sont pr esents, et ce ind ependemment du contraste (des valeurs de ) le long du contour. Sur la gure 8.8, nous montrons les lignes de niveau de limage au temps ; notez en particulier les diff erences avec la gure 8.2. Remarque : il est possible de montrer (voir [Guichard et Morel, 2002]) que, de m eme que l equation de la chaleur est l equation associ ee asymptotiquement a ` lit eration de moyennages locaux (paragraphe (8.1.2)), le mouvement par courbure moyenne (8.9) est asymptotiquement e quivalent a ` lit eration de ltres m edians (ltres non-lin eaires d enis au paragraphe 10.2.2). Nous verrons au paragraphe 8.3 que les e quations raisonnables pour lanalyse des images qui sont invariantes par changement de contraste et isom etries (rotations-translations) s ecrivent sous la forme :

curv
(8.10)
avec r eelle continue et d ecroissante en . Le mouvement par courbure moyenne correspond une fonction au cas . Si lon impose de plus linvariance par transformations afnes, il ne reste plus quune seule e quation, introduite en 1993 par Alvarez, Guichard, Lions et Morel (voir [Alvarez et al., 1993]) :
sign curv
curv
(8.11)
Ces diff erents r esultats sont pr ecis es au paragraphe 8.3.3.
185
F IG . 8.7 Evolution par courbure moyenne. Limage originale est limage gauche a ` droite, les solutions de l equation (8.9) respectivement pour
De la gure 8.1. $ . haut en bas et de de
F IG . 8.8 Lignes de niveau de la solution de (8.9), mouvement par courbure moyenne, pour multiples de 30).
(niveaux
8.2.4 L equation de Rudin-Osher-Fatemi

Les e quations aux d eriv ees partielles apparaissent dans le cadre dapproches variationnelles de probl` emes de traitement des images, cest a ` dire lorsque lon cherche a ` r esoudre un probl` eme en minimisant une e nergie. Rudin, Osher et Fatemi, dans un article de 1992 ([Rudin et al., 1992a]) sint eressent a ` l energie :
o` u d esigne toujours le domaine de d enition des images, et un param` eel positif. Minimiser cette e nergie etre r sur un ensemble de fonctions (par exemple les fonctions e gales a ` sur la fronti` ere de ) revient a ` chercher

(8.12)
186
une fonction proche de tout en p enalisant les ace au deuxi` eme terme. L equation fonctions trop oscillantes gr dEuler-Lagrange associ ee a ` cette e nergie est , et la descente de gradient correspondante est :
avec comme pr ec edemment une fonction de % ( ), et en utilisant les r esultats du paragraphe 8.2.1, nous pouvons r ee crire cette e quation sous la forme :
div
et de . Si lon fait abstraction du terme de d elit e aux donn ees

"
Ces e quations sont es utilis ees en restauration dimages, car la minimisation d energies du type (8.12), com tr` prenant un terme (la variation totale de limage), permet dobtenir des solution aux bords francs, sans les oscillations r esiduelles qui peuvent appara tre, par exemple, avec lutilisation du ltre de Wiener (voir paragraphe 5.2.2). Dans le cas de la restauration dimage convolu ee par un noyau et bruit ee, l energie (8.12) prend la forme

curv

(8.13)
Ces m ethodes sont en particulier utilis ees par le Centre National dEtudes Spatiales (CNES), dans le cadre de limagerie satellitaire. Figure 8.9, nous comparons les r esultats obtenus par variation totale et ltre de Wiener dans le cas dune image satellitaire. Limage est convolu ee avec un ltre connu, puis lui est ajout e un bruit gaussien de d eviation standard connue. La restauration par Wiener se fait comme expliqu e au paragraphe 5.2.2, la densit e de puissance du signal e tant estim ee sur limage d egrad ee. La restauration par la m ethode de Rudin-Osher-Fatemi seffectue en minimisant l energie (8.13) par e volution sufsamment longue de l equation associ ee. Remarque : de la m eme mani` ere, on montre que l equation de la chaleur (8.1) est associ ee a ` l energie .

8.2.5 Le ltre de choc de Rudin

Nous avons vu au paragraphe 8.1.5 que l equation de la chaleur pouvait e tre utilis ee a ` des ns dam elioration dimages, mais que ceci posait de gros probl` emes de stabilit e. Une am elioration de cette m ethode, appel ee ltre de choc et due a ` Rudin ([Rudin, 1987]), consiste a ` r esoudre l equation :
sign

(8.14)
avec limage a ` restaurer comme condition initiale. La diffusion des niveaux de gris seffectue dans la m eme direction quavec l equation de la chaleur inverse (8.4), mais est bien plus stable. Il est possible de montrer que cette e quation fait e voluer les lignes de niveau a ` une vitesse constante. Sur la gure 8.10, nous reprenons les exp eriences pr esent ees pour l equation de la chaleur inverse, pour illustrer leffet du ltre de choc ainsi que sa stabilit e. Remarquons en particulier que la restauration se fait au prix dune perte des d etails et de la texture : pour des valeurs croissantes de , limage ltr ee prend une allure de type bande dessin ee. Sur la derni` ere exp erience (8.10 (f)) on remarque que la pr esence de bruit sur limage initiale (e) entra ne lapparition deflochement le long des contours.
8.3 EDP et analyse multi- echelles

Dans les chapitres pr ec edents, nous avons vu des exemples danalyse multi- echelles des images, sous la forme d equations aux d eriv ees partielles. Dans ce chapitre, nous formalisons cette notion, et donnons, sans preuves, les e l ements permettant une classication de ces analyses en fonction de leurs invariances, notamment g eom etriques. Nous allons voir que les E.D.P. appara ssent naturellement dans ce cadre, et nous allons retrouver des e quations vues ci-dessus. Plus pr ecis ement, nous allons voir comment ramener le concept danalyse multi- echelles a ` des ltrages it er es, ltrages que nous avons d ej` a rencontr es au paragraphe 8.1.2.
8.3. EDP ET ANALYSE MULTI-ECHELLES
187
F IG . 8.9 Exemple de restauration. De haut en bas et de gauche a ` droite : image originale (image Spot 5 c CNES 2002) ; image d egrad ee par convolution et ajout de bruit ; image restaur ee par Wiener ; image restaur ee par minimisation de l energie (8.13).
8.3.1 D enition et propri et es des analyses multi- echelles

Nous d enissons une analyse multi- echelles comme une famille dop erateurs param` etre sur les images, le e tant appel e param` etre d echelle. Etant donn e une image , est limage analys ee a ` l echelle . Nous donnons maintenant quelques propri et es d esirables pour ces familles dop erateurs :
Structure pyramidale. La famille de transition , tels que :
a cette structure sil existe une famille dop erateurs

es ltres , appel
(8.15)
Cette propri et e signie que limage a ` une e chelle plus grossi` ere peut se d eduire dune version a ` une e chelle plus ne, sans n ecessiter limage originale. Un cas particulier de cette propri et e est le cas o` u lanalyse multi- echelles est r ecursive, cest a ` dire que (propri et e de semi-groupe). Nous allons consid erer des op erateurs causaux, cest a ` dire qui ne cr eent pas de nouvelle structure lorsque l echelle augmente. Une autre propri et e d esirable pour une analyse multi- echelles est la localit e. Dans le cas o` u
188
(a)
(b)
(c)
(d)
(e)
(f)
F IG . 8.10 Filtre de choc de Rudin. Les images (a), (c), (e) sont identiques a ` celles de la gure 8.3. Les images (b), (d), (f) sont les applications correspondantes de l equation (8.14) (respectivement ).
189
les op erateurs sont pyramidaux, le r esultat de lapplication du ltre de transition en un point, , ne doit d ependre que des valeurs de dans un voisinage de . Ces deux principes, de localit e et de causalit e, sont condens es dans le principe suivant, qui afrme que si une image est localement plus claire quune autre, il en sera de m eme pour les deux familles multi- echelles correspondantes pendant un certain temps :

Principe de comparaison locale. echelles est dite satisfaire le principe de comparaison Une analyse multi- locale, si pour toutes fonctions et : dans un voisinage de , , alors pour sufsamment petit, si
et si
, alors :

Une derni` ere propri et e que nous imposerons a ` une analyse multi- echelles est une propri et e de r egularit e : une image r eguli` ere (par exemple diff erentiable) e volue r eguli` erement. Il sav` ere sufsant de faire cette hypoth` ese pour des fonctions quadratiques. R egularit e. Soit un point de
Lanalyse multi- echelles est dite r eguli` ere sil existe une fonction , continue par rapport a ` que : quand

, soit la forme quadratique :

(8.16)
, telle (8.17)
Dans la suite, nous dirons quune analyse multi- echelles est causale si elle est pyramidale, et satisfait aux principes de comparaison locale et de r egularit ee nonc es ci-dessus. Ce sont ce type danalyses multi- echelles dont nous allons maintenant clarier le lien avec les E.D.P., et pour lesquelles nous donnons un d ebut de classication.
8.3.2 Pourquoi les analyse multi- echelles sont r egies par des E.D.P.
Nous donnons un r esultat qui pr ecise le lien entre analyse multi- echelles et e quations aux d eriv ees partielles. Le lecteur int eress e en trouvera la preuve dans [Guichard et Morel, 2002]. Si une analyse multi- echelles est causale, (cest a ` dire pyramidale r eguli` ere, et satisfaisant au principe de comparaison locale), alors il existe une fonction telle que
, et donc que si dans l equation ci-dessus nous voyons comme , le terme de gauche, lorsque tends vers 0, tends vers . Le r esultat est en r ealit e non trivial, mais lon peut montrer que est solution de :
! . lorsque tend vers , pour toute fonction , et tout Rappelons alors que lop erateur permet de passer du temps au temps

(8.18)
avec . Ces r esultats sont prouv es dans [Guichard et Morel, 2002], gr ace a ` une notion de solution particuli` ere, les solutions de viscosit e.
'
190
Gr ace au r esultat ci-dessus, la classication des analyses multi- echelles se ram` ene a ` la classication des fonctions . Nous allons maintenant voir quen imposant a ` lanalyse des contraintes li ees a ` la structure des images, les formes possibles de la fonction sont grandement r eduites. Commenc ons par linvariance par addition dune constante. Supposons que

pour toute fonction et toute constante (un d ecalage constant de niveau de gris naffecte pas laction de lop erateur ). Il est facile de voir que si est causal et invariant par addition dune constante, alors ne d epend pas de . Ceci se prouve en appliquant (8.17) et (8.19) a ` la fonction , o` u est une forme quadratique du type (8.16). Similairement, nous avons les r esultats suivants, pour un op erateur invariant par laddition de constantes : Si est invariant par translation (cest a ` dire commute avec lop erateur , pour tout ), alors ne d e pend pas de son quatri` e me argument, . commute avec les rotations et translations (invariance euclidienne) alors pour toute matrice disom etrie Si ,
et
(8.19)

(Rappelons epend pas de dans ce cas en vertu de la propri et e pr ec edente). que F ne d Si est invariant par changement de contraste, alors pour toutes constantes :
o` u
d esigne le produit tensoriel, cest a ` dire que :

Cette derni` ere propri et e est quelque peu obscure, mais est indiqu ee comme r esultat interm ediaire pour e tablir la forme des analyses multi- echelles invariantes par changement de contraste, donn ee ci-dessous au paragraphe 8.3.3.
8.3.3 Classication des analyses multi- echelles

Gr ace a ` la caract erisation des analyse multi- echelles causales, exprim ee par l equation (8.18), nous avons vu que l etude de ces analyses se ram` ene a ` l etude d equations diff erentielles du type :

(8.20)
De plus, des hypoth` eses simples dinvariance permettent de grandement simplier les formes possibles de la fonction . Ces r esultats, d etaill es dans [Guichard et Morel, 2002], permettent une classication des analyses multie chelles. Nous donnons maintenant quelques-uns de ces r esultats de classication. Analyse lin eaire isotrope Le premier r esultat indique que si lanalyse est lin eaire et isotrope, elle est donn ee par l equation de la chaleur, r esultat que nous avions entrevu au d ebut du paragraphe 8.1.2.
191
Si
est un op eaire, alors (` a une renormalisation erateur causal, invariant par rotation et translation, et lin pr` es) est solution de :

$

in in

!
(8.21)
Remarquons que ce r esultat implique en particulier que lin earit e et invariance par changement de contraste sont incompatibles, puisque l equation de la chaleur nest pas contraste invariante. Invariance par changement de contraste Nous avons vu au paragraphe 8.1.6 limportance de linvariance par changement de contraste en traitement des images, et il est donc quations satisfaisant a ` cette invariance. Le r esultat naturel de se demander quelles sont les e est le suivant : si est une analyse multi- e chelle causale, invariante par rotation et translation, et invariante par changement de contraste, alors est solution de l equation
o` u est une fonction croissante et continue par rapport a ` son premier argument. Remarquons que les e quations pr esent ees au paragraphe 8.2.3 sont parmi les e quations les plus simples de ce type. Invariance afne Pour conclure nous nous int eressons aux analyses invariantes par changement de contraste et par transformations afnes. Les transformations afnes sont dune grande importance en traitement des images, en particulier parce quelles fournissent une approximation simple des transformations projectives quinduisent sur les images les mouvements des appareils optiques de capture lors du passage dune sc` ene tridimensionnelle a ` une photo bidimensionnelle. Si lon suppose que est une analyse multi- echelles causale et invariante par transformation afne, alors (` a une renormalisation du param` etre pr` es)

curv
curv
o` u,
et e tant des constantes ([Alvarez et al., 1993]). En imposant des contraintes assez simples et directement li ees au processus de formation des images, nous nous sommes donc ramen es a ` une seule e quation possible pour une analyse multi- echelles, appel ee AMSS pour langlais Afne Morphological Scale Space . En vertu de ses invariances g eom etriques, et parce quelle pr eserve les discontinuit es, cette e quation est en particulier utilis ee en reconnaissance de formes. Signalons enn que le lecteur d esireux dapprofondir le sujet pourra se r ef erer a ` [Guichard et Morel, 2002], [Aubert et Kornprobst, 2001], [Weickert, 1998].

! si ! si
(8.22)
192
Chapitre 9
Ondelettes et traitement dimages

Chapitre r edig e par B eatrice P ESQUET-P OPESCU et Jean-Christophe P ESQUET (Universit e de Marne la Vall ee)
9.1 Principes de lanalyse lin eaire des images
Pour analyser lin e ere g en eralement un dictionnaire de airement une image, on consid` fonctions danalyse, e tant un certain ensemble de param` etres inclus dans , propre a ` la famille choisie. lin eaire de limage , d enie sur , est alors obtenue en calculant une corr elation Une transformation entre et la fonction :

"
o` u
"

(9.1)
d esignant le complexe conjugu e de la quantit e en argument. La premi` ere question qui se pose naturellement, dans cette approche, est de savoir quelles fonctions utiliser. Ce choix se fait souvent en suivant deux imp eratifs, quon rencontre plus g en eralement dans tous les probl` emes de mod elisation : d enir une famille sufsamment riche pour pouvoir mod eliser efcacement des images au contenu relativement complexe (telles que celles quon rencontre en vision assist ee par ordinateur ou encore en vid eo) garder des fonctions dexpression relativement simple et caract eris ees par un nombre limit e de param` etres. Lexemple le plus classique danalyse lin eaire est la transform ee de Fourier (TF). On a alors , et :

Cette transformation est bien adapt ee a ` lanalyse des comportements harmoniques, surtout apparents dans les zones textur ees des images, mais elle nest pas appropri ee a ` lanalyse de formes bien localis ees spatialement. Pour avoir la possibilit e de conserver une analyse spectrale tout en acqu erant un pouvoir de localisation spatiale, il faut adopter une approche espace-fr equence (temps-fr equence en 1D [Flandrin, 1998]), en choisissant des fonctions a ` la fois oscillantes et de support limit e. On dit alors que les fonctions constituent des atomes espace-fr equence. Plusieurs choix de tels atomes sont envisageables : 193
194
CHAPITRE 9. ONDELETTES ET TRAITEMENT DIMAGES
famille de Weyl-Heisenberg eg` erement la TF, en introduisant une fen etre . On prend ainsi . On modie l , et : (9.2)

La TF de cette fonction est :
d esigne celle de (suppos ee d enie). En choisissant centr ee et de type passe-bas (localis ee en espace et en fr equence autour de (0,0)), on voit que est localis e e spatialement autour de et fr equentiellement autour de . Le principe de Gabor-Heisenberg [Flandrin, 1998] nous assure que la localisation espace-fr equence est optimale si :
o` u

. Lorsque o` u de Gabor. famille dondelettes. On prend

&%
prend une forme gaussienne de ce type, on dit quon effectue une analyse

La fonction est appel ee une ondelette m` ere [Meyer, 1990]. Il sagit g en eralement dune fonction de carr e sommable assez r eguli` ere, bien localis ee en espace et en fr equence (la d ecroissance asymptotique de la fonction, ainsi que celle de sa TF sont rapides) et telle que :
% ,

et
"

La TF de
vaut :
o` u d la TF de . Si est localis ee spatialement en et fr equentiellement en e signe a un maximum global en ) alors est localis (i.e. e e spatialement en et . En faisant varier les param` e tres de localisation spatiale et le facfr equentiellement en teur d echelle (analyse espace- echelle), il y a bien la possibilit e de r ealiser du m eme coup une analyse espace-fr equence. Nous navons pas encore parl e du r ole du param` etre , qui correspond a ` un angle indiquant la direction danalyse privil egi ee. On peut, par exemple, d enir :
"

o` u
est une fonction a ` deux variables anisotrope et
Un autre choix usuel est de limiter a ` prendre ses valeurs dans
est la matrice de rotation plane

%
! % !
et de poser :
9.1. PRINCIPES DE LANALYSE LINEAIRE DES IMAGES
o` u d esigne maintenant une ondelette m` e (telle que " ) et est une fonction basse re 1D " fr equence localis ee en 0 telle que . On g en` ere ainsi une famille dondelettes 2D s eparables. Un exemple de telles fonctions est donn e par la gure 9.1. Compar ees a ` la famille de Weyl-Heisenberg, les familles dondelettes sav` erent souvent mieux adapt ees a ` lanalyse des images naturelles. De plus, lanalyse quelles permettent de r ealiser a lavantage d etre plus proche de celle op er ee par le syst` eme psycho-visuel [Mallat, 2000].
195
(a) 8 6 6 4 4 2 2 0 0 2 2 4 4 6 6 8 8 6 4 2 0 2 4 6 8 6 4 2 0
(b)
, (b) . Londelette (resp. ) permet dextraire les sert a ` lanalyse des d etails r esiduels. informations de type contours horizontaux (resp. verticaux) alors que
F IG . 9.1 Exemple dondelettes s eparables splines : (a)
famille de Gabor modi ee . En partant de lid ee de ec edentes, combiner les caract eristiques des deux familles pr on peut prendre , et

eelle, la transform ee dune image r eelle est aussi r eelle ( ). Lanalyse obtenue Notons que, si est r (cf. gure 9.2) est plus exible que celles de Gabor ou en ondelettes, mais elle comporte un nombre accru de param` etres a ` g erer. ridgelets. Les fonctions de cette famille ees aux ondelettes. Elles sont d enies sont fortement apparent [Cand` es, 1999] par , et :

&%
&%

(9.3)
&%
#

des contours, qui constituent des e l ements s emantiques essentiels des images. Notons que les fonctions ne peuvent e tre ni sommables, ni de carr es sommables sur . Maintenant que nous avons quelques id ees sur la fac on de construire une transformation lin eaire, un certain nombre dinterrogations doivent nous venir a ` lesprit :
o` u
ere 1D. Les courbes de niveau de la fonction sont les droites d equations est une ondelette m` , . Ceci explique que cette famille soit particuli` erement bien adapt ee a ` lanalyse
1. Quand une transformation lin eaire fournit-elle une repr esentation compl` ete ? En dautres termes, ` quelle a condition la seule connaissance des coefcients suft-elle a ` caract eriser enti` erement limage ? Le cas
196
(a) 5

(b) 5
5 5
5 5
(c) 5 5
(d)
5 5
5
#
5 5
# %$'&( #
5

F IG . 9.2 Exemple de fonctions de Gabor modi ees localis ees en ! "
0
gaussienne.
2
(orientation suivant laxe des ordonn ees) et (a) # (orientation suivant la seconde bissectrice) et (c)
ou (b)
ou (d)
: atomes a ` l echelle pour )( ; atomes a ` l echelle pour 3$!&2( . La fonction 4 est ici une
e ch eant, on doit e tre a ` m eme de reconstruire limage ` partir de ses coefcients. La question revient donc a ` se a demander si lon peut inverser la transformation . Un autre int e r e t, beaucoup plus pratique, de la d e nition dune inverse de est la possibilit e de r ealiser des traitements e labor es a ` partir dune transformation lin eaire, suivant le sch ema g en erique de la gure 9.3. Le traitement peut e tre, par exemple, un codage ou une estimation an de comprimer ou bien de d ebruiter limage. Notons que ces op erations sont g en eralement plus simples a ` mettre en uvre apr` es transformation que directement, sur limage dorigine.
2. Existe-t-il des m ethodes rapides pour le calcul de certaines transformations lin eaires ? Peut-on reconstruire ou bien synth etiser de mani` ere efcace une image a ` partir de ses coefcients ? Un premier pas dans la voie de limpl ementation est la discr etisation de lensemble . Il est clair quavec un ordinateur, on ne peut eressant de se demander si prendre en compte quun nombre ni datomes espace-fr equence. Il est donc int lon peut se limiter a ` des familles discr` etes de fonctions (i.e. des ensembles d enombrables). Avant dapporter des e l ements de r eponses a ` ces questions, pr ecisons quelques points math ematiques, ne serait-ce
9.2. TRAMES
197
traitement
F IG . 9.3 Traitement dans le domaine transform e ( : image dorigine, : coefcients transform es, es, : coefcients trait
: image trait ee).
que pour donner un sens rigoureux ` lint egrale . Lensemble des images que nous consid ererons est , a lespace de Hilbert des fonctions a ` valeurs complexes, d enies sur , d energie nie, celle-ci e tant donn ee par :

Cet espace est muni de la norme
et du produit scalaire associe :

"

"

"
9.2 Trames
9.2.1 Objectif
ete par d trames permettent de d enir une repr esentation compl` ecomposition sur une famille Les de fonctions dun espace de Hilbert ( ), e tant un ensemble dindices d enombrable.
discr` ete
9.2.2 D enition
Une famille que :

dun espace de Hilbert
est une trame (frame en anglais) sil existe

tel
(9.4)
Les constantes strictement positives et sont appel ees les bornes de la trame. Si , on dit que la trame est ajust ee (tight frame). Remarques : Une base orthonormale de constitue une trame ajust ee puisquon a, par conservation de la norme :

Inversement, si une trame est ajust ee avec et si , , alors on montre que cest une base orthonormale. Des e l ements dune trame peuvent e tre lin eairement d ependants. Ceci signie quune trame conduit g en eralement a ` une repr esentation redondante de linformation (on calcule plus de coefcients que cela nest strictement n ecessaire !). Cette redondance peut e tre p enalisante dans certaines applications telles que la compression dimages, o` u lon cherche a ` compacter au maximum linformation a ` coder. Au contraire, la redondance est souvent recherch ee en analyse dimages, car elle permet demployer des dictionnaires plus riches de fonctions qui offrent, par exemple, la possibilit e de mieux localiser les objets pr esents dans la sc` ene consid er ee.

198
Lun des int er ets de la d enition ci-dessus est de conduire a ` un op erateur de transformation : !

qui est lin eaire et continu. En effet, rappelons que, pour un op erateur lin eaire, la continuit e est e quivalente a ` la bornitude [Schwartz, 1995] et on vient de voir que :

9.2.3 Propri et es
Commenc ons par ouvrir une petite parenth` ese math ematique, en calculant ladjoint de . Cet adjoint, not e est d eni par :

et donc :
Remarquons que,

(9.5)
, on a :

L equation (9.4) se r ee crit donc, sous une forme plus symbolique :

ce quon exprime aussi, de mani` ere encore plus synth etique, par :
e tant lin eaire et continu (puisque et donc Lop erateur bijectif et dinverse continu [Daubechies, 1992a]. De plus, en utilisant des propri et es des op erateurs auto-adjoints, on montre que : (9.7)
, on peut verier quil est le sont) et minor e par

(9.6)
Utilisons r e sultats inversible a ` gauche. .bien dabord ces pour inverser . Remarquons tout que est En effet, posons . Il est clair que En fait, il sav` e re que na pas vers n ecessairement un inverse a ` gauche unique et est le pseudo-inverse de , i.e. lop erateur de ,
inverse a ` gauche de , qui est de norme minimale [Daubechies, 1992a] (voir aussi le Chapitre 5).
9.2.4 Trame duale

Nous allons maintenant le calcul de la pseudo-inverse de voir que et des fonctions : laide de ses coefcients
conduit a ` la reconstruction de
a `

9.2. TRAMES
Plus pr ecis ement, en utilisant la relation (9.5), on trouve la formule de reconstruction suivante :
199
De fac on sym etrique, on peut v erier que Notons que

(9.8)
est aussi une trame puisque :
On dit que

(9.9)

est la trame duale de

Par cons equent :
. Pour justier la relation (9.9), on remarque que, pour tout

En utilisant lin egalit e (9.7), on en d eduit lin egalit e d esir ee qui est caract eristique dune trame. En r esum e, de m eme que lon dispose de deux formules de reconstruction, on a deux transformations duales :

A ce point, on peut naturellement se demander dans quelle situation sp ecique une trame fournit une analyse non redondante. En premier lieu, il convient dintroduire le concept de base de Riesz , qui formalise cette notion de non-redondance . D enition 1. Une base de Riesz est une trame dont les e ements sont ind ependants. l
est une base de Riesz, alors est aussi une base de Riesz, puisque Notons que, si . Par ailleurs, compte tenu de la relation duale de (9.8) :

et, la famille

e tant ind ependante, on a :

En raison de cette relation, on dit que et cas, si les fonctions , sont norm ees, on a :

sont des bases bi-orthogonales de . Par ailleurs, dans ce

Mentionnons que les bases bi-orthogonales sont tr` es utilis ees en compression dimages [Antonini et al., 1994] et notamment dans la nouvelle norme JPEG2000 (voir la gure 9.4).
200
bits/pixel) et en bas limage d ecod ee a ` 0.25 bit/pixel (cest-` a-dire, une compression dun facteur 96 pour une image couleur). Le rapport signal sur bruit de codage vaut 28.17 dB en valeur cr ete (PSNR). JPEG2000 repose sur lemploi de bases bi-orthogonales dondelettes. Les coefcients dondelettes sont quanti es dautant plus nement que leur amplitude est grande. Une strat egie de codage assez sophistiqu ee est e galement mise en uvre an datteindre de forts taux de compression.
F IG . 9.4 Compression dimage a ` laide de JPEG2000 : en haut, limage originale (
9.2.5 Algorithme des trames

les fonctions
Pour reconstruire une image
ne sont pas calculables analytiquement, il faut les d eterminer num eriquement. De
a ` partir des coefcients

, il faut conna tre la famille

. Quand
mani` ere e quivalente, on peut directement calculer :
o` u
Dans les deux cas, on est amen ea ` approcher num eriquement lop erateur poser :
.
o` u

. Pour cela, on peut
est une approximation grossi` ere de
a ` partir des bornes de la trame (cf. relation (9.6)) et
correspond a ` lerreur dapproximation. Dapr` es l equation (9.6), on a :
On peut montrer que cela implique que

v eri ee, on a le d eveloppement suivant :

. Sous la condition

, qui est, en fait, toujours

o` u la s erie converge en norme. On en d eduit que :

9.2. TRAMES
Une approximation dordre
201 de
est ainsi :

Lerreur dapproximation peut e tre e valu ee :

soit

!
On observe que converge dautant plus rapidement vers (quand ) que est petit, cest-` a-dire que les bornes de la trame sont proches. Par ailleurs, une formule r ecursive permet de calculer rapidement :

9.2.6 Exemples de trames

Les dictionnaires datomes espace-fr equence que nous avons introduits au paragraphe 9.1 permettent de construire des repr esentations discr` etes des images. En effet, on montre que, sous certaines conditions techniques [Daubechies, 1992a, en choisissant judicieusement Bergeaud, 1996] quil serait fastidieux d enoncer, on obtient des trames de . trames de Weyl-Heisenberg On r ealise un e chantillonnage r egulier des param` etres spatiaux et fr equentiels de la famille de Weyl-Heisenberg (donn ee par l equation (9.2)). On a donc
. Une condition n o` u ecessaire pour que soit une trame de est alors : . On montre, par ailleurs, que la trame duale est la trame de Weyl-Heisenberg correspondant a ` une certaine fen etre . trames dondelettes On discr etise l echelle suivant une loi exponentielle, alors que les facteurs de translation sont e chantillonn es avec un pas proportionnel a ` cette m eme e chelle [Meyer, 1990]. Ainsi, dans le cas s eparable, on a :

% % . Lentier est couramment appel o` doit prendre e niveau de r esolution. Lorsque u(resp., et lon ) la r esolution est grossi` ere (resp., ne), les ondelettes e tant dilat ees (resp., contract ees). On montre que la trame duale est aussi une trame dondelettes. . Fait important, il est Tr` es souvent, on se limite a ` des d ecompositions dyadiques pour lesquelles
possible de construire des bases bi-orthogonales [Cohen, 1992] ou m eme orthonormales dondelettes, dans ce cas [Pesquet-Popescu et Pesquet, 2001]. Il peut alors e tre int e ressant de limiter lanalyse en ondelettes a ` un certain niveau de r esolution , en d eterminant les coefcients dondelettes

202

ces coefcients, ainsi que les ondelettes associ ees, ayant e t e index es de mani` ere e vidente par rapport aux notations pr ec edentes. Ensuite, en calculant

peut extraire les structures pr esentes dans limage, d echelle au moins e ` on gale a . En faisant varier , on r ealise ce quon appelle une analyse multir esolution (AMR). Quand d ecro t, fournit une approximation plus ne de limage ce qui, en quelque sorte, permet de zoomer sur les d etails de la sc` ene (cf. gure 9.5). Gr ace a ` ce concept dAMR, on peut concevoir des algorithmes efcaces [Mallat, 2000] pour effectuer le calcul dune d ecomposition sur une base dondelettes. En termes de complexit e, ces algorithmes sont comp etitifs par rapport a ` ceux de transform ee de Fourier rapide. A titre illustratif, un exemple de d ebruitage a ` laide de trames dondelettes est donn e en gure 9.6. trames de Gabor modi ees Dans [Bergeaud, 1996], il est demontr e quon peut obtenir une trame de a ` partir dune famille de Gabor modif ee en prenant

, et o` u . trames de ridgelets On peut de mani` ere similaire [Cand` es, 1999] discr etiser les param` etres dune famille de ridgelets en prenant
% $ %
%
%
(9.10)
$ , lespace des images d o` u . On obtient alors une trame de energie nie d enies sur le carr e unit e . Par dilatations et translations des fonctions de cette trame, on peut se ramener a ` une trame , o` . En partitionnant en carr de u est un carr e arbitraire de e s, on peut ainsi g e n erer une . Une analyse de ce type (pr trame de ec ed ee dune d ecomposition a ` laide dun banc de ltres

&%

$ $
[Vetterli et Kova cevi` c, 1995] isotropes) permet de construire des bases orthonormales de curvelets , qui sont mieux adapt ees que les ridgelets a ` lanalyse des contours non rectilignes [Cand` es et Donoho, 1999].
9.3 Poursuite adaptative

9.3.1 Motivation
Soit

une trame de
. On sait que, pour tout
Cependant, si nest pas une base de Riesz de , alors les coefcients enis de ne sont pas d mani` ere unique. Parmi toutes les strat egies de choix possibles pour les coefcients , la meilleure est sans doute celle qui consiste a ` concentrer au maximum l energie de limage sur un nombre minimal de termes de la d ecomposition (9.11). De cette mani` ere, on peut esp erer faire appara tre les termes principaux, i.e. les structures essentielles composant limage .

, il existe

tel que (9.11)

, mais ces derniers ne v Lalgorithme des trames permet de d eterminer des coefcients erient g en eralement pas la propri et e de concentration d energie dont nous venons de souligner limportance. Pour pallier ce probl` eme, nous allons maintenant proposer une autre approche.
9.3. POURSUITE ADAPTATIVE
203
9.3.2 Algorithme de poursuite

Lalgorithme (appel e matching pursuit, en anglais) que nous allons pr esenter vise a ` extraire it erativement, par ordre d ecroissant dimportance, les e l ements du dictionnaire qui composent le signal. que soit une trame dun sous-espace vectoriel ferm e de (qui peut e tre Supposons lui-m eme) et que chaque e l ement de ce dictionnaire soit norm e:
Si lon projette mation

(orthogonalement) sur la droite vectorielle engendr ee par , on obtient une approxi-
de limage . Dapr` es le th eor` eme de Pythagore, lerreur dapproximation est donn ee par :

est grand. Pour d On voit donc que lerreur est dautant plus faible que eterminer l el ement de limportance est pr epond erante, il suft ainsi de rechercher celui qui maximise . Supposons que :

dont
On peut alors appliquer la m eme m ethode a ` lerreur dapproximation (appel ee aussi r esidu ),
de fac on a ` isoler le second ingr edient essentiel , , entrant dans la composition du signal. Remarquons au passage que est orthogonal a ` . En proc edant de cette mani` ere, it erativement, on obtient a ` l etape :

(9.12)
o` u

et lon a pos e

(9.13)
. Toujours en invoquant le th eor` eme de Pythagore, on a :

ce qui conduit, par r ecurrence, a ` la relation :

Remarques : Si est de dimension innie, rien ne garantit que a ` la r` egle de s election (9.13) la suivante :
est atteint. Il est donc preferable de substituer
o` u . Notons que, m eme dans le cas o` u est de dimension nie, cette nouvelle r` egle de s election peut e tre mise a ` prot an de faciliter la recherche de .

204
On peut montrer [Mallat et Zhong, 1993] que lalgorithme de poursuite converge vers la projection orthogonale de sur . Dans le cas o` u , la limite obtenue est et on a la d ecomposition :
Si
est de dimension nie, on peut de plus e tablir que la convergence est exponentielle, i.e.

9.3.3 Am eliorations
R eduction de la complexit e La m ethode que nous avons pr esent ee au paragraphe pr ec edent pose des probl` emes de complexit e qui peuvent devenir r edhibitoires en traitement dimage si lon ne veille pas a ` optimiser sa mise en uvre. , on doit d eterminer les corr elations du r esidu avec les fonctions . Ce calcul peut A lit eration e tre r ealis e efcacement, de mani` ere r ecursive, en remarquant que, dapr` es (9.12),

. Pour le dictionnaire d eni par les e quations (9.3) a ` (9.10), cette propri et e est v eri ee si est de support limit e. On peut, par exemple, prendre pour une fonction spline. Pour initialiser la r ecurrence (9.14), il faut calculer . Si des dictionnaires de type (9.3)-(9.10) sont employ es, cette corr elation peut e tre effectu ee a ` laide de bancs de ltres [Vetterli et Kova cevi` c, 1995]. La complexit e de cette e tape de ltrage peut e tre r eduite en imposant a ` la fonction d etre s eparable. Notons enn que l equation (9.14) doit e tre mise en uvre m eme si es faibles valeurs, prend de tr` ce qui induit une charge de calculs inutile. Pour acc e l e rer le traitement, on peut se limiter a ` un sous-dictionnaire restreint form e des e l ements ayant une inuence non n egligeable, i.e. tels que :
On voit donc quil est pr ef erable de pr e-calculer les produits scalaires , . Par ailleurs, pour telles que , minimiser le nombre de mises a ` jour, on a int e r e t a ` limiter le nombre de fonctions

e tant x e arbitrairement dans
(9.14)
o` u . Dans la suite des it erations de lalgorithme de poursuite, on e limine alors successivement les fonctions ne contribuant pas signicativement a ` lanalyse du r esidu, i.e. , telles que :

Quand toutes les fonctions ont ainsi e t ee puis ees1 et que le sous-dictionnaire est r eduit a ` lensemble vide, disons a ` lit eration , on peut constituer un nouveau sous-dictionnaire en recherchant les fonctions de telles que et it erer la proc edure jusqu` a sa convergence [Bergeaud, 1996].

A lit eration de lalgorithme de poursuite, on sait que le r esidu est ` orthogonal a , mais il nest pas n ecessairement orthogonal au sous-espace vectoriel engendr e par la famille , si cette derni` ere nest pas orthonormale. Ceci montre que rien nemp eche le m eme e l ement du dictionnaire d etre retenu plusieurs fois au cours des it erations de lalgorithme de poursuite. Par cons equent, on nest pas assur e de la convergence de lalgorithme en un nombre ni dit erations, m eme si le dictionnaire est ni. Pour pallier ce probl` eme, on peut recourir a ` une orthogonalisation r ecursive de la famille , en employant une proc edure de Gram-Schmidt.
Orthogonalisation
$
1 On
montre que cela se produit n ecessairement au bout dun nombre ni dit erations.
205
, , , (de haut en bas). LAMR peut e tre utilis ee pour la transmission progressive dinformation ou la recherche hi erarchique dans des bases de donn ees. Dans chacune de ces applications, on part dune approximation a ` faible r esolution de limage, qui est rafn ee au cours des e tapes du traitement.

F IG . 9.5 Exemple danalyse multir esolution pour
206
F IG . 9.6 D ebruitage dimage a ` laide de trames dondelettes. A gauche, on peut voir limage d egrad ee, apr` es addition dun bruit non gaussien (m elange de distributions gaussiennes). Lerreur quadratique moyenne normalis e e (EQMN) par rapport a ` 2( . Limage restaur ). Un estimateur non lin loriginal vaut ee est pr esent ee a ` droite (EQMN = eaire est employ e qui consiste simplement en un seuillage des coefcients dondelettes. Cette op eration permet d eliminer les coefcients de petite amplitude, tr` es sensibles au bruit, alors quon conserve ceux de forte amplitude, sur lesquels se concentre essentiellement l energie de limage.
207
(a)
(b)
(c)
(d)
F IG . 9.7 Approximation par poursuite adaptative de limage de la gure (a), en utilisant un dictionnaire de Gabor modi e pour un nombre dit erations e gal a ` : (b) 650 , (c) 1300 et (d) 1950.
208

Poly Anim t1

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Poly Anim t1

Enviado por

Direitos autorais:

Formatos disponíveis

Le traitement des images

I. Bloch, Y. Gousseau, H. Ma tre, D. Matignon,

B. Pesquet-Popescu, F. Schmitt, M. Sigelle, F. Tupin

Table des mati` eres

Comment percevons nous les images ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 2.5.2 2.5.3 2.5.4 2.5.5

Un mod` ele dimage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.1 2.6.2

` TABLE DES MATIERES

` TABLE DES MATIERES

` TABLE DES MATIERES

Applications de louverture et de la fermeture . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

Transformation en tout ou rien et op erateurs d eriv es . . . . . . . . . . . . . . . . . . . . . . . . . 116

G eod esie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

Estimateurs dans un cadre markovien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

` TABLE DES MATIERES

` TABLE DES MATIERES

` TABLE DES MATIERES

` TABLE DES MATIERES

` TABLE DES MATIERES

16.4.1 Un ordre pour lespace

` TABLE DES MATIERES

La vision et la perception humaines

1.1 Anatomie du syst` eme visuel humain

CHAPITRE 1. VISION ET PERCEPTION

1.1.2 Les voies optiques

1.1.3 Les aires sup erieures de la vision

1.2 Comment percevons nous les images ?

1.2. COMMENT PERCEVONS NOUS LES IMAGES ?

1.2.1 Comportement passif du syst` eme visuel

CHAPITRE 1. VISION ET PERCEPTION

1.2. COMMENT PERCEVONS NOUS LES IMAGES ?

1.2.2 Comportement actif du syst` eme visuel

CHAPITRE 1. VISION ET PERCEPTION

1.2. COMMENT PERCEVONS NOUS LES IMAGES ?

F IG . 1.8 R ole des gradients de texture dans l Arlequin

de Vasarely (cf. texte).

F IG . 1.10 Positif et n egatif de la photo de lauteur. Vous pouvez v erier.

CHAPITRE 1. VISION ET PERCEPTION

1.2. COMMENT PERCEVONS NOUS LES IMAGES ?

CHAPITRE 1. VISION ET PERCEPTION

Jeune lle ou vieille femme ?

gure ambigu e de R. Leeper.

1.2. COMMENT PERCEVONS NOUS LES IMAGES ?

CHAPITRE 1. VISION ET PERCEPTION

Propri et es statistiques des images

ES STATISTIQUES DES IMAGES CHAPITRE 2. PROPRIET

2.1.2 Quelles images

Fillettes F IG . 2.1 Trois images

2.2.2 Sensibilit e aux modications dhistogrammes

ES STATISTIQUES DES IMAGES CHAPITRE 2. PROPRIET

2.3 Les sauts de lamplitude

 '   !$# &  %  !

2.4. LA FONCTION DAUTOCORRELATION

2.4 La fonction dautocorr elation

ES STATISTIQUES DES IMAGES CHAPITRE 2. PROPRIET

(la valeur 127 a e t e ajout ee a `

      !"

2.4. LA FONCTION DAUTOCORRELATION

   !"

fruits nice tifany singe lena

ES STATISTIQUES DES IMAGES CHAPITRE 2. PROPRIET

2.4. LA FONCTION DAUTOCORRELATION

est une forme quadratique en

2.4.3 Le spectre de densit e de puissance

' !$# & % !

!"

!"

"

par la r du syst` eponse impulsionnelle eme dobservation :

, des frequences seront attenuees, introduisant un ou