Escolar Documentos
Profissional Documentos
Cultura Documentos
tome 1
Polycopi e du cours ANIM D epartement TSI - T el ecom-Paris version 5.0 8 d ecembre 2005
2 Propri et es statistiques des images 2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 2.1.2 2.2 2.2.1 2.2.2 2.3 2.4 Pourquoi e tudier des propri et es statistiques . . . . . . . . . . . . . . . . . . . . . . . . . Quelles images . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Propri et es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sensibilit e aux modications dhistogrammes . . . . . . . . . . . . . . . . . . . . . . . .
Lamplitude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Les sauts de lamplitude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . La fonction dautocorr elation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 A une dimension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2 2.4.3 En multi-dimensions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Le spectre de densit e de puissance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Entropie dordre 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Entropie des sauts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Entropie dordre N . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Entropie conditionnelle, redondance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Retour sur un paradoxe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Processus de Markov Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mais ... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.5
2.6
4 2.7 Critique de la d emarche pr ec edente . . . . 2.7.1 La stationnarit e . . . . . . . . . . 2.7.2 La causalit e . . . . . . . . . . . . 2.7.3 La monodimensionnalit e . . . . . 2.7.4 Vers un mod` ele complet dimage ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
L echantillonnage des images, la repr esentation fractale 3.1 Les signaux monodimensionnels a ` bande limit ee . . . . . . . . . . . . . 3.1.1 Echantillonnage du signal . . . . . . . . . . . . . . . . . . . . . 3.1.2 Reconstruction du signal e chantillonn ea ` la fr equence de Nyquist 3.1.3 Reconstruction dans le cas de sur echantillonnage . . . . . . . . . 3.2 Signaux r eels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Les limitations physiques du spectre . . . . . . . . . . . . . . . . 3.2.2 Filtrage du signal . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Lextension en dimension . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Le mod` ele fractal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1 La dimension fractale . . . . . . . . . . . . . . . . . . . . . . . . 3.4.2 Lhomoth etie interne . . . . . . . . . . . . . . . . . . . . . . . . 3.4.3 Que faire de la th eorie fractale ? . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
Repr esentations discr` etes 4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Pavages et maillages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 D enitions et contraintes . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.2 Pavages plans r eguliers . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.3 Pavages plans semi-r eguliers . . . . . . . . . . . . . . . . . . . . . . . 4.2.4 Dualit e pavage / maillage . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Topologie discr` ete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Quelques approches . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.2 Topologie a ` partir de la notion de voisinage e l ementaire . . . . . . . . 4.3.3 Nombre dEuler : un exemple de caract eristique topologique dun objet 4.4 Repr esentations g eom etriques . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.1 Discr etisation dune droite continue . . . . . . . . . . . . . . . . . . . 4.4.2 Caract erisation dun segment de droite discret . . . . . . . . . . . . . . 4.4.3 Droites analytiques discr` etes . . . . . . . . . . . . . . . . . . . . . . . 4.4.4 Cercles discrets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.5 Pavage de Vorono et triangulation de Delaunay . . . . . . . . . . . . . 4.5 Exemples de structures al eatoires . . . . . . . . . . . . . . . . . . . . . . . . . 4.6 Fonction distance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.1 D enition de distances discr` etes . . . . . . . . . . . . . . . . . . . . . 4.6.2 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
5 79 81 81 82 82 83 85 85 85 86 88 88 89 90 91 91 91 92 92 93 93 93 95 95 97 97 98 100 104 105 106 108 108 109 109 110 110 110 110
5 Restauration des images 5.1 Le ltrage inverse . . . . . . . . . . . . . . . 5.1.1 Approche analytique . . . . . . . . . 5.1.2 Approche alg ebrique . . . . . . . . . 5.1.3 Discussion . . . . . . . . . . . . . . 5.1.4 Conclusions (provisoires) . . . . . . 5.2 D efauts singuliers et mal conditionn es . . . . 5.2.1 D efauts singuliers . . . . . . . . . . . 5.2.2 Syst` eme mal conditionn e. . . . . . . 5.2.3 D ecomposition en valeurs singuli` eres 5.3 Restauration des signaux bidimensionnels . . 5.4 La restauration it erative . . . . . . . . . . . . 5.4.1 M ethode de Jacobi . . . . . . . . . . 5.4.2 M ethode de Gauss-Seidel . . . . . . 5.4.3 M ethode de plus grande pente . . . . 5.4.4 M ethode du gradient conjugu e . . . . 5.4.5 M ethodes de projection (POCS) . . . 5.5 Lestimation des d efauts . . . . . . . . . . . 5.5.1 D etermination par calibrage . . . . . 5.5.2 D etermination statistique . . . . . . . 5.6 R eduction des effets de bord . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
6 Morphologie math ematique 6.1 Introduction et pr eliminaires . . . . . . . . . . . . . . . 6.2 Les quatre op erations . . . . . . . . . . . . . . . . . . . 6.2.1 Notion d element structurant et cadre ensembliste 6.2.2 Erosion et dilatation binaires . . . . . . . . . . . 6.2.3 Erosion et dilatation de fonctions . . . . . . . . 6.2.4 Ouverture et fermeture binaires . . . . . . . . . 6.2.5 Ouverture et fermeture num eriques . . . . . . . 6.3 Cadre topologique . . . . . . . . . . . . . . . . . . . . . 6.4 Cadre alg ebrique . . . . . . . . . . . . . . . . . . . . . 6.4.1 Treillis . . . . . . . . . . . . . . . . . . . . . . 6.4.2 Erosion et dilatation alg ebriques, adjonctions . . 6.4.3 Lien avec les op erateurs morphologiques . . . . 6.4.4 Ouverture et fermeture alg ebriques . . . . . . . 6.5 Cadre probabiliste . . . . . . . . . . . . . . . . . . . . . 6.5.1 Ensembles ferm es al eatoires . . . . . . . . . . . 6.5.2 Un exemple : le sch ema bool een . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
6 6.6
6.10 Ligne de partage des eaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 6.10.1 D enition et propri et es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 6.10.2 Applications en segmentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 6.11 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 7 D enition et simulation dun champ de Markov 7.1 7.1.1 7.1.2 7.1.3 7.1.4 7.1.5 7.1.6 7.1.7 7.2 7.2.1 7.2.2 7.2.3 127
D enition et simulation dun champ de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 Description de limage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 Mod elisation probabiliste de limage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 Champs de Markov - Champs de Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 Echantillonnage de MRF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 Le recuit simul e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 Quelques MRF fondamentaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 Applications : restauration et segmentation . . . . . . . . . . . . . . . . . . . . . . . . . 137 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 Mod elisation bay esienne et fonction de co ut . . . . . . . . . . . . . . . . . . . . . . . . . 141 Estimateur MAP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
7 144 145 146 148 148 149 152 160 160 161 162 162 164 167 167 168 170 175 176 176 176 177 177 177 178 181 181 182 183 185 186 186 187 189 190 193 193 197 197
7.3
7.4
7.5
7.6
8 Equations aux d eriv ees partielles et traitement dimages 8.1 L equation de la chaleur et ses limitations . . . . . . . . . . . . . . . 8.1.1 Quelques notations . . . . . . . . . . . . . . . . . . . . . . . 8.1.2 Pourquoi l equation de la chaleur . . . . . . . . . . . . . . . 8.1.3 Equation de la chaleur et noyau gaussien . . . . . . . . . . . 8.1.4 Application aux images . . . . . . . . . . . . . . . . . . . . . 8.1.5 L equation de la chaleur inverse . . . . . . . . . . . . . . . . 8.1.6 Limitations, invariance par changement de contraste . . . . . 8.2 Equations de diffusion non-lin eaires . . . . . . . . . . . . . . . . . . 8.2.1 Notations et structure locale des images . . . . . . . . . . . . 8.2.2 L equation de Malik et Perona . . . . . . . . . . . . . . . . . 8.2.3 Mouvement par courbure moyenne et variantes . . . . . . . . 8.2.4 L equation de Rudin-Osher-Fatemi . . . . . . . . . . . . . . . 8.2.5 Le ltre de choc de Rudin . . . . . . . . . . . . . . . . . . . 8.3 EDP et analyse multi- echelles . . . . . . . . . . . . . . . . . . . . . 8.3.1 D enition et propri et es des analyses multi- echelles . . . . . . 8.3.2 Pourquoi les analyse multi- echelles sont r egies par des E.D.P. 8.3.3 Classication des analyses multi- echelles . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
9 Ondelettes et traitement dimages 9.1 Principes de lanalyse lin eaire des images . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2 Trames . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2.1 Objectif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8 9.2.2 D enition . . . . . . . . 9.2.3 Propri et es . . . . . . . . 9.2.4 Trame duale . . . . . . . 9.2.5 Algorithme des trames . 9.2.6 Exemples de trames . . Poursuite adaptative . . . . . . . 9.3.1 Motivation . . . . . . . 9.3.2 Algorithme de poursuite 9.3.3 Am eliorations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3
10 Les pr etraitements 10.1 Les traitements photom etriques ou colorim etriques 10.1.1 Lin earit e . . . . . . . . . . . . . . . . . . 10.1.2 Homog en eit e . . . . . . . . . . . . . . . . 10.1.3 Binarisation, seuillage . . . . . . . . . . . 10.1.4 Augmentation de contraste . . . . . . . . . 10.2 Suppression des bruits . . . . . . . . . . . . . . . 10.2.1 Filtrages lin eaires . . . . . . . . . . . . . . 10.2.2 Filtrage de rang . . . . . . . . . . . . . . . 10.2.3 Filtrages morphologiques . . . . . . . . . 10.2.4 Filtrages par e quations de diffusion . . . . 10.3 Les ltres adaptatifs . . . . . . . . . . . . . . . . . 10.3.1 Les ltres a ` coefcients adaptatifs . . . . . 10.3.2 Les ltres a ` fen etres adaptatives . . . . . . 10.4 Le r ee chantillonnage des images . . . . . . . . . . 10.4.1 Interpolation avec des polyn omes . . . . . 10.4.2 Interpolation par des B-splines . . . . . . . 10.4.3 Interpolation adaptative . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
11 La d etection des contours dans les images 11.1 Un mod` ele continu de contour. . . . . . . . . . . . . . 11.2 Les approches classiques . . . . . . . . . . . . . . . . 11.2.1 Les d etecteurs de gradient par ltrage . . . . . 11.2.2 Les d etecteurs de gradient par masques . . . . 11.2.3 Pr e- et post traitements . . . . . . . . . . . . . 11.2.4 Les d etecteurs de passage par z ero du laplacien 11.2.5 Les d etecteurs par masquage adapt e . . . . . . 11.3 Les approches analytiques . . . . . . . . . . . . . . . 11.3.1 Les crit` eres de Canny . . . . . . . . . . . . . . 11.3.2 Les ltres de Deriche et Shen et Castan . . . . 11.3.3 Lextension a ` 2D . . . . . . . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
9 233 234 234 235 237 238 238 239 240 243 243 243 244 245 245 245 247 248 248 249 250 250 251 253 253 254 257 257 258 259 259 259 259 260 260 260 261 265 266
12 La segmentation par r egions 12.1 Les m ethodes sur histogramme . . . . . . . . . . . . . . . . . . 12.1.1 Avec apprentissage . . . . . . . . . . . . . . . . . . . . 12.1.2 Seuillage sans apprentissage . . . . . . . . . . . . . . . 12.1.3 M ethodes de classication . . . . . . . . . . . . . . . . 12.1.4 S election sur lhistogramme et dans limage . . . . . . . 12.1.5 S election sur histogramme et r egularisation . . . . . . . 12.2 Les m ethodes par transformation de r egions . . . . . . . . . . . 12.2.1 La croissance de r egion . . . . . . . . . . . . . . . . . . 12.2.2 Le partage de r egion . . . . . . . . . . . . . . . . . . . 12.2.3 La r eunion de r egion . . . . . . . . . . . . . . . . . . . 12.2.4 Les pyramides . . . . . . . . . . . . . . . . . . . . . . 12.3 Les graphes dadjacence . . . . . . . . . . . . . . . . . . . . . 12.4 La m ethode MDL = Minimum Description Length . . . . . . . 12.5 Lapproche de Mumford et Shah . . . . . . . . . . . . . . . . . 12.5.1 Approche formelle . . . . . . . . . . . . . . . . . . . . 12.5.2 Les variantes autour de la formulation de Mumford-Shah 13 Les textures 13.1 Quest ce quune texture ? . . . . . . . . . . . . . . . . . . 13.1.1 Distribution al eatoire ou r eguli` ere ? . . . . . . . . . 13.1.2 Les e chelles des textures . . . . . . . . . . . . . . . 13.1.3 Analyse ou synth` ese . . . . . . . . . . . . . . . . . 13.2 Mod` eles de texture . . . . . . . . . . . . . . . . . . . . . . 13.2.1 Un mod` ele biologiquement plausible . . . . . . . . 13.2.2 Mod` eles stochastiques . . . . . . . . . . . . . . . . 13.3 Analyse et reconnaissance de textures . . . . . . . . . . . . 13.3.1 Sch ema g en eral . . . . . . . . . . . . . . . . . . . . 13.3.2 Approches par mesures statistiques . . . . . . . . . 13.3.3 La d etection d energie dans des canaux fr equentiels . 13.3.4 Les ltres optimis es . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
10 13.3.5 Les mod elisations autor egressives . . . 13.4 Les approches par champs markoviens . . . . . 13.4.1 La m ethode de Manjunath et Chellappa 13.4.2 La m ethode de Kervrann et Heitz . . . 13.5 Les m ethodes structurales . . . . . . . . . . . . 13.6 Textures h et erog` enes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14 Description de contours et de formes 14.1 Fonction caract eristique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2 Description de formes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.1 Repr esentation par les moments . . . . . . . . . . . . . . . . . . . . 14.2.2 Repr esentation par les moments invariants . . . . . . . . . . . . . . . 14.2.3 Bo tes englobantes et bo tes minimales . . . . . . . . . . . . . . . . 14.3 Polygones de Guzman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.4 Cha nes de Freeman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.4.1 D enition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.4.2 Les propri et es des cha nes de Freeman . . . . . . . . . . . . . . . . . 14.4.3 Reconnaissance des formes par des cha nes de Freeman . . . . . . . 14.5 Descripteurs de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.5.1 Descripteur par tangente . . . . . . . . . . . . . . . . . . . . . . . . 14.5.2 Repr esentation complexe . . . . . . . . . . . . . . . . . . . . . . . . 14.6 Approximations polynomiales . . . . . . . . . . . . . . . . . . . . . . . . . 14.6.1 Approximation dun nuage de points par une droite unique . . . . . . 14.6.2 Approximations polygonales, simplication de contours polygonaux . 14.6.3 Approximation par des splines . . . . . . . . . . . . . . . . . . . . . 14.7 Transformation de Hough . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.7.1 D enitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.7.2 Mise en uvre de la TH . . . . . . . . . . . . . . . . . . . . . . . . 14.7.3 D etections par TH . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ements de g 15 El eom etrie tridimensionnelle 15.1 G eom etrie projective . . . . . . . . . . . . . . . . . . . . . . 15.1.1 Espace projectif et coordonn ees homog` enes . . . . . . 15.1.2 Espaces projectifs , et . . . . . . . . . . . . 15.1.3 Expression lin eaire de probl` emes g eom etriques . . . . 15.1.4 Stratication, groupes de transformations et invariants 15.2 Repr esentations des rotations de I R . . . . . . . . . . . . . . 15.2.1 Les angles dEuler . . . . . . . . . . . . . . . . . . . 15.2.2 Exponentielle dune matrice anti-sym etrique . . . . . 15.2.3 Forme canonique et th eor` eme de Rodriguez . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
11
15.2.4 Quaternions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302 15.3 G eom etrie diff erentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 15.3.1 Courbes, rep` ere de Frenet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 15.3.2 Courbes sur une surface, formes fondamentales . . . . . . . . . . . . . . . . . . . . . . . 306 15.3.3 Courbures sur des surfaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308 15.3.4 Une notation fr equente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 15.3.5 Interpr etations g eom etriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 15.3.6 Principales m ethodes de calcul des courbures . . . . . . . . . . . . . . . . . . . . . . . . 311 15.3.7 G eom etrie diff erentielle dans des volumes num eriques . . . . . . . . . . . . . . . . . . . 313 16 Formation de limage et couleur 315
16.1 Formation des images . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 16.1.1 Imagerie coh erente et incoh erente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 16.1.2 Interaction mati` ere rayonnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317 16.1.3 Les sources de lumi` ere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320 16.2 D enition des diff erents espaces couleur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320 16.2.1 Trivariance et primaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320 16.2.2 Choix dun espace de couleur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321 16.2.3 Lespace RVB de la CIE 1931 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322 16.2.4 Lespace XYZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324 16.2.5 Lespace Lab et le rep` ere TLC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325 16.2.6 Lespace YC1C2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327 16.2.7 Lespace TLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327 16.2.8 Le syst` eme visuel hypoth etique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328 16.2.9 Lespace TLC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330 16.2.10 Les espaces de la t el evision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330 16.3 Mod elisation de la perception color ee des images . . . . . . . . . . . . . . . . . . . . . . . . . . 331 16.4 Les traitements des images en couleur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
16.4.2 Quest ce quune couleur repr esentative dun nuage ? . . . . . . . . . . . . . . . . . . . . 335 16.4.3 Comment calculer une palette ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335 16.4.4 Comment ltrer 2 couleurs ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336 16.4.5 La d etection des contours des images en couleur . . . . . . . . . . . . . . . . . . . . . . 336 16.4.6 Repr esentation par quaternions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337 16.4.7 Couleur et quaternion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337 A D ecomposition en Valeurs Singuli` eres : SVD 339
A.1 D enition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339 A.2 Lien avec le rang et interpr etation de la d ecomposition . . . . . . . . . . . . . . . . . . . . . . . 339 A.3 Normes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340
12
` la r B Applications de la SVD a esolution des syst` emes lin eaires B.1 Conditionnement dun syst` eme lin eaire non singulier . . . . . . . . . . . . . . . . . . . . . . . . B.2 Pseudo-inverse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.3 Solutions robustes dun syst` eme lin eaire, moindres carr es . . . . . . . . . . . . . . . . . . . . . .
C Optimisation sous contraintes 345 C.1 Contraintes e galit es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 C.2 Contraintes in egalit es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
Chapitre 1
F IG . 1.1 Sch ema de lil humain et photographie du fond de la r etine. Le champ visuel nest pas circulaire, il est de 90 du c ot e temporal, de 60 du c ot e nasal, de 50 et 80 vers le haut et vers le bas. La r etine est le transducteur qui transforme le signal optique en signaux e lectriques. La surface de la r etine est tr` es h et erog` ene, aussi bien en nature de r ecepteurs quen densit e, cf. gure 1.1. Cette h et erog en eit e permet a ` des zones diff erentes dassumer des fonctions compl ementaires. Le centre de la r etine assure la vision color ee et la vision des d etails a ` fort niveau d eclairement (vision photopique). Le pourtour assure la vision achromatique a ` faible niveau de lumi` ere (vision scotopique), la vision des 13
14
mouvements rapides, la perception globale des sc` enes et la vision achromatique a ` faible niveau de lumi` ere (vision scotopique). Lacuit e visuelle est maximale sur la fov ea (zone de la r etine correspondant a ` laxe du regard). La zone do` u part le nerf optique ne capte pas la lumi` ere (elle est appel ee tache aveugle). La r etine est constitu ee de nombreux types de cellules nerveuses : les cellules photo-r eceptrices (c ones et batonnets), les cellules bipolaires, ganglionnaires et amacrines. Ces cellules constituent 2 voies crois ees : la voie directe et la voie indirecte, interconnect ees de fac on complexe. Dans la fov ea, la r etine adopte un sch ema beaucoup plus simple : il ny a que des c ones (et pas de batonnets) et chaque c one nest connect e qu` a une cellule bipolaire elle m eme connect ee a ` une seule cellule ganglionnaire. Lacuit e visuelle baisse r eguli` erement lorsquon s eloigne de la fov ea. Les c ones sont principalement concentr es dans la fov ea et leur densit e d ecro t tr` es rapidement vers le pourtour de lil. Ils sont au nombre de 6 a ` 7 millions. Dans la fov ea ils sont tr` es petits (de 1 a ` 2 microns) et tr` es serr es (entre 2 et 10 microns). Les c ones sont peu sensibles, mais une m eme bre nerveuse ne regroupe quun tout petit nombre de c ones, assurant une bonne discrimination angulaire. Dans toutes les op erations de traitement dimage, on consid` ere que limage est observ ee en vision par les c ones. La vision chromatique est assur ee par 3 types de c ones dont la sensibilit e diff` ere selon le type de pigment quils contiennent. Ces c ones sont appel es L, M et S en fonction des longueurs dondes auxquels ils ont leur pic de sensibilit e : L= Long autour du jaune vert (585 nm), M= Middle autour du vert (550 nm) et S=Short autour du bleu (430 nm). Les b atonnets sont au contraire plus dens ement localis es sur une couronne centr ee a ` 20 de la fov ea environ. Leur densit e est nulle a ` la fov ea mais demeure tr` es forte encore a ` plus de 60 de celle-ci. Ils sont tr` es nombreux (de 80 a ` 150 millions), dun diam` etre moyen de 3 microns. Ils ont une tr` es bonne r eponse temporelle (cest en p eriph erie de lil que passent les e toiles lantes), une tr` es bonne sensibilit e (ils assurent la vision nocturne scotopique). Ils ont tous la m eme r eponse spectrale (` a peu pr` es ind ependante de la longueur donde) ( la nuit tous les chats sont gris. ).
15
Sachant que limage est un des supports physiques les plus privil egi es pour transmettre un message a ` notre cerveau, interrogeons-nous donc sur la mani` ere dont ce message est transmis, d ecod e et synth etis e par le syst` eme nerveux. Cest une question extr emement complexe qui nest encore que tr` es partiellement e lucid ee et quon va essayer de d ebroussailler grossi` erement. Les divers types dapproche du ph enom` ene de vision sont compar es dans [Gordon, 1998]. Il nest pas question de faire ici un large tour dhorizon de l etat de nos connaissances sur le comportement du syst` eme visuel face a ` linformation contenue dans les images. Tout au plus allons-nous essayer de donner une vague vue synth etique qui n evitera naturellement pas l ecueil dune sch ematisation excessive. Le but, en fait, est de sensibiliser le lecteur sur le ph enom` ene de la perception visuelle. Nous esp erons que nous aurons ainsi loccasion de lui procurer quelques sujets de distraction et de r eexion. Il pourra e galement se r ef erer a ` [Gregory, 1966], [Cornsweet, 1973], [Murch, 1973] ou [Carterette et Friedman, 1975]. On peut distinguer dans le traitement de linformation image par notre syst` eme visuel deux proc edures distinctes : une qui correspondrait a ` un comportement passif du syst` eme et lautre a ` un comportement actif. Nous allons voir successivement a ` quoi correspondent ces deux aspects, sans cependant insister trop sur le premier qui est un tantinet technique et qui pourrait par l` a para tre un peu trop r ebarbatif.
F IG . 1.2 La perception des diff erentes gradations dune e chelle de gris d epend du niveau lumineux du fond. Illustrons cela par un exemple et demandez-vous comment vous proc ederiez pour fabriquer une e chelle de gris dune dizaine de tons allant du blanc au noir et dont les e carts de luminosit e vous para traient le plus homog` ene possible, dun point de vue perceptif bien s ur. Vous vous apercevriez alors que cet exercice vous demande des processus intellectuels beaucoup plus e labor es que celui de fournir une r eponse a ` la simple question vu ou pas vu ? . Il
16
vous faudra entre autres d enir un crit` ere de jugement qui vous permettra apr` es entra nement de mieux s electionner vos gris. Cel` a souligne laspect plus subjectif de telles exp eriences de perception compar ees a ` celles permettant de mesurer les seuils de d etection. La gure 1.2 montre limportance des conditions selon lesquelles on op` ere et quil est n ecessaire de bien contr oler : en changeant la luminosit e du fond on modie s erieusement la sensation que procure une e chelle de gris d etermin ee. Le comportement passif du syst` eme visuel sexplique globalement par le fait que cest essentiellement un syst` eme biophysique. Ses propri et es d ecoulent des caract eristiques de sa structure, a ` commencer par lil et la r etine, pour nir avec limmense complexit e de ses connexions nerveuses (cf. section 1.1.2). Ce comportement peut donner lieu a ` quelques ph enom` enes particuli` erement d emonstratifs comme ceux des gures 1.2 a ` 1.5, d us aux interactions spatiales entre les r egions de limage ayant des luminosit es diff erentes. Ces exemples indiquent a ` quel point linformation image une fois prise en charge par le syst` eme visuel peut e tre rapidement transform ee et d eform ee. indexcontraste simultan e
F IG . 1.3 Ph enom` enes dus aux interactions spatiales dans limage. En haut a ` gauche une bande de Mach (cest a ` dire un renforcement local du contraste) appara t a ` la n dune variation spatiale continue de la luminance et est plus claire que le fond blanc sur lequel elle se situe. En haut a ` droite, le contraste simultan e est un exemple classique de linteraction de la couleur dun fond sur celle dun m edaillon : les neufs petits carr es ont le m eme niveau de gris. En bas, le centre des croisements de la grille blanche dHermann para t plus sombre except e celui que lon xe du regard : la partie centrale de la r etine ne traite pas limage de la m eme mani` ere que sa partie p eriph erique. A la gure 1.2 les plages dans l echelle de gris ne sont pas perc ues comme uniformes alors quelles le sont physiquement.Les trois ph enom` enes de la gure 1.3, trouvent leur origine aux niveaux des interconnexions nerveuses des cellules r etiniennes qui effectuent un v eritable ltrage lin eaire. Mais d` es quintervient un contour, des ph enom` enes non lin eaires (gure 1.4) peuvent se produire. Les contours dans certains cas peuvent procurer des
17
` gauche, la seule adjonction dun contour au F IG . 1.4 Ph enom` enes dus aux interactions spatiales dans limage. A ` droite, dans milieu de la barre grise au motif du haut permet dobtenir un net contraste simultan e (motif du bas). A lillusion de Titchener les deux cercles centraux sont de taille e gale.
F IG . 1.5 Ph enom` enes dus aux interactions spatiales dans limage. Les contours vrais ou faux (` a gauche) jouent par leur orientation un r ole primordial dans certains effets : les diagonales dans lillusion de Z ollner (au centre) sont parall` eles et la spirale de Snearl (` a droite) nest form ee... que de cercles concentriques. r esultats assez spectaculaires sur la gure 1.5. Leur explication nest pas aussi claire que dans le cas de la gure 1.3 a ` gauche, mais se situerait cependant au niveau de la structure neurophysiologique des voies visuelles o` u des cellules extr emement sp ecialis ees dans le traitement des contours ont e t e d ecouvertes. Mais il existe des illusions notamment sur la dimension des formes (gure 1.4 a ` droite), pour lesquelles on nest plus en mesure de donner une explication dordre neurophysiologique. Elles correspondraient a ` des processus mentaux beaucoup plus complexes. Le syst` eme visuel ne jouerait d ej` a plus dans ce cas un r ole aussi passif.
18
F IG . 1.6 Dans cet e chiquier, les deux carr es marqu es A et B ont le m eme niveau de gris. Plusieurs ph enom` enes se conjuguent pour renforcer cette illusion. certains rel` event de processus de contraste simultan e, dautres de ph enom` enes dinterpr etation de la sc` ene. c E. H. Adelson.
F IG . 1.7 La perception des formes est modi ee selon le contexte spatial o` u elle est situ ee.
un damier r egulier. Ces indications peuvent aussi agir sur des m ecanismes mentaux particuliers comme celui de la constance de la taille et provoquer de fortes illusions g eom etriques comme la gure 1.9. On y v erie pourtant que les trois motifs sont absolument identiques et que par cons equent les images r etiniennes quils forment ont la m eme taille. Ces exemples soulignent le caract` ere actif avec lequel le cerveau reconstruit linformation image mais nindiquent pas la mani` ere avec laquelle il proc` ede pour y parvenir. Comment faisons-nous pour reconna tre les formes, analyser les sc` enes ? Actuellement ces questions nont pas encore trouv e de r eponses satisfaisantes. Quelques approches par le biais de la th eorie de linformation ont e t e tent ees, mais semblent e tre rest ees jusquici st eriles. En fait une constatation toute simple permet de montrer combien il est difcile dattaquer le probl` eme de cette mani` ere. La photographie 1.10 a ` gauche nest rien dautre que le positif de la photo de lauteur, dont la gure de droite est le n egatif. Or, il est extr emement difcile de reconna tre une personne sur un n egatif sans un entra nement pr ealable. Et cependant la quantit e dinformation contenue dans un positif ou un n egatif est
19
F IG . 1.9 Illusion g eom etrique sur la taille provoqu ee par la perspective. la m eme. Lapproche adopt ee par les gestaltistes ([Wertheimer, 1944] ou [Gordon, 1998] chapitre 3), tr` es diff erente, a donn e de meilleurs r esultats. Pour eux, la perception des signes, des objets ne sexpliquerait pas par un processus de concat enation ou de sommation en s erie de leurs diff erentes parties. lis seraient perc us comme un tout. Regardez les 3 segments de la gure 1.11. Lorsquils nissent par se rapprocher sufsamment pour se rejoindre, ils forment une gure triangulaire que lon perc oit en soi plut ot que comme le r esultat de ce rapprochement. Cette construction suivrait un certain nombre de lois indiqu ees a ` la gure 1.12. Ces lois poussent a ` croire quil existerait une sorte de principe de simplicit e qui dirigerait le cerveau et lui permettrait de limiter au maximum ses efforts pour reconstruire linformation. Cest une id ee un peu na ve, mais prenez par exemple le cas des surfaces subjectives de la gure 1.13. Le triangle blanc a ` droite na pas de contour r eel pourtant on le perc oit tr` es vivement. Il para t m eme e tre plus lumineux que le fond. Or, quy a-t-il dans cette image ? Trois angles et trois disques tronqu es. Ces formes paraissent incompl` etes au cerveau. Il lui suft alors de faire lhypoth` ese suppl ementaire de la pr esence dun triangle blanc recouvrant ces formes pour que limage sorganise plus simplement.
20
F IG . 1.11 Le triangle est perc u comme une unit e graphique en soi. Vous constatez que le cerveau ne se contente pas de percevoir que ce qui existe dans le signal. Il nh esite pas a ` le compl eter si cela larrange, cest-` a-dire si cela lui permet de faire son travail de synth` ese a ` moindre frais. Ce que le cerveau rajoute au signal pour effectuer ces op erations constructives d epend bien s ur de limage mais aussi de la m emoire. Plus la m emoire pourra apporter d el ements signicatifs pour comprendre limage regard ee et moins vous aurez besoin de signal pour percevoir linformation. Cest vrai pour la lecture. Lorsque vous appreniez a ` lire vous e tiez oblig e de d etailler chaque caract` ere. Maintenant ceux-ci d elent a ` toute vitesse devant vos yeux. Il est des cas o` u le cerveau peut construire pour une image donn ee plusieurs solutions distinctes. Ces solutions sexcluent mutuellement car on ne perc oit que lune des deux et le passage de lune a ` lautre demande un important effort intellectuel. La gure 1.14 est un exemple c el` ebre de ces gures ambigu es. Certains reconna tront une vieille femme et dautres une jeune femme fort e l egante. Pourquoi ? Il est difcile de r epondre. Peut- etre les amoureux verront plus facilement la jeune femme alors que les maris tourment es par leur belle-m` ere verront plut ot la plus a g ee. De nombreux facteurs psychologiques interviennent et la m emoire joue encore ici un r ole pr epond erant surtout si on la stimule s electivement, par exemple en vous racontant au pr ealable des histoires de vieilles rombi` eres ou au contraire des histoires de belles romantiques. Inversement avec les images en fausse perspective de la gure 1.15 a ` gauche, le cerveau ne parvient pas a ` ` la photo 1.15, a construire de solution coh erente ce qui provoque m eme une certaine g ene mentale. A ` droite, cette g ene diminue et m eme dispara t. Car il faut r e echir pour sapercevoir que les escaliers de cette maison sont dun genre sp ecial. Cest le caract` ere r ealiste de la photographie avec ses multitudes de petits d etails qui permet au cerveau de saffranchir de cette construction impossible. Nous terminerons en signalant que le r ole actif du syst` eme visuel se manifeste aussi au niveau de lanalyse physique de limage, cest-` a-dire dans la mani` ere avec laquelle vous la regardez. Peut- etre nen avez-vous pas vraiment conscience, mais vos yeux bougent beaucoup et pas nimporte comment. Yarbus a enregistr e leurs mouvements [Kolers, 1972]. La gure 1.16 en haut montre comment dans une premi` ere e tape laxe visuel du regard balaye limage en suivant tr` es approximativement les contours principaux. Puis dans une deuxi` eme phase, le regard se stabilise sur des points particuliers o` u linformation est tr` es importante comme les yeux et la bouche dun visage ou tout autre d etail inhabituel. Mais ce qui est particuli` erement int eressant cest de savoir que ce type de lecture varie e norm ement suivant les pr eoccupations de lobservateur. Sur la gure 1.16 en bas ont e t e enregistr ees diff erentes lectures de la photographie gurant en haut a ` gauche et faites par un m eme individu. On a simplement pos ea ` ce dernier une question pr ecise correspondant a ` la sc` ene repr esent ee par cette photographie en lui demandant dy r epondre apr` es quelques secondes dobservation. On peut remarquer alors quil va chercher linformation l` a o` u elle est la plus signicative pour r esoudre son probl` eme. Enn, que tout cela ne vous tourmente pas. Dans deux minutes vous aurez compl` etement oubli e que votre syst` eme visuel joue un r ole passif ou actif et vous continuerez a ` regarder autour de vous comme si de rien n etait.
21
F IG . 1.12 Lois de la perception (dapr` es les gestaltistes). En haut a ` gauche - lois de similitude : on regroupe les zones ayant des caract eristiques similaires. En haut a ` droite - loi de continuit e : au lieu de percevoir 3 formes c ote a ` c ote, on pr ef` ere voir une ligne courbe et une ligne rectangulaire superpos ee. Au centre - loi de proximit e : on perc oit plut ot 5 triplets de 3 points que 3 lignes de 5 points. En bas a ` gauche - loi de fermeture : on perc oit deux formes ferm ees se touchant en un point plut ot que deux courbes quelconques se croisant. En bas a ` droite - le fait quon perc oive deux trames de carr es imbriqu ees, plut ot que la simple juxtaposition de l el ement indiqu e en noir est une cons equence de ces lois.
F IG . 1.13 Deux triangles subjectifs qui nont pas de contours (dapr` es G. Kanizsa, Scientic American, avril 76).
22
F IG . 1.14
F IG . 1.15 Quelques constructions impossibles (` a gauche), ... qui nont pas arr et e cet architecte (photographie A.P. Lamoth), a ` droite.
23
F IG . 1.16 Chemin que suit laxe du regard (dapr` es Yarbus et Kolers [Kolers, 1972]) : en haut, lorsquon observe une image ; en bas lorsquon demande a ` lobservateur de se souvenir de diverses choses concernant limage.
24
Chapitre 2
2.1 Introduction
tudier des propri 2.1.1 Pourquoi e et es statistiques
Lanalyse des propri et es statistiques des images est dict ee par le souci dadapter des traitements ult erieurs comme le ltrage, la restauration, le codage ou la reconnaissance des formes au signal dimage. Les techniques de base mises en uvre pour supprimer un bruit ou pour rehausser un signal affaibli reposent toutes sur des hypoth` eses sur ce quest le signal et ce quest le bruit, cest-` a-dire sur des mod elisations du signal et du bruit. Les techniques statistiques, reprises par les m ethodes de traitement de signal, font ainsi abondamment lhypoth` ese que les signaux sont gaussiens ou uniform ement r epartis dans un intervalle par exemple et les bruits blancs, cest-` a-dire a ` corr elation microscopique. De ces mod` eles, on peut d eduire par des encha nements rigoureux loptimalit e dun ltre ou lestimation de ses performances, en moyenne ou dans le pire des cas. La validit e ou la qualit e du ltre du codeur ou du d etecteur d ependra en pratique de lad equation des hypoth` eses qui sont a ` la base de son calcul et des propri et es pr esent ees par le signal r eellement trait e. On a donc tr` es t ot mesur e les propri et es statistiques des images, et essay e den d eduire des mod` eles permettant dexpliquer les images. Ces mod elisations statistiques ont cependant tr` es peu d echo dans notre vie quotidienne car elles ont beaucoup moins dutilisation que des descriptions structurelles ou syntaxiques qui donnent de chaque image une repr esentation a ` base de langage naturel et de g eom etrie, comme par exemple : une femme au sourire e es sur la poitrine devant un paysage de montagne. nigmatique, les bras crois Dans lobjectif dun traitement automatique par ordinateur, la repr esentation statistique est cependant tr` es utile, car elle nourrit imm ediatement des algorithmes plus ou moins e labor es manipulant les pixels, composants e l ementaires de limage. Luniversalit e de codeurs comme JPEG ou MPEG, qui reposent beaucoup sur ce type de propri et es, atteste de lint er et technique de ces e tudes. Notre d emarche sera la suivante : dans un premier temps nous passerons en revue les mesures statistiques les plus simples, celles qui sont obtenues par balayage mono-dimensionnel de limage. Nous en d eduirons un mod` ele, assez universellement utilis e. Nous en montrerons les limites. Nous pr esenterons quelques propri et es bidimensionnelles mal couvertes par ce mod` ele. Nous sugg ererons des am eliorations du mod` ele de base.
25
26
Op era
Vlsi quelconques .
Notre propos est aussi de cerner les propri et es des images en g en eral, les images usuellement rencontr ees. Mais ces termes m eme d enissent mal notre objet, car il ny a pas de normalit e en image. Ils excluent cependant clairement des images trop simples : le carr e blanc sur un fond blanc des peintres, l echiquier ou la grille, ainsi que esentant des motifs tr` es particuliers (rosaces, mosa ques, etc. Nous pr eciserons les images pathologiques repr lorsque ce sera n ecessaire ce qui peut e tre normal ou anormal en traitement dimage. Retenons cependant que des images normales forment lessentiel des sc` enes en vid eo, des images satellitaires, des images m edicales, des images de robotique ou de microscopie.
2.2 Lamplitude
2.2.1 Propri et es
Nous repr , soit discr` ete des deux variables esenterons limage par une fonction soit continue despace et ou et .Nous utiliserons e galement fr e quemment la restriction monodimensionnelle obtenue par balayage ligne a ` ligne que nous e crirons lorsquaucune ambigu t e ne sera a ` craindre. Nous limiterons parfois les variables et a ` et ! pour rendre compte de la dimension nie des images. Mais nous prendrons
2.2. LAMPLITUDE
27
F IG . 2.2 Les histogrammes des 3 images de la gure 2.1 alors et ! tr` es grands. Les propri et es les plus simples auxquelles on sint eresse tout dabord sont li ees a ` lamplitude de limage. Dans la plupart des cas, les images sont repr esent ees sur 8 bits, parfois sur 10, 12 pour des images de tr` es bonne qualit e ou, exceptionnellement, 16. La premi` ere description dint er et est lhistogramme de lamplitude qui exprime la fr equence dapparition des divers niveaux. Les images e tant constitu ees de tr` es nombreux e chantillons (entre 100 000 et plusieurs millions), on invoque souvent le th eor` eme central limite pour justier lhypoth` ese que lamplitude de limage serait gaussienne. Cela nest g en eralement pas vrai. Les exemples de la gure 2.2 pr esentent des histogrammes typiques des trois images de la gure 2.1. Ils sont quelconques et toute autre allure serait e galement possible : lhistogramme dune image nest pas plus gaussien quuniforme.
28
F IG . 2.3 Histogrammes dune m eme image obtenus pour des pr esentations sur des papiers de natures diff erentes : a ` gauche, duret e du papier, a ` droite, aspect du papier (dapr` es [Estournet, 1969]). mera en et tels que . Un tel programme est ais ea ` concevoir. Appliqu ea ` des images il donne les r esultats de la gure 2.4 , o` u les histogrammes darriv ee sont respectivement une loi uniforme, une somme de 2 gaussiennes et une sinuso de. Nous percevons bien s ur des diff erences dans les images ainsi cr ee es, mais les images demeurent parfaitement reconnaissables et leur interpr etation nen est pas affect ee. Cette exp erience nous conrme le r ole tr` es superciel de lhistogramme dont lallure nest li ee que de tr` es loin aux e l ements signicatifs de limage. Est ce que ces conclusions sont toujours valables ? Non bien s ur, puisque des images tr` es particuli` eres peuvent avoir des histogrammes tr` es sp eciques : un e chiquier sera compos e de deux pics et un texte noir sur blanc de deux modes nettement s epar es. Si nous prenons un champ de vagues tr` es r egulier, ou un mur cr epi, il est possible e galement que lon obtienne des histogrammes gaussiens. Dans le cas des images obtenues avec des illuminations coh erentes, on peut mener th eoriquement le calcul de la loi de probabilit e de lamplitude r e echie par une surface uniforme rugueuse (hypoth` ese dite de speckle pleinement d evelopp e [Goodman, 1976]). On montre alors quon obtient, pour probabilit e du module de lamplitude complexe, une loi de Rayleigh :
(2.1)
On v erie sur limage 2.5 que lhistogramme suit pr ecis ement ce mod` ele.
"!
(2.2)
29
F IG . 2.4 Modication dhistogramme. En haut a ` gauche : image originale, en haut a ` droite somme de 2 gaussiennes, en bas a ` gauche sinuso de, en bas a ` droite r epartition uniforme.
Certaines images a ` transitions douces se caract erisent par une faible valeur de , dautres par une forte. Ce domaine de variation de est typiquement de 3 a ` 15. Il est clair que des contre-exemples peuvent e tre ais ement trouv es dimages dont lhistogramme na pas les propri et es ci-dessus. Un d egrad e r egulier du blanc au noir pr esenterait un histogramme non sym etrique avec des valeurs uniform ement r eparties dans le demi-espace gauche. Un e chiquier ne pr esenterait que trois types de transitions, des transitions nulles, des positives a ` +255 et des n egatives a ` -255. Ces exemples nentrent bien s ur pas dans nos hypoth` eses dimages normales.
30
F IG . 2.5 Agrandissement dune image de radar a ` vision lat erale (radar ERS-1) sur une r egion agricole de lUkraine ( c Cnes) montrant limportance du bruit de coh erence, et histogramme de la sc` ene compl` ete, tr` es proche dune loi de Rayleigh.
F IG . 2.6 Une image des gradients horizontaux dun extrait de limage Fillettes toute limage pour lafchage) et 4 histogrammes de sauts de 4 images diff erentes.
part elle permet un acc` es commode au domaine de Fourier par linterm ediaire du th eor` eme de Wiener-Khinchine 1. La fonction dautocorr elation dune fonction discr` ete est d enie par :
(2.3)
o` u le symbole exprime lesp erance math ematique de la variable al eatoire . La fonction dautocorr elation se calcule usuellement par :
Les images sont des signaux r eels ( ). Ce sont des signaux positifs dont on retire la valeur moyenne # pour calculer la fonction dautocorr elation centr ee :
1 Le th eor` eme de Wiener-Khinchine e tablit que la fonction dautocorr elation est transform ee de Fourier (TF) du spectre de densit e de puissance [Blanc-Lapierre et Picinbono, 1981].
(2.4)
31
#
(2.5)
et on calcule une fonction dautocorr elation ee centr ee en rapportant cette fonction a ` son maximum norm (qui est e galement la variance de ) :
'
" # #
(2.6)
#
(2.7)
Cette fonction dispose de nombreuses propri et es int eressantes : elle a un maximum a ` lorigine ( e gal a ` 1) ; elle est born ee a ` lintervalle ; ) ; elle est paire ( si elle poss` ede un autre maximum e gal a ` 1 en un autre point , alors elle ede une innit e de maxima aux poss` positions , et elle est p eriodique de p eriode , ainsi que la fonction elle-m eme ; il existe des relations simples eriv ees de la fonction dautocorr elation et les fonctions dauto entre les d corr elation des d eriv ees de . On pr esente sur la gure 2.7 la fonction dautocorr elation dune image, pour des d ecalages de 1 a ` 27 points. On note un maximum marqu ea ` lorigine (souvent accompagn e dune discontinuit e de la d eriv ee), suivi dune d ecroissance rapide et r eguli` ere. Si lon observe la d ecroissance de sur un plus long domaine, on constate que ses amplitudes deviennent tr` es faibles, exprimant une faible corr elation des pixels de limage tr` es e loign es les uns des autres.
F IG . 2.7 A gauche sont superpos ees les valeurs mesur ees dune fonction dautocorr elation (sur limage a ` la loi exponentielle th eorique la plus proche, a ` droite 5 fonctions de corr elation dimages diff erentes.
Lena )
Ce comportement tr` es g en eral a permis de mod eliser la fonction dautocorr elation norm ee centr ee par une fonction exponentielle :
Le param` etre est le second param` etre caract eristique de limage, on voit sur la gure 2.7 que les images a ` variation lente ont une corr elation tr` es e tal ee (et donc un tr` es faible ). Au contraire, les images a ` variations tr` es rapides ont une autocorr elation pointue et un grand. Le domaine de variation de est typiquement de 0,01 a ` 0,3.
'
(2.8)
32
F IG . 2.8 Les 5 images ayant servis a ` calculer les corr elations de la gure 2.7 : Nice, Fruits, Tifany, Lena et Singe. Les contre-exemples de fonctions dont lauto-corr elation nest pas exponentielle sont ais es a ` trouver, en particulier, parmi les fonctions p eriodiques. Si les fonctions purement p eriodiques sont rares dans les images naturelles, les images pr esentant un motif qui se r ep` ete abondent (grilles, murs, vignes, tissus, etc.). Dautres ont des motifs moyens (foule dans des gradins, fac ades dimmeubles dans une rue, etc.). Ces images auront une autocorr elation compos ee de deux motifs multipli es : lun p eriodique, lautre exponentiellement d ecroissant exprimant la perte du motif avec la distance (cf. gure 2.9).
F IG . 2.9 Allure de lautocorr elation dune image avec un fort contenu p eriodique : th eorique a ` gauche et mesur ee (sur Fillettes), a ` droite.
2.4.2 En multi-dimensions
Si lon consid` ere maintenant non plus le signal le long dune ligne de limage, mais selon une direction quelconque, on retrouve un comportement semblable de la fonction dautocorr elation, mais avec peut- etre des coefcients diff erents selon les directions. Ainsi, il ne sera pas surprenant de trouver une forte corr elation verticale
33
dans un paysage de sous-bois de sapins alors quelle sera faible horizontalement. On voit sur la gure 2.10 des mesures sur une image r eelle re etant cette vari et e. La fonction dauto-corr elation bidimensionnelle exprime bien les propri et es disotropie de la sc` ene.
F IG . 2.10 Corr elation obtenue dans les directions horizontales (en haut) et verticales (en bas) pour limage Bateaux .
Si lon veut mod eliser ce comportement, on est amen ea ` choisir lun des deux mod` eles bidimensionnels suivants : (2.9) o` u
et , &
Image Bateaux corrlation horizontale
(2.10)
corrlation verticale
F IG . 2.11 Courbes disocorr elation pour le mod` ele non-s eparable (` a gauche) et pour le mod` ele s eparable (au centre) et courbes disocorr elation mesur ee sur limage Bateaux (le quart inf erieur du plan est repr esent e).
Cette deuxi` eme forme est moins satisfaisante pour la continuit e de la fonction dautocorr elation, mais elle est cependant tr` es souvent retenue car sa forme s eparable la rend tr` es commode demploi (s eparation en deux procesus ind ependants en ligne et en colonne), particuli` erement dans le plan de Fourier (cf. gure 2.11).
(2.11) (2.12)
34
et
)
On voit sur cette fonction (distribution de Lorentz, gure 2.12) des propri et es bien connues des opticiens : l energie est maximale a ` lorigine ( ), cest-` a-dire, en th eorie de la diffraction [Franc on, 1970], sur laxe optique, elle va en diminuant r eguli` erement vers les hautes fr equences spatiales (positives ou n egatives), dautant plus vite que la corr elation est plus forte ( faible) [Nicolas, 1995].
2.5 Entropie
Suivant les id ees de Shannon, lentropie est une mesure statistique du contenu dinformation dun message. Elle est donc adapt ee a ` caract eriser les images, chacune dentre-elles e tant prise comme un message sp ecique. 2 Lid ee dentropie sappuie, bien s ur, sur lanalogie de la physique : thermodynamique de Clausius ou statistique de Boltzman et attribue a ` des congurations particuli` erement improbables un plus grand contenu dinformation quaux congurations tr` es fr equentes.
Suivant lid ee pr ec edente, Hartley en 1925 attribue a ` un symbole e mis par une source stationnaire avec une probabilit e , la quantit e dinformation : (2.13)
exprim e en bit par symbole si le logarithme est a ` base 2. Shannon [Shannon, 1948] d enit alors linformation moyenne par symbole ou entropie par :
(2.14)
Consid erant une image comme une source stationnaire de pixels, lentropie se mesure donc a ` partir du seul histogramme de lamplitude. Utilisant les propri et es de la fonction log , on montre que lentropie est maximale pour une r epartition uni . Pour les images, cela conduit le plus souvent a forme de probabilit e ` une entropie inf erieure a `
2 cest une des approches possibles de la d enition de linformation. Une autre approche repose sur la th eorie de la complexit e [Delahaye, 1994] et mesure linformation apport ee par un message par la longueur du plus petit programme capable de d ecrire cette information. Cest lapproche de Kolmogorov [Kolmogorov, 1965], elle est compl et ee par la notion de profondeur logique de Benett qui distingue les s equences complexes mais calculables, de celles complexes mais al eatoires, au moyen du nombre de pas e l ementaires accomplis par le programme pour retrouver linformation. Le lecteur curieux trouvera dans [Ma tre, 1996] une application de ces principes aux images.
2.5. ENTROPIE
35
8 bits [Gallager, 1966] Les chiffres ordinairement rencontr es vont de 4 a ` 7,5 bits pour des images normalement contrast ees, utilisant lessentiel de la dynamique des niveaux de gris. Leffet dune quantication uniforme de limage (r eduction des niveaux de gris) conduit a ` une r eduction r eguli` ere de lentropie avec une pente presqu egale a ` (cf. gure 2.13).
F IG . 2.13 D ecroissance de lentropie pour 3 images en fonction de la quantication des niveaux de gris.
! % !
Cette entropie a le mauvais go ut d etre n egative pour de tr` es faibles valeurs de , mais il faut alors prendre en compte laspect discret des niveaux de quantication de limage et remplacer le r esultat obtenu en continu ci-dessus par sa forme discr` ete.
!
(2.15)
lune des e galit es e tant v eri ee si les pixels sont ind ependants, lautre si leur d ependance est lin eaire. Cette extension se reconduit naturellement pour des sources dordre , cest-` a-dire compos ees de symboles ind ependants constitu es de pixels, a ` partir de la connaissance des probabilit e s jointes de ces pixels. Notons cependant que cette probabilit ee tant un tableau de dimension , (o` u est le nombre de niveaux de gris dans limage), elle devient de plus en plus difcile a ` calculer.
36
et
:
(2.16)
` , comme linformation moyenne, pour mais on peut aussi d enir lentropie conditionnelle de par rapport a toutes les valeurs de , de linformation conditionnelle apport ee par sachant :
Linformation apport ee par
sur
(2.17)
Le codage pr edictif en vigueur dans les ann ees 80 (codage MICD : Modulation par Impulsions Cod ees Diff erentielle ou DPCM [Guillois, 1996b, Barlaud et Labit, 2002]) sest beaucoup appuy e sur la recherche des meilleures con gurations de pixels permettant de minimiser lentropie conditionnelle du :
37
a ` 8 bits par pixel. Comment explique-t-on ce gain en information moyenne ? O` u est pratiquement localis ee cette information ? Que peut en faire lutilisateur ? Pour r epondre a ` ces questions, il faut bien s ur analyser en d etail les sch emas de transformation, et en en imaginant dastucieux, il est possible de se convaincre que lon peut effectivement ajouter une information utile, par exemple en donnant une image moins bruit ee (ou au contraire plus contrast ee), ou en incorporant quelque bit de parit e ou autre marqueur permettant dassurer des v erications sur lint egrit e de la transmission, lidentit e de lauteur ou autre.
La probabilit e conditionnelle se repr esente, dans le langage des cha nes de Markov, par une matrice de taille , o` u repr esente le nombre de niveaux de gris. Cela permet d ecrire :
!# %
!
!
gale a ` 1 pour une ligne donn ee), mais non bi-stochastique. ! est une matrice stochastique (somme des colonnes e Ce mod` ele tr` es simple est tr` es utile pour d eterminer de nombreuses propri et es des images. Il a permis en particulier de nombreux travaux sur le codage pr edictif (MICD ou DPCM) [Guillois, 1996b, Barlaud et Labit, 2002].
cela ne tendra vers une limite ind ependante du premier point de la ligne que si ! est une matrice dont la seule valeur propre de module 1 est 1, cest-` a-dire si ! est r eguli` ere (toutes les colonnes de ! sont e gales) ; en labsence de stationnarit e , on a affaire a ` un processus de diffusion (de Wiener-Levy), et lon montre que ee a ` celle du point 0 par : la variance du point est li
!
et sa fonction dautocorr elation d epend du point o` u elle est calcul ee [Fleuret, 1977]. Tout cela montre que lon ne peut pousser trop loin ce mod` ele gaussien markovien. Il rend n eanmoins bien compte de quelques propri et es tr` es g en erales et demeure a ` ce titre souvent utilis e.
38
2.7.1 La stationnarit e
Nous navons pas port e attention jusquici a ` lhypoth` ese de stationnarit e qui est pourtant sous-jacente a ` toutes les estimations que nous avons faites jusqu` a pr esent, quil sagisse damplitude, de saut ou de corr elation. Quexprimet-elle ? Que les estimations que nous faisons sont ind ependantes du point de limage o` u elles sont faites, cest-` a-dire que les symboles expriment des estimations repr esentatives de limage globalement et non dun champ particulier de celle-ci. Cela e carte de nos mod` eles des images qui s eloignent trop clairement de cette hypoth` ese : par exemple un paysage dont la partie haute (le ciel) est tr` es clair et uniforme tandis que le sol est sombre et riche en d etails. Dans ce cas, ni les propri et es du premier ordre (moyenne, variance, entropie), ni les propri et es dordre sup erieur comme la corr elation ne peuvent s evaluer globalement pour limage enti` ere. Ecartera-t-on ainsi toutes les images ou existe-t-il des documents qui v erient cette hypoth` ese de stationnarit e ? Cest une question d elicate a ` laquelle nous pouvons r epondre par deux voies : par une approche th eorique si lon conna t la source dimage, son contenu et les raisons de ses variations ; par une approche exp erimentale o` u lon confronte a ` limage originale une version modi ee de celle-ci faite en sorte quelle v erie lhypoth` ese de stationnarit e. La premi` ere approche permet dimaginer des congurations particuli` eres, homog` enes, par exemple un champ de houle, un tissu biologique, ou un portion de ciel, certaines images satellitaires . . .Mais pour les sc` enes ordinaires, il appara t e videmment que les images sont compos ees dobjets ind ependants : (une table, un meuble, un arbre) dont les propri et es sont ind ependantes et possiblement tr` es diff erentes. La seconde exp erience montre quil est pratiquement tr` es difcile de concevoir des images ordinaires qui soient stationnaires.
2.7.2 La causalit e
Elle est sous-jacente a ` la plupart des signaux temporels, mais perd son sens pour les images pour lesquelles il nexiste pas d ecoulement irr eversible du temps, a ` moins quelles naient e t e balay ees comme par exemple en t el evision. La causalit e est lune des propri et es fortes des processus markoviens qui na pas de signication pour limage. Recr eer une causalit e en 2D impose aussi des arbitraires et lon d enit ainsi des pass es qui peuvent e tre quart de plan, ou demi-plan, selon les besoins (cf. gure 2.14). Ces r eexions sont a ` la base des travaux conduits sur les ltres de Kalman bidimensionnels [Wood, 1981].
2.7.3 La monodimensionnalit e
La structure bidimensionnelle de limage rend sa mod elisation plus complexe. Les sch emas a ` 1D se combinent difcilement a ` 2D sans perdre certaines de leurs propri et es, ainsi en est-il des cha nes de Markov. Lextension peut prendre plusieurs formes : une formulation selon 2 e quations coupl ees en lignes et en colonnes, ou une formulation directement planaire.
39
F IG . 2.14 Pr ediction dun point par pass e quart de plan , a ` gauche, et pass e demi-plan , a ` droite. Les zones gris ees constituent le pass e du point au centre du rep` ere, au sens de la causalit e markovienne.
o` u est la partie al eatoire du processus (typiquement gaussien), limage nale e tant donn ee par :
et Attasi [Attasi, 1975] :
Dautres mod` eles peuvent e tre trouv es dans les r ef erences [Huang, 1976] et [Huang, 1981].
# # #
40
o` u # d enote la longueur moyenne de la longueur de plage, valeur sp ecique dune image donn ee. Cette propri et ea souvent e t e utilis ee dans des sch emas de codage ou de d etection, elle est cependant tr` es difcile a ` inclure dans des mod` eles et aucun mod` ele aujourdhui disponible nest capable de lint egrer a ` notre connaissance. La prise en compte des d ependances non-causales entre pixels a abouti a ` labandon presque g en eral de la piste des cha nes de Markov au prot des champs de Markov (cf. chapitre 7). Dans les champs de Markov, un pixel ne d epend plus simplement des 2 ou 3 pixels qui lont pr ec ed e lors du balayage r egulier de limage, mais dun voisinage qui lentoure et qui fait porter les d ependances de fac on sym etrique entre les points (voisinage de 4 points, ou de 8 points dans la plupart des cas). Linconv enient des champs markoviens est de ne plus se pr eter a ` des techniques de ltrage directes, mais de faire appel a ` des techniques it eratives g en eralement plus co uteuses en temps machine, et plus difciles a ` optimiser. La prise en compte des propri et es de non-stationnarit e des images a incit e les auteurs a ` abandonner lid ee dun mod` ele global au prot dun mod` ele en mosa que, dans lequel limage est constitu ee dune partition de plages, chacune relevant dun mod` ele semblable a ` celui que nous avons evelopp e en 2.6.1, cest-` a-dire chaque plage d suivant une loi de Markov-Gauss d enie par la valeur moyenne # , le param` etre de probabilit e de transition , le param` etre de d ecroissance de la corr elation . Ce mod` ele d enit deux grandeurs qui seront fondamentales pour tout le traitement des images : les contours qui repr esentent les transitions dune plage a ` une autre, et les textures qui d ecrivent les propri et es statistiques de chaque plage. Cest le mod` ele qui sera le plus utilis e pour les op erations de reconnaissance des formes, de ltrage et de d etection. Cest aussi un mod` ele qui est particuli` erement explor e pour les techniques de codage avanc e (MPEG-4 : codage par objets [Barlaud et Labit, 2002]), ainsi que pour la restauration des images pr eservant les contours.
Chapitre 3
41
42
f(x)
F(u)
u x f(x) et g -U G(u) U
p x U 1/p-U 1/p u
. , a` spectre
la fonction e tant le peigne de Dirac de p eriode . La TF se d eduit de par r ep etition de p eriode (cf. gure 3.1) et att enuation de . Comme , sur lintervalle , et co ncident exactement (au facteur pr` es). Pour reconstruire le signal, il est int eressant de distinguer le cas o` u le signal a e t ee chantillonn ea ` la fr equence la plus basse, , appel ee fr equence de Nyquist, du cas o` u lon choisit un nombre plus e lev e d echantillons .
"!
!
"! # # #
43
p x U 1/p u
F IG . 3.2 Echantillonnage a ` la fr equence de Nyquist. Le ltre de reconstruction dun signal continu , cest-` est le ltre canonique a-dire la fonction porte.
(3.1)
La reconstruction de
ou de fac on e quivalente :
La fonction qui v erie les relations 3.1 sappelle la fonction canonique d echantillonnage. Nous en verrons lusage plus loin. Dans le cas monodimensionnel qui nous int eresse ici, nous avons :
et la reconstruction, en dehors des valeurs connues cardinaux pond er es par les valeurs des e chantillons :
Pour les positions des e chantillons , on v erie que les contributions de tous les autres e chantillons sannulent (cela exprime lind ependance des e chantillons a ` la fr equence de Nyquist). On voit donc que les e chantillons pris ` a la distance forment une base pour la reconstruction des signaux dont la bande est limit ee a ` lintervalle .
44
Si lon choisit de prendre plus d echantillons quil nest strictement n ecessaire ( la situation d ecrite sur la gure 3.1, o` u certaines fr equences, comprises entre et d energie. Lors de la reconstruction, tout ltre v eriant :
# (3.2) est satisfaisant pour la reconstruction. Il existera donc de nombreuses formules de reconstruction du type : seront autant de fonctions de reconstruction (cf. gure 3.3). Il ny a donc en general plus independance o` u les
entre les e chantillons, mais au contraire redondance. Ces e chantillons ne forment plus une base mais un syst` eme g en erateur. La redondance peut e tre exploit ee de diverses fac ons, par exemple pour corriger des distorsions, les plus adapt es a ` att enuer leffet dun bruit ou combler des pertes. Elle permet e galement de choisir les ltres nos contraintes. Elle se paie par un signal plus volumineux. Parmi toutes les fonctions de reconstruction possibles, la fonction canonique vue en e q.3.1 se distingue car elle garantit que la reconstruction quelle procure, m eme en pr esence de bruit, sera la plus d` ele au signal original selon un crit` ere d ecart quadratique moyen.
G(u)
1 2 3
u U 1/p-U
F IG . 3.3 Trois ltres possibles pour reconstruire exactement un signal sur echantillonn e (les ltres sont egatifs). Ils diff` erent par leurs valeurs dans lintervalle compris entre et . sym etriques pour les n
!
45
La limite fr equentielle est alors impos ee par le support de , fonction de transfert du syst` eme. Cest donc a ` ce signal que lon appliquera les recommandations issues de la th eorie de Shannon et expos ees dans les lignes pr ec edentes (Section 3.1). Les limites des optiques Pour tous les syst` emes dont loptique est parfaite et limit ee par le seul diam` etre de la pupille dentr ee, et dans le cas dune imagerie incoh erente, loptique introduit un ltrage bidimensionnel, fonction de la seule variable :
#
% % ! !
(3.3)
Cette fonction est connue sous le nom de tache dAiry [P erez, 1991], est la fonction de Bessel dordre 1 et la distance focale de loptique utilis ee. Un tel ltre nest malheureusement pas un ltre passe-bas parfait mais il est g en eralement consid er e comme approximativement nul au-del` a des fr equences .
!
Les capteurs solides Une autre limitation du spectre du signal est introduite lorsquon utilise des d etecteurs solides (matrices ou lignes de photod etecteurs). Ces d etecteurs sont constitu es dun assemblage de d etecteurs e l ementaires plac es dans le plan image du syst` eme optique, chacun e tant charg e de mesurer un e chantillon. L echantillon ainsi mesur e nest donc pas ponctuel mais il r esulte de lint egration de l energie sur la surface du capteur e l ementaire. Le ltrage a pour r eponse impulsionnelle une fonction porte dont, pour des raisons de construction, la largeur est n ecessairement inf erieure au pas d echantillonnage (donn e par la distance entre capteurs). Un tel syst` e me est lui aussi un mauvais ` support large dune part et ne sannule qu` a ltre passe-bas puisque sa fonction de transfert (la fonction ) est a lext erieur de la bande passante compatible avec le pas d echantillonnage dautre part. Lui aussi laissera place a ` du repliement de spectre si lon ne prend pas soin de ltrer optiquement le signal.
Pour de nombreuses applications, le pas d echantillonnage , dont d ecoule le d ebit de l echantillonneur, est la grandeur limitante dun syst` eme dimagerie. Cest par exemple le cas pour certaines applications de t el esurveillance ou de t el ed etection qui utilisent un canal de transmission a ` d ebit r eduit. Dans ces cas, le probl` eme de l echantillonnage est pris a ` lenvers et cest la bande passante de loptique qui est ajust ee pour assurer la relation . On adapte donc la d egradation du signal au taux d echantillonnage que lon peut effectuer. Comment choisir alors si est x e? Une id ee tentante est de de fac on que son spectre eborde pas de ltrer parfaitement le signal original ne d la bande de fr equence . Cela conduit a ` choisir e gale a ` la fonction porte . Cette solution est ais ee si lon dispose de la TF du signal , comme en optique coh erente [Cozannet et al., 1981], ou en radar [Ma tre, 2001]. Il suft alors de supprimer les fr equences au-del` a de . Lorsque lon ne peut acc eder directement au domaine spectral, un tel ltrage passe-bas id eal est difcile a ` r ealiser puisquil n ecessite que lon convole le signal ` support inni. On choisit alors dapprocher eration en convolant par un sinus cardinal, fonction a cette op par une fonction a ` support presque-compact et dont le spectre est proche de la fonction porte. Cette approximation entra ne deux types derreurs (cf. gure 3.4) :
46
F IG . 3.4 erent du passe-bas Les deux types derreurs introduites par le ltrage dun signal par un ltre diff id eal lors de son e chantillonnage. Ils sont pr esent es ici dans lespace de Fourier. A lint erieur de la bande, lerreur est une distorsion des fr equences appel ee ou en traitement dimages, a ` lext erieur de la bande, l energie non annul ee viendra se replier lors de l echantillonnage et cr eera le d efaut de repliement de spectre. 1. tout dabord, a ` lint erieur de la bande passante sur limage. Son e nergie est donn ee par :
2. dautre part, a ` lext erieur, des fr equences ne seront pas annul ees. Lors de l echantillonnage, ces fr equences r epliqu ees dans les ordres parasites viendront sins erer dans la bande conserv ee, introduisant une distorsion du signal appel ee repliement de spectre ou aliasing. L energie concern ee est :
Parmi les fonctions les equemment utilis ees, nous plus fr pouvons citer les suivantes : la fonction porte : qui conduit a ` ; la fonction triangle (convolution de 2 portes) : qui conduit a ` la spline cubique (convolution dune porte et dun triangle) :
; , qui conduit a o` u: ` ! ! la fonction gaussienne qui a pour fonction de transfert la gaussienne de variance
"!
"
Lextension de la th eorie de l echantillonnage a ` des espaces de dimension ( pour limage, $ pour les s equences dimages ou pour les volumes en imagerie sismique et m edicale, pour une s equence de volumes temporels, etc.) est simpli ee par la lin earit e des op erations dans le domaine spectral qui permettent de d ecomposer la d emarche en autant de probl` emes d echantillonnage que de dimensions. Mais il r ev` ele cependant des diff erences notables d` es que et entra ne une complexit e croissante du choix de la base d echantillonnage avec . noterons par % et & les variables vectorielles conjugu ees despace et de fr equence. A une image continue Nous % est associ ee sa transform ee de Fourier & .
#
&
$
%
&
% %
47
p2 1/p 2
u1
1/p 1
F IG . 3.5 Echantillonnage dun signal bidimensionnel selon 2 pas d echantillonnage et (` a gauche). Le spectre de limage est reproduit aux nuds du r eseau r eciproque (` a doite). Le domaine est le domaine o` u nest pas nul ; le domaine est la maille de r ep etition du motif.
` spectre born e sil existe tel que & & . Se donner un e chantillonnage Un signal de dimension est a de lespace, cest choisir un ensemble de vecteurs d echantillonnage formant une base de lespace image. A ces vecteurs est associ e par transform ee de Fourier le r eseau r eciproque de vecteurs de base qui pave lespace des fr equences (cf. gure 3.5). La reconstruction du signal continu se fera exactement si les ordres parasites ne se superposent pas au spectre du signal. On voit quil est simple d echantillonner un signal de dimension de fac on a ` v erier lin egalit e stricte de Shannon. Il suft de choisir tous les pas d echantillonnage de fac on que . Cette condition sufsante pour faire un e chantillonnage parfait nest cependant pas n ecessaire et conduit g en eralement a ` un tr` es fort sur echantillonnage et donc a ` une grande redondance dans les e chantillons ainsi mesur es. On d enit lefcacit e de l echantillonnage par le rapport du volume o` u le spectre nest pas nul, sur le volume e l ementaire de r ep etition du spectre par les :
!
On v erie que l echantillonnage au crit` ere de Nyquist (cf. Section 3.1.2) correspond au cas , sans redondance. Sil est facile dadapter le pas d echantillonnage dun signal monodimensionnel de fac on a ` e liminer la redondance, cest beaucoup plus difcile pour , et tr` es souvent impossible. En effet, on ne pourra assurer que si le 2D, eme g eom etrie que , cest-` a-dire si lon peut paver lespace a ` partir de translat es de . A domaine a la m les seules formes v eriant cette propri et e sont les parall elogrammes ou des hexagones, mais il est exceptionnel de trouver des sc` enes dont le spectre est born e par de telles gures. En cons equence, pour la dimension 2 et les dimensions sup erieures, ont doit g en eralement accepter des e chantillonnages redondants. On peut alors chercher a ` maximiser . Dans le cas g en eral dun spectre quelconque, cette optimisation se fait de fac on empirique. Un cas ere de ). Les e chantillonnages qui tr` es fr equemment rencontr e est celui de spectres isotropes ( est une sph` simposent alors sont b atis sur le maillage hexagonal (cf. gure 3.6) : a ` 2D cest le maillage hexagonal lui-m eme ; a ` 3D cest le maillage hexagonal compact ou le maillage cubique centr e qui conduit a ` des maillages appel es en quinconce en vid eo (quinconce ligne et quinconce trame). Les e chantillonnages b atis sur le maillage carr e sont plus redondants mais leur simplicit e de mise en uvre les a rendus populaires malgr e leur efcacit e m ediocre et leurs faibles propri et es topologiques (cf. Chapitre 4).
48
u2
A13 B11 A22 A11 A21 A31 A41 A33 A42 A51 A43
A13
A23
A33
A44
B31
A12
A22 B13
A32
A42
u1
Z42 Z11
F IG . 3.6 Echantillonnage de signaux tridimensionnels a ` spectre isotrope. Les spectres sont repr esent es par des sph` eres. la vue de gauche repr esente une vue perspective du domaine de Fourier, celle de droite une vue de dessus depuis esent e un e chantillonnage hexagonal dans le plan (sph` eres la direction des positifs. On a repr ) et 2 sch emas diff erents : lhexagonal compact et le cubique centr e . Dans les deux cas, la couche sup e rieure (repr esent ee par les sph` eres ) est plac ee dans les trous de la couche de fac on que chaque sph` ere soit tangente a ` 3 sph` eres . Mais dans le sch ema hexagonal compact (B11 et Z11), la couche inf erieure est a ` e (B13 et Z42) elle occupe les sites inoccup es de la laplomb de la couche tandis que dans le cas cubique centr couche .
La notion de dimension fractale a e t e introduite par Mandelbrot [Mandelbrot, 1977] pour rendre compte du comportement surprenant de certains objets soumis a ` des mesures de plus en plus nes. On saperc oit alors que le r esultat de la mesure (longueur, p erim` etre ou surface) d epend fortement de la pr ecision de linstrument utilis e, et que ce r esultat, invariablement, cro t sans limite apparente pour des pr ecisions de plus en plus grandes. Cette propri et e est bien illustr ee par lexemple dune c ote rocailleuse, tir e de [Richardson, 1961], dont la longueur ne cesse de cro tre, selon quon la mesure sur une carte, sur le terrain en voiture, en v elo, a ` pied, ou avec un double d ecim` etre. Chaque nouvelle m ethode nous permet de contourner des rochers nouveaux, de sintroduire dans des anfractuosit es plus petites, ce qui rallonge dautant lestimation faite auparavant. Mandelbrot a soulign e que ce comportement, qui soppose r esolument a ` toutes les notions de lanalyse math ematique classique (fond ee sur la r egularit e et la continuit e des fonctions, au moins dans des petits domaines), est en fait tr` es commun et peut e tre ais ement e tendu a ` des objets les plus vari es : suspension deau savonneuse et ses innies cascades de particules en e mulsion, e ponges aux formes tortur ees, e tagement de v eg etations dans les sous-bois, ramications sans n des connexions nerveuses, embo tement des crat` eres a ` la surface de la lune, et bien dautres encore. Sur la gure 3.7, nous avons repr esent e certains de ces objets, tels que la nature nous les propose, v eritables casse-t etes pour le traiteur dimage. Une e ponge, ou un poumon, pr esentent, par exemple, une surface continue, mais si d echiquet ee, si perc ee dalv eoles, si ponctu ee de protub erances de toutes tailles quelle appara t nalement remplir tout lespace : tout le poumon nest que surface int erieure vers le syst` eme sanguin, ext erieure vers les bronches et latmosph` ere (cf. gure 3.9). Cette propri et e dune surface de remplir tout un volume nest pas sans rappeler les courbes pathologiques de Peano ou de Von Koch (g. 3.8). Cest cette analogie avec ces courbes c el` ebres que Mandelbrot utilise pour d enir deux qualit es qui seront pour nous pr ecieuses : la dimension fractale et lhomoth etie interne. De la m eme fac on un ph enom` ene, apparemment ponctuel, pourra avoir une dimension plus grande que 0, et une surface dans lespace pourra avoir une dimension sup erieure a ` 2.
49
F IG . 3.7 Evolution de la longueur de quelques fronti` eres et c otes en fonction de la mesure utilis ee pour calculer cette longueur (dapr` es [Richardson, 1961] cit ee dans [Mandelbrot, 1977]) - e chelles logarithmiques.
F IG . 3.8 La courbe de von Koch est un cas d ecole de courbe fractale. Elle se construit a ` partir dun segment de droite qui est divis e en 3 et remplac e par 4 segments de taille 1/3. La dimension fractale vaut alors .
!
aux volumes. Mandelbrot postule quil existe des courbes de dimension interm ediaire entre 1 et 2, des surfaces de dimension sup erieure a ` 2, et que ces objets poss` edent justement la propri et e de navoir pas de longueur ou de surface pr ecise, pas plus quun volume na de surface, ou un carr e de longueur. Cette dimension, interm ediaire entre les valeurs enti` eres, a e t e baptis ee du n eologisme fractale an quaucune confusion ne soit faite entre une surface classique (de dimension ). Lune et lautre passent, par exemple, par tous les points dun plan, mais si lune est une vraie fonction de deux variables, lautre nest que fonction dune seule variable (ensemble totalement ordonn e). Comment mesure-t-on une dimension, classique ou fractale ? Tout dabord, conform ement a ` la d emarche math ematique, il nous faut nous munir dune mesure. Cest une op eration en apparence d elicate, mais en pratique
50
tr` es simple. Elle est discut ee dans [Mandelbrot, 1977], et nous nen reprendrons pas les termes ici. Disons simplement que si nous disposons, par exemple, dune famille de confettis de rayons d ecroissants, alors nous sommes a ` m eme d evaluer aussi bien des longueurs ou des surfaces classiques, que des courbes fractales. Pour cela, ayant confront ea ` un e talon universel la taille du confetti (nous le d enoterons ), il ne nous reste plus qu` a recouvrir la courbe de ces confettis, de fac on quaucun point de la courbe ne soit plus visible. Le produit du nombre de confettis par la taille e l ementaire : est une bonne mesure de la grandeur qui nous int eresse lorsque tend vers 0 : longueur ou par exemple. Mesurons ainsi un segment de droite ou une courbe classique. surface par 10, est multipli e par 10 et la longueur totale est constante. Cette variation, lin eaire, de Si lon divise et est caract eristique des dimensions 1. Si lon mesure laire dun carr e, chaque fois que est divis e par 10, il faut 100 fois plus de confettis pour recouvrir la surface. La d ependance quadratique indique une dimension 2. R ep et ee sur une courbe fractale, erience mettra en e vidence une dimension interm ediaire entre 1 et 2 : lexp par exemple, pour la courbe de Von Koch de la gure 3.8, ou bien 1,25 pour la courbe de lAngleterre conform ement a ` la gure 3.7. Ainsi, la dimension fractale est d etermin ee par le graphe de . Si ce graphe est lin eaire la dimension est donn ee par : (3.4)
!
'
(3.5)
(3.6)
Par exemple, un segment de ` segments fois plus petits mis bout a ` bout, un carr droite est identique a e est semblable a ` carr es de c ot e fois plus petit judicieusement assembl es, et il faut segments de taille fois plus petite pour reconstruire un ocon de von Koch.
51
Tout dabord, lexistence de formes fractales conforte notre opinion que lapproche de Nyquist-Shannon est parfois impuissante a ` rendre compte de la structure dun objet, par le simple fait quil ny a pas de fr equence quelle r limite qui le caract erise de fac on certaine. A esolution faudra-t-il en effet analyser une coupe de poumon pour e valuer la surface des e changes doxyg` ene ? Les seules r eponses rigoureuses seraient, l` a-encore, des majorants bien incompatibles avec nos moyens de traitement : par exemple les plus grosses structures mol eculaires, ou bien les plus nes structures cellulaires. Cest pourquoi, dans de nombreuses e tudes (en biologie, m etallurgie, ou m eme t el ed etection des ressources terrestres), des travaux identiques, men es sur des e chantillonnages diff erents conduisent a ` des r esultats discordants. Le d epouillement automatique des donn ees entra ne souvent une conance trop grande dans les r esultats pour quune remise en question des hypoth` eses fondamentales soit consentie. En second point, lorsquelle est clairement perc ue, la notion de forme fractale permet de r ealiser une e conomie de temps danalyse et de traitement. Pour cela, il nous faut conna tre dune part la dimension fractale de lobjet, dautre part lexistence et la limite de son homoth etie interne. Cette derni` ere connaissance est un des points-clefs de lanalyse et sa connaissance nous est habituellement enseign ee par le sp ecialiste : biologiste, m etallurgiste, etc. On sait que larchitecture intime de lunivers est h et erog` ene : les constructions nucl eaires pr ec` edent les structures atomiques, qui elles-m emes engendrent les e dices mol eculaires, et ainsi de suite. Clairement, de cette architecture d ecoulent les discontinuit es dans les diverses structures, et donc dans les dimensions fractales. La limite dhomoth etie est issue de cette double notion de discontinuit e ; elle nous informe que, jusqu` a une certaine e chelle de r esolution, la fonction des structures est bien celle qui nous concerne ( e changes gazeux dans le cas des poumons). Nous choisissons alors un pas grossier d echantillonnage , tr` es sup erieur a ` la limite qui serait n ecessaire pour rendre compte de la totalit e du ph enom` ene. De la mesure faite a ` cette e chelle (exprim e e en unit e ), et de la dimension fractale D, nous d eduisons alors la valeur vraie (exprim ee en unit es ) par la relation :
(3.7)
F IG . 3.9 Quelques exemples de fractales : arbre bronchique de lhomme recalcul ea ` partir du corps du Human Visual Project par Jorge Marquez. Soulignons a ` ce point la propri et e remarquable du pixel (point e l ementaire dimage) de fournir une mesure universelle (au sens o` u nous lavons entendu au paragraphe 3.4.1). Contrairement au double d ecim` etre, le pixel permet de mesurer non seulement des longueurs ( ), mais aussi des surfaces ( ) ou des volumes ( ). Et l equation 3.5 demeure valable, tant pour des formes classiques que fractales pour variant de 0a ` 3. Ainsi cette notion de forme fractale m erite-t-elle une attention particuli` ere ; elle bouleverse nos sch emas traditionnels de lunivers peupl e de bonnes fonctions, continues, d erivables, mesurables, etc. Elle se montre
52
F IG . 3.11 Corail synth etique et naturel n eanmoins un outil remarquable pour repr esenter beaucoup des objets rencontr es chaque jour. Elle sest montr ee particuli` erement pr ecieuse pour d ecrire les objets de la g eomorphologie : rivi` eres, lignes de cr etes, etc. Enn les approches fractales ont pr et e leur nom a ` des outils de compression et de codage dimages (le codage fractal). Ces techniques utilisent les propri et es du point xe de certaines transformations contractantes du plan (g en eralement des combinaisons dhomoth eties, de rotations et de changements de contraste) [Fisher, 1995]. Cela permet de ne transmettre, pour chaque imagette issue de la sc` ene a ` transmettre, que la seule transformation qui permet dobtenir cette imagette a ` partir dune autre plus grande issue dune autre partie de limage (cascade interne).
53
F IG . 3.12 Electrod eposition de cuivre, cest un exemple de percolation fractale. La cascade dhomoth etie est illustr ee par la petite fen etre de limage gauche, agrandie sur limage droite (dapr` es [Bunde et Havlin, 1994]).
54
F IG . 3.15 Foug` ere simul ee par 5 attracteurs superpos es (dapr` es [Peitgen et Saupe, 1988]).)
Chapitre 4
4.1 Introduction
Le traitement des images par ordinateur n ecessite de disposer de repr esentations discr` etes des sc` enes observ ees. On dispose alors dun e chantillonnage de ou dans ou , qui est de plus ni, ce qui justie de repr esenter les images sous forme matricielle. Pour traiter de tels ensembles de points, deux solutions sont possibles : soit on plonge les points discrets de dans , et on les traite comme sils appartenaient a ` un espace continu ; ce sont alors souvent des proc ed es de g eom etrie algorithmique qui sont mis en uvre ; soit on d enit directement les traitements dans lespace discret, en essayant den pr eserver les effets et les propri et es. Le choix de lune ou lautre de ces solutions d epend beaucoup du type de traitement a ` effectuer, du type de repr esentation sur lequel sappuie ce traitement, des propri et es souhait ees, de la complexit e des calculs, etc. Par exemple, on garantit de meilleures propri et es de connexit e avec des rotations continues que des rotations discr` etes. Au contraire, les op erations morphologiques de base sont beaucoup plus simples a ` effectuer dans un espace discret (voir le chapitre 6 sur la morphologie math ematique). Dans les cas o` u les deux approches sont possibles, elles ne sont pas toujours e quivalentes, et il est souvent difcile de garantir que la transformation appliqu ee a ` une version discr` ete dun objet fournira le m eme r esultat que la discr etisation du r esultat de la transformation continue.
Dans ce chapitre, nous nous int eressons surtout aux probl` emes de repr esentations g eom etriques discr` etes, qui serviront de support aux traitements et transformations effectu es directement dans . Des exemples de tels traitements seront abord es en particulier dans le chapitre de morphologie math ematique (chapitre 6). Nous aborderons ici succinctement les pavages et maillages (section 4.2), sur lesquels sont d enies les images discr` etes, puis les questions de topologie (section 4.3), les probl` emes de repr esentations de quelques structures g eom etriques simples, d eterministes (section 4.4) ou al eatoires (section 4.5), et enn la d enition et le calcul de distances discr` etes (section 4.6). Un expos e plus d etaill e sur tous ces points ainsi que sur dautres aspects de la g eom etrie discr` ete en traitement dimages peut e tre trouv e dans [Chassery et Montanvert, 1991, Klette et Rosenfeld, 2004]. Les principes d ecrits peuvent e tre appliqu es aussi bien a ` la synth` ese qu` a lanalyse dimages. La g eom etrie discr` ete constitue toujours un axe de recherche important dans ces deux domaines.
55
56
Un pavage est une partition de lespace continu ( ) en cellules e l ementaires (tout lespace est recouvert par les cellules, et les cellules nont pas dintersection deux a ` deux). Cette d enition, la plus g en erale, peut donner lieu a ` une innit e de solutions si lon nimpose pas de contraintes suppl ementaires sur la forme et la disposition des cellules. En pratique, des contraintes sont impos ees : dune part par les capteurs, dont la surface sensible a g en eralement une structure r eguli` ere, et dautre part par lutilisation que lon souhaite faire de la repr esentation, qui impose une certaine r egularit e et simplicit e, ainsi que certaines propri et es sur le pavage r esultant sur lesquelles nous reviendrons. Deux m ethodes peuvent e tre envisag ees pour construire un tel pavage : 1. La premi` ere consiste a ` se donner une distribution de points dans lespace. Puis a ` chaque point est associ ee une cellule , de telle sorte quelle nintersecte aucune autre cellule et quelle ne laisse pas de vide dans lespace. La solution la plus simple consiste a ` choisir pour lensemble des points de lespace qui sont les plus proches de que de tout autre point de la distribution. Dans le cas o` u la distribution des points est r eguli` ere, on aboutit a ` un pavage classique, tel que ceux que nous verrons dans la section suivante. Dans le cas o` u la distribution est irr eguli` ere, on aboutit a ` un pavage de Vorono , que nous d ecrirons plus en d etails dans la section 4.4. Les points de la distribution peuvent e tre interpr et es comme des germes, a ` partir desquels on fait cro tre des cellules a ` vitesse constante, jusqu` a ce que tout lespace soit rempli (voir gure 4.1).
F IG . 4.1 Deux exemples de construction dun pavage par propagation a ` partir dune distribution de points r eguli` ere.
2. La deuxi` eme solution consiste a ` se donner au contraire un mod` ele a priori de cellule e l ementaire, et a ` reproduire ce mod` ele en juxtaposant les cellules pour construire une partition de lespace [Grunbaum et Shepard, 1989]. Cela nest bien s ur pas possible avec nimporte quel mod` ele de cellule. On impose g en eralement que celui-ci soit un polygone (ou poly` edre) convexe, r egulier, et que dans la juxtaposition les sommets soient en contact avec dautres sommets mais pas avec des ar etes (typiquement, la conguration de la gure 4.2 ne satisfait pas cette derni` ere condition).
57
F IG . 4.2 Exemple dune conguration o` u les sommets du pavage ne sont pas en co ncidence avec dautres sommets. Notons quen d eformant ce maillage, on peut obtenir un pavage hexagonal qui est le pavage r egulier associ ea ` cette distribution de points, comme on le verra par la suite.
triangulaire
carr
hexagonal
1 Notons que le pavage triangulaire est r egulier au sens o` u nous lavons d eni, mais quil nest pas uniforme car les triangles nont pas tous la m eme orientation.
58
F IG . 4.4 Deux exemples de congurations semi-r eguli` eres permettant de paver le plan.
59
F IG . 4.5 Dualit e entre les maillages et les pavages r eguliers du plan. Plusieurs approches ont e t e tent ees an de d enir des topologies plus satisfaisantes. Nous d ecrivons ici succinctement lune delles [Chassery et Chenin, 1980, Khalimsky et al., 1990]. Elle consiste (dans le plan) a ` construire une base topologique de . Une topologie est alors une classe densembles de telle que chaque e l ement de soit r eunion d enombrable d el ements de la base topologique, et telle que :
2.
1.
Sur une trame carr ee, on peut par de la mani` ere suivante : pour tout exemple construire la base topologique point de , de coordonn ees , on associe a ` lensemble d eni par (voir gure 4.6) :
2. si et de cette base.
60
1 1 2 3 4 5 6 7 P 2 3 4 5
F IG . 4.6 D enition dune base topologique dans le plan discret sur une trame carr ee. Ce type de construction a un inconv enient majeur : la forme du voisinage induit par les autour de chaque point d epend de la position du point dans lespace. En particulier, la topologie ainsi construite nest pas invariante par translation. De plus, ce type de construction ne garantit pas toutes les propri et es souhait ees, en particulier le th eor` eme de Jordan. Enn, si cette construction reste possible sur une trame triangulaire (voir gure 4.7), elle ne lest pas sur une trame hexagonale.
Q P
F IG . 4.7 D enition dune base topologique dans le plan discret sur une trame triangulaire. Sur cette gure, , , , .
61
(a)
(b)
(c)
F IG . 4.8 Connexit e sur une trame discr` ete carr ee (a : 4-connexit e, b : 8-connexit e), ou hexagonale (c : 6connexit e).
noeuds du graphe arcs dfinissant les voisins et la connexit
F IG . 4.9 Graphe d enissant la 4-connexit e sur une trame carr ee. Sur une trame hexagonale, la connexit e la plus naturelle est la 6-connexit e (gure 4.8 c). Chaque point a 6 voisins qui sont tous a ` m eme distance du point central et les 6 directions repr esent ees sont e quir eparties, ce qui constitue un des avantages de la trame hexagonale. Sur une trame triangulaire, trois types de voisinages e l ementaires peuvent e tre d enis, correspondant respectivement a ` la 3-, 9- et 12-connexit e. Ces d enitions sont illustr ees sur la gure 4.10. Dans une repr esentation matricielle des images, lacc` es aux voisins dun point de coordonn ees se fait tr` es ais ement sur une trame carr ee. Ce sont : en 4-connexit e : les points de coordonn ees , , , , en 8-connexit e : les points de coordonn e es , , , , , , , . Sur une trame hexagonale, lacc` es aux voisins est un peu plus d elicat. En effet, sil est toujours possible de repr esenter une image de mani` ere matricielle, il faut consid erer que, g eom etriquement, les lignes sont d ecal ees les unes par rapport aux autres. Les indices des voisins dun point d ependent donc de la parit e de la ligne sur laquelle se situe le point. erot ees comme lindique la gure 4.11, alors les voisins dun point de Si les lignes sont num coordonn ees sont : si est pair : , , , , , , si est impair : , , , , , . Sur une trame triangulaire, de la m eme mani` ere, les indices des voisins d ependent de la parit e de la ligne sur laquelle se trouve le point consid er e (et bien s ur de la connexit e choisie). Si lon se place maintenant en dimension trois sur une trame cubique, trois types de voisinages e l ementaires sont classiquement d enis, correspondant respectivement a ` la 6-, 18- et 26-connexit e. Si lon repr esente chaque point de limage 3D comme un cube e l ementaire, les 6-voisins correspondent aux cubes adjacents a ` par une face, les 18-voisins comprennent les 6 pr ec edents et ceux qui sont adjacents a ` par une ar ete, et les 26-voisins
&
" $
" "
62
F IG . 4.10 Graphes d enissant la 8-connexit e sur une trame carr ee, la 6-connexit e sur une trame hexagonale, et les 3-, 9- et 12-connexit es sur une trame triangulaire (seuls quelques arcs sont repr esent es pour la trame triangulaire).
sobtiennent en ajoutant les cubes adjacents par un sommet (voir gure 4.12). Une fois que sont d enis les voisinages e l ementaires, les notions de connexit e sen d eduisent ais ement, gr ace a ` linterpr etation en termes de th eorie des graphes [Berge, 1958]. Un chemin est ainsi d eni comme une suite de sommets du graphe telle que deux points cons ecutifs de la suite soient joints par un arc du graphe, o` u les arcs sont d enis en fonction de la connexit e choisie. Par exemple, sur une trame carr ee, on d enit : un 4-chemin comme une suite de points tels que :
$
63
F IG . 4.11 Les indices des voisins dun point sur une trame hexagonale d ependent de la parit e de la ligne sur laquelle se trouve le point.
F IG . 4.12 Les trois types de voisinages e l ementaires pour une image 3D d enie sur une trame cubique. un 8-chemin comme une suite de points
tels que :
Les composantes connexes sen d eduisent alors en reprenant les d enitions classiques des graphes. On obtient ainsi sur une trame carr ee : une composante 4-connexe est un ensemble de points tel que pour tout couple de points de , il existe un 4-chemin dextr emit es et et dont tous les points soient dans ; une composante 8-connexe est un ensemble de points tel que pour tout couple de points de , il existe un 8-chemin dextr emit es et et dont tous les points soient dans . Ces d enitions sont illustr ees sur la gure 4.13. De mani` ere analogue, on d enit sur une trame hexagonale les notions de 6-chemin et de composante 6connexe. Sur une trame triangulaire, les chemins peuvent e tre 3-, 9- ou 12-connexes, de m eme que les composantes connexes.
Sur une trame carr ee, des paradoxes peuvent appara tre pour certaines congurations locales de points de lobjet et de son compl ementaire. Sur la gure 4.14, en 8-connexit e, les points a et d de lobjet sont voisins ainsi que les points b et c du compl ementaire. Cela signie que les composantes connexes de lobjet et du compl ementaire se croisent . Si on se place au contraire en 4-connexit e, ni les points a et d, ni les points b et c ne sont voisins,
64
F IG . 4.13 Illustration des d enitions des chemins et composantes connexes sur une trame carr ee, en 4- et 8connexit es. laissant ainsi une zone qui nest ni lobjet ni son compl ementaire. Ce paradoxe peut e tre e vit e si lon consid` ere des connexit es diff erentes pour lobjet et pour son compl ementaire. Sur une trame hexagonale, ce type de ph enom` ene ne se produit pas et on travaille en 6-connexit e aussi bien pour la forme que pour le fond.
a c
b d
a c
b d
F IG . 4.14 Paradoxe sur une trame discr` ete carr ee en 8- et 4-connexit e. Un des r esultats importants qui permet de garantir de bonnes propri et es topologiques aux objets (et d eviter ce type de paradoxe) est le th eor` eme de Jordan. Dans le cas continu, il sexprime sous la forme suivante : toute courbe simple ferm ee s epare lespace en deux composantes connexes, lint erieur et lext erieur de la courbe. Avec les d enitions de la connexit e discr` ete donn ees ci-dessous, on montre les deux r esultats suivants : sur une trame carr ee, tout 4-chemin (respectivement 8-chemin) simple ferm e 2 s epare lespace en deux composantes 8-connexes (respectivement 4-connexes), lint erieur et lext erieur (voir lillustration de la gure 4.15) ; sur une trame hexagonale, tout 6-chemin simple ferm e s epare lespace en deux composantes 6-connexes.
2 Un 4-chemin simple ferm e 17 est un 4-chemin !('0#132 6 54 et seulement si & .
"!#%$
si et seulement si &
!('
, et
est un 4-voisin de
)$
si
65
Intrieur
F IG . 4.15 Illustration du th eor` eme de Jordan dans le cas continu et dans le cas discret sur une trame carr ee (les points ext erieurs ne sont pas repr esent es).
Le premier de ces r esultats fait appara tre une dualit e entre la 4- et la 8-connexit e [Kong et Rosenfeld, 1989]. Ainsi, pour garantir que le th eor` eme de Jordan soit respect e, il faut changer de connexit e quand on passe dun objet a ` son compl ementaire. On consid erera donc par exemple un objet en 4-connexit e et son compl ementaire en 8-connexit e, ou le contraire. Sur lexemple de la gure 4.15, les points de lint erieur du chemin 4-connexe forment bien une composante 8-connexe, mais deux composantes 4-connexes. Le r esultat nest donc pas vrai si on prend la m eme connexit e pour les points du chemin et pour le compl ementaire du chemin. Le deuxi` eme r esultat montre quau contraire ce type de probl` eme ne se pose pas en 6-connexit e. La trame hexagonale pr esente donc de meilleures propri et es topologiques que la trame carr ee. Sur une trame triangulaire, il existe de mani` ere analogue une dualit e entre la 3- et la 12-connexit e, mais, comme nous lavons soulign e, cette trame est peu usit ee. En dimension 3 sur une trame cubique, il existe une dualit e entre la 6- et la 26-connexit e, et on a un analogue du th eor` eme de Jordan en consid erant cette fois une surface simple ferm ee. La difcult e rencontr ee en 4- et 8-connexit es vient de ce que lappartenance des fronti` eres dun pixel a ` un objet ou a ` son compl ementaire nest pas clairement d enie. Elle peut e tre lev ee dans le cadre des complexes cellulaires [Kovalesky, 1989]. Chaque pixel ou voxel est d ecompos e en e l ements de dimension locale variant de 0 (les sommets) a ` 2 (lint erieur du carr e repr esentant un pixel) ou 3 (lint erieur du cube repr esentant un voxel), et lappartenance de chacun de ses e l ements aux objets et a ` leur compl ementaire est d enie. Ces structures ne posent pas de probl` emes topologiques et le th eor` eme de Jordan est v eri e, ainsi que lillustre la gure 4.16. Ces structures peuvent e galement e tre g en eralis ees a ` trois dimensions [Cointepas et al., 2001]. Il faut cependant noter que ces structures sont un peu plus lourdres a ` manipuler que les pixels ou les voxels car elles sont plus volumineuses et non homog` enes (plusieurs types d el ements, dont les voisinages sont e galement diff erents).
66
F IG . 4.16 Le th eor` eme de Jordan est toujours v eri e dans le mod` ele des complexes cellulaires. Chaque pixel et d etermine la connexit e de la courbe est d ecompos e en carr e, ar ete et sommet. La couleur des points noire et celle du fond.
vaut . La connexit e utilis ee pour calculer le nombre de trous et le nombre de composantes connexes doit respecter les contraintes du th eor` eme de Jordan discret. Sur lexemple de la gure 4.17, le nombre dEuler vaut si on consid` ere les objets en 8-connexit e et les trous en 4-connexit e, et 0 si on choisit les conventions inverses.
Objet Trou
F IG . 4.17 Nombre dEuler sur une trame carr ee : si on consid` ere les objets en 8-connexit e et les trous en 4 connexit e, et , donc . Avec les conventions inverses, et , donc .
Le nombre dEuler peut e tre calcul e par simple d enombrement de congurations locales, d ecrites dans la gure 4.18. Avec les notations de cette gure, on montre que : si on consid` ere les objets en 8-connexit e et les trous en 4-connexit e, alors :
Le lecteur pourra v erier les r esultats de ces formules sur lexemple de la gure 4.17. Il est remarquable que ces caract eristiques ne fassent intervenir que des points de lobjet, alors que le nombre dEuler implique a ` la fois lobjet et son compl ementaire. Cet exemple est e galement particuli` erement int eressant
67
car il montre quil est possible de calculer le nombre dEuler uniquement avec des caract eristiques locales, bien quil sagisse dune mesure globale sur un objet. Le calcul est donc beaucoup plus facile, et la mise en uvre informatique avec ces caract eristiques locales est imm ediate, alors que le calcul direct des nombres de composantes connexes et de trous serait plus difcile. Cet exemple illustre ainsi une id ee quon retrouvera souvent en traitement dimages, qui consiste a ` ramener des notions globales a ` des calculs qui peuvent se faire simplement localement. On voit appara tre ici un int er et suppl ementaire de la notion de voisinages e l ementaires, puisque ce sont les points d enis par ces voisinages qui interviennent dans les calculs locaux.
68
"
La m ethode de discr etisation par pav e semi-ouvert consiste alors a ` garder dans la repr esentation discr` ete tout point de la trame tel que le pav e semi-ouvert qui lui est associ e ait une intersection non vide avec lentit ea ` discr etiser. La gure 4.19 illustre le r esultat dans le cas dun segment de droite.
F IG . 4.19 Discr etisation dun segment de droite par la m ethode du pav e semi-ouvert. Lensemble discret ainsi obtenu ne constitue pas n ecessairement un chemin simple au sens de la 4- ou de la 8-connexit e. Sur lexemple de la gure 4.19, lensemble de points obtenu nest pas 4-connexe, et au sens de la 8-connexit e, certains points ont plus de 2 voisins. Si lon cherche maintenant a ` discr etiser la fronti` ere du demi-plan ferm e limit e par la droite (plut ot que la droite elle-m eme), en imposant une contrainte dunilat eralit e, on obtient cette fois un chemin 8-connexe [Dorst et Smeulders, 1984]. La m ethode consiste a ` garder les points discrets sils sont situ es dun m eme c ot e de la droite et tels que le segment vertical du maillage qui en part coupe la droite. Ce proc ed e est illustr e sur la gure 4.20. On remarquera que le r esultat obtenu est diff erent de celui obtenu avec la m ethode du pav e semi-ouvert, partant de la m eme droite continue. Il est possible de combiner ces deux m ethodes, en associant a ` chaque point du maillage un segment semiouvert, centr e en ce point et vertical. Un point discret est alors conserv e si le segment qui en est issu intersecte la droite continue. Le r esultat de ce proc ed e est illustr e sur la gure 4.21. On obtient toujours un chemin 8-connexe, mais o` u les points discrets sont r epartis des deux c ot es de la droite continue3.
3 Le r esultat est e quivalent a ` celui quon obtiendrait avec lalgorithme de Bresenham, fr equemment utilis e en synth` ese dimages, qui minimise lerreur locale en chacun des points du trac e [H egron, 1985].
69
F IG . 4.20 Discr etisation dun segment de droite par la contrainte dunilat eralit e.
F IG . 4.21 Discr etisation dun segment de droite par la m ethode de segment vertical semi-ouvert.
ee). On dit que Soit un ensemble de points discrets (toujours en dimension deux et sur une trame carr la propri et e de la corde si et seulement si :
v erie
La gure 4.22 pr esente un cas o` u la propri et e de la corde est v eri ee et un cas o` u elle ne lest pas.
70
Q R P
F IG . 4.22 Lensemble de points discrets de gauche v erie la propri et e de la corde, celui de droite ne la v erie pas (le point du segment est a ` une distance de plus de 1 de tout point discret de ).
Un segment discret v eriant la propri et e de la corde satisfait aux caract eristiques utilis ees dans la m ethode de discr etisation du segment semi-ouvert [Rosenfeld, 1974, Ronse, 1985, Santalo, 1940]. Une deuxi` eme caract erisation op erationnelle de segments de droite discrets repose sur leur description syntaxique [Pham, 1986]. En effet, un segment de droite discret est constitu e dune suite de points, que lon peut suivre en observant les changements de direction. La caract erisation est alors la suivante : on appelle section une sous-suite de points maximale sans changement de direction (les 8 directions possibles sont celles d enies par la 8-connexit e sur la trame carr ee, comme lindique la gure 4.23), dans un segment de droite discret, les sections ne peuvent avoir que deux directions distinctes, qui sont cons ecutives (selon le sch ema de la gure 4.23), pour une de ces directions, les sections sont toutes de longueur 1, et pour lautre direction, les sections sont , o` u la valeur de d epend de la pente de la droite. de longueur ou On peut donc utiliser cette caract erisation, illustr ee sur la gure 4.24, pour v erier si lensemble de points consid er e est bien un segment de droite discret.
F IG . 4.23 Les 8 directions possibles sur une trame carr ee. Deux directions sont cons ecutives si leurs num eros diff` erent de 1 (modulo 8).
71
n+1
F IG . 4.24 Caract erisation syntaxique dun segment de droite discret. Pour que cette intersection soit non vide, il faut que la pente de la droite soit de la forme :
si limage est de taille , et pour une pente de droite inf erieure a ` 1 (les autres cas sobtiennent par sym etrie). Les pentes de droites possibles forment donc une suite de Farey dordre , not e e [Franel, 1924]. Pour une image de taille , les droites possibles telles que sont repr esent ees sur la gure 4.25 ; on a dans ce cas :
Le nombre de droites possibles augmente bien s ur avec la taille de limage. Par exemple pour
$ ! % . Des propri est de lordre de et es des suites de Farey permettent de les construire.
, on a :
# # #
On peut ainsi calculer le nombre de droites possibles suivant la taille de limage, mais aussi les nombres doccurrences de ces droites en fonction de la pente . En effet, si lon essaye de retrouver une droite dans une image a ` partir de deux points discrets, on trouvera plus souvent certaines droites que dautres. Par exemple, les droites de pente 0 et 1 sur la gure 4.25 seront obtenues pour plus de couples de points que les autres droites. Pour certaines transformations, ce ph enom` ene constitue un v eritable biais li ea ` la discr etisation dont il va falloir tenir compte. Par exemple, si lon essaye de d etecter des contours rectilignes en comptant les couples de points
72
p/q = 0
p/q = 1/3
p/q = 1/2
p/q = 2/3
p/q = 1
F IG . 4.25 Les droites possibles (dintersection non vide avec lensemble des points de la trame) sur une image .
qui contribuent a ` un contour dorientation donn ee (transformation de Hough [Ma tre, 1985a, Ma tre, 1986], voir chapitre 14), on d etectera beaucoup plus facilement les contours de pente 0 ou 1 que des contours de pente tr` es faible par exemple. Si lon cherche maintenant quelles sont les longueurs possibles de segments discrets, on arrive a ` des conclusions de m eme type. Soit le carr e dune longueur de segment. est obtenu comme la distance quadratique entre deux points discrets, donc de coordonn ees enti` eres. est donc solution dune e quation diophantienne de la forme :
avec et entiers. On retrouvera pour les cercles le m eme type d equation, qui sera e tudi e plus en d etails a ` cette occasion. Cette e quation na pas toujours de solution. En effet, on constate que, suivant la parit e de et , est congru a ` 0, 1 ou 2 modulo 4. Les valeurs de qui sont congrues a ` 3 modulo 4 ne peuvent donc jamais e tre obtenues. La gure 4.26 illustre lirr egularit e des nombres doccurrences de sur une image et sur une image . La d ecroissance g en erale des courbes obtenues est li ee au fait que les images sont born ees. Pour plus de d etails sur les droites et courbes discr` etes, on pourra consulter [Debled-Rennesson et Reveill` es, 1995].
73
F IG . 4.26 Distribution des carr es des longueurs des segments discrets sur une image .
F IG . 4.27 Intersection de cercles continus avec des points de la trame carr ee. Le nombre de solutions de cette e quation est donn e par nombres premiers :
#
en
o` u les repr esentent les facteurs premiers congrus a ` 1 modulo 4, et les ceux qui sont congrus a ` 3 modulo 4. Par exemple, pour on obtient 8 points, pour et on obtient 12 points. En effet, est congru a ` 1 modulo 4. Le seul terme qui intervient dans correspond donc a ` , avec et $ ,un . On remarque dans ces formules que, d` e s quintervient dans la d e composition de terme congru a ` 3 modulo 4 avec un exposant impair, alors .
#
En pratique, la d enition dun cercle discret limit ee aux points dintersection avec le maillage est tr` es restrictive. On pr ef` ere donc souvent consid erer que le cercle a une certaine e paisseur , et donc regarder plut ot lintersection dune couronne circulaire avec les points du maillage4 .
4 On
peut bien s ur faire la m eme chose avec des droites et des segments, en consid erant des bandes.
74 Si
toujours avec
et
Par et , on trouve . Ici encore, la grande variabilit e de la fonction exemple, pour entra ne des biais dans les m ethodes danalyse ou de synth` ese dimages, ainsi que de reconnaissance des formes, quil ne faut pas n egliger. Il existe des m ethodes de correction, prenant en compte la forme des distributions obtenues. Pour plus de d etails sur les cercles et sph` eres discrets, on pourra consulter [Andres, 1994].
4.4.5 Pavage de Vorono et triangulation de Delaunay
Nous nous attachons maintenant a ` des repr esentations structur ees adapt ees au contenu des images. Nous pr esentons ici les pavages de Vorono , qui constituent un exemple de syst` eme de repr esentation structur ee pour linterpr etation de formes. Nous en verrons un autre exemple tr` es diff erent avec le squelette dans le chapitre 6 sur la morphologie math ematique. ` chacun de ces germes, on associe un , appel es germes. A On se donne un ensemble de points domaine du plan d eni par :
$
d esigne une distance du plan. Si lon choisit pour la distance euclidienne, alors sont des polygones convexes. En effet, si les lon prend tout dabord , alors la s eparation entre et est la m ediatrice des deux points. Les pour quelconque sont donc des intersections de demi-plans, donc des polygones convexes (pas forc ement born es). La gure 4.28 illustre cette d enition (pour la distance euclidienne), ainsi que la convexit e des pav es obtenus. Notons que le pavage obtenu correspond a ` la premi` ere des m ethodes d ecrites pour construire des pavages dans la section 4.2. Les pav es sont appel es polygones de Vorono , et sont form es dar etes et de sommets de Vorono . La d enition du pavage de Vorono se g en eralise directement a ` des germes quelconques (plus n ecessairement ponctuels) mais, dans ce cas, les pav es obtenus ne sont pas n ecessairement polygonaux. Dans le cas discret, la d enition du pavage de Vorono demeure inchang ee. Cependant, au lieu de la distance euclidienne, on en utilise g en eralement des approximations : les distances discr` etes, telles quelles seront vues dans la section 4.6, qui permettent des calculs rapides tout en fournissant une bonne approximation de la distance euclidienne. Le pavage de Vorono a les propri et es suivantes [Klein, 1989] : 1. sil nexiste pas de quadruplets de germes cocirculaires, tout sommet de Vorono est e quidistant de 3 germes exactement, 2. tout sommet du diagramme de Vorono est centre dun cercle passant par 3 germes et ne contenant aucun autre germe, ce cercle est appel e cercle de Delaunay, 3. est non born e si et seulement si appartient a ` la fronti` ere de lenveloppe convexe des . Si lon joint par des segments les 3 germes e quidistants dun sommet de Vorono , on obtient une triangulation de lensemble de , appel ee triangulation de Delaunay. Le r esultat obtenu pour les points de la gure 4.28 est illustr e sur la gure 4.29.
o` u
!
75
La triangulation de Delaunay et le pavage de Vorono sont deux structures de lespace duales lune de lautre, comme lillustre la gure 4.30. En effet, a ` chaque ar ete de Vorono correspond une ar ete de la triangulation, qui lui est orthogonale ; chaque germe est un sommet de la triangulation, et chaque sommet de Vorono est le centre dun triangle de Delaunay. La deuxi` eme propri et e est illustr ee sur la gure 4.31. La triangulation de Delaunay est celle qui v erie que le cercle circonscrit a ` chaque triangle ne contienne aucun sommet de la triangulation. On a donc ici une premi` ere application g eom etrique du pavage de Vorono et de la triangulation de Delaunay. La troisi` eme propri et e permet de d eduire directement lenveloppe convexe dun ensemble de points, ce qui nous donne une deuxi` eme application g eom etrique de ces deux notions. Il existe beaucoup dautres applications. Nous nen mentionnerons plus quune ici, qui concerne le calcul de la
76
o` u d esigne la distance euclidienne entre les points et . Pour calculer cette distance minimum, il suft deffectuer la triangulation de Delaunay de la r eunion de tous les points , et de d eterminer lar ete la plus courte ayant une extr emit e dans et lautre dans .
et
Enn, mentionnons quelques algorithmes de calcul du pavage de Vorono [Toussaint, 1985, Preparata et Shamos, 1988]. Il existe des algorithmes r ecursifs qui sont optimaux (en termes de complexit e algorithmique), mais dont la mise en uvre nest pas tr` es facile. Il existe e galement des algorithmes incr ementaux, dont la complexit e dans le cas le pire nest pas optimale, mais qui sont plus simples a ` mettre en uvre [Green et Sibson, 1978]. Le principe consiste a ` rajouter les points un a ` un et a ` modier le pavage pr ec edemment obtenu. Lint er et est que lajout point dun nentra ne que des modications locales du pavage. Supposons que lon connaisse le pavage de . Lorsquon ajoute , on commence par rechercher le germe ( ) le plus proche de . La m ediatrice de est le support dune nouvelle ar ete du pavage. En se donnant un sens de parcours de cette m ediatrice, on recherche lintersection avec une ar ete du pavage pr ec edent. Le germe correspondant, voisin de , est le nouveau point et on it` ere la proc edure jusqu` a ce quon revienne au point de d epart. On tourne ainsi
77
autour de pour construire le pav e qui lui est associ e. Les parties dar etes du pavage pr ec edent qui tombent dans ce nouveau pav e sont alors supprim ees. La gure 4.32 illustre le principe de cette construction.
avec : , (dans densit e constante, ); le cas dune e tant donn es points dans , suit une loi uniforme sur . Si lon essaye de g en eraliser la notion de points de Poisson a ` des structures plus complexes, on est confront ea ` des difcult es de g en eration de ces structures. Par exemple, la g en eration de droites de Poisson nest pas imm ediate. Lid ee la plus simple serait de se donner une distribution de points de Poisson dans le plan, et en chaque point, de tracer une droite dont la direction est choisie de mani` ere uniforme. Malheureusement la distribution de droites ainsi obtenue nest pas de Poisson. Une autre solution, plus compliqu ee mais fournissant effectivement une distribution de Poisson, consiste a ` faire touner un axe autour dun point . Quand balaye un secteur angulaire
5 Elles
constituent par exemple une des composantes des sch emas bool eens que nous arborderons au chapitre 6.
78
, et on trace les droites orthogonales a ` passant pas ces points. On obtient ainsi un ensemble de droites de Poisson. Elles peuvent e tre utilis ees par exemple pour d enir des pavages al eatoires isotropes.
des axes de coordonn ees). Cette distance est exactement la longueur du plus court chemin entre et sur le graphe erier ais ement que toutes les propri et es dune distance sont bien satisfaites. engendr e par . On peut v En pratique, les et sont repr esent es par des masques. Chaque point du masque est lextr emit e dun et a pour coefcient le correspondant, qui repr esente la distance locale entre ce point et le point central du masque (celui-ci est affect e du coefcient 0).
si est la longueur associ o` u est un facteur d echelle (typiquement ee au vecteur e l e selon un mentaire
4.6.2 Exemples
Pour la qualit e de lapproximation, il est possible de jouer sur deux param` etres : la taille du masque (donc le nombre de directions repr esent ees, ou encore le nombre de ) et les coefcients du masque (donc les ). Plusieurs crit` eres ont e t e propos es pour estimer cette qualit e, le plus fr equemment utilis ee tant de minimiser le maximum de la diff erence avec la distance euclidienne. Les masques les plus employ es sont illustr es sur la gure 4.33. Les deux
79
premiers correspondent respectivement a ` la 4- et a ` la 8-connexit e sur une trame carr ee. Le troisi` eme (gure 4.33 c) permet davoir une erreur faible ( %) par rapport a ` la distance euclidienne en modiant les coefcients (toutes les distances sont alors multipli ees par 3). Le dernier (gure 4.33 d) donne une erreur inf erieure a ` 2% en jouant a ` la fois sur les coefcients et sur la taille du masque (toutes les distances sont alors multipli ees par 5).
11 1 1 0 1 1 1 1 1 1 0 1 1 1 1 4 3 4 3 0 3 4 3 4 11 11 7 5 7 11 5 0 5
11 7 5 7 11 11 11
support
Linconv enient majeur de cet algorithme est que le nombre dit erations d epend de la taille de limage, de la taille de lobjet et de sa forme. De plus deux images doivent e tre gard ees en m emoire. Cet algorithme sapplique a ` nimporte quelle trame et nimporte quel masque. Lalgorithme s equentiel ne n ecessite que deux it erations. Il proc` ede en deux balayages en sens oppos es de limage et le masque est divis e en deux parties et contenant les points d e j` a examin e s dans le sens courant de balayage. Pour , on effectue lop eration suivante ( e tant calcul ee comme pr ec edemment) :
support
Cet algorithme v erie lexigence de la rapidit e. Il ne n ecessite quune image en m emoire et sapplique e galement a ` nimporte quelle trame et nimporte quel masque. Une deuxi` eme famille dalgorithmes repose sur les contours des objets. En effet, les points situ es a ` lint erieur des objets ont toujours une distance nulle a ` lobjet, et les points les plus proches des points ext erieurs aux objets sont toujours des points situ es sur les contours des objets. Ainsi, seuls ceux-ci interviennent r eellement dans le calcul. Un premier type dalgorithme dans cette famille repose sur une structure de cha ne pour repr esenter les contours des objets. Le principe du calcul de la fonction distance consiste a ` d eplacer ces contours par des r` egles de r ee criture, pour d eterminer successivement les points a ` une distance 1 des objets, puis les points a ` une distance
80
2, etc. [Vincent, 1992]. Une e tape dajustement est parfois n ecessaire, par exemple quand le d eplacement dun contour conduit a ` connecter deux objets. Ce type dalgorithme ne n ecessite quune image en m emoire. Lacc` es aux voisins doit e tre facile car il est fr equemment utilis e dans les r` egles de r e- ecriture. Il est tr` es rapide, mais ne peut pas e tre g en eralis ea ` des images 3D car il ny a pas dordre naturel sur les points de la surface dun objet 3D permettant de les repr esenter sous forme de cha ne. Les r` egles de r e- ecriture et dajustement comportent beaucoup de cas particuliers et la proc edure compl` ete est donc un peu d elicate. Un deuxi` eme type dalgorithme repose sur une repr esentation des points de contours sous la forme dune simple le dattente FIFO (rst in, rst out). Cette pile est initialis ee par les points de contours des objets (lordre na pas dimportance). Lalgorithme extrait alors le premier point de la pile, et recherche ses voisins. Pour chaque voisin , si celui-ci est a ` lext erieur des objets, il est ajout ea ` la pile, et on lui affecte une valeur de distance qui vaut ). Cet algorithme est e celle de plus la distance locale entre et ( si galement tr` es rapide, g en eralisable a ` 3D, et n ecessite e galement un acc` es rapide aux voisins.
Notons que ces diff erentes classes dalgorithmes sont utilis ees pour de nombreuses autres transformations.
Chapitre 5
Une e quation aussi g en erale ne poss` ede pas de solution universelle et lon est amen ea ` r eduire le probl` eme au seul cas o` u: est un op erateur lin eaire ; est un op erateur spatialement invariant. Dans ces conditions, on montre que l equation 5.1 prend alors la forme dune convolution :
o` u est la r eponse impulsionnelle du d efaut. Cest cette seule op eration que nous traiterons dans ce chapitre. Pour cette raison, la restauration sera r eduite pour nous a ` une op eration de d econvolution ou de ltrage. De plus nous ne sommes concern es ici que par le cas de d efauts parfaitement connus, cest-` a-dire pour lesquels nous disposons de la r eponse impulsionnelle . Nous allons, dans ce chapitre, examiner tout dabord linversion de l equation pr ec edente. Nous e tudierons ensuite les conditions pour que la restauration dun signal se passe bien. Enn nous proposerons des techniques pour e valuer le d efaut entachant limage, d efaut que nous aurons jusqualors suppos e connu.
(5.2)
82
Par TF, cette e quation nous donne :
"
(5.3)
qui, si toutes les conditions sont remplies, (nous y reviendrons plus loin), permet dobtenir une estim ee TF de par :
de
de la
Nous voyons sont remplies (existence du ltre , existence de la TF inverse), le que, si toutes les conditions signal restaur e et le signal id eal sont e gaux. Il y a restauration parfaite. Cette restauration est obtenue par ltrage lin eaire de limage d efectueuse. Logiquement, le ltre est appel e ltre inverse, sa fonction de transfert est en effet linverse de la fonction de transfert du d efaut . Nous reviendrons plus loin sur les probl` emes associ es aux conditions dexistence du ltre inverse :
(5.4)
(5.5)
(5.6)
:
(5.7)
(5.8)
Cette e quation fournit une solution imm ediate au probl` eme de restauration, par inversion dun syst` eme lin eaire (nous supposerons l` a-aussi que les conditions de cette inversion existent) : (5.9)
1 Comme
aux chapitres pr ec edents, nous repr esenterons les vecteurs par des caract` eres gras lorsquil y aura un risque dambigu t e
83
5.1.3 Discussion
On voit ainsi que selon que lon choisit une approche discr` ete (alg ebrique), ou continue (analytique), on est conduit a ` des solutions en apparence diff erentes : l equation 5.4 ou l equation 5.9. Notons tout dabord que la nature continue du signal nest pas la cause des outils diff erents employ es puisque, a ` partir de l equation 5.6, il est e galement possible dappliquer une TF aux deux membres de l equation pour aboutir a ` une solution, discr` ete, mais mettant en uvre des transform ees de Fourier et non des inverses de matrices. Expliquons en quoi ces deux approches sont bien les deux faces dun m eme probl` eme [Andrews et Hunt, 1977]. L equation 5.7 exprime la propri et e dinvariance par translation du d efaut ; la matrice est une matrice de T oplitz (nous la noterons pour cela ) : elle s ecrit sous la forme remarquable :
$
. . .
(5.10)
La forme des matrices T oplitz rappelle celle des matrices circulantes. Elles nen diff` erent que par les termes repli es aux coins sup erieur droit et inf erieur gauche. Une matrice circulante construite sur , au lieu dutiliser la d enition 5.7, a pour d enition :
o` u
$ . . . . . . . .. .. .
. . . .. .
(5.11)
..
. . .
Il est connu que les matrices circulantes ont toutes pour vecteurs propres les racines de lunit e [Lelong-Ferrand et Arnaudi` es, 1971], et ce qui permet de les e crire : , avec :
$
$
On montre de plus que les matrices et sont asymptotiquement e quivalentes, sous les conditions suivantes, que nous discuterons plus loin : "! que la dimension du syst` eme soit tr` es grande ( ), que le d efaut soit a ` support e troit.
) par
Nous reconnaissons maintenant, en les regroupant a ` partir de la droite, les divers termes qui constituent lapproche analytique : le produit , qui repr esente la TF discr` te de g, d enot ee ; e le produit par les termes diagonaux qui constituent les termes courants de la matrice inverse. Or , cest donc linverse de la fonction de transfert du d efaut ; puis la transform ee de Fourier inverse, accomplie par le produit matriciel par . On voit donc quil y a bien e quivalence des deux approches dans le cas o` u le d efaut est correctement repr esent e par une matrice circulante : lapproche par inversion de matrice est linversion directe du d efaut, tandis que lapproche par TF est linversion par projection du signal sur la base des vecteurs propres de lop erateur d. Mais nous avons vu e galement que lorsque lon repr esente le signal par un ensemble ni d echantillons, la ` quelles matrice qui d ecoule des hypoth` eses de lin earit e et dinvariance spatiale nest pas circulante mais T oplitz. A conditions y a-t-il donc e quivalence entre et ? Nous avons vu que la diff erence entre les deux matrices r eside dans les termes des coins sup erieur droit et inf erieur gauche qui apparaissent lors du passage de T oplitz a ` circulante. Ce sont les termes de la demi-r eponse impulsionnelle gauche qui ont disparu sur la gauche du signal, et de m eme a ` droite. Ces diff erences seront n egligeables si la taille du d efaut est tr` es petite devant la dimension du signal. Pourquoi lapproche continue ( equation 5.3) conduit-elle a une solution par TF quelle que-soit la taille ! ! du d efaut ? Parce que dans cette approche, la TF est faite de a ` ,e liminant de fait les effets de bord. Si lon souhaite discr etiser les divers signaux, sous lhypoth` ese quils v erient la contrainte de spectre born e, il nous d faudra e galement prendre un nombre inni d echantillons (cf. chapitre 3) et l equivalence ecoule alors de la convergence asymptotique quelle que soit la taille, nie, du d efaut 2 .
!
!
!
F IG . 5.1 Dans une matrice T oplitz (` a gauche), le signal est tronqu e aux bords. Dans une matrice circulante (` a droite), les effets de bord sont repli es : on consid` ere que le signal est p eriodique au d etriment dune bonne lisibilit e du signal (merci Fred).
2 Dans un cas tout a ` fait exceptionnel, si le signal est p eriodique, les 2 approches sont e quivalentes avec un nombre ni d echantillons. En effet sa TF peut e tre obtenue par une s erie de Fourier sur une p eriode.
85
complexit e
matrice circulante
domaine de validit e tous d efauts lin eaires d efauts lin eaires spatialement invariants d efauts lin eaires spatialement invariants a ` r eponse impulsionnelle e troite
TAB . 5.1 Les diverses repr esentations des d efauts, leur complexit e et leur domaine dapplication. D` es que les signaux sont un peu longs (quelques centaines d echantillons), on voit donc lint er et dadopter une repr esentation par matrice circulante, m eme si lon risque de d egrader la solution trouv ee par des effets de bord non d esid er es. Nous verrons plus loin 5.6 comment on peut att enuer les effets de bord lors de la restauration dimages.
86
(5.12)
Ce ltre est identique au ltre inverse si le d efaut nest pas singulier, mais ne diverge plus en cas de singularit e. Dans une repr esentation vectorielle ( equation 5.8), deux types de probl` emes se pr esentent : 1. dune part la matrice peut e tre rectangulaire, 2. dautre part, elle peut ne pas e tre de rang plein. Ces deux probl` emes trouvent une solution par la matrice pseudo inverse [Albert, 1976, Hestenes, 1975, Decreusefond et Maruani, 2005] qui est solution de l equation (issue de l equation 5.6) :
Cette matrice a la propri et e suivante : son rang est e gal a ` celui de la plus grande matrice carr ee r eguli` ere issue de . Si est r eguli` ere, est e gale a ` . Comme lindique le dernier facteur , si est singuli` ere, a une valeur propre nulle pour tout vecteur propre appartenant au noyau de . La restauration consiste donc bien a ` inverser le plus eme r egulier issu de , et dannuler toutes les composantes de appartenant au noyau grand syst` de (ou de , qui est le m eme).
est, non seulement parfois singuli` ere, mais e galement souvent mal conditionn ee [DUR], Mais la matrice cest-` a-dire que certaines de ses valeurs propres non nulles sont tr` es faibles, quelles ne pourront e tre invers ees exactement, et risquent, selon la m ethode mise en uvre, de donner des r esultats diff erents. On d enit le degr e de conditionnement dun syst` eme lin eaire comme le rapport de sa plus grande a ` sa plus petite valeur propre :
Un syst` eme est mal conditionn e si est typiquement de lordre de linverse de la pr ecision de la machine sur laquelle on travaille. Il doit alors e tre r egularis e. De nombreuses techniques ont e t e propos ees pour r egulariser l equation 5.2 [Twomey, 1965, Phillips, 1962, Tikonov et Arsenine, 1974]. Nous pr esentons ici lapproche analytique propos ee par Wiener [Hellstrom, 1967]. Le ltre de Wiener Wiener suppose que l equation 5.2 est perturb ee par un bruit corr el e au signal. L equation 5.2 devient alors :
Wiener recherche une solution lin eaire (donc par convolution de avec un ltre d enot e ). Il veut une solution qui minimise lesp erance de lerreur quadratique int egrale entre le signal et son estim ee, esp erance estim ee sur toutes les r ealisations possibles du bruit :
"
87
remplac ant par , permutant int egrale et esp erance, et imposant a ` chaque composante contribution a ` , on obtient :
"
de minimiser sa
o` u
et
(5.13)
(5.14) (5.15)
Nous voyons le r ole du ltre de Wiener : dans le cas dun d efaut singulier, et en labsence de bruit, il conduit a ` une solution e quivalente a ` celle du ltre inverse. Lorsque le d efaut est singulier, il est e gal a ` la solution de Bracewell. Mais si , sans e tre nul, devient faible, le rapport du d enominateur lemporte sur le terme quadratique , et fait tendre le ltre vers 0. Le ltre ne corrige plus, mais en ces valeurs o` u le signal est faible devant le bruit, le bruit nest pas ampli e par le ltre.
defaut
filtre inverse
F IG . 5.2 A gauche : fonction de transfert ( ) dun d efaut de boug ea ` vitesse constante et le ltre inverse permettant de le corriger. A droite, deux ltres de Wiener de ce m eme d efaut obtenus a ` partir de deux valeurs suppos diff erentes du rapport es constants.
!
Des ltres de Wiener identiques existent pour lapproche alg ebrique. En r` egle g en erale, une solution alg ebrique r egularis ee de l equation 5.6 utilise une matrice inverse approch ee de sous la forme :
o` u est une matrice diagonale a ` termes strictement positifs et major es par 1. u Pour les composantes o` est tr` es faible, la correction sera celle du ltre inverse, pour les composantes o` u est e gal a ` 1, il ny aura aucune correction si est tr` es faible. De la m eme fac on, on d eduit le ltre de Wiener matriciel :
(5.16)
Les deux termes de densit e spectrale et rev etent une importance particuli` ere dans la r egularisation du ltrage dans lapproche de Wiener. Ils sont malheureusement le plus souvent inconnus lors de la r esolution dun probl` eme particulier. Une fac on tr` es r epandue de circonvenir cette ignorance consiste a ` consid erer le rapport signal a ` bruit ee a ` partir des connaissances acquises sur le capteur, comme une constante qui est, soit estim soit recherch ee par des essais successifs de restauration par des valeurs de variables. Une m ethode un peu plus rigoureuse consiste a ` exploiter les propri et es statistiques des images naturelles telles que nous les avons vues au chapitre 2. Consid erant le bruit blanc de variance , et limage comme un processus markovien a ` accroissements gaussiens, caract eris e par la d ecroissance de sa corr elation (cf. e quation 2.12), le terme de r egularisation prend la forme :
propres de o` u est une matrice unitaire, matrice des vecteurs , est la matrice transpos ee ( egale a ` la matrice inverse) de la matrice des vecteurs propres de et une matrice diagonale a ` valeurs r eelles positives ordonn ees par ordre d ecroissant.
La restauration de l equation 5.8 se ram` ene alors a ` la succession dop erations suivantes : 1. pour toutes les valeurs propres de tr` es sup erieures au bruit affectant le signal et engendr e par les calculs, inverser le syst` eme, cest-` a-dire, multiplier par linverse de la valeur singuli` ere correspondante chaque composante du signal ; 2. pour toute valeur singuli` ere nulle ou tr` es inf erieure au bruit, et en labsence dune information a ` priori sur le signal, annuler les composantes du signal ; 3. pour les valeurs singuli` eres tr` es proches du bruit, mettre en uvre toute technique de r egularisation qui appara tra appropri ee, en tirant parti au mieux des connaissances existant sur le signal. Cette d emarche serait a ` conseiller syst ematiquement si sa complexit e en nen rendait la mise en uvre pratiquement impossible.
89
Dans le cas de lapproche alg ebrique, lextension est plus d elicate, puisque limage ne se pr esente pas sous forme dun vecteur monodimensionnel ; il convient donc de la ramener a ` cette forme, a ` laide de se quon appelle la forme d evelopp ee des images [Pratt, 1975]. Cette forme sobtient en rangeant les lignes de limage dans un vecteur , de dimension tr` es grande, (` a composantes si limage est de c ot e ), les unes apr` es les autres.
o` u est maintenant une matrice T oplitz-blocs-T oplitz, cest-` a-dire une matrice de taille , compos ee de matrices de T oplitz, chacune de taille , agenc ees de fac on T oplitz, cest a ` dire de fac on que des matrices identiques se retrouvent sur une m eme diagonale :
. . . . . .
. . .
$
. . .
(5.20)
avec :
. . .
. . . . .
..
(5.21)
$
..
On montre sans peine que les matrices T oplitz-blocs-T oplitz sont asymptotiquement e quivalentes aux matrices circulantes-blocs-circulantes, qui admettent pour vecteurs propres les bases trigonom etriques a ` 2 dimensions. Par cette r ecriture en forme d evelopp ee, il est possible de conserver pour les images tous les r esultats formels obtenus en alg` ebre des matrices et qui forment la base de la restauration alg ebrique. Remarquons cependant que dans le cas des images, compte tenu de la valeur de (de lordre de 500), on se contente de l ecriture formelle, la mise en uvre pratique se faisant toujours par transform ee de Fourier rapide (ou e ventuellement par les m ethodes it eratives que nous verrons maintenant) mais pratiquement jamais par inversion directe de matrice. La g en eralisation se fait sans probl` eme aux approches par SVD, ainsi qu` a des signaux de dimension plus grande, mais la mise en uvre est de plus en plus difcile.
90
passent par le calcul dune s erie de fonctions , convergent vers lestim ee recherch ee et qui permettent donc de sapprocher par e tapes de la restauration. Ces m ethodes reposent g en eralement sur une r ecriture de l equation 5.2 (respectivement 5.6), en d ecomposant la fonction (resp. la matrice de d efaut ) en 2 termes :
(5.22)
et
et la solution initiale peut e tre choisie, soit identiquement nulle, soit al eatoire, soit enn, le plus souvent, e gale a ` limage d efectueuse .
e gal a ` lunit e, ce qui conduit au sch ema : . La quantit e est appel e r esidu de lit eration.
(5.23)
Les conditions de cette convergence sont ais ement discut ees a ` partir de la TF de l equation 5.23 :
qui, si lon choisit , donne par r ecurrence : e quation qui converge vers :
avec ses qualit es (restauration exacte dans les cas r eguliers et bien conditionn es), et ses d efauts (divergence dans le cas de syst` eme singulier, instabilit e dans le cas de mauvais conditionnement). On peut cependant y ajouter des qualit es propres aux techniques it eratives : 1. il nest pas n ecessaire dinverser le d efaut, mais il suft de lappliquer fois aux solutions successives de lit eration (cela permet en particulier, pour des syst` emes dimagerie disponibles a ` lutilisateur, de ne pas d eterminer le d efaut, mais dutiliser le syst` eme d efectueux lui-m eme pour se corriger [Ma tre, 1981]) ; 2. si le d efaut est tr` es compact (support de tr` es e troit), lop eration de convolution peut e tre r eduite a ` un nombre tr` es petit dop erations, et la solution it erative est alors beaucoup moins co uteuse que le ltrage inverse ; 3. lop erateur peut voir les r esultats des it erations successives de la restauration et intervenir sur elle en interrompant par exemple la correction en cas de divergence du syst` eme (lexp erience montre que ce sont g en eralement les valeurs propres les mieux conditionn ees qui sont lobjet des corrections des premi` eres it erations, la divergence nintervenant quapr` es une premi` ere phase de restauration [Ma tre, 1981]) ; 4. la correction it erative se pr ete bien a ` lintroduction, dans la recherche de la solution optimale, de connaissances a ` priori ou de contraintes non lin eaires (par exemple contraindre limage solution a `e tre positive, ou damplitude born ee, ou a ` support e troit, etc.).
si et seulement si . On reconna t donc une op eration e quivalente au ltrage inverse ( equation 5.2),
'
91
En cas de convergence de la m ethode de Jacobi, il est possible de modier le sch ema de l equation 5.23 en introduisant un facteur de relaxation choisi entre 0 et 2 et permettant, soit dacc elerer la convergence ( ) on parle alors de sur-relaxation, soit dam eliorer son conditionnement ( 1) :
a ` la
Ces formules sont des expressions classiques en analyse num erique ; en traitement des images, on leur pr ef` ere des techniques dont la convergence est g en eralement assur ee vers la solution principale au sens de Bracewell (ou vers la matrice pseudo-inverse de norme minimale) comme la m ethode du gradient conjugu e ou les m ethodes de projection (m ethodes POCS).
n Si la matrice nest pas d enie non eme, si elle nest ee), on r esout, comme on la vu en egative (ou m pas carr section 5.2.1, le syst` eme au lieu du syst` eme . Les avantages de la m ethode du gradient conjugu e sont tout dabord sa convergence inconditionnelle (vers la solution pseudo-inverse), et ensuite sa tr` es grande vitesse de convergence [Hestenes, 1975].
92
o` u
% % ! !
(5.24)
On est e galement dans ces conditions favorables lorsque le syst` eme dimagerie e autour de l equation est constitu de convolution 5.2 an de permettre de mesurer indirectement une grandeur inaccessible. Cest le cas de la tomographie par exemple, ou de limagerie sismique ou encore dans les syst` emes a ` synth` ese douverture comme on en rencontre en radar [Ma tre, 2001], en acoustique ou en astronomie [Roddier, 1999]. Ainsi, en tomographie m edicale [Grangeat, 2001], le signal mesur e est lint egrale, le long de la ligne de propagation des rayons X, du signal int eressant , la densit e des tissus biologiques observ es. Lorsque la source de rayons X et le capteur se d eplacent en translation et en rotation autour du patient, les signaux et sont li es par une r eponse impulsionnelle [Grangeat, 2001].
!
R x L S x L R
F IG . 5.3 Construction de limage en tomographie m edicale. est la source de rayons X, mesure est lint egrale le long de de latt enuation des rayons X due aux tissus.
93
Mais dans de nombreux cas on ne dispose que de la seule image d efectueuse . Il est alors tr` es difcile de remonter au d efaut sans aucune information a priori sur celui-ci. Heureusement on sait souvent quelle classe de d efaut peut avoir affect e limage. Cest le plus souvent un d efaut de mise au point, ou un d efaut de boug e, lobjet ou la cam era e tant en mouvement pendant la prise de vue. Il sagit alors de conrmer le d efaut, puis de d eterminer son ampleur. Une bonne fac on de proc eder consiste a `e tudier le spectre de densit e de puissance de limage d efectueuse. Dapr` es l equation 5.4, il sexprime par :
Or la plupart des d efauts pr esentent des z eros dans leur fonction de transfert
(5.25)
1. les boug es a ` vitesse constante dont la r eponse impulsionnelle est une fonction porte dans la direction du d eplacement et de largeur x ee par la vitesse et le temps de pose : est alors un sinus cardinal ;
2. les d efauts de mise au point dont la r eponse impulsionnelle est un cercle et la fonction de transfert une fonction de Bessel de premi` ere esp` ece semblable a ` celle de l equation 5.24, mais dans le plan des fr equences. On voit sur l equation 5.25 que ces z eros se retrouvent dans le spectre , alors quils sont tr` es improbables dans le spectre dune image (cf. chapitre 2). En d etectant ces z eros, il est alors possible de conrmer la pr esence du d efaut et de d eterminer les param` etres qui le caract erisent.
94
Chapitre 6
On trouve a ` la base des transformations de morphologie math ematique quatre principes fondamentaux qui guident leur construction et qui sont v eri es pour la plupart des op e rations. Ils sont exprim es ci-dessous pour une op eration quelconque, agissant sur un ensemble ou une fonction d enie sur . Compatibilit e avec les translations : Ce principe exprime lind ependance des transformations par rapport a `
95
96 lorigine de lespace1 :
Compatibilit e avec les homoth eties : Ce principe assure lind ependance des transformations par rapport a ` un param` etre d echelle :
d esigne la restriction de au domaine . Semi-continuit e : ce principe (voir d enitions 18 et 22) assure la robustesse des transformations. Outre ces propri et es fondamentales, les op erateurs de morphologie math ematique peuvent avoir des propri et es alg ebriques dont les principales sont d enies ci-dessous. ou des fonctions de dans est D enition 1. Croissance : Une transformation sur des ensembles de croissante si :
o` u
dans un domaine
de
born e
est anti-extensive si :
ou des fonctions
ou des fonctions de
dans
est
et
o` u
ou des fonctions de
dans
sont
dans
'
(cest-` a-dire
),
1 Cette
propri et e est appel ee aussi invariance spatiale dans dautres th eories du traitement dimages.
97
Notons que pour des images num eriques, repr esent ees par des fonctions a ` valeurs positives et born ees par une valeur maximale ! , la dualit e sexprime par :
Nous verrons dans la suite que ce principe de dualit e exprime le fait que deux op erations, qui ne sont pas linverse lune de lautre, ont des effets contraires (les op erations de morphologie math ematique e tant g en eralement non inversibles).
Pour d ecrire de mani` ere tr` es synth etique la bo te a ` outils de la morphologie math ematique, il faut retenir les points suivants : les transformations sont non lin eaires, elles sont fond ees sur des op erations de type sup et inf ; les transformations sont g en eralement non inversibles, et elles perdent donc de linformation ; le travail du morphologue consiste alors a ` d eterminer les transformations adapt ees a ` son probl` eme, cest-` a-dire qui vont simplier les images en retenant linformation pertinente ; des propri et es analytiques et alg ebriques sont attach ees aux op erations, ce qui permet dassurer des propri et es pr ecises sur les objets ou images issues des transformations ; cest sur ces propri et es que lon sappuie pour encha ner les transformations an de r esoudre un probl` eme particulier ; aux transformations sont e galement associ es des algorithmes, qui permettent de les appliquer de mani` ere efcace. Les parties suivantes sattachent a ` d ecrire plus pr ecis ement ces concepts pour les principales op erations morphologiques.
98
Dans toute cette partie, on consid erera des ensembles de . Un e l ement structurant est e galement un ensemble dont on se donne la forme et la taille, et dont on particularise un point (lorigine) quon appelle le centre (qui nest pas forc ement le centre g eom etrique). D enition 5. Dilatation binaire : La dilatation binaire dun ensemble par un e ement structurant est d enie l comme lensemble obtenu par addition de Minkowski de par le sym etrique de par rapport a ` son centre :
(6.1)
(6.2)
Il existe des d enitions l eg` erement diff erentes, pour lesquelles la dilatation est e gale a ` laddition de Minkowski. Cela implique des modications des propri et es, en particulier dans les relations de dualit e, mais permet une meilleure conformit e avec le cadre alg ebrique que nous verrons plus loin. L equation 6.2 est e quivalente aux expressions suivantes :
!
o` u d esigne e de l el ement structurant au point (cest-` a-dire le centre de l el ement structurant le translat co ncide avec ). Dans cette formulation ( equation 6.3) apparaissent clairement les concepts de lapproche ensembliste : ici la relation impos ee entre la forme e tudi ee et l el ement structurant est lintersection. Ainsi, un point appartient a ` lobjet r esultat si l el ement structurant centr e en ce point intersecte lobjet initial. Propri et es de la dilatation. La dilatation a les propri et es suivantes (les d emonstrations sont imm ediates en utilisant les formules 6.2 ou 6.3) : ` , elle est extensive ( ) si le centre de appartient a elle est croissante ( ), , elle commute avec la r eunion mais pas avec lintersection :
(6.3)
Ces propri et es alg ebriques ont des cons equences importantes sur les applications de cette transformation, a ` la fois du point de vue algorithmique et du point de vue des propri et es des objets obtenus. Par exemple, la relation dit eration permet de calculer une dilatation par un disque de rayon 2 soit directement, soit comme une suite de deux dilatations par un disque de rayon 1. De plus, la dilatation v erie les 4 principes fondamentaux donn es en introduction. Exemples. La dilatation par un segment centr ea ` une de ses extr emit es a pour effet d etendre lobjet dans la direction oppos ee a ` celle du segment (alors que laddition de Minkowski e tend lobjet dans la direction du
99
segment). Notons que la distinction entre addition de Minkowski et dilatation tombe d` es quon utilise des e l ements structurants sym etriques, ce qui est souvent le cas. La dilatation par un disque a pour effet daugmenter la taille des objets selon la taille du disque, de relier entre elles les composantes proches et de boucher les petits trous (plus petits que l el ement structurant). La gure 6.1 illustre ces effets.
F IG . 6.1 Exemple de dilatation binaire (de gauche a ` droite : image initiale, dilatation par un disque de taille 3, diff erence : en blanc, les parties rajout ees par la dilatation). D enition 6. Erosion binaire : L erosion dun ensemble
!
!
L equation 6.4 correspond a ` lapproche ensembliste, o` u cette fois la relation impos ee entre l ement structurant el et la forme est linclusion. L equation 6.5 fait r ef erence a ` la soustraction de Minskowski not ee . Propri et es de l erosion. La propri et e essentielle de l erosion est quelle est la transformation duale de la dilatation par rapport a ` la compl ementation : (6.6)
Ainsi, il est e quivalent d eroder un objet ou de dilater son compl ementaire. Cette propri et e peut e galement e tre pr esent ee comme d enition, dont on d eduit alors les expressions 6.4 et 6.5. L erosion a les propri et es alg ebriques suivantes (elles peuvent e tre d emontr ees soit directement a ` partir des formules 6.4 et 6.5, soit d eduites de celles de la dilatation gr ace a ` la formule de dualit e 6.6) : elle est anti-extensive si le centre de appartient a ` , elle est croissante, , elle satisfait les relations suivantes par rapport a ` la r eunion et a ` lintersection (en particulier, elle commute avec lintersection) :
100
(6.7)
De plus, l erosion v erie les 4 principes e nonc es en introduction. Exemples. L erosion par un disque a les effets suivants : lobjet est diminu e selon la taille de l el ement structurant, les composantes connexes de lobjet plus petites que l el ement structurant sont supprim ees, les parties des objets reli ees par des isthmes plus ns que l el ement structurant sont d econnect ees. La gure 6.2 illustre ces effets.
F IG . 6.2 Exemple d erosion binaire (de gauche a ` droite : image initiale, e rosion par un disque de taille 3, diff erence : en blanc, les parties supprim ees par l erosion). Liens avec la fonction distance. La fonction distance (voir chapitre 4) a de nombreuses applications en morphologie math ematique (outre toutes les applications n ecessitant une estimation de la distance entre objets comme le recalage). En voici quelques exemples : elle permet deffectuer tr` es rapidement des dilatations et e rosions de taille quelconque : en effet, la fonction distance calcul ee avec les masques de la gure 4.33 a et b (chapitre 4) fournit des courbes de niveaux autour de lobjet qui correspondent exactement aux points qui seraient rajout es a ` lobjet par des dilatations successives par les e l ements structurants e l ementaires ; il suft alors de seuiller la fonction distance a ` la taille de dilatation souhait ee pour obtenir, en deux passes seulement, le dilat e (pour l erosion, on proc` ede de m eme, en calculant cette fois la distance des points de lobjet au compl ementaire) ; elle permet de r ealiser des dilatations et e rosions par des e l ements structurants proches dun disque (par exemple avec le masque de la gure 4.33 d, chapitre 4) ; elle permet dobtenir tr` es rapidement les e rod es ultimes dun ensemble dobjets (cest-` a-dire les compo santes connexes de qui disparaissent par une e rosion de taille ), comme maxima r egionaux de la fonction distance ; elle peut e tre utilis ee pour le calcul de squelettes. La gure 6.3 montre que les courbes diso-distances a ` lint erieur des objets sont les e rod es successifs de ces objets.
101
F IG . 6.3 Les courbes diso-distances a ` lint erieur des objets sont les e rod es successifs. 1. soit en remplac ant dans les d enitions tous les concepts ensemblistes par leurs e quivalents fonctionnels :
! "!
(6.8)
2. soit en consid erant le sous-graphe de la fonction (voir d enition 23) comme un ensemble binaire (dans un espace de dimension ) et en lui appliquant les op erations binaires. quivalentes (pour des fonctions semi-continues sup erieurement a ` valeurs dans ! Ces deux approches sont e et des e l ements structurants born es) mais la premi` ere est plus op erationnelle. Les e quivalences des expressions 6.8 se retrouveront dans les d enitions et les propri et es qui suivent. Cette g en eralisation est indispensable pour pouvoir traiter des images a ` niveaux de gris. Nous consid ererons tout dabord des e l ements structurants binaires, puis nous donnerons les d enitions g en erales des transformations sur des fonctions avec des e l ements structurants fonctionnels. D enition 7. Dilatation fonctionnelle ( el ement structurant binaire) : La dilatation dune fonction par un enie par : e ement structurant est la fonction d l
(6.9)
L equation 6.9 fait appara tre explicitement que les valeurs de intervenant dans le r esultat de lop eration en un point sont celles prises dans un voisinage de ce point, ce voisinage e tant d eni par l el ement structurant 2. Propri et es. La dilatation a les propri et es suivantes (analogues des propri et es de la dilatation binaire) : elle est extensive si le centre de appartient a ` , elle croissante, est , , elle v erie les quatre principes e nonc es en introduction. Exemples. Sur une image a ` niveaux de gris, la dilatation par un disque augmente les niveaux de gris, propage les maxima locaux des niveaux de gris (dans une r egion correspondant a ` la taille et a ` la forme de l el ement structurant). La gure 6.4 illustre ces effets.
2 On
102
F IG . 6.4 Exemple de dilatation num erique (de gauche a ` droite : image initiale, consid er ee comme une fonction sur lespace a ` deux dimensions, dilatation par un disque de taille 3). D enition 8. Erosion fonctionnelle ( el ement structurant binaire) : L erosion dune fonction enie par : structurant est la fonction d
!
Ici encore, la valeur prise en un point d epend uniquement des valeurs de dans un voisinage, d eni par , de ce point. Propri et es. L erosion a les propri et es suivantes (similaires a ` celles de l erosion binaire) : elle est duale de la dilatation, elle est anti-extensive si le centre de appartient a ` , elle est croissante, , , elle v erie les quatre principes de lintroduction. Exemples. L erosion dune image a ` niveaux de gris par un disque a pour effet de diminuer les niveaux, et de propager les minima dans une r egion d enie par l el ement structurant. La gure 6.5 illustre ces effets. Notons que la dilatation et l erosion sont des cas particuliers de ltres de rang (voir chapitre 10). Dans un tel ltre, les niveaux de gris des voisins dun point sont class es par ordre croissant et la valeur de ce point est remplac ee par celle dun rang donn e. Le min utilis e dans l erosion correspond donc a ` un ltre de rang 1 et le max de la dilatation a ` un ltre de ranf (si le voisinage comporte points). Cependant ce ne sont pas des ltres au sens morphologique du terme. Cas discret. Une fois les notions de topologie d enies sur la trame discr` ete, la transposition des d enitions morphologiques de base ne pose pas de probl` eme. Elles sexpriment de la m eme mani` ere que dans le cas continu, ou plus simplement puisque les sup et les inf deviennent des max et des min lorsque l el ement la dilatation par un e l e ment structurant de taille 1 en struturant contient un nombre ni de points. Par exemple, 4-connexit e, sexprime en tout point ! de coordonn ees de la trame par :
que soit une fonction ou un ensemble. Cette formule fournit en m eme temps un moyen op erationnel simple pour calculer la dilatation.
103
F IG . 6.5 Exemple d erosion num erique (de gauche a ` droite : image initiale et e rosion par un disque de taille 3). Il est remarquable de noter que toutes les propri et es de la dilatation, de l erosion, de louverture et de la fermeture (qui seront vues plus loin) sont encore valables sur une trame discr` ete (si lon exclut celles li ees a ` la semi-continuit e qui nont pas de sens dans ce cas)3 . Si la transposition de ces op erations de base est si ais ee, cest que celles-ci impliquent essentiellement des notions ensemblistes ( eventuellement g en eralis ees a ` des fonctions comme nous lavons vu plus haut) et des concepts topologiques tr` es simples, de voisinage entre points uniquement. Des transformations plus complexes impliquant des notions topologiques plus globales (pr eservation de la connexit e et de lhomotopie dun objet par exemple) sont beaucoup plus d elicates a ` transposer. Ce sera le cas par exemple du squelette (voir parties 6.8.3 et 6.8.4) : les d enitions continues ont de tr` es bonnes propri et es mais leur transposition directe au cas discret en fait perdre la plupart. On est alors conduit a ` red enir le squelette directement dans lespace discret, par des proc ed es qui garantissent les propri et es que lon veut conserver. Sans aller chercher des transformations aussi complexes, une simple rotation peut d egrader les propri et es topologiques dun objet (par exemple lui faire perdre sa connexit e, ou faire appara tre des trous l` a o` u il ny en avait pas). dans Consid des ements a-dire des fonctions de erons maintenant e l structurants fonctionnels, cest-` ! telles que est born e. D enition 9. Dilatation par une fonction : La dilatation dune fonction par une fonction est la fonction d enie par : (6.11)
!
D enition 10. Erosion par une fonction : L erosion dune fonction par :
Lint er et de ces e l ements structurants est quils permettent de r ealiser des op erations plus nes quavec des e l ements structurants binaires. Par exemple, il est ainsi possible de modier un relief (l ecr eter par exemple) dans nimporte quelle direction, et pas seulement parall` element au plan de limage comme avec des e l ements structurants binaires (plans).
3 Notons que dans lexpression de la dualit e entre dilatation et e rosion, et entre ouverture et fermeture, l el ement structurant reste le m eme des deux c ot es de l egalit e.
104
L equation 6.7 montre, si on lexprime pour , que la dilatation nest pas linverse de l erosion. Par exemple, si lon effectue dabord une e rosion puis une dilatation, les composantes connexes de lobjet qui ont e t e supprim ees par l erosion (` a cause de leur petite taille) ne peuvent plus e tre recouvr ees par la dilatation et sont donc d enitivement perdues. On construit donc ainsi une nouvelle transformation par composition dune e rosion et dune dilatation, appel ee ouverture. D enition 11. Ouverture binaire : Louverture de lensemble par l el ement structurant est d enie par :
(6.13)
Propri et es. Louverture a les propri es alg ebriques suivantes : et elle est anti-extensive ( )4 , ), elle est croissante ( ). elle est idempotente ( Ces propri et es sont fondamentales puisquelles font de louverture un ltre morphologique. , et si d esigne louvert de par un e l ement structurant de taille , On a de plus . Louverture v erie les 4 principes fondamentaux (comme compos ee de deux op erations les satisfaisant). Exemples. Louverture a pour effet de supprimer les parties des objets plus petites que l el ement structurant, et de lisser les contours en supprimant les petites excroissances (trop nes pour pouvoir contenir l el ement structurant). Cest leffet de ltrage d ecrit alg ebriquement ci-dessus. Elle ne r eduit pas syst ematiquement toutes les structures comme le fait l erosion. La gure 6.6 illustre ces effets.
F IG . 6.6 Exemple douverture binaire (de gauche a ` droite : image initiale, ouverture par un disque de taille 3, diff erence : en blanc, les parties supprim ees par louverture). D enition 12. Fermeture binaire : La fermeture de lensemble
Propri et es. La fermeture a les propri es alg ebriques suivantes : et elle est extensive ( ), elle est croissante,
4 Contrairement
a ` la dilatation et a ` l erosion, cette propri et e est vraie sans restriction sur l el ement structurant.
105
elle est idempotente. De m eme que pour louverture, ces propri es font de louverture un ltre morphologique. et On , et si d esigne le ferm e de par un e l ement structurant de taille , a de plus . La fermeture v erie les 4 principes fondamentaux (comme compos ee de deux op erations les satisfaisant). Enn, la fermeture est lop eration duale de louverture par rapport a ` la compl ementation :
(6.15)
ce qui permet de d eduire les propri et es et laction dune des op erations de celles de lautre. Exemples. La fermeture a pour effet de boucher les trous des objets qui sont plus petits que l el ement structurant. Elle lisse les contours des objets en rajoutant des points dans les concavit es e troites (dans lesquelles ne peut pas se glisser l el ement structurant). On retrouve leffet de ltrage, dual de celui de louverture, d ecrit par les trois propri et es alg ebriques ci-dessus. La gure 6.7 illustre ces effets.
F IG . 6.7 Exemple de fermeture binaire (de gauche a ` droite : image initiale, fermeture par un disque de taille 3, diff erence : en blanc, les parties rajout ees par la fermeture).
par un (6.16)
Propri et es. Louverture est croissante, anti-extensive et idempotente, ce qui lui conf` ere une nature de ltre morphologique. Exemples. Louverture sur une image a ` niveaux de gris a pour effet d ecr eter les pics (si on consid` ere le sousgraphe de la fonction comme un relief) qui sont plus e troits que l el ement structurant. La gure 6.8 illustre ces effets. D enition 14. Fermeture num erique : (par un e ement structurant binaire) La fermeture dune fonction par l un e ement structurant est d enie comme dans le cas binaire par : l
(6.17)
106
F IG . 6.8 Exemple douverture num erique (de gauche a ` droite : image initiale et ouverture par un disque de taille 3). Propri et es. La fermeture est duale de louverture. De plus, comme dans le cas binaire, elle est croissante, extensive et idempotente, ce qui lui conf` ere une nature de ltre morphologique. Exemples. La fermeture a leffet dual de louverture : elle comble les vall ees qui sont plus e troites que l el ement structurant. La gure 6.9 illustre ces effets.
F IG . 6.9 Exemple de fermeture num erique (de gauche a ` droite : image initiale et fermeture par un disque de taille 3).
107
Dans la suite, on note lensemble des ferm es de , lensemble de ses ouverts, et lensemble de ses compacts, pour la topologie usuelle de . D enition 15. Topologie en tout ou rien : La topologie en tout ou rien sur est engendr ee par la famille :
o` u , et .
La topologie en tout ou rien est donc engendr ee par les ferm es qui, e tant donn es un compact et une famille douverts, nintersectent pas le compact et intersectent chacun des ouverts. La convergence pour la topologie en tout ou rien est d enie de la mani` ere suivante : es converge vers si pour tout ouvert D enition 16. Convergence dans : Une suite de ferm qui intersecte et tout compact qui nintersecte pas , on a :
On montre que la r eunion de dans est continue pour cette d enition mais que lintersection ne lest pas. Cela nous conduit a ` introduire les notions de semi-continuit e. , not ee D erieure et sup erieure : La limite inf erieure dune suite de ferm enition 17. Limites inf e s est lintersection des points dadh erence de la suite, et sa limite sup erieure, not ee est la r eunion des points dadh erence. D enition 18. Semi-continuit e : Une application dun ensemble dans est semi-continue sup erieurement de convergeant vers : (s.c.s.) si pour tout de et toute suite
De m eme ,
Notons quune application est continue ssi elle est a ` la fois s.c.s. et s.c.i. Lintersection de dans est s.c.s. Ces propri et es de lintersection et de la r eunion seront directement utilis ees pour en d eduire des propri et es des transformations de morphologie math ematique construites selon lapproche ensembliste. On a ainsi les r esultats suivants : la dilatation dun ferm e par un compact est continue (le r esultat est un ferm e), cest-` a-dire a ` la fois s.c.s. et s.c.i., la dilatation dun compact par un compact (le r esultat est un compact), est continue lapplication de dans qui a ` associe est s.c.s., de m eme, lapplication de dans qui a ` associe est s.c.s., lapplication de dans qui a ` associe est s.c.s., de m eme, lapplication de dans ` associe est s.c.s., qui a lapplication de dans qui a ` associe est s.c.s., de m eme, lapplication de dans qui a ` associe est s.c.s. Ces propri et es fortes de la dilatation et de l erosion en termes de continuit e lorsque l el ement structurant est compact incitent a ` choisir pour les applications des e l ements structurants compacts. D enition 19. Topologie myope : La topologie myope sur est engendr ee par la famille :
o` u
et .
108
La topologie myope est plus ne que la topologie induite sur par la topologie en tout ou rien sur e quivalente sur ` la topologie induite par la distance de Hausdorff. a D enition 20. Distance de Hausdorff : La distance de Hausdorff entre deux compacts non vides et d enie par :
, et est
).
Cette distance est souvent utilis ee pour comparer deux ensembles et estimer leur proximit e. Notons que cette distance est tr` es sensible aux d eformations qui peuvent se produire a ` la surface des objets 5 .
6.4.1 Treillis
D enition 21. Treillis : Un treillis est un ensemble muni dune el ements relation dordre , tel que toute paire d (ou toute famille nie) poss` ede une borne sup erieure (not ee ) et une borne inf erieure (not ee ). Un treillis est complet si toute famille d el ements (nie ou non) poss` ede un plus petit majorant et un plus grand minorant. Un treillis complet contient en particulier un plus petit e l ement et un plus grand e l ement. Lensemble des fonctions de dans est un treillis complet, pour la relation dordre d enie par :
La semi-continuit e pour des fonctions est d enie de la mani` ere suivante. erieurement en si : D enition 22. Semi-continuit e dune fonction : Une fonction est semi-continue sup
o` u
est un voisinage de
dans
. De m eme,
de
Remarquons quune fonction est s.c.s. ssi son sous-graphe est ferm e. Lensemble des fonctions s.c.s. de dans est un treillis complet, pour la relation dordre d enie par :
5 Le probl` eme de la d enition dune distance entre objets est r eput e difcile et la plupart des distances utilis ees, comme la distance de Hausdorff, ne donnent quune information partielle sur la ressemblance des objets. La distance de Hausdorff est cependant bien adapt ee a ` une grande classe de probl` emes, en particulier gr ace a ` ses liens e troits avec la morphologie math ematique.
109
Cette propri et e montre lint er et du cadre fourni par les treillis pour la morphologie math ematique. Un autre int er et vient du fait que les op erations de morphologie math ematique sont fond ees sur des sup et des inf comme nous lavons vu dans la partie 6.2. La notion de sous-graphe permet de faire un lien direct avec lapproche ensembliste dune part puisque les sous-graphes sont des ensembles de , et avec lapproche topologique dautre part puisque la topologie utilis ee sur lespace des fonctions s.c.s. est celle induite par la topologie en tout ou rien sur .
(6.18)
est une famille ( eventuellement vide) d el ements de . rosion alg De mani` ere similaire, une e ebrique est une fonction sur telle que :
o` u
Notons que cette d enition suft a ` garantir que les dilatations et e rosions alg ebriques sont croissantes. Une propri et e fondamentale dans le cadre des treillis est celle dadjonction. sur est une adjonction si est seulement si : D enition 25. Une paire dop erateurs
(6.20)
Propri et erations alg ebriques et adjonctions : es. On a les relations suivantes entre op si est une adjonction, alors est une e rosion alg ebrique et est une dilatation alg ebrique ; un op erateur croissant est une dilatation alg ebrique si et seulement si il existe un op erateur tel que soit une adjonction ; est alors une e rosion alg ebrique et vaut :
un op erateur croissant est une e rosion alg ebrique si et seulement si il existe un op erateur soit une adjonction ; est alors une dilatation alg ebrique et vaut :
tel que
Sur le treillis bool een des parties de ou (la relation dordre est alors linclusion), le dilat e de nimporte quelle partie peut e tre exprim e comme la r eunion des dilat es des singletons qui la composent :
De plus, tout dilatation invariante par translation peut sexprimer comme une dilatation morphologique, d enie a ` partir dun e l ement structurant comme dans la section 6.2. Des r esultats similaires sont valables pour les e rosions.
110
De plus, et sont toujours idempotentes, ce sont donc des exemples douverture et fermeture alg ebriques respectivement, appel ees ouverture et fermeture morphologiques.
&
(6.21)
conduit alors a La donn ee dune probabilit e sur lespace mesurable ` la notion densemble ferm e al eatoire. D enition 28. Ensemble ferm e al eatoire e al eatoire , not e est d etermin e : Un ensemble ferm par la donn ee dune probabilit e sur . D enition 29. Capacit e de Choquet : La capacit e de Choquet dun ensemble ferm e al eatoire est la fonctionnelle d enie par :
La capacit e de Choquet joue un r ole analogue a ` celui de la fonction de r epartition dune probabilit e sur . On montre quun ensemble ferm e al eatoire est enti` erement caract eris e par sa capacit e de Choquet. En pratique, cela fournit un moyen op e ratoire de caract e risation dun ph e nom` e ne al e atoire, puisque la connaissance des est sufsante, ce qui limite les mesures a ` effectuer. Les applications de ces concepts concernent des mesures de ph enom` enes al eatoires, comme par exemple des sch emas bool eens, ou lanalyse de textures.
avec , o` u d esigne le volume de . De plus, si deux compacts et sont disjoints, alors les variables al eatoires qui comptent les points tombant dans et dans sont ind ependantes (voir chapitre 4, section 4.5). On appelle e al eatoire . Le sch ema bool een grain primaire un ensemble ferm dintensit e et de grain primaire est alors d eni par :
(6.22)
o` u les sont des compacts al eatoires ind ependants de m eme loi et translat es aux points du processus de Poisson. On garantit que cette r eunion est un ferm e en imposant que le volume moyen de est ni, pour e gal a ` la boule unit e. Un tel sch ema bool een est stable par r eunion. On a alors la caract erisation suivante en fonction de la capacit e de Choquet :
(6.23)
o` u d esigne le volume moyen. Cette caract erisation permet de d enir des proc edures dinf erence des param` etres du mod` ele, a ` une translation pr` es [Schmitt et Mattioli, 1994a].
(6.24)
112
o` u d esigne l erod e de de taille et d esigne les composantes connexes de qui ont une intersection non vide avec . L erod e ultime dun ensemble est exactement lensemble des maxima r egionaux de la fonction distance a ` ` ). lint erieur de (distance des points de a
Le rehaussement de contraste morphologique dune fonction est d eni a ` partir dune fonction minorante et . Le r dune fonction majorante et de deux param` etres et tels que , et esultat de cette transformation est obtenu en faisant basculer les points vers la fonction minorante ou vers la fonction majorante suivant la r` egle suivante :
avec . La morphologie math ematique fournit naturellement des fonctions minorantes (resp. majorantes) a ` partir de transformations anti-extensives (resp. extensives) comme l e rosion de par un e l e ment structurant centr e, ou encore louverture de (resp. dilatation ou fermeture). La gure 6.10 donne un exemple de rehaussement de contraste a ` partir des dilatation et e rosion des gures 6.4 et 6.5.
si si si
et dans le cas discret par :
113
Cette transformation trouve ses applications dans la d etection de contours. La gure 6.11 donne un exemple de gradient obtenu par diff erence des dilatation et e rosion de taille 1.
Notons quon obtient bien ainsi des op erations croissantes et idempotentes (donc des ltres morphologiques). Ils sont utilis es en pratique pour ltrer progressivement le bruit positif (pics e troits) et le bruit n egatif (vall ees etermin e en fonction de la taille minimale des e troites). Le dernier e l ement structurant utilis e (de taille ) est d objets de limage que lon veut conserver apr` es le ltrage. La gure 6.12 donne des exemples de ltres altern es s equentiels.
(6.26)
114
o` u d esigne lidentit e. Les travaux de H. Heijmans se sont attach es a ` formaliser cette notion de ltres auto-duaux dans un cadre alg ebrique.
Cette transformation extrait les pics e troits (plus e troits que l el ement structurant) quelle que soit leur hauteur absolue. Elle permet par exemple dextraire des lignes nes de niveau intense par rapport a ` leur voisinage (telles que des routes dans une image satellitaire). Lop eration duale extrait au contraire des vall ees e troites. La gure 6.13 donne un exemple de chapeau haut de forme obtenu pour une ouverture de taille 3.
115
F IG . 6.13 Exemple de chapeau haut de forme obtenu pour une ouverture de taille 3. Si lon applique cette transformation avec des e l ements structurants fonctionnels, par exemple des sph` eres de , on s electionne alors les contours abrupts dans limage, ou encore les pics de courbure plus forte que l el ement structurant.
Il est clair, dapr` es cette d enition, que la famille douvertures par des boules de rayon d enit une granu est une granulom est une ouverture pour tout et la lom etrie. On montre m eme que e trie si et seulement si pour . classe des ensembles de invariants par est incluse dans celle des invariants par Ainsi, si on applique a ` un ensemble une suite douvertures de tailles croissantes (par des boules), on s electionnera dabord les plus petites parties de lensemble (celles qui sont supprim ees par louverture), puis des parties de plus en plus grosses. La gure 6.14 montre une courbe de granulom etrie obtenue sur une image binaire par ouvertures de diff erentes tailles. Lorsque la taille de louverture correspond a ` la taille caract eristique de la plupart des objets, un saut appara t dans la courbe.
est connexe et
(6.27)
116
est la surface de (ou son volume en 3D). d esigne une ouverture par et
et a `
117
(6.28) (6.29)
Lamincissement, op eration anti-extensive, supprime donc de des points qui sont dans une conguration particuli` ere, s electionn es par la transformation en tout ou rien. Les e l ements structurants appropri es sont ceux epaississement rajoute au contraire a ` les points s electionn es par la pour lesquels lorigine appartient a ` . L transformation en tout ou rien et est une op eration extensive. Les e l ements structurants appropri es sont ceux pour lesquels lorigine appartient a ` . Ces deux transformations sont duales lune de lautre au sens suivant :
avec si . Il existe tout un alphabet d el ements structurants, appel e alphabet de Golay en trame hexagonale, qui permet deffectuer une grande vari e t e dop e rations [Serra, 1982a]. Par exemple : si est l el ement structurant e l ementaire sur la trame consid er ee et est vide, la transformation en tout ou rien est une e rosion et lamincissement correspondant extrait la fronti` ere des objets ; si les congurations recherch ees par la transformation en tout ou rien correpondent a ` un point du compl ementaire entour e de points de lobjet formant une conguration localement non convexe, l epaississement correspondant (appliqu e it erativement jusqu` a convergence) permet de calculer le plus petit convexe discret contenant lobjet de d epart ; si est le point central de l el ement structurant e l ementaire et contient les autres, la transformation en tout ou rien s electionne les points isol es de lobjet ; etc. Nous verrons dans la suite que des congurations particuli` eres permettent dextraire le squelette dun objet par amincissement.
6.8.3 Squelette
Le squelette est une notion tr` es utile en reconnaissance de formes : en effet, il sagit dune repr esentation des objets, quon souhaite intuitivement compacte (lignes nes centr ees dans les objets), homotopique a ` lobjet de d epart (m eme nombre de composantes connexes et m eme nombre de trous), et inversible. En morphologie math ematique, on arrive a ` une d enition du squelette dans le cas continu qui a de bonnes propri et es par rapport a ` ces exigences. En revanche, le passage au discret est tr` es d elicat pour cette transformation. Dans le cas continu, le squelette est d eni comme lensemble des centres des boules maximales incluses dans lobjet (une boule e tant maximale si elle ne peut e tre incluse dans aucune autre boule incluse dans lobjet). On travaille g en eralement sur les ferm es en morphologie math ematique. Cependant, dans le cas du squelette, cela conduit a ` de mauvaises propri et es : le squelette dun ensemble connexe nest pas n ecessairement connexe, il nest pas n ecessairement ferm e, et lapplication qui a ` un ferm e associe ladh erence de son squelette nest ni s.c.s., ni s.c.i. On travaillera donc, pour le cas du squelette, sur des ouverts. D enition 33. Squelette : Le squelette dun ouvert est lensemble des centres des boules ouvertes maximales incluses dans . En appelant lensemble des centres des boules ouvertes maximales de rayon donn e , on obtient le squelette comme r eunion de tels ensembles :
o` u de
(resp.
esigne la boule ouverte (resp. ferm ee) de rayon . Cela fournit une caract erisation du squelette # ) d
(et un moyen op eratoire pour le calculer) a ` partir de ses e rod es et des ouverts de ses e rod es :
(6.30)
Lobjet de d epart peut e tre reconstruit a ` partir de son squelette (et donc la propri et e dinversibilit e est satisfaite) :
Pour la d enition 33, on montre de plus que lapplication qui a ` associe ladh erence de son squelette # est s.c.i. de dans , que si est connexe alors # est connexe, et que le squelette est n au sens suivant : lint erieur du squelette est vide. Le squelette ainsi d eni v erie donc bien les propri et es quon en attend intuitivement.
(6.31)
o` u est l el ement structurant e l ementaire sur la trame. Cette d enition, que lon trouve aussi sous le nom daxe m edian, correspond aux centres des boules maximales (discr` etes) incluses dans lobjet. Si la propri et e dinversibilit e est conserv ee avec l equation 6.31, les autres sont perdues, en particulier la pr eservation de la connexit e. Deux classes de m ethodes ont alors e t e propos ees pour r esoudre ce probl` eme : la premi` ere tente de relier entre eux les points d etect es par l equation 6.31 pour en faire une ligne m ediane qui satisfasse les propri et es de connexit e ; la deuxi` eme tente de trouver dautres d enitions, directement discr` etes, en supprimant it erativement des points a ` la surface de lobjet. La m ethode que propose la morphologie math ematique rel` eve de cette deuxi` eme approche. Elle sappuie sur la notion damincissement ( equation 6.28), en utilisant des e l ements structurants qui suppriment des points de lobjet sans changer sa topologie (voir gure 6.15). Il sagit donc dun amincissement homotopique. On arrive ainsi a ` un squelette qui v erie les propri et es de connexit e, qui donne une bonne repr esentation des formes, mais qui nest plus inversible (il ne contient pas n ecessairement les centres des boules maximales) et qui nest pas n ecessairement d epaisseur unit e. La gure 6.16 illustre la diff erence entre les centres des boules maximales et le squelette par amincissement dans le cas discret.
6.8.5 SKIZ
Consid le compl ementaire de lobjet . On note les composantes connexes de lobjet erons maintenant lensemble des points plus proches de que ). Dans , on appelle zone dinuence de des pour :
!
Cette notion permet de d enir celle de squelette par zones dinuence (SKIZ) :
119
1 . 0 1
1 . 0
ement structurant utilis F IG . 6.15 El e en 6-connexit e pour obtenir le squelette dun objet par amincissement : cet e l ement structurant, ainsi que les 5 qui en sont d eduits par rotations, sont appliqu es it erativement jusqu` a convergence.
F IG . 6.16 Centres des boules maximales (au centre) et squelette par amincissement (` a droite).
D enition 34. Squelette par zones dinuence : Le squelette par zone dinuence de qui nappartiennent a ` aucune des zones dinuence : Skiz
Le squelette par zones dinuence est un sous-ensemble du squelette de , il nest pas forc ement connexe et contient en g en eral moins de barbules que le squelette de (ce qui est souvent exploit e dans les applications).
D enition 35. Boule g eod esique : La boule g eod esique de centre ensemble de est d enie par :
et de rayon
conditionnellement au sous-
!
(6.32)
120
o` u
dans
(appel ee aussi
et de rayon .
!
(6.33)
En pratique dans un espace discret, lexpression 6.33 se calcule tr` es simplement a ` partir de la dilatation euclidienne ( equation 6.3) par l el ement structurant e l ementaire puisquelle est alors e quivalente a `:
o` u lexposant signie que lop eration est it er ee fois. D enition 37. Erosion g eod esique : L erosion g eod esique de dans
(6.34)
et est ainsi reli ee a e (faisant intervenir le compl ementaire ` la dilatation par dualit
de
dans
(6.35) ).
Louverture et la fermeture g eod esiques sont d enies a ` partir de l erosion et de la dilatation g eod esiques, de mani` ere analogue au cas euclidien ( equations 6.13 et 6.14). De la dilatation g eod esique, on d eduit la notion de reconstruction de a ` partir de marqueurs d enis par un ensemble . eod esique de dans D enition 38. Reconstruction binaire : La reconstruction de dans est la dilatation g par une boule de rayon inni, cest-a qui ont une intersection non vide ` -dire, les composantes connexes de avec .
Les notions de transformations g esiques ou conditionnelles s etendent au cas num erique par linterm ediaire eod des sections de la fonction consid er ee :
D enition 39. Dilatation g eod esique num erique : La dilatation g eod esique de par ses sections a eod esique binaire : ` partir de la dilatation g
dans , pour
est d enie
et l erosion g eod esique est d enie par dualit e. Dans le cas discret, on retrouve des formules analogues a ` celles obtenues dans le cas binaire, pour la dilatation :
o` u
est l el ement structurant e l ementaire et lexposant signie que lop eration est it er ee fois, et pour l erosion :
Comme dans le cas binaire, la reconstruction num erique de est appel ee fonction de marquage.
. La fonction
121
). La Soient un ensemble et un ensemble ` deux ( de composantes connexes disjointes deux a zone dinuence g eod esique de conditionnellement a ` est lensemble des points de plus proches de que des autres composantes au sens de la distance g eod esique dans :
(6.36)
Le squelette g eod esique par zone dinuence est alors d eni par :
(6.37)
bassins versants
minimum
minimum
F IG . 6.17 Ligne de partage des eaux. La transposition de cette d enition intuitive en termes math ematiques ne va pas sans poser de nombreux probl` emes (d enition dune ligne de plus grande pente, probl` eme des plateaux, etc.). La plupart des d enitions sont algorithmiques, cest-` a-dire que la ligne de partage des eaux est d enie dapr` es le moyen qui pemet de la construire. Un des algorithmes les plus populaires est lalgorithme dimmersion qui consiste a ` remplir progressivement les bassins versants (` a partir des minima r egionaux) pour d eterminer leurs limites [Vincent et Soille, 1991, Vincent, 1992, Soille, 1999]. Ce nest que r ecemment que des approches math ematiques rigoureuses ont e t e propos ees dans le cas continu [Schmitt et Mattioli, 1994a]. Lavantage de la ligne de partage des eaux pour la segmentation est quelle fournit des r egions d elimit ees par des contours ferm es formant une partition de limage. La gure 6.18 donne un exemple de ligne de partage des eaux sur une image de gradient.
122
6.11. CONCLUSION
123
a ` (cest-` a-dire une reconstruction num erique), on obtient une version modi ee de o` u les minima sont uniquement ceux qui ont e t e d enis par les marqueurs. Cest sur cette image que la ligne de partage des eaux est alors calcul ee, assurant ainsi que les bassins versants correspondent soit a ` lobjet a ` segmenter soit au fond, et quon obtient un contour ferm e autour de lobjet. La gure 6.20 donne un exemple de ligne de partage des eaux sur une image de gradient apr` es reconstruction.
6.11 Conclusion
De nombreuses extensions peuvent e tre trouv ees dans la litt erature sur la morphologie math ematique, ainsi que des liens avec dautres domaines. Par exemple, l el ement structurant peut e tre interpr et e comme une relation binaire et les op erations de morphologie math ematique sont donc applicables a ` des structures telles que des graphes, o` u les e l ements structurants sont d enis en fonction des arcs du graphe [Vincent, 1989]. Parmi les nombreux liens, citons ceux qui existent avec les e quations de diffusion (voir chapitre 8) et l equation eikonale [Schmitt et Mattioli, 1994a], ainsi quavec les approches multi- echelles (pyramides [Goutsias et Heijmans, 2000], ondelettes [Heijmans et Goutsias, 2000]).
124
F IG . 6.18 Ligne de partage des eaux appliqu ee sur une image de gradient (en haut), et sur une image de gradient ferm e (au milieu). En bas : superposition de la ligne de partage des eaux sur limage originale, sans et avec fermeture du gradient.
6.11. CONCLUSION
125
F IG . 6.19 Image intiale, fonction distance, ligne de partage des eaux appliqu ee sur la distance invers ee, ligne de partage des eaux appliqu ee a ` partir de la reconstruction de la distance moins 2 sous la distance.
F IG . 6.20 Image de gradient apr` es reconstruction en imposant des marqueurs (` a gauche) et ligne de partage des eaux appliqu ee sur cette image (` a droite), limitant la sursegmentation.
126
Chapitre 7
Limage est form ee dun ensemble ni de sites correspondant aux pixels. est donc essentiellement un r eseau discret ni, partie de , si on note la dimension de lespace (2 le plus classiquement, 3 pour les volumes, ` chaque site est associ etc.). A e un descripteur, repr esentant l etat du site et qui peut e tre son niveau de gris, une e tiquette, ou une information plus complexe, et prenant ses valeurs dans . La notion dinteractions locales n ecessite de structurer les relations spatiales entre les diff erents sites du r eseau.
127
tels que
! ! !
` partir dun syst` A eme de voisinage, un syst` eme de cliques peut e tre d eduit : une clique est soit un singleton de , soit un ensemble de sites tous voisins les uns des autres. En fonction du syst` eme de voisinage utilis e, le syst` eme de cliques sera diff erent et fera intervenir plus ou moins de sites comme illustr e sur la gure 7.1. On notera lensemble des cliques relatif a ` , et lensemble des cliques de cardinal .
C1 4-connexit
C2
C1 8-connexit
C2
C3
C4
F IG . 7.1 Les cliques associ ees a ` deux syst` emes de voisinage en dimension 2. Les interactions locales entre niveaux de gris (ou descripteurs) de sites voisins peuvent alors sexprimer comme epend des niveaux de gris un potentiel de clique. Soit une clique, on lui associe le potentiel dont la valeur d (ou descripteurs) des pixels constituant la clique. En poursuivant ce raisonnement, on peut d enir l energie globale de limage comme la somme des potentiels de toutes les cliques :
et l energie locale en un site comme la somme des potentiels de toutes les cliques auxquelles il appartient :
!
Nous avons jusquici consid er e le cas dune image pour illustrer les notions de voisinage, de clique et de potentiel, mais le formalisme markovien se d enit tr` es g en eralement sur tout graphe. Soit un ensemble de sites d enombrable (sommets du graphe), et une relation de voisinage, les cliques sont alors d enies comme les sousgraphes complets du graphe. Cest lutilisation de graphes plus g en eraux que ceux d enis sur la grille de limage qui permet des traitements de plus haut niveau.
niveau de gris ! en nest ainsi quune r ealisation de la v.a ! . On d enit alors le champ al eatoire $ . Le ! prenant ses valeurs dans . On trouvera aussi le terme de processus al eatoire pour ;
129
en toute rigueur, processus devrait e tre r eserv e au cas dun ensemble dindexation continu, et champ au cas discret. Dans ce limage consid er ee est simplement une r ealisation du champ. La probabilit e cadre probabiliste, globale de , , permet dacc eder en quelque sorte a ` la vraisemblance de limage, et les probabilit es conditionnelles locales dune valeur en un site permettent de mesurer le lien statistique entre un niveau de gris et le reste de limage. Lhypoth` ese markovienne permet d evaluer ces quantit es. Notons que nous nous plac ons dans le cas o` u , lespace de valeurs des descripteurs, est quanti e, ce qui nous permet de manipuler des probabilit es. Dans le cas o` u cet espace est continu, il faut remplacer par une densit e de probabilit e, mais dans ce cas le th eor` eme que nous allons voir ci-dessous nest plus valable.
la valeur du descripteur prise au site et Consid erons site . La d enition dun champ de Markov est alors la suivante :
est un champ de Markov ssi la probabilit e conditionnelle locale en un site nest fonction que de la conguration du voisinage du site consid er e
! ! ! !
! !!
Ainsi, le niveau de gris en un site ne d epend que des niveaux de gris des pixels voisins de ce site. Cette hypoth` ese markovienne se justie bien dans le cas de la plupart des images naturelles constitu ees de zones homog` enes ou textur ees ainsi que pour une large gamme dimages de synth` ese. Plus g en eralement, une connaissance locale de limage suft souvent a ` r ealiser son interpr etation partielle et donc cette hypoth` ese markovienne sera souvent justi ee sur des graphes plus globaux que le graphe des pixels. Notons quen labsence de contrainte sur le syst` eme de voisinage, tous les champs al eatoires peuvent e tre consid er es comme markoviens a ` condition de prendre un voisinage sufsamment grand. Lint er et de cette mod elisation r eside bien s ur dans le cas o` u la propri et e markovienne est v eri ee pour des voisinages restreints permettant des calculs rapides. Equivalence entre champs de Markov et champs de Gibbs La mod elisation markovienne prend toute sa puissance gr ace au th eor` eme que nous allons voir maintenant. En effet, celui-ci permettra dacc eder aux expressions des probabilit es conditionnelles locales. Il nous faut au pr ealable d enir un certain nombre de notions relatives aux mesures et champs de Gibbs. D enition dune mesure de Gibbs : La mesure de Gibbs de fonction d energie (ou dhamiltonien) est la probabilit e d enie sur par :
avec
1 On
notera g en eralement en lettres majuscules les variables al eatoires et en minuscules leurs r ealisations.
130 o` u
'
de
il est quasi impossible de calculer cette constante a ` cause du tr` es grand nombre de congurations possibles. Ne serait-ce que dans le cas dune image binaire (Card ) et de taille , on a congurations possibles ! est abusive car ne e La notation couramment ee pour pend pas de lensemble de la congu utilis d ration mais seulement de restreinte a ` la clique ( ). Nous pouvons maintenant d enir le champ de Gibbs de potentiel associ e au syst` eme de voisinage : cest le champ al eatoire dont la probabilit e est une mesure de Gibbs associ ee au syst` eme de voisinage , ce qui implique :
'
'
L energie globale dun champ de Gibbs poss` ede donc la propri et e de se d ecomposer sous forme dune somme d energies locales, qui comme on le verra par la suite permettront dacc eder aux probabilit es conditionnelles locales. Notons ici que plus une conguration dun champ de Gibbs a une e nergie faible, plus elle est probable. Le th eor` eme de Hammersley-Clifford [Besag, 1974] e tablit alors le r esultat fondamental suivant sous les hypoth` eses : enombrable, ni ou d le syst` eme de voisinage est born e, lespace des e tats est discret ` et X est un champ de Markov relativement a si et seulement si X est un champ ` . de Gibbs de potentiel associ ea Par exemple, si nous consid erons un champ de Markov de voisinage 4-connexe, nous pouvons e crire l energie de la conguration sous la forme :
!
!
!
Notons que rien ninterdit la non-stationnarit e du champ, cest-` a-dire la variation des potentiels en fonction de la dans [Descombes, 1993]. Dautre part, rien nimpose la sym etrie des potentiels localisation de la clique limage et on peut avoir . Le th eor` eme de Hammersley-Clifford, et la forme bien sp ecique de probabilit e de qui en r esulte, va permettre de lier les probabilit es globales et locales comme nous allons le voir maintenant. En effet si nous cherchons a `e crire la probabilit e conditionnelle locale , nous avons gr ace au r esultat pr ec edent :
! $
!! ! ! ! ! ! ! ! ! !
! ! !
! par :
! ! !
sous la forme :
! ). Cette e nergie locale ne fait donc intervenir que les voisins de . On peut alors e crire
! !
est toujours possible de trouver un syst` eme de voisinage permettant de d ecomposer ; le cas extr eme correspondant a ` des sites tous voisins les uns des autres.
131
!
!
!
! ! ! !
En simpliant lexpression de la probabilit e conditionnelle locale en supprimant les termes communs qui font intervenir les cliques ne contenant pas le site au num erateur et au d enominateur, on a :
! !
! !
'
! ! ! ! ! ! ! !
!
'
!
! ! ! ! ! ! ! !
(7.1)
Lexpression obtenue, qui ne fait intervenir que les potentiels des cliques contenant le site (ce qui nous permet de retrouver au passage ese markovienne), est tr` es importante. En effet, autant il nest pas possible partant lhypoth` dune conguration dacc eder a ` sa probabilit ea ` cause de la constante de normalisation, autant il est possible de calculer en chaque site la probabilit e conditionnelle locale. Cette expression sera a ` la base de tous les algorithmes de simulation de champs markoviens que nous verrons dans la section suivante. Remarque : Le th eor` eme de Hammersley-Clifford nest valable que lorsquaucune conguration nest interdite (condition ). Des solutions ont e t e propos ees, lorsquil est souhaitable de supprimer certaines congurations irr ealistes (par exemple avoir une route a ` lint erieur dune zone de mer, ou de los dans la mati` ere blanche du cerveau).
L echantillonneur de Gibbs Cet algorithme, propos e par Geman et Geman [Geman et Geman, 1984a], repose sur la construction it erative dune suite dimages. A la convergence, i.e apr` es un nombre dit erations sufsant, les images construites sont des r ealisations tir ees selon la loi de Gibbs globale. La m ethode de construction de limage a ` lit eration , partant de limage a ` lit eration se fait par mises a ` ` l jour successives des sites de limage. A etape :
132
! !
!
pour limage
! ! ! ! !
! !
!.
On consid` ere que lalgorithme a converg e apr` es un grand nombre dit erations ou lorsque le nombre de changements est faible. Le choix du site consid er ea ` l etape peut se faire de nimporte quelle fac on a ` condition de balayer tous les sites un tr` es grand nombre de fois (th eoriquement un nombre inni de fois). Les m ethodes usuelles consistent a ` tirer un site selon une loi uniforme, ou effectuer un balayage classique, ligne par ligne, de limage. Cet algorithme construit en r ealit e une suite dimages qui sont les observations dune suite de champs al eatoires constituant une cha ne de Markov pour un certain noyau de transition. On peut montrer le th eor` eme suivant, lorsque la s equence balaye chaque site une innit e de fois :
o` u est la mesure de Gibbs associ ee au champ de Markov consid e. Ainsi, apr` es un grand nombre dit erations, e r les images g e n e r e es sont des r e alisations de la loi globale , et cela ind e pendemment de la conguration initiale . La preuve de ce th eor` eme, et donc de la convergence de lalgorithme, est donn ee dans [Winkler, 1995]. On parle de l echantillonneur de Gibbs comme dun algorithme de relaxation, car il proc` ede par mises a ` jour successives des sites, et probabiliste car celle-ci est fond ee sur un tirage al eatoire.
Lalgorithme de Metropolis L echantillonneur de Gibbs est un algorithme tr` es utilis e en traitement dimages pour la synth` ese de champs de Markov. N eanmoins, un algorithme ant erieur et issu de la physique statistique avait e t e mis au point dans les ann ees 50 par Metropolis [Metropolis et al., 1953]. Cet algorithme repose sur un principe similaire a ` l echantillonneur de Gibbs, et il sagit e galement dun algorithme de relaxation probabiliste. Le principe est l` a encore de construire une suite dimages qui seront des tirages selon la loi du champ de Markov apr` es un nombre sufsamment grand dit erations. Mais la mise a ` jour en un site seffectue de fac on diff erente. Ainsi a ` l etape :
, le changement est accepte : ! ; , le changement est accepte ou refuse par tirage selon les probabilites
et
"
Le syst` eme de balayage des sites et le crit` ere darr et sont similaires a ` ceux de l echantillonneur de Gibbs. La diff erence avec l echantillonneur de Gibbs r eside dans le tirage au sort du nouveau niveau de gris (ou descripteur), au lieu de consid erer la loi d enie par tous les descripteurs. Comme on ne consid` ere que la variation e nerg etique entre les 2 congurations, lalgorithme de Metropolis est plus rapide a ` chaque e tape que l echantillonneur de Gibbs, qui lui n ecessite le calcul de la fonction de partition locale. Mais la convergence peut e tre plus lente car le taux
133
dacceptation est strictement inf erieur a ` 1 (les transitions ne sont pas toujours accept ees, contrairement au cas de l echantillonneur de Gibbs). L` a encore, le principe est de construire une cha ne de Markov selon un certain noyau de transition (diff erent de celui intervenant dans l echantillonneur de Gibbs). Le th eor` eme pr ec edent est alors encore v eri e pour lalgorithme de Metropolis.
avec
'
et
statistique. Il est int eressant d etudier le comportement de cette distribution pour des valeurs extr emes du param` etre de temp erature. "! :
On a
et comme
, on obtient
Card
Donc
converge vers la probabilit e uniforme sur , i.e pour une temp erature innie tous les e tats sont e quiprobables. : l energie minimale et lensemble des congurations atteignant l energie minimale Notons sont les minima globaux de l energie). On peut e crire :
' '
'
'
134
Si , on a et pour . Donc si nest pas un minimum global de l energie. Si , on a : (il y a une somme nie de termes qui tendent vers 0 au d enominateur). Ce qui signie que lorsque la temp erature est nulle est uniform ement distribu ee sur les minima globaux de l energie, i.e sur les congurations les plus probables. Cest ce r esultat qui est a ` la base de lalgorithme de recuit simul e.
Algorithme du recuit simul e Cet algorithme est d edi ea ` la recherche dune conguration d energie minimale dun champ de Gibbs (on ne cherche plus ici a `e chantillonnner contrairement a ` pr ec edemment). Lid ee dint egrer un param` etre de temp erature et de simuler un recuit a e t e initialement propos ee par Kirkpatrick [Kirkpatrick et al., 1982] et reprise par Geman et Geman [Geman et Geman, 1984a] qui ont propos e lalgorithme suivant. Comme les algorithmes de simulation, cest un algorithme it eratif qui construit la solution au fur et a ` mesure. le num e ro de lit e ration) : Le d eroulement de lalgorithme est le suivant (en notant
sufsamment lev ee e
a ` l etape
lalgorithme de M ; la simulation peut se faire par l echantillonneur de Gibbs etropolis ; on ou r ealise en g en eral un balayage complet de limage a ` la temp erature ; diminution lente de la temp erature :
'
a ` partir de la conguration
La d ecroissance logarithmique de la temp erature est un rythme tr` es lent ; en pratique des d ecroissances g eom etriques sont utilis ees, souvent sans d egradation notable des r esultats obtenus. La constante intervenant dans la d ecroissance d epend de la variation e nerg etique globale maximale sur lespace des congurations. La gure 7.1.5 montre l evolution du paysage e nerg etique repr esent e en 1 dimension au fur et a ` mesure de la d ecroissance en temp erature. Au d epart, toutes les congurations sont e quiprobables puis les minima e nerg etiques apparaissent et saccentuent. Notons que contrairement aux algorithmes de l echantillonneur de Gibbs et de M etropolis qui e chantillonnent selon la loi de Gibbs et qui sont en mesure de donner toutes les congurations possibles, les images obtenues par recuit simul e sont uniques et doivent en th eorie correspondre aux minima globaux de l energie. Il existe une preuve de convergence de cet algorithme, qui repose a ` nouveau sur la construction dune cha ne de Markov, mais qui est h et erogg` ene cette fois-ci a ` cause de la variation du param` etre de temp erature [Geman et Geman, 1984a]. Intuitivement, le recuit simul e permet datteindre un optimum global, car il accepte des remont ees en e nergie. Avec la d ecroissance de la temp erature, ces sauts e nerg etiques sont progressivement supprim es au fur et a ` mesure quon se rapproche de loptimum global. La descente en temp erature doit donc se faire sufsamment lentement pour que lalgorithme ne reste pas pi eg e dans un minimum local de l energie. Algorithme des modes conditionnels it er es (ICM) Malheureusement, lalgorithme du recuit simul e est tr` es lourd en temps de calcul puisquil demande la g en eration dun grand nombre de congurations au fur et a ` mesure que la temp erature d ecro t. Des algorithmes sous-optimaux sont donc souvent utilis es en pratique. Besag [Besag, 1986] a ainsi propos e un autre algorithme, beaucoup plus
135
a b
temprature T
a: b:
xloc
x glob
rapide, mais pour lequel nous navons pas de preuve de convergence vers un minimum global. Il sagit de lICM, Iterated Conditional Mode, que nous allons pr esenter ici. Cet algorithme est un algorithme it eratif modiant a ` chaque e tape les valeurs de lensemble des sites de limage. Mais a ` la diff erence de ces algorithmes qui e taient stochastiques par essence, la modication dune valeur se fait ici de fac on d eterministe. On construit donc, partant dune conguration initiale , une suite dimages , convergeant vers une approximation du MAP recherch e. Soit un tour la visite de tous les sites de limage, on parlera dans la suite dit erations a ` chaque mise a ` jour dun site et d etape a ` chaque mise a ` jour de toute limage (i.e accomplissement dun tour). Le d eroulement de l etape seffectue de la fac on suivante : on parcourt tous les sites et en chaque site, on effectue les deux op erations suivantes :
1. calcul des probabilit es conditionnelles locales, pour toutes les valeurs possibles de
dans
du site :
(en pratique, calcul plus simplement des e nergies conditionnelles locales) 2. mise a ` jour de la valeur par le
Argmax
(ou de fac on e quivalente, minimisant l energie conditionnelle locale). Le processus sarr ete lorsque le nombre de changements dune e tape a ` lautre devient sufsamment faible. On peut montrer que l energie globale de la conguration diminue a ` chaque it eration. Cet algorithme, contrairement au recuit simul e, est tr` es rapide (une dizaine de balayages permettent darriver a ` convergence) et peu co uteux en temps de calcul puisquil ne n ecessite que le calcul des e nergies conditionnelles locales. En contrepartie, ses performances d ependent tr` es fortement de linitialisation (par rapport a ` la forme du paysage e nerg etique) puisquil converge vers un minimum local. LICM sapparente a ` une descente en gradient (on fait baisser l energie a ` chaque it eration) ou a ` un recuit simul e gel ea ` temp erature nulle, et peut donc rester bloqu e dans le minimum
136
e nerg etique local le plus proche de linitialisation. Le recuit simul e, au contraire, gr ace au param` etre de temp erature et aux remont ees en e nergie quil autorise permet dacc eder au minimum global. Notons quil a e galement e t e propos e dutiliser la programmation dynamique pour estimer le MAP [Derin et Elliott, 1987a]. Mais il est alors n ecessaire d etre dans une conguration simple de segmentation (peu d etiquettes, dimensions raisonnables) et seule une approximation peut e tre obtenue.
! !
Ce qui s ecrit e galement . Les potentiels des cliques dordre 1 (clique constitu ee par un seul spin) sont de la forme s ecrit :
! ! !
si si
! . L energie totale
!
est la constante de couplage entre sites voisins et repr esente un champ magn etique externe. Lorsque est positif, les congurations les plus probables (i.e d energies plus faibles) sont celles pour lesquelles les spins sont egatif, au contraire, on favorisera lalternance de m eme signe (ferro-magn etisme), alors que dans le cas de n de spins de signes oppos es (anti-ferromagn etisme). La valeur (signe et valeur absolue) de conditionne donc la r egularit e du mod` ele dIsing. Quant au champ magn etique externe relatif au potentiel dordre 1, il favorise a priori par son signe un spin ou un autre. La gure 7.2 montre des r ealisations de mod` eles dIsing pour diff erents param` etres (la r egularisation appel ee critique correspond a ` lapparition des zones homog` enes). Mod` ele de Potts : Il sagit dune extension du mod` ele dIsing [Wu, 1982] pour un espace -aire, i.e. . Il peut sagir de plusieurs niveaux de gris, mais plus souvent pour ce mod` ele, d etiquettes (labels) pouvant repr esenter une classication de limage (par exemple les classes eau, for et, champ, ville). Le voisinage consid er e est 4- ou 8-connexe et les potentiels sont comme pr ec edemment en tout ou rien mais d enis seulement pour les cliques dordre 2 :
! !
si si
Lorsque est positif, les congurations les plus probables correspondent a ` des sites voisins de m eme niveau de gris ou descripteur, ce qui donne des r e alisations constitu e es par des larges zones homog` e nes. La taille de ces regions est gouvern ee par la valeur de . Des exemples de r ealisations pour diff erentes valeurs de sont montr es gure 7.3.
137
F IG . 7.2 Le mod` ele dIsing plan et 4-connexe pour diff erentes valeurs etres - Simulations en raccorde de param` ment torique ; a. Image al eatoire : , b.r e gularisation faible, ; c. r e gularisation critique : ; d. r egularisation forte : .
Il est possible de d enir des mod` eles utilisant des pond erations diff erentes en fonction des directions des cliques, et de privil egier ainsi certaines directions. Ce mod` ele permet e galement de prendre en compte diff erentes relations entre egions (i.e. entre diff erentes les r valeurs des descripteurs). On peut par exemple d enir des pond erations pour . Dans notre exemple de classication en 4 e tiquettes eau, for et, champ, ville, une conguration de sites avec les e tiquettes champ / for e t peut e tre suppos e e plus probable quune conguration ville / for e t , do` u des valeurs et diff erentes [Sigelle, 1993]. Mod` ele markovien gaussien : Ce mod` ele est r eserv e aux images en niveaux de gris et ne convient pas bien aux images d etiquettes. Le voisinage est 4 ou 8-connexe et l energie est de la forme :
!
!
! !
Le premier terme correspondant aux cliques dordre 2 est egularisation, qui favorise les faibles un terme de r diff erences de niveaux de gris entre sites voisins pour . Le second terme peut correspondre a ` un terme dattache aux donn ees dans le cas o` u on poss` ede une image de donn ees ext erieures. Le rapport pond` ere les inuences respectives de lattache aux donn ees et de la r egularisation, et les valeurs absolues des param` etres caract erisent le caract` ere plus ou moins piqu e ou e quir eparti au contraire de la distribution.
138
F IG . 7.3 Le Mod` ele de Potts 2D et 4-connexe pour diff erentes valeurs de param` etres (m = 4) - Simulations en raccordement torique ; a. Image al e atoire : , b.r e gularisation faible, ; c. r egularisation critique : ; d. r egularisation forte : .
Cadre bay esien Pour ces deux applications, on peut mod eliser le probl` eme dans esien de la fac on suivante. un cadre bay Nous disposons dune certaine donn e e (image) que nous noterons et que nous pouvons consid e rer comme une r ealisation dun champ al eatoire . Nous cherchons une r ealisation de limage restaur ee ou segment ee, que tiquettes (labels) dans le cas de la nous pouvons mod eliser comme un champ de Markov . est le champ des e segmentation, le champ des intensit es dans le cas de la restauration. Les espaces de congurations ne sont donc pas n ecessairement les m emes pour et . Ces deux champs sont li es par le processus dacquisition de limage, qui conduit du champ id eal , le processus image originel que nous cherchons, au champ bruit e que nous observons. La restauration ou la segmentation ont pour objectif dinverser le processus et donc de remonter a ` une r ealisation de a ` partir de lobservation des donn e es bruit e es . On parle dans ce contexte de champ de Markov cach e pour , ou de donn ees incompl` etes puisque nest pas une r ealisation de . On peut par exemple utiliser le crit` ere du maximum a la conguration maximisant la posteriori et rechercher probabilit e de conditionnellement a ` la donn ee i.e . Or la r` egle de Bayes permet d ecrire :
!
Expression dans laquelle il sagit alors danalyser chacun des termes et , sachant que est une constante (ind ependante de la r ealisation ). Le premier terme d ecrit justement le processus dobservation et dacquisition des donn ees. Lhypoth` ese la plus courante (dont la validit e
139
! ! ! ! !
Cette e criture nest plus valable lorsquil y a une convolution par la fonction de transfert du syst` eme dacquisition, mais on peut montrer que le champ a posteriori reste markovien. Par ailleurs, on fait sur le champ recherch e une hypoth` ese markovienne selon un voisinage et un mod` ele donn e d ependant de lapplication. On peut alors e crire :
avec :
!
!
! ! !
Par cons equent, sous les hypoth` eses pr ec edentes, on constate que la distribution a posteriori est une distribution de Gibbs et que donc le champ conditionnellement a ` est e galement un champ de Markov (th eor` eme de Hammersley-Clifford). Ainsi, il est possible de simuler des r ealisations de ce champ a ` laide de l e chantillonneur eresse est celle maximisant la de Gibbs ou de lalgorithme de Metropolis. Mais la conguration qui nous int probabilit e a posteriori, donc la r e alisation la plus probable du champ de Gibbs, ou encore celle qui minimise l energie . Lalgorithme du recuit simul e d ecrit plus haut permet datteindre ce (ou ces) e tat(s) d energie minimale.
(7.2)
Cas de la restauration
Reprenons la d emarche pr ec edente et exprimons plus en d etails l energie dans un cas particulier de restauration. Dans le cas o` u le processus dacquisition entra ne une d egradation de limage sous forme dun bruit blanc gaussien de variance , on a la probabilit e conditionnelle suivante :
La probabilit e a priori permet dintroduire les contraintes que nous souhaitons imposer a ` la solution (i.e. que nous supposons pour le processus originel). En faisant lhypoth` ese que est markovien nous nous restreignons a ` des contraintes locales, le plus souvent de r egularit e entre sites voisins. On choisit fr equemment un mod` ele avec des potentiels dordre 2 :
! ! ! # &%
! !
!
!
!
!
! !
(7.3)
140
Le champ conditionnellement a ` est donc un champ de Gibbs pour le m eme syst` eme de voisinage que . La constante pond` e re linuence entre le terme dattache aux donn e es (cliques dordre 1) qui impose des niveaux de gris de limage restaur ee proches de ceux de la donn ee bruit ee, et le terme de r egularisation (cliques dordre 2) qui impose une solution constitu ee de zones homog` enes. Le mod` ele pour peut e tre soit markovien gaussien, soit plus adapt ea ` la restauration des contours avec une fonction appropri ee. En effet, le mod` ele gaussien qui correspond a ` un fonction quadratique favorise des niveaux de gris proches pour des pixels voisins dans tous les cas. Or si on consid` ere une image naturelle cet aspect est n efaste a ` proximit e des contours car il favorisera ont e t e propos e es pour mod eliser les potentiels des la pr esence dun d egrad e. Aussi, de nombreuses fonctions cliques dordre 2 : . Lid ee est de supprimer la p enalisation lorsque la variation de niveaux de gris est sup erieure a ` une certaine valeur consid er ee comme repr esentant un contour. La partie 7.4 d etaille ces aspects.
! !
Cas de la segmentation
Dans ce contexte, le champ markovien est eni sur d un autre espace de congurations que car seulement quelques e tiquettes sont consid er ees : (correspondant aux diff erentes classes cherch ees). Dans (champ des labels) a ` ne d e crit pas tant le processus dacquisition que ce cas le processus de passage de lapparence des classes dans limage. Le terme traduit donc la probabilit e de r ealisation dune conguration donn ee connaissant son e tiquetage (i.e. connaissant la classe de chaque pixel). En supposant lind ependance des sites les uns par rapport aux autres, et en supposant que le niveau de gris en un site ne d epend que de l etiquette en ce site, on a :
! ! !
Les valeurs des probabilit es conditionnelles sont donn ees par lhistogramme conditionnel des niveaux de gris pour une classe donn ee. Par exemple, si on suppose que chaque classe a une distribution gaussienne de moyenne et d ecart-type , on a :
! ! ! # % ! Si comme pr ec edemment on fait une hypoth` ese markovienne sur et quon se limite aux cliques dordre 2, on a : ! !
!
! # & %
Le champ des e tiquettes conditionnellement a ` est markovien et d energie de Gibbs . L` a encore, comme pour la restauration, le terme dordre 1 exprime le respect des donn ees (le niveau de gris doit correspondre a ` la classe), et le terme dordre 2 la contrainte de r egularisation introduite. On choisit souvent un mod` ele de Potts pour , ce qui donne une image segment ee avec de larges zones homog` enes. La gure 7.4 montre un exemple de segmentation dune image satellitaire obtenue par le radar a ` ouverture synth etique ERS-1. Lutilisation du mod` ele de Potts pour le terme dattache aux donn ees donne des r egions compactes. Dans les deux applications pr ec edentes il est n ecessaire de pouvoir d eterminer le ou les e tats d energie minimale qui correspondent au maximum de la probabilit e dun champ markovien. Lalgorithme du recuit simul e pr esent e permet de trouver ces congurations. Nous reviendrons sur ce point en pr esentant dautres estimateurs de la solution dans la section suivante.
(7.4)
141
!
142
b. Image segment ee en r egions F IG . 7.4 Exemple de segmentation markovienne sur une image ERS-1 du Flevoland.
143
que sous certaines hypoth` eses (ind ependance des sites dans la probabilit e conditionnelle et hypoth` ese markovienne pour le champ ), la distribution a posteriori est une distribution de Gibbs et donc que le champ conditionnellement a ` la donn ee est markovien. Cette propri et e nest pas n ecessaire pour les notions suivantes, mais elle sera primordiale pour les algorithmes de r esolution. Le probl` eme est alors de eterminer une estimation optimisant un certain crit` ere, o` u est une fonction d d eterministe de la donn ee : avec
esienne proc` ede alors ut, Lestimation bay comme suit. On se donne une fonction de co , qui repr esente le co ut de remplacer
par
d enie de
dans
opt . La fonction opt minimise donc lerreur moyenne conditionnellement a ` , et lestimateur optimal est Suivant les fonctions de co ut envisag ees, on obtient diff erents estimateurs et diff erentes m ethodes de r esolution associ ees.
7.2.3 Estimateur MAP
Consid erons la fonction de co ut suivante :
) du cout,
si
sinon
Cette fonction consiste donc a ` p enaliser toute diff erence entre deux congurations, et ce, quel que soit le nombre de sites en lesquels elles diff` erent. Nous pouvons alors e crire :
!
Par cons equent, la fonction opt minimisant lesp erance pour cette fonction de co ut est celle qui maximimise la probabilit e a posteriori : opt Argmax
!
Il nous faut donc trouver la r ealisation , fonction de , maximisant la probabilit e a posteriori . On parle de lestimateur MAP (maximum a posteriori) ou de maximum de vraisemblance a posteriori. On retrouve donc, avec cette fonction de co ut en tout ou rien, la d emarche intuitive que nous avions pr esent ee dans la partie pr ec edente 7.1.7 a ` savoir chercher la conguration maximisant la probabilit e conditionnellement a ` la donn ee disponible. Les solutions algorithmiques associ ees a ` cet estimateur sont le recuit simul e et lICM que nous avons pr esent es dans le paragraphe 7.1.5, utilis es avec la distribution a posteriori avec param` etre de temp erature.
144
!
! !
!
1 I
La fonction de co ut p enalise cette fois-ci une conguration proportionnellement au nombre de diff erences entre deux congurations. Elle para t donc plus naturelle que la fonction de co ut en tout ou rien pr ec edente. Dans le cas dune fonction de co ut d enie comme somme de co uts en chaque site, on peut montrer le r esultat suivant :
!
!
! !
!!
Or
! !
! !
!
! !
! ! !
! !
! !!
On passe donc de la probabilit e conditionnelle globale dune conguration a ` la probabilit e conditionnelle en un site. Il sagit dune somme de termes positifs, et par cons e quent la fonction optimale minimise en chaque site lesp erance conditionnelle du co ut local . Ce r esultat est valable pour toutes les fonctions de co ut d enies par une somme de co uts en chaque site. Dans le cas de la fonction d enie ci-dessus, on a alors comme pr ec edemment :
! ! !
! ! !
!!
ou de
opt
Argmax
i.e. on maximise en chaque site la marginale a posteriori . On obtient donc des estimateurs du maximum a posteriori locaux, a ` calculer en chaque pixel contrairement a ` la recherche pr ec edente qui e tait globale. Lestimateur est appel e maximum de vraisemblance a posteriori local ou maximum posterior marginal (pour maximum a posteriori de la marginale) abr eg e en MPM. Dun point de vue algorithmique, la taille de lespace des congurations ne permet pas un calcul direct des quantit es . Aussi r ealise-t-on en pratique des approximations de type Monte-Carlo. En effet, supposons que lon soit capable de tirer des r ealisations de selon sa loi conditionnelle a ` , et notons les . Il est alors possible de calculer une approximation de lestimateur MPM. Le tirage des r ealisations ne pose quant a ` lui pas de probl` eme particulier car nous avons vu dans le paragrpahe pr ec edent 7.1.4 comment tirer des r ealisations dun champ de Gibbs avec l echantillonneur de Gibbs et lalgorithme de M e tropolis. Or sous les hypoth` eses rappel ees en d ebut de la section 7.2.1, la probabilit e a posteriori est une distribution de Gibbs.
!!
!
!
!!
$
Supposons donc que nous disposions de e chantillons de tir es selon la loi a posteriori et que nous cherchions a ` estimer la distribution conditionnelle en chaque site . Nous allons estimer cette quantit e par la fr equence empirique de au site dans les e chantillons de , i.e :
145
! !
Lestimation ee en chaque site en choisissant la valeur de au sens du MPM est alors donn .
!!
!
1 I
dans
maximisant
!
! !
Il sagit de lerreur quadratique et elle p enalise cette fois-ci directement la somme des diff erences entre les deux congurations. Elle peut donc e tre plus adapt ee dans certains cas que les pr ec edentes, puisquelle tient compte non seulement du nombre de diff erences comme le MPM, mais aussi de leurs valeurs. Dans ce cas, on a en utilisant le r esultat e tabli pr ec edemment :
! ! ! ! ! ! ! soit minimum. Nous allons e On cherche donc , telle que ! crire cette esp erance sous une nouvelle forme en utilisant la moyenne conditionnelle au site , ! ! ! ! ! ! : ! ! ! ! ! ! ! ! ! ! !
o` u est une constante ne d ependant pas de donc nintervenant pas dans la minimisation. Par cons equent, le minimum de lerreur est atteint pour la fonction telle que :
opt !
! !
Cet estimateur consiste a ` prendre en chaque site la moyenne conditionnelle locale donn ee par la loi a posteriori, do` u le nom de TPM (Thresholded Posteriori Mean). Dun point de vue algorithmique, la d emarche est similaire a ` celle effectu ee dans le paragraphe pr ec edent pour le MPM. On approxime lesp erance conditionnelle en chaque site par la moyenne empirique en ce site des e chantillons tir es selon la loi a posteriori :
! !
!
Lestimation au sens du TPM est alors donn ee en chaque site par sa moyenne empirique. Remarquons que cet estimateur est mal adapt ea ` une probl ematique de segmentation car la moyenne des e tiquettes na alors aucun sens.
146
!
! !
et
!
avec
Comme indiqu e dans le paragraphe 7.1.7, cette fonction permet de seuiller les p enalit es impos ees par le terme de r egularisation en pr esence de contours dans limage. Les param` etres utilis es sont x es aux valeurs suivantes ( ecart-type du bruit), (saut en amplitude : a ` partir duquel on consid` ere quil y a un contour), pond eration de linuence relative des deux termes). Linitialisation est donn ee par limage a ` restaurer. Pour tous les estimateurs, on r ealise 600 it erations. Dans le cas du recuit simul e, la temp erature initiale est de 6. Les r esultats sont montr es sur la gure 7.5.
147
c. R esultat de la restauration avec d. R esultat de la restauration avec lestimateur MAP et lalgorithme lestimateur TPM. ICM. F IG . 7.5 Comparaison des algorithmes ICM, Recuit Simul e et TPM en restauration.
148
On constate visuellement que le meilleur r esultat est obtenu par le MAP du recuit simul e. Comme limage originale est une assez bonne initialisation, il ny a pas de grandes diff erences entre les algorithmes de recuit simul e et dICM pour lestimateur du MAP. Ce nest pas vrai d` es que linitialisation s ecarte du r esultat a ` obtenir et les diff erences avec le recuit simul e peuvent e tre tr` es importantes. Par ailleurs, on constate que lestimateur TPM, qui est par d enition plus local, donne un r esultat plus bruit e et moins r egularis e. Cette analyse visuelle est conrm ee par l etude statistique qui peut e tre effectu ee sur des zones homog` enes de limage. Le tableau ci-dessous donne les statistiques dune zone sombre et dune zone claire de limage originale et pour les diff erents r esultats de restauration. Les e carts-types les plus faibles sont obtenus pour lestimateur MAP. Statistiques sur limage originale zone 1 zone 2 Estimateur MAP ICM zone 1 zone 2 Estimateur TPM zone 1 zone 2 Estimateur MAP recuit simul e zone 1 zone 2
TAB . 7.1 Statistiques sur des zones homog` enes pour les diff erents r esultats de restauration On notera e galement que des points isol es de faible ou fort niveau de gris subsistent dans limage restaur ee. Cela est li ea ` lutilisation de la fonction qui ne r egularise plus au-del` a dun certain seuil contr ol e par la valeur de . En ce qui concerne les temps de calcul, les m ethodes se r epartissent comme suit : lalgorithme le plus rapide pour converger est sans conteste lICM, les algorithmes de recuit simul e et de TPM (ou MPM) e tant a ` peu pr` es e quivalents. En effet, plus le nombre dit erations est grand, meilleure est lestimation de la moyenne a posteriori. Les conclusions qui sont donn ees ici ne sont pas n ecessairement valables pour une application en segmentation. Lestimateur du TPM peut en effet dans certains cas donner de meilleurs r esultats que le MAP. Par ailleurs, lICM peut sav erer tr` es utile lorsquon conna t une conguration proche de la conguration optimale.
149
3. On veut segmenter une image, et pour cela apprendre les param` etres de chaque classe, ainsi que le coefcient optimal du mod` ele de r egularisation adapt ea ` cette t ache. On sait en effet que le r esultat dune segmentation par estimateur MAP par exemple d epend fondamentalement du poids respectif de la r egularisation par rapport a ` celui de lattache aux donn ees. Il faut donc l` a aussi estimer ce poids dune fac on optimale dans un sens a ` d enir. Lensemble forme un probl` eme r eput e difcile. Nous ne d ementirons pas ici la difcut e de ces probl` emes, accentu ee par le fait que de tr` es nombreuses variantes ont e t e mises au point dans la litt erature pour le r esoudre. Certaines tentatives de comparaison de ces approches ont d eja e t e effectu ees [Pieczynski, 1994]. Nous exposerons ici les variantes les plus fr equemment utilis ees. Elles se d ecomposent en deux classes fondamentales : le cas des donn ees dites compl` etes, correspondant aux deux premiers probl` emes cit es plus haut : un e chantillon dune distribution de Gibbs est connu. Il sagit de remonter aux param` etres de cette distribution. le cas des donn ees dites incompl` etes. L` a non seulement le r esultat de traitement est inconnu, mais les param` etres sont e galement a ` estimer.
et de chercher par exemple la valeur de lhyperparam` etre maximisant cette vraisemblance . Le probl` eme essentiel est que lon ne sait en g en eral pas calculer exactement la fonction de partition . M eme pour des mod` eles aussi simples et fondamentaux que ceux dIsing et de Potts, le r esultat (analytique) est obtenu apr` es des calculs excessivement compliqu es [Onsager, 1944, Landau et Lifschitz, 1961]. Dans les autres cas on sera donc amen e: soit a ` effectuer des approximations de la fonction de partition globale au moyen des fonctions de partition conditionnelles locales (codages paragraphe 7.3.2, pseudo-vraisemblance paragraphe 7.3.2) soit a ` employer des algorithmes it eratifs (gradient stochastique paragraphe 7.3.2) a ` partir de la vraisemblance exacte, mais dont il sagit alors de prouver la convergence ainsi que le type doptimum trouv e (local, global).
M ethode des codages Le principe de la m ethode des codages [Besag, 1974] est le suivant. Une fois d eni un syst` eme de voisinage pour un champ de Markov, nous sommes capables de d enir un certain nombre de sous r eseaux, chacun form e de sites/pixels ind ependants les uns des autres : chacun de ces sous r eseaux est appel e un codage. Par exemple avec un voisinage en 4 connexit e il existe deux codages comme le montre la gure ci dessous (` a gauche), et 4 codages diff erents dans le cas de la 8-connexit e (` a droite) :
150
Nous allons poser le probl` eme destimation dans le cadre de chaque codage. Pour un codage donn e les diff erents sites/pixels le constituant sont ind ependants les uns des autres puisquils ne sont pas des voisins pour le champ de Markov de d epart. La probabilit e globale dun codage se trouvera donc e tre le produit des probabilit es individuelles de chacun des sites du codage. Or du fait de la structure de Markov du champ de d epart cette probabilit e individuelle se trouve e tre la probabilit e conditionnelle locale du site/pixel dans le champ de Markov. Pour un codage Cod donn e nous pouvons donc e crire :
! ! ! Cod !
Cod
!
! ! ! !
(7.5)
Cod
Etant donn e la structure des probabilit es locales telles quelles ont e t e d ecrites dans les chapitres pr ec edents la fonction de vraisemblance devient calculable, puique les fonctions de partition conditionnelles locales le sont. Dans le cas o` u la d ependance des e nergies locales est lin eaire vis-` a vis des param` etres, la log-vraisemblance associ ee,
! ! ! Cod !
Cod
!
!
Cod
est une fonction concave du (des) param` etre(s), car somme de fonctions concaves [Sigelle, 1997]. Elle se pr ete donc bien a ` la recherche dun optimum par une m ethode classique de type gradient. On peut e galement montrer quil sagit dans ce cas dun simple probl` eme de moindres carr es [Derin et al., 1985]. Pseudo-vraisemblance Il appara t en fait exp erimentalement que la m ethode des codages nest pas able. La m ethode du maximum de vraisemblance vrai para t quant a ` elle incalculable. Des algorithmes ont cependant e t ee tudi es pour tenter de r esoudre ce probl` eme [Younes, 1988], voir paragraphe 7.3.2. En fait nous allons utiliser une m ethode interm ediaire qui aura de bonnes propri et es : la m ethode du pseudo-maximum de vraisemblance [Grafgne, 1987]. Du maximum de vraisemblance vrai, nous allons prendre lid ee de travailler sur lensemble de limage et non s epar ement sur des r eseaux ind ependants. De la m ethode de codage, nous conservons lid ee de manipuler une fonction de vraisemblance produit des probabilit es locales de chacun des sites/pixels. Cette fonction sera appel ee pseudo-maximum de vraisemblance, et elle s ecrira :
!
! ! ! ! !
(7.6)
ou, encore, en consid erant le logarithme de cette fonction, et lexpression de la probabilit e locale de chaque site/pixel : (7.7)
!
151
Maintenant lexpression devient calculable, puisque reli ee a ` la fonction de normalisation de la probabilit e conditionnelle locale telle quelle a e t e d ecrite dans le paragraphe 7.1.3. Donc un raisonnement identique a ` celui du paragraphe pr ec edent conduit au fait que la log-pseudo-vraisemblance est une fonction concave des param` etres lorsque l energie en d epend de fac on lin eaire. Les algorithmes usuels de type gradient ou gradient conjugu e sappliquent donc aussi ici naturellement a ` la recherche de loptimum (qui est unique comme pr ec edemment). Il sagit alors de qualier la valeur des param` etres obtenus par cette m ethode par rapport a ` la valeur vraie. Des r esultats th eoriques importants ont e t e obtenus a ` ce sujet [Grafgne, 1987, Guyon, 1992] : la m ethode de la pseudovraisemblance est consistante et convergente.
Algorithme du gradient stochastique Partons de la vraisemblance exacte du param` etre. Elle s ecrit bien s ur :
La valeur de lhyperparam` etre satisfaisant au principe du maximum de vraisemblance donc v erier l equation :
Comme I E
doit
(7.8)
equation [Sigelle, 1997], cette valeur optimale est donc unique et doit satisfaire l
suivante :
I E
"
Il sagit l` a de ce que lon appelle une e quation stochastique. Comme remarqu e en introduction de la Section 7.3.2 cette e quation ne peut e tre r esolue exactement, pour la raison que I E , qui d erive de la fonction de partition , ne peut en g en eral e tre calcul e de fac on analytique exacte. On est donc amen ea ` employer des algorithmes bas es sur un sch ema it eratif de type Newton-Raphson, mais adapt e a ` ce cadre stochastique. Un sch e ma rigoureux conduirait a ` chaque e tape a `: I E I E
(7.9)
Lid ee est alors de remplacer les grandeurs statistiques mises en jeu par leurs valeurs empiriques approch ees. Ainsi pour lesp erance du potentiel de r egularisation , on prendra sa moyenne empirique au cours dune seule it eration (cest a ` dire la valeur effective obtenue !) dun e chantillonneur de Gibbs ou de Metropolis men e avec la valeur courante du param` etre. Quant a ` la variance de ce potentiel, on lestime encore plus cr ument par une grandeur positive x ee ! On peut montrer que le prix a ` payer pour cette approximation est lintroduction dun terme correctif suppl ementaire en
I E var
obtenu par une dynamique de Il est tr` es important de noter ici que ( ), e chantillon de la distribution Gibbs (ou de Metropolis) associ ee a ` la valeur courante du param` etre , est g en er ea ` partir de l echantillon
(7.10)
152
obtenu a ` lit eration pr ec edente (cest a ` dire lors de la valeur pr ec edente du param` etre). On peut alors montrer que cet algorithme stochastique converge presque s urement, en termes de probabilit e, vers la valeur optimale lorsque le coefcient est choisi sufsamment grand.
Ainsi, dans le cas dun bruit blanc gaussien additif en restauration ou en d econvolution et lapproximation discr` ete nie, on a :
o` u
la variable cach ee . On suppose aussi que lon dispose dune connaissance a priori sur la sc` ene a ` retrouver , que ce soit en segmentation ou restauration, via la distribution de Gibbs suivante :
%
Nous aurons besoin dans la suite de ce chapitre dutiliser la distribution de Gibbs a posteriori :
de fonction e nergie , et de fonction de partition associ ee . Nous commencerons par g en eraliser, dans un cadre de Maximum de Vraisemblance (MV), la m ethode de gradient stochastique vue au paragraphe pr ec edent lorsque la loi dobservation (attache aux donn ees) est compl` e tement connue, cest-` a-dire que nous nous focaliserons sur lestimation du meilleur param` etre de r egularisation . Puis nous comparerons cette m ethode a ` des variantes importantes similaires r epertori ees dans la litt erature. Nous aborderons ensuite lestimation des param` etres dattache aux donn ees, en particulier dans le cadre de la segmentation dimages. Cela nous permettra de d ecrire ensuite la seconde grande classe de m ethodes adapt ee a ` lestimation des param` etres : lEM (Expectation-Maximisation).
!
!
!
Gradient stochastique g en eralis e [Younes, 1989] On va prouver dans cette partie que lestimation du param` etre de r egularisation connaissant la forme du potentiel a priori ne peut e tre dissoci ee dans la plupart des cas de la forme de lattache aux donn ees, suppos ee connue ici par simplicit e, cest a ` dire que est connu. On suppose acc eder par exemple dune fac on ou dune autre a ` la variance dun bruit gaussien en restauration dimage bruit ee (et a ` la r eponse impulsionnelle du ou si lon est en
153
d econvolution). Dans le cas suppos e o` u aucune information a priori sur le param` etre de r egularisation nest disponible, cest-` a-dire lorsque suit la distribution uniforme sur , la vraisemblance de ce param` e tre est la grandeur ad e quate a ` e tudier connais sant lobservation incompl` ete et le param` etre . Elle peut se calculer de fac on e l egante [Peyrard, 2001] en remarquant que la loi jointe de lobservation et des variables cach ees s ecrit :
Toute valeur optimale du param` etre de r egularisation satisfait donc l equation suivante :
(7.11)
o` u lon rappelle que I E est lesp erance dune v.a. sous la distribution de Gibbs a priori d energie , tandis que I E signie lesp erance statistique sous la distribution de Gibbs a posteriori. Notons e galement que les deux grandeurs statistiques I E et I E sont des fonctions monotones d ecroissantes de , ce qui implique que plusieurs valeurs optimales de lhyperparam` etre peuvent exister (voir g.7.3.3).
I E
I E
"
I E
I E
(7.12)
^ 1
()
^ 2 ,()
F IG . 7.6 Valeur(s) optimale(s) du param` etre de r egularisation en donn ees incompl` etes.
E I
I E
IE IE
I E var
I E var
(7.13)
Il faut dabord noter que dans ce sch ema le d enominateur du dernier terme peut e tre de signe quelconque contrairement au cas des donn ees compl` etes (7.10), ce qui est reli ea ` lexistence de plusieurs solutions possibles en donn ees
154
incompl` etes. Maintenant, en sinspirant du raisonnement effectu e pour le gradient stochastique pour les donn ees compl` etes, on saperc oit quil est n ecessaire dapproximer des quantit es statistiques (moyenne, variance) reli ees aux distributions a posteriori et a priori. On a donc besoin d echantillonner deux champs de Markov en g en eral : celui li ea ` la r egularisation pure (champ a priori) et le champ de Markov post erieur comprenant lattachement aux donn ees. Le sch ema empirique qui en r esulte naturellement est donc le suivant [Younes, 1989] :
un e chantillon un e chantillon
g en er e par g en er e par
(distribution a priori)
(distribution a posteriori)
et var (qui n ecessitent donc en fait au moins deux e chantillons pour chacune des distributions et a ` chaque e tape du sch ema d evolution de lhyperparam` etre). Ainsi en segmentation, on doit e chantillonner aussi bien la distribution a posteriori, ce qui sera par ailleurs utile en vue de la segmentation a ` convergence des param` etres par lun des estimateurs MPM ou TPM, que la distribution a priori qui correspond au mod` ele de r egularisation pur : mod` eles dIsing, de Potts, g en eralisation, et ceci pour la valeur courante du (des) hyperparam` etre(s). La convergence de cette m ethode est a ` montrer dans le cadre g en eral des algorithmes stochastiques [M etivier et Priouret, 1987], qui d epasse largement lobjet de ce chapitre. Comparaison avec dautres variantes destimation Dans ce paragraphe on pr esente dautres m ethodes usuelles destimation des hyperparam` etres en donn ees incompl` etes, qui sont en fait reli ees a ` dautres estimateurs que le maximum de vraisemblance. Toute la subtilit e r eside ici dans le choix de la fonction de type vraisemblance a ` maximiser. On va voir en effet que de tr` es l eg` eres diff erences conduisent a ` des formes fort diff erentes d equations stochastiques, et donc des r esultats destimation a priori fort diff erents. On suppose dans les deux premiers cas quun r esultat optimal de restauration (ou segmentation) est connu a ` l etape destimation o` u lon se situe. Une premi` ere approche consiste a ` utiliser la loi jointe de lobservation et du r esultat connaissant la valeur courante des hyperparam` etres [Lakshmanan et Derin, 1989a, Descombes et al., 1999]. On peut alors e crire que le param` etre optimal doit satisfaire :
Il faut noter en particulier la pr esence des estimateurs empiriques des variances var
var
var
En utilisant comme ec edemment le fait que lattache aux donn ees (resp. la r egularisation) est ind ependante de pr lhyperparam` etre (resp. de ), on obtient :
On retombe de vraisemblance pour alors sur lestimateur au sens du maximum le champ de Markov a priori d energie et pour la donn ee ici compl` ete , cest a ` dire : I E . On peut donc utiliser une technique de gradient stochastique classique pour estimer ce param` etre (cf. paragraphe 7.3.2). On peut ensuite it erer
155
en effectuant le traitement d esir e (restauration, segmentation) avec les nouvelles valeurs des hyperparam` etres obtenues. On obtient donc une nouvelle conguration optimale a ` partir de laquelle on peut re-estimer les param` etres, et ainsi de suite [Khoumri, 1997, Zerubia et Blanc-F eraud, 1998]. La m ethode est th eoriquement convergente vers les valeurs optimales des param` etres et de la conguration. Une seconde approche consiste a ` utiliser la probabilit e du r esultat conditionnellement a ` lobservation et aux hyperparam` etres. Dans ce cas, le param` etre optimal doit v erier :
En appliquant la seconde formule de Bayes et en utilisant le m eme argument dind ependance des diff erentes lois de probabilit es vis-` a-vis des diff erents hyperparam` etres mis en jeu, on obtient :
!
On tombe cette fois pour la distribution de a pos sur lestimateur au sens du maximum de vraisemblance Gibbs teriori d energie et pour la donn ee compl` ete , cest-` a-dire : I E . Les deux m ethodes aboutissent donc a ` lestimation dun param` etre unique, et peuvent donc e tre impl ement ees avec une technique de gradient stochastique classique [Younes, 1988, Khoumri, 1997]. Nous citerons e galement lalternative des m ethodes MCMCML (Monte Carlo Markov Chains Maximum Likelihood) [Descombes et al., 1999]. Il est tr` es int eressant de comparer les deux r esultats pr ec edents avec le v eritable gradient stochastique g en eralis e vu pr ec edemment. On rappelle que celui-ci permet de maximiser la probabilit e du param` etre de r egularisation conditionnellement a ` lobservation uniquement [Younes, 1989] :
En toute rigueur, il est lestimateur exact au sens du MV du param` etre de r egularisation. Les deux autres cit es pr ec edemment ont essentiellement lavantage d etre plus rapides, car ne n ecessitant quun e chantillonnage a ` chaque e tape, et permettant de faire alterner le traitement dimage d esir e avec lestimation des param` etres. En pratique, les trois estimateurs cit es aboutissent a ` des valeurs du param` etre de r egularisation semblables, ce qui provient du fait que les mod` eles adopt es pour lattache aux donn ees et pour la r egularisation sont souvent choisis en coh erence avec lobservation fournie. Estimation des hyperparam` etres dattache aux donn ees : le cas de la segmentation Supposons que lon veuille estimer e galement les param` etres intervenant dans lattache aux donn ees, que nous regrouperons sous une variable . Ainsi, dans le cas important de la segmentation o` u le niveau de gris de cha , est cune des r egions dune image est suppos e e suivre une loi gaussienne de moyenne et de variance lensemble . Nous e tudierons ici lestimation de ces param` etres dans le cas gaussien par raison de commodit e. La probabilit e des observations conditionellement aux labels s ecrit donc :
& % ! #
!
!
156
!
!
(7.14)
et comme fonction de partition a posteriori associ ee . La vraisemblance des param` etres dattache aux donn ees s ecrit donc selon le m eme principe que pr ec edemment
&%
Int eressons nous a ` maximiser cette quantit e vis-` a-vis dun des param` etres de . Il faut remarquer ici que les . Do` u lon fonctions e nergie mises en jeu d ependent de fac on non-lin eaire de lensemble de param` etres d eduit pour chacun des param` etres :
Pr ecisons quil sagit bien rance a posteriori. Pour analyser la d ependance pr ecise de l energie a posteriori de lesp e vis-a-vis des param` etres , il est commode de re- ecrire la formule (7.14) en employant les fonctions caract eristiques dappartenance a ` chaque classe :
I E
"
(7.15)
!
!
1 I
Examinons dabord le cas dun param` etre de moyenne donn e. On peut montrer que (si
I ! ! 1 ! !
1 I
(7.16)
! ! ! ! !
!
):
(7.17)
Linterpr etation physique en est claire : on obtient le barycentre des observations en chaque site de limage pond er ees par la probabilit e a posteriori davoir une classe d etermin ee. De la m eme fac on, on obtient pour les variances de chaque classe :
!
!
(7.18)
les pouvant e tre calcul es par la formule (7.17). Le r esultat est similaire a ` une variance empirique, mais avec pond eration en chaque site par la probabilit e a posteriori que ce site ait le label e tudi e. En d enitive on aboutit donc a ` des e quations (7.17) et (7.18) auto-coh erentes, de forme bien plus complexe que celles des gradients stochastiques simple et g en eralis e. On aimerait pouvoir les remplacer par des formes it eratives simples : cest ce qui va justier lemploi des m ethodes de type EM, a ` adapter dans le cadre gibbsien d eni ici.
157
R ecapitulons les r esultats pr ec edents obtenus concernant lestimation au Maximum de Vraisemblance des hyperparam` etres dans le cas des donn ees incompl` etes : pour lhyperparam` etre de r egularisation nous sommes arriv es a ` l equation stochastique :
I E
I E
pour les param` etres dattache aux donn ees en segmentation avec d equations :
! ! ! ! ! ! ! ! ! !
Nous en avons conclu quil serait esirable de r esoudre ces e quations de mani` ere it erative. Par exemple si les d e taient connues (ou apprises) a ` une e tape donn ee on pourrait les injecter dans probabilit es a posteriori la premi` ere e quation a ` condition de pouvoir estimer pour toute valeur de lesp erance a priori du potentiel de r egularisation ainsi que dans le deuxi` eme syst` eme. Ces deux arguments vont nous fournir les principes de lEM, avec un certain nombre de r esultats th eoriques tr` es puissants a ` la cl e. La m ethode EM est par essence it erative. Des r esultats th eoriques tr` es g en eraux montrent que la vraisemblance des param` etres estim es cro t a ` chaque it eration de lalgorithme associ e [Baum et al., 1970, Redner et Walker, 1984]. On pourra e galement consulter en particulier [Chalmond, 1999] pour une pr esentation claire de cette m ethode. De plus cette m ethode permet dune certaine fac on loptimisation s epar ee des hyperparam` etres dattache aux donn ees et de celui de r egularisation. En effet elle consid` ere essentiellement la probabilit e jointe de lobservation et des donn ees cach ees (un e tiquetage de limage par exemple), cest-` a-dire le produit de la loi dobservation et de la probabilit e a priori. soient connus a ` l e tape courante . On suppose aussi que lon a acc` es dune Supposons que les param` etres et fac on ou dune autre aux statistiques li ees a ` la loi a posteriori des donn ees cach ees courantes (ppartie Expectation de lEM, voir plus loin). On d enit alors la notation :
I E
I E
I E I E
secrit : !
158
On rappelle que la vraisemblance des param` etres cro t en fonction de lit eration par cette m ethode ce qui aboutit a ` terme a ` un optimum local pour les valeurs des param` etres. Examinons plus pr ecis ement ce qui se passe pour chacune des cat egories de param` etres : en ce qui concerne le param` etre de r egularisation, cela correspondra a `:
I E
"
I E
(7.19)
I E
Supposons que lon sache dune mani` ere ou dune autre calculer ou estimer lesp erance a posteriori du potentiel de r egularisation pour la valeur courante des param` etres. Ainsi, en pratique, on approxime cette quantit e par sa moyenne empirique au cours dun e chantillonneur de Gibbs (ou de Metropolis) pris pour la valeur courante des param` etres 3 . On est alors ramen ea ` un probl` eme destimation du param` etre de r egularisation pour la donn ee compl` ete I E ! On peut donc appliquer la technique du pseudo-maximum de vraisemblance [Chalmond, 1989] ou bien encore celle du gradient stochastique [Younes, 1991] pour re-estimer la nouvelle valeur du param` etre de r egularisation. pour les param` etres dattache aux donn ees, on a vu plus haut que
!
- pour les param` etres de variances : I E
! ! ! ! ! ! ! !
(7.20)
! !
!
!
!
!
(7.21)
Deux remarques insistantes : 1. Ce sont bien les distributions a posteriori qui sont mises en jeu dans lestimation it erative (eqs. 7.20 et 7.21). Elles sont donc a ` re-estimer a ` chaque it eration . Une mani` ere bien naturelle est de remplacer ces probabilit es a ` l etape courante du processus EM par la fr equence empirique dapparition des labels lors dune s erie d echantillonnages de la distribution de Gibbs a posteriori courante men es a ` laide dun e chantillonneur de type Gibbs ou Metropolis
3 Ceci
159
Notons e galement
!
e chantillonnages. On peut donc e crire : param` etres de moyennes et de variance de chaque classe :
!
De la m eme fac on, notons la s erie dimages e chantillons ainsi obtenue pour lesp erance a posteriori du potentiel de r egularisation I E
! ! ! ! ! ! ! ! ! !
. On obtient pour
Cest donc ensuite que lon proc ede a ` l etape destimation EM comme indiqu e plus haut, a ` partir de ces valeurs empiriques a posteriori. 2. On retrouve le caract` ere it eratif que nous voulions anticiper a ` propos des e quations plus haut. L` a aussi, a ` convergence, on doit satisfaire a ` la forme exacte des e quations (7.17) et (7.18) obtenues par le Maximum de Vraisemblance. Variantes Une variante importante, ee ICE ou Iterative Conditional Estimation est la suivante [Pieczynski, 1994]. appel chantillons obtenus pr ec edemment a ` une e tape courante de lEM. On pourrait sonConsid erons les e ger a ` estimer moyenne et variance des classes pour chacun deux consid er e comme segmentation courante, puis prendre la moyenne empirique (arithm etique) des valeurs ainsi obtenues
!1 I I 1 ! ! 1 I ! I ! 1 !
Cette estimation est diff erente de lEM. On peut montrer quelle correspond en fait a ` lestimateur de la moyenne a posteriori des param` etres. Conclusion pour lestimation en donn ees incompl` etes On voit donc au terme de cette partie que lestimation en donn ees incompl` etes se pr ete a ` un nombre tr` es riche de variantes. On pourrait ainsi parfaitement juger pr ef erable destimer certains types de param` etres comme
160
moyenne et variance par lEM, tandis que lon adopterait la m ethode de Lakhsmanan-Derin pour le param` etre de r egularisation, ou r eciproquement ! Ces variantes m eritent encore d etre examin ees et compar ees entre elles de fac on exhaustive, dans la lign ee de lapproche suivie dans [Pieczynski, 1994]. Il faut aussi pr eciser que les m ethodes utilisant un e chantillonnage de la distribution a posteriori (comme lEM) permettent en m eme temps de fournir une s erie de congurations e chantillons se pr etant favorablement a ` la segmentation ou a ` la restauration dans le cadre des estimateurs de type TPM ou MPM, lorsque la convergence des param` etres vers leur valeur optimale est suppos ee atteinte.
Le terme de r egularisation permet alors dagir directement sur les d eriv ees de la solution cherch ee. Dans le cas dun potentiel quadratique, il sagit dune r egularisation de Tikhonov qui entra ne un fort lissage de la solution au d etriment des discontinuit es souvent naturellement pr esentes dans limage. De nombreux travaux ont port e sur lintroduction de discontinuit es et sur les avantages potentiels que cela impliquait dans la recherche de la solution. Nous nous limiterons ici a ` des cliques dordre deux, cest-` a-dire a ` lintroduction de contraintes sur la d eriv ee premi` ere de la solution cherch ee. Nous mettons en e vidence l equivalence entre processus de bords et certaines fonctions avant de pr esenter quelques algorithmes d eterministes doptimisation.
! !
Dune fac on intuitive, en labsence de discontinuit es, on a et on retrouve un potentiel quadratique visant a ` lisser la solution. En revanche, en pr esence de discontinuit e( , la p enalit e est arbitraire et vaut 4 de fac on a ` limiter le nombre de discontinuit es introduites par le mod` ele. Ce mod` ele (mod` ele de la membrane mince -weak membrane-) est tr` es simple et nintroduit pas dinteractions entre les e l ements du processus bords. En r ealit e, il nest pas n ecessaire dintroduire explicitement un processus de bords de fonction et un choix (et judicieux peut procurer le m eme r esultat. En effet, notons le terme
! !
! !
(7.22)
! !
4 Ce
et ). param` etre peut varier pour des mod` eles anisotropes ou non stationnaires (on a alors
! ! !
telle que
! ! !
!
161
soit minimale. Or :
!
! !
en notant :
Par cons equent, la quadratique est remplac ee dans ce mod` ele par une quadratique tronqu ee (gure 7.7). Lutili sation dun processus de bords explicite est dans ce cas e quivalente a ` lutilisation de la fonction (on parle de etermine a ` partir de quelle valeur du gradient on introduira une processus de bords implicite). La valeur de d discontinuit e.
F IG . 7.7 Fonctions quadratique, quadratique tronqu ee et la fonction de r egularisation propos ee par Geman et McClure pr eservant les discontinuit es. Un tr` es grand nombre de fonctions de r egularisation pr eservant les discontinuit es ont e t e propos ees et e tudi ees (on pourra se r ef erer a ` [Charbonnier et al., 1996] pour une e tude comparative). La fonction suivante, qui pr esente lint er et d etre d erivable partout, est tr` es utilis ee en restauration [Geman et McClure, 1985] :
Notons quil est int eressant dutiliser des fonctionnelles convexes pour la recherche de la solution, mais la prise en . compte des discontinuit es repose sur le comportement de Le choix dun processus de bords implicite ou explicite va donner lieu a ` diff erents algorithmes de minimisation. En effet, le recuit simul e permettant dacc eder au minimum global de l energie est un algorithme long et co uteux. Il peut dans de nombreux cas e tre remplac e par un algorithme d eterministe pour acc el erer la recherche de la solution.
162
Puis le crit` ere est modi e graduellement perdant sa propri et e de convexit e pour se rapprocher du crit` ere ` chaque e initial. A tape une solution est trouv ee de fac on d eterministe en utilisant pour initialisation la solution donn ee par l etape pr ec edente. Si des preuves de convergence peuvent e tre obtenues dans certains cas particuliers, cette d emarche nassure cependant pas de trouver le minimum global pour toutes les fonctions d energie. MFA [Geiger et Girosi, 1991] : une autre approche est le recuit par champ moyen MFA (Mean Field Annealing) qui utilise cette fois un processus bords explicite. Lalgorithme met en uvre une descente de temp erature au cours de laquelle a ` chaque e tape une solution (image restaur ee et processus de bords) est estim ee au sens du champ moyen. On a des expressions explicites pour le processus de bords, tandis que est estim ee de fac on it erative. Artur et Legend [Charbonnier, 1994] : Charbonnier a e galement propos e deux algorithmes d eterministes appel es Artur et Legend pour loptimisation. Il utilise un processus de bords explicite et exploite le fait qu` a x e, le crit` ere est quadratique en (donc convexe et minimisable rapidement par une descente de type gradient), tandis qu` a x ee, il existe une expression analytique du processus de bords. Malgr e de nombreuses diff erences (notamment sur les propri et es de convergence et sur leur g en eralit e), il sagit toujours dalgorithmes it eratifs minimisant des suites d energies (GNC ou MFA) ou faisant varier les variables auxiliaires (le processus de bords pour Artur et Legend) au cours des it erations. Une comparaison est effectu ee dans [Charbonnier, 1994] et [Zerubia et Chellapa, 1993].
163
Nous avons d ej` a vu au paragraphe 7.3.2 un certain nombre de techniques (m ethode des codages, maximum de pseudo-vraisemblance, gradient stochastique) pour calculer les param` etres dun champ markovien. Toutes ces m ethodes, qui ne pr esupposent pas de mod` ele pour le champ, sont assez lourdes a ` mettre en uvre. Nous allons supposer ici que nous nous situons dans le cadre dun champ markovien gaussien pour lequel nous pouvons obtenir une exacte des param` etres. Dans le cas dun champ markovien gaussien, nous pouvons e crire l energie expression sous la forme :
! !
Avec cette e criture, les param` etres caract erisant le champ et que nous cherchons a ` estimer sont donc la temp erature (correspondant a ` une sorte de variance g en eralis ee), la moyenne et la pond eration du terme dattache aux donn ees de l energie, .
La m ethode des queues de com` etes La m ethode que nous allons voir a e t e propos ee dans [Descombes, 1993]. Consid erons la probabilit e conditionnelle en un site :
! !!
En notant
!
! !!
! ! ! !
!
"
!
On a donc remplac e le conditionnement local par lensemble des voisins de , par une seule variable conditionnante , ce qui am eliorera la robustesse des estimateurs. En effet, le nombre de sites concern e s par un condi sera bien plus grand que celui des sites concern es par une conguration du tionnement par voisinage. Nous constatons que est une loi gaussienne, de moments (moyenne et variance) suivants :
!!
Lesp erance et la variance de ! conditionnellement a ` ! e tant fonction des param` etres , et que nous recherchons, il nous suft destimer ces moments de fac on empirique. La variance ne d ependant pas de la valeur conditionnante ! , on notera le moment th eorique par . Pour faire ces estimations, on construit limage dite des queues de com` etes en raison de son aspect, qui est simplement limage des fr equences normalis ees des niveaux ! du voisinage. Si on met les valeurs ! en colonne ! conditionnellement de gris a ` la moyenne de et celles ! ! ! de ! en ligne, chaque ligne de limage des queues de com` e tes repr e sente , i.e une gaussienne de " ! moyenne et de variance .
var
I E
!!
! ! ! !
" !
!!
164
en notant var lestimation empirique de la variance faite selon une ligne des queues de com` etes. Cet estimateur permet daccorder a ` chaque probabilit e conditionnelle locale une importance proportionnelle au nombre d echantillons qui la constituent et entra ne une plus grande robustesse de lestimation. En ce qui concerne lesp erance, nous avons la relation suivante :
I E
!!
!!
! !
Par cons equent, les esp erances des probabilit es conditionnelles se situent sur une droite. Lestimation empririque E permet de faire une estimation aux moindres carr e s des param` e tres et de la droite. des moyennes I Une fois estim es empiriquement , , , on peut d eduire , , et par les relations :
!! !
! ! ! !
En es des param` etres de la droite, on peut exprimer directement , explicitant lestimation aux moindres carr , et en fonction des moments dordre 1 et 2, conditionn e s ou non. On retrouve dans ce cas pour , la moyenne empirique des .
` la d Application a etection des zones urbaines Cet exemple dapplication est tir e de la th` ese de X. Descombes [Descombes, 1993]. On peut utiliser les r esultats pr ec edents pour analyser les textures pr esentes sur une image satellitaire SPOT. Limage e tant par essence non stationnaire (sinon lanalyse aurait peu dint er et !), le calcul des param` etres se fait localement, sur une fen etre glissante centr ee en chaque pixel. La abilit e des estimateurs saccro t avec la taille de la fen etre, en m eme temps, et de fac on antagoniste, que le risque de consid erer des m elanges de textures diff erentes a ` lint erieur de la fen etre d etude. Une solution pour rem edier a ` ce probl` eme peut e tre de ne consid erer que les e chantillons les plus repr esent es. En cas de m elange, les e chantillons appartiendront a ` la texture la plus pr esente dans la fen etre. Le param` etre de temp erature, est un bon indicateur du milieu urbain qui se pr esente sur une image SPOT sous une forme assez textur ee, type poivre et sel avec alternance de niveaux de gris faibles et forts. En effet, ce param` etre qui mesure en quelque sorte le chahut de la zone, a des valeurs plus e lev ees dans les r egions urbaines. Il permet dobtenir une bonne discrimination du milieu urbain.
7.5.2 Segmentation
Nous allons aborder dans cette partie une application tr` es classique des champs markoviens qui est la segmentation. Nous commenc ons par rappeler le principe de la segmentation markovienne en prenant lexemple des images radar [Tupin, 1997], puis pr esentons une m ethode de fusion dans un cadre markovien [Descombes, 1993]. Segmentation dune image radar Cet exemple dapplication est tir e de la th` ese de F. Tupin [Tupin, 1997].
165
La mod elisation est similaire a ` celle qui a e t e pr esent ee dans le paragraphe 7.1.7. Ecrivons a ` nouveau les deux termes intervenant dans la probabilit e a posteriori. Pour la probabilit e du champ des observations conditionnellement au champ des e tiquettes, en supposant lind ependance des pixels, on a :
! ! ! ! !
Les images radar sont des images tr` es bruit ees par le ph enom` ene de speckle. En revanche, le processus dacquisition est bien mod elis e statistiquement et on a lexpression suivante pour une image radar en amplitude :
! ! ! !
avec un param` etre du syst` eme connu5 appel e nombre de vues, la fonction Gamma, et les moyennes en intensit e (carr e de lamplitude) des diff erentes classes consid er ees. Le champ des e tiquettes est suppos e markovien avec un mod` ele de Potts qui vise a ` obtenir des zones homog` enes compactes sur limage segment ee :
avec , et . Le champ a posteriori r esultant est donc markovien et son e nergie s ecrit :
!
!
En choisissant lestimateur MAP, la solution est obtenue par recuit simul e avec une d ecroissance g eom etrique en temp erature, et une temp erature initiale x ee arbitrairement. Le choix des classes se fait de la fac on suivante. On se xe le nombre de classes (15 dans les illustrations ci-dessous) et on applique un algorithme de k-moyennes dont le r esultat6 sert a ` calculer les valeurs des moyennes en intensit e des diff erentes classes. Notons que ces classes nont pas de contenu s emantique et que la segmentation correspond ici a ` un d ecoupage de limage. Le choix de qui pond` ere linuence entre attache aux donn e es et r e gularisation se fait de fac on ad hoc apr` es quelques essais. Laugmentation de entra ne une augmentation de la taille des zones obtenues par la segmentation. Il serait bien s ur possible destimer ce param` etre a ` laide dune des m ethodes d ecrites au chapitre 3. Notons que ce mod` ele nest pas adapt ea ` la pr eservation des cibles ponctuelles et des lignes qui sont des congurations de forte e nergie pour le champ des e tiquettes (il faut donc une forte attache aux donn ees pour que ces congurations subsistent dans le r esultat nal). Il est bien s ur possible de prendre en compte un champ externe pour mieux respecter les lignes par exemple [Tupin et al., 1996] ou dutiliser un mod` ele plus appropri e [Descombes et al., 1995]. Le tableau ci-dessous 7.2 r esume les param` etres utilis es et la gure 7.4 montre le r esultat de la segmentation. Sch ema de fusion dans un cadre markovien Principe du sch ema de fusion Nous nous plac ons maintenant dans le cas o` u plusieurs sources dinformation sont disponibles pour r ealiser la classication de limage. Ces diff erentes sources peuvent provenir de lextraction de diff erents param` etres a ` partir dune m eme image ou directement de plusieurs capteurs.
les produits PRI du satellite ERS1 . r esultat des k-moyennes est tr` es bruit ea ` cause du bruit multiplicatif pr esent sur les images radars et labsence de modes dans lhistogramme. Il ne peut donc pas dans ce cas e tre utilis e directement comme r esulat de segmentation.
5 Pour 6 Le
166
TAB . 7.2 Valeurs des param` etres de la segmentation Temp erature initiale Facteur de d ecroissance g eom etrique Param` etre de r egularisation Nombre de classes Nombre dit erations pour les k-moyennes 5 0,95 0,4 15 20
Notons le vecteur dattributs correspondant aux diff erentes sources avec dinformations le nombre de donn ees (ou canaux) et ! le nombre de classes . La probabilit e a posteriori s ecrit :
$
Si nous faisons lhypoth` ese que les sources sont ind ependantes entre elles, et les pixels de chaque source entre eux, on a :
!
!
!
! ! ! ! ! ! $ ! ! ! ! ! ! ! ! ! ! ! !
!
! ! !
Le potentiel dattache aux donn ees r esultant sexprime alors sous forme dune somme des potentiels individuels de chaque source :
! ! ! ! !
! ! !
Les diff erentes sources ne renseignant pas de la m eme fac on sur toutes les classes, il est possible dintroduire des coefcients de pond eration exprimant la conance (la abilit e) quon veut accorder a ` chacune des sources par rapport a ` une classe. On notera la conance accord ee a ` la source pour la classe . Il faut par ailleurs ne favoriser aucune classe, donc les coefcients doivent v erier donn ees s ecrit alors :
! ! ! ! !
! ! !
En pratique, il nest pas toujours n ecessaire de faire des mod elisations statistiques compliqu ees pour calculer les potentiels dattache aux donn ees. Souvent des potentiels tr` es simples, lin eaires par morceaux, permettent dobtenir de bons r esultats. On attache un potentiel faible (typiquement 0) a ` la plage de niveaux de gris qui correspond a ` la classe consid er ee et un potentiel e lev e (typiquement 1) ailleurs. Cette d enition peut se faire de fac on supervis ee en analysant lhistogramme ou de fac on automatique par une recherche des modes de lhistogramme de limage (analyse multi- echelle [Aurdal, 1997], recuit simul e sur lhistogramme [Bloch et Maitre, 1997], etc.). La d enition des coefcients de abilit e des sources est souvent ematique. On se limite en g en eral a ` plus probl des remarques de bon sens en affectant lorsque la source nest pas signicative pour la classe , 0.5 si linformation d elivr ee est approximative, et 1 si la source est pertinente (avant normalisation).
167
` lanalyse des images SPOT Application a Cet exemple dapplication est tir e de la th` ese de X. Descombes [Descombes, 1993]. On trouvera dautres exemples dans [Tupin et al., 1996] [Aurdal, 1997]. Nous d ecrivons ici lapplication de ce sch ema a ` lanalyse de plusieurs canaux d elivr es par le satellite NOAA. Il sagit de 5 canaux de basse r esolution (1.1km) correspondant aux domaines visible, proche infra-rouge, moyen infra-rouge et 2 canaux thermiques. Les classes quon cherche a ` discriminer sont les suivantes : mer, nuages, continent sans relief, continent avec relief et icebergs. Une premi` ere e tape consiste a ` d enir les sources que nous allons utiliser. La m ethodes des queues de com` ete que nous avons pr esent ee plus haut permet en effet de d eduire de chaque image, 3 images de param` etres (moyenne locale, temp erature et param` etre dattache aux donn ees ). Au total 20 images sont donc disponibles, dont les plus signicatives pour notre objectif, sont s electionn ees : limage 1 (visible), limage de temp erature et limage de moyenne associ ees, limage 3 (moyen infra-rouge) et limage de temp erature associ ee (soit 5 en tout). Pour chacune de ces images, une analyse supervis ee de lhistogramme est effectu ee, permettant de d enir les potentiels (lin eaires par morceaux) et la pertinence du canal pour chaque classe. Le terme dattache aux donn ees de l energie a posteriori est alors d eni comme mentionn e pr ec edemment. Quant au terme de r egularisation, les classes recherch ees e tant relativement compactes, on utilise un mod` ele de Potts.
168
(not e vol), niveau de gris moyen (qui sera lobservation du champ des donn ees), coordonn ees du centre du bassin. Le r esultat de cette m ethode appliqu ee a ` limage 7.8.a est montr e sur la gure 7.8.b. Relaxation markovienne : Un graphe est construit comme indiqu e pr ec edemment a ` partir de la sursegmentation (g. 7.8.c). On associe aux arcs du graphe la surface dadjascence entre les deux r egions (not ee surf). Les potentiels du champ markovien sont alors d enis comme suit : Terme dattache aux donn ees : vol
! ! !
!
! !
(d eduit dune e tude statistique des classes [G eraud et al., 1995]) Terme de r egularisation : surf
!
Seuls les potentiels des cliques dordre 2 sont choisis non nuls. La matrice est une matrice dadjascence permettant de pond erer les voisinages entre classes suivant quils sont favoris es ou non [Sigelle, 1993]. Le crit` ere utilis e est un crit` ere MAP et la solution est obtenue par un recuit simul e. Le temps de calcul est de moins dune minute pour un graphe de 32 000 sites. Les r esultats pour les ASI sont montr es sur la gure 7.8.c.
! !! !
!! !
169
b. Sur-segmentation.
c. Extrait du graphe
Energie a priori : elle permet justement dint egrer toutes les connaissances a priori quon veut prendre en compte pour la d etection du r eseau, par exemple du type : (i) les routes sont longues et, dans labsolu, elles ne sarr etent pas ; (ii) elles ont une courbure relativement faible ; (iii) un segment de route est plus souvent connect e en une extr emit ea ` un unique segment de route qu` a plusieurs. Ces a priori peuvent sexprimer en d enissant les potentiels des cliques dordre maximal (rappelons quune clique est un ensemble de sites tous voisins les uns des autres, donc dans notre cas, un ensemble de segments qui se rejoignent en un m eme point) ; quatre param` etres sufsent pour les contraintes mentionn ees pr ec edemment : un param` etre contr olant les extr emit es (qui vise a ` d efavoriser la conguration dune clique o` u un seul segment a le label route) ; deux param` etres contr olant la longueur des routes (qui visent a ` favoriser des congurations o` u il y deux segments routes qui se joignent en une extr emit e et qui sont align es) ; un param` etre contr olant les carrefours (qui vise a ` d efavoriser les congurations o` u une multitude de segments sont route).
170
reprsentation image 6
Graphe correspondant 6 7 1
1 3
4 5 2 Segments de Sd
7 5
a. Fr equences des observations sur des segments-routes etect es manuellement (ap d proximant ).
!! !
!! !
F IG . 7.10 Fr equences conditionnelles des observations sur une zone test. Lapprentissage de ces param` etres se fait difcilement par les m ethodes du chapitre 3. En revanche l etude de congurations extr emes (cha ne de segments tous a ` route, etc.), plus connue sous le nom de Bo tes qualitatives dAzencott [Azencott, 1992], permet de xer des intervalles de valeurs pour ces param` etres. Un exemple de r esultat obtenu par recuit simul e est montr e sur la gure 7.13.
7.6.3 Conclusion
Ce chapitre ne se veut pas une pr esentation exhaustive des applications possibles des champs markoviens, mais pr esente quelques unes de leurs potentialit es dans des domaines et a ` des niveaux de traitement dimage vari es. Leur grande souplesse permet en effet dintroduire toutes sortes dinformations, que ce soit pour le terme dattache aux donn ees, que ce soit pour les a priori possibles, ou m eme encore sur la forme du graphe a ` utiliser.
171
V(d|0) 1
d 0 t1 t2 1 0 1
F IG . 7.11 Potentiels lin eaires par morceaux utilis es A c ot e de la multitude dapplications qui peuvent trouver une solution dans un cadre markovien, souvrent des champs de recherche plus th eoriques sur lestimation des param` etres et lacc el eration des techniques de recherche de solution.
172
c. Ensemble des 8891 segments constituant les sites du graphe. F IG . 7.12 Les e tapes de la construction du graphe
173
174
Chapitre 8
Un exemple classique d equation aux d eriv ees partielles est l equation de la chaleur, qui s ecrit, pour une fonction de dans :
def
(8.1)
dans , qui d avec des conditions aux bords de . La solution de cette e quation est une fonction ecrit de la propagation au cours du temps de la chaleur dans un milieu isotrope ( est la quantit e de chaleur au point et a ` linstant ). Les e quations aux d eriv ees partielles (E.D.P.) apparaissent naturellement dans de nombreux domaines de la physique, mais leur utilisation en traitement des images peut sembler e trange au premier abord : a ` quoi correspond l evolution dans le temps ou l etat stationnaire ? Lorsque l equation (8.1) est appliqu e e a ` une image esigne plus le temps mais est etre d echelle. Partant dune image et r esolvant cette e quation, , ne d un param` nous obtenons une suite dimages , images simpli ees a ` l echelle . Les E.D.P. apparaissent donc dans le cadre danalyses multi- echelles, et sont a ` ce titre utilis ees en d ebruitage, en restauration, ou en traitement pr ealable a ` des applications en reconnaissance des formes. Ces e quations sont e galement essentielles dans le cadre des probl` emes variationnels, ou lon cherche une image (ou une repr esentation associ ee a ` limage) qui minimise une certaine e nergie. La descente de gradient associ ee a ` cette e nergie fait alors appara tre une E.D.P. dont la r esolution fournit une solution au probl` eme doptimisation consid er e. Cette approche est utilis ee dans des domaines aussi vari es que la d etection de contours, la restauration, le recallage dimages, etc. Dans ce chapitre, nous envisagerons les E.D.P. essentiellement sous langle de lanalyse multi- echelles. En particulier nous naborderons quen passant le lien entre E.D.P. et probl` emes variationnels. Les r esultats math ematiques seront admis, et laccent sera mis sur quelques exemples d equations illustrant les points nous paraissant les plus importants. Apr` es avoir pr ecis e leffet de l equation de la chaleur sur les images, nous expliquerons pourquoi certaines e quations non-lin eaires sont mieux adapt ees a ` leur structure, et donnerons un aperc u de limportance des E.D.P. dans le cadre de lanalyse multi- echelles.
175
176
indicatrice dun ensemble de sera not ee . Pour une fonction r eelle , que nous supposons d eriv ees partielles :
n rentrer dans le vif du sujet, il est ecessaire de pr eciser quelques notations. not e Avant de Un point de . Lasera et sa norme . Le produit scalaire entre et est fonction
Le gradient de
Le laplacien de
o` u est le disque de centre % et de rayon . En effectuant un d eveloppement de Taylor au voisinage de % il % est facile de voir que
o` u est une fonction qui tend vers 0 si tend vers 0. Si nous notons alors ! lop erateur correspondant a ` applications successives tends vers un nombre positif et vers de ! , il est possible de montrer que, si linni, alors ! , solution de l equation % converge vers %
%
%
'
(8.2)
Ce r esultat signie que si lon construit une suite dimages de plus en plus liss ees en partant de , on ob tient asymptotiquement une suite solution de l equation de la chaleur (le facteur 1/8 peut e tre supprim e en normalisant le ltre). Plus g en eralement, ce type de relation reste v eri e si ! est remplac e par un op erateur de convolution avec un noyau isotrope de masse unit e (cest a ` dire que ) sufsamment r egulier (voir [Guichard et Morel, 2002]). En ce sens, l equation de la chaleur est caract eristique dun grand nombre de ltrages lin eaires, et nous allons donc maintenant nous int eresser a ` cette e quation, en commenc ant par donner une construction explicite de ses solutions.
177
Soit le cube unit e. Soit une fonction int egrable de dans (une image). Nous prolongeons par sym etrie par rapport aux axes et , de fac on a ` obtenir une fonction d enie sur . Puis nous prolongeons cette fonction a ` entier par p e riodisation. Ce prolongement a pour but de pouvoir appliquer des convolutions a ` . Nous obtenons ainsi une fonction sym etrique par rapport aux axes, 2-p eriodique en chacune de ses variables. Nous noterons dans la suite lensemble des fonctions int egrables ayant ces propri et es. Cest dans le cadre de cet espace (dont un e l ement peut e tre vu comme une image repr esent ee par une fonction de dans ) que nous donnons la forme des solutions de l equation de la chaleur. Soit
et
. Alors
%
%
Ce r esultat est ici admis, le lecteur int eress e peut se reporter a ` [Guichard et Morel, 2002]. Les bases math ematiques n ecessaires a ` la compr ehension de ces r esultats pourront e tre trouv ees dans [Rudin, 1998]. Pour une e tude plus compl` ete de l equation de la chaleur et ` [Evans, 1998]. Num eriquement, de nombreuses autres E.D.P., on se reportera a en convoluant limage originale avec des noyaux gaussiens et en utinous obtenons donc les fonctions lisant des conditions de sym etrie miroir aux bords de limage. Dans ce chapitre, nous naborderons pas les aspects num eriques li es aux E.D.P., et nous renvoyons le lecteur int er ess e aux r ef erences [Weickert et al., 1998] et [Guichard et Morel, 2002].
Nous avons vu pr e c edemment que l equation de la chaleur permet de lisser une image a ` l echelle , et que partant dune image , nous obtenons une suite dimages , images de plus en plus oues. Nous avons e galement mentionn e que cette suite dimages e tait asymptotiquement repr esentative dun grand nombre de ltrages lin eaires. Dans le cadre de la restauration dimages, il semble donc raisonnable, partant dune image originale oue, de lui appliquer l equation de la chaleur inverse, cest a ` dire
Cette m ethode donne des r esultats satisfaisant pour des valeurs de petites (gure 8.3), mais est num eriquement tr` es instable ce qui limite grandement son utilisation. En effet, l equation (8.4) est mal pos ee, et est tr` es sensible
(8.4)
178
F IG . 8.1 Application de l equation de la chaleur. De haut en bas et de gauche a ` droite : image originale ; images auxquelles a e t e appliqu ee l equation (8.1), respectivement pour des temps . On remarque en particulier que les d etails disparaissent et que les images deviennent oues lorsque augmente.
$$
aux conditions initiales. Ainsi, le r esultat explose pour des temps tr` es rapidement atteints en pratique, et cette explosion est encore acc el er ee si lon bruite limage, ou si on la quantie. Cette instabilit e est illustr ee sur la gure 8.4, o` u lon applique successivement l equation de la chaleur et l equation inverse. Pour (images (c) et (d)), nous remarquons lapparition doscillations sur limage restaur ee. En pr esence de bruit, (images (e) et (f)), nous ne voyons presque plus rien, car certaines valeurs sont devenues tr` es grandes en valeur absolue devant les valeurs maximales de limage originale. Il est ainsi impossible dutiliser cette e quation pour r esoudre un probl` eme du type d econvolution en pr esence de bruit, et son utilit e se limite a ` lam elioration dimage, avec des temps tr` es petits (voir gure 8.3, (a), (b)). Au chapitre 8.2.5, nous pr esenterons une e quation non-lin eaire qui permet une restauration stable num eriquement.
179
F IG . 8.2 Gauche : quelques lignes de niveau de limage originale (pour les niveaux multiples de 30) ; droite, # lignes de niveau de l evolution au temps . On remarque que le long des contours, endroit o` u les lignes de niveau saccumulent, l equation de la chaleur 8.1 les e loigne les unes des autres.
d egradation enissons lensemble de niveau , associ e est agrante sur les ensembles de niveau de limage. Nous d a ` limage d enie sur le domaine , par
Un contour dans une image correspond a ` un saut brusque de niveau de gris, et donc a ` une accumulation des fronti` eres des ensembles de niveau, appel ees lignes de niveau. Ceci est visible sur la gure 8.2, o` u nous montrons une image et quelques-unes de ses lignes de niveau (pour tous les niveaux multiples de 30). Sur la m eme gure, a ` droite, nous montrons ce que sont devenues ces lignes apr` es lissage par l equation de la chaleur. Nous voyons nettement que les lignes se sont e cart ees les unes des autres, ce qui se traduit sur limage par un effet de ou. Limage a donc e t e simpli ee, mais ses contours ont e t e d etruits. Plus formellement, l equation de la chaleur nest pas invariante par changement de contraste. Nous appelons changement de contraste une transformation
o` u est une fonction croissante de dans . Il est bien connu que ce type de changement nalt` ere pas notre perception de la structure dune image, et il suft pour sen convaincre de se munir de lunettes de soleil ou de changer les r eglages dune t el evision. Insistons sur le fait que nous parlons ici de perception de la structure, et que ceci nest pas contradictoire avec le fait quun changement de contraste peut am eliorer la qualit e dune image, voir
180
(a)
(b)
(c)
(d)
(e)
(f)
F IG . 8.4 (a) : diffusion selon l equation de la chaleur (8.1) pour ; (b) : diffusion inverse selon (8.4) a ` partir de limage (a), pour ; (c) et (d) : m eme exp erience, avec , on remarque un d ebut dinstabilit e ; (e) et (f) : m eme exp erience avec , mais un bruit gaussien d ecart type 1 a e t e ajout ea ` la premi` ere image. Les valeurs de niveau de gris explosent en plusieurs points et le r esultat est inexploitable.
181
le chapitre 10. Par ailleurs, des changements de contraste interviennent dans la cha ne dacquisition des images. Pour ces raisons, nous nous int eressons aux modications dimage invariantes par changement de contraste : nous dirons quun op erateur (agissant sur les images) est invariant par changement de contraste si :
' si d esigne lop erateur envoyant une image sur , pour toute fonction r eelle , croissante et continue. Or solution de l equation de la chaleur au temps avec comme condition initiale, il est facile de voir que
(8.5)
nest plus solution de l equation (8.1) (le v erier !), et donc que nest pas invariant par changement de contraste. Pr ecisons que linvariance par changement de contraste est li ee a ` l evolution des de la fac on ensembles de niveau suivante : si est un op erateur v eriant (8.5) et monotone (cest a ` dire que si , alors ), alors
(8.6)
Linvariance par changement de contraste est donc e quivalente a ` une action sur les lignes de niveau. Plus g en eralement, l equation (8.6) permet de ramener l etude des op erateurs sur les images invariants par changement de contraste a ` celle dop erateurs g eom etriques agissant sur des ensembles du plan. Bien que nous ne d etaillons pas ici cet aspect, nous voyons poindre le lien entre ces e quations aux d eriv ees partielles et la morphologie math ematique (voir le chapitre 6) : toute linformation dune image est contenue dans ses ensembles de niveau. Le lecteur int eress e se reportera a ` louvrage [Guichard et Morel, 2002]. Nous verrons au paragraphe 8.3.3 que, sous des hypoth` eses assez faibles, la pr eservation des discontinuit es implique lutilisation d equations non-lin eaires. Nous allons maintenant voir comment lutilisation de ces e quations permet de simplier les images en respectant mieux leur structure.
Nous consid erons une fonction de dans , supposons , et nous plac ons en un point de . En ce point, passe la ligne de niveau associ ee au param` etre , cest a ` direla fronti` e re de , courbe deux fois diff erentiable. Le long de cette ligne, la fonction est constante e gale a ` . Un premier r e sultat important est que le gradient de en , cest a ` dire le vecteur , est perpendiculaire a ` cette ligne de niveau (lorsquil est non nul). Si nous supposons que , nous pouvons d enir un syst` eme de coordonn ees locales en ce point (voir la gure 8.5) :
et
182
curv
PSfrag replacements
F IG . 8.5
pour quadratique associ ee, cest a ` dire que pour deux vecteurs et , nous et notons e galement la forme avons , o` u est le transpos e de . Nous pouvons montrer les formules suivantes, qui permettent de calculer les d eriv ees secondes selon et avec les coordonn ees euclidiennes :
et
" !
) par :
curv
div
par :
On peut montrer que curv ligne de niveau passant par , cest a ` dire linverse du rayon est la courbure de la du cercle osculateur a ` la courbe en (voir la gure 8.5). %
div
La faiblesse de cette e quation est que la diffusion est identique en tout point de limage (cette e quation mod elise initialement la diffusion de la chaleur dans un milieu isotrope). En particulier, comme nous lavons vu au paragraphe pr ec edent, limage est liss ee aussi bien dans les zones homog` enes que le long des contours. Lid ee de Malik
183
et Perona est de lisser limage dans les zones homog` enes, et de ne pas faire e voluer limage le long des contours, voire de rehausser ces derniers, comme nous allons le voir plus pr ecis ement. L equation correspondante s ecrit :
ecroissante, valant 1 en z ero, et tendant vers 0 en linni. L se rapproche donc de avec une fonction d equation de , un des choix (8.1) aux points o` u est proche de 0. A titre dexemple, nous consid ererons fonction propos e par larticle original de Malik et Perona. Pour comprendre ce qui se passe aux points o` u est grand, nous r ee crivons l equation sous la forme
(8.7)
avec les notations du paragraphe 8.2.1. Contrairement au cas de l equation de la chaleur (8.1), qui peut se r ee crire , l evolution varie en fonction des valeurs de (norme et direction). Le premier terme de l equation (8.8) repr esente une diffusion uni-dimensionnelle dans la direction orthogonale au gradient, alors que le deuxi` eme terme prend des valeurs positives ou n egatives selon la valeur de , ce qui correspond respectivement a ` une e quation de la chaleur directe ou inverse (comme e tudi e au paragraphe 8.1.5). Remarquons limportance du param` etre , qui impose le type de diffusion en fonction des valeurs de . Ainsi, cette e quation se propose de r esoudre a ` la fois un probl` eme danalyse (limage est simpli ee a ` l echelle ), et un probl` eme de restauration (rehaussement des contours), qui d epend dun seuil sur le contraste. Signalons e galement que rien ne garantit lexistence et lunicit e des solutions e ventuelles de cette e quation. Enn remarquons que lors de lutilisation de cette e quation comme pr etraitement avant un d etecteur de contours du type Canny (voir le chapitre 11), le choix . Sur la gure 8.6, nous montrons les e du param` e tre correspondra au seuil que lon se xe pour volutions de limage de la gure 8.1 sous leffet de l equation (8.7). A nouveau, nous obtenons une suite dimages de plus en plus simpli ees, ce qui sera utile par exemple pour une recherche de structures. Remarquez que les contours sont mieux pr eserv es que sur la gure 8.1, mais quils ne sont pas trait es de la m eme fac on selon les valeurs du contraste (de ). En particulier, les bords du chapeau tr` es contrast es sont renforc es (comportement du type e quation de la chaleur inverse), alors que les bords de la roue moins contrast es deviennent ous lorsque augmente.
(8.8)
(8.9)
et a originellement e t e introduite par Sethian, [Sethian, 1985]. Il y a diffusion dans la direction perpendiculaire au gradient, alors quil ne se passe rien dans la direction du gradient. Avec les r esultats de la section 8.2.1, cette e quation peut se r ee crire :
curv
Signalons que l equation (8.9) est invariante par changement de contraste. Nous verrons plus loin que ce type de mouvement selon la courbure est in evitable si lon sint eresse aux e quations invariantes par changement de contraste. Rappelons que les modications dimages invariantes par changement de contraste peuvent e tre vues comme une e volution des ensembles de niveau de limage, ce qui est exprim e par l equation (8.6). Il est possible de montrer que l equation (8.9) fait e voluer les lignes de niveau de limage courbure, cest a ` dire quen selon leur % chaque point , la ligne de niveau passant par (cest a ` dire la courbe ) e volue dans la direction de sa normale en (la direction de ), a ` la vitesse curv . En particulier, les lignes droites n evoluent pas sous leffet de (8.9), et les oscillations brusques tendent a ` dispara tre. Du fait de ces propri et es, cette e quation a e t e
184
F IG . 8.6 Equation eme image de d epart que sur la gure 8.1. De haut en bas et de gauche de Malik et Perona. M a ` droite : .
$$
propos ee dans le cadre de lanalyse de formes, voir [Kimia et al., 1992]. Nous illustrons leffet de cette e quation evolution du chapeau : les bords rectilignes e voluent gure 8.7, pour plusieurs temps . Remarquez en particulier l peu tandis que la pointe voit sa courbure diminuer avec le temps . Observez e galement la diff erence avec la gure 8.6 : les contours restent nets tant quils sont pr esents, et ce ind ependemment du contraste (des valeurs de ) le long du contour. Sur la gure 8.8, nous montrons les lignes de niveau de limage au temps ; notez en particulier les diff erences avec la gure 8.2. Remarque : il est possible de montrer (voir [Guichard et Morel, 2002]) que, de m eme que l equation de la chaleur est l equation associ ee asymptotiquement a ` lit eration de moyennages locaux (paragraphe (8.1.2)), le mouvement par courbure moyenne (8.9) est asymptotiquement e quivalent a ` lit eration de ltres m edians (ltres non-lin eaires d enis au paragraphe 10.2.2). Nous verrons au paragraphe 8.3 que les e quations raisonnables pour lanalyse des images qui sont invariantes par changement de contraste et isom etries (rotations-translations) s ecrivent sous la forme :
curv
(8.10)
avec r eelle continue et d ecroissante en . Le mouvement par courbure moyenne correspond une fonction au cas . Si lon impose de plus linvariance par transformations afnes, il ne reste plus quune seule e quation, introduite en 1993 par Alvarez, Guichard, Lions et Morel (voir [Alvarez et al., 1993]) :
sign curv
curv
(8.11)
185
F IG . 8.7 Evolution par courbure moyenne. Limage originale est limage gauche a ` droite, les solutions de l equation (8.9) respectivement pour
F IG . 8.8 Lignes de niveau de la solution de (8.9), mouvement par courbure moyenne, pour multiples de 30).
(niveaux
o` u d esigne toujours le domaine de d enition des images, et un param` eel positif. Minimiser cette e nergie etre r sur un ensemble de fonctions (par exemple les fonctions e gales a ` sur la fronti` ere de ) revient a ` chercher
(8.12)
186
une fonction proche de tout en p enalisant les ace au deuxi` eme terme. L equation fonctions trop oscillantes gr dEuler-Lagrange associ ee a ` cette e nergie est , et la descente de gradient correspondante est :
avec comme pr ec edemment une fonction de % ( ), et en utilisant les r esultats du paragraphe 8.2.1, nous pouvons r ee crire cette e quation sous la forme :
div
"
Ces e quations sont es utilis ees en restauration dimages, car la minimisation d energies du type (8.12), com tr` prenant un terme (la variation totale de limage), permet dobtenir des solution aux bords francs, sans les oscillations r esiduelles qui peuvent appara tre, par exemple, avec lutilisation du ltre de Wiener (voir paragraphe 5.2.2). Dans le cas de la restauration dimage convolu ee par un noyau et bruit ee, l energie (8.12) prend la forme
curv
(8.13)
Ces m ethodes sont en particulier utilis ees par le Centre National dEtudes Spatiales (CNES), dans le cadre de limagerie satellitaire. Figure 8.9, nous comparons les r esultats obtenus par variation totale et ltre de Wiener dans le cas dune image satellitaire. Limage est convolu ee avec un ltre connu, puis lui est ajout e un bruit gaussien de d eviation standard connue. La restauration par Wiener se fait comme expliqu e au paragraphe 5.2.2, la densit e de puissance du signal e tant estim ee sur limage d egrad ee. La restauration par la m ethode de Rudin-Osher-Fatemi seffectue en minimisant l energie (8.13) par e volution sufsamment longue de l equation associ ee. Remarque : de la m eme mani` ere, on montre que l equation de la chaleur (8.1) est associ ee a ` l energie .
sign
(8.14)
avec limage a ` restaurer comme condition initiale. La diffusion des niveaux de gris seffectue dans la m eme direction quavec l equation de la chaleur inverse (8.4), mais est bien plus stable. Il est possible de montrer que cette e quation fait e voluer les lignes de niveau a ` une vitesse constante. Sur la gure 8.10, nous reprenons les exp eriences pr esent ees pour l equation de la chaleur inverse, pour illustrer leffet du ltre de choc ainsi que sa stabilit e. Remarquons en particulier que la restauration se fait au prix dune perte des d etails et de la texture : pour des valeurs croissantes de , limage ltr ee prend une allure de type bande dessin ee. Sur la derni` ere exp erience (8.10 (f)) on remarque que la pr esence de bruit sur limage initiale (e) entra ne lapparition deflochement le long des contours.
187
F IG . 8.9 Exemple de restauration. De haut en bas et de gauche a ` droite : image originale (image Spot 5 c CNES 2002) ; image d egrad ee par convolution et ajout de bruit ; image restaur ee par Wiener ; image restaur ee par minimisation de l energie (8.13).
es ltres , appel
(8.15)
Cette propri et e signie que limage a ` une e chelle plus grossi` ere peut se d eduire dune version a ` une e chelle plus ne, sans n ecessiter limage originale. Un cas particulier de cette propri et e est le cas o` u lanalyse multi- echelles est r ecursive, cest a ` dire que (propri et e de semi-groupe). Nous allons consid erer des op erateurs causaux, cest a ` dire qui ne cr eent pas de nouvelle structure lorsque l echelle augmente. Une autre propri et e d esirable pour une analyse multi- echelles est la localit e. Dans le cas o` u
188
(a)
(b)
(c)
(d)
(e)
(f)
F IG . 8.10 Filtre de choc de Rudin. Les images (a), (c), (e) sont identiques a ` celles de la gure 8.3. Les images (b), (d), (f) sont les applications correspondantes de l equation (8.14) (respectivement ).
189
les op erateurs sont pyramidaux, le r esultat de lapplication du ltre de transition en un point, , ne doit d ependre que des valeurs de dans un voisinage de . Ces deux principes, de localit e et de causalit e, sont condens es dans le principe suivant, qui afrme que si une image est localement plus claire quune autre, il en sera de m eme pour les deux familles multi- echelles correspondantes pendant un certain temps :
Principe de comparaison locale. echelles est dite satisfaire le principe de comparaison Une analyse multi- locale, si pour toutes fonctions et : dans un voisinage de , , alors pour sufsamment petit, si
et si
, alors :
Une derni` ere propri et e que nous imposerons a ` une analyse multi- echelles est une propri et e de r egularit e : une image r eguli` ere (par exemple diff erentiable) e volue r eguli` erement. Il sav` ere sufsant de faire cette hypoth` ese pour des fonctions quadratiques. R egularit e. Soit un point de
Lanalyse multi- echelles est dite r eguli` ere sil existe une fonction , continue par rapport a ` que : quand
(8.16)
, telle (8.17)
Dans la suite, nous dirons quune analyse multi- echelles est causale si elle est pyramidale, et satisfait aux principes de comparaison locale et de r egularit ee nonc es ci-dessus. Ce sont ce type danalyses multi- echelles dont nous allons maintenant clarier le lien avec les E.D.P., et pour lesquelles nous donnons un d ebut de classication.
8.3.2 Pourquoi les analyse multi- echelles sont r egies par des E.D.P.
Nous donnons un r esultat qui pr ecise le lien entre analyse multi- echelles et e quations aux d eriv ees partielles. Le lecteur int eress e en trouvera la preuve dans [Guichard et Morel, 2002]. Si une analyse multi- echelles est causale, (cest a ` dire pyramidale r eguli` ere, et satisfaisant au principe de comparaison locale), alors il existe une fonction telle que
, et donc que si dans l equation ci-dessus nous voyons comme , le terme de gauche, lorsque tends vers 0, tends vers . Le r esultat est en r ealit e non trivial, mais lon peut montrer que est solution de :
! . lorsque tend vers , pour toute fonction , et tout Rappelons alors que lop erateur permet de passer du temps au temps
(8.18)
avec . Ces r esultats sont prouv es dans [Guichard et Morel, 2002], gr ace a ` une notion de solution particuli` ere, les solutions de viscosit e.
'
190
Gr ace au r esultat ci-dessus, la classication des analyses multi- echelles se ram` ene a ` la classication des fonctions . Nous allons maintenant voir quen imposant a ` lanalyse des contraintes li ees a ` la structure des images, les formes possibles de la fonction sont grandement r eduites. Commenc ons par linvariance par addition dune constante. Supposons que
pour toute fonction et toute constante (un d ecalage constant de niveau de gris naffecte pas laction de lop erateur ). Il est facile de voir que si est causal et invariant par addition dune constante, alors ne d epend pas de . Ceci se prouve en appliquant (8.17) et (8.19) a ` la fonction , o` u est une forme quadratique du type (8.16). Similairement, nous avons les r esultats suivants, pour un op erateur invariant par laddition de constantes : Si est invariant par translation (cest a ` dire commute avec lop erateur , pour tout ), alors ne d e pend pas de son quatri` e me argument, . commute avec les rotations et translations (invariance euclidienne) alors pour toute matrice disom etrie Si ,
et
(8.19)
(Rappelons epend pas de dans ce cas en vertu de la propri et e pr ec edente). que F ne d Si est invariant par changement de contraste, alors pour toutes constantes :
o` u
Cette derni` ere propri et e est quelque peu obscure, mais est indiqu ee comme r esultat interm ediaire pour e tablir la forme des analyses multi- echelles invariantes par changement de contraste, donn ee ci-dessous au paragraphe 8.3.3.
(8.20)
De plus, des hypoth` eses simples dinvariance permettent de grandement simplier les formes possibles de la fonction . Ces r esultats, d etaill es dans [Guichard et Morel, 2002], permettent une classication des analyses multie chelles. Nous donnons maintenant quelques-uns de ces r esultats de classication. Analyse lin eaire isotrope Le premier r esultat indique que si lanalyse est lin eaire et isotrope, elle est donn ee par l equation de la chaleur, r esultat que nous avions entrevu au d ebut du paragraphe 8.1.2.
191
Si
est un op eaire, alors (` a une renormalisation erateur causal, invariant par rotation et translation, et lin pr` es) est solution de :
$
in in
!
(8.21)
Remarquons que ce r esultat implique en particulier que lin earit e et invariance par changement de contraste sont incompatibles, puisque l equation de la chaleur nest pas contraste invariante. Invariance par changement de contraste Nous avons vu au paragraphe 8.1.6 limportance de linvariance par changement de contraste en traitement des images, et il est donc quations satisfaisant a ` cette invariance. Le r esultat naturel de se demander quelles sont les e est le suivant : si est une analyse multi- e chelle causale, invariante par rotation et translation, et invariante par changement de contraste, alors est solution de l equation
o` u est une fonction croissante et continue par rapport a ` son premier argument. Remarquons que les e quations pr esent ees au paragraphe 8.2.3 sont parmi les e quations les plus simples de ce type. Invariance afne Pour conclure nous nous int eressons aux analyses invariantes par changement de contraste et par transformations afnes. Les transformations afnes sont dune grande importance en traitement des images, en particulier parce quelles fournissent une approximation simple des transformations projectives quinduisent sur les images les mouvements des appareils optiques de capture lors du passage dune sc` ene tridimensionnelle a ` une photo bidimensionnelle. Si lon suppose que est une analyse multi- echelles causale et invariante par transformation afne, alors (` a une renormalisation du param` etre pr` es)
curv
curv
o` u,
et e tant des constantes ([Alvarez et al., 1993]). En imposant des contraintes assez simples et directement li ees au processus de formation des images, nous nous sommes donc ramen es a ` une seule e quation possible pour une analyse multi- echelles, appel ee AMSS pour langlais Afne Morphological Scale Space . En vertu de ses invariances g eom etriques, et parce quelle pr eserve les discontinuit es, cette e quation est en particulier utilis ee en reconnaissance de formes. Signalons enn que le lecteur d esireux dapprofondir le sujet pourra se r ef erer a ` [Guichard et Morel, 2002], [Aubert et Kornprobst, 2001], [Weickert, 1998].
! si ! si
(8.22)
192
Chapitre 9
Pour analyser lin e ere g en eralement un dictionnaire de airement une image, on consid` fonctions danalyse, e tant un certain ensemble de param` etres inclus dans , propre a ` la famille choisie. lin eaire de limage , d enie sur , est alors obtenue en calculant une corr elation Une transformation entre et la fonction :
"
o` u
"
(9.1)
d esignant le complexe conjugu e de la quantit e en argument. La premi` ere question qui se pose naturellement, dans cette approche, est de savoir quelles fonctions utiliser. Ce choix se fait souvent en suivant deux imp eratifs, quon rencontre plus g en eralement dans tous les probl` emes de mod elisation : d enir une famille sufsamment riche pour pouvoir mod eliser efcacement des images au contenu relativement complexe (telles que celles quon rencontre en vision assist ee par ordinateur ou encore en vid eo) garder des fonctions dexpression relativement simple et caract eris ees par un nombre limit e de param` etres. Lexemple le plus classique danalyse lin eaire est la transform ee de Fourier (TF). On a alors , et :
Cette transformation est bien adapt ee a ` lanalyse des comportements harmoniques, surtout apparents dans les zones textur ees des images, mais elle nest pas appropri ee a ` lanalyse de formes bien localis ees spatialement. Pour avoir la possibilit e de conserver une analyse spectrale tout en acqu erant un pouvoir de localisation spatiale, il faut adopter une approche espace-fr equence (temps-fr equence en 1D [Flandrin, 1998]), en choisissant des fonctions a ` la fois oscillantes et de support limit e. On dit alors que les fonctions constituent des atomes espace-fr equence. Plusieurs choix de tels atomes sont envisageables : 193
194
famille de Weyl-Heisenberg eg` erement la TF, en introduisant une fen etre . On prend ainsi . On modie l , et : (9.2)
d esigne celle de (suppos ee d enie). En choisissant centr ee et de type passe-bas (localis ee en espace et en fr equence autour de (0,0)), on voit que est localis e e spatialement autour de et fr equentiellement autour de . Le principe de Gabor-Heisenberg [Flandrin, 1998] nous assure que la localisation espace-fr equence est optimale si :
o` u
&%
prend une forme gaussienne de ce type, on dit quon effectue une analyse
La fonction est appel ee une ondelette m` ere [Meyer, 1990]. Il sagit g en eralement dune fonction de carr e sommable assez r eguli` ere, bien localis ee en espace et en fr equence (la d ecroissance asymptotique de la fonction, ainsi que celle de sa TF sont rapides) et telle que :
% ,
et
"
La TF de
vaut :
o` u d la TF de . Si est localis ee spatialement en et fr equentiellement en e signe a un maximum global en ) alors est localis (i.e. e e spatialement en et . En faisant varier les param` e tres de localisation spatiale et le facfr equentiellement en teur d echelle (analyse espace- echelle), il y a bien la possibilit e de r ealiser du m eme coup une analyse espace-fr equence. Nous navons pas encore parl e du r ole du param` etre , qui correspond a ` un angle indiquant la direction danalyse privil egi ee. On peut, par exemple, d enir :
"
o` u
%
! % !
et de poser :
o` u d esigne maintenant une ondelette m` e (telle que " ) et est une fonction basse re 1D " fr equence localis ee en 0 telle que . On g en` ere ainsi une famille dondelettes 2D s eparables. Un exemple de telles fonctions est donn e par la gure 9.1. Compar ees a ` la famille de Weyl-Heisenberg, les familles dondelettes sav` erent souvent mieux adapt ees a ` lanalyse des images naturelles. De plus, lanalyse quelles permettent de r ealiser a lavantage d etre plus proche de celle op er ee par le syst` eme psycho-visuel [Mallat, 2000].
195
(a) 8 6 6 4 4 2 2 0 0 2 2 4 4 6 6 8 8 6 4 2 0 2 4 6 8 6 4 2 0
(b)
, (b) . Londelette (resp. ) permet dextraire les sert a ` lanalyse des d etails r esiduels. informations de type contours horizontaux (resp. verticaux) alors que
famille de Gabor modi ee . En partant de lid ee de ec edentes, combiner les caract eristiques des deux familles pr on peut prendre , et
eelle, la transform ee dune image r eelle est aussi r eelle ( ). Lanalyse obtenue Notons que, si est r (cf. gure 9.2) est plus exible que celles de Gabor ou en ondelettes, mais elle comporte un nombre accru de param` etres a ` g erer. ridgelets. Les fonctions de cette famille ees aux ondelettes. Elles sont d enies sont fortement apparent [Cand` es, 1999] par , et :
&%
&%
(9.3)
&%
#
des contours, qui constituent des e l ements s emantiques essentiels des images. Notons que les fonctions ne peuvent e tre ni sommables, ni de carr es sommables sur . Maintenant que nous avons quelques id ees sur la fac on de construire une transformation lin eaire, un certain nombre dinterrogations doivent nous venir a ` lesprit :
o` u
ere 1D. Les courbes de niveau de la fonction sont les droites d equations est une ondelette m` , . Ceci explique que cette famille soit particuli` erement bien adapt ee a ` lanalyse
1. Quand une transformation lin eaire fournit-elle une repr esentation compl` ete ? En dautres termes, ` quelle a condition la seule connaissance des coefcients suft-elle a ` caract eriser enti` erement limage ? Le cas
196
(a) 5
5 5
5 5
(c) 5 5
(d)
5 5
5
#
5 5
# %$'&( #
5
F IG . 9.2 Exemple de fonctions de Gabor modi ees localis ees en ! "
0
gaussienne.
2
(orientation suivant laxe des ordonn ees) et (a) # (orientation suivant la seconde bissectrice) et (c)
ou (b)
ou (d)
: atomes a ` l echelle pour )( ; atomes a ` l echelle pour 3$!&2( . La fonction 4 est ici une
e ch eant, on doit e tre a ` m eme de reconstruire limage ` partir de ses coefcients. La question revient donc a ` se a demander si lon peut inverser la transformation . Un autre int e r e t, beaucoup plus pratique, de la d e nition dune inverse de est la possibilit e de r ealiser des traitements e labor es a ` partir dune transformation lin eaire, suivant le sch ema g en erique de la gure 9.3. Le traitement peut e tre, par exemple, un codage ou une estimation an de comprimer ou bien de d ebruiter limage. Notons que ces op erations sont g en eralement plus simples a ` mettre en uvre apr` es transformation que directement, sur limage dorigine.
2. Existe-t-il des m ethodes rapides pour le calcul de certaines transformations lin eaires ? Peut-on reconstruire ou bien synth etiser de mani` ere efcace une image a ` partir de ses coefcients ? Un premier pas dans la voie de limpl ementation est la discr etisation de lensemble . Il est clair quavec un ordinateur, on ne peut eressant de se demander si prendre en compte quun nombre ni datomes espace-fr equence. Il est donc int lon peut se limiter a ` des familles discr` etes de fonctions (i.e. des ensembles d enombrables). Avant dapporter des e l ements de r eponses a ` ces questions, pr ecisons quelques points math ematiques, ne serait-ce
9.2. TRAMES
197
traitement
F IG . 9.3 Traitement dans le domaine transform e ( : image dorigine, : coefcients transform es, es, : coefcients trait
: image trait ee).
que pour donner un sens rigoureux ` lint egrale . Lensemble des images que nous consid ererons est , a lespace de Hilbert des fonctions a ` valeurs complexes, d enies sur , d energie nie, celle-ci e tant donn ee par :
"
"
"
9.2 Trames
9.2.1 Objectif
ete par d trames permettent de d enir une repr esentation compl` ecomposition sur une famille Les de fonctions dun espace de Hilbert ( ), e tant un ensemble dindices d enombrable.
discr` ete
9.2.2 D enition
Une famille que :
tel
(9.4)
Les constantes strictement positives et sont appel ees les bornes de la trame. Si , on dit que la trame est ajust ee (tight frame). Remarques : Une base orthonormale de constitue une trame ajust ee puisquon a, par conservation de la norme :
Inversement, si une trame est ajust ee avec et si , , alors on montre que cest une base orthonormale. Des e l ements dune trame peuvent e tre lin eairement d ependants. Ceci signie quune trame conduit g en eralement a ` une repr esentation redondante de linformation (on calcule plus de coefcients que cela nest strictement n ecessaire !). Cette redondance peut e tre p enalisante dans certaines applications telles que la compression dimages, o` u lon cherche a ` compacter au maximum linformation a ` coder. Au contraire, la redondance est souvent recherch ee en analyse dimages, car elle permet demployer des dictionnaires plus riches de fonctions qui offrent, par exemple, la possibilit e de mieux localiser les objets pr esents dans la sc` ene consid er ee.
198
Lun des int er ets de la d enition ci-dessus est de conduire a ` un op erateur de transformation : !
qui est lin eaire et continu. En effet, rappelons que, pour un op erateur lin eaire, la continuit e est e quivalente a ` la bornitude [Schwartz, 1995] et on vient de voir que :
9.2.3 Propri et es
Commenc ons par ouvrir une petite parenth` ese math ematique, en calculant ladjoint de . Cet adjoint, not e est d eni par :
et donc :
Remarquons que,
(9.5)
, on a :
ce quon exprime aussi, de mani` ere encore plus synth etique, par :
e tant lin eaire et continu (puisque et donc Lop erateur bijectif et dinverse continu [Daubechies, 1992a]. De plus, en utilisant des propri et es des op erateurs auto-adjoints, on montre que : (9.7)
(9.6)
Utilisons r e sultats inversible a ` gauche. .bien dabord ces pour inverser . Remarquons tout que est En effet, posons . Il est clair que En fait, il sav` e re que na pas vers n ecessairement un inverse a ` gauche unique et est le pseudo-inverse de , i.e. lop erateur de ,
inverse a ` gauche de , qui est de norme minimale [Daubechies, 1992a] (voir aussi le Chapitre 5).
conduit a ` la reconstruction de
a `
9.2. TRAMES
Plus pr ecis ement, en utilisant la relation (9.5), on trouve la formule de reconstruction suivante :
199
(9.8)
On dit que
(9.9)
Par cons equent :
En utilisant lin egalit e (9.7), on en d eduit lin egalit e d esir ee qui est caract eristique dune trame. En r esum e, de m eme que lon dispose de deux formules de reconstruction, on a deux transformations duales :
A ce point, on peut naturellement se demander dans quelle situation sp ecique une trame fournit une analyse non redondante. En premier lieu, il convient dintroduire le concept de base de Riesz , qui formalise cette notion de non-redondance . D enition 1. Une base de Riesz est une trame dont les e ements sont ind ependants. l
est une base de Riesz, alors est aussi une base de Riesz, puisque Notons que, si . Par ailleurs, compte tenu de la relation duale de (9.8) :
et, la famille
En raison de cette relation, on dit que et cas, si les fonctions , sont norm ees, on a :
Mentionnons que les bases bi-orthogonales sont tr` es utilis ees en compression dimages [Antonini et al., 1994] et notamment dans la nouvelle norme JPEG2000 (voir la gure 9.4).
200
bits/pixel) et en bas limage d ecod ee a ` 0.25 bit/pixel (cest-` a-dire, une compression dun facteur 96 pour une image couleur). Le rapport signal sur bruit de codage vaut 28.17 dB en valeur cr ete (PSNR). JPEG2000 repose sur lemploi de bases bi-orthogonales dondelettes. Les coefcients dondelettes sont quanti es dautant plus nement que leur amplitude est grande. Une strat egie de codage assez sophistiqu ee est e galement mise en uvre an datteindre de forts taux de compression.
. Quand
o` u
Dans les deux cas, on est amen ea ` approcher num eriquement lop erateur poser :
.
o` u
. Sous la condition
9.2. TRAMES
201 de
est ainsi :
soit
!
On observe que converge dautant plus rapidement vers (quand ) que est petit, cest-` a-dire que les bornes de la trame sont proches. Par ailleurs, une formule r ecursive permet de calculer rapidement :
. Une condition n o` u ecessaire pour que soit une trame de est alors : . On montre, par ailleurs, que la trame duale est la trame de Weyl-Heisenberg correspondant a ` une certaine fen etre . trames dondelettes On discr etise l echelle suivant une loi exponentielle, alors que les facteurs de translation sont e chantillonn es avec un pas proportionnel a ` cette m eme e chelle [Meyer, 1990]. Ainsi, dans le cas s eparable, on a :
% % . Lentier est couramment appel o` doit prendre e niveau de r esolution. Lorsque u(resp., et lon ) la r esolution est grossi` ere (resp., ne), les ondelettes e tant dilat ees (resp., contract ees). On montre que la trame duale est aussi une trame dondelettes. . Fait important, il est Tr` es souvent, on se limite a ` des d ecompositions dyadiques pour lesquelles
possible de construire des bases bi-orthogonales [Cohen, 1992] ou m eme orthonormales dondelettes, dans ce cas [Pesquet-Popescu et Pesquet, 2001]. Il peut alors e tre int e ressant de limiter lanalyse en ondelettes a ` un certain niveau de r esolution , en d eterminant les coefcients dondelettes
202
peut extraire les structures pr esentes dans limage, d echelle au moins e ` on gale a . En faisant varier , on r ealise ce quon appelle une analyse multir esolution (AMR). Quand d ecro t, fournit une approximation plus ne de limage ce qui, en quelque sorte, permet de zoomer sur les d etails de la sc` ene (cf. gure 9.5). Gr ace a ` ce concept dAMR, on peut concevoir des algorithmes efcaces [Mallat, 2000] pour effectuer le calcul dune d ecomposition sur une base dondelettes. En termes de complexit e, ces algorithmes sont comp etitifs par rapport a ` ceux de transform ee de Fourier rapide. A titre illustratif, un exemple de d ebruitage a ` laide de trames dondelettes est donn e en gure 9.6. trames de Gabor modi ees Dans [Bergeaud, 1996], il est demontr e quon peut obtenir une trame de a ` partir dune famille de Gabor modif ee en prenant
, et o` u . trames de ridgelets On peut de mani` ere similaire [Cand` es, 1999] discr etiser les param` etres dune famille de ridgelets en prenant
% $ %
%
%
(9.10)
$ , lespace des images d o` u . On obtient alors une trame de energie nie d enies sur le carr e unit e . Par dilatations et translations des fonctions de cette trame, on peut se ramener a ` une trame , o` . En partitionnant en carr de u est un carr e arbitraire de e s, on peut ainsi g e n erer une . Une analyse de ce type (pr trame de ec ed ee dune d ecomposition a ` laide dun banc de ltres
&%
$ $
[Vetterli et Kova cevi` c, 1995] isotropes) permet de construire des bases orthonormales de curvelets , qui sont mieux adapt ees que les ridgelets a ` lanalyse des contours non rectilignes [Cand` es et Donoho, 1999].
Soit
une trame de
Cependant, si nest pas une base de Riesz de , alors les coefcients enis de ne sont pas d mani` ere unique. Parmi toutes les strat egies de choix possibles pour les coefcients , la meilleure est sans doute celle qui consiste a ` concentrer au maximum l energie de limage sur un nombre minimal de termes de la d ecomposition (9.11). De cette mani` ere, on peut esp erer faire appara tre les termes principaux, i.e. les structures essentielles composant limage .
, il existe
, mais ces derniers ne v Lalgorithme des trames permet de d eterminer des coefcients erient g en eralement pas la propri et e de concentration d energie dont nous venons de souligner limportance. Pour pallier ce probl` eme, nous allons maintenant proposer une autre approche.
203
de limage . Dapr` es le th eor` eme de Pythagore, lerreur dapproximation est donn ee par :
est grand. Pour d On voit donc que lerreur est dautant plus faible que eterminer l el ement de limportance est pr epond erante, il suft ainsi de rechercher celui qui maximise . Supposons que :
dont
On peut alors appliquer la m eme m ethode a ` lerreur dapproximation (appel ee aussi r esidu ),
de fac on a ` isoler le second ingr edient essentiel , , entrant dans la composition du signal. Remarquons au passage que est orthogonal a ` . En proc edant de cette mani` ere, it erativement, on obtient a ` l etape :
(9.12)
o` u
et lon a pos e
(9.13)
Remarques : Si est de dimension innie, rien ne garantit que a ` la r` egle de s election (9.13) la suivante :
o` u . Notons que, m eme dans le cas o` u est de dimension nie, cette nouvelle r` egle de s election peut e tre mise a ` prot an de faciliter la recherche de .
204
On peut montrer [Mallat et Zhong, 1993] que lalgorithme de poursuite converge vers la projection orthogonale de sur . Dans le cas o` u , la limite obtenue est et on a la d ecomposition :
Si
est de dimension nie, on peut de plus e tablir que la convergence est exponentielle, i.e.
9.3.3 Am eliorations
R eduction de la complexit e La m ethode que nous avons pr esent ee au paragraphe pr ec edent pose des probl` emes de complexit e qui peuvent devenir r edhibitoires en traitement dimage si lon ne veille pas a ` optimiser sa mise en uvre. , on doit d eterminer les corr elations du r esidu avec les fonctions . Ce calcul peut A lit eration e tre r ealis e efcacement, de mani` ere r ecursive, en remarquant que, dapr` es (9.12),
. Pour le dictionnaire d eni par les e quations (9.3) a ` (9.10), cette propri et e est v eri ee si est de support limit e. On peut, par exemple, prendre pour une fonction spline. Pour initialiser la r ecurrence (9.14), il faut calculer . Si des dictionnaires de type (9.3)-(9.10) sont employ es, cette corr elation peut e tre effectu ee a ` laide de bancs de ltres [Vetterli et Kova cevi` c, 1995]. La complexit e de cette e tape de ltrage peut e tre r eduite en imposant a ` la fonction d etre s eparable. Notons enn que l equation (9.14) doit e tre mise en uvre m eme si es faibles valeurs, prend de tr` ce qui induit une charge de calculs inutile. Pour acc e l e rer le traitement, on peut se limiter a ` un sous-dictionnaire restreint form e des e l ements ayant une inuence non n egligeable, i.e. tels que :
On voit donc quil est pr ef erable de pr e-calculer les produits scalaires , . Par ailleurs, pour telles que , minimiser le nombre de mises a ` jour, on a int e r e t a ` limiter le nombre de fonctions
(9.14)
o` u . Dans la suite des it erations de lalgorithme de poursuite, on e limine alors successivement les fonctions ne contribuant pas signicativement a ` lanalyse du r esidu, i.e. , telles que :
Quand toutes les fonctions ont ainsi e t ee puis ees1 et que le sous-dictionnaire est r eduit a ` lensemble vide, disons a ` lit eration , on peut constituer un nouveau sous-dictionnaire en recherchant les fonctions de telles que et it erer la proc edure jusqu` a sa convergence [Bergeaud, 1996].
A lit eration de lalgorithme de poursuite, on sait que le r esidu est ` orthogonal a , mais il nest pas n ecessairement orthogonal au sous-espace vectoriel engendr e par la famille , si cette derni` ere nest pas orthonormale. Ceci montre que rien nemp eche le m eme e l ement du dictionnaire d etre retenu plusieurs fois au cours des it erations de lalgorithme de poursuite. Par cons equent, on nest pas assur e de la convergence de lalgorithme en un nombre ni dit erations, m eme si le dictionnaire est ni. Pour pallier ce probl` eme, on peut recourir a ` une orthogonalisation r ecursive de la famille , en employant une proc edure de Gram-Schmidt.
Orthogonalisation
$
1 On
montre que cela se produit n ecessairement au bout dun nombre ni dit erations.
205
, , , (de haut en bas). LAMR peut e tre utilis ee pour la transmission progressive dinformation ou la recherche hi erarchique dans des bases de donn ees. Dans chacune de ces applications, on part dune approximation a ` faible r esolution de limage, qui est rafn ee au cours des e tapes du traitement.
206
F IG . 9.6 D ebruitage dimage a ` laide de trames dondelettes. A gauche, on peut voir limage d egrad ee, apr` es addition dun bruit non gaussien (m elange de distributions gaussiennes). Lerreur quadratique moyenne normalis e e (EQMN) par rapport a ` 2( . Limage restaur ). Un estimateur non lin loriginal vaut ee est pr esent ee a ` droite (EQMN = eaire est employ e qui consiste simplement en un seuillage des coefcients dondelettes. Cette op eration permet d eliminer les coefcients de petite amplitude, tr` es sensibles au bruit, alors quon conserve ceux de forte amplitude, sur lesquels se concentre essentiellement l energie de limage.
207
(a)
(b)
(c)
(d)
F IG . 9.7 Approximation par poursuite adaptative de limage de la gure (a), en utilisant un dictionnaire de Gabor modi e pour un nombre dit erations e gal a ` : (b) 650 , (c) 1300 et (d) 1950.
208