Cette page est une version électronique de l'article publié dans les actes de l'International Conference on Image and Signal Processing (ICISP'2001), Agadir, Morocco, May 2001. |
Thierry Géraud, Pierre-Yves Strub, Jérôme Darbon
Laboratoire de Recherche et Développement de l'EPITA
14-16 rue Voltaire, F-94276 Le Kremlin-Bicêtre cedex, France
{ thierry.geraud,
pierre-yves.strub,
jerome.darbon }@lrde.epita.fr
http://www.lrde.epita.fr
La segmentation a pour but de déterminer les régions d'une image cohérentes à la fois spatialement et du point de vue de leur contenu. Une catégorie de méthodes de segmentation d'images s'appuie sur une classification : les points de l'image sont des individus que l'on souhaite regrouper en classes. Pour cela, on considère que l'histogramme de l'image est un espace des caractéristiques de ces individus. Dans le cas des images en couleur, un nombre important de points qui sont de couleurs très proches produit une zone de valeurs élevées dans l'histogramme. D'un point de vue statistique, cette zone traduit la présence d'un mode de couleurs dans l'image. L'histogramme réduit à cette zone permet un calcul approximatif de la fonction de densité de probabilité (FDP) associée à ce mode. L'histogramme complet traduit la somme des FDP s ; cette somme est la fonction de densité de probabilité globale (FDPG). Les classifieurs statistiques prennent pour hypothèse que chaque FDP suit un modèle donné. Souvent, il s'agit d'une loi gaussienne ou multi-gaussiennes si l'espace des caractéristiques est de dimension supérieure ou égale à 2. Citons par exemple le classifieur proposé récemment par Frigui et Krisnapuram [2] qui réussit même à prendre en compte la superposition des modes dans l'espace des caractéristiques.
Cependant, dans le cas d'images en couleur quelconques, l'hypothèse de modes multi-gaussiens s'avère généralement très éloignée de la réalité. L'utilisation de classifieurs statistiques classiques s'en trouve alors peu justifiée. Une autre approche permettant d'identifier les modes d'un histogramme s'appuie sur l'aspect morphologique de l'histogramme et des techniques de morphologie mathématique [8] peuvent être utilisées. Cet article propose un classifieur morphologique non supervisé qui s'appuie sur l'algorithme de la ligne de partage des eaux (LPE) proposé par Vincent et Soille [9]. La LPE est appliquée dans l'espace des caractéristiques afin d'obtenir une segmentation de l'image. Cette méthode contraste donc avec les méthodes de segmentation par la LPE dans l'espace de l'image [6,3].
L'organisation de cet article est la suivante. La section 2 présente un état de l'art des méthodes de classification morphologique. La section 3 explique la méthode de classification morphologique non supervisée par LPE que nous proposons et donne ses propriétés. La section 4 commente les résultats que nous avons obtenus avec cette méthode. Enfin, la section 5 conclut cet article et discute des perspectives que laisse envisager la méthode proposée.
Nota bene : les images utilisées ou produites dans cet article ainsi que les résultats obtenus sur d'autres images de test sont disponibles sur l'Internet à partir de l'adresse http://www.lrde.epita.fr/download/.
Tous les classifieurs morphologiques considèrent la FDPG comme une image numérique à valeurs entières afin de pouvoir analyser l'allure de la FDPG à l'aide de traitements d'images.
Dans [5], Postaire et al. propose un classifieur
morphologique très simple qui utilise la morphologie mathématique binaire : la FDPG est
seuillée pour obtenir une image binaire où l'objet correspond aux
valeurs suffisamment élevées de densité donc au cur des modes ;
une fermeture morphologique est appliquée pour régulariser la forme
des objets ; enfin, un étiquetage de composantes connexes permet de
distinguer les différents modes. Malheureusement, cette classification
tire très peu parti de la forme ``à niveaux'' de la FDPG. De plus, un
mode peu représenté, c'est-à-dire de faible probabilité a
priori, disparaît avec le seuillage, même lorsque ce mode est bien
isolé dans l'espace des caractéristiques.
Afin de palier ces défauts, Zhang et Postaire [10] proposent de traiter l'image à niveaux de la FDPG avant d'effectuer le seuillage. Le pré-traitement est un filtrage morphologique dépendant de la convexité du paysage de la FDPG qui a pour but d'augmenter la séparabilité des modes en creusant les vallées. Seulement, le relief initial entre deux modes doit déjà être suffisamment prononcé pour que les modes soient effectivement bien séparés.
Notons que les deux méthodes précédentes posent un problème lors de la segmentation finale de l'image originale. En effet, les modes sont identifiés sous la forme de composantes connexes dans l'espace des caractéristiques mais aucun partitionnement de cet espace n'est fourni ; dès lors, le vecteur caractéristique d'un point de l'image originale peut n'appartenir à aucune composante et l'affectation d'une classe à ce point n'est pas triviale. La méthode suivante résout ce problème.
Park et al. proposent une méthode beaucoup plus élaborée [4] : l'image de la FDPG est tout d'abord traitée par une différence de gaussiennes ; un seuillage de cette image de différence fournit une image binaire qui met en évidence les modes de l'histogramme original. À ce stade de la méthode, sur l'image de test dans [4], l'affectation d'une classe est impossible pour 30% des points de l'image à segmenter ce qui est dû au très fort étalement des occurrences dans l'histogramme 3D pour des images en couleur quelconques. Pour palier à ce problème, l'image binaire des modes est encore traitée. Une fermeture régularise la forme des modes ce qui se traduit par un double effet de bouchage et de fusion de ces derniers. Enfin, une dilatation augmente l'étendu de leur support . À l'issue de cette étape, l'étiquetage des points de l'image en couleur a lieu mais il reste encore des points non classifiables directement, leur couleur n'appartenant pas à un mode de l'espace des caractéristiques (leur couleur est un point du fond de l'image binaire qui représente l'espace caractéristique) ! Ces points sont finalement affecter à la classe la plus proche du point de vue de leur couleur.
L'utilisation comme classifieur de l'algorithme de la ligne de partage des eaux (LPE) a été mise en évidence par Soille [7]. La LPE fournit un partitionnement d'une image en bassins tel que chaque bassin entoure un minimum local de l'image et tel que les frontières entre bassins passent par les crêtes de l'image. Sur l'histogramme inversé d'une image, les modes se traduisent par des cuvettes et sont séparés par des crêtes. Cependant, calculer directement la LPE sur l'histogramme inversé produirait un sur-partitionnement dû à la présence de minima locaux parasites. Afin d'éviter cela, l'histogramme original est pré-traité. Tout d'abord, les pics de plus forte dynamique sont sélectionnés pour définir des marqueurs. Ensuite, une reconstruction morphologique de l'histogramme par dilatation à partir de ces marqueurs garantit que les seuls maxima locaux correspondent aux pics sélectionnés.
La LPE permet de s'affranchir du problème de points non classifiables car son résultat est un étiquetage en classes de tout l'espace des caractéristiques. En revanche, appliquer telle quelle la méthode de Soille à des images en couleur n'est pas envisageable car leurs histogrammes 3D ne sont généralement pas assez denses et les modes ne sont pas suffisamment apparents.
La méthode que nous proposons considère l'histogramme 3D
d'une image
en couleur. Le vecteur caractéristique d'un point
de l'image est le vecteur de ses composantes rouge-vert-bleu,
. Dans cet article, certaines images 3D associent à
chaque point/couleur
un scalaire ; par exemple, c'est le cas de
l'histogramme
:
. Les autres images 3D
associent à chaque point/couleur une étiquette.
Afin de visualiser le contenu d'une image 3D, , nous aurons recours
à une projection 2D sur le plan rouge-vert :
(le choix de ce
plan est justifié car les composantes rouge et vert sont faiblement
corrélées).
Lorsque est une image de scalaires, la projection vérifie :
Lorsque est une image d'étiquettes, notons
une étiquette ;
étant le symbole de Kronecker, formons :
Nous donnons ici une description des différentes étapes de la
méthode de classification morphologique non supervisée que nous
proposons. Nous en illustrons les différentes étapes sur l'image en
couleur peppers comprenant 512512 points RVB, chaque
composante de couleur étant codée sur 8 bit ; Cf. la
figure 1 (a).
|
|
La méthode que nous proposons possèdent plusieurs propriétés
théoriques fortes. Le résultat de l'algorithme de la LPE, , obtenu
à l'issue de l'étape 4, est invariant par rapport aux transformations
suivantes de l'histogramme 3D original,
, calculé au début de
l'étape 1.
Le résultat de la classification morphologique par LPE sur
l'image de test peppers est donné en
figure 3 (a). Pour un classifieur non-contextuel,
nous pouvons remarquer que les régions obtenues sont relativement bien
homogènes spatialement.
Toutefois, si une segmentation contextuelle est nécessaire, une
variante très simple de l'étape 5 est la suivante. Appliquer
l'algorithme de la LPE connectée à l'image en couleur originale ;
pour cela, calculer l'image de la valeur absolue du gradient, la
fermer morphologiquement par un petit élément structurant (c8), puis
calculer la LPE connectée. Notons l'image de la LPE connectée
issue de
; notons
son
ème bassin et
la
couleur moyenne des points de ce bassin dans
. Soit
l'indice
du bassin de
auquel
appartient (
). Soit
l'indice du bassin de
qui contient la couleur moyenne de
(c'est-à-dire,
).
La segmentation s'effectue alors suivant :
|
Nous avons appliqué la classification morphologique à un jeu d'une dizaine d'images en couleur (l'ensemble des résultats est disponible sur l'Internet à partir de l'adresse http://www.lrde.epita.fr/download/). Une illustration de plusieurs classifications est donnée en figure 4 et nous donnons ici quelques observations remarquables. L'image house, très classique, est facile à segmenter ; le comportement du classifieur morphologique donne effectivement le résultat attendu. L'image jbeanc contient des haricots peints de couleurs différentes mais dont la surface présente une spécularité importante ; l'histogramme ne se prête donc pas à une classification mais la segmentation est de très bonne qualité. L'image tiffany a une piètre dynamique des couleurs ; contrairement au reste de l'image, les lèvres, qui représentent peu de points dans l'image, sont violacées et donnent lieu à une classe à part entière (ce qu'un classifieur ``classique'' a dû mal à réaliser). Remarquons enfin que, grâce au filtrage passe-bas, le classifieur morphologique se comporte correctement sur des images qui sont mal quantifiées (par exemple, girl).
|
Dans cet article, nous proposons une méthode de classification morphologique non supervisée pour les images en couleur (section 3). L'utilisation de la morphologie mathématique comme outil de classification est encore peu classique et nous montrons en particulier que l'algorithme de la LPE s'avère un classifieur bien adapté pour les images en couleur. La méthode proposée fournit de très bons résultats ; ils s'expliquent par le fait que l'on ne puisse pas considérer que les modes de couleur soient d'une forme statistique donnée dans ces images.
La classification dans l'espace des couleurs ne suffit cependant pas pour obtenir des segmentations pertinentes d'images en couleur. Nous avons présenté ici (section 4) une façon très simple de garantir, à l'issue de la classification, la cohérence spatiale des régions de l'image segmentée. Nous pouvons imaginer cependant d'appliquer d'autres méthodes de régularisation, plus élaborées. Par exemple, la classification morphologique peut servir d'étape d'apprentissage des modes ``statistiques'' de couleur et une segmentation par classification markovienne peut alors être menée dans l'espace de l'image en couleur. Une perspective d'une toute autre nature est de continuer l'étude morphologique dans l'espace des couleurs pour déduire de la forme des modes les connections en queue de comète qui les relient et qui sont dues soit aux dégradés de couleurs dans l'image soit aux effets de mélange. Enfin, nous pouvons envisager une version plus rapide et moins gourmande en mémoire du classifieur morphologique en utilisant non plus un espace 3D des couleurs mais 3 projections 2D de cet espace.
``An Efficient Watershed Algorithm Based on Connected Components'',
Pattern Recognition, 33(6), 2000, pp. 907-916.
``A Robust Competitive Clustering Algorithm with Applications in
Computer Vision'',
IEEE Transactions on Pattern Analysis and Machine Intelligence,
21(5), May 1999, pp. 450-465.
``Hybrid Image Segmentation Using Watersheds and Fast Region Merging'',
IEEE Transactions on Image Processing, 7(12), 1998, pp. 1684-1699.
``Color Image Segmentation Based on 3-D Clustering: Morphological
Approach'',
Pattern Recognition, 31(8), 1998, pp. 1061-1076.
``Cluster Analysis by Binary Morphology'',
IEEE Transactions on Pattern Analysis and Machine Intelligence,
15(2), February 1993, pp. 170-180.
``Color Image Segmentation by a Watershed Algorithm and Region
Adjacency Graph Processing'',
In Proceedings of IEEE International Conference on Image
Processing, vol. 3, Austin, TX, USA, November
1994, pp. 1021-1025.
``Morphological Partitioning of Multispectral Images'',
Journal of Electronic Imaging, 5(3), 1996, pp. 252-265.
Morphological Image Analysis - Principles and Applications,
Springer-Verlag, 1999.
``Watersheds in Digital Spaces: an Efficient Algorithm Based on
Immersion Simulations'',
IEEE Transactions on Pattern Analysis and Machine Intelligence,
13(6), June 1991, pp. 583-598.
``Convexity Dependent Morphological Transformations for Mode Detection
in Cluster Analysis'',
Pattern Recognition, 27(1), 1994, pp. 135-148.
This document was generated using the LaTeX2HTML translator Version 99.2beta6 (1.42)
Copyright © 1993, 1994, 1995, 1996,
Nikos Drakos,
Computer Based Learning Unit, University of Leeds.
Copyright © 1997, 1998, 1999,
Ross Moore,
Mathematics Department, Macquarie University, Sydney.