Directeur de thèse : Pascal BERTOLINO Jean-Marc CHASSERY
École doctorale : Electronique, electrotechnique, automatique, traitement du signal (EEATS)
Spécialité : Signal, image, parole, télécoms
Structure de rattachement : Université Grenoble Alpes
Établissement d'origine : INPG - ENSIEG
Financement(s) : allocation MENRT ; ATER
Date d'entrée en thèse : 01/10/2008
Date de soutenance : 17/01/2012
Composition du jury :
M. Bill TRIGGS, LJK Grenoble (Président du Jury)
Mme. Sylvie PHILIPP-FOLIGUET, ETIS Cergy-Pontoise (Rapporteur)
M. Jean-Louis DILLENSEGER, LTSI Rennes (Rapporteur)
M. François BREMOND, INRIA Sophia Antipolis (Examinateur)
M. Jean-Marc CHASSERY, GIPSA-LAB Grenoble (Directeur de thèse)
M. Pascal BERTOLINO, GIPSA-LAB Grenoble (Directeur de thèse)
Résumé : La segmentation de personnes dans les images et les vidéos est une problématique actuellement au coeur de nombreux travaux. Nous nous intéressons à la segmentation de personnes debout. Pour cela, nous avons mis au point deux méthodes originales : La première est une continuation d'une méthode de détection efficace. On réalise une pré-segmentation en associant aux segments de contour de l'image une valeur de vraisemblance en tant qu'élément d'une silhouette humaine par une combinaison d'histogrammes de gradients orientés (HOG) et de machines à vecteurs de support (SVM) prises à l'échelle des ces segments. Une recherche d'arbre optimal dans un graphe intégrant les données de la pré-segmentation permet de reconstruire la silhouette de la personne. Enfin, une utilisation itérative de ce processus permet d'en améliorer la performance. La seconde méthode prend en compte l'interaction de l'utilisateur pour une image. Une coupe de graphe est guidée par un gabarit non binaire représentant une silhouette humaine. Nous proposons également un gabarit par parties pour s'adapter à la posture de la personne. Nous avons enfin transposé cette méthode à la segmentation de vidéos et la réalisation automatique de trimaps.