>>

Soutenance de thèse : Vu Lam Nguyen

Titre de la thèse

Approches complémentaires pour une classification efficace des textures.

Complementary Approaches for Efficient Texture Classification.

Date et lieu de soutenance

Mardi 29 mai 2018, 14h

Université de Cergy Pontoise, salle des thèses

Résumé

Dans cette thèse, nous nous intéressons à la classification des images de textures avec aucune connaissance a priori sur les conditions de numérisation. Cette classification selon des définitions pré-établies de matériaux repose sur des algorithmes qui extraient des descripteurs visuels. A cette fin, nous introduisons tout d'abord une variante de descripteurs par motifs binaires locaux (Local Binary Patterns). Dans cette proposition, une approche statistique est suivie pour représenter les textures statiques. Elle incorpore la quantité d'information complémentaire des niveaux de gris des images dans des opérateurs basés LBP. Nous avons nommé cette nouvelle méthode "Completed Local Entropy Binary Patterns (CLEBP)". CLEBP capture la distribution des relations entre les mesures statistiques des données aléatoires d'une image, l'ensemble étant calculé pour tous les pixels au sein d'une structure locale.

Sans la moindre étape préalable d'apprentissage, ni de calibration automatique, les descriptions CLEBP contiennent à la fois des informations locales et globales des textures, tout en étant robustes aux variations externes. En outre, nous utilisons le filtrage inspiré par la biologie, ou biologically-inspired filtering (BF), qui simule la rétine humaine via une phase de prétraitement. Nous montrons que notre approche est complémentaire avec les LBP conventionnels, et les deux combinés offrent de meilleurs résultats que l'une des deux méthodes seule. Les résultats expérimentaux sur quatre bases de texture, Outex, KTH-TIPS-2b, CURet, et UIUC montrent que notre approche est plus performante que les méthodes actuelles.

Nous introduisons également un cadre formel basé sur une combinaison de descripteurs pour la classification de textures. Au sein de ce cadre, nous combinons des descripteurs LBP invariants en rotation et en échelle, et de faible dimension, avec les réseaux de dispersion, ou scattering networks (ScatNet). Les résultats expérimentaux montrent que l'approche proposée est capable d'extraire des descripteurs riches à de nombreuses orientations et échelles. Les textures sont modélisées par une concaténation des codes LBP et valeurs moyennes des coefficients ScatNet. Nous proposons également d'utiliser le filtrage inspiré par la biologie, ou biologically-inspired filtering (BF), pour améliorer la résistance des descripteurs LBP. Nous démontrons par l'expérience que ces nouveaux descripteurs présentent de meilleurs résultats que les approches usuelles de l'état de l'art. Ces résultats sont obtenus sur des bases réelles qui contiennent de nombreuses avec des variations significatives.

Nous proposons aussi un nouveau réseau conçu par l'expertise appelé réseaux de convolution normalisée, ou normalized convolution network. Celui-ci est inspiré du modèle des ScatNet, auquel deux modifications ont été apportées. La première repose sur l'utilisation de la convolution normalisé en lieu et place de la convolution standard. La deuxième propose de remplacer le calcul de la valeur moyenne des coefficients du réseaux par une agrégation avec la méthode des vecteurs de Fisher. Les expériences montrent des résultats compétitifs sur de nombreuses bases de textures.

Enfin, tout au long de cette thèse, nous avons montré par l'expérience qu'il est possible d'obtenir de très bons résultats de classification en utilisant des techniques peu coûteuses en ressources.

Mots clés

texture, représentation,image classification, normalized-convolution, feature, texture classification

Abstract

This thesis investigates the complementary approaches for classifying texture images. The thesis begins by proposing a Local Binary Pattern (LBP) variant for efficient texture classification. In this proposed method, a statistical approach to static texture representation is developed. It incorporates the complementary quantity information of image intensity into the LBP-based operators. We name our LBP variant `the completed local entropy binary patterns (CLEBP)'. CLEBP captures the distribution of the relationships between statistical measures of image data randomness, calculated over all pixels within a local structure. Without any pre-learning process and any additional parameters to be learned, the CLEBP descriptors convey both global and local information about texture while being robust to external variations. Furthermore, we use biologically-inspired filtering (BF) which simulates the performance of human retina as preprocessing technique. It is shown that our approach and the conventional LBP have the complementary strength and that by combining these algorithms, one obtains better results than either of them considered separately. Experimental results on four large texture databases show that our approach is more efficient than contemporary ones.

We then introduce a framework which is a feature combination approach to the problem of texture classification. In this framework, we combine Local Binary Pattern (LBP) features with low dimensional, rotation and scale invariant counterparts, the handcrafted scattering network (ScatNet). The experimental results show that the proposed approach is capable of extracting rich features at multiple orientations and scales. Textures are modeled by concatenating histogram of LBP codes and the mean values of ScatNet coefficients. Then, we propose using Biological Inspired Filtering (BF) preprocessing technique to enhance the robustness of LBP features. We have demonstrated by experiment that the novel features extracted from the proposed framework achieve superior performance as compared to their traditional counterparts when benchmarked on real-world databases containing many classes with significant imaging variations.

In addition, we propose a novel handcrafted network called normalized convolution network. It is inspired by the model of ScatNet with two important modification. Firstly, normalized convolution substitute for standard convolution in ScatNet model to extract richer texture features. Secondly, Instead of using mean values of the network coefficients, Fisher vector is exploited as an aggregation method. Experiments show that our proposed network gains competitive classification results on many difficult texture benchmarks.

Finally, throughout the thesis, we have proved by experiments that the proposed approaches gain good classification results with low resource required.

Keywords

texture, descriptor, image classification, normalized-convolution,feature, texture classification

Composition du jury

  • Philippe-Henri GOSSELIN, Professeur des Universités, ETIS UMR 8051 Université Paris Seine, Université Cergy-Pontoise, ENSEA, CNRS, Directeur de thèse.
  • Ngoc-Son VU, Maître de Conférences, ETIS UMR 8051, Université Paris Seine, Université Cergy-Pontoise, ENSEA, CNRS, Examinateur.
  • Laurent HEUTTE, Professeur des Universités, EA 4108 UFR des Sciences, Université de Rouen Technopole de Madrillet, Rapporteur.
  • Philippe CARRE, Professeur des Universités, Laboratoire XLIM UMR CNRS 7252, Université de Poitiers, Rapporteur.
  • Véronique EGLIN, Professeur des Universités, LIRIS UMR CNRS 5205, INSA Lyon, Examinateur.
  • Patrick LAMBERT, Professeur des Universités, LISTIC Polytech Annecy Chambéry, Université de Savoie, Examinateur.

Retour