>>

Séminaire MIDI : Zoulficar Younes

Titre du séminaire et orateur

Apport de différentes théories de l'incertain à la classification multi-label.
Zoulficar Younes, CEA.

Date et lieu

Mardi 3 avril 2012, 16h30.
Université de Cergy-Pontoise, site de St-Martin 1, 5ème étage.

Résumé

La classification traditionnelle (mono-label) consiste à attribuer à un individu donné une classe parmi un ensemble prédéfini de classes supposées disjointes et mutuellement exclusives. La classification multi-label quant à elle, permet d'attribuer à chaque individu plusieurs classes simultanément. Pour ce type de classification, les classes ne sont donc pas considérées comme étant exclusives. La classification multi-label devient de plus en plus requise par de nombreuses applications réelles telles que la catégorisation de documents, la classification d'images selon leur contenu, la classification de chansons, et l'annotation de vidéos. Dans le cadre de ma thèse, trois approches de classification multi-label ont été développées en utilisant trois cadres théoriques différentes : probabilités, logique floue et fonctions de croyance. La règle des k-plus proches voisins a été utilisée comme classifieur de base. L'originalité des méthodes proposées réside dans le fait qu'elles s'adressent notamment à deux challenges clés : la prise en compte de la dépendance entre les classes, et l'apprentissage à partir de données étiquetées de manière imprécise.

La prise en compte de la dépendance entre les classes constitue une tâche primordiale en classification multi-label. L'appartenance des individus à plusieurs classes en même temps implique qu'il existe des interactions entre les différentes étiquettes. Par exemple, en catégorisation de textes, prenant un document parlant de la "politique", il est plus probable que ce document appartienne également à la classe "économie" qu'à la classe "culture".

Par ailleurs, dans de nombreuses applications réelles, l'étiquetage précis et certain de données n'est pas toujours faisable à un coût raisonnable. En l'absence d'une vérité terrain, on a souvent recours à un étiquetage fait des experts. En raison d'éventuels conflits entre les experts, de manque d'informations et de subjectivité, des étiquettes imprécises seraient attribuées à certains individus.

Au cours de cette présentation, ces différentes approches seront exposées ainsi que quelques résultats expérimentaux.

Retour