>>

Séminaire MIDI : Rachid Benmokhtar

Titre et orateur

Indexation et recherche d'informations multimédia par le contenu.
Rachid Benmokhtar, INRIA/IRISA Rennes.

Date et lieu du séminaire

Mardi 26 février, 14h.
ENSEA, salle 384.

Résumé

Aujourd'hui, l'accès aux documents dans les bases de données, d’archives et sur Internet s'effectue principalement grâce à des données textuelles : nom de l'image ou mots-clés. Cette recherche est non exempte de fautes plus ou moins graves : omission, orthographe, etc. Les progrès effectués dans le domaine de l'analyse d'images et de l’apprentissage automatique permettent d'apporter des solutions comme l'indexation et la recherche à base des caractéristiques telles que la couleur, la forme, la texture, le mouvement, le son et le texte. Ces caractéristiques sont riches en informations et notamment d'un point de vue sémantique.

Nos travaux de thèse s'inscrivent dans le cadre de l'indexation automatique par le contenu sémantique des documents multimédia : plans vidéo et images-clés. L'indexation consiste à extraire, représenter et organiser efficacement le contenu des documents d'une base de données.

L'état de l'art du domaine est confronté au « fossé sémantique » qui sépare les représentations visuelles brutes (bas-niveau) et conceptuelles (haut-niveau). Pour limiter les conséquences de cette problématique, nous avons introduit dans le système plusieurs types de descripteurs, tout en prenant à  notre avantage les avancées scientifiques dans le domaine de l'apprentissage automatique et de la « fusion multi-niveau ». En effet, la fusion est utilisée dans le but de combiner des informations hétérogènes issues de plusieurs sources afin d'obtenir une information globale, plus complète, de meilleure qualité, permettant de mieux décider et d'agir. Elle peut être appliquée sur plusieurs niveaux du processus de classification. Dans cette thèse, nous avons étudié la fusion bas-niveau (précoce), la fusion haut-niveau (tardive), ainsi qu’à un niveau décisionnel basé sur l'ontologie et la similarité inter-concepts dit de raisonnement. Les systèmes proposés ont été validés sur les données de TRECVid (projet NoE K-Space) et les vidéos de football issues d'Orange-France Télécom Labs (projet CRE-Fusion). Les résultats révèlent l'importance de la fusion sur chaque niveau du processus de classification, en particulier, l'usage de la théorie des évidences.

Mots-clés : Indexation vidéo, fusion, théorie des évidences, similarité inter-concepts, classification, ontologie, LSCOM-lite, TRECVid.

Retour