>>

MIDI Team (Multimedia Indexation and Data Integration)

Team leader

Dimitris Kotzinos (PU)

Members (June 1, 2016)

Boris BORZIC (IR), Tuyet Trâm DANG NGOC (MCF), Philippe-Henri GOSSELIN (PU), Dimitris Kotzinos (PU), Tao-Yuan JEN (MCF), Michel JORDAN (IGR), Dominique LAURENT (PU émérite), Claudia MARINICA (MCF), David PICARD (MCF), Hedi TABIA (MCF), Dan VODISLAV (PU), Son VU (MCF)

Publications

Voir les publications de l'équipe MIDI sur le site HAL.

Research axis

Les travaux de l’équipe MIDI (Indexation Multimédia et Intégration de Données) portent sur l’indexation, la recherche et la fouille dans de grandes masses de données, allant des bases de données relationnelles, aux données hétérogènes du Web (XML, RDF, flux d’information) et aux données multimédia (images, vidéos, objets 3D).

L’activité de l’équipe s’organise autour de deux axes :

  • Masses de données

    Cet axe aborde des problématiques d’intégration de données du Web à grande échelle files/site-etis/images/images-sites/big_data.jpg(documents XML, flux d’information et réseaux sociaux, RDF/données ouvertes, données multimédia), ainsi que de fouille dans des entrepôts de données (recherche de motifs fréquents) et dans des graphes de réseaux sociaux.

  • Systèmes de recherche multimédia

    La problématique abordée dans cet axe concerne l’extraction de descripteurs de contenu files/site-etis/images/midi/logo_midi_test2.jpgvisuel à partir de documents multimédia (images, vidéos et objets 3D), l’indexation de grandes bases de documents multimédia et l’apprentissage statistique pour la recherche dans ces bases.

L’équipe MIDI est fortement impliquée dans le LabEx PATRIMA (2011-2020) et l’EquipEx associé PATRIMEX, dans plusieurs projets en collaboration avec le laboratoire PRISM (UVSQ) et plusieurs laboratoires et institutions culturelles (BnF, Musée Rodin, le Centre de recherche du Château de Versailles, les Archives Nationales, etc.). L’objectif de l’équipe dans ce contexte est la constitution d’un pôle de recherche en gestion de données du patrimoine.

En 2013, l’équipe MIDI organise le cycle thématique « Données ouvertes pour le patrimoine culturel », sous l’égide de l’Institut des Etudes Avancées de l’Université de Cergy-Pontoise, en collaboration avec l’institut FORTH-ICS (Grèce), incluant le workshop international WOD 2013 et une série de tutoriels sur le thème des données ouvertes.

L’équipe est impliquée dans plusieurs projets de recherche en cours :

  • Projets Investissements d’avenir / Fonds pour la Société Numérique : Culture 3D Clouds (2012-2015) et TerraRush (2012-2014)
  • Projet GOD - STIC Asie (2013-2015)
  • Projets PATRIMA : EDOP (2012-2015), VERSPERA (2012-2015)

Quelques faits marquants

Best demo award

Maria Koutraki (doctorante ETIS / PRISM, UVSQ), Dan Vodislav (ETIS) et Nicoleta Preda (PRISM, UVSQ) ont obtenu le "best demo award" lors de la conférence BDA 2015, qui s'est tenue à Toulon du 29 septembre au 2 octobre 2015.

Le travail présenté s'intitule "DORIS: Discovering Ontological Relations In Services", et permet de mettre en correspondance les résultats de requêtes par web services avec des bases de connaissances (web sémantique). Ce travail s'inscrit dans le projet EDOP (Espace de données pour les objets du patrimoine culturel) financé par la Fondation des sciences du patrimoine.

Fouilles de données pour le patrimoine culturel

L'équipe MIDI participe activement au pôle de recherche d'excellence en fouille de données pour le patrimoine culturel (Labex PATRIMA et Equipex PATRIMEX).

Trois projets de l'équipe sont financés par PATRIMA, dont deux thèses (débutant en 2011 et 2012), et l'équipe est investie dans de nombreuses collaborations concrètes avec des institutions culturelles.

L'équipe organise le cycle thématique "Données ouvertes pour le patrimoine culturel" (Université de Cergy-Pontoise, 2013), les tutoriels Open Data et un colloque regroupant chercheurs en bases de données et partenaires culturels.

Extraction de requêtes fréquentes

Ce thème de recherche a fait l'objet de 3 articles de revue, 3 conférences internationales reconnues, 2 thèses et une collaboration internationale (projet STIC Asie).

Indexation multimedia

L'équipe a proposé des avancées dans le domaine de l'indexation multimedia générique : à partir de fonctions noyaux sur des graphes, le passage à l'échelle est proposé par hachage et linéarisation des fonctions noyaux à l'aide de représentations tensorielles.

3 thèses ont été soutenues depuis 2008, une est en cours (début en 2011), 4 articles de revues et 11 communications en conférences ont été publiés.

Apprentissage interactif et collaboratif

De nouveaux résultats ont été obtenus dans le domaine de l'apprentissage interactif et collaboratif pour la recherche de contenu multimedia, par l'utilisation de représentations dynamiques et d'algorithmes de boosting.

L'aspect collaboratif est pris en compte à l'aide d'algorithmes de colonies de fourmis.

Ces travaux ont fait l'objet de 2 thèses, 4 articles de revue et 7 communications en conférence.