>>

Equipe MIDI (Indexation Multimédia et Intégration de Données)

Responsable de l'équipe

Dan Vodislav (PU)

Membres (au 1er janvier 2019)

Boris BORZIC (IR), Nicole CHOLEWKA (IE), Tuyet Trâm DANG NGOC (MCF), Philippe-Henri GOSSELIN (PU), Dimitris KOTZINOS (PU), Tao-Yuan JEN (MCF), Michel JORDAN (IGR), Dominique LAURENT (PU émérite), Claudia MARINICA (MCF), David PICARD (MCF-HDR), Hedi TABIA (MCF-HDR), Aikaterini TZOMPANAKI (MCF), Dan VODISLAV (PU), Son VU (MCF)

Publications

Voir les publications de l'équipe MIDI sur le site HAL.

Axes de recherche

Les travaux de l’équipe MIDI (Indexation Multimédia et Intégration de Données) portent sur l’indexation, la recherche et la fouille dans de grandes masses de données, allant des bases de données relationnelles, aux données hétérogènes du Web (XML, RDF, flux d’information) et aux données multimédia (images, vidéos, objets 3D).

L’activité de l’équipe s’organise autour de deux axes :

  • Masses de données

    Cet axe aborde des problématiques d’intégration de données du Web à grande échelle files/site-etis/images/images-sites/big_data.jpg(documents XML, flux d’information et réseaux sociaux, RDF/données ouvertes, données multimédia), ainsi que de fouille dans des entrepôts de données (recherche de motifs fréquents) et dans des graphes de réseaux sociaux.

  • Systèmes de recherche multimédia

    La problématique abordée dans cet axe concerne l’extraction de descripteurs de contenu files/site-etis/images/midi/logo_midi_test2.jpgvisuel à partir de documents multimédia (images, vidéos et objets 3D), l’indexation de grandes bases de documents multimédia et l’apprentissage statistique pour la recherche dans ces bases.

L’équipe MIDI est fortement impliquée dans le LabEx PATRIMA (2011-2020) et l’EquipEx associé PATRIMEX, dans plusieurs projets en collaboration avec le laboratoire DAVID (UVSQ) et plusieurs laboratoires et institutions culturelles (BnF, Musée Rodin, C2RMF, CRC/CRCC, IPANEMA, Musée du Louvre, Centre de recherche du Château de Versailles, Archives Nationales, etc.). L’objectif de l’équipe dans ce contexte est la constitution d’un pôle de recherche en gestion de données du patrimoine.

L’équipe est impliquée dans plusieurs projets de recherche en cours ou terminés :

  • Projets Investissements d’avenir / Fonds pour la Société Numérique : Culture 3D Clouds (2012-2015) et TerraRush (2012-2014)
  • Projet GOD - STIC Asie (2013-2015)
  • Projets européens H2020 : ANIMA
  • Projets PATRIMA : EDOP (2012-2015), PARCOURS (2012-2018), VERSPERA (2012-2018), Trajectoires, ARCHEPUZ-3D (2017-2019)
  • Autres projets : #IDEO2017 (plateforme d'analyse de tweets lors de campagnes d'élections politiques)

Quelques faits marquants

Fouilles de données pour le patrimoine culturel

L'équipe MIDI participe activement au pôle de recherche d'excellence en fouille de données pour le patrimoine culturel (Labex PATRIMA et Equipex PATRIMEX).

Plusieurs projets de l'équipe ont été financés par PATRIMA, dont deux thèses en cours (débutant en 2016 et 2017) et deux thèses soutenues, et l'équipe est investie dans de nombreuses collaborations concrètes avec des institutions culturelles.

L'équipe a organisé le cycle thématique "Données ouvertes pour le patrimoine culturel" (Université de Cergy-Pontoise, 2013), les tutoriels Open Data et un colloque regroupant chercheurs en bases de données et partenaires culturels.

Récompenses et invitations

L'équipe MIDI a reçu deux "Best paper awards" dans la période 2014-2018:

Dimitris Kotzinos (6 fois) et Dominique Laurent (3 fois) ont été invités en tant qu'orateurs à des conférences internationales.

RETIN

La plateforme logicielle RETIN rassemble les recherches de l'équipe dans le domaine de la recherche par le contenu dans des bases de données multimedia. RETIN est aussi un support de démonstrations qui a montré son intérêt pour attirer de nouveaux partenaires académiques et industriels.

La chaire "Data analytics"

La Chaire “Data Analytics”, financée par QWANT, soutient les travaux de l'équipe dans nos principaux thèmes de recherche.

Un objectif spécifique est d'appliquer nos résultats dans le domaine de la recherche par le contenu dans des bases de données multimedia au moteur de recherche de QWANT. Un autre objectif concerne la personnalisation des contenus en fonction des préférences des utilisateurs, et le thème des données privées, afin que les résultats des moteurs de recherche soient envoyés aux utilisateurs avec différents niveaux de garantie. Ce travail pourrait aboutir et être consolidé dans le cadre d'une "start-up".

ANIMA, projet européen H2020

Le projet européen ANIMA a pour objectif de contribuer à la compréhension de la qualité de vie à proximité des aéroports, en observant en particulier les nuisances sonores. Le projet rassemble 22 partenaires de 11 Etats différents, et est financé par l'Union européenne à hauteur de 7,45 M€ pour 48 mois.

La principale contribution des membres de l'équipe dans ce projet concerne l'interrogation de la perception par les habitants de leur qualité de vie ; pour cela, nous exploitons les données massives relevées sur les plateformes des réseaux sociaux, et les combinons avec des données externes, afin de comprendre comment cette perception se traduit réellement. Ce projet montre notre capacité à participer à des projets de recherche au niveau européen, dans des consortiums rassemblant un grand nombre de partenaires. Il s'agit aussi d'une collaboration aboutie à l'intérieur du laboratoire, entre des membres des équipes MIDI et Neurocybernétique.

VERSPERA

Le projet VERSPERA (Numérisation et modélisation des plans de Versailles sous l’Ancien Régime), financé par la Fondation des sciences du patrimoine, est un cas de coopération exemplaire entre partenaires venus des sciences humaines et du patrimoine et informaticiens. Les résultats obtenus sont utilisables directement, validés par les partenaires culturels, et reposent sur une base théorique solide. La transformation de plans anciens en information aisée à manipuler a un intérêt à la fois pour la recherche en traitement des images numériques, et aussi, un intérêt esthétique et pratique. Le logiciel développé dans ce projet est utilisable pour la modélisation 3D d'autres bâtiments. Le projet est aussi le support de travaux étudiants, et donc d'enseignement par la recherche. Enfin, ce projet a fait l'objet de plusieurs mentions et articles dans la presse scientifique et "grand public".

Institut des humanités numériques

L'équipe MIDI est la principale équipe d'ETIS impliquée dans l'Institut des Humanités numériques (IDHN), créé en 2017 par l'Université de Cergy-Pontoise, avec les laboratoires AGORA, LT2D et ETIS.

Plateformes de recherche

L'équipe a mis en place trois plateformes de recherche (matériel / logiciel) pour soutenir les recherches de ses membres :

  • RETIN implémente les recherches de l'équipe dans le domaine de l'analyse et la description de contenus multimedia, de l'indexation, la classification de documents multimedia, et de l'apprentissage artificiel pour la recherche et la fouille dans des bases de données multimedia ;
  • ARAV-3D (acquisition, réalités augmentée et virtuelle), permet l'acquisition de données 3D et l'expérimentation en réalité virtuelle et réalité augmentée. Cette plateforme est utilisée pour des applications de modélisation 3D, de reconnaissance de visages ou de gestes, etc.
  • la plateforme "Cloud MIDI", en cours d'installation, permettra aux membres de l'équipe d'adapter leurs recherches sur les requêtes "Top-k", les graphes et le traitement de données privées, aux architectures parallèles et distribuées.