>>

Séminaire ETIS : Yann Soullard

Titre du séminaire et orateur

Deux cas d'études : reconnaissance de gestes techniques avec des HMMs prudents et extraction de lignes de textes avec des réseaux de neurones totalement convolutifs

Yann Soullard (LITIS, Rouen)

Date et lieu

Mardi 22 mai 2018, 13h30

ENSEA, salle 384

Résumé

Les modèles de Markov à états cachés (HMMs) sont des méthodes populaires en reconnaissance de gestes. Cependant, les gestes techniques sont des gestes particuliers et précis dont la reconnaissance automatique peut être une tâche difficile due au petit nombre de données supervisées, à des données bruitées et à des classes déséquilibrées. Les estimations faites au sein des HMMs peuvent être biaisées par de telles données. Nous proposons une extension des HMMs à la théorie des probabilités imprécises en considérant d'une part une information a priori sur les classes et d'autre part des ensembles convexes de probabilités pour renforcer la fiabilité du modèle en prédiction.

Dans un second temps, nous présentons une nouvelle approche pour l'identification de lignes de texte dans des images de documents. Alors que de nombreuses méthodes ad-hoc ont été développées ces dernières années pour cette tâche, peu de travaux ont proposé des méthodes d'apprentissage automatique. Nous proposons ici une variante des réseaux de neurones profonds totalement convolutifs (FCN) basée sur des convolutions dilatées. Les FCNs sont des modèles permettant un étiquetage au niveau pixel, ce qui nécessite usuellement une tâche de reconstruction après avoir réduit la résolution au cours des couches successives (convolution et pooling). Les convolutions dilatées évitent de réduire la résolution d'entrée ce qui permet d'obtenir directement un étiquetage au niveau pixel. Les FCN sont ici entraînés à identifier le corps de texte ce qui a un certain nombre d'avantages comparé à d'autres représentations des lignes de texte.

Retour