>>

Soutenance de thèse : Abdelhak Chatty

Titre de la thèse

Apport du couplage entre dynamique d'apprentissage et propriétés collectives dans l'optimisation multi-contraintes par un système multi-agents et multi-robots.

Contribution of the Coupling between Dynamic Learning and Collective Properties in a Multi-Constraints Optimization by a Multi-Agent System and Multi-Robots.

Date et lieu de soutenance

Lundi 30 juin 2014, 14h.
Université de Cergy-Pontoise, site de St-Martin 2, 2 rue Adolphe Chauvin 95302 Cergy-Pontoise Cedex - Amphi Colloque.

Résumé

Dans ce travail, nous proposons un système auto-organisé composé d'agents-robots contrôlés par une architecture de subsomption et des règles locales probabilistes de prises et de dépôts. Ces agents-robots sont capables, grâce au développement de leurs capacités cognitives de se créer une carte cognitive, d'apprendre plusieurs lieux buts et de planifier le retour vers ces buts. Bien que formellement l'algorithme ne permette pas à chaque agent de "mélanger ni de fusionner ou d'optimiser" plusieurs objectifs, nous montrerons que le système global est capable de réaliser une optimisation multi-objectifs. Particulièrement, la fusion de l'apprentissage local avec l'accumulation de décisions individuelles permet de faire émerger (i) des structures dans l'environnement et (ii) des dynamiques tel que le comportement de spécialisation ou les comportements que nous pouvons considérer comme étant "égoïstes" ou "altruistes". Nous montrons qu'un mécanisme d'imitation simple contribue à l'amélioration des performance de notre SMAC et de notre SMRC, à savoir l'optimisation de la durée pour découvrir des différentes ressources, le temps moyen de planification, le niveau global de satisfaction des agents et enfin le temps moyen de convergence vers une solution stable. Particulièrement, l'ajout d'une capacité d'imitation améliore la construction des cartes cognitives pour chaque agent et stimule le partage implicite des informations dans un environnement a priori inconnu. En effet, les découvertes individuelles peuvent avoir un effet au plan social et donc inclure l'apprentissage de nouveaux comportements au niveau individuel. Pour finir, nous comparons les propriétés émergentes de notre SMAC à un modèle mathématique basé sur la programmation linéaire (PL). Cette évaluation montre les bonnes performances de notre SMAC qui permet d'avoir des solutions proches des solutions de la PL pour un coût de calcul réduit. Dans une dernière série d'expériences, nous étudions notre système d'agrégation dans un environnement réel. Nous mettons en place un SMRC, composé par des robots qui sont capables d'effectuer les opérations de prise, de dépôt et de maintien. Nous montrons via les premiers tests d'agrégation que les résultats sont prometteurs.

Mots-clefs

Propriétés collectives, Dynamique d'apprentissage, Optimisation mulit-contraintes, Système mulit-agents, Système multi-robots.

Abstract

In this work, we propose a self-organized system composed by agents-robots, controlled by a subsumption architecture with probabilistic local rules of deposits and taking. These agents-robots are able, thanks to the development of their cognitive abilities to create a cognitive map, to learn various goals' locations and to plan the return to these goals. Although formally the algorithm does not allow each agent to « mix or merge or optimize » several objectives, we show that the overall system is able to perform a multi-objective optimization. Specifically, the fusion of local learning with the accumulation of the individual decisions allows to emerge (i) structures in the environment and (ii) several dynamics such as specialization behavior or those that we can consider as « selfish » or « altruistic ». We show that the imitation strategy contributes to the improvement of the performance of our SMAC and our SMRC, namely the optimization of time to explore the various resources, the average planning time, the overall satisfaction level of agents and finally the the average time of convergence to a stable solution. Specifically, the addition of an imitation ability improves the construction of cognitive maps for each agent and stimulates the implicit sharing of informations in an unknown environment. Indeed, individual discoveries can affect the social level and therefore include learning new behaviors at the individual level. Finally, we compare the emergent properties of our SMAC with a mathematical model based on linear programming (LP). This evaluation shows the good performance of our SMAC which allows to obtain solutions close to the solution of the PL for a low cost of computation. In a final series of experiments, we study our aggregation system in a real environment. We set up a SMRC, composed by robots that are able to perform taking operations, deposits operations and refueling operations. We show through the first tests of aggregation that the results are promising.

Keywords

Collective Properties, Dynamic Learning, Multi-Constraints Optimization, Multi-Agents System, Multi-Robots System.

Composition du jury

  • Philippe GAUSSIER, professeur, Université de Cergy-Pontoise, Directeur de thèse
  • Adel MOHAMED ALIMI, professeur, Ecole Nationale d'Ingénieurs de Sfax, CoDirecteur de thèse
  • François CHARPILLET, professeur, LORIA, INRIA Nancy, France, Rapporteur
  • Nicolas BREDECHE, professeur, Université Pierre et Marie Curie, Rapporteur
  • Khaled GHEDIRA, professeur, Institut supérieur de gestion de Tunis, Rapporteur
  • Rachid ALAMI, Directeur de recherches, LAAS /CNRS Robotics and Artificial Intelligence Group, Examinateur
  • Guy THERAULAZ, Directeur de recherches CNRS, Université Paul Sabatier, Examinateur

Retour