Nicolas Vecoven, Antoine Wehenkel, Damien Ernst et Guillaume Drion, chercheurs à l’Université de Liège (ULiège), ont présenté dans une publication dans PLOS ONE un nouvel algorithme basé sur un mécanisme biologique appelé la neuromodulation. Il a été développé afin de créer des agents intelligents capables de réaliser des tâches non rencontrées pendant l’entrainement.
Les chercheurs de l’ULiège se sont intéressés à la problématique des performances, souvent décevantes, des agents informatiques pour effectuer certaines tâches mieux que des humains lorsqu’ils sont entrainés spécifiquement pour celles-ci. Ils ont notamment pris pour exemple, un enfant ayant appris à marcher dans un salon. Il saura rapidement marcher également dans un jardin. Dans un tel contexte, l’apprentissage de la marche est associé à la plasticité synaptique qui modifie les connexions entre neurones, tandis que l’adaptation rapide des compétences de marche apprises dans le salon à celles nécessaires pour marcher dans le jardin est associée à la neuromodulation. Celle-ci modifie les propriétés « entrée-sortie » des neurones eux-mêmes via des neuromodulateurs chimiques.
Comme l’indique l’ULiège dans un communiqué :
“la plasticité synaptique est à la base de toutes les dernières avancées dans le domaine de l’IA. Cependant aucun travail scientifique n’avait proposé jusqu’à aujourd’hui une manière d’introduire un mécanisme de neuromodulation dans des réseaux de neurones artificiels”.
Deux doctorants, Nicolas Vecoven et Antoine Wehenkel, ainsi que deux professeurs, Damien Ernst (spécialiste en intelligence artificielle) et Guillaume Drion (neuroscientifique) ont donc travaillé sur ce sujet et leur collaboration a donné lieu à des résultats très intéressant.
Ces chercheurs de l’ULiège ont développé une architecture de réseaux de neurones artificiels originale, introduisant une interaction entre deux sous-réseaux. Un premier prend en compte toutes les informations contextuelles concernant la tâche à résoudre et, sur la base de ces dernières, neuromodule le deuxième sous-réseau à la manière des neuromodulateurs chimiques du cerveau. Grâce à la neuromodulation, ce deuxième sous-réseau, déterminant les actions que l’agent intelligent doit effectuer, peut donc être adapté très rapidement en fonction de la tâche courante. Cela permet à l’agent de résoudre efficacement de nouvelles tâches.
Cette architecture a été testée avec succès sur des classes de problèmes de navigation pour lesquels l’adaptation est nécessaire. Des agents entrainés à se déplacer vers une cible, tout en évitant des obstacles, ont notamment été capables de s’adapter à des situations dans lesquelles leur mouvement était perturbé par du vent dont la direction est extrêmement variable.
Damien Ernst a indiqué à ce propos :
« La nouveauté de cette recherche est que, pour la première fois, des mécanismes cognitifs identifiés en neurosciences trouvent des applications algorithmiques dans un contexte multi-tâches. Cette recherche ouvre des perspectives dans l’exploitation en IA de la neuromodulation, mécanisme-clé du fonctionnement du cerveau humain. »
‘Introducing Neuromodulation in Deep Neural Networks to Learn Adaptive Behaviours’, PLOS ONE, 27 janvier 2020.