OpenAI vient de publier sa dernière expérience, le projet Dactyl, une main robotique qui résout un Rubik’s cube ex-nihilo.
Attention aux apparences, même si cette main robotique semble réussir “seule” en quelques minutes à résoudre ce problème, il lui faut au minimum plusieurs jours d’entraînement dans un environnement simulé pour “appréhender” la manipulation de ce cube, c’est la restitution de ce long apprentissage qui lui permet de résoudre 60% des cubes et 20% des combinaisons les plus complexes (qui nécessitent un maximum de “tours”) en quelques minutes.
L’apprentissage se fait par différentes couches RNN,RL, … (explicités dans la publication officielle OpenAI) notamment via un apprentissage par renforcement qui se fait en augmentant progressivement certains paramètres comme le “bruit” de la simulation nommé ici ADR (automatic domain randomization).
Le bras robotique utilisé est ici un “Shadow Dexterous E Series Hand” (E3M5R)
- Pour en savoir plus :
https://arxiv.org/abs/1910.07113 - Les autres vidéos publiées par OpenAI sur ce sujet :
https://www.youtube.com/playlist?list=PLOXw6I10VTv9HODt7TFEL72K3Q6C4itG6