IA et robotique : Physical Intelligence annonce une levée de fonds de 400 millions de dollars

L’IA appliquée à la robotique a le vent en poupe. Pour exemple, Physical Intelligence, une jeune start-up basée à San Francisco a annoncé lundi dernier avoir levé la somme de 400 millions de dollars lors d’un tour de table mené par Jeff Bezos, fondateur et président exécutif du conseil d’administration d’Amazon, Thrive Capital et Lux Capital. OpenAI, Redpoint Ventures et Bond figurent parmi les autres investisseurs.

A son lancement, en mars dernier, Physical Intelligence (Pi) annonçait avoir reçu des financements initiaux de 70 millions de dollars apportés par de Khosla Ventures, Lux Capital, OpenAI, Sequoia Capital et Thrive Capital. Grâce à cette dernière levée de fonds, la start-up serait aujourd’hui valorisée à environ 2 milliards de dollars.

Son PDG et cofondateur Karol Hausman était auparavant chercheur scientifique chez Google DeepMind. Pi déclare sur son site :

“L’intelligence physique apporte l’IA à usage général dans le monde physique. Nous sommes un groupe d’ingénieurs, de scientifiques, de roboticiens et de bâtisseurs d’entreprise qui développent des modèles de fondation et des algorithmes d’apprentissage pour alimenter les robots d’aujourd’hui et les appareils à commande physique du futur”.

Son objectif est de développer un modèle d’IA polyvalent, capable de piloter divers robots et dispositifs physiques pour des applications multiples. Contrairement à la robotique traditionnelle, souvent axée sur des tâches spécifiques et répétitives dans des environnements contrôlés, Physical Intelligence travaille à créer une IA plus adaptative pour des interactions dans le monde réel.

Elle a d’ailleurs partagé sur son blog le 31 octobre dernier le fruit de son travail des huit derniers mois : π0 (pi-zéro) et détaille son approche dans un article, expliquant :

“À l’instar des LLM, notre modèle est formé sur des données larges et diverses et peut suivre diverses instructions textuelles. Contrairement aux LLM, il s’étend sur des images, du texte et des actions et acquiert de l’intelligence physique en s’entraînant sur l’expérience incarnée de robots, apprenant à émettre directement des commandes motrices de bas niveau via une nouvelle architecture. Il peut contrôler une variété de robots différents et peut être soit invité à effectuer la tâche souhaitée, soit affiné pour le spécialiser dans des scénarios d’application difficiles”.

π0 est entraîné à partir de données multitâches et multirobots, incluant des tâches complexes comme plier du linge, nettoyer des tables, et assembler des boîtes. Il utilise un modèle de langage visuel (VLM) pré-entraîné, capable de manipuler des objets avec précision en temps réel grâce à un nouveau système d’appariement de flux pour des actions continues. Il peut ainsi être adapté rapidement pour de nouvelles tâches, surmontant ainsi les limites des modèles précédents.

La société qui collabore avec plusieurs entreprises et laboratoires de robotique, notamment pour affiner les conceptions matérielles pour la téléopération et l’autonomie, reconnait qu’il lui reste “un long chemin à parcourir”. Cependant, pour elle, “ces premiers résultats brossent un tableau prometteur pour l’avenir des modèles de fondation robotique”. 


Recommandé pour vous :

Partager l'article
intelligence artificielle
À PROPOS DE NOUS
Le portail francophone consacré à l'intelligence artificielle et à la datascience, à destination des chercheurs, étudiants, professionnels et passionnés.