Une équipe internationale de chercheurs, incluant des scientifiques du CNRS-INSU et de l’agence scientifique nationale australienne, CSIRO, a développé un algorithme d’IA appelé “PhySO” (Optimisation Symbolique Physique) pour résoudre le défi de créer des modèles physiques analytiques à partir de données scientifiques. Contrairement aux méthodes d’apprentissage profond critiquées pour leur opacité, PhySO génère des équations compréhensibles en manipulant des symboles mathématiques grâce aux progrès dans le traitement du langage et aux techniques de calcul symbolique.
La régression symbolique est l’étude d’algorithmes qui automatisent la recherche d’expressions analytiques qui correspondent à des données. Dans l’article de recherche “Deep Symbolic Regression ,for Physics Guided by Units Constraints: Toward the Automated Discovery of Physical Laws”, les chercheurs abordent la complexité de combiner divers symboles mathématiques de manière significative tout en respectant les règles d’analyse dimensionnelle. Ces règles jouent un rôle crucial en limitant les combinaisons valides lors de la modélisation d’équations physiques.
Ils y présentent PhySO, un framework d’optimisation symbolique physique pour la régression symbolique (RS), qui vise à automatiser la recherche d’expressions analytiques correspondant à des données physiques. Contrairement aux approches récentes d’apprentissage profond, ce nouvel algorithme SR, construit à partir de zéro, est spécifiquement conçu pour la physique, intégrant des contraintes d’unités associées aux données. Il utilise des techniques d’apprentissage par renforcement profond pour récupérer des expressions symboliques analytiques, en garantissant la cohérence des unités physiques et respectant les règles grammaticales de l’analyse dimensionnelle. Il peut ajuster des données sans bruit, dériver des propriétés analytiques d’un modèle physique, et obtenir des approximations analytiques de données bruitées.
Ce cadre a été conçu dès le départ pour incorporer et tirer pleinement parti des informations sur les unités physiques pendant la RS en stockant et en gérant les informations liées à l’analyse dimensionnelle. PhySO inclut les contraintes unitaires in situ pendant le processus de génération d’équations, de sorte que seules les équations à unités équilibrées sont proposées par construction, réduisant ainsi considérablement l’espace de recherche comme illustré dans la figure ci-dessous.
L’algorithme a été testé sur des équations standard de physique, où il a démontré des performances robustes même en présence de bruit important. Il produit des milliers d’équations par seconde, apprenant de manière autonome et améliorant la qualité des équations par essais et erreurs, tout en capitalisant sur ces règles dimensionnelles.
Dans la vidéo ci-dessous, on peut le voir retrouver l’équation du cas d’école de l’oscillateur harmonique à partir d’un jeu de données.
Références de l’article : “Deep Symbolic Regression ,for Physics Guided by Units Constraints: Toward the Automated Discovery of Physical Laws”, The Astrophysical Journal, DOI 10.3847/1538-4357/ad014c
Auteurs : Wassim Tenachi , Rodrigo Ibata , Université de Strasbourg, CNRS, Observatoire astronomique de Strasbourg, UMR 75 et Foivos I. Diakogiannis, CSIRO, Wembley, Australie.