En mars 2021, Inria, la Fondation Inria et le groupe La Poste signaient un accord de mécénat pour une société numérique responsable. C’est dans le cadre de ce partenariat qu’est lancé le défi Fed-Malin (Federated machine learning over the Internet), un défi Inria co-porté par les chercheurs Aurélien Bellet et Giovanni Neglia, dont l’objectif est de faire progresser la recherche sur l’apprentissage fédéré et de développer des cas d’utilisation concrets.
Les données sont essentielles au développement des modèles de ML. Plus elles sont nombreuses, plus elles sont susceptibles de permettre des avancées marquantes dans de nombreux domaines, notamment celui de la santé. Pourtant, elles questionnent sur le respect de la vie privée, les coûts et les risques liés à la centralisation et à la transmission de gros volumes de données.
L’apprentissage fédéré peut apporter une réponse à ces problèmes : il permet de se connecter à des ensembles de données multipartites décentralisés et de créer des modèles d’IA sans mise en commun des données. Il peut en outre être combiné avec des techniques de protection de la confidentialité pour éviter que des informations sensibles ne soient révélées lors de l’apprentissage.
Le projet de R&D Fed-Malin
Ce projet vise à faire progresser la recherche sur l’apprentissage fédéré en relevant un certain nombre de défis qui surviennent lorsqu’il est déployé sur Internet, notamment la confidentialité et l’équité, la consommation d’énergie, la personnalisation et les dépendances temporelles et spatiales.
Dix équipes-projet de l’Institut et de ses partenaires sont impliquées : Coati (CNRS, Inria, UCA), Comete (CNRS, Inria, IPP), Dyogene (CNRS, Inria, PSL), Epione (Inria), Magnet (CNRS, Inria, U. Lille), Maracas (Inria, INSA Lyon), Neo (Inria), Spirals (CNRS, Inria, U. Lille), Tribe (Inria) et Wide (Inria, U. Rennes).
Localisées dans les centres Inria de l’Université Côte d’Azur, l’Université de Lille, l’Université de Rennes, de Paris, de Lyon et de Saclay, elles combinent des expertises en ML, systèmes distribués, confidentialité et sécurité, réseaux et médecine.
Les travaux porteront sur la confidentialité et l’équité, la consommation d’énergie, la personnalisation des modèles et les dépendances temporelles et spatiales. Le défi contribuera également au développement d’outils open source pour l’expérimentation de l’apprentissage fédéré et son déploiement dans le monde réel, et les utilisera pour des applications concrètes en médecine et en crowdsensing.
Il est lié à un certain nombre de recherches menées au sein d’Inria, notamment les deux actions exploratoires, Mammals et Flamed, qui ont elles-aussi bénéficié du soutien du Groupe La Poste. Mammals vise à fournir des inférences à faible latence en exécutant, à proximité de l’utilisateur final, des modèles simples de ML qui peuvent également exploiter une base des données locale. Flamed, de son côté, a pour objectif l’application de l’apprentissage fédéré aux études médicales multi-centriques dans les hôpitaux.
Une recherche engagée et impliquée au service de la société
La R&D open science de Fed-Malin va permettre de consolider les projets existants d’Inria autour des applications médicales et de renforcer les collaborations avec des acteurs de la santé, comme les hôpitaux du réseau Unicancer, le CHU de Lille et l’alliance G4. D’ailleurs, cette coopération entre recherches de pointe en sciences et technologies du numérique et spécialistes des domaines applicatifs de l’apprentissage fédéré (médecins, radiologues…) est au cœur du modèle de deep learning qui s’appuie sur des exemples étiquetés par des experts (de l’imagerie médicale, par exemple).
Les avancées de Fed-Malin apporteront au groupe La Poste, acteur de la santé comptant plus de 450 experts en IA et data, des opportunités d’innovation dans les domaines de l’analyse des données de santé au bénéfice des patients et de la prévention à domicile en faveur de l’accompagnement du vieillissement de la population. Des développements dans d’autres secteurs nécessitant une éthique de la donnée au service de la confiance numérique sont aussi envisagés.