Inria et ses partenaires industriels ont annoncé ce 17 septembre au sein de Station F le lancement de l’initiative scikit-Learn, visant à intensifier le développement de la célèbre bibliothèque de machine learning open source.
Une bibliothèque de Machine Learning très utilisée.
Scikit-learn propose une grande variété d’algorithmes d’apprentissage supervisé et non supervisé. Elle permet d’extraire la structure de données complexes et de les classifier en utilisant des techniques correspondant à l’état de l’art. Son point fort est sa généricité, qui lui assure une grande polyvalence et des domaines d’application divers et variés. Les acteurs de l’industrie l’utilisent aujourd’hui dans des tâches aussi diverses que la lutte contre la fraude et le spam, le ciblage marketing, la prévision des comportements des utilisateurs ou encore l’optimisation des processus industriels et logistiques.
10 ans de développement par une large communauté
Son développement a été initié en 2007 en tant que projet Google Summer of Code par David Cournapeau. D’autres membres de la communauté scientifique Python l’ont ensuite rejoint. L’équipe Parietal d’Inria a su voir le potentiel de la bibliothèque dans le cadre de ses travaux de recherche sur l’imagerie fonctionnelle du cerveau et s’est investie dans son développement. Deux ans plus tard, Fabian Pedregosa, Gael Varoquaux, Alexandre Gramfort, Vincent Michel ont naturellement pris le leadership du projet, peu avant de proposer la première version publique de scikit-learn le 1er février 2010 et de publier “Scikit-learn : Machine Learning in Python” dans le Journal of Machine Learning Research.
Les objectifs de l’équipe de développement ont toujours été ambitieux et reposaient dès le départ sur une volonté de qualité, de compatibilité multi-plateforme et d’ouverture du code.
Une communauté internationale de développeurs s’est constituée au fil des années autour de scikit-learn. Le projet bénéficie maintenant du soutien d’une équipe importante de développeurs basés à Paris, mais aussi à New-York, Sydney et un peu partout dans le monde. Il est dans le top 3 des logiciels de machine learning les plus populaires sur GitHub.
Le lancement de l’initiative scikit-learn vise à intensifier les efforts
Aujourd’hui, Inria et ses partenaires annoncent la création d’une fondation et du consortium scikit-learn né de la volonté d’intensifier le développement de la bibliothèque.
L’objectif est de permettre à une équipe centrale de travailler à plein temps sur le projet. Le consortium regroupant des mécènes a été créé avec le soutien de la Fondation Inria. Il doit ainsi permettre aux ingénieurs de développement d’assurer la qualité du projet et l’intégration de nouvelles contributions, ainsi que l’ajout de nouvelles fonctionnalités ambitieuses. Le tout en lien et au bénéfice de sa vaste communauté d’utilisateurs et de développeurs.
Les membres du consortium et les partenaires de l’initiative sont associés en tant que soutiens et mécènes à la définition des priorités de développement et à la visibilité du projet. Les membres du consortium scikit-learn sont :
- AXA
- BCG-Gamma
- BNP PARIBAS CARDIF
- DATAIKU
- INTEL
- MICROSOFT
- NVIDIA
Pour en savoir plus sur scikit-learn, nous vous invitons à lire notre interview de Gaël Varoquaux, qui est chercheur Inria et l’un des principaux développeurs du projet.