Scikit-learn est une librairie Python très populaire, incluant une grande variété de modèles de Machine Learning.
Voici une courte vidéo de présentation réalisée par l’Inria:
Son point fort est sa généricité, qui lui assure une grande polyvalence et des domaines d’application divers et variés. Elle est aujourd’hui utilisée dans des tâches aussi diverses que la lutte contre la fraude et le spam, le ciblage marketing, la prévision des comportements des utilisateurs ou encore l’optimisation des processus industriels et logistiques.
L’Inria est l’un des contributeurs phares du projet.
Voici comment Gaël Varoquaux, développeur phare du projet, nous présentait scikit-learn lorsque nous l’avons interviewé à l’occasion du lancement de l’initiative scikit-learn :
Au delà de l’ergonomie et de qualité de la documentation, nous avons un placement différent par rapport à variété d’autres logiciels de machine learning. Par rapport aux bibliothèques de deep learning, nous pouvons être mis en œuvre avec beaucoup moins de moyens: à la fois moins de ressources de calcul, moins de moyens humains, et surtout moins de données. En effet, nous proposons beaucoup de modèles de machine learning qui sont bien adaptés aux scénarios où il n’y a pas des millions d’échantillons. Nous établissons le continuum entre le machine learning et “l’analytics” car nous nous intégrons parfaitement dans un environnement d’exploration de données interactive, dans l’écosystème “PyData”. Par rapport au langage “R”, qui permet aussi une très bonne analyse de données interactive, notre force est d’être plus robuste et de monter mieux à l’échelle. En effet, nous sommes aussi utilisés comme moteur de production pour des sites web, bénéficiant du fait que le langage Python est universellement utilisé sur le web. Par rapport à un environnement comme Spark, nous montons moins bien à l’échelle, mais nous sommes beaucoup plus facile à déployer et à utiliser. Nous avons aussi un ensemble de modèles de machine learning beaucoup plus riche que celui de spark. Il est courant que les utilisateurs de spark combinent cet outil avec scikit-learn.
Lire la suite de l’interview sur: https://www.actuia.com/actualite/scikit-learn-interview-de-gael-varoquaux/