Databricks, société spécialisée dans la gestion de la data et l’IA, a annoncé avoir conclu un accord définitif pour l’acquisition de MosaicML, une plateforme de premier plan en matière d’IA générative. Ensemble, Databricks et MosaicML rendront l’IA générative accessible à toutes les organisations, leur permettant de construire, de posséder et de sécuriser des modèles d’IA générative avec leurs propres données. La transaction est évaluée à environ 1,3 milliard de dollars.
Créée en 2013 par les fondateurs d’Apache Spark, Delta Lake et MLflow, Databricks s’est très vite démarquée en proposant une plateforme lakehouse dans le cloud, une architecture ouverte et unifiée pour les données et l’IA qui apporte la fiabilité, la gouvernance et les performances d’un data warehouse directement dans les data lakes, dans lesquels la plupart des entreprises stockent déjà toutes leurs données.
Une même vision de l’open source
Il y a trois mois, elle présentait Dolly, un LLM entraîné pour moins de 30 $, et, peu après, publiait l’intégralité de Dolly 2.0, un modèle de 12 milliards de paramètres, en open source, y compris le code de formation, l’ensemble de données et le poids du modèle, tous adaptés à un usage commercial.
Comme les LLM de petite taille, il présente l’avantage d’être rapide à entraîner et à exécuter, ce qui le rend plus accessible et plus facile à utiliser pour les développeurs et les organisations qui ne disposent pas de ressources informatiques importantes.
MosaicML a récemment publié deux grands modèles de langage MPT, également en open source. Avec plus de 3,3 millions de téléchargements de MPT-7B et la récente sortie de MPT-30B, la start-up, créée en 2021, a démontré comment les organisations peuvent rapidement créer et entraîner leurs propres modèles de pointe en utilisant leurs données de manière rentable. Des clients tels que AI2 (Allen Institute for AI), Generally Intelligent, Hippocratic AI, Replit et Scatter Labs utilisent MosaicML pour une grande variété de cas d’utilisation de l’IA générative.
Permettre aux entreprises de créer leurs propres modèles d’IA générative à faible coût
L’objectif principal de cette acquisition est de fournir aux organisations un moyen simple et rapide de créer, posséder et sécuriser leurs propres modèles d’IA générative. Grâce à la plateforme Databricks Lakehouse combinée à la technologie de MosaicML, les clients pourront conserver le contrôle, la sécurité et la propriété de leurs données sans coûts élevés.
Selon MosaicML, une optimisation automatique pour l’entraînement des modèles, fournit une formation 2 à 7 fois plus rapide que les approches standard. Cette efficacité, combinée à la mise à l’échelle quasi linéaire des ressources, lui permettra de former avec Databricks des modèles comportant des milliards de paramètres en quelques heures seulement, réduisant ainsi les coûts de formation de l’IA de millions à des milliers de dollars.
Ali Ghodsi, cofondateur et PDG de Databricks, déclare :
“Chaque organisation devrait pouvoir bénéficier de la révolution de l’IA avec plus de contrôle sur la façon dont ses données sont utilisées. Databricks et MosaicML ont une opportunité incroyable de démocratiser l’IA et de faire de Lakehouse le meilleur endroit pour construire une IA générative et des LLM”.
Toute l’équipe de MosaicML devrait rejoindre Databricks après la clôture de la transaction.