Une semaine d’annonces chargée pour Dataiku. CapitalG, le fond d’investissement d’Alphabet, fait en effet son entrée au capital de la start-up, fondée en 2013 par Florian Douetteau et désormais basée à New York. En début de semaine, Dataiku avait également annoncé le lancement de Dataiku 6, la dernière version de sa plate-forme Enterprise AI et de machine learning.
Dans une note de blog, Dataiku a annoncé l’entrée de CapitalG dans le capital de la start-up. Comme l’indique Florian Douetteau, l’année 2019 a été une source d’inspiration pour Dataiku : elle a publié son propre documentaire sur la data science, discuté de l’intelligence artificielle centrée sur l’être humain avec plus de 3 000 participants à cinq conférences EGG dans le monde entier, ouvert de nouveaux bureaux dans le monde entier et fait partie de la 2019 Forbes Cloud 100 list.
CapitalG, anciennement Google Capital, est un fonds d’investissement financé par Alphabet Inc. et basé à San Francisco, en Californie. Fondée en 2013, la société se concentre sur les entreprises technologiques en phase de croissance. CapitalG achètera les actions Dataiku directement à Serena Capital.
“Dataiku a fait ses preuves pour résoudre de véritables problématiques métier au sein des entreprises, avec une capacité unique à extraire des informations exploitables par les data scientists et les dirigeants. Nous sommes ravis de les accompagner désormais, alors qu’ils continuer de déployer leur approche d’intelligence artificielle à forte différenciation qui permet de démocratiser l’accès aux données et d’éliminer les barrières entre les data scientists et les analystes métier”, a détaillé Derek Zanutto, partner chez CapitalG
La valeur de Dataiku dépasse donc le milliard de dollars et atteindrait désormais les 1,4 milliard de dollars selon les experts du secteur. La start-up de près de 400 employés indique compter plus de 300 clients partout dans le monde.
La veille de cette annonce qui place Dataiku parmi les licornes, la start-up avait présenté Dataiku 6, la dernière version de sa plate-forme Enterprise AI et de machine learning. Dataiku 6 a pour objectif d’offrir aux utilisateurs la possibilité de créer et de gérer facilement des clusters Kubernetes depuis la plate-forme Dataiku. En plus de l’élasticité, cette version Dataiku 6 offre une suite de nouvelles fonctionnalités permettant aux organisations de construire des systèmes d’IA durables.
Élasticité: Dataiku 6 permet aux utilisateurs de facilement créer et gérer des clusters Kubernetes (sur AWS, Azure ou GCP) depuis la plateforme Dataiku. Cela signifie que les utilisateurs non-administrateurs peuvent désormais rapidement faire tourner les clusters Kubernetes pour une exécution optimisée des tâches Spark ou en mémoire. Les administrateurs peuvent également isoler et gérer la puissance de calcul afin que chaque équipe obtienne exactement ce dont elle a besoin pour exécuter son analyse et déployer Enterprise AI à grande échelle.
En outre, les utilisateurs de Snowflake bénéficieront d’une exécution plus rapide de Dataiku avec la nouvelle synchronisation optimisée avec WASB et l’exécution native des tâches Spark dans Snowflake. Dataiku 6 rend également extrêmement rapide l’exécution de longs pipelines de données SQL en plusieurs étapes, offrant ainsi un environnement de calcul et de stockage optimisé lorsque vous travaillez avec des données SQL.
White Box AI: Dataiku 6 offre deux nouvelles fonctionnalités visuelles (tracés de dépendance partielle et analyse des sous-populations) qui permettent aux utilisateurs de se plonger dans les aspects clés du comportement des modèles afin d’aider les équipes à éviter les biais indésirables. Grâce à l’analyse des sous-populations, les utilisateurs peuvent facilement éliminer ces biais de modèle non souhaités et créer un déploiement plus transparent et plus équitable de l’IA. Parallèlement, les diagrammes de dépendance partielle aident les utilisateurs à comprendre visuellement des modèles complexes en faisant ressortir la relation entre une entité et la cible.
Collaboration entre plusieurs équipes et efficacité: les intégrations IDE améliorées (RStudio, VS Code, SublimeText, PyCharm) permettent aux développeurs de travailler dans l’environnement de leur choix tout en alimentant la collaboration sur la plateforme Dataiku. Une meilleure visualisation est essentielle pour la communication des systèmes basés sur les données et des décisions aux parties prenantes de l’entreprise, ainsi que pour les data scientists afin de comprendre et de suivre l’avancement des projets d’intelligence artificielle. Dataiku 6 permet de travailler en toute transparence avec des outils de visualisation de données externes tels que Qlik et Tableau.
Avec les fonctionnalités de collaboration ajoutées à Dataiku 6, les data analysts peuvent facilement exploiter le nouveau plugins store et réutiliser le code créé par les data engineers et les data scientists dans leurs flux de travail quotidiens. Avec des fonctionnalités telles que des custom model plugins pour le visual machine learning et des graphiques personnalisés, les développeurs peuvent désormais créer et partager de superbes visuels et des modèles de machine learning personnalisés avec des non-développeurs.