Google Cloud et NVIDIA : un partenariat étendu autour des données et de l'IA générative

La semaine dernière, lors de Google Cloud Next, Thomas Kurian, CEO de Google Cloud, et Jensen Huang, fondateur et CEO de NVIDIA, ont annoncé une nouvelle infrastructure et un nouveau logiciel d'IA permettant aux clients de construire et de déployer des modèles massifs pour l'IA générative et d'accélérer les charges de travail de la science des données. En mars dernier, lors de la GTC, Jenseng Huang, a dévoilé AI Foundations, un ensemble de services cloud permettant aux entreprises de créer leurs propres modèles d’IA génératives à partir de leurs données, pour leurs tâches spécifiques à un domaine : le texte (NVIDIA NeMo), le contenu visuel (NVIDIA Picasso) et la biologie (NVIDIA BioNeMo).

Les services NeMo et Picasso fonctionnent sur NVIDIA DGX Cloud, dévoilé lui aussi le 21 mars, un service accessible via un navigateur permettant aux entreprises de louer des clusters de GPU H100, leur donnant ainsi un accès immédiat à l’infrastructure et aux logiciels nécessaires pour former des modèles avancés pour l’IA générative et d’autres applications.

DGX Cloud inclut NVIDIA AI Enterprise, la couche logicielle de la plate-forme NVIDIA AI, qui fournit des modèles préentraînés, des frameworks optimisés et des bibliothèques logicielles de science des données accélérées.

Les annonces Google Cloud-NVIDIA

Les dirigeants de Google Cloud et NVIDIA sont revenus sur leur collaboration autour des innovations ci-dessus. Ils ont rappelé qu'il était possible d'accéder à la suite Nvidia AI Enterprise sur Google Cloud Marketplace et ont annoncé que NVIDIA DGX Cloud sera prochainement disponible sur Google Cloud.

PaxML optimisé pour les GPU NVIDIA

Le framework PaxML est utilisé par les chercheurs de Google et ceux de Deepmind pour construire des modèles internes et leurs projets de recherche.

Il est désormais optimisé pour les GPU NVIDIA H100 et A100 Tensor Core, ce qui permet aux développeurs d'expérimenter et de mettre à l'échelle leurs projets de manière plus avancée et entièrement configurable. Cette optimisation utilise JAX, qui a lui-même été amélioré pour les GPU avec l'OpenXLA Compiler.

Un conteneur PaxML optimisé pour les GPU est dès à présent disponible dans le catalogue de logiciels NVIDIA NGC.

Spark Sans Serveur intégré aux GPU NVIDIA

Une autre intégration majeure est celle de la solution sans serveur Spark de Google avec les GPU NVIDIA via le service Dataproc de Google. Cette collaboration aidera les scientifiques des données à accélérer leurs charges de travail Apache Spark, préparant ainsi les données pour le développement de l'IA.

Disponibilité des machines virtuelles A3

Google Cloud a annoncé la disponibilité générale de ses machines virtuelles A3, conçues pour entraîner et fournir les LLM nécessaires pour répondre aux besoins de l"IA générative, alimentées par les GPU NVIDIA H100. Celles-ci offrent une formation trois fois plus rapide et une bande passante réseau considérablement améliorée par rapport à la génération précédente.

Les GPU NVIDIA H100 alimenteront également la plateforme Vertex AI de Google Cloud, ouvrant ainsi la voie au développement rapide de LLM d'IA génératives.

Google Cloud sera l'une des premières entreprises à avoir accès au supercalculateur DGX GH200 AI, présenté récemment par NVIDIA.

Comprendre l'IA

Applications de l'IA

Google Cloud et NVIDIA : un partenariat étendu autour des données et de l'IA générative

Sommaire

Les annonces Google Cloud-NVIDIA

PaxML optimisé pour les GPU NVIDIA

Spark Sans Serveur intégré aux GPU NVIDIA

Disponibilité des machines virtuelles A3