Lors du Computex, à Taiwan, Jensen Huang, cofondateur et PDG de Nvidia, a déclaré vouloir apporter l’IA générative à chaque centre de données. Il a notamment annoncé la mise en production du GH200 Grace Hopper et collaborer avec l’opérateur de télécommunication Softbank Group sur une plateforme pionnière, basée sur cette “superpuce”, pour les applications d’IA générative et 5G/6G que SoftBank prévoit de déployer dans ses nouveaux centres de données distribués au Japon.
Selon Jensen Huang, le GH200 Grace Hopper de Nvidia, conçu pour les applications de centre de données à haute résilience, est maintenant en pleine production. Il réunit les architectures CPU Nvidia Grace et GPU Hopper basées sur Arm, via la technologie d’interconnexion Nvidia NVLink-C2C à bande passante élevée, faible latence et faible consommation. La superpuce booste 4 PetaFLOPS TE, 72 processeurs Arm connectés par liaison puce à puce, 96 Go de mémoire HBM3 et 576 GPU.
© Nvidia
Le partenariat SoftBank-Nvidia
Cette collaboration avec Nvidia permettra à SoftBank de construire des centres de données pouvant héberger des applications d’IA génératives et sans fil sur une plateforme de serveur commune mutualisée, ce qui réduit les coûts et est plus économe en énergie.
La plateforme utilisera la nouvelle architecture de référence NVIDIA MGX avec les superpuces GH200 basées sur Arm Neoverse, et devrait améliorer les performances, l’évolutivité et l’utilisation des ressources des charges de travail des applications.
Jensen Huang explique :
“La demande de calcul accéléré et d’IA générative entraîne un changement fondamental dans l’architecture des centres de données. NVIDIA Grace Hopper est une plate-forme informatique révolutionnaire conçue pour traiter et faire évoluer les services d’IA générative. Comme d’autres initiatives visionnaires dans leur passé, SoftBank est à la tête du monde pour créer un réseau de télécommunications conçu pour héberger des services d’IA générative”.
Les nouveaux centres géreront à la fois les charges de travail d’IA et 5G. SoftBank explore en effet la création d’applications 5G pour la conduite autonome, les usines d’IA, la réalité augmentée et virtuelle, la vision par ordinateur et les jumeaux numériques.
RAN virtuel avec débit record
Les unités de traitement de données NVIDIA Grace Hopper et NVIDIA BlueField-3 accéléreront le vRAN 5G défini par logiciel, ainsi que les applications d’IA génératives, sans accélérateurs matériels sur mesure ni processeurs 5G spécialisés. De plus, le commutateur Ethernet NVIDIA Spectrum avec BlueField-3 fournira un protocole de synchronisation très précis pour la 5G.
La solution atteint une vitesse 5G révolutionnaire sur une conception de serveur 1U MGX accélérée par NVIDIA, avec un débit élevé de 36 Gbit/s de capacité de liaison descendante, basé sur des données accessibles au public sur les accélérateurs 5G. Les opérateurs ont eu du mal à fournir une capacité de liaison descendante aussi élevée en utilisant des serveurs standard de l’industrie.
La nouvelle architecture de référence NVIDIA MGX
NVIDIA MGX est une architecture de référence modulaire qui permet aux fabricants de systèmes et aux clients hyperscale de créer rapidement et à moindre coût plus d’une centaine de variantes de serveurs différentes pour s’adapter à un large éventail d’applications IA, HPC et NVIDIA Omniverse.
En intégrant le logiciel NVIDIA Aerial pour les réseaux 5G hautes performances, définis par logiciel et natifs du cloud, ces stations de base 5G permettront aux opérateurs d’allouer dynamiquement des ressources de calcul et d’atteindre une efficacité énergétique 2,5 fois supérieure à celle des produits concurrents.
René Haas, PDG d’Arm, déclare :
“L’avenir de l’IA générative nécessite un calcul haute performance et économe en énergie, comme celui de la superpuce Grace Hopper basée sur Arm Neoverse de NVIDIA. Combiné aux DPU NVIDIA BlueField, Grace Hopper permet aux nouveaux centres de données SoftBank 5G d’exécuter les applications de calcul et de mémoire les plus exigeantes et d’apporter des gains d’efficacité exponentiels à la 5G définie par logiciel et à l’IA sur Arm”.
Junichi Miyakawa, Président et Chef de la direction de SoftBank Corp, conclut :
“Alors que nous entrons dans une ère où la société coexiste avec l’IA, la demande de traitement de données et les besoins en électricité augmenteront rapidement. SoftBank fournira une infrastructure sociale de nouvelle génération pour soutenir la société super-numérisée au Japon. Notre collaboration avec NVIDIA aidera notre infrastructure à atteindre des performances nettement supérieures avec l’utilisation de l’IA, y compris l’optimisation du RAN. Nous pensons que cela peut également nous aider à réduire la consommation d’énergie et à créer un réseau de centres de données interconnectés qui peuvent être utilisés pour partager des ressources et héberger une gamme d’applications d’IA génératives”.