Optique co-packagée (CPO) : comment IBM entend booster l’entraînement des LLMs dans les datacenters

IBM Research vient de dévoiler une avancée majeure dans le domaine des technologies de connexion pour les centres de données et les circuits imprimés, avec l’introduction d’un nouveau module prototype d’optiques co-packagées (CPO : co-packaged optics). Cette innovation pourrait remplacer les interconnexions électriques dans les datacenters et offrir des améliorations significatives en termes de vitesse et d’efficacité énergétique pour l’IA et d’autres applications informatiques.

Avec l’essor de la GenAI, les centres de données sont confrontés à une demande croissante de transfert de données à haute vitesse. Alors que les câbles en cuivre traditionnellement utilisés sont limités par la dégradation du signal sur de longues distances, la CPO se présente comme une alternative prometteuse. Combinant étroitement électronique et photonique au sein d’un même module, elle augmente la densité de bande passante des interconnexions et l’efficacité énergétique en raccourcissant considérablement la longueur des liaisons électriques.

L’innovation d’IBM repose sur un processus minutieux d’intégration entre électronique et photonique, au cœur duquel se trouve le développement d’un guide d’ondes optiques en polymère (PWG : polymer optical waveguide). Elle permet d’augmenter de six fois le nombre de fibres optiques pouvant être connectées au bord d’une puce de silicium, une mesure connue sous le nom de densité de bord.

Une étape clé de ce développement a été la réalisation de connexions optiques haute densité entre les puces et les fibres, un défi technique considérable compte tenu des tolérances extrêmement serrées requises pour aligner les faisceaux lumineux avec précision. Les connexions optiques hautes fidélité nécessitent en effet un écartement extrêmement précis, de l’ordre d’un demi-micron ou moins entre une fibre et un connecteur, un exploit que l’équipe d’IBM a réalisé.

Elle a atteint pour ce prototype une densité de pas de 50 microns, réduisant ainsi de 80 % l’espace requis par rapport aux solutions conventionnelles (pas de 250 microns, soit environ trois fois la largeur d’un cheveu humain). Des tests ont même montré un potentiel de réduction à 25 microns, ouvrant la voie à des bandes passantes multipliées par dix.

L’intégration de cette technologie a nécessité des avancées dans la fabrication, notamment la mise au point de photodétecteurs et d’émetteurs optiques compacts capables de gérer des signaux à des fréquences élevées, tout en restant compatibles avec les processus de production standard.

Crédit IBM

Performances et gains environnementaux

Selon IBM, cette innovation permettrait :

  • Une diminution des coûts de mise à l’échelle de l’IA générative : la consommation énergétique serait réduite de plus de 5 fois par rapport aux interconnexions électriques. L’économie réalisée par modèle IA entraîné serait équivalente à la consommation annuelle de 5 000 foyers ;
  • Un entraînement des LLMs jusqu’à cinq fois plus rapides : la CPO pourrait également réduire le temps nécessaire à l’entraînement d’un LLM standard de trois mois à trois semaines, les gains de performance augmentant avec l’utilisation de modèles plus grands et d’un plus grand nombre de GPU.

Tests rigoureux en conditions réelles

Les prototypes ont été soumis à des tests de fiabilité dans des environnements simulant des températures extrêmes (-40 °C à 125 °C) et des contraintes mécaniques au siège social mondial d’IBM Research à Yorktown Heights, dans l’État de New York et à l’usine d’IBM à Bromont, au Québec.

Ces tests ont permis à IBM de s’assurer que les fibres optiques pouvaient supporter la flexion sans se casser ni subir de pertes de données. Ils ont validé la faible perte d’insertion (<1,2 dB) et une diaphonie limitée (<30 dB), démontrant la viabilité de la solution pour les centres de données.

John Knickerbocker, ingénieur de recherche chez IBM, assure :

“Le gros problème, ce n’est pas seulement que nous avons obtenu cette grande augmentation de la densité pour les communications sur le module, mais nous avons également démontré que cela est compatible avec des tests de résistance que les liaisons optiques n’ont pas réussi dans le passé”.

Les modules d’IBM sont compatibles avec les processus d’assemblage d’emballages électroniques passifs avancés standard, ce qui permet une réduction des coûts de production. Ils sont fabriqués à Bromont, avec une capacité à être produits à l’échelle, ouvrant la voie à une adoption commerciale.

John Knickerbocker conclut :

“Nous travaillerons également avec les fournisseurs de composants pour les positionner pour cette prochaine étape technologique, ainsi que pour les positionner pour qu’ils soient capables de prendre en charge des quantités de production, pas seulement des prototypes”. 

Recevez gratuitement l'actualité de l'intelligence artificielle

Suivez la Newsletter de référence sur l'intelligence artificielle (+ de 18 000 membres), quotidienne et 100% gratuite.


Tout comme vous, nous n'apprécions pas le spam. Vos coordonnées ne seront transmises à aucun tiers.
Partager l'article
intelligence artificielle
À PROPOS DE NOUS
Le portail francophone consacré à l'intelligence artificielle et à la datascience, à destination des chercheurs, étudiants, professionnels et passionnés.