Alibaba lance une puce IA à haute performance spécialisée dans l’accélération des tâches de machine learning

Dans le cadre de la conférence annuelle d'Alibaba Cloud Apsara Computing qui se tient actuellement à Hangzhou en Chine, Alibaba a annoncé le lancement d'une puce IA pour améliorer la puissance du Cloud Computing. Baptisée Hanguang 800, cette unité de traitement neuronal est destinée à améliorer les performances des solutions de recherche, de recommandation ainsi que les services à la clientèle pour le retail.

Alibaba Group vient de présenter sa première puce d’inférence IA développée par T-Head dans le cadre de l’initiative Alibaba DAMO Academy, qui porte les activités de développement technologique et de recherche scientifique du groupe. La puce d’inférence IA à haute performance, une NPU nommée Hanguang 800, spécialisée dans l’accélération des tâches de machine learning, a été annoncée lors de la conférence annuelle Apsara Computing d’Alibaba Cloud qui se tient du 25 au 27 septembre.

La Hanguang 800 est actuellement utilisée en interne pour les opérations commerciales d’Alibaba, notamment dans la recherche de produits et la traduction automatique pour ses sites e-commerce, les recommandations personnalisées, la publicité et les services clients intelligents. Ces domaines nécessitent une puissance de calcul considérable en matière d’intelligence artificielle afin d’optimiser l’expérience d’achat.

« Le lancement de Hanguang 800 est une étape importante dans notre quête de technologies de nouvelle génération. Elle améliore les capacités de calcul qui stimuleront nos activités actuelles et émergentes tout en augmentant l’efficacité énergétique », a déclaré Jeff Zhang, Directeur Technique du Groupe Alibaba et Président d’Alibaba Cloud Intelligence.

« Dans un avenir proche, nous prévoyons de donner à nos clients les moyens d’accéder à de l’informatique avancée, grâce à cette puce, à tout moment et en tout lieu, par l’intermédiaire de notre activité cloud. »

L’un des principaux objectifs d’Alibaba Cloud est d’offrir une infrastructure technologique de pointe qui profite aux entreprises de toutes tailles et bouche les lacunes existantes en matière d’accès à la technologie, pour finalement rendre le monde plus inclusif.

Portée par une architecture matérielle développée en interne, et des algorithmes hautement optimisés et adaptés à des applications métiers telles que le retail et la logistique, la puce Hanguang 800 a enregistré des performances remarquables dans les tests. La performance de calcul sur une seule puce a atteint 78 563 IPS au moment du pic, tandis que les scores des tests d’efficience Restnet-50 Inference étaient de 500 IPS/W. Les deux scores de performance sont largement supérieurs à la moyenne de l’industrie, mettant en lumière un équilibre remarquable entre des capacités de calcul élevées et une grande efficience.

Par exemple, environ un milliard d’images de produits sont téléchargées chaque jour sur Taobao, le site e-commerce d’Alibaba, pour les commerçants. Auparavant, il fallait une heure à la machine pour catégoriser un si grand volume d’images, puis adapter la recherche et les recommandations personnalisées pour des centaines de millions de consommateurs. Avec Hanguang 800, il ne faut plus que 5 minutes à la même machine pour accomplir la même tâche.

L’unité de recherche d’Alibaba, T-Head — dont le nom chinois est « Pintouge », qui signifie « Ratel » — se veut à la pointe de l’innovation en matière de puces pour le cloud computing et le edge computing. T-Head est également responsable de la mise en place d’un écosystème informatique de pointe inclusif en collaborant avec des partenaires mondiaux de l’industrie de la carte à puce.

Plus tôt cette année, T-Head avait lancé la XuanTie 910, un processeur IoT haute performance basé sur RISC-V, un jeu d’instructions open source (ISA). XuanTie 910 a été conçu pour servir les applications IoT à haut rendement qui nécessitent des capacités de calcul élevées, telles que l’intelligence artificielle, la mise en réseau, les passerelles, les automobiles autonomes et les serveurs embarqués. Les développeurs du monde entier ont pu accéder avec succès à certains codes des processeurs hautes performances et utiliser cette technologie pour développer des prototypes pour leurs propres puces.

Pour en savoir plus sur les différents types de puces, n'hésitez pas à retrouver l'article "L'avenir de l'intelligence artificielle passe par la lumière" que nous avons consacré à la technologie d'OPU de LightOn

Comprendre l'IA

Applications de l'IA

Alibaba lance une puce IA à haute performance spécialisée dans l’accélération des tâches de machine learning