Après OpenAI, c’est au tour d’AWS d’être sous les feux des projecteurs cette semaine mais pour une bien meilleure raison : son évènement destiné au cloud computing “re:invent”. Durant cinq jours, la société présente ses nouveaux partenariats et ses innovations. Parmi celles-ci, Amazon Q, un chatbot destiné aux métiers et de nouvelles puces d’IA.
AWS propose une alternative à ChatGPT Enterprise, Copilot de Microsoft ou Duet AI de Google : Amazon Q. Basé sur 17 ans d’expérience d’AWS, cet assistant alimenté par l’IA générative, connecté aux données, aux informations, au code et aux systèmes de l’entreprise, permettra aux employés d’accéder aux bonnes informations beaucoup plus rapidement.
AWS assure que ces données ne seront pas utilisées pour entraîner ses modèles sous-jacents. Conçu dans un souci de sécurité et de confidentialité pour répondre aux exigences strictes des entreprises clientes, Amazon Q peut personnaliser ses interactions à chaque utilisateur en fonction de son identité, de son rôle et des autorisations existantes.
Les clients peuvent accéder à Amazon Q via une interface conversationnelle depuis la console de gestion AWS, les pages de documentation, leur environnement de développement intégré (IDE), et via Slack ou d’autres applications de chat tierces.
Une assistance générative pour des cas d’utilisation et des secteurs spécifiques
AWS apporte Amazon Q à plusieurs services et applications, notamment Amazon QuickSight, Amazon Connect et AWS Supply Chain.
Avec Amazon Q in QuickSight,( actuellement en preview), les clients peuvent accéder à des capacités génératives alimentées par l’IA pour créer des tableaux de bord et utiliser plus facilement les tableaux de bord existants pour simplifier la prise de décision à l’aide d’histoires de données, informer les parties prenantes de l’entreprise des changements et distiller les informations clés.
Amazon Q est disponible pour le centre de contact cloud “Connect” : il permet de détecter les problèmes des clients en fonction de la conversation en temps réel entre le client et l’agent, et fournit automatiquement des réponses à ce dernier, lui suggère des actions et des liens vers des articles pertinents.
L’assistant sera bientôt disponible dans AWS Supply Chain, les clients pourront alors poser des questions sur leurs données de chaîne d’approvisionnement, visualiser les résultats de scénarios complexes et poser des questions de suivi pour comprendre les compromis entre différentes décisions.
Les nouvelles puces Graviton4 et Trainium2
AWS a également annoncé la nouvelle génération de deux de ses familles de puces, Graviton4 et Trainium2, qui offrent des avancées en matière de rapport qualité-prix et d’efficacité énergétique pour un large éventail de charges de travail, notamment l’entraînement des modèles d’IA et les applications d’IA générative exécutés sur Amazon Elastic Compute Cloud (Amazon EC2).
La 4ème génération de Graviton offre des performances de calcul jusqu’à 30 % supérieures, 50 % de cœurs en plus et 75 % de bande passante mémoire en plus que les processeurs Graviton3 de la génération actuelle.
Avec des performances d’entraînement 4 fois plus rapides et 3 fois plus de capacité de mémoire que les puces Trainium de première génération, tout en doublant l’efficacité énergétique (performances/watt), les puces Trainium2 sont spécialement conçues pour l’entraînement haute performance des FM et des LLM.
Elles seront disponibles dans les instances Amazon EC2 Trn2, en clusters de 16 puces. Il sera possible de déployer jusqu’à 100 000 puces Trainium2 dans des UltraClusters EC2 de nouvelle génération, interconnectés avec un réseau à l’échelle du pétabit AWS Elastic Fabric Adapter (EFA), ce qui permettra de fournir jusqu’à 65 exaflops de calcul.
Selon AWS, il sera ainsi possible d’entraîner un LLM de 300 milliards de paramètres en quelques semaines plutôt qu’en plusieurs mois.