Le PDG d’Amazon, Andy Jassy, a dévoilé lors de la conférence AWS re:Invent, sa première famille de modèles de fondation : NOVA. Celle-ci comprend plusieurs modèles, conçus chacun pour des tâches spécifiques comme le traitement du texte, des images et des vidéos, qui ont été intégrés à Amazon Bedrock.
Cette plateforme, lancée en avril 2023 et accessible en France depuis avril dernier, permet à ses utilisateurs de personnaliser des LLMs en fonction de leurs besoins et de leurs données au lieu d’utiliser des modèles prêts à l’emploi. Jusqu’à présent, Amazon Bedrock leur permettait d’accéder à une variété de modèles d’IA de différents fournisseurs, ils ont désormais accès aux modèles Nova.
La gamme Amazon Nova comprend plusieurs versions qui prennent en charge un large éventail de tâches dans 200 langues. Chacune est optimisée pour des applications spécifiques :
- Amazon Nova Micro : un modèle uniquement textuel conçu pour offrir des réponses à faible latence à des coûts minimaux ;
- Amazon Nova Lite : un modèle multimodal économique capable de traiter du texte, des images et des vidéos ;
- Amazon Nova Pro : une version multimodale avancée, à la fois rapide et précise, idéale pour des tâches variées ;
- Amazon Nova Premier : un modèle haut de gamme destiné aux tâches complexes de raisonnement et au perfectionnement d’autres modèles (disponible dès le premier trimestre 2025) ;
- Amazon Nova Canvas : un modèle de génération d’images ;
- Amazon Nova Reel : un modèle de génération de vidéos d’une durée de 6 secondes actuellement, mais celle-ci devrait passer à 2 minutes en 2025.
Outre le fine-tuning, les modèles prennent en charge la distillation, une technique permettant de transférer des connaissances spécifiques d’un « modèle enseignant » plus grand et très performant vers un modèle plus petit, plus efficace et moins coûteux à exécuter. Amazon Nova Micro, Nova Lite et Nova Pro sont ainsi, selon Amazon, “au moins 75 % moins chers que les modèles les plus performants dans leurs classes d’intelligence respectives dans Amazon Bedrock“.
Amazon présente une publicité vidéo générée par Amazon Nova Reel pour une marque fictive de pâtes, illustrant son potentiel créatif de haute qualité pour les annonceurs.
Dans la vidéo ci-dessous, l’entreprise démontre les capacités de compréhension vidéo d’Amazon Nova Pro, à qui elle a demandé d’examiner et de décrire un bref clip vidéo muet d’un match de football.
Prompt : “Décrivez la vidéo.”
Sortie : “La vidéo montre un match de football en cours sur un terrain vert. Des joueurs de deux équipes, l’un en uniforme jaune et l’autre en blanc, sont engagés dans un jeu. Le quart-arrière de l’équipe jaune lance une passe à un receveur, qui attrape le ballon et commence à courir sur le terrain. Les défenseurs de l’équipe blanche le poursuivent, tentant de le plaquer. Le jeu se termine par un plaqué, qui fait tomber le receveur sur le terrain”.
De nouveaux modèles Nova en prévision
Amazon prévoit de lancer deux autres modèles en 2025, notamment un modèle de synthèse vocale avancée et un modèle multimodal capable de traiter texte, images, audio et vidéos en entrée comme en sortie.