La GTC (GPU Technology Conference) 2023 a eu lieu il y a quelques jours. Lors de son discours d’ouverture, Jenseng Huang, fondateur et CEO de NVIDIA, a dévoilé AI Foundations, un ensemble de services cloud permettant aux entreprises de créer leurs propres modèles d’IA génératives à partir de leurs données, qu’ils soient linguistiques ou visuels, fonctionnant sur DGX Cloud.
NVIDIA AI Foundations vise à accélérer l’adoption de l’IA générative au niveau des entreprises en leur permettant d’affiner et d’exploiter des modèles personnalisés de grand langage et des modèles d’IA générative formés avec leurs propres données propriétaires et créés pour leurs tâches spécifiques à un domaine : le texte (NVIDIA NeMo), le contenu visuel (NVIDIA Picasso) et la biologie (NVIDIA BioNeMo).
Les services NeMo et Picasso fonctionnent sur NVIDIA DGX Cloud, dévoilé lui aussi le 21 mars, un service accessible via un navigateur permettant aux entreprises de louer des clusters de GPU H100, leur donnant ainsi un accès immédiat à l’infrastructure et aux logiciels nécessaires pour former des modèles avancés pour l’IA générative et d’autres applications.
Les développeurs peuvent utiliser les modèles proposés sur chaque service via des interfaces de programmation d’applications simples. Une fois les modèles prêts à être déployés, les entreprises peuvent exécuter des charges de travail d’inférence à grande échelle à l’aide des services cloud NVIDIA AI Foundations.
Chaque service cloud comprend six éléments : des modèles pré-entraînés, des frameworks pour le traitement des données, des bases de données vectorielles et la personnalisation, des moteurs d’inférence optimisés, des API et le support des experts NVIDIA pour aider les entreprises à ajuster les modèles pour leurs cas d’utilisation personnalisés.
NVIDIA Picasso
Shuttertstock, Adobe et Getty Images figurent parmi les premiers clients à adopter NVIDIA Picasso. Ce service cloud permet de créer et de déployer des applications d’image, de vidéo et 3D génératives basées sur l’IA avec des capacités avancées de synthèse texte-image, de synthèse vidéo et de synthèse de texte en 3D afin de booster la productivité pour la créativité la conception et la simulation numérique grâce à des API cloud simples.
Les fabricants de logiciels, les fournisseurs de services et les entreprises peuvent utiliser Picasso pour former les modèles de base NVIDIA Edify sur leurs données propriétaires afin de créer des applications qui utilisent des invites de texte naturel pour créer et personnaliser rapidement du contenu visuel pour de nombreux cas d’utilisation : conception de produits, jumeaux numériques, narration, création de personnages…
Shutterstock utilisera NVIDIA Picasso pour convertir le texte en contenu 3D haute fidélité
Shutterstock a annoncé en octobre dernier un partenariat étendu avec OpenAI, lui permettant d’intégrer le modèle de texte-image DALL-E 2 mais il s’engage en contrepartie à rémunérer les artistes pour leur contribution. D’autre part, il interdit la vente d’œuvres d’art générées par l’IA qui ne sont pas réalisées à l’aide de DALL-E sur son site.
Les modèles 3D formés avec NVIDIA Picasso seront introduits dans les prochains mois sur Shutterstock.com, les nouvelles capacités d’IA générative alimentées par NVIDIA seront ainsi intégrées à la boîte à outils Creative Flow. Ces fonctionnalités de conversion de texte en 3D seront également proposées sur Turbosquid.com et devraient être introduites sur la plate-forme NVIDIA Omniverse pour la construction et l’exploitation d’applications métaverses industrielles.
Les artistes contribuant à l’entraînement des modèles d’IA seront rémunérés au travers de du « Contributor Fund » de Shutterstock.
Certains modèles d’Adobe Firefly seront hébergés sur NVIDIA Picasso
NVIDIA et Adobe ont annoncé lors du GTC une extension de leur partenariat de R&D pour créer la prochaine génération de modèles d’IA générative, en mettant l’accent sur la transparence et les informations d’identification du contenu, alimentées par l’initiative Content Authenticity d’Adobe (un projet open source dont l’objectif est de fournir une meilleure attribution des oeuvres).
Adobe a également présenté Adobe Firefly, une famille de modèles d’IA générative créative qui devrait apporter encore plus de précision, de puissance et de vitesse directement dans les workflows Adobe Creative Cloud, Adobe Document Cloud et Adobe Experience Cloud qui impliquent la création et la modification de contenu.
L’hébergement de certains modèles Adobe Firefly sur NVIDIA Picasso optimisera les performances et générera des ressources de haute qualité afin de répondre aux attentes des clients.
La collaboration NVidia -Getty Images
NVIDIA et Getty Images collaborent pour développer deux modèles d’IA générative utilisant NVIDIA Picasso : les utilisateurs pourront utiliser les modèles pour créer une image ou une vidéo personnalisée en quelques secondes, à partir d’une invite textuelle.
Getty Images a interdit l’an passé la publication et la vente d’images générées par l’IA sur son site pour des raisons de droit d’auteur. Les modèles seront entraînés sur le contenu entièrement sous licence de Getty Images et les revenus générés par les modèles fourniront des redevances aux créateurs de contenu.
NVIDIA NEMO pour le texte
NVIDIA NeMo est une boîte à outils d’IA conversationnelle conçue pour les chercheurs travaillant sur la reconnaissance vocale automatique, la synthèse texte-parole, les grands modèles de langage et le traitement du langage naturel.
Ce framework cloud-native permet aux développeurs de construire, personnaliser et déployer des modèles d’IA générative de 8 à 530 milliards de paramètres. Il contribue à rendre les grands modèles de langage (LLM) plus pertinents pour les entreprises en définissant des domaines d’intérêt, en ajoutant des connaissances spécifiques au domaine et en enseignant des compétences fonctionnelles.
Les entreprises peuvent ainsi personnaliser les modèles pour alimenter des applications d’IA génératives précises pour l’intelligence du marché, la recherche d’entreprise, les chatbots , le service client…
Morningstar, l’un des principaux fournisseurs indépendants d’informations sur les investissements, travaille avec NeMo pour rechercher des services de renseignement avancés et Quantiphi, une société d’ingénierie numérique axée sur l’IA et l’un des partenaires de prestation de services de NVIDIA, l’utilise pour créer une solution d’IA générative modulaire. L’offre, appelée baioniq, permettra aux entreprises de créer des LLM personnalisés équipés d’informations à jour pour stimuler la productivité des employés de bureau.
NVIDIA BioNeMo pour la recherche pharmaceutique
NVIDIA BioNeMo, basé sur l’architecture NVIDIA NeMo Megatron, permet d’entraîner et de déployer de grands modèles d’IA pour les transformateurs biomoléculaires à une échelle de calcul intensif. Il comprend de grands modèles de langage complexes (LLM) pré-entraînés et un support natif des formats de fichiers communs pour les protéines, l’ADN, l’ARN et la chimie, fournissant ainsi des chargeurs de données pour SMILES pour les structures moléculaires et FASTA pour les séquences d’acides aminés et de nucléotides.
Les développeurs peuvent demander à accéder au service cloud d’IA générative NeMo, qui est en accès anticipé, et au service Picasso, qui est en préversion privée.