En janvier 2021, OPEN AI introduisait DALL·E puis en lançait la seconde version en avril dernier. Le 20 juillet, elle a annoncé la disponibilité de ce système d’IA qui crée des images réalistes et de l’art à partir d’une description en langage naturel, en version bêta. Dans les prochaines semaines, un million de personnes inscrites sur la liste d’attente auront accès à DALL·E 2 et pourront l’utiliser à des fins commerciales.
L’an passé, OPEN AI annonçait DALL·E, une version à 12 milliards de paramètres de GPT-3, formée pour générer des images à partir de descriptions textuelles, en utilisant un ensemble de données de paires texte-image.
La nouvelle version, DALL·E 2, génèrerait des images plus réalistes et plus précises avec une résolution 4 fois supérieure à son prédécesseur. En avril, il a été présenté à un nombre limité d’utilisateurs, ce qui a permis à la société de mieux comprendre les capacités et les limites du système et d’améliorer ses systèmes de sécurité. Les évaluateurs ont été invités à comparer 1 000 générations d’images des 2 modèles, 71,7 % l’ont préféré pour la correspondance des légendes, 88,8 % pour le photoréalisme.
DALL·E 2 peut créer des images et des illustrations originales et réalistes à partir d’une description textuelle et combiner des concepts, des attributs et des styles. Il permet également d’apporter des modifications réalistes aux images existantes à partir d’une légende en langage naturel, ajouter et supprimer des éléments tout en tenant compte des ombres, des reflets et des textures.
Il utilise un processus de diffusion, qui commence par un motif de points aléatoires et modifie progressivement ce motif vers une image lorsqu’il reconnaît des aspects spécifiques de cette image.
Le passage à la version bêta
Chaque utilisateur recevra 50 crédits gratuits au cours du premier mois d’utilisation de DALL·E 2 et 15 crédits gratuits les mois suivants. Chaque crédit pourra être utilisé pour une génération d’invite DALL·E originale, renvoyant quatre images, ou une invite de modification ou de variation, qui renvoie trois images.
Dans cette première phase de la version bêta, les utilisateurs pourront par ailleurs acheter 115 crédits supplémentaires (460 images) pour 15 $ en plus de leurs crédits mensuels gratuits. Un crédit est appliqué chaque fois qu’une invite est saisie et qu’un utilisateur clique sur « générer » ou « variantes ».
L’utilisation à des fins commerciales
Les utilisateurs ont tous les droits d’utilisation pour commercialiser les images qu’ils créent avec DALL·E 2, dont le droit d’impression, de vendre ou de commercialiser. Les projets commerciaux concernent par exemple des illustrations pour des livres pour enfants ou des newsletters, des concepts et des personnages pour des jeux, des moodboards (montages) pour le conseil en design et des storyboards pour des films.
Prévenir les générations nuisibles
Avant de rendre DALL·E 2 disponible en version bêta, Open AI a travaillé avec des chercheurs, des artistes, des développeurs et d’autres utilisateurs pour évaluer les risques et pris des mesures pour améliorer ses systèmes de sécurité.
Open AI a ainsi limité la capacité de DALL·E 2 à générer des images violentes, haineuses ou pour adultes et utilisé des techniques avancées pour prévenir les générations photoréalistes de visages réels d’individus, notamment ceux de personnalités publiques ou politiques. Pour réduire les biais, une nouvelle technique a été mise en œuvre pour générer des images de personnes plus représentatives de la diversité de la population mondiale, technique qui devrait être améliorée grâce à cette première version bêta.