En février dernier, OpenAI dévoilait son premier modèle text-to-video, Sora, depuis lors en preview. La société a annoncé ce 9 décembre le déploiement de Sora Turbo, une version plus rapide, sur sora.com. Elle est disponible sans frais supplémentaires pour les abonnés ChatGPT Plus et Pro dans tous les pays où ChatGPT est disponible, hors l’UE, le Royaume-Uni et la Suisse où il faudra patienter encore quelques mois.
La nouvelle version, Sora Turbo, partage les caractéristiques techniques de Sora présenté en février dernier, mais propose une vitesse de génération significativement améliorée, réduisant le temps nécessaire pour produire des contenus réalistes de haute qualité à partir de descriptions textuelles. Les utilisateurs peuvent créer des vidéos de 20 secondes maximum, idéales pour les réseaux sociaux ou le marketing.
Avec des capacités de résolution allant jusqu’à 1080p sous différents formats (panoramiques, verticaux ou carrés), il offre une flexibilité qui plaira autant aux créateurs amateurs qu’aux professionnels.
Une interface intuitive pour une création précise
Afin de simplifier l’expérience utilisateur, OpenAI a conçu une interface dédiée à Sora, incluant un outil de storyboard qui permet de définir précisément chaque élément de la vidéo. Des flux récents en vedette mettent en avant les créations de la communauté, inspirant les utilisateurs tout en démontrant le potentiel du modèle.
Sora supporte également l’utilisation de ressources personnalisées : les utilisateurs peuvent combiner textes, images et vidéos existants pour étendre ou remixer leurs créations. Cette modularité renforce l’attrait de la plateforme pour un large éventail d’applications.
Les limitations de SORA
La version initiale avait parfois des difficultés à modéliser la physique complexe, la causalité, les détails spatiaux et temporels, et les interactions entre les objets et les personnages. Bien qu’atténués, Sora Turbo rencontre ces mêmes problèmes, les mouvements manquent parfois de naturel.
Si le modèle reste perfectible, son déploiement marque une étape clé pour OpenAI. On peut découvrir le flux de vidéos générées ici.
Un déploiement responsable
Les méthodes de sécurité conçues pour DALL-E 3 garantissant le respect des politiques d’utilisation, comme l’interdiction de la violence, du contenu haineux ou de la divulgation d’informations personnelles ont été appliquées à Sora. OpenAI y a ajouté d’autres mesures pour plus de sécurité et de transparence :
- Toutes les vidéos incluent des métadonnées C2PA pour garantir leur traçabilité ;
- Des filigranes visibles par défaut assurent une transparence quant à leur origine ;
- Un outil interne de vérification aide à identifier les contenus issus de Sora.
Les deepfakes à caractère sexuel ou les contenus illégaux sont bloqués par la société qui a en outre volontairement restreint les fonctionnalités liées aux visages humains pour prévenir les détournements et les abus potentiels.
Disponibilité et modèles d’abonnement
Sora est disponible exclusivement pour les abonnés de ChatGPT Plus et Pro.
Les premiers ont la possibilité de générer jusqu’à 50 vidéos de 5 secondes de 480p à 720p chaque mois. Pour les utilisateurs ayant des besoins plus élevés, l’abonnement Pro leur permet de produire 500 vidéos, d’une durée plus longue (20 secondes) et à une résolution supérieure (jusqu’à 1080p).
OpenAI prévoit également de proposer des tarifs adaptés à différents types d’utilisateurs, rendant la technologie accessible aux créateurs individuels comme aux grandes entreprises. Ces offres devraient être disponibles dès le début de 2025.