Synthesia est une startup utilisant l’IA pour créer des vidéos synthétiques d’avatars à des fins marketing. Après une première levée de fonds en avril 2021, elle a annoncé en décembre dernier un nouveau tour de table de 5O millions de dollars dirigé par Kleiner Perkins, avec la participation de GV et des investisseurs existants Firstmark Capital, LDV Capital, Seedcamp et MMC Ventures.
Synthesia a été fondée en 2017 par une équipe de chercheurs et d’entrepreneurs de l’UCL, Stanford, TUM et Cambridge qui veulent remplacer les caméras par du code, faire de chacun un créateur et que les médias synthétiques progressent de manière percutante et éthique”. Par “médias synthétiques”, on entend la vidéo, l’image, le texte et la voix qui ont été entièrement ou partiellement générés par des ordinateurs. La capacité des systèmes pilotés par l’IA à générer du contenu audiovisuel est un développement rendu possible par les derniers progrès de l’apprentissage en profondeur. Synthesia utilise le deep learning pour créer des chatbots visuels, des vidéos de produits et des vidéos de vente pour des clients sans acteurs, équipes de tournage, studios ou caméras.
Une vidéo rapide à réaliser et peu coûteuse
Une production vidéo est coûteuse, nécessite des studios, des acteurs, des caméras, la post-production peut être complexe. Synthesia propose la réalisation de vidéos en quelques minutes à partir d’un texte, des avatars intégrés si le client n’en a pas créé un lui-même, ce dernier opte pour une voix réelle ou synthétique et la vidéo est prête, avec une traduction possible en 50 langues. Par la suite, il est possible de modifier le contenu de la vidéo, d’y ajouter du texte, des images… Depuis la levée de fonds du mois d’avril, Synthesia a ajouté des fonctionnalités qui permettent aux utilisateurs de créer encore plus facilement leurs propres talkers animés, et la plate-forme compte désormais 1 000 avatars personnalisés en cours d’utilisation. Riparbelli a cité Ernst & Young comme exemple de client. L’entreprise compte 35 partenaires avec leurs propres avatars, créant des vidéos pour les communications internes et la communication client.
Assurer la sécurité des clients
Les entreprises qui cherchent à faciliter la création de vidéos grâce à l’IA et aux avatars doivent encore augmenter le réalisme mais elles doivent également assurer la sécurité des utilisateurs et la crédibilité de leurs propres plateformes. Une société israélienne appelée D-ID a fait une démonstration de sa technologie à Disrupt 2021, qui peut, à partir d’une image fixe d’une personne, la transformer en contenu vidéo. On peut imaginer ce qu’une telle technologie pourrait entraîner si elle était utilisée avec l’intention de nuire à autrui… Pour sa part, Synthesia assure :
“Nous n’offrirons pas notre logiciel à un usage public. Tout le contenu passera par un processus de sélection interne explicite avant d’être diffusé à nos clients de confiance…En tant qu’entreprise pionnière de ce nouveau type de média, nous sommes conscients de notre responsabilité. Il est clair pour nous que l’intelligence artificielle et des technologies tout aussi puissantes ne peuvent être construites avec l’éthique après coup. Elle doit être à l’avant-plan, faire partie de l’entreprise : reflétée à la fois dans la politique de l’entreprise et dans la technologie que nous développons. C’est également la raison pour laquelle nous sommes un membre actif de la Content Authenticity Initiative qui a été lancée par Adobe en 2019”.