Selon diverses sources, OpenAI serait en négociations avec divers médias afin d’obtenir des licences lui permettant d’entraîner ses LLM sur leurs publications. Plusieurs plaintes ont visé la société depuis le lancement de ChatGPT en novembre 2022 pour violation de propriété intellectuelle, si les tractations aboutissaient, elles permettraient à OpenAI d’agir en toute légalité. Cependant, le montant évoqué de 1 à 5 millions de dollars, serait considéré comme insuffisant par plusieurs médias.
Si ChatGPT a connu un succès fulgurant, il était initialement limité aux données antérieures à septembre 2021, du moins dans sa version gratuite. La fonctionnalité “Browse with Bing” a permis au système d’IA d’avoir accès au Web via le moteur de recherche de Microsoft et d’apporter des réponses actualisées aux abonnés de ChatGPT Plus. Les abonnés ont ainsi eu accès à des contenus payants, ce qui n’a pas plu à leurs auteurs.
Une récente plainte du New York Times devant la Cour de district sud de New York contre OpenAI pour violation d’auteur, des recours collectifs pour le même motif ont également placé la société dans une mauvaise position. Le quotidien argue qu’OpenAI lui a fait perdre des milliards de dollars et réclame le retrait de ses contenus utilisés sans autorisation. Tous les auteurs impliqués dans ces procès s’accordent avec le New York Times sur le fait de ne pas laisser OpenAI générer des bénéfices avec des produits utilisant leur travail sans contrepartie.
OpenAI se défend de vouloir spolier les éditeurs et créateurs, la société se dit prête à collaborer avec eux “afin qu’ils tirent profit d’une technologie IA avancée et d’un nouveau modèle de revenus”. OpenAi aurait ainsi approché une douzaine d’éditeurs selon The Information, des dizaines selon Bloomberg.
Elle a ainsi signé récemment un accord avec le groupe de presse allemand Axel Springer après avoir conclu un partenariat avec l’Associated Press en juillet dernier, pour partager certains contenus et technologies d’information et examiner des cas d’utilisation potentiels de l’IA générative dans les produits et services d’actualité. Si certains quotidiens se disent prêts à négocier, pour l’instant la BBC, CNN, Reuters empêchent OpenAI d’explorer et collecter des données à partir de leurs contenus.
Selon les déclarations de Tom Rubin, responsable de la propriété intellectuelle et du contenu chez OpenAI à Bloomberg, les négociations seraient en bonne voie et d’autres accords devraient être prochainement annoncés.