Le New York Times porte plainte contre OpenAI et Microsoft pour violation de droit d’auteur

Le New York Times a porté plainte mercredi dernier devant la Cour de district sud de New York, contre OpenAI et Microsoft. Le journal les accuse de violer le droit d’auteur en entraînant les modèles tels que GPT-4 sur ses publications sans autorisation, lui faisant ainsi perdre des milliards de dollars.

Le Times dit avoir mis en place “des conditions d’utilisation qui définissent les limites de la copie et de l’utilisation de son contenu”, il concède sous licence son contenu dans le cadre d’accords de licence négociés, ce qui n’a pu être réalisé avec OpenAI et Microsoft. Pourtant, selon ses dires, des millions de ses articles ont servi à entraîner les modèles GPT d’OpenAI.

Dans la plainte, le quotidien explique en effet avoir “contacté Microsoft et OpenAI en avril 2023 pour soulever des préoccupations en matière de propriété intellectuelle et explorer la possibilité d’une résolution amiable, avec des termes commerciaux et des garde-fous technologiques permettant un échange de valeur mutuellement bénéfique entre les défendeurs et le Times. Ces efforts n’ont pas abouti à une résolution“.

Il produit dans cette plainte des exemples où les réponses de ChatGPT ou Bing Chat paraphrasent certains de ses articles quand elles ne les reprennent quasiment mot à mot. Les réponses de GPT-4 reprenant certaines parties d’une série du journal primée par le prix Pulitzer sur les pratiques de prêt prédateur dans l’industrie des taxis de la ville de New York, fruit d’un travail de 18 mois, ou d’une autre sur la façon dont la sous-traitance par Apple et d’autres entreprises technologiques a transformé l’économie mondiale, en sont des exemples flagrants.

2023, une année de batailles judiciaires pour OpenAI

On a vu cette année les auteurs, les scénaristes et les journalistes préoccupés par la peur de voir leurs métiers remplacés par l’IA générative, mais la violation de leur propriété intellectuelle les a fait également réagir.

Une lettre ouverte de l’Authors Guild, rassemblant plus de 9 000 signatures, a ainsi été  envoyée à OpenAI, Alphabet, Meta, Stability AI, IBM et Microsoft, attirant l’attention sur “l’injustice inhérente à la construction de technologies d’IA génératives lucratives à l’aide d’œuvres protégées par le droit d’auteur et demande aux développeurs d’IA d’obtenir le consentement, de créditer et de rémunérer équitablement les auteurs”.

Des actions en justice ont vu le jour : Matthew Butterick, avocat et développeur, et le cabinet d’avocats Joseph Saveri, qui avaient porté plainte contre GitHub Copilot l’an dernier, ont représenté les écrivains Sarah Silverman, Richard Kadrey et Christopher Golden lors d’un procès contre OpenAI accusé d’avoir utilisé leurs livres pour l’entraînement de ChatGPT, ils les avaient représentés également lors d’un procès en juillet contre Meta pour avoir violé les lois sur le droit d’auteur en utilisant leurs livres pour entraîner LLaMA. La société avait admis avoir utilisé Books3, mais via l’ensemble de données The Pile qui est open source.

Pour Matthew Butterick, les recours collectifs allaient être de plus en plus nombreux, ce qui s’est vérifié par une nouvelle plainte contre OpenAI de Michael Chabon, David Henry Hwang, Rachel Louise Snyder et Ayelet Waldman.

Tous s’accordent avec le New York Times sur le fait de ne pas laisser OpenAI générer des bénéfices avec des produits utilisant leur travail sans contrepartie.

Des accords avec les médias

OpenAI se défend de vouloir spolier les éditeurs et créateurs, la société se dit prête à collaborer avec eux “afin qu’ils tirent profit d’une technologie IA avancée et d’un nouveau modèle de revenus”.

Elle a ainsi signé récemment un accord avec le groupe de presse allemand Axel Springer après avoir conclu un partenariat avec l’Associated Press en juillet dernier, pour partager certains contenus et technologies d’information et examiner des cas d’utilisation potentiels de l’IA générative dans les produits et services d’actualité. Si certains quotidiens se disent prêts à négocier, pour l’instant la BBC, CNN, Reuters empêchent OpenAI d’explorer et collecter des données à partir de leurs contenus.

Ce litige en cours avec le New York Times souligne les défis complexes auxquels l’industrie de l’IA est confrontée dans la recherche d’un équilibre entre innovation technologique, protection des droits d’auteur et rémunération équitable des créateurs de contenu. La décision prise par la Cour pourrait servir de jurisprudence, cette énième plainte souligne la nécessité d’une réglementation telle que l’AI Act pour des modèles transparents.

Recevez gratuitement l'actualité de l'intelligence artificielle

Suivez la Newsletter de référence sur l'intelligence artificielle (+ de 18 000 membres), quotidienne et 100% gratuite.


Tout comme vous, nous n'apprécions pas le spam. Vos coordonnées ne seront transmises à aucun tiers.
Partager l'article
intelligence artificielle
À PROPOS DE NOUS
Le portail francophone consacré à l'intelligence artificielle et à la datascience, à destination des chercheurs, étudiants, professionnels et passionnés.