Le 3 novembre dernier, un recours collectif a été déposé devant un tribunal fédéral américain à San Francisco, contre OpenAI, Microsoft et GitHub. Les plaignants contestent la légalité de GitHub Copilot et d’OpenAI Codex, qui violerait les termes des licences open source. Ils réclament neuf milliards de dollars de dommages et intérêts.
Les outils de complétion sont conçus pour permettre aux développeurs de gagner en productivité dans une activité toujours plus complexe. GitHub Copilot, extension de Visual Studio Code, alimenté par OpenAI Codex, est un système d’IA créé par OpenAI, plus performant que GPT-3 pour la génération de code, en partie parce qu’il a été formé sur un ensemble de données qui comprend une concentration beaucoup plus importante de code source public. Il propose des autocomplétion de portions entières de code que le développeur est libre d’accepter ou de rejeter.
Le lancement de l’aperçu technique de Copilot avait suscité de nombreuses réactions dans la communauté des développeurs et, tout particulièrement, celle de la Free Software Foundation concernant les droits d’auteur, les questions de propriété du code généré par l’IA et les impacts juridiques pour les auteurs GitHub.
Le litige GitHub Copilot
Sur le site de Matthew Butterick, avocat et développeur, consacré à ce litige, GitHub Copilot est qualifié « de produit d’IA qui repose sur un piratage de logiciels open source sans précédent ».
Après une enquête sur GitHub Copilot, Matthew Butterick et le cabinet d’avocats Joseph Saveri ont porté plainte contre Open AI, Microsoft et GitHub pour violation des droits légaux d’un grand nombre de créateurs ayant publié du code ou d’autres œuvres sous licences open source sur GitHub. Ces licences open source, notamment la licence Apache, la licence GPL ou la licence MIT, exigent toutes l’attribution du nom de l’auteur et des droits d’auteur, ce que n’ont pas à faire les utilisateurs de Copilot.
Outre la violation de ces exigences d’attribution, les plaignants les accusent d’avoir violé :
- Les conditions d’utilisation et politiques de confidentialité de GitHub;
- Le DMCA 1202, qui interdit la suppression des informations de gestion des droits d’auteur;
- La California Consumer Privacy Act;
- et d’autres lois donnant lieu à des actions en justice connexes.
Matthew Butterick déclare sur le site :
« C’est la première étape de ce qui sera un long voyage. Pour autant que nous le sachions, il s’agit du premier recours collectif aux États-Unis contestant la formation et la production de systèmes d’IA. Ce ne sera pas la dernière. Les systèmes d’IA ne sont pas exemptés de la loi. Ceux qui créent et exploitent ces systèmes doivent rester responsables. Si des entreprises comme Microsoft, GitHub et OpenAI choisissent de ne pas respecter la loi, elles ne devraient pas s’attendre à ce que nous, le public, restions les bras croisés. L’IA doit être juste et éthique pour tout le monde. »
Le 10 novembre dernier, un second recours collectif a d’ailleurs été déposé au nom de deux autres demandeurs.