En novembre 2023, l’ONG Reporters sans frontières (RSF) et l’Alliance de la presse d’information générale (Apig) annonçaient collaborer dans le cadre du projet "Spinoza" dans l'objectif de développer une IA générative open source dédiée aux journalistes. Ce 10 février, alors que le Sommet pour l'Action sur l'IA IA ouvre ses portes au Grand Palais, les 2 partenaires publient le rapport “SpinozIA, vers un journalisme augmenté et éthique”, présentant les observations et conclusions de l’expérimentation du projet.
Le projet Spinoza avait pour but de “développer un outil d’intelligence artificielle, par et pour les journalistes, qui garantit la propriété intellectuelle des médias sur leurs publications” tout en étant “au service d’une information fiable et d’un journalisme de confiance”.
Initié par RSF, il a été lancé en octobre 2023 avec 120 médias volontaires membres de l'Alliance issus de 12 entreprises de presse : Actu.fr, EBRA, L’Équipe, La Nouvelle République, La Provence, Le Télégramme, Libération, l’Union, Nice-Matin, PMSO, Sogemedia et Sud Ouest.
L'idée n'était pas de démontrer que la GenAI peut remplacer le métier de journaliste, mais qu'elle peut l'enrichir avec des données fiables. Le prototype réalisé avec Ekimetrics, une société experte en IA et data science, vise à améliorer la recherche documentaire et la reformulation des données pour le traitement médiatique du changement climatique et de la transition écologique.
Exploitant le modèle de langage GPT 3.5 d'OpenAI et un algorithme d’embedding (un moteur de recherche qui explore les textes à la recherche de termes au sens proche de la question posée), en mars 2024, il était alimenté par 12 000 articles de presse, par des rapports scientifiques du Groupe d'experts intergouvernemental sur l’évolution du climat (GIEC), des textes de lois français, des rapports de l’Agence de l’Environnement et de la Maîtrise de l’Énergie (ADEME) ainsi que des documents tirés de la stratégie nationale bas-carbone du gouvernement français.
Grâce notamment aux données issues de l’Agence France-Presse (AFP), qui a rejoint le projet en juillet 2024, le jeu de données journalistiques, qui a également été enrichi avec des données régionales, contient aujourd'hui 28 450 articles publiés par la presse française depuis 2022. Il permet de combler les lacunes des autres sources, comme les rapports scientifiques souvent limités à des régions spécifiques ou inversement décrivant des phénomènes à une échelle très large.
Ce travail collaboratif a démontré la complémentarité et la richesse des contenus journalistiques avec les autres sources de données et leur intérêt pour les outils d’IA générative.
Toutes les informations transmises par l’outil sont sourcées, afin que le journaliste puisse les tracer et les vérifier.
SpinozIA, vers un journalisme augmenté et éthique
Le rapport, outre la méthode suivie par l’équipe du projet Spinoza, présente une étude sur la perception de l’IA générative par les journalistes.Le questionnaire, conçu avec l’agence Econovia pour qualifier le rapport des journalistes à l’IA générative, a interrogé un panel de 281 journalistes exerçant en France. Il a permis de constater que malgré les craintes liées à l'utilisation de la GenAI telles que la perte de contrôle sur le traitement éditorial, la désinformation ou l’impact potentiel de l’IA sur les conditions de travail, les journalistes associent l'IA générative avec un gain de productivité.
D'ailleurs, 45 % des journalistes français interrogés l'utilisent déjà dans leur pratique professionnelle et 93 % envisagent de l’utiliser notamment pour :
• traduire des documents ;
• générer une retranscription d’entretien ;
• synthétiser des informations ;
• reformuler du texte ;
• générer des résumés d’article.
L'étude souligne également que les journalistes prennent conscience qu’ils ont un rôle à jouer dans le développement de l’IA : 86 % considèrent qu’ils sont les mieux placés pour garantir un usage encadré et responsable de ces outils dans la sphère de l’information journalistique.
Les recommandations de Reporters sans frontières
L'ONG adresse, dans ce rapport, dix recommandations aux médias pour poser le cadre éthique et technique nécessaire pour garantir l’intégrité de l’information dans les systèmes d’IA utilisés en journalisme :- Encadrer les usages et pratiques de l’IA dans les rédactions sur la base de références éthiques ;
- Développer des extensions du projet Spinoza et les partager auprès de la communauté journalistique afin de permettre leur audit par des tiers ;
- Initier des projets collaboratifs de développement d’outils d’IA entre médias ;
- Respecter le droit voisin des éditeurs de presse et le droit d’auteur des journalistes ;
- Mobiliser les méthodes de travail journalistique dans la conception des systèmes génératifs et nommer des responsables éditoriaux ;
- Maintenir à jour les bases de données utilisées dans les outils d’IA générative, s’assurer de leur fiabilité ;
- Tracer l’origine de toutes les sources utilisées dans les bases de données ;
- Adapter les prompts à chaque base de données ;
- Définir les prompts de manière collaborative ;
- Rester indépendants dans l’usage des LLMs.
Thibaut Bruttin, Directeur général de RSF, conclut :
“RSF a à cœur d’ouvrir une voie éthique et responsable, où l’innovation n’implique pas la marginalisation du journalisme. Le projet Spinoza permet cela, en réaffirmant le rôle central des rédactions dans la sélection, la hiérarchisation et la production de contenus de qualité, et l’indiscutable valeur ajoutée des contenus journalistiques dans les systèmes d’intelligence artificielle. Les journalistes et les éditeurs ont le pouvoir de réinventer le journalisme, à condition de lui redonner une souveraineté technologique. Saluons ici l’engagement de l’Alliance, de sa direction et de ses membres, qui ont témoigné de l’intérêt pour ce projet.”