Après avoir eu recours à l’intelligence artificielle pour la publication en open data des décisions de justice, la Cour de cassation décide de l’utiliser à nouveau pour détecter les divergences de jurisprudences entre les différents tribunaux et vérifier si la justice rendue est la même pour tous. Dans cet objectif, elle a fait appel aux experts scientifiques du Lab IA, rattaché à Etalab au sein de la Direction interministérielle du numérique (Dinum), notamment à l’équipe-projet ALMAnaCH d’INRIA. Ceux-ci ont présenté leurs travaux dans l’article “Complex Labelling and Similarity Prediction in Legal Texts: Automatic Analysis of France’s Court of Cassation Rulings” publié sur la plateforme en ligne HAL.
La Cour de cassation est la plus haute juridiction de l’ordre judiciaire français, elle a pour mission de contrôler l’exacte application du droit par les tribunaux et les cours d’appel, garantissant ainsi une interprétation uniforme de la loi.
Pour rappel, le Ministère de la justice a abandonné en début d’année le projet Datajust, visant la création d’un référentiel officiel d’indemnisation, grâce à l’analyse de la jurisprudence en matière de préjudices corporels
Comparer des centaines de milliers de décisions
Tandis que la masse de données s’accroît au fur et à mesure des décisions rendues par la justice, la Cour de cassation doit identifier, parmi les décisions que rendent ses six chambres, des interprétations contradictoires d’une même question juridique ou d’une même loi. Ce travail de détection, long et fastidieux, est réalisé manuellement par les juristes de la Cour qui ont de solides compétences d’analyse juridique mais aussi une parfaite maîtrise de la loi et de la jurisprudence.
Ils doivent tout d’abord détecter les cas similaires, en s’appuyant sur des versions résumées des décisions (synthèses et séquences de mots clés), également produites manuellement et ne sont d’ailleurs pas disponibles pour toutes les décisions. Il existe également un degré élevé de variabilité dans les choix de mots-clés et le niveau de granularité utilisé.
La Cour de cassation a décidé de se tourner vers l’IA pour analyser les centaines de milliers de décisions et détecter l’intégralité des divergences.
Identifier les divergences de jurisprudences grâce à l’IA
Créé en 2019, le Laboratoire pour l’intelligence artificielle (Lab IA) accompagne les administrations dans le déploiement de leurs projets IA en coopérant avec les chercheurs d’Inria. Ioana Manolescu, sa directrice scientifique, met ainsi en relation les projets sélectionnés et les experts scientifiques.
Les membres de l’équipe-projet ALMAnaCH : Benoît Sagot, Rachel Bawden, spécialistes du traitement automatique des langues (TAL) et Thibault Charmet, ingénieur, ont collaboré étroitement avec les experts juristes et les data scientists de la Cour de cassation, pour ce projet.
L’identification de décisions de justice similaires peut s’automatiser dès lors que l’on sait mesurer automatiquement la similarité entre deux décisions, les chercheurs ont donc décidé d’associer deux à deux des arrêts sur une base de 80 000 arrêts.
Dans ce but, ils ont développé un modèle de prédiction de titrages à partir des sommaires. Ils ont attribué un titrage aux décisions qui n’en avaient pas, puis ils ont fourni des titrages supplémentaires à toutes les décisions, partant de l’hypothèse que cela faciliterait l’identification de paires de documents similaires. Pour produire ces titrages automatiquement, ils ont modélisé la prédiction de titrages à partir des sommaires comme une tâche de traduction automatique.
Rachel Bawden, chargée de recherche chez Inria depuis 2020 dans l’équipe-projet ALMAnaCH, commente :
“valider l’adaptation de technologies de traduction automatique à d’autres types de données et à d’autres tâches répondant à des besoins de la Cour, a été vraiment intéressant et ouvre des perspectives pour d’autres projets dans d’autres domaines comme la finance ou la biomédecine.”
Une approche pertinente
Les scientifiques ont demandé aux juristes de la Cour de faire le même travail que leur algorithme après avoir défini avec eux une hiérarchie de niveaux de similarités. Les expériences menées ont non seulement démontré que l’approche automatique donnait des résultats similaires aux jugements des experts, mais aussi que les titrages supplémentaires renforçaient ces similitudes.
La collaboration avec la Cour de cassation se poursuit, afin de finaliser des modèles semi-automatiques pour faciliter la rédaction de titrages par les experts. Du côté de la Cour de cassation, ces modèles finaux vont être intégrés dans les workflows de la Cour prochainement, les membres de l’équipe-projet ALMAnaCH, quant à eux, sont prêts à renouveler l’expérience avec d’autres structures publiques.
Références :
Auteurs :
Thibault Charmet, Benoît Sagot, Rachel Bawden, équipe-projet ALMAnaCH, Inria.
Ines Cherichi, Matthieu Allain, Urszula Czerwinska, Amaury Fouret, Cour de cassation.