Aujourd’hui, les enquêteurs récoltent de très nombreux documents, ce qui rend leur exploitation toujours plus ardue. L’intelligence sémantique est la solution pour aider à structurer les informations rapidement. Mais encore faut-il que les utilisateurs aient confiance en cette technologie…
L’IA sémantique s’intéresse à l’extraction d’informations structurées à partir de données non structurées, que ce soient des textes ou de la parole, afin de comprendre le sens des propos au-delà des mots. Ainsi, une information exprimée de différentes manières aura une seule et même représentation. Cependant, pour que l’IA sémantique apporte réellement des bénéfices à l’enquêteur, elle doit tout d’abord s’assurer que les utilisateurs font confiance à cette technologie.
L’IA sémantique, une technologie à deux visages
L’intelligence sémantique utilise deux approches différentes : l’IA connexionniste, basée sur des méthodes telles que le machine learning et les réseaux de neurones, qui a l’avantage d’être disponible assez rapidement pour les langues les plus répandues et est très performante pour les tâches de reconnaissance de formes telles que le rapprochement de comportements semblables ; et l’IA symbolique, qui utilise des systèmes à base de règles et demande des temps de mise au point plus importants, mais ne nécessite pas de gros corpus et permet de conserver le lien vers la source des informations extraites.
Une intelligence sémantique de confiance by design
Pour garantir à la fois une confiance dans l’outil et une rapidité de mise au point, chez Deveryware, nous adoptons une approche hybride qui allie l’IA connexionniste pour accélérer le temps de mise au point du système et l’IA symbolique qui permet un travail sur des corpus restreints et un suivi précis de la source des informations extraites ainsi que des raisonnements utilisés.
Dans un domaine aussi sensible que les enquêtes judiciaires, proposer un outil sous forme d’une boîte noire qui effectuerait tout le travail automatiquement se heurte à de nombreuses contraintes en termes de légalité, de qualité de résultats, de traçabilité et donc de confiance. Nous proposons donc plutôt des aides sous la forme de différents outils dont les enquêteurs comprennent le fonctionnement, et qu’ils peuvent utiliser selon leurs besoins. L’outil principal d’extraction sémantique permet, selon des critères définis par l’utilisateur, de mettre en exergue les documents qui contiennent le plus d’informations intéressantes, afin qu’il traite en priorité ceux-ci, avant de traiter les autres documents. Cela permet, lorsque le temps de l’enquête est contraint, comme dans le cadre d’une garde à vue, de trouver rapidement les éléments pertinents. L’avantage également est que l’utilisateur peut choisir de « valider » les informations extraites comme étant correctes afin de générer une représentation structurée des informations garantissant ainsi que l’enquêteur n’oublie aucune information qu’il a rencontrée.
Co-construire des raisonnements de confiance
Connaissant l’origine des informations extraites, l’utilisateur peut ensuite, grâce à l’intelligence sémantique, obtenir des représentations graphiques telles que des graphes de relations, des frises chronologiques, des projections sur des cartes. Il peut également comparer ces informations avec d’autres informations structurées telles que des bases de données, les relevés de position GPS, etc., assurant ainsi une vue globale des éléments de l’enquête.
L’intelligence sémantique hybride, telle que proposée par Deveryware, est un vrai support aux enquêtes judiciaires permettant d’accélérer le processus d’extraction et de structuration des informations pertinentes, tout en conservant la transparence quant à leurs sources, pour promouvoir une IA digne de confiance.
Cette contribution d’Aurélie Pradelles entre dans le cadre de notre dossier sur l’IA et la sécurité paru dans le n°9 du magazine ActuIA, disponible en kiosque et en ligne.