L’Intelligence Artificielle au service de la santé : «CLEAR» est un projet d’assistant personnel médical pour faciliter l’échange et la compréhension d’informations entre les médecins et leurs patients.
Synapse Développement, spécialiste de l’Intelligence Artificielle appliquée aux textes, lance CLEAR, un projet de R&D mené en partenariat avec :
- Le CNRS (délégations Nord Pas-de-Calais et Picardie et Ile de France Sud)
- L’université Paris Nord – Paris 13
- L’association Française des Hémophiles
Sélectionné par l’Agence nationale de la recherche (ANR) dans le cadre de l’appel à projets intitulé «AAP GENERIQUE 2017», CLEAR est la contraction de « Communication, Literacy, Education, Accessibility, Readibility ». Projet ambitieux de 3 ans, il entend proposer des méthodes innovantes pour la création d’un prototype logiciel dédié à la simplification des textes médicaux en français.
Le développement de ces méthodes est le résultat d’un projet de recherche Chistera mené avec des partenaires académiques de renom et Airbus Innovation Works. Cette IA évoluera pour répondre aux ambitions du projet CLEAR.
Camille Pradel, responsable R&D chez Synapse Développement explique :
“Depuis sa fondation en 1994, Synapse Développement a développé des ressources lexicales très riches et des méthodes déterministes (application d’heuristiques le plus souvent écrites à la main) exploitant ces ressources. Nous mettons en oeuvre depuis quelques années des approches de machine learning et de deep learning pour enrichir ces briques technologiques d’origine, les rendant plus robustes, résilientes et versatiles.
Par exemple, les ressources lexicales génériques peuvent être complétées par des représentations vectorielles de mots apprises sur des corpus spécifiques à un domaine avec des méthodes statistiques issues de la sémantique distributionnelle (Word2Vec, FastText). Ainsi, l’IA obtenue exploite les ressources symboliques pour le raisonnement et les ressources statistiques pour interpréter des termes spécifiques (comme ceux du vocabulaire spécifique à la recherche médicale dans le cas du projet CLEAR).
De même, les chaînes de traitement déterministes se voient complétées par des modèles statistiques issus de l’analyse de textes annotés ou non. Par exemple, pour la reconnaissance d’entités nommées, nous disposons d’un premier modèle exploitant des patrons lexicaux syntaxiques écrits par nos ingénieurs linguistes. Ce premier modèle présente une très bonne précision mais un rappel améliorable (c’est-à-dire qu’il se trompe très rarement lorsqu’il identifie une entité nommée mais qu’il en rate assez souvent).
Pour améliorer ce rappel, les patrons écrits à la main peuvent être complétés par des patrons extraits automatiquement par text mining (classifieur d’entropie maximale) sur des exemples annotés. Dans les cas où nous disposons d’un grand nombre d’annotations, nous pouvons construire un troisième modèle utilisant des champs aléatoires conditionnels (CRF) pour détecter les entités en tirant parti de nos représentations de mots. Ainsi, lors des traitements métiers que nous effectuons pour CLEAR, les sorties de chacun des modèles peuvent être combinées”.
Ce prototype pourra prendre la forme d’un assistant personnel disponible sur une application que les patients seront en mesure d’installer sur leur smartphone. Le projet entend doter l’application de capacités intéressantes grâce aux apports de l’Intelligence Artificielle. Elle saura ainsi :
- Orienter les recherches sur les besoins des patients ;
- Faire face aux données massives, non structurées et hétérogènes ;
- Adapter les méthodes de traitement automatique du langage naturel (TALN) au domaine
médical ; - Créer une base de connaissances pour l’explicitation des termes médicaux en français.
In fine, CLEAR offrira des ressources pouvant être exploitées par les médecins pour améliorer leurs interactions avec les patients. Les patients, quant à eux, pourront bénéficier d’un meilleur accès aux connaissances sur leur pathologie et son traitement, afin de mieux appréhender leur maladie au quotidien.