Faciliter l’évaluation des effets toxiques de certaines substances chimiques est au coeur d’un nouvel outil informatique basé sur l’intelligence artificielle qu’ont développé des chercheurs de l’Inserm. Menés par Karine Audouze, au sein de l’unité 1124 “Toxicité Environnementale, Cibles Thérapeutiques, Signalisation Cellulaire et Biomarqueurs” (Inserm/Université de Paris), il permet d’identifier des effets toxiques du bisphénol S, substitut fréquent du bisphénol A dans les contenants alimentaires, à partir de données déjà publiées.
Plus largement, cet outil permettra de révéler des effets toxiques de n’importe quelle substance chimique (ou d’un agent physique) sous réserve qu’elle ait fait l’objet d’études publiées ou soit présente dans des bases de données. Les étapes de développement et d’utilisation de cet outil sont décrites dans Environmental Health Perspectives comme l’indique l’Inserm dans son communiqué.
L’intelligence artificielle permet désormais d’analyser de manière conjointe les bases de données et la littérature scientifique pour évaluer la toxicité d’une molécule chez l’homme. Cette « méta-analyse in-silico » est devenue possible grâce à un programme informatique conçu par Karine Audouze et ses collègues de l’unité Inserm UMR-S1124 (Toxicité Environnementale, Cibles Thérapeutiques, Signalisation Cellulaire et Biomarqueurs). Il a été validé par la recherche de toxicité du bisphénol S, un substitut fréquent du bisphénol A qui est un perturbateur endocrinien déjà interdit dans les contenants alimentaires.
En pratique, les chercheurs ont intégré plusieurs types de données biologiques et chimiques dans leur programme informatique dont les 2000 termes référencés dans la base AOP-wiki (AOP pour Adverse Outcome Pathways).
« Cette base est composée des descriptions précises de toutes les étapes biologiques (molécules, voies de signalisation) menant d’une perturbation moléculaire à un effet pathologique comme l’obésité, la stéatose, le cancer, etc. Elle s’enrichit régulièrement avec de nouveaux processus de toxicité », précise Karine Audouze.
Parallèlement, le bisphénol S ayant servi à tester ce programme, les auteurs ont intégré toutes les appellations et synonymes de ce constituant retrouvés dans la littérature scientifique. Ainsi équipé, le programme a scanné les résumés d’articles scientifiques soumis par les auteurs, à la recherche de ces termes pré-enregistrés.
« L’objectif était d’établir des liens entre les termes représentant la substance chimique et ceux correspondant aux processus pathologiques », clarifie Karine Audouze.
Pour cela, les chercheurs ont appris à leur système à lire intelligemment. Ainsi, le programme accorde plus de poids à des termes retrouvés côte à côte plutôt qu’éloignés, à ceux qui sont placés en fin de résumé dans les résultats et les conclusions plutôt qu’en début au stade de l’hypothèse, et enfin, en quantifiant les mots repérés.
« Au-delà d’une lecture rapide, le système permet une véritable analyse de texte automatisée ».
L’analyse a finalement révélé une corrélation entre le bisphénol S et le risque d’obésité qui a ensuite été vérifiée manuellement par les auteurs. Puis, pour augmenter encore les performances de leur outil, les auteurs ont également intégré les données biologiques issues de la base américaine ToxCast qui référence les effets de nombreux agents chimiques et physiques sur différents types cellulaires grâce à des analyses robotisées.
« Cette stratégie permet ainsi de suggérer des mécanismes associés à la toxicité découverte par le programme », explique Karine Audouze.
Les chercheurs ont ainsi constaté que le bisphénol S favorisait la formation d’adipocytes.
« Cet outil informatique peut être utilisé pour établir un bilan rapide des effets d’un agent chimique, ce qui est souhaitable s’il s’agit d’un substitut proposé pour une substance existante. Il n’apporte pas, en tant que tel, de preuve de toxicité, mais sert à intégrer rapidement un grand nombre d’informations et à hiérarchiser les effets néfastes les plus probables, permettant ainsi de concevoir les études biologiques et épidémiologiques les plus pertinentes », illustre Karine Audouze.
Cet outil est désormais libre d’accès sur la plateforme GitHub. Tout chercheur désireux de tester la toxicité d’un agent peut l’utiliser en développant un dictionnaire propre à cet agent.
Ce projet a été financé par le programme de recherche européen sur la biosurveillance humaine, HBM4EU.