Au quotidien, les acteurs du monde de la santé engrangent, compilent et manipulent un nombre conséquent de données. Avec pour objectif de mieux exploiter les données pour comprendre les pratiques, la Haute Autorité de santé lance une stratégie autour de l’usage des données sur la période 2021-2024. La feuille de route comprend quatre axes principaux : mieux maitriser le patrimoine de données de la HAS, mieux exploiter les données en santé pour suivre les pratiques, outiller le traitement des connaissances textuelles, s’intégrer à l’écosystème des données en santé et social.
Mieux maitriser le patrimoine de données de la HAS
Le premier point concerne une meilleure utilisation des données de la HAS comme les résultats de certification des établissements de santé, d’évaluation des établissements et services sociaux ou médico-sociaux ou les avis rendus sur les produits de santé. La culture de la donnée sera développée au sein de l’institution et les acteurs de la HAS seront formés pour acquérir des compétences qui serviront de base à l’ensemble de la stratégie.
Une plateforme data sera créée afin de traiter automatiquement les données sources et de les analyser pour des études ponctuelles puis de les diffuser au travers de nouveaux outils et usages. La base de données derrière le site Scope santé va subir une refonte, un nouvel outil (projet Adex)sera développé pour rechercher et sélectionner des experts extérieurs, et des données seront analysés pour concevoir la future plateforme d’habilitation des organismes en charge de l’évaluation des établissements et services sociaux ou médico-sociaux.
Pierre-Alain Jachiet, responsable de la stratégie data à la HAS, précise les enjeux de ce premier axe :
“L’enjeu est d’avoir une excellente maitrise de notre patrimoine de données, de savoir le gérer informatiquement et de pouvoir l’exploiter pour différents usages : analyses, tableaux de bords, datavisualisations, etc. Nous allons avancer brique par brique, en mettant en place plusieurs projets qui nous permettront in fine de construire cette plateforme.”
Mieux exploiter les données en santé pour suivre les pratiques
Le second axe se concentre sur les données “observationnelles”. Ce sont les données issues de la pratique courante, et non d’études cliniques. Pierre-Alain Jachiet les évoque tout en explicitant les futurs travaux qui seront menés autour d’elles :
“Elles sont utiles pour contextualiser nos travaux, en connaissant mieux l’usage des traitements étudiés ou de leurs comparateurs, les populations de patients concernés, etc. Nous pourrons davantage les utiliser pour alimenter nos productions, en complément de la littérature et des dires d’experts. Elles sont enfin essentielles pour l’évaluation des pratiques, ainsi que pour suivre les impacts de nos recommandations sur les pratiques. Nous allons commencer par des éléments simples, comme un portail de requête sur l’open data publié par l’Assurance maladie à partir du système national des données de santé (SNDS). À terme, l’enjeu est de savoir impulser les études observationnelles dont nous avons besoin et de développer un regard critique approfondi sur celles qui nous sont soumises.”
Outiller le traitement des connaissances textuelles
Ce troisième axe s’intéresse à l’exploitation des connaissances textuelles. L’utilisation du traitement automatisé du langage est dans le viseur de la HAS comme l’évoque Pierre-Alain Jachiet dans ses propos :
“La HAS manipule et produit beaucoup de connaissances sous forme de textes. Aujourd’hui, tout ce travail se fait sans outillage particulier, ou ne se fait pas lorsque le volume est trop grand. Il est important de créer des outils pour assister l’analyse de textes.”
Le projet e-Satis par exemple, porte sur les commentaires laissés par les patients après leur hospitalisation pour mieux prendre en compte les sujets qui importent aux usagers du système de soins. Durant l’automne 2021, un hackathon sera organisé pour prototype de nouveaux usages sur les textes de l’ensemble des productions de la HAS.
S’intégrer à l’écosystème des données en santé et social
Le dernier axe se tourne vers l’intégration à l’écosystème des données en santé et sa structuration en interne comme en externe. La donnée est un sujet éminemment transverse et collaboratif. Il est essentiel, pour la HAS, de structurer le sujet en interne (échanges, formations…) et de s’intégrer au réseau des acteurs produisant et utilisant les données en santé et social : la HAS considère qu’elle a un rôle important à y jouer en tant qu’autorité scientifique indépendante.
Pierre-Alain Jachiet précise :
“Malgré la haute confidentialité des données considérées, il est crucial d’identifier ce qui est mutualisable en termes d’outils, de données et de méthodes.”
Pour réussir à mettre en place ces quatre axes, la HAS a recruté pour renforcer son réseau d’experts data : Pierre-Alain Jachiet comme responsable de la stratégie, Matthieu Doutreligne qui réalise un doctorat en cotutelle avec l’Institut national de recherche en informatique et en automatique (Inria) sur l’utilité des entrepôts de données de santé pour mesurer des effets de traitement, Timothée Chehab comme ingénieur en charge de la plateforme donnée de la HAS, Thibault Ledieu comme ingénieur spécialiste des données massives en santé et prochainement et Pavel Soriano comme responsable data science spécialiste du traitement automatique du langage.