Le Trouble Déficit de l’Attention avec ou sans hyperactivité ou TDAH est un trouble du neurodéveloppement, qui touche environ 6% des enfants d’âge scolaire et 3% des adultes. Mettre en place une prise en charge précoce est essentiel mais avant cela, il faut poser le diagnostic de TDAH. Une équipe composée de chercheurs du département de psychiatrie et de psychothérapie de l’enfant et de l’adolescent ainsi que de la section des neurosciences translationnelles du développement de l’Université Technique de Dresde a mené des travaux pour identifier le TDAH, l’étude intitulée « Training a machine learning classifier to identify ADHD based on real-world clinical data from medical records » a été publiée dans Nature, le 28 juillet dernier.
Chez l’enfant, le TDAH se manifeste par un trouble durable de l’attention associé ou non à de l’impulsivité ou/et de l’hyperactivité, il touche en moyenne 3 garçons pour une fille. Selon des études récentes, 50% des enfants atteints de TDAH seront guéris de ce trouble à l’âge adulte, ce qui a été prouvé par des scans cérébraux.
La plupart du temps, ce sont les enseignants qui conseillent aux parents de consulter. Le médecin traitant les dirige alors vers des spécialistes : neurologue, psychiatre pour enfant, neuropsychologue, pour confirmer le diagnostic TDAH et mettre en place un traitement.
Former un classificateur ML pour identifier le TDAH
Le diagnostic du TDAH est complexe et repose sur des critères sensibles aux biais subjectifs ce qui peut entraîner des retards importants dans l’initiation appropriée du traitement.
Une analyse automatisée reposant sur des mesures subjectives et objectives pourrait non seulement simplifier le processus de diagnostic et réduire le temps de diagnostic, mais aussi améliorer la reproductibilité. Des études récentes sur l’apprentissage automatique ont permis de distinguer les patients atteints de TDAH des témoins sains, cependant le processus clinique nécessite une différenciation entre ce trouble et d’autres affections psychiatriques.
Les chercheurs de l’Institut technique de Dresde ont formé un classificateur de machine à vecteurs de soutien linéaire (SVM) pour détecter les participants atteints de TDAH dans une population présentant un large éventail de troubles psychiatriques en utilisant des données anonymisées provenant de 299 dossiers cliniques, obtenant ainsi une précision de 66,1%.
Le SVM utilisant des caractéristiques uniques a montré de légères différences entre les caractéristiques et des écarts-types qui se chevauchent des précisions obtenues. Une sélection automatisée de fonctionnalités a permis d’obtenir les meilleures performances en utilisant une combinaison de 19 fonctionnalités.
La collecte des données
La collecte d’une quantité substantielle de données, bien que complexe, longue et coûteuse, est nécessaire pour distinguer si le TDAH sous-tend le modèle particulier de symptômes observés par opposition aux variantes normales du comportement, aux diagnostics différentiels possibles ou aux comorbidités survenant en plus du TDAH. Dans l’ensemble, ce processus diagnostique approfondi repose sur des critères très sensibles aux biais subjectifs et peut entraîner des retards dans l’initiation du traitement alors que des traitements efficaces pour le TDAH sont facilement disponibles.
Pour rationaliser, raccourcir et spécifier le processus de diagnostic, il est nécessaire d’identifier les aspects les plus pertinents des données qui prédisent le résultat du diagnostic, ce qui est possible grâce à l’application de techniques d’apprentissage automatique.
Des études précédentes basées sur des données cliniques et/ou de neuroimagerie ont effectué des classifications automatisées pour distinguer le TDAH et les individus en développement typique avec des précisions de classification allant de 62 à 89,5%. Cependant, avant celle de l’équipe de Dresde, aucune étude n’avait tenté d’appliquer l’apprentissage automatique afin de prédire si le diagnostic sera le TDAH ou « autre chose » (une variante standard du comportement ou un autre diagnostic psychiatrique) dans un large éventail de conditions cliniques.
Du fait des limites de fiabilité et validité des échantillons croisés ainsi que de sensibilité et de spécificité, la neuroimagerie ou les données génétiques ne font pas (encore) partie du processus de diagnostic de routine du TDAH. Les données comportementales et cliniques facilement accessibles, les informations démographiques, les évaluations subjectives des symptômes et les données neuropsychologiques objectives ont donc été utilisées. En effet, les données démographiques telles que le sexe masculin, l’apparition précoce sévère et les prédispositions familiales sont associés à un risque plus élevé de TDAH.
Les données provenaient des dossiers médicaux anonymisés du Département de psychiatrie et de psychothérapie de l’enfant et de l’adolescent de la Faculté de médecine de l’Université technique de Dresde de 2015 à 2020.
Résultats de l’étude
Les chercheurs ont pu différencier les enfants et les adolescents atteints de TDAH de ceux qui ne présentent pas ce trouble avec une précision de 66,1% en utilisant des données cliniques réelles provenant de dossiers hospitaliers. L’exclusion des caractéristiques démographiques (âge et sexe) a donné une précision comparable.
Une sélection automatisée utilisant une combinaison des 19 fonctionnalités les plus prédictives dans les domaines de l’attention et de l’intelligence et des évaluations des symptômes a été la plus performante, la précision pourrait être encore augmentée à l’aide d’ensembles de données sans données manquantes.
Selon les chercheurs, la précision la plus élevée obtenue dans une étude sur les patients atteints de TDAH et les personnes en bonne santé est de 89,5%. Bien qu’ils aient utilisé plus de fonctionnalités que cette étude, la précision résultante est plus faible, ils pensent que ce pourrait être dû au fait que de nombreuses personnes de leur échantillon ont reçu d’autres diagnostics associés à des symptômes qui peuvent faire penser au TDAH (tels que des déficits de l’attention dans la dépression, une activité accrue dans les troubles tic, …).
Les données multimodales (en particulier la neuroimagerie et les données génétiques) pourraient améliorer la reconnaissance des troubles psychiatriques grâce à l’apprentissage automatique.
Sources de l’article :
« Training a machine learning classifier to identify ADHD based on real-world clinical data from medical records »
https://www.nature.com/articles/s41598-022-17126-x