La langue peut révéler beaucoup sur notre santé : sa forme, sa texture, le fait qu’elle soit humide ou sèche et surtout sa couleur sont autant d’informations sur des maladies potentielles. Des chercheurs de l’Université Technique du Moyen-Orient en Irak, et de l’Université d’Australie du Sud (UniSA) ont utilisé le machine learning pour analyser les couleurs de la langue afin de prédire les maladies associées. Le système d’imagerie proposé dans leur étude a atteint une précision de 96,6 %.
Lorsqu’une personne est en bonne santé, sa langue est généralement de couleur rose avec un léger revêtement blanc. Diverses maladies peuvent modifier ces caractéristiques, par exemple :
- Une couche jaune sur la langue peut être signe de diabète. En cas de diabète de type 2, la langue peut devenir bleue avec un revêtement jaune ;
- Une langue violette avec un revêtement épais peut être un signe de cancer ;
- Lors des phases aiguës d’accident vasculaire cérébral (AVC), les patients peuvent présenter une langue rouge avec une forme inhabituelle ;
- Une langue blanche peut indiquer une anémie ou carence en fer ;
- Une langue jaune peut signaler une augmentation de la chaleur corporelle ou une maladie des organes hépatiques et biliaires ;
- Une langue de couleur indigo ou violette peut être signe de problèmes vasculaires ou gastro-intestinaux ;
- La langue peut apparaître rougeâtre avec des marques blanches lors d’une infection à helicobacter pylori ;
- Des modifications visibles peuvent apparaître à la surface de la langue en cas d’appendicite.
L’infection par le virus COVID-19 peut également influencer la couleur de la langue, la faisant apparaître légèrement rose dans les cas bénins, cramoisi dans les infections modérées, et rouge foncé (bordeaux) dans les cas graves, souvent accompagnée d’inflammation et d’ulcérations.
Grâce aux avancées des systèmes de vision par ordinateur et de l’IA, il est désormais possible de développer des systèmes automatisés pour analyser ces caractéristiques de manière plus précise et reproductible. Cette étude présente un nouveau système d’imagerie capable d’analyser et d’extraire les caractéristiques de couleur de la langue sous différentes conditions d’éclairage et de saturations de couleurs, permettant ainsi un diagnostic en temps réel des maladies associées.
Les chercheurs ont utilisé cinq modèles d’espace colorimétrique (RGB, YcbCr, HSV, LAB et YIQ) et six algorithmes d’apprentissage automatique pour prédire la couleur de la langue et, par extension, les maladies associées : Naïve Bayes (NB), Support Vector Machine (SVM), k-plus proches voisins (KNN), arbres de décision (DT), forêt aléatoire (RF) et Extreme Gradient Boost (XGBoost).
Collecte des données
Pour leur étude, les chercheurs ont tout d’abord utilisé un premier ensemble de données comprenant 5260 images de langue classées en sept catégories de couleurs (rouge, jaune, vert, bleu, gris, blanc, rose). Ces images ont été extraites dans différentes conditions de saturation et d’éclairage, 80% ont été utilisées pour l’entraînement des algorithmes d’apprentissage automatique et les 20% restants à des fins de test.
Le deuxième groupe de données comprenait 60 images anormales de la langue qui ont été collectées à l’hôpital universitaire Al-Hussein de Dhi Qar, en Irak, et à l’hôpital général de Mossoul à Mossoul de janvier 2022 à décembre 2023 pour tester le système d’imagerie proposé en temps réel. Ces images de la langue comprenaient des patients atteints de diverses affections, notamment le diabète, l’infection mycosique, l’asthme, le COVID-19, les papilles fongiformes et l’anémie.
Configuration expérimentale
Le système d’imagerie proposé se compose d’une webcam USB haute résolution connectée à un ordinateur portable exécutant MATLAB. Le patient s’assoit à 20 cm de la caméra, le système capture une image de la langue qui est analysée en temps réel. Une interface graphique (GUI), développée avec MATLAB App Designer, facilite cette analyse en affichant les valeurs de chaque teinte, la couleur identifiée, l’histogramme des couleurs, et les maladies potentielles associées.
Analyse d’images et algorithmes d’apprentissage
Après la capture de l’image, une méthode de segmentation a été utilisée pour isoler la région d’intérêt (ROI) de la langue, éliminant les éléments non pertinents comme les lèvres ou les dents. Les images sont ensuite converties des couleurs RGB vers les espaces YCbCr, HSV, LAB, et YIQ pour une analyse approfondie. Les données ainsi obtenues sont enregistrées en format CSV et ont servi de base pour l’entraînement des algorithmes d’apprentissage automatique.
Résultats
L’évaluation des différents algorithmes a montré que l’algorithme XGBoost offrait la meilleure précision, atteignant 98,71 %, suivi par les autres méthodes avec des précisions légèrement inférieures. Le Naive Bayes, bien qu’efficace, a montré la précision la plus faible à 91,43 %.
En se basant sur ces résultats, les chercheurs ont sélectionné l’algorithme XGBoost comme le classificateur principal du système d’imagerie et l’ont intégré à l’interface utilisateur graphique qui permet de prédire la couleur de la langue et les maladies correspondantes en temps réel.
Le système d’imagerie en temps réel utilisant XGBoost a donné des résultats positifs lors du déploiement avec une précision de diagnostic de 96,6 %.
Les chercheurs concluent :
“Ces résultats confirment la praticité des systèmes d’intelligence artificielle pour la détection de la langue dans les applications médicales, démontrant que cette méthode est sécurisée, efficace, conviviale, agréable et rentable”.
Ils notent toutefois que les réflexions de la caméra peuvent entraîner des différences dans les couleurs observées, affectant ainsi le diagnostic. Selon eux, les études futures devraient prendre en compte les réflexions de la caméra et utiliser de puissants processeurs d’image, des filtres et des approches d’apprentissage profond pour augmenter la précision. Cette méthode ouvre la voie à un diagnostic prolongé de la langue dans les futurs systèmes de santé au point de service.
Références de l’article
“Tongue Disease Prediction Based on Machine Learning Algorithms” Technologies 2024, 12(7), 97; https://doi.org/10.3390/technologies12070097
Auteurs et affiliations
Ali Raad Hassoon 1,2, Ali Al-Naji 1, Ghaidaa A. Khalid 1, Javaan Chahl 3
1 Electrical Engineering Technical College, Middle Technical University, Baghdad 10022, Irak
2 Al Hussein Teaching Hospital, Nasiriyah 64001, Irak
3 School of Engineering, University of South Australia, Mawson Lakes, SA 5095, Australie