Des chercheurs munichois développent des méthodes d’IA pour la recherche biomédicale de nouvelle génération

La compilation et l’analyse de nombreuses bases de données sont essentielles à la recherche biomédicale. Pour développer de nouvelles thérapies ou stratégies de prévention des maladies, les scientifiques ont de plus en plus besoin de données de meilleure qualité. Cependant, la qualité est très variable et l’intégration de différents ensembles de données s’avère très compliqué. Le Computational Health and Fitness Heart de Helmholtz Munich, un des plus grands centres de recherche européens sur l’intelligence artificielle dans les sciences médicales a collaboré avec l’Université Technique de Munich (TUM), pour découvrir des alternatives à ces problèmes et permettre des innovations médicales pour une société plus saine. Ils ont présenté trois de celles-ci dans la revue Méthodes Naturelles.

Le Computational Health and Fitness Heart de Hemlotz développe de nouveaux outils informatiques alimentés par l’IA pour accélérer la découverte et la traduction. Pour cela, il développe des algorithmes prédictifs ainsi que des modèles mécanistes pour analyser les données moléculaires, d’imagerie et cliniques de la santé et des maladies humaines. Il coopère ainsi à créer des diagnostics innovants et de nouveaux traitements pour les maladies déclenchées par l’environnement. L’Université Technique de Munich, une des premières universités d’Allemagne a avoir été nommée université d’excellence, s’engage pour une recherche et innovation centrées sur l’humain.

La recherche basée sur la génomique unicellulaire

Fabian Theis, directeur scientifique du Hemlotz AI et professeur de modélisation mathématique des systèmes biologiques à la TUM, a déclaré :

« Ces 4 semaines ont été folles, avec beaucoup de nos histoires et méthodes scientifiques qui se sont concrétisées dans la même fenêtre temporelle. Nos groupes de recherche se concentrent sur l’utilisation de la génomique unicellulaire pour comprendre l’origine de la maladie de manière mécaniste – pour cela, nous exploitons et développons des approches d’apprentissage automatique pour mieux représenter ces données complexes. Dans les trois nouveaux articles, nous avons travaillé respectivement sur l’intégration de données à cellule unique, l’apprentissage de trajectoire et la résolution spatiale. Outre les applications présentées dans les articles, nous prévoyons de soutenir la prochaine génération de recherche sur les cellules uniques vers la compréhension des maladies. »

Voici les dernières solutions développées par Helmholtz Munich et les chercheurs du TUM :

Analyse comparative de l’intégration de données au niveau de l’atlas en génomique unicellulaire

Pour savoir si une observation faite dans un seul ensemble de données peut être généralisée, il faut vérifier si la même chose peut être observée dans d’autres ensembles de données du même système. Dans les données à cellule unique, les effets dits de lot compliquent la combinaison des ensembles de données de cette manière. Il y a des différences entre les profils moléculaires dans les échantillons car ils ont été générés à un moment différent, dans un endroit différent ou à partir d’une personne différente. Surmonter ces effets est un défi central en génomique unicellulaire avec plus de 50 solutions proposées.

Un groupe de chercheurs autour de Malte Lücken a soigneusement organisé 86 ensembles de données et comparé 16 des méthodes d’intégration de données les plus populaires sur 13 tâches. Après plus de 55 000 heures de temps de calcul et une évaluation détaillée de 590 résultats, ils ont construit un guide pour une intégration optimisée des données. Cela permet d’améliorer les observations sur les processus pathologiques dans les ensembles de données à l’échelle de la population.

CellRank pour la cartographie dirigée du destin unicellulaire

De nombreuses questions en biologie tournent autour de processus continus comme le développement ou la régénération. Si un séquençage d’ARN unicellulaire permet de mesurer l’expression des gènes, c’est cependant une méthode destructrice pour les cellules et les scientifiques n’obtiennent que des instantanés statiques. En outre, même si de nombreux algorithmes ont été développés pour reconstruire des processus continus à partir d’instantanés de l’expression des gènes, ils n’apprennent rien aux chercheurs sur la direction du processus.

Pour remédier à ces problèmes, Marius Lange et ses collègues avaient développé l’algorithme CellRank qui estime les trajectoires dirigées de l’état cellulaire en combinant les approches de reconstruction précédentes avec la vitesse de l’ARN, un concept permettant d’estimer la régulation à la hausse ou à la baisse des gènes. Dans les applications in vitro et in vivo, CellRank a correctement déduit les résultats du devenir et récupéré des gènes précédemment connus.

Lors d’un exemple de régénération pulmonaire, CellRank a prédit de nouveaux états cellulaires intermédiaires sur une trajectoire de dédifférenciation dont l’existence a été validée expérimentalement. CellRank est un progiciel open source qu’utilisent des biologistes et des bioinformaticiens du monde entier pour analyser des dynamiques cellulaires complexes dans des situations telles que le cancer, la reprogrammation ou la régénération.

Squidpy : un cadre évolutif pour l’analyse spatiale en omique

De nouvelles technologies pour mesurer la variation de l’expression génique dans les tissus voient le jour qui permettent aux scientifiques d’envisager les cellules dans leur contexte, pour ainsi étudier les principes de l’organisation tissulaire et de la interaction cellulaire. Giovanni Palla, Hannah Spitzer et leurs collègues ont développé un nouveau cadre de calcul, appelé Squidpy qui permet aux analystes et aux développeurs de gérer les données d’expression spatiale des gènes. Squidpy fournit une infrastructure efficace et de nombreuses méthodes d’analyse qui permettent de stocker, de manipuler et de visualiser efficacement les données spatiales omiques. En outre, il est extensible et peut être interfacé avec une variété d’outils d’apprentissage automatique dans l’écosystème python. Des scientifiques du monde entier l’utilisent déjà pour analyser des données moléculaires spatiales.

sources de l’article :

Lücken et al. 2021 : Analyse comparative de l’intégration de données au niveau de l’atlas en génomique unicellulaire. Méthodes naturelles DOI : 10.1038/s41592-021-01336-8.

Lange et al. 2022 : CellRank pour la cartographie dirigée du destin unicellulaire. Méthodes naturelles DOI : 10.1038/s41592-021-01346-6.

Palla, Spitzer et al. 2022 : Squidpy : un cadre évolutif pour l’analyse spatiale en omique. Méthodes naturellesDOI : 10.1038/s41592-021-01358-2.

Recevez gratuitement l'actualité de l'intelligence artificielle

Suivez la Newsletter de référence sur l'intelligence artificielle (+ de 18 000 membres), quotidienne et 100% gratuite.


Tout comme vous, nous n'apprécions pas le spam. Vos coordonnées ne seront transmises à aucun tiers.
Partager l'article
intelligence artificielle
À PROPOS DE NOUS
Le portail francophone consacré à l'intelligence artificielle et à la datascience, à destination des chercheurs, étudiants, professionnels et passionnés.