L’Initiative Chan Zuckerberg (CZI) a récemment annoncé le financement et la construction de l’un des plus grands systèmes informatiques dédiés à la recherche en sciences de la vie à but non lucratif. Equipé d’un cluster HPC de plus de 1 000 GPU, il sera utilisé pour développer des modèles prédictifs de cellules saines et malades. CZI les mettra à disposition de la communauté scientifique, ouvrant ainsi la porte à de nouvelles découvertes révolutionnaires dans le domaine de la biologie et de la médecine.
L’Initiative Chan Zuckerberg a été fondée en 2015 par Mark Zuckerberg et son épouse Priscilla Chan afin d’aider à résoudre certains des défis les plus difficiles de la société, pour bâtir un avenir plus inclusif, juste et sain pour tous.
Elle a l’espoir de guérir, prévenir ou gérer toutes les maladies d’ici la fin du siècle et soutient la science en développant des outils logiciels open source, en finançant la recherche mondiale et en créant des instituts de recherche interdisciplinaires : les instituts CZ Science.
L’IA générative et la biomédecine
Certains systèmes d’IA ont déjà apporté des contributions significatives à l’étude de la biologie humaine à l’instar d’AlphaFold, développé par DeepMind pour prédire avec précision des modèles 3D de structures protéiques à partir de leurs séquences d’acides aminés, qui a révolutionné la recherche en protéomique. ESM de Meta en a ensuite amélioré les performances.
Cependant, pour soutenir ces modèles de plus en plus puissants, un calcul haute performance (HPC) est nécessaire, ce qui nécessite des investissements massifs dans les GPU. Actuellement, le coût de cette infrastructure est prohibitif pour de nombreuses organisations, en particulier les universités.
En finançant la création d’un cluster GPU de pointe, CZI permettra d’accélérer la recherche en science de la vie.
Mark Zuckerberg assure :
“L’IA crée de nouvelles opportunités en biomédecine, et la construction d’une grappe de calcul haute performance dédiée à la recherche en sciences de la vie accélérera les progrès sur d’importantes questions scientifiques sur le fonctionnement de nos cellule. Le développement de modèles numériques capables de prédire tous les types et états cellulaires à partir du génome aidera les chercheurs à mieux comprendre nos cellules et leur comportement en matière de santé et de maladie”.
Priscilla Chan ajoute :
“Les modèles d’IA pourraient prédire comment une cellule immunitaire réagit à une infection, ce qui se passe au niveau cellulaire lorsqu’un enfant naît avec une maladie rare, ou même comment le corps d’un patient réagira à un nouveau médicament. Nous espérons que cet effort de collaboration générera de nouvelles connaissances sur les caractéristiques fondamentales de nos cellules”.
Des ensembles de données massifs
Les modèles prédictifs développés dans le cadre de cette initiative seront formés sur d’immenses ensembles de données, y compris ceux intégrés dans l’outil logiciel Chan Zuckerberg CELL by GENE (CZ CELLxGENE), qui détient le plus grand corpus d’ensembles de données monocellulaires standardisés, avec plus de 50 millions de cellules.
D’autres sources de données proviennent des instituts de recherche CZ Science telles que l’atlas de localisation et d’interaction des protéines OpenCell et l’atlas cellulaire Tabula Sapiens, construit par le Chan Zuckerberg Biohub San Francisco, un groupe d’instituts de recherche à but non lucratif.
De grands ensembles de données d’imagerie de l’Institut Chan Zuckerberg pour l’imagerie biologique avancée (CZ Imaging Institute) seront également inclus, ainsi que des ensembles de données accessibles au public.
Stephen Quake, responsable scientifique de CZI, conclut :
“Le développement d’un simulateur de biologie virtuel est une évolution naturelle de notre travail scientifique au cours des sept dernières années. Nous avons aidé des chercheurs à générer et à annoter des ensembles de données normalisés et représentatifs, construit des outils pour intégrer ces ensembles de données et les rendre largement disponibles – et, par l’intermédiaire de nos instituts scientifiques, nous avons construit un nouveau modèle pour le type de collaboration nécessaire pour entreprendre cette vision ambitieuse de la construction de modèles cellulaires prédictifs. CZ Science utilise de nombreux outils d’IA dans ses recherches depuis des années, et cette orientation unifiera nos efforts collectifs pour créer une ressource à l’échelle du domaine pour mieux comprendre les cellules et les systèmes cellulaires”.
Grâce à l’engagement et à la vision de CZI ainsi qu’à l’apport de l’IA générative, la recherche en sciences de la vie s’apprête à franchir une nouvelle frontière, offrant des perspectives prometteuses pour une compréhension plus approfondie des cellules et des systèmes cellulaires.