Ce lundi 4 décembre, Google a dévoilé DeepVariant, un outil utilisant l’intelligence artificielle. Il peut être utilisé pour améliorer la précision du séquençage du génome.
La santé, un secteur porteur
Après deux ans de recherche, la Google Brain team, en collaboration avec Verify Life Sciences, a dévoilé DeepVariant. L’outil est désormais disponible en open source sur GitHub. Mark DePristo et Ryan Poplin, de Google Brain ont expliqué :
“DeepVariant est la première de nombreuses contributions qui utilisent l’infrastructure informatique de Google et le machine learning pour mieux comprendre le génome et fournir à la communauté des outils de génomique basés sur le deep learning“.
L’intelligence artificielle intéresse de plus en plus les hôpitaux, centres de formation médicale, compagnies d’assurance ou encore organisations liées à la santé. Les avancées, notamment en matière de gain de temps que de précision, que pourraient fournir les systèmes intelligents sont en passe de révolutionner le secteur et les pratiques. Informatique cognitive et machine learning sont en effet considérés comme fondamentaux pour la médecine du futur.
Séquençage du génome, médecine de précision ou encore diagnostic et traitement, de nombreuses start-ups mais aussi géants tels qu’IBM ou Microsoft développent des projets dans le domaine de la santé.
L’outil DeepVariant et Google Cloud Platform
En améliorant la précision du séquençage, DeepVariant répond à l’un des enjeux majeurs de la médecine de précision. Mark DePristo et Ryan Poplin ont expliqué que leur technologie deep learning permet de reconstituer la séquence du génome avec une précision bien plus grande que les méthodes classiques.
Les chercheurs ont expliqué le fonctionnement de cet outil dans un article sur Google Open Source.
“Pour atteindre cet objectif, nous nous sommes associés à Google Cloud Platform pour déployer les flux de travail de DeepVariant sur GCP, disponible aujourd’hui, dans des configurations optimisées pour des délais d’exécution économiques et rapides grâce à des technologies GCP évolutives telles que l’API Pipelines”.
“Cet ensemble de paires fournit aux utilisateurs une base fluide leur permettant d’explorer et d’évaluer les capacités de DeepVariant dans leur environnement de calcul actuel, tout en fournissant une solution basée sur le cloud pour satisfaire les besoins des plus grands ensembles de données génomiques”.
Pour construire DeepVariant, l’équipe Google Brain a commencé avec des génomes de référence du Genome in a Bottle Consortium. Ils ont ainsi créé des dizaines de millions d’exemples d’encodage de données de séquençage à haut débit.
L’étape suivante consistait à développer un modèle de classification Google TensorFlow pour distinguer le vrai génome des données expérimentales. Mark DePristo et Ryan Poplin ont rappelé à la revue du MIT que DeepVariant avait obtenu le plus haut taux de précision du PrecisionFDA’s Truth Challenge en 2016 et que, depuis lors, Google avait réduit le taux d’erreur de l’outil de plus de 50%.
Google a déclaré que DeepVariant faisait partie de son objectif global d’appliquer ses technologies au domaine de la santé et à d’autres disciplines scientifiques. Son objectif est de proposer outils et données au plus grand nombre.