Google Research a annoncé la mise en disposition en open source sur GitHub de sa technologie DeepLab-v3+ au sein de son framework TensorFlow. Développée à partir de réseaux de neurones convolutifs, elle sera désormais accessible aux développeurs.
DeepLab est un modèle de segmentation sémantique d’images qui a été utilisé dans la création des modes ‘portrait’ des smartphones Pixel2 et Pixel 2 XL. Cette technologie développée par Google permet d’assigner une étiquette d’identification à chaque pixel d’une image contenant des éléments tels que le ciel, un chien ou encore une personne. Les applications de cette technologie sont donc multiples car elle peut par exemple être utilisée pour identifier une personne, la détourer ou flouter le reste de l’image afin de simuler une photo prise sur un appareil doté d’une grande ouverture, capable de produire un effet bokeh.
“Cet étiquetage sémantique nécessite d’identifier le contour des objets”, explique Google Research sur son blog.
DeepLab avait été développé il y a 3 ans et a connu depuis d’importantes évolutions :
“l’amélioration des feature extractors des réseaux de neurones convolutifs, une meilleure modélisation des objets, une assimilation minutieuse des informations contextuelles, des procédures d’apprentissage améliorées et un hardware et software de plus en plus performants entre DeepLab-v2 et DeepLab-v3.
Avec DeepLab-v3 +, nous étendons DeepLab-v3 en y ajoutant un module décodeur simple mais efficace pour affiner les résultats de la segmentation, en particulier le long des contours des objets”.
Par ailleurs, cette technologie est également utilisée dans la segmentation des vidéos mobiles temps réel grâce à sa précision de localisation particulièrement stricte par rapport aux autres tâches de reconnaissance visuelle en matière, entre autres, de classification d’images.
DeepLab-v3+ est donc désormais disponible en open source au sein du framework TensorFlow et inclut des modèles construits sur une architecture de réseau neuronal convolutif, ce qui lui permet de fournir des résultats plus précis sur les déploiements du côté serveur.