Le CEA a développé un nouvel outil d’annotation automatique d’image basé sur l’intelligence artificielle et la vision par ordinateur. Baptisé PIXANO, il est disponible à la communauté IA en open source et combine efficacement la rapidité des systèmes artificiels et la validation de l’humain pour accélérer le développement de solutions et technologies d’annotations.
En février dernier, le CEA a présenté PIXANO, l’outil open source d’annotation automatique développé par ses équipes de recherche. Comme l’indique l’organisme public de recherche, il y a 20 ans, les systèmes de reconnaissance automatique dans l’image identifiaient laborieusement un chiffre écrit à la main. L’essor de l’intelligence artificielle a ouvert des perspectives à l’exploitation massive des données, dans des applications aussi diverses que l’imagerie médicale, le contrôle qualité en usine, et la conduite autonome. Toujours plus performants, les systèmes intelligents se voient attribuer de plus en plus de tâches et de responsabilité. Il est donc crucial pour les industriels qui utilisent ou commercialisent ces systèmes de constituer des bases de données pertinentes pour les entraîner, les évaluer et valider leurs capacités.
L’expertise du List, institut du CEA dédié aux systèmes numériques intelligents, lui a permis de relever ce défi en concevant PIXANO (Pixel Annotation), une solution open source pour l’annotation web efficace à grande échelle d’images et de vidéos. L’annotation consiste à décrire les éléments présents dans les images par des étiquettes ou tags localisés pouvant prendre des formes variables et présentant différents niveaux de détail (descriptions textuelles, formes géométriques englobant les objets, propriétés des objets, labels des pixels, etc.).
L’outil PIXANO propose une importante gamme de types d’étiquettes (boîte englobante, polygone, cuboïde, masque pixellique) intégrées dans des composants web ouverts, modulaires, réutilisables et personnalisables. Les modules sont alimentés par de l’intelligence artificielle qui vient assister l’humain dans sa tâche d’annotation et réduire le nombre de clics nécessaires à la création d’étiquettes.
Des acteurs majeurs de l’industrie, notamment automobile, ont validé la pertinence de cette solution dans le cadre de partenariats et projets collaboratifs favorisant la capitalisation des développements réalisés. Par sa modularité et sa capacité à intégrer de nouveaux composants personnalisables et intelligents, PIXANO ouvre de larges perspectives de création de solutions adaptées aux besoins des concepteurs d’IA.
Le marché mondial des services d’annotation de données a dépassé les 300 millions d’euros en 2018 et restera en forte augmentation dans les prochaines années. La distribution à grande échelle des tâches est devenue le modèle prépondérant, grâce au Web qui fournit une plateforme accessible partout, centralise les données et rend facile la collaboration d’une multitude d’annotateurs (‘crowdsourcing’).