Facebook Research a présenté le 14 décembre le framework python PyText. L’outil basé sur PyTorch est destiné à simplifier le passage en production de projets de traitement automatisé du langage (NLP).
Selon les auteurs, PyText permet de concilier rapidité d’expérimentation et passage à l’échelle en proposant une interface simple et extensible. Les modèles générés peuvent être exportés de façon à être exécutés par le moteur d’inférence Caffe2. Le framework propose une chaîne de production de bout en bout, prête à être mise en oeuvre. Mais son architecture modulaire permet aux développeurs de faire appel ou non à certains de ses composants.
Le framework permet d’adresser des problématiques de classification de texte, de taggage de mots (Part of speech et reconnaissance d’entités nommées) ou encore d’analyse sémantique et de détermination de probabilité de séquences de mots. Ces différentes tâches peuvent également être combinées. PyText est actuellement utilisé en production par Facebook sur sa plateforme.
Consulter la publication
Accéder au code source
Consulter la documentation