En avril dernier, NLP Cloud, start-up grenobloise lançait son interface de programmation NLP permettant aux entreprises et à leurs développeurs et/ou data scientistes de pouvoir utiliser le NLP dans leurs réalisations. La jeune pousse française annonce l’intégration du modèle open source GPT-J dans leur outil NLP. Récemment publié par une équipe de chercheurs d’EleutherAI, ce modèle se veut être équivalent au célèbre GPT-3 d’Open AI.
Une start-up innovante dans le NLP et un modèle NLP open source qui concurrence GPT-3
Créée en 2020 par Julien Salinas, la start-up française NLP Cloud, basée à Grenoble, fournit des modèles de traitement automatique du langage (NLP ou TAL en français) de haute performance basés sur spaCy et Hugging Face Transformers, répondant aux exigences de production. En avril dernier, ce nouvel acteur du marché du NLP lance sa propre interface de programmation NLP au service des data scientists et des développeurs.
En parallèle, les équipes de EleutherAI (plus particulièrement Aran Komatsuzaki, doctorant en machine learning et Ben Wang, étudiant en ingénierie électrique à l’Université de Pensylavanie) développent GPT-J, modèle de traitement automatique du langage open source entrainé à l’aide de 6 milliards de paramètres, soit 4 fois place que GPT-2 mais presque 30 fois mois que le modèle GPT-3 d’Open AI. Néanmoins, EleutherAI affirme que son modèle NLP est l’un des plus avancés et serait équivalent à GPT-3.
L’arrivée de GPT-J dans NLP Cloud : entre enjeux éthiques et performance de l’interface
Si l’interface NLPcloud supportait déjà GPT-3, la start-up annonce qu’elle supportera également GPT-J. L’entreprise précise :
“GPT-3 et GPT-J ont récemment bouleversé le monde du NLP. Grâce à leur taille, ces modèles d’IA sont à la fois très efficaces pour générer un langage humain fluide et pour traiter efficacement la plupart des cas d’utilisation du traitement automatique du langage moderne. Grâce à GPT-J, les développeurs peuvent effectuer diverses opérations de pointe telles que des chatbots, l’extraction de données à partir de documents non structurés (comme des pages Web, des e-mails, des contrats, des états financiers…), la génération de code, l’analyse des sentiments, ou la création de contenu marketing, dans de nombreuses langues. De nouveaux cas d’utilisation sont découverts presque tous les jours.”
Depuis plus de trois mois, l’équipe de NLP Cloud travaille pour réussir au mieux l’intégration de GPT-J afin de proposer une solution prête pour la production à ses clients. Julien Salinas, fondateur et CEO de NLP Cloud évoque l’arrivée de ce nouveau modèle NLP dans l’interface que sa société a conçu :
” Chez NLP Cloud, nous sommes heureux de proposer une alternative open source au monopole OpenAI-Microsoft, car nous pensons que tout le monde devrait être capable de comprendre – s’il le souhaite – comment fonctionne un modèle d’IA de l’intérieur.”
Pour finir, NLP Cloud précise que pour que les modèles avancés de NLP puissent être les plus éthiques et responsables possibles, il faudrait que ces modèles puissent rester open source et soient continuellement audités par la communauté des spécialistes en traitement du langage naturel.