Trois mois après avoir annoncé la sortie d’Alfred-40B-0723, LightOn, un des acteurs clés français de l’IA générative, dévoile la seconde version de son modèle open-source, Alfred-40B-1023. Plus performant, plus fiable répondant “Je ne sais pas” lorsqu’il n’est pas en mesure de répondre à une sollicitation, il est également moins sujet aux hallucinations.
LightOn a développé ce nouveau modèle afin qu’il réponde spécifiquement aux besoins des entreprises et des services publics. Alfred-40B-1023 sera prochainement disponible sur HuggingFace et AWS Jumpstart, ce qui facilitera son intégration à d’autres environnements de travail.
Laurent Daudet, Directeur Général et co-fondateur de LightOn avec Igor Carron, Florent Krzakala et Sylvain Gigan, explique :
“Le marché des IA génératives est en plein essor et l’amélioration continue des LLM contribue à accroître l’adoption des IA génératives en renforçant l’efficacité et la qualité des tâches pouvant être menées On assiste ainsi à une multiplication des cas d’usage aussi bien dans le secteur public que privé, dans lesquels une simple requête en langage naturel permet de synthétiser des documents, produire des textes, faire de la veille, retranscrire des réunions, rédiger des fiches produit, etc”.
Un copilote d’IA générative très efficace
Les compétences principales de la 1ère version étaient la qualité de l’ingénierie des prompts, le développement d’applications sans code et l’exécution de tâches classiques des modèles de langage : la synthèse de contenu, la réponse à des requêtes sur un document, la classification de contenu et l’extraction de mots-clés.
Elles avaient été obtenues en ajustant les paramètres du modèle brut et pré-entraîné Falcon 40B, le LLM open source des Émirats arabes unis et du Moyen-Orient. LightOn en a affiné les capacités, ce qui fait d’Alfred-40B-1023 un copilote d’IA générative encore plus efficace.
Les améliorations apportées à la seconde version
Les principales fonctionnalités et améliorations apportées à Alfred-40B-1023 sont :
La réduction des hallucinations : l’une des avancées majeures d’Alfred-40B-1023 est sa capacité à minimiser les hallucinations contextuelles, garantissant des résultats plus précis et fiables.
Une amélioration de la transparence : en l’absence d’une réponse définitive, le modèle est désormais programmé pour indiquer simplement “Je ne sais pas”, améliorant ainsi sa transparence et sa fiabilité.
La capacité “Chat with Docs” : Alfred-40B-1023 excelle dans les tâches de type “Chat with Docs”, simplifiant l’interaction avec des documents spécifiques à une entreprise et optimisant la recherche d’informations.
Un contexte élargi : avec un contexte élargi de 8192 tokens, le modèle peut comprendre et générer des contenus plus longs et complexes, garantissant des réponses détaillées et complètes.
Des données sécurisées
Lors de la conception d’Alfred-40B-1023, LIghtOn a priorisé la sécurité des données. Lorsqu’il est déployé dans l’infrastructure d’un client, toutes les interactions de données sont confinées dans cet environnement, assurant ainsi la confidentialité et la sécurité des informations.
Grâce au partenariat entre la start-up et AWS, il a été entraîné sur AWS Sagemaker, dont il exploite l’infrastructure évolutive pour garantir efficacité et fiabilité. Le modèle alimente Paradigm, la plateforme pour entreprise de LightOn.
Laurent Daudet précise :
“Si Alfred-40B-1023 est proposé en tant que modèle open-source, les utilisateurs de notre plateforme Paradigm ont accès à une version plus avancée, qui peut inclure des améliorations et des fonctionnalités supplémentaires, leur garantissant de toujours bénéficier des capacités les plus performantes. Nous avons également mis l’accent sur la création d’interfaces et de flux de travail intuitifs, afin que chacun, quelle que soit son expertise technique, puisse exploiter la puissance de l’IA générative. Des fonctionnalités telles que “Task Factory” permettent ainsi aux non-experts d’intégrer l’IA dans leurs tâches quotidiennes de manière transparente”.
LightOn encourage ainsi la collaboration, l’innovation et l’exploration en permettant aux développeurs, chercheurs et organisations de travailler avec le modèle pour contribuer à son amélioration et l’intégrer dans diverses applications.