Avec le lancement de R1, DeepSeek a non seulement créé une onde de choc dans la Silicon Valley mais intensifié la concurrence au sein même de l'Empire du Milieu. En février dernier, Baidu, acteur majeur chinois de la GenAI, détenteur du moteur de recherche éponyme, ripostait avec l'annonce de la mise open source en juin prochain de son modèle d'IA Ernie ainsi que la gratuité de son chatbot Ernie Bot. Il a mis les bouchées doubles puisqu'hier il a publié ERNIE 4.5, la dernière version de son modèle de fondation multimodal, mais également ERNIE X1, un modèle axé sur le raisonnement, offrant des performances comparables à R1, mais à moitié prix. Tous deux sont intégrés à Ernie Bot, qui de fait, est gratuit un peu plus tôt que prévu.
Selon Baidu, ERNIE 4.5 intègre des avancées significatives en compréhension, génération, raisonnement et mémoire. Il bénéficie notamment d’une meilleure gestion des hallucinations et d’une optimisation du raisonnement logique. Sa capacité à traiter simultanément du texte, des images, du son et de la vidéo en fait un outil puissant pour des applications variées, allant du dialogue à la création de contenu.
Les améliorations apportées au modèle sont attribuées à plusieurs technologies clés, notamment le masquage dynamique de l’attention « FlashMask », le mélange multimodal hétérogène d’experts, la compression de représentation spatio-temporelle, la construction de données d’entraînement centrée sur les connaissances, l’auto-rétroaction améliorée post-formation.
Dans son communiqué, la société affirme qu'ERNIE 4.5 surpasse GPT-4.5 dans plusieurs benchmarks, tout en étant 100 fois moins coûteux.
De son côté, ERNIE X1, axé sur le raisonnement multimodal et l’utilisation d’outils avancés, excellerait en planification, en analyse et en résolution de problèmes complexes. Il intègre des fonctionnalités spécifiques comme la recherche avancée, la génération et l’interprétation d’images, la lecture de pages web ainsi que la cartographie conceptuelle via TreeMind.
Un pari sur l’accessibilité et la compétitivité
En rendant ces modèles gratuits pour le grand public et en proposant des tarifs compétitifs pour les entreprises via sa plateforme cloud Qianfan, Baidu cherche à renforcer son influence dans l’écosystème de l’IA. ERNIE 4.5 est ainsi proposé à 0,004 RMB (environ 0,0005 euro) par millier de jetons en entrée et 0,016 RMB (environ 0,002 euro) en sortie, tandis qu’ERNIE X1 affiche des prix encore plus bas : il est proposé à 0,002 RMB (environ 0,00025 euro) pour le même nombre de jetons en entrée et 0,008 RMB (environ 0,001 euro) en sortie.
Ce positionnement tarifaire agressif s’accompagne d’une volonté de démocratiser l’IA générative, tout en intégrant progressivement ces modèles dans les produits et services de Baidu, notamment son moteur de recherche et l’application Wenxiaoyan.
En proposant un modèle aux performances comparables à R1, mais à moitié prix, Baidu affiche clairement son ambition de dominer le secteur non seulement en Chine mais également face aux acteurs américains.