Tout juste un mois après avoir introduit son modèle de raisonnement TurboS, le conglomérat chinois Tencent dévoile celui à qui il a servi de base : Hunyuan-T1. Selon lui, grâce à un post-entraînement à grande échelle, sa capacité de raisonnement a été considérablement élargie et alignée sur les préférences humaines, ce qui lui permet de rivaliser avec DeepSeek R1.

Dès 2024, avec V2, un modèle de langage performant proposé à un coût compétitif, DeepSeek a déclenché une guerre des prix sur le marché chinois de l'IA et amené Tencent et ses principaux concurrents dont Zhipu AI, ByteDance, Alibaba, Baidu, à revoir leurs prix à la baisse. Alors que la guerre technologique autour de l'IA entre les Etats-Unis et la Chine continue de s'intensifier depuis l'apparition de R1, la concurrence dans l'Empire du Milieu atteint également de nouveaux sommets. 

Un modèle axé sur le raisonnement profond

Après Baidu et Alibaba, c'est donc le géant Tencent qui tente de s'imposer sur le marché chinois face à DeepSeek. 

T1 s'appuie sur l’architecture Hybrid-Transformer-Mamba MoE, qui comme son nom l'indique, combine les avantages des Transformers et des modèles Mamba, tout en intégrant des experts, ce qui permet de limiter le nombre de paramètres actifs. Elle est particulièrement adaptée aux tâches nécessitant un traitement de contexte long et une grande précision. T1 réduit ainsi les pertes de contexte et optimise l'utilisation des ressources informatiques, tout en étant deux fois plus rapide dans le décodage. 

Grâce à un post-entraînement basé sur le RLHF (apprentissage par renforcement avec retour humain), Tencent positionne son modèle comme un concurrent sérieux face à OpenAI o1 et DeepSeek R1.

Selon les évaluations partagées par Tencent, Hunyuan-T1 affiche des performances :
  • Supérieures ou équivalentes sur certains benchmarks (MMLU-pro, CEval, AIME, Zebra Logic) ;
  • Particulièrement fortes en mathématiques, avec un score impressionnant de 96,2 sur MATH-500 ;
  • Solides en ingénierie et codage, démontrant une capacité avancée à résoudre des problèmes techniques.

Benchmarks fournis par Tencent