La licorne canadienne Cohere a récemment dévoilé “Command A”, la dernière version de son modèle phare. Spécialement conçu, comme ses prédécesseurs, pour répondre aux besoins des entreprises, ce LLM de 111 milliards de paramètres, qui combine performance et efficacité énergétique, rivalise avec des modèles de premier plan tels que GPT-4o et DeepSeek-V3.
 
L’un des atouts majeurs de Command A pour les entreprises est son empreinte matérielle minimale. Alors que la plupart des modèles comparables nécessitent jusqu’à 32 GPU, Command A fonctionne efficacement avec seulement deux GPU A100 ou H100, ce qui se traduit par une réduction significative des coûts et de la latence ainsi qu'une vitesse d’exécution plus élevée. Outre une génération plus rapide du premier token, il peut ainsi générer jusqu’à 156 tokens/s, soit un débit 1,75 fois supérieur à GPT-4o et 2,4 fois supérieur à DeepSeek-V3.
Performances de Command A
Cohere a évalué les performances de Command A par rapport à celles de GPT-4o et DeepSeek-V3,sur des benchmarks académiques : MMLU((connaissances générales),, MATH, IFEval (suivi des instructions), des tests d’agents intelligents (BFCL, Taubench) et des benchmarks de codage (MBPPPlus, SQL, RepoQA).
Ses capacités en suivi des instructions, en codage, en particulier en SQL, et sur des tâches agentiques surpassent celles de ses concurrents.
Dans des tests d’évaluation humaine, Command A, qui couvre 23 des langues principales, a surpassé ses concurrents sur plusieurs langues, notamment en arabe dialectal, où il s’est révélé plus cohérent et précis que GPT-4o et DeepSeek-V3. Cette capacité à s’adapter aux contextes locaux représente un atout stratégique pour les entreprises opérant à l’international.
Des capacités optimisées pour les entreprises
Contrairement à son prédécesseur, qui prenait en charge une longueur de contexte de 128 000 jetons, Command A est doté d’une longueur de contexte de 256  tokens, ce qui le rend apte à analyser de longs documents d’entreprise. Il intègre des fonctionnalités avancées telles que la génération augmentée par récupération (RAG) avec des citations vérifiables et l'utilisation d’outils agentiques sécurisés.
Il est particulièrement efficace pour :
  • L’analyse et l’extraction d’informations à partir de rapports financiers volumineux ;
  • La gestion des politiques RH selon les spécificités locales ;
  • La vérification et l’interprétation des réglementations juridiques complexes.
Grâce à une intégration fluide avec North, la plateforme d’agents IA de Cohere, Command A permet aux entreprises de développer des solutions d’IA sur mesure tout en maintenant un haut niveau de sécurité et de conformité.
Disponibilité et tarification
D'ores et déjà disponible sur la plateforme Cohere, avec une prise en charge prochaine par les principaux fournisseurs de cloud, Command A est proposé à un coût de 2,50 $ pour 1 million de tokens en entrée et de 10,00 $ pour 1 million de jetons en sortie. Il est également accessible à des fins de recherche sur Hugging Face.