GPT-4o mini : OpenAI lance une version optimisée et économique de son modèle phare

L'un des principaux obstacles à l'adoption de l'IA générative pour les entreprises est le coût. Les fournisseurs proposent donc aujourd'hui des modèles plus légers très performants tout en offrant plus de flexibilité. OpenAI, qui a présenté GPT-4o en mai dernier, a introduit la semaine dernière une version allégée et optimisée de son modèle phare : GPT-4o mini. Adapté à des environnements avec des contraintes de ressources, la start-up le présente comme son modèle le plus rentable à ce jour.

GPT-4o mini est conçu pour une large gamme d'applications grâce à son faible coût et sa faible latence. Il est particulièrement adapté aux scénarios enchaînant ou parallélisant plusieurs appels de modèle, par exemple l’appel de plusieurs API, ou une analyse de grands volumes de données contextuelles, comme l'intégration de bases de code complètes ou d'historiques de conversations. Les chatbots de support client peuvent également bénéficier de ses réponses rapides et précises en temps réel.

Pour l'instant, le modèle ne traite que le texte et les images mais les entrées et sorties audio et vidéo seront également prises en charge, élargissant ainsi les possibilités d'application dans divers domaines. Il dispose d’une fenêtre contextuelle de 128 000 jetons et peut gérer jusqu’à 16 000 jetons de sortie par demande. Son coût est de 15 cents par million de jetons d'entrée et 60 cents par million de jetons de sortie (environ 2500 pages d'un livre standard), soit une réduction de plus de 60 % par rapport à GPT-3.5 Turbo. Il prend en charge la même gamme de langues que GPT-4o, cependant, ses connaissances au lancement s'arrêtent à octobre 2023.

Des performances impressionnantes

Malgré sa taille réduite, GPT-4o mini conserve une performance robuste et offre des réponses de haute qualité dans divers contextes. Open AI l'a évalué par rapport à GPT-3.5 Turbo, GPT-4o mais également par rapport à des modèles plus légers, Gemini Flash de Google et Claude Haïku d'Anthropic.

Ses capacités en matière de génération de texte et de raisonnement multimodal lui ont permis de surpasser ces modèles, à l'exception de GPT-4o, sur toutes les tâches. Pour les tâches de raisonnement impliquant à la fois le texte et la vision, il a obtenu un score de 82,0 % sur MMLU, contre 77,9 % pour Gemini Flash, 73,8 % pour Claude Haiku et 69,8 % pour GPT-3,5 Turbo (88,7 % pour GPT-4o).

GPT-4o mini excelle dans le raisonnement mathématique et les tâches de codage. Sur MGSM, mesurant le raisonnement mathématique, il a obtenu un score de 87,0 %, contre 75,5 % pour Gemini Flash et 71,7 % pour Claude Haiku et 87,2 % sur HumanEval, qui mesure les performances de codage, contre 71,5 % pour Gemini Flash et 75,9 % pour Claude Haiku.

Sécurité et fiabilité

La sécurité est un pilier central du développement de GPT-4o mini. Le modèle intègre des mesures de sécurité robustes dès la phase de pré-entraînement, filtrant les contenus indésirables tels que les discours haineux et le spam. Après l'entraînement, des techniques avancées comme l'apprentissage par renforcement avec rétroaction humaine (RLHF) ont été utilisées pour aligner le comportement du modèle sur des normes strictes. GPT-4o mini est conçu pour résister aux tentatives de jailbreaks et autres attaques, garantissant des réponses fiables et sécurisées.

Disponibilité

GPT-4o mini est disponible en tant que modèle de texte et de vision dans l’API Assistants, l’API Chat Completions et l’API Batch. Les équipes d’OpenAI travaillent au peaufinage de ses réglages.

Dans ChatGPT, il remplace désormais GPT-3,5 et est disponible pour les utilisateurs Plus et Team, mais également pour ceux de Free, la version gratuite. Les utilisateurs Enterprise y auront également accès cette semaine. Cette disponibilité large témoigne de l'engagement d'OpenAI à rendre les avantages de l'IA accessibles à tous.

Tendances

Comprendre l'IA

Applications de l'IA

GPT-4o mini : OpenAI lance une version optimisée et économique de son modèle phare

Des performances impressionnantes

Sécurité et fiabilité

Disponibilité