Anthropic a annoncé lundi dernier Claude 3.7 Sonnet, qu’il présente comme son “modèle le plus intelligent à ce jour et le premier modèle de raisonnement hybride sur le marché” ainsi que Claude Code, un outil de codage agentique permettant aux développeurs d'automatiser des tâches complexes directement depuis leur terminal. 

Claude 3.7 Sonnet : de nettes améliorations dans le codage et le développement web front-end

Anthropic adopte une approche unifiée du raisonnement en combinant rapidité et profondeur d'analyse. Contrairement à d'autres modèles qui développent des solutions distinctes pour le raisonnement instantané et la réflexion approfondie, Claude 3.7 Sonnet intègre ces deux capacités dans un seul système.

Le modèle offre deux modes de fonctionnement :

  • Standard, qui améliore les performances de Claude 3.5 Sonnet avec des réponses plus précises et naturelles.

  • Réflexion étendue, étape par étape, visible par l’utilisateur où l'IA prend le temps d'analyser un problème avant de formuler une réponse, améliorant ainsi ses performances en mathématiques, en codage et en suivi d'instructions complexes.

 

L'une des innovations clés de Claude 3.7 Sonnet est la possibilité, pour les utilisateurs de l'API d’Anthropic, de définir un budget de réflexion en nombre de jetons. Ce contrôle granulaire permet de trouver un équilibre entre la qualité des réponses et les coûts opérationnels..

 

Un positionnement stratégique entre performance et sécurité

Anthropic met  l'accent sur la sécurité et la fiabilité de ses modèles. Des tests approfondis et des collaborations avec des experts externes ont été menés pour s'assurer que le modèle distingue efficacement les demandes nuisibles et bénignes, réduisant ainsi de 45 % les refus injustifiés par rapport à son prédécesseur. L'entreprise a publié une carte système détaillée de ses méthodes d'évaluation, couvrant notamment les risques d'attaques par injection rapide et les stratégies mises en place pour y résister.

Claude Code : vers une automatisation avancée du développement logiciel

Avec Claude Code, Anthropic ambitionne de transformer les pratiques de développement en offrant un assistant IA capable de rechercher et modifier du code, exécuter des tests et même envoyer des modifications sur GitHub.

Les premiers tests montrent une réduction significative du temps nécessaire à l'accomplissement de certaines tâches, parfois de plus de 45 minutes. Cette amélioration pourrait modifier en profondeur le quotidien des développeurs, notamment dans des domaines comme le débogage, le refactoring à grande échelle et le développement piloté par les tests.

Disponibilité 

Claude 3.7 Sonnet  est disponible sur toutes les plans Claude, y compris Free, Pro, Team et Enterprise, ainsi que via l’API Anthropic, Amazon Bedrock et Vertex AI de Google Cloud. Toutefois, le mode de réflexion étendu est réservé aux utilisateurs des plans payants. Les tarifs restent identiques à ceux des versions précédentes : 3 $ par million de jetons d’entrée et 15 $ par million de jetons de sortie, y compris les jetons utilisés pour la réflexion.

Par contre, Claude Code est actuellement disponible en tant qu’aperçu de recherche limité . En fonction des commentaires reçus, Anthropic améliorera “la fiabilité des appels d’outils, ajout de la prise en charge des commandes de longue durée, amélioration du rendu dans l’application et élargissement de la compréhension de Claude de ses capacités.”