Stefano Ermon - Intelligence artificielle

Intelligence artificielle Stefano Ermon

Articles citant les travaux de Stefano Ermon dans le domaine de l'intelligence artificielle.

La DPO, une alternative prometteuse à la RLHF pour l’alignement des modèles de langage...

Marie-Claude Benoit - 12 janvier 2024

L’apprentissage par renforcement à partir de la rétroaction humaine (RLHF) est couramment utilisé pour aligner les modèles d'IA sur les préférences humaines, il l'a...