Intelligence artificielle
Chelsea Finn
Chelsea Finn
La DPO, une alternative prometteuse à la RLHF pour l’alignement des modèles de langage...
L’apprentissage par renforcement à partir de la rétroaction humaine (RLHF) est couramment utilisé pour aligner les modèles d'IA sur les préférences humaines, il l'a...
PIGEON et PIGEOTTO, les modèles de géolocalisation d’images de l’Université de Stanford
La géolocalisation d'images à l'échelle mondiale représente un défi majeur en raison de la diversité des images provenant de toutes les régions du globe....