Dans cette vidéo on s’interesse à un algorithme important dans l’apprentissage par renforcement: Policy Gradient.
Retourner au début de la série sur l’apprentissage par renforcement
Dans cette vidéo on s’interesse à un algorithme important dans l’apprentissage par renforcement: Policy Gradient.
Retourner au début de la série sur l’apprentissage par renforcement
Thibault Neveu est un entrepreneur, ingénieur de recherche spécialisé dans l’apprentissa