présentation
-

Présentation des Méthodes de Différence Temporelle n-Step
EN BREF Méthodes de Différence Temporelle : Un cadre d’apprentissage par renforcement. n-step TD Learning : Approche qui utilise plusieurs étapes pour l’estimation. Bridge entre les méthodes de TD classiques et les méthodes Monte Carlo. Utilise bootstrapping tout en incorporant les n récompenses suivantes. Complète par des erreurs de temporelle n-step. Développe sur le problème…
