A copy of this work was available on the public web and has been preserved in the Wayback Machine. The capture dates from 2022; you can also visit the original URL.
The file type is application/pdf
.
Théorie des Catégories et Critère de Contrôlabilité pour Atari 2600
2018
Conférence Nationale sur les Applications Pratiques de l'Intelligence Artificielle
L'objectif de l'apprentissage par renforcement est de contrôler un agent ou système dynamique dans le but de tirer la meilleure récompense de son environnement. Toutefois, dès lors que l'on prend en compte des contraintes réalistes telles qu'un nombre restreint d'expériences ou une puissance de calcul limitée, les approches classiques perdent de leur efficacité. Nous introduisons des éléments de la théorie du contrôle pour diminuer le nombre d'essais requis. En parallèle, des outils
dblp:conf/apia/AmarBCELPP18a
fatcat:kuhddydp5vh5jc6k6biztewbay