https://hal-supelec.archives-ouvertes.fr/hal-00554373
Contributor : Sébastien van Luchene <>
Submitted on : Monday, January 10, 2011 - 4:30:19 PM Last modification on : Monday, December 14, 2020 - 2:10:02 PM
Raghav Aras, Olivier Pietquin. Optimal Average Reward Controllers For POMDPs. 5èmes Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes (JFPDA'10), Jun 2010, Besançon, France. ⟨hal-00554373⟩