Optimisation de contrôleurs par essaim particulaire

Jérémy Fix 1 Matthieu Geist 1
1 IMS - Equipe Information, Multimodalité et Signal
UMI2958 - Georgia Tech - CNRS [Metz], SUPELEC-Campus Metz
Résumé : Trouver des contrôleurs optimaux pour des systèmes stochastiques est un problème particulièrement difficile abordé dans les communautés d'apprentissage par renforcement et de contrôle optimal. Le paradigme classique employé pour résoudre ces problèmes est celui des processus décisionnel de Markov. Néanmoins, le problème d'optimisation qui en découle peut être difficile à résoudre. Dans ce papier, nous explorons l'utilisation de l'optimisation par essaim particulaire pour apprendre des contrôleurs optimaux. Nous l'appliquons en particulier à trois problèmes classiques : le pendule inversé, le mountain car et le double pendule.
Document type :
Conference papers
Complete list of metadatas

Cited literature [11 references]  Display  Hide  Download

https://hal-supelec.archives-ouvertes.fr/hal-00701945
Contributor : Sébastien van Luchene <>
Submitted on : Monday, October 29, 2012 - 2:17:45 PM
Last modification on : Thursday, October 24, 2019 - 3:52:04 PM
Long-term archiving on : Thursday, December 15, 2016 - 9:34:16 AM

File

Cap10.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00701945, version 1

Collections

Citation

Jérémy Fix, Matthieu Geist. Optimisation de contrôleurs par essaim particulaire. Conférence Francophone sur l'Apprentissage Automatique - CAp 2012, May 2012, Nancy, France. pp.1-14. ⟨hal-00701945⟩

Share

Metrics

Record views

466

Files downloads

349