Optimisation de contrôleurs par essaim particulaire - CentraleSupélec Access content directly
Conference Papers Year : 2012

Optimisation de contrôleurs par essaim particulaire

Jérémy Fix

Abstract

Trouver des contrôleurs optimaux pour des systèmes stochastiques est un problème particulièrement difficile abordé dans les communautés d'apprentissage par renforcement et de contrôle optimal. Le paradigme classique employé pour résoudre ces problèmes est celui des processus décisionnel de Markov. Néanmoins, le problème d'optimisation qui en découle peut être difficile à résoudre. Dans ce papier, nous explorons l'utilisation de l'optimisation par essaim particulaire pour apprendre des contrôleurs optimaux. Nous l'appliquons en particulier à trois problèmes classiques : le pendule inversé, le mountain car et le double pendule.
Fichier principal
Vignette du fichier
Cap10.pdf (274.73 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

hal-00701945 , version 1 (29-10-2012)

Identifiers

  • HAL Id : hal-00701945 , version 1

Cite

Jérémy Fix, Matthieu Geist. Optimisation de contrôleurs par essaim particulaire. Conférence Francophone sur l'Apprentissage Automatique - CAp 2012, May 2012, Nancy, France. pp.1-14. ⟨hal-00701945⟩
222 View
337 Download

Share

Gmail Facebook Twitter LinkedIn More