Attributes | Values |
---|
type
| |
Thesis advisor
| |
Author
| |
alternative label
| - On-line search for Markov Decision Processes : application to the maintenance of a constellation of satellites
|
dc:subject
| - Satellites artificiels
- Thèses et écrits académiques
- Apprentissage par renforcement
- Arbres (théorie des graphes)
- Optimisation stochastique
|
preferred label
| - Recherche en ligne pour les Processus Décisionnels de Markov, application à la maintenance d'une constellation de satellites
|
Language
| |
Subject
| |
dc:title
| - Recherche en ligne pour les Processus Décisionnels de Markov, application à la maintenance d'une constellation de satellites
|
Degree granting institution
| |
note
| - La résolution de Processus de Markov de grande dimension est habituellement basée sur le calcul hors ligne d'une approximation de la fonction de valeur optimale et sur son exploitation en ligne pour définir une politique a priori. Toutefois, quand l'espace d'états est très vaste et qu'aucune représentation structurée efficace n'est reconnue, le calcul d'une bonne approximation de la fonction de valeur optimale s'avère souvent être une tâche difficile. Nous proposons ici une approche alternative reposant sur la simulation stochastique du processus décisionnel depuis chaque état courant sur un certain horizon de raisonnement. Cette approche conduit à la définition en ligne d'une politique stochastique en remplacement de la politique a prioi traditionnelle. Nous proposons en particulier deux algorithmes pour contrôler l'allocation en ligne des simulations. Notre démarche a été validée sur une application proposée par le Centre National d'Etudes Spatiales concernant la maintenance d'une constellation de 32 satellites en orbite basse. Les actions à entreprendre définissent la préparation au sol de nouveaux satellites puis leur injection en orbite. L'objectif est de pallier efficacement les pannes affectant les satellites, qui, en raison de l'hostilité du milieu spatial, sont relativement fréquentes. Ce problème nous a conduit à mettre en oeuvre diverses techniques à base de simulations pour optimiser les politiques de maintenance. Les plus performantes de ces méthodes, combinant optimisation hors ligne et recherche en ligne, ont permis de diminuer les coûts simulés de maintenance de 26%.
|
dc:type
| |
http://iflastandar...bd/elements/P1001
| |
rdaw:P10219
| |
has content type
| |
is primary topic
of | |
is rdam:P30135
of | |