Université de Liège Réseau des Bibliothèques

BICTEL/e - ULg
Serveur institutionnel des thèses de doctorat



Nouvelles thèses
dans BICTEL/e - ULg
  • Sharma, Henu - Theoretical studies of PbTiO3 and SrTiO3 under uniaxial mechanical constraints combining first-principles calculations and phenomenological Landau theory
  • Gennotte, Vincent - Biologie de la reproduction et analyse du déterminisme et de la différenciation du sexe à des stades précoces chez le tilapia du Nil, Oreochromis niloticus/Reproductive biology and analysis of sex determinism and differentiation at early developmental stages in Nile tilapia, Oreochromis niloticus
  • André, Cédric - Audiovisual spatial congruence, and applications to 3D sound and stereoscopic video.
Présentation Recherche thèse Dépôt thèse Accès
gestionnaires
 
Page de résumé pour ULgetd-02152011-101110

Auteur : Fonteneau, Raphaël
E-mail de l'auteur : Raphael.Fonteneau@ulg.ac.be
URN : ULgetd-02152011-101110
Langue : Anglais/English
Titre : Contributions to Batch Mode Reinforcement Learning
Intitulé du diplôme : Doctorat en sciences de l'ingénieur
Département : FSA - Département d'électricité, électronique et informatique
Jury :
Nom : Titre :
Munos, Rémi Membre du jury/Committee Member
Murphy, Susan A. Membre du jury/Committee Member
Sebag, Michele Membre du jury/Committee Member
Sepulchre, Rodolphe Membre du jury/Committee Member
Wehenkel, Louis Membre du jury/Committee Member
Louveaux, Quentin Président du jury/Committee Chair
Ernst, Damien Promoteur/Director
Mots-clés :
  • reinforcement learning/apprentissage par renforcement
  • artificial intelligence/intelligence artificielle
  • optimal control/contrôle optimal
  • machine learning/apprentissage automatique
Date de soutenance : 2011-02-24
Type d'accès : Public/Internet
Résumé :

This dissertation presents various research contributions published during these four years of PhD in the field of batch mode reinforcement learning, which studies optimal control problems for which the only information available on the system dynamics and the reward function is gathered in a set of trajectories. We first focus on deterministic problems in continuous spaces. In such a context, and under some assumptions related to the smoothness of the environment, we propose a new approach for inferring bounds on the performance of control policies. We also derive from these bounds a new inference algorithm for generalizing the information contained in the batch collection of trajectories in a cautious manner. This inference algorithm as itself lead us to propose a min max generalization framework. When working on batch mode reinforcement learning problems, one has also often to consider the problem of generating informative trajectories. This dissertation proposes two different approaches for addressing this problem. The first approach uses the bounds mentioned above to generate data tightening these bounds. The second approach proposes to generate data that are predicted to generate a change in the inferred optimal control policy. While the above mentioned contributions consider a deterministic framework, we also report on two research contributions which consider a stochastic setting. The first one addresses the problem of evaluating the expected return of control policies in the presence of disturbances. The second one proposes a technique for selecting relevant variables in a batch mode reinforcement learning context, in order to compute simplified control policies that are based on smaller sets of state variables.

Autre version :
Fichiers :
Nom du fichier Taille Temps de chargement évalué (HH:MI:SS)
Modem 56K ADSL
[Public/Internet] Fonteneau_thesis.pdf 2.22 Mb 00:05:17 00:00:11

Bien que le maximum ait été fait pour que les droits des ayants-droits soient respectés, si un de ceux-ci constatait qu'une oeuvre sur laquelle il a des droits a été utilisée dans BICTEL/e ULg sans son autorisation explicite, il est invité à prendre contact le plus rapidement possible avec la Direction du Réseau des Bibliothèques.


Parcourir BICTEL/e par Auteur|Département | Rechercher dans BICTEL/e


© Réseau des Bibliothèques de l'ULg, Grande traverse, 12 B37 4000 LIEGE