Université de Liège Réseau des Bibliothèques

BICTEL/e - ULg
Serveur institutionnel des thèses de doctorat



Nouvelles thèses
dans BICTEL/e - ULg
  • Brabant, Christian - Etude du rôle des mécanismes d’apprentissage dans le développement des effets renforçants de la cocaïne chez l’animal : implication des récepteurs histaminergiques H3
  • Boukary, Abdou Razac - Epidémiologie de la brucellose et de la tuberculose animales dans les milieux urbain, périurbain et rural au Niger
  • Bouabidi, Abderrahim - Etude Critique des Différentes Approches de Validation des Méthodes Analytiques
Présentation Recherche thèse Dépôt thèse Accès
gestionnaires
 
Page de résumé pour ULgetd-12072006-100239

Auteur : Jodogne, Sébastien
E-mail de l'auteur : S.Jodogne@ulg.ac.be
URN : ULgetd-12072006-100239
Langue : Anglais/English
Titre : Closed-Loop Learning of Visual Control Policies
Intitulé du diplôme : Doctorat en sciences de l'ingénieur
Département : FSA - Département d'électricité, électronique et informatique
Jury :
Nom : Titre :
Charvillat, Vincent Membre du jury/Committee Member
Munos, Remi Membre du jury/Committee Member
Paletta, Lucas Membre du jury/Committee Member
Verly, Jacques G. Membre du jury/Committee Member
Wehenkel, Louis Président du jury/Committee Chair
Piater, Justus H. Promoteur/Director
Mots-clés :
  • Visual features
  • Reinforcement learning
  • Purposive vision
Date de soutenance : 2006-12-05
Type d'accès : Public/Internet
Résumé :

In this dissertation, I introduce a general, flexible framework for learning direct mappings from images to actions in an agent that interacts with its surrounding environment. This work is motivated by the paradigm of purposive vision. The original contributions consist in the design of reinforcement learning algorithms that are applicable to visual spaces. Inspired by the paradigm of local-appearance vision, these algorithms exploit specialized visual features that can be detected in the visual signal.

Two different ways to use the visual features are described. Firstly, I introduce adaptive-resolution methods for discretizing the visual space into a manageable number of perceptual classes. To this end, a percept classifier that tests the presence or absence of few highly informative visual features is incrementally refined. New discriminant visual features are selected in a sequence of attempts to remove perceptual aliasing. Any standard reinforcement learning algorithm can then be used to extract an optimal visual control policy. The resulting algorithm is called "Reinforcement Learning of Visual Classes." Secondly, I propose to exploit the raw content of the visual features, without ever considering an equivalence relation on the visual feature space. Technically, feature regression models that associate visual features with a real-valued utility are introduced within the Approximate Policy Iteration architecture. This is done by means of a general, abstract version of Approximate Policy Iteration. This results in the "Visual Approximate Policy Iteration" algorithm.

Another major contribution of this dissertation is the design of adaptive-resolution techniques that can be applied to complex, high-dimensional and/or continuous action spaces, simultaneously to visual spaces. The "Reinforcement Learning of Joint Classes" algorithm produces a non-uniform discretization of the joint space of percepts and actions. This is a brand new, general approach to adaptive-resolution methods in reinforcement learning that can deal with arbitrary, hybrid state-action spaces.

Throughout this dissertation, emphasis is also put on the design of general algorithms that can be used in non-visual (e.g. continuous) perceptual spaces. The applicability of the proposed algorithms is demonstrated by solving several visual navigation tasks.

Autre version : http://www.montefiore.ulg.ac.be/~jodogne/jodogne-phd.pdf
Fichiers :
Nom du fichier Taille Temps de chargement évalué (HH:MI:SS)
Modem 56K ADSL
[Public/Internet] jodogne-phd.pdf 5.40 Mb 00:12:51 00:00:28

Bien que le maximum ait été fait pour que les droits des ayants-droits soient respectés, si un de ceux-ci constatait qu'une oeuvre sur laquelle il a des droits a été utilisée dans BICTEL/e ULg sans son autorisation explicite, il est invité à prendre contact le plus rapidement possible avec la Direction du Réseau des Bibliothèques.


Parcourir BICTEL/e par Auteur|Département | Rechercher dans BICTEL/e


© Réseau des Bibliothèques de l'ULg, Grande traverse, 12 B37 4000 LIEGE