Fullscreen
Loading...
 
Print

Module Reinforcement Learning, Michele Sebag et Herilalaina Rakotoarison

Livres


Vidéos


19 novembre


26 novembre

  • Multi-Armed Bandits & Applications

3 décembre

* TP (3h, Herilalaina Rakotoarison).

10 décembre

  • TP, Herilalaina Rakotoarison

7 janvier

  • Cours + TP, Function Approximation

14 janvier

  • Cours + TP, Direct Policy Search

Exposés (28 janvier et 4 février)

Par binome, choisissez un article ds la liste ci-dessous (premier arrivé premier servi), et présentez le (avec transparents ou au tableau) pour un exposé de 10 minutes + 5 mn questions : réimplémentation de l'algo si réaliste ; étude de sensibilité, analyse des résultats si code disponible. Le but de l'exposé est de rendre clair l'utilité et les limites de l'approche, et votre capacité de jugement (qualité de la validation, de l'argumentation, poussière sous le tapis, fertilité scientifique, etc).

28 janvier



4 février, ordre de passage.


  1. Human-level control through deep reinforcement learning
    1. Bouaziz, Dittrick
  2. Deep Reinforcement Learning with Double Q-learning
    1. Mirwaisse Djanbaz, Luc Gibaud, Théo Cornille
  3. Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm
    1. Jabri, Hamidèche (discutants: Duraz et Gao).
  4. The Predictron: End-To-End Learning and Planning
    1. Malik Kazi Aoual et Nouredine Nour
  1. Gated Path Planning Networks
    1. Adrien Chuttarsing Vu Thanh Trung
  1. Self-Consistent Trajectory Autoencoder: Hierarchical Reinforcement Learning with Trajectory Embeddings
    1. Maktouf et Garcia Cancian
  2. Latent Space Policies for Hierarchical Reinforcement Learning
    1. BIARD David BERRIEN Samuel
  1. Learning the Reward Function for a Misspecified Model
    1. Luca Veyrin-forrer
  1. End-to-end Active Object Tracking via Reinforcement Learning
    1. Joslove, Riolacci
  2. A Deep Reinforcement Learning Chatbot
    1. Yakoubi et Mascaro



Deep RL

Robustesse


Optimisation

Monte-Carlo Tree Search

Applications




Contributors to this page: sebag .
Page last modified on Monday 04 of February, 2019 12:50:46 CET by sebag.