A Unified View on Solving Objective Mismatch in Model-Based Reinforcement Learning

10 October 2023

Papers citing "A Unified View on Solving Objective Mismatch in Model-Based Reinforcement Learning"

7 / 7 papers shown

Title
MAD-TD: Model-Augmented Data stabilizes High Update Ratio RL C. Voelcker Marcel Hussing Eric Eaton Amir-massoud Farahmand Igor Gilitschenski 39 1 0 11 Oct 2024
The Alignment Ceiling: Objective Mismatch in Reinforcement Learning from Human Feedback Nathan Lambert Roberto Calandra ALM 20 31 0 31 Oct 2023
Simplifying Model-based RL: Learning Representations, Latent-space Models, and Policies with One Objective Raj Ghugare Homanga Bharadhwaj Benjamin Eysenbach Sergey Levine Ruslan Salakhutdinov OffRL 42 25 0 18 Sep 2022
Mismatched No More: Joint Model-Policy Optimization for Model-Based RL Benjamin Eysenbach Alexander Khazatsky Sergey Levine Ruslan Salakhutdinov OffRL 203 43 0 06 Oct 2021
Pessimistic Model-based Offline Reinforcement Learning under Partial Coverage Masatoshi Uehara Wen Sun OffRL 96 144 0 13 Jul 2021
COMBO: Conservative Offline Model-Based Policy Optimization Tianhe Yu Aviral Kumar Rafael Rafailov Aravind Rajeswaran Sergey Levine Chelsea Finn OffRL 219 413 0 16 Feb 2021
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 340 1,955 0 04 May 2020