Imagined Value Gradients: Model-Based Policy Optimization with Transferable Latent Dynamics Models

9 October 2019

Arunkumar Byravan

Jost Tobias Springenberg

Martin Riedmiller

Papers citing "Imagined Value Gradients: Model-Based Policy Optimization with Transferable Latent Dynamics Models"

32 / 32 papers shown

Title
Evaluating World Models with LLM for Decision Making Chang Yang Xinrun Wang Junzhe Jiang Qinggang Zhang Xiao Huang LLMAG ELM 133 5 0 13 Nov 2024
Meta-DT: Offline Meta-RL as Conditional Sequence Modeling with World Model Disentanglement Zhi Wang Li Zhang Wenhao Wu Yuanheng Zhu Dongbin Zhao C. L. Philip Chen OffRL 100 9 0 15 Oct 2024
Adaptive Horizon Actor-Critic for Policy Learning in Contact-Rich Differentiable Simulation Ignat Georgiev K. Srinivasan Jie Xu Eric Heiden Animesh Garg 93 14 0 28 May 2024
Guided Cooperation in Hierarchical Reinforcement Learning via Model-based Rollout Haoran Wang Zeshen Tang Leya Yang Yaoru Sun Fang Wang Siyu Zhang Ye-Ting Chen 96 2 0 24 Sep 2023
Diminishing Return of Value Expansion Methods in Model-Based Reinforcement Learning Daniel Palenicek M. Lutter João Carvalho Jan Peters 79 4 0 07 Mar 2023
Leveraging Jumpy Models for Planning and Fast Learning in Robotic Domains Jingwei Zhang Jost Tobias Springenberg Arunkumar Byravan Leonard Hasenclever A. Abdolmaleki Dushyant Rao N. Heess Martin Riedmiller 78 5 0 24 Feb 2023
Investigating the role of model-based learning in exploration and transfer Jacob Walker Eszter Vértes Yazhe Li Gabriel Dulac-Arnold Ankesh Anand T. Weber Jessica B. Hamrick OffRL 70 7 0 08 Feb 2023
Learning General World Models in a Handful of Reward-Free Deployments Yingchen Xu Jack Parker-Holder Aldo Pacchiano Philip J. Ball Oleh Rybkin Stephen J. Roberts Tim Rocktaschel Edward Grefenstette OffRL 112 10 0 23 Oct 2022
A model-based approach to meta-Reinforcement Learning: Transformers and tree search Brieuc Pinon Jean-Charles Delvenne Raphaël Jungers OffRL 69 3 0 24 Aug 2022
A Survey on Model-based Reinforcement Learning Fan Luo Tian Xu Hang Lai Xiong-Hui Chen Weinan Zhang Yang Yu OffRL LRM 121 110 0 19 Jun 2022
DreamingV2: Reinforcement Learning with Discrete World Models without Reconstruction Masashi Okada T. Taniguchi 3DV OffRL 95 24 0 01 Mar 2022
GrASP: Gradient-Based Affordance Selection for Planning Vivek Veeriah Zeyu Zheng Richard L. Lewis Satinder Singh 74 4 0 08 Feb 2022
Tutorial on amortized optimization Brandon Amos OffRL 177 48 0 01 Feb 2022
Model-Value Inconsistency as a Signal for Epistemic Uncertainty Angelos Filos Eszter Vértes Zita Marinho Gregory Farquhar Diana Borsa A. Friesen Feryal M. P. Behbahani Tom Schaul André Barreto Simon Osindero 104 7 0 08 Dec 2021
Self-Consistent Models and Values Roy Miles Kate Baumli Zita Marinho Angelos Filos Matteo Hessel Hado van Hasselt David Silver 91 8 0 25 Oct 2021
Evaluating model-based planning and planner amortization for continuous control Arunkumar Byravan Leonard Hasenclever Piotr Trochim M. Berk Mirza Alessandro Davide Ialongo ... Jost Tobias Springenberg A. Abdolmaleki N. Heess J. Merel Martin Riedmiller 105 17 0 07 Oct 2021
Learning Dynamics Models for Model Predictive Agents M. Lutter Leonard Hasenclever Arunkumar Byravan Gabriel Dulac-Arnold Piotr Trochim N. Heess J. Merel Yuval Tassa AI4CE 114 28 0 29 Sep 2021
Collect & Infer -- a fresh look at data-efficient Reinforcement Learning Martin Riedmiller Jost Tobias Springenberg Roland Hafner N. Heess OffRL 85 18 0 23 Aug 2021
MBRL-Lib: A Modular Library for Model-based Reinforcement Learning Luis Pineda Brandon Amos Amy Zhang Nathan Lambert Roberto Calandra OffRL 84 47 0 20 Apr 2021
Learning and Planning in Complex Action Spaces Thomas Hubert Julian Schrittwieser Ioannis Antonoglou M. Barekatain Simon Schmitt David Silver 90 79 0 13 Apr 2021
Muesli: Combining Improvements in Policy Optimization Matteo Hessel Ivo Danihelka Fabio Viola A. Guez Simon Schmitt Laurent Sifre T. Weber David Silver H. V. Hasselt 105 66 0 13 Apr 2021
Latent Skill Planning for Exploration and Transfer Kevin Xie Homanga Bharadhwaj Danijar Hafner Animesh Garg Florian Shkurti 95 20 0 27 Nov 2020
On the role of planning in model-based deep reinforcement learning Jessica B. Hamrick A. Friesen Feryal M. P. Behbahani A. Guez Fabio Viola Sims Witherspoon Thomas W. Anthony Lars Buesing Petar Velickovic T. Weber OffRL 108 67 0 08 Nov 2020
Representation Matters: Improving Perception and Exploration for Robotics Markus Wulfmeier Arunkumar Byravan Tim Hertweck I. Higgins Ankush Gupta ... Malcolm Reynolds Denis Teplyashin Roland Hafner Thomas Lampe Martin Riedmiller 93 16 0 03 Nov 2020
Bridging Imagination and Reality for Model-Based Deep Reinforcement Learning Guangxiang Zhu Minghao Zhang Honglak Lee Chongjie Zhang OffRL 135 18 0 23 Oct 2020
Iterative Amortized Policy Optimization Joseph Marino Alexandre Piché Alessandro Davide Ialongo Yisong Yue OffRL 117 21 0 20 Oct 2020
Local Search for Policy Iteration in Continuous Control Jost Tobias Springenberg N. Heess D. Mankowitz J. Merel Arunkumar Byravan ... Julian Schrittwieser Yuval Tassa J. Buchli Dan Belov Martin Riedmiller OffRL 77 15 0 12 Oct 2020
Mastering Atari with Discrete World Models Danijar Hafner Timothy Lillicrap Mohammad Norouzi Jimmy Ba DRL 173 875 0 05 Oct 2020
On the model-based stochastic value gradient for continuous reinforcement learning Brandon Amos Samuel Stanton Denis Yarats A. Wilson 83 71 0 28 Aug 2020
Goal-Aware Prediction: Learning to Model What Matters Suraj Nair Silvio Savarese Chelsea Finn 85 65 0 14 Jul 2020
Learning to Fly via Deep Model-Based Reinforcement Learning Philip Becker-Ehmck Maximilian Karl Jan Peters Patrick van der Smagt SSL 132 37 0 19 Mar 2020
Dream to Control: Learning Behaviors by Latent Imagination Danijar Hafner Timothy Lillicrap Jimmy Ba Mohammad Norouzi VLM 176 1,376 0 03 Dec 2019