On the model-based stochastic value gradient for continuous reinforcement learning

28 August 2020

Papers citing "On the model-based stochastic value gradient for continuous reinforcement learning"

23 / 23 papers shown

Title
A Robust Model-Based Approach for Continuous-Time Policy Evaluation with Unknown Lévy Process Dynamics Qihao Ye Xiaochuan Tian Yuhua Zhu 36 1 0 02 Apr 2025
Stabilizing Reinforcement Learning in Differentiable Multiphysics Simulation Eliot Xing Vernon Luk Jean Oh 84 0 0 16 Dec 2024
MAD-TD: Model-Augmented Data stabilizes High Update Ratio RL C. Voelcker Marcel Hussing Eric Eaton Amir-massoud Farahmand Igor Gilitschenski 39 1 0 11 Oct 2024
MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot Learning Rafael Rafailov Kyle Hatch Victor Kolev John D. Martin Mariano Phielipp Chelsea Finn OffRL OnRL 22 9 0 06 Jan 2024
A Tractable Inference Perspective of Offline RL Xuejie Liu Guy Van den Broeck Mathias Niepert Yitao Liang OffRL 34 1 0 31 Oct 2023
Learning Modular Robot Locomotion from Demonstrations Julian Whitman Howie Choset 29 1 0 31 Oct 2022
Learning Modular Robot Visual-motor Locomotion Policies Julian Whitman Howie Choset 26 1 0 31 Oct 2022
RMBench: Benchmarking Deep Reinforcement Learning for Robotic Manipulator Control Yanfei Xiang Xin Wang Shu Hu Bin Zhu Xiaomeng Huang Xi Wu Siwei Lyu SSL 29 5 0 20 Oct 2022
Efficient Planning in a Compact Latent Action Space Zhengyao Jiang Tianjun Zhang Michael Janner Yueying Li Tim Rocktaschel Edward Grefenstette Yuandong Tian OffRL 24 36 0 22 Aug 2022
A Survey on Model-based Reinforcement Learning Fan Luo Tian Xu Hang Lai Xiong-Hui Chen Weinan Zhang Yang Yu OffRL LRM 50 101 0 19 Jun 2022
Deconstructing the Inductive Biases of Hamiltonian Neural Networks Nate Gruver Marc Finzi Samuel Stanton A. Wilson AI4CE 26 39 0 10 Feb 2022
Tutorial on amortized optimization Brandon Amos OffRL 75 43 0 01 Feb 2022
Sample-Efficient Reinforcement Learning via Conservative Model-Based Actor-Critic Zhihai Wang Jie Wang Qi Zhou Bin Li Houqiang Li 19 30 0 16 Dec 2021
Residual Pathway Priors for Soft Equivariance Constraints Marc Finzi Gregory W. Benton A. Wilson BDL UQCV 24 50 0 02 Dec 2021
Learning Pessimism for Robust and Efficient Off-Policy Reinforcement Learning Edoardo Cetin Oya Celiktutan OffRL 42 16 0 07 Oct 2021
Evaluating model-based planning and planner amortization for continuous control Arunkumar Byravan Leonard Hasenclever Piotr Trochim M. Berk Mirza Alessandro Davide Ialongo ... Jost Tobias Springenberg A. Abdolmaleki N. Heess J. Merel Martin Riedmiller 55 17 0 07 Oct 2021
Learning Dynamics Models for Model Predictive Agents M. Lutter Leonard Hasenclever Arunkumar Byravan Gabriel Dulac-Arnold Piotr Trochim N. Heess J. Merel Yuval Tassa AI4CE 57 26 0 29 Sep 2021
Mastering Visual Continuous Control: Improved Data-Augmented Reinforcement Learning Denis Yarats Rob Fergus A. Lazaric Lerrel Pinto OffRL 36 337 0 20 Jul 2021
Offline Reinforcement Learning as One Big Sequence Modeling Problem Michael Janner Qiyang Li Sergey Levine OffRL 66 645 0 03 Jun 2021
Model-Invariant State Abstractions for Model-Based Reinforcement Learning Manan Tomar Amy Zhang Roberto Calandra Matthew E. Taylor Joelle Pineau 19 24 0 19 Feb 2021
Iterative Amortized Policy Optimization Joseph Marino Alexandre Piché Alessandro Davide Ialongo Yisong Yue OffRL 63 21 0 20 Oct 2020
D2RL: Deep Dense Architectures in Reinforcement Learning Samarth Sinha Homanga Bharadhwaj A. Srinivas Animesh Garg OffRL AI4CE 51 56 0 19 Oct 2020
SUNRISE: A Simple Unified Framework for Ensemble Learning in Deep Reinforcement Learning Kimin Lee Michael Laskin A. Srinivas Pieter Abbeel OffRL 11 199 0 09 Jul 2020