Model-Based Value Estimation for Efficient Model-Free Reinforcement Learning

28 February 2018

Papers citing "Model-Based Value Estimation for Efficient Model-Free Reinforcement Learning"

50 / 197 papers shown

Title
X-RLflow: Graph Reinforcement Learning for Neural Network Subgraphs Transformation Guoliang He Sean Parker Eiko Yoneki 56 4 0 28 Apr 2023
Policy Resilience to Environment Poisoning Attacks on Reinforcement Learning Hang Xu Xinghua Qu Zinovi Rabinovich 93 1 0 24 Apr 2023
Models as Agents: Optimizing Multi-Step Predictions of Interactive Local Models in Model-Based Multi-Agent Reinforcement Learning Zifan Wu Chao Yu Chong Chen Jianye Hao H. Zhuo 81 10 0 31 Mar 2023
Foundation Models for Decision Making: Problems, Methods, and Opportunities Sherry Yang Ofir Nachum Yilun Du Jason W. Wei Pieter Abbeel Dale Schuurmans LM&Ro OffRL LRM AI4CE 200 172 0 07 Mar 2023
Diminishing Return of Value Expansion Methods in Model-Based Reinforcement Learning Daniel Palenicek M. Lutter João Carvalho Jan Peters 84 4 0 07 Mar 2023
Sample-efficient Real-time Planning with Curiosity Cross-Entropy Method and Contrastive Learning Mostafa Kotb C. Weber S. Wermter 74 4 0 07 Mar 2023
Taylor TD-learning Michele Garibbo Maxime Robeyns Laurence Aitchison OffRL 60 1 0 27 Feb 2023
Model-Based Decentralized Policy Optimization Hao Luo Jiechuan Jiang Zongqing Lu 67 0 0 16 Feb 2023
Predictable MDP Abstraction for Unsupervised Model-Based RL Seohong Park Sergey Levine 64 9 0 08 Feb 2023
Sample-Efficient Multi-Objective Learning via Generalized Policy Improvement Prioritization L. N. Alegre A. Bazzan D. Roijers Ann Nowé Bruno C. da Silva 80 30 0 18 Jan 2023
Model-based trajectory stitching for improved behavioural cloning and its applications Charles A. Hepburn Giovanni Montana OffRL 81 7 0 08 Dec 2022
Model-based Trajectory Stitching for Improved Offline Reinforcement Learning Charles A. Hepburn Giovanni Montana OffRL 84 14 0 21 Nov 2022
A Survey on Reinforcement Learning in Aviation Applications Pouria Razzaghi Amin Tabrizian Wei Guo Shulu Chen Abenezer Taye Ellis E. Thompson Alexis Bregeon Ali Baheri Peng Wei OffRL 54 56 0 03 Nov 2022
Sensor Control for Information Gain in Dynamic, Sparse and Partially Observed Environments J. Burns A. Sundaresan Pedro Sequeira Vidyasagar Sadhu 58 0 0 03 Nov 2022
On Many-Actions Policy Gradient Michal Nauman Marek Cygan 70 0 0 24 Oct 2022
Integrated Decision and Control for High-Level Automated Vehicles by Mixed Policy Gradient and Its Experiment Verification Yang Guan Liye Tang Chuanxiao Li Shengbo Eben Li Yangang Ren Junqing Wei Bo Zhang Ke Li 45 0 0 19 Oct 2022
When to Update Your Model: Constrained Model-based Reinforcement Learning Tianying Ji Yu-Juan Luo Gang Hua Mingxuan Jing Fengxiang He Wen-bing Huang 82 19 0 15 Oct 2022
Distributional Reward Estimation for Effective Multi-Agent Deep Reinforcement Learning Jifeng Hu Yanchao Sun Hechang Chen Sili Huang Haiyin Piao Yi-Ju Chang Lichao Sun 68 5 0 14 Oct 2022
Long N-step Surrogate Stage Reward to Reduce Variances of Deep Reinforcement Learning in Complex Problems Junmin Zhong Ruofan Wu J. Si LRM 40 0 0 10 Oct 2022
Conservative Bayesian Model-Based Value Expansion for Offline Policy Optimization Jihwan Jeong Xiaoyu Wang Michael Gimelfarb Hyunwoo J. Kim Baher Abdulhai Scott Sanner OffRL 118 12 0 07 Oct 2022
Design of experiments for the calibration of history-dependent models via deep reinforcement learning and an enhanced Kalman filter Ruben Villarreal Nikolaos N. Vlassis Nhon N. Phan Tommie A. Catanach Reese E. Jones N. Trask S. Kramer WaiChing Sun OffRL 59 12 0 27 Sep 2022
Simplifying Model-based RL: Learning Representations, Latent-space Models, and Policies with One Objective Raj Ghugare Homanga Bharadhwaj Benjamin Eysenbach Sergey Levine Ruslan Salakhutdinov OffRL 106 27 0 18 Sep 2022
Value Summation: A Novel Scoring Function for MPC-based Model-based Reinforcement Learning Mehran Raisi Amirhossein Noohian Lucy McCutcheon Saber Fallah 49 3 0 16 Sep 2022
Conservative Dual Policy Optimization for Efficient Model-Based Reinforcement Learning Shen Zhang 58 6 0 16 Sep 2022
Model-based Reinforcement Learning with Multi-step Plan Value Estimation Hao-Chu Lin Yihao Sun Jiajin Zhang Yang Yu OffRL 75 7 0 12 Sep 2022
Causal Dynamics Learning for Task-Independent State Abstraction Zizhao Wang Xuesu Xiao Zifan Xu Yuke Zhu Peter Stone CML 80 58 0 27 Jun 2022
A Survey on Model-based Reinforcement Learning Fan Luo Tian Xu Hang Lai Xiong-Hui Chen Weinan Zhang Yang Yu OffRL LRM 125 111 0 19 Jun 2022
Stock Trading Optimization through Model-based Reinforcement Learning with Resistance Support Relative Strength Huifang Huang Ting Gao Yi Gui Jinqiu Guo Peng Zhang 52 0 0 30 May 2022
RLFlow: Optimising Neural Network Subgraph Transformation with World Models Sean Parker Sami Alabed Eiko Yoneki 34 0 0 03 May 2022
Data-driven control of spatiotemporal chaos with reduced-order neural ODE-based models and reinforcement learning Kevin Zeng Alec J. Linot M. Graham AI4CE 81 29 0 01 May 2022
Mingling Foresight with Imagination: Model-Based Cooperative Multi-Agent Reinforcement Learning Zhiwei Xu Dapeng Li Bin Zhang Yuan Zhan Yunru Bai Guoliang Fan OffRL 72 8 0 20 Apr 2022
Revisiting Model-based Value Expansion Daniel Palenicek M. Lutter Jan Peters 70 2 0 28 Mar 2022
Neural-Progressive Hedging: Enforcing Constraints in Reinforcement Learning with Stochastic Programming Supriyo Ghosh L. Wynter Shiau Hong Lim D. Nguyen 63 0 0 27 Feb 2022
Bayesian sense of time in biological and artificial brains Zafeirios Fountas Alexey Zakharov 60 0 0 14 Jan 2022
Multiagent Model-based Credit Assignment for Continuous Control Dongge Han Chris Xiaoxuan Lu Tomasz P. Michalak Michael Wooldridge 63 6 0 27 Dec 2021
Model-Value Inconsistency as a Signal for Epistemic Uncertainty Angelos Filos Eszter Vértes Zita Marinho Gregory Farquhar Diana Borsa A. Friesen Feryal M. P. Behbahani Tom Schaul André Barreto Simon Osindero 104 7 0 08 Dec 2021
ED2: Environment Dynamics Decomposition World Models for Continuous Control Jianye Hao Yifu Yuan Cong Wang Zhen Wang OffRL 91 2 0 06 Dec 2021
On Effective Scheduling of Model-based Reinforcement Learning Hang Lai Jian Shen Weinan Zhang Yimin Huang Xingzhi Zhang Ruiming Tang Yong Yu Zhenguo Li 95 19 0 16 Nov 2021
Look Before You Leap: Safe Model-Based Reinforcement Learning with Human Intervention Yunkun Xu Zhen-yu Liu Guifang Duan Jiangcheng Zhu X. Bai Jianrong Tan 81 9 0 10 Nov 2021
Gradients are Not All You Need Luke Metz C. Freeman S. Schoenholz Tal Kachman 120 93 0 10 Nov 2021
Using Time-Series Privileged Information for Provably Efficient Learning of Prediction Models R. Karlsson Martin Willbo Zeshan Hussain Rahul G. Krishnan David Sontag Fredrik D. Johansson AI4TS 43 4 0 28 Oct 2021
On-Policy Model Errors in Reinforcement Learning Lukas P. Frohlich Maksym Lefarov Melanie Zeilinger Felix Berkenkamp OnRL 81 6 0 15 Oct 2021
Imaginary Hindsight Experience Replay: Curious Model-based Learning for Sparse Reward Tasks Robert McCarthy Qiang Wang S. Redmond OffRL 72 15 0 05 Oct 2021
Continuous-Time Fitted Value Iteration for Robust Policies M. Lutter Boris Belousov Shie Mannor Dieter Fox Animesh Garg Jan Peters 70 9 0 05 Oct 2021
Learning Dynamics Models for Model Predictive Agents M. Lutter Leonard Hasenclever Arunkumar Byravan Gabriel Dulac-Arnold Piotr Trochim N. Heess J. Merel Yuval Tassa AI4CE 114 28 0 29 Sep 2021
Deep Reinforcement Learning with Adjustments H. Khorasgani Haiyan Wang Chetan Gupta Susumu Serita 25 2 0 28 Sep 2021
Eden: A Unified Environment Framework for Booming Reinforcement Learning Algorithms Ruizhi Chen Xiaoyu Wu Yansong Pan Kaizhao Yuan Ling Li ... Shaohui Peng Xishan Zhang Zidong Du Qi Guo Yunji Chen OffRL 61 3 0 04 Sep 2021
Model-Based Opponent Modeling Xiaopeng Yu Jiechuan Jiang Wanpeng Zhang Haobin Jiang Zongqing Lu OffRL 109 29 0 04 Aug 2021
High-Accuracy Model-Based Reinforcement Learning, a Survey Aske Plaat W. Kosters Mike Preuss OffRL 75 37 0 17 Jul 2021
Visual Adversarial Imitation Learning using Variational Models Rafael Rafailov Tianhe Yu Aravind Rajeswaran Chelsea Finn SSL 116 50 0 16 Jul 2021