Off-Policy Deep Reinforcement Learning without Exploration

7 December 2018

Papers citing "Off-Policy Deep Reinforcement Learning without Exploration"

50 / 415 papers shown

Title
Offline Actor-Critic Reinforcement Learning Scales to Large Models Jost Tobias Springenberg A. Abdolmaleki Jingwei Zhang Oliver Groth Michael Bloesch ... Sarah Bechtle Steven Kapturowski Roland Hafner N. Heess Martin Riedmiller OffRL LRM 48 13 0 08 Feb 2024
Transductive Reward Inference on Graph B. Qu Xiaofeng Cao Qing Guo Yi Chang Ivor W. Tsang Chengqi Zhang OffRL 66 0 0 06 Feb 2024
MoMA: Model-based Mirror Ascent for Offline Reinforcement Learning Mao Hong Zhiyue Zhang Yue Wu Yan Xu OffRL 82 0 0 21 Jan 2024
DDM-Lag : A Diffusion-based Decision-making Model for Autonomous Vehicles with Lagrangian Safety Enhancement Jiaqi Liu Peng Hang Xiaocong Zhao Jianqiang Wang Jian Sun 71 11 0 08 Jan 2024
HiBid: A Cross-Channel Constrained Bidding System with Budget Allocation by Hierarchical Offline Deep Reinforcement Learning Hao Wang Bo Tang Chi Harold Liu Shangqin Mao Jiahong Zhou Zipeng Dai Yaqi Sun Qianlong Xie Xingxing Wang Dong Wang OffRL 46 3 0 29 Dec 2023
RL-MPCA: A Reinforcement Learning Based Multi-Phase Computation Allocation Approach for Recommender Systems Jiahong Zhou Shunhui Mao Guoliang Yang Bo Tang Qianlong Xie Lebin Lin Xingxing Wang Dong Wang 39 8 0 27 Dec 2023
Offline Skill Generalization via Task and Motion Planning Shin Watanabe Geir Horn J. Tørresen K. Ellefsen OffRL 50 0 0 24 Nov 2023
A Tractable Inference Perspective of Offline RL Xuejie Liu Hoang Trung-Dung Guy Van den Broeck Yitao Liang OffRL 41 1 0 31 Oct 2023
Model-enhanced Contrastive Reinforcement Learning for Sequential Recommendation Chengpeng Li Zhengyi Yang Jizhi Zhang Jiancan Wu Dingxian Wang Xiangnan He Xiang Wang OffRL 57 1 0 25 Oct 2023
End-to-end Offline Reinforcement Learning for Glycemia Control Tristan Beolet Alice Adenis E. Huneker Maxime Louis OffRL 45 1 0 16 Oct 2023
Offline Reinforcement Learning for Optimizing Production Bidding Policies D. Korenkevych Frank Cheng Artsiom Balakir Alex Nikulkov Lingnan Gao Zhihao Cen Zuobing Xu Zheqing Zhu OffRL 43 1 0 13 Oct 2023
Boosting Continuous Control with Consistency Policy Yuhui Chen Haoran Li Dongbin Zhao OffRL 50 22 0 10 Oct 2023
Planning to Go Out-of-Distribution in Offline-to-Online Reinforcement Learning Trevor A. McInroe Adam Jelley Stefano V. Albrecht Amos Storkey OffRL OnRL 43 6 0 09 Oct 2023
Reward-Consistent Dynamics Models are Strongly Generalizable for Offline Reinforcement Learning Fan Luo Tian Xu Xingchen Cao Yang Yu OffRL 47 9 0 09 Oct 2023
Beyond Uniform Sampling: Offline Reinforcement Learning with Imbalanced Datasets Zhang-Wei Hong Aviral Kumar Sathwik Karnik Abhishek Bhandwaldar Akash Srivastava Joni Pajarinen Romain Laroche Abhishek Gupta Pulkit Agrawal OffRL 43 19 0 06 Oct 2023
Pre-training with Synthetic Data Helps Offline Reinforcement Learning Zecheng Wang Che Wang Zixuan Dong Keith Ross OffRL 53 5 0 01 Oct 2023
A General Offline Reinforcement Learning Framework for Interactive Recommendation Teng Xiao Donglin Wang OffRL 47 73 0 01 Oct 2023
Stackelberg Batch Policy Learning Wenzhuo Zhou Annie Qu OffRL 52 1 0 28 Sep 2023
Zero-Shot Reinforcement Learning from Low Quality Data Scott Jeen Tom Bewley Jonathan M. Cullen OffRL OnRL 50 1 0 26 Sep 2023
H2O+: An Improved Framework for Hybrid Offline-and-Online RL with Dynamics Gaps Haoyi Niu Tianying Ji Bingqi Liu Haocheng Zhao Xiangyu Zhu Jianying Zheng Pengfei Huang Guyue Zhou Jianming Hu Xianyuan Zhan OffRL OnRL AI4CE 47 7 0 22 Sep 2023
ACT: Empowering Decision Transformer with Dynamic Programming via Advantage Conditioning Chenxiao Gao Chenyang Wu Mingjun Cao Rui Kong Zongzhang Zhang Yang Yu OffRL 49 13 0 12 Sep 2023
Hundreds Guide Millions: Adaptive Offline Reinforcement Learning with Expert Guidance Qisen Yang Shenzhi Wang Qihang Zhang Gao Huang Shiji Song OffRL OnRL 43 8 0 04 Sep 2023
SMARLA: A Safety Monitoring Approach for Deep Reinforcement Learning Agents Amirhossein Zolfagharian Manel Abdellatif Lionel C. Briand S. Ramesh 47 5 0 03 Aug 2023
Benchmarking Offline Reinforcement Learning on Real-Robot Hardware Nico Gürtler Sebastian Blaes Pavel Kolev Felix Widmaier Manuel Wüthrich Stefan Bauer Bernhard Schölkopf Georg Martius OffRL 67 29 0 28 Jul 2023
Offline Multi-Agent Reinforcement Learning with Implicit Global-to-Local Value Regularization Xiangsen Wang Haoran Xu Yinan Zheng Xianyuan Zhan OffRL 47 24 0 21 Jul 2023
Robotic Manipulation Datasets for Offline Compositional Reinforcement Learning Marcel Hussing Jorge Armando Mendez Mendez Anisha Singrodia Cassandra Kent Eric Eaton OffRL 52 5 0 13 Jul 2023
Diffusion Policies for Out-of-Distribution Generalization in Offline Reinforcement Learning S. E. Ada Erhan Öztop Emre Ugur OffRL 59 17 0 10 Jul 2023
RLTF: Reinforcement Learning from Unit Test Feedback Jiate Liu Yiqin Zhu Kaiwen Xiao Qiang Fu Xiao Han Wei Yang Deheng Ye OffRL 55 57 0 10 Jul 2023
Beyond Conservatism: Diffusion Policies in Offline Multi-agent Reinforcement Learning Zhuoran Li Ling Pan Longbo Huang DiffM OffRL 32 7 0 04 Jul 2023
Is Risk-Sensitive Reinforcement Learning Properly Resolved? Ruiwen Zhou Minghuan Liu Kan Ren Xufang Luo Weinan Zhang Dongsheng Li 32 2 0 02 Jul 2023
Prioritized Trajectory Replay: A Replay Memory for Data-driven Reinforcement Learning Jinyi Liu Yi Ma Jianye Hao Yujing Hu Yan Zheng Tangjie Lv Changjie Fan OffRL 83 2 0 27 Jun 2023
Adaptive Ensemble Q-learning: Minimizing Estimation Bias via Error Feedback Hang Wang Sen Lin Junshan Zhang 29 19 0 20 Jun 2023
Empowering NLG: Offline Reinforcement Learning for Informal Summarization in Online Domains Zhiwei Tai Po-Chuan Chen OffRL 31 0 0 17 Jun 2023
Delphic Offline Reinforcement Learning under Nonidentifiable Hidden Confounding Alizée Pace Hugo Yèche Bernhard Schölkopf Gunnar Rätsch Guy Tennenholtz OffRL 37 6 0 01 Jun 2023
Safe Offline Reinforcement Learning with Real-Time Budget Constraints Qian Lin Bo Tang Zifan Wu Chao Yu Shangqin Mao Qianlong Xie Xingxing Wang Dong Wang OffRL 52 11 0 01 Jun 2023
Offline Meta Reinforcement Learning with In-Distribution Online Adaptation Jianhao Wang Jin Zhang Haozhe Jiang Junyu Zhang Liwei Wang Chongjie Zhang OffRL 35 9 0 31 May 2023
Passive learning of active causal strategies in agents and language models Andrew Kyle Lampinen Stephanie C. Y. Chan Ishita Dasgupta A. Nam Jane X. Wang 47 16 0 25 May 2023
Prompt-Tuning Decision Transformer with Preference Ranking Shengchao Hu Li Shen Ya Zhang Dacheng Tao OffRL 48 14 0 16 May 2023
Federated Ensemble-Directed Offline Reinforcement Learning Desik Rengarajan N. Ragothaman D. Kalathil S. Shakkottai OffRL 45 1 0 04 May 2023
Leveraging Factored Action Spaces for Efficient Offline Reinforcement Learning in Healthcare Shengpu Tang Maggie Makar Michael Sjoding Finale Doshi-Velez Jenna Wiens OffRL 71 40 0 02 May 2023
Efficient Deep Reinforcement Learning Requires Regulating Overfitting Qiyang Li Aviral Kumar Ilya Kostrikov Sergey Levine OffRL 52 32 0 20 Apr 2023
MAHALO: Unifying Offline Reinforcement Learning and Imitation Learning from Observations Anqi Li Byron Boots Ching-An Cheng OffRL 58 16 0 30 Mar 2023
Planning with Sequence Models through Iterative Energy Minimization Hongyi Chen Yilun Du Yiye Chen J. Tenenbaum Patricio A. Vela 42 6 0 28 Mar 2023
Deep RL with Hierarchical Action Exploration for Dialogue Generation Itsugun Cho Ryota Takahashi Yusaku Yanase Hiroaki Saito 45 2 0 22 Mar 2023
Towards Real-World Applications of Personalized Anesthesia Using Policy Constraint Q Learning for Propofol Infusion Control Xiuding Cai Jiao Chen Yaoyao Zhu Beiming Wang Yu Yao OffRL 41 5 0 17 Mar 2023
Psychotherapy AI Companion with Reinforcement Learning Recommendations and Interpretable Policy Dynamics Baihan Lin Guillermo Cecchi Djallel Bouneffouf OffRL AI4TS AI4MH 57 11 0 16 Mar 2023
Adaptive Policy Learning for Offline-to-Online Reinforcement Learning Han Zheng Xufang Luo Pengfei Wei Xuan Song Dongsheng Li Jing Jiang OffRL OnRL 26 21 0 14 Mar 2023
Mastering Strategy Card Game (Legends of Code and Magic) via End-to-End Policy and Optimistic Smooth Fictitious Play Wei Xi Yongxin Zhang Changnan Xiao Xuefeng Huang Shihong Deng Haowei Liang Jie Chen Peng Sun OffRL 50 8 0 07 Mar 2023
Environment Transformer and Policy Optimization for Model-Based Offline Reinforcement Learning Pengqin Wang Meixin Zhu Shaojie Shen OffRL 38 1 0 07 Mar 2023
Graph Decision Transformer Shengchao Hu Li Shen Ya Zhang Dacheng Tao OffRL 55 16 0 07 Mar 2023