Off-Policy Deep Reinforcement Learning without Exploration

7 December 2018

Papers citing "Off-Policy Deep Reinforcement Learning without Exploration"

50 / 415 papers shown

Title
MAD-TD: Model-Augmented Data stabilizes High Update Ratio RL C. Voelcker Marcel Hussing Eric Eaton Amir-massoud Farahmand Igor Gilitschenski 56 2 0 11 Oct 2024
Predictive Coding for Decision Transformer Tung M. Luu Donghoon Lee Chang D. Yoo OffRL 66 2 0 04 Oct 2024
Scaling Offline Model-Based RL via Jointly-Optimized World-Action Model Pretraining Jie Cheng Ruixi Qiao Gang Xiong Binhua Li Yingwei Ma Binhua Li Yongbin Li Yisheng Lv OffRL OnRL LM&Ro 57 3 0 01 Oct 2024
An Enhanced-State Reinforcement Learning Algorithm for Multi-Task Fusion in Large-Scale Recommender Systems Peng Liu Jiawei Zhu Cong Xu Ming Zhao Bin Wang 36 1 0 18 Sep 2024
Online Decision MetaMorphFormer: A Casual Transformer-Based Reinforcement Learning Framework of Universal Embodied Intelligence Luo Ji Runji Lin OffRL AI4CE LM&Ro 45 0 0 11 Sep 2024
Enhancing Sample Efficiency and Exploration in Reinforcement Learning through the Integration of Diffusion Models and Proximal Policy Optimization Gao Tianci Dmitriev D. Dmitry Konstantin A. Neusypin Yang Bo Rao Shengren OffRL 47 1 0 02 Sep 2024
SAMBO-RL: Shifts-aware Model-based Offline Reinforcement Learning Wang Luo Haoran Li Zicheng Zhang Congying Han Jiayu Lv Tiande Guo OffRL 59 1 0 23 Aug 2024
Domain Adaptation for Offline Reinforcement Learning with Limited Samples Weiqin Chen Sandipan Mishra Santiago Paternain OffRL 51 2 0 22 Aug 2024
Hokoff: Real Game Dataset from Honor of Kings and its Offline Reinforcement Learning Benchmarks Yun Qu Boyuan Wang Jianzhun Shao Yuhang Jiang Chen Chen ... Qiang Fu Wei Yang Guang Yang Lanxiao Huang Xiangyang Ji OffRL 61 9 0 20 Aug 2024
How to Solve Contextual Goal-Oriented Problems with Offline Datasets? Ying Fan Jingling Li Adith Swaminathan Aditya Modi Ching-An Cheng OffRL 72 0 0 14 Aug 2024
ROLeR: Effective Reward Shaping in Offline Reinforcement Learning for Recommender Systems Yi Zhang Ruihong Qiu Jiajun Liu Sen Wang OffRL 31 0 0 18 Jul 2024
Aligning Diffusion Behaviors with Q-functions for Efficient Continuous Control Huayu Chen Kaiwen Zheng Hang Su Jun Zhu 87 2 0 12 Jul 2024
Communication and Control Co-Design in 6G: Sequential Decision-Making with LLMs Xianfu Chen Celimuge Wu Yi Shen Yusheng Ji Tsutomu Yoshinaga Qiang Ni Charilaos C. Zarakovitis Honggang Zhang 67 1 0 06 Jul 2024
FOSP: Fine-tuning Offline Safe Policy through World Models Chenyang Cao Yucheng Xin Silang Wu Longxiang He Zichen Yan Junbo Tan Xueqian Wang OffRL 85 1 0 06 Jul 2024
To Switch or Not to Switch? Balanced Policy Switching in Offline Reinforcement Learning Tao Ma Xuzhi Yang Zoltan Szabo OffRL 79 0 0 01 Jul 2024
Residual Learning and Context Encoding for Adaptive Offline-to-Online Reinforcement Learning Mohammadreza Nakhaei Aidan Scannell Joni Pajarinen OffRL 69 1 0 12 Jun 2024
CDSA: Conservative Denoising Score-based Algorithm for Offline Reinforcement Learning Zeyuan Liu Kai Yang Xiu Li OffRL 64 0 0 11 Jun 2024
Augmenting Offline RL with Unlabeled Data Zhao Wang Briti Gangopadhyay Jia-Fong Yeh Shingo Takamatsu OffRL 33 0 0 11 Jun 2024
Integrating Domain Knowledge for handling Limited Data in Offline RL Briti Gangopadhyay Zhao Wang Jia-Fong Yeh Shingo Takamatsu OffRL 41 0 0 11 Jun 2024
Decision Mamba: A Multi-Grained State Space Model with Self-Evolution Regularization for Offline RL Qi Lv Xiang Deng Gongwei Chen Michael Yu Wang Liqiang Nie 93 7 0 08 Jun 2024
Pretraining Decision Transformers with Reward Prediction for In-Context Multi-task Structured Bandit Learning Subhojyoti Mukherjee Josiah P. Hanna Qiaomin Xie Robert Nowak 95 2 0 07 Jun 2024
UDQL: Bridging The Gap between MSE Loss and The Optimal Value Function in Offline Reinforcement Learning Yu Zhang Rui Yu Zhipeng Yao Wenyuan Zhang Jun Wang Liming Zhang OffRL 76 0 0 05 Jun 2024
Diffusion Actor-Critic: Formulating Constrained Policy Iteration as Diffusion Noise Regression for Offline Reinforcement Learning Linjiajie Fang Ruoxue Liu Jing Zhang Wenjia Wang Bing-Yi Jing OffRL 64 5 0 31 May 2024
GTA: Generative Trajectory Augmentation with Guidance for Offline Reinforcement Learning Jaewoo Lee Sujin Yun Taeyoung Yun Jinkyoo Park 84 7 0 27 May 2024
Cross-Domain Policy Adaptation by Capturing Representation Mismatch Jiafei Lyu Chenjia Bai Jingwen Yang Zongqing Lu Xiu Li 46 9 0 24 May 2024
State-Constrained Offline Reinforcement Learning Charles A. Hepburn Yue Jin Giovanni Montana OffRL 82 0 0 23 May 2024
Exclusively Penalized Q-learning for Offline Reinforcement Learning Junghyuk Yeom Yonghyeon Jo Jungmo Kim Sanghyeon Lee Seungyul Han OffRL 76 2 0 23 May 2024
A Survey on Vision-Language-Action Models for Embodied AI Yueen Ma Zixing Song Yuzheng Zhuang Jianye Hao Irwin King LM&Ro 87 48 0 23 May 2024
A Unified Linear Programming Framework for Offline Reward Learning from Human Demonstrations and Feedback Kihyun Kim Jiawei Zhang Asuman Ozdaglar P. Parrilo OffRL 74 1 0 20 May 2024
Towards Robust Policy: Enhancing Offline Reinforcement Learning with Adversarial Attacks and Defenses Thanh Nguyen Tung M. Luu Tri Ton Chang D. Yoo OffRL AAML 52 0 0 18 May 2024
Understanding the performance gap between online and offline alignment algorithms Yunhao Tang Daniel Guo Zeyu Zheng Daniele Calandriello Yuan Cao ... Rémi Munos Bernardo Avila-Pires Michal Valko Yong Cheng Will Dabney OffRL OnRL 46 63 0 14 May 2024
Ensemble Successor Representations for Task Generalization in Offline-to-Online Reinforcement Learning Changhong Wang Xudong Yu Chenjia Bai Qiaosheng Zhang Zhen Wang 48 1 0 12 May 2024
Contrastive Representation for Data Filtering in Cross-Domain Offline Reinforcement Learning Xiaoyu Wen Chenjia Bai Kang Xu Xudong Yu Yang Zhang Xuelong Li Zhen Wang 69 2 0 10 May 2024
The Curse of Diversity in Ensemble-Based Exploration Zhixuan Lin P. DÓro Evgenii Nikishin Rameswar Panda 55 1 0 07 May 2024
Out-of-Distribution Adaptation in Offline RL: Counterfactual Reasoning via Causal Normalizing Flows Minjae Cho Jonathan P. How Chuangchuang Sun OODD OffRL 53 1 0 06 May 2024
Rank2Reward: Learning Shaped Reward Functions from Passive Video Daniel Yang Davin Tjia Jacob Berg Dima Damen Pulkit Agrawal Abhishek Gupta OffRL 42 5 0 23 Apr 2024
Empowering Embodied Visual Tracking with Visual Foundation Models and Offline RL Fangwei Zhong Kui Wu Hai Ci Churan Wang Hao Chen OffRL 56 3 0 15 Apr 2024
IBCB: Efficient Inverse Batched Contextual Bandit for Behavioral Evolution History Yi Xu Weiran Shen Xiao Zhang Jun Xu OffRL 78 0 0 24 Mar 2024
Simple Ingredients for Offline Reinforcement Learning Edoardo Cetin Andrea Tirinzoni Matteo Pirotta A. Lazaric Yann Ollivier Ahmed Touati OffRL 62 2 0 19 Mar 2024
A2PO: Towards Effective Offline Reinforcement Learning from an Advantage-aware Perspective Yunpeng Qing Shunyu Liu Jingyuan Cong Kaixuan Chen Yihe Zhou Mingli Song OffRL 71 1 0 12 Mar 2024
Dissecting Deep RL with High Update Ratios: Combatting Value Divergence Marcel Hussing C. Voelcker Igor Gilitschenski Amir-massoud Farahmand Eric Eaton 55 3 0 09 Mar 2024
ELA: Exploited Level Augmentation for Offline Learning in Zero-Sum Games Shiqi Lei Kanghoon Lee Linjing Li Jinkyoo Park Jiachen Li OffRL 47 1 0 28 Feb 2024
Enhancing Reinforcement Learning Agents with Local Guides Paul Daoudi Bogdan Robu Christophe Prieur Ludovic Dos Santos M. Barlier OnRL 46 3 0 21 Feb 2024
Improving a Proportional Integral Controller with Reinforcement Learning on a Throttle Valve Benchmark Paul Daoudi B. Mavkov Bogdan Robu Christophe Prieur Emmanuel Witrant M. Barlier Ludovic Dos Santos 33 2 0 21 Feb 2024
Align Your Intents: Offline Imitation Learning via Optimal Transport Maksim Bobrin N. Buzun Dmitrii Krylov Dmitry V. Dylov OffRL 76 3 0 20 Feb 2024
The Edge-of-Reach Problem in Offline Model-Based Reinforcement Learning Anya Sims Cong Lu Yee Whye Teh OffRL 56 3 0 19 Feb 2024
Debiased Offline Representation Learning for Fast Online Adaptation in Non-stationary Dynamics Xinyu Zhang Wenjie Qiu Yi-Chen Li Lei Yuan Chengxing Jia Zongzhang Zhang Yang Yu OffRL 59 1 0 17 Feb 2024
Dataset Clustering for Improved Offline Policy Learning Qiang Wang Yixin Deng Francisco Roldan Sanchez Keru Wang Kevin McGuinness Noel E. O'Connor Stephen J. Redmond OffRL 44 2 0 14 Feb 2024
Counterfactual Influence in Markov Decision Processes Milad Kazemi Jessica Lally Ekaterina Tishchenko Hana Chockler Nicola Paoletti 35 1 0 13 Feb 2024
Federated Offline Reinforcement Learning: Collaborative Single-Policy Coverage Suffices Jiin Woo Laixi Shi Gauri Joshi Yuejie Chi OffRL 42 3 0 08 Feb 2024