Survival Instinct in Offline Reinforcement Learning

Survival Instinct in Offline Reinforcement Learning

5 June 2023

Dipendra Kumar Misra

Papers citing "Survival Instinct in Offline Reinforcement Learning"

14 / 14 papers shown

Title
Adversarial Policy Optimization for Offline Preference-based Reinforcement Learning Hyungkyu Kang Min-hwan Oh OffRL 47 0 0 07 Mar 2025
Uncertainty-based Offline Variational Bayesian Reinforcement Learning for Robustness under Diverse Data Corruptions Rui Yang Jie Wang Guoping Wu Yangqiu Song AAML OffRL 39 1 0 01 Nov 2024
Offline Reinforcement Learning for Learning to Dispatch for Job Shop Scheduling Jesse van Remmerden Z. Bukhsh Yingqian Zhang OffRL OnRL 45 1 0 16 Sep 2024
Listwise Reward Estimation for Offline Preference-based Reinforcement Learning Heewoong Choi Sangwon Jung Hongjoon Ahn Taesup Moon OffRL 44 2 0 08 Aug 2024
OASIS: Conditional Distribution Shaping for Offline Safe Reinforcement Learning Yi-Fan Yao Zhepeng Cen Wenhao Ding Hao-ming Lin Shiqi Liu Tingnan Zhang Wenhao Yu Ding Zhao OffRL OnRL 51 1 0 19 Jul 2024
Hindsight Preference Learning for Offline Preference-based Reinforcement Learning Chen-Xiao Gao Shengjun Fang Chenjun Xiao Yang Yu Zongzhang Zhang OffRL 35 0 0 05 Jul 2024
SaVeR: Optimal Data Collection Strategy for Safe Policy Evaluation in Tabular MDP Subhojyoti Mukherjee Josiah P. Hanna Robert Nowak OffRL 51 0 0 04 Jun 2024
Correlated Proxies: A New Definition and Improved Mitigation for Reward Hacking Cassidy Laidlaw Shivam Singhal Anca Dragan AAML 27 11 0 05 Mar 2024
Unsupervised Behavior Extraction via Random Intent Priors Haotian Hu Yiqin Yang Jianing Ye Ziqing Mai Chongjie Zhang OffRL 34 6 0 28 Oct 2023
Towards Robust Offline Reinforcement Learning under Diverse Data Corruption Rui Yang Han Zhong Jiawei Xu Amy Zhang Chong Zhang Lei Han Tong Zhang OffRL OnRL 41 15 0 19 Oct 2023
Adversarial Model for Offline Reinforcement Learning M. Bhardwaj Tengyang Xie Byron Boots Nan Jiang Ching-An Cheng AAML OffRL 37 26 0 21 Feb 2023
Offline Reinforcement Learning with Implicit Q-Learning Ilya Kostrikov Ashvin Nair Sergey Levine OffRL 214 843 0 12 Oct 2021
Pessimistic Model-based Offline Reinforcement Learning under Partial Coverage Masatoshi Uehara Wen Sun OffRL 98 9 0 13 Jul 2021
COMBO: Conservative Offline Model-Based Policy Optimization Tianhe Yu Aviral Kumar Rafael Rafailov Aravind Rajeswaran Sergey Levine Chelsea Finn OffRL 219 415 0 16 Feb 2021