Conservative Data Sharing for Multi-Task Offline Reinforcement Learning

16 September 2021

Papers citing "Conservative Data Sharing for Multi-Task Offline Reinforcement Learning"

50 / 55 papers shown

Title
Efficient Reinforcement Learning by Guiding Generalist World Models with Non-Curated Data Yi Zhao Aidan Scannell Wenshuai Zhao Yuxin Hou Tianyu Cui Le Chen Dieter Büchler Arno Solin Juho Kannala Joni Pajarinen OffRL OnRL 96 1 0 26 Feb 2025
ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement Learning Kun Wu Yinuo Zhao Zhihao Xu Zhengping Che Chengxiang Yin C. Liu Qinru Qiu Feiferi Feng OffRL 100 1 0 22 Dec 2024
Offline Behavior Distillation Shiye Lei Sen Zhang Dacheng Tao OffRL 36 0 0 30 Oct 2024
Active Fine-Tuning of Generalist Policies Marco Bagatella Jonas Hübotter Georg Martius Andreas Krause 32 0 0 07 Oct 2024
Skills Regularized Task Decomposition for Multi-task Offline Reinforcement Learning Minjong Yoo Sangwoo Cho Honguk Woo OffRL 37 10 0 28 Aug 2024
Leveraging Unlabeled Data Sharing through Kernel Function Approximation in Offline Reinforcement Learning Yen-Ru Lai Fu-Chieh Chang Pei-Yuan Wu OffRL 73 1 0 22 Aug 2024
Hokoff: Real Game Dataset from Honor of Kings and its Offline Reinforcement Learning Benchmarks Yun Qu Boyuan Wang Jianzhun Shao Yuhang Jiang Chen Chen ... Qiang Fu Wei Yang Guang Yang Lanxiao Huang Xiangyang Ji OffRL 51 9 0 20 Aug 2024
How to Solve Contextual Goal-Oriented Problems with Offline Datasets? Ying Fan Jingling Li Adith Swaminathan Aditya Modi Ching-An Cheng OffRL 72 0 0 14 Aug 2024
Listwise Reward Estimation for Offline Preference-based Reinforcement Learning Heewoong Choi Sangwon Jung Hongjoon Ahn Taesup Moon OffRL 39 2 0 08 Aug 2024
Urban-Focused Multi-Task Offline Reinforcement Learning with Contrastive Data Sharing Xinbo Zhao Yingxue Zhang Xin Zhang Yu Yang Yiqun Xie Yanhua Li Jun Luo OffRL 45 2 0 20 Jun 2024
A Behavior-Aware Approach for Deep Reinforcement Learning in Non-stationary Environments without Known Change Points Zihe Liu Jie Lu Guangquan Zhang Junyu Xuan 32 0 0 23 May 2024
Contrastive Representation for Data Filtering in Cross-Domain Offline Reinforcement Learning Xiaoyu Wen Chenjia Bai Kang Xu Xudong Yu Yang Zhang Xuelong Li Zhen Wang 41 2 0 10 May 2024
Pessimistic Value Iteration for Multi-Task Data Sharing in Offline Reinforcement Learning Chenjia Bai Lingxiao Wang Jianye Hao Zhuoran Yang Bin Zhao Zhen Wang Xuelong Li OffRL 34 9 0 30 Apr 2024
Leveraging Sub-Optimal Data for Human-in-the-Loop Reinforcement Learning Calarina Muslimani M. E. Taylor OffRL 43 2 0 30 Apr 2024
Efficient Multi-Task Reinforcement Learning via Task-Specific Action Correction Jinyuan Feng Min Chen Zhiqiang Pu Tenghai Qiu Jianqiang Yi 27 2 0 09 Apr 2024
Disentangling Policy from Offline Task Representation Learning via Adversarial Data Augmentation Chengxing Jia Fuxiang Zhang Yi-Chen Li Chenxiao Gao Xu-Hui Liu Lei Yuan Zongzhang Zhang Yang Yu AAML 39 4 0 12 Mar 2024
Multi Task Inverse Reinforcement Learning for Common Sense Reward Neta Glazer Aviv Navon Aviv Shamsian Ethan Fetaya 27 0 0 17 Feb 2024
Multi-Task Learning of Active Fault-Tolerant Controller for Leg Failures in Quadruped robots Tai-Wei Hou Jiaxin Tu Xiaofei Gao Zhiyan Dong Peng Zhai Lihua Zhang 25 3 0 14 Feb 2024
Sharing Knowledge in Multi-Task Deep Reinforcement Learning Carlo DÉramo Davide Tateo Andrea Bonarini Marcello Restelli Jan Peters 59 122 0 17 Jan 2024
MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot Learning Rafael Rafailov Kyle Hatch Victor Kolev John D. Martin Mariano Phielipp Chelsea Finn OffRL OnRL 22 9 0 06 Jan 2024
On-Policy Policy Gradient Reinforcement Learning Without On-Policy Sampling Nicholas Corrado Josiah P. Hanna OffRL 18 1 0 14 Nov 2023
Unsupervised Behavior Extraction via Random Intent Priors Haotian Hu Yiqin Yang Jianing Ye Ziqing Mai Chongjie Zhang OffRL 32 6 0 28 Oct 2023
Deep Reinforcement Learning with Explicit Context Representation Francisco Munguia-Galeano Ah-Hwee Tan Ze Ji OffRL 30 2 0 15 Oct 2023
Beyond Uniform Sampling: Offline Reinforcement Learning with Imbalanced Datasets Zhang-Wei Hong Aviral Kumar Sathwik Karnik Abhishek Bhandwaldar Akash Srivastava Joni Pajarinen Romain Laroche Abhishek Gupta Pulkit Agrawal OffRL 38 19 0 06 Oct 2023
Learning and reusing primitive behaviours to improve Hindsight Experience Replay sample efficiency Francisco Roldan Sanchez Qiang Wang David Córdova Bulens Kevin McGuinness Stephen J. Redmond Noel E. O'Connor OffRL OnRL 26 1 0 03 Oct 2023
Distill Knowledge in Multi-task Reinforcement Learning with Optimal-Transport Regularization Bang Giang Le Viet-Cuong Ta OT 32 1 0 27 Sep 2023
Robotic Manipulation Datasets for Offline Compositional Reinforcement Learning Marcel Hussing Jorge Armando Mendez Mendez Anisha Singrodia Cassandra Kent Eric Eaton OffRL 31 5 0 13 Jul 2023
Diffusion Model is an Effective Planner and Data Synthesizer for Multi-Task Reinforcement Learning Haoran He Chenjia Bai Kang Xu Zhuoran Yang Weinan Zhang Dong Wang Bingyan Zhao Xuelong Li DiffM OffRL 30 89 0 29 May 2023
Cross-Domain Policy Adaptation via Value-Guided Data Filtering Kang Xu Chenjia Bai Xiaoteng Ma Dong Wang Bingyan Zhao Zhen Wang Xuelong Li Wei Li 29 14 0 28 May 2023
Future-conditioned Unsupervised Pretraining for Decision Transformer Zhihui Xie Zichuan Lin Deheng Ye Qiang Fu Wei Yang Shuai Li OffRL OnRL 43 22 0 26 May 2023
OER: Offline Experience Replay for Continual Offline Reinforcement Learning Sibo Gai Donglin Wang Li He CLL OffRL 42 3 0 23 May 2023
Federated Ensemble-Directed Offline Reinforcement Learning Desik Rengarajan N. Ragothaman D. Kalathil S. Shakkottai OffRL 26 1 0 04 May 2023
A Survey of Demonstration Learning André Rosa de Sousa Porfírio Correia Luís A. Alexandre OffRL 33 17 0 20 Mar 2023
The Provable Benefits of Unsupervised Data Sharing for Offline Reinforcement Learning Haotian Hu Yiqin Yang Qianchuan Zhao Chongjie Zhang OffRL 11 5 0 27 Feb 2023
Mind the Gap: Offline Policy Optimization for Imperfect Rewards Jianxiong Li Xiao Hu Haoran Xu Jingjing Liu Xianyuan Zhan Qing-Shan Jia Ya-Qin Zhang OffRL 38 19 0 03 Feb 2023
QMP: Q-switch Mixture of Policies for Multi-Task Behavior Sharing Grace Zhang Ayush Jain Injune Hwang Shao-Hua Sun Joseph J. Lim 22 5 0 01 Feb 2023
Multi-Task Imitation Learning for Linear Dynamical Systems Thomas T. Zhang Katie Kang Bruce D. Lee Claire Tomlin Sergey Levine Stephen Tu Nikolai Matni 35 23 0 01 Dec 2022
Pre-Training for Robots: Offline RL Enables Learning New Tasks from a Handful of Trials Aviral Kumar Anika Singh F. Ebert Mitsuhiko Nakamoto Yanlai Yang Chelsea Finn Sergey Levine OffRL OnRL 123 66 0 11 Oct 2022
Using Both Demonstrations and Language Instructions to Efficiently Learn Robotic Tasks Albert Yu Raymond J. Mooney LM&Ro 32 19 0 10 Oct 2022
Hierarchical Decision Transformer André Rosa de Sousa Porfírio Correia L. A. Alexandre OffRL 92 10 0 21 Sep 2022
Don't Start From Scratch: Leveraging Prior Data to Automate Robotic Reinforcement Learning Homer Walke Jonathan Yang Albert Yu Aviral Kumar Jedrzej Orbik Avi Singh Sergey Levine OffRL OnRL 25 32 0 11 Jul 2022
Phasic Self-Imitative Reduction for Sparse-Reward Goal-Conditioned Reinforcement Learning Yunfei Li Tian Gao Jiaqi Yang Huazhe Xu Yi Wu OffRL 19 22 0 24 Jun 2022
Planning to Practice: Efficient Online Fine-Tuning by Composing Goals in Latent Space Kuan Fang Patrick Yin Ashvin Nair Sergey Levine OffRL 52 29 0 17 May 2022
A Simple Structure For Building A Robust Model Xiao Tan Jingbo Gao Ruolin Li AAML OOD 33 3 0 25 Apr 2022
Forgetting and Imbalance in Robot Lifelong Learning with Off-policy Data Wenxuan Zhou Steven Bohez Jan Humplik A. Abdolmaleki Dushyant Rao Markus Wulfmeier Tuomas Haarnoja N. Heess OffRL 32 6 0 12 Apr 2022
Latent-Variable Advantage-Weighted Policy Optimization for Offline RL Xi Chen Ali Ghadirzadeh Tianhe Yu Yuan Gao Jianhao Wang Wenzhe Li Bin Liang Chelsea Finn Chongjie Zhang OffRL 32 14 0 16 Mar 2022
Switch Trajectory Transformer with Distributional Value Approximation for Multi-Task Reinforcement Learning Qinjie Lin Han Liu B. Sengupta OffRL 24 11 0 14 Mar 2022
The Efficacy of Pessimism in Asynchronous Q-Learning Yuling Yan Gen Li Yuxin Chen Jianqing Fan OffRL 75 40 0 14 Mar 2022
Pessimistic Q-Learning for Offline Reinforcement Learning: Towards Optimal Sample Complexity Laixi Shi Gen Li Yuting Wei Yuxin Chen Yuejie Chi OffRL 30 90 0 28 Feb 2022
Model-Based Offline Meta-Reinforcement Learning with Regularization Sen Lin Jialin Wan Tengyu Xu Yingbin Liang Junshan Zhang OffRL 28 17 0 07 Feb 2022