AWAC: Accelerating Online Reinforcement Learning with Offline Datasets

16 June 2020

Abhishek Gupta

Papers citing "AWAC: Accelerating Online Reinforcement Learning with Offline Datasets"

50 / 423 papers shown

Title
Planning to Go Out-of-Distribution in Offline-to-Online Reinforcement Learning Trevor A. McInroe Adam Jelley Stefano V. Albrecht Amos Storkey OffRL OnRL 22 6 0 09 Oct 2023
DiffCPS: Diffusion Model based Constrained Policy Search for Offline Reinforcement Learning Longxiang He Li Shen Linrui Zhang Junbo Tan Xueqian Wang OffRL 28 8 0 09 Oct 2023
Improving Offline-to-Online Reinforcement Learning with Q Conditioned State Entropy Exploration Ziqi Zhang Xiao Xiong Zifeng Zhuang Jinxin Liu Donglin Wang OffRL OnRL 45 0 0 07 Oct 2023
Understanding, Predicting and Better Resolving Q-Value Divergence in Offline-RL Yang Yue Rui Lu Bingyi Kang Shiji Song Gao Huang OffRL 35 16 0 06 Oct 2023
Efficient Planning with Latent Diffusion Wenhao Li DiffM 40 4 0 30 Sep 2023
Consistency Models as a Rich and Efficient Policy Class for Reinforcement Learning Daoce Wang Chi Jin OffRL DiffM 27 25 0 29 Sep 2023
Towards Robust Offline-to-Online Reinforcement Learning via Uncertainty and Smoothness Xiaoyu Wen Xudong Yu Rui Yang Chenjia Bai Zhen Wang OffRL OnRL 24 10 0 29 Sep 2023
Zero-Shot Reinforcement Learning from Low Quality Data Scott Jeen Tom Bewley Jonathan M. Cullen OffRL OnRL 36 0 0 26 Sep 2023
Counterfactual Conservative Q Learning for Offline Multi-agent Reinforcement Learning Jianzhun Shao Yun Qu Chen Chen Hongchang Zhang Xiangyang Ji OffRL 20 19 0 22 Sep 2023
H2O+: An Improved Framework for Hybrid Offline-and-Online RL with Dynamics Gaps Haoyi Niu Tianying Ji Bingqi Liu Haocheng Zhao Xiangyu Zhu Jianying Zheng Pengfei Huang Guyue Zhou Jianming Hu Xianyuan Zhan OffRL OnRL AI4CE 27 6 0 22 Sep 2023
OpenChat: Advancing Open-source Language Models with Mixed-Quality Data Guan-Bo Wang Sijie Cheng Xianyuan Zhan Xiangang Li Sen Song Yang Liu ALM 27 228 0 20 Sep 2023
Guided Online Distillation: Promoting Safe Reinforcement Learning by Offline Demonstration Jinning Li Xinyi Liu Banghua Zhu Jiantao Jiao Masayoshi Tomizuka Chen Tang Wei Zhan OffRL OnRL 69 9 0 18 Sep 2023
A Real-World Quadrupedal Locomotion Benchmark for Offline Reinforcement Learning Sidney Besnard Shuyu Yang M. Fadili OffRL 26 2 0 13 Sep 2023
LEAP Hand: Low-Cost, Efficient, and Anthropomorphic Hand for Robot Learning Kenneth Shaw Ananye Agarwal Deepak Pathak 30 80 0 12 Sep 2023
Bootstrapping Adaptive Human-Machine Interfaces with Offline Reinforcement Learning Jensen Gao S. Reddy Glen Berseth Anca Dragan Sergey Levine OffRL 31 0 0 07 Sep 2023
RLSynC: Offline-Online Reinforcement Learning for Synthon Completion Frazier N. Baker Ziqi Chen Daniel Adu-Ampratwum Xia Ning OffRL OnRL 27 1 0 06 Sep 2023
Hundreds Guide Millions: Adaptive Offline Reinforcement Learning with Expert Guidance Qisen Yang Shenzhi Wang Qihang Zhang Gao Huang Shiji Song OffRL OnRL 26 8 0 04 Sep 2023
Multi-Objective Decision Transformers for Offline Reinforcement Learning Abdelghani Ghanem P. Ciblat Mounir Ghogho OffRL 27 1 0 31 Aug 2023
Real Robot Challenge 2022: Learning Dexterous Manipulation from Offline Data in the Real World Nicolas Gurtler Felix Widmaier Cansu Sancaktar Sebastian Blaes Pavel Kolev ... Arman Raayatsanati Hehui Zheng Barnabas Gavin Cangan Bernhard Schölkopf Georg Martius OffRL 35 2 0 15 Aug 2023
Value-Informed Skill Chaining for Policy Learning of Long-Horizon Tasks with Surgical Robot Tao Huang Kai-xiang Chen Wang Wei Jianan Li Yonghao Long Qi Dou OffRL 26 6 0 31 Jul 2023
Benchmarking Offline Reinforcement Learning on Real-Robot Hardware Nico Gürtler Sebastian Blaes Pavel Kolev Felix Widmaier Manuel Wüthrich Stefan Bauer Bernhard Schölkopf Georg Martius OffRL 33 28 0 28 Jul 2023
HIQL: Offline Goal-Conditioned RL with Latent States as Actions Seohong Park Dibya Ghosh Benjamin Eysenbach Sergey Levine OffRL 30 44 0 22 Jul 2023
Offline Diversity Maximization Under Imitation Constraints Marin Vlastelica Jin Cheng Georg Martius Pavel Kolev OffRL 44 0 0 21 Jul 2023
PASTA: Pretrained Action-State Transformer Agents Raphael Boige Yannis Flet-Berliac Arthur Flajolet Guillaume Richard Thomas Pierrot LM&Ro OffRL 37 5 0 20 Jul 2023
Robotic Manipulation Datasets for Offline Compositional Reinforcement Learning Marcel Hussing Jorge Armando Mendez Mendez Anisha Singrodia Cassandra Kent Eric Eaton OffRL 31 5 0 13 Jul 2023
Budgeting Counterfactual for Offline RL Yao Liu Pratik Chaudhari Rasool Fakoor OffRL 25 2 0 12 Jul 2023
Diffusion Policies for Out-of-Distribution Generalization in Offline Reinforcement Learning S. E. Ada Erhan Öztop Emre Ugur OffRL 40 15 0 10 Jul 2023
Offline Reinforcement Learning with Imbalanced Datasets Li Jiang Sijie Cheng Jielin Qiu Haoran Xu Wai Kin Victor Chan Zhao Ding OffRL 34 3 0 06 Jul 2023
Elastic Decision Transformer Yueh-hua Wu Xiaolong Wang Masashi Hamaya OffRL 29 39 0 05 Jul 2023
Beyond Conservatism: Diffusion Policies in Offline Multi-agent Reinforcement Learning Zhuoran Li Ling Pan Longbo Huang DiffM OffRL 23 7 0 04 Jul 2023
Design from Policies: Conservative Test-Time Adaptation for Offline Policy Optimization Jinxin Liu Hongyin Zhang Zifeng Zhuang Yachen Kang Donglin Wang Bin Wang OffRL 42 8 0 26 Jun 2023
Fighting Uncertainty with Gradients: Offline Reinforcement Learning via Diffusion Score Matching H. Suh Glen Chou Hongkai Dai Lujie Yang Abhishek Gupta Russ Tedrake DiffM OffRL 37 7 0 24 Jun 2023
Large Sequence Models for Sequential Decision-Making: A Survey Muning Wen Runji Lin Hanjing Wang Yaodong Yang Ying Wen Luo Mai Jun Wang Haifeng Zhang Weinan Zhang LM&Ro LRM 37 35 0 24 Jun 2023
SPRINT: Scalable Policy Pre-Training via Language Instruction Relabeling Jesse Zhang Karl Pertsch Jiahui Zhang Joseph J. Lim LM&Ro 36 17 0 20 Jun 2023
Warm-Start Actor-Critic: From Approximation Error to Sub-optimality Gap Hang Wang Sen Lin Junshan Zhang OffRL OnRL 28 3 0 20 Jun 2023
Residual Q-Learning: Offline and Online Policy Customization without Value Chenran Li Chen Tang Haruki Nishimura Jean-Pierre Mercat Masayoshi Tomizuka Wei Zhan OffRL 30 6 0 15 Jun 2023
Offline Multi-Agent Reinforcement Learning with Coupled Value Factorization Xiangsen Wang Xianyuan Zhan OffRL 21 5 0 15 Jun 2023
Deep Generative Models for Decision-Making and Control Michael Janner 32 1 0 15 Jun 2023
Katakomba: Tools and Benchmarks for Data-Driven NetHack Vladislav Kurenkov Alexander Nikulin Denis Tarasov Sergey Kolesnikov OffRL 30 5 0 14 Jun 2023
A Simple Unified Uncertainty-Guided Framework for Offline-to-Online Reinforcement Learning Siyuan Guo Yanchao Sun Jifeng Hu Sili Huang Hechang Chen Haiyin Piao Lichao Sun Yi-Ju Chang OffRL OnRL 31 7 0 13 Jun 2023
Improving Offline-to-Online Reinforcement Learning with Q-Ensembles Kai-Wen Zhao Yi Ma Jianye Hao Jinyi Liu Yan Zheng Zhaopeng Meng OffRL OnRL 20 12 0 12 Jun 2023
Policy Regularization with Dataset Constraint for Offline Reinforcement Learning Yuhang Ran Yi-Chen Li Fuxiang Zhang Zongzhang Zhang Yang Yu OffRL 21 23 0 11 Jun 2023
Iteratively Refined Behavior Regularization for Offline Reinforcement Learning Xiao Hu Yi Ma Chenjun Xiao Yan Zheng Zhaopeng Meng OffRL 18 4 0 09 Jun 2023
Decoupled Prioritized Resampling for Offline RL Yang Yue Bingyi Kang Xiao Ma Qisen Yang Gao Huang S. Song Shuicheng Yan OffRL 27 0 0 08 Jun 2023
Mildly Constrained Evaluation Policy for Offline Reinforcement Learning Linjie Xu Zhengyao Jiang Jinyu Wang Lei Song Jiang Bian OffRL 33 0 0 06 Jun 2023
A Grasp Pose is All You Need: Learning Multi-fingered Grasping with Deep Reinforcement Learning from Vision and Touch Federico Ceola Elisa Maiettini Lorenzo Rosasco Lorenzo Natale 24 5 0 06 Jun 2023
Boosting Offline Reinforcement Learning with Action Preference Query Qisen Yang Shenzhi Wang Matthieu Lin S. Song Gao Huang OffRL 13 9 0 06 Jun 2023
Stabilizing Contrastive RL: Techniques for Robotic Goal Reaching from Offline Data Chongyi Zheng Benjamin Eysenbach Homer Walke Patrick Yin Kuan Fang Ruslan Salakhutdinov Sergey Levine SSL OffRL 39 4 0 06 Jun 2023
Seizing Serendipity: Exploiting the Value of Past Success in Off-Policy Actor-Critic Tianying Ji Yuping Luo Gang Hua Xianyuan Zhan Jianwei Zhang Huazhe Xu OffRL OnRL 37 14 0 05 Jun 2023
Fine-Tuning Language Models with Advantage-Induced Policy Alignment Banghua Zhu Hiteshi Sharma Felipe Vieira Frujeri Shi Dong Chenguang Zhu Michael I. Jordan Jiantao Jiao OSLM 28 39 0 04 Jun 2023