A Minimalist Approach to Offline Reinforcement Learning

12 June 2021

Papers citing "A Minimalist Approach to Offline Reinforcement Learning"

50 / 522 papers shown

Title
ImagineBench: Evaluating Reinforcement Learning with Large Language Model Rollouts Jing-Cheng Pang Kaiyuan Li Yixuan Wang Si-Hang Yang Shengyi Jiang Yang Yu OffRL LLMAG LM&Ro LRM 19 0 0 15 May 2025
Video-Enhanced Offline Reinforcement Learning: A Model-Based Approach Minting Pan Yitao Zheng J. Li Yunbo Wang Xiaokang Yang OffRL 48 0 0 10 May 2025
Taming OOD Actions for Offline Reinforcement Learning: An Advantage-Based Approach Xuyang Chen Keyu Yan Lin Zhao OffRL 51 0 0 08 May 2025
Analytic Energy-Guided Policy Optimization for Offline Reinforcement Learning Jifeng Hu Sili Huang Z. Yang Shengchao Hu Li Shen H. Chen Lichao Sun Yi-Ju Chang Dacheng Tao OffRL 149 0 0 03 May 2025
Reinforcement Learning with Continuous Actions Under Unmeasured Confounding Yuhan Li Eugene Han Yifan Hu Wenzhuo Zhou Zhengling Qi Yifan Cui Ruoqing Zhu OffRL 141 0 0 01 May 2025
Dynamic Action Interpolation: A Universal Approach for Accelerating Reinforcement Learning with Expert Guidance Wenjun Cao 52 0 0 26 Apr 2025
BiasBench: A reproducible benchmark for tuning the biases of event cameras Andreas Ziegler David Joseph Thomas Gossard Emil Moldovan A. Zell 31 0 0 25 Apr 2025
An Optimal Discriminator Weighted Imitation Perspective for Reinforcement Learning Haoran Xu Shuozhe Li Harshit S. Sikchi S. Niekum Amy Zhang OffRL 27 0 0 17 Apr 2025
VIPO: Value Function Inconsistency Penalized Offline Reinforcement Learning Xuyang Chen Guojian Wang Keyu Yan Lin Zhao OffRL 37 1 0 16 Apr 2025
A Clean Slate for Offline Reinforcement Learning Matthew Jackson Uljad Berdica Jarek Liesen Shimon Whiteson Jakob Foerster OffRL OnRL 49 0 0 15 Apr 2025
Human-Level Competitive Pokémon via Scalable Offline Reinforcement Learning with Transformers Jake Grigsby Yuqi Xie Justin Sasek Steven Zheng Yuke Zhu OffRL 26 0 0 06 Apr 2025
Beyond Non-Expert Demonstrations: Outcome-Driven Action Constraint for Offline Reinforcement Learning Ke Jiang Wen Jiang Y. Li Xiaoyang Tan OffRL 38 0 0 02 Apr 2025
Learning Generalizable Skills from Offline Multi-Task Data for Multi-Agent Cooperation Sicong Liu Yang Shu Chenjuan Guo Bin Yang OffRL 58 3 0 27 Mar 2025
Offline Reinforcement Learning with Discrete Diffusion Skills Ruixi Qiao Jie Cheng Xingyuan Dai Yonglin Tian Yisheng Lv OffRL 84 0 0 26 Mar 2025
Model-Based Offline Reinforcement Learning with Adversarial Data Augmentation Hongye Cao Fan Feng Jing Huo Shangdong Yang Meng Fang Tianpei Yang Yang Gao AAML OffRL 60 0 0 26 Mar 2025
NeoRL-2: Near Real-World Benchmarks for Offline Reinforcement Learning with Extended Realistic Scenarios Songyi Gao Zuolin Tu Rong-Jun Qin Yi-Hao Sun Xiong-Hui Chen Yang Yu OffRL 42 0 0 25 Mar 2025
Latent Embedding Adaptation for Human Preference Alignment in Diffusion Planners Wen Zheng Terence Ng Jianda Chen Yuan Xu Tianwei Zhang 41 0 0 24 Mar 2025
Evaluation-Time Policy Switching for Offline Reinforcement Learning Natinael Solomon Neggatu Jeremie Houssineau Giovanni Montana OffRL OnRL 70 0 0 15 Mar 2025
Towards Safe Path Tracking Using the Simplex Architecture Georg Jäger Nils-Jonathan Friedrich Hauke Petersen Benjamin Noack 34 0 0 13 Mar 2025
GTR: Guided Thought Reinforcement Prevents Thought Collapse in RL-based VLM Agent Training Tong Wei Yijun Yang Junliang Xing Yuanchun Shi Zongqing Lu Deheng Ye OffRL LRM 44 1 0 11 Mar 2025
Policy Constraint by Only Support Constraint for Offline Reinforcement Learning Yunkai Gao Jiaming Guo Fan Wu Rui Zhang OffRL 56 0 0 07 Mar 2025
High-Precision Transformer-Based Visual Servoing for Humanoid Robots in Aligning Tiny Objects Jialong Xue Wei Gao Yu Wang Chao Ji Dongdong Zhao Shi Yan Shiwu Zhang 45 0 0 06 Mar 2025
DPR: Diffusion Preference-based Reward for Offline Reinforcement Learning Teng Pang Bingzheng Wang Guoqiang Wu Yilong Yin OffRL 70 0 0 03 Mar 2025
SFO: Piloting VLM Feedback for Offline RL Jacob Beck OffRL 39 0 0 02 Mar 2025
Behavior Preference Regression for Offline Reinforcement Learning Padmanaba Srinivasan William J. Knottenbelt OffRL 33 0 0 02 Mar 2025
What Makes a Good Diffusion Planner for Decision Making? Haofei Lu Dongqi Han Yifei Shen Dongsheng Li DiffM 38 3 0 01 Mar 2025
Fewer May Be Better: Enhancing Offline Reinforcement Learning with Reduced Dataset Yiqin Yang Quanwei Wang Chenghao Li Hao Hu Chengjie Wu ... Dianyu Zhong Ziyou Zhang Qianchuan Zhao Chongjie Zhang Xu Bo OffRL 47 0 0 26 Feb 2025
Efficient Reinforcement Learning by Guiding Generalist World Models with Non-Curated Data Yi Zhao Aidan Scannell Wenshuai Zhao Yuxin Hou Tianyu Cui Le Chen Dieter Büchler Arno Solin Juho Kannala Joni Pajarinen OffRL OnRL 96 1 0 26 Feb 2025
Hyperspherical Normalization for Scalable Deep Reinforcement Learning Hojoon Lee Youngdo Lee Takuma Seno Donghu Kim Peter Stone Jaegul Choo 63 1 0 24 Feb 2025
TDMPBC: Self-Imitative Reinforcement Learning for Humanoid Robot Control Zifeng Zhuang Diyuan Shi Runze Suo Xiao He Hongyin Zhang Ting Wang Shangke Lyu Donglin Wang 39 0 0 24 Feb 2025
Yes, Q-learning Helps Offline In-Context RL Denis Tarasov Alexander Nikulin Ilya Zisman Albina Klepach Andrei Polubarov Nikita Lyubaykin Alexander Derevyagin Igor Kiselev Vladislav Kurenkov OffRL OnRL 175 0 0 24 Feb 2025
Reward-Safety Balance in Offline Safe RL via Diffusion Regularization Junyu Guo Zhi Zheng Donghao Ying Ming Jin Shangding Gu C. Spanos Javad Lavaei OffRL 56 0 0 18 Feb 2025
Data Center Cooling System Optimization Using Offline Reinforcement Learning Xianyuan Zhan Xiangyu Zhu Peng Cheng Xiao Hu Ziteng He ... Chenhui Liu Tianshun Hong Yan Liang Yunxin Liu Feng Zhao AI4CE 62 0 0 17 Feb 2025
Deep Reinforcement Learning based Triggering Function for Early Classifiers of Time Series Aurélien Renault A. Bondu Antoine Cornuéjols Vincent Lemaire 49 0 0 10 Feb 2025
B3C: A Minimalist Approach to Offline Multi-Agent Reinforcement Learning Woojun Kim Katia P. Sycara OffRL 91 0 0 30 Jan 2025
Reinforcement Teaching Alex Lewandowski Calarina Muslimani Dale Schuurmans Matthew E. Taylor Jun Luo 81 1 0 28 Jan 2025
Coordinating Ride-Pooling with Public Transit using Reward-Guided Conservative Q-Learning: An Offline Training and Online Fine-Tuning Reinforcement Learning Framework Yulong Hu Tingting Dong Sen Li OffRL OnRL 59 0 0 24 Jan 2025
Deterministic Uncertainty Propagation for Improved Model-Based Offline Reinforcement Learning Abdullah Akgul Manuel Haußmann M. Kandemir OffRL 71 1 0 17 Jan 2025
Integrating Multi-Modal Input Token Mixer Into Mamba-Based Decision Models: Decision MetaMamba Wall Kim Mamba 55 0 0 10 Jan 2025
SR-Reward: Taking The Path More Traveled Seyed Mahdi Basiri Azad Zahra Padar Gabriel Kalweit Joschka Boedecker OffRL 67 0 0 04 Jan 2025
MADiff: Offline Multi-agent Learning with Diffusion Models Zhengbang Zhu Minghuan Liu Liyuan Mao Bingyi Kang Minkai Xu Yong Yu Stefano Ermon Weinan Zhang DiffM OffRL 85 34 0 03 Jan 2025
Hierarchical Multi-agent Meta-Reinforcement Learning for Cross-channel Bidding Shenghong He Chao Yu 39 0 0 26 Dec 2024
Attention-Enhanced Short-Time Wiener Solution for Acoustic Echo Cancellation Fei Zhao Xueliang Zhang 36 0 0 25 Dec 2024
Large Language Model guided Deep Reinforcement Learning for Decision Making in Autonomous Driving Hao Pang Zhenpo Wang Guoqiang Li 43 1 0 24 Dec 2024
ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement Learning Kun Wu Yinuo Zhao Zhihao Xu Zhengping Che Chengxiang Yin C. Liu Qinru Qiu Feiferi Feng OffRL 100 1 0 22 Dec 2024
Policy Agnostic RL: Offline RL and Online RL Fine-Tuning of Any Class and Backbone Max Sobol Mark Tian Gao Georgia Gabriela Sampaio Mohan Kumar Srirama Archit Sharma Chelsea Finn Aviral Kumar OffRL OnRL 95 4 0 09 Dec 2024
Supervised Learning-enhanced Multi-Group Actor Critic for Live Stream Allocation in Feed Jingxin Liu Xiang Gao Yisha Li Xin Li Haiyang Lu Ben Wang OffRL 72 0 0 28 Nov 2024
Enhancing Exploration with Diffusion Policies in Hybrid Off-Policy RL: Application to Non-Prehensile Manipulation Huy Le Miroslav Gabriel Tai Hoang Gerhard Neumann Ngo Anh Vien 111 1 0 22 Nov 2024
Continual Task Learning through Adaptive Policy Self-Composition Shengchao Hu Yuhang Zhou Ziqing Fan Jifeng Hu Li Shen Ya-Qin Zhang Dacheng Tao OffRL 74 0 0 18 Nov 2024
Enhancing Decision Transformer with Diffusion-Based Trajectory Branch Generation Zhihong Liu Long Qian Zeyang Liu Lipeng Wan Xingyu Chen Xuguang Lan OffRL 80 1 0 18 Nov 2024