When does return-conditioned supervised learning work for offline
reinforcement learning?

v1v2v3 (latest)

When does return-conditioned supervised learning work for offline reinforcement learning?

2 June 2022

David Brandfonbrener

Joan Bruna

ArXiv (abs)PDF HTML

Papers citing "When does return-conditioned supervised learning work for offline reinforcement learning?"

15 / 15 papers shown

Title
How to Provably Improve Return Conditioned Supervised Learning? Zhishuai Liu Yu Yang Ruhan Wang Pan Xu Dongruo Zhou OffRL 26 0 0 10 Jun 2025
Temporal Logic Specification-Conditioned Decision Transformer for Offline Safe Reinforcement Learning Zijian Guo Weichao Zhou Wenchao Li OffRL 150 2 0 28 Jan 2025
MADiff: Offline Multi-agent Learning with Diffusion Models Zhengbang Zhu Minghuan Liu Liyuan Mao Bingyi Kang Minkai Xu Yong Yu Stefano Ermon Weinan Zhang DiffM OffRL 187 40 0 03 Jan 2025
Predictive Coding for Decision Transformer Tung M. Luu Donghoon Lee Chang D. Yoo OffRL 129 2 0 04 Oct 2024
Improving Reward-Conditioned Policies for Multi-Armed Bandits using Normalized Weight Functions Kai Xu Farid Tajaddodianfar Ben Allison 47 0 0 16 Jun 2024
Pretraining Decision Transformers with Reward Prediction for In-Context Multi-task Structured Bandit Learning Subhojyoti Mukherjee Josiah P. Hanna Qiaomin Xie Robert Nowak 255 2 0 07 Jun 2024
A Tractable Inference Perspective of Offline RL Xuejie Liu Hoang Trung-Dung Guy Van den Broeck Yitao Liang OffRL 133 1 0 31 Oct 2023
AMAGO: Scalable In-Context Reinforcement Learning for Adaptive Agents Jake Grigsby Linxi Fan Yuke Zhu OffRL LM&Ro 121 33 0 15 Oct 2023
On the Effectiveness of Offline RL for Dialogue Response Generation Paloma Sodhi Felix Wu Ethan R. Elenberg Kilian Q. Weinberger Ryan T. McDonald OffRL 82 5 0 23 Jul 2023
Offline Multi-Agent Reinforcement Learning with Implicit Global-to-Local Value Regularization Xiangsen Wang Haoran Xu Yinan Zheng Xianyuan Zhan OffRL 93 26 0 21 Jul 2023
Supervised Pretraining Can Learn In-Context Reinforcement Learning Jonathan Lee Annie Xie Aldo Pacchiano Yash Chandak Chelsea Finn Ofir Nachum Emma Brunskill OffRL 118 86 0 26 Jun 2023
A Survey on Transformers in Reinforcement Learning Wenzhe Li Hao Luo Zichuan Lin Chongjie Zhang Zongqing Lu Deheng Ye OffRL MU AI4CE 128 58 0 08 Jan 2023
Dichotomy of Control: Separating What You Can Control from What You Cannot Mengjiao Yang Dale Schuurmans Pieter Abbeel Ofir Nachum OffRL 84 44 0 24 Oct 2022
From Play to Policy: Conditional Behavior Generation from Uncurated Robot Data Zichen Jeff Cui Yibin Wang Nur Muhammad (Mahi) Shafiullah Lerrel Pinto LM&Ro VGen OffRL 100 95 0 18 Oct 2022
A Policy-Guided Imitation Approach for Offline Reinforcement Learning Haoran Xu Li Jiang Jianxiong Li Xianyuan Zhan OffRL 153 64 0 15 Oct 2022