Offline Reinforcement Learning as One Big Sequence Modeling Problem

3 June 2021

Papers citing "Offline Reinforcement Learning as One Big Sequence Modeling Problem"

50 / 89 papers shown

Title
BOFormer: Learning to Solve Multi-Objective Bayesian Optimization via Non-Markovian RL Yu-Heng Hung Kai-Jie Lin Yu-Heng Lin Chien-Yi Wang Cheng Sun Ping-Chun Hsieh 60 1 0 28 May 2025
What Do You Need for Diverse Trajectory Stitching in Diffusion Planning? Quentin Clark Florian Shkurti 754 0 0 23 May 2025
ReinboT: Amplifying Robot Visual-Language Manipulation with Reinforcement Learning Hongyin Zhang Zifeng Zhuang Han Zhao Pengxiang Ding Hongchao Lu Donglin Wang OffRL 106 0 0 12 May 2025
Masked Sensory-Temporal Attention for Sensor Generalization in Quadruped Locomotion Dikai Liu Tianwei Zhang Jianxiong Yin Simon See 220 1 0 13 Mar 2025
Zero-shot Model-based Reinforcement Learning using Large Language Models Abdelhakim Benechehab Youssef Attia El Hili Ambroise Odonnat Oussama Zekri Albert Thomas Giuseppe Paolo Maurizio Filippone I. Redko Balázs Kégl OffRL 111 1 0 17 Feb 2025
Utilizing Novelty-based Evolution Strategies to Train Transformers in Reinforcement Learning Matyáš Lorenc OffRL 96 0 0 10 Feb 2025
Model-Based Offline Reinforcement Learning with Reliability-Guaranteed Sequence Modeling Shenghong He OffRL 431 0 0 10 Feb 2025
Towards Robust Spacecraft Trajectory Optimization via Transformers Yuji Takubo T. Guffanti Daniele Gammelli Marco Pavone Simone DÁmico 126 4 0 28 Jan 2025
Extensive Exploration in Complex Traffic Scenarios using Hierarchical Reinforcement Learning Zhihao Zhang Ekim Yurtsever Keith A. Redmill 66 0 0 28 Jan 2025
HopCast: Calibration of Autoregressive Dynamics Models Muhammad Bilal Shahid Cody H. Fleming UQCV 123 0 0 27 Jan 2025
Utilizing Evolution Strategies to Train Transformers in Reinforcement Learning Matyáš Lorenc 89 1 0 23 Jan 2025
Deterministic Uncertainty Propagation for Improved Model-Based Offline Reinforcement Learning Abdullah Akgul Manuel Haußmann M. Kandemir OffRL 190 0 0 17 Jan 2025
Human-like Bots for Tactical Shooters Using Compute-Efficient Sensors Niels Justesen Maria Kaselimi Sam Snodgrass Miruna Vozaru Matthew Schlegel ... Albert Wang Christoffer Holmgård Georgios N. Yannakakis S. Risi Julian Togelius 161 0 0 03 Jan 2025
MADiff: Offline Multi-agent Learning with Diffusion Models Zhengbang Zhu Minghuan Liu Liyuan Mao Bingyi Kang Minkai Xu Yong Yu Stefano Ermon Weinan Zhang DiffM OffRL 131 40 0 03 Jan 2025
Constrained Latent Action Policies for Model-Based Offline Reinforcement Learning Marvin Alles Philip Becker-Ehmck Patrick van der Smagt Maximilian Karl OffRL 79 1 0 07 Nov 2024
Transformer-Based Fault-Tolerant Control for Fixed-Wing UAVs Using Knowledge Distillation and In-Context Adaptation Francisco Giral Ignacio Gómez Ricardo Vinuesa S. L. Clainche 89 2 0 05 Nov 2024
A Large Recurrent Action Model: xLSTM enables Fast Inference for Robotics Tasks Thomas Schmied Thomas Adler Vihang Patil M. Beck Korbinian Poppel Johannes Brandstetter Günter Klambauer Razvan Pascanu Sepp Hochreiter 196 6 0 29 Oct 2024
Masked Generative Priors Improve World Models Sequence Modelling Capabilities Cristian Meo Mircea Lica Zarif Ikram Akihiro Nakano Vedant Shah Aniket Didolkar Dianbo Liu Anirudh Goyal Justin Dauwels OffRL 124 0 0 10 Oct 2024
Diffusion Model Predictive Control Guangyao Zhou Sivaramakrishnan Swaminathan Rajkumar Vasudeva Raju J. S. Guntupalli Wolfgang Lehrach Joseph Ortiz Antoine Dedieu Miguel Lázaro-Gredilla Kevin P. Murphy 68 11 0 07 Oct 2024
Predictive Coding for Decision Transformer Tung M. Luu Donghoon Lee Chang D. Yoo OffRL 88 2 0 04 Oct 2024
Autoregressive Action Sequence Learning for Robotic Manipulation Xinyu Zhang Yuhan Liu Haonan Chang Liam Schramm Abdeslam Boularias 91 16 0 04 Oct 2024
Offline Reinforcement Learning for Learning to Dispatch for Job Shop Scheduling Jesse van Remmerden Zaharah Bukhsh Yingqian Zhang OffRL OnRL 97 1 0 16 Sep 2024
SAMBO-RL: Shifts-aware Model-based Offline Reinforcement Learning Wang Luo Haoran Li Zicheng Zhang Congying Han Jiayu Lv Tiande Guo OffRL 94 1 0 23 Aug 2024
Geospatial Trajectory Generation via Efficient Abduction: Deployment for Independent Testing Divyagna Bavikadi Dyuman Aditya Devendra Parkar Paulo Shakarian Graham Mueller Chad Parvis Gerardo Simari 63 2 0 08 Jul 2024
ARDuP: Active Region Video Diffusion for Universal Policies Shuaiyi Huang Mara Levy Zhenyu Jiang Anima Anandkumar Yuke Zhu Linxi Fan De-An Huang Abhinav Shrivastava VGen 81 2 0 19 Jun 2024
UniZero: Generalized and Efficient Planning with Scalable Latent World Models Yuan Pu Yazhe Niu Jiyuan Ren Zhenjie Yang Hongsheng Li Yu Liu OffRL 182 2 0 15 Jun 2024
Decision Mamba: A Multi-Grained State Space Model with Self-Evolution Regularization for Offline RL Qi Lv Xiang Deng Gongwei Chen Michael Yu Wang Liqiang Nie 123 7 0 08 Jun 2024
Pretraining Decision Transformers with Reward Prediction for In-Context Multi-task Structured Bandit Learning Subhojyoti Mukherjee Josiah P. Hanna Qiaomin Xie Robert Nowak 201 2 0 07 Jun 2024
TSPDiffuser: Diffusion Models as Learned Samplers for Traveling Salesperson Path Planning Problems Ryo Yonetani 74 1 0 05 Jun 2024
Diffusion Actor-Critic: Formulating Constrained Policy Iteration as Diffusion Noise Regression for Offline Reinforcement Learning Linjiajie Fang Ruoxue Liu Jing Zhang Wenjia Wang Bing-Yi Jing OffRL 113 7 0 31 May 2024
A Survey on Vision-Language-Action Models for Embodied AI Yueen Ma Zixing Song Yuzheng Zhuang Jianye Hao Irwin King LM&Ro 256 52 0 23 May 2024
Inference via Interpolation: Contrastive Representations Provably Enable Planning and Inference Benjamin Eysenbach Vivek Myers Ruslan Salakhutdinov Sergey Levine AI4TS 105 11 0 06 Mar 2024
Return-Aligned Decision Transformer Tsunehiko Tanaka Kenshi Abe Kaito Ariu Tetsuro Morimura Edgar Simo-Serra OffRL 101 1 0 06 Feb 2024
Towards an Information Theoretic Framework of Context-Based Offline Meta-Reinforcement Learning Lanqing Li Hai Zhang Xinyu Zhang Shatong Zhu Junqiao Zhao Junqiao Zhao Pheng-Ann Heng OffRL 79 8 0 04 Feb 2024
A Tractable Inference Perspective of Offline RL Xuejie Liu Hoang Trung-Dung Guy Van den Broeck Yitao Liang OffRL 84 1 0 31 Oct 2023
Offline Reinforcement Learning with Implicit Q-Learning Ilya Kostrikov Ashvin Nair Sergey Levine OffRL 286 903 0 12 Oct 2021
Decision Transformer: Reinforcement Learning via Sequence Modeling Lili Chen Kevin Lu Aravind Rajeswaran Kimin Lee Aditya Grover Michael Laskin Pieter Abbeel A. Srinivas Igor Mordatch OffRL 127 1,640 0 02 Jun 2021
Autoregressive Dynamics Models for Offline Policy Evaluation and Optimization Michael Ruogu Zhang T. Paine Ofir Nachum Cosmin Paduraru George Tucker Ziyun Wang Mohammad Norouzi OffRL 74 47 0 28 Apr 2021
Efficient Transformers in Reinforcement Learning using Actor-Learner Distillation Emilio Parisotto Ruslan Salakhutdinov 64 45 0 04 Apr 2021
Offline Reinforcement Learning with Pseudometric Learning Robert Dadashi Shideh Rezaeifar Nino Vieillard Léonard Hussenot Olivier Pietquin Matthieu Geist OffRL 70 41 0 02 Mar 2021
Near-Optimal Offline Reinforcement Learning via Double Variance Reduction Ming Yin Yu Bai Yu Wang OffRL 66 67 0 02 Feb 2021
Is Pessimism Provably Efficient for Offline RL? Ying Jin Zhuoran Yang Zhaoran Wang OffRL 167 358 0 30 Dec 2020
Planning from Pixels using Inverse Dynamics Models Keiran Paster Sheila A. McIlraith Jimmy Ba BDL 49 41 0 04 Dec 2020
Long Range Arena: A Benchmark for Efficient Transformers Yi Tay Mostafa Dehghani Samira Abnar Songlin Yang Dara Bahri Philip Pham J. Rao Liu Yang Sebastian Ruder Donald Metzler 139 718 0 08 Nov 2020
Generative Temporal Difference Learning for Infinite-Horizon Prediction Michael Janner Igor Mordatch Sergey Levine AI4CE 58 35 0 27 Oct 2020
If beam search is the answer, what was the question? Clara Meister Tim Vieira Ryan Cotterell 52 141 0 06 Oct 2020
On the model-based stochastic value gradient for continuous reinforcement learning Brandon Amos Samuel Stanton Denis Yarats A. Wilson 58 71 0 28 Aug 2020
Model-Based Offline Planning Arthur Argenson Gabriel Dulac-Arnold OffRL 54 154 0 12 Aug 2020
EMaQ: Expected-Max Q-Learning Operator for Simple Yet Effective Offline and Online RL Seyed Kamyar Seyed Ghasemipour Dale Schuurmans S. Gu OffRL 271 121 0 21 Jul 2020
Array Programming with NumPy Charles R. Harris K. Millman S. Walt R. Gommers Pauli Virtanen ... Tyler Reddy Warren Weckesser Hameer Abbasi C. Gohlke T. Oliphant 152 14,953 0 18 Jun 2020