Decision Transformer: Reinforcement Learning via Sequence Modeling

2 June 2021

Aravind Rajeswaran

Pieter Abbeel

Papers citing "Decision Transformer: Reinforcement Learning via Sequence Modeling"

50 / 360 papers shown

Title
Reinforcement Learning for Individual Optimal Policy from Heterogeneous Data Rui Miao Babak Shahbaba Annie Qu OffRL 28 0 0 14 May 2025
Beyond the Known: Decision Making with Counterfactual Reasoning Decision Transformer Minh Hoang Nguyen Linh Le Pham Van Thommen George Karimpanal Sunil Gupta Hung Le OffRL LRM 37 0 0 14 May 2025
ReinboT: Amplifying Robot Visual-Language Manipulation with Reinforcement Learning Hongyin Zhang Zifeng Zhuang Han Zhao Pengxiang Ding Hongchao Lu Donglin Wang OffRL 44 0 0 12 May 2025
A Reproduction Study: The Kernel PCA Interpretation of Self-Attention Fails Under Scrutiny Karahan Sarıtaş Çağatay Yıldız 34 0 0 12 May 2025
An empathic GPT-based chatbot to talk about mental disorders with Spanish teenagers Alba María Mármol-Romero Manuel García-Vega Miguel Ángel García-Cumbreras Arturo Montejo-Ráez 35 3 0 09 May 2025
Benchmarking Vision, Language, & Action Models in Procedurally Generated, Open Ended Action Environments Pranav Guruprasad Yangyue Wang Sudipta Chowdhury Harshvardhan Sikka LM&Ro VLM 174 0 0 08 May 2025
UniCO: Towards a Unified Model for Combinatorial Optimization Problems Zefang Zong Xiaochen Wei Guozhen Zhang Chen Gao Huandong Wang Yong Li 34 0 0 07 May 2025
Latent Adaptive Planner for Dynamic Manipulation Donghun Noh Deqian Kong Minglu Zhao Andrew Lizarraga Jianwen Xie Ying Nian Wu Dennis W. Hong 151 0 0 06 May 2025
StableMotion: Training Motion Cleanup Models with Unpaired Corrupted Data Yuxuan Mu Hung Yu Ling Yi Shi Ismael Baira Ojeda Pengcheng Xi Chang Shu F. Zinno Xue Bin Peng 52 0 0 06 May 2025
Analytic Energy-Guided Policy Optimization for Offline Reinforcement Learning Jifeng Hu Sili Huang Zhengyuan Yang Shengchao Hu Li Shen H. Chen Lichao Sun Yi-Ju Chang Dacheng Tao OffRL 167 0 0 03 May 2025
Dual Filter: A Mathematical Framework for Inference using Transformer-like Architectures Heng-Sheng Chang P. Mehta 39 0 0 01 May 2025
Generative Machine Learning in Adaptive Control of Dynamic Manufacturing Processes: A Review Suk Ki Lee Hyunwoong Ko AI4CE 54 0 0 30 Apr 2025
Offline Learning of Controllable Diverse Behaviors Mathieu Petitbois Rémy Portelas Sylvain Lamprier Ludovic Denoyer OffRL 38 0 0 25 Apr 2025
Do We Need Transformers to Play FPS Video Games? Karmanbir Batth Krish Sethi Aly Shariff Leo Shi Hetul Patel OffRL AI4CE 34 0 0 24 Apr 2025
RAGEN: Understanding Self-Evolution in LLM Agents via Multi-Turn Reinforcement Learning Zihan Wang Kaidi Wang Q. Wang Pingyue Zhang Linjie Li ... Jiajun Wu L. Fei-Fei Lijuan Wang Yejin Choi Manling Li 89 4 0 24 Apr 2025
Text-to-Decision Agent: Learning Generalist Policies from Natural Language Supervision Shilin Zhang Zican Hu Wenhao Wu Xinyi Xie Jianxiang Tang Chunlin Chen Daoyi Dong Yu Cheng Zhenhong Sun Zhi Wang OffRL 160 0 0 21 Apr 2025
Generative Auto-Bidding with Value-Guided Explorations Jingtong Gao Yewen Li Shuai Mao Peng Jiang Nan Jiang ... Fei Pan Peng Jiang Kun Gai Bo An Xiangyu Zhao OffRL 41 0 0 20 Apr 2025
Playing Non-Embedded Card-Based Games with Reinforcement Learning Tianyang Wu Lipeng Wan Yuhang Wang Qiang Wan Xuguang Lan OffRL 30 0 0 07 Apr 2025
Efficient Continual Adaptation of Pretrained Robotic Policy with Online Meta-Learned Adapters Ruiqi Zhu Endong Sun Guanhe Huang Oya Celiktutan CLL OnRL 65 0 0 24 Mar 2025
Curiosity-Diffuser: Curiosity Guide Diffusion Models for Reliability Zihao Liu Xing Liu Yizhai Zhang Zhengxiong Liu Panfeng Huang 69 0 0 19 Mar 2025
Quantization-Free Autoregressive Action Transformer Ziyad Sheebaelhamd Michael Tschannen Michael Muehlebach Claire Vernade 49 0 0 18 Mar 2025
Masked Sensory-Temporal Attention for Sensor Generalization in Quadruped Locomotion Dikai Liu Tianwei Zhang Jianxiong Yin Simon See 92 1 0 13 Mar 2025
Generative Trajectory Stitching through Diffusion Composition Yunhao Luo Utkarsh Aashu Mishra Yilun Du Danfei Xu 150 1 0 07 Mar 2025
DPR: Diffusion Preference-based Reward for Offline Reinforcement Learning Teng Pang Bingzheng Wang Guoqiang Wu Yilong Yin OffRL 73 0 0 03 Mar 2025
Transformer Meets Twicing: Harnessing Unattended Residual Information Laziz U. Abdullaev Tan M. Nguyen 41 2 0 02 Mar 2025
Hyperspherical Normalization for Scalable Deep Reinforcement Learning Hojoon Lee Youngdo Lee Takuma Seno Donghu Kim Peter Stone Jaegul Choo 63 1 0 24 Feb 2025
Yes, Q-learning Helps Offline In-Context RL Denis Tarasov Alexander Nikulin Ilya Zisman Albina Klepach Andrei Polubarov Nikita Lyubaykin Alexander Derevyagin Igor Kiselev Vladislav Kurenkov OffRL OnRL 196 0 0 24 Feb 2025
Score-Based Diffusion Policy Compatible with Reinforcement Learning via Optimal Transport Mingyang Sun Pengxiang Ding Weinan Zhang Donglin Wang OT 83 0 0 24 Feb 2025
A Large Recurrent Action Model: xLSTM enables Fast Inference for Robotics Tasks Thomas Schmied Thomas Adler Vihang Patil M. Beck Korbinian Poppel Johannes Brandstetter G. Klambauer Razvan Pascanu Sepp Hochreiter 75 5 0 21 Feb 2025
X-IL: Exploring the Design Space of Imitation Learning Policies Xiaogang Jia Atalay Donat Xi Huang Xuan Zhao Denis Blessing ... Han A. Wang Hanyi Zhang Qian Wang Rudolf Lioutikov Gerhard Neumann 91 1 0 20 Feb 2025
FLAG-Trader: Fusion LLM-Agent with Gradient-based Reinforcement Learning for Financial Trading Guojun Xiong Zhiyang Deng Keyi Wang Yupeng Cao Haohang Li ... Kaleb Smith Xiao-Yang Liu J. Huang Sophia Ananiadou Qianqian Xie AIFin 186 1 0 20 Feb 2025
RobotIQ: Empowering Mobile Robots with Human-Level Planning for Real-World Execution Emmanuel K. Raptis Athanasios Ch. Kapoutsis Elias B. Kosmatopoulos LM&Ro 82 0 0 18 Feb 2025
Zero-shot Model-based Reinforcement Learning using Large Language Models Abdelhakim Benechehab Youssef Attia El Hili Ambroise Odonnat Oussama Zekri Albert Thomas Giuseppe Paolo Maurizio Filippone I. Redko Balázs Kégl OffRL 72 1 0 17 Feb 2025
Model-Based Offline Reinforcement Learning with Reliability-Guaranteed Sequence Modeling Shenghong He OffRL 189 0 0 10 Feb 2025
Utilizing Novelty-based Evolution Strategies to Train Transformers in Reinforcement Learning Matyáš Lorenc OffRL 75 0 0 10 Feb 2025
From Uncertain to Safe: Conformal Fine-Tuning of Diffusion Models for Safe PDE Control Peiyan Hu Xiaowei Qian Wenhao Deng Rui Wang Haodong Feng ... Tao Zhang Long Wei Yue Wang Zhi-Ming Ma Tailin Wu AI4CE 120 0 0 04 Feb 2025
GNN-DT: Graph Neural Network Enhanced Decision Transformer for Efficient Optimization in Dynamic Environments Stavros Orfanoudakis Nanda Kishor Panda Peter Palensky Pedro P. Vergara AI4CE 66 0 0 03 Feb 2025
OT-Transformer: A Continuous-time Transformer Architecture with Optimal Transport Regularization Kelvin Kan Xingjian Li Stanley Osher 99 2 0 30 Jan 2025
Temporal Logic Specification-Conditioned Decision Transformer for Offline Safe Reinforcement Learning Zijian Guo Weichao Zhou Wenchao Li OffRL 102 2 0 28 Jan 2025
Towards Robust Spacecraft Trajectory Optimization via Transformers Yuji Takubo T. Guffanti Daniele Gammelli Marco Pavone Simone DÁmico 69 4 0 28 Jan 2025
Extensive Exploration in Complex Traffic Scenarios using Hierarchical Reinforcement Learning Zhihao Zhang Ekim Yurtsever Keith A. Redmill 38 0 0 28 Jan 2025
UNIDOOR: A Universal Framework for Action-Level Backdoor Attacks in Deep Reinforcement Learning Oubo Ma L. Du Yang Dai Chunyi Zhou Qingming Li Yuwen Pu Shouling Ji 46 0 0 28 Jan 2025
Collective Intelligence for 2D Push Manipulations with Mobile Robots So Kuroki T. Matsushima Jumpei Arima Hiroki Furuta Yutaka Matsuo S. Gu Yujin Tang 69 5 0 28 Jan 2025
Integrating Multi-Modal Input Token Mixer Into Mamba-Based Decision Models: Decision MetaMamba Wall Kim Mamba 60 0 0 10 Jan 2025
Learning the Language of Protein Structure Benoit Gaujac Jérémie Donà Liviu Copoiu Timothy Atkinson Thomas Pierrot Thomas D. Barrett 58 10 0 08 Jan 2025
Amortized Bayesian Experimental Design for Decision-Making Daolang Huang Yujia Guo Luigi Acerbi Samuel Kaski 48 2 0 03 Jan 2025
MADiff: Offline Multi-agent Learning with Diffusion Models Zhengbang Zhu Minghuan Liu Liyuan Mao Bingyi Kang Minkai Xu Yong Yu Stefano Ermon Weinan Zhang DiffM OffRL 88 34 0 03 Jan 2025
Human-like Bots for Tactical Shooters Using Compute-Efficient Sensors Niels Justesen Maria Kaselimi Sam Snodgrass Miruna Vozaru Matthew Schlegel ... Albert Wang Christoffer Holmgård Georgios N. Yannakakis S. Risi Julian Togelius 50 0 0 03 Jan 2025
Marvel: Accelerating Safe Online Reinforcement Learning with Finetuned Offline Policy Keru Chen Honghao Wei Zhigang Deng Sen Lin OffRL OnRL 94 0 0 31 Dec 2024
ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement Learning Kun Wu Yinuo Zhao Zhihao Xu Zhengping Che Chengxiang Yin C. Liu Qinru Qiu Feiferi Feng OffRL 102 1 0 22 Dec 2024