Target Return Optimizer for Multi-Game Decision Transformer

4 March 2025

Papers citing "Target Return Optimizer for Multi-Game Decision Transformer"

17 / 17 papers shown

Title
Return-Aligned Decision Transformer Tsunehiko Tanaka Kenshi Abe Kaito Ariu Tetsuro Morimura Edgar Simo-Serra OffRL 131 1 0 06 Feb 2024
Constrained Decision Transformer for Offline Safe Reinforcement Learning Zuxin Liu Zijian Guo Yi-Fan Yao Zhepeng Cen Wenhao Yu Tingnan Zhang Ding Zhao OffRL 76 52 0 14 Feb 2023
Prompting Decision Transformer for Few-Shot Policy Generalization Mengdi Xu Songlin Yang Shun Zhang Yuchen Lu Ding Zhao J. Tenenbaum Chuang Gan OffRL 85 149 0 27 Jun 2022
Learning Generalizable Dexterous Manipulation from Human Grasp Affordance Yueh-hua Wu Jiashun Wang Xiaolong Wang 108 61 0 05 Apr 2022
Training Compute-Optimal Large Language Models Jordan Hoffmann Sebastian Borgeaud A. Mensch Elena Buchatskaya Trevor Cai ... Karen Simonyan Erich Elsen Jack W. Rae Oriol Vinyals Laurent Sifre AI4TS 211 1,987 0 29 Mar 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 897 13,228 0 04 Mar 2022
Online Decision Transformer Qinqing Zheng Amy Zhang Aditya Grover OffRL 83 209 0 11 Feb 2022
Offline Pre-trained Multi-Agent Decision Transformer: One Big Sequence Model Tackles All SMAC Tasks Linghui Meng Muning Wen Yaodong Yang Chenyang Le Xiyun Li Weinan Zhang Ying Wen Haifeng Zhang Jun Wang Bo Xu OffRL 89 42 0 06 Dec 2021
Generalized Decision Transformer for Offline Hindsight Information Matching Hiroki Furuta Y. Matsuo S. Gu OffRL 92 103 0 19 Nov 2021
Deep Reinforcement Learning at the Edge of the Statistical Precipice Rishabh Agarwal Max Schwarzer Pablo Samuel Castro Aaron Courville Marc G. Bellemare OffRL 139 676 0 30 Aug 2021
Offline Reinforcement Learning as One Big Sequence Modeling Problem Michael Janner Qiyang Li Sergey Levine OffRL 158 686 0 03 Jun 2021
Conservative Q-Learning for Offline Reinforcement Learning Aviral Kumar Aurick Zhou George Tucker Sergey Levine OffRL OnRL 148 1,836 0 08 Jun 2020
Scaling Laws for Neural Language Models Jared Kaplan Sam McCandlish T. Henighan Tom B. Brown B. Chess R. Child Scott Gray Alec Radford Jeff Wu Dario Amodei 651 4,925 0 23 Jan 2020
Generative Adversarial User Model for Reinforcement Learning Based Recommendation System Xinshi Chen Shuang Li Hui Li Shaohua Jiang Yuan Qi Le Song 64 209 0 27 Dec 2018
Proximal Policy Optimization Algorithms John Schulman Filip Wolski Prafulla Dhariwal Alec Radford Oleg Klimov OffRL 583 19,315 0 20 Jul 2017
Attention Is All You Need Ashish Vaswani Noam M. Shazeer Niki Parmar Jakob Uszkoreit Llion Jones Aidan Gomez Lukasz Kaiser Illia Polosukhin 3DV 811 132,725 0 12 Jun 2017
The Arcade Learning Environment: An Evaluation Platform for General Agents Marc G. Bellemare Yavar Naddaf J. Veness Michael Bowling 120 3,022 0 19 Jul 2012