Efficient Planning in a Compact Latent Action Space

22 August 2022

Tianjun Zhang

Papers citing "Efficient Planning in a Compact Latent Action Space"

34 / 34 papers shown

Title
Analytic Energy-Guided Policy Optimization for Offline Reinforcement Learning Jifeng Hu Sili Huang Z. Yang Shengchao Hu Li Shen H. Chen Lichao Sun Yi-Ju Chang Dacheng Tao OffRL 149 0 0 03 May 2025
Scalable Decision-Making in Stochastic Environments through Learned Temporal Abstraction Baiting Luo Ava Pettet Aron Laszka A. Dubey Ayan Mukhopadhyay OffRL 43 1 0 28 Feb 2025
Few-Shot Task Learning through Inverse Generative Modeling Aviv Netanyahu Yilun Du Antonia Bronars Jyothish Pari J. Tenenbaum Tianmin Shu Pulkit Agrawal 51 1 0 07 Nov 2024
Constrained Latent Action Policies for Model-Based Offline Reinforcement Learning Marvin Alles Philip Becker-Ehmck Patrick van der Smagt Maximilian Karl OffRL 36 0 0 07 Nov 2024
OGBench: Benchmarking Offline Goal-Conditioned RL Seohong Park Kevin Frans Benjamin Eysenbach Sergey Levine OffRL 50 8 0 26 Oct 2024
Leveraging Skills from Unlabeled Prior Data for Efficient Online Exploration Max Wilcoxson Qiyang Li Kevin Frans Sergey Levine SSL OffRL OnRL 57 0 0 23 Oct 2024
Predictive Coding for Decision Transformer Tung M. Luu Donghoon Lee Chang D. Yoo OffRL 58 2 0 04 Oct 2024
Planning Transformer: Long-Horizon Offline Reinforcement Learning with Planning Tokens Joseph Clinton Robert Lieck OffRL 46 4 0 14 Sep 2024
Goal-Reaching Policy Learning from Non-Expert Observations via Effective Subgoal Guidance Renming Huang Shaochong Liu Yunqiang Pei Peng Wang Guoqing Wang Yang Yang Hengtao Shen OffRL 34 0 0 06 Sep 2024
Unsupervised-to-Online Reinforcement Learning Junsu Kim Seohong Park Sergey Levine OnRL 53 3 0 27 Aug 2024
QueST: Self-Supervised Skill Abstractions for Learning Continuous Control Atharva Mete Haotian Xue Albert Wilcox Yongxin Chen Animesh Garg SSL 38 16 0 22 Jul 2024
TLDR: Unsupervised Goal-Conditioned RL via Temporal Distance-Aware Representations Junik Bae Kwanyoung Park Youngwoon Lee 37 2 0 11 Jul 2024
PlanDQ: Hierarchical Plan Orchestration via D-Conductor and Q-Performer Chang Chen Junyeob Baek Fei Deng Kenji Kawaguchi Çağlar Gülçehre Sungjin Ahn OffRL 33 1 0 10 Jun 2024
AD3: Implicit Action is the Key for World Models to Distinguish the Diverse Visual Distractors Yucen Wang Shenghua Wan Le Gan Shuai Feng De-Chuan Zhan VGen 25 4 0 15 Mar 2024
Foundation Policies with Hilbert Representations Seohong Park Tobias Kreiman Sergey Levine SSL OffRL 50 19 0 23 Feb 2024
PRISE: LLM-Style Sequence Compression for Learning Temporal Action Abstractions in Control Ruijie Zheng Ching-An Cheng Hal Daumé Furong Huang Andrey Kolobov 33 9 0 16 Feb 2024
Premier-TACO is a Few-Shot Policy Learner: Pretraining Multitask Representation via Temporal Action-Driven Contrastive Loss Ruijie Zheng Yongyuan Liang Xiyao Wang Shuang Ma Hal Daumé Huazhe Xu John Langford Praveen Palanisamy Kalyan Shankar Basu Furong Huang 40 5 0 09 Feb 2024
FoMo Rewards: Can we cast foundation models as reward functions? Ekdeep Singh Lubana Johann Brehmer P. D. Haan Taco S. Cohen OffRL LRM 48 2 0 06 Dec 2023
H-GAP: Humanoid Control with a Generalist Planner Zhengyao Jiang Yingchen Xu Nolan Wagener Yicheng Luo Michael Janner Edward Grefenstette Tim Rocktaschel Yuandong Tian AI4CE 27 5 0 05 Dec 2023
Rethinking Decision Transformer via Hierarchical Reinforcement Learning Yi Ma Chenjun Xiao Hebin Liang Jianye Hao OffRL 19 6 0 01 Nov 2023
Efficient Planning with Latent Diffusion Wenhao Li DiffM 40 4 0 30 Sep 2023
Subwords as Skills: Tokenization for Sparse-Reward Reinforcement Learning David Yunis Justin Jung Falcon Z. Dai Matthew R. Walter OffRL 39 0 0 08 Sep 2023
HIQL: Offline Goal-Conditioned RL with Latent States as Actions Seohong Park Dibya Ghosh Benjamin Eysenbach Sergey Levine OffRL 30 44 0 22 Jul 2023
Reparameterized Policy Learning for Multimodal Trajectory Optimization Zhiao Huang Litian Liang Z. Ling Xuanlin Li Chuang Gan H. Su 25 10 0 20 Jul 2023
Goal-Conditioned Predictive Coding for Offline Reinforcement Learning Zilai Zeng Ce Zhang Shijie Wang Chen Sun OffRL 29 5 0 07 Jul 2023
Recurrent Action Transformer with Memory A. Staroverov A. Bessonov Dmitry A. Yudin A. Kovalev Aleksandr I. Panov OffRL 33 4 0 15 Jun 2023
IQL-TD-MPC: Implicit Q-Learning for Hierarchical Model Predictive Control Rohan Chitnis Yingchen Xu B. Hashemi Lucas Lehnert Ürün Dogan Zheqing Zhu Olivier Delalleau OffRL 26 9 0 01 Jun 2023
A Generalist Dynamics Model for Control Ingmar Schubert Jingwei Zhang Jake Bruce Sarah Bechtle Emilio Parisotto Martin Riedmiller Jost Tobias Springenberg Arunkumar Byravan Leonard Hasenclever N. Heess AI4CE 33 28 0 18 May 2023
Masked Trajectory Models for Prediction, Representation, and Control Philipp Wu Arjun Majumdar Kevin Stone Yixin Lin Igor Mordatch Pieter Abbeel Aravind Rajeswaran OffRL 36 38 0 04 May 2023
The Wisdom of Hindsight Makes Language Models Better Instruction Followers Tianjun Zhang Fangchen Liu Justin Wong Pieter Abbeel Joseph E. Gonzalez 16 44 0 10 Feb 2023
Planning with Diffusion for Flexible Behavior Synthesis Michael Janner Yilun Du J. Tenenbaum Sergey Levine DiffM 202 632 0 20 May 2022
Offline Reinforcement Learning with Implicit Q-Learning Ilya Kostrikov Ashvin Nair Sergey Levine OffRL 214 843 0 12 Oct 2021
Learning Visually Guided Latent Actions for Assistive Teleoperation Siddharth Karamcheti Albert J. Zhai Dylan P. Losey Dorsa Sadigh 29 22 0 02 May 2021
Pixel Recurrent Neural Networks Aaron van den Oord Nal Kalchbrenner Koray Kavukcuoglu SSeg GAN 242 2,550 0 25 Jan 2016