Scaling Offline RL via Efficient and Expressive Shortcut Models

Scaling Offline RL via Efficient and Expressive Shortcut Models

28 May 2025

Nicolas Espinosa-Dice

Kianté Brantley

Papers citing "Scaling Offline RL via Efficient and Expressive Shortcut Models"

19 / 19 papers shown

Title
THE-SEAN: A Heart Rate Variation-Inspired Temporally High-Order Event-Based Visual Odometry with Self-Supervised Spiking Event Accumulation Networks Chaoran Xiong Litao Wei Kehui Ma Zhen Sun Yan Xiang Zihan Nan Trieu-Kien Truong Ling Pei 55 0 0 07 Mar 2025
All Roads Lead to Likelihood: The Value of Reinforcement Learning in Fine-Tuning Gokul Swamy Sanjiban Choudhury Wen Sun Zhiwei Steven Wu J. Andrew Bagnell OffRL 86 13 0 03 Mar 2025
Flow Matching Guide and Code Y. Lipman Marton Havasi Peter Holderrieth Neta Shaul Matt Le Brian Karrer Ricky T. Q. Chen David Lopez-Paz Heli Ben-Hamu Itai Gat 82 38 0 09 Dec 2024
OGBench: Benchmarking Offline Goal-Conditioned RL Seohong Park Kevin Frans Benjamin Eysenbach Sergey Levine OffRL 87 18 0 26 Oct 2024
Diffusing States and Matching Scores: A New Framework for Imitation Learning Runzhe Wu Yiding Chen Gokul Swamy Kianté Brantley Wen Sun DiffM 68 4 0 17 Oct 2024
One Step Diffusion via Shortcut Models Kevin Frans Danijar Hafner Sergey Levine Pieter Abbeel VLM DiffM 66 35 0 16 Oct 2024
Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization Haoran Xu Li Jiang Jianxiong Li Zhuoran Yang Zhaoran Wang Victor Chan Xianyuan Zhan OffRL 43 78 0 28 Mar 2023
Offline Reinforcement Learning via High-Fidelity Generative Behavior Modeling Huayu Chen Cheng Lu Chengyang Ying Hang Su Jun Zhu DiffM OffRL 124 113 0 29 Sep 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 495 9,009 0 28 Jan 2022
Offline Reinforcement Learning with Implicit Q-Learning Ilya Kostrikov Ashvin Nair Sergey Levine OffRL 243 874 0 12 Oct 2021
A Minimalist Approach to Offline Reinforcement Learning Scott Fujimoto S. Gu OffRL 75 804 0 12 Jun 2021
Offline Reinforcement Learning as One Big Sequence Modeling Problem Michael Janner Qiyang Li Sergey Levine OffRL 84 665 0 03 Jun 2021
Score-Based Generative Modeling through Stochastic Differential Equations Yang Song Jascha Narain Sohl-Dickstein Diederik P. Kingma Abhishek Kumar Stefano Ermon Ben Poole DiffM SyDa 211 6,293 0 26 Nov 2020
Denoising Diffusion Probabilistic Models Jonathan Ho Ajay Jain Pieter Abbeel DiffM 178 17,550 0 19 Jun 2020
AWAC: Accelerating Online Reinforcement Learning with Offline Datasets Ashvin Nair Abhishek Gupta Murtaza Dalal Sergey Levine OffRL OnRL 59 601 0 16 Jun 2020
Conservative Q-Learning for Offline Reinforcement Learning Aviral Kumar Aurick Zhou George Tucker Sergey Levine OffRL OnRL 78 1,780 0 08 Jun 2020
MOReL : Model-Based Offline Reinforcement Learning Rahul Kidambi Aravind Rajeswaran Praneeth Netrapalli Thorsten Joachims OffRL 47 662 0 12 May 2020
Layer Normalization Jimmy Lei Ba J. Kiros Geoffrey E. Hinton 154 10,412 0 21 Jul 2016
Adam: A Method for Stochastic Optimization Diederik P. Kingma Jimmy Ba ODL 225 149,474 0 22 Dec 2014