Diffusion Guidance Is a Controllable Policy Improvement Operator

29 May 2025

Papers citing "Diffusion Guidance Is a Controllable Policy Improvement Operator"

3 / 3 papers shown

Title
Learning a Diffusion Model Policy from Rewards via Q-Score Matching Michael Psenka Alejandro Escontrela Pieter Abbeel Yi-An Ma DiffM 156 33 0 17 Feb 2025
OGBench: Benchmarking Offline Goal-Conditioned RL Seohong Park Kevin Frans Benjamin Eysenbach Sergey Levine OffRL 146 29 0 26 Oct 2024
Diffusion Actor-Critic: Formulating Constrained Policy Iteration as Diffusion Noise Regression for Offline Reinforcement Learning Linjiajie Fang Ruoxue Liu Jing Zhang Wenjia Wang Bing-Yi Jing OffRL 166 7 0 31 May 2024