Forward KL Regularized Preference Optimization for Aligning Diffusion Policies

9 September 2024

Papers citing "Forward KL Regularized Preference Optimization for Aligning Diffusion Policies"

2 / 2 papers shown

Title
Policy-labeled Preference Learning: Is Preference Enough for RLHF? Taehyun Cho Seokhun Ju Seungyub Han Dohyeong Kim Kyungjae Lee Jungwoo Lee OffRL 29 0 0 06 May 2025
Planning with Diffusion for Flexible Behavior Synthesis Michael Janner Yilun Du J. Tenenbaum Sergey Levine DiffM 202 629 0 20 May 2022