DPOK: Reinforcement Learning for Fine-tuning Text-to-Image Diffusion Models

25 May 2023

Pieter Abbeel

Papers citing "DPOK: Reinforcement Learning for Fine-tuning Text-to-Image Diffusion Models"

40 / 40 papers shown

Title
DanceGRPO: Unleashing GRPO on Visual Generation Zeyue Xue Jie Wu Yu Gao Fangyuan Kong Lingting Zhu ... Zhiheng Liu Wei Liu Qiushan Guo Weilin Huang Ping Luo EGVM VGen 52 0 0 12 May 2025
Augmenting Perceptual Super-Resolution via Image Quality Predictors Fengjia Zhang Samrudhdhi B. Rangrej Tristan Aumentado-Armstrong Afsaneh Fazly Alex Levinshtein SupR 72 0 0 25 Apr 2025
EvolvingGrasp: Evolutionary Grasp Generation via Efficient Preference Alignment Yufei Zhu Yiming Zhong Zemin Yang Peishan Cong Jingyi Yu X. Zhu Y. Ma 55 1 0 18 Mar 2025
Flow to the Mode: Mode-Seeking Diffusion Autoencoders for State-of-the-Art Image Tokenization Kyle Sargent Kyle Hsu Justin Johnson L. Fei-Fei Jiajun Wu DiffM MU 58 3 0 14 Mar 2025
Towards Better Alignment: Training Diffusion Models with Reinforcement Learning Against Sparse Rewards Zijing Hu Fengda Zhang Long Chen Kun Kuang Jiahui Li Kaifeng Gao Jun Xiao X. Wang Wenwu Zhu EGVM 56 0 0 14 Mar 2025
Score as Action: Fine-Tuning Diffusion Generative Models by Continuous-time Reinforcement Learning Hanyang Zhao Haoxian Chen Ji Zhang D. Yao Wenpin Tang 60 0 0 03 Feb 2025
Efficient Diversity-Preserving Diffusion Alignment via Gradient-Informed GFlowNets Zhen Liu Tim Z. Xiao Weiyang Liu Yoshua Bengio Dinghuai Zhang 123 2 0 10 Dec 2024
Schedule On the Fly: Diffusion Time Prediction for Faster and Better Image Generation Zilyu Ye Zhiyang Chen Tiancheng Li Zemin Huang Weijian Luo Guo-jun Qi DiffM 83 5 0 02 Dec 2024
Reward Fine-Tuning Two-Step Diffusion Models via Learning Differentiable Latent-Space Surrogate Reward Zhiwei Jia Yuesong Nan Huixi Zhao Gengdai Liu EGVM 88 0 0 22 Nov 2024
TurboHopp: Accelerated Molecule Scaffold Hopping with Consistency Models Kiwoong Yoo Owen Oertell Junhyun Lee Sanghoon Lee Jaewoo Kang 31 0 0 28 Oct 2024
Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein Design Chenyu Wang Masatoshi Uehara Yichun He Amy Wang Tommaso Biancalani Avantika Lal Tommi Jaakkola Sergey Levine Hanchen Wang Aviv Regev 53 8 0 17 Oct 2024
ReinDiffuse: Crafting Physically Plausible Motions with Reinforced Diffusion Model Gaoge Han Mingjiang Liang Jinglei Tang Yongkang Cheng Wei Liu Shaoli Huang VGen 43 5 0 09 Oct 2024
DiffusionGuard: A Robust Defense Against Malicious Diffusion-based Image Editing June Suk Choi Kyungmin Lee Jongheon Jeong Saining Xie Jinwoo Shin Kimin Lee DiffM AAML 33 2 0 08 Oct 2024
Training-free Diffusion Model Alignment with Sampling Demons Po-Hung Yeh Kuang-Huei Lee Jun-Cheng Chen 39 4 0 08 Oct 2024
HERO: Human-Feedback Efficient Reinforcement Learning for Online Diffusion Model Finetuning Ayano Hiranaka Shang-Fu Chen Chieh-Hsin Lai Dongjun Kim Naoki Murata Takashi Shibuya Wei-Hsiang Liao Shao-Hua Sun Yuki Mitsufuji 47 1 0 07 Oct 2024
Tuning Timestep-Distilled Diffusion Model Using Pairwise Sample Optimization Zichen Miao Zhengyuan Yang Kevin Lin Ze Wang Zicheng Liu Lijuan Wang Qiang Qiu 45 3 0 04 Oct 2024
Adding Conditional Control to Diffusion Models with Reinforcement Learning Yulai Zhao Masatoshi Uehara Gabriele Scalia Tommaso Biancalani Sergey Levine Ehsan Hajiramezanali Ehsan Hajiramezanali AI4CE 57 3 0 17 Jun 2024
Margin-aware Preference Optimization for Aligning Diffusion Models without Reference Jiwoo Hong Sayak Paul Noah Lee Kashif Rasul James Thorne Jongheon Jeong 43 13 0 10 Jun 2024
Diffusion-RPO: Aligning Diffusion Models through Relative Preference Optimization Yi Gu Zhendong Wang Yueqin Yin Yujia Xie Mingyuan Zhou 38 15 0 10 Jun 2024
Information Theoretic Text-to-Image Alignment Chao Wang Giulio Franzese A. Finamore Massimo Gallo Pietro Michiardi 72 0 0 31 May 2024
Transfer Learning for Diffusion Models Yidong Ouyang Liyan Xie Hongyuan Zha Guang Cheng DiffM 57 2 0 27 May 2024
Curriculum Direct Preference Optimization for Diffusion and Consistency Models Florinel-Alin Croitoru Vlad Hondru Radu Tudor Ionescu N. Sebe Mubarak Shah EGVM 89 6 0 22 May 2024
CoCoG: Controllable Visual Stimuli Generation based on Human Concept Representations Chen Wei Jiachen Zou Dietmar Heinke Quanying Liu 48 3 0 25 Apr 2024
YaART: Yet Another ART Rendering Technology Sergey Kastryulin Artem Konev Alexander Shishenya Eugene Lyapustin Artem Khurshudov ... Dmitrii Kornilov Mikhail Romanov Artem Babenko Sergei Ovcharenko Valentin Khrulkov EGVM 38 1 0 08 Apr 2024
RL for Consistency Models: Faster Reward Guided Text-to-Image Generation Owen Oertell Jonathan D. Chang Yiyi Zhang Kianté Brantley Wen Sun EGVM 41 4 0 25 Mar 2024
AGFSync: Leveraging AI-Generated Feedback for Preference Optimization in Text-to-Image Generation Jingkun An Yinghao Zhu Zongjian Li Haoran Feng Bohua Chen Yemin Shi Chengwei Pan 37 2 0 20 Mar 2024
Advancing Text-Driven Chest X-Ray Generation with Policy-Based Reinforcement Learning Woojung Han Chanyoung Kim Dayun Ju Yumin Shim Seong Jae Hwang MedIm 37 8 0 11 Mar 2024
Implicit Diffusion: Efficient Optimization through Stochastic Sampling Pierre Marion Anna Korba Peter Bartlett Mathieu Blondel Valentin De Bortoli Arnaud Doucet Felipe Llinares-López Courtney Paquette Quentin Berthet 76 12 0 08 Feb 2024
Progress and Prospects in 3D Generative AI: A Technical Overview including 3D human Song Bai Jie Li 27 6 0 05 Jan 2024
Carve3D: Improving Multi-view Reconstruction Consistency for Diffusion Models with RL Finetuning Desai Xie Jiahao Li Hao Tan Xin Sun Zhixin Shu Yi Zhou Sai Bi Soren Pirk Arie E. Kaufman 34 8 0 21 Dec 2023
Rich Human Feedback for Text-to-Image Generation Youwei Liang Junfeng He Gang Li Peizhao Li Arseniy Klimovskiy ... Yiwen Luo Yang Li Kai Kohlhoff Deepak Ramachandran Vidhya Navalpakkam EGVM 29 67 0 15 Dec 2023
An Invitation to Deep Reinforcement Learning Bernhard Jaeger Andreas Geiger OffRL OOD 78 5 0 13 Dec 2023
Reinforcement Learning from Diffusion Feedback: Q* for Image Search Aboli Rajan Marathe VLM 41 0 0 27 Nov 2023
Using Human Feedback to Fine-tune Diffusion Models without Any Reward Model Kai Yang Jian Tao Jiafei Lyu Chunjiang Ge Jiaxin Chen Qimai Li Weihan Shen Xiaolong Zhu Xiu Li EGVM 23 89 0 22 Nov 2023
Reinforcement Learning for Generative AI: A Survey Yuanjiang Cao Quan.Z Sheng Julian McAuley Lina Yao SyDa 46 10 0 28 Aug 2023
Counting Guidance for High Fidelity Text-to-Image Synthesis Wonjune Kang Kevin Galim H. Koo Nam Ik Cho DiffM 32 8 0 30 Jun 2023
Pick-a-Pic: An Open Dataset of User Preferences for Text-to-Image Generation Yuval Kirstain Adam Polyak Uriel Singer Shahbuland Matiana Joe Penna Omer Levy EGVM 168 351 0 02 May 2023
Multiresolution Textual Inversion Giannis Daras A. Dimakis 37 34 0 30 Nov 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 313 11,953 0 04 Mar 2022
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation Junnan Li Dongxu Li Caiming Xiong S. Hoi MLLM BDL VLM CLIP 392 4,137 0 28 Jan 2022