v1v2v3 (latest)

HERO: Human-Feedback Efficient Reinforcement Learning for Online Diffusion Model Finetuning

7 October 2024

Papers citing "HERO: Human-Feedback Efficient Reinforcement Learning for Online Diffusion Model Finetuning"

37 / 37 papers shown

Title
EvolvingGrasp: Evolutionary Grasp Generation via Efficient Preference Alignment Yufei Zhu Yiming Zhong Zemin Yang Peishan Cong Jingyi Yu X. Zhu Y. Ma 96 1 0 18 Mar 2025
Beyond Aesthetics: Cultural Competence in Text-to-Image Models Nithish Kannen Arif Ahmad Marco Andreetto Vinodkumar Prabhakaran Utsav Prabhu Adji Bousso Dieng Pushpak Bhattacharyya Shachi Dave 104 20 0 09 Jul 2024
Non-confusing Generation of Customized Concepts in Diffusion Models Wang Lin Jingyuan Chen Jiaxin Shi Yichen Zhu Chen Liang ... Tao Jin Zhou Zhao Fei Wu Shuicheng Yan Hanwang Zhang DiffM 77 14 0 11 May 2024
MACE: Mass Concept Erasure in Diffusion Models Shilin Lu Zilan Wang Leyang Li Yanzhu Liu A. Kong DiffM 92 93 0 10 Mar 2024
Feedback Efficient Online Fine-Tuning of Diffusion Models Masatoshi Uehara Yulai Zhao Kevin Black Ehsan Hajiramezanali Gabriele Scalia N. Diamant Alex Tseng Sergey Levine Tommaso Biancalani 116 28 0 26 Feb 2024
From Pampas to Pixels: Fine-Tuning Diffusion Models for Gaúcho Heritage Marcellus Amadeus William Alberto Cruz Castañeda A. F. Zanella F. Mahlow 101 3 0 10 Jan 2024
EmoGen: Emotional Image Content Generation with Text-to-Image Diffusion Models Jingyuan Yang Jiawei Feng Hui Huang VLM 56 8 0 09 Jan 2024
Using Human Feedback to Fine-tune Diffusion Models without Any Reward Model Kai Yang Jian Tao Jiafei Lyu Chunjiang Ge Jiaxin Chen Qimai Li Weihan Shen Xiaolong Zhu Xiu Li EGVM 126 109 0 22 Nov 2023
Diffusion Model Alignment Using Direct Preference Optimization Bram Wallace Meihua Dang Rafael Rafailov Linqi Zhou Aaron Lou Senthil Purushwalkam Stefano Ermon Caiming Xiong Shafiq Joty Nikhil Naik EGVM 159 288 0 21 Nov 2023
Aligning Text-to-Image Diffusion Models with Reward Backpropagation Mihir Prabhudesai Anirudh Goyal Deepak Pathak Katerina Fragkiadaki 141 133 0 05 Oct 2023
Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion Dongjun Kim Chieh-Hsin Lai Wei-Hsiang Liao Naoki Murata Yuhta Takida Toshimitsu Uesaka Yutong He Yuki Mitsufuji Stefano Ermon DiffM 138 197 0 01 Oct 2023
Directly Fine-Tuning Diffusion Models on Differentiable Rewards Amita Gajewar Paul Vicol G. Bansal David J Fleet 110 177 0 29 Sep 2023
On the Equivalence of Consistency-Type Models: Consistency Models, Consistent Diffusion Models, and Fokker-Planck Regularization Chieh-Hsin Lai Yuhta Takida Toshimitsu Uesaka Naoki Murata Yuki Mitsufuji Stefano Ermon DiffM 80 10 0 01 Jun 2023
Direct Preference Optimization: Your Language Model is Secretly a Reward Model Rafael Rafailov Archit Sharma E. Mitchell Stefano Ermon Christopher D. Manning Chelsea Finn ALM 405 4,187 0 29 May 2023
DPOK: Reinforcement Learning for Fine-tuning Text-to-Image Diffusion Models Ying Fan Olivia Watkins Yuqing Du Hao Liu Moonkyung Ryu Craig Boutilier Pieter Abbeel Mohammad Ghavamzadeh Kangwook Lee Kimin Lee 167 167 0 25 May 2023
Training Diffusion Models with Reinforcement Learning Kevin Black Michael Janner Yilun Du Ilya Kostrikov Sergey Levine EGVM 158 379 0 22 May 2023
Pick-a-Pic: An Open Dataset of User Preferences for Text-to-Image Generation Yuval Kirstain Adam Polyak Uriel Singer Shahbuland Matiana Joe Penna Omer Levy EGVM 235 420 0 02 May 2023
ImageReward: Learning and Evaluating Human Preferences for Text-to-Image Generation Jiazheng Xu Xiao Liu Yuchen Wu Yuxuan Tong Qinkai Li Ming Ding Jie Tang Yuxiao Dong 161 413 0 12 Apr 2023
Ablating Concepts in Text-to-Image Diffusion Models Nupur Kumari Bin Zhang Sheng-Yu Wang Eli Shechtman Richard Y. Zhang Jun-Yan Zhu VLM 75 201 0 23 Mar 2023
GPT-4 Technical Report OpenAI OpenAI OpenAI Josh Achiam Steven Adler Sandhini Agarwal Lama Ahmad ... Shengjia Zhao Tianhao Zheng Juntang Zhuang William Zhuk Barret Zoph LLMAG MLLM 1.6K 14,852 0 15 Mar 2023
Erasing Concepts from Diffusion Models Rohit Gandikota Joanna Materzyñska Jaden Fiotto-Kaufman David Bau DiffM 135 313 0 13 Mar 2023
Aligning Text-to-Image Models using Human Feedback Kimin Lee Hao Liu Moonkyung Ryu Olivia Watkins Yuqing Du Craig Boutilier Pieter Abbeel Mohammad Ghavamzadeh S. Gu EGVM 142 285 0 23 Feb 2023
Adding Conditional Control to Text-to-Image Diffusion Models Lvmin Zhang Anyi Rao Maneesh Agrawala AI4CE 300 4,198 1 10 Feb 2023
FP-Diffusion: Improving Score-based Diffusion Models by Enforcing the Underlying Score Fokker-Planck Equation Chieh-Hsin Lai Yuhta Takida Naoki Murata Toshimitsu Uesaka Yuki Mitsufuji Stefano Ermon DiffM 92 32 0 09 Oct 2022
DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation Nataniel Ruiz Yuanzhen Li Varun Jampani Yael Pritch Michael Rubinstein Kfir Aberman 386 2,908 0 25 Aug 2022
An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion Rinon Gal Yuval Alaluf Yuval Atzmon Or Patashnik Amit H. Bermano Gal Chechik Daniel Cohen-Or 176 1,905 0 02 Aug 2022
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation Junnan Li Dongxu Li Caiming Xiong Guosheng Lin MLLM BDL VLM CLIP 571 4,438 0 28 Jan 2022
High-Resolution Image Synthesis with Latent Diffusion Models Robin Rombach A. Blattmann Dominik Lorenz Patrick Esser Bjorn Ommer 3DV 606 15,854 0 20 Dec 2021
Learning Transferable Visual Models From Natural Language Supervision Alec Radford Jong Wook Kim Chris Hallacy Aditya A. Ramesh Gabriel Goh ... Amanda Askell Pamela Mishkin Jack Clark Gretchen Krueger Ilya Sutskever CLIP VLM 1.1K 30,092 0 26 Feb 2021
Score-Based Generative Modeling through Stochastic Differential Equations Yang Song Jascha Narain Sohl-Dickstein Diederik P. Kingma Abhishek Kumar Stefano Ermon Ben Poole DiffM SyDa 534 6,606 0 26 Nov 2020
Denoising Diffusion Implicit Models Jiaming Song Chenlin Meng Stefano Ermon VLM DiffM 334 7,531 0 06 Oct 2020
Denoising Diffusion Probabilistic Models Jonathan Ho Ajay Jain Pieter Abbeel DiffM 1.0K 18,531 0 19 Jun 2020
Unsupervised Learning of Visual Features by Contrasting Cluster Assignments Mathilde Caron Ishan Misra Julien Mairal Priya Goyal Piotr Bojanowski Armand Joulin OCL SSL 346 4,109 0 17 Jun 2020
Language Models are Few-Shot Learners Tom B. Brown Benjamin Mann Nick Ryder Melanie Subbiah Jared Kaplan ... Christopher Berner Sam McCandlish Alec Radford Ilya Sutskever Dario Amodei BDL 1.1K 42,712 0 28 May 2020
A Simple Framework for Contrastive Learning of Visual Representations Ting-Li Chen Simon Kornblith Mohammad Norouzi Geoffrey E. Hinton SSL 431 18,975 0 13 Feb 2020
Momentum Contrast for Unsupervised Visual Representation Learning Kaiming He Haoqi Fan Yuxin Wu Saining Xie Ross B. Girshick SSL 272 12,165 0 13 Nov 2019
Proximal Policy Optimization Algorithms John Schulman Filip Wolski Prafulla Dhariwal Alec Radford Oleg Klimov OffRL 693 19,363 0 20 Jul 2017