v1v2v3v4 (latest)

ImageReward: Learning and Evaluating Human Preferences for Text-to-Image Generation

12 April 2023

Xiao Liu

Yuxiao Dong

ArXiv (abs)PDF HTML Github (1412★)

Papers citing "ImageReward: Learning and Evaluating Human Preferences for Text-to-Image Generation"

50 / 271 papers shown

Title
Learning to Sample Effective and Diverse Prompts for Text-to-Image Generation Taeyoung Yun Dinghuai Zhang Jinkyoo Park Ling Pan DiffM 108 6 0 17 Feb 2025
Diffusion-Sharpening: Fine-tuning Diffusion Models with Denoising Trajectory Sharpening Ye Tian L. Yang Xinchen Zhang Yunhai Tong Mengdi Wang Tengjiao Wang 124 2 0 17 Feb 2025
Score as Action: Fine-Tuning Diffusion Generative Models by Continuous-time Reinforcement Learning Hanyang Zhao Haoxian Chen Ji Zhang D. Yao Wenpin Tang 154 1 0 03 Feb 2025
Refining Alignment Framework for Diffusion Models with Intermediate-Step Preference Ranking Jie Ren Yuhang Zhang Dongrui Liu Xiaopeng Zhang Qi Tian 75 0 0 01 Feb 2025
DiffSplat: Repurposing Image Diffusion Models for Scalable Gaussian Splat Generation Chenguo Lin Panwang Pan Bangbang Yang Zeming Li Yadong Mu 3DGS 172 9 0 28 Jan 2025
Improving Video Generation with Human Feedback Jie Liu Gongye Liu Jiajun Liang Ziyang Yuan Xiaokun Liu ... Pengfei Wan Di Zhang Kun Gai Yujiu Yang Wanli Ouyang VGen EGVM 168 26 0 23 Jan 2025
Parameter-Efficient Fine-Tuning for Foundation Models Dan Zhang Tao Feng Lilong Xue Yuandong Wang Yuxiao Dong J. Tang 236 12 0 23 Jan 2025
DiffDoctor: Diagnosing Image Diffusion Models Before Treating Yiyang Wang Xi Chen Xiaogang Xu S. Ji Yongxu Liu Yujun Shen Hengshuang Zhao DiffM 151 0 0 21 Jan 2025
Boosting Text-To-Image Generation via Multilingual Prompting in Large Multimodal Models Yongyu Mu Hengyu Li Jiadong Wang Xiaoxuan Zhou Chenglong Wang Yingfeng Luo Qiaozhi He Tong Xiao Guocheng Chen Jingbo Zhu MLLM 79 0 0 13 Jan 2025
SpotDiffusion: A Fast Approach For Seamless Panorama Generation Over Time Stanislav Frolov Brian B. Moser Andreas Dengel 79 3 0 08 Jan 2025
Rare-to-Frequent: Unlocking Compositional Generation Power of Diffusion Models on Rare Concepts with LLM Guidance Dongmin Park Sebin Kim Taehong Moon Minkyu Kim Kangwook Lee Jaewoong Cho DiffM CoGe 120 5 0 08 Jan 2025
AdaDiff: Adaptive Step Selection for Fast Diffusion Models Hui Zhang Zuxuan Wu Zhen Xing Jie Shao Yu-Gang Jiang 149 13 0 31 Dec 2024
Efficient Diversity-Preserving Diffusion Alignment via Gradient-Informed GFlowNets Zhen Liu Tim Z. Xiao Weiyang Liu Yoshua Bengio Dinghuai Zhang 258 6 0 10 Dec 2024
T2I-FactualBench: Benchmarking the Factuality of Text-to-Image Models with Knowledge-Intensive Concepts Ziwei Huang Wanggui He Quanyu Long Yandi Wang Haoyuan Li ... Fangxun Shu Long Chen Hao Jiang Leilei Gan Leilei Gan EGVM 523 4 0 05 Dec 2024
Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis Anton Voronov Denis Kuznedelev Mikhail Khoroshikh Valentin Khrulkov Dmitry Baranchuk 267 4 0 02 Dec 2024
LiteVAR: Compressing Visual Autoregressive Modelling with Efficient Attention and Quantization Rui Xie Tianchen Zhao Zhihang Yuan Rui Wan Wenxi Gao Zhenhua Zhu Xuefei Ning Yu Wang VGen MQ 95 4 0 26 Nov 2024
AI-Generated Image Quality Assessment Based on Task-Specific Prompt and Multi-Granularity Similarity Jili Xia Lihuo He Fei Gao Peng Sun Leida Li Xinbo Gao EGVM 144 1 0 25 Nov 2024
Interactive Visual Assessment for Text-to-Image Generation Models Xiaoyue Mi Fan Tang Juan Cao Qiang Sheng Ziyao Huang Ziwei Sun Yi Liu Tong-Yee Lee EGVM 111 0 0 23 Nov 2024
SageAttention2: Efficient Attention with Thorough Outlier Smoothing and Per-thread INT4 Quantization Jintao Zhang Haofeng Huang Pengle Zhang Jia Wei Jun-Jie Zhu Jianfei Chen MQ VLM 183 2 0 17 Nov 2024
Visual question answering based evaluation metrics for text-to-image generation Mizuki Miyamoto Ryugo Morita Jinjia Zhou EGVM 112 1 0 15 Nov 2024
Token Merging for Training-Free Semantic Binding in Text-to-Image Synthesis Taihang Hu Linxuan Li Joost van de Weijer Hongcheng Gao Fahad Shahbaz Khan Jian Yang Ming-Ming Cheng Kai Wang Yaxing Wang DiffM 134 9 0 11 Nov 2024
TypeScore: A Text Fidelity Metric for Text-to-Image Generative Models Georgia Gabriela Sampaio Ruixiang Zhang Shuangfei Zhai Jiatao Gu J. Susskind Navdeep Jaitly Yizhe Zhang DiffM CLIP 65 1 0 02 Nov 2024
MoLE: Enhancing Human-centric Text-to-image Diffusion via Mixture of Low-rank Experts Jie Zhu Yukang Chen Mingyu Ding Ping Luo Leye Wang Jingdong Wang DiffM 69 5 0 30 Oct 2024
Natural Language Inference Improves Compositionality in Vision-Language Models Paola Cascante-Bonilla Yu Hou Yang Trista Cao Hal Daumé III Rachel Rudinger ReLM CoGe VLM 83 4 0 29 Oct 2024
PrefPaint: Aligning Image Inpainting Diffusion Model with Human Preference Kendong Liu Zhiyu Zhu Chuanhao Li Hui Liu H. Zeng Junhui Hou EGVM 76 4 0 29 Oct 2024
GrounDiT: Grounding Diffusion Transformers via Noisy Patch Transplantation Phillip Y. Lee Taehoon Yoon Minhyuk Sung 145 7 1 27 Oct 2024
Scalable Ranked Preference Optimization for Text-to-Image Generation Shyamgopal Karthik Huseyin Coskun Zeynep Akata Sergey Tulyakov J. Ren Anil Kag EGVM 111 9 0 23 Oct 2024
An Online Learning Approach to Prompt-based Selection of Generative Models and LLMs Xiaoyan Hu Ho-fung Leung Farzan Farnia 273 3 0 17 Oct 2024
TV-3DG: Mastering Text-to-3D Customized Generation with Visual Prompt Jiahui Yang Donglin Di Baorui Ma Xun Yang Yongjia Ma ... Wei Chen Jianxun Cui Zhou Xue Meng Wang Yebin Liu DiffM 69 2 0 16 Oct 2024
DDIL: Diversity Enhancing Diffusion Distillation With Imitation Learning Risheek Garrepalli Shweta Mahajan Munawar Hayat Fatih Porikli DiffM 57 0 0 15 Oct 2024
Improving Long-Text Alignment for Text-to-Image Diffusion Models Luping Liu Chao Du Tianyu Pang Zehan Wang Chongxuan Li Dong Xu VLM 121 8 0 15 Oct 2024
SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers Enze Xie Junsong Chen Junyu Chen Han Cai Haotian Tang ... Zhekai Zhang Zhekai Zhang Ligeng Zhu Yaojie Lu Song Han VLM 139 88 0 14 Oct 2024
Ada-K Routing: Boosting the Efficiency of MoE-based LLMs Tongtian Yue Longteng Guo Jie Cheng Xuange Gao Qingbin Liu MoE 67 3 0 14 Oct 2024
Toward Guidance-Free AR Visual Generation via Condition Contrastive Alignment Huayu Chen Hang Su Peize Sun Jun Zhu VLM 84 4 0 12 Oct 2024
Rectified Diffusion: Straightness Is Not Your Need in Rectified Flow Fu-Yun Wang Ling Yang Zhaoyang Huang Mengdi Wang Hongsheng Li 82 21 0 09 Oct 2024
ReinDiffuse: Crafting Physically Plausible Motions with Reinforced Diffusion Model Gaoge Han Mingjiang Liang Jinglei Tang Yongkang Cheng Wei Liu Shaoli Huang VGen 82 6 0 09 Oct 2024
IterComp: Iterative Composition-Aware Feedback Learning from Model Gallery for Text-to-Image Generation Xinchen Zhang Ling Yang Ge Li Yaqi Cai Jiake Xie Yong Tang Yujiu Yang Mengdi Wang Bin Cui EGVM CoGe 113 11 0 09 Oct 2024
DiffusionGuard: A Robust Defense Against Malicious Diffusion-based Image Editing June Suk Choi Kyungmin Lee Jongheon Jeong Saining Xie Jinwoo Shin Kimin Lee DiffM AAML 65 4 0 08 Oct 2024
T2V-Turbo-v2: Enhancing Video Generation Model Post-Training through Data, Reward, and Conditional Guidance Design Jiachen Li Qian Long Jian Zheng Xiaofeng Gao Robinson Piramuthu Wenhu Chen William Yang Wang VGen 128 26 0 08 Oct 2024
Training-free Diffusion Model Alignment with Sampling Demons Po-Hung Yeh Kuang-Huei Lee Jun-Cheng Chen 100 9 0 08 Oct 2024
Holistic Unlearning Benchmark: A Multi-Faceted Evaluation for Text-to-Image Diffusion Model Unlearning Saemi Moon M. Lee Sangdon Park Dongwoo Kim 94 3 0 08 Oct 2024
ACDC: Autoregressive Coherent Multimodal Generation using Diffusion Correction Hyungjin Chung Dohun Lee Jong Chul Ye VGen DiffM 68 2 0 07 Oct 2024
HERO: Human-Feedback Efficient Reinforcement Learning for Online Diffusion Model Finetuning Ayano Hiranaka Shang-Fu Chen Chieh-Hsin Lai Dongjun Kim Naoki Murata Takashi Shibuya Wei-Hsiang Liao Shao-Hua Sun Yuki Mitsufuji 126 2 0 07 Oct 2024
Learning Efficient and Effective Trajectories for Differential Equation-based Image Restoration Zhiyu Zhu Jinhui Hou Hui Liu H. Zeng Junhui Hou 81 0 0 07 Oct 2024
Attention Shift: Steering AI Away from Unsafe Content Shivank Garg Manyana Tiwari 80 0 0 06 Oct 2024
Is What You Ask For What You Get? Investigating Concept Associations in Text-to-Image Models Salma Abdel Magid Weiwei Pan Simon Warchol Grace Guo Junsik Kim Mahia Rahman Hanspeter Pfister 193 0 0 06 Oct 2024
Tuning Timestep-Distilled Diffusion Model Using Pairwise Sample Optimization Zichen Miao Zhengyuan Yang Kevin Lin Ze Wang Zicheng Liu Lijuan Wang Qiang Qiu 97 6 0 04 Oct 2024
SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration Jintao Zhang Jia Wei Pengle Zhang Jun-Jie Zhu Jun Zhu Jianfei Chen VLM MQ 186 39 0 03 Oct 2024
ComfyGen: Prompt-Adaptive Workflows for Text-to-Image Generation Rinon Gal Adi Haviv Yuval Alaluf Amit H. Bermano Daniel Cohen-Or Gal Chechik DiffM 60 6 0 02 Oct 2024
Improving Fine-Grained Control via Aggregation of Multiple Diffusion Models Conghan Yue Zhengwei Peng Shiyan Du Zhi Ji Chuangjian Cai Le Wan Dongyu Zhang 83 0 0 02 Oct 2024