Title
Nested Diffusion Models Using Hierarchical Latent Priors Xiao Zhang Ruoxi Jiang Rebecca Willett Michael Maire BDL DiffM 118 1 0 08 Dec 2024
Birth and Death of a Rose Chen Geng Yunzhi Zhang Shangzhe Wu Jiajun Wu AI4CE 118 2 0 06 Dec 2024
PaintScene4D: Consistent 4D Scene Generation from Text Prompts Vinayak Gupta Yunze Man Yu-Xiong Wang VGen 148 0 0 05 Dec 2024
T2I-FactualBench: Benchmarking the Factuality of Text-to-Image Models with Knowledge-Intensive Concepts Ziwei Huang Wanggui He Quanyu Long Yandi Wang Haoyuan Li ... Fangxun Shu Long Chen Hao Jiang Leilei Gan Leilei Gan EGVM 518 4 0 05 Dec 2024
DynamicControl: Adaptive Condition Selection for Improved Text-to-Image Generation Qu He Jinlong Peng P. Xu Boyuan Jiang Xiaobin Hu ... Yang Liu Yun Wang Chengjie Wang Xuelong Li Jing Zhang DiffM 212 1 0 04 Dec 2024
AccDiffusion v2: Towards More Accurate Higher-Resolution Diffusion Extrapolation Zhihang Lin Mingbao Lin Wengyi Zhan Rongrong Ji 138 0 0 03 Dec 2024
IQA-Adapter: Exploring Knowledge Transfer from Image Quality Assessment to Diffusion-based Generative Models Khaled Abud Sergey Lavrushkin Alexey Kirillov D. Vatolin 216 0 0 02 Dec 2024
Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis Anton Voronov Denis Kuznedelev Mikhail Khoroshikh Valentin Khrulkov Dmitry Baranchuk 261 4 0 02 Dec 2024
Schedule On the Fly: Diffusion Time Prediction for Faster and Better Image Generation Zilyu Ye Zhiyang Chen Tiancheng Li Zemin Huang Weijian Luo Guo-Jun Qi DiffM 132 6 0 02 Dec 2024
MuLan: Adapting Multilingual Diffusion Models for Hundreds of Languages with Negligible Cost Sen Xing Muyan Zhong Zeqiang Lai Liangchen Li Jing Liu Yaohui Wang Jifeng Dai Wenhai Wang 207 2 0 02 Dec 2024
SerialGen: Personalized Image Generation by First Standardization Then Personalization Cong Xie Han Zou Ruiqi Yu Yan Zhang Zhenpeng Zhan 146 1 0 02 Dec 2024
DiffPatch: Generating Customizable Adversarial Patches using Diffusion Models Zhixiang Wang Guangnan Ye Xinyu Wang Siheng Chen Ziyi Wang Xingjun Ma Yu-Gang Jiang AAML DiffM 199 0 0 02 Dec 2024
DyMO: Training-Free Diffusion Model Alignment with Dynamic Multi-Objective Scheduling Xin Xie Dong Gong 179 1 0 01 Dec 2024
Continuous Concepts Removal in Text-to-image Diffusion Models Tingxu Han Weisong Sun Yanrong Hu Chunrong Fang Yonglong Zhang Shiqing Ma Tao Zheng Zhenyu Chen Zhenting Wang DiffM 190 3 0 30 Nov 2024
Timestep Embedding Tells: It's Time to Cache for Video Diffusion Model Feng Liu Shiwei Zhang Xiaofeng Wang Yujie Wei Haonan Qiu Yuzhong Zhao Yingya Zhang Qixiang Ye Fang Wan VGen AI4TS 216 30 0 28 Nov 2024
Self-Cross Diffusion Guidance for Text-to-Image Synthesis of Similar Subjects Weimin Qiu Jieke Wang Meng Tang DiffM 185 1 0 28 Nov 2024
ModeDreamer: Mode Guiding Score Distillation for Text-to-3D Generation using Reference Image Prompts Uy Dieu Tran Minh Luu P. Nguyen K. Nguyen Binh-Son Hua DiffM 139 1 0 27 Nov 2024
Type-R: Automatically Retouching Typos for Text-to-Image Generation Wataru Shimoda Naoto Inoue Daichi Haraguchi Hayato Mitani S. Uchida Kota Yamaguchi DiffM 221 0 0 27 Nov 2024
Puzzle Similarity: A Perceptually-guided Cross-Reference Metric for Artifact Detection in 3D Scene Reconstructions Nicolai Hermann Jorge Condor Piotr Didyk 3DV 193 0 0 26 Nov 2024
VideoDirector: Precise Video Editing via Text-to-Video Models Yukun Wang Longguang Wang Zhiyuan Ma Qibin Hu Kai Xu Yulan Guo VGen DiffM 226 0 0 26 Nov 2024
AnyEdit: Mastering Unified High-Quality Image Editing for Any Idea Qifan Yu Wei Chow Zhongqi Yue Kaihang Pan Yang Wu Xiaoyang Wan Juncheng Billy Li Siliang Tang Hao Zhang Yueting Zhuang DiffM 236 29 0 24 Nov 2024
Unveil Inversion and Invariance in Flow Transformer for Versatile Image Editing P. Xu Boyuan Jiang Xiaobin Hu Donghao Luo Qu He Jing Zhang Chengjie Wang Yunsheng Wu Charles Ling Boyu Wang 227 3 0 24 Nov 2024
Gaussian Scenes: Pose-Free Sparse-View Scene Reconstruction using Depth-Enhanced Diffusion Priors Soumava Paul Prakhar Kaushik Alan Yuille 3DGS DiffM 544 0 0 24 Nov 2024
Large-Scale Text-to-Image Model with Inpainting is a Zero-Shot Subject-Driven Image Generator Chaehun Shin Jooyoung Choi Heeseung Kim Sungroh Yoon DiffM 171 13 0 23 Nov 2024
TKG-DM: Training-free Chroma Key Content Generation Diffusion Model Ryugo Morita Stanislav Frolov Brian B. Moser Takahiro Shirakawa Ko Watanabe Andreas Dengel Jinjia Zhou DiffM 156 0 0 23 Nov 2024
Classifier-Free Guidance inside the Attraction Basin May Cause Memorization Anubhav Jain Yuya Kobayashi Takashi Shibuya Yuhta Takida N. Memon Julian Togelius Yuki Mitsufuji DiffM 199 2 0 23 Nov 2024
$$\textit{Revelio}$: Interpreting and leveraging semantic information in diffusion models$ $\textit{Revelio}$ : Interpreting and leveraging semantic information in diffusion models Dahye Kim Xavier Thomas Deepti Ghadiyaram 143 4 0 23 Nov 2024
Exploiting Watermark-Based Defense Mechanisms in Text-to-Image Diffusion Models for Unauthorized Data Usage Soumil Datta Shih-Chieh Dai Leo Yu Guanhong Tao WIGM 115 0 0 22 Nov 2024
TEXGen: a Generative Diffusion Model for Mesh Textures Xin Yu Ze Yuan Yu Guo Ying-Tian Liu Jing Liu Yangguang Li Yan-Pei Cao Ding Liang Xiaojuan Qi 96 17 0 22 Nov 2024
Reward Fine-Tuning Two-Step Diffusion Models via Learning Differentiable Latent-Space Surrogate Reward Zhiwei Jia Yuesong Nan Huixi Zhao Gengdai Liu EGVM 203 1 0 22 Nov 2024
Text Embedding is Not All You Need: Attention Control for Text-to-Image Semantic Alignment with Text Self-Attention Maps Jeeyung Kim Erfan Esmaeili Qiang Qiu DiffM 134 1 0 21 Nov 2024
Safety Without Semantic Disruptions: Editing-free Safe Image Generation via Context-preserving Dual Latent Reconstruction Jordan Vice Naveed Akhtar Leonid Sigal Ajmal Mian Ajmal Mian DiffM 156 0 0 21 Nov 2024
On the Fairness, Diversity and Reliability of Text-to-Image Generative Models Jordan Vice Naveed Akhtar Leonid Sigal Richard Hartley Ajmal Mian EGVM 139 0 0 21 Nov 2024
AI-generated Image Detection: Passive or Watermark? Moyang Guo Yuepeng Hu Zhengyuan Jiang Zeyu Li Amir Sadovnik Arka Daw Neil Zhenqiang Gong 211 1 0 20 Nov 2024
Identity Preserving 3D Head Stylization with Multiview Score Distillation Bahri Batuhan Bilecen Ahmet Berke Gokmen Furkan Guzelant Aysegül Dündar 196 0 0 20 Nov 2024
CDI: Copyrighted Data Identification in Diffusion Models Jan Dubiñski Antoni Kowalczuk Franziska Boenisch Adam Dziedzic 124 2 0 19 Nov 2024
ColorEdit: Training-free Image-Guided Color editing with diffusion model Xingxi Yin Zhi Li Jingfeng Zhang Chenglin Li Yin Zhang DiffM 155 0 0 15 Nov 2024
Grounding Video Models to Actions through Goal Conditioned Exploration Yunhao Luo Yilun Du LM&Ro VGen 143 5 0 11 Nov 2024
Autoregressive Models in Vision: A Survey Jing Xiong Gongye Liu Lun Huang Chengyue Wu Taiqiang Wu ... Hao Fei Guillermo Sapiro Jiebo Luo Ping Luo Ngai Wong VGen 191 14 0 08 Nov 2024
Few-Shot Task Learning through Inverse Generative Modeling Aviv Netanyahu Yilun Du Antonia Bronars Jyothish Pari J. Tenenbaum Tianmin Shu Pulkit Agrawal 133 4 0 07 Nov 2024
ROBIN: Robust and Invisible Watermarks for Diffusion Models with Adversarial Optimization Huayang Huang Yu Wu Qian Wang DiffM WIGM 106 7 0 06 Nov 2024
Generating Synthetic Electronic Health Record Data: a Methodological Scoping Review with Benchmarking on Phenotype Data and Open-Source Software Xingran Chen Zhenke Wu Xu Shi Hyunghoon Cho Bhramar Mukherjee SyDa 82 2 0 06 Nov 2024
On Improved Conditioning Mechanisms and Pre-training Strategies for Diffusion Models Tariq Berrada Ifriqi Pietro Astolfi Melissa Hall Reyhane Askari Hemmat Yohann Benchetrit ... Matthew Muckley Karteek Alahari Adriana Romero Soriano Jakob Verbeek M. Drozdzal AI4CE VLM 139 4 0 05 Nov 2024
Denoising Fisher Training For Neural Implicit Samplers Weijian Luo Wei Deng 78 0 0 03 Nov 2024
TextDestroyer: A Training- and Annotation-Free Diffusion Method for Destroying Anomal Text from Images Mengcheng Li Mingbao Lin Chia-Wen Lin Chia-Wen Lin DiffM 92 0 0 01 Nov 2024
HairDiffusion: Vivid Multi-Colored Hair Editing via Latent Diffusion Yu Zeng Zhiyuan Liu Jiachen Liu Linlin Shen Kaijun Deng Weizhao He Jinbao Wang DiffM 52 0 0 29 Oct 2024
IntLoRA: Integral Low-rank Adaptation of Quantized Diffusion Models Hang Guo Yawei Li Tao Dai Shu-Tao Xia Luca Benini MQ 127 2 0 29 Oct 2024
Shallow Diffuse: Robust and Invisible Watermarking through Low-Dimensional Subspaces in Diffusion Models Wenda Li Huijie Zhang Qing Qu WIGM 104 2 0 28 Oct 2024
One-Step is Enough: Sparse Autoencoders for Text-to-Image Diffusion Models Viacheslav Surkov Chris Wendler Antonio Mari Mikhail Terekhov Justin Deschenaux Robert West Çağlar Gülçehre David Bau VLM 128 14 0 28 Oct 2024
LARP: Tokenizing Videos with a Learned Autoregressive Generative Prior Hanyu Wang Saksham Suri Yixuan Ren Hao Chen Abhinav Shrivastava VGen 107 12 0 28 Oct 2024