SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis

4 July 2023

Papers citing "SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis"

50 / 1,635 papers shown

Title
FreeControl: Training-Free Spatial Control of Any Text-to-Image Diffusion Model with Any Condition Sicheng Mo Fangzhou Mu Kuan Heng Lin Yanli Liu Bochen Guan Yin Li Bolei Zhou DiffM 53 59 0 12 Dec 2023
EditGuard: Versatile Image Watermarking for Tamper Localization and Copyright Protection Xuanyu Zhang Runyi Li Jiwen Yu You-song Xu Weiqi Li Jian Zhang WIGM 39 45 0 12 Dec 2023
Boosting Latent Diffusion with Flow Matching Johannes S. Fischer Ming Gui Pingchuan Ma Nick Stracke S. A. Baumann Bjorn Ommer 22 20 0 12 Dec 2023
Learned representation-guided diffusion models for large-image generation Alexandros Graikos Srikar Yellapragada Minh-Quan Le S. Kapse Prateek Prasanna Joel H. Saltz Dimitris Samaras DiffM 40 27 0 12 Dec 2023
ControlNet-XS: Designing an Efficient and Effective Architecture for Controlling Text-to-Image Diffusion Models Denis Zavadski Johann-Friedrich Feiden Carsten Rother DiffM 48 10 0 11 Dec 2023
InstructAny2Pix: Flexible Visual Editing via Multimodal Instruction Following Shufan Li Harkanwar Singh Aditya Grover DiffM 30 7 0 11 Dec 2023
Stellar: Systematic Evaluation of Human-Centric Personalized Text-to-Image Methods Panos Achlioptas Alexandros Benetatos Iordanis Fostiropoulos Dimitris Skourtis 29 8 0 11 Dec 2023
Characteristic Guidance: Non-linear Correction for Diffusion Model at Large Guidance Scale Candi Zheng Yuan Lan DiffM 32 4 0 11 Dec 2023
Efficient Quantization Strategies for Latent Diffusion Models Yuewei Yang Xiaoliang Dai Jialiang Wang Peizhao Zhang Hongbo Zhang DiffM MQ 24 13 0 09 Dec 2023
SmartMask: Context Aware High-Fidelity Mask Generation for Fine-grained Object Insertion and Layout Control Jaskirat Singh Jianming Zhang Qing Liu Cameron Smith Zhe-nan Lin Liang Zheng DiffM 34 11 0 08 Dec 2023
UDiffText: A Unified Framework for High-quality Text Synthesis in Arbitrary Images via Character-aware Diffusion Models Yiming Zhao Zhouhui Lian 79 27 0 08 Dec 2023
GenTron: Diffusion Transformers for Image and Video Generation Shoufa Chen Mengmeng Xu Jiawei Ren Yuren Cong Sen He Yanping Xie Animesh Sinha Ping Luo Tao Xiang Juan-Manuel Perez-Rua VGen 39 38 0 07 Dec 2023
Hierarchical Spatio-temporal Decoupling for Text-to-Video Generation Zhiwu Qing Shiwei Zhang Jiayu Wang Xiang Wang Yujie Wei Yingya Zhang Changxin Gao Nong Sang VGen DiffM 32 37 0 07 Dec 2023
PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding Zhen Li Mingdeng Cao Xintao Wang Zhongang Qi Ming-Ming Cheng Ying Shan DiffM 60 189 0 07 Dec 2023
Approximate Caching for Efficiently Serving Diffusion Models Shubham Agarwal Subrata Mitra Sarthak Chakraborty Srikrishna Karanam Koyel Mukherjee S. Saini DiffM 33 4 0 07 Dec 2023
Cascade-Zero123: One Image to Highly Consistent 3D with Self-Prompted Nearby Views Yabo Chen Jiemin Fang Yuyang Huang Taoran Yi Xiaopeng Zhang Lingxi Xie Xinggang Wang Wenrui Dai Hongkai Xiong Qi Tian DiffM 33 20 0 07 Dec 2023
Merging by Matching Models in Task Parameter Subspaces Derek Tam Mohit Bansal Colin Raffel MoMe 21 10 0 07 Dec 2023
iDesigner: A High-Resolution and Complex-Prompt Following Text-to-Image Diffusion Model for Interior Design Ruyi Gan Xiaojun Wu Junyu Lu Yuanhe Tian Di Zhang ... Renliang Sun Chang Liu Jiaxing Zhang Pingjian Zhang Yan Song 97 4 0 07 Dec 2023
KOALA: Empirical Lessons Toward Memory-Efficient and Fast Diffusion Models for Text-to-Image Synthesis Youngwan Lee Kwanyong Park Yoorhim Cho Yong-Ju Lee Sung Ju Hwang VLM 29 3 0 07 Dec 2023
Diffusion Illusions: Hiding Images in Plain Sight R. Burgert Xiang Li Abe Leite Kanchana Ranasinghe Michael S. Ryoo 55 17 0 06 Dec 2023
A Task is Worth One Word: Learning with Task Prompts for High-Quality Versatile Image Inpainting Junhao Zhuang Yanhong Zeng Wenran Liu Chun Yuan Kai Chen DiffM 53 71 0 06 Dec 2023
XCube: Large-Scale 3D Generative Modeling using Sparse Voxel Hierarchies Xuanchi Ren Jiahui Huang Fangyin Wei Ken Museth Sanja Fidler Francis Williams 28 48 0 06 Dec 2023
FRDiff : Feature Reuse for Universal Training-free Acceleration of Diffusion Models Junhyuk So Jungwon Lee Eunhyeok Park DiffM 36 9 0 06 Dec 2023
Kandinsky 3.0 Technical Report V.Ya. Arkhipkin Andrei Filatov Viacheslav Vasilev Anastasia Maltseva Said Azizov Igor Pavlov Julia Agafonova Andrey Kuznetsov Denis Dimitrov DiffM 30 12 0 06 Dec 2023
Cache Me if You Can: Accelerating Diffusion Models through Block Caching Felix Wimbauer Bichen Wu Edgar Schoenfeld Xiaoliang Dai Ji Hou ... Jonas Kohler Christian Rupprecht Daniel Cremers Peter Vajda Jialiang Wang DiffM 38 58 0 06 Dec 2023
FERGI: Automatic Annotation of User Preferences for Text-to-Image Generation from Spontaneous Facial Expression Reaction Shuangquan Feng Junhua Ma Virginia R. de Sa EGVM 29 0 0 05 Dec 2023
DreamInpainter: Text-Guided Subject-Driven Image Inpainting with Diffusion Models Shaoan Xie Yang Zhao Zhisheng Xiao Kelvin C. K. Chan Yandong Li Yanwu Xu Kun Zhang Tingbo Hou DiffM 36 26 0 05 Dec 2023
Mismatch Quest: Visual and Textual Feedback for Image-Text Misalignment Brian Gordon Yonatan Bitton Yonatan Shafir Roopal Garg Xi Chen Dani Lischinski Daniel Cohen-Or Idan Szpektor 44 11 0 05 Dec 2023
LivePhoto: Real Image Animation with Text-guided Motion Control Xi Chen Zhiheng Liu Mengting Chen Yutong Feng Yu Liu Yujun Shen Hengshuang Zhao VGen DiffM 47 30 0 05 Dec 2023
H-GAP: Humanoid Control with a Generalist Planner Zhengyao Jiang Yingchen Xu Nolan Wagener Yicheng Luo Michael Janner Edward Grefenstette Tim Rocktaschel Yuandong Tian AI4CE 27 5 0 05 Dec 2023
A Contrastive Compositional Benchmark for Text-to-Image Synthesis: A Study with Unified Text-to-Image Fidelity Metrics Xiangru Zhu Penglei Sun Chengyu Wang Jingping Liu Zhixu Li Yanghua Xiao Jun Huang CoGe 112 5 0 04 Dec 2023
Readout Guidance: Learning Control from Diffusion Features Grace Luo Trevor Darrell Oliver Wang Dan B. Goldman Aleksander Holynski 16 22 0 04 Dec 2023
Style Aligned Image Generation via Shared Attention Amir Hertz Andrey Voynov Shlomi Fruchter Daniel Cohen-Or DiffM 21 122 0 04 Dec 2023
Generalization by Adaptation: Diffusion-Based Domain Extension for Domain-Generalized Semantic Segmentation J. Niemeijer Manuel Schwonberg Jan-Aike Termöhlen Nico M. Schmidt Tim Fingscheidt DiffM 36 15 0 04 Dec 2023
X-Adapter: Adding Universal Compatibility of Plugins for Upgraded Diffusion Model L. Ran Xiaodong Cun Jia-Wei Liu Rui Zhao Song Zijie Xintao Wang Jussi Keppo Mike Zheng Shou 37 11 0 04 Dec 2023
ImageDream: Image-Prompt Multi-view Diffusion for 3D Generation Peng Wang Yichun Shi 16 165 0 02 Dec 2023
StableDreamer: Taming Noisy Score Distillation Sampling for Text-to-3D Pengsheng Guo Hans Hao Adam Caccavale Zhongzheng Ren Edward Zhang Qi Shan Aditya Sankar A. Schwing Alex Colburn Fangchang Ma DiffM 3DGS 53 7 0 02 Dec 2023
Raising the Bar of AI-generated Image Detection with CLIP D. Cozzolino Giovanni Poggi Riccardo Corvi Matthias Nießner L. Verdoliva VLM 35 74 0 30 Nov 2023
$ART$\boldsymbol{\cdot}$V: Auto-Regressive Text-to-Video Generation with Diffusion Models$ ART $\boldsymbol{\cdot}$ V: Auto-Regressive Text-to-Video Generation with Diffusion Models Wenming Weng Ruoyu Feng Yanhui Wang Qi Dai Chunyu Wang ... Jianmin Bao Yuhui Yuan Chong Luo Yueyi Zhang Zhiwei Xiong VGen 30 32 0 30 Nov 2023
MicroCinema: A Divide-and-Conquer Approach for Text-to-Video Generation Yanhui Wang Jianmin Bao Wenming Weng Ruoyu Feng Dacheng Yin ... Yuhui Yuan Chuanxin Tang Xiaoyan Sun Chong Luo Baining Guo DiffM VGen 66 15 0 30 Nov 2023
One-step Diffusion with Distribution Matching Distillation Tianwei Yin Michael Gharbi Richard Zhang Eli Shechtman Frédo Durand William T. Freeman Taesung Park DiffM 135 221 0 30 Nov 2023
IMMA: Immunizing text-to-image Models against Malicious Adaptation Yijia Zheng Raymond A. Yeh 53 8 0 30 Nov 2023
Diffusion Models Without Attention Jing Nathan Yan Jiatao Gu Alexander M. Rush 32 61 0 30 Nov 2023
Synthesize, Diagnose, and Optimize: Towards Fine-Grained Vision-Language Understanding Wujian Peng Sicheng Xie Zuyao You Shiyi Lan Zuxuan Wu VLM CoGe MLLM 33 18 0 30 Nov 2023
HiPA: Enabling One-Step Text-to-Image Diffusion Models via High-Frequency-Promoting Adaptation Yifan Zhang Bryan Hooi VLM 37 9 0 30 Nov 2023
ElasticDiffusion: Training-free Arbitrary Size Image Generation through Global-Local Content Separation Moayed Haji-Ali Guha Balakrishnan Vicente Ordonez 56 24 0 30 Nov 2023
GELDA: A generative language annotation framework to reveal visual biases in datasets Krish Kabra Kathleen M. Lewis Guha Balakrishnan VLM 24 1 0 29 Nov 2023
VBench: Comprehensive Benchmark Suite for Video Generative Models Ziqi Huang Yinan He Jiashuo Yu Fan Zhang Chenyang Si ... Xinyuan Chen Limin Wang Dahua Lin Yu Qiao Ziwei Liu VGen 77 351 0 29 Nov 2023
Curved Diffusion: A Generative Model With Optical Geometry Control Andrey Voynov Amir Hertz Moab Arar Shlomi Fruchter Daniel Cohen-Or DiffM 30 4 0 29 Nov 2023
$M$^{2}$Chat: Empowering VLM for Multimodal LLM Interleaved Text-Image Generation$ M $^{2}$ Chat: Empowering VLM for Multimodal LLM Interleaved Text-Image Generation Xiaowei Chi Rongyu Zhang Zhengkai Jiang Yijiang Liu Ziyi Lin ... Chaoyou Fu Peng Gao Shanghang Zhang Qi-fei Liu Yi-Ting Guo MLLM 33 1 0 29 Nov 2023