SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis

4 July 2023

ArXiv (abs)PDF HTML Github (25942★)

Papers citing "SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis"

50 / 607 papers shown

Title
Ouroboros3D: Image-to-3D Generation via 3D-aware Recursive Diffusion Hao Wen Zehuan Huang Yaohui Wang Xinyuan Chen Yu Qiao 159 9 0 05 Jun 2024
ViDiT-Q: Efficient and Accurate Quantization of Diffusion Transformers for Image and Video Generation Tianchen Zhao Tongcheng Fang Haofeng Huang Enshu Liu Widyadewi Soedarmadji ... Shengen Yan Huazhong Yang Xuefei Ning Xuefei Ning Yu Wang MQ VGen 193 35 0 04 Jun 2024
AutoStudio: Crafting Consistent Subjects in Multi-turn Interactive Image Generation Junhao Cheng Xi Lu Hanhui Li Khun Loun Zai Baiqiao Yin Yuhao Cheng Yiqiang Yan Xiaodan Liang DiffM VGen 128 11 0 03 Jun 2024
Information Theoretic Text-to-Image Alignment Chao Wang Giulio Franzese A. Finamore Massimo Gallo Pietro Michiardi 176 0 0 31 May 2024
Don't drop your samples! Coherence-aware training benefits Conditional diffusion Nicolas Dufour Victor Besnier Vicky Kalogeiton David Picard DiffM 131 2 0 30 May 2024
Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability Shenyuan Gao Jiazhi Yang Li Chen Kashyap Chitta Yihang Qiu Andreas Geiger Jun Zhang Hongyang Li 167 103 0 27 May 2024
ClassDiffusion: More Aligned Personalization Tuning with Explicit Class Guidance Jiannan Huang Jun Hao Liew Hanshu Yan Yuyang Yin Yao Zhao Yunchao Wei Yunchao Wei DiffM 207 7 0 27 May 2024
Ensembling Diffusion Models via Adaptive Feature Aggregation Cong Wang Kuan Tian Yonghang Guan Jun Zhang Zhiwei Jiang Fei Shen Xiao Han 127 6 0 27 May 2024
Diffusion Bridge AutoEncoders for Unsupervised Representation Learning Yeongmin Kim Kwanghyeon Lee Minsang Park Byeonghu Na Il-Chul Moon DiffM 136 2 0 27 May 2024
FreezeAsGuard: Mitigating Illegal Adaptation of Diffusion Models via Selective Tensor Freezing Kai Huang Wei Gao 85 2 0 24 May 2024
Improved Distribution Matching Distillation for Fast Image Synthesis Tianwei Yin Michael Gharbi Taesung Park Richard Zhang Eli Shechtman Frédo Durand William T. Freeman DiffM 143 127 0 23 May 2024
LiteVAE: Lightweight and Efficient Variational Autoencoders for Latent Diffusion Models Seyedmorteza Sadat Jakob Buhmann Derek Bradley Otmar Hilliges Romann M. Weber 152 9 0 23 May 2024
Dreamer XL: Towards High-Resolution Text-to-3D Generation via Trajectory Score Matching Xingyu Miao Haoran Duan Varun Ojha Jun Song Tejal Shah Yang Long R. Ranjan 131 4 0 18 May 2024
Generative AI for 2D Character Animation Jaime Guajardo Ozgun Y. Bursalioglu Dan B. Goldman VGen 49 3 0 17 May 2024
Lumina-T2X: Transforming Text into Any Modality, Resolution, and Duration via Flow-based Large Diffusion Transformers Peng Gao Le Zhuo Ziyi Lin Ruoyi Du Xu Luo ... Weicai Ye He Tong Jingwen He Yu Qiao Hongsheng Li VGen 103 91 0 09 May 2024
Video Diffusion Models: A Survey Andrew Melnik Michal Ljubljanac Cong Lu Qi Yan Weiming Ren Helge J. Ritter VGen 145 16 0 06 May 2024
DOCCI: Descriptions of Connected and Contrasting Images Yasumasa Onoe Sunayana Rane Zachary Berger Yonatan Bitton Jaemin Cho ... Zarana Parekh Jordi Pont-Tuset Garrett Tanzer Su Wang Jason Baldridge 117 63 0 30 Apr 2024
GS-LRM: Large Reconstruction Model for 3D Gaussian Splatting Kai Zhang Sai Bi Hao Tan Yuanbo Xiangli Nanxuan Zhao Kalyan Sunkavalli Zexiang Xu 3DGS 128 149 0 30 Apr 2024
TwinDiffusion: Enhancing Coherence and Efficiency in Panoramic Image Generation with Diffusion Models Teng Zhou Yongchuan Tang DiffM 144 2 0 30 Apr 2024
G-Refine: A General Quality Refiner for Text-to-Image Generation Chunyi Li Haoning Wu Hongkun Hao Zicheng Zhang Tengchaun Kou Chaofeng Chen Lei Bai Xiaohong Liu Weisi Lin Guangtao Zhai 96 4 0 29 Apr 2024
TheaterGen: Character Management with LLM for Consistent Multi-turn Image Generation Junhao Cheng Baiqiao Yin Kaixin Cai Minbin Huang Hanhui Li ... Yue Li Yifei Li Yuhao Cheng Yiqiang Yan Xiaodan Liang DiffM MLLM 138 13 0 29 Apr 2024
MuseumMaker: Continual Style Customization without Catastrophic Forgetting Chenxi Liu Gan Sun Wenqi Liang Jiahua Dong Can Qin Yang Cong DiffM 125 4 0 25 Apr 2024
Revisiting Text-to-Image Evaluation with Gecko: On Metrics, Prompts, and Human Ratings Olivia Wiles Chuhan Zhang Isabela Albuquerque Ivana Kajić Su Wang ... Jordi Pont-Tuset Aida Nematzadeh Anant Nawalgaria Jordi Pont-Tuset Aida Nematzadeh EGVM 257 22 0 25 Apr 2024
SEED-X: Multimodal Models with Unified Multi-granularity Comprehension and Generation Yuying Ge Sijie Zhao Jinguo Zhu Yixiao Ge Kun Yi Lin Song Chen Li Xiaohan Ding Ying Shan VLM 142 142 0 22 Apr 2024
RHanDS: Refining Malformed Hands for Generated Images with Decoupled Structure and Style Guidance Chengrui Wang Pengfei Liu Min Zhou Ming Zeng Xubin Li Tiezheng Ge Bo Zheng DiffM 128 5 0 22 Apr 2024
Hyper-SD: Trajectory Segmented Consistency Model for Efficient Image Synthesis Yuxi Ren Xin Xia Yanzuo Lu Jiacheng Zhang Jie Wu Pan Xie Xing Wang Xuefeng Xiao 164 79 0 21 Apr 2024
LASER: Tuning-Free LLM-Driven Attention Control for Efficient Text-conditioned Image-to-Animation Haoyu Zheng Wenqiao Zhang Yaoke Wang Hao Zhou Jiang Liu Juncheng Li Zheqi Lv Siliang Tang Yueting Zhuang Yueting Zhuang 138 2 0 21 Apr 2024
F2FLDM: Latent Diffusion Models with Histopathology Pre-Trained Embeddings for Unpaired Frozen Section to FFPE Translation M. M. Ho Shikha Dubey Yosep Chong Beatrice Knudsen Tolga Tasdizen MedIm AI4CE 86 5 0 19 Apr 2024
EdgeFusion: On-Device Text-to-Image Generation Thibault Castells Hyoung-Kyu Song Tairen Piao Shinkook Choi Bo-Kyeong Kim Hanyoung Yim Changgwun Lee Jae Gon Kim Tae-Ho Kim VLM 69 6 0 18 Apr 2024
LAPTOP-Diff: Layer Pruning and Normalized Distillation for Compressing Diffusion Models Dingkun Zhang Sijia Li Chen Chen Qingsong Xie H. Lu 125 29 0 17 Apr 2024
From Data Deluge to Data Curation: A Filtering-WoRA Paradigm for Efficient Text-based Person Search Jintao Sun Zhedong Zheng Gangyi Ding Gangyi Ding 124 8 0 16 Apr 2024
RealmDreamer: Text-Driven 3D Scene Generation with Inpainting and Depth Diffusion Jaidev Shriram Alex Trevithick Lingjie Liu Ravi Ramamoorthi DiffM 3DGS 161 59 0 10 Apr 2024
YaART: Yet Another ART Rendering Technology Sergey Kastryulin Artem Konev Alexander Shishenya Eugene Lyapustin Artem Khurshudov ... Dmitrii Kornilov Mikhail Romanov Artem Babenko Sergei Ovcharenko Valentin Khrulkov EGVM 73 1 0 08 Apr 2024
MagicTime: Time-lapse Video Generation Models as Metamorphic Simulators Shenghai Yuan Jinfa Huang Yujun Shi Yongqi Xu Ruijie Zhu Bin Lin Xinhua Cheng Li-xin Yuan Jiebo Luo VGen 169 36 0 07 Apr 2024
Aligning Diffusion Models by Optimizing Human Utility Shufan Li Konstantinos Kallidromitis Akash Gokul Yusuke Kato Kazuki Kozuka 157 34 0 06 Apr 2024
Gen3DSR: Generalizable 3D Scene Reconstruction via Divide and Conquer from a Single View Andreea Dogaru M. Ozer Bernhard Egger 3DGS 139 7 0 04 Apr 2024
Faster Diffusion via Temporal Attention Decomposition Haozhe Liu Wentian Zhang Jinheng Xie Francesco Faccio Mengmeng Xu Tao Xiang Mike Zheng Shou Juan-Manuel Perez-Rua Jürgen Schmidhuber DiffM 174 24 0 03 Apr 2024
Jailbreaking Prompt Attack: A Controllable Adversarial Attack against Diffusion Models Jiachen Ma Anda Cao Zhiqing Xiao Jie Zhang Chaonan Ye Chao Ye Junbo Zhao 137 33 0 02 Apr 2024
Bigger is not Always Better: Scaling Properties of Latent Diffusion Models Kangfu Mei Zhengzhong Tu M. Delbracio Hossein Talebi Vishal M. Patel P. Milanfar DiffM 88 13 0 01 Apr 2024
Enhancing Efficiency in Vision Transformer Networks: Design Techniques and Insights Moein Heidari Reza Azad Sina Ghorbani Kolahi René Arimond Leon Niggemeier ... Afshin Bozorgpour Ehsan Khodapanah Aghdam Amirhossein Kazerouni Ilker Hacihaliloglu Dorit Merhof 97 7 0 28 Mar 2024
AID: Attention Interpolation of Text-to-Image Diffusion Qiyuan He Jinghao Wang Ziwei Liu Angela Yao DiffM 84 10 0 26 Mar 2024
Continuous, Subject-Specific Attribute Control in T2I Models by Identifying Semantic Directions S. A. Baumann Felix Krause Michael Neumayr Nick Stracke Vincent Tao Hu Bjorn Ommer Björn Ommer DiffM LM&Ro 134 12 0 25 Mar 2024
Implicit Style-Content Separation using B-LoRA Yarden Frenkel Yael Vinker Ariel Shamir Daniel Cohen-Or MoMe OffRL 99 47 0 21 Mar 2024
Building Optimal Neural Architectures using Interpretable Knowledge Keith G. Mills Fred X. Han Mohammad Salameh Shengyao Lu Chunhua Zhou Jiao He Fengyu Sun Di Niu 67 2 0 20 Mar 2024
VSTAR: Generative Temporal Nursing for Longer Dynamic Video Synthesis Yumeng Li William H. Beluch Margret Keuper Dan Zhang Anna Khoreva DiffM VGen 129 5 0 20 Mar 2024
LASPA: Latent Spatial Alignment for Fast Training-free Single Image Editing Yazeed Alharbi Peter Wonka DiffM 66 0 0 19 Mar 2024
DreamMotion: Space-Time Self-Similar Score Distillation for Zero-Shot Video Editing Hyeonho Jeong Jinho Chang Geon Yeong Park Jong Chul Ye DiffM VGen 102 18 0 18 Mar 2024
Infinite-ID: Identity-preserved Personalization via ID-semantics Decoupling Paradigm Yi Wu Ziqiang Li Heliang Zheng Chaoyue Wang Bin Li DiffM 111 22 0 18 Mar 2024
3D Human Reconstruction in the Wild with Synthetic Data Using Generative Models Yongtao Ge Wenjia Wang Yongfan Chen Hao Chen Chunhua Shen 3DH 72 8 0 17 Mar 2024
Giving a Hand to Diffusion Models: a Two-Stage Approach to Improving Conditional Human Image Generation Anton Pelykh Ozge Mercanoglu Richard Bowden DiffM 69 8 0 15 Mar 2024