SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis

4 July 2023

Papers citing "SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis"

50 / 1,635 papers shown

Title
HiDiffusion: Unlocking Higher-Resolution Creativity and Efficiency in Pretrained Diffusion Models Shen Zhang Zhaowei Chen Zhenyu Zhao Yuhao Chen Yao Tang Jiajun Liang 37 6 0 29 Nov 2023
MMA-Diffusion: MultiModal Attack on Diffusion Models Yijun Yang Ruiyuan Gao Xiaosen Wang Tsung-Yi Ho Nan Xu Qiang Xu 29 62 0 29 Nov 2023
HandRefiner: Refining Malformed Hands in Generated Images by Diffusion-based Conditional Inpainting Wenquan Lu Yufei Xu Jing Zhang Chaoyue Wang Dacheng Tao DiffM 60 26 0 29 Nov 2023
Rethinking Image Editing Detection in the Era of Generative AI Revolution Zhihao Sun Haipeng Fang Xinying Zhao Danding Wang Juan Cao 36 8 0 29 Nov 2023
DreamSync: Aligning Text-to-Image Generation with Image Understanding Feedback Jiao Sun Deqing Fu Yushi Hu Su Wang Royi Rassin ... Dana Alon Charles Herrmann Sjoerd van Steenkiste Ranjay Krishna Cyrus Rashtchian EGVM 37 40 0 29 Nov 2023
Unlocking Spatial Comprehension in Text-to-Image Diffusion Models Mohammad Mahdi Derakhshani Menglin Xia Harkirat Singh Behl Cees G. M. Snoek Victor Rühle 25 2 0 28 Nov 2023
Shadows Don't Lie and Lines Can't Bend! Generative Models don't know Projective Geometry...for now Ayush Sarkar Hanlin Mai Amitabh Mahapatra Svetlana Lazebnik D. A. Forsyth Anand Bhattad GAN 35 34 0 28 Nov 2023
Adversarial Diffusion Distillation Axel Sauer Dominik Lorenz A. Blattmann Robin Rombach 138 332 0 28 Nov 2023
Ranni: Taming Text-to-Image Diffusion for Accurate Instruction Following Yutong Feng Biao Gong Di Chen Yujun Shen Yu Liu Jingren Zhou DiffM 34 43 0 28 Nov 2023
COLE: A Hierarchical Generation Framework for Multi-Layered and Editable Graphic Design Peidong Jia Chenxuan Li Yuhui Yuan Zeyu Liu Yichao Shen ... Dong Chen Ji Li Xiaodong Xie Shanghang Zhang Baining Guo 30 6 0 28 Nov 2023
SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models Yuwei Guo Ceyuan Yang Anyi Rao Maneesh Agrawala Dahua Lin Bo Dai DiffM VGen 28 114 0 28 Nov 2023
Panacea: Panoramic and Controllable Video Generation for Autonomous Driving Yuqing Wen Yucheng Zhao Yingfei Liu Fan Jia Yanhui Wang Chong Luo Chi Zhang Tiancai Wang Xiaoyan Sun Xiangyu Zhang 72 57 0 28 Nov 2023
As-Plausible-As-Possible: Plausibility-Aware Mesh Deformation Using 2D Diffusion Priors Seungwoo Yoo Kunho Kim Vladimir G. Kim Minhyuk Sung DiffM 39 13 0 28 Nov 2023
LEDITS++: Limitless Image Editing using Text-to-Image Models Manuel Brack Felix Friedrich Katharina Kornmeier Linoy Tsaban P. Schramowski Kristian Kersting Apolinário Passos DiffM 40 70 0 28 Nov 2023
MobileDiffusion: Instant Text-to-Image Generation on Mobile Devices Yang Zhao Yanwu Xu Zhisheng Xiao Haolin Jia Tingbo Hou VLM 47 11 0 28 Nov 2023
SEED-Bench-2: Benchmarking Multimodal Large Language Models Bohao Li Yuying Ge Yixiao Ge Guangzhi Wang Rui Wang Ruimao Zhang Ying Shan MLLM VLM 31 67 0 28 Nov 2023
TextDiffuser-2: Unleashing the Power of Language Models for Text Rendering Jingye Chen Yupan Huang Tengchao Lv Lei Cui Qifeng Chen Furu Wei DiffM 27 61 0 28 Nov 2023
PEA-Diffusion: Parameter-Efficient Adapter with Knowledge Distillation in non-English Text-to-Image Generation Jiancang Ma Chen Chen Qingsong Xie H. Lu DiffM VLM 33 3 0 28 Nov 2023
CoSeR: Bridging Image and Language for Cognitive Super-Resolution Haoze Sun Wenbo Li Jianzhuang Liu Haoyu Chen Renjing Pei X. Zou Youliang Yan Yujiu Yang SupR 45 45 0 27 Nov 2023
Deceptive-Human: Prompt-to-NeRF 3D Human Generation with 3D-Consistent Synthetic Images Shiu-hong Kao Xinhang Liu Yu-Wing Tai Chi-Keung Tang 29 0 0 27 Nov 2023
SiTH: Single-view Textured Human Reconstruction with Image-Conditioned Diffusion Hsuan-I Ho Mingli Song Otmar Hilliges DiffM 26 31 0 27 Nov 2023
LLMGA: Multimodal Large Language Model based Generation Assistant Bin Xia Shiyin Wang Yingfan Tao Yitong Wang Jiaya Jia MLLM 41 12 0 27 Nov 2023
One More Step: A Versatile Plug-and-Play Module for Rectifying Diffusion Schedule Flaws and Enhancing Low-Frequency Controls Minghui Hu Jianbin Zheng Chuanxia Zheng Chaoyue Wang Dacheng Tao Tat-Jen Cham DiffM 26 3 0 27 Nov 2023
UniRepLKNet: A Universal Perception Large-Kernel ConvNet for Audio, Video, Point Cloud, Time-Series and Image Recognition Xiaohan Ding Yiyuan Zhang Yixiao Ge Sijie Zhao Lin Song Xiangyu Yue Ying Shan VLM AI4TS SSL 29 102 0 27 Nov 2023
HawkI: Homography & Mutual Information Guidance for 3D-free Single Image to Aerial View D. Kothandaraman Dinesh Manocha Ming C. Lin Dinesh Manocha DiffM 31 2 0 27 Nov 2023
Flow-Guided Diffusion for Video Inpainting Bohai Gu Yongsheng Yu Hengrui Fan Libo Zhang VGen DiffM 32 12 0 26 Nov 2023
Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets A. Blattmann Tim Dockhorn Sumith Kulal Daniel Mendelevitch Maciej Kilian ... Zion English Vikram S. Voleti Adam Letts Varun Jampani Robin Rombach VGen 178 1,019 0 25 Nov 2023
Leveraging Diffusion Perturbations for Measuring Fairness in Computer Vision Nicholas Lui Bryan Chia William Berrios Candace Ross Douwe Kiela 27 2 0 25 Nov 2023
GaussianEditor: Swift and Controllable 3D Editing with Gaussian Splatting Yiwen Chen Zilong Chen Chi Zhang Feng Wang Xiaofeng Yang Yikai Wang Zhongang Cai Lei Yang Huaping Liu Guosheng Lin 3DGS 108 186 0 24 Nov 2023
DemoFusion: Democratising High-Resolution Image Generation With No Ruoyi Du Dongliang Chang Timothy M. Hospedales Yi-Zhe Song Zhanyu Ma 41 47 0 24 Nov 2023
Paragraph-to-Image Generation with Information-Enriched Diffusion Model Weijia Wu Zhuang Li Yefei He Mike Zheng Shou Chunhua Shen Lele Cheng Yan Li Tingting Gao Di Zhang VLM 141 24 0 24 Nov 2023
ZipLoRA: Any Subject in Any Style by Effectively Merging LoRAs Viraj Shah Nataniel Ruiz Forrester Cole Erika Lu Svetlana Lazebnik Yuanzhen Li Varun Jampani DiffM 36 100 0 22 Nov 2023
Diffusion Model Alignment Using Direct Preference Optimization Bram Wallace Meihua Dang Rafael Rafailov Linqi Zhou Aaron Lou Senthil Purushwalkam Stefano Ermon Caiming Xiong Chenyu You Nikhil Naik EGVM 50 227 0 21 Nov 2023
GPT4Motion: Scripting Physical Motions in Text-to-Video Generation via Blender-Oriented GPT Planning Jiaxi Lv Yi Huang Mingfu Yan Jiancheng Huang Jianzhuang Liu Yifan Liu Yafei Wen Xiaoxin Chen Shifeng Chen VGen DiffM 32 23 0 21 Nov 2023
LoCo: Locally Constrained Training-Free Layout-to-Image Synthesis Peiang Zhao Han Li Ruiyang Jin S. Kevin Zhou DiffM 51 12 0 21 Nov 2023
AnimateAnything: Fine-Grained Open Domain Image Animation with Motion Guidance Zuozhuo Dai Zhenghao Zhang Yao Yao Bingxue Qiu Siyu Zhu Long Qin Weizhi Wang VGen 28 44 0 21 Nov 2023
Concept Sliders: LoRA Adaptors for Precise Control in Diffusion Models Rohit Gandikota Joanna Materzyñska Tingrui Zhou Antonio Torralba David Bau DiffM 46 62 0 20 Nov 2023
Pyramid Diffusion for Fine 3D Large Scene Generation Yuheng Liu Xinke Li Xueting Li Lu Qi Chongshou Li Ming-Hsuan Yang 70 15 0 20 Nov 2023
EditShield: Protecting Unauthorized Image Editing by Instruction-guided Diffusion Models Ruoxi Chen Haibo Jin Yixin Liu Jinyin Chen Haohan Wang Lichao Sun 28 10 0 19 Nov 2023
Make Pixels Dance: High-Dynamic Video Generation Yan Zeng Guoqiang Wei Jiani Zheng Jiaxin Zou Yang Wei Yuchen Zhang Hang Li DiffM VGen 21 92 0 18 Nov 2023
Emu Video: Factorizing Text-to-Video Generation by Explicit Image Conditioning Rohit Girdhar Mannat Singh Andrew Brown Quentin Duval S. Azadi Sai Saketh Rambhatla Akbar Shah Xi Yin Devi Parikh Ishan Misra DiffM VGen 61 190 0 17 Nov 2023
Text-to-Sticker: Style Tailoring Latent Diffusion Models for Human Expression Animesh Sinha Bo Sun Anmol Kalia Arantxa Casanova Elliot Blanchard ... Ankit Ramchandani Maziar Sanjabi Sonal Gupta Amy Bearman Dhruv Mahajan DiffM 36 4 0 17 Nov 2023
The Chosen One: Consistent Characters in Text-to-Image Diffusion Models Omri Avrahami Amir Hertz Yael Vinker Moab Arar Shlomi Fruchter Ohad Fried Daniel Cohen-Or Dani Lischinski DiffM 60 32 0 16 Nov 2023
Synthetically Enhanced: Unveiling Synthetic Data's Potential in Medical Imaging Research Bardia Khosravi Frank Li Theo Dapamede Pouria Rouzrokh Cooper Gamble ... C. Wyles Andrew B. Sellergren S. Purkayastha Bradley J. Erickson J. Gichoya MedIm 36 17 0 15 Nov 2023
UFOGen: You Forward Once Large Scale Text-to-Image Generation via Diffusion GANs Yanwu Xu Yang Zhao Zhisheng Xiao Tingbo Hou 137 107 0 14 Nov 2023
FIRST: A Million-Entry Dataset for Text-Driven Fashion Synthesis and Design Zhen Huang Yihao Li Dong Pei Jiapeng Zhou Xuliang Ning Jianlin Han Xiaoguang Han Xuejun Chen 40 3 0 13 Nov 2023
Instant3D: Fast Text-to-3D with Sparse-View Generation and Large Reconstruction Model Jiahao Li Hao Tan Kai Zhang Zexiang Xu Fujun Luan Yinghao Xu Yicong Hong Kalyan Sunkavalli Greg Shakhnarovich Sai Bi 59 254 0 10 Nov 2023
Post-training Quantization for Text-to-Image Diffusion Models with Progressive Calibration and Activation Relaxing Siao Tang Xin Wang Hong Chen Chaoyu Guan Zewen Wu Yansong Tang Wenwu Zhu MQ 41 16 0 10 Nov 2023
LCM-LoRA: A Universal Stable-Diffusion Acceleration Module Simian Luo Yiqin Tan Suraj Patil Daniel Gu Patrick von Platen Apolinário Passos Longbo Huang Jian Li Hang Zhao MoMe 113 146 0 09 Nov 2023
u-LLaVA: Unifying Multi-Modal Tasks via Large Language Model Jinjin Xu Liwu Xu Yuzhe Yang Xiang Li Fanyi Wang Yanchun Xie Yi-Jie Huang Yaqian Li MoE MLLM VLM 29 13 0 09 Nov 2023