SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis

4 July 2023

Papers citing "SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis"

50 / 1,639 papers shown

Title
Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models Yixin Liu Kai Zhang Yuan Li Zhiling Yan Chujie Gao ... Yue Huang Hanchi Sun Jianfeng Gao Lifang He Lichao Sun VLM VGen EGVM 80 263 0 27 Feb 2024
TaxDiff: Taxonomic-Guided Diffusion Model for Protein Sequence Generation Zongying Lin Hao Li Liuzhenghao Lv Lin Bin Junwu Zhang Calvin Yu-Chian Chwn Li Yuan Tian Yonghong 39 3 0 27 Feb 2024
Transparent Image Layer Diffusion using Latent Transparency Lvmin Zhang Maneesh Agrawala 37 43 0 27 Feb 2024
Diffusion Model-Based Image Editing: A Survey Yi Huang Jiancheng Huang Yifan Liu Mingfu Yan Jiaxi Lv Jianzhuang Liu Wei Xiong He Zhang Liangliang Cao Liangliang Cao EGVM 71 88 0 27 Feb 2024
Contextualized Diffusion Models for Text-Guided Image and Video Generation Ling Yang Zhilong Zhang Zhaochen Yu Jingwei Liu Minkai Xu Stefano Ermon Tengjiao Wang 49 4 0 26 Feb 2024
Referee Can Play: An Alternative Approach to Conditional Generation via Model Inversion Xuantong Liu Tianyang Hu Wei Cao Kenji Kawaguchi Yuan Yao DiffM 77 3 0 26 Feb 2024
Gen4Gen: Generative Data Pipeline for Generative Multi-Concept Composition Chun-Hsiao Yeh Ta-Ying Cheng He-Yen Hsieh Chuan-En Lin Yi Ma Andrew Markham Niki Trigoni H. T. Kung Yubei Chen DiffM 25 4 0 23 Feb 2024
Generative Models are Self-Watermarked: Declaring Model Authentication through Re-Generation Aditya Desu Xuanli He Qiongkai Xu Wei Lu WIGM 32 1 0 23 Feb 2024
Visual Hallucinations of Multi-modal Large Language Models Wen Huang Hongbin Liu Minxin Guo Neil Zhenqiang Gong MLLM VLM 32 24 0 22 Feb 2024
T-Stitch: Accelerating Sampling in Pre-Trained Diffusion Models with Trajectory Stitching Zizheng Pan Bohan Zhuang De-An Huang Weili Nie Zhiding Yu Chaowei Xiao Jianfei Cai A. Anandkumar 36 17 0 21 Feb 2024
SDXL-Lightning: Progressive Adversarial Diffusion Distillation Shanchuan Lin Anran Wang Xiao Yang 37 119 0 21 Feb 2024
A Unified Framework and Dataset for Assessing Societal Bias in Vision-Language Models Ashutosh Sathe Prachi Jain Sunayana Sitaram 65 1 0 21 Feb 2024
Visual Style Prompting with Swapping Self-Attention Jaeseok Jeong Junho Kim Yunjey Choi Gayoung Lee Youngjung Uh DiffM 40 40 0 20 Feb 2024
RealCompo: Balancing Realism and Compositionality Improves Text-to-Image Diffusion Models Xinchen Zhang Ling Yang Yaqi Cai Zhaochen Yu Kai-Ni Wang ... Ye Tian Minkai Xu Yong Tang Yujiu Yang Tengjiao Wang DiffM 34 5 0 20 Feb 2024
SDXL Finetuned with LoRA for Coloring Therapy: Generating Graphic Templates Inspired by United Arab Emirates Culture Abdulla Alfalasi Esrat Khan Mohamed Alhashmi Raed Aldweik Davor Svetinovic 19 0 0 20 Feb 2024
MuLan: Multimodal-LLM Agent for Progressive and Interactive Multi-Object Diffusion Sen Li Ruochen Wang Cho-Jui Hsieh Minhao Cheng Tianyi Zhou MLLM LM&Ro 48 3 0 20 Feb 2024
From Cloud to Edge: Rethinking Generative AI for Low-Resource Design Challenges Sai Krishna Revanth Vuruma Ashley Margetts Jianhai Su Faez Ahmed Biplav Srivastava 38 5 0 20 Feb 2024
The Revolution of Multimodal Large Language Models: A Survey Davide Caffagni Federico Cocchi Luca Barsellotti Nicholas Moratelli Sara Sarto Lorenzo Baraldi Lorenzo Baraldi Marcella Cornia Rita Cucchiara LRM VLM 66 43 0 19 Feb 2024
Universal Prompt Optimizer for Safe Text-to-Image Generation Zongyu Wu Hongcheng Gao Yueze Wang Xiang Zhang Suhang Wang EGVM 23 9 0 16 Feb 2024
MRPD: Undersampled MRI reconstruction by prompting a large latent diffusion model Student Member Ieee Ziqi Gao F. I. S. Kevin Zhou MedIm 37 3 0 16 Feb 2024
How People Prompt to Create Interactive VR Scenes Setareh Aghel Manesh Tianyi Zhang Yuki Onishi Kotaro Hara Scott Bateman Jiannan Li Anthony Tang 28 12 0 16 Feb 2024
Make a Cheap Scaling: A Self-Cascade Diffusion Model for Higher-Resolution Adaptation Lanqing Guo Yin-Yin He Haoxin Chen Menghan Xia Xiaodong Cun ... Yong Zhang Xintao Wang Qifeng Chen Ying Shan Bihan Wen 43 23 0 16 Feb 2024
Self-Play Fine-Tuning of Diffusion Models for Text-to-Image Generation Huizhuo Yuan Zixiang Chen Kaixuan Ji Quanquan Gu 65 24 0 15 Feb 2024
Rewards-in-Context: Multi-objective Alignment of Foundation Models with Dynamic Preference Adjustment Rui Yang Xiaoman Pan Feng Luo Shuang Qiu Han Zhong Dong Yu Jianshu Chen 103 69 0 15 Feb 2024
GES: Generalized Exponential Splatting for Efficient Radiance Field Rendering Abdullah Hamdi Luke Melas-Kyriazi Jinjie Mai Guocheng Qian Ruoshi Liu Carl Vondrick Guohao Li Andrea Vedaldi 3DGS 34 44 0 15 Feb 2024
Magic-Me: Identity-Specific Video Customized Diffusion Ze Ma Daquan Zhou Chun-Hsiao Yeh Xue-She Wang Xiuyu Li Huanrui Yang Zhen Dong Kurt Keutzer Jiashi Feng VGen DiffM 40 31 0 14 Feb 2024
DoRA: Weight-Decomposed Low-Rank Adaptation Shih-yang Liu Chien-Yi Wang Hongxu Yin Pavlo Molchanov Yu-Chiang Frank Wang Kwang-Ting Cheng Min-Hung Chen 47 345 0 14 Feb 2024
L3GO: Language Agents with Chain-of-3D-Thoughts for Generating Unconventional Objects Yutaro Yamada Khyathi Raghavi Chandu Yuchen Lin Jack Hessel Ilker Yildirim Yejin Choi AI4CE 23 12 0 14 Feb 2024
IM-3D: Iterative Multiview Diffusion and Reconstruction for High-Quality 3D Generation Luke Melas-Kyriazi Iro Laina Christian Rupprecht Natalia Neverova Andrea Vedaldi Oran Gafni Filippos Kokkinos 3DGS 32 64 0 13 Feb 2024
A Dense Reward View on Aligning Text-to-Image Diffusion with Preference Shentao Yang Tianqi Chen Mingyuan Zhou EGVM 34 23 0 13 Feb 2024
Discovering Universal Semantic Triggers for Text-to-Image Synthesis Shengfang Zhai Weilong Wang Jiajun Li Yinpeng Dong Hang Su Qingni Shen EGVM 41 3 0 12 Feb 2024
AvatarMMC: 3D Head Avatar Generation and Editing with Multi-Modal Conditioning W. Para Abdelrahman Eldesokey Zhenyu Li Pradyumna Reddy Jiankang Deng Peter Wonka DiffM 40 0 0 08 Feb 2024
SPAD : Spatially Aware Multiview Diffusers Yash Kant Ziyi Wu Michael Vasilkovsky Guocheng Qian Jian Ren R. A. Guler Guohao Li Sergey Tulyakov Igor Gilitschenski Aliaksandr Siarohin DiffM 29 36 0 07 Feb 2024
Fast Timing-Conditioned Latent Audio Diffusion Zach Evans CJ Carr Josiah Taylor Scott H. Hawley Jordi Pons DiffM 82 103 0 07 Feb 2024
Noise Map Guidance: Inversion with Spatial Context for Real Image Editing Hansam Cho Jonghyun Lee Seoung Bum Kim Tae-Hyun Oh Yonghyun Jeong DiffM 25 15 0 07 Feb 2024
ColorSwap: A Color and Word Order Dataset for Multimodal Evaluation Jirayu Burapacheep Ishan Gaur Agam Bhatia Tristan Thrush 40 4 0 07 Feb 2024
ConsistI2V: Enhancing Visual Consistency for Image-to-Video Generation Weiming Ren Harry Yang Ge Zhang Cong Wei Xinrun Du Stephen W. Huang Wenhu Chen DiffM VGen 93 54 0 06 Feb 2024
EscherNet: A Generative Model for Scalable View Synthesis Xin Kong Shikun Liu Xiaoyang Lyu Marwan Taher Xiaojuan Qi Andrew J. Davison DiffM 88 42 0 06 Feb 2024
An Inpainting-Infused Pipeline for Attire and Background Replacement F. Mahlow A. F. Zanella William Alberto Cruz-Castaneda Marcellus Amadeus 41 0 0 05 Feb 2024
Video-LaVIT: Unified Video-Language Pre-training with Decoupled Visual-Motional Tokenization Yang Jin Zhicheng Sun Kun Xu Kun Xu Liwei Chen ... Yuliang Liu Di Zhang Yang Song Kun Gai Yadong Mu VGen 55 42 0 05 Feb 2024
Character-based Outfit Generation with Vision-augmented Style Extraction via LLMs Najmeh Forouzandehmehr Yijie Cao Nikhil Thakurdesai Ramin Giahi Luyi Ma Nima Farrokhsiar Jianpeng Xu Evren Körpeoglu Kannan Achan 36 2 0 02 Feb 2024
AI-generated faces influence gender stereotypes and racial homogenization Nouar Aldahoul Talal Rahwan Yasir Zaki 35 2 0 01 Feb 2024
Diffusion Facial Forgery Detection Harry Cheng Yangyang Guo Tianyi Wang L. Nie Mohan S. Kankanhalli 71 17 0 29 Jan 2024
FreeStyle: Free Lunch for Text-guided Style Transfer using Diffusion Models Feihong He Gang Li Mengyuan Zhang Leilei Yan Jiangmeng Li Fanzhang Li Li Shen DiffM 43 15 0 28 Jan 2024
Taiyi-Diffusion-XL: Advancing Bilingual Text-to-Image Generation with Large Vision-Language Model Support Xiaojun Wu Di Zhang Ruyi Gan Junyu Lu Ziwei Wu Renliang Sun Jiaxing Zhang Pingjian Zhang Yan Song VLM 34 6 0 26 Jan 2024
pix2gestalt: Amodal Segmentation by Synthesizing Wholes Ege Ozguroglu Ruoshi Liu Dídac Surís Dian Chen Achal Dave P. Tokmakov Carl Vondrick DiffM VLM 45 32 0 25 Jan 2024
StyleInject: Parameter Efficient Tuning of Text-to-Image Diffusion Models Mohan Zhou Yalong Bai Qing Yang Tiejun Zhao 32 0 0 25 Jan 2024
CreativeSynth: Cross-Art-Attention for Artistic Image Synthesis with Multimodal Diffusion Nisha Huang Weiming Dong Yuxin Zhang Fan Tang Ronghui Li Chongyang Ma Xiu Li Tong-Yee Lee Changsheng Xu DiffM 43 0 0 25 Jan 2024
Scaling Up to Excellence: Practicing Model Scaling for Photo-Realistic Image Restoration In the Wild Fanghua Yu Jinjin Gu Zheyuan Li Jinfan Hu Xiangtao Kong Xintao Wang Jingwen He Yu Qiao Chao Dong 36 129 0 24 Jan 2024
UNIMO-G: Unified Image Generation through Multimodal Conditional Diffusion Wei Li Xue Xu Jiachen Liu Xinyan Xiao 25 5 0 24 Jan 2024