v1v2 (latest)

DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation

25 August 2022

Nataniel Ruiz

Yuanzhen Li

Varun Jampani

Yael Pritch

Michael Rubinstein

Kfir Aberman

ArXiv (abs)PDF HTML

Papers citing "DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation"

50 / 2,169 papers shown

Title
Divide, Evaluate, and Refine: Evaluating and Improving Text-to-Image Alignment with Iterative VQA Feedback Jaskirat Singh Liang Zheng 114 19 0 10 Jul 2023
AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning Yuwei Guo Ceyuan Yang Anyi Rao Zhengyang Liang Yaohui Wang Yu Qiao Maneesh Agrawala Dahua Lin Bo Dai VGen 154 882 0 10 Jul 2023
DIFF-NST: Diffusion Interleaving For deFormable Neural Style Transfer Dan Ruta Gemma Canet Tarrés Andrew Gilbert Eli Shechtman Nicholas I. Kolkin John Collomosse DiffM 96 5 0 09 Jul 2023
A Critical Look at the Current Usage of Foundation Model for Dense Recognition Task Shiqi Yang Atsushi Hashimoto Yoshitaka Ushiku DiffM VLM 76 1 0 06 Jul 2023
Detecting Images Generated by Deep Diffusion Models using their Local Intrinsic Dimensionality P. Lorenz Ricard Durall J. Keuper DiffM 146 38 0 05 Jul 2023
Automating Computational Design with Generative AI J. Ploennigs Markus Berger AI4CE DiffM 74 3 0 05 Jul 2023
Collaborative Score Distillation for Consistent Visual Synthesis Subin Kim Kyungmin Lee June Suk Choi Jongheon Jeong Kihyuk Sohn Jinwoo Shin DiffM 62 21 0 04 Jul 2023
AdAM: Few-Shot Image Generation via Adaptation-Aware Kernel Modulation Yunqing Zhao Keshigeyan Chandrasegaran Abdollahzadeh Milad Chao Du Tianyu Pang Ruoteng Li Henghui Ding Ngai-Man Cheung 78 0 0 04 Jul 2023
DreamIdentity: Improved Editability for Efficient Face-identity Preserved Image Generation Zhuowei Chen Shancheng Fang Wei Liu Qian He Mengqi Huang Yongdong Zhang Zhendong Mao DiffM 125 24 0 01 Jul 2023
DisCo: Disentangled Control for Realistic Human Dance Generation Tan Wang Linjie Li Kevin Qinghong Lin Yuanhao Zhai Chung-Ching Lin Zhengyuan Yang Hanwang Zhang Zicheng Liu Lijuan Wang VGen 141 89 0 30 Jun 2023
Generate Anything Anywhere in Any Scene Yuheng Li Haotian Liu Yangming Wen Yong Jae Lee DiffM 134 12 0 29 Jun 2023
PFB-Diff: Progressive Feature Blending Diffusion for Text-driven Image Editing Wenjing Huang Shikui Tu Lei Xu DiffM 87 17 0 28 Jun 2023
UnitSpeech: Speaker-adaptive Speech Synthesis with Untranscribed Data Heeseung Kim Sungwon Kim Ji-Ran Yeom Sung-Wan Yoon DiffM 73 22 0 28 Jun 2023
Federated Generative Learning with Foundation Models Jie Zhang Xiaohua Qi Bo Zhao FedML 116 22 0 28 Jun 2023
Approximated Prompt Tuning for Vision-Language Pre-trained Models Qiong Wu Shubin Huang Yiyi Zhou Pingyang Dai Annan Shu Guannan Jiang Rongrong Ji VLM VPVLM 42 2 0 27 Jun 2023
DragDiffusion: Harnessing Diffusion Models for Interactive Point-based Image Editing Yujun Shi Chuhui Xue Jun Hao Liew Jiachun Pan Hanshu Yan Wenqing Zhang Vincent Y. F. Tan Song Bai 149 220 0 26 Jun 2023
Text-Anchored Score Composition: Tackling Condition Misalignment in Text-to-Image Diffusion Models Luozhou Wang Guibao Shen Wenhang Ge Guangyong Chen Yijun Li Yingke Chen DiffM 78 4 0 26 Jun 2023
DomainStudio: Fine-Tuning Diffusion Models for Domain-Driven Image Generation using Limited Data Jin Zhu Huimin Ma Jiansheng Chen Jian Yuan DiffM 117 11 0 25 Jun 2023
DreamEditor: Text-Driven 3D Scene Editing with Neural Fields Jingyu Zhuang Chen Wang Lingjie Liu Liang Lin Guanbin Li DiffM 78 130 0 23 Jun 2023
Continuous Layout Editing of Single Images with Diffusion Models Zhiyuan Zhang Zhitong Huang J. Liao DiffM 63 10 0 22 Jun 2023
Set-Membership Inference Attacks using Data Watermarking M. Laszkiewicz Denis Lukovnikov Johannes Lederer Asja Fischer WIGM TDI 87 2 0 22 Jun 2023
DreamEdit: Subject-driven Image Editing Tianle Li Max Ku Cong Wei Wenhu Chen EGVM 83 29 0 22 Jun 2023
Learning Profitable NFT Image Diffusions via Multiple Visual-Policy Guided Reinforcement Learning Huiguo He Tianfu Wang Huan Yang Jianlong Fu N. Yuan Jian Yin Hongyang Chao Qi Zhang EGVM 152 10 0 20 Jun 2023
Align, Adapt and Inject: Sound-guided Unified Image Generation Yue Yang Kaipeng Zhang Yuying Ge Wenqi Shao Zeyue Xue Yu Qiao Ping Luo DiffM 104 6 0 20 Jun 2023
Masked Diffusion Models Are Fast Distribution Learners Jiachen Lei Qinglong Wang Pengyu Cheng Zhongjie Ba Zhan Qin Peng Kuang Zhenguang Liu Kui Ren DiffM 82 2 0 20 Jun 2023
RS5M and GeoRSCLIP: A Large Scale Vision-Language Dataset and A Large Vision-Language Model for Remote Sensing Zilun Zhang Tiancheng Zhao Yulong Guo Yuxiang Cai DiffM VLM 149 66 0 20 Jun 2023
Meta-Personalizing Vision-Language Models to Find Named Instances in Video Chun-Hsiao Yeh Bryan C. Russell Josef Sivic Fabian Caba Heilbron Simon Jenni VLM MLLM 101 11 0 16 Jun 2023
MagicBrush: A Manually Annotated Dataset for Instruction-Guided Image Editing Kai Zhang Lingbo Mo Wenhu Chen Huan Sun Yu-Chuan Su EGVM 226 277 0 16 Jun 2023
AvatarBooth: High-Quality and Customizable 3D Human Avatar Generation Yifei Zeng Yuanxun Lu Xinya Ji Yao Yao Hao Zhu Xun Cao DiffM 74 30 0 16 Jun 2023
The Big Data Myth: Using Diffusion Models for Dataset Generation to Train Deep Detection Models Roy Voetman Maya Aghaei K. Dijkstra DiffM 98 12 0 16 Jun 2023
Evaluating Data Attribution for Text-to-Image Models Sheng-Yu Wang Alexei A. Efros Jun-Yan Zhu Richard Y. Zhang TDI 94 33 0 15 Jun 2023
DreamHuman: Animatable 3D Avatars from Text Nikos Kolotouros Thiemo Alldieck Andrei Zanfir Eduard Gabriel Bazavan Mihai Fieraru C. Sminchisescu 111 101 0 15 Jun 2023
Fast Training of Diffusion Models with Masked Transformers Hongkai Zheng Weili Nie Arash Vahdat Anima Anandkumar DiffM 115 73 0 15 Jun 2023
Relation-Aware Diffusion Model for Controllable Poster Layout Generation Fengheng Li An Liu Wei Feng Honghe Zhu Yaoyu Li ... Jingjing Lv Xin Zhu Jun-Jun Shen Zhangang Lin Jingping Shao 76 24 0 15 Jun 2023
Perceptions and Realities of Text-to-Image Generation J. Oppenlaender Johanna M. Silvennoinen Ville Paananen Aku Visuri 51 18 0 14 Jun 2023
TryOnDiffusion: A Tale of Two UNets Luyang Zhu Dawei Yang Tyler Lixuan Zhu F. Reda William Chan Chitwan Saharia Mohammad Norouzi Ira Kemelmacher-Shlizerman DiffM 94 111 0 14 Jun 2023
Diffusion in Diffusion: Cyclic One-Way Diffusion for Text-Vision-Conditioned Generation Ruoyu Wang Yongqi Yang Zhihao Qian Ye Zhu Yuehua Wu DiffM 99 14 0 14 Jun 2023
Rerender A Video: Zero-Shot Text-Guided Video-to-Video Translation Shuai Yang Yifan Zhou Ziwei Liu Chen Change Loy VGen DiffM 104 222 0 13 Jun 2023
Generative Watermarking Against Unauthorized Subject-Driven Image Synthesis Yi Ma Zhengyu Zhao Xinlei He Zheng Li Michael Backes Yang Zhang AAML WIGM 90 21 0 13 Jun 2023
Paste, Inpaint and Harmonize via Denoising: Subject-Driven Image Editing with Pre-Trained Diffusion Model Xinyu Zhang Jiaxian Guo Paul D. Yoo Yutaka Matsuo Yusuke Iwasawa DiffM 110 22 0 13 Jun 2023
Controlling Text-to-Image Diffusion by Orthogonal Finetuning Zeju Qiu Wei-yu Liu Haiwen Feng Yuxuan Xue Yao Feng Zhen Liu Dan Zhang Adrian Weller Bernhard Schölkopf DiffM 126 158 0 12 Jun 2023
MovieFactory: Automatic Movie Creation from Text using Large Generative Models for Language and Images Sitong Su Huan Yang Huiguo He Wenjing Wang Zixi Tuo Wen-Huang Cheng Lianli Gao Jingkuan Song Jianlong Fu VGen DiffM 90 40 0 12 Jun 2023
Fill-Up: Balancing Long-Tailed Data with Generative Models Joonghyuk Shin Minguk Kang Jaesik Park 109 33 0 12 Jun 2023
Face0: Instantaneously Conditioning a Text-to-Image Model on a Face Dani Valevski Danny Lumen Yossi Matias Yaniv Leviathan DiffM VLM 77 77 0 11 Jun 2023
Boosting GUI Prototyping with Diffusion Models Jialiang Wei A. Courbis Thomas Lambolais Binbin Xu P. Bernard Gérard Dray DiffM 74 22 0 09 Jun 2023
Open Data on GitHub: Unlocking the Potential of AI Anthony C. Roman Ke Xu Arfon M. Smith Jehu Torres Vega Caleb Robinson J. L. Ferres AI4CE 26 2 0 09 Jun 2023
Grounded Text-to-Image Synthesis with Attention Refocusing Quynh Phung Songwei Ge Jia-Bin Huang DiffM 117 113 0 08 Jun 2023
Improving Tuning-Free Real Image Editing with Proximal Guidance Ligong Han Song Wen Qi Chen Zhixing Zhang Kunpeng Song ... Qilong Zhangli Jindong Jiang Zhaoyang Xia Akash Srivastava Dimitris N. Metaxas DiffM 115 63 0 08 Jun 2023
Unsupervised Compositional Concepts Discovery with Text-to-Image Generative Models Nan Liu Yilun Du Shuang Li J. Tenenbaum Antonio Torralba DiffM CoGe 102 27 0 08 Jun 2023
SyncDiffusion: Coherent Montage via Synchronized Joint Diffusions Yuseung Lee Kunho Kim Hyunjin Kim Minhyuk Sung DiffM 127 67 0 08 Jun 2023