v1v2 (latest)

DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation

25 August 2022

Nataniel Ruiz

Yuanzhen Li

Varun Jampani

Yael Pritch

Michael Rubinstein

Kfir Aberman

ArXiv (abs)PDF HTML

Papers citing "DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation"

50 / 2,167 papers shown

Title
Meta-LoRA: Meta-Learning LoRA Components for Domain-Aware ID Personalization Barış Batuhan Topal Umut Özyurt Zafer Doğan Budak Ramazan Gokberk Cinbis 107 0 0 01 Jul 2025
Edit360: 2D Image Edits to 3D Assets from Any Angle Junchao Huang Xinting Hu Zhuotao Tian Shaoshuai Shi Li Jiang VGen 118 0 0 01 Jul 2025
Controllable and Expressive One-Shot Video Head Swapping Chaonan Ji Jinwei Qi Peng Zhang Bang Zhang Liefeng Bo DiffM VGen 14 0 0 20 Jun 2025
VS-Singer: Vision-Guided Stereo Singing Voice Synthesis with Consistency Schrödinger Bridge Zijing Zhao Kai Wang Hao-Ming Huang Ying Hu Liang He J. Yang 22 0 0 19 Jun 2025
Break Stylistic Sophon: Are We Really Meant to Confine the Imagination in Style Transfer? Gary Song Yan Yusen Zhang Jinyu Zhao Hao Zhang Zhangping Yang ... Tao Zhang Yujie He Siyuan Tian Yao Gou Min Li DiffM 50 0 0 18 Jun 2025
Evolutionary Caching to Accelerate Your Off-the-Shelf Diffusion Model Anirud Aggarwal Abhinav Shrivastava M. Gwilliam 52 0 0 18 Jun 2025
Control and Realism: Best of Both Worlds in Layout-to-Image without Training Bonan li Yinhan Hu Songhua Liu Xinchao Wang DiffM 40 0 0 18 Jun 2025
Sharp Generalization Bounds for Foundation Models with Asymmetric Randomized Low-Rank Adapters Anastasis Kratsios Tin Sum Cheng Aurelien Lucchi Haitz Sáez de Ocáriz Borde 18 0 0 17 Jun 2025
Toward Rich Video Human-Motion2D Generation Ruihao Xi Xuekuan Wang Yongcheng Li Shuhua Li Zichen Wang Yiwei Wang Feng Wei Cairong Zhao VGen 19 0 0 17 Jun 2025
FLUX.1 Kontext: Flow Matching for In-Context Image Generation and Editing in Latent Space Black Forest Labs Stephen Batifol A. Blattmann Frederic Boesel Saksham Consul ... Dustin Podell Robin Rombach Harry Saini Axel Sauer Luke Smith DiffM 25 0 0 17 Jun 2025
UltraZoom: Generating Gigapixel Images from Regular Photos Jingwei Ma V. Jayaram Brian L. Curless Ira Kemelmacher-Shlizerman S. M. Seitz 3DGS 23 0 0 16 Jun 2025
Balancing Preservation and Modification: A Region and Semantic Aware Metric for Instruction-Based Image Editing Zhuoying Li Zhu Xu Yuxin Peng Yang Liu 16 0 0 15 Jun 2025
EMLoC: Emulator-based Memory-efficient Fine-tuning with LoRA Correction Hsi-Che Lin Yu-Chu Yu Kai-Po Chang Y. Wang 77 0 0 13 Jun 2025
Text to Image for Multi-Label Image Recognition with Joint Prompt-Adapter Learning Chun-Mei Feng Kai-An Yu Xinxing Xu Salman Khan Rick Siow Mong Goh Wangmeng Zuo Yong Liu VLM 140 0 0 12 Jun 2025
Improving Personalized Search with Regularized Low-Rank Parameter Updates Fiona Ryan Josef Sivic Fabian Caba Heilbron Judy Hoffman James M. Rehg Bryan C. Russell 49 0 0 11 Jun 2025
Only-Style: Stylistic Consistency in Image Generation without Content Leakage Tilemachos Aravanis P. Filntisis Petros Maragos George Retsinas 75 0 0 11 Jun 2025
SPARKE: Scalable Prompt-Aware Diversity Guidance in Diffusion Models via RKE Score Mohammad Jalali Haoyu Lei Amin Gohari Farzan Farnia DiffM 64 0 0 11 Jun 2025
Consistent Story Generation with Asymmetry Zigzag Sampling Mingxiao Li Mang Ning Marie-Francine Moens DiffM 86 0 0 11 Jun 2025
Geometric Regularity in Deterministic Sampling of Diffusion-based Generative Models Defang Chen Zhenyu Zhou C. Wang Siwei Lyu DiffM 65 0 0 11 Jun 2025
CulturalFrames: Assessing Cultural Expectation Alignment in Text-to-Image Models and Evaluation Metrics Shravan Nayak Mehar Bhatia Xiaofeng Zhang Verena Rieser Lisa Anne Hendricks Sjoerd van Steenkiste Yash Goyal Karolina Stañczak Aishwarya Agrawal EGVM 27 0 0 10 Jun 2025
ORIDa: Object-centric Real-world Image Composition Dataset Jinwoo Kim Sangmin Han Jinho Jeong Jiwoo Choi Dongyoung Kim Seon Joo Kim 25 0 0 10 Jun 2025
RoboSwap: A GAN-driven Video Diffusion Framework For Unsupervised Robot Arm Swapping Yang Bai Liudi Yang George Eskandar Fengyi Shen Dong Chen Mohammad Altillawi Z. Liu Gitta Kutyniok VGen 24 0 0 10 Jun 2025
Diffusion Counterfactual Generation with Semantic Abduction Rajat Rasal Avinash Kori Fabio De Sousa Ribeiro Tian Xia Ben Glocker DiffM 22 0 0 09 Jun 2025
Dreamland: Controllable World Creation with Simulator and Generative Models Sicheng Mo Ziyang Leng Leon Liu Weizhen Wang Honglin He Bolei Zhou VGen 12 0 0 09 Jun 2025
PolyVivid: Vivid Multi-Subject Video Generation with Cross-Modal Interaction and Enhancement Teng Hu Zhentao Yu Zhengguang Zhou Jiangning Zhang Yuan Zhou Qinglin Lu Ran Yi VGen 20 0 0 09 Jun 2025
Difference Inversion: Interpolate and Isolate the Difference with Token Consistency for Image Analogy Generation H. Kim Donghyun Kim Suhyun Kim DiffM 31 1 0 09 Jun 2025
Evaluating Robustness in Latent Diffusion Models via Embedding Level Augmentation Boris Martirosyan Alexey Karmanov DiffM 15 0 0 09 Jun 2025
R3D2: Realistic 3D Asset Insertion via Diffusion for Autonomous Driving Simulation William Ljungbergh Bernardo Taveira Wenzhao Zheng Adam Tonderski Chensheng Peng ... Christoffer Petersson Michael Felsberg Kurt Keutzer Masayoshi Tomizuka Wei Zhan 22 0 0 09 Jun 2025
Gradients: When Markets Meet Fine-tuning -- A Distributed Approach to Model Optimisation Christopher Subia-Waud 22 0 0 09 Jun 2025
Consistent Video Editing as Flow-Driven Image-to-Video Generation Ge Wang Songlin Fan Hangxu Liu Quanjian Song Hewei Wang Jinfeng Xu DiffM VGen 29 0 0 09 Jun 2025
Self-Adapting Improvement Loops for Robotic Learning Calvin Luo Zilai Zeng Mingxi Jia Yilun Du Chen Sun 24 0 0 07 Jun 2025
Noise Consistency Regularization for Improved Subject-Driven Image Synthesis Yao Ni Song Wen Piotr Koniusz A. Cherian 21 0 0 06 Jun 2025
Come Together, But Not Right Now: A Progressive Strategy to Boost Low-Rank Adaptation Zhan Zhuang Xiequn Wang Wei Li Yulong Zhang Qiushi Huang ... Yanbin Wei Yuhe Nie Kede Ma Yu Zhang Ying Wei 55 0 0 06 Jun 2025
MARBLE: Material Recomposition and Blending in CLIP-Space Ta-Ying Cheng Prafull Sharma Mark Boss Varun Jampani DiffM 100 0 0 05 Jun 2025
ComfyUI-Copilot: An Intelligent Assistant for Automated Workflow Development Zhenran Xu Xue Yang Yiyu Wang Qingli Hu Zijiao Wu L. Wang Weihua Luo Kaifu Zhang Baotian Hu Min Zhang LLMAG 92 0 0 05 Jun 2025
AuthGuard: Generalizable Deepfake Detection via Language Guidance Guangyu Shen Zhihua Li Xiang Xu Tianchen Zhao Zheng Zhang Dongsheng An Zhuowen Tu Yifan Xing Qin Zhang 23 0 0 04 Jun 2025
Negative-Guided Subject Fidelity Optimization for Zero-Shot Subject-Driven Generation Chaehun Shin Jooyoung Choi Johan Barthelemy Jungbeom Lee Sungroh Yoon DiffM 80 0 0 04 Jun 2025
Is Perturbation-Based Image Protection Disruptive to Image Editing? Qiuyu Tang Bonor Ayambem Mooi Choo Chuah Aparna Bharati DiffM 36 0 0 04 Jun 2025
PartComposer: Learning and Composing Part-Level Concepts from Single-Image Examples Junyu Liu R. K. Jones Daniel E. Ritchie DiffM CoGe 62 0 0 03 Jun 2025
RelationAdapter: Learning and Transferring Visual Relation with Diffusion Transformers Yan Gong Yiren Song Yicheng Li Chenglin Li Yin Zhang KELM 58 0 0 03 Jun 2025
Beyond Invisibility: Learning Robust Visible Watermarks for Stronger Copyright Protection Tianci Liu Tong Yang Quan Zhang Qi Lei WIGM AAML 49 0 0 03 Jun 2025
FlexPainter: Flexible and Multi-View Consistent Texture Generation Dongyu Yan Leyi Wu Jiantao Lin Luozhou Wang Tianshuo Xu Zhifei Chen Zhen Yang Lie Xu Shunsi Zhang Yingcong Chen DiffM 62 0 0 03 Jun 2025
EDITOR: Effective and Interpretable Prompt Inversion for Text-to-Image Diffusion Models Mingzhe Li Gehao Zhang Zhenting Wang Shiqing Ma Siqi Pan Richard Cartwright Juan Zhai DiffM 52 0 0 03 Jun 2025
TaxaDiffusion: Progressively Trained Diffusion Model for Fine-Grained Species Generation Amin Karimi Monsefi Mridul Khurana R. Ramnath Anuj Karpatne Wei-Lun Chao Cheng Zhang 63 0 0 02 Jun 2025
Dual-Process Image Generation Grace Luo Jonathan Granskog Aleksander Holynski Trevor Darrell VLM 72 0 0 02 Jun 2025
Efficiency without Compromise: CLIP-aided Text-to-Image GANs with Increased Diversity Yuya Kobayashi Yuhta Takida Takashi Shibuya Yuki Mitsufuji DiffM 54 0 0 02 Jun 2025
WorldExplorer: Towards Generating Fully Navigable 3D Scenes Manuel-Andreas Schneider Lukas Höllein Matthias Nießner VGen 53 0 0 02 Jun 2025
Many-for-Many: Unify the Training of Multiple Video and Image Generation and Manipulation Tasks Tao Yang Ruibin Li Yangming Shi Yuqi Zhang Qide Dong Haoran Cheng Weiguo Feng Shilei Wen Bingyue Peng Lei Zhang DiffM VGen 62 0 0 02 Jun 2025
G4Seg: Generation for Inexact Segmentation Refinement with Diffusion Models Tianjiao Zhang Fei Zhang Jiangchao Yao Ya Zhang Yanfeng Wang DiffM 95 1 0 02 Jun 2025
Minimal Impact ControlNet: Advancing Multi-ControlNet Integration Shikun Sun Min Zhou Zixuan Wang Xubin Li T. Ge Zijie Ye Xiaoyu Qin Junliang Xing Bo Zheng J. Jia 62 0 0 02 Jun 2025