BLIP-Diffusion: Pre-trained Subject Representation for Controllable Text-to-Image Generation and Editing

24 May 2023

Papers citing "BLIP-Diffusion: Pre-trained Subject Representation for Controllable Text-to-Image Generation and Editing"

17 / 67 papers shown

Title
Instruct-Imagen: Image Generation with Multi-modal Instruction Hexiang Hu Kelvin C. K. Chan Yu-Chuan Su Wenhu Chen Yandong Li ... Xue Ben Boqing Gong William W. Cohen Ming-Wei Chang Xuhui Jia MLLM 46 43 0 03 Jan 2024
SSR-Encoder: Encoding Selective Subject Representation for Subject-Driven Generation Yuxuan Zhang Yiren Song Jiaming Liu Rui Wang Jinpeng Yu ... Huaxia Li Xu Tang Yao Hu Han Pan Zhongliang Jing 49 59 0 26 Dec 2023
Alpha-CLIP: A CLIP Model Focusing on Wherever You Want Zeyi Sun Ye Fang Tong Wu Pan Zhang Yuhang Zang Shu Kong Yuanjun Xiong Dahua Lin Jiaqi Wang VLM CLIP 51 83 0 06 Dec 2023
Improve Supervised Representation Learning with Masked Image Modeling Kaifeng Chen Daniel M. Salz Huiwen Chang Kihyuk Sohn Dilip Krishnan Mojtaba Seyedhosseini SSL ViT 50 3 0 01 Dec 2023
A Data Perspective on Enhanced Identity Preservation for Diffusion Personalization Xingzhe He Zhiwen Cao Nicholas I. Kolkin Lantao Yu Kun Wan Helge Rhodin Ratheesh Kalarot 45 13 0 07 Nov 2023
ObjectComposer: Consistent Generation of Multiple Objects Without Fine-tuning Alec Helbling Evan Montoya Duen Horng Chau DiffM 31 1 0 10 Oct 2023
DreamCom: Finetuning Text-guided Inpainting Model for Image Composition Lingxiao Lu Jiangtong Li Bo Zhang Li Niu DiffM 28 11 0 27 Sep 2023
AnyDoor: Zero-shot Object-level Image Customization Xi Chen Lianghua Huang Yu Liu Yujun Shen Deli Zhao Hengshuang Zhao DiffM 46 256 0 18 Jul 2023
CLIPAG: Towards Generator-Free Text-to-Image Generation Roy Ganz Michael Elad VLM 36 7 0 29 Jun 2023
Expressive Text-to-Image Generation with Rich Text Songwei Ge Taesung Park Jun-Yan Zhu Jia-Bin Huang DiffM 79 78 0 13 Apr 2023
InstantBooth: Personalized Text-to-Image Generation without Test-Time Finetuning Jing Shi Wei Xiong Zhe-nan Lin H. J. Jung DiffM 133 279 0 06 Apr 2023
ReVersion: Diffusion-Based Relation Inversion from Images Ziqi Huang Tianxing Wu Yuming Jiang Kelvin C. K. Chan Ziwei Liu 51 67 0 23 Mar 2023
Re-Imagen: Retrieval-Augmented Text-to-Image Generator Wenhu Chen Hexiang Hu Chitwan Saharia William W. Cohen VLM 131 164 0 29 Sep 2022
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation Junnan Li Dongxu Li Caiming Xiong Guosheng Lin MLLM BDL VLM CLIP 392 4,171 0 28 Jan 2022
Emerging Properties in Self-Supervised Vision Transformers Mathilde Caron Hugo Touvron Ishan Misra Hervé Jégou Julien Mairal Piotr Bojanowski Armand Joulin 383 5,818 0 29 Apr 2021
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 255 4,805 0 24 Feb 2021
Conceptual 12M: Pushing Web-Scale Image-Text Pre-Training To Recognize Long-Tail Visual Concepts Soravit Changpinyo P. Sharma Nan Ding Radu Soricut VLM 302 1,086 0 17 Feb 2021