An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion

2 August 2022

Daniel Cohen-Or

Papers citing "An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion"

50 / 184 papers shown

Title
Paint by Inpaint: Learning to Add Image Objects by Removing Them First Navve Wasserman Noam Rotstein Roy Ganz Ron Kimmel DiffM 81 16 0 28 Apr 2024
MaPa: Text-driven Photorealistic Material Painting for 3D Shapes Shangzhan Zhang Sida Peng Tao Xu Yuanbo Yang Tianrun Chen Nan Xue Yujun Shen Hujun Bao Ruizhen Hu Xiaowei Zhou DiffM 59 10 0 26 Apr 2024
MultiBooth: Towards Generating All Your Concepts in an Image from Text Chenyang Zhu Kai Li Yue Ma Chunming He Li Xiu DiffM 126 25 0 22 Apr 2024
RHanDS: Refining Malformed Hands for Generated Images with Decoupled Structure and Style Guidance Chengrui Wang Pengfei Liu Min Zhou Ming Zeng Xubin Li Tiezheng Ge Bo Zheng DiffM 93 5 0 22 Apr 2024
Jailbreaking Prompt Attack: A Controllable Adversarial Attack against Diffusion Models Jiachen Ma Anda Cao Zhiqing Xiao Jie Zhang Chaonan Ye Chao Ye Junbo Zhao 74 31 0 02 Apr 2024
Controlled Training Data Generation with Diffusion Models Teresa Yeo Andrei Atanov Harold Benoit Aleksandr Alekseev Ruchira Ray Pooya Esmaeil Akhoondi Amir Zamir 73 6 0 22 Mar 2024
Explore In-Context Segmentation via Latent Diffusion Models Chaoyang Wang Xiangtai Li Henghui Ding Lu Qi Jiangning Zhang Yunhai Tong Chen Change Loy Shuicheng Yan DiffM 112 6 0 14 Mar 2024
Stable-Makeup: When Real-World Makeup Transfer Meets Diffusion Model Yuxuan Zhang Lifu Wei Qing Zhang Yiren Song DiffM 85 17 0 12 Mar 2024
SCott: Accelerating Diffusion Models with Stochastic Consistency Distillation Hongjian Liu Qingsong Xie Zhijie Deng Chen Chen Shixiang Tang Fueyang Fu Zheng-Jun Zha H. Lu Zheng-jun Zha 73 7 0 03 Mar 2024
Diffusion Model-Based Image Editing: A Survey Yi Huang Jiancheng Huang Yifan Liu Mingfu Yan Jiaxi Lv Jianzhuang Liu Wei Xiong He Zhang Liangliang Cao Liangliang Cao EGVM 114 97 0 27 Feb 2024
Visual Concept-driven Image Generation with Text-to-Image Diffusion Model Tanzila Rahman Shweta Mahajan Hsin-Ying Lee Jian Ren Sergey Tulyakov Leonid Sigal 109 4 0 18 Feb 2024
S-NeRF++: Autonomous Driving Simulation via Neural Reconstruction and Generation Yurui Chen Jing Zhang Ziyang Xie Wenye Li Feihu Zhang Jiachen Lu Li Zhang 174 12 0 03 Feb 2024
Learning from Mistakes: Iterative Prompt Relabeling for Text-to-Image Diffusion Model Training Xinyan Chen Jiaxin Ge Tianjun Zhang Jiaming Liu Shanghang Zhang VLM EGVM 89 0 0 23 Dec 2023
Scene-Conditional 3D Object Stylization and Composition Jinghao Zhou Tomas Jakab Philip Torr Christian Rupprecht DiffM 95 3 0 19 Dec 2023
On the Proactive Generation of Unsafe Images From Text-To-Image Models Using Benign Prompts Yixin Wu Ning Yu Michael Backes Yun Shen Yang Zhang DiffM 98 8 0 25 Oct 2023
AI-Generated Content (AIGC) for Various Data Modalities: A Survey Lin Geng Foo Hossein Rahmani Jing Liu 139 31 0 27 Aug 2023
Expressive Text-to-Image Generation with Rich Text Songwei Ge Taesung Park Jun-Yan Zhu Jia-Bin Huang DiffM 106 82 0 13 Apr 2023
Discriminative Class Tokens for Text-to-Image Diffusion Models Idan Schwartz Vésteinn Snaebjarnarson Hila Chefer Ryan Cotterell Serge Belongie Lior Wolf Sagie Benaim 55 10 0 30 Mar 2023
Enhanced Controllability of Diffusion Models via Feature Disentanglement and Realism-Enhanced Sampling Methods Wonwoong Cho Hareesh Ravi Midhun Harikumar V. Khuc Krishna Kumar Singh Jingwan Lu David I. Inouye Ajinkya Kale DiffM 88 7 0 28 Feb 2023
SINE: SINgle Image Editing with Text-to-Image Diffusion Models Zhixing Zhang Ligong Han Arna Ghosh Dimitris N. Metaxas Jian Ren DiffM 107 159 0 08 Dec 2022
Imagic: Text-Based Real Image Editing with Diffusion Models Bahjat Kawar Shiran Zada Oran Lang Omer Tov Hui-Tang Chang Tali Dekel Inbar Mosseri Michal Irani 59 1,083 0 17 Oct 2022
DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation Nataniel Ruiz Yuanzhen Li Varun Jampani Yael Pritch Michael Rubinstein Kfir Aberman 261 2,851 0 25 Aug 2022
Classifier-Free Diffusion Guidance Jonathan Ho Tim Salimans FaML 184 3,885 0 26 Jul 2022
Don't Stop Learning: Towards Continual Learning for the CLIP Model Yuxuan Ding Lingqiao Liu Chunna Tian Jingyuan Yang Haoxuan Ding CLL VLM KELM 45 54 0 19 Jul 2022
Scaling Autoregressive Models for Content-Rich Text-to-Image Generation Jiahui Yu Yuanzhong Xu Jing Yu Koh Thang Luong Gunjan Baid ... Zarana Parekh Xin Li Han Zhang Jason Baldridge Yonghui Wu EGVM 178 1,114 0 22 Jun 2022
Blended Latent Diffusion Omri Avrahami Ohad Fried Dani Lischinski DiffM 101 382 0 06 Jun 2022
Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding Chitwan Saharia William Chan Saurabh Saxena Lala Li Jay Whang ... Raphael Gontijo-Lopes Tim Salimans Jonathan Ho David J Fleet Mohammad Norouzi VLM 387 6,006 0 23 May 2022
TEMOS: Generating diverse human motions from textual descriptions Mathis Petrovich Michael J. Black Gül Varol 98 386 0 25 Apr 2022
VQGAN-CLIP: Open Domain Image Generation and Editing with Natural Language Guidance Katherine Crowson Stella Biderman Daniel Kornis Dashiell Stander Eric Hallahan Louis Castricato Edward Raff CLIP 105 380 0 18 Apr 2022
Hierarchical Text-Conditional Image Generation with CLIP Latents Aditya A. Ramesh Prafulla Dhariwal Alex Nichol Casey Chu Mark Chen VLM DiffM 365 6,854 0 13 Apr 2022
No Token Left Behind: Explainability-Aided Image Classification and Generation Roni Paiss Hila Chefer Lior Wolf VLM 50 29 0 11 Apr 2022
Text2LIVE: Text-Driven Layered Image and Video Editing Omer Bar-Tal Dolev Ofri-Amar Rafail Fridman Yoni Kasten Tali Dekel VGen DiffM 68 313 0 05 Apr 2022
"This is my unicorn, Fluffy": Personalizing frozen vision-language representations Niv Cohen Rinon Gal E. Meirom Gal Chechik Yuval Atzmon VLM MLLM 72 86 0 04 Apr 2022
MotionCLIP: Exposing Human Motion Generation to CLIP Space Guy Tevet Brian Gordon Amir Hertz Amit H. Bermano Daniel Cohen-Or CLIP 112 341 0 15 Mar 2022
Fine-Tuning can Distort Pretrained Features and Underperform Out-of-Distribution Ananya Kumar Aditi Raghunathan Robbie Jones Tengyu Ma Percy Liang OODD 111 671 0 21 Feb 2022
High-Resolution Image Synthesis with Latent Diffusion Models Robin Rombach A. Blattmann Dominik Lorenz Patrick Esser Bjorn Ommer 3DV 393 15,454 0 20 Dec 2021
GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models Alex Nichol Prafulla Dhariwal Aditya A. Ramesh Pranav Shyam Pamela Mishkin Bob McGrew Ilya Sutskever Mark Chen 318 3,594 0 20 Dec 2021
CLIP2StyleGAN: Unsupervised Extraction of StyleGAN Edit Directions Rameen Abdal Peihao Zhu John C. Femiani Niloy J. Mitra Peter Wonka CLIP 56 104 0 09 Dec 2021
Text2Mesh: Text-Driven Neural Stylization for Meshes O. Michel Roi Bar-On Richard Liu Sagie Benaim Rana Hanocka CLIP AI4CE 255 358 0 06 Dec 2021
HyperInverter: Improving StyleGAN Inversion via Hypernetwork Tan M. Dinh Anh Tran Rang Nguyen Binh-Son Hua 66 119 0 01 Dec 2021
CLIPstyler: Image Style Transfer with a Single Text Condition Gihyun Kwon Jong Chul Ye VLM CLIP 74 243 0 01 Dec 2021
HyperStyle: StyleGAN Inversion with HyperNetworks for Real Image Editing Yuval Alaluf Omer Tov Ron Mokady Rinon Gal Amit H. Bermano 94 274 0 30 Nov 2021
Blended Diffusion for Text-driven Editing of Natural Images Omri Avrahami Dani Lischinski Ohad Fried DiffM 101 947 0 29 Nov 2021
CoLLIE: Continual Learning of Language Grounding from Language-Image Embeddings Gabriel Skantze Bram Willemsen VLM 39 14 0 15 Nov 2021
LAION-400M: Open Dataset of CLIP-Filtered 400 Million Image-Text Pairs Christoph Schuhmann Richard Vencu Romain Beaumont R. Kaczmarczyk Clayton Mullis Aarush Katta Theo Coombes J. Jitsev Aran Komatsuzaki VLM MLLM CLIP 212 1,425 0 03 Nov 2021
CLIP-Adapter: Better Vision-Language Models with Feature Adapters Peng Gao Shijie Geng Renrui Zhang Teli Ma Rongyao Fang Yongfeng Zhang Hongsheng Li Yu Qiao VLM CLIP 274 1,040 0 09 Oct 2021
DiffusionCLIP: Text-Guided Diffusion Models for Robust Image Manipulation Gwanghyun Kim Taesung Kwon Jong Chul Ye DiffM 172 647 0 06 Oct 2021
Learning to Prompt for Vision-Language Models Kaiyang Zhou Jingkang Yang Chen Change Loy Ziwei Liu VPVLM CLIP VLM 474 2,394 0 02 Sep 2021
ILVR: Conditioning Method for Denoising Diffusion Probabilistic Models Jooyoung Choi Sungwon Kim Yonghyun Jeong Youngjune Gwon Sungroh Yoon DiffM 118 717 0 06 Aug 2021
Improving Text-to-Image Synthesis Using Contrastive Learning Hui Ye Xiulong Yang Martin Takáč Rajshekhar Sunderraman Shihao Ji 69 83 0 06 Jul 2021