MoMA: Multimodal LLM Adapter for Fast Personalized Image Generation

MoMA: Multimodal LLM Adapter for Fast Personalized Image Generation

8 April 2024

Qing Yan

Papers citing "MoMA: Multimodal LLM Adapter for Fast Personalized Image Generation"

14 / 14 papers shown

Title
Have Multimodal Large Language Models (MLLMs) Really Learned to Tell the Time on Analog Clocks? Tairan Fu Miguel González Javier Conde Elena Merino-Gómez Pedro Reviriego 7 0 0 16 May 2025
InstantCharacter: Personalize Any Characters with a Scalable Diffusion Transformer Framework Jiale Tao Yanbing Zhang Qixun Wang Yiji Cheng Haofan Wang ... Ruihuang Li Linqing Wang Chunyu Wang Qin Lin Qinglin Lu DiffM 47 1 0 16 Apr 2025
FlexIP: Dynamic Control of Preservation and Personality for Customized Image Generation Linyan Huang Haonan Lin Yanning Zhou Kaiwen Xiao 47 0 0 10 Apr 2025
Personalize Anything for Free with Diffusion Transformer Haoran Feng Zehuan Huang Lin Li Hairong Lv Lu Sheng DiffM 87 1 0 16 Mar 2025
Personalized Generation In Large Model Era: A Survey Yiyan Xu Jinghao Zhang Alireza Salemi Xinting Hu Luu Anh Tuan Fuli Feng Hamed Zamani Xiangnan He Tat-Seng Chua 3DV 79 2 0 04 Mar 2025
DP-Adapter: Dual-Pathway Adapter for Boosting Fidelity and Text Consistency in Customizable Human Image Generation Ye Wang Xuping Xie Lanjun Wang Zili Yi Rui Ma DiffM 97 0 0 21 Feb 2025
RealCustom++: Representing Images as Real-Word for Real-Time Customization Zhendong Mao Mengqi Huang Fei Ding Mingcong Liu Qian He Xiaojun Chang DiffM 78 6 0 03 Jan 2025
MV-Adapter: Multi-view Consistent Image Generation Made Easy Zehuan Huang Y. Guo Haoran Wang Ran Yi Lizhuang Ma Yan-Pei Cao Lu Sheng 107 9 0 04 Dec 2024
Playground v3: Improving Text-to-Image Alignment with Deep-Fusion Large Language Models Bingchen Liu Ehsan Akhgari Alexander Visheratin Aleks Kamko Linmiao Xu Shivam Shrirao Joao Souza Suhail Doshi Daiqing Li Daiqing Li DiffM MLLM 31 47 0 16 Sep 2024
CustomContrast: A Multilevel Contrastive Perspective For Subject-Driven Text-to-Image Customization Nan Chen Mengqi Huang Zhuowei Chen Yang Zheng Lei Zhang Zhendong Mao DiffM 49 5 0 09 Sep 2024
Joint Embeddings for Graph Instruction Tuning Vlad Argatu Aaron Haag Oliver Lohse 44 0 0 31 May 2024
Kandinsky: an Improved Text-to-Image Synthesis with Image Prior and Latent Diffusion Anton Razzhigaev Arseniy Shakhmatov Anastasia Maltseva V.Ya. Arkhipkin Igor Pavlov Ilya Ryabov Angelina Kuts Alexander Panchenko Andrey Kuznetsov Denis Dimitrov 48 78 0 05 Oct 2023
InstantBooth: Personalized Text-to-Image Generation without Test-Time Finetuning Jing Shi Wei Xiong Zhe-nan Lin H. J. Jung DiffM 130 279 0 06 Apr 2023
Emerging Properties in Self-Supervised Vision Transformers Mathilde Caron Hugo Touvron Ishan Misra Hervé Jégou Julien Mairal Piotr Bojanowski Armand Joulin 329 5,785 0 29 Apr 2021