v1v2v3 (latest)

Adding Conditional Control to Text-to-Image Diffusion Models

10 February 2023

Papers citing "Adding Conditional Control to Text-to-Image Diffusion Models"

50 / 367 papers shown

Title
Joint Learning of Depth and Appearance for Portrait Image Animation Xinya Ji Gaspard Zoss Prashanth Chandran Lingchen Yang Xun Cao B. Solenthaler D. Bradley 3DH MDE 108 0 0 15 Jan 2025
MagicFace: High-Fidelity Facial Expression Editing with Action-Unit Control Mengting Wei Tuomas Varanka Xingxun Jiang Huai-Qian Khor Guoying Zhao DiffM 87 0 0 10 Jan 2025
COCOLA: Coherence-Oriented Contrastive Learning of Musical Audio Representations Ruben Ciranni Emilian Postolache Giorgio Mariani Michele Mancusi Giorgio Fabbro Emanuele Rodolà Luca Cosmo 215 8 0 10 Jan 2025
Beyond Flat Text: Dual Self-inherited Guidance for Visual Text Generation Minxing Luo Zixun Xia L. Chen Zhenhang Li Weichao Zeng Jinqiao Wang Wentao Cheng Yaxing Wang Yu Zhou Jian Yang DiffM 129 1 0 10 Jan 2025
MC-VTON: Minimal Control Virtual Try-On Diffusion Transformer Junsheng Luan Guangyuan Li Lei Zhao Wei Xing DiffM 64 2 0 07 Jan 2025
MObI: Multimodal Object Inpainting Using Diffusion Models Alexandru Buburuzan Anuj Sharma John Redford P. Dokania Romain Mueller DiffM 152 1 0 06 Jan 2025
ACE++: Instruction-Based Image Creation and Editing via Context-Aware Content Filling Chaojie Mao Junxuan Zhang Yulin Pan Zeyinzi Jiang Zhen Han Yu Liu Jingren Zhou DiffM 108 21 0 05 Jan 2025
GeoDiffuser: Geometry-Based Image Editing with Diffusion Models Rahul Sajnani Jeroen Vanbaar Jie Min Kapil D. Katyal Srinath Sridhar DiffM 113 11 0 03 Jan 2025
Text2Data: Low-Resource Data Generation with Textual Control Shiyu Wang Yihao Feng Tian Lan Ning Yu Yu Bai Ran Xu Han Wang Caiming Xiong Siyang Song DiffM 128 0 0 03 Jan 2025
VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control Yuanpeng Tu Hao Luo Xi Chen S. Ji Xiang Bai Hengshuang Zhao DiffM VGen 115 5 0 02 Jan 2025
Grid Diffusion Models for Text-to-Video Generation Taegyeong Lee Soyeong Kwon Taehwan Kim 120 7 0 31 Dec 2024
AdaDiff: Adaptive Step Selection for Fast Diffusion Models Hui Zhang Zuxuan Wu Zhen Xing Jie Shao Yu-Gang Jiang 127 11 0 31 Dec 2024
MotionLCM: Real-time Controllable Motion Generation via Latent Consistency Model Wen-Dao Dai Ling-Hao Chen Jingbo Wang Jinpeng Liu Bo Dai Yansong Tang 132 61 0 31 Dec 2024
AKiRa: Augmentation Kit on Rays for optical video generation Xi Wang Robin Courant Marc Christie Vicky Kalogeiton VGen 168 3 0 31 Dec 2024
Edicho: Consistent Image Editing in the Wild Qingyan Bai Hao Ouyang Yinghao Xu Qiuyu Wang Ceyuan Yang Ka Leong Cheng Yujun Shen Qifeng Chen DiffM 118 1 0 30 Dec 2024
DPBridge: Latent Diffusion Bridge for Dense Prediction Haorui Ji Taojun Lin Hongdong Li DiffM 235 1 0 29 Dec 2024
Dora: Sampling and Benchmarking for 3D Shape Variational Auto-Encoders Rui Chen Jianfeng Zhang Yixun Liang Guan Luo Weiyu Li Jiarui Liu Xiu Li Xiaoxiao Long Jiashi Feng P. Tan 164 15 0 23 Dec 2024
Map Imagination Like Blind Humans: Group Diffusion Model for Robotic Map Generation Qijin Song Weibang Bai 140 1 0 22 Dec 2024
Adapting Image-to-Video Diffusion Models for Large-Motion Frame Interpolation Luoxu Jin Hiroshi Watanabe DiffM VGen 207 0 0 22 Dec 2024
AniDoc: Animation Creation Made Easier Yihao Meng Hao Ouyang Hanlin Wang Qiuyu Wang Wen Wang Ka Leong Cheng Zhiheng Liu Yujun Shen Huamin Qu DiffM VGen 162 5 0 18 Dec 2024
FlexCache: Flexible Approximate Cache System for Video Diffusion Desen Sun Henry Tian Tim Lu Sihang Liu DiffM 120 0 0 18 Dec 2024
Zero-Shot Low Light Image Enhancement with Diffusion Prior Joshua Cho Sara Aghajanzadeh Zhen Zhu David A. Forsyth DiffM 206 2 0 18 Dec 2024
MMO-IG: Multi-Class and Multi-Scale Object Image Generation for Remote Sensing Chuang Yang Bingxuan Zhao Qing Zhou Qi Wang 138 1 0 18 Dec 2024
IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations Zhibing Li Tong Wu Jing Tan Mengchen Zhang Jiaqi Wang Dahua Lin 162 2 0 16 Dec 2024
InterDyn: Controllable Interactive Dynamics with Video Diffusion Models Rick Akkerman Haiwen Feng M. Black Dimitrios Tzionas Victoria Fernandez-Abrevaya VGen AI4CE 171 3 0 16 Dec 2024
Nearly Zero-Cost Protection Against Mimicry by Personalized Diffusion Models Namhyuk Ahn Kiyoon Yoo Wonhyuk Ahn Daesik Kim Seung-Hun Nam AAML WIGM DiffM 149 0 0 16 Dec 2024
Wonderland: Navigating 3D Scenes from a Single Image Hanwen Liang Junli Cao Vidit Goel Guocheng Qian Sergei Korolev Demetri Terzopoulos Konstantinos N. Plataniotis Sergey Tulyakov Jian Ren VGen 199 12 0 16 Dec 2024
UIBDiffusion: Universal Imperceptible Backdoor Attack for Diffusion Models Yuning Han Bingyin Zhao Rui Chu Feng Luo Biplab Sikdar Yingjie Lao DiffM AAML 166 1 0 16 Dec 2024
CLIP-SR: Collaborative Linguistic and Image Processing for Super-Resolution Bingwen Hu Heng Liu Zhedong Zheng Ping Liu SupR 204 0 0 16 Dec 2024
ColorFlow: Retrieval-Augmented Image Sequence Colorization Junhao Zhuang Xuan Ju Zhe Zhang Yong-Jin Liu Shiyi Zhang Chun Yuan Ying Shan DiffM 149 1 0 16 Dec 2024
EditSplat: Multi-View Fusion and Attention-Guided Optimization for View-Consistent 3D Scene Editing with 3D Gaussian Splatting Dong In Lee Hyeongcheol Park Jiyoung Seo Eunbyung Park Hyunje Park Ha Dam Baek Shin Sangheon Sangmin kim Sangpil Kim 3DGS 175 2 0 16 Dec 2024
Video Diffusion Transformers are In-Context Learners Zhengcong Fei Di Qiu Changqian Yu Debang Li Mingyuan Fan VGen DiffM 370 3 0 14 Dec 2024
Olympus: A Universal Task Router for Computer Vision Tasks Yuanze Lin Yunsheng Li Dongdong Chen Weijian Xu Ronald Clark Philip Torr VLM ObjD 485 0 0 12 Dec 2024
Omni-ID: Holistic Identity Representation Designed for Generative Tasks Guocheng Qian Kuan-Chieh Wang Or Patashnik Negin Heravi Daniil Ostashev Sergey Tulyakov Daniel Cohen-Or Kfir Aberman 129 4 0 12 Dec 2024
DynamicControl: Adaptive Condition Selection for Improved Text-to-Image Generation Qu He Jinlong Peng P. Xu Boyuan Jiang Xiaobin Hu ... Yang Liu Yun Wang Chengjie Wang Xuelong Li Jing Zhang DiffM 172 1 0 04 Dec 2024
EmojiDiff: Advanced Facial Expression Control with High Identity Preservation in Portrait Generation Liangwei Jiang Ruida Li Zhifeng Zhang Shuo Fang Chenguang Ma DiffM 142 1 0 02 Dec 2024
IQA-Adapter: Exploring Knowledge Transfer from Image Quality Assessment to Diffusion-based Generative Models Khaled Abud Sergey Lavrushkin Alexey Kirillov D. Vatolin 162 0 0 02 Dec 2024
Continuous Concepts Removal in Text-to-image Diffusion Models Tingxu Han Weisong Sun Yanrong Hu Chunrong Fang Yonglong Zhang Shiqing Ma Tao Zheng Zhenyu Chen Zhenting Wang DiffM 176 3 0 30 Nov 2024
Spline-FRIDA: Towards Diverse, Humanlike Robot Painting Styles with a Sample-Efficient, Differentiable Brush Stroke Model Lawrence Chen Peter Schaldenbrand Tanmay Shankar Lia Coleman Jean Oh 97 0 0 30 Nov 2024
PCDreamer: Point Cloud Completion Through Multi-view Diffusion Priors Guangshun Wei Yuan Feng Long Ma Chen Wang Yuanfeng Zhou Changjian Li 515 0 0 28 Nov 2024
COAP: Memory-Efficient Training with Correlation-Aware Gradient Projection Jinqi Xiao S. Sang Tiancheng Zhi Jing Liu Qing Yan Linjie Luo Bo Yuan Bo Yuan VLM 160 2 0 26 Nov 2024
Ca2-VDM: Efficient Autoregressive Video Diffusion Model with Causal Generation and Cache Sharing Kaifeng Gao Jiaxin Shi Hanwang Zhang Chunping Wang Jun Xiao Long Chen VGen DiffM 175 2 0 25 Nov 2024
AnyEdit: Mastering Unified High-Quality Image Editing for Any Idea Qifan Yu Wei Chow Zhongqi Yue Kaihang Pan Yang Wu Xiaoyang Wan Juncheng Billy Li Siliang Tang Hao Zhang Yueting Zhuang DiffM 162 24 0 24 Nov 2024
Unveil Inversion and Invariance in Flow Transformer for Versatile Image Editing P. Xu Boyuan Jiang Xiaobin Hu Donghao Luo Qu He Jing Zhang Chengjie Wang Yunsheng Wu Charles Ling Boyu Wang 177 3 0 24 Nov 2024
TKG-DM: Training-free Chroma Key Content Generation Diffusion Model Ryugo Morita Stanislav Frolov Brian B. Moser Takahiro Shirakawa Ko Watanabe Andreas Dengel Jinjia Zhou DiffM 132 0 0 23 Nov 2024
Parameter Efficient Mamba Tuning via Projector-targeted Diagonal-centric Linear Transformation Seokil Ham H. Kim Sangmin Woo Changick Kim Mamba 472 0 0 21 Nov 2024
C-DiffSET: Leveraging Latent Diffusion for SAR-to-EO Image Translation with Confidence-Guided Reliable Object Generation Jeonghyeok Do Jaehyup Lee Munchurl Kim DiffM 84 2 0 16 Nov 2024
SG-I2V: Self-Guided Trajectory Control in Image-to-Video Generation Koichi Namekata Sherwin Bahmani Ziyi Wu Yash Kant Igor Gilitschenski David B. Lindell VGen 141 16 0 07 Nov 2024
ROBIN: Robust and Invisible Watermarks for Diffusion Models with Adversarial Optimization Huayang Huang Yu Wu Qian Wang DiffM WIGM 84 7 0 06 Nov 2024
On Improved Conditioning Mechanisms and Pre-training Strategies for Diffusion Models Tariq Berrada Ifriqi Pietro Astolfi Melissa Hall Reyhane Askari Hemmat Yohann Benchetrit ... Matthew Muckley Karteek Alahari Adriana Romero Soriano Jakob Verbeek M. Drozdzal AI4CE VLM 109 4 0 05 Nov 2024