Vector Quantized Diffusion Model for Text-to-Image Synthesis

29 November 2021

Jianmin Bao

Lu Yuan

Papers citing "Vector Quantized Diffusion Model for Text-to-Image Synthesis"

50 / 566 papers shown

Title
Video Diffusion Transformers are In-Context Learners Zhengcong Fei Di Qiu Changqian Yu Debang Li Mingyuan Fan VGen DiffM 196 2 0 14 Dec 2024
FIRE: Robust Detection of Diffusion-Generated Images via Frequency-Guided Reconstruction Error Beilin Chu Xuan Xu Xin Wang Y. Zhang Weike You Linna Zhou DiffM 100 1 0 10 Dec 2024
[MASK] is All You Need Vincent Tao Hu Bjorn Ommer DiffM 137 2 0 09 Dec 2024
Detecting Discrepancies Between AI-Generated and Natural Images Using Uncertainty Jun Nie Yonggang Zhang Tongliang Liu Y. Cheung Bo Han Xinmei Tian UQCV 90 0 0 08 Dec 2024
Remix-DiT: Mixing Diffusion Transformers for Multi-Expert Denoising Gongfan Fang Xinyin Ma Xinchao Wang DiffM MoE 104 0 0 07 Dec 2024
CopyrightShield: Spatial Similarity Guided Backdoor Defense against Copyright Infringement in Diffusion Models Zhixiang Guo Siyuan Liang Aishan Liu Dacheng Tao AAML 71 1 0 02 Dec 2024
Multidimensional Byte Pair Encoding: Shortened Sequences for Improved Visual Data Generation Tim Elsner Paula Usinger Julius Nehring-Wirxel Gregor Kobsik Victor Czech Yanjiang He I. Lim Leif Kobbelt 37 0 0 15 Nov 2024
ColorEdit: Training-free Image-Guided Color editing with diffusion model Xingxi Yin Zhi Li Jingfeng Zhang Chenglin Li Yin Zhang DiffM 51 0 0 15 Nov 2024
Semi-Truths: A Large-Scale Dataset of AI-Augmented Images for Evaluating Robustness of AI-Generated Image detectors Anisha Pal Julia Kruk Mansi Phute Manognya Bhattaram Diyi Yang Duen Horng Chau Judy Hoffman AAML 42 2 0 12 Nov 2024
ENAT: Rethinking Spatial-temporal Interactions in Token-based Image Synthesis Zanlin Ni Yulin Wang Renping Zhou Yizeng Han Jiayi Guo Zhiyuan Liu Yuan Yao Gao Huang 57 4 0 11 Nov 2024
Scalable, Tokenization-Free Diffusion Model Architectures with Efficient Initial Convolution and Fixed-Size Reusable Structures for On-Device Image Generation Sanchar Palit Sathya Veera Reddy Dendi Mallikarjuna Talluri Raj Narayana Gadde 41 0 0 09 Nov 2024
Autoregressive Models in Vision: A Survey Jing Xiong Gongye Liu Lun Huang Chengyue Wu Taiqiang Wu ... M. Zhang Guillermo Sapiro Jiebo Luo Ping Luo Ngai Wong VGen 48 9 0 08 Nov 2024
Analyzing The Language of Visual Tokens David M. Chan Rodolfo Corona J. S. Park Cheol Jun Cho Yutong Bai Trevor Darrell 21 2 0 07 Nov 2024
Community Forensics: Using Thousands of Generators to Train Fake Image Detectors Jeongsoo Park Andrew Owens 34 3 0 06 Nov 2024
Estimating Ego-Body Pose from Doubly Sparse Egocentric Video Data Seunggeun Chi Pin-Hao Huang Enna Sachdeva Hengbo Ma Karthik Ramani Kwonjoon Lee DiffM 37 2 0 05 Nov 2024
Exploring the Interplay Between Video Generation and World Models in Autonomous Driving: A Survey Ao Fu Yi Zhou Tao Zhou Y. Yang Bojun Gao Qun Li Guobin Wu Ling Shao VGen 59 2 0 05 Nov 2024
VQ-Map: Bird's-Eye-View Map Layout Estimation in Tokenized Discrete Space via Vector Quantization Yiwei Zhang Jin Gao Fudong Ge Guan Luo Bing Li Z. Zhang Haibin Ling Weiming Hu 57 0 0 03 Nov 2024
Breaking Determinism: Fuzzy Modeling of Sequential Recommendation Using Discrete State Space Diffusion Model Wenjia Xie Hao Wang L. Zhang Rui Zhou Defu Lian Enhong Chen DiffM 41 3 0 31 Oct 2024
MoLE: Enhancing Human-centric Text-to-image Diffusion via Mixture of Low-rank Experts Jie Zhu Y. Chen Mingyu Ding Ping Luo Leye Wang Jingdong Wang DiffM 39 3 0 30 Oct 2024
st-DTPM: Spatial-Temporal Guided Diffusion Transformer Probabilistic Model for Delayed Scan PET Image Prediction Ran Hong Yuxia Huang Lei Liu Zhonghui Wu Bingxuan Li X. Wang Qiegen Liu MedIm 37 0 0 30 Oct 2024
Diff-Instruct*: Towards Human-Preferred One-step Text-to-image Generative Models Weijian Luo C. Zhang Debing Zhang Zhengyang Geng 28 3 0 28 Oct 2024
Novel Object Synthesis via Adaptive Text-Image Harmony Zeren Xiong Zedong Zhang Zikun Chen Shuo Chen Xianrui Li Gan Sun Jian Yang Jun Li DiffM 40 4 0 28 Oct 2024
Human-Object Interaction Detection Collaborated with Large Relation-driven Diffusion Models Liulei Li Wenguan Wang Y. Yang 42 7 0 26 Oct 2024
Diff-Instruct++: Training One-step Text-to-image Generator Model to Align with Human Preferences Weijian Luo EGVM 36 6 0 24 Oct 2024
How to Continually Adapt Text-to-Image Diffusion Models for Flexible Customization? Jiahua Dong Wenqi Liang Hongliu Li Duzhen Zhang Meng Cao Henghui Ding Salman Khan F. Khan DiffM 65 9 0 23 Oct 2024
On conditional diffusion models for PDE simulations Aliaksandra Shysheya Cristiana-Diana Diaconu Federico Bergamin P. Perdikaris José Miguel Hernández-Lobato Richard E. Turner Emile Mathieu DiffM 23 5 0 21 Oct 2024
Synergistic Dual Spatial-aware Generation of Image-to-Text and Text-to-Image Yu Zhao Hao Fei Xiangtai Li L. Qin Jiayi Ji Hongyuan Zhu Meishan Zhang M. Zhang Jianguo Wei DiffM 29 1 0 20 Oct 2024
Improving Vector-Quantized Image Modeling with Latent Consistency-Matching Diffusion Bac Nguyen and Chieh-Hsin Lai Yuhta Takida Naoki Murata Toshimitsu Uesaka Stefano Ermon Yuki Mitsufuji 66 0 0 18 Oct 2024
FAMSeC: A Few-shot-sample-based General AI-generated Image Detection Method Juncong Xu Yang Yang Han Fang Honggu Liu Weiming Zhang 32 1 0 17 Oct 2024
Unlocking the Capabilities of Masked Generative Models for Image Synthesis via Self-Guidance Jiwan Hur Dong-Jae Lee Gyojin Han Jaehyun Choi Yunho Jeon Junmo Kim DiffM 35 0 0 17 Oct 2024
DreamCraft3D++: Efficient Hierarchical 3D Generation with Multi-Plane Reconstruction Model Jingxiang Sun Cheng Peng Ruizhi Shao Y. Guo Xiaochen Zhao Yangguang Li Yanpei Cao Bo Zhang Yebin Liu 41 2 0 16 Oct 2024
Towards Reliable Verification of Unauthorized Data Usage in Personalized Text-to-Image Diffusion Models Boheng Li Yanhao Wei Yankai Fu Z. Wang Yiming Li Jie Zhang Run Wang Tianwei Zhang DiffM AAML 27 9 0 14 Oct 2024
EBDM: Exemplar-guided Image Translation with Brownian-bridge Diffusion Models Eungbean Lee Somi Jeong K. Sohn DiffM 30 1 0 13 Oct 2024
Distillation of Discrete Diffusion through Dimensional Correlations Satoshi Hayakawa Yuhta Takida Masaaki Imaizumi Hiromi Wakaki Yuki Mitsufuji DiffM 61 0 0 11 Oct 2024
$$\textit{Jump Your Steps}$: Optimizing Sampling Schedule of Discrete Diffusion Models$ $\textit{Jump Your Steps}$ : Optimizing Sampling Schedule of Discrete Diffusion Models Yong-Hyun Park Chieh-Hsin Lai Satoshi Hayakawa Yuhta Takida Yuki Mitsufuji 54 4 0 10 Oct 2024
DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models Xiaoxiao He Ligong Han Quan Dao Song Wen Minhao Bai ... Hongdong Li Junzhou Huang Faez Ahmed Akash Srivastava Dimitris Metaxas DiffM SyDa 40 4 0 10 Oct 2024
Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis Jinbin Bai Tian-Chun Ye Wei Chow Enxin Song Qing-Guo Chen Xiangtai Li Zhen Dong Lei Zhu 63 13 0 10 Oct 2024
MotionAura: Generating High-Quality and Motion Consistent Videos using Discrete Diffusion Onkar Susladkar Jishu Sen Gupta Chirag Sehgal Sparsh Mittal Rekha Singhal DiffM VGen 42 0 0 10 Oct 2024
G2D2: Gradient-guided Discrete Diffusion for image inverse problem solving Naoki Murata Chieh-Hsin Lai Yuhta Takida Toshimitsu Uesaka Bac Nguyen Stefano Ermon Yuki Mitsufuji DiffM 59 1 0 09 Oct 2024
Representation Alignment for Generation: Training Diffusion Transformers Is Easier Than You Think Sihyun Yu Sangkyung Kwak Huiwon Jang Jongheon Jeong Jonathan Huang Jinwoo Shin Saining Xie OCL 70 64 0 09 Oct 2024
ByTheWay: Boost Your Text-to-Video Generation Model to Higher Quality in a Training-free Way Jiazi Bu Pengyang Ling Pan Zhang Tong Wu Xiaoyi Dong Yuhang Zang Yuhang Cao Dahua Lin Jiaqi Wang DiffM VGen 33 0 0 08 Oct 2024
From Incomplete Coarse-Grained to Complete Fine-Grained: A Two-Stage Framework for Spatiotemporal Data Reconstruction Ziyu Sun Haoyang Su E. Wang Funing Yang Yongjian Yang Wenbin Liu AI4TS DiffM 31 0 0 05 Oct 2024
How Discrete and Continuous Diffusion Meet: Comprehensive Analysis of Discrete Diffusion Models via a Stochastic Integral Framework Yinuo Ren Haoxuan Chen Grant M. Rotskoff Lexing Ying 47 3 0 04 Oct 2024
Data Extrapolation for Text-to-image Generation on Small Datasets Senmao Ye Fei Liu 33 0 0 02 Oct 2024
Learning Multimodal Latent Generative Models with Energy-Based Prior Shiyu Yuan Jiali Cui Hanao Li Tian Han 34 0 0 30 Sep 2024
Text-driven Human Motion Generation with Motion Masked Diffusion Model Xingyu Chen DiffM VGen 30 2 0 29 Sep 2024
Conditional Image Synthesis with Diffusion Models: A Survey Zheyuan Zhan Defang Chen Jian-Ping Mei Zhenghe Zhao Jiawei Chen Chun Chen Siwei Lyu Can Wang VLM 42 5 0 28 Sep 2024
Fusion is all you need: Face Fusion for Customized Identity-Preserving Image Synthesis Salaheldin Mohamed Dong Han Yong Li 18 1 0 27 Sep 2024
Detecting Dataset Abuse in Fine-Tuning Stable Diffusion Models for Text-to-Image Synthesis Songrui Wang Yubo Zhu Wei Tong Sheng Zhong WIGM 28 0 0 27 Sep 2024
Layout-Corrector: Alleviating Layout Sticking Phenomenon in Discrete Diffusion Model Shoma Iwai Atsuki Osanai Shunsuke Kitada S. Omachi 3DV 22 2 0 25 Sep 2024