Q-Diffusion: Quantizing Diffusion Models

8 February 2023

Zhen Dong

Shanghang Zhang

Papers citing "Q-Diffusion: Quantizing Diffusion Models"

50 / 108 papers shown

Title
Attend to Not Attended: Structure-then-Detail Token Merging for Post-training DiT Acceleration Haipeng Fang Sheng Tang Juan Cao Enshuo Zhang Fan Tang Tong-Yee Lee 2 0 0 16 May 2025
Replay-Based Continual Learning with Dual-Layered Distillation and a Streamlined U-Net for Efficient Text-to-Image Generation Md. Naimur Asif Borno Md Sakib Hossain Shovon Asmaa Soliman Al-Moisheer Mohammad Ali Moni 36 0 0 11 May 2025
Diffusion Model Quantization: A Review Qian Zeng Chenggong Hu Mingli Song Jie Song MQ 45 0 0 08 May 2025
Quantizing Diffusion Models from a Sampling-Aware Perspective Qian Zeng Jie Song Yuanyu Wan Huiqiong Wang Mingli Song DiffM MQ 88 1 0 04 May 2025
GuideSR: Rethinking Guidance for One-Step High-Fidelity Diffusion-Based Super-Resolution Aditya Arora Z. Tu Yucheng Wang Ruizheng Bai Jian Wang Sizhuo Ma DiffM 66 0 0 01 May 2025
Sparse-to-Sparse Training of Diffusion Models Inês Cardoso Oliveira Decebal Constantin Mocanu Luis A. Leiva DiffM 86 0 0 30 Apr 2025
Packing Input Frame Context in Next-Frame Prediction Models for Video Generation Lvmin Zhang Maneesh Agrawala DiffM VGen 75 0 0 17 Apr 2025
DyDiT++: Dynamic Diffusion Transformers for Efficient Visual Generation Wangbo Zhao Yizeng Han Jiasheng Tang Kai Wang Hao Luo Yibing Song Gao Huang Fan Wang Yang You 74 0 0 09 Apr 2025
FastVAR: Linear Visual Autoregressive Modeling via Cached Token Pruning Hang Guo Yawei Li Taolin Zhang Jiadong Wang Tao Dai Shu-Tao Xia Luca Benini 72 2 0 30 Mar 2025
DiTFastAttnV2: Head-wise Attention Compression for Multi-Modality Diffusion Transformers Hao Zhang R. Su Zhihang Yuan Pengtao Chen Mingzhu Shen Yibo Fan Shengen Yan Guohao Dai Yu Wang 41 0 0 28 Mar 2025
Scaling Down Text Encoders of Text-to-Image Diffusion Models Lifu Wang Daqing Liu Xinchen Liu Xiaodong He VLM 49 0 0 25 Mar 2025
PCM : Picard Consistency Model for Fast Parallel Sampling of Diffusion Models Junhyuk So Jiwoong Shin Chaeyeon Jang Eunhyeok Park DiffM 53 0 0 25 Mar 2025
Scale-wise Distillation of Diffusion Models Nikita Starodubcev Denis Kuznedelev Artem Babenko Dmitry Baranchuk DiffM 53 0 0 20 Mar 2025
FP4DiT: Towards Effective Floating Point Quantization for Diffusion Transformers Ruichen Chen Keith G. Mills Di Niu MQ 59 0 0 19 Mar 2025
Training Video Foundation Models with NVIDIA NeMo Zeeshan Patel Ethan He Parth Mannan Xiaowei Ren Ryan Wolf ... Rong Ou Pallab Bhattacharya David Page Nima Tajbakhsh Ashwath Aithal VGen 50 0 0 17 Mar 2025
Stabilizing Quantization-Aware Training by Implicit-Regularization on Hessian Matrix Junbiao Pang Tianyang Cai 44 1 0 14 Mar 2025
Upcycling Text-to-Image Diffusion Models for Multi-Task Capabilities Ruchika Chavhan Abhinav Mehrotra Malcolm Chadwick Alberto Gil C. P. Ramos Luca Morreale Mehdi Noroozi Sourav Bhattacharya 49 0 0 14 Mar 2025
Understanding Flatness in Generative Models: Its Role and Benefits Taehwan Lee Kyeongkook Seo Jaejun Yoo Sung Whan Yoon DiffM 60 0 0 14 Mar 2025
Efficient Fine-Tuning and Concept Suppression for Pruned Diffusion Models Reza Shirkavand Peiran Yu Shangqian Gao Gowthami Somepalli Tom Goldstein Heng-Chiao Huang 113 1 0 13 Mar 2025
OuroMamba: A Data-Free Quantization Framework for Vision Mamba Models Akshat Ramachandran Mingyu Lee Huan Xu Souvik Kundu Tushar Krishna MQ 51 1 0 13 Mar 2025
From Reusing to Forecasting: Accelerating Diffusion Models with TaylorSeers Jiacheng Liu Chang Zou Yuanhuiyi Lyu Junjie Chen Linfeng Zhang DiffM 63 1 0 10 Mar 2025
Post-Training Quantization for Diffusion Transformer via Hierarchical Timestep Grouping Ning Ding Jing Han Yuchuan Tian Chao Xu Kai Han Yehui Tang MQ 44 0 0 10 Mar 2025
TR-DQ: Time-Rotation Diffusion Quantization Yihua Shao Deyang Lin Fanhu Zeng Minxi Yan Hao Fei ... Haozhe Wang J. Guo Yan Wang Haotong Qin Hao Tang MQ DiffM 77 1 0 09 Mar 2025
QArtSR: Quantization via Reverse-Module and Timestep-Retraining in One-Step Diffusion based Image Super-Resolution Libo Zhu Haotong Qin Kaicheng Yang W. J. Li Yong Guo Yulun Zhang Susanto Rahardja Xiaokang Yang MQ DiffM 66 0 0 07 Mar 2025
Q&C: When Quantization Meets Cache in Efficient Image Generation Xin Ding X. Li Haotong Qin Zhibo Chen DiffM MQ 75 0 0 04 Mar 2025
CacheQuant: Comprehensively Accelerated Diffusion Models Xuewen Liu Zhikai Li Qingyi Gu DiffM 40 0 0 03 Mar 2025
Accelerating Diffusion Transformers with Token-wise Feature Caching Chang Zou Xuyang Liu Ting Liu Siteng Huang Linfeng Zhang 54 14 0 20 Feb 2025
Skrr: Skip and Re-use Text Encoder Layers for Memory Efficient Text-to-Image Generation H. Seo Wongi Jeong Jae-sun Seo Se Young Chun 62 0 0 12 Feb 2025
SQ-DM: Accelerating Diffusion Models with Aggressive Quantization and Temporal Sparsity Zichen Fan Steve Dai Rangharajan Venkatesan Dennis Sylvester Brucek Khailany MQ 55 0 0 28 Jan 2025
Ditto: Accelerating Diffusion Model via Temporal Value Similarity Sungbin Kim Hyunwuk Lee Wonho Cho Mincheol Park Won Woo Ro 58 1 0 20 Jan 2025
Self-Refining Diffusion Samplers: Enabling Parallelization via Parareal Iterations Nikil Roashan Selvam Amil Merchant Stefano Ermon DiffM 66 3 0 11 Dec 2024
Partially Conditioned Patch Parallelism for Accelerated Diffusion Model Inference XiuYu Zhang Zening Luo Michelle E. Lu DiffM 61 0 0 04 Dec 2024
Collaborative Decoding Makes Visual Auto-Regressive Modeling Efficient Zigeng Chen Xinyin Ma Gongfan Fang Xinchao Wang VLM 89 5 0 26 Nov 2024
PassionSR: Post-Training Quantization with Adaptive Scale in One-Step Diffusion based Image Super-Resolution Libo Zhu Jiajian Li Haotong Qin W. J. Li Yulun Zhang Yong Guo Xiaokang Yang DiffM MQ 72 2 0 26 Nov 2024
Fast and Memory-Efficient Video Diffusion Using Streamlined Inference Zheng Zhan Yushu Wu Yifan Gong Zichong Meng Zhenglun Kong Changdi Yang Geng Yuan Pu Zhao Wei Niu Yanzhi Wang VGen 44 4 0 02 Nov 2024
IntLoRA: Integral Low-rank Adaptation of Quantized Diffusion Models Hang Guo Yawei Li Tao Dai Shu-Tao Xia Luca Benini MQ 39 1 0 29 Oct 2024
SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers Enze Xie Junsong Chen Junyu Chen Han Cai Haotian Tang ... Zhekai Zhang Muyang Li Ligeng Zhu Yunfan LU Song Han VLM 46 51 0 14 Oct 2024
Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis Jinbin Bai Tian-Chun Ye Wei Chow Enxin Song Qing-Guo Chen Hefei Ling Zhen Dong Lei Zhu 69 14 0 10 Oct 2024
Decouple-Then-Merge: Finetune Diffusion Models as Multi-Task Learning Qianli Ma Xuefei Ning Dongrui Liu Li Niu Linfeng Zhang MoMe 57 0 0 09 Oct 2024
Dynamic Diffusion Transformer Wangbo Zhao Yizeng Han Jiasheng Tang Kai Wang Yibing Song Gao Huang Fan Wang Yang You 77 13 0 04 Oct 2024
Multi-Modal Generative AI: Multi-modal LLM, Diffusion and Beyond Hong Chen Xin Wang Yuwei Zhou Bin Huang Yipeng Zhang Wei Feng Houlun Chen Zeyang Zhang Siao Tang Wenwu Zhu DiffM 55 7 0 23 Sep 2024
Bayesian computation with generative diffusion models by Multilevel Monte Carlo Abdul-Lateef Haji-Ali Marcelo Pereyra Luke Shaw K. Zygalakis DiffM 47 0 0 23 Sep 2024
DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation Xuewen Liu Zhikai Li Qingyi Gu MQ 34 4 0 22 Sep 2024
SDP: Spiking Diffusion Policy for Robotic Manipulation with Learnable Channel-Wise Membrane Thresholds Zhixing Hou Maoxu Gao Hang Yu Mengyu Yang Chio-in Ieong 45 1 0 17 Sep 2024
DiTAS: Quantizing Diffusion Transformers via Enhanced Activation Smoothing Zhenyuan Dong Sai Qian Zhang MQ 33 3 0 12 Sep 2024
DKDM: Data-Free Knowledge Distillation for Diffusion Models with Any Architecture Qianlong Xiang Miao Zhang Yuzhang Shang Jianlong Wu Yan Yan Liqiang Nie DiffM 66 10 0 05 Sep 2024
Accurate Compression of Text-to-Image Diffusion Models via Vector Quantization Vage Egiazarian Denis Kuznedelev Anton Voronov Ruslan Svirschevski Michael Goin Daniil Pavlov Dan Alistarh Dmitry Baranchuk MQ 41 0 0 31 Aug 2024
K-Sort Arena: Efficient and Reliable Benchmarking for Generative Models via K-wise Human Preferences Zhikai Li Xuewen Liu Dongrong Fu Jianquan Li Qingyi Gu Kurt Keutzer Zhen Dong EGVM VGen DiffM 95 1 0 26 Aug 2024
Diff-PCC: Diffusion-based Neural Compression for 3D Point Clouds Kai Liu Kang-Soo You Pan Gao DiffM 37 0 0 20 Aug 2024
Low-Bitwidth Floating Point Quantization for Efficient High-Quality Diffusion Models Cheng Chen Christina Giannoula Andreas Moshovos DiffM MQ 24 0 0 13 Aug 2024