Title
Attend to Not Attended: Structure-then-Detail Token Merging for Post-training DiT Acceleration Haipeng Fang Sheng Tang Juan Cao Enshuo Zhang Fan Tang Tong-Yee Lee 2 0 0 16 May 2025
Accelerating Diffusion Transformer via Increment-Calibrated Caching with Channel-Aware Singular Value Decomposition Zhiyuan Chen Keyi Li Yifan Jia Le Ye Yufei Ma DiffM 35 0 0 09 May 2025
DiTFastAttnV2: Head-wise Attention Compression for Multi-Modality Diffusion Transformers Hao Zhang R. Su Zhihang Yuan Pengtao Chen Mingzhu Shen Yibo Fan Shengen Yan Guohao Dai Yu Wang 41 0 0 28 Mar 2025
PromptMobile: Efficient Promptus for Low Bandwidth Mobile Video Streaming Liming Liu Jiangkai Wu Haoyang Wang Peiheng Wang Xinggong Zhang Zongming Guo 47 0 0 20 Mar 2025
Scale-wise Distillation of Diffusion Models Nikita Starodubcev Denis Kuznedelev Artem Babenko Dmitry Baranchuk DiffM 53 0 0 20 Mar 2025
BlockDance: Reuse Structurally Similar Spatio-Temporal Features to Accelerate Diffusion Transformers Hui Zhang Tingwei Gao Jie Shao Zuxuan Wu 69 0 0 20 Mar 2025
FasterCache: Training-Free Video Diffusion Model Acceleration with High Quality Zhengyao Lv Chenyang Si Junhao Song Zhenyu Yang Ping Luo Ziwei Liu Kwan-Yee K. Wong VGen DiffM 84 8 0 13 Mar 2025
Accelerating Diffusion Sampling via Exploiting Local Transition Coherence Shangwen Zhu Han Zhang Zhantao Yang Qianyu Peng Zhao Pu Haoran Wang Fan Cheng DiffM 48 0 0 12 Mar 2025
Exposure Bias Reduction for Enhancing Diffusion Transformer Feature Caching Zhen Zou Hu Yu Jie Xiao Feng Zhao 45 0 0 10 Mar 2025
Q&C: When Quantization Meets Cache in Efficient Image Generation Xin Ding X. Li Haotong Qin Zhibo Chen DiffM MQ 75 0 0 04 Mar 2025
CacheQuant: Comprehensively Accelerated Diffusion Models Xuewen Liu Zhikai Li Qingyi Gu DiffM 40 0 0 03 Mar 2025
FlexiDiT: Your Diffusion Transformer Can Easily Generate High-Quality Samples with Less Compute Sotiris Anagnostidis Gregor Bachmann Yeongmin Kim Jonas Kohler Markos Georgopoulos A. Sanakoyeu Yuming Du Albert Pumarola Ali K. Thabet Edgar Schönfeld 92 0 0 27 Feb 2025
PFDiff: Training-Free Acceleration of Diffusion Models Combining Past and Future Scores Guangyi Wang Yuren Cai Lijiang Li Wei Peng Songzhi Su DiffM 54 0 0 21 Feb 2025
Accelerating Diffusion Transformers with Token-wise Feature Caching Chang Zou Xuyang Liu Ting Liu Siteng Huang Linfeng Zhang 54 14 0 20 Feb 2025
CAT Pruning: Cluster-Aware Token Pruning For Text-to-Image Diffusion Models Xinle Cheng Zhuoming Chen Zhihao Jia DiffM VLM 52 1 0 01 Feb 2025
Accelerate High-Quality Diffusion Models with Inner Loop Feedback M. Gwilliam Han Cai Di Wu Abhinav Shrivastava Zhiyu Cheng 90 0 0 22 Jan 2025
Cached Adaptive Token Merging: Dynamic Token Reduction and Redundant Computation Elimination in Diffusion Model Omid Saghatchian Atiyeh Gh. Moghadam Ahmad Nickabadi MoMe 49 1 0 03 Jan 2025
FlexCache: Flexible Approximate Cache System for Video Diffusion Desen Sun Henry Tian Tim Lu Sihang Liu DiffM 33 0 0 18 Dec 2024
AsymRnR: Video Diffusion Transformers Acceleration with Asymmetric Reduction and Restoration Wenhao Sun Rong-Cheng Tu Jingyi Liao Zhao Jin Dacheng Tao VGen 102 1 0 16 Dec 2024
Timestep Embedding Tells: It's Time to Cache for Video Diffusion Model Feng Liu Shiwei Zhang Xiaofeng Wang Yujie Wei Haonan Qiu Yuzhong Zhao Yingya Zhang Qixiang Ye Fang Wan VGen AI4TS 99 11 0 28 Nov 2024
Collaborative Decoding Makes Visual Auto-Regressive Modeling Efficient Zigeng Chen Xinyin Ma Gongfan Fang Xinchao Wang VLM 89 5 0 26 Nov 2024
SmoothCache: A Universal Inference Acceleration Technique for Diffusion Transformers Joseph Liu Joshua Geddes Ziyu Guo Haomiao Jiang Mahesh Kumar Nandwana 56 0 0 15 Nov 2024
ENAT: Rethinking Spatial-temporal Interactions in Token-based Image Synthesis Zanlin Ni Yulin Wang Renping Zhou Yizeng Han Jiayi Guo Zhiyuan Liu Yuan Yao Gao Huang 60 4 0 11 Nov 2024
Diffusion Sampling Correction via Approximately 10 Parameters Guangyi Wang Wei Peng Lijiang Li Wenyu Chen Yuren Cai Songzhi Su DiffM 38 0 0 10 Nov 2024
AsCAN: Asymmetric Convolution-Attention Networks for Efficient Recognition and Generation Anil Kag Huseyin Coskun Jierun Chen Junli Cao Willi Menapace Aliaksandr Siarohin Sergey Tulyakov Jian Ren 51 3 0 07 Nov 2024
DiffSTR: Controlled Diffusion Models for Scene Text Removal Sanhita Pathak V. Kaushik Brejesh Lall DiffM 33 0 0 29 Oct 2024
Presto! Distilling Steps and Layers for Accelerating Music Generation Zachary Novack Ge Zhu Jonah Casebeer Julian McAuley Taylor Berg-Kirkpatrick Nicholas J. Bryan 45 5 0 07 Oct 2024
Pixel-Space Post-Training of Latent Diffusion Models Christina Zhang Simran Motwani Matthew Yu Ji Hou Felix Juefei-Xu Sam S. Tsai Peter Vajda Zijian He Jialiang Wang 28 2 0 26 Sep 2024
Real-Time Video Generation with Pyramid Attention Broadcast Xuanlei Zhao Xiaolong Jin Kai Wang Yang You VGen DiffM 77 32 0 22 Aug 2024
A Simple Early Exiting Framework for Accelerated Sampling in Diffusion Models Taehong Moon Moonseok Choi Eunggu Yun Jongmin Yoon Gayoung Lee Jaewoong Cho Juho Lee 42 4 0 12 Aug 2024
Temporal Feature Matters: A Framework for Diffusion Model Quantization Yushi Huang Ruihao Gong Xianglong Liu Jing Liu Yuhang Li Jiwen Lu Dacheng Tao DiffM MQ 49 0 0 28 Jul 2024
SlimFlow: Training Smaller One-Step Diffusion Models with Rectified Flow Yuanzhi Zhu Xingchao Liu Qiang Liu 46 9 0 17 Jul 2024
FORA: Fast-Forward Caching in Diffusion Transformer Acceleration Pratheba Selvaraju Tianyu Ding Tianyi Chen Ilya Zharkov Luming Liang 36 20 0 01 Jul 2024
Not All Prompts Are Made Equal: Prompt-based Pruning of Text-to-Image Diffusion Models Alireza Ganjdanesh Reza Shirkavand Shangqian Gao Heng Huang DiffM VLM 56 4 0 17 Jun 2024
AsyncDiff: Parallelizing Diffusion Models by Asynchronous Denoising Zigeng Chen Xinyin Ma Gongfan Fang Zhenxiong Tan Xinchao Wang 52 7 0 11 Jun 2024
Learning-to-Cache: Accelerating Diffusion Transformer via Layer Caching Xinyin Ma Gongfan Fang Michael Bi Mi Xinchao Wang 61 30 0 03 Jun 2024
Looking Backward: Streaming Video-to-Video Translation with Feature Banks Feng Liang Akio Kodaira Chenfeng Xu Masayoshi Tomizuka Kurt Keutzer Diana Marculescu DiffM VGen 70 7 0 24 May 2024
Imagine Flash: Accelerating Emu Diffusion Models with Backward Distillation Jonas Kohler Albert Pumarola Edgar Schönfeld A. Sanakoyeu Roshan Sumbaly Peter Vajda Ali K. Thabet 32 22 0 08 May 2024
Lazy Layers to Make Fine-Tuned Diffusion Models More Traceable Haozhe Liu Wentian Zhang Bing Li Bernard Ghanem Jürgen Schmidhuber DiffM WIGM AAML 36 1 0 01 May 2024
Faster Diffusion via Temporal Attention Decomposition Haozhe Liu Wentian Zhang Jinheng Xie Francesco Faccio Mengmeng Xu Tao Xiang Mike Zheng Shou Juan-Manuel Perez-Rua Jürgen Schmidhuber DiffM 75 19 0 03 Apr 2024
Invertible Diffusion Models for Compressed Sensing Bin Chen Zhenyu Zhang Weiqi Li Chen Zhao Jiwen Yu Shijie Zhao Jie Chen Jian Zhang DiffM 57 5 0 25 Mar 2024
T-Stitch: Accelerating Sampling in Pre-Trained Diffusion Models with Trajectory Stitching Zizheng Pan Bohan Zhuang De-An Huang Weili Nie Zhiding Yu Chaowei Xiao Jianfei Cai A. Anandkumar 36 17 0 21 Feb 2024
Masked Autoencoders Are Scalable Vision Learners Kaiming He Xinlei Chen Saining Xie Yanghao Li Piotr Dollár Ross B. Girshick ViT TPM 311 7,457 0 11 Nov 2021
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 255 4,796 0 24 Feb 2021
Knowledge Distillation in Iterative Generative Models for Improved Sampling Speed Eric Luhman Troy Luhman DiffM 195 258 0 07 Jan 2021
U-Net: Convolutional Networks for Biomedical Image Segmentation Olaf Ronneberger Philipp Fischer Thomas Brox SSeg 3DV 342 75,888 0 18 May 2015