ZeroQ: A Novel Zero Shot Quantization Framework

1 January 2020

Zhen Dong

ArXiv (abs)PDF HTML Github (279★)

Papers citing "ZeroQ: A Novel Zero Shot Quantization Framework"

50 / 233 papers shown

Title
ReStNet: A Reusable & Stitchable Network for Dynamic Adaptation on IoT Devices Maoyu Wang Yao Lu Jiaqi Nie Zeyu Wang Yun Lin Qi Xuan Guan Gui 13 0 0 08 Jun 2025
FPTQuant: Function-Preserving Transforms for LLM Quantization Boris van Breugel Yelysei Bondarenko Paul N. Whatmough Markus Nagel MQ 87 0 0 05 Jun 2025
TuneComp: Joint Fine-tuning and Compression for Large Foundation Models Xiangyu Chen Jing Liu Ye Wang Matthew Brand Wang T. Koike-Akino 49 0 0 27 May 2025
PDE: Gene Effect Inspired Parameter Dynamic Evolution for Low-light Image Enhancement Tong Li Lizhi Wang Hansen Feng Lin Zhu Hua Huang DiffM 68 0 0 14 May 2025
Zero-shot Quantization: A Comprehensive Survey Minjun Kim Jaehyeon Choi Jongkeun Lee Wonjin Cho U. Kang MQ 90 2 0 14 May 2025
Quantitative Analysis of Performance Drop in DeepSeek Model Quantization Enbo Zhao Yi Shen Shuming Shi Jieyun Huang Z. Chen Rongjia Du Siqi Xiao Jing Zhang Ning Wang Shiguo Lian MQ 149 0 0 05 May 2025
StableQuant: Layer Adaptive Post-Training Quantization for Speech Foundation Models Yeona Hong Hyewon Han Woo-Jin Chung Hong-Goo Kang MQ 128 0 0 21 Apr 2025
PARQ: Piecewise-Affine Regularized Quantization Lisa Jin Jianhao Ma Zechun Liu Andrey Gromov Aaron Defazio Lin Xiao MQ 71 1 0 19 Mar 2025
Robust Machine Unlearning for Quantized Neural Networks via Adaptive Gradient Reweighting with Similar Labels Yujia Tong Yuze Wang Jingling Yuan Chuang Hu NoLa 104 0 0 18 Mar 2025
A General Error-Theoretical Analysis Framework for Constructing Compression Strategies Boyang Zhang Daning Cheng Yunquan Zhang Meiqi Tu Fangmin Liu Jiake Tian 74 1 0 19 Feb 2025
DecDEC: A Systems Approach to Advancing Low-Bit LLM Quantization Y. Park Jake Hyun Hojoon Kim Jae W. Lee MQ 118 0 0 28 Dec 2024
Rethinking Model Redundancy for Low-light Image Enhancement Tong Li Lizhi Wang Hansen Feng Lin Zhu Wanxuan Lu Hua Huang 114 0 0 21 Dec 2024
Semantic Alignment and Reinforcement for Data-Free Quantization of Vision Transformers Mingliang Xu Yuyao Zhou Yuxin Zhang Shen Li Yong Li Chia-Wen Lin Zhanpeng Zeng Rongrong Ji MQ 331 0 0 21 Dec 2024
Adaptive Calibration: A Unified Conversion Framework of Spiking Neural Network Zehua Wang Yuetong Fang Jiahang Cao Hongwei Ren Renjing Xu 131 3 0 18 Dec 2024
Relation-Guided Adversarial Learning for Data-free Knowledge Transfer Yingping Liang Ying Fu 100 1 0 16 Dec 2024
SKIM: Any-bit Quantization Pushing The Limits of Post-Training Quantization Runsheng Bai Qiang Liu B. Liu MQ 135 2 0 05 Dec 2024
On the Impact of White-box Deployment Strategies for Edge AI on Latency and Model Performance Jaskirat Singh Bram Adams Ahmed E. Hassan VLM 142 0 0 01 Nov 2024
Data Generation for Hardware-Friendly Post-Training Quantization Lior Dikstein Ariel Lapid Arnon Netzer H. Habi MQ 480 0 0 29 Oct 2024
Self-calibration for Language Model Quantization and Pruning Miles Williams G. Chrysostomou Nikolaos Aletras MQ 487 0 0 22 Oct 2024
SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers Enze Xie Junsong Chen Junyu Chen Han Cai Haotian Tang ... Zhekai Zhang Zhekai Zhang Ligeng Zhu Yaojie Lu Song Han VLM 139 41 0 14 Oct 2024
Q-VLM: Post-training Quantization for Large Vision-Language Models Changyuan Wang Ziwei Wang Xiuwei Xu Yansong Tang Jie Zhou Jiwen Lu MQ 113 7 0 10 Oct 2024
QT-DoG: Quantization-aware Training for Domain Generalization Saqib Javed Hieu Le Mathieu Salzmann OOD MQ 119 2 0 08 Oct 2024
Constraint Guided Model Quantization of Neural Networks Quinten Van Baelen P. Karsmakers MQ 59 0 0 30 Sep 2024
SPAQ-DL-SLAM: Towards Optimizing Deep Learning-based SLAM for Resource-Constrained Embedded Platforms Niraj Pudasaini Muhammad Abdullah Hanif Mohamed Bennai 46 0 0 22 Sep 2024
Art and Science of Quantizing Large-Scale Models: A Comprehensive Overview Yanshu Wang Tong Yang Xiyan Liang Guoan Wang Hanning Lu Xu Zhe Yaoming Li Li Weitao MQ 87 3 0 18 Sep 2024
Privacy-Preserving SAM Quantization for Efficient Edge Intelligence in Healthcare Zhikai Li Jing Zhang Qingyi Gu MedIm 126 1 0 14 Sep 2024
Infrared Domain Adaptation with Zero-Shot Quantization Burak Sevsay Erdem Akagündüz VLM MQ 132 1 0 25 Aug 2024
Computer Vision Model Compression Techniques for Embedded Systems: A Survey Alexandre Lopes Fernando Pereira dos Santos D. Oliveira Mauricio Schiezaro Hélio Pedrini 79 10 0 15 Aug 2024
Layer-Specific Optimization: Sensitivity Based Convolution Layers Basis Search V. Alekseev Ilya Lukashevich Ilia Zharikov Ilya Vasiliev 49 0 0 12 Aug 2024
MimiQ: Low-Bit Data-Free Quantization of Vision Transformers with Encouraging Inter-Head Attention Similarity Kanghyun Choi Hyeyoon Lee Dain Kwon Sunjong Park Kyuyeun Kim Noseong Park Jinho Lee Jinho Lee MQ 123 2 0 29 Jul 2024
MetaAug: Meta-Data Augmentation for Post-Training Quantization Cuong Pham Hoang Anh Dung Cuong C. Nguyen Trung Le Dinh Q. Phung Gustavo Carneiro Thanh-Toan Do MQ 76 0 0 20 Jul 2024
MCU-MixQ: A HW/SW Co-optimized Mixed-precision Neural Network Design Framework for MCUs Junfeng Gong Cheng Liu Long Cheng Huawei Li Xiaowei Li 86 0 0 17 Jul 2024
CLAMP-ViT: Contrastive Data-Free Learning for Adaptive Post-Training Quantization of ViTs Akshat Ramachandran Souvik Kundu Tushar Krishna MQ 109 11 0 07 Jul 2024
DataFreeShield: Defending Adversarial Attacks without Training Data Hyeyoon Lee Kanghyun Choi Dain Kwon Sunjong Park Mayoore S. Jaiswal Noseong Park Jonghyun Choi Jinho Lee 78 0 0 21 Jun 2024
An Analysis on Quantizing Diffusion Transformers Yuewei Yang Jialiang Wang Xiaoliang Dai Peizhao Zhang Hongbo Zhang MQ 106 1 0 16 Jun 2024
Low-Rank Quantization-Aware Training for LLMs Yelysei Bondarenko Riccardo Del Chiaro Markus Nagel MQ 77 14 0 10 Jun 2024
ViDiT-Q: Efficient and Accurate Quantization of Diffusion Transformers for Image and Video Generation Tianchen Zhao Tongcheng Fang Haofeng Huang Enshu Liu Widyadewi Soedarmadji ... Shengen Yan Huazhong Yang Xuefei Ning Xuefei Ning Yu Wang MQ VGen 187 35 0 04 Jun 2024
Robust Knowledge Distillation Based on Feature Variance Against Backdoored Teacher Model Jinyin Chen Xiaoming Zhao Haibin Zheng Xiao Li Sheng Xiang Haifeng Guo AAML 36 5 0 01 Jun 2024
LLMC: Benchmarking Large Language Model Quantization with a Versatile Compression Toolkit Ruihao Gong Yang Yong Shiqiao Gu Yushi Huang Chentao Lv Yunchen Zhang Xianglong Liu Dacheng Tao MQ 112 10 0 09 May 2024
Learning from Students: Applying t-Distributions to Explore Accurate and Efficient Formats for LLMs Jordan Dotzel Yuzong Chen Bahaa Kotb Sushma Prasad Gang Wu Sheng Li Mohamed S. Abdelfattah Zhiru Zhang 76 9 0 06 May 2024
Lightweight Deep Learning for Resource-Constrained Environments: A Survey Hou-I Liu Marco Galindo Hongxia Xie Lai-Kuan Wong Hong-Han Shuai Yung-Hui Li Wen-Huang Cheng 130 65 0 08 Apr 2024
DNN Memory Footprint Reduction via Post-Training Intra-Layer Multi-Precision Quantization B. Ghavami Amin Kamjoo Lesley Shannon S. Wilton MQ 45 0 0 03 Apr 2024
QNCD: Quantization Noise Correction for Diffusion Models Huanpeng Chu Wei Wu Chengjie Zang Kun Yuan DiffM MQ 84 6 0 28 Mar 2024
On the Impact of Black-box Deployment Strategies for Edge AI on Latency and Model Performance Jaskirat Singh Emad Fallahzadeh Bram Adams Ahmed E. Hassan MQ 155 3 0 25 Mar 2024
AffineQuant: Affine Transformation Quantization for Large Language Models Yuexiao Ma Huixia Li Xiawu Zheng Feng Ling Xuefeng Xiao Rui Wang Shilei Wen Chia-Wen Lin Rongrong Ji MQ 117 28 0 19 Mar 2024
PYRA: Parallel Yielding Re-Activation for Training-Inference Efficient Task Adaptation Yizhe Xiong Hui Chen Tianxiang Hao Zijia Lin Jungong Han Yuesong Zhang Guoxin Wang Yongjun Bao Guiguang Ding 97 18 0 14 Mar 2024
COMQ: A Backpropagation-Free Algorithm for Post-Training Quantization Aozhong Zhang Zi Yang Naigang Wang Yingyong Qin Jack Xin Xin Li Penghang Yin VLM MQ 46 3 0 11 Mar 2024
Self-Adapting Large Visual-Language Models to Edge Devices across Visual Modalities Kaiwen Cai Zhekai Duan Gaowen Liu Charles Fleming Chris Xiaoxuan Lu VLM 75 4 0 07 Mar 2024
Ef-QuantFace: Streamlined Face Recognition with Small Data and Low-Bit Precision William Gazali Jocelyn Michelle Kho Joshua Santoso Williem CVBM MQ 78 0 0 28 Feb 2024
Understanding Neural Network Binarization with Forward and Backward Proximal Quantizers Yiwei Lu Yaoliang Yu Xinlin Li Vahid Partovi Nia MQ 78 3 0 27 Feb 2024