ZeroQ: A Novel Zero Shot Quantization Framework

1 January 2020

Zhen Dong

ArXiv (abs)PDF HTML Github (279★)

Papers citing "ZeroQ: A Novel Zero Shot Quantization Framework"

33 / 233 papers shown

Title
Integer-only Zero-shot Quantization for Efficient Speech Recognition Sehoon Kim A. Gholami Z. Yao Nicholas Lee Patrick Wang Aniruddha Nrusimha Bohan Zhai Tianren Gao Michael W. Mahoney Kurt Keutzer MQ 93 25 0 31 Mar 2021
Zero-shot Adversarial Quantization Yuang Liu Wei Zhang Jun Wang MQ 114 79 0 29 Mar 2021
Data-free mixed-precision quantization using novel sensitivity metric Donghyun Lee M. Cho Seungwon Lee Joonho Song Changkyu Choi MQ 63 2 0 18 Mar 2021
Confounding Tradeoffs for Neural Network Quantization Sahaj Garg Anirudh Jain Joe Lou Mitchell Nahmias MQ 76 19 0 12 Feb 2021
Dynamic Precision Analog Computing for Neural Networks Sahaj Garg Joe Lou Anirudh Jain Mitchell Nahmias 75 33 0 12 Feb 2021
BRECQ: Pushing the Limit of Post-Training Quantization by Block Reconstruction Yuhang Li Ruihao Gong Xu Tan Yang Yang Peng Hu Qi Zhang F. Yu Wei Wang Shi Gu MQ 160 445 0 10 Feb 2021
Attention-Based Neural Networks for Chroma Intra Prediction in Video Coding Marc Górriz Blanch Saverio G. Blasi Alan F. Smeaton Noel E. O'Connor M. Mrak 29 15 0 09 Feb 2021
VS-Quant: Per-vector Scaled Quantization for Accurate Low-Precision Neural Network Inference Steve Dai Rangharajan Venkatesan Haoxing Ren B. Zimmer W. Dally Brucek Khailany MQ 94 74 0 08 Feb 2021
Rethinking Floating Point Overheads for Mixed Precision DNN Accelerators Hamzah Abdel-Aziz Ali Shafiee J. Shin A. Pedram Joseph Hassoun MQ 67 11 0 27 Jan 2021
Generative Zero-shot Network Quantization Xiangyu He Qinghao Hu Peisong Wang Jian Cheng GAN MQ 114 23 0 21 Jan 2021
Hybrid and Non-Uniform quantization methods using retro synthesis data for efficient inference Gvsl Tej Pratap R. Kumar MQ 54 1 0 26 Dec 2020
DAQ: Channel-Wise Distribution-Aware Quantization for Deep Image Super-Resolution Networks Chee Hong Heewon Kim Sungyong Baik Junghun Oh Kyoung Mu Lee OOD SupR MQ 97 41 0 21 Dec 2020
Exploring Neural Networks Quantization via Layer-Wise Quantization Analysis Shachar Gluska Mark Grobman MQ 42 5 0 15 Dec 2020
HAWQV3: Dyadic Neural Network Quantization Z. Yao Zhen Dong Zhangcheng Zheng A. Gholami Jiali Yu ... Leyuan Wang Qijing Huang Yida Wang Michael W. Mahoney Kurt Keutzer MQ 122 87 0 20 Nov 2020
MixMix: All You Need for Data-Free Compression Are Feature and Data Mixing Yuhang Li Feng Zhu Ruihao Gong Mingzhu Shen Xin Dong F. Yu Shaoqing Lu Shi Gu MQ 104 40 0 19 Nov 2020
Layer-Wise Data-Free CNN Compression Maxwell Horton Yanzi Jin Ali Farhadi Mohammad Rastegari MQ 67 17 0 18 Nov 2020
A Statistical Framework for Low-bitwidth Training of Deep Neural Networks Jianfei Chen Yujie Gai Z. Yao Michael W. Mahoney Joseph E. Gonzalez MQ 68 59 0 27 Oct 2020
Towards Accurate Quantization and Pruning via Data-free Knowledge Transfer Chen Zhu Zheng Xu Ali Shafahi Manli Shu Amin Ghiasi Tom Goldstein MQ 61 3 0 14 Oct 2020
SoFAr: Shortcut-based Fractal Architectures for Binary Convolutional Neural Networks Baozhou Zhu P. Hofstee Jinho Lee Zaid Al-Ars MQ 36 2 0 11 Sep 2020
Weight Equalizing Shift Scaler-Coupled Post-training Quantization Jihun Oh Sangjeong Lee Meejeong Park Pooni Walagaurav K. Kwon MQ 67 1 0 13 Aug 2020
Fully Dynamic Inference with Deep Neural Networks Wenhan Xia Hongxu Yin Xiaoliang Dai N. Jha 3DH BDL 80 40 0 29 Jul 2020
HMQ: Hardware Friendly Mixed Precision Quantization Block for CNNs H. Habi Roy H. Jennings Arnon Netzer MQ 72 65 0 20 Jul 2020
Improving Post Training Neural Quantization: Layer-wise Calibration and Integer Programming Itay Hubara Yury Nahshan Y. Hanani Ron Banner Daniel Soudry MQ 115 129 0 14 Jun 2020
Self-Distillation as Instance-Specific Label Smoothing Zhilu Zhang M. Sabuncu 76 119 0 09 Jun 2020
Up or Down? Adaptive Rounding for Post-Training Quantization Markus Nagel Rana Ali Amjad M. V. Baalen Christos Louizos Tijmen Blankevoort MQ 105 588 0 22 Apr 2020
A Data and Compute Efficient Design for Limited-Resources Deep Learning Mirgahney Mohamed Gabriele Cesa Taco S. Cohen Max Welling MedIm 93 18 0 21 Apr 2020
LSQ+: Improving low-bit quantization through learnable offsets and better initialization Yash Bhalgat Jinwon Lee Markus Nagel Tijmen Blankevoort Nojun Kwak MQ 65 223 0 20 Apr 2020
Generative Low-bitwidth Data Free Quantization Shoukai Xu Haokun Li Bohan Zhuang Jing Liu Jingyun Liang Chuangrun Liang Mingkui Tan MQ 77 127 0 07 Mar 2020
Dreaming to Distill: Data-free Knowledge Transfer via DeepInversion Hongxu Yin Pavlo Molchanov Zhizhong Li J. Álvarez Arun Mallya Derek Hoiem N. Jha Jan Kautz 127 569 0 18 Dec 2019
The Knowledge Within: Methods for Data-Free Model Compression Matan Haroush Itay Hubara Elad Hoffer Daniel Soudry 65 109 0 03 Dec 2019
HAWQ-V2: Hessian Aware trace-Weighted Quantization of Neural Networks Zhen Dong Z. Yao Yaohui Cai Daiyaan Arfeen A. Gholami Michael W. Mahoney Kurt Keutzer MQ 97 284 0 10 Nov 2019
OverQ: Opportunistic Outlier Quantization for Neural Network Accelerators Ritchie Zhao Jordan Dotzel Zhanqiu Hu Preslav Ivanov Christopher De Sa Zhiru Zhang MQ 34 1 0 13 Oct 2019
ArcFace: Additive Angular Margin Loss for Deep Face Recognition Jiankang Deng Jiaxin Guo J. Yang Niannan Xue I. Kotsia Stefanos Zafeiriou CVBM 94 220 0 23 Jan 2018