Adaptive quantization with mixed-precision based on low-cost proxy

Adaptive quantization with mixed-precision based on low-cost proxy

27 February 2024

Papers citing "Adaptive quantization with mixed-precision based on low-cost proxy"

13 / 13 papers shown

Title
CABM: Content-Aware Bit Mapping for Single Image Super-Resolution Network with Large Input Senmao Tian Ming Lu Jiaming Liu Yandong Guo Yurong Chen Shunli Zhang SupR MQ 42 11 0 13 Apr 2023
A White Paper on Neural Network Quantization Markus Nagel Marios Fournarakis Rana Ali Amjad Yelysei Bondarenko M. V. Baalen Tijmen Blankevoort MQ 72 539 0 15 Jun 2021
One Weight Bitwidth to Rule Them All Ting-Wu Chin P. Chuang Vikas Chandra Diana Marculescu MQ 49 25 0 22 Aug 2020
Bayesian Bits: Unifying Quantization and Pruning M. V. Baalen Christos Louizos Markus Nagel Rana Ali Amjad Ying Wang Tijmen Blankevoort Max Welling MQ 56 114 0 14 May 2020
LSQ+: Improving low-bit quantization through learnable offsets and better initialization Yash Bhalgat Jinwon Lee Markus Nagel Tijmen Blankevoort Nojun Kwak MQ 62 220 0 20 Apr 2020
HAWQ-V2: Hessian Aware trace-Weighted Quantization of Neural Networks Zhen Dong Z. Yao Yaohui Cai Daiyaan Arfeen A. Gholami Michael W. Mahoney Kurt Keutzer MQ 79 279 0 10 Nov 2019
HAWQ: Hessian AWare Quantization of Neural Networks with Mixed-Precision Zhen Dong Z. Yao A. Gholami Michael W. Mahoney Kurt Keutzer MQ 77 526 0 29 Apr 2019
Mixed Precision Quantization of ConvNets via Differentiable Neural Architecture Search Bichen Wu Yanghan Wang Peizhao Zhang Yuandong Tian Peter Vajda Kurt Keutzer MQ 66 273 0 30 Nov 2018
HAQ: Hardware-Aware Automated Quantization with Mixed Precision Kuan-Chieh Wang Zhijian Liu Chengyue Wu Ji Lin Song Han MQ 121 881 0 21 Nov 2018
Quantizing deep convolutional networks for efficient inference: A whitepaper Raghuraman Krishnamoorthi MQ 131 1,015 0 21 Jun 2018
Model compression via distillation and quantization A. Polino Razvan Pascanu Dan Alistarh MQ 81 731 0 15 Feb 2018
Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference Benoit Jacob S. Kligys Bo Chen Menglong Zhu Matthew Tang Andrew G. Howard Hartwig Adam Dmitry Kalenichenko MQ 145 3,121 0 15 Dec 2017
Distilling the Knowledge in a Neural Network Geoffrey E. Hinton Oriol Vinyals J. Dean FedML 340 19,634 0 09 Mar 2015