A White Paper on Neural Network Quantization

A White Paper on Neural Network Quantization

15 June 2021

Marios Fournarakis

Yelysei Bondarenko

Tijmen Blankevoort

ArXiv (abs)PDF HTML

Papers citing "A White Paper on Neural Network Quantization"

14 / 264 papers shown

Title
Overcoming Oscillations in Quantization-Aware Training Markus Nagel Marios Fournarakis Yelysei Bondarenko Tijmen Blankevoort MQ 192 108 0 21 Mar 2022
TinyMLOps: Operational Challenges for Widespread Edge AI Adoption Sam Leroux Pieter Simoens Meelis Lootus Kartik Thakore Akshay Sharma 72 16 0 21 Mar 2022
An Empirical Study of Low Precision Quantization for TinyML Shaojie Zhuo Hongyu Chen R. Ramakrishnan Tommy Chen Chen Feng Yi-Rung Lin Parker Zhang Liang Shen MQ 114 13 0 10 Mar 2022
Post-Training Quantization for Cross-Platform Learned Image Compression Dailan He Zi Yang Yuan-Hsin Chen Qi Zhang Hongwei Qin Yan Wang MQ 79 13 0 15 Feb 2022
F8Net: Fixed-Point 8-bit Only Multiplication for Network Quantization Qing Jin Jian Ren Richard Zhuang Sumant Hanumante Zhengang Li Zhiyu Chen Yanzhi Wang Kai-Min Yang Sergey Tulyakov MQ 97 50 0 10 Feb 2022
Few-Bit Backward: Quantized Gradients of Activation Functions for Memory Footprint Reduction Georgii Sergeevich Novikov Daniel Bershatsky Julia Gusak Alex Shonenkov Denis Dimitrov Ivan Oseledets MQ 79 17 0 01 Feb 2022
SPDY: Accurate Pruning with Speedup Guarantees Elias Frantar Dan Alistarh 79 37 0 31 Jan 2022
Implicit Neural Video Compression Yunfan Zhang T. V. Rozendaal Johann Brehmer Markus Nagel Taco S. Cohen 103 58 0 21 Dec 2021
Accurate Neural Training with 4-bit Matrix Multiplications at Standard Formats Brian Chmiel Ron Banner Elad Hoffer Hilla Ben Yaacov Daniel Soudry MQ 74 24 0 19 Dec 2021
Instance-Adaptive Video Compression: Improving Neural Codecs by Training on the Test Set T. V. Rozendaal Johann Brehmer Yunfan Zhang Reza Pourreza Auke Wiggers Taco S. Cohen 98 24 0 19 Nov 2021
An Underexplored Dilemma between Confidence and Calibration in Quantized Neural Networks Guoxuan Xia Sangwon Ha Tiago Azevedo Partha P. Maji UQCV 36 1 0 10 Nov 2021
Understanding and Overcoming the Challenges of Efficient Transformer Quantization Yelysei Bondarenko Markus Nagel Tijmen Blankevoort MQ 83 146 0 27 Sep 2021
HPTQ: Hardware-Friendly Post Training Quantization H. Habi Reuven Peretz Elad Cohen Lior Dikstein Oranit Dror I. Diamant Roy H. Jennings Arnon Netzer MQ 80 9 0 19 Sep 2021
DAQ: Channel-Wise Distribution-Aware Quantization for Deep Image Super-Resolution Networks Chee Hong Heewon Kim Sungyong Baik Junghun Oh Kyoung Mu Lee OOD SupR MQ 97 41 0 21 Dec 2020