LSQ+: Improving low-bit quantization through learnable offsets and better initialization

20 April 2020

Papers citing "LSQ+: Improving low-bit quantization through learnable offsets and better initialization"

36 / 36 papers shown

Title
Quartet: Native FP4 Training Can Be Optimal for Large Language Models Roberto L. Castro Andrei Panferov Soroush Tabesh Oliver Sieberling Jiale Chen Mahdi Nikdan Saleh Ashkboos Dan Alistarh MQ 37 0 0 20 May 2025
RGB-Event Fusion with Self-Attention for Collision Prediction Pietro Bonazzi Christian Vogt Michael Jost Haotong Qin Lyes Khacef Federico Paredes-Valles Michele Magno 51 0 0 07 May 2025
Dedicated Inference Engine and Binary-Weight Neural Networks for Lightweight Instance Segmentation Tse-Wei Chen Wei Tao Dongyue Zhao Kazuhiro Mima Tadayuki Ito Kinya Osa Masami Kato MQ 101 0 0 03 Jan 2025
PTQ4VM: Post-Training Quantization for Visual Mamba Younghyun Cho Changhun Lee Seonggon Kim Eunhyeok Park MQ Mamba 84 2 0 29 Dec 2024
On the Impact of White-box Deployment Strategies for Edge AI on Latency and Model Performance Jaskirat Singh Bram Adams Ahmed E. Hassan VLM 69 0 0 01 Nov 2024
Data Generation for Hardware-Friendly Post-Training Quantization Lior Dikstein Ariel Lapid Arnon Netzer H. Habi MQ 381 0 0 29 Oct 2024
2-in-1 Accelerator: Enabling Random Precision Switch for Winning Both Adversarial Robustness and Efficiency Yonggan Fu Yang Zhao Qixuan Yu Chaojian Li Yingyan Lin AAML 70 14 0 11 Sep 2021
ZeroQ: A Novel Zero Shot Quantization Framework Yaohui Cai Z. Yao Zhen Dong A. Gholami Michael W. Mahoney Kurt Keutzer MQ 60 393 0 01 Jan 2020
QKD: Quantization-aware Knowledge Distillation Jangho Kim Yash Bhalgat Jinwon Lee Chirag I. Patel Nojun Kwak MQ 73 64 0 28 Nov 2019
Differentiable Soft Quantization: Bridging Full-Precision and Low-Bit Neural Networks Ruihao Gong Xianglong Liu Shenghu Jiang Tian-Hao Li Peng Hu Jiazhen Lin F. Yu Junjie Yan MQ 51 449 0 14 Aug 2019
MixConv: Mixed Depthwise Convolutional Kernels Mingxing Tan Quoc V. Le 50 377 0 22 Jul 2019
Data-Free Quantization Through Weight Equalization and Bias Correction Markus Nagel M. V. Baalen Tijmen Blankevoort Max Welling MQ 36 505 0 11 Jun 2019
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks Mingxing Tan Quoc V. Le 3DV MedIm 121 17,950 0 28 May 2019
Searching for MobileNetV3 Andrew G. Howard Mark Sandler Grace Chu Liang-Chieh Chen Bo Chen ... Yukun Zhu Ruoming Pang Vijay Vasudevan Quoc V. Le Hartwig Adam 269 6,685 0 06 May 2019
Trained Quantization Thresholds for Accurate and Efficient Fixed-Point Inference of Deep Neural Networks Sambhav R. Jain Albert Gural Michael Wu Chris Dick MQ 58 151 0 19 Mar 2019
Learned Step Size Quantization S. K. Esser J. McKinstry Deepika Bablani R. Appuswamy D. Modha MQ 55 792 0 21 Feb 2019
Low-bit Quantization of Neural Networks for Efficient Inference Yoni Choukroun Eli Kravchik Fan Yang P. Kisilev MQ 47 359 0 18 Feb 2019
Improving Neural Network Quantization without Retraining using Outlier Channel Splitting Ritchie Zhao Yuwei Hu Jordan Dotzel Christopher De Sa Zhiru Zhang OODD MQ 75 307 0 28 Jan 2019
HAQ: Hardware-Aware Automated Quantization with Mixed Precision Kuan-Chieh Wang Zhijian Liu Chengyue Wu Ji Lin Song Han MQ 99 876 0 21 Nov 2018
Relaxed Quantization for Discretized Neural Networks Christos Louizos M. Reisser Tijmen Blankevoort E. Gavves Max Welling MQ 57 132 0 03 Oct 2018
Learning to Quantize Deep Networks by Optimizing Quantization Intervals with Task Loss S. Jung Changyong Son Seohyung Lee JinWoo Son Youngjun Kwak Jae-Joon Han Sung Ju Hwang Changkyu Choi MQ 41 373 0 17 Aug 2018
Quantizing deep convolutional networks for efficient inference: A whitepaper Raghuraman Krishnamoorthi MQ 103 1,009 0 21 Jun 2018
PACT: Parameterized Clipping Activation for Quantized Neural Networks Jungwook Choi Zhuo Wang Swagath Venkataramani P. Chuang Vijayalakshmi Srinivasan K. Gopalakrishnan MQ 49 945 0 16 May 2018
Model compression via distillation and quantization A. Polino Razvan Pascanu Dan Alistarh MQ 67 722 0 15 Feb 2018
Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference Benoit Jacob S. Kligys Bo Chen Menglong Zhu Matthew Tang Andrew G. Howard Hartwig Adam Dmitry Kalenichenko MQ 124 3,090 0 15 Dec 2017
Apprentice: Using Knowledge Distillation Techniques To Improve Low-Precision Network Accuracy Asit K. Mishra Debbie Marr FedML 60 330 0 15 Nov 2017
Searching for Activation Functions Prajit Ramachandran Barret Zoph Quoc V. Le 55 602 0 16 Oct 2017
Fixed-point optimization of deep neural networks with adaptive step size retraining Sungho Shin Yoonho Boo Wonyong Sung MQ 71 34 0 27 Feb 2017
Soft Weight-Sharing for Neural Network Compression Karen Ullrich Edward Meeds Max Welling 112 416 0 13 Feb 2017
Identity Mappings in Deep Residual Networks Kaiming He Xinming Zhang Shaoqing Ren Jian Sun 288 10,149 0 16 Mar 2016
Convolutional Neural Networks using Logarithmic Data Representation Daisuke Miyashita Edward H. Lee B. Murmann MQ 53 427 0 03 Mar 2016
Resiliency of Deep Neural Networks under Quantization Wonyong Sung Sungho Shin Kyuyeon Hwang MQ 39 157 0 20 Nov 2015
Deep Learning with Limited Numerical Precision Suyog Gupta A. Agrawal K. Gopalakrishnan P. Narayanan HAI 134 2,043 0 09 Feb 2015
ImageNet Large Scale Visual Recognition Challenge Olga Russakovsky Jia Deng Hao Su J. Krause S. Satheesh ... A. Karpathy A. Khosla Michael S. Bernstein Alexander C. Berg Li Fei-Fei VLM ObjD 1.1K 39,383 0 01 Sep 2014
Estimating or Propagating Gradients Through Stochastic Neurons for Conditional Computation Yoshua Bengio Nicholas Léonard Aaron Courville 312 3,099 0 15 Aug 2013
Estimating or Propagating Gradients Through Stochastic Neurons Yoshua Bengio 84 110 0 14 May 2013