DoReFa-Net: Training Low Bitwidth Convolutional Neural Networks with Low Bitwidth Gradients

20 June 2016

Shuchang Zhou

Papers citing "DoReFa-Net: Training Low Bitwidth Convolutional Neural Networks with Low Bitwidth Gradients"

50 / 444 papers shown

Title
Q-Diffusion: Quantizing Diffusion Models Xiuyu Li Yijia Liu Long Lian Hua Yang Zhen Dong Daniel Kang Shanghang Zhang Kurt Keutzer DiffM MQ 55 157 0 08 Feb 2023
Revisiting Offline Compression: Going Beyond Factorization-based Methods for Transformer Language Models Mohammadreza Banaei Klaudia Bałazy Artur Kasymov R. Lebret Jacek Tabor Karl Aberer OffRL 21 0 0 08 Feb 2023
Learning Discretized Neural Networks under Ricci Flow Jun Chen Han Chen Mengmeng Wang Guang Dai Ivor W. Tsang Yang Liu 38 2 0 07 Feb 2023
Oscillation-free Quantization for Low-bit Vision Transformers Shi Liu Zechun Liu Kwang-Ting Cheng MQ 26 35 0 04 Feb 2023
A Survey on Efficient Training of Transformers Bohan Zhuang Jing Liu Zizheng Pan Haoyu He Yuetian Weng Chunhua Shen 36 47 0 02 Feb 2023
Resilient Binary Neural Network Sheng Xu Yanjing Li Teli Ma Mingbao Lin Hao Dong Baochang Zhang Penglei Gao Jinhu Lv MQ OOD 55 16 0 02 Feb 2023
Efficient and Effective Methods for Mixed Precision Neural Network Quantization for Faster, Energy-efficient Inference Deepika Bablani J. McKinstry S. K. Esser R. Appuswamy D. Modha MQ 28 4 0 30 Jan 2023
BiBench: Benchmarking and Analyzing Network Binarization Haotong Qin Mingyuan Zhang Yifu Ding Aoyu Li Zhongang Cai Ziwei Liu Feng Yu Xianglong Liu MQ AAML 49 37 0 26 Jan 2023
PowerQuant: Automorphism Search for Non-Uniform Quantization Edouard Yvinec Arnaud Dapogny Matthieu Cord Kévin Bailly MQ 28 15 0 24 Jan 2023
Enabling Hard Constraints in Differentiable Neural Network and Accelerator Co-Exploration Deokki Hong Kanghyun Choi Hyeyoon Lee Joonsang Yu Noseong Park Youngsok Kim Jinho Lee 21 3 0 23 Jan 2023
RedBit: An End-to-End Flexible Framework for Evaluating the Accuracy of Quantized CNNs A. M. Ribeiro-dos-Santos João Dinis Ferreira O. Mutlu G. Falcão MQ 23 1 0 15 Jan 2023
Guided Hybrid Quantization for Object detection in Multimodal Remote Sensing Imagery via One-to-one Self-teaching Jiaqing Zhang Jie Lei Weiying Xie Yunsong Li Wenxuan Wang MQ 32 19 0 31 Dec 2022
Deep Hierarchy Quantization Compression algorithm based on Dynamic Sampling W. Jiang Gang Liu Xiaofeng Chen Yipeng Zhou FedML 24 0 0 30 Dec 2022
BiMLP: Compact Binary Architectures for Vision Multi-Layer Perceptrons Yixing Xu Xinghao Chen Yunhe Wang MQ 29 8 0 29 Dec 2022
Hyperspherical Quantization: Toward Smaller and More Accurate Models Dan Liu X. Chen Chen Ma Xue Liu MQ 35 3 0 24 Dec 2022
Redistribution of Weights and Activations for AdderNet Quantization Ying Nie Kai Han Haikang Diao Chuanjian Liu Enhua Wu Yunhe Wang MQ 58 6 0 20 Dec 2022
Atrous Space Bender U-Net (ASBU-Net/LogiNet) Anurag Bansal O. Ostap Miguel Maestre Trueba Kristopher Perry SSeg 21 0 0 16 Dec 2022
RepQ-ViT: Scale Reparameterization for Post-Training Quantization of Vision Transformers Zhikai Li Junrui Xiao Lianwei Yang Qingyi Gu MQ 31 82 0 16 Dec 2022
Towards Hardware-Specific Automatic Compression of Neural Networks Torben Krieger Bernhard Klein Holger Fröning MQ 32 2 0 15 Dec 2022
PD-Quant: Post-Training Quantization based on Prediction Difference Metric Jiawei Liu Lin Niu Zhihang Yuan Dawei Yang Xinggang Wang Wenyu Liu MQ 106 70 0 14 Dec 2022
Vertical Layering of Quantized Neural Networks for Heterogeneous Inference Hai Wu Ruifei He Hao Hao Tan Xiaojuan Qi Kaibin Huang MQ 40 2 0 10 Dec 2022
CSQ: Growing Mixed-Precision Quantization Scheme with Bi-level Continuous Sparsification Lirui Xiao Huanrui Yang Zhen Dong Kurt Keutzer Li Du Shanghang Zhang MQ 29 10 0 06 Dec 2022
Boosted Dynamic Neural Networks Haichao Yu Haoxiang Li G. Hua Gao Huang Humphrey Shi 35 7 0 30 Nov 2022
NoisyQuant: Noisy Bias-Enhanced Post-Training Activation Quantization for Vision Transformers Yijiang Liu Huanrui Yang Zhen Dong Kurt Keutzer Li Du Shanghang Zhang MQ 33 47 0 29 Nov 2022
BiViT: Extremely Compressed Binary Vision Transformer Yefei He Zhenyu Lou Luoming Zhang Jing Liu Weijia Wu Hong Zhou Bohan Zhuang ViT MQ 31 28 0 14 Nov 2022
BiFSMNv2: Pushing Binary Neural Networks for Keyword Spotting to Real-Network Performance Haotong Qin Xudong Ma Yifu Ding Xiaochen Li Yang Zhang Zejun Ma Jiakai Wang Jie Luo Xianglong Liu MQ 42 21 0 13 Nov 2022
NEON: Enabling Efficient Support for Nonlinear Operations in Resistive RAM-based Neural Network Accelerators Aditya Manglik Minesh Patel Haiyu Mao Behzad Salami Jisung Park Lois Orosa O. Mutlu 20 1 0 10 Nov 2022
AskewSGD : An Annealed interval-constrained Optimisation method to train Quantized Neural Networks Louis Leconte S. Schechtman Eric Moulines 34 4 0 07 Nov 2022
Efficient Spatially Sparse Inference for Conditional GANs and Diffusion Models Zhekai Zhang Ji Lin Chenlin Meng Stefano Ermon Song Han Jun-Yan Zhu DiffM 45 45 0 03 Nov 2022
Defending with Errors: Approximate Computing for Robustness of Deep Neural Networks Amira Guesmi Ihsen Alouani Khaled N. Khasawneh M. Baklouti T. Frikha Mohamed Abid Nael B. Abu-Ghazaleh AAML OOD 30 2 0 02 Nov 2022
Block-Wise Dynamic-Precision Neural Network Training Acceleration via Online Quantization Sensitivity Analytics Ruoyang Liu Chenhan Wei Yixiong Yang Wenxun Wang Huazhong Yang Yongpan Liu MQ 35 3 0 31 Oct 2022
Collaborative Multi-Teacher Knowledge Distillation for Learning Low Bit-width Deep Neural Networks Cuong Pham Tuan Hoang Thanh-Toan Do FedML MQ 45 14 0 27 Oct 2022
Weight Fixing Networks Christopher Subia-Waud S. Dasmahapatra MQ 32 2 0 24 Oct 2022
Approximating Continuous Convolutions for Deep Network Compression Theo W. Costain V. Prisacariu 38 0 0 17 Oct 2022
IDa-Det: An Information Discrepancy-aware Distillation for 1-bit Detectors Sheng Xu Yanjing Li Bo-Wen Zeng Teli Ma Baochang Zhang Xianbin Cao Penglei Gao Jinhu Lv 30 15 0 07 Oct 2022
Convolutional Neural Networks Quantization with Attention Binyi Wu Bernd Waschneck Christian Mayr MQ 26 1 0 30 Sep 2022
PIM-QAT: Neural Network Quantization for Processing-In-Memory (PIM) Systems Qing Jin Zhiyu Chen J. Ren Yanyu Li Yanzhi Wang Kai-Min Yang MQ 23 2 0 18 Sep 2022
FP8 Formats for Deep Learning Paulius Micikevicius Dusan Stosic N. Burgess Marius Cornea Pradeep Dubey ... Naveen Mellempudi S. Oberman Mohammad Shoeybi Michael Siu Hao Wu BDL VLM MQ 77 126 0 12 Sep 2022
How important are activation functions in regression and classification? A survey, performance comparison, and future directions Ameya Dilip Jagtap George Karniadakis AI4CE 45 71 0 06 Sep 2022
Recurrent Bilinear Optimization for Binary Neural Networks Sheng Xu Yanjing Li Tian Wang Teli Ma Baochang Zhang Peng Gao Yu Qiao Jinhu Lv Guodong Guo MQ 27 14 0 04 Sep 2022
ANT: Exploiting Adaptive Numerical Data Type for Low-bit Deep Neural Network Quantization Cong Guo Chen Zhang Jingwen Leng Zihan Liu Fan Yang Yun-Bo Liu Minyi Guo Yuhao Zhu MQ 20 58 0 30 Aug 2022
FP8 Quantization: The Power of the Exponent Andrey Kuzmin M. V. Baalen Yuwei Ren Markus Nagel Jorn W. T. Peters Tijmen Blankevoort MQ 27 82 0 19 Aug 2022
A Scalable, Interpretable, Verifiable & Differentiable Logic Gate Convolutional Neural Network Architecture From Truth Tables Adrien Benamira Tristan Guérand Thomas Peyrin Trevor Yap Bryan Hooi 42 1 0 18 Aug 2022
AdaBin: Improving Binary Neural Networks with Adaptive Binary Sets Zhaopeng Tu Xinghao Chen Pengju Ren Yunhe Wang MQ 38 54 0 17 Aug 2022
Mixed-Precision Neural Networks: A Survey M. Rakka M. Fouda Pramod P. Khargonekar Fadi J. Kurdahi MQ 32 11 0 11 Aug 2022
Auto-ViT-Acc: An FPGA-Aware Automatic Acceleration Framework for Vision Transformer with Mixed-Scheme Quantization Zechao Li Mengshu Sun Alec Lu Haoyu Ma Geng Yuan ... Yanyu Li M. Leeser Zhangyang Wang Xue Lin Zhenman Fang ViT MQ 28 52 0 10 Aug 2022
Symmetry Regularization and Saturating Nonlinearity for Robust Quantization Sein Park Yeongsang Jang Eunhyeok Park MQ 29 2 0 31 Jul 2022
CADyQ: Content-Aware Dynamic Quantization for Image Super-Resolution Chee Hong Sungyong Baik Heewon Kim Seungjun Nah Kyoung Mu Lee SupR MQ 36 32 0 21 Jul 2022
Quantized Training of Gradient Boosting Decision Trees Yu Shi Guolin Ke Zhuoming Chen Shuxin Zheng Tie-Yan Liu MQ AI4CE 21 18 0 20 Jul 2022
Green, Quantized Federated Learning over Wireless Networks: An Energy-Efficient Design Minsu Kim Walid Saad Mohammad Mozaffari Merouane Debbah FedML MQ 36 28 0 19 Jul 2022