v1v2v3 (latest)

HAQ: Hardware-Aware Automated Quantization with Mixed Precision

21 November 2018

Zhijian Liu

Song Han

Papers citing "HAQ: Hardware-Aware Automated Quantization with Mixed Precision"

36 / 436 papers shown

Title
Fractional Skipping: Towards Finer-Grained Dynamic CNN Inference Jianghao Shen Y. Fu Yue Wang Pengfei Xu Zhangyang Wang Yingyan Lin MQ 60 45 0 03 Jan 2020
Mixed-Precision Quantized Neural Network with Progressively Decreasing Bitwidth For Image Classification and Object Detection Tianshu Chu Qin Luo Jie Yang Xiaolin Huang MQ 40 6 0 29 Dec 2019
Towards Unified INT8 Training for Convolutional Neural Network Feng Zhu Ruihao Gong F. Yu Xianglong Liu Yanfei Wang Zhelong Li Xiuqi Yang Junjie Yan MQ 97 152 0 29 Dec 2019
Towards Efficient Training for Neural Network Quantization Qing Jin Linjie Yang Zhenyu A. Liao MQ 110 42 0 21 Dec 2019
AdaBits: Neural Network Quantization with Adaptive Bit-Widths Qing Jin Linjie Yang Zhenyu A. Liao MQ 93 124 0 20 Dec 2019
Dreaming to Distill: Data-free Knowledge Transfer via DeepInversion Hongxu Yin Pavlo Molchanov Zhizhong Li J. Álvarez Arun Mallya Derek Hoiem N. Jha Jan Kautz 144 569 0 18 Dec 2019
Dynamic Convolution: Attention over Convolution Kernels Yinpeng Chen Xiyang Dai Mengchen Liu Dongdong Chen Lu Yuan Zicheng Liu 146 899 0 07 Dec 2019
Deep Model Compression Via Two-Stage Deep Reinforcement Learning Huixin Zhan Wei-Ming Lin Yongcan Cao 52 12 0 04 Dec 2019
Semi-Relaxed Quantization with DropBits: Training Low-Bit Neural Networks via Bit-wise Regularization J. H. Lee Jihun Yun Sung Ju Hwang Eunho Yang MQ 22 0 0 29 Nov 2019
QKD: Quantization-aware Knowledge Distillation Jangho Kim Yash Bhalgat Jinwon Lee Chirag I. Patel Nojun Kwak MQ 100 66 0 28 Nov 2019
Domain-Aware Dynamic Networks Tianyuan Zhang Bichen Wu Xin Wang Joseph E. Gonzalez Kurt Keutzer 79 6 0 26 Nov 2019
Any-Precision Deep Neural Networks Haichao Yu Haoxiang Li Humphrey Shi Thomas S. Huang G. Hua MQ 93 65 0 17 Nov 2019
Ternary MobileNets via Per-Layer Hybrid Filter Banks Dibakar Gope Jesse G. Beu Urmish Thakker Matthew Mattina MQ 69 15 0 04 Nov 2019
Comprehensive SNN Compression Using ADMM Optimization and Activity Regularization Lei Deng Yujie Wu Yifan Hu Ling Liang Guoqi Li Xing Hu Yufei Ding Peng Li Yuan Xie 78 85 0 03 Nov 2019
Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers Xishan Zhang Shaoli Liu Rui Zhang Chang-Shu Liu Di Huang ... Jiaming Guo Yu Kang Qi Guo Zidong Du Yunji Chen MQ 56 7 0 01 Nov 2019
Training DNN IoT Applications for Deployment On Analog NVM Crossbars F. García-Redondo Shidhartha Das G. Rosendale 47 5 0 30 Oct 2019
Depth-wise Decomposition for Accelerating Separable Convolutions in Efficient Convolutional Neural Networks Yihui He Jianing Qian Jianren Wang Cindy X. Le Congrui Hetang Qi Lyu Wenping Wang Tianwei Yue 99 11 0 21 Oct 2019
Automatic Neural Network Compression by Sparsity-Quantization Joint Learning: A Constrained Optimization-based Approach Haichuan Yang Shupeng Gui Yuhao Zhu Ji Liu MQ 71 5 0 14 Oct 2019
Forward and Backward Information Retention for Accurate Binary Neural Networks Haotong Qin Ruihao Gong Xianglong Liu Mingzhu Shen Ziran Wei F. Yu Jingkuan Song MQ 220 332 0 24 Sep 2019
Structured Binary Neural Networks for Image Recognition Bohan Zhuang Chunhua Shen Mingkui Tan Peng Chen Lingqiao Liu Ian Reid MQ 135 19 0 22 Sep 2019
PULP-NN: Accelerating Quantized Neural Networks on Parallel Ultra-Low-Power RISC-V Processors Angelo Garofalo Manuele Rusci Francesco Conti D. Rossi Luca Benini MQ 66 137 0 29 Aug 2019
Differentiable Soft Quantization: Bridging Full-Precision and Low-Bit Neural Networks Ruihao Gong Xianglong Liu Shenghu Jiang Tian-Hao Li Peng Hu Jiazhen Lin F. Yu Junjie Yan MQ 99 460 0 14 Aug 2019
GDRQ: Group-based Distribution Reshaping for Quantization Haibao Yu Tuopu Wen Guangliang Cheng Jiankai Sun Qi Han Jianping Shi MQ 57 3 0 05 Aug 2019
And the Bit Goes Down: Revisiting the Quantization of Neural Networks Pierre Stock Armand Joulin Rémi Gribonval Benjamin Graham Hervé Jégou MQ 120 149 0 12 Jul 2019
Point-Voxel CNN for Efficient 3D Deep Learning Zhijian Liu Haotian Tang Chengyue Wu Song Han 3DPC 167 677 0 08 Jul 2019
Hardware/Software Co-Exploration of Neural Architectures Weiwen Jiang Lei Yang E. Sha Qingfeng Zhuge Shouzhen Gu Sakyasingha Dasgupta Yiyu Shi Jiaxi Hu 104 132 0 06 Jul 2019
Memory-Driven Mixed Low Precision Quantization For Enabling Deep Network Inference On Microcontrollers Manuele Rusci Alessandro Capotondi Luca Benini MQ 97 75 0 30 May 2019
Instant Quantization of Neural Networks using Monte Carlo Methods Gonçalo Mordido Matthijs Van Keirsbilck A. Keller MQ 39 9 0 29 May 2019
Approximate LSTMs for Time-Constrained Inference: Enabling Fast Reaction in Self-Driving Cars Alexandros Kouris Stylianos I. Venieris Michail Rizakis C. Bouganis AI4TS 44 12 0 02 May 2019
Low-Memory Neural Network Training: A Technical Report N. Sohoni Christopher R. Aberger Megan Leszczynski Jian Zhang Christopher Ré 92 103 0 24 Apr 2019
Design Automation for Efficient Deep Learning Computing Song Han Han Cai Ligeng Zhu Ji Lin Kuan-Chieh Wang Zhijian Liu Chengyue Wu 83 20 0 24 Apr 2019
Resource Constrained Neural Network Architecture Search: Will a Submodularity Assumption Help? Yunyang Xiong Ronak R. Mehta Vikas Singh 99 33 0 08 Apr 2019
AutoQ: Automated Kernel-Wise Neural Network Quantization Qian Lou Feng Guo Lantao Liu Minje Kim Lei Jiang MQ 105 98 0 15 Feb 2019
TSM: Temporal Shift Module for Efficient Video Understanding Ji Lin Chuang Gan Song Han 108 1,698 0 20 Nov 2018
ReLeQ: A Reinforcement Learning Approach for Deep Quantization of Neural Networks Ahmed T. Elthakeb Prannoy Pilligundla Fatemehsadat Mireshghallah Amir Yazdanbakhsh H. Esmaeilzadeh MQ 146 68 0 05 Nov 2018
A Survey of Model Compression and Acceleration for Deep Neural Networks Yu Cheng Duo Wang Pan Zhou Zhang Tao 162 1,101 0 23 Oct 2017