CAT: Compression-Aware Training for bandwidth reduction

25 September 2019

Chaim Baskin

Brian Chmiel

Evgenii Zheltonozhskii

Papers citing "CAT: Compression-Aware Training for bandwidth reduction"

21 / 21 papers shown

Title
Towards Efficient Training for Neural Network Quantization Qing Jin Linjie Yang Zhenyu A. Liao MQ 93 42 0 21 Dec 2019
Quantization Networks Jiwei Yang Xu Shen Jun Xing Xinmei Tian Houqiang Li Bing Deng Jianqiang Huang Xiansheng Hua MQ 72 347 0 21 Nov 2019
Differentiable Soft Quantization: Bridging Full-Precision and Low-Bit Neural Networks Ruihao Gong Xianglong Liu Shenghu Jiang Tian-Hao Li Peng Hu Jiazhen Lin F. Yu Junjie Yan MQ 67 458 0 14 Aug 2019
Sparse Networks from Scratch: Faster Training without Losing Performance Tim Dettmers Luke Zettlemoyer 139 340 0 10 Jul 2019
Importance Estimation for Neural Network Pruning Pavlo Molchanov Arun Mallya Stephen Tyree I. Frosio Jan Kautz 3DPC 78 882 0 25 Jun 2019
Feature Map Transform Coding for Energy-Efficient CNN Inference Brian Chmiel Chaim Baskin Ron Banner Evgenii Zheltonozhskii Yevgeny Yermolin Alex Karbachevsky A. Bronstein A. Mendelson 74 25 0 26 May 2019
Compressibility Loss for Neural Network Weights Çağlar Aytekin Francesco Cricri Emre B. Aksu 22 11 0 03 May 2019
SWALP : Stochastic Weight Averaging in Low-Precision Training Guandao Yang Tianyi Zhang Polina Kirichenko Junwen Bai A. Wilson Christopher De Sa 59 97 0 26 Apr 2019
The State of Sparsity in Deep Neural Networks Trevor Gale Erich Elsen Sara Hooker 161 758 0 25 Feb 2019
DNNVM : End-to-End Compiler Leveraging Heterogeneous Optimizations on FPGA-based CNN Accelerators Yu Xing Shuang Liang Lingzhi Sui Xijie Jia Jiantao Qiu Xin Liu Yushun Wang Yu Wang Yi Shan 63 69 0 20 Feb 2019
NICE: Noise Injection and Clamping Estimation for Neural Network Quantization Chaim Baskin Natan Liss Yoav Chai Evgenii Zheltonozhskii Eli Schwartz Raja Giryes A. Mendelson A. Bronstein MQ 73 62 0 29 Sep 2018
LQ-Nets: Learned Quantization for Highly Accurate and Compact Deep Neural Networks Dongqing Zhang Jiaolong Yang Dongqiangzi Ye G. Hua MQ 62 703 0 26 Jul 2018
Neural Network Acceptability Judgments Alex Warstadt Amanpreet Singh Samuel R. Bowman 230 1,407 0 31 May 2018
PACT: Parameterized Clipping Activation for Quantized Neural Networks Jungwook Choi Zhuo Wang Swagath Venkataramani P. Chuang Vijayalakshmi Srinivasan K. Gopalakrishnan MQ 62 953 0 16 May 2018
WRPN: Wide Reduced-Precision Networks Asit K. Mishra Eriko Nurvitadhi Jeffrey J. Cook Debbie Marr MQ 78 267 0 04 Sep 2017
A Broad-Coverage Challenge Corpus for Sentence Understanding through Inference Adina Williams Nikita Nangia Samuel R. Bowman 520 4,479 0 18 Apr 2017
In-Datacenter Performance Analysis of a Tensor Processing Unit N. Jouppi C. Young Nishant Patil David Patterson Gaurav Agrawal ... Vijay Vasudevan Richard Walter Walter Wang Eric Wilcox Doe Hyun Yoon 235 4,635 0 16 Apr 2017
Categorical Reparameterization with Gumbel-Softmax Eric Jang S. Gu Ben Poole BDL 334 5,364 0 03 Nov 2016
Pruning Filters for Efficient ConvNets Hao Li Asim Kadav Igor Durdanovic H. Samet H. Graf 3DPC 193 3,697 0 31 Aug 2016
XNOR-Net: ImageNet Classification Using Binary Convolutional Neural Networks Mohammad Rastegari Vicente Ordonez Joseph Redmon Ali Farhadi MQ 170 4,357 0 16 Mar 2016
Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding Song Han Huizi Mao W. Dally 3DGS 257 8,842 0 01 Oct 2015