v1v2 (latest)

SmartDeal: Re-Modeling Deep Network Weights for Efficient Inference and Training

4 January 2021

Yue Wang

Papers citing "SmartDeal: Re-Modeling Deep Network Weights for Efficient Inference and Training"

28 / 28 papers shown

Title
FracTrain: Fractionally Squeezing Bit Savings Both Temporally and Spatially for Efficient DNN Training Y. Fu Haoran You Yang Zhao Yue Wang Chaojian Li K. Gopalakrishnan Zhangyang Wang Yingyan Lin MQ 66 32 0 24 Dec 2020
The Lottery Tickets Hypothesis for Supervised and Self-supervised Pre-training in Computer Vision Models Tianlong Chen Jonathan Frankle Shiyu Chang Sijia Liu Yang Zhang Michael Carbin Zhangyang Wang 68 123 0 12 Dec 2020
ShiftAddNet: A Hardware-Inspired Deep Network Haoran You Xiaohan Chen Yongan Zhang Chaojian Li Sicheng Li Zihao Liu Zhangyang Wang Yingyan Lin OOD MQ 127 78 0 24 Oct 2020
SmartExchange: Trading Higher-cost Memory Storage/Access for Lower-cost Computation Yang Zhao Xiaohan Chen Yue Wang Chaojian Li Haoran You Y. Fu Yuan Xie Zhangyang Wang Yingyan Lin MQ 97 43 0 07 May 2020
Triple Wins: Boosting Accuracy, Robustness and Efficiency Together by Enabling Input-Adaptive Inference Ting-Kuei Hu Tianlong Chen Haotao Wang Zhangyang Wang OOD AAML 3DH 74 84 0 24 Feb 2020
Fractional Skipping: Towards Finer-Grained Dynamic CNN Inference Jianghao Shen Y. Fu Yue Wang Pengfei Xu Zhangyang Wang Yingyan Lin MQ 52 44 0 03 Jan 2020
Training High-Performance and Large-Scale Deep Neural Networks with Full 8-bit Integers Yukuan Yang Shuang Wu Lei Deng Tianyi Yan Yuan Xie Guoqi Li MQ 151 112 0 05 Sep 2019
Differentiable Soft Quantization: Bridging Full-Precision and Low-Bit Neural Networks Ruihao Gong Xianglong Liu Shenghu Jiang Tian-Hao Li Peng Hu Jiazhen Lin F. Yu Junjie Yan MQ 74 459 0 14 Aug 2019
Latent Weights Do Not Exist: Rethinking Binarized Neural Network Optimization K. Helwegen James Widdicombe Lukas Geiger Zechun Liu K. Cheng Roeland Nusselder MQ 45 114 0 05 Jun 2019
SWALP : Stochastic Weight Averaging in Low-Precision Training Guandao Yang Tianyi Zhang Polina Kirichenko Junwen Bai A. Wilson Christopher De Sa 68 97 0 26 Apr 2019
Learned Step Size Quantization S. K. Esser J. McKinstry Deepika Bablani R. Appuswamy D. Modha MQ 75 810 0 21 Feb 2019
Mixed Precision Quantization of ConvNets via Differentiable Neural Architecture Search Bichen Wu Yanghan Wang Peizhao Zhang Yuandong Tian Peter Vajda Kurt Keutzer MQ 78 273 0 30 Nov 2018
HAQ: Hardware-Aware Automated Quantization with Mixed Precision Kuan-Chieh Wang Zhijian Liu Chengyue Wu Ji Lin Song Han MQ 129 884 0 21 Nov 2018
Graph-Adaptive Pruning for Efficient Inference of Convolutional Neural Networks Mengdi Wang Qing Zhang Jun Yang Xiaoyuan Cui Wei Lin GNN 49 2 0 21 Nov 2018
Interstellar: Using Halide's Scheduling Language to Analyze DNN Accelerators Xuan S. Yang Mingyu Gao Qiaoyi Liu Jeff Setter Jing Pu ... Kaidi Cao Heonjae Ha Priyanka Raina Christos Kozyrakis M. Horowitz 176 230 0 10 Sep 2018
Deep $k$ -Means: Re-Training and Parameter Sharing with Harder Cluster Assignments for Compressing Deep Convolutions Junru Wu Yue Wang Zhenyu Wu Zhangyang Wang Ashok Veeraraghavan Yingyan Lin 59 115 0 24 Jun 2018
Scalable Methods for 8-bit Training of Neural Networks Ron Banner Itay Hubara Elad Hoffer Daniel Soudry MQ 84 339 0 25 May 2018
SkipNet: Learning Dynamic Routing in Convolutional Networks Xin Wang Feng Yu Zi-Yi Dou Trevor Darrell Joseph E. Gonzalez 109 640 0 26 Nov 2017
Apprentice: Using Knowledge Distillation Techniques To Improve Low-Precision Network Accuracy Asit K. Mishra Debbie Marr FedML 67 331 0 15 Nov 2017
Learning Efficient Convolutional Networks through Network Slimming Zhuang Liu Jianguo Li Zhiqiang Shen Gao Huang Shoumeng Yan Changshui Zhang 127 2,426 0 22 Aug 2017
ThiNet: A Filter Level Pruning Method for Deep Neural Network Compression Jian-Hao Luo Jianxin Wu Weiyao Lin 58 1,761 0 20 Jul 2017
Exploring the Regularity of Sparse Structure in Convolutional Neural Networks Huizi Mao Song Han Jeff Pool Wenshuo Li Xingyu Liu Yu Wang W. Dally 111 244 0 24 May 2017
Learning Structured Sparsity in Deep Neural Networks W. Wen Chunpeng Wu Yandan Wang Yiran Chen Hai Helen Li 187 2,341 0 12 Aug 2016
Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding Song Han Huizi Mao W. Dally 3DGS 263 8,862 0 01 Oct 2015
Tensorizing Neural Networks Alexander Novikov D. Podoprikhin A. Osokin Dmitry Vetrov 117 886 0 22 Sep 2015
Learning both Weights and Connections for Efficient Neural Networks Song Han Jeff Pool J. Tran W. Dally CVBM 316 6,709 0 08 Jun 2015
Compressing Deep Convolutional Networks using Vector Quantization Yunchao Gong Liu Liu Ming Yang Lubomir D. Bourdev MQ 179 1,171 0 18 Dec 2014
Do Deep Nets Really Need to be Deep? Lei Jimmy Ba R. Caruana 188 2,120 0 21 Dec 2013