Quantized Convolutional Neural Networks for Mobile Devices

21 December 2015

Papers citing "Quantized Convolutional Neural Networks for Mobile Devices"

50 / 174 papers shown

Title
Bias Loss for Mobile Neural Networks L. Abrahamyan Valentin Ziatchin Yiming Chen Nikos Deligiannis 17 14 0 23 Jul 2021
Follow Your Path: a Progressive Method for Knowledge Distillation Wenxian Shi Yuxuan Song Hao Zhou Bohan Li Lei Li 17 15 0 20 Jul 2021
APNN-TC: Accelerating Arbitrary Precision Neural Networks on Ampere GPU Tensor Cores Boyuan Feng Yuke Wang Tong Geng Ang Li Yufei Ding MQ 18 37 0 23 Jun 2021
FORMS: Fine-grained Polarized ReRAM-based In-situ Computation for Mixed-signal DNN Accelerator Geng Yuan Payman Behnam Zhengang Li Ali Shafiee Sheng Lin ... Hang Liu Xuehai Qian M. N. Bojnordi Yanzhi Wang Caiwen Ding 24 68 0 16 Jun 2021
Stealthy Backdoors as Compression Artifacts Yulong Tian Fnu Suya Fengyuan Xu David Evans 35 22 0 30 Apr 2021
Compact CNN Structure Learning by Knowledge Distillation Waqar Ahmed Andrea Zunino Pietro Morerio Vittorio Murino 38 5 0 19 Apr 2021
"BNN - BN = ?": Training Binary Neural Networks without Batch Normalization Tianlong Chen Zhenyu Zhang Xu Ouyang Zechun Liu Zhiqiang Shen Zhangyang Wang MQ 46 36 0 16 Apr 2021
Binary Neural Network for Speaker Verification Tinglong Zhu Xiaoyi Qin Ming Li MQ 21 12 0 06 Apr 2021
Distilling Object Detectors via Decoupled Features Jianyuan Guo Kai Han Yunhe Wang Han Wu Xinghao Chen Chunjing Xu Chang Xu 43 199 0 26 Mar 2021
Compacting Deep Neural Networks for Internet of Things: Methods and Applications Ke Zhang Hanbo Ying Hongning Dai Lin Li Yuangyuang Peng Keyi Guo Hongfang Yu 21 38 0 20 Mar 2021
Learned Gradient Compression for Distributed Deep Learning L. Abrahamyan Yiming Chen Giannis Bekoulis Nikos Deligiannis 40 46 0 16 Mar 2021
hls4ml: An Open-Source Codesign Workflow to Empower Scientific Low-Power Machine Learning Devices F. Fahim B. Hawks C. Herwig J. Hirschauer S. Jindariani ... J. Ngadiuba Miaoyuan Liu Duc Hoang E. Kreinar Zhenbin Wu 32 129 0 09 Mar 2021
VS-Quant: Per-vector Scaled Quantization for Accurate Low-Precision Neural Network Inference Steve Dai Rangharajan Venkatesan Haoxing Ren B. Zimmer W. Dally Brucek Khailany MQ 33 68 0 08 Feb 2021
SeReNe: Sensitivity based Regularization of Neurons for Structured Sparsity in Neural Networks Enzo Tartaglione Andrea Bragagnolo Francesco Odierna Attilio Fiandrotti Marco Grangetto 43 18 0 07 Feb 2021
Pruning and Quantization for Deep Neural Network Acceleration: A Survey Tailin Liang C. Glossner Lei Wang Shaobo Shi Xiaotong Zhang MQ 150 676 0 24 Jan 2021
I-BERT: Integer-only BERT Quantization Sehoon Kim A. Gholami Z. Yao Michael W. Mahoney Kurt Keutzer MQ 107 344 0 05 Jan 2021
Hybrid and Non-Uniform quantization methods using retro synthesis data for efficient inference Gvsl Tej Pratap R. Kumar MQ 29 1 0 26 Dec 2020
Parallel Blockwise Knowledge Distillation for Deep Neural Network Compression Cody Blakeney Xiaomin Li Yan Yan Ziliang Zong 53 40 0 05 Dec 2020
Bringing AI To Edge: From Deep Learning's Perspective Di Liu Hao Kong Xiangzhong Luo Weichen Liu Ravi Subramaniam 52 116 0 25 Nov 2020
SegBlocks: Block-Based Dynamic Resolution Networks for Real-Time Segmentation Thomas Verelst Tinne Tuytelaars SSeg 10 16 0 24 Nov 2020
Neural Network Compression Via Sparse Optimization Tianyi Chen Bo Ji Yixin Shi Tianyu Ding Biyi Fang Sheng Yi Xiao Tu 36 15 0 10 Nov 2020
Parameter Efficient Deep Neural Networks with Bilinear Projections Litao Yu Yongsheng Gao Jun Zhou Jian Zhang 21 1 0 03 Nov 2020
Permute, Quantize, and Fine-tune: Efficient Compression of Neural Networks Julieta Martinez Jashan Shewakramani Ting Liu Ioan Andrei Bârsan Wenyuan Zeng R. Urtasun MQ 23 30 0 29 Oct 2020
Densely Guided Knowledge Distillation using Multiple Teacher Assistants Wonchul Son Jaemin Na Junyong Choi Wonjun Hwang 25 111 0 18 Sep 2020
Transform Quantization for CNN (Convolutional Neural Network) Compression Sean I. Young Wang Zhe David S. Taubman B. Girod MQ 33 69 0 02 Sep 2020
A transprecision floating-point cluster for efficient near-sensor data analytics Fabio Montagna Stefan Mach Simone Benatti Angelo Garofalo G. Ottavi Luca Benini D. Rossi Giuseppe Tagliavini 14 12 0 27 Aug 2020
T-Basis: a Compact Representation for Neural Networks Anton Obukhov M. Rakhuba Stamatios Georgoulis Menelaos Kanakis Dengxin Dai Luc Van Gool 41 27 0 13 Jul 2020
Lightweight Modules for Efficient Deep Learning based Image Restoration A. Lahiri Sourav Bairagya Sutanu Bera Siddhant Haldar P. Biswas SupR 32 36 0 11 Jul 2020
Optimal Lottery Tickets via SubsetSum: Logarithmic Over-Parameterization is Sufficient Ankit Pensia Shashank Rajput Alliot Nagle Harit Vishwakarma Dimitris Papailiopoulos 24 103 0 14 Jun 2020
Knowledge Distillation: A Survey Jianping Gou B. Yu Stephen J. Maybank Dacheng Tao VLM 23 2,857 0 09 Jun 2020
SmartExchange: Trading Higher-cost Memory Storage/Access for Lower-cost Computation Yang Katie Zhao Xiaohan Chen Yue Wang Chaojian Li Haoran You Y. Fu Yuan Xie Zhangyang Wang Yingyan Lin MQ 40 43 0 07 May 2020
A Generic Network Compression Framework for Sequential Recommender Systems Yang Sun Fajie Yuan Ming Yang Guoao Wei Zhou Zhao Duo Liu 26 54 0 21 Apr 2020
Teacher-Class Network: A Neural Network Compression Mechanism Shaiq Munir Malik Muhammad Umair Haider Fnu Mohbat Musab Rasheed M. Taj 20 5 0 07 Apr 2020
Binary Neural Networks: A Survey Haotong Qin Ruihao Gong Xianglong Liu Xiao Bai Jingkuan Song N. Sebe MQ 52 459 0 31 Mar 2020
CoCoPIE: Making Mobile AI Sweet As PIE --Compression-Compilation Co-Design Goes a Long Way Shaoshan Liu Bin Ren Xipeng Shen Yanzhi Wang 17 18 0 14 Mar 2020
Knowledge distillation via adaptive instance normalization Jing Yang Brais Martínez Adrian Bulat Georgios Tzimiropoulos 21 23 0 09 Mar 2020
Pacemaker: Intermediate Teacher Knowledge Distillation For On-The-Fly Convolutional Neural Network Wonchul Son Youngbin Kim Wonseok Song Youngsuk Moon Wonjun Hwang 14 0 0 09 Mar 2020
Communication-Efficient Edge AI: Algorithms and Systems Yuanming Shi Kai Yang Tao Jiang Jun Zhang Khaled B. Letaief GNN 29 327 0 22 Feb 2020
Compact recurrent neural networks for acoustic event detection on low-energy low-complexity platforms G. Cerutti Rahul Prasad Alessio Brutti Elisabetta Farella 21 47 0 29 Jan 2020
Sparse Weight Activation Training Md Aamir Raihan Tor M. Aamodt 34 73 0 07 Jan 2020
ZeroQ: A Novel Zero Shot Quantization Framework Yaohui Cai Z. Yao Zhen Dong A. Gholami Michael W. Mahoney Kurt Keutzer MQ 40 389 0 01 Jan 2020
Lossless Compression of Deep Neural Networks Thiago Serra Abhinav Kumar Srikumar Ramalingam 24 56 0 01 Jan 2020
PatDNN: Achieving Real-Time DNN Execution on Mobile Devices with Pattern-based Weight Pruning Wei Niu Xiaolong Ma Sheng Lin Shihao Wang Xuehai Qian X. Lin Yanzhi Wang Bin Ren MQ 35 227 0 01 Jan 2020
Neural Machine Translation: A Review and Survey Felix Stahlberg 3DV AI4TS MedIm 28 313 0 04 Dec 2019
S2DNAS:Transforming Static CNN Model for Dynamic Inference via Neural Architecture Search Zhihang Yuan Bingzhe Wu Zheng Liang Shiwan Zhao Weichen Bi Guangyu Sun 30 30 0 16 Nov 2019
HAWQ-V2: Hessian Aware trace-Weighted Quantization of Neural Networks Zhen Dong Z. Yao Yaohui Cai Daiyaan Arfeen A. Gholami Michael W. Mahoney Kurt Keutzer MQ 45 274 0 10 Nov 2019
Fully Quantized Transformer for Machine Translation Gabriele Prato Ella Charlaix Mehdi Rezagholizadeh MQ 13 68 0 17 Oct 2019
EDEN: Enabling Energy-Efficient, High-Performance Deep Neural Network Inference Using Approximate DRAM Skanda Koppula Lois Orosa A. G. Yaglikçi Roknoddin Azizi Taha Shahroodi Konstantinos Kanellopoulos O. Mutlu 27 105 0 12 Oct 2019
Edge AI: On-Demand Accelerating Deep Neural Network Inference via Edge Computing En Li Liekang Zeng Zhi Zhou Xu Chen 12 616 0 04 Oct 2019
On the Efficacy of Knowledge Distillation Ligang He Rui Mao 57 600 0 03 Oct 2019