v1v2 (latest)

Channel Pruning for Accelerating Very Deep Neural Networks

19 July 2017

Yihui He

Xiangyu Zhang

Jian Sun

ArXiv (abs)PDF HTML

Papers citing "Channel Pruning for Accelerating Very Deep Neural Networks"

50 / 1,097 papers shown

Title
AutoDFP: Automatic Data-Free Pruning via Channel Similarity Reconstruction Siqi Li Jun Chen Jingyang Xiang Chengrui Zhu Yong-Jin Liu 78 0 0 13 Mar 2024
Self-Regulated Neurogenesis for Online Data-Incremental Learning Murat Onur Yildirim Elif Ceren Gok Yildirim Decebal Constantin Mocanu Joaquin Vanschoren CLL 100 0 0 13 Mar 2024
COMQ: A Backpropagation-Free Algorithm for Post-Training Quantization Aozhong Zhang Zi Yang Naigang Wang Yingyong Qin Jack Xin Xin Li Penghang Yin VLM MQ 53 3 0 11 Mar 2024
FALCON: FLOP-Aware Combinatorial Optimization for Neural Network Pruning Xiang Meng Wenyu Chen Riade Benbaki Rahul Mazumder 60 6 0 11 Mar 2024
Enhanced Sparsification via Stimulative Training Shengji Tang Weihao Lin Hancheng Ye Peng Ye Chong Yu Baopu Li Tao Chen 60 2 0 11 Mar 2024
Frequency Attention for Knowledge Distillation Cuong Pham Van-Anh Nguyen Trung Le Dinh Q. Phung Gustavo Carneiro Thanh-Toan Do 73 18 0 09 Mar 2024
A Survey of Lottery Ticket Hypothesis Bohan Liu Zijie Zhang Peixiong He Zhensen Wang Yang Xiao Ruimeng Ye Yang Zhou Wei-Shinn Ku Bo Hui UQCV 91 15 0 07 Mar 2024
Structurally Prune Anything: Any Architecture, Any Framework, Any Time Xun Wang John Rachwan Stephan Günnemann Bertrand Charpentier 65 5 0 03 Mar 2024
OSSCAR: One-Shot Structured Pruning in Vision and Language Models with Combinatorial Optimization Xiang Meng Shibal Ibrahim Kayhan Behdin Hussein Hazimeh Natalia Ponomareva Rahul Mazumder VLM 104 8 0 02 Mar 2024
Towards Explaining Deep Neural Network Compression Through a Probabilistic Latent Space Mahsa Mozafari-Nia Salimeh Yasaei Sekeh 131 0 0 29 Feb 2024
REPrune: Channel Pruning via Kernel Representative Selection Mincheol Park Dongjin Kim Cheonjun Park Yuna Park Gyeong Eun Gong Won Woo Ro Suhyun Kim VLM 69 1 0 27 Feb 2024
SPC-NeRF: Spatial Predictive Compression for Voxel Based Radiance Field Zetian Song Wenhong Duan Yuhuai Zhang Shiqi Wang Siwei Ma Wen Gao 84 3 0 26 Feb 2024
GPTVQ: The Blessing of Dimensionality for LLM Quantization M. V. Baalen Andrey Kuzmin Ivan Koryakovskiy Markus Nagel Peter Couperus Cédric Bastoul E. Mahurin Tijmen Blankevoort Paul N. Whatmough MQ 108 35 0 23 Feb 2024
Not All Experts are Equal: Efficient Expert Pruning and Skipping for Mixture-of-Experts Large Language Models Xudong Lu Qi Liu Yuhui Xu Aojun Zhou Siyuan Huang Bo Zhang Junchi Yan Hongsheng Li MoE 82 33 0 22 Feb 2024
FedLPS: Heterogeneous Federated Learning for Multiple Tasks with Local Parameter Sharing Yongzhe Jia Xuyun Zhang Amin Beheshti Wanchun Dou FedML 63 6 0 13 Feb 2024
Towards Meta-Pruning via Optimal Transport Alexander Theus Olin Geimer Friedrich Wicke Thomas Hofmann Sotiris Anagnostidis Sidak Pal Singh MoMe 86 4 0 12 Feb 2024
Compressing Deep Reinforcement Learning Networks with a Dynamic Structured Pruning Method for Autonomous Driving Wensheng Su Zhenni Li Minrui Xu Jiawen Kang Dusit Niyato Shengli Xie 77 9 0 07 Feb 2024
A Survey on Transformer Compression Yehui Tang Yunhe Wang Jianyuan Guo Zhijun Tu Kai Han Hailin Hu Dacheng Tao 152 35 0 05 Feb 2024
Lightweight Pixel Difference Networks for Efficient Visual Representation Learning Z. Su Jiehua Zhang Longguang Wang Hua Zhang Zhen Liu M. Pietikäinen Li Liu 92 22 0 01 Feb 2024
One-Step Forward and Backtrack: Overcoming Zig-Zagging in Loss-Aware Quantization Training Lianbo Ma Yuee Zhou Jianlun Ma Guo-Ding Yu Qing Li MQ 49 2 0 30 Jan 2024
SliceGPT: Compress Large Language Models by Deleting Rows and Columns Saleh Ashkboos Maximilian L. Croci Marcelo Gennari do Nascimento Torsten Hoefler James Hensman VLM 216 186 0 26 Jan 2024
DTMM: Deploying TinyML Models on Extremely Weak IoT Devices with Pruning Lixiang Han Zhen Xiao Zhenjiang Li 80 6 0 17 Jan 2024
Harnessing Orthogonality to Train Low-Rank Neural Networks D. Coquelin Katharina Flügel Marie Weiel Nicholas Kiefer Charlotte Debus Achim Streit Markus Goetz 66 1 0 16 Jan 2024
Boosting Defect Detection in Manufacturing using Tensor Convolutional Neural Networks Pablo Martin-Ramiro Unai Sainz de la Maza Sukhbinder Singh Roman Orus Samuel Mugel UQCV 76 3 0 29 Dec 2023
Hardware-Aware DNN Compression via Diverse Pruning and Mixed-Precision Quantization K. Balaskas Andreas Karatzas Christos Sad K. Siozios Iraklis Anagnostopoulos Georgios Zervakis Jörg Henkel MQ 72 11 0 23 Dec 2023
Sparsity-Guided Holistic Explanation for LLMs with Interpretable Inference-Time Intervention Zhen Tan Tianlong Chen Zhenyu Zhang Huan Liu 98 17 0 22 Dec 2023
ElasticTrainer: Speeding Up On-Device Training with Runtime Elastic Tensor Selection Kai Huang Boyuan Yang Wei Gao 93 21 0 21 Dec 2023
ARBiBench: Benchmarking Adversarial Robustness of Binarized Neural Networks Peng Zhao Jiehua Zhang Bowen Peng Longguang Wang Yingmei Wei Yu Liu Li Liu AAML 86 0 0 21 Dec 2023
Model-Based Control with Sparse Neural Dynamics Ziang Liu Genggeng Zhou Jeff He Tobia Marcucci Fei-Fei Li Jiajun Wu Yunzhu Li AI4CE 92 18 0 20 Dec 2023
Optimizing Convolutional Neural Network Architecture Luis Balderas Miguel Lastra José M. Benítez CVBM 98 7 0 17 Dec 2023
OTOv3: Automatic Architecture-Agnostic Neural Network Training and Compression from Structured Pruning to Erasing Operators Tianyi Chen Tianyu Ding Zhihui Zhu Zeyu Chen HsiangTao Wu Ilya Zharkov Luming Liang 55 4 0 15 Dec 2023
Weight subcloning: direct initialization of transformers using larger pretrained ones Mohammad Samragh Mehrdad Farajtabar Sachin Mehta Raviteja Vemulapalli Fartash Faghri Devang Naik Oncel Tuzel Mohammad Rastegari 112 30 0 14 Dec 2023
CBQ: Cross-Block Quantization for Large Language Models Xin Ding Xiaoyu Liu Zhijun Tu Yun-feng Zhang Wei Li ... Hanting Chen Yehui Tang Zhiwei Xiong Baoqun Yin Yunhe Wang MQ 146 17 0 13 Dec 2023
MaxQ: Multi-Axis Query for N:M Sparsity Network Jingyang Xiang Siqi Li Junhao Chen Zhuangzhi Chen Tianxin Huang Linpeng Peng Yong-Jin Liu 53 0 0 12 Dec 2023
Ternary Spike: Learning Ternary Spikes for Spiking Neural Networks Yu-Zhu Guo Y. Chen Xiaode Liu Weihang Peng Yuhan Zhang Xuhui Huang Zhe Ma 75 32 0 11 Dec 2023
SlimSAM: 0.1% Data Makes Segment Anything Slim Zigeng Chen Gongfan Fang Xinyin Ma Xinchao Wang 103 14 0 08 Dec 2023
Accelerating Convolutional Neural Network Pruning via Spatial Aura Entropy Bogdan Musat Razvan Andonie 57 0 0 08 Dec 2023
A Masked Pruning Approach for Dimensionality Reduction in Communication-Efficient Federated Learning Systems Tamir L. S. Gez Kobi Cohen 55 3 0 06 Dec 2023
Towards Sobolev Pruning Neil Kichler Sher Afghan U. Naumann 30 0 0 06 Dec 2023
Towards Sample-specific Backdoor Attack with Clean Labels via Attribute Trigger Yiming Li Mingyan Zhu Junfeng Guo Tao Wei Shu-Tao Xia Zhan Qin AAML 158 1 0 03 Dec 2023
Towards Higher Ranks via Adversarial Weight Pruning Yuchuan Tian Hanting Chen Tianyu Guo Chao Xu Yunhe Wang 63 2 0 29 Nov 2023
BinaryHPE: 3D Human Pose and Shape Estimation via Binarization Zhiteng Li Yulun Zhang Jing Lin Haotong Qin Jinjin Gu Xin Yuan Linghe Kong Xiaokang Yang 3DH 132 1 0 24 Nov 2023
Efficient Neural Networks for Tiny Machine Learning: A Comprehensive Review M. Lê Pierre Wolinski Julyan Arbel 89 10 0 20 Nov 2023
Pursing the Sparse Limitation of Spiking Deep Learning Structures Hao-Ran Cheng Jiahang Cao Erjia Xiao Mengshu Sun Le Yang Jize Zhang Xue Lin B. Kailkhura Kaidi Xu Renjing Xu 85 1 0 18 Nov 2023
Adaptive Compression-Aware Split Learning and Inference for Enhanced Network Efficiency Akrit Mudvari Antero Vainio Iason Ofeidis Sasu Tarkoma Leandros Tassiulas 59 3 0 09 Nov 2023
Mini but Mighty: Finetuning ViTs with Mini Adapters Imad Eddine Marouf Enzo Tartaglione Stéphane Lathuilière 60 5 0 07 Nov 2023
OrthoNets: Orthogonal Channel Attention Networks Hadi Salman Caleb Parks Matthew Swan John Gauch 54 12 0 06 Nov 2023
Efficient Model-Based Deep Learning via Network Pruning and Fine-Tuning Chicago Y. Park Weijie Gan Zihao Zou Yuyang Hu Zhixin Sun Ulugbek S. Kamilov 69 0 0 03 Nov 2023
USDC: Unified Static and Dynamic Compression for Visual Transformer Huan Yuan Chao Liao Jianchao Tan Peng Yao Jiyuan Jia Bin Chen Chengru Song Di Zhang ViT 32 0 0 17 Oct 2023
Sparse-DySta: Sparsity-Aware Dynamic and Static Scheduling for Sparse Multi-DNN Workloads Hongxiang Fan Stylianos I. Venieris Alexandros Kouris Nicholas D. Lane 88 8 0 17 Oct 2023