v1v2v3v4v5 (latest)

Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding

1 October 2015

Song Han

Papers citing "Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding"

50 / 3,481 papers shown

Title
Sparse Training from Random Initialization: Aligning Lottery Ticket Masks using Weight Symmetry Mohammed Adnan Rohan Jain Ekansh Sharma Rahul Krishnan Yani Andrew Ioannou 114 0 0 08 May 2025
PROM: Prioritize Reduction of Multiplications Over Lower Bit-Widths for Efficient CNNs Lukas Meiner Jens Mehnert Alexandru Paul Condurache MQ 167 0 0 06 May 2025
Efficient Continual Learning in Keyword Spotting using Binary Neural Networks Quynh Nguyen Phuong Vu Luciano S. Martinez-Rau Yuxuan Zhang Nho-Duc Tran Bengt Oelmann Michele Magno Sebastian Bader CLL 68 0 0 05 May 2025
FPGA-based Acceleration for Convolutional Neural Networks: A Comprehensive Review Junye Jiang Yaan Zhou Yuanhao Gong Haoxuan Yuan Shuanglong Liu 104 0 0 04 May 2025
Efficient Shapley Value-based Non-Uniform Pruning of Large Language Models Chuan Sun Han Yu Lizhen Cui Xiaoxiao Li 448 3 0 03 May 2025
HMI: Hierarchical Knowledge Management for Efficient Multi-Tenant Inference in Pretrained Language Models Junxuan Zhang Jiadong Wang Haoyang Li Lidan Shou Ke Chen Gang Chen Qin Xie Guiming Xie Xuejian Gong 49 0 0 24 Apr 2025
BackSlash: Rate Constrained Optimized Training of Large Language Models Jun Wu Jiangtao Wen Yuxing Han 154 1 0 23 Apr 2025
Efficient Adaptation of Deep Neural Networks for Semantic Segmentation in Space Applications Leonardo Olivi Edoardo Santero Mormile Enzo Tartaglione SSeg 94 0 0 22 Apr 2025
Mathematical Programming Models for Exact and Interpretable Formulation of Neural Networks Masoud Ataei Edrin Hasaj Jacob Gipp Sepideh Forouzi 48 0 0 19 Apr 2025
Collaborative Learning of On-Device Small Model and Cloud-Based Large Model: Advances and Future Directions Chaoyue Niu Yucheng Ding Junhui Lu Zhengxiang Huang Hang Zeng Yutong Dai Xuezhen Tu Chengfei Lv Fan Wu Guihai Chen 130 1 0 17 Apr 2025
Set You Straight: Auto-Steering Denoising Trajectories to Sidestep Unwanted Concepts Leyang Li Shilin Lu Yan Ren A. Kong DiffM 115 4 0 17 Apr 2025
Mamba-Based Ensemble learning for White Blood Cell Classification Lewis Clifton X. Tian D. Palasuwan Phandee Watanaboonyongcharoen Ponlapat Rojnuckarin Nantheera Anantrasirichai Mamba 104 0 0 15 Apr 2025
70% Size, 100% Accuracy: Lossless LLM Compression for Efficient GPU Inference via Dynamic-Length Float Tianyi Zhang Yang Sui Shaochen Zhong Vipin Chaudhary Helen Zhou Anshumali Shrivastava MQ 82 2 0 15 Apr 2025
Efficient Reasoning Models: A Survey Sicheng Feng Gongfan Fang Xinyin Ma Xinchao Wang ReLM LRM 424 13 0 15 Apr 2025
ConvShareViT: Enhancing Vision Transformers with Convolutional Attention Mechanisms for Free-Space Optical Accelerators Riad Ibadulla Thomas M. Chen C. Reyes-Aldasoro ViT 58 0 0 15 Apr 2025
CUT: Pruning Pre-Trained Multi-Task Models into Compact Models for Edge Devices Jingxuan Zhou Weidong Bao Ji Wang Zhengyi Zhong 62 0 0 14 Apr 2025
Can LLMs Revolutionize the Design of Explainable and Efficient TinyML Models? Christophe El Zeinaty W. Hamidouche Glenn Herrou D. Ménard Merouane Debbah 85 0 0 13 Apr 2025
Tin-Tin: Towards Tiny Learning on Tiny Devices with Integer-based Neural Network Training Yi Hu Jinhang Zuo Eddie Zhang Bob Iannucci Carlee Joe-Wong 104 0 0 13 Apr 2025
Cycle Training with Semi-Supervised Domain Adaptation: Bridging Accuracy and Efficiency for Real-Time Mobile Scene Detection Huu-Phong Phan-Nguyen Anh Dao T. Nguyen Tuan Quang H. Tran Tinh-Anh Nguyen-Nhu Huy-Thach Pham Quan Nguyen Hoang M. Le Quang-Vinh Dinh 86 0 0 12 Apr 2025
Optimizing Large Language Models: Metrics, Energy Efficiency, and Case Study Insights Tahniat Khan Soroor Motie Sedef Akinli Kocak Shaina Raza MQ 83 0 0 07 Apr 2025
Two is Better than One: Efficient Ensemble Defense for Robust and Compact Models Yoojin Jung Byung Cheol Song AAML VLM MQ 91 0 0 07 Apr 2025
Hyperflows: Pruning Reveals the Importance of Weights Eugen Barbulescu Antonio Alexoaie 64 0 0 06 Apr 2025
Towards Understanding and Improving Refusal in Compressed Models via Mechanistic Interpretability Vishnu Kabir Chhabra Mohammad Mahdi Khalili AI4CE 89 0 0 05 Apr 2025
Online Difficulty Filtering for Reasoning Oriented Reinforcement Learning Sanghwan Bae Jiwoo Hong Min Young Lee Hanbyul Kim Jeongyeon Nam Donghyun Kwak OffRL LRM 154 0 0 04 Apr 2025
HyperRAG: Enhancing Quality-Efficiency Tradeoffs in Retrieval-Augmented Generation with Reranker KV-Cache Reuse Yuwei An Yihua Cheng Seo Jin Park Junchen Jiang 96 1 0 03 Apr 2025
MDP: Multidimensional Vision Model Pruning with Latency Constraint Xinglong Sun Barath Lakshmanan Maying Shen Shiyi Lan Jingde Chen Jose M. Alvarez VLM 151 0 0 02 Apr 2025
FedPaI: Achieving Extreme Sparsity in Federated Learning via Pruning at Initialization Haonan Wang Ziqiang Liu Kajimusugura Hoshino Tuo Zhang J. Walters S. Crago 104 0 0 01 Apr 2025
Machine Learning-assisted High-speed Combinatorial Optimization with Ising Machines for Dynamically Changing Problems Yohei Hamakawa Tomoya Kashimata Masaya Yamasaki Kosuke Tatsumura AI4CE 161 0 0 31 Mar 2025
Optimization of Layer Skipping and Frequency Scaling for Convolutional Neural Networks under Latency Constraint Minh David Thao Chan Ruoyu Zhao Yukuan Jia Ruiqing Mao Sheng Zhou 87 0 0 31 Mar 2025
An Efficient Training Algorithm for Models with Block-wise Sparsity Ding Zhu Zhiqun Zuo Mohammad Mahdi Khalili 57 0 0 27 Mar 2025
Boosting Large Language Models with Mask Fine-Tuning M. Zhang Yue Bai Huan Wang Yizhou Wang Qihua Dong Y. Fu CLL 100 0 0 27 Mar 2025
Optimizing Multi-DNN Inference on Mobile Devices through Heterogeneous Processor Co-Execution Yunquan Gao Zhiguo Zhang Praveen Kumar Donta C. Dehury Xiang Wang Dusit Niyato Qiyang Zhang 69 0 0 27 Mar 2025
Mobile-VideoGPT: Fast and Accurate Video Understanding Language Model Abdelrahman M. Shaker Muhammad Maaz Chenhui Gou Hamid Rezatofighi Salman Khan Fahad Shahbaz Khan 430 0 0 27 Mar 2025
A Low-complexity Structured Neural Network Approach to Intelligently Realize Wideband Multi-beam Beamformers Hansaka Aluvihare Sivakumar Sivasankar Xianqi Li Arjuna Madanayake Sirani M. Perera 121 1 0 26 Mar 2025
Lipschitz Constant Meets Condition Number: Learning Robust and Compact Deep Neural Networks Yangqi Feng S. J. Lin Baoyuan Gao Xian Wei AAML 127 1 0 26 Mar 2025
GIViC: Generative Implicit Video Compression Ge Gao Siyue Teng Tianhao Peng Fan Zhang David Bull DiffM VGen 79 0 0 25 Mar 2025
MoST: Efficient Monarch Sparse Tuning for 3D Representation Learning Xu Han Yuan Tang Jinfeng Xu Xianzhi Li 97 0 0 24 Mar 2025
Temporal Action Detection Model Compression by Progressive Block Drop Xiaoyong Chen Yong Guo Jiaming Liang Sitong Zhuang Runhao Zeng Xiping Hu 92 0 0 21 Mar 2025
Attention Pruning: Automated Fairness Repair of Language Models via Surrogate Simulated Annealing Vishnu Asutosh Dasu Md Rafi Ur Rashid Vipul Gupta Saeid Tizpaz-Niari Gang Tan AAML 108 1 0 20 Mar 2025
PARQ: Piecewise-Affine Regularized Quantization Lisa Jin Jianhao Ma Zechun Liu Andrey Gromov Aaron Defazio Lin Xiao MQ 80 1 0 19 Mar 2025
Decision Tree Induction Through LLMs via Semantically-Aware Evolution Tennison Liu Nicolas Huynh M. Schaar 94 3 0 18 Mar 2025
Knowledge Distillation: Enhancing Neural Network Compression with Integrated Gradients David E. Hernandez J. Chang Torbjörn E. M. Nordling 112 0 0 17 Mar 2025
Changing Base Without Losing Pace: A GPU-Efficient Alternative to MatMul in DNNs Nir Ailon Akhiad Bercovich Omri Weinstein 139 0 0 15 Mar 2025
Safe Vision-Language Models via Unsafe Weights Manipulation Moreno DÍncà E. Peruzzo Xingqian Xu Humphrey Shi N. Sebe Massimiliano Mancini MU 116 0 0 14 Mar 2025
Stabilizing Quantization-Aware Training by Implicit-Regularization on Hessian Matrix Junbiao Pang Tianyang Cai 132 1 0 14 Mar 2025
Towards Extreme Pruning of LLMs with Plug-and-Play Mixed Sparsity Chi Xu Gefei Zhang Yantong Zhu Luca Benini Guosheng Hu Yawei Li Zhihong Zhang 60 1 0 14 Mar 2025
ViM-VQ: Efficient Post-Training Vector Quantization for Visual Mamba Juncan Deng Shuaiting Li Zeyu Wang Kedong Xu Hong Gu Kejie Huang MQ 141 0 0 12 Mar 2025
SSVQ: Unleashing the Potential of Vector Quantization with Sign-Splitting Shuaiting Li Juncan Deng Chenxuan Wang Kedong Xu Rongtao Deng Hong Gu Haibin Shen Kejie Huang MQ 99 0 0 11 Mar 2025
Residual Learning and Filtering Networks for End-to-End Lossless Video Compression Md Baharul Islam Afsana Ahsan Jeny 73 0 0 11 Mar 2025
Sample-aware Adaptive Structured Pruning for Large Language Models Jun Kong Xinge Ma Jin Wang Xuejie Zhang 92 0 0 08 Mar 2025