Differentiable Model Compression via Pseudo Quantization Noise

20 April 2021

Yossi Adi

Papers citing "Differentiable Model Compression via Pseudo Quantization Noise"

29 / 29 papers shown

Title
Optimizing Deep Neural Networks using Safety-Guided Self Compression Mohammad Zbeeb Mariam Salman Mohammad Bazzi Ammar Mohanna 26 0 0 01 May 2025
Semi-parametric Memory Consolidation: Towards Brain-like Deep Continual Learning Geng Liu Fei Zhu Rong Feng Zhiqiang Yi Shiqi Wang Gaofeng Meng Zhaoxiang Zhang CLL 35 0 0 20 Apr 2025
Gradual Binary Search and Dimension Expansion : A general method for activation quantization in LLMs Lucas Maisonnave Cyril Moineau Olivier Bichler Fabrice Rastello MQ 40 0 0 18 Apr 2025
Stabilizing Quantization-Aware Training by Implicit-Regularization on Hessian Matrix Junbiao Pang Tianyang Cai 39 1 0 14 Mar 2025
Robust Training of Neural Networks at Arbitrary Precision and Sparsity Chengxi Ye Grace Chu Yanfeng Liu Yichi Zhang Lukasz Lew Andrew G. Howard MQ 27 2 0 14 Sep 2024
GIFT-SW: Gaussian noise Injected Fine-Tuning of Salient Weights for LLMs Maxim Zhelnin Viktor Moskvoretskii Egor Shvetsov Egor Venediktov Mariya Krylova Aleksandr Zuev Evgeny Burnaev 24 2 0 27 Aug 2024
MetaAug: Meta-Data Augmentation for Post-Training Quantization Cuong Pham Hoang Anh Dung Cuong C. Nguyen Trung Le Dinh Q. Phung Gustavo Carneiro Thanh-Toan Do MQ 40 0 0 20 Jul 2024
Hybrid-Parallel: Achieving High Performance and Energy Efficient Distributed Inference on Robots Zekai Sun Xiuxian Guan Junming Wang Haoze Song Yuhao Qing Tianxiang Shen Dong Huang Fangming Liu Heming Cui 34 0 0 29 May 2024
QGen: On the Ability to Generalize in Quantization Aware Training Mohammadhossein Askarihemmat Ahmadreza Jeddi Reyhane Askari Hemmat Ivan Lazarevich Alexander Hoffman Sudhakar Sah Ehsan Saboori Yvon Savaria Jean-Pierre David MQ 21 0 0 17 Apr 2024
Comprehensive Survey of Model Compression and Speed up for Vision Transformers Feiyang Chen Ziqian Luo Lisang Zhou Xueting Pan Ying Jiang 16 22 0 16 Apr 2024
Retraining-free Model Quantization via One-Shot Weight-Coupling Learning Chen Tang Yuan Meng Jiacheng Jiang Shuzhao Xie Rongwei Lu Xinzhu Ma Zhi Wang Wenwu Zhu MQ 22 8 0 03 Jan 2024
RepQ: Generalizing Quantization-Aware Training for Re-Parametrized Architectures Anastasiia Prutianova Alexey Zaytsev Chung-Kuei Lee Fengyu Sun Ivan Koryakovskiy MQ 10 0 0 09 Nov 2023
Reducing the Side-Effects of Oscillations in Training of Quantized YOLO Networks Kartik Gupta Akshay Asthana MQ 24 8 0 09 Nov 2023
On Calibration of Modern Quantized Efficient Neural Networks Joe-Hwa Kuang Alexander Wong UQCV MQ 21 1 0 25 Sep 2023
QBitOpt: Fast and Accurate Bitwidth Reallocation during Training Jorn W. T. Peters Marios Fournarakis Markus Nagel M. V. Baalen Tijmen Blankevoort MQ 16 5 0 10 Jul 2023
RAND: Robustness Aware Norm Decay For Quantized Seq2seq Models David Qiu David Rim Shaojin Ding Oleg Rybakov Yanzhang He MQ 27 4 0 24 May 2023
Rotation Invariant Quantization for Model Compression Dor-Joseph Kampeas Yury Nahshan Hanoch Kremer Gil Lederman Shira Zaloshinski Zheng Li E. Haleva MQ 16 0 0 03 Mar 2023
Self-Compressing Neural Networks Szabolcs Cséfalvay J. Imber 11 2 0 30 Jan 2023
Error-aware Quantization through Noise Tempering Zheng Wang Juncheng Billy Li Shuhui Qu Florian Metze Emma Strubell MQ 11 2 0 11 Dec 2022
Vertical Layering of Quantized Neural Networks for Heterogeneous Inference Hai Wu Ruifei He Hao Hao Tan Xiaojuan Qi Kaibin Huang MQ 21 2 0 10 Dec 2022
Neural Networks with Quantization Constraints Ignacio Hounie Juan Elenter Alejandro Ribeiro MQ 18 4 0 27 Oct 2022
High Fidelity Neural Audio Compression Alexandre Défossez Jade Copet Gabriel Synnaeve Yossi Adi 16 595 0 24 Oct 2022
QuantNAS for super resolution: searching for efficient quantization-friendly architectures against quantization noise Egor Shvetsov Dmitry Osin Alexey Zaytsev Ivan Koryakovskiy Valentin Buchnev I. Trofimov Evgeny Burnaev MQ 21 2 0 31 Aug 2022
Quantization Robust Federated Learning for Efficient Inference on Heterogeneous Devices Kartik Gupta Marios Fournarakis M. Reisser Christos Louizos Markus Nagel FedML 14 14 0 22 Jun 2022
NIPQ: Noise proxy-based Integrated Pseudo-Quantization Juncheol Shin Junhyuk So Sein Park Seungyeop Kang S. Yoo Eunhyeok Park 12 27 0 02 Jun 2022
Overcoming Oscillations in Quantization-Aware Training Markus Nagel Marios Fournarakis Yelysei Bondarenko Tijmen Blankevoort MQ 108 100 0 21 Mar 2022
Sharpness-aware Quantization for Deep Neural Networks Jing Liu Jianfei Cai Bohan Zhuang MQ 27 24 0 24 Nov 2021
ResMLP: Feedforward networks for image classification with data-efficient training Hugo Touvron Piotr Bojanowski Mathilde Caron Matthieu Cord Alaaeldin El-Nouby ... Gautier Izacard Armand Joulin Gabriel Synnaeve Jakob Verbeek Hervé Jégou VLM 21 655 0 07 May 2021
MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications Andrew G. Howard Menglong Zhu Bo Chen Dmitry Kalenichenko Weijun Wang Tobias Weyand M. Andreetto Hartwig Adam 3DH 950 20,561 0 17 Apr 2017