Rotation Invariant Quantization for Model Compression

3 March 2023

Papers citing "Rotation Invariant Quantization for Model Compression"

23 / 23 papers shown

Title
MiniViT: Compressing Vision Transformers with Weight Multiplexing Jinnian Zhang Houwen Peng Kan Wu Mengchen Liu Bin Xiao Jianlong Fu Lu Yuan ViT 70 125 0 14 Apr 2022
Post-training Quantization for Neural Networks with Provable Guarantees Jinjie Zhang Yixuan Zhou Rayan Saab MQ 61 33 0 26 Jan 2022
Multi-Objective Bayesian Optimization over High-Dimensional Search Spaces Sam Daulton David Eriksson Maximilian Balandat E. Bakshy 64 109 0 22 Sep 2021
Differentiable Model Compression via Pseudo Quantization Noise Alexandre Défossez Yossi Adi Gabriel Synnaeve DiffM MQ 52 50 0 20 Apr 2021
An Information-Theoretic Justification for Model Pruning Berivan Isik Tsachy Weissman Albert No 122 36 0 16 Feb 2021
BRECQ: Pushing the Limit of Post-Training Quantization by Block Reconstruction Yuhang Li Ruihao Gong Xu Tan Yang Yang Peng Hu Qi Zhang F. Yu Wei Wang Shi Gu MQ 127 438 0 10 Feb 2021
Online Ensemble Model Compression using Knowledge Distillation Devesh Walawalkar Zhiqiang Shen Marios Savvides 38 51 0 15 Nov 2020
Knowledge Distillation Beyond Model Compression F. Sarfraz Elahe Arani Bahram Zonooz 61 42 0 03 Jul 2020
Differentiable Expected Hypervolume Improvement for Parallel Multi-Objective Bayesian Optimization Sam Daulton Maximilian Balandat E. Bakshy 51 242 0 09 Jun 2020
Up or Down? Adaptive Rounding for Post-Training Quantization Markus Nagel Rana Ali Amjad M. V. Baalen Christos Louizos Tijmen Blankevoort MQ 85 581 0 22 Apr 2020
Integer Quantization for Deep Learning Inference: Principles and Empirical Evaluation Hao Wu Patrick Judd Xiaojie Zhang Mikhail Isaev Paulius Micikevicius MQ 92 357 0 20 Apr 2020
LSQ+: Improving low-bit quantization through learnable offsets and better initialization Yash Bhalgat Jinwon Lee Markus Nagel Tijmen Blankevoort Nojun Kwak MQ 62 220 0 20 Apr 2020
Training with Quantization Noise for Extreme Model Compression Angela Fan Pierre Stock Benjamin Graham Edouard Grave Remi Gribonval Hervé Jégou Armand Joulin MQ 90 245 0 15 Apr 2020
Gaussian Approximation of Quantization Error for Estimation from Compressed Data A. Kipnis Galen Reeves 71 11 0 09 Jan 2020
ZeroQ: A Novel Zero Shot Quantization Framework Yaohui Cai Z. Yao Zhen Dong A. Gholami Michael W. Mahoney Kurt Keutzer MQ 88 397 0 01 Jan 2020
DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter Victor Sanh Lysandre Debut Julien Chaumond Thomas Wolf 232 7,520 0 02 Oct 2019
Improving Neural Network Quantization without Retraining using Outlier Channel Splitting Ritchie Zhao Yuwei Hu Jordan Dotzel Christopher De Sa Zhiru Zhang OODD MQ 94 311 0 28 Jan 2019
HAQ: Hardware-Aware Automated Quantization with Mixed Precision Kuan-Chieh Wang Zhijian Liu Chengyue Wu Ji Lin Song Han MQ 127 882 0 21 Nov 2018
Rate Distortion For Model Compression: From Theory To Practice Weihao Gao Yu-Han Liu Chong-Jun Wang Sewoong Oh 66 31 0 09 Oct 2018
Quantizing deep convolutional networks for efficient inference: A whitepaper Raghuraman Krishnamoorthi MQ 141 1,016 0 21 Jun 2018
The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networks Jonathan Frankle Michael Carbin 233 3,473 0 09 Mar 2018
SQuAD: 100,000+ Questions for Machine Comprehension of Text Pranav Rajpurkar Jian Zhang Konstantin Lopyrev Percy Liang RALM 283 8,134 0 16 Jun 2016
Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding Song Han Huizi Mao W. Dally 3DGS 259 8,842 0 01 Oct 2015