Robust Quantization: One Model to Rule Them All

18 February 2020

Papers citing "Robust Quantization: One Model to Rule Them All"

21 / 21 papers shown

Title
Fast and Low-Cost Genomic Foundation Models via Outlier Removal Haozheng Luo Chenghao Qiu Maojiang Su Zhihan Zhou Zoe Mehta Guo Ye Jerry Yao-Chieh Hu Han Liu AAML 55 1 0 01 May 2025
Nearly Lossless Adaptive Bit Switching Haiduo Huang Zhenhua Liu Tian Xia Wenzhe zhao Pengju Ren MQ 63 0 0 03 Feb 2025
FlatQuant: Flatness Matters for LLM Quantization Yuxuan Sun Ruikang Liu Haoli Bai Han Bao Kang Zhao ... Lu Hou Chun Yuan Xin Jiang Wei Liu Jun Yao MQ 79 4 0 12 Oct 2024
Outlier-Efficient Hopfield Layers for Large Transformer-Based Models Jerry Yao-Chieh Hu Pei-Hsuan Chang Haozheng Luo Hong-Yu Chen Weijian Li Wei-Po Wang Han Liu 39 26 0 04 Apr 2024
Pursing the Sparse Limitation of Spiking Deep Learning Structures Hao-Ran Cheng Jiahang Cao Erjia Xiao Mengshu Sun Le Yang Jize Zhang Xue Lin B. Kailkhura Kaidi Xu Renjing Xu 16 1 0 18 Nov 2023
Quantizable Transformers: Removing Outliers by Helping Attention Heads Do Nothing Yelysei Bondarenko Markus Nagel Tijmen Blankevoort MQ 21 88 0 22 Jun 2023
High-Resolution Convolutional Neural Networks on Homomorphically Encrypted Data via Sharding Ciphertexts Vivian Maloney R. Obrecht V. Saraph P. Rama K. Tallaksen 26 1 0 15 Jun 2023
MBQuant: A Novel Multi-Branch Topology Method for Arbitrary Bit-width Network Quantization Mingliang Xu Yuyao Zhou Rongrong Ji Rongrong Ji MQ 31 1 0 14 May 2023
BiMLP: Compact Binary Architectures for Vision Multi-Layer Perceptrons Yixing Xu Xinghao Chen Yunhe Wang MQ 27 8 0 29 Dec 2022
Weight Fixing Networks Christopher Subia-Waud S. Dasmahapatra MQ 19 2 0 24 Oct 2022
Outlier Suppression: Pushing the Limit of Low-bit Transformer Language Models Xiuying Wei Yunchen Zhang Xiangguo Zhang Ruihao Gong Shanghang Zhang Qi Zhang F. Yu Xianglong Liu MQ 36 145 0 27 Sep 2022
Symmetry Regularization and Saturating Nonlinearity for Robust Quantization Sein Park Yeongsang Jang Eunhyeok Park MQ 21 1 0 31 Jul 2022
SDQ: Stochastic Differentiable Quantization with Mixed Precision Xijie Huang Zhiqiang Shen Shichao Li Zechun Liu Xianghong Hu Jeffry Wicaksana Eric P. Xing Kwang-Ting Cheng MQ 19 33 0 09 Jun 2022
Bimodal Distributed Binarized Neural Networks T. Rozen Moshe Kimhi Brian Chmiel A. Mendelson Chaim Baskin MQ 47 4 0 05 Apr 2022
2-in-1 Accelerator: Enabling Random Precision Switch for Winning Both Adversarial Robustness and Efficiency Yonggan Fu Yang Katie Zhao Qixuan Yu Chaojian Li Yingyan Lin AAML 49 12 0 11 Sep 2021
Post-Training Sparsity-Aware Quantization Gil Shomron F. Gabbay Samer Kurzum U. Weiser MQ 39 33 0 23 May 2021
Anchor-based Plain Net for Mobile Image Super-Resolution Zongcai Du Jie Liu Jie Tang Gangshan Wu SupR MQ 30 52 0 20 May 2021
Do All MobileNets Quantize Poorly? Gaining Insights into the Effect of Quantization on Depthwise Separable Convolutional Networks Through the Eyes of Multi-scale Distributional Dynamics S. Yun Alexander Wong MQ 19 25 0 24 Apr 2021
FantastIC4: A Hardware-Software Co-Design Approach for Efficiently Running 4bit-Compact Multilayer Perceptrons Simon Wiedemann Suhas Shivapakash P. Wiedemann Daniel Becking Wojciech Samek F. Gerfers Thomas Wiegand MQ 23 7 0 17 Dec 2020
Once Quantization-Aware Training: High Performance Extremely Low-bit Architecture Search Mingzhu Shen Feng Liang Ruihao Gong Yuhang Li Chuming Li Chen Lin F. Yu Junjie Yan Wanli Ouyang MQ 28 36 0 09 Oct 2020
Search What You Want: Barrier Panelty NAS for Mixed Precision Quantization Haibao Yu Qi Han Jianbo Li Jianping Shi Guangliang Cheng Bin Fan MQ 21 61 0 20 Jul 2020