Rethinking Differentiable Search for Mixed-Precision Neural Networks

13 April 2020

Papers citing "Rethinking Differentiable Search for Mixed-Precision Neural Networks"

30 / 30 papers shown

Title
Efficient Mixed Precision Quantization in Graph Neural Networks Samir Moustafa Nils M. Kriege Wilfried Gansterer GNN MQ 35 0 0 14 May 2025
Learning from Loss Landscape: Generalizable Mixed-Precision Quantization via Adaptive Sharpness-Aware Gradient Aligning Lianbo Ma Jianlun Ma Yuee Zhou Guoyang Xie Qiang He Zhichao Lu MQ 48 0 0 08 May 2025
Optimizing DNN Inference on Multi-Accelerator SoCs at Training-time Matteo Risso Alessio Burrello Daniele Jahier Pagliari 51 0 0 24 Feb 2025
Nearly Lossless Adaptive Bit Switching Haiduo Huang Zhenhua Liu Tian Xia Wenzhe zhao Pengju Ren MQ 63 0 0 03 Feb 2025
RefQSR: Reference-based Quantization for Image Super-Resolution Networks H. Lee Jun-Sang Yoo Seung-Won Jung SupR 18 2 0 02 Apr 2024
Instance-Aware Group Quantization for Vision Transformers Jaehyeon Moon Dohyung Kim Junyong Cheon Bumsub Ham MQ ViT 29 7 0 01 Apr 2024
MPTQ-ViT: Mixed-Precision Post-Training Quantization for Vision Transformer Y. Tai An-Yeu Wu Wu MQ 34 6 0 26 Jan 2024
LitE-SNN: Designing Lightweight and Efficient Spiking Neural Network through Spatial-Temporal Compressive Network Search and Joint Optimization Qianhui Liu Jiaqi Yan Malu Zhang Gang Pan Haizhou Li 42 4 0 26 Jan 2024
SAfER: Layer-Level Sensitivity Assessment for Efficient and Robust Neural Network Inference Edouard Yvinec Arnaud Dapogny Kévin Bailly Xavier Fischer AAML 16 2 0 09 Aug 2023
FLIQS: One-Shot Mixed-Precision Floating-Point and Integer Quantization Search Jordan Dotzel Gang Wu Andrew Li M. Umar Yun Ni ... Liqun Cheng Martin G. Dixon N. Jouppi Quoc V. Le Sheng Li MQ 38 3 0 07 Aug 2023
Overcoming Distribution Mismatch in Quantizing Image Super-Resolution Networks Chee Hong Kyoung Mu Lee SupR MQ 27 1 0 25 Jul 2023
Free Bits: Latency Optimization of Mixed-Precision Quantized Neural Networks on the Edge Georg Rutishauser Francesco Conti Luca Benini MQ 31 5 0 06 Jul 2023
Precision-aware Latency and Energy Balancing on Multi-Accelerator Platforms for DNN Inference Matteo Risso Alessio Burrello G. M. Sarda Luca Benini Enrico Macii M. Poncino Marian Verhelst Daniele Jahier Pagliari 28 4 0 08 Jun 2023
Binarizing Sparse Convolutional Networks for Efficient Point Cloud Analysis Xiuwei Xu Ziwei Wang Jie Zhou Jiwen Lu 3DPC MQ 35 6 0 27 Mar 2023
QuantNAS for super resolution: searching for efficient quantization-friendly architectures against quantization noise Egor Shvetsov Dmitry Osin Alexey Zaytsev Ivan Koryakovskiy Valentin Buchnev I. Trofimov Evgeny Burnaev MQ 23 2 0 31 Aug 2022
ANT: Exploiting Adaptive Numerical Data Type for Low-bit Deep Neural Network Quantization Cong Guo Chen Zhang Jingwen Leng Zihan Liu Fan Yang Yun-Bo Liu Minyi Guo Yuhao Zhu MQ 20 55 0 30 Aug 2022
Mixed-Precision Neural Networks: A Survey M. Rakka M. Fouda Pramod P. Khargonekar Fadi J. Kurdahi MQ 25 11 0 11 Aug 2022
CADyQ: Content-Aware Dynamic Quantization for Image Super-Resolution Chee Hong Sungyong Baik Heewon Kim Seungjun Nah Kyoung Mu Lee SupR MQ 31 32 0 21 Jul 2022
Learnable Mixed-precision and Dimension Reduction Co-design for Low-storage Activation Yu-Shan Tai Cheng-Yang Chang Chieh-Fang Teng AnYeu A. Wu 30 5 0 16 Jul 2022
SDQ: Stochastic Differentiable Quantization with Mixed Precision Xijie Huang Zhiqiang Shen Shichao Li Zechun Liu Xianghong Hu Jeffry Wicaksana Eric P. Xing Kwang-Ting Cheng MQ 24 33 0 09 Jun 2022
PICASSO: Unleashing the Potential of GPU-centric Training for Wide-and-deep Recommender Systems Yuanxing Zhang Langshi Chen Siran Yang Man Yuan Hui-juan Yi ... Yong Li Dingyang Zhang Wei Lin Lin Qu Bo Zheng 35 32 0 11 Apr 2022
Q-PPG: Energy-Efficient PPG-based Heart Rate Monitoring on Wearable Devices Alessio Burrello Daniele Jahier Pagliari Matteo Risso Simone Benatti Enrico Macii Luca Benini M. Poncino 19 41 0 24 Mar 2022
Mixed Precision Low-bit Quantization of Neural Network Language Models for Speech Recognition Junhao Xu Jianwei Yu Shoukang Hu Xunying Liu Helen Meng MQ 27 13 0 29 Nov 2021
Sharpness-aware Quantization for Deep Neural Networks Jing Liu Jianfei Cai Bohan Zhuang MQ 27 24 0 24 Nov 2021
How Low Can We Go: Trading Memory for Error in Low-Precision Training Chengrun Yang Ziyang Wu Jerry Chee Christopher De Sa Madeleine Udell 18 2 0 17 Jun 2021
Auto-NBA: Efficient and Effective Search Over the Joint Space of Networks, Bitwidths, and Accelerators Yonggan Fu Yongan Zhang Yang Zhang David D. Cox Yingyan Lin MQ 55 17 0 11 Jun 2021
DAQ: Channel-Wise Distribution-Aware Quantization for Deep Image Super-Resolution Networks Chee Hong Heewon Kim Sungyong Baik Junghun Oh Kyoung Mu Lee OOD SupR MQ 24 41 0 21 Dec 2020
Empowering Things with Intelligence: A Survey of the Progress, Challenges, and Opportunities in Artificial Intelligence of Things Jing Zhang Dacheng Tao 45 462 0 17 Nov 2020
ReLeQ: A Reinforcement Learning Approach for Deep Quantization of Neural Networks Ahmed T. Elthakeb Prannoy Pilligundla Fatemehsadat Mireshghallah Amir Yazdanbakhsh H. Esmaeilzadeh MQ 55 68 0 05 Nov 2018
Neural Architecture Search with Reinforcement Learning Barret Zoph Quoc V. Le 271 5,327 0 05 Nov 2016