DoReFa-Net: Training Low Bitwidth Convolutional Neural Networks with Low Bitwidth Gradients

20 June 2016

Shuchang Zhou

Papers citing "DoReFa-Net: Training Low Bitwidth Convolutional Neural Networks with Low Bitwidth Gradients"

50 / 444 papers shown

Title
Learning from Loss Landscape: Generalizable Mixed-Precision Quantization via Adaptive Sharpness-Aware Gradient Aligning Lianbo Ma Jianlun Ma Yuee Zhou Guoyang Xie Qiang He Zhichao Lu MQ 53 0 0 08 May 2025
RGB-Event Fusion with Self-Attention for Collision Prediction Pietro Bonazzi Christian Vogt Michael Jost Haotong Qin Lyes Khacef Federico Paredes-Valles Michele Magno 42 0 0 07 May 2025
NeuroSim V1.5: Improved Software Backbone for Benchmarking Compute-in-Memory Accelerators with Device and Circuit-level Non-idealities James Read Ming-Yen Lee Wei-Hsing Huang Yuan-Chun Luo A. Lu Shimeng Yu 48 0 0 05 May 2025
BackSlash: Rate Constrained Optimized Training of Large Language Models Jun Wu Jiangtao Wen Yuxing Han 39 0 0 23 Apr 2025
Breaking the Limits of Quantization-Aware Defenses: QADT-R for Robustness Against Patch-Based Adversarial Attacks in QNNs Amira Guesmi B. Ouni Muhammad Shafique MQ AAML 41 0 0 10 Mar 2025
Cauchy-Schwarz Regularizers Sueda Taner Ziyi Wang Christoph Studer 46 0 0 03 Mar 2025
Nearly Lossless Adaptive Bit Switching Haiduo Huang Zhenhua Liu Tian Xia Wenzhe zhao Pengju Ren MQ 73 0 0 03 Feb 2025
HadamRNN: Binary and Sparse Ternary Orthogonal RNNs Armand Foucault Franck Mamalet François Malgouyres MQ 89 0 0 28 Jan 2025
Histogram-Equalized Quantization for logic-gated Residual Neural Networks Van Thien Nguyen William Guicquero Gilles Sicard MQ 49 2 0 10 Jan 2025
PTQ4VM: Post-Training Quantization for Visual Mamba Younghyun Cho Changhun Lee Seonggon Kim Eunhyeok Park MQ Mamba 53 2 0 29 Dec 2024
Exploring the Robustness and Transferability of Patch-Based Adversarial Attacks in Quantized Neural Networks Amira Guesmi B. Ouni Mohamed Bennai AAML 84 0 0 22 Nov 2024
On the Impact of White-box Deployment Strategies for Edge AI on Latency and Model Performance Jaskirat Singh Bram Adams Ahmed E. Hassan VLM 47 0 0 01 Nov 2024
MimiQ: Low-Bit Data-Free Quantization of Vision Transformers with Encouraging Inter-Head Attention Similarity Kanghyun Choi Hyeyoon Lee Dain Kwon Sunjong Park Kyuyeun Kim Noseong Park Jinho Lee Jinho Lee MQ 57 1 0 29 Jul 2024
Exploring FPGA designs for MX and beyond Ebby Samson Naveen Mellempudi Wayne Luk George A. Constantinides MQ 40 1 0 01 Jul 2024
Custom Gradient Estimators are Straight-Through Estimators in Disguise Matt Schoenbauer Daniele Moro Lukasz Lew Andrew G. Howard MQ 44 3 0 08 May 2024
Designed Dithering Sign Activation for Binary Neural Networks Brayan Monroy Juan Estupiñán T. Gelvez-Barrera Jorge Bacca Henry Arguello MQ 40 1 0 03 May 2024
Torch2Chip: An End-to-end Customizable Deep Neural Network Compression and Deployment Toolkit for Prototype Hardware Accelerator Design Jian Meng Yuan Liao Anupreetham Anupreetham Ahmed Hassan Shixing Yu Han-Sok Suh Xiaofeng Hu Jae-sun Seo MQ 56 2 0 02 May 2024
AdaQAT: Adaptive Bit-Width Quantization-Aware Training Cédric Gernigon Silviu-Ioan Filip Olivier Sentieys Clément Coggiola Mickael Bruno 31 2 0 22 Apr 2024
Communication-Efficient Large-Scale Distributed Deep Learning: A Comprehensive Survey Feng Liang Zhen Zhang Haifeng Lu Victor C. M. Leung Yanyi Guo Xiping Hu GNN 42 6 0 09 Apr 2024
QuantTune: Optimizing Model Quantization with Adaptive Outlier-Driven Fine Tuning Jiun-Man Chen Yu-Hsuan Chao Yu-Jie Wang Ming-Der Shieh Chih-Chung Hsu Wei-Fen Lin MQ 48 1 0 11 Mar 2024
Better Schedules for Low Precision Training of Deep Neural Networks Cameron R. Wolfe Anastasios Kyrillidis 47 1 0 04 Mar 2024
RepQuant: Towards Accurate Post-Training Quantization of Large Transformer Models via Scale Reparameterization Zhikai Li Xuewen Liu Jing Zhang Qingyi Gu MQ 54 7 0 08 Feb 2024
ARBiBench: Benchmarking Adversarial Robustness of Binarized Neural Networks Peng Zhao Jiehua Zhang Bowen Peng Longguang Wang Yingmei Wei Yu Liu Li Liu AAML 42 0 0 21 Dec 2023
PLUM: Improving Inference Efficiency By Leveraging Repetition-Sparsity Trade-Off Sachit Kuhar Yash Jain Alexey Tumanov MQ 61 0 0 04 Dec 2023
RepQ: Generalizing Quantization-Aware Training for Re-Parametrized Architectures Anastasiia Prutianova Alexey Zaytsev Chung-Kuei Lee Fengyu Sun Ivan Koryakovskiy MQ 28 0 0 09 Nov 2023
Hamming Encoder: Mining Discriminative k-mers for Discrete Sequence Classification Junjie Dong Mudi Jiang Lianyu Hu Zengyou He 25 0 0 16 Oct 2023
YFlows: Systematic Dataflow Exploration and Code Generation for Efficient Neural Network Inference using SIMD Architectures on CPUs Cyrus Zhou Zack Hassman Ruize Xu Dhirpal Shah Vaughn Richard Yanjing Li 37 1 0 01 Oct 2023
Distributed Extra-gradient with Optimal Complexity and Communication Guarantees Ali Ramezani-Kebrya Kimon Antonakopoulos Igor Krawczuk Justin Deschenaux V. Cevher 46 3 0 17 Aug 2023
Overcoming Distribution Mismatch in Quantizing Image Super-Resolution Networks Chee Hong Kyoung Mu Lee SupR MQ 32 1 0 25 Jul 2023
Quantized Feature Distillation for Network Quantization Kevin Zhu Yin He Jianxin Wu MQ 31 9 0 20 Jul 2023
Approximate Computing Survey, Part II: Application-Specific & Architectural Approximation Techniques and Applications Vasileios Leon Muhammad Abdullah Hanif Giorgos Armeniakos Xun Jiao Mohamed Bennai K. Pekmestzi Dimitrios Soudris 44 3 0 20 Jul 2023
Learning Discrete Weights and Activations Using the Local Reparameterization Trick G. Berger Aviv Navon Ethan Fetaya MQ 25 0 0 04 Jul 2023
Data-Free Quantization via Mixed-Precision Compensation without Fine-Tuning Jun Chen Shipeng Bai Tianxin Huang Mengmeng Wang Guanzhong Tian Y. Liu MQ 44 18 0 02 Jul 2023
Quantizable Transformers: Removing Outliers by Helping Attention Heads Do Nothing Yelysei Bondarenko Markus Nagel Tijmen Blankevoort MQ 28 87 0 22 Jun 2023
Patch-wise Mixed-Precision Quantization of Vision Transformer Junrui Xiao Zhikai Li Lianwei Yang Qingyi Gu MQ 37 12 0 11 May 2023
Improving Robustness Against Adversarial Attacks with Deeply Quantized Neural Networks Ferheen Ayaz Idris Zakariyya José Cano S. Keoh Jeremy Singer D. Pau Mounia Kharbouche-Harrari 26 5 0 25 Apr 2023
Efficient Halftoning via Deep Reinforcement Learning Haitian Jiang Dongliang Xiong Xiaowen Jiang Li Ding Liang Chen Kai Huang 23 3 0 24 Apr 2023
PixelRNN: In-pixel Recurrent Neural Networks for End-to-end-optimized Perception with Neural Sensors Haley M. So Laurie Bose Piotr Dudek Gordon Wetzstein 28 4 0 11 Apr 2023
Benchmarking the Robustness of Quantized Models Yisong Xiao Tianyuan Zhang Shunchang Liu Haotong Qin AAML MQ 39 2 0 08 Apr 2023
AutoQNN: An End-to-End Framework for Automatically Quantizing Neural Networks Cheng Gong Ye Lu Surong Dai Deng Qian Chenkun Du Tao Li MQ 34 0 0 07 Apr 2023
RPTQ: Reorder-based Post-training Quantization for Large Language Models Zhihang Yuan Lin Niu Jia-Wen Liu Wenyu Liu Xinggang Wang Yuzhang Shang Guangyu Sun Qiang Wu Jiaxiang Wu Bingzhe Wu MQ 38 80 0 03 Apr 2023
Optimizing data-flow in Binary Neural Networks Lorenzo Vorabbi Davide Maltoni Stefano Santi MQ 30 5 0 03 Apr 2023
Q-DETR: An Efficient Low-Bit Quantized Detection Transformer Sheng Xu Yanjing Li Mingbao Lin Penglei Gao Guodong Guo Jinhu Lu Baochang Zhang MQ 37 23 0 01 Apr 2023
Compacting Binary Neural Networks by Sparse Kernel Selection Yikai Wang Wen-bing Huang Yinpeng Dong Gang Hua Anbang Yao MQ 41 4 0 25 Mar 2023
Mathematical Challenges in Deep Learning V. Nia Guojun Zhang I. Kobyzev Michael R. Metel Xinlin Li ... S. Hemati M. Asgharian Linglong Kong Wulong Liu Boxing Chen AI4CE VLM 37 1 0 24 Mar 2023
A Dynamic Multi-Scale Voxel Flow Network for Video Prediction Xiaotao Hu Zhewei Huang Ailin Huang Jun Xu Shuchang Zhou VGen 40 69 0 17 Mar 2023
Efficient Transformer-based 3D Object Detection with Dynamic Token Halting Mao Ye Gregory P. Meyer Yuning Chai Qiang Liu 37 9 0 09 Mar 2023
Hierarchical Training of Deep Neural Networks Using Early Exiting Yamin Sepehri P. Pad A. C. Yüzügüler P. Frossard L. A. Dunbar 41 9 0 04 Mar 2023
MetaGrad: Adaptive Gradient Quantization with Hypernetworks Kaixin Xu Alina Hui Xiu Lee Ziyuan Zhao Zhe Wang Min-man Wu Weisi Lin MQ 33 1 0 04 Mar 2023
Quantized Low-Rank Multivariate Regression with Random Dithering Junren Chen Yueqi Wang Michael Kwok-Po Ng 39 5 0 22 Feb 2023