Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference

15 December 2017

Papers citing "Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference"

50 / 1,298 papers shown

Title
Pack-PTQ: Advancing Post-training Quantization of Neural Networks by Pack-wise Reconstruction Changjun Li Runqing Jiang Zhuo Song Pengpeng Yu Ye Zhang Yulan Guo MQ 154 0 0 01 May 2025
DNAD: Differentiable Neural Architecture Distillation Xuan Rao Bo Zhao Derong Liu 96 1 0 25 Apr 2025
Silenzio: Secure Non-Interactive Outsourced MLP Training Jonas Sander T. Eisenbarth 55 0 0 24 Apr 2025
AlphaGrad: Non-Linear Gradient Normalization Optimizer Soham Sane ODL 147 0 0 22 Apr 2025
FGMP: Fine-Grained Mixed-Precision Weight and Activation Quantization for Hardware-Accelerated LLM Inference Coleman Hooper Charbel Sakr Ben Keller Rangharajan Venkatesan Kurt Keutzer Siyang Song Brucek Khailany MQ 101 0 0 19 Apr 2025
Collaborative Learning of On-Device Small Model and Cloud-Based Large Model: Advances and Future Directions Chaoyue Niu Yucheng Ding Junhui Lu Zhengxiang Huang Hang Zeng Yutong Dai Xuezhen Tu Chengfei Lv Fan Wu Guihai Chen 128 1 0 17 Apr 2025
Tin-Tin: Towards Tiny Learning on Tiny Devices with Integer-based Neural Network Training Yi Hu Jinhang Zuo Eddie Zhang Bob Iannucci Carlee Joe-Wong 102 0 0 13 Apr 2025
Quantization Error Propagation: Revisiting Layer-Wise Post-Training Quantization Yamato Arai Yuma Ichikawa MQ 107 0 0 13 Apr 2025
Low-Bit Integerization of Vision Transformers using Operand Reodering for Efficient Hardware Ching-Yi Lin Sahil Shah MQ 133 0 0 11 Apr 2025
PoGO: A Scalable Proof of Useful Work via Quantized Gradient Descent and Merkle Proofs José I. Orlicki 68 0 0 10 Apr 2025
Pychop: Emulating Low-Precision Arithmetic in Numerical Methods and Neural Networks Erin Carson Xinye Chen 168 0 0 10 Apr 2025
Generative Artificial Intelligence for Internet of Things Computing: A Systematic Survey Fabrizio Mangione Claudio Savaglio Giancarlo Fortino 64 1 0 10 Apr 2025
Efficient Deployment of Spiking Neural Networks on SpiNNaker2 for DVS Gesture Recognition Using Neuromorphic Intermediate Representation Sirine Arfa Bernhard Vogginger Chen Liu Johannes Partzsch Mark Schöne Christian Mayr 83 0 0 09 Apr 2025
MetaCLBench: Meta Continual Learning Benchmark on Resource-Constrained Edge Devices Sijia Li Young D. Kwon Lik-Hang Lee Pan Hui 91 0 0 31 Mar 2025
Model Hemorrhage and the Robustness Limits of Large Language Models Ziyang Ma Hui Yuan Lefei Zhang Gui-Song Xia Bo Du Liangpei Zhang Dacheng Tao 120 1 0 31 Mar 2025
Gemma 3 Technical Report Gemma Team Aishwarya B Kamath Johan Ferret Shreya Pathak Nino Vieillard ... Harshal Tushar Lehri Hussein Hazimeh Ian Ballantyne Idan Szpektor Ivan Nardini VLM 195 137 0 25 Mar 2025
PRIOT: Pruning-Based Integer-Only Transfer Learning for Embedded Systems Honoka Anada Sefutsu Ryu Masayuki Usui Tatsuya Kaneko Shinya Takamaeda-Yamazaki 111 1 0 21 Mar 2025
QuartDepth: Post-Training Quantization for Real-Time Depth Estimation on the Edge Xuan Shen Weize Ma Jing Liu Changdi Yang Rui Ding ... Wei Niu Yanzhi Wang Pu Zhao Jun Lin Jiuxiang Gu MQ 99 0 0 20 Mar 2025
FP4DiT: Towards Effective Floating Point Quantization for Diffusion Transformers Ruichen Chen Keith G. Mills Di Niu MQ 152 0 0 19 Mar 2025
Real-Time Multi-Object Tracking using YOLOv8 and SORT on a SoC FPGA Michal Danilowicz T. Kryjak VOT 97 0 0 17 Mar 2025
Bridging Language Models and Financial Analysis Alejandro Lopez-Lira Jihoon Kwon Sangwoon Yoon Jy-yong Sohn Chanyeol Choi AIFin 117 1 0 14 Mar 2025
Accurate INT8 Training Through Dynamic Block-Level Fallback Pengle Zhang Jia Wei Jintao Zhang Jun-Jie Zhu Jianfei Chen MQ 173 9 0 11 Mar 2025
Breaking the Limits of Quantization-Aware Defenses: QADT-R for Robustness Against Patch-Based Adversarial Attacks in QNNs Amira Guesmi B. Ouni Muhammad Shafique MQ AAML 132 0 0 10 Mar 2025
Helios 2.0: A Robust, Ultra-Low Power Gesture Recognition System Optimised for Event-Sensor based Wearables Prarthana Bhattacharyya Joshua Mitton Ryan Page Owen Morgan Oliver Powell ... Kemi Jacobs Paolo Baesso Taru Muhonen R. Vigars Louis Berridge 78 0 0 10 Mar 2025
SAQ-SAM: Semantically-Aligned Quantization for Segment Anything Model Jing Zhang Zhiyu Li Qingyi Gu MQ VLM 78 0 0 09 Mar 2025
Hardware-Accelerated Event-Graph Neural Networks for Low-Latency Time-Series Classification on SoC FPGA Hiroshi Nakano Krzysztof Blachut K. Jeziorek Piotr Wzorek Manon Dampfhoffer Thomas Mesquida Hiroaki Nishi T. Kryjak Thomas Dalgaty GNN 98 1 0 09 Mar 2025
MoFE: Mixture of Frozen Experts Architecture Jean Seo Jaeyoon Kim Hyopil Shin MoE 503 0 0 09 Mar 2025
QArtSR: Quantization via Reverse-Module and Timestep-Retraining in One-Step Diffusion based Image Super-Resolution Libo Zhu Haotong Qin Kaicheng Yang Wenbo Li Yong Guo Yulun Zhang Susanto Rahardja Xiaokang Yang MQ DiffM 133 0 0 07 Mar 2025
MergeQuant: Accurate 4-bit Static Quantization of Large Language Models by Channel-wise Calibration Jinguang Wang Jiangming Wang Haifeng Sun Tingting Yang Zirui Zhuang Wanyi Ning Yuexi Yin Q. Qi Jianxin Liao MQ MoMe 99 0 0 07 Mar 2025
LVLM-Compress-Bench: Benchmarking the Broader Impact of Large Vision-Language Model Compression Souvik Kundu Anahita Bhiwandiwalla Sungduk Yu Phillip Howard Tiep Le S. N. Sridhar David Cobbley Hao Kang Vasudev Lal MQ 90 2 0 06 Mar 2025
Security and Real-time FPGA integration for Learned Image Compression Alaa Mazouz Carl De Sousa Tria Sumanta Chaudhuri Attilio Fiandrotti Marco Cagnanzzo Mihai P. Mitrea Enzo Tartaglione 74 1 0 06 Mar 2025
Beyond Matryoshka: Revisiting Sparse Coding for Adaptive Representation Tiansheng Wen Yifei Wang Zequn Zeng Zhong Peng Yudi Su Xinyang Liu Bo Chen Hongwei Liu Stefanie Jegelka Chenyu You CLL 233 4 0 03 Mar 2025
Lossy Neural Compression for Geospatial Analytics: A Review Carlos Gomes Isabelle Wittmann Damien Robert Johannes Jakubik Tim Reichelt ... Romeo Kienzler Rania Briq Sabrina Benassou Michele Lazzarini C. Albrecht 145 2 0 03 Mar 2025
Optimal Brain Apoptosis Mingyuan Sun Zheng Fang Jiaxu Wang Junjie Jiang Delei Kong Chenming Hu Yuetong Fang Renjing Xu AAML 107 0 0 25 Feb 2025
A Survey of Zero-Knowledge Proof Based Verifiable Machine Learning Zhizhi Peng Taotao Wang Chonghe Zhao Guofu Liao Zibin Lin Yixiao Liu Bin Cao Long Shi Qing Yang Shengli Zhang 115 5 0 25 Feb 2025
Optimizing DNN Inference on Multi-Accelerator SoCs at Training-time Matteo Risso Luca Bompani Daniele Jahier Pagliari 117 0 0 24 Feb 2025
Verification of Bit-Flip Attacks against Quantized Neural Networks Yedi Zhang Lei Huang Pengfei Gao Fu Song Jun Sun Jin Song Dong AAML 104 0 0 22 Feb 2025
GSQ-Tuning: Group-Shared Exponents Integer in Fully Quantized Training for LLMs On-Device Fine-tuning Sifan Zhou Shuo Wang Zhihang Yuan Mingjia Shi Yuzhang Shang Dawei Yang MQ ALM 208 0 0 18 Feb 2025
Hybrid Offline-online Scheduling Method for Large Language Model Inference Optimization Bowen Pang Kai Li Ruifeng She Feifan Wang OffRL 113 2 0 14 Feb 2025
Vision-Language Models for Edge Networks: A Comprehensive Survey Ahmed Sharshar Latif U. Khan Waseem Ullah Mohsen Guizani VLM 160 3 0 11 Feb 2025
Membership Inference Risks in Quantized Models: A Theoretical and Empirical Study Eric Aubinais Philippe Formont Pablo Piantanida Elisabeth Gassiat 112 1 0 10 Feb 2025
Finetuning and Quantization of EEG-Based Foundational BioSignal Models on ECG and PPG Data for Blood Pressure Estimation Bálint Tóth Dominik Senti T. Ingolfsson Jeffrey Zweidler Alexandre Elsig Luca Benini Yawei Li 67 1 0 10 Feb 2025
Contrastive Representation Distillation via Multi-Scale Feature Decoupling Cuipeng Wang Tieyuan Chen Haipeng Wang 103 0 0 09 Feb 2025
Performance Analysis of Traditional VQA Models Under Limited Computational Resources Jihao Gu 155 0 0 09 Feb 2025
Nearly Lossless Adaptive Bit Switching Haiduo Huang Zhenhua Liu Tian Xia Wenzhe zhao Pengju Ren MQ 103 0 0 03 Feb 2025
LLM-based Affective Text Generation Quality Based on Different Quantization Values Yarik Menchaca Resendiz Roman Klinger MQ 259 1 0 31 Jan 2025
RAMQA: A Unified Framework for Retrieval-Augmented Multi-Modal Question Answering Yang Bai Christan Earl Grant Daisy Zhe Wang RALM 124 1 0 23 Jan 2025
UAV-Assisted Real-Time Disaster Detection Using Optimized Transformer Model Branislava Jankovic Sabina Jangirova Waseem Ullah Latif U. Khan Mohsen Guizani 111 1 0 21 Jan 2025
Multi-stage Training of Bilingual Islamic LLM for Neural Passage Retrieval Vera Pavlova 88 1 0 20 Jan 2025
UPAQ: A Framework for Real-Time and Energy-Efficient 3D Object Detection in Autonomous Vehicles Abhishek Balasubramaniam Febin P. Sunny S. Pasricha 3DPC 99 0 0 08 Jan 2025