FlexRound: Learnable Rounding based on Element-wise Division for
Post-Training Quantization

v1v2 (latest)

FlexRound: Learnable Rounding based on Element-wise Division for Post-Training Quantization

1 June 2023

ArXiv (abs)PDF HTML

Papers citing "FlexRound: Learnable Rounding based on Element-wise Division for Post-Training Quantization"

9 / 9 papers shown

Title
Accurate Sublayer Pruning for Large Language Models by Exploiting Latency and Tunability Information Seungcheol Park Sojin Lee Jongjin Kim Jinsik Lee Hyunjik Jo U. Kang 81 2 0 04 Jun 2025
Unifying Uniform and Binary-coding Quantization for Accurate Compression of Large Language Models Seungcheol Park Jeongin Bae Beomseok Kwon Minjun Kim Byeongwook Kim S. Kwon U. Kang Dongsoo Lee MQ 149 0 0 04 Jun 2025
Mix-QSAM: Mixed-Precision Quantization of the Segment Anything Model Navin Ranjan Andreas E. Savakis MQ VLM 145 0 0 08 May 2025
Post-Training Quantization for Diffusion Transformer via Hierarchical Timestep Grouping Ning Ding Jing Han Yuchuan Tian Chao Xu Kai Han Yehui Tang MQ 155 0 0 10 Mar 2025
LRQ: Optimizing Post-Training Quantization for Large Language Models by Learning Low-Rank Weight-Scaling Matrices Jung Hyun Lee Jeonghoon Kim J. Yang S. Kwon Eunho Yang Kang Min Yoo Dongsoo Lee MQ 138 3 0 16 Jul 2024
EfficientQAT: Efficient Quantization-Aware Training for Large Language Models Mengzhao Chen Wenqi Shao Peng Xu Jiahao Wang Peng Gao Kaipeng Zhang Ping Luo MQ 160 35 0 10 Jul 2024
PTQ4SAM: Post-Training Quantization for Segment Anything Chengtao Lv Hong Chen Jinyang Guo Yifu Ding Xianglong Liu VLM MQ 85 16 0 06 May 2024
Rethinking Channel Dimensions to Isolate Outliers for Low-bit Weight Quantization of Large Language Models Jung Hwan Heo Jeonghoon Kim Beomseok Kwon Byeongwook Kim Se Jung Kwon Dongsoo Lee MQ 131 10 0 27 Sep 2023
Memory-Efficient Fine-Tuning of Compressed Large Language Models via sub-4-bit Integer Quantization Jeonghoon Kim J. H. Lee Sungdong Kim Joonsuk Park Kang Min Yoo S. Kwon Dongsoo Lee MQ 157 106 0 23 May 2023