Dynamic Stashing Quantization for Efficient Transformer Training

9 March 2023

Papers citing "Dynamic Stashing Quantization for Efficient Transformer Training"

8 / 8 papers shown

Title
CUT: Pruning Pre-Trained Multi-Task Models into Compact Models for Edge Devices Jingxuan Zhou Weidong Bao Ji Wang Zhengyi Zhong 32 0 0 14 Apr 2025
Mobile Edge Intelligence for Large Language Models: A Contemporary Survey Guanqiao Qu Qiyuan Chen Wei Wei Zheng Lin Xianhao Chen Kaibin Huang 42 43 0 09 Jul 2024
A Comparative Analysis of Distributed Training Strategies for GPT-2 Ishan Patwardhan Shubham Gandhi Om M. Khare Amit Joshi Suraj Sawant 37 1 0 24 May 2024
Model Compression and Efficient Inference for Large Language Models: A Survey Wenxiao Wang Wei Chen Yicong Luo Yongliu Long Zhengkai Lin Liye Zhang Binbin Lin Deng Cai Xiaofei He MQ 41 48 0 15 Feb 2024
Hadamard Domain Training with Integers for Class Incremental Quantized Learning Martin Schiemer Clemens J. S. Schaefer Jayden Parker Vap Mark Horeni Yu Emma Wang Juan Ye Siddharth Joshi 36 2 0 05 Oct 2023
Understanding the Impact of Post-Training Quantization on Large Language Models Somnath Roy MQ 38 3 0 11 Sep 2023
BinaryBERT: Pushing the Limit of BERT Quantization Haoli Bai Wei Zhang Lu Hou Lifeng Shang Jing Jin Xin Jiang Qun Liu Michael Lyu Irwin King MQ 142 221 0 31 Dec 2020
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 299 6,984 0 20 Apr 2018