EvoPress: Towards Optimal Dynamic Model Compression via Evolutionary
Search

EvoPress: Towards Optimal Dynamic Model Compression via Evolutionary Search

18 October 2024

Oliver Sieberling

Denis Kuznedelev

ArXiv (abs)PDF HTML Github (23★)

Papers citing "EvoPress: Towards Optimal Dynamic Model Compression via Evolutionary Search"

12 / 12 papers shown

Title
Outlier Weighed Layerwise Sparsity (OWL): A Missing Secret Sauce for Pruning LLMs to High Sparsity Lu Yin You Wu Zhenyu Zhang Cheng-Yu Hsieh Yaqing Wang ... Mykola Pechenizkiy Yi Liang Michael Bendersky Zhangyang Wang Shiwei Liu 119 102 0 08 Oct 2023
Comma Selection Outperforms Plus Selection on OneMax with Randomly Planted Optima J. Jorritsma Johannes Lengler Dirk Sudholt 53 15 0 19 Apr 2023
GPTQ: Accurate Post-Training Quantization for Generative Pre-trained Transformers Elias Frantar Saleh Ashkboos Torsten Hoefler Dan Alistarh MQ 146 1,008 0 31 Oct 2022
SPDY: Accurate Pruning with Speedup Guarantees Elias Frantar Dan Alistarh 58 35 0 31 Jan 2022
EfficientBERT: Progressively Searching Multilayer Perceptron via Warm-up Knowledge Distillation Chenhe Dong Guangrun Wang Hang Xu Jiefeng Peng Xiaozhe Ren Xiaodan Liang 75 28 0 15 Sep 2021
LANA: Latency Aware Network Acceleration Pavlo Molchanov Jimmy Hall Hongxu Yin Jan Kautz Nicolò Fusi Arash Vahdat 97 10 0 12 Jul 2021
Accelerated Sparse Neural Training: A Provable and Efficient Method to Find N:M Transposable Masks Itay Hubara Brian Chmiel Moshe Island Ron Banner S. Naor Daniel Soudry 115 119 0 16 Feb 2021
BRECQ: Pushing the Limit of Post-Training Quantization by Block Reconstruction Yuhang Li Ruihao Gong Xu Tan Yang Yang Peng Hu Qi Zhang F. Yu Wei Wang Shi Gu MQ 138 444 0 10 Feb 2021
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer Colin Raffel Noam M. Shazeer Adam Roberts Katherine Lee Sharan Narang Michael Matena Yanqi Zhou Wei Li Peter J. Liu AIMat 488 20,342 0 23 Oct 2019
AMC: AutoML for Model Compression and Acceleration on Mobile Devices Yihui He Ji Lin Zhijian Liu Hanrui Wang Li Li Song Han 100 1,349 0 10 Feb 2018
N2N Learning: Network to Network Compression via Policy Gradient Reinforcement Learning A. Ashok Nicholas Rhinehart Fares N. Beainy Kris Kitani 72 171 0 18 Sep 2017
Pointer Sentinel Mixture Models Stephen Merity Caiming Xiong James Bradbury R. Socher RALM 343 2,900 0 26 Sep 2016