VEGETA: Vertically-Integrated Extensions for Sparse/Dense GEMM Tile Acceleration on CPUs

17 February 2023

Papers citing "VEGETA: Vertically-Integrated Extensions for Sparse/Dense GEMM Tile Acceleration on CPUs"

6 / 6 papers shown

Title
Periodic Online Testing for Sparse Systolic Tensor Arrays C. Peltekis Chrysostomos Nicopoulos G. Dimitrakopoulos 52 0 0 25 Apr 2025
Accelerating LLM Inference with Flexible N:M Sparsity via A Fully Digital Compute-in-Memory Accelerator Akshat Ramachandran Souvik Kundu Arnab Raha Shamik Kundu Deepak K. Mathaikutty Tushar Krishna 29 1 0 19 Apr 2025
Abstracting Sparse DNN Acceleration via Structured Sparse Tensor Decomposition Geonhwa Jeong Po-An Tsai Abhimanyu Bambhaniya S. Keckler Tushar Krishna 33 7 0 12 Mar 2024
Progressive Gradient Flow for Robust N:M Sparsity Training in Transformers Abhimanyu Bambhaniya Amir Yazdanbakhsh Suvinay Subramanian Sheng-Chun Kao Shivani Agrawal Utku Evci Tushar Krishna 54 16 0 07 Feb 2024
Scaling Down to Scale Up: A Cost-Benefit Analysis of Replacing OpenAI's LLM with Open Source SLMs in Production Chandra Irugalbandara Ashish Mahendra Roland Daynauth T. Arachchige Jayanaka L. Dantanarayana K. Flautner Lingjia Tang Yiping Kang Jason Mars ELM 28 14 0 20 Dec 2023
RASA: Efficient Register-Aware Systolic Array Matrix Engine for CPU Geonhwa Jeong Eric Qin A. Samajdar C. Hughes S. Subramoney Hyesoon Kim T. Krishna 50 18 0 05 Oct 2021