Title
The Grand Illusion: The Myth of Software Portability and Implications for ML Progress Fraser Mince Dzung Dinh Jonas Kgomo Neil Thompson Sara Hooker 58 6 0 12 Sep 2023
Efficiency is Not Enough: A Critical Perspective of Environmentally Sustainable AI Dustin Wright Christian Igel Gabrielle Samuel Raghavendra Selvan 120 16 0 05 Sep 2023
LoopTune: Optimizing Tensor Computations with Reinforcement Learning Dejan Grubisic Bram Wasti Chris Cummins John Mellor-Crummey A. Zlateski 65 1 0 04 Sep 2023
Reducing shared memory footprint to leverage high throughput on Tensor Cores and its flexible API extension library Hiroyuki Ootomo Rio Yokota 61 8 0 29 Aug 2023
Massively Parallel Continuous Local Search for Hybrid SAT Solving on GPUs Yunuo Cen Zhiwei Zhang Xuanyao Fong 54 3 0 29 Aug 2023
Throughput Maximization of DNN Inference: Batching or Multi-Tenancy? Seyed Morteza Nabavinejad M. Ebrahimi Sherief Reda 48 1 0 26 Aug 2023
TpuGraphs: A Performance Prediction Dataset on Large Tensor Computational Graphs P. Phothilimthana Sami Abu-El-Haija Kaidi Cao Bahare Fatemi Mike Burrows Charith Mendis Bryan Perozzi GNN AI4TS 127 20 0 25 Aug 2023
An Open-Source ML-Based Full-Stack Optimization Framework for Machine Learning Accelerators H. Esmaeilzadeh Soroush Ghodrati A. Kahng Joo-Young Kim Sean Kinzer ... R. Mahapatra Susmita Dey Manasi S. Sapatnekar Zhiang Wang Ziqing Zeng 60 4 0 23 Aug 2023
Accelerating Exact Combinatorial Optimization via RL-based Initialization -- A Case Study in Scheduling Jiaqi Yin Cunxi Yu 48 2 0 19 Aug 2023
A Survey of Spanish Clinical Language Models Guillem García Subies Á. Jiménez Paloma Martínez LM&MA ELM LRM 57 0 0 04 Aug 2023
DiviML: A Module-based Heuristic for Mapping Neural Networks onto Heterogeneous Platforms Yassine Ghannane Mohamed S. Abdelfattah 54 2 0 31 Jul 2023
HUGE: Huge Unsupervised Graph Embeddings with TPUs Brandon Mayer Anton Tsitsulin Hendrik Fichtenberger Jonathan J. Halcrow Bryan Perozzi GNN 60 1 0 26 Jul 2023
Mitigating Memory Wall Effects in CNN Engines with On-the-Fly Weights Generation Stylianos I. Venieris Javier Fernandez-Marques Nicholas D. Lane MQ 62 3 0 25 Jul 2023
Leveraging Deep Learning and Online Source Sentiment for Financial Portfolio Management K. Srivatsan Loukia Avramelou Georgios Rodinos Maria Tzelepi Muzammal Naseer ... Manos Kirtas Pavlos Tosidis Avraam Tsantekidis Nikolaos Passalis Anastasios Tefas AIFin 58 2 0 23 Jul 2023
Approximate Computing Survey, Part II: Application-Specific & Architectural Approximation Techniques and Applications Vasileios Leon Muhammad Abdullah Hanif Giorgos Armeniakos Xun Jiao Mohamed Bennai K. Pekmestzi Dimitrios Soudris 104 3 0 20 Jul 2023
MGit: A Model Versioning and Management System Wei Hao Daniel Mendoza Rafael Ferreira da Silva Deepak Narayanan Amar Phanishayee VLM 49 1 0 14 Jul 2023
Rational Neural Network Controllers M. Newton A. Papachristodoulou OOD AAML 72 1 0 12 Jul 2023
MG3MConv: Multi-Grained Matrix-Multiplication-Mapping Convolution Algorithm toward the SW26010 Processor Zheng-Kuo Wu 32 1 0 11 Jul 2023
Performance Analysis of DNN Inference/Training with Convolution and non-Convolution Operations H. Esmaeilzadeh Soroush Ghodrati A. Kahng Sean Kinzer Susmita Dey Manasi S. Sapatnekar Zhiang Wang 57 2 0 29 Jun 2023
CIMulator: A Comprehensive Simulation Platform for Computing-In-Memory Circuit Macros with Low Bit-Width and Real Memory Materials Hoang-Hiep Le M. Baig Wei-Chen Hong Chengshian Tsai Cheng-Jui Yeh ... Nan-Yow Chen Wen-Jay Lee Ing-Chao Lin Da-Wei Chang D. Lu 25 1 0 26 Jun 2023
Accelerating SNN Training with Stochastic Parallelizable Spiking Neurons Sidi Yaya Arnaud Yarga Sean U. N. Wood 70 9 0 22 Jun 2023
Subgraph Stationary Hardware-Software Inference Co-Design Payman Behnam Jianming Tong Alind Khare Yang Chen Yue Pan Pranav Gadikar Abhimanyu Bambhaniya T. Krishna Alexey Tumanov 51 4 0 21 Jun 2023
Opportunities of Renewable Energy Powered DNN Inference Seyed Morteza Nabavinejad Tian Guo AI4CE 44 2 0 21 Jun 2023
DGEMM on Integer Matrix Multiplication Unit Hiroyuki Ootomo K. Ozaki Rio Yokota 72 14 0 21 Jun 2023
ArchGym: An Open-Source Gymnasium for Machine Learning Assisted Architecture Design Srivatsan Krishnan Amir Yazdanbaksh Shvetank Prakash Jason J. Jabbour Ikechukwu Uchendu ... Behzad Boroujerdian Daniel Richins Devashree Tripathy Aleksandra Faust Vijay Janapa Reddi 116 14 0 15 Jun 2023
KAPLA: Pragmatic Representation and Fast Solving of Scalable NN Accelerator Dataflow Zhiyao Li Mingyu Gao 45 1 0 09 Jun 2023
Revisiting Neural Retrieval on Accelerators Jiaqi Zhai Zhaojie Gong Yueming Wang Xiao Sun Zheng Yan Fu Li Xing Liu 79 12 0 06 Jun 2023
Streaming Task Graph Scheduling for Dataflow Architectures T. De Matteis Lukas Gianinazzi Johannes de Fine Licht Torsten Hoefler GNN 41 3 0 05 Jun 2023
Edit Distance based RL for RNNT decoding DongSeon Hwang Changwan Ryu K. Sim 47 0 0 31 May 2023
Intriguing Properties of Quantization at Scale Arash Ahmadian Saurabh Dash Hongyu Chen Bharat Venkitesh Stephen Gou Phil Blunsom Ahmet Üstün Sara Hooker MQ 121 38 0 30 May 2023
NicePIM: Design Space Exploration for Processing-In-Memory DNN Accelerators with 3D-Stacked-DRAM Junpeng Wang Mengke Ge Bo Ding Qi Xu Song Chen Yi Kang 47 6 0 30 May 2023
Global-QSGD: Practical Floatless Quantization for Distributed Learning with Theoretical Guarantees Jihao Xin Marco Canini Peter Richtárik Samuel Horváth 88 2 0 29 May 2023
Multiplication-Free Transformer Training via Piecewise Affine Operations Atli Kosson Martin Jaggi 34 5 0 26 May 2023
PQA: Exploring the Potential of Product Quantization in DNN Hardware Acceleration Ahmed F. AbouElhamayed Angela Cui Javier Fernandez-Marques Nicholas D. Lane Mohamed S. Abdelfattah MQ 78 6 0 25 May 2023
NeuralMatrix: Compute the Entire Neural Networks with Linear Matrix Operations for Efficient Inference Ruiqi Sun Siwei Ye Jie Zhao Xin He Yiran Li An Zou 90 0 0 23 May 2023
HighLight: Efficient and Flexible DNN Acceleration with Hierarchical Structured Sparsity Yannan Nellie Wu Po-An Tsai Saurav Muralidharan A. Parashar Vivienne Sze J. Emer 52 27 0 22 May 2023
FAQ: Mitigating the Impact of Faults in the Weight Memory of DNN Accelerators through Fault-Aware Quantization Muhammad Abdullah Hanif Mohamed Bennai AAML 63 2 0 21 May 2023
ProgSG: Cross-Modality Representation Learning for Programs in Electronic Design Automation Yunsheng Bai Atefeh Sohrabizadeh Zongyue Qin Ziniu Hu Yizhou Sun Jason Cong 112 1 0 18 May 2023
Boost Vision Transformer with GPU-Friendly Sparsity and Quantization Chong Yu Tao Chen Zhongxue Gan Jiayuan Fan MQ ViT 78 25 0 18 May 2023
Fast Matrix Multiplication via Compiler-only Layered Data Reorganization and Intrinsic Lowering Braedy Kuzma Ivan Korostelev J. P. L. Carvalho José Moreira Christopher Barton Guido Araujo J. N. Amaral 20 3 0 15 May 2023
MoCA: Memory-Centric, Adaptive Execution for Multi-Tenant Deep Neural Networks Seah Kim Hasan Genç Vadim Nikiforov Krste Asanović B. Nikolić Y. Shao 57 21 0 10 May 2023
A Systematic Literature Review on Hardware Reliability Assessment Methods for Deep Neural Networks Mohammad Hasan Ahmadilivani Mahdi Taheri J. Raik Masoud Daneshtalab M. Jenihhin 89 28 0 09 May 2023
Energy-Latency Attacks to On-Device Neural Networks via Sponge Poisoning Zijian Wang Shuo Huang Yu-Jen Huang Helei Cui SILM 34 11 0 06 May 2023
Hardware Acceleration of Explainable Artificial Intelligence Zhixin Pan Prabhat Mishra 94 0 0 04 May 2023
Cheaply Evaluating Inference Efficiency Metrics for Autoregressive Transformer APIs Deepak Narayanan Keshav Santhanam Peter Henderson Rishi Bommasani Tony Lee Percy Liang 192 3 0 03 May 2023
Rubik's Optical Neural Networks: Multi-task Learning with Physics-aware Rotation Architecture Yingjie Li Weilu Gao Cunxi Yu 74 4 0 25 Apr 2023
SALSA: Simulated Annealing based Loop-Ordering Scheduler for DNN Accelerators Victor J. B. Jung Arne Symons L. Mei Marian Verhelst Luca Benini 53 3 0 20 Apr 2023
eFAT: Improving the Effectiveness of Fault-Aware Training for Mitigating Permanent Faults in DNN Hardware Accelerators Muhammad Abdullah Hanif Mohamed Bennai 24 3 0 20 Apr 2023
Massive Data-Centric Parallelism in the Chiplet Era Marcelo Orenes-Vera Esin Tureci D. Wentzlaff M. Martonosi 53 6 0 19 Apr 2023
Heterogeneous Integration of In-Memory Analog Computing Architectures with Tensor Processing Units Mohammed E. Elbtity Brendan Reidy Md Hasibul Amin Ramtin Zand 82 8 0 18 Apr 2023