Balancing Efficiency and Flexibility for DNN Acceleration via Temporal
GPU-Systolic Array Integration

Balancing Efficiency and Flexibility for DNN Acceleration via Temporal GPU-Systolic Array Integration

18 February 2020

Cong Guo

Yangjie Zhou

Jingwen Leng

Yuhao Zhu

Papers citing "Balancing Efficiency and Flexibility for DNN Acceleration via Temporal GPU-Systolic Array Integration"

7 / 7 papers shown

Title
AdaptGear: Accelerating GNN Training via Adaptive Subgraph-Level Kernels on GPUs Yangjie Zhou Yaoxu Song Jingwen Leng Zihan Liu Weihao Cui Zhendong Zhang Cong Guo Quan Chen Li-Wei Li Minyi Guo GNN 51 1 0 27 May 2023
A High-Performance Accelerator for Super-Resolution Processing on Embedded GPU W. Zhao Qi Sun Yang Bai Wenbo Li Haisheng Zheng Bei Yu Martin D. F. Wong SupR 47 8 0 16 Mar 2023
ANT: Exploiting Adaptive Numerical Data Type for Low-bit Deep Neural Network Quantization Cong Guo Chen Zhang Jingwen Leng Zihan Liu Fan Yang Yun-Bo Liu Minyi Guo Yuhao Zhu MQ 20 58 0 30 Aug 2022
SQuant: On-the-Fly Data-Free Quantization via Diagonal Hessian Approximation Cong Guo Yuxian Qiu Jingwen Leng Xiaotian Gao Chen Zhang Yunxin Liu Fan Yang Yuhao Zhu Minyi Guo MQ 74 71 0 14 Feb 2022
Characterizing and Demystifying the Implicit Convolution Algorithm on Commercial Matrix-Multiplication Accelerators Yangjie Zhou Mengtian Yang Cong Guo Jingwen Leng Yun Liang Quan Chen Minyi Guo Yuhao Zhu 34 34 0 08 Oct 2021
Dual-side Sparse Tensor Core Yang-Feng Wang Chen Zhang Zhiqiang Xie Cong Guo Yunxin Liu Jingwen Leng 27 75 0 20 May 2021
Accelerating Sparse DNN Models without Hardware-Support via Tile-Wise Sparsity Cong Guo B. Hsueh Jingwen Leng Yuxian Qiu Yue Guan Zehuan Wang Xiaoying Jia Xipeng Li Minyi Guo Yuhao Zhu 35 83 0 29 Aug 2020