Workload-Aware Hardware Accelerator Mining for Distributed Deep Learning Training

23 April 2024

Papers citing "Workload-Aware Hardware Accelerator Mining for Distributed Deep Learning Training"

4 / 4 papers shown

Title
HASCO: Towards Agile HArdware and Software CO-design for Tensor Computation Qingcheng Xiao Wenlei Bao Bingzhe Wu Pengcheng Xu Xuehai Qian Yun Liang 37 65 0 04 May 2021
Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism M. Shoeybi M. Patwary Raul Puri P. LeGresley Jared Casper Bryan Catanzaro MoE 245 1,821 0 17 Sep 2019
MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications Andrew G. Howard Menglong Zhu Bo Chen Dmitry Kalenichenko Weijun Wang Tobias Weyand M. Andreetto Hartwig Adam 3DH 950 20,567 0 17 Apr 2017
Aggregated Residual Transformations for Deep Neural Networks Saining Xie Ross B. Girshick Piotr Dollár Z. Tu Kaiming He 297 10,220 0 16 Nov 2016