Title
Deep Learning Models on CPUs: A Methodology for Efficient Training Quchen Fu Ramesh Chukka Keith Achorn Thomas Atta-fosu Deepak R. Canchi Zhongwei Teng Jules White Douglas C. Schmidt 18 1 0 20 Jun 2022
Optimizing Deep Learning Recommender Systems' Training On CPU Cluster Architectures Dhiraj D. Kalamkar E. Georganas S. Srinivasan Jianping Chen Mikhail Shiryaev A. Heinecke 48 47 0 10 May 2020
Optimizing Multi-GPU Parallelization Strategies for Deep Learning Training Saptadeep Pal Eiman Ebrahimi A. Zulfiqar Yaosheng Fu Victor Zhang Szymon Migacz D. Nellans Puneet Gupta 34 55 0 30 Jul 2019
Scalable Distributed DNN Training using TensorFlow and CUDA-Aware MPI: Characterization, Designs, and Performance Evaluation A. A. Awan Jeroen Bédorf Ching-Hsiang Chu Hari Subramoni D. Panda GNN 25 45 0 25 Oct 2018
On Large-Batch Training for Deep Learning: Generalization Gap and Sharp Minima N. Keskar Dheevatsa Mudigere J. Nocedal M. Smelyanskiy P. T. P. Tang ODL 281 2,889 0 15 Sep 2016