Balanced Sparsity for Efficient DNN Inference on GPU

Balanced Sparsity for Efficient DNN Inference on GPU

1 November 2018

Papers citing "Balanced Sparsity for Efficient DNN Inference on GPU"

13 / 13 papers shown

Title
Effective Interplay between Sparsity and Quantization: From Theory to Practice Simla Burcu Harma Ayan Chakraborty Elizaveta Kostenok Danila Mishin Dongho Ha ... Martin Jaggi Ming Liu Yunho Oh Suvinay Subramanian Amir Yazdanbakhsh MQ 44 5 0 31 May 2024
STen: Productive and Efficient Sparsity in PyTorch Andrei Ivanov Nikoli Dryden Tal Ben-Nun Saleh Ashkboos Torsten Hoefler 32 4 0 15 Apr 2023
$Physics-aware Roughness Optimization for Diffractive Optical Neural Networks$ Physics-aware Roughness Optimization for Diffractive Optical Neural Networks Shangli Zhou Yingjie Li Minhan Lou Weilu Gao Zhijie Shi Cunxi Yu Caiwen Ding 27 2 0 04 Apr 2023
Pruning Compact ConvNets for Efficient Inference Sayan Ghosh Karthik Prasad Xiaoliang Dai Peizhao Zhang Bichen Wu Graham Cormode Peter Vajda VLM 19 4 0 11 Jan 2023
MegaBlocks: Efficient Sparse Training with Mixture-of-Experts Trevor Gale Deepak Narayanan C. Young Matei A. Zaharia MoE 14 102 0 29 Nov 2022
Shfl-BW: Accelerating Deep Neural Network Inference with Tensor-Core Aware Weight Pruning Guyue Huang Haoran Li Minghai Qin Fei Sun Yufei Din Yuan Xie 25 18 0 09 Mar 2022
Two Sparsities Are Better Than One: Unlocking the Performance Benefits of Sparse-Sparse Networks Kevin Lee Hunter Lawrence Spracklen Subutai Ahmad 23 20 0 27 Dec 2021
Dual-side Sparse Tensor Core Yang-Feng Wang Chen Zhang Zhiqiang Xie Cong Guo Yunxin Liu Jingwen Leng 12 74 0 20 May 2021
FjORD: Fair and Accurate Federated Learning under heterogeneous targets with Ordered Dropout Samuel Horváth Stefanos Laskaridis Mario Almeida Ilias Leondiadis Stylianos I. Venieris Nicholas D. Lane 189 268 0 26 Feb 2021
Accelerating Sparse DNN Models without Hardware-Support via Tile-Wise Sparsity Cong Guo B. Hsueh Jingwen Leng Yuxian Qiu Yue Guan Zehuan Wang Xiaoying Jia Xipeng Li M. Guo Yuhao Zhu 35 83 0 29 Aug 2020
SparseRT: Accelerating Unstructured Sparsity on GPUs for Deep Learning Inference Ziheng Wang 24 66 0 26 Aug 2020
Sparse GPU Kernels for Deep Learning Trevor Gale Matei A. Zaharia C. Young Erich Elsen 17 227 0 18 Jun 2020
FeatherWave: An efficient high-fidelity neural vocoder with multi-band linear prediction Qiao Tian Zewang Zhang Heng Lu Linghui Chen Shan Liu 14 22 0 12 May 2020