Bit-pragmatic Deep Neural Network Computing

Bit-pragmatic Deep Neural Network Computing

20 October 2016

Jorge Albericio

Andreas Moshovos

Papers citing "Bit-pragmatic Deep Neural Network Computing"

15 / 15 papers shown

Title
Quantized symbolic time series approximation Erin Carson Xinye Chen Cheng Kang AI4TS 74 0 0 20 Nov 2024
BitMoD: Bit-serial Mixture-of-Datatype LLM Acceleration Yuzong Chen Ahmed F. AbouElhamayed Xilai Dai Yang Wang Marta Andronic G. Constantinides Mohamed S. Abdelfattah MQ 100 1 0 18 Nov 2024
PhotoFourier: A Photonic Joint Transform Correlator-Based Neural Network Accelerator Shurui Li Hangbo Yang C. Wong V. Sorger Puneet Gupta 12 12 0 10 Nov 2022
Accelerating Attention through Gradient-Based Learned Runtime Pruning Zheng Li Soroush Ghodrati Amir Yazdanbakhsh H. Esmaeilzadeh Mingu Kang 19 16 0 07 Apr 2022
Boggart: Towards General-Purpose Acceleration of Retrospective Video Analytics Neil Agarwal Ravi Netravali 19 14 0 21 Jun 2021
unzipFPGA: Enhancing FPGA-based CNN Engines with On-the-Fly Weights Generation Stylianos I. Venieris Javier Fernandez-Marques Nicholas D. Lane 8 11 0 09 Mar 2021
LazyBatching: An SLA-aware Batching System for Cloud Machine Learning Inference Yujeong Choi Yunseong Kim Minsoo Rhu 11 66 0 25 Oct 2020
Tensor Casting: Co-Designing Algorithm-Architecture for Personalized Recommendation Training Youngeun Kwon Yunjae Lee Minsoo Rhu 11 39 0 25 Oct 2020
FPRaker: A Processing Element For Accelerating Neural Network Training Omar Mohamed Awad Mostafa Mahmoud Isak Edo Vivancos Ali Hadi Zadeh Ciaran Bannon Anand Jayarajan Gennady Pekhimenko Andreas Moshovos 15 15 0 15 Oct 2020
Weight Equalizing Shift Scaler-Coupled Post-training Quantization Jihun Oh Sangjeong Lee Meejeong Park Pooni Walagaurav K. Kwon MQ 13 1 0 13 Aug 2020
Term Revealing: Furthering Quantization at Run Time on Quantized DNNs H. T. Kung Bradley McDanel S. Zhang MQ 6 9 0 13 Jul 2020
DeepRecSys: A System for Optimizing End-To-End At-scale Neural Recommendation Inference Udit Gupta Samuel Hsia V. Saraph Xiaodong Wang Brandon Reagen Gu-Yeon Wei Hsien-Hsin S. Lee David Brooks Carole-Jean Wu GNN 25 188 0 08 Jan 2020
Adaptive Loss-aware Quantization for Multi-bit Networks Zhongnan Qu Zimu Zhou Yun Cheng Lothar Thiele MQ 20 53 0 18 Dec 2019
Analyzing Machine Learning Workloads Using a Detailed GPU Simulator Jonathan Lew Deval Shah Suchita Pati Shaylin Cattell Mengchi Zhang ... Christopher Ng Negar Goli Matthew D. Sinclair Timothy G. Rogers Tor M. Aamodt 13 65 0 18 Nov 2018
TBD: Benchmarking and Analyzing Deep Neural Network Training Hongyu Zhu Mohamed Akrout Bojian Zheng Andrew Pelegris Amar Phanishayee Bianca Schroeder Gennady Pekhimenko 6 80 0 16 Mar 2018