SpArch: Efficient Architecture for Sparse Matrix Multiplication

20 February 2020

Song Han

Papers citing "SpArch: Efficient Architecture for Sparse Matrix Multiplication"

23 / 23 papers shown

Title
Oaken: Fast and Efficient LLM Serving with Online-Offline Hybrid KV Cache Quantization Minsu Kim Seongmin Hong RyeoWook Ko S. Choi Hunjong Lee Junsoo Kim Joo-Young Kim Jongse Park 62 0 0 24 Mar 2025
An Efficient Row-Based Sparse Fine-Tuning Cen-Jhih Li Aditya Bhaskara 60 0 0 17 Feb 2025
EXION: Exploiting Inter- and Intra-Iteration Output Sparsity for Diffusion Models Jaehoon Heo Adiwena Putra Jieon Yoon Sungwoong Yune Hangyeol Lee Ji-Hoon Kim Joo-Young Kim DiffM 60 1 0 10 Jan 2025
SPADE: Sparse Pillar-based 3D Object Detection Accelerator for Autonomous Driving Minjae Lee Seongmin Park Hyung-Se Kim Minyong Yoon Jangwhan Lee Junwon Choi Nam Sung Kim Mingu Kang Jungwook Choi 3DPC 26 5 0 12 May 2023
VEGETA: Vertically-Integrated Extensions for Sparse/Dense GEMM Tile Acceleration on CPUs Geonhwa Jeong S. Damani Abhimanyu Bambhaniya Eric Qin C. Hughes S. Subramoney Hyesoon Kim T. Krishna MoE 46 24 0 17 Feb 2023
Slice-and-Forge: Making Better Use of Caches for Graph Convolutional Network Accelerators Min-hee Yoo Jaeyong Song Hyeyoon Lee Jounghoo Lee Namhyung Kim Youngsok Kim Jinho Lee GNN 50 5 0 24 Jan 2023
LearningGroup: A Real-Time Sparse Training on FPGA via Learnable Weight Grouping for Multi-Agent Reinforcement Learning Jenny Yang Jaeuk Kim Joo-Young Kim 31 2 0 29 Oct 2022
ViTCoD: Vision Transformer Acceleration via Dedicated Algorithm and Accelerator Co-Design Haoran You Zhanyi Sun Huihong Shi Zhongzhi Yu Yang Katie Zhao Yongan Zhang Chaojian Li Baopu Li Yingyan Lin ViT 27 81 0 18 Oct 2022
Chiplets and the Codelet Model D. Fox J. M. Diaz Xiaoming Li 18 0 0 13 Sep 2022
OpSparse: a Highly Optimized Framework for Sparse General Matrix Multiplication on GPUs Zhaoyang Du Yijin Guan Tianchan Guan Dimin Niu Linyong Huang Hongzhong Zheng Yuan Xie 42 5 0 15 Jun 2022
Sparseloop: An Analytical Approach To Sparse Tensor Accelerator Modeling Yannan Nellie Wu Po-An Tsai A. Parashar Vivienne Sze J. Emer 25 57 0 12 May 2022
GROW: A Row-Stationary Sparse-Dense GEMM Accelerator for Memory-Efficient Graph Convolutional Neural Networks Ranggi Hwang M. Kang Jiwon Lee D. Kam Youngjoo Lee Minsoo Rhu GNN 18 22 0 01 Mar 2022
QOC: Quantum On-Chip Training with Parameter Shift and Gradient Pruning Hanrui Wang Zi-Chen Li Jiaqi Gu Yongshan Ding David Z. Pan Song Han 47 53 0 26 Feb 2022
SQuant: On-the-Fly Data-Free Quantization via Diagonal Hessian Approximation Cong Guo Yuxian Qiu Jingwen Leng Xiaotian Gao Chen Zhang Yunxin Liu Fan Yang Yuhao Zhu Minyi Guo MQ 74 71 0 14 Feb 2022
Phantom: A High-Performance Computational Core for Sparse Convolutional Neural Networks Mahmood Azhar Qureshi Arslan Munir 35 0 0 09 Nov 2021
QuantumNAS: Noise-Adaptive Search for Robust Quantum Circuits Hanrui Wang Yongshan Ding Jiaqi Gu Zirui Li Chengyue Wu David Z. Pan Frederic T. Chong Song Han 33 172 0 22 Jul 2021
S2TA: Exploiting Structured Sparsity for Energy-Efficient Mobile CNN Acceleration Zhi-Gang Liu P. Whatmough Yuhao Zhu Matthew Mattina MQ 27 75 0 16 Jul 2021
Dual-side Sparse Tensor Core Yang-Feng Wang Chen Zhang Zhiqiang Xie Cong Guo Yunxin Liu Jingwen Leng 25 75 0 20 May 2021
Extending Sparse Tensor Accelerators to Support Multiple Compression Formats Eric Qin Geonhwa Jeong William Won Sheng-Chun Kao Hyoukjun Kwon Sudarshan Srinivasan Dipankar Das G. Moon S. Rajamanickam T. Krishna 35 18 0 18 Mar 2021
SpAtten: Efficient Sparse Attention Architecture with Cascade Token and Head Pruning Hanrui Wang Zhekai Zhang Song Han 48 380 0 17 Dec 2020
APQ: Joint Search for Network Architecture, Pruning and Quantization Policy Tianzhe Wang Kuan-Chieh Wang Han Cai Ji Lin Zhijian Liu Song Han MQ 39 174 0 15 Jun 2020
GCN-RL Circuit Designer: Transferable Transistor Sizing with Graph Neural Networks and Reinforcement Learning Hanrui Wang Kuan-Chieh Wang Jiacheng Yang Linxiao Shen Nan Sun Hae-Seung Lee Song Han GNN 21 232 0 30 Apr 2020
Computation on Sparse Neural Networks: an Inspiration for Future Hardware Fei Sun Minghai Qin Tianyun Zhang Liu Liu Yen-kuang Chen Yuan Xie 42 7 0 24 Apr 2020