An Efficient Sparse Inference Software Accelerator for Transformer-based
Language Models on CPUs

An Efficient Sparse Inference Software Accelerator for Transformer-based Language Models on CPUs

28 June 2023

Moshe Wasserblat

ArXiv (abs)PDF HTML HuggingFace (4 upvotes)Github (2170★)

Papers citing "An Efficient Sparse Inference Software Accelerator for Transformer-based Language Models on CPUs"

1 / 1 papers shown

Title
Model Compression and Efficient Inference for Large Language Models: A Survey Wenxiao Wang Wei Chen Yicong Luo Yongliu Long Zhengkai Lin Liye Zhang Binbin Lin Deng Cai Xiaofei He MQ 248 85 0 15 Feb 2024