Papers citing 'STEP: Learning N:M Structured Sparsity Masks from Scratch with Precondition'

Title
Sparse by Rule: Probability-Based N:M Pruning for Spiking Neural Networks Shuhan Ye Yi Yu Qixin Zhang Chenqi Kong Qiangqiang Wu Xudong Jiang Dacheng Tao 60 0 0 15 Nov 2025
Extreme Model Compression with Structured Sparsity at Low Precision Dan Liu Nikita Dvornik Xue Liu MQ 124 0 0 11 Nov 2025
PermLLM: Learnable Channel Permutation for N:M Sparse Large Language Models Lancheng Zou Shuo Yin Zehua Pei Tsung-Yi Ho Farzan Farnia Bei Yu 56 0 0 11 Oct 2025
SparseLoRA: Accelerating LLM Fine-Tuning with Contextual Sparsity Samir Khaki Xiuyu Li Junxian Guo Ligeng Zhu Chenfeng Xu Konstantinos N. Plataniotis Amir Yazdanbakhsh Kurt Keutzer Song Han Zhijian Liu 174 2 0 19 Jun 2025
MaskPro: Linear-Space Probabilistic Learning for Strict (N:M)-Sparsity on Large Language Models Yan Sun Qixin Zhang Zhiyuan Yu Xikun Zhang Li Shen Dacheng Tao 143 1 0 15 Jun 2025
TSENOR: Highly-Efficient Algorithm for Finding Transposable N:M Sparse Masks X. Meng Mehdi Makni Rahul Mazumder 158 0 0 29 May 2025
SLoPe: Double-Pruned Sparse Plus Lazy Low-Rank Adapter Pretraining of LLMsInternational Conference on Learning Representations (ICLR), 2024 Mohammad Mozaffari Amir Yazdanbakhsh Zhao Zhang M. Dehnavi 319 12 0 28 Jan 2025
MaskLLM: Learnable Semi-Structured Sparsity for Large Language ModelsNeural Information Processing Systems (NeurIPS), 2024 Gongfan Fang Hongxu Yin Saurav Muralidharan Greg Heinrich Jeff Pool Jan Kautz Pavlo Molchanov Xinchao Wang 141 29 0 26 Sep 2024
S-STE: Continuous Pruning Function for Efficient 2:4 Sparse Pre-trainingNeural Information Processing Systems (NeurIPS), 2024 Yuezhou Hu Jun-Jie Zhu Jianfei Chen 343 5 0 13 Sep 2024
Pruning Large Language Models with Semi-Structural Adaptive Sparse Training Weiyu Huang Yuezhou Hu Guohao Jian Jun Zhu Jianfei Chen 232 16 0 30 Jul 2024
Effective Interplay between Sparsity and Quantization: From Theory to Practice Simla Burcu Harma Ayan Chakraborty Elizaveta Kostenok Danila Mishin Dongho Ha ... Martin Jaggi Ming Liu Yunho Oh Suvinay Subramanian Amir Yazdanbakhsh MQ 293 18 0 31 May 2024
Accelerating Transformer Pre-training with 2:4 SparsityInternational Conference on Machine Learning (ICML), 2024 Yuezhou Hu Kang Zhao Weiyu Huang Jianfei Chen Jun Zhu 222 16 0 02 Apr 2024
Progressive Gradient Flow for Robust N:M Sparsity Training in Transformers Abhimanyu Bambhaniya Amir Yazdanbakhsh Suvinay Subramanian Sheng-Chun Kao Shivani Agrawal Utku Evci Tushar Krishna 273 23 0 07 Feb 2024
Lookahead: An Inference Acceleration Framework for Large Language Model with Lossless Generation Accuracy Yao-Min Zhao Zhitian Xie Chen Liang Chenyi Zhuang Jinjie Gu 269 28 0 20 Dec 2023
Scaling Laws for Sparsely-Connected Foundation ModelsInternational Conference on Learning Representations (ICLR), 2023 Elias Frantar C. Riquelme N. Houlsby Dan Alistarh Utku Evci 195 46 0 15 Sep 2023
Accurate Neural Network Pruning Requires Rethinking Sparse Optimization Denis Kuznedelev Eldar Kurtic Eugenia Iofinova Elias Frantar Alexandra Peste Dan Alistarh VLM 284 14 0 03 Aug 2023