Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2503.16672
Cited By

Accelerating Transformer Inference and Training with 2:4 Activation Sparsity

Accelerating Transformer Inference and Training with 2:4 Activation Sparsity

20 March 2025

Dhruv Choudhary

Francisco Massa

Patrick Labatut

ArXiv (abs)PDF HTML

Papers citing "Accelerating Transformer Inference and Training with 2:4 Activation Sparsity"

5 / 5 papers shown

Lightweight error mitigation strategies for post-training N:M activation sparsity in LLMs

Lightweight error mitigation strategies for post-training N:M activation sparsity in LLMs

Kristina Kazistova

Ekaterina Galaeva

Alina Kostromina

Vladimir Smirnov

136

0

0

26 Sep 2025

Amber Pruner: Leveraging N:M Activation Sparsity for Efficient Prefill in Large Language Models

Amber Pruner: Leveraging N:M Activation Sparsity for Efficient Prefill in Large Language Models

140

2

0

04 Aug 2025

TorchAO: PyTorch-Native Training-to-Serving Model Optimization

TorchAO: PyTorch-Native Training-to-Serving Model Optimization

Daniel Vega-Myhre

Charles David Hernandez

...

Christian Puhrsch

Aleksandar Samardžić

170

4

0

21 Jul 2025

DuoGPT: Training-free Dual Sparsity through Activation-aware Pruning in LLMs

DuoGPT: Training-free Dual Sparsity through Activation-aware Pruning in LLMs

Priyadarshini Panda

230

2

0

25 Jun 2025

SLoPe: Double-Pruned Sparse Plus Lazy Low-Rank Adapter Pretraining of LLMs

SLoPe: Double-Pruned Sparse Plus Lazy Low-Rank Adapter Pretraining of LLMsInternational Conference on Learning Representations (ICLR), 2024

Mohammad Mozaffari

Amir Yazdanbakhsh

379

13

0

28 Jan 2025