Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Home
Papers

All Papers

0 / 0 papers shown

Twitter GitHub LinkedIn Bluesky Youtube

Home
Papers
2401.15347
Cited By

A Comprehensive Survey of Compression Algorithms for Language Models

27 January 2024

Papers citing "A Comprehensive Survey of Compression Algorithms for Language Models"

11 / 11 papers shown

Global Cross-Time Attention Fusion for Enhanced Solar Flare Prediction from Multivariate Time Series

132

17 Nov 2025

Unifying Uniform and Binary-coding Quantization for Accurate Compression of Large Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

375

04 Jun 2025

Accurate Sublayer Pruning for Large Language Models by Exploiting Latency and Tunability InformationInternational Joint Conference on Artificial Intelligence (IJCAI), 2025

264

04 Jun 2025

QA-HFL: Quality-Aware Hierarchical Federated Learning for Resource-Constrained Mobile Devices with Heterogeneous Image Quality

Sajid Hussain

Muhammad Sohail

Nauman Ali Khan

366

04 Jun 2025

Zero-shot Quantization: A Comprehensive SurveyInternational Joint Conference on Artificial Intelligence (IJCAI), 2024

363

14 May 2025

Benchmarking Post-Training Quantization in LLMs: Comprehensive Taxonomy, Unified Evaluation, and Comparative Analysis

601

18 Feb 2025

Large Language Model Inference Acceleration: A Comprehensive Hardware Perspective

...

624

06 Oct 2024

The Early Bird Catches the Leak: Unveiling Timing Side Channels in LLM Serving SystemsIEEE Transactions on Information Forensics and Security (IEEE TIFS), 2024

610

30 Sep 2024

Compact Language Models via Pruning and Knowledge Distillation

Saurav Muralidharan

Sharath Turuvekere Sreenivas

354

113

19 Jul 2024

Accurate Retraining-free Pruning for Pretrained Encoder-based Language ModelsInternational Conference on Learning Representations (ICLR), 2023

230

07 Aug 2023

Fast Transformer Decoding: One Write-Head is All You Need

Noam M. Shazeer

588

636

06 Nov 2019

Home
Papers
2401.15347
Cited By

A Comprehensive Survey of Compression Algorithms for Language Models

27 January 2024

Papers citing "A Comprehensive Survey of Compression Algorithms for Language Models"

11 / 11 papers shown

Global Cross-Time Attention Fusion for Enhanced Solar Flare Prediction from Multivariate Time Series

132

17 Nov 2025

Unifying Uniform and Binary-coding Quantization for Accurate Compression of Large Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

375

04 Jun 2025

Accurate Sublayer Pruning for Large Language Models by Exploiting Latency and Tunability InformationInternational Joint Conference on Artificial Intelligence (IJCAI), 2025

264

04 Jun 2025

QA-HFL: Quality-Aware Hierarchical Federated Learning for Resource-Constrained Mobile Devices with Heterogeneous Image Quality

Sajid Hussain

Muhammad Sohail

Nauman Ali Khan

366

04 Jun 2025

Zero-shot Quantization: A Comprehensive SurveyInternational Joint Conference on Artificial Intelligence (IJCAI), 2024

363

14 May 2025

Benchmarking Post-Training Quantization in LLMs: Comprehensive Taxonomy, Unified Evaluation, and Comparative Analysis

601

18 Feb 2025

Large Language Model Inference Acceleration: A Comprehensive Hardware Perspective

...

624

06 Oct 2024

The Early Bird Catches the Leak: Unveiling Timing Side Channels in LLM Serving SystemsIEEE Transactions on Information Forensics and Security (IEEE TIFS), 2024

610

30 Sep 2024

Compact Language Models via Pruning and Knowledge Distillation

Saurav Muralidharan

Sharath Turuvekere Sreenivas

354

113

19 Jul 2024

Accurate Retraining-free Pruning for Pretrained Encoder-based Language ModelsInternational Conference on Learning Representations (ICLR), 2023

230

07 Aug 2023

Fast Transformer Decoding: One Write-Head is All You Need

Noam M. Shazeer

588

636

06 Nov 2019