v1v2 (latest)

Do Emergent Abilities Exist in Quantized Large Language Models: An Empirical Study

International Conference on Language Resources and Evaluation (LREC), 2023

16 July 2023

ArXiv (abs)PDF HTML Github (3070★)

Papers citing "Do Emergent Abilities Exist in Quantized Large Language Models: An Empirical Study"

33 / 33 papers shown

Importance-Aware Data Selection for Efficient LLM Instruction Tuning

432

10 Nov 2025

Scaling LLM Test-Time Compute with Mobile NPU on Smartphones

325

27 Sep 2025

Bridging the Gap Between Promise and Performance for Microscaling FP4 Quantization

...

297

27 Sep 2025

Fair-GPTQ: Bias-Aware Quantization for Large Language Models

Irina Proskurina

Guillaume Metzler

Julien Velcin

263

18 Sep 2025

Quantized but Deceptive? A Multi-Dimensional Truthfulness Evaluation of Quantized LLMs

231

26 Aug 2025

Revisiting Compositional Generalization Capability of Large Language Models Considering Instruction Following AbilityAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

313

18 Jun 2025

Does quantization affect models' performance on long-context tasks?

587

26 May 2025

Through a Compressed Lens: Investigating The Impact of Quantization on Factual Knowledge Recall

306

20 May 2025

Stability in Single-Peaked Strategic Resource Selection Games

Henri Zeiler

392

09 May 2025

Domain-Specific Pruning of Large Mixture-of-Experts Models with Few-shot Demonstrations

365

09 Apr 2025

Sustainable LLM Inference for Edge AI: Evaluating Quantized LLMs for Energy Efficiency, Output Accuracy, and Inference LatencyACM Transactions on Internet of Things (ACM TIOT), 2025

Benedikt Andreas Mithassel

Ahmet Soylu

469

04 Apr 2025

PTQ1.61: Push the Real Limit of Extremely Low-Bit Post-Training Quantization Methods for Large Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

381

18 Feb 2025

Mixture Compressor for Mixture-of-Experts LLMs Gains MoreInternational Conference on Learning Representations (ICLR), 2024

Wei Huang

Yue Liao

Jianhui Liu

Ruifei He

Haoru Tan

Shiming Zhang

Hongsheng Li

Si Liu

Xiaojuan Qi

MoE

345

08 Oct 2024

Toward the Evaluation of Large Language Models Considering Score Variance across Instruction TemplatesBlackboxNLP Workshop on Analyzing and Interpreting Neural Networks for NLP (BlackBoxNLP), 2024

Yusuke Sakai

Adam Nohejl

Jiangnan Hang

Hidetaka Kamigaito

Taro Watanabe

ELM

315

22 Aug 2024

Dynamic Sentiment Analysis with Local Large Language Models using Majority Voting: A Study on Factors Affecting Restaurant Evaluation

Junichiro Niimi

316

18 Jul 2024

How Does Quantization Affect Multilingual LLMs?

Sara Hooker

353

03 Jul 2024

Evaluating the Generalization Ability of Quantized LLMs: Benchmark, Analysis, and Toolbox

Zhi Wang

Wenwu Zhu

385

15 Jun 2024

Unlocking Data-free Low-bit Quantization with Matrix Decomposition for KV Cache Compression

327

21 May 2024

When Quantization Affects Confidence of Large Language Models?

322

01 May 2024

Exploring the Mystery of Influential Data for Mathematical Reasoning

Yujiu Yang

310

01 Apr 2024

Evaluating Quantized Large Language Models

Luning Wang

Shengen Yan

349

28 Feb 2024

A Comprehensive Evaluation of Quantization Strategies for Large Language Models

333

26 Feb 2024

Comparing Specialised Small and General Large Language Models on Text Classification: 100 Labelled Samples to Achieve Break-Even Performance

421

20 Feb 2024

Model Compression and Efficient Inference for Large Language Models: A Survey

379

15 Feb 2024

Accurate LoRA-Finetuning Quantization of LLMs via Information Retention

Yang Zhang

Xianglong Liu

Michele Magno

300

08 Feb 2024

One-Shot Learning as Instruction Data Prospector for Large Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

Yunshui Li

Binyuan Hui

Xiaobo Xia

Jiaxi Yang

Min Yang

...

Fei Huang

434

16 Dec 2023

PowerInfer: Fast Large Language Model Serving with a Consumer-grade GPUSymposium on Operating Systems Principles (SOSP), 2023

580

249

16 Dec 2023

Good Questions Help Zero-Shot Image Reasoning

303

04 Dec 2023

PrivateLoRA For Efficient Privacy Preserving LLM

377

23 Nov 2023

Chatmap : Large Language Model Interaction with Cartographic Data

Eren Unlu

KELM

358

28 Sep 2023

Sparks of Large Audio Models: A Survey and Outlook

...

Björn W. Schuller

833

24 Aug 2023

LMTuner: An user-friendly and highly-integrable Training Framework for fine-tuning Large Language Models

Jun Zhao

313

20 Aug 2023

FootGPT : A Large Language Model Development Experiment on a Minimal Setting

Eren Unlu

ALM

284

16 Aug 2023