HellaSwag: Can a Machine Really Finish Your Sentence?

Annual Meeting of the Association for Computational Linguistics (ACL), 2019

19 May 2019

Yejin Choi

Papers citing "HellaSwag: Can a Machine Really Finish Your Sentence?"

50 / 2,253 papers shown

UI-Bench: A Benchmark for Evaluating Design Capabilities of AI Text-to-App Tools

223

28 Aug 2025

Diffusion Language Models Know the Answer Before Decoding

178

27 Aug 2025

Benchmarking Hindi LLMs: A New Suite of Datasets and a Comparative Analysis

153

27 Aug 2025

Task-Stratified Knowledge Scaling Laws for Post-Training Quantized Large Language Models

Jun Zhao

Kang Liu

188

26 Aug 2025

UltraMemV2: Memory Networks Scaling to 120B Parameters with Superior Long-Context Learning

...

181

26 Aug 2025

Predicting the Order of Upcoming Tokens Improves Language Modeling

Zayd Muhammad Kawakibi Zuhri

Erland Hilman Fuadi

Alham Fikri Aji

AI4TS

26 Aug 2025

Optimal Sparsity of Mixture-of-Experts Language Models for Reasoning Tasks

175

26 Aug 2025

Beyond Benchmark: LLMs Evaluation with an Anthropomorphic and Value-oriented Roadmap

...

226

26 Aug 2025

Weights-Rotated Preference Optimization for Large Language Models

142

25 Aug 2025

DualSparse-MoE: Coordinating Tensor/Neuron-Level Sparsity with Expert Partition and Reconstruction

121

25 Aug 2025

Riemannian Optimization for LoRA on the Stiefel Manifold

151

25 Aug 2025

Layerwise Importance Analysis of Feed-Forward Networks in Transformer-based Language Models

25 Aug 2025

Integral Transformer: Denoising Attention, Not Too Much Not Too Little

128

25 Aug 2025

InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficiency

...

304

265

25 Aug 2025

TiKMiX: Take Data Influence into Dynamic Mixture for Language Model Pre-training

141

25 Aug 2025

Randomly Removing 50% of Dimensions in Text Embeddings has Minimal Impact on Retrieval and Classification Tasks

Sotaro Takeshita

Yurina Takeshita

Daniel Ruffinelli

Simone Paolo Ponzetto

147

25 Aug 2025

DropLoRA: Sparse Low-Rank Adaptation for Parameter-Efficient Fine-Tuning

Haojie Zhang

24 Aug 2025

Debate or Vote: Which Yields Better Decisions in Multi-Agent Large Language Models?

347

24 Aug 2025

MoE-Inference-Bench: Performance Evaluation of Mixture of Expert Large Language and Vision Models

Krishna Teja Chitty-Venkata

113

24 Aug 2025

CEQuest: Benchmarking Large Language Models for Construction Estimation

Y. Wu

L. xilinx Wang

Rui Liu

22 Aug 2025

Interpreting the Effects of Quantization on LLMs

Manpreet Singh

Hassan Sajjad

MQ MILM

377

22 Aug 2025

RoboBuddy in the Classroom: Exploring LLM-Powered Social Robots for Storytelling in Learning and Integration Activities

22 Aug 2025

Systematic Characterization of LLM Quantization: A Performance, Energy, and Quality Perspective

Tianyao Shi

Yi Ding

133

22 Aug 2025

WISCA: A Lightweight Model Transition Method to Improve LLM Training via Weight Scaling

...

110

21 Aug 2025

Exploiting Vocabulary Frequency Imbalance in Language Model Pre-training

Woojin Chung

Jeonghoon Kim

200

21 Aug 2025

TPLA: Tensor Parallel Latent Attention for Efficient Disaggregated Prefill and Decode Inference

197

21 Aug 2025

End-to-End On-Device Quantization-Aware Training for LLMs at Inference Cost

...

226

21 Aug 2025

SLM-Bench: A Comprehensive Benchmark of Small Language Models on Environmental Impacts--Extended Version

174

21 Aug 2025

CALR: Corrective Adaptive Low-Rank Decomposition for Efficient Large Language Model Layer Compression

Muchammad Daniyal Kautsar

Afra Majida Hariono

Widyawan

Syukron Abu Ishaq Alfarozi

Kuntpong Woraratpanya

161

21 Aug 2025

Dream 7B: Diffusion Large Language Models

1.0K

110

21 Aug 2025

Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs

178

20 Aug 2025

NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model

...

298

20 Aug 2025

GLASS: Test-Time Acceleration for LLMs via Global-Local Neural Importance Aggregation

Amirmohsen Sattarifard

104

19 Aug 2025

Beyond Pass@1: Self-Play with Variational Problem Synthesis Sustains RLVR

236

19 Aug 2025

Maximum Score Routing For Mixture-of-ExpertsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

117

18 Aug 2025

Z-Pruner: Post-Training Pruning of Large Language Models for Efficiency without Retraining

Samiul Basir Bhuiyan

Md. Sazzad Hossain Adib

Mohammed Aman Bhuiyan

Muhammad Rafsan Kabir

Moshiur Farazi

Shafin Rahman

Nabeel Mohammed

179

18 Aug 2025

Signal and Noise: A Framework for Reducing Uncertainty in Language Model Evaluation

122

18 Aug 2025

Reinforcement Learning with Rubric Anchors

...

119

18 Aug 2025

Data Mixing Optimization for Supervised Fine-Tuning of Large Language Models

Yuan Li

Zhengzhong Liu

Eric P. Xing

139

16 Aug 2025

Every 28 Days the AI Dreams of Soft Skin and Burning Stars: Scaffolding AI Agents with Hormones and Emotions

Leigh Levinson

Christopher J. Agostino

15 Aug 2025

MSRS: Adaptive Multi-Subspace Representation Steering for Attribute Alignment in Large Language Models

393

14 Aug 2025

A Survey on Diffusion Language Models

316

14 Aug 2025

EffiEval: Efficient and Generalizable Model Evaluation via Capability Coverage Maximization

13 Aug 2025

TiMoE: Time-Aware Mixture of Language Experts

140

12 Aug 2025

Rethinking 1-bit Optimization Leveraging Pre-trained Large Language Models

121

09 Aug 2025

Align, Don't Divide: Revisiting the LoRA Architecture in Multi-Task Learning

07 Aug 2025

Pruning Large Language Models by Identifying and Preserving Functional Networks

155

07 Aug 2025

$iFairy: the First 2-bit Complex LLM with All Parameters in $\{\pm1, \pm i\}$$

iFairy: the First 2-bit Complex LLM with All Parameters in

\{\pm1, \pm i\}

233

07 Aug 2025

TASE: Token Awareness and Structured Evaluation for Multilingual Language Models

114

07 Aug 2025

Tensorized Clustered LoRA Merging for Multi-Task Interference

178

06 Aug 2025