HellaSwag: Can a Machine Really Finish Your Sentence?

Annual Meeting of the Association for Computational Linguistics (ACL), 2019

19 May 2019

Yejin Choi

Papers citing "HellaSwag: Can a Machine Really Finish Your Sentence?"

50 / 2,252 papers shown

RAGCap-Bench: Benchmarking Capabilities of LLMs in Agentic Retrieval Augmented Generation Systems

116

15 Oct 2025

CARVQ: Corrective Adaptor with Group Residual Vector Quantization for LLM Embedding Compression

108

14 Oct 2025

OPLoRA: Orthogonal Projection LoRA Prevents Catastrophic Forgetting during Parameter-Efficient Fine-Tuning

Yifeng Xiong

Xiaohui Xie

CLL

476

14 Oct 2025

Deconstructing Attention: Investigating Design Principles for Effective Language Modeling

Huiyin Xue

Nafise Sadat Moosavi

Nikolaos Aletras

121

13 Oct 2025

Neural Weight Compression for Language Models

133

13 Oct 2025

APLOT: Robust Reward Modeling via Adaptive Preference Learning with Optimal Transport

120

13 Oct 2025

Balancing Synthetic Data and Replay for Enhancing Task-Specific Capabilities

136

13 Oct 2025

Preconditioned Norms: A Unified Framework for Steepest Descent, Quasi-Newton and Adaptive Methods

310

12 Oct 2025

Preserving LLM Capabilities through Calibration Data Curation: From Analysis to Optimization

104

12 Oct 2025

RePro: Training Language Models to Faithfully Recycle the Web for Pretraining

Zichun Yu

Chenyan Xiong

OnRL

228

12 Oct 2025

Rethinking LLM Evaluation: Can We Evaluate LLMs with 200x Less Data?

...

146

12 Oct 2025

AnyBCQ: Hardware Efficient Flexible Binary-Coded Quantization for Multi-Precision LLMs

165

12 Oct 2025

Long Exposure: Accelerating Parameter-Efficient Fine-Tuning for LLMs under Shadowy SparsityInternational Conference for High Performance Computing, Networking, Storage and Analysis (SC), 2024

152

12 Oct 2025

BabyBabelLM: A Multilingual Benchmark of Developmentally Plausible Training Data

...

116

11 Oct 2025

CTR-LoRA: Curvature-Aware and Trust-Region Guided Low-Rank Adaptation for Large Language Models

127

11 Oct 2025

PermLLM: Learnable Channel Permutation for N:M Sparse Large Language Models

11 Oct 2025

NarraBench: A Comprehensive Framework for Narrative Benchmarking

Sil Hamilton

Matthew Wilkens

Andrew Piper

190

10 Oct 2025

ProxRouter: Proximity-Weighted LLM Query Routing for Improved Robustness to Outliers

128

10 Oct 2025

Entropy Meets Importance: A Unified Head Importance-Entropy Score for Stable and Efficient Transformer Pruning

116

10 Oct 2025

Hierarchical Scheduling for Multi-Vector Image Retrieval

112

10 Oct 2025

FLRC: Fine-grained Low-Rank Compressor for Efficient LLM Inference

10 Oct 2025

SliceFine: The Universal Winning-Slice Hypothesis for Pretrained Networks

Md. Kowsher

Ali O. Polat

Ehsan Mohammady Ardehaly

180

09 Oct 2025

DISCO: Diversifying Sample Condensation for Efficient Model Evaluation

375

09 Oct 2025

RCPU: Rotation-Constrained Error Compensation for Structured Pruning of a Large Language Model

126

09 Oct 2025

Fewer Weights, More Problems: A Practical Attack on LLM Pruning

191

09 Oct 2025

Weak Form Learning for Mean-Field Partial Differential Equations: an Application to Insect Movement

119

09 Oct 2025

AILoRA: Function-Aware Asymmetric Initialization for Low-Rank Adaptation of Large Language Models

123

09 Oct 2025

Contrastive Weak-to-strong Generalization

132

09 Oct 2025

Recycling Pretrained Checkpoints: Orthogonal Growth of Mixture-of-Experts for Efficient Large Language Model Pre-Training

136

09 Oct 2025

Rényi Sharpness: A Novel Sharpness that Strongly Correlates with Generalization

180

09 Oct 2025

POME: Post Optimization Model Edit via Muon-style Projection

08 Oct 2025

Next Semantic Scale Prediction via Hierarchical Diffusion Language Models

140

08 Oct 2025

Encode, Think, Decode: Scaling test-time reasoning with recursive latent thoughts

Yeskendir Koishekenov

Aldo Lipani

Nicola Cancedda

LRM

150

08 Oct 2025

Auto-Stega: An Agent-Driven System for Lifelong Strategy Evolution in LLM-Based Text Steganography

106

08 Oct 2025

Learning to Route LLMs from Bandit Feedback: One Policy, Many Trade-offs

08 Oct 2025

JAI-1: A Thai-Centric Large Language Model

Attapol T. Rutherford

Jullajak Karnjanaekarin

Narongkorn Panitsrisit

Pontakorn Trakuekul

Sumana Sumanakul

Natchanon Pollertlam

08 Oct 2025

Native Hybrid Attention for Efficient Sequence Modeling

197

08 Oct 2025

PIKA: Expert-Level Synthetic Datasets for Post-Training Alignment from Scratch

118

08 Oct 2025

Latent Representation Learning in Heavy-Ion Collisions with MaskPoint Transformer

140

08 Oct 2025

Poisoning Attacks on LLMs Require a Near-constant Number of Poison Samples

...

268

08 Oct 2025

ParsTranslit: Truly Versatile Tajik-Farsi Transliteration

Rayyan Merchant

Kevin Tang

08 Oct 2025

Adaptive Stain Normalization for Cross-Domain Medical HistologyInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025

124

08 Oct 2025

Grouped Differential Attention

101

08 Oct 2025

lm-Meter: Unveiling Runtime Inference Latency for On-Device Language Models

107

07 Oct 2025

BLISS: A Lightweight Bilevel Influence Scoring Method for Data Selection in Language Model Pretraining

256

07 Oct 2025

Activation-Informed Pareto-Guided Low-Rank Compression for Efficient LLM/VLM

Ryan Solgi

Parsa Madinei

Jiayi Tian

Rupak Vignesh Swaminathan

Jing Liu

Nathan Susanj

Zheng Zhang

07 Oct 2025

Fairness in Token Delegation: Mitigating Voting Power Concentration in DAOs

Johnnatan Messias

Ayae Ide

105

07 Oct 2025

Latent Speech-Text Transformer

...

124

07 Oct 2025

Diversity Is All You Need for Contrastive Learning: Spectral Bounds on Gradient Magnitudes

Peter Ochieng

07 Oct 2025

ARMOR: High-Performance Semi-Structured Pruning via Adaptive Matrix Factorization

120

07 Oct 2025