Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge

14 March 2018

Oyvind Tafjord

Papers citing "Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge"

50 / 1,910 papers shown

Pimba: A Processing-in-Memory Acceleration for Post-Transformer Large Language Model Serving

...

634

14 Jul 2025

FusionFactory: Fusing LLM Capabilities with Multi-LLM Log Data

203

14 Jul 2025

Advancing Large Language Models for Tibetan with Curated Data and Continual Pre-Training

...

373

12 Jul 2025

DATE-LM: Benchmarking Data Attribution Evaluation for Large Language Models

216

12 Jul 2025

Pre-Training LLMs on a budget: A comparison of three optimizers

203

11 Jul 2025

Lizard: An Efficient Linearization Framework for Large Language Models

...

247

11 Jul 2025

KV Cache Steering for Controlling Frozen LLMs

267

11 Jul 2025

AbbIE: Autoregressive Block-Based Iterative Encoder for Efficient Sequence Modeling

Preslav Aleksandrov

Meghdad Kurmanji

Fernando Garcia Redondo

186

11 Jul 2025

SAS: Simulated Attention Score

...

244

10 Jul 2025

FlexOlmo: Open Language Models for Flexible Data Use

...

398

09 Jul 2025

Train-before-Test Harmonizes Language Model Rankings

Guanhua Zhang

Ricardo Dominguez-Olmedo

Moritz Hardt

ALM

212

07 Jul 2025

Steering Information Utility in Key-Value Memory for Language Model Post-Training

369

07 Jul 2025

RAT: Bridging RNN Efficiency and Attention Accuracy via Chunk-based Sequence ModelingIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025

262

06 Jul 2025

LoSiA: Efficient High-Rank Fine-Tuning via Subnet Localization and Optimization

Xujia Wang

Yunjia Qi

Bin Xu

262

06 Jul 2025

OrthoRank: Token Selection via Sink Token Orthogonality for Efficient LLM inference

Seungjun Shin

Jaehoon Oh

Dokwan Oh

172

05 Jul 2025

Blending Supervised and Reinforcement Fine-Tuning with Prefix Sampling

340

02 Jul 2025

Eka-Eval: An Evaluation Framework for Low-Resource Multilingual Large Language Models

191

02 Jul 2025

Tuning without Peeking: Provable Generalization Bounds and Robust LLM Post-Training

291

02 Jul 2025

Semantic-guided Diverse Decoding for Large Language Model

220

30 Jun 2025

Data Uniformity Improves Training Efficiency and More, with a Convergence Framework Beyond the NTK Regime

Yuqing Wang

Shangding Gu

216

30 Jun 2025

AutoMixer: Checkpoint Artifacts as Automatic Data MixersAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

148

27 Jun 2025

DuoGPT: Training-free Dual Sparsity through Activation-aware Pruning in LLMs

246

25 Jun 2025

Multi-Preference Lambda-weighted Listwise DPO for Small-Scale Model Alignment

210

24 Jun 2025

AnTKV: Anchor Token-Aware Sub-Bit Vector Quantization for KV Cache in Large Language Models

138

24 Jun 2025

Revisiting LoRA through the Lens of Parameter Redundancy: Spectral Encoding HelpsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

220

20 Jun 2025

SparseLoRA: Accelerating LLM Fine-Tuning with Contextual Sparsity

Konstantinos N. Plataniotis

217

19 Jun 2025

EvoLM: In Search of Lost Language Model Training Dynamics

316

19 Jun 2025

Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights

...

241

19 Jun 2025

Thunder-Tok: Minimizing Tokens per Word in Tokenizing Korean Texts for Generative Language Models

224

18 Jun 2025

Finance Language Model Evaluation (FLaME)

190

18 Jun 2025

RATTENTION: Towards the Minimal Sliding Window Size in Local-Global Attention Models

257

18 Jun 2025

CC-LEARN: Cohort-based Consistency Learning

340

18 Jun 2025

SLR: Automated Synthesis for Scalable Logical Reasoning

364

18 Jun 2025

Instruction Tuning with and without Context: Behavioral Shifts and Downstream Impact

249

18 Jun 2025

SFT-GO: Supervised Fine-Tuning with Group Optimization for Large Language Models

154

17 Jun 2025

Improving LoRA with Variational Learning

Mohammad Emtiyaz Khan

Thomas Möllenhoff

232

17 Jun 2025

Massive Supervised Fine-tuning Experiments Reveal How Data, Layer, and Training Factors Shape LLM Alignment Quality

262

17 Jun 2025

MoORE: SVD-based Model MoE-ization for Conflict- and Oblivion-Resistant Multi-Task Adaptation

388

17 Jun 2025

ROSAQ: Rotation-based Saliency-Aware Weight Quantization for Efficiently Compressing Large Language Models

227

16 Jun 2025

TensorSLM: Energy-efficient Embedding Compression of Sub-billion Parameter Language Models on Low-end Devices

Mingxue Xu

Y. Xu

Danilo Mandic

187

16 Jun 2025

Understand the Implication: Learning to Think for Pragmatic UnderstandingAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

Pushpak Bhattacharyya

ReLM LRM

204

16 Jun 2025

EAQuant: Enhancing Post-Training Quantization for MoE Models via Expert-Aware Optimization

252

16 Jun 2025

Load Balancing Mixture of Experts with Similarity Preserving Routers

284

16 Jun 2025

Just Go Parallel: Improving the Multilingual Capabilities of Large Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

251

16 Jun 2025

BOW: Reinforcement Learning for Bottlenecked Next Word Prediction

227

16 Jun 2025

Unveiling the Learning Mind of Language Models: A Cognitive Framework and Empirical Study

229

16 Jun 2025

Mixture of Weight-shared Heterogeneous Group Attention Experts for Dynamic Token-wise KV Optimization

182

16 Jun 2025

Assessing the Role of Data Quality in Training Bilingual Language Models

162

15 Jun 2025

GTA: Grouped-head latenT Attention

174

15 Jun 2025

Infini-gram mini: Exact n-gram Search at the Internet Scale with FM-Index

258

13 Jun 2025