v1v2v3v4 (latest)

Right for the Wrong Reasons: Diagnosing Syntactic Heuristics in Natural Language Inference

4 February 2019

Papers citing "Right for the Wrong Reasons: Diagnosing Syntactic Heuristics in Natural Language Inference"

50 / 863 papers shown

Efficient PRM Training Data Synthesis via Formal Verification

Ryo Kamoi

Yusen Zhang

Nan Zhang

Sarkar Snigdha Sarathi Das

Rui Zhang

Wenpeng Yin

Rui Zhang

LRM

362

10 Apr 2026

Different types of syntactic agreement recruit the same units within large language models

162

03 Dec 2025

Auxiliary Metrics Help Decoding Skill Neurons in the Wild

408

26 Nov 2025

BengaliFig: A Low-Resource Challenge for Figurative and Culturally Grounded Reasoning in Bengali

Abdullah Al Sefat

222

25 Nov 2025

MapFormer: Self-Supervised Learning of Cognitive Maps with Input-Dependent Positional Embeddings

Victor Rambaud

Salvador Mascarenhas

Yair Lakretz

193

24 Nov 2025

Estonian WinoGrande Dataset: Comparative Analysis of LLM Performance on Human and Machine Translation

222

21 Nov 2025

Don't Learn, Ground: A Case for Natural Language Inference with Visual Grounding

191

21 Nov 2025

Cognitive Foundations for Reasoning and Their Manifestation in LLMs

...

264

20 Nov 2025

Analyzing and Mitigating Negation Artifacts using Data Augmentation for Improving ELECTRA-Small Model Accuracy

Mojtaba Noghabaei

111

09 Nov 2025

Unlocking the Power of Multi-Agent LLM for Reasoning: From Lazy Agents to Deliberation

...

298

04 Nov 2025

Measuring what Matters: Construct Validity in Large Language Model Benchmarks

Andrew M. Bean

Ryan Kearns

Angelika Romanou

Franziska Sofia Hafner

Harry Mayne

...

Christopher Summerfield

586

03 Nov 2025

LingGym: How Far Are LLMs from Thinking Like Field Linguists?

327

01 Nov 2025

Do Students Debias Like Teachers? On the Distillability of Bias Mitigation Methods

Jiali Cheng

Chirag Agarwal

Hadi Amiri

156

30 Oct 2025

MERGE: Minimal Expression-Replacement GEneralization Test for Natural Language Inference

Mădălina Zgreabăn

Tejaswini Deoskar

Lasha Abzianidze

184

28 Oct 2025

StreetMath: Study of LLMs' Approximation Behaviors

177

27 Oct 2025

Transformers Provably Learn Algorithmic Solutions for Graph Connectivity, But Only with the Right Data

217

22 Oct 2025

LLM-Augmented Symbolic NLU System for More Reliable Continuous Causal Statement Interpretation

Xin Lian

Kenneth D. Forbus

193

22 Oct 2025

Moneyball with LLMs: Analyzing Tabular Summarization in Sports Narratives

229

20 Oct 2025

Hierarchical Frequency Tagging Probe (HFTP): A Unified Approach to Investigate Syntactic Structure Representations in Large Language Models and the Human Brain

210

15 Oct 2025

Distributional Semantics Tracing: A Framework for Explaining Hallucinations in Large Language Models

328

07 Oct 2025

Reward Models are Metrics in a Trench Coat

Sebastian Gehrmann

189

03 Oct 2025

Learning the Wrong Lessons: Syntactic-Domain Spurious Correlations in Language Models

230

25 Sep 2025

GRPO++: Enhancing Dermatological Reasoning under Low Resource Settings

Ismam Nur Swapnil

Aranya Saha

Tanvir Ahmed Khan

Mohammad Ariful Haque

134

23 Sep 2025

Benchmark Profiling: Mechanistic Diagnosis of LLM Benchmarks

186

23 Sep 2025

Extractive Fact Decomposition for Interpretable Natural Language Inference in one Forward Pass

Nicholas Popovic

Michael Färber

145

23 Sep 2025

The PIMMUR Principles: Ensuring Validity in Collective Behavior of LLM Societies

242

22 Sep 2025

Layer-wise Minimal Pair Probing Reveals Contextual Grammatical-Conceptual Hierarchy in Speech Representations

303

19 Sep 2025

Can Large Language Models Robustly Perform Natural Language Inference for Japanese Comparatives?

115

17 Sep 2025

Do Natural Language Descriptions of Model Activations Convey Privileged Information?

Millicent Li

Alberto Mario Ceballos Arroyo

Giordano Rogers

Naomi Saphra

Byron C. Wallace

260

16 Sep 2025

MORABLES: A Benchmark for Assessing Abstract Moral Reasoning in LLMs with Fables

Matteo Marcuzzo

A. Zangari

A. Albarelli

Jose Camacho-Collados

Mohammad Taher Pilehvar

264

15 Sep 2025

Compartmentalised Agentic Reasoning for Clinical NLI

195

12 Sep 2025

On Aligning Prediction Models with Clinical Experiential Learning: A Prostate Cancer Case Study

Jacqueline Jil Vallon

...

206

04 Sep 2025

Can Out-of-Distribution Evaluations Uncover Reliance on Shortcuts? A Case Study in Question Answering

157

25 Aug 2025

Natural Language Satisfiability: Exploring the Problem Distribution and Evaluating Transformer-based Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

135

23 Aug 2025

LLMs Struggle with NLI for Perfect Aspect: A Cross-Linguistic Study in Chinese and Japanese

Jie Lu

Du Jin

Hitomi Yanaka

100

16 Aug 2025

Beyond the Rosetta Stone: Unification Forces in Generalization Dynamics

...

273

14 Aug 2025

What Has a Foundation Model Found? Using Inductive Bias to Probe for World Models

772

09 Jul 2025

Discourse Heuristics For Paradoxically Moral Self-CorrectionConference on Empirical Methods in Natural Language Processing (EMNLP), 2025

220

01 Jul 2025

Model Guidance via Robust Feature Attribution

264

24 Jun 2025

CC-LEARN: Cohort-based Consistency Learning

461

18 Jun 2025

When Does Meaning Backfire? Investigating the Role of AMRs in NLI

350

17 Jun 2025

LoRA Users Beware: A Few Spurious Tokens Can Manipulate Your Finetuned Model

386

13 Jun 2025

A Shortcut-aware Video-QA Benchmark for Physical Understanding via Minimal Video Pairs

471

11 Jun 2025

Not quite Sherlock Holmes: Language model predictions do not reliably differentiate impossible from improbable eventsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

251

07 Jun 2025

RELIC: Evaluating Compositional Instruction Following via Language Recognition

350

05 Jun 2025

Exploring Explanations Improves the Robustness of In-Context LearningAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

Ukyo Honda

Tatsushi Oka

LRM

341

03 Jun 2025

Image Generation from Contextually-Contradictory Prompts

283

02 Jun 2025

Spurious Correlations and Beyond: Understanding and Mitigating Shortcut Learning in SDOH Extraction with Large Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

281

30 May 2025

Flying Pigs, FaR and Beyond: Evaluating LLM Reasoning in Counterfactual Worlds

Ishwar B Balappanawar

Vamshi Krishna Bonagiri

Anish Joishy

Manas Gaur

K. Thirunarayan

Ponnurangam Kumaraguru

ReLM LRM

334

28 May 2025

Research Community Perspectives on "Intelligence" and Large Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

Bertram Højer

Terne Sasha Thorn Jakobsen

Anna Rogers

Stefan Heinrich

229

27 May 2025