v1v2v3 (latest)

Faith and Fate: Limits of Transformers on Compositionality

Neural Information Processing Systems (NeurIPS), 2023

29 May 2023

Xiang Lorraine Li

Xiang Ren

Yejin Choi

ArXiv (abs)PDF HTML HuggingFace (7 upvotes)

Papers citing "Faith and Fate: Limits of Transformers on Compositionality"

50 / 328 papers shown

Position as Probability: Self-Supervised Transformers that Think Past Their Training for Length Extrapolation

Philip Heejun Lee

102

24 Dec 2025

Nexus: Higher-Order Attention Mechanisms in Transformers

298

03 Dec 2025

AsymPuzl: An Asymmetric Puzzle for multi-agent cooperation

03 Dec 2025

When Do Symbolic Solvers Enhance Reasoning in Large Language Models?

Zhiyuan He

Dingmin Wang

ReLM LRM

129

02 Dec 2025

Orthographic Constraint Satisfaction and Human Difficulty Alignment in Large Language Models

Bryan Edward Tuck

Rakesh M. Verma

ALM

157

26 Nov 2025

Closed-Loop Transformers: Autoregressive Modeling as Iterative Latent Equilibrium

Akbar Anbar Jafari

G. Anbarjafari

26 Nov 2025

In-Context Compositional Learning via Sparse Coding Transformer

162

25 Nov 2025

Cognitive Foundations for Reasoning and Their Manifestation in LLMs

...

207

20 Nov 2025

Cognitive Maps in Language Models: A Mechanistic Analysis of Spatial Planning

153

17 Nov 2025

Next-Latent Prediction Transformers Learn Compact World Models

140

08 Nov 2025

DecompSR: A dataset for decomposed analyses of compositional multihop spatial reasoning

284

04 Nov 2025

The Ouroboros of Benchmarking: Reasoning Evaluation in an Era of Saturation

İbrahim Ethem Deveci

Duygu Ataman

ReLM ALM ELM LRM

211

03 Nov 2025

Training LLMs Beyond Next Token Prediction - Filling the Mutual Information Gap

31 Oct 2025

The Kinetics of Reasoning: How Chain-of-Thought Shapes Learning in Transformers?

28 Oct 2025

Can Language Models Compose Skills In-Context?

294

27 Oct 2025

When No Paths Lead to Rome: Benchmarking Systematic Neural Relational Reasoning

475

27 Oct 2025

Once Upon an Input: Reasoning via Per-Instance Program Synthesis

169

26 Oct 2025

Reasoning Models Reason Well, Until They Don't

124

25 Oct 2025

Measuring Reasoning in LLMs: a New Dialectical Angle

Soheil Abbasloo

LRM

134

20 Oct 2025

DAG-Math: Graph-Guided Mathematical Reasoning in LLMs

154

19 Oct 2025

Self-Verifying Reflection Helps Transformers with CoT Reasoning

105

14 Oct 2025

Which Word Orders Facilitate Length Generalization in LMs? An Investigation with GCG-Based Artificial Languages

Nadine El-Naggar

Tatsuki Kuribayashi

Ted Briscoe

100

14 Oct 2025

RegexPSPACE: A Benchmark for Evaluating LLM Reasoning on PSPACE-complete Regex Problems

10 Oct 2025

Hire Your Anthropologist! Rethinking Culture Benchmarks Through an Anthropological Lens

172

07 Oct 2025

Bridging Reasoning to Learning: Unmasking Illusions using Complexity Out of Distribution Generalization

Mohammad Mahdi Samiei Paqaleh

Arash Marioriyad

Arman Tahmasebi-Zadeh

Mohamadreza Fereydooni

Mahdi Ghaznavai

Mahdieh Soleymani Baghshah

120

06 Oct 2025

Orchestrating Human-AI Teams: The Manager Agent as a Unifying Research Challenge

162

02 Oct 2025

How Do Language Models Compose Functions?

Apoorv Khandelwal

Ellie Pavlick

KELM CoGe LRM

204

02 Oct 2025

Boosting Process-Correct CoT Reasoning by Modeling Solvability of Multiple-Choice QA

Raphael Schumann

Stefan Riezler

LRM

130

30 Sep 2025

Identity Bridge: Enabling Implicit Reasoning via Shared Latent Memory

110

29 Sep 2025

Local Success Does Not Compose: Benchmarking Large Language Models for Compositional Formal Verification

134

27 Sep 2025

Review of Hallucination Understanding in Large Language and Vision Models

138

26 Sep 2025

Teaching Transformers to Solve Combinatorial Problems through Efficient Trial & Error

Panagiotis Giannoulis

Yorgos Pantis

Christos Tzamos

124

26 Sep 2025

Variation in Verification: Understanding Verification Dynamics in Large Language Models

177

22 Sep 2025

PiERN: Token-Level Routing for Integrating High-Precision Computation and Reasoning

184

17 Sep 2025

Large Language Models Imitate Logical Reasoning, but at what Cost?

Lachlan McGinness

Peter Baumgartner

ReLM LRM ELM AI4CE

197

16 Sep 2025

Is In-Context Learning Learning?

Adrian de Wynter

165

12 Sep 2025

COGITAO: A Visual Reasoning Framework To Study Compositionality & Generalization

Yassine Taoudi-Benchekroun

132

05 Sep 2025

When LLM Meets Time Series: Can LLMs Perform Multi-Step Time Series Reasoning and Inference

01 Sep 2025

Provable Benefits of In-Tool Learning for Large Language Models

152

28 Aug 2025

Understanding Subword Compositionality of Large Language Models

Qiwei Peng

Yekun Chai

Anders Søgaard

112

25 Aug 2025

Beyond Memorization: Extending Reasoning Depth with Recurrence, Memory and Test-Time Compute Scaling

...

229

22 Aug 2025

Dream 7B: Diffusion Large Language Models

1.0K

106

21 Aug 2025

TransLLM: A Unified Multi-Task Foundation Framework for Urban Transportation via Learnable Prompting

20 Aug 2025

Reinforced Context Order Recovery for Adaptive Reasoning and Planning

105

18 Aug 2025

Beyond Ethical Alignment: Evaluating LLMs as Artificial Moral Assistants

Alessio Galatolo

Luca Alberto Rappuoli

Katie Winkle

Meriem Beloucif

ELM

138

18 Aug 2025

Is GPT-OSS Good? A Comprehensive Evaluation of OpenAI's Latest Open Source Models

...

214

17 Aug 2025

The Missing Reward: Active Inference in the Era of Experience

Bo Wen

07 Aug 2025

Topos Theory for Generative AI and LLMs

Sridhar Mahadevan

115

05 Aug 2025

Diagnosing Memorization in Chain-of-Thought Reasoning, One Token at a Time

198

04 Aug 2025

CompoST: A Benchmark for Analyzing the Ability of LLMs To Compositionally Interpret Questions in a QALD Setting

299

28 Jul 2025