v1v2v3v4 (latest)

Reflexion: Language Agents with Verbal Reinforcement Learning

Neural Information Processing Systems (NeurIPS), 2023

20 March 2023

ArXiv (abs)PDF HTML HuggingFace (5 upvotes)Github

Papers citing "Reflexion: Language Agents with Verbal Reinforcement Learning"

50 / 1,280 papers shown

AgentPack: A Dataset of Code Changes, Co-Authored by Agents and Humans

Yangtian Zi

Zixuan Wu

Aleksander Boruch-Gruszecki

Jonathan Bell

Arjun Guha

204

30 Mar 2026

ProbGuard: Probabilistic Runtime Monitoring for LLM Agent Safety

418

30 Mar 2026

Defending Against Knowledge Poisoning Attacks During Retrieval-Augmented Generation

216

30 Mar 2026

Compositional Image Synthesis with Inference-Time Scaling

312

30 Mar 2026

RevoNAD: Reflective Evolutionary Exploration for Neural Architecture Design

152

05 Dec 2025

Nex-N1: Agentic Models Trained via a Unified Ecosystem for Large-Scale Environment Construction

...

208

04 Dec 2025

Natural Language Actor-Critic: Scalable Off-Policy Learning in Language Space

264

04 Dec 2025

Reason-Plan-ReAct: A Reasoner-Planner Supervising a ReAct Executor for Complex Enterprise Tasks

Gianni Molinari

Fabio Ciravegna

03 Dec 2025

Evaluating Long-Context Reasoning in LLM-Based WebAgents

178

03 Dec 2025

InEx: Hallucination Mitigation via Introspection and Cross-Modal Multi-Agent Collaboration

200

02 Dec 2025

LeechHijack: Covert Computational Resource Exploitation in Intelligent Agent Systems

165

02 Dec 2025

In-Context Distillation with Self-Consistency Cascades: A Simple, Training-Free Way to Reduce LLM Agent Costs

108

02 Dec 2025

Process-Centric Analysis of Agentic Software Systems

101

02 Dec 2025

WISE: Weighted Iterative Society-of-Experts for Robust Multimodal Multi-Agent Debate

142

02 Dec 2025

Self-Improving VLM Judges Without Human Annotations

02 Dec 2025

When Does Verification Pay Off? A Closer Look at LLMs as Solution Verifiers

186

02 Dec 2025

STRIDE: A Systematic Framework for Selecting AI Modalities - Agentic AI, AI Assistants, or LLM Calls

01 Dec 2025

Orchestration Framework for Financial Agents: From Algorithmic Trading to Agentic Trading

268

01 Dec 2025

The Art of Scaling Test-Time Compute for Large Language Models

400

01 Dec 2025

Transforming Monolithic Foundation Models into Embodied Multi-Agent Architectures for Human-Robot Collaboration

139

30 Nov 2025

Towards Continuous Intelligence Growth: Self-Training, Continual Learning, and Dual-Scale Memory in SuperIntelliAgent

164

28 Nov 2025

Beyond Curve Fitting: Neuro-Symbolic Agents for Context-Aware Epidemic Forecasting

135

28 Nov 2025

ThetaEvolve: Test-time Learning on Open Problems

...

368

28 Nov 2025

Multi-chain Graph Refinement and Selection for Reliable Reasoning in Large Language Models

255

28 Nov 2025

Evaluating LLMs for One-Shot Patching of Real and Artificial Vulnerabilities

177

28 Nov 2025

MCP vs RAG vs NLWeb vs HTML: A Comparison of the Effectiveness and Efficiency of Different Agent Interfaces to the Web (Technical Report)

198

28 Nov 2025

Adapting Like Humans: A Metacognitive Agent with Test-time Reasoning

215

28 Nov 2025

SkeletonAgent: An Agentic Interaction Framework for Skeleton-based Action Recognition

305

27 Nov 2025

TinyLLM: Evaluation and Optimization of Small Language Models for Agentic Tasks on Edge Devices

204

27 Nov 2025

Real-Time Procedural Learning From Experience for AI Agents

Dasheng Bi

Yubin Hu

Mohammed N. Nasir

107

27 Nov 2025

Agentic Learner with Grow-and-Refine Multimodal Semantic Memory

...

269

26 Nov 2025

MADRA: Multi-Agent Debate for Risk-Aware Embodied Planning

Junjian Wang

Lidan Zhao

Xi Sheryl Zhang

252

26 Nov 2025

BRIDGE: Building Representations In Domain Guided Program Synthesis

Robert Joseph George

Carson Eisenach

Udaya Ghai

Dominique C. Perrault-Joncas

A. Anandkumar

Dean Phillips Foster

ALM LRM

489

26 Nov 2025

Improving Language Agents through BREW

297

25 Nov 2025

Stabilizing Off-Policy Training for Long-Horizon LLM Agent via Turn-Level Importance Sampling and Clipping-Triggered Normalization

262

25 Nov 2025

Evo-Memory: Benchmarking LLM Agent Test-time Learning with Self-Evolving Memory

...

251

25 Nov 2025

CLIMATEAGENT: Multi-Agent Orchestration for Complex Climate Data Science Workflows

353

25 Nov 2025

ReEXplore: Improving MLLMs for Embodied Exploration with Contextualized Retrospective Experience Replay

239

24 Nov 2025

FHE-Agent: Automating CKKS Configuration for Practical Encrypted Inference via an LLM-Guided Agentic Framework

171

23 Nov 2025

Cross-Disciplinary Knowledge Retrieval and Synthesis: A Compound AI Architecture for Scientific Discovery

159

23 Nov 2025

Reasoning With a Star: A Heliophysics Dataset and Benchmark for Agentic Scientific Reasoning

131

23 Nov 2025

LLMs as Firmware Experts: A Runtime-Grown Tree-of-Agents Framework

142

23 Nov 2025

Learning to Debug: LLM-Organized Knowledge Trees for Solving RTL Assertion Failures

Yunsheng Bai

Haoxing Ren

146

21 Nov 2025

A Benchmark for Procedural Memory Retrieval in Language Agents

Ishant Kohar

Aswanth Krishnan

21 Nov 2025

Cognitive Inception: Agentic Reasoning against Visual Deceptions by Injecting Skepticism

148

21 Nov 2025

Hiding in the AI Traffic: Abusing MCP for LLM-Powered Agentic Red Teaming

Strahinja Janjusevic

Anna Baron Garcia

Sohrob Kazerounian

257

20 Nov 2025

PSM: Prompt Sensitivity Minimization via LLM-Guided Black-Box Optimization

Huseein Jawad

Nicolas Brunel

AAML

207

20 Nov 2025

NAMeGEn: Creative Name Generation via A Novel Agent-based Multiple Personalized Goal Enhancement Framework

424

19 Nov 2025

AVATAAR: Agentic Video Answering via Temporal Adaptive Alignment and Reasoning

Urjitkumar Patel

Fang-Chun Yeh

Chinmay Gondhalekar

262

19 Nov 2025

Agent-R1: Training Powerful LLM Agents with End-to-End Reinforcement Learning

197

18 Nov 2025