v1v2 (latest)

Constructing A Multi-hop QA Dataset for Comprehensive Evaluation of Reasoning Steps

International Conference on Computational Linguistics (COLING), 2020

2 November 2020

Papers citing "Constructing A Multi-hop QA Dataset for Comprehensive Evaluation of Reasoning Steps"

50 / 590 papers shown

Chunks as Arms: Multi-Armed Bandit-Guided Sampling for Long-Context LLM Preference Optimization

174

10 Apr 2026

PathFinder: MCTS and LLM Feedback-based Path Selection for Multi-Hop Question Answering

05 Dec 2025

On Group Relative Policy Optimization Collapse in Agent Search: The Lazy Likelihood-Displacement

Christos Thrampoulidis

Xiaoxiao Li

166

03 Dec 2025

Towards Unification of Hallucination Detection and Fact Verification for Large Language Models

148

02 Dec 2025

Agentic Policy Optimization via Instruction-Policy Co-Evolution

157

01 Dec 2025

From Atomic to Composite: Reinforcement Learning Enables Generalization in Complementary Reasoning

319

01 Dec 2025

Multi-chain Graph Refinement and Selection for Reliable Reasoning in Large Language Models

255

28 Nov 2025

Reducing Latency of LLM Search Agent via Speculation-based Algorithm-System Co-Design

...

245

25 Nov 2025

Stabilizing Off-Policy Training for Long-Horizon LLM Agent via Turn-Level Importance Sampling and Clipping-Triggered Normalization

264

25 Nov 2025

HyperbolicRAG: Enhancing Retrieval-Augmented Generation with Hyperbolic Representations

256

24 Nov 2025

CLaRa: Bridging Retrieval and Generation with Continuous Latent Reasoning

784

24 Nov 2025

Parametric Retrieval-Augmented Generation using Latent Routing of LoRA Adapters

Zhan Su

Fengran Mo

Jian-yun Nie

Yuchen Hui

Jiaao Sun

Jian-yun Nie

176

21 Nov 2025

ARK: Answer-Centric Retriever Tuning via KG-augmented Curriculum Learning

185

20 Nov 2025

MuISQA: Multi-Intent Retrieval-Augmented Generation for Scientific Question Answering

365

20 Nov 2025

Agent-R1: Training Powerful LLM Agents with End-to-End Reinforcement Learning

199

18 Nov 2025

Hierarchical Token Prepending: Enhancing Information Flow in Decoder-based LLM Embeddings

175

18 Nov 2025

CriticSearch: Fine-Grained Credit Assignment for Search Agents via a Retrospective Critic

212

15 Nov 2025

A Multifaceted Analysis of Negative Bias in Large Language Models through the Lens of Parametric KnowledgeIEEE Transactions on Audio, Speech, and Language Processing (TASLP), 2025

Jongyoon Song

Sangwon Yu

Sungroh Yoon

14 Nov 2025

MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents via Model, Context, and Interactive Scaling

...

370

14 Nov 2025

Modeling Uncertainty Trends for Timely Retrieval in Dynamic RAG

295

13 Nov 2025

CAPO: Confidence Aware Preference Optimization Learning for Multilingual Preferences

Rhitabrat Pokharel

Yufei Tao

Ameeta Agrawal

172

10 Nov 2025

TeaRAG: A Token-Efficient Agentic Retrieval-Augmented Generation Framework

...

496

07 Nov 2025

Query Generation Pipeline with Enhanced Answerability Assessment for Financial Information Retrieval

260

07 Nov 2025

MemSearcher: Training LLMs to Reason, Search and Manage Memory via End-to-End Reinforcement Learning

213

04 Nov 2025

Using Span Queries to Optimize for Cache and Attention Locality

Antoni Viros i Martin

LRM

175

04 Nov 2025

LiveSearchBench: An Automatically Constructed Benchmark for Retrieval and Reasoning over Dynamic Knowledge

...

487

03 Nov 2025

PROPEX-RAG: Enhanced GraphRAG using Prompt-Driven Prompt Execution

224

03 Nov 2025

DEEPAMBIGQA: Ambiguous Multi-hop Questions for Benchmarking LLM Answer Completeness

148

03 Nov 2025

Optimizing Native Sparse Attention with Latent Attention and Local Global Alternating Strategies

305

02 Nov 2025

Prompt-R1: Collaborative Automatic Prompting Framework via End-to-end Reinforcement Learning

594

02 Nov 2025

Separate the Wheat from the Chaff: Winnowing Down Divergent Views in Retrieval Augmented Generation

236

01 Nov 2025

Interact-RAG: Reason and Interact with the Corpus, Beyond Black-Box Retrieval

361

31 Oct 2025

MARAG-R1: Beyond Single Retriever via Reinforcement-Learned Multi-Tool Agentic Retrieval

244

31 Oct 2025

InfoFlow: Reinforcing Search Agent Via Reward Density Optimization

187

30 Oct 2025

Towards Global Retrieval Augmented Generation: A Benchmark for Corpus-Level Reasoning

712

30 Oct 2025

GAP: Graph-Based Agent Planning with Parallel Tool Use and Reinforcement Learning

125

29 Oct 2025

Sharpness-Guided Group Relative Policy Optimization via Probability Shaping

Tue Le

Nghi D.Q.Bui

Linh Ngo Van

267

29 Oct 2025

Repurposing Synthetic Data for Fine-grained Search Agent Supervision

...

175

28 Oct 2025

SynthWorlds: Controlled Parallel Worlds for Disentangling Reasoning and Knowledge in Language Models

305

28 Oct 2025

BMGQ: A Bottom-up Method for Generating Complex Multi-hop Reasoning Questions from Semi-structured Data

350

28 Oct 2025

RaCoT: Plug-and-Play Contrastive Example Generation Mechanism for Enhanced LLM Reasoning Reliability

202

26 Oct 2025

GlobalRAG: Enhancing Global Reasoning in Multi-hop Question Answering via Reinforcement Learning

550

23 Oct 2025

Think Straight, Stop Smart: Structured Reasoning for Efficient Multi-Hop RAG

194

22 Oct 2025

LoongRL: Reinforcement Learning for Advanced Reasoning over Long Contexts

317

22 Oct 2025

Search Self-play: Pushing the Frontier of Agent Capability without Supervision

168

21 Oct 2025

MENTOR: A Reinforcement Learning Framework for Enabling Tool Use in Small Models via Teacher-Optimized Rewards

215

21 Oct 2025

WebSeer: Training Deeper Search Agents through Reinforcement Learning with Self-Reflection

139

21 Oct 2025

Which LLM Multi-Agent Protocol to Choose?

253

20 Oct 2025

Towards Mixed-Modal Retrieval for Universal Retrieval-Augmented Generation

116

20 Oct 2025

Annotation-Efficient Universal Honesty Alignment

263

20 Oct 2025