v1v2v3 (latest)

WebGPT: Browser-assisted question-answering with human feedback

17 December 2021

Tyna Eloundou

ArXiv (abs)PDF HTML HuggingFace (2 upvotes)

Papers citing "WebGPT: Browser-assisted question-answering with human feedback"

50 / 1,123 papers shown

$Icon$^{2}$: Aligning Large Language Models Using Self-Synthetic Preference Data via Inherent Regulation$

Icon

^{2}

: Aligning Large Language Models Using Self-Synthetic Preference Data via Inherent Regulation

110

06 Sep 2025

Towards a Unified View of Large Language Model Post-Training

...

108

04 Sep 2025

Why Language Models Hallucinate

388

04 Sep 2025

Explainable Knowledge Graph Retrieval-Augmented Generation (KG-RAG) with KG-SMILE

Zahra Zehtabi Sabeti Moghaddam

Zeinab Dehghani

Maneeha Rani

Mohammed Naveed Akram

B. Mishra

R. R. Kureshi

D. Thakker

167

03 Sep 2025

DeepTRACE: Auditing Deep Research AI Systems for Tracking Reliability Across Citations and Evidence

Pranav Narayanan Venkit

140

02 Sep 2025

EviNote-RAG: Enhancing RAG Models via Answer-Supportive Evidence Notes

...

243

31 Aug 2025

Can Compact Language Models Search Like Agents? Distillation-Guided Policy Optimization for Preserving Agentic RAG Capabilities

232

27 Aug 2025

ReSURE: Regularizing Supervision Unreliability for Multi-turn Dialogue Fine-tuning

179

27 Aug 2025

Better Language Model-Based Judging Reward Modeling through Scaling Comprehension Boundaries

132

25 Aug 2025

CoCoA: Confidence and Context-Aware Adaptive Decoding for Resolving Knowledge Conflicts in Large Language Models

Anant Khandelwal

Manish Gupta

Puneet Agrawal

193

25 Aug 2025

WebSight: A Vision-First Architecture for Robust Web Agents

Tanvir Bhathal

Asanshay Gupta

LRM

119

23 Aug 2025

Decoding Alignment: A Critical Survey of LLM Development Initiatives through Value-setting and Data-centric Lens

Ilias Chalkidis

OffRL ALM

156

23 Aug 2025

Memento: Fine-tuning LLM Agents without Fine-tuning LLMs

...

Youssef Attia El Hili

Linyi Yang

Jun Wang

LLMAG

424

22 Aug 2025

Select to Know: An Internal-External Knowledge Self-Selection Framework for Domain-Specific Question Answering

258

21 Aug 2025

Comp-X: On Defining an Interactive Learned Image Compression Paradigm With Expert-driven LLM Agent

134

21 Aug 2025

From Bits to Boardrooms: A Cutting-Edge Multi-Agent LLM Framework for Business Excellence

Zihao Wang

Junming Zhang

LLMAG

224

21 Aug 2025

Foundational Design Principles and Patterns for Building Robust and Adaptive GenAI-Native Systems

Frederik Vandeputte

AI4TS

154

21 Aug 2025

Multimodal Data Storage and Retrieval for Embodied AI: A Survey

Yihao Lu

Hao Tang

144

19 Aug 2025

Deep Research: A Survey of Autonomous Research Agents

112

18 Aug 2025

A Functionality-Grounded Benchmark for Evaluating Web Agents in E-commerce Domains

119

18 Aug 2025

Fast, Slow, and Tool-augmented Thinking for LLMs: A Review

136

17 Aug 2025

Thinking Inside the Mask: In-Place Prompting in Diffusion LLMs

184

14 Aug 2025

MM-BrowseComp: A Comprehensive Benchmark for Multimodal Browsing Agents

...

313

14 Aug 2025

Improving and Evaluating Open Deep Research Agents

Doaa Allabadi

Kyle Bradbury

Jordan M. Malof

101

13 Aug 2025

OpenCUA: Open Foundations for Computer-Use Agents

...

256

12 Aug 2025

HGMF: A Hierarchical Gaussian Mixture Framework for Scalable Tool Invocation within the Model Context Protocol

11 Aug 2025

Towards Theoretical Understanding of Transformer Test-Time Computing: Investigation on In-Context Linear Regression

149

11 Aug 2025

Remote Sensing Image Intelligent Interpretation with the Language-Centered Perspective: Principles, Methods and Challenges

139

09 Aug 2025

Chain of Questions: Guiding Multimodal Curiosity in Language Models

Nima Iji

Kia Dashtipour

LRM

165

06 Aug 2025

Large Language Model's Multi-Capability Alignment in Biomedical Domain

136

06 Aug 2025

ToolGrad: Efficient Tool-use Dataset Generation with Textual "Gradients"

217

06 Aug 2025

SEAgent: Self-Evolving Computer Use Agent with Autonomous Learning from Experience

248

06 Aug 2025

AttnTrace: Attention-based Context Traceback for Long-Context LLMs

198

05 Aug 2025

SE-Agent: Self-Evolution Trajectory Optimization in Multi-Step Reasoning with LLM-Based Agents

...

359

04 Aug 2025

CUPID: Evaluating Personalized and Contextualized Alignment of LLMs from Interactions

236

03 Aug 2025

MetaAgent: Toward Self-Evolving Agent via Tool Meta-Learning

Hongjin Qian

Zheng Liu

LM&Ro

226

01 Aug 2025

BAR Conjecture: the Feasibility of Inference Budget-Constrained LLM Services with Authenticity and Reasoning

186

31 Jul 2025

Phi-Ground Tech Report: Advancing Perception in GUI Grounding

...

230

31 Jul 2025

Improving Generative Ad Text on Facebook using Reinforcement Learning

209

29 Jul 2025

Trustworthy Reasoning: Evaluating and Enhancing Factual Accuracy in LLM Intermediate Thought Processes

204

25 Jul 2025

Understanding Human Limits in Pattern Recognition: A Computational Model of Sequential Reasoning in Rock, Paper, Scissors

123

25 Jul 2025

A Systematic Review of Key Retrieval-Augmented Generation (RAG) Systems: Progress, Gaps, and Future Directions

Agada Joseph Oche

Ademola Glory Folashade

Tirthankar Ghosal

Arpan Biswas

3DV VLM

358

25 Jul 2025

Thinking Isn't an Illusion: Overcoming the Limitations of Reasoning Models via Tool Augmentations

198

23 Jul 2025

Theoretical Foundations and Mitigation of Hallucination in Large Language Models

Esmail Gumaan

HILM

125

20 Jul 2025

SAND: Boosting LLM Agents with Self-Taught Action Deliberation

183

10 Jul 2025

Multi-Agent Retrieval-Augmented Framework for Evidence-Based Counterspeech Against Health Misinformation

231

09 Jul 2025

Agentic-R1: Distilled Dual-Strategy Reasoning

176

08 Jul 2025

iPanda: An LLM-based Agent for Automated Conformance Testing of Communication Protocols

...

183

01 Jul 2025

WebArXiv: Evaluating Multimodal Agents on Time-Invariant arXiv Tasks

Zihao Sun

Ling Chen

LLMAG

158

01 Jul 2025

KaLM-Embedding-V2: Superior Training Techniques and Data Inspire A Versatile Embedding Model

...

413

26 Jun 2025