v1v2v3 (latest)

WebGPT: Browser-assisted question-answering with human feedback

17 December 2021

Tyna Eloundou

ArXiv (abs)PDF HTML HuggingFace (2 upvotes)

Papers citing "WebGPT: Browser-assisted question-answering with human feedback"

50 / 1,123 papers shown

Authenticated Delegation and Authorized AI Agents

Cedric Deslandes Whitney

Dazza Greenwood

Alan Chan

Alex Pentland

419

17 Jan 2025

A Comprehensive Survey of Foundation Models in MedicineIEEE Reviews in Biomedical Engineering (RBME), 2024

778

17 Jan 2025

WebWalker: Benchmarking LLMs in Web TraversalAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

...

619

13 Jan 2025

Exposing Limitations of Language Model Agents in Sequential-Task Compositions on the Web

608

03 Jan 2025

Enhancing Preference-based Linear Bandits via Human Response TimeNeural Information Processing Systems (NeurIPS), 2024

490

03 Jan 2025

PRD: Peer Rank and Discussion Improve Large Language Model based Evaluations

553

126

03 Jan 2025

AutoPresent: Designing Structured Visuals from ScratchComputer Vision and Pattern Recognition (CVPR), 2025

...

278

01 Jan 2025

Zero-Indexing Internet Search Augmented Generation for Large Language Models

369

31 Dec 2024

Is ChatGPT Good at Search? Investigating Large Language Models as Re-Ranking AgentsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

RALM ALM ELM LRM LM&MA

688

427

31 Dec 2024

Diverse and Effective Red Teaming with Auto-generated Rewards and Multi-step Reinforcement Learning

183

24 Dec 2024

Lies, Damned Lies, and Distributional Language Statistics: Persuasion and Deception with Large Language Models

Cameron R. Jones

Benjamin Bergen

462

22 Dec 2024

Disentangling Reasoning Tokens and Boilerplate Tokens For Language Model Fine-tuningAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

269

19 Dec 2024

Relational Programming with Foundation ModelsAAAI Conference on Artificial Intelligence (AAAI), 2024

313

19 Dec 2024

LDC: Learning to Generate Research Idea with Dynamic Control

304

19 Dec 2024

RAG-RewardBench: Benchmarking Reward Models in Retrieval Augmented Generation for Preference Alignment

441

18 Dec 2024

Context-DPO: Aligning Language Models for Context-FaithfulnessAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

...

312

18 Dec 2024

CAD-Assistant: Tool-Augmented VLLMs as Generic CAD Task Solvers

Dimitrios Mallis

Ahmet Serdar Karadeniz

Sebastian Cavada

Danila Rukhovich

Niki Maria Foteinopoulou

K. Cherenkova

Anis Kacem

Djamila Aouada

605

18 Dec 2024

EscapeBench: Towards Advancing Creative Intelligence of Language Model AgentsAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

...

520

18 Dec 2024

RareAgents: Autonomous Multi-disciplinary Team for Rare Disease Diagnosis and Treatment

332

17 Dec 2024

RL-LLM-DT: An Automatic Decision Tree Generation Method Based on RL Evaluation and LLM Enhancement

267

16 Dec 2024

Attention with Dependency Parsing Augmentation for Fine-Grained AttributionAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

294

16 Dec 2024

Beyond the Binary: Capturing Diverse Preferences With Reward Regularization

254

05 Dec 2024

Know Your RAG: Dataset Taxonomy and Generation Strategies for Evaluating RAG Systems

Rafael Teixeira de Lima

258

29 Nov 2024

Advanced System Integration: Analyzing OpenAPI Chunking for Retrieval-Augmented GenerationInternational Conference on Advanced Information Systems Engineering (CAiSE), 2024

272

29 Nov 2024

Automatic Evaluation for Text-to-image Generation: Task-decomposed Framework, Distilled Training, and Meta-evaluation BenchmarkAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

362

23 Nov 2024

SRSA: A Cost-Efficient Strategy-Router Search Agent for Real-world Human-Machine Interactions

Yaqi Wang

Haipei Xu

LLMAG

235

21 Nov 2024

Value Imprint: A Technique for Auditing the Human Values Embedded in RLHF DatasetsNeural Information Processing Systems (NeurIPS), 2024

Ike Obi

Rohan Pant

Srishti Shekhar Agrawal

Maham Ghazanfar

Aaron Basiletti

233

18 Nov 2024

Search, Verify and Feedback: Towards Next Generation Post-training Paradigm of Foundation Models via Verifier Engineering

...

590

18 Nov 2024

Drowning in Documents: Consequences of Scaling Reranker Inference

565

18 Nov 2024

The Dawn of GUI Agent: A Preliminary Case Study with Claude 3.5 Computer Use

215

15 Nov 2024

Approximated Variational Bayesian Inverse Reinforcement Learning for Large Language Model AlignmentAAAI Conference on Artificial Intelligence (AAAI), 2024

246

14 Nov 2024

AssistRAG: Boosting the Potential of Large Language Models with an Intelligent Information AssistantNeural Information Processing Systems (NeurIPS), 2024

162

11 Nov 2024

Magentic-One: A Generalist Multi-Agent System for Solving Complex Tasks

...

Ahmed Hassan Awadallah

358

132

07 Nov 2024

Sharp Analysis for KL-Regularized Contextual Bandits and RLHF

558

07 Nov 2024

Long Context RAG Performance of Large Language Models

274

05 Nov 2024

Enhancing Multiple Dimensions of Trustworthiness in LLMs via Sparse Activation ControlNeural Information Processing Systems (NeurIPS), 2024

187

04 Nov 2024

Foundations and Recent Trends in Multimodal Mobile Agents: A Survey

LM&Ro LLMAG OffRL AI4TS

426

04 Nov 2024

Sample-Efficient Alignment for LLMs

286

03 Nov 2024

Rate, Explain and Cite (REC): Enhanced Explanation and Attribution in Automatic Evaluation by Large Language Models

...

Regunathan Radhakrishnan

695

03 Nov 2024

CORAG: A Cost-Constrained Retrieval Optimization System for Retrieval-Augmented Generation

205

01 Nov 2024

Attention Tracker: Detecting Prompt Injection Attacks in LLMsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2024

411

01 Nov 2024

GPT for Games: An Updated Scoping Review (2020-2024)IEEE Transactions on Games (IEEE Trans. Games), 2024

577

01 Nov 2024

Building Multi-Agent Copilot towards Autonomous Agricultural Data Management and AnalysisBigData Congress [Services Society] (BSS), 2024

254

31 Oct 2024

AndroidLab: Training and Systematic Benchmarking of Android Autonomous Agents

Xiao Liu

Jie Tang

296

31 Oct 2024

Dynamic Strategy Planning for Efficient Question Answering with Large Language Models

844

30 Oct 2024

A Perspective for Adapting Generalist AI to Specialized Medical AI Applications and Their Challenges

Ying Li

308

28 Oct 2024

AutoGLM: Autonomous Foundation Agents for GUIs

Xiao Liu

...

Yujia Wang

303

28 Oct 2024

Vision Search Assistant: Empower Vision-Language Models as Multimodal Search Engines

229

28 Oct 2024

Fast Best-of-N Decoding via Speculative RejectionNeural Information Processing Systems (NeurIPS), 2024

Ruiqi Zhang

378

101

26 Oct 2024

FISHNET: Financial Intelligence from Sub-querying, Harmonizing, Neural-Conditioning, Expert Swarms, and Task PlanningInternational Conference on AI in Finance (ICAF), 2024

221

25 Oct 2024