v1v2v3 (latest)

WebGPT: Browser-assisted question-answering with human feedback

17 December 2021

Tyna Eloundou

ArXiv (abs)PDF HTML HuggingFace (2 upvotes)

Papers citing "WebGPT: Browser-assisted question-answering with human feedback"

50 / 1,126 papers shown

AssistantBench: Can Web Agents Solve Realistic and Time-Consuming Tasks?

380

22 Jul 2024

Clinical Reading Comprehension with Encoder-Decoder Models Enhanced by Direct Preference Optimization

Md Sultan al Nahian

R. Kavuluru

MedIm AI4CE

185

19 Jul 2024

ChatQA 2: Bridging the Gap to Proprietary LLMs in Long Context and RAG Capabilities

553

19 Jul 2024

Learning Goal-Conditioned Representations for Language Reward Models

194

18 Jul 2024

Agent-E: From Autonomous Web Navigation to Foundational Design Principles in Agentic Systems

350

17 Jul 2024

Retrieval-Enhanced Machine Learning: Synthesis and Opportunities

414

17 Jul 2024

How Are LLMs Mitigating Stereotyping Harms? Learning from Search Engine Studies

Alina Leidinger

Richard Rogers

401

16 Jul 2024

Localizing and Mitigating Errors in Long-form Question Answering

362

16 Jul 2024

Sibyl: Simple yet Effective Agent Framework for Complex Real-world Reasoning

308

15 Jul 2024

Fine-grained Analysis of In-context Linear Estimation: Data, Architecture, and Beyond

Yingcong Li

A. S. Rawat

Samet Oymak

253

13 Jul 2024

A Survey on Symbolic Knowledge Distillation of Large Language Models

326

12 Jul 2024

Large Language Models as Biomedical Hypothesis Generators: A Comprehensive Evaluation

Hu Jinfang

Bowen Zhou

LM&MA

406

12 Jul 2024

Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence

Chen Qian

352

09 Jul 2024

It Cannot Be Right If It Was Written by AI: On Lawyers' Preferences of Documents Perceived as Authored by an LLM vs a Human

319

09 Jul 2024

Variational Best-of-N Alignment

Ryan Cotterell

520

08 Jul 2024

Orchestrating LLMs with Different Personalizations

145

04 Jul 2024

RLHF Can Speak Many Languages: Unlocking Multilingual Preference Optimization for LLMs

Sara Hooker

312

02 Jul 2024

Concise and Precise Context Compression for Tool-Using Language Models

...

Zhongyang Li

Dandan Tu

215

02 Jul 2024

LogEval: A Comprehensive Benchmark Suite for Large Language Models In Log Analysis

...

199

02 Jul 2024

DogeRM: Equipping Reward Models with Domain Knowledge through Model Merging

Tzu-Han Lin

Chen-An Li

Hung-yi Lee

Yun-Nung Chen

VLM ALM

165

01 Jul 2024

$$\text{Memory}^3$: Language Modeling with Explicit Memory$

\text{Memory}^3

: Language Modeling with Explicit Memory

Zhiyu Li

...

Weinan E

263

01 Jul 2024

ProductAgent: Benchmarking Conversational Product Search Agent with Asking Clarification Questions

Yong Jiang

Yangning Li

Fei Huang

249

01 Jul 2024

Ground Every Sentence: Improving Retrieval-Augmented LLMs with Interleaved Reference-Claim Generation

494

01 Jul 2024

Advancing Process Verification for Large Language Models via Tree-Based Preference Learning

Weiming Lu

235

29 Jun 2024

Applying RLAIF for Code Generation with API-usage in Lightweight LLMs

260

28 Jun 2024

Scalable and Domain-General Abstractive Proposition Segmentation

Mohammad Javad Hosseini

202

28 Jun 2024

Lifelong Robot Library Learning: Bootstrapping Composable and Generalizable Skills for Embodied Control with Language Models

Georgios Tziafas

Hamidreza Kasaei

KELM LM&Ro

356

26 Jun 2024

Not All Preference Pairs Are Created Equal: A Recipe for Annotation-Efficient Iterative Preference Learning

Sen Yang

Wai Lam

224

25 Jun 2024

Reinforcement Learning via Auxiliary Task Distillation

289

24 Jun 2024

Towards Comprehensive Preference Data Collection for Reward Modeling

Sheng Ouyang

821

24 Jun 2024

Cascade Reward Sampling for Efficient Decoding-Time Alignment

639

24 Jun 2024

LOGIC-LM++: Multi-Step Refinement for Symbolic Formulations

350

22 Jun 2024

Beyond the Turn-Based Game: Enabling Real-Time Conversations with Duplex Models

Yingfa Chen

Xu Han

Maosong Sun

Zhiyuan Liu

227

22 Jun 2024

A SMART Mnemonic Sounds like "Glue Tonic": Mixing LLMs with Student Feedback to Make Mnemonic Learning Stick

Nishant Balepur

Matthew Shu

Alexander Hoyle

Alison Robey

Shi Feng

Seraphina Goldfarb-Tarrant

Jordan Boyd-Graber

222

21 Jun 2024

Hybrid Alignment Training for Large Language Models

Bei Li

Jingbo Zhu

298

21 Jun 2024

GraphReader: Building Graph-based Agent to Enhance Long-Context Abilities of Large Language Models

...

Yangguang Li

Wanli Ouyang

Yuchi Xu

Bo Zheng

RALM LLMAG

267

20 Jun 2024

FoRAG: Factuality-optimized Retrieval Augmented Generation for Web-enhanced Long-form Question Answering

Yunqi Xu

Yinger Zhang

Jinjie Gu

321

19 Jun 2024

Model Internals-based Answer Attribution for Trustworthy Retrieval-Augmented GenerationConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

292

19 Jun 2024

AgentDojo: A Dynamic Environment to Evaluate Attacks and Defenses for LLM AgentsNeural Information Processing Systems (NeurIPS), 2024

Florian Tramèr

457

19 Jun 2024

APPL: A Prompt Programming Language for Harmonious Integration of Programs and Large Language Model PromptsAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

Xujie Si

174

19 Jun 2024

Learning to Generate Answers with Citations via Factual Consistency ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

280

19 Jun 2024

Think-then-Act: A Dual-Angle Evaluated Retrieval-Augmented Generation

Jihong Zhao

241

18 Jun 2024

LightPAL: Lightweight Passage Retrieval for Open Domain Multi-Document Summarization

183

18 Jun 2024

WebCanvas: Benchmarking Web Agents in Online Environments

...

416

18 Jun 2024

On the Exponential Convergence for Offline RLHF with Pairwise Comparisons

Zhirui Chen

Vincent Y. F. Tan

OffRL

257

18 Jun 2024

Satyrn: A Platform for Analytics Augmented Generation

255

17 Jun 2024

Dialogue Action Tokens: Steering Language Models in Goal-Directed Dialogue with a Multi-Turn Planner

Kenneth Li

Yiming Wang

Fernanda Viégas

Martin Wattenberg

349

17 Jun 2024

KAOS: Large Model Multi-Agent Operating System

359

17 Jun 2024

Small Agent Can Also Rock! Empowering Small Language Models as Hallucination Detector

Xiaoxue Cheng

Junyi Li

Wayne Xin Zhao

Hongzhi Zhang

Fuzheng Zhang

Di Zhang

Kun Gai

Ji-Rong Wen

HILM LLMAG

236

17 Jun 2024

A Survey on Human Preference Learning for Large Language Models

Ruili Jiang

Kehai Chen

Xuefeng Bai

Zhixuan He

Juntao Li

Muyun Yang

Tiejun Zhao

Liqiang Nie

Min Zhang

332

17 Jun 2024