Deep Bayesian Active Learning for Preference Modeling in Large Language
Models

Deep Bayesian Active Learning for Preference Modeling in Large Language Models

14 June 2024

Alessandro Abate

Yarin Gal

Papers citing "Deep Bayesian Active Learning for Preference Modeling in Large Language Models"

8 / 8 papers shown

Title
Uncertainty-Aware Step-wise Verification with Generative Reward Models Zihuiwen Ye L. Melo Younesse Kaddar Phil Blunsom S. Kamath S Yarin Gal LRM 44 0 0 16 Feb 2025
Preference Elicitation for Offline Reinforcement Learning Alizée Pace Bernhard Schölkopf Gunnar Rätsch Giorgia Ramponi OffRL 50 1 0 26 Jun 2024
Advancing Deep Active Learning & Data Subset Selection: Unifying Principles with Information-Theory Intuitions Andreas Kirsch UQCV 48 6 0 09 Jan 2024
Sample Efficient Preference Alignment in LLMs via Active Exploration Viraj Mehta Vikramjeet Das Ojash Neopane Yijia Dai Ilija Bogunovic Ilija Bogunovic W. Neiswanger Stefano Ermon Jeff Schneider Willie Neiswanger OffRL 25 12 0 01 Dec 2023
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 301 11,730 0 04 Mar 2022
Bayesian Active Learning for Sim-to-Real Robotic Perception Jianxiang Feng Jongseok Lee M. Durner Rudolph Triebel 42 13 0 23 Sep 2021
Fine-Tuning Language Models from Human Preferences Daniel M. Ziegler Nisan Stiennon Jeff Wu Tom B. Brown Alec Radford Dario Amodei Paul Christiano G. Irving ALM 275 1,561 0 18 Sep 2019
Teaching Machines to Read and Comprehend Karl Moritz Hermann Tomás Kociský Edward Grefenstette L. Espeholt W. Kay Mustafa Suleyman Phil Blunsom 170 3,504 0 10 Jun 2015