Aligning Agents like Large Language Models

Aligning Agents like Large Language Models

6 June 2024

Dave Bignell

Papers citing "Aligning Agents like Large Language Models"

7 / 7 papers shown

Title
Adapting a World Model for Trajectory Following in a 3D Game Marko Tot Shu Ishida Abdelhak Lemkhenter David Bignell Pallavi Choudhury ... Tarun Gupta Darren Gehring Sam Devlin Sergio Valcarcel Macua Raluca Georgescu 38 0 0 16 Apr 2025
Scaling Instructable Agents Across Many Simulated Worlds Sima Team Maria Abi Raad Arun Ahuja Catarina Barros F. Besse ... Daan Wierstra Duncan Williams Nathaniel Wong Sarah York Nick Young LM&Ro 107 35 0 13 Mar 2024
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 301 11,730 0 04 Mar 2022
Recent Advances in Leveraging Human Guidance for Sequential Decision-Making Tasks Ruohan Zhang F. Torabi Garrett A. Warnell Peter Stone 64 28 0 13 Jul 2021
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 321 1,944 0 04 May 2020
Scaling Laws for Neural Language Models Jared Kaplan Sam McCandlish T. Henighan Tom B. Brown B. Chess R. Child Scott Gray Alec Radford Jeff Wu Dario Amodei 220 4,424 0 23 Jan 2020
Fine-Tuning Language Models from Human Preferences Daniel M. Ziegler Nisan Stiennon Jeff Wu Tom B. Brown Alec Radford Dario Amodei Paul Christiano G. Irving ALM 275 1,561 0 18 Sep 2019