Finding Generalizable Evidence by Learning to Convince Q&A Models

Finding Generalizable Evidence by Learning to Convince Q&A Models

12 September 2019

Siddharth Karamcheti

Jason Weston

Douwe Kiela

Papers citing "Finding Generalizable Evidence by Learning to Convince Q&A Models"

8 / 8 papers shown

Title
Improving alignment of dialogue agents via targeted human judgements Amelia Glaese Nat McAleese Maja Trkebacz John Aslanides Vlad Firoiu ... John F. J. Mellor Demis Hassabis Koray Kavukcuoglu Lisa Anne Hendricks G. Irving ALM AAML 225 500 0 28 Sep 2022
Self-critiquing models for assisting human evaluators William Saunders Catherine Yeh Jeff Wu Steven Bills Ouyang Long Jonathan Ward Jan Leike ALM ELM 21 279 0 12 Jun 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 306 11,909 0 04 Mar 2022
Recursively Summarizing Books with Human Feedback Jeff Wu Long Ouyang Daniel M. Ziegler Nissan Stiennon Ryan J. Lowe Jan Leike Paul Christiano ALM 21 294 0 22 Sep 2021
What's in your Head? Emergent Behaviour in Multi-Task Transformer Models Mor Geva Uri Katz Aviv Ben-Arie Jonathan Berant LRM 30 11 0 13 Apr 2021
Does the Whole Exceed its Parts? The Effect of AI Explanations on Complementary Team Performance Gagan Bansal Tongshuang Wu Joyce Zhou Raymond Fok Besmira Nushi Ece Kamar Marco Tulio Ribeiro Daniel S. Weld 23 575 0 26 Jun 2020
AI safety via debate G. Irving Paul Christiano Dario Amodei 199 199 0 02 May 2018
Generating Natural Language Adversarial Examples M. Alzantot Yash Sharma Ahmed Elgohary Bo-Jhang Ho Mani B. Srivastava Kai-Wei Chang AAML 243 914 0 21 Apr 2018