Title
Conversational AI-Powered Design: ChatGPT as Designer, User, and Product A. Kocaballi 19 38 0 15 Feb 2023
Compositional Exemplars for In-context Learning Jiacheng Ye Zhiyong Wu Jiangtao Feng Tao Yu Lingpeng Kong 30 111 0 11 Feb 2023
The Wisdom of Hindsight Makes Language Models Better Instruction Followers Tianjun Zhang Fangchen Liu Justin Wong Pieter Abbeel Joseph E. Gonzalez 13 43 0 10 Feb 2023
Toolformer: Language Models Can Teach Themselves to Use Tools Timo Schick Jane Dwivedi-Yu Roberto Dessì Roberta Raileanu Maria Lomeli Luke Zettlemoyer Nicola Cancedda Thomas Scialom SyDa RALM 17 1,590 0 09 Feb 2023
ChatGPT versus Traditional Question Answering for Knowledge Graphs: Current Status and Future Directions Towards Knowledge Graph Chatbots Reham Omar Omij Mangukiya Panos Kalnis Essam Mansour AI4MH 24 75 0 08 Feb 2023
Chain of Hindsight Aligns Language Models with Feedback Hao Liu Carmelo Sferrazza Pieter Abbeel ALM 18 115 0 06 Feb 2023
Analyzing Leakage of Personally Identifiable Information in Language Models Nils Lukas A. Salem Robert Sim Shruti Tople Lukas Wutschitz Santiago Zanella Béguelin PILM 19 211 0 01 Feb 2023
The Flan Collection: Designing Data and Methods for Effective Instruction Tuning Shayne Longpre Le Hou Tu Vu Albert Webson Hyung Won Chung ... Denny Zhou Quoc V. Le Barret Zoph Jason W. Wei Adam Roberts ALM 27 623 0 31 Jan 2023
Direct Preference-based Policy Optimization without Reward Modeling Gaon An Junhyeok Lee Xingdong Zuo Norio Kosaka KyungHyun Kim Hyun Oh Song OffRL 24 26 0 30 Jan 2023
Principled Reinforcement Learning with Human Feedback from Pairwise or $K$ -wise Comparisons Banghua Zhu Jiantao Jiao Michael I. Jordan OffRL 23 177 0 26 Jan 2023
On The Fragility of Learned Reward Functions Lev McKinney Yawen Duan David M. Krueger Adam Gleave 23 19 0 09 Jan 2023
Logically at Factify 2: A Multi-Modal Fact Checking System Based on Evidence Retrieval techniques and Transformer Encoder Architecture P. Verschuuren Jie Gao A. V. Eeden Stylianos Oikonomou Anil Bandhakavi 15 2 0 09 Jan 2023
A Survey on Transformers in Reinforcement Learning Wenzhe Li Hao Luo Zichuan Lin Chongjie Zhang Zongqing Lu Deheng Ye OffRL MU AI4CE 35 55 0 08 Jan 2023
Iterated Decomposition: Improving Science Q&A by Supervising Reasoning Processes Justin Reppert Ben Rachbach Charlie George Luke Stebbing Ju-Seung Byun Maggie Appleton Andreas Stuhlmuller ReLM LRM 36 17 0 04 Jan 2023
Rethinking with Retrieval: Faithful Large Language Model Inference Hangfeng He Hongming Zhang Dan Roth KELM LRM 141 156 0 31 Dec 2022
A Survey on Table-and-Text HybridQA: Concepts, Methods, Challenges and Future Directions Dingzirui Wang Longxu Dou Wanxiang Che 14 5 0 27 Dec 2022
Real or Fake Text?: Investigating Human Ability to Detect Boundaries Between Human-Written and Machine-Generated Text Liam Dugan Daphne Ippolito Arun Kirubarajan Sherry Shi Chris Callison-Burch DeLMO 27 62 0 24 Dec 2022
Inclusive Artificial Intelligence Dilip Arumugam Shi Dong Benjamin Van Roy 33 1 0 24 Dec 2022
Critic-Guided Decoding for Controlled Text Generation Minbeom Kim Hwanhee Lee Kang Min Yoo Joonsuk Park Hwaran Lee Kyomin Jung 31 35 0 21 Dec 2022
A Survey of Deep Learning for Mathematical Reasoning Pan Lu Liang Qiu Wenhao Yu Sean Welleck Kai-Wei Chang ReLM LRM 32 137 0 20 Dec 2022
Interleaving Retrieval with Chain-of-Thought Reasoning for Knowledge-Intensive Multi-Step Questions H. Trivedi Niranjan Balasubramanian Tushar Khot Ashish Sabharwal KELM RALM LRM 17 377 0 20 Dec 2022
Can Current Task-oriented Dialogue Models Automate Real-world Scenarios in the Wild? Sang-Woo Lee Sungdong Kim Donghyeon Ko Dong-hyun Ham Youngki Hong ... Wangkyo Jung Kyunghyun Cho Donghyun Kwak H. Noh W. Park 41 1 0 20 Dec 2022
Don't Generate, Discriminate: A Proposal for Grounding Language Models to Real-World Environments Yu Gu Xiang Deng Yu-Chuan Su LLMAG 26 52 0 19 Dec 2022
Visconde: Multi-document QA with GPT-3 and Neural Reranking Jayr Alencar Pereira R. Fidalgo R. Lotufo Rodrigo Nogueira BDL RALM 21 31 0 19 Dec 2022
Attributed Question Answering: Evaluation and Modeling for Attributed Large Language Models Bernd Bohnet Vinh Q. Tran Pat Verga Roee Aharoni D. Andor ... Michael Collins Dipanjan Das Donald Metzler Slav Petrov Kellie Webster 41 59 0 15 Dec 2022
Discovering Latent Knowledge in Language Models Without Supervision Collin Burns Haotian Ye Dan Klein Jacob Steinhardt 45 322 0 07 Dec 2022
CREPE: Open-Domain Question Answering with False Presuppositions Xinyan Velocity Yu Sewon Min Luke Zettlemoyer Hannaneh Hajishirzi 14 45 0 30 Nov 2022
Fine-tuning language models to find agreement among humans with diverse preferences Michiel A. Bakker Martin Chadwick Hannah R. Sheahan Michael Henry Tessler Lucy Campbell-Gillingham ... Nat McAleese Amelia Glaese John Aslanides M. Botvinick Christopher Summerfield ALM 21 215 0 28 Nov 2022
Solving math word problems with process- and outcome-based feedback J. Uesato Nate Kushman Ramana Kumar Francis Song Noah Y. Siegel L. Wang Antonia Creswell G. Irving I. Higgins FaML ReLM AIMat LRM 22 281 0 25 Nov 2022
Cheater's Bowl: Human vs. Computer Search Strategies for Open-Domain Question Answering Wanrong He Andrew Mao Jordan L. Boyd-Graber 15 0 0 15 Nov 2022
General Intelligence Requires Rethinking Exploration Minqi Jiang Tim Rocktaschel Edward Grefenstette LRM 27 17 0 15 Nov 2022
Metaphors We Learn By Roland Memisevic 19 0 0 11 Nov 2022
The CRINGE Loss: Learning what language not to model Leonard Adolphs Tianyu Gao Jing Xu Kurt Shuster Sainbayar Sukhbaatar Jason Weston MU 23 34 0 10 Nov 2022
Active Example Selection for In-Context Learning Yiming Zhang Shi Feng Chenhao Tan SILM LRM 30 186 0 08 Nov 2022
PLATO-K: Internal and External Knowledge Enhanced Dialogue Generation Siqi Bao H. He Jun Xu Hua Lu Fan Wang Hua-Hong Wu Han Zhou Wenquan Wu Zheng-Yu Niu Haifeng Wang 22 4 0 02 Nov 2022
Learning to Navigate Wikipedia by Taking Random Walks Manzil Zaheer Kenneth Marino Will Grathwohl John Schultz Wendy Shang Sheila Babayan Arun Ahuja Ishita Dasgupta Christine Kaeser-Chen Rob Fergus 11 5 0 31 Oct 2022
When Life Gives You Lemons, Make Cherryade: Converting Feedback from Bad Responses into Good Labels Weiyan Shi Emily Dinan Kurt Shuster Jason Weston Jing Xu 44 19 0 28 Oct 2022
Decoding a Neural Retriever's Latent Space for Query Suggestion Leonard Adolphs Michelle Chen Huebscher Christian Buck Sertan Girgin Olivier Bachem Massimiliano Ciaramita Thomas Hofmann RALM 13 8 0 21 Oct 2022
Two-Turn Debate Doesn't Help Humans Answer Hard Reading Comprehension Questions Alicia Parrish H. Trivedi Nikita Nangia Vishakh Padmakumar Jason Phang Amanpreet Singh Saimbhi Sam Bowman 13 11 0 19 Oct 2022
Scaling Laws for Reward Model Overoptimization Leo Gao John Schulman Jacob Hilton ALM 28 473 0 19 Oct 2022
N-Best Hypotheses Reranking for Text-To-SQL Systems Lu Zeng S. Parthasarathi Dilek Z. Hakkani-Tür 8 21 0 19 Oct 2022
RARR: Researching and Revising What Language Models Say, Using Language Models Luyu Gao Zhuyun Dai Panupong Pasupat Anthony Chen Arun Tejasvi Chaganty ... Vincent Zhao Ni Lao Hongrae Lee Da-Cheng Juan Kelvin Guu HILM KELM 33 256 0 17 Oct 2022
Understanding HTML with Large Language Models Izzeddin Gur Ofir Nachum Yingjie Miao Mustafa Safdari Austin Huang Aakanksha Chowdhery Sharan Narang Noah Fiedel Aleksandra Faust AI4CE 134 70 0 08 Oct 2022
LLMEffiChecker: Understanding and Testing Efficiency Degradation of Large Language Models Simin Chen Cong Liu Mirazul Haque Wei Yang 34 21 0 07 Oct 2022
Measuring and Narrowing the Compositionality Gap in Language Models Ofir Press Muru Zhang Sewon Min Ludwig Schmidt Noah A. Smith M. Lewis ReLM KELM LRM 46 550 0 07 Oct 2022
Rainier: Reinforced Knowledge Introspector for Commonsense Question Answering Jiacheng Liu Skyler Hallinan Ximing Lu Pengfei He Sean Welleck Hannaneh Hajishirzi Yejin Choi RALM 21 59 0 06 Oct 2022
ReAct: Synergizing Reasoning and Acting in Language Models Shunyu Yao Jeffrey Zhao Dian Yu Nan Du Izhak Shafran Karthik Narasimhan Yuan Cao LLMAG ReLM LRM 233 2,477 0 06 Oct 2022
Ask Me Anything: A simple strategy for prompting language models Simran Arora A. Narayan Mayee F. Chen Laurel J. Orr Neel Guha Kush S. Bhatia Ines Chami Frederic Sala Christopher Ré ReLM LRM 206 206 0 05 Oct 2022
Is Reinforcement Learning (Not) for Natural Language Processing: Benchmarks, Baselines, and Building Blocks for Natural Language Policy Optimization Rajkumar Ramamurthy Prithviraj Ammanabrolu Kianté Brantley Jack Hessel R. Sifa Christian Bauckhage Hannaneh Hajishirzi Yejin Choi OffRL 31 239 0 03 Oct 2022
Zero-Shot Retrieval with Search Agents and Hybrid Environments Michelle Chen Huebscher Christian Buck Massimiliano Ciaramita S. Rothe 24 9 0 30 Sep 2022