Learning to Clarify: Multi-turn Conversations with Action-Based
Contrastive Self-Training

Learning to Clarify: Multi-turn Conversations with Action-Based Contrastive Self-Training

31 May 2024

Maximillian Chen

Sercan Ö. Arik

Tomas Pfister

Papers citing "Learning to Clarify: Multi-turn Conversations with Action-Based Contrastive Self-Training"

12 / 12 papers shown

Title
Bottom-Up Synthesis of Knowledge-Grounded Task-Oriented Dialogues with Iteratively Self-Refined Prompts Kun Qian Maximillian Chen Siyan Li Arpit Sharma Zhou Yu 22 0 0 19 Apr 2025
Query Understanding in LLM-based Conversational Information Seeking Yifei Yuan Zahra Abbasiantaeb Yang Deng Mohammad Aliannejadi 30 0 0 08 Apr 2025
DiaTool-DPO: Multi-Turn Direct Preference Optimization for Tool-Augmented Large Language Models S. Jung Donghun Lee Shinbok Lee Gaeun Seo Daniel Lee Byeongil Ko Junrae Cho Kihyun Kim EungGyun Kim M. Shin 36 0 0 02 Apr 2025
Generalist Virtual Agents: A Survey on Autonomous Agents Across Digital Platforms Minghe Gao Wendong Bu Bingchen Miao Yang Wu Yunfei Li Juncheng Billy Li Siliang Tang Qi Wu Yueting Zhuang Meng Wang LM&Ro 33 3 0 17 Nov 2024
Self-Rewarding Language Models Weizhe Yuan Richard Yuanzhe Pang Kyunghyun Cho Xian Li Sainbayar Sukhbaatar Jing Xu Jason Weston ReLM SyDa ALM LRM 215 291 0 18 Jan 2024
SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data Ruoxi Sun Sercan Ö. Arik Rajarishi Sinha Hootan Nakhost Hanjun Dai Pengcheng Yin Tomas Pfister 28 12 0 06 Nov 2023
MINT: Evaluating LLMs in Multi-turn Interaction with Tools and Language Feedback Xingyao Wang Zihan Wang Jiateng Liu Yangyi Chen Lifan Yuan Hao Peng Heng Ji LRM 125 137 0 19 Sep 2023
Prompting and Evaluating Large Language Models for Proactive Dialogues: Clarification, Target-guided, and Non-collaboration Yang Deng Lizi Liao Liang Chen Hongru Wang Wenqiang Lei Tat-Seng Chua 72 72 0 23 May 2023
We're Afraid Language Models Aren't Modeling Ambiguity Alisa Liu Zhaofeng Wu Julian Michael Alane Suhr Peter West Alexander Koller Swabha Swayamdipta Noah A. Smith Yejin Choi 54 87 0 27 Apr 2023
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 301 11,730 0 04 Mar 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 315 8,261 0 28 Jan 2022
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 321 1,662 0 04 May 2020