COLLIE: Systematic Construction of Constrained Text Generation Tasks

17 July 2023

Papers citing "COLLIE: Systematic Construction of Constrained Text Generation Tasks"

31 / 31 papers shown

Title
Assessing Robustness to Spurious Correlations in Post-Training Language Models Julia Shuieh Prasann Singhal Apaar Shanker John Heyer George Pu Samuel Denton LRM 24 0 0 09 May 2025
Ask, Fail, Repeat: Meeseeks, an Iterative Feedback Benchmark for LLMs' Multi-turn Instruction-following Ability Jiaming Wang Yunke Zhao Peng Ding Jun Kuang Zongyu Wang Xuezhi Cao Xunliang Cai 55 0 0 30 Apr 2025
EvalAgent: Discovering Implicit Evaluation Criteria from the Web Manya Wadhwa Zayne Sprague Chaitanya Malaviya Philippe Laban Junyi Jessy Li Greg Durrett 27 0 0 21 Apr 2025
Constrained Language Generation with Discrete Diffusion Models Michael Cardei Jacob K Christopher Thomas Hartvigsen Brian Bartoldson B. Kailkhura Ferdinando Fioretto DiffM 55 0 0 12 Mar 2025
WildIFEval: Instruction Following in the Wild Gili Lior Asaf Yehudai Ariel Gera L. Ein-Dor 66 0 0 09 Mar 2025
LCTG Bench: LLM Controlled Text Generation Benchmark K. K. Masato Mita Peinan Zhang S. Sasaki Ryosuke Ishigami Naoaki Okazaki 55 0 0 28 Jan 2025
BENCHAGENTS: Automated Benchmark Creation with Agent Interaction Natasha Butt Varun Chandrasekaran Neel Joshi Besmira Nushi Vidhisha Balachandran 31 6 0 29 Oct 2024
A Comparative Study on Reasoning Patterns of OpenAI's o1 Model Siwei Wu Zhongyuan Peng Xinrun Du Tuney Zheng Minghao Liu ... Zhaoxiang Zhang Wenhao Huang Ge Zhang Chenghua Lin J. H. Liu ELM LLMAG LRM AI4CE 29 28 0 17 Oct 2024
LLM Self-Correction with DeCRIM: Decompose, Critique, and Refine for Enhanced Following of Instructions with Multiple Constraints Thomas Palmeira Ferraz Kartik Mehta Yu-Hsiang Lin Haw-Shiuan Chang Shereen Oraby Sijia Liu Vivek Subramanian Tagyoung Chung Mohit Bansal Nanyun Peng 48 7 0 09 Oct 2024
CS4: Measuring the Creativity of Large Language Models Automatically by Controlling the Number of Story-Writing Constraints Anirudh Atmakuru Jatin Nainani Rohith Siddhartha Reddy Bheemreddy Anirudh Lakkaraju Zonghai Yao Hamed Zamani Haw-Shiuan Chang 60 2 0 05 Oct 2024
Can Models Learn Skill Composition from Examples? Haoyu Zhao Simran Kaur Dingli Yu Anirudh Goyal Sanjeev Arora CoGe MoE 53 2 0 29 Sep 2024
Preference-Guided Reflective Sampling for Aligning Language Models Hai Ye Hwee Tou Ng 24 3 0 22 Aug 2024
CFBench: A Comprehensive Constraints-Following Benchmark for LLMs Leo Micklem Yan-Bin Shen Wenjing Luo Yan Zhang Hao Liang ... Weipeng Chen Bin Cui Blair Thornton Wentao Zhang Zenan Zhou ELM 76 16 0 02 Aug 2024
Combining Constraint Programming Reasoning with Large Language Model Predictions Florian Régin Elisabetta De Maria Alexandre Bonlarron 51 2 0 18 Jul 2024
Roleplay-doh: Enabling Domain-Experts to Create LLM-simulated Patients via Eliciting and Adhering to Principles Ryan Louie Ananjan Nandi William Fang Cheng Chang Emma Brunskill Diyi Yang 39 37 0 01 Jul 2024
Intertwining CP and NLP: The Generation of Unreasonably Constrained Sentences Alexandre Bonlarron Jean-Charles Régin 31 1 0 15 Jun 2024
The BiGGen Bench: A Principled Benchmark for Fine-grained Evaluation of Language Models with Language Models Seungone Kim Juyoung Suk Ji Yong Cho Shayne Longpre Chaeeun Kim ... Sean Welleck Graham Neubig Moontae Lee Kyungjae Lee Minjoon Seo ELM ALM LM&MA 97 29 0 09 Jun 2024
Controllable Text Generation in the Instruction-Tuning Era D. Ashok Barnabás Póczos 37 6 0 02 May 2024
From Complex to Simple: Enhancing Multi-Constraint Complex Instruction Following Ability of Large Language Models Qi He Jie Zeng Qianxi He Jiaqing Liang Yanghua Xiao 27 9 0 24 Apr 2024
Train & Constrain: Phonologically Informed Tongue-Twister Generation from Topics and Paraphrases Tyler Loakman Chen Tang Chenghua Lin 38 4 0 20 Mar 2024
KIWI: A Dataset of Knowledge-Intensive Writing Instructions for Answering Research Questions Fangyuan Xu Kyle Lo Luca Soldaini Bailey Kuehl Eunsol Choi David Wadden 32 6 0 06 Mar 2024
Robot Learning in the Era of Foundation Models: A Survey Xuan Xiao Jiahang Liu Zhipeng Wang Yanmin Zhou Yong Qi Qian Cheng Bin He Shuo Jiang AI4CE LM&Ro 16 25 0 24 Nov 2023
FollowEval: A Multi-Dimensional Benchmark for Assessing the Instruction-Following Capability of Large Language Models Yimin Jing Renren Jin Jiahao Hu Huishi Qiu Xiaohua Wang Peng Wang Deyi Xiong LRM ELM 15 1 0 16 Nov 2023
Evaluating, Understanding, and Improving Constrained Text Generation for Large Language Models Xiang Chen Xiaojun Wan 16 0 0 25 Oct 2023
Branch-Solve-Merge Improves Large Language Model Evaluation and Generation Swarnadeep Saha Omer Levy Asli Celikyilmaz Mohit Bansal Jason Weston Xian Li MoMe 16 69 0 23 Oct 2023
Evaluating Large Language Models at Evaluating Instruction Following Zhiyuan Zeng Jiatong Yu Tianyu Gao Yu Meng Tanya Goyal Danqi Chen ELM ALM 23 159 0 11 Oct 2023
Can Large Language Models Understand Real-World Complex Instructions? Qi He Jie Zeng Wenhao Huang Lina Chen Jin Xiao ... Shisong Chen Yikai Zhang Zhouhong Gu Jiaqing Liang Yanghua Xiao ALM LRM ELM 90 50 0 17 Sep 2023
ReAct: Synergizing Reasoning and Acting in Language Models Shunyu Yao Jeffrey Zhao Dian Yu Nan Du Izhak Shafran Karthik Narasimhan Yuan Cao LLMAG ReLM LRM 233 2,413 0 06 Oct 2022
Diffusion-LM Improves Controllable Text Generation Xiang Lisa Li John Thickstun Ishaan Gulrajani Percy Liang Tatsunori B. Hashimoto AI4CE 171 768 0 27 May 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 303 11,730 0 04 Mar 2022
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 294 6,927 0 20 Apr 2018