WANLI: Worker and AI Collaboration for Natural Language Inference Dataset Creation

16 January 2022

Yejin Choi

Papers citing "WANLI: Worker and AI Collaboration for Natural Language Inference Dataset Creation"

50 / 177 papers shown

Title
eXplainable Bayesian Multi-Perspective Generative Retrieval EuiYul Song Philhoon Oh Sangryul Kim James Thorne BDL 19 0 0 04 Feb 2024
Quantifying Stereotypes in Language Yang Liu 19 1 0 28 Jan 2024
A Survey on Data Augmentation in Large Model Era Yue Zhou Chenlu Guo Xu Wang Yi-Ju Chang Yuan Wu LM&MA VLM 40 22 0 27 Jan 2024
Building Efficient Universal Classifiers with Natural Language Inference Moritz Laurer W. Atteveldt Andreu Casas Kasper Welbers 28 8 0 29 Dec 2023
NovaCOMET: Open Commonsense Foundation Models with Symbolic Knowledge Distillation Peter West Ronan Le Bras Taylor Sorensen Bill Yuchen Lin Liwei Jiang ... Khyathi Raghavi Chandu Jack Hessel Ashutosh Baheti Chandra Bhagavatula Yejin Choi VLM 21 10 0 10 Dec 2023
Localized Symbolic Knowledge Distillation for Visual Commonsense Models J. Park Jack Hessel Khyathi Raghavi Chandu Paul Pu Liang Ximing Lu ... Youngjae Yu Qiuyuan Huang Jianfeng Gao Ali Farhadi Yejin Choi VLM 16 11 0 08 Dec 2023
RoAST: Robustifying Language Models via Adversarial Perturbation with Selective Training Jaehyung Kim Yuning Mao Rui Hou Hanchao Yu Davis Liang Pascale Fung Qifan Wang Fuli Feng Lifu Huang Madian Khabsa AAML 15 2 0 07 Dec 2023
LLMs Accelerate Annotation for Medical Information Extraction Akshay Goel Almog Gueta Omry Gilon Chang Liu Sofia Erell ... Shashir Reddy Rupesh Kartha Jean Steiner Itay Laish Amir Feder 25 101 0 04 Dec 2023
VITATECS: A Diagnostic Dataset for Temporal Concept Understanding of Video-Language Models Shicheng Li Lei Li Shuhuai Ren Yuanxin Liu Yi Liu Rundong Gao Xu Sun Lu Hou 27 28 0 29 Nov 2023
Whispers of Doubt Amidst Echoes of Triumph in NLP Robustness Ashim Gupta Rishanth Rajendhran Nathan Stringham Vivek Srikumar Ana Marasović AAML 25 3 0 16 Nov 2023
GistScore: Learning Better Representations for In-Context Example Selection with Gist Bottlenecks Shivanshu Gupta Clemens Rosenbaum Ethan R. Elenberg LRM 24 6 0 16 Nov 2023
Measuring and Improving Attentiveness to Partial Inputs with Counterfactuals Yanai Elazar Bhargavi Paranjape Hao Peng Sarah Wiegreffe Khyathi Raghavi Vivek Srikumar Sameer Singh Noah A. Smith AAML OOD 21 0 0 16 Nov 2023
Hallucination Augmented Recitations for Language Models Abdullatif Köksal Renat Aksitov Chung-Ching Chang HILM 35 5 0 13 Nov 2023
The Generative AI Paradox: "What It Can Create, It May Not Understand" Peter West Ximing Lu Nouha Dziri Faeze Brahman Linjie Li ... Khyathi Raghavi Chandu Benjamin Newman Pang Wei Koh Allyson Ettinger Yejin Choi AIMat 13 67 0 31 Oct 2023
TarGEN: Targeted Data Generation with Large Language Models Himanshu Gupta Kevin Scaria Ujjwala Anantheswaran Shreyas Verma Mihir Parmar Saurabh Arjun Sawant Chitta Baral Swaroop Mishra SyDa 28 4 0 27 Oct 2023
CoAnnotating: Uncertainty-Guided Work Allocation between Human and Large Language Models for Data Annotation Minzhi Li Taiwei Shi Caleb Ziems Min-Yen Kan Nancy F. Chen Zhengyuan Liu Diyi Yang 16 66 0 24 Oct 2023
What Makes it Ok to Set a Fire? Iterative Self-distillation of Contexts and Rationales for Disambiguating Defeasible Social and Moral Situations Kavel Rao Liwei Jiang Valentina Pyatkin Yuling Gu Niket Tandon Nouha Dziri Faeze Brahman Yejin Choi 11 15 0 24 Oct 2023
What do Deck Chairs and Sun Hats Have in Common? Uncovering Shared Properties in Large Concept Vocabularies Amit Gajbhiye Zied Bouraoui Na Li Usashi Chatterjee Luis Espinosa Anke Steven Schockaert 22 1 0 23 Oct 2023
Can Language Models Laugh at YouTube Short-form Videos? Dayoon Ko Sangho Lee Gunhee Kim 27 6 0 22 Oct 2023
PHALM: Building a Knowledge Graph from Scratch by Prompting Humans and a Language Model Tatsuya Ide Eiki Murata Daisuke Kawahara T. Yamazaki Shengzhe Li K. Shinzato Toshinori Sato LRM 38 2 0 11 Oct 2023
"A Tale of Two Movements": Identifying and Comparing Perspectives in #BlackLivesMatter and #BlueLivesMatter Movements-related Tweets using Weakly Supervised Graph-based Structured Prediction Shamik Roy Dan Goldwasser 17 4 0 11 Oct 2023
FTFT: Efficient and Robust Fine-Tuning by Transferring Training Dynamics Yupei Du Albert Gatt Dong Nguyen 19 1 0 10 Oct 2023
Towards LogiGLUE: A Brief Survey and A Benchmark for Analyzing Logical Reasoning Capabilities of Language Models Man Luo Shrinidhi Kumbhar Ming shen Mihir Parmar Neeraj Varshney Pratyay Banerjee Somak Aditya Chitta Baral ReLM ELM LRM 37 23 0 02 Oct 2023
Choice-75: A Dataset on Decision Branching in Script Learning Zhaoyi Hou Li Zhang Chris Callison-Burch 27 4 0 21 Sep 2023
From Artificially Real to Real: Leveraging Pseudo Data from Large Language Models for Low-Resource Molecule Discovery Yuhan Chen Nuwa Xi Yanrui Du Hao Wang Jianyu Chen Sendong Zhao Bing Qin 27 10 0 11 Sep 2023
Value Kaleidoscope: Engaging AI with Pluralistic Human Values, Rights, and Duties Taylor Sorensen Liwei Jiang Jena D. Hwang Sydney Levine Valentina Pyatkin ... Kavel Rao Chandra Bhagavatula Maarten Sap J. Tasioulas Yejin Choi SLR 11 49 0 02 Sep 2023
HAGRID: A Human-LLM Collaborative Dataset for Generative Information-Seeking with Attribution Ehsan Kamalloo A. Jafari Xinyu Crystina Zhang Nandan Thakur Jimmy J. Lin 18 41 0 31 Jul 2023
Does Collaborative Human-LM Dialogue Generation Help Information Extraction from Human Dialogues? Bo-Ru Lu Nikita Haduong Chia-Hsuan Lee Zeqiu Wu Hao Cheng Paul Koester J. Utke Tao Yu Noah A. Smith Mari Ostendorf SyDa 45 2 0 13 Jul 2023
KoRC: Knowledge oriented Reading Comprehension Benchmark for Deep Text Understanding Zijun Yao Yantao Liu Xin Lv S. Cao Jifan Yu Lei Hou Juanzi Li 30 10 0 06 Jul 2023
Deductive Additivity for Planning of Natural Language Proofs Zayne Sprague Kaj Bostrom Swarat Chaudhuri Greg Durrett LRM 23 3 0 05 Jul 2023
SpaceNLI: Evaluating the Consistency of Predicting Inferences in Space Lasha Abzianidze J. Zwarts Yoad Winter 11 2 0 05 Jul 2023
Power-up! What Can Generative Models Do for Human Computation Workflows? Garrett Allen Gaole He U. Gadiraju 27 3 0 05 Jul 2023
Evaluating Paraphrastic Robustness in Textual Entailment Models Dhruv Verma Yash Kumar Lal Shreyashee Sinha Benjamin Van Durme Adam Poliak 15 5 0 29 Jun 2023
Large Language Model as Attributed Training Data Generator: A Tale of Diversity and Bias Yue Yu Yuchen Zhuang Jieyu Zhang Yu Meng Alexander Ratner Ranjay Krishna Jiaming Shen Chao Zhang ALM 28 200 0 28 Jun 2023
Symbolic Chain-of-Thought Distillation: Small Models Can Also "Think" Step-by-Step Liunian Harold Li Jack Hessel Youngjae Yu Xiang Ren Kai-Wei Chang Yejin Choi LRM AI4CE ReLM 22 127 0 24 Jun 2023
Which Spurious Correlations Impact Reasoning in NLI Models? A Visual Interactive Diagnosis through Data-Constrained Counterfactuals Robin Shing Moon Chan Afra Amini Mennatallah El-Assady LRM AAML 19 2 0 21 Jun 2023
CLARA: Classifying and Disambiguating User Commands for Reliable Interactive Robotic Agents Jeongeun Park Seungwon Lim Joonhyung Lee Sangbeom Park Minsuk Chang Youngjae Yu Sungjoon Choi LM&Ro 32 22 0 17 Jun 2023
No Strong Feelings One Way or Another: Re-operationalizing Neutrality in Natural Language Inference Animesh Nighojkar Antonio Laverghetta John Licato 23 4 0 16 Jun 2023
Artificial Artificial Artificial Intelligence: Crowd Workers Widely Use Large Language Models for Text Production Tasks V. Veselovsky Manoel Horta Ribeiro Robert West 11 126 0 13 Jun 2023
Revisiting Out-of-distribution Robustness in NLP: Benchmark, Analysis, and LLMs Evaluations Lifan Yuan Yangyi Chen Ganqu Cui Hongcheng Gao Fangyuan Zou Xingyi Cheng Heng Ji Zhiyuan Liu Maosong Sun 32 72 0 07 Jun 2023
COBRA Frames: Contextual Reasoning about Effects and Harms of Offensive Statements Xuhui Zhou Haojie Zhu Akhila Yerukola Thomas Davidson Jena D. Hwang Swabha Swayamdipta Maarten Sap 11 33 0 03 Jun 2023
Minding Language Models' (Lack of) Theory of Mind: A Plug-and-Play Multi-Character Belief Tracker Melanie Sclar Sachin Kumar Peter West Alane Suhr Yejin Choi Yulia Tsvetkov 23 64 0 01 Jun 2023
ReviewerGPT? An Exploratory Study on Using Large Language Models for Paper Reviewing Ryan Liu Nihar B. Shah ELM 25 62 0 01 Jun 2023
Factually Consistent Summarization via Reinforcement Learning with Textual Entailment Feedback Paul Roit Johan Ferret Lior Shani Roee Aharoni Geoffrey Cideron ... Olivier Bachem G. Elidan Avinatan Hassidim Olivier Pietquin Idan Szpektor HILM 15 74 0 31 May 2023
What does the Failure to Reason with "Respectively" in Zero/Few-Shot Settings Tell Us about Language Models? Ruixiang Cui Seolhwa Lee Daniel Hershcovich Anders Søgaard 25 2 0 31 May 2023
Fighting Bias with Bias: Promoting Model Robustness by Amplifying Dataset Biases Yuval Reif Roy Schwartz 15 7 0 30 May 2023
KoSBi: A Dataset for Mitigating Social Bias Risks Towards Safer Large Language Model Application Hwaran Lee Seokhee Hong Joonsuk Park Takyoung Kim Gunhee Kim Jung-Woo Ha 24 28 0 28 May 2023
SQuARe: A Large-Scale Dataset of Sensitive Questions and Acceptable Responses Created Through Human-Machine Collaboration Hwaran Lee Seokhee Hong Joonsuk Park Takyoung Kim M. Cha ... Eun-Ju Lee Yong Lim Alice H. Oh San-hee Park Jung-Woo Ha 20 15 0 28 May 2023
With a Little Push, NLI Models can Robustly and Efficiently Predict Faithfulness Julius Steen Juri Opitz Anette Frank K. Markert HILM 11 9 0 26 May 2023
On Degrees of Freedom in Defining and Testing Natural Language Understanding Saku Sugawara S. Tsugita ELM 21 1 0 24 May 2023