Rationalizing Neural Predictions

13 June 2016

Papers citing "Rationalizing Neural Predictions"

50 / 152 papers shown

Title
Adversarial Cooperative Rationalization: The Risk of Spurious Correlations in Even Clean Datasets W. Liu Zhongyu Niu Lang Gao Zhiying Deng Jun Wang H. Wang Ruixuan Li 134 1 0 04 May 2025
AI Awareness X. Li Haoyuan Shi Rongwu Xu Wei Xu 54 0 0 25 Apr 2025
On Behalf of the Stakeholders: Trends in NLP Model Interpretability in the Era of LLMs Nitay Calderon Roi Reichart 38 10 0 27 Jul 2024
Evaluating Human Alignment and Model Faithfulness of LLM Rationale Mohsen Fayyaz Fan Yin Jiao Sun Nanyun Peng 55 3 0 28 Jun 2024
CAVE: Controllable Authorship Verification Explanations Sahana Ramnath Kartik Pandey Elizabeth Boschee Xiang Ren 61 1 0 24 Jun 2024
Talking Nonsense: Probing Large Language Models' Understanding of Adversarial Gibberish Inputs Valeriia Cherepanova James Zou AAML 33 4 0 26 Apr 2024
Exploring the Trade-off Between Model Performance and Explanation Plausibility of Text Classifiers Using Human Rationales Lucas Resck Marcos M. Raimundo Jorge Poco 44 1 0 03 Apr 2024
Towards Faithful Explanations: Boosting Rationalization with Shortcuts Discovery Linan Yue Qi Liu Yichao Du Li Wang Weibo Gao Yanqing An 30 5 0 12 Mar 2024
Enhancing the Rationale-Input Alignment for Self-explaining Rationalization Wei Liu Haozhao Wang Jun Wang Zhiying Deng Yuankai Zhang Chengwei Wang Ruixuan Li 32 9 0 07 Dec 2023
Unsupervised Chunking with Hierarchical RNN Zijun Wu Anup Anand Deshmukh Yongkang Wu Jimmy Lin Lili Mou 28 3 0 10 Sep 2023
Interpreting Sentiment Composition with Latent Semantic Tree Zhongtao Jiang Yuanzhe Zhang Cao Liu Jiansong Chen Jun Zhao Kang Liu CoGe 24 0 0 31 Aug 2023
AI Transparency in the Age of LLMs: A Human-Centered Research Roadmap Q. V. Liao J. Vaughan 36 158 0 02 Jun 2023
Explanation Graph Generation via Generative Pre-training over Synthetic Graphs H. Cui Sha Li Yu Zhang Qi Shi 11 1 0 01 Jun 2023
Decoupled Rationalization with Asymmetric Learning Rates: A Flexible Lipschitz Restraint Wei Liu Jun Wang Haozhao Wang Rui Li Yang Qiu Yuankai Zhang Jie Han Yixiong Zou 41 12 0 23 May 2023
MGR: Multi-generator Based Rationalization Wei Liu Haozhao Wang Jun Wang Rui Li Xinyang Li Yuankai Zhang Yang Qiu 21 7 0 08 May 2023
Exploring Faithful Rationale for Multi-hop Fact Verification via Salience-Aware Graph Learning Jiasheng Si Yingjie Zhu Deyu Zhou 27 12 0 02 Dec 2022
Easy to Decide, Hard to Agree: Reducing Disagreements Between Saliency Methods Josip Jukić Martin Tutek Jan Snajder FAtt 18 0 0 15 Nov 2022
GLUE-X: Evaluating Natural Language Understanding Models from an Out-of-distribution Generalization Perspective Linyi Yang Shuibai Zhang Libo Qin Yafu Li Yidong Wang Hanmeng Liu Jindong Wang Xingxu Xie Yue Zhang ELM 39 79 0 15 Nov 2022
Towards Human-Centred Explainability Benchmarks For Text Classification Viktor Schlegel Erick Mendez Guzman R. Batista-Navarro 18 5 0 10 Nov 2022
Why Is It Hate Speech? Masked Rationale Prediction for Explainable Hate Speech Detection Jiyun Kim Byounghan Lee Kyung-ah Sohn 19 13 0 01 Nov 2022
StyLEx: Explaining Style Using Human Lexical Annotations Shirley Anugrah Hayati Kyumin Park Dheeraj Rajagopal Lyle Ungar Dongyeop Kang 22 3 0 14 Oct 2022
On the Explainability of Natural Language Processing Deep Models Julia El Zini M. Awad 27 82 0 13 Oct 2022
Honest Students from Untrusted Teachers: Learning an Interpretable Question-Answering Pipeline from a Pretrained Language Model Jacob Eisenstein D. Andor Bernd Bohnet Michael Collins David M. Mimno LRM 189 24 0 05 Oct 2022
SIMPLE: A Gradient Estimator for $k$ -Subset Sampling Kareem Ahmed Zhe Zeng Mathias Niepert Guy Van den Broeck BDL 42 24 0 04 Oct 2022
An Interpretability Evaluation Benchmark for Pre-trained Language Models Ya-Ming Shen Lijie Wang Ying Chen Xinyan Xiao Jing Liu Hua-Hong Wu 37 4 0 28 Jul 2022
BAGEL: A Benchmark for Assessing Graph Neural Network Explanations Mandeep Rathee Thorben Funke Avishek Anand Megha Khosla 38 14 0 28 Jun 2022
Mediators: Conversational Agents Explaining NLP Model Behavior Nils Feldhus A. Ravichandran Sebastian Möller 30 16 0 13 Jun 2022
Leveraging Causal Inference for Explainable Automatic Program Repair Jianzong Wang Shijing Si Z. Zhu Xiaoyang Qu Zhenhou Hong Jing Xiao 21 3 0 26 May 2022
Learning to Ignore Adversarial Attacks Yiming Zhang Yan Zhou Samuel Carton Chenhao Tan 46 2 0 23 May 2022
KOLD: Korean Offensive Language Dataset Young-kuk Jeong Juhyun Oh Jaimeen Ahn Jongwon Lee Jihyung Mon Sungjoon Park Alice H. Oh 47 25 0 23 May 2022
Argumentative Explanations for Pattern-Based Text Classifiers Piyawat Lertvittayakumjorn Francesca Toni 37 4 0 22 May 2022
Interlock-Free Multi-Aspect Rationalization for Text Classification Shuang Li Diego Antognini Boi Faltings 17 0 0 13 May 2022
ExSum: From Local Explanations to Model Understanding Yilun Zhou Marco Tulio Ribeiro J. Shah FAtt LRM 11 25 0 30 Apr 2022
Learning to Split for Automatic Bias Detection Yujia Bao Regina Barzilay 17 20 0 28 Apr 2022
Can Rationalization Improve Robustness? Howard Chen Jacqueline He Karthik Narasimhan Danqi Chen AAML 23 40 0 25 Apr 2022
Human-AI Collaboration via Conditional Delegation: A Case Study of Content Moderation Vivian Lai Samuel Carton Rajat Bhatnagar Vera Liao Yunfeng Zhang Chenhao Tan 18 130 0 25 Apr 2022
It Takes Two Flints to Make a Fire: Multitask Learning of Neural Relation and Explanation Classifiers Zheng Tang Mihai Surdeanu 19 6 0 25 Apr 2022
Learning to Scaffold: Optimizing Model Explanations for Teaching Patrick Fernandes Marcos Vinícius Treviso Danish Pruthi André F. T. Martins Graham Neubig FAtt 17 22 0 22 Apr 2022
ProtoTEx: Explaining Model Decisions with Prototype Tensors Anubrata Das Chitrank Gupta Venelin Kovatchev Matthew Lease J. Li 24 26 0 11 Apr 2022
Towards Explainable Evaluation Metrics for Natural Language Generation Christoph Leiter Piyawat Lertvittayakumjorn M. Fomicheva Wei-Ye Zhao Yang Gao Steffen Eger AAML ELM 22 20 0 21 Mar 2022
Controlling the Focus of Pretrained Language Generation Models Jiabao Ji Yoon Kim James R. Glass Tianxing He 30 5 0 02 Mar 2022
Diagnosing AI Explanation Methods with Folk Concepts of Behavior Alon Jacovi Jasmijn Bastings Sebastian Gehrmann Yoav Goldberg Katja Filippova 36 15 0 27 Jan 2022
Making a (Counterfactual) Difference One Rationale at a Time Michael J. Plyler Michal Green Min Chi 21 11 0 13 Jan 2022
UNIREX: A Unified Learning Framework for Language Model Rationale Extraction Aaron Chan Maziar Sanjabi Lambert Mathias L Tan Shaoliang Nie Xiaochang Peng Xiang Ren Hamed Firooz 38 41 0 16 Dec 2021
Reframing Human-AI Collaboration for Generating Free-Text Explanations Sarah Wiegreffe Jack Hessel Swabha Swayamdipta Mark O. Riedl Yejin Choi 21 142 0 16 Dec 2021
MultiVerS: Improving scientific claim verification with weak supervision and full-document context David Wadden Bertie Vidgen Lucy Lu Wang Dirk Hovy J. Pierrehumbert Hannaneh Hajishirzi 27 149 0 02 Dec 2021
What to Learn, and How: Toward Effective Learning from Rationales Samuel Carton Surya Kanoria Chenhao Tan 30 22 0 30 Nov 2021
Towards Interpretable and Reliable Reading Comprehension: A Pipeline Model with Unanswerability Prediction Kosuke Nishida Kyosuke Nishida Itsumi Saito Sen Yoshida 30 7 0 17 Nov 2021
Few-Shot Self-Rationalization with Natural Language Prompts Ana Marasović Iz Beltagy Doug Downey Matthew E. Peters LRM 26 106 0 16 Nov 2021
Understanding Interlocking Dynamics of Cooperative Rationalization Mo Yu Yang Zhang Shiyu Chang Tommi Jaakkola 18 41 0 26 Oct 2021