Incorporating Priors with Feature Attribution on Text Classification

Incorporating Priors with Feature Attribution on Text Classification

19 June 2019

Papers citing "Incorporating Priors with Feature Attribution on Text Classification"

17 / 17 papers shown

Title
Large Language Models as Attribution Regularizers for Efficient Model Training Davor Vukadin Marin Šilić Goran Delač 36 0 0 27 Feb 2025
InjecGuard: Benchmarking and Mitigating Over-defense in Prompt Injection Guardrail Models H. Li Xiaogeng Liu SILM 37 4 0 30 Oct 2024
Explaining black box text modules in natural language with language models Chandan Singh Aliyah R. Hsu Richard Antonello Shailee Jain Alexander G. Huth Bin-Xia Yu Jianfeng Gao MILM 16 46 0 17 May 2023
XMD: An End-to-End Framework for Interactive Explanation-Based Debugging of NLP Models Dong-Ho Lee Akshen Kadakia Brihi Joshi Aaron Chan Ziyi Liu ... Takashi Shibuya Ryosuke Mitani Toshiyuki Sekiya Jay Pujara Xiang Ren LRM 27 9 0 30 Oct 2022
Fairness via Adversarial Attribute Neighbourhood Robust Learning Q. Qi Shervin Ardeshir Yi Tian Xu Tianbao Yang 35 0 0 12 Oct 2022
Domain Classification-based Source-specific Term Penalization for Domain Adaptation in Hate-speech Detection Tulika Bose Nikolaos Aletras Irina Illina Dominique Fohr 9 0 0 18 Sep 2022
Shortcut Learning of Large Language Models in Natural Language Understanding Mengnan Du Fengxiang He Na Zou Dacheng Tao Xia Hu KELM OffRL 19 82 0 25 Aug 2022
Dynamically Refined Regularization for Improving Cross-corpora Hate Speech Detection Tulika Bose Nikolaos Aletras Irina Illina Dominique Fohr 40 5 0 23 Mar 2022
FairPrune: Achieving Fairness Through Pruning for Dermatological Disease Diagnosis Yawen Wu Dewen Zeng Xiaowei Xu Yiyu Shi Jingtong Hu MedIm 14 51 0 04 Mar 2022
Aligning Eyes between Humans and Deep Neural Network through Interactive Attention Alignment Yuyang Gao Tong Sun Liang Zhao Sungsoo Ray Hong HAI 13 37 0 06 Feb 2022
Modeling Techniques for Machine Learning Fairness: A Survey Mingyang Wan Daochen Zha Ninghao Liu Na Zou SyDa FaML 17 36 0 04 Nov 2021
Double Trouble: How to not explain a text classifier's decisions using counterfactuals synthesized by masked language models? Thang M. Pham Trung H. Bui Long Mai Anh Totti Nguyen 18 7 0 22 Oct 2021
Enjoy the Salience: Towards Better Transformer-based Faithful Explanations with Word Salience G. Chrysostomou Nikolaos Aletras 18 16 0 31 Aug 2021
Shapley Explanation Networks Rui Wang Xiaoqian Wang David I. Inouye TDI FAtt 9 44 0 06 Apr 2021
Efficient Explanations from Empirical Explainers Robert Schwarzenberg Nils Feldhus Sebastian Möller FAtt 17 9 0 29 Mar 2021
Learning Adversarially Fair and Transferable Representations David Madras Elliot Creager T. Pitassi R. Zemel FaML 213 669 0 17 Feb 2018
Convolutional Neural Networks for Sentence Classification Yoon Kim AILaw VLM 250 13,347 0 25 Aug 2014