Defense against Adversarial Attacks in NLP via Dirichlet Neighborhood
Ensemble

Defense against Adversarial Attacks in NLP via Dirichlet Neighborhood Ensemble

20 June 2020

Xuanjing Huang

Papers citing "Defense against Adversarial Attacks in NLP via Dirichlet Neighborhood Ensemble"

12 / 12 papers shown

Title
One Perturbation is Enough: On Generating Universal Adversarial Perturbations against Vision-Language Pre-training Models Hao Fang Jiawei Kong Wenbo Yu Bin Chen Jiawei Li Hao Wu Ke Xu Ke Xu AAML VLM 40 13 0 08 Jun 2024
Backdoor Learning for NLP: Recent Advances, Challenges, and Future Research Directions Marwan Omar SILM AAML 25 20 0 14 Feb 2023
TextShield: Beyond Successfully Detecting Adversarial Sentences in Text Classification Lingfeng Shen Ze Zhang Haiyun Jiang Ying Chen AAML 37 5 0 03 Feb 2023
ADDMU: Detection of Far-Boundary Adversarial Examples with Data and Model Uncertainty Estimation Fan Yin Yao Li Cho-Jui Hsieh Kai-Wei Chang AAML 60 4 0 22 Oct 2022
Learning to Ignore Adversarial Attacks Yiming Zhang Yan Zhou Samuel Carton Chenhao Tan 46 2 0 23 May 2022
"That Is a Suspicious Reaction!": Interpreting Logits Variation to Detect NLP Adversarial Attacks Edoardo Mosca Shreyash Agarwal Javier Rando Georg Groh AAML 25 30 0 10 Apr 2022
Towards Robustness Against Natural Language Word Substitutions Xinshuai Dong A. Luu Rongrong Ji Hong Liu SILM AAML 25 112 0 28 Jul 2021
Defending Against Backdoor Attacks in Natural Language Generation Xiaofei Sun Xiaoya Li Yuxian Meng Xiang Ao Fei Wu Jiwei Li Tianwei Zhang AAML SILM 21 47 0 03 Jun 2021
Grey-box Adversarial Attack And Defence For Sentiment Classification Ying Xu Xu Zhong Antonio Jimeno Yepes Jey Han Lau VLM AAML 11 53 0 22 Mar 2021
Certified Robustness to Adversarial Word Substitutions Robin Jia Aditi Raghunathan Kerem Göksel Percy Liang AAML 183 290 0 03 Sep 2019
Generating Natural Language Adversarial Examples M. Alzantot Yash Sharma Ahmed Elgohary Bo-Jhang Ho Mani B. Srivastava Kai-Wei Chang AAML 245 914 0 21 Apr 2018
A Decomposable Attention Model for Natural Language Inference Ankur P. Parikh Oscar Täckström Dipanjan Das Jakob Uszkoreit 196 1,367 0 06 Jun 2016