A Survey on Backdoor Attack and Defense in Natural Language Processing

22 November 2022

Papers citing "A Survey on Backdoor Attack and Defense in Natural Language Processing"

6 / 6 papers shown

Title
Stress-Testing Capability Elicitation With Password-Locked Models Ryan Greenblatt Fabien Roger Dmitrii Krasheninnikov David M. Krueger 30 13 0 29 May 2024
Beyond Boundaries: A Comprehensive Survey of Transferable Attacks on AI Systems Guangjing Wang Ce Zhou Yuanda Wang Bocheng Chen Hanqing Guo Qiben Yan AAML SILM 53 3 0 20 Nov 2023
Defending Against Stealthy Backdoor Attacks Sangeet Sagar Abhinav Bhatt Abhijith Srinivas Bidaralli AAML 41 3 0 27 May 2022
A Study of the Attention Abnormality in Trojaned BERTs Weimin Lyu Songzhu Zheng Teng Ma Chao Chen 51 56 0 13 May 2022
Mind the Style of Text! Adversarial and Backdoor Attacks Based on Text Style Transfer Fanchao Qi Yangyi Chen Xurui Zhang Mukai Li Zhiyuan Liu Maosong Sun AAML SILM 77 175 0 14 Oct 2021
Mitigating backdoor attacks in LSTM-based Text Classification Systems by Backdoor Keyword Identification Chuanshuai Chen Jiazhu Dai SILM 53 126 0 11 Jul 2020