Backdoor Learning for NLP: Recent Advances, Challenges, and Future Research Directions

14 February 2023

Papers citing "Backdoor Learning for NLP: Recent Advances, Challenges, and Future Research Directions"

16 / 16 papers shown

Title
Stress-Testing Capability Elicitation With Password-Locked Models Ryan Greenblatt Fabien Roger Dmitrii Krasheninnikov David M. Krueger 30 13 0 29 May 2024
The Philosopher's Stone: Trojaning Plugins of Large Language Models Tian Dong Minhui Xue Guoxing Chen Rayne Holland Shaofeng Li Yan Meng Zhen Liu Haojin Zhu AAML 13 9 0 01 Dec 2023
Beyond Boundaries: A Comprehensive Survey of Transferable Attacks on AI Systems Guangjing Wang Ce Zhou Yuanda Wang Bocheng Chen Hanqing Guo Qiben Yan AAML SILM 53 3 0 20 Nov 2023
Setting the Trap: Capturing and Defeating Backdoors in Pretrained Language Models through Honeypots Ruixiang Tang Jiayi Yuan Yiming Li Zirui Liu Rui Chen Xia Hu AAML 18 13 0 28 Oct 2023
Detecting software vulnerabilities using Language Models Marwan Omar 6 11 0 23 Feb 2023
RobustNLP: A Technique to Defend NLP Models Against Backdoor Attacks Marwan Omar SILM AAML 11 0 0 18 Feb 2023
DeepPayload: Black-box Backdoor Attack on Deep Learning Models through Neural Payload Injection Yuanchun Li Jiayi Hua Haoyu Wang Chunyang Chen Yunxin Liu FedML SILM 86 75 0 18 Jan 2021
In-N-Out: Pre-Training and Self-Training using Auxiliary Information for Out-of-Distribution Robustness Sang Michael Xie Ananya Kumar Robbie Jones Fereshte Khani Tengyu Ma Percy Liang OOD 153 62 0 08 Dec 2020
Mitigating backdoor attacks in LSTM-based Text Classification Systems by Backdoor Keyword Identification Chuanshuai Chen Jiazhu Dai SILM 53 126 0 11 Jul 2020
Clean-Label Backdoor Attacks on Video Recognition Models Shihao Zhao Xingjun Ma Xiang Zheng James Bailey Jingjing Chen Yu-Gang Jiang AAML 185 274 0 06 Mar 2020
Threats to Federated Learning: A Survey Lingjuan Lyu Han Yu Qiang Yang FedML 186 432 0 04 Mar 2020
Certified Robustness to Adversarial Word Substitutions Robin Jia Aditi Raghunathan Kerem Göksel Percy Liang AAML 178 290 0 03 Sep 2019
Model-Reuse Attacks on Deep Learning Systems Yujie Ji Xinyang Zhang S. Ji Xiapu Luo Ting Wang SILM AAML 123 186 0 02 Dec 2018
Generating Natural Language Adversarial Examples M. Alzantot Yash Sharma Ahmed Elgohary Bo-Jhang Ho Mani B. Srivastava Kai-Wei Chang AAML 243 914 0 21 Apr 2018
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 294 6,943 0 20 Apr 2018
Adversarial Example Generation with Syntactically Controlled Paraphrase Networks Mohit Iyyer John Wieting Kevin Gimpel Luke Zettlemoyer AAML GAN 185 711 0 17 Apr 2018