Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2110.02467
Cited By

BadPre: Task-agnostic Backdoor Attacks to Pre-trained NLP Foundation
Models

BadPre: Task-agnostic Backdoor Attacks to Pre-trained NLP Foundation Models

6 October 2021

Jiwei Li

ArXiv (abs)PDF HTML

Papers citing "BadPre: Task-agnostic Backdoor Attacks to Pre-trained NLP Foundation Models"

50 / 76 papers shown

SteganoBackdoor: Stealthy and Data-Efficient Backdoor Attacks on Language Models

SteganoBackdoor: Stealthy and Data-Efficient Backdoor Attacks on Language Models

224

0

0

18 Nov 2025

Unmasking Backdoors: An Explainable Defense via Gradient-Attention Anomaly Scoring for Pre-trained Language Models

Unmasking Backdoors: An Explainable Defense via Gradient-Attention Anomaly Scoring for Pre-trained Language Models

Anindya Sundar Das

246

1

0

05 Oct 2025

Trigger Where It Hurts: Unveiling Hidden Backdoors through Sensitivity with Sensitron

Trigger Where It Hurts: Unveiling Hidden Backdoors through Sensitivity with Sensitron

211

0

0

23 Sep 2025

Backdoor Samples Detection Based on Perturbation Discrepancy Consistency in Pre-trained Language Models

Backdoor Samples Detection Based on Perturbation Discrepancy Consistency in Pre-trained Language ModelsNeural Networks (NN), 2025

179

0

0

30 Aug 2025

Pruning Strategies for Backdoor Defense in LLMs

Pruning Strategies for Backdoor Defense in LLMs

Santosh Chapagain

S. F. Boubrahimi

165

5

0

27 Aug 2025

A Systematic Review of Poisoning Attacks Against Large Language Models

A Systematic Review of Poisoning Attacks Against Large Language Models

Edward W. Staley

Nathan G. Drenkow

285

8

0

06 Jun 2025

The Ripple Effect: On Unforeseen Complications of Backdoor Attacks

The Ripple Effect: On Unforeseen Complications of Backdoor Attacks

260

0

0

16 May 2025

BadLingual: A Novel Lingual-Backdoor Attack against Large Language Models

BadLingual: A Novel Lingual-Backdoor Attack against Large Language Models

275

1

0

06 May 2025

GaussTrap: Stealthy Poisoning Attacks on 3D Gaussian Splatting for Targeted Scene Confusion

GaussTrap: Stealthy Poisoning Attacks on 3D Gaussian Splatting for Targeted Scene Confusion

951

1

0

29 Apr 2025

The Ultimate Cookbook for Invisible Poison: Crafting Subtle Clean-Label Text Backdoors with Style Attributes

The Ultimate Cookbook for Invisible Poison: Crafting Subtle Clean-Label Text Backdoors with Style Attributes

351

1

0

24 Apr 2025

SSD: A State-based Stealthy Backdoor Attack For Navigation System in UAV Route Planning

SSD: A State-based Stealthy Backdoor Attack For Navigation System in UAV Route Planning

387

0

0

27 Feb 2025

Quantized Delta Weight Is Safety Keeper

Quantized Delta Weight Is Safety Keeper

532

10

0

29 Nov 2024

New Emerged Security and Privacy of Pre-trained Model: a Survey and
Outlook

New Emerged Security and Privacy of Pre-trained Model: a Survey and Outlook

357

2

0

12 Nov 2024

CAT: Concept-level backdoor ATtacks for Concept Bottleneck Models

CAT: Concept-level backdoor ATtacks for Concept Bottleneck Models

409

2

0

07 Oct 2024

Obliviate: Neutralizing Task-agnostic Backdoors within the
Parameter-efficient Fine-tuning Paradigm

Obliviate: Neutralizing Task-agnostic Backdoors within the Parameter-efficient Fine-tuning ParadigmNorth American Chapter of the Association for Computational Linguistics (NAACL), 2024

Jaehan Kim

Seungwon Shin

311

6

0

21 Sep 2024

The Dark Side of Human Feedback: Poisoning Large Language Models via
User Inputs

The Dark Side of Human Feedback: Poisoning Large Language Models via User Inputs

352

10

0

01 Sep 2024

Rethinking Backdoor Detection Evaluation for Language Models

Rethinking Backdoor Detection Evaluation for Language Models

Wenjie Jacky Mo

375

5

0

31 Aug 2024

Turning Generative Models Degenerate: The Power of Data Poisoning
Attacks

Turning Generative Models Degenerate: The Power of Data Poisoning Attacks

Praneet Adusumilli

Nathalie Baracaldo

325

12

0

17 Jul 2024

Hey, That's My Model! Introducing Chain & Hash, An LLM Fingerprinting Technique

Hey, That's My Model! Introducing Chain & Hash, An LLM Fingerprinting Technique

519

44

0

15 Jul 2024

Distributed Backdoor Attacks on Federated Graph Learning and Certified
Defenses

Distributed Backdoor Attacks on Federated Graph Learning and Certified Defenses

265

23

0

12 Jul 2024

Defending Code Language Models against Backdoor Attacks with Deceptive Cross-Entropy Loss

Defending Code Language Models against Backdoor Attacks with Deceptive Cross-Entropy Loss

444

4

0

12 Jul 2024

Unique Security and Privacy Threats of Large Language Models: A Comprehensive Survey

Unique Security and Privacy Threats of Large Language Models: A Comprehensive Survey

490

22

0

12 Jun 2024

An LLM-Assisted Easy-to-Trigger Backdoor Attack on Code Completion
Models: Injecting Disguised Vulnerabilities against Strong Detection

An LLM-Assisted Easy-to-Trigger Backdoor Attack on Code Completion Models: Injecting Disguised Vulnerabilities against Strong Detection

271

59

0

10 Jun 2024

BadAgent: Inserting and Activating Backdoor Attacks in LLM Agents

BadAgent: Inserting and Activating Backdoor Attacks in LLM Agents

Shengsheng Qian

342

102

0

05 Jun 2024

Cross-Context Backdoor Attacks against Graph Prompt Learning

Cross-Context Backdoor Attacks against Graph Prompt Learning

Ivor Tsang

Xiangliang Zhang

258

24

0

28 May 2024

TrojFM: Resource-efficient Backdoor Attacks against Very Large
Foundation Models

TrojFM: Resource-efficient Backdoor Attacks against Very Large Foundation Models

Michael J. De Lucia

Nathaniel D. Bastian

293

8

0

27 May 2024

SEEP: Training Dynamics Grounds Latent Representation Search for
Mitigating Backdoor Poisoning Attacks

SEEP: Training Dynamics Grounds Latent Representation Search for Mitigating Backdoor Poisoning AttacksTransactions of the Association for Computational Linguistics (TACL), 2024

Benjamin I. P. Rubinstein

227

6

0

19 May 2024

BadEdit: Backdooring large language models by model editing

BadEdit: Backdooring large language models by model editing

Yang Liu

336

106

0

20 Mar 2024

WARDEN: Multi-Directional Backdoor Watermarks for Embedding-as-a-Service
Copyright Protection

WARDEN: Multi-Directional Backdoor Watermarks for Embedding-as-a-Service Copyright Protection

366

15

0

03 Mar 2024

Double-I Watermark: Protecting Model Copyright for LLM Fine-tuning

Double-I Watermark: Protecting Model Copyright for LLM Fine-tuning

609

28

0

22 Feb 2024

Purifying Large Language Models by Ensembling a Small Language Model

Purifying Large Language Models by Ensembling a Small Language Model

Yang Liu

300

30

0

19 Feb 2024

Test-Time Backdoor Attacks on Multimodal Large Language Models

Test-Time Backdoor Attacks on Multimodal Large Language Models

499

44

0

13 Feb 2024

OrderBkd: Textual backdoor attack through repositioning

OrderBkd: Textual backdoor attack through repositioning

Irina Alekseevskaia

Konstantin Arkhipenko

304

5

0

12 Feb 2024

Pre-trained Trojan Attacks for Visual Recognition

Pre-trained Trojan Attacks for Visual Recognition

Xinwei Zhang

Xianglong Liu

353

44

0

23 Dec 2023

Forcing Generative Models to Degenerate Ones: The Power of Data
Poisoning Attacks

Forcing Generative Models to Degenerate Ones: The Power of Data Poisoning Attacks

Nathalie Baracaldo

205

15

0

07 Dec 2023

Foundation Models for Weather and Climate Data Understanding: A
Comprehensive Survey

Foundation Models for Weather and Climate Data Understanding: A Comprehensive Survey

397

44

0

05 Dec 2023

Grounding Foundation Models through Federated Transfer Learning: A
General Framework

Grounding Foundation Models through Federated Transfer Learning: A General FrameworkACM Transactions on Intelligent Systems and Technology (ACM TIST), 2023

Hanlin Gu

645

32

0

29 Nov 2023

Beyond Boundaries: A Comprehensive Survey of Transferable Attacks on AI Systems

Beyond Boundaries: A Comprehensive Survey of Transferable Attacks on AI Systems

520

10

0

20 Nov 2023

TextGuard: Provable Defense against Backdoor Attacks on Text
Classification

TextGuard: Provable Defense against Backdoor Attacks on Text Classification

385

23

0

19 Nov 2023

Watermarking Vision-Language Pre-trained Models for Multi-modal
Embedding as a Service

Watermarking Vision-Language Pre-trained Models for Multi-modal Embedding as a Service

Qi Wu

252

12

0

10 Nov 2023

Last One Standing: A Comparative Analysis of Security and Privacy of
Soft Prompt Tuning, LoRA, and In-Context Learning

Last One Standing: A Comparative Analysis of Security and Privacy of Soft Prompt Tuning, LoRA, and In-Context Learning

Michael Backes

249

18

0

17 Oct 2023

Privacy in Large Language Models: Attacks, Defenses and Future
Directions

Privacy in Large Language Models: Attacks, Defenses and Future Directions

512

78

0

16 Oct 2023

AFLOW: Developing Adversarial Examples under Extremely Noise-limited
Settings

AFLOW: Developing Adversarial Examples under Extremely Noise-limited Settings

222

7

0

15 Oct 2023

Composite Backdoor Attacks Against Large Language Models

Composite Backdoor Attacks Against Large Language Models

Subrat Kishore Dutta

Michael Backes

246

91

0

11 Oct 2023

Fine-tuning Aligned Language Models Compromises Safety, Even When Users
Do Not Intend To!

Fine-tuning Aligned Language Models Compromises Safety, Even When Users Do Not Intend To!International Conference on Learning Representations (ICLR), 2023

Yi Zeng

Peter Henderson

483

1,058

0

05 Oct 2023

PETA: Parameter-Efficient Trojan Attacks

PETA: Parameter-Efficient Trojan Attacks

530

1

0

01 Oct 2023

Backdoor Attacks and Countermeasures in Natural Language Processing
Models: A Comprehensive Security Review

Backdoor Attacks and Countermeasures in Natural Language Processing Models: A Comprehensive Security ReviewIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2023

801

55

0

12 Sep 2023

A Comprehensive Overview of Backdoor Attacks in Large Language Models
within Communication Networks

A Comprehensive Overview of Backdoor Attacks in Large Language Models within Communication NetworksIEEE Network (IEEE Netw.), 2023

363

79

0

28 Aug 2023

LMSanitator: Defending Prompt-Tuning Against Task-Agnostic Backdoors

LMSanitator: Defending Prompt-Tuning Against Task-Agnostic BackdoorsNetwork and Distributed System Security Symposium (NDSS), 2023

260

19

0

26 Aug 2023

Use of LLMs for Illicit Purposes: Threats, Prevention Measures, and
Vulnerabilities

Use of LLMs for Illicit Purposes: Threats, Prevention Measures, and Vulnerabilities

Maximilian Mozes

Bennett Kleinberg

Lewis D. Griffin

261

120

0

24 Aug 2023

Page 1 of 2