Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
1706.06083
Cited By

Towards Deep Learning Models Resistant to Adversarial Attacks

v1v2v3v4 (latest)

Towards Deep Learning Models Resistant to Adversarial Attacks

19 June 2017

Aleksander Madry

Aleksandar Makelov

Dimitris Tsipras

ArXiv (abs)PDF HTML Github (752★)

Papers citing "Towards Deep Learning Models Resistant to Adversarial Attacks"

50 / 7,067 papers shown

SPEAR++: Scaling Gradient Inversion via Sparsely-Used Dictionary Learning

SPEAR++: Scaling Gradient Inversion via Sparsely-Used Dictionary Learning

Alexander Bakarsky

Dimitar I. Dimitrov

Maximilian Baader

101

0

0

28 Oct 2025

Self-Calibrated Consistency can Fight Back for Adversarial Robustness in Vision-Language Models

Self-Calibrated Consistency can Fight Back for Adversarial Robustness in Vision-Language Models

124

1

0

26 Oct 2025

Stable neural networks and connections to continuous dynamical systems

Stable neural networks and connections to continuous dynamical systems

Matthias Joachim Ehrhardt

96

0

0

25 Oct 2025

FrameShield: Adversarially Robust Video Anomaly Detection

FrameShield: Adversarially Robust Video Anomaly Detection

Bardia Soltani Moakhar

Mohammad Sabokrou

173

0

0

24 Oct 2025

Toward Understanding the Transferability of Adversarial Suffixes in Large Language Models

Toward Understanding the Transferability of Adversarial Suffixes in Large Language Models

Alexander Robey

Avi Schwarzschild

Andrej Risteski

297

0

0

24 Oct 2025

Transferable Black-Box One-Shot Forging of Watermarks via Image Preference Models

Transferable Black-Box One-Shot Forging of Watermarks via Image Preference Models

Tomáš Souček

Sylvestre-Alvise Rebuffi

Pierre Fernandez

Nikola Jovanović

Valeriu Lacatusu

Alexandre Mourachko

298

0

0

23 Oct 2025

Kernel Learning with Adversarial Features: Numerical Efficiency and Adaptive Regularization

Kernel Learning with Adversarial Features: Numerical Efficiency and Adaptive Regularization

Antônio H. Ribeiro

David Vävinggren

Thomas B. Schon

137

0

0

23 Oct 2025

Adversarially-Aware Architecture Design for Robust Medical AI Systems

Adversarially-Aware Architecture Design for Robust Medical AI Systems

190

1

0

23 Oct 2025

H-SPLID: HSIC-based Saliency Preserving Latent Information Decomposition

H-SPLID: HSIC-based Saliency Preserving Latent Information Decomposition

Andrii Shkabrii

Theodoros Thirimachos Davarakis

Stratis Ioannidis

102

0

0

23 Oct 2025

FPT-Noise: Dynamic Scene-Aware Counterattack for Test-Time Adversarial Defense in Vision-Language Models

FPT-Noise: Dynamic Scene-Aware Counterattack for Test-Time Adversarial Defense in Vision-Language Models

156

1

0

22 Oct 2025

Revisiting the Relation Between Robustness and Universality

Revisiting the Relation Between Robustness and Universality

109

0

0

22 Oct 2025

Towards Strong Certified Defense with Universal Asymmetric Randomization

Towards Strong Certified Defense with Universal Asymmetric Randomization

157

0

0

22 Oct 2025

AegisRF: Adversarial Perturbations Guided with Sensitivity for Protecting Intellectual Property of Neural Radiance Fields

AegisRF: Adversarial Perturbations Guided with Sensitivity for Protecting Intellectual Property of Neural Radiance Fields

161

0

0

22 Oct 2025

The Black Tuesday Attack: how to crash the stock market with adversarial examples to financial forecasting models

The Black Tuesday Attack: how to crash the stock market with adversarial examples to financial forecasting models

Thomas Hofweber

150

0

0

21 Oct 2025

PP3D: An In-Browser Vision-Based Defense Against Web Behavior Manipulation Attacks

PP3D: An In-Browser Vision-Based Defense Against Web Behavior Manipulation Attacks

Karthika Subramani

Saranyan Senthivel

93

0

0

21 Oct 2025

S2AP: Score-space Sharpness Minimization for Adversarial Pruning

S2AP: Score-space Sharpness Minimization for Adversarial Pruning

Christian Wressnegger

Battista Biggio

135

0

0

21 Oct 2025

Black-Box Evasion Attacks on Data-Driven Open RAN Apps: Tailored Design and Experimental Evaluation

Black-Box Evasion Attacks on Data-Driven Open RAN Apps: Tailored Design and Experimental Evaluation

Pranshav Gajjar

Mahesh K. Marina

136

0

0

20 Oct 2025

A Single Set of Adversarial Clothes Breaks Multiple Defense Methods in the Physical World

A Single Set of Adversarial Clothes Breaks Multiple Defense Methods in the Physical World

83

0

0

20 Oct 2025

Data Unlearning Beyond Uniform Forgetting via Diffusion Time and Frequency Selection

Data Unlearning Beyond Uniform Forgetting via Diffusion Time and Frequency Selection

250

0

0

20 Oct 2025

Variance-Reduction Guidance: Sampling Trajectory Optimization for Diffusion Models

Variance-Reduction Guidance: Sampling Trajectory Optimization for Diffusion Models

103

1

0

20 Oct 2025

A Versatile Framework for Designing Group-Sparse Adversarial Attacks

A Versatile Framework for Designing Group-Sparse Adversarial Attacks

Alireza Heshmati

Saman Soleimani Roudi

Shahrokh Ghaemmaghami

Farokh Marvasti

147

0

0

18 Oct 2025

Bridging Symmetry and Robustness: On the Role of Equivariance in Enhancing Adversarial Robustness

Bridging Symmetry and Robustness: On the Role of Equivariance in Enhancing Adversarial Robustness

Ifrat Ikhtear Uddin

261

2

0

17 Oct 2025

Constrained Adversarial Perturbation

Constrained Adversarial Perturbation

Virendra Nishad

Sayak Ray Chowdhury

150

0

0

17 Oct 2025

When Flatness Does (Not) Guarantee Adversarial Robustness

When Flatness Does (Not) Guarantee Adversarial Robustness

Nils Philipp Walter

141

1

0

16 Oct 2025

SAJA: A State-Action Joint Attack Framework on Multi-Agent Deep Reinforcement Learning

SAJA: A State-Action Joint Attack Framework on Multi-Agent Deep Reinforcement Learning

94

0

0

15 Oct 2025

NAPPure: Adversarial Purification for Robust Image Classification under Non-Additive Perturbations

NAPPure: Adversarial Purification for Robust Image Classification under Non-Additive Perturbations

233

0

0

15 Oct 2025

Model-agnostic Adversarial Attack and Defense for Vision-Language-Action Models

Model-agnostic Adversarial Attack and Defense for Vision-Language-Action Models

181

3

0

15 Oct 2025

Generalist++: A Meta-learning Framework for Mitigating Trade-off in Adversarial Training

Generalist++: A Meta-learning Framework for Mitigating Trade-off in Adversarial Training

131

1

0

15 Oct 2025

Towards Adversarial Robustness and Uncertainty Quantification in DINOv2-based Few-Shot Anomaly Detection

Towards Adversarial Robustness and Uncertainty Quantification in DINOv2-based Few-Shot Anomaly Detection

Akib Mohammed Khan

Bartosz Krawczyk

137

0

0

15 Oct 2025

Pruning Cannot Hurt Robustness: Certified Trade-offs in Reinforcement Learning

Pruning Cannot Hurt Robustness: Certified Trade-offs in Reinforcement Learning

Benjamin Etheridge

Stephen J. Roberts

Francesco Quinzan

116

0

0

14 Oct 2025

KoALA: KL-L0 Adversarial Detector via Label Agreement

KoALA: KL-L0 Adversarial Detector via Label Agreement

124

0

0

14 Oct 2025

Joint Discriminative-Generative Modeling via Dual Adversarial Training

Joint Discriminative-Generative Modeling via Dual Adversarial Training

435

0

0

13 Oct 2025

Adversarial Robustness in One-Stage Learning-to-Defer

Adversarial Robustness in One-Stage Learning-to-Defer

Yannis Montreuil

112

1

0

13 Oct 2025

Empirical Study on Robustness and Resilience in Cooperative Multi-Agent Reinforcement Learning

Empirical Study on Robustness and Resilience in Cooperative Multi-Agent Reinforcement Learning

...

154

0

0

13 Oct 2025

Adversarial Attacks Leverage Interference Between Features in Superposition

Adversarial Attacks Leverage Interference Between Features in Superposition

Edward Stevinson

113

0

0

13 Oct 2025

The Easy Path to Robustness: Coreset Selection using Sample Hardness

The Easy Path to Robustness: Coreset Selection using Sample Hardness

Deepak Ravikumar

Gopalakrishnan Srinivasan

141

0

0

13 Oct 2025

CoDefend: Cross-Modal Collaborative Defense via Diffusion Purification and Prompt Optimization

CoDefend: Cross-Modal Collaborative Defense via Diffusion Purification and Prompt Optimization

114

0

0

13 Oct 2025

Anchor-based Maximum Discrepancy for Relative Similarity Testing

Anchor-based Maximum Discrepancy for Relative Similarity Testing

127

0

0

12 Oct 2025

Adversarial Attacks on Downstream Weather Forecasting Models: Application to Tropical Cyclone Trajectory Prediction

Adversarial Attacks on Downstream Weather Forecasting Models: Application to Tropical Cyclone Trajectory Prediction

Francisco Santos

103

0

0

11 Oct 2025

Explainable Human-in-the-Loop Segmentation via Critic Feedback Signals

Explainable Human-in-the-Loop Segmentation via Critic Feedback Signals

Yasaman Mohammadpour

130

0

0

11 Oct 2025

Tight Robustness Certificates and Wasserstein Distributional Attacks for Deep Neural Networks

Tight Robustness Certificates and Wasserstein Distributional Attacks for Deep Neural Networks

190

0

0

11 Oct 2025

SegTrans: Transferable Adversarial Examples for Segmentation Models

SegTrans: Transferable Adversarial Examples for Segmentation Models

144

5

0

10 Oct 2025

A geometrical approach to solve the proximity of a point to an axisymmetric quadric in space

A geometrical approach to solve the proximity of a point to an axisymmetric quadric in space

Bibekananda Patra

Aditya Mahesh Kolte

Sandipan Bandyopadhyay

122

11

0

10 Oct 2025

Uncolorable Examples: Preventing Unauthorized AI Colorization via Perception-Aware Chroma-Restrictive Perturbation

Uncolorable Examples: Preventing Unauthorized AI Colorization via Perception-Aware Chroma-Restrictive Perturbation

Ching-Chun Chang

127

0

0

10 Oct 2025

A unified Bayesian framework for adversarial robustness

A unified Bayesian framework for adversarial robustness

David Ríos Insua

113

0

0

10 Oct 2025

Text Prompt Injection of Vision Language Models

Text Prompt Injection of Vision Language Models

342

1

0

10 Oct 2025

VisuoAlign: Safety Alignment of LVLMs with Multimodal Tree Search

VisuoAlign: Safety Alignment of LVLMs with Multimodal Tree Search

129

0

0

10 Oct 2025

SynthID-Image: Image watermarking at internet scale

SynthID-Image: Image watermarking at internet scale

Florian Stimberg

Guillermo Ortiz-Jimenez

...

Christopher Savčak

257

4

0

10 Oct 2025

MemLoss: Enhancing Adversarial Training with Recycling Adversarial Examples

MemLoss: Enhancing Adversarial Training with Recycling Adversarial Examples

M. Amirmazlaghani

Zahra Dehghanian

83

0

0

10 Oct 2025

The Attacker Moves Second: Stronger Adaptive Attacks Bypass Defenses Against Llm Jailbreaks and Prompt Injections

The Attacker Moves Second: Stronger Adaptive Attacks Bypass Defenses Against Llm Jailbreaks and Prompt Injections

Nicholas Carlini

Chawin Sitawarin

Sander Schulhoff

...

Abhradeep Thakurta

Kai Yuanqing Xiao

183

15

0

10 Oct 2025

1 2 3 4 5 6...140 141 142

Page 3 of 142

Pageof 142