v1v2 (latest)

Adaptive Reward-Poisoning Attacks against Reinforcement Learning

International Conference on Machine Learning (ICML), 2020

27 March 2020

Papers citing "Adaptive Reward-Poisoning Attacks against Reinforcement Learning"

50 / 89 papers shown

Exposing Vulnerabilities in RL: A Novel Stealthy Backdoor Attack through Reward Poisoning

181

27 Nov 2025

Diffusion Guided Adversarial State Perturbations in Reinforcement Learning

193

10 Nov 2025

Agentic AI Security: Threats, Defenses, Evaluation, and Open Challenges

414

27 Oct 2025

Provably Invincible Adversarial Attacks on Reinforcement Learning Systems: A Rate-Distortion Information-Theoretic Approach

118

15 Oct 2025

Density-Ratio Weighted Behavioral Cloning: Learning Control Policies from Corrupted Datasets

Shriram Karpoora Sundara Pandian

Ali Baheri

OffRL

215

01 Oct 2025

Constrained Black-Box Attacks Against Cooperative Multi-Agent Reinforcement Learning

130

12 Aug 2025

Policy Disruption in Reinforcement Learning:Adversarial Attack with Large Language Models and Critical State Identification

164

24 Jul 2025

Collapsing Sequence-Level Data-Policy Coverage via Poisoning Attack in Offline Reinforcement LearningConference on Uncertainty in Artificial Intelligence (UAI), 2025

217

12 Jun 2025

Can In-Context Reinforcement Learning Recover From Reward Poisoning Attacks?

Paulius Sasnauskas

Yiğit Yalın

Goran Radanović

265

07 Jun 2025

Optimally Installing Strict Equilibria

339

05 Mar 2025

Provably Robust Federated Reinforcement LearningThe Web Conference (WWW), 2025

329

12 Feb 2025

Reinforcement Teaching

456

28 Jan 2025

Position: Mind the Gap-the Growing Disconnect Between Established Vulnerability Disclosure and AI Security

532

19 Dec 2024

Online Poisoning Attack Against Reinforcement Learning under Black-box Environments

345

01 Dec 2024

Provably Efficient Action-Manipulation Attack Against Continuous Reinforcement Learning

266

20 Nov 2024

SpecGuard: Specification Aware Recovery for Robotic Autonomous Vehicles from Physical AttacksConference on Computer and Communications Security (CCS), 2024

213

27 Aug 2024

CuDA2: An approach for Incorporating Traitor Agents into Cooperative Multi-Agent Systems

210

25 Jun 2024

Defending Against Sophisticated Poisoning Attacks with RL-based Aggregation in Federated Learning

Hainan Zhang

Binghui Guo

217

20 Jun 2024

Exploring Fairness in Educational Data Mining in the Context of the Right to be Forgotten

377

27 May 2024

Policy Iteration for Two-Player General-Sum Stochastic Stackelberg Games

Mikoto Kudo

Yohei Akimoto

219

07 May 2024

Data Poisoning Attacks on Off-Policy Policy Evaluation Methods

Himabindu Lakkaraju

250

06 Apr 2024

Strategizing against Q-learners: A Control-theoretical ApproachIEEE Control Systems Letters (L-CSS), 2024

Yuksel Arslantas

Ege Yuceel

Muhammed O. Sayin

326

13 Mar 2024

Belief-Enriched Pessimistic Q-Learning against Adversarial State Perturbations

Xiaolin Sun

Zizhan Zheng

OnRL

295

06 Mar 2024

Stealthy Adversarial Attacks on Stochastic Multi-Armed Bandits

320

21 Feb 2024

Beyond Worst-case Attacks: Robust RL with Adaptive Defense via Non-dominated Policies

Furong Huang

365

20 Feb 2024

SUB-PLAY: Adversarial Policies against Partially Observed Multi-Agent Reinforcement Learning SystemsConference on Computer and Communications Security (CCS), 2024

Yuwen Pu

302

06 Feb 2024

Assessing the Impact of Distribution Shift on Reinforcement Learning Performance

264

05 Feb 2024

Camouflage Adversarial Attacks on Multiple Agent Systems

224

30 Jan 2024

Adaptive Discounting of Training Time Attacks

257

05 Jan 2024

PGN: A perturbation generation network against deep reinforcement learning

129

20 Dec 2023

BadRL: Sparse Targeted Backdoor Attack Against Reinforcement Learning

268

19 Dec 2023

Optimal Attack and Defense for Reinforcement LearningAAAI Conference on Artificial Intelligence (AAAI), 2023

328

30 Nov 2023

RLHFPoison: Reward Poisoning Attack for Reinforcement Learning with Human Feedback in Large Language Models

261

16 Nov 2023

Optimal Cost Constrained Adversarial Attacks For Multiple Agent SystemsAnnual Conference on Information Sciences and Systems (CISS), 2023

213

01 Nov 2023

Minimally Modifying a Markov Game to Achieve Any Nash Equilibrium and ValueInternational Conference on Machine Learning (ICML), 2023

508

01 Nov 2023

Corruption-Robust Offline Reinforcement Learning with General Function ApproximationNeural Information Processing Systems (NeurIPS), 2023

Chen Ye

Rui Yang

Quanquan Gu

Tong Zhang

OffRL

463

23 Oct 2023

Adversarial Attacks on Combinatorial Multi-Armed BanditsInternational Conference on Machine Learning (ICML), 2023

321

08 Oct 2023

Building Privacy-Preserving and Secure Geospatial Artificial Intelligence Foundation Models

378

29 Sep 2023

BRNES: Enabling Security and Privacy-aware Experience Sharing in Multiagent Robotic and Autonomous SystemsIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2023

165

02 Aug 2023

Efficient Adversarial Attacks on Online Multi-agent Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

Guanlin Liu

Lifeng Lai

AAML

223

15 Jul 2023

Efficient Action Robust Reinforcement Learning with Probabilistic Policy Execution Uncertainty

333

15 Jul 2023

Data Poisoning to Fake a Nash Equilibrium in Markov Games

319

13 Jun 2023

A Reminder of its Brittleness: Language Reward Shaping May Hinder Learning for Instruction Following Agents

Sukai Huang

Nir Lipovetzky

Trevor Cohn

286

26 May 2023

Black-Box Targeted Reward Poisoning Attack Against Online Deep Reinforcement Learning

Yinglun Xu

Gagandeep Singh

OffRL AAML

232

18 May 2023

Policy Resilience to Environment Poisoning Attacks on Reinforcement Learning

Hang Xu

Xinghua Qu

Zinovi Rabinovich

256

24 Apr 2023

Local Environment Poisoning Attacks on Federated Reinforcement Learning

412

05 Mar 2023

Implicit Poisoning Attacks in Two-Agent Reinforcement Learning: Adversarial Policies for Training-Time AttacksAdaptive Agents and Multi-Agent Systems (AAMAS), 2023

219

27 Feb 2023

Adversarial Attacks on Adversarial BanditsInternational Conference on Learning Representations (ICLR), 2023

Yuzhe Ma

Zhijin Zhou

AAML

184

30 Jan 2023

New Challenges in Reinforcement Learning: A Survey of Security and PrivacyArtificial Intelligence Review (Artif Intell Rev), 2022

346

31 Dec 2022

Security of Deep Reinforcement Learning for Autonomous Driving: A Survey

387

12 Dec 2022