Learning Robust Policy against Disturbance in Transition Dynamics via State-Conservative Policy Optimization

AAAI Conference on Artificial Intelligence (AAAI), 2021

20 December 2021

ArXiv (abs)PDF HTML Github

Papers citing "Learning Robust Policy against Disturbance in Transition Dynamics via State-Conservative Policy Optimization"

17 / 17 papers shown

Dual-Robust Cross-Domain Offline Reinforcement Learning Against Dynamics Shifts

227

02 Dec 2025

Robust Reinforcement Learning in Finance: Modeling Market Impact with Elliptic Uncertainty Sets

Shaocong Ma

Heng Huang

OOD AIFin OffRL

380

22 Oct 2025

Keep on Going: Learning Robust Humanoid Motion Skills via Selective Adversarial Training

318

11 Jul 2025

Mirror Descent Policy Optimisation for Robust Constrained Markov Decision Processes

David Bossens

Atsushi Nitanda

457

29 Jun 2025

Generalization in Monitored Markov Decision Processes (Mon-MDPs)

Montaser Mohammedalamen

Michael Bowling

365

13 May 2025

Finite-Sample Analysis of Policy Evaluation for Robust Average Reward Reinforcement Learning

613

24 Feb 2025

Robust Deep Reinforcement Learning with Adaptive Adversarial Perturbations in Action Space

159

20 May 2024

Lipschitz-Regularized Critics Lead to Policy Robustness Against Transition Dynamics Uncertainty

417

22 Apr 2024

Distributionally Robust Reinforcement Learning with Interactive Data Collection: Fundamental Hardness and Near-Optimal AlgorithmNeural Information Processing Systems (NeurIPS), 2024

Tong Zhang

292

04 Apr 2024

Learning to Stop Cut Generation for Efficient Mixed-Integer Linear Programming

Haotian Ling

Zhihai Wang

Jie Wang

345

31 Jan 2024

MICRO: Model-Based Offline Reinforcement Learning with a Conservative Bellman Operator

384

07 Dec 2023

Adjustable Robust Reinforcement Learning for Online 3D Bin PackingNeural Information Processing Systems (NeurIPS), 2023

265

06 Oct 2023

Natural Actor-Critic for Robust Reinforcement Learning with Function ApproximationNeural Information Processing Systems (NeurIPS), 2023

410

17 Jul 2023

Double Pessimism is Provably Efficient for Distributionally Robust Offline Reinforcement Learning: Generic Algorithm and Robust Partial CoverageNeural Information Processing Systems (NeurIPS), 2023

Tong Zhang

359

16 May 2023

Adversarial Policy Optimization in Deep Reinforcement Learning

Md Masudur Rahman

Yexiang Xue

AAML

172

27 Apr 2023

Optimal Transport Perturbations for Safe Reinforcement Learning with Robustness Guarantees

James Queeney

E. C. Ozcan

I. Paschalidis

Christos G. Cassandras

OOD OffRL

356

31 Jan 2023

Provable Sim-to-real Transfer in Continuous Domain with Partial ObservationsInternational Conference on Learning Representations (ICLR), 2022

371

27 Oct 2022