Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2402.08991
Cited By

Towards Robust Model-Based Reinforcement Learning Against Adversarial
Corruption

v1v2 (latest)

Towards Robust Model-Based Reinforcement Learning Against Adversarial Corruption

14 February 2024

Quanquan Gu

Tong Zhang

ArXiv (abs)PDF HTML Github

Papers citing "Towards Robust Model-Based Reinforcement Learning Against Adversarial Corruption"

8 / 8 papers shown

RobustVLA: Robustness-Aware Reinforcement Post-Training for Vision-Language-Action Models

RobustVLA: Robustness-Aware Reinforcement Post-Training for Vision-Language-Action Models

499

4

0

03 Nov 2025

Robust Policy Expansion for Offline-to-Online RL under Diverse Data Corruption

Robust Policy Expansion for Offline-to-Online RL under Diverse Data Corruption

399

0

0

29 Sep 2025

ORVIT: Near-Optimal Online Distributionally Robust Reinforcement Learning

ORVIT: Near-Optimal Online Distributionally Robust Reinforcement Learning

447

3

0

05 Aug 2025

Daunce: Data Attribution through Uncertainty Estimation

Daunce: Data Attribution through Uncertainty Estimation

Joseph Melkonian

219

2

0

29 May 2025

Catoni Contextual Bandits are Robust to Heavy-tailed Rewards

Catoni Contextual Bandits are Robust to Heavy-tailed Rewards

494

1

0

04 Feb 2025

A Model Selection Approach for Corruption Robust Reinforcement Learning

A Model Selection Approach for Corruption Robust Reinforcement LearningInternational Conference on Algorithmic Learning Theory (ALT), 2021

445

51

0

31 Dec 2024

Sharp Analysis for KL-Regularized Contextual Bandits and RLHF

Sharp Analysis for KL-Regularized Contextual Bandits and RLHF

702

19

0

07 Nov 2024

Distributionally Robust Reinforcement Learning with Interactive Data
Collection: Fundamental Hardness and Near-Optimal Algorithm

Distributionally Robust Reinforcement Learning with Interactive Data Collection: Fundamental Hardness and Near-Optimal AlgorithmNeural Information Processing Systems (NeurIPS), 2024

Tong Zhang

Jose H. Blanchet

295

23

0

04 Apr 2024

Page 1 of 1