v1v2 (latest)

A Game Theoretic Framework for Model Based Reinforcement Learning

International Conference on Machine Learning (ICML), 2020

16 April 2020

Aravind Rajeswaran

Igor Mordatch

Vikash Kumar

OffRL

ArXiv (abs)PDF HTML

Papers citing "A Game Theoretic Framework for Model Based Reinforcement Learning"

50 / 80 papers shown

Policy-Driven World Model Adaptation for Robust Offline Model-based Reinforcement Learning

535

19 May 2025

Imitation Learning of Correlated Policies in Stackelberg Games

Kunag-Da Wang

Ping-Chun Hsieh

Chao-Han Huck Yang

529

11 Mar 2025

Adversarial Policy Optimization for Offline Preference-based Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2025

Hyungkyu Kang

Min-hwan Oh

OffRL

447

07 Mar 2025

Understanding World or Predicting Future? A Comprehensive Survey of World ModelsACM Computing Surveys (ACM CSUR), 2024

...

Chen Gao

Fengli Xu

Yong Li

VGen SyDa

641

21 Nov 2024

Scalable Reinforcement Post-Training Beyond Static Human Prompts: Evolving Alignment via Asymmetric Self-Play

378

31 Oct 2024

Towards Differentiable Multilevel Optimization: A Gradient-Based Approach

Yuntian Gu

Xuzheng Chen

239

15 Oct 2024

Self-Supervised Video Representation Learning in a Heuristic Decoupled Perspective

427

19 Jul 2024

Short-Long Policy Evaluation with Novel Actions

382

04 Jul 2024

BiLoRA: A Bi-level Optimization Framework for Overfitting-Resilient Low-Rank Adaptation of Large Pre-trained Models

196

19 Mar 2024

A Model-Based Approach for Improving Reinforcement Learning Efficiency Leveraging Expert Observations

232

29 Feb 2024

Performative Reinforcement Learning in Gradually Shifting Environments

Ben Rank

Stelios Triantafyllou

Debmalya Mandal

Goran Radanović

OffRL

458

15 Feb 2024

Leveraging Approximate Model-based Shielding for Probabilistic Safety Guarantees in Continuous Environments

Alexander W. Goodall

Francesco Belardinelli

OffRL

316

01 Feb 2024

Data protection psychology using game theory

Mike Nkongolo

Jahrad Sewnath

136

03 Jan 2024

Refining Diffusion Planner for Reliable Behavior Synthesis by Automatic Detection of Infeasible PlansNeural Information Processing Systems (NeurIPS), 2023

331

30 Oct 2023

Behavior Alignment via Reward Function OptimizationNeural Information Processing Systems (NeurIPS), 2023

Bruno Castro da Silva

435

29 Oct 2023

Memory-based Controllers for Efficient Data-driven Control of Soft Robots

Yuzhe Wu

Ehsan Nekouei

122

19 Sep 2023

Approximate Model-Based Shielding for Safe Reinforcement LearningEuropean Conference on Artificial Intelligence (ECAI), 2023

Alexander W. Goodall

Francesco Belardinelli

301

27 Jul 2023

Learning non-Markovian Decision-Making from State-only SequencesNeural Information Processing Systems (NeurIPS), 2023

408

27 Jun 2023

Stackelberg Games for Learning Emergent Behaviors During Competitive AutocurriculaIEEE International Conference on Robotics and Automation (ICRA), 2023

226

04 May 2023

Masked Trajectory Models for Prediction, Representation, and ControlInternational Conference on Machine Learning (ICML), 2023

Pieter Abbeel

Aravind Rajeswaran

OffRL

332

04 May 2023

Causal Semantic Communication for Digital Twins: A Generalizable Imitation Learning ApproachIEEE Journal on Selected Areas in Information Theory (JSAIT), 2023

Christo Kurisummoottil Thomas

Walid Saad

Yong Xiao

256

25 Apr 2023

Implicit Poisoning Attacks in Two-Agent Reinforcement Learning: Adversarial Policies for Training-Time AttacksAdaptive Agents and Multi-Agent Systems (AAMAS), 2023

234

27 Feb 2023

Risk-Averse Model Uncertainty for Distributionally Robust Safe Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

James Queeney

M. Benosman

OOD OffRL

350

30 Jan 2023

Beyond Inverted Pendulums: Task-optimal Simple Models of Legged LocomotionIEEE Transactions on robotics (TRO), 2023

Yu-Ming Chen

Jian-bo Hu

Michael Posa

490

05 Jan 2023

One Risk to Rule Them All: A Risk-Sensitive Perspective on Model-Based Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

540

30 Nov 2022

Task-Driven Hybrid Model Reduction for Dexterous ManipulationIEEE Transactions on robotics (TRO), 2022

Wanxin Jin

Michael Posa

468

30 Nov 2022

Learning Modular Robot Locomotion from Demonstrations

Julian Whitman

Howie Choset

238

31 Oct 2022

Learning Modular Robot Visual-motor Locomotion PoliciesIEEE International Conference on Robotics and Automation (ICRA), 2022

Julian Whitman

Howie Choset

276

31 Oct 2022

Real World Offline Reinforcement Learning with Realistic Data SourceIEEE International Conference on Robotics and Automation (ICRA), 2022

Aravind Rajeswaran

Vikash Kumar

OffRL

325

12 Oct 2022

A Unified Framework for Alternating Offline Model Training and Policy LearningNeural Information Processing Systems (NeurIPS), 2022

323

12 Oct 2022

Simplifying Model-based RL: Learning Representations, Latent-space Models, and Policies with One ObjectiveInternational Conference on Learning Representations (ICLR), 2022

Homanga Bharadhwaj

449

18 Sep 2022

Live in the Moment: Learning Dynamics Model Adapted to Evolving PolicyInternational Conference on Machine Learning (ICML), 2022

Xiyao Wang

Wichayaporn Wongkamjan

Furong Huang

458

25 Jul 2022

A Survey of Decision Making in Adversarial GamesScience China Information Sciences (Sci. China Inf. Sci.), 2022

355

16 Jul 2022

Betty: An Automatic Differentiation Library for Multilevel OptimizationInternational Conference on Learning Representations (ICLR), 2022

359

05 Jul 2022

Performative Reinforcement LearningInternational Conference on Machine Learning (ICML), 2022

Debmalya Mandal

Stelios Triantafyllou

Goran Radanović

466

30 Jun 2022

Generalized Policy Improvement Algorithms with Theoretically Supported Sample ReuseIEEE Transactions on Automatic Control (TAC), 2022

James Queeney

I. Paschalidis

Christos G. Cassandras

OffRL

402

28 Jun 2022

A Survey on Model-based Reinforcement LearningScience China Information Sciences (Sci. China Inf. Sci.), 2022

487

167

19 Jun 2022

Regularizing a Model-based Policy Stationary Distribution to Stabilize Offline Reinforcement LearningInternational Conference on Machine Learning (ICML), 2022

294

14 Jun 2022

Sampling without Replacement Leads to Faster Rates in Finite-Sum Minimax OptimizationNeural Information Processing Systems (NeurIPS), 2022

Aniket Das

Bernhard Schölkopf

Michael Muehlebach

339

07 Jun 2022

Beyond backpropagation: bilevel optimization through implicit differentiation and equilibrium propagationNeural Computation (Neural Comput.), 2022

Nicolas Zucchet

João Sacramento

423

06 May 2022

VRL3: A Data-Driven Framework for Visual Deep Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

Dongsheng Li

520

17 Feb 2022

A Ranking Game for Imitation Learning

372

07 Feb 2022

Adversarially Trained Actor Critic for Offline Reinforcement LearningInternational Conference on Machine Learning (ICML), 2022

394

153

05 Feb 2022

Offline Reinforcement Learning for Road Traffic Control

Mayuresh Kunjir

Sanjay Chawla

OffRL

303

07 Jan 2022

Can Reinforcement Learning Find Stackelberg-Nash Equilibria in General-Sum Markov Games with Myopic Followers?

367

27 Dec 2021

Lyapunov Exponents for Diversity in Differentiable GamesAdaptive Agents and Multi-Agent Systems (AAMAS), 2021

Paul Vicol

219

24 Dec 2021

On Effective Scheduling of Model-based Reinforcement Learning

Ruiming Tang

Yong Yu

Zhenguo Li

325

16 Nov 2021

Robot Learning from Randomized Simulations: A ReviewFrontiers in Robotics and AI (Front. Robot. AI), 2021

Wenhao Yu

Jan Peters

448

130

01 Nov 2021

Mismatched No More: Joint Model-Policy Optimization for Model-Based RL

556

06 Oct 2021

Learning Dynamics Models for Model Predictive Agents

291

29 Sep 2021