v1v2v3 (latest)

Provable Self-Play Algorithms for Competitive Reinforcement Learning

International Conference on Machine Learning (ICML), 2020

10 February 2020

Papers citing "Provable Self-Play Algorithms for Competitive Reinforcement Learning"

50 / 109 papers shown

Proximal Regret and Proximal Correlated Equilibria: A New Tractable Solution Concept for Online Learning and Games

276

03 Nov 2025

Game-Theoretic Understandings of Multi-Agent Systems with Multiple Objectives

Yue Wang

195

27 Sep 2025

Language Self-Play For Data-Free Training

Jason Chen

489

09 Sep 2025

Sample-Efficient Distributionally Robust Multi-Agent Reinforcement Learning via Online Interaction

Zain Ulabedeen Farhat

Debamita Ghosh

George Atia

Yue Wang

211

04 Aug 2025

Learning Equilibria from Data: Provably Efficient Multi-Agent Imitation Learning

326

23 May 2025

The Lagrangian Method for Solving Constrained Markov Games

355

13 Mar 2025

Learning in Markov Games with Adaptive Adversaries: Policy Regret, Fundamental Barriers, and Efficient AlgorithmsNeural Information Processing Systems (NeurIPS), 2024

Thanh Nguyen-Tang

Raman Arora

413

01 Nov 2024

Transformers as Game Players: Provable In-context Game-playing Capabilities of Pre-trained ModelsNeural Information Processing Systems (NeurIPS), 2024

Chengshuai Shi

Kun Yang

Jing Yang

Cong Shen

261

13 Oct 2024

Efficient Reinforcement Learning in Probabilistic Reward MachinesAAAI Conference on Artificial Intelligence (AAAI), 2024

Xiaofeng Lin

Xuezhou Zhang

298

19 Aug 2024

Efficacy of Language Model Self-Play in Non-Zero-Sum Games

Austen Liao

Nicholas Tomlin

Dan Klein

375

27 Jun 2024

Competing for pixels: a self-play algorithm for weakly-supervised segmentation

...

Matthew J. Clarkson

329

26 May 2024

Taming Equilibrium Bias in Risk-Sensitive Multi-Agent Reinforcement Learning

Yingjie Fei

Ruitu Xu

220

04 May 2024

Provably Efficient Information-Directed Sampling Algorithms for Multi-Agent Reinforcement Learning

Qiaosheng Zhang

Chenjia Bai

Shuyue Hu

Zhen Wang

Xuelong Li

325

30 Apr 2024

Differentially Private Reinforcement Learning with Self-Play

Dan Qiao

Yu Wang

281

11 Apr 2024

DP-Dueling: Learning from Preference Feedback without Compromising User Privacy

Aadirupa Saha

Hilal Asi

305

22 Mar 2024

Provably Efficient Partially Observable Risk-Sensitive Reinforcement Learning with Hindsight Observation

Tonghe Zhang

Yu Chen

Longbo Huang

269

28 Feb 2024

Refined Sample Complexity for Markov Games with Independent Linear Function ApproximationAnnual Conference Computational Learning Theory (COLT), 2024

Yan Dai

Qiwen Cui

S. S. Du

397

11 Feb 2024

$$\widetilde{O}(T^{-1})$ Convergence to (Coarse) Correlated Equilibria in Full-Information General-Sum Markov Games$

\widetilde{O}(T^{-1})

Convergence to (Coarse) Correlated Equilibria in Full-Information General-Sum Markov Games

Zbigniew T. Kalbarczyk

Tamer Basar

263

02 Feb 2024

Near-Optimal Reinforcement Learning with Self-Play under Adaptivity Constraints

Dan Qiao

Yu Wang

OffRL

303

02 Feb 2024

Sample-Efficient Multi-Agent RL: An Optimization PerspectiveInternational Conference on Learning Representations (ICLR), 2023

316

10 Oct 2023

VDFD: Multi-Agent Value Decomposition Framework with Disentangled World Model

Zhizun Wang

David Meger

DRL

348

08 Sep 2023

Improving Sample Efficiency of Model-Free Algorithms for Zero-Sum Markov GamesInternational Conference on Machine Learning (ICML), 2023

Ming Yin

167

17 Aug 2023

Efficient Adversarial Attacks on Online Multi-agent Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

Guanlin Liu

Lifeng Lai

AAML

225

15 Jul 2023

Multi-Player Zero-Sum Markov Games with Networked Separable InteractionsNeural Information Processing Systems (NeurIPS), 2023

Chanwoo Park

Jianchao Tan

Asuman Ozdaglar

386

13 Jul 2023

Provably Efficient Generalized Lagrangian Policy Optimization for Safe Multi-Agent Reinforcement LearningConference on Learning for Dynamics & Control (L4DC), 2023

382

31 May 2023

Maximize to Explore: One Objective Function Fusing Estimation, Planning, and ExplorationNeural Information Processing Systems (NeurIPS), 2023

Wei Xiong

380

29 May 2023

Provably Feedback-Efficient Reinforcement Learning via Active Reward LearningNeural Information Processing Systems (NeurIPS), 2023

Dingwen Kong

Lin F. Yang

270

18 Apr 2023

A New Policy Iteration Algorithm For Reinforcement Learning in Zero-Sum Markov Games

Anna Winnicki

R. Srikant

425

17 Mar 2023

Uncoupled and Convergent Learning in Two-Player Zero-Sum Markov Games with Bandit FeedbackNeural Information Processing Systems (NeurIPS), 2023

269

05 Mar 2023

A Finite-Sample Analysis of Payoff-Based Independent Learning in Zero-Sum Stochastic GamesNeural Information Processing Systems (NeurIPS), 2023

Zaiwei Chen

Jianchao Tan

Eric Mazumdar

Asuman Ozdaglar

Adam Wierman

375

03 Mar 2023

Can We Find Nash Equilibria at a Linear Rate in Markov Games?International Conference on Learning Representations (ICLR), 2023

Zhuoqing Song

Jason D. Lee

Zhuoran Yang

400

03 Mar 2023

Breaking the Curse of Multiagency: Provably Efficient Decentralized Multi-Agent RL with Function ApproximationAnnual Conference Computational Learning Theory (COLT), 2023

342

13 Feb 2023

Efficient Planning in Combinatorial Action Spaces with Applications to Cooperative Multi-Agent Reinforcement LearningInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

Volodymyr Tkachuk

Seyed Alireza Bakhtiari

256

08 Feb 2023

Breaking the Curse of Multiagents in a Large State Space: RL in Markov Games with Independent Linear Function ApproximationAnnual Conference Computational Learning Theory (COLT), 2023

Qiwen Cui

Jianchao Tan

S. Du

428

07 Feb 2023

Population-size-Aware Policy Optimization for Mean-Field GamesInternational Conference on Learning Representations (ICLR), 2023

236

07 Feb 2023

Robust Subtask Learning for Compositional GeneralizationInternational Conference on Machine Learning (ICML), 2023

261

06 Feb 2023

Offline Learning in Markov Games with General Function ApproximationInternational Conference on Machine Learning (ICML), 2023

374

06 Feb 2023

A Reduction-based Framework for Sequential Decision Making with Delayed FeedbackNeural Information Processing Systems (NeurIPS), 2023

576

03 Feb 2023

Decentralized model-free reinforcement learning in stochastic games with average-reward objectiveAdaptive Agents and Multi-Agent Systems (AAMAS), 2023

Romain Cravic

Nicolas Gast

B. Gaujal

195

13 Jan 2023

Provably Efficient Model-free RL in Leader-Follower MDP with Linear Function ApproximationConference on Learning for Dynamics & Control (L4DC), 2022

A. Ghosh

250

28 Nov 2022

Nesterov Meets Optimism: Rate-Optimal Separable Minimax OptimizationInternational Conference on Machine Learning (ICML), 2022

Quanquan Gu

247

31 Oct 2022

On the convergence of policy gradient methods to Nash equilibria in general stochastic gamesNeural Information Processing Systems (NeurIPS), 2022

Angeliki Giannou

Kyriakos Lotidis

P. Mertikopoulos

Emmanouil-Vasileios Vlatakis-Gkaragkounis

340

17 Oct 2022

A Self-Play Posterior Sampling Algorithm for Zero-Sum Markov GamesInternational Conference on Machine Learning (ICML), 2022

Wei Xiong

Han Zhong

Chengshuai Shi

Cong Shen

Tong Zhang

204

04 Oct 2022

Faster Last-iterate Convergence of Policy Optimization in Zero-Sum Markov GamesInternational Conference on Learning Representations (ICLR), 2022

494

03 Oct 2022

$$O(T^{-1})$ Convergence of Optimistic-Follow-the-Regularized-Leader in Two-Player Zero-Sum Markov Games$

O(T^{-1})

Convergence of Optimistic-Follow-the-Regularized-Leader in Two-Player Zero-Sum Markov Games

Yuepeng Yang

Cong Ma

250

26 Sep 2022

Minimax-Optimal Multi-Agent RL in Markov Games With a Generative ModelNeural Information Processing Systems (NeurIPS), 2022

419

22 Aug 2022

Learning Two-Player Mixture Markov Games: Kernel Function Approximation and Correlated Equilibrium

C. J. Li

Dongruo Zhou

Quanquan Gu

Sai Li

173

10 Aug 2022

Provably Efficient Fictitious Play Policy Optimization for Zero-Sum Markov Games with Structured TransitionsInternational Conference on Machine Learning (ICML), 2022

206

25 Jul 2022

A Deep Reinforcement Learning Approach for Finding Non-Exploitable Strategies in Two-Player Atari Games

320

18 Jul 2022

On the Statistical Efficiency of Reward-Free Exploration in Non-Linear RLNeural Information Processing Systems (NeurIPS), 2022

390

21 Jun 2022