v1v2 (latest)

Last-iterate Convergence of Decentralized Optimistic Gradient Descent/Ascent in Infinite-horizon Competitive Markov Games

Annual Conference Computational Learning Theory (COLT), 2021

8 February 2021

Papers citing "Last-iterate Convergence of Decentralized Optimistic Gradient Descent/Ascent in Infinite-horizon Competitive Markov Games"

50 / 57 papers shown

Multi-Objective Reinforcement Learning with Max-Min Criterion: A Game-Theoretic Approach

238

23 Oct 2025

Achieve Performatively Optimal Policy for Performative Reinforcement Learning

Ziyi Chen

Heng Huang

134

06 Oct 2025

Properties of Fixed Points of Generalised Extra Gradient Methods Applied to Min-Max ProblemsIEEE Control Systems Letters (L-CSS), 2025

219

03 Apr 2025

Multi-Step Alignment as Markov Games: An Optimistic Online Gradient Descent Approach with Convergence Guarantees

558

18 Feb 2025

Decentralized Online Learning in General-Sum Stackelberg GamesConference on Uncertainty in Artificial Intelligence (UAI), 2024

Yaolong Yu

Haipeng Chen

301

06 May 2024

Linear Convergence of Independent Natural Policy Gradient in Games with Entropy RegularizationIEEE Control Systems Letters (L-CSS), 2024

263

04 May 2024

$$\widetilde{O}(T^{-1})$ Convergence to (Coarse) Correlated Equilibria in Full-Information General-Sum Markov Games$

\widetilde{O}(T^{-1})

Convergence to (Coarse) Correlated Equilibria in Full-Information General-Sum Markov Games

Zbigniew T. Kalbarczyk

Tamer Basar

287

02 Feb 2024

Near-Optimal Policy Optimization for Correlated Equilibrium in General-Sum Markov GamesInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2024

347

26 Jan 2024

Optimistic Policy Gradient in Multi-Player Markov Games with a Single Controller: Convergence Beyond the Minty Property

394

19 Dec 2023

Scalable and Independent Learning of Nash Equilibrium Policies in

n

-Player Stochastic Games with Unknown Independent Chains

Tiancheng Qin

S. Rasoul Etesami

345

04 Dec 2023

Symmetric Mean-field Langevin Dynamics for Distributional Minimax ProblemsInternational Conference on Learning Representations (ICLR), 2023

429

02 Dec 2023

Stability and Generalization of the Decentralized Stochastic Gradient Descent Ascent AlgorithmNeural Information Processing Systems (NeurIPS), 2023

Miaoxi Zhu

Li Shen

Bo Du

Dacheng Tao

303

31 Oct 2023

Provably Fast Convergence of Independent Natural Policy Gradient for Markov Potential Games

455

15 Oct 2023

Global Convergence of Policy Gradient Methods in Reinforcement Learning, Games and Control

Shicong Cen

Yuejie Chi

272

08 Oct 2023

Local and adaptive mirror descents in extensive-form gamesNeural Information Processing Systems (NeurIPS), 2023

Pierre Ménard

274

01 Sep 2023

Multi-Player Zero-Sum Markov Games with Networked Separable InteractionsNeural Information Processing Systems (NeurIPS), 2023

Chanwoo Park

Jianchao Tan

Asuman Ozdaglar

398

13 Jul 2023

Last-Iterate Convergent Policy Gradient Primal-Dual Methods for Constrained MDPsNeural Information Processing Systems (NeurIPS), 2023

Dongsheng Ding

Chen-Yu Wei

Jianchao Tan

Alejandro Ribeiro

417

20 Jun 2023

Zero-sum Polymatrix Markov Games: Equilibrium Collapse and Efficient Computation of Nash EquilibriaNeural Information Processing Systems (NeurIPS), 2023

Fivos Kalogiannis

Ioannis Panageas

430

23 May 2023

Sublinear Convergence Rates of Extragradient-Type Methods: A Survey on Classical and Recent Developments

Quoc Tran-Dinh

237

30 Mar 2023

Uncoupled and Convergent Learning in Two-Player Zero-Sum Markov Games with Bandit FeedbackNeural Information Processing Systems (NeurIPS), 2023

304

05 Mar 2023

A Finite-Sample Analysis of Payoff-Based Independent Learning in Zero-Sum Stochastic GamesNeural Information Processing Systems (NeurIPS), 2023

Zaiwei Chen

Jianchao Tan

Eric Mazumdar

Asuman Ozdaglar

Adam Wierman

383

03 Mar 2023

Can We Find Nash Equilibria at a Linear Rate in Markov Games?International Conference on Learning Representations (ICLR), 2023

Zhuoqing Song

Jason D. Lee

Zhuoran Yang

445

03 Mar 2023

Population-size-Aware Policy Optimization for Mean-Field GamesInternational Conference on Learning Representations (ICLR), 2023

246

07 Feb 2023

Decentralized model-free reinforcement learning in stochastic games with average-reward objectiveAdaptive Agents and Multi-Agent Systems (AAMAS), 2023

Romain Cravic

Nicolas Gast

B. Gaujal

240

13 Jan 2023

Adapting to game trees in zero-sum imperfect information gamesInternational Conference on Machine Learning (ICML), 2022

Pierre Ménard

520

23 Dec 2022

Asynchronous Gradient Play in Zero-Sum Multi-agent GamesInternational Conference on Learning Representations (ICLR), 2022

Ruicheng Ao

Shicong Cen

Yuejie Chi

226

16 Nov 2022

Symmetric (Optimistic) Natural Policy Gradient for Multi-agent Learning with Parameter ConvergenceInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2022

S. Pattathil

Jianchao Tan

Asuman Ozdaglar

370

23 Oct 2022

On the convergence of policy gradient methods to Nash equilibria in general stochastic gamesNeural Information Processing Systems (NeurIPS), 2022

Angeliki Giannou

Kyriakos Lotidis

P. Mertikopoulos

Emmanouil-Vasileios Vlatakis-Gkaragkounis

378

17 Oct 2022

Decentralized Policy Gradient for Nash Equilibria Learning of General-sum Stochastic Games

Yan Chen

Taoying Li

277

14 Oct 2022

Faster Last-iterate Convergence of Policy Optimization in Zero-Sum Markov GamesInternational Conference on Learning Representations (ICLR), 2022

530

03 Oct 2022

$$O(T^{-1})$ Convergence of Optimistic-Follow-the-Regularized-Leader in Two-Player Zero-Sum Markov Games$

O(T^{-1})

Convergence of Optimistic-Follow-the-Regularized-Leader in Two-Player Zero-Sum Markov Games

Yuepeng Yang

Cong Ma

267

26 Sep 2022

Minimax-Optimal Multi-Agent RL in Markov Games With a Generative ModelNeural Information Processing Systems (NeurIPS), 2022

431

22 Aug 2022

Last-Iterate Convergence with Full and Noisy Feedback in Two-Player Zero-Sum GamesInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2022

348

21 Aug 2022

Efficiently Computing Nash Equilibria in Adversarial Team Markov GamesInternational Conference on Learning Representations (ICLR), 2022

Fivos Kalogiannis

Ioannis Anagnostides

Ioannis Panageas

Emmanouil-Vasileios Vlatakis-Gkaragkounis

Vaggos Chatziafratis

S. Stavroulakis

288

03 Aug 2022

Regret Minimization and Convergence to Equilibria in General-sum Markov GamesInternational Conference on Machine Learning (ICML), 2022

496

28 Jul 2022

Optimism in Face of a Context: Regret Guarantees for Stochastic Contextual MDPAAAI Conference on Artificial Intelligence (AAAI), 2022

Orin Levy

Yishay Mansour

186

22 Jul 2022

Fast Convergence of Optimistic Gradient Ascent in Network Zero-Sum Extensive Form GamesAlgorithmic Game Theory (AGT), 2022

233

18 Jul 2022

A Survey of Decision Making in Adversarial GamesScience China Information Sciences (Sci. China Inf. Sci.), 2022

354

16 Jul 2022

Policy Optimization for Markov Games: Unified Framework and Faster ConvergenceNeural Information Processing Systems (NeurIPS), 2022

467

06 Jun 2022

Regularized Gradient Descent Ascent for Two-Player Zero-Sum Markov GamesNeural Information Processing Systems (NeurIPS), 2022

Sihan Zeng

Thinh T. Doan

Justin Romberg

374

27 May 2022

Tight Last-Iterate Convergence of the Extragradient and the Optimistic Gradient Descent-Ascent Algorithm for Constrained Monotone Variational Inequalities

Yang Cai

Argyris Oikonomou

Weiqiang Zheng

309

20 Apr 2022

Independent Natural Policy Gradient Methods for Potential Games: Finite-time Global Convergence with Entropy RegularizationIEEE Conference on Decision and Control (CDC), 2022

Shicong Cen

Fan Chen

Yuejie Chi

278

12 Apr 2022

Finite-Time Analysis of Natural Actor-Critic for POMDPsSIAM Journal on Mathematics of Data Science (SIMODS), 2022

Semih Cayci

Niao He

R. Srikant

260

20 Feb 2022

Independent Policy Gradient for Large-Scale Markov Potential Games: Sharper Rates, Function Approximation, and Game-Agnostic ConvergenceInternational Conference on Machine Learning (ICML), 2022

515

08 Feb 2022

Near-Optimal Learning of Extensive-Form Games with Imperfect InformationInternational Conference on Machine Learning (ICML), 2022

400

03 Feb 2022

Finite-Sample Analysis of Decentralized Q-Learning for Stochastic Games

299

15 Dec 2021

Doubly Optimal No-Regret Online Learning in Strongly Monotone Games with Bandit FeedbackOperational Research (OR), 2021

385

06 Dec 2021

MDPGT: Momentum-based Decentralized Policy Gradient TrackingAAAI Conference on Artificial Intelligence (AAAI), 2021

Aditya Balu

252

06 Dec 2021

Independent Learning in Stochastic Games

Asuman Ozdaglar

M. O. Sayin

Jianchao Tan

264

23 Nov 2021

V-Learning -- A Simple, Efficient, Decentralized Algorithm for Multiagent RL

303

147

27 Oct 2021