v1v2v3 (latest)

Multi-Agent Trust Region Policy Optimization

15 October 2020

Hepeng Li

Haibo He

ArXiv (abs)PDF HTML

Papers citing "Multi-Agent Trust Region Policy Optimization"

18 / 18 papers shown

Collaborative AI Teaming in Unknown Environments via Active Goal Deduction

190

22 Mar 2024

Fully Decentralized Cooperative Multi-Agent Reinforcement Learning: A Survey

Jiechuan Jiang

Kefan Su

Zongqing Lu

232

10 Jan 2024

MARC: A multi-agent robots control framework for enhancing reinforcement learning in construction tasks

Kangkang Duan

C. W. Suen

Zhengbo Zou

115

23 May 2023

How to Use Reinforcement Learning to Facilitate Future Electricity Market Design? Part 1: A Paradigmatic Theory

168

04 May 2023

Heterogeneous-Agent Reinforcement Learning

Jiaming Ji

208

100

19 Apr 2023

Order Matters: Agent-by-agent Policy OptimizationInternational Conference on Learning Representations (ICLR), 2023

297

13 Feb 2023

Best Possible Q-LearningConference on Uncertainty in Artificial Intelligence (UAI), 2023

Jiechuan Jiang

Zongqing Lu

OffRL

224

02 Feb 2023

Heterogeneous-Agent Mirror Learning: A Continuum of Solutions to Cooperative MARL

Jun Wang

157

02 Aug 2022

Learning Distributed and Fair Policies for Network Load Balancing as Markov Potential GameNeural Information Processing Systems (NeurIPS), 2022

Zhiyuan Yao

Zihan Ding

OffRL

271

03 Jun 2022

DM$^2$: Decentralized Multi-Agent Reinforcement Learning for
Distribution Matching

^2

: Decentralized Multi-Agent Reinforcement Learning for Distribution MatchingAAAI Conference on Artificial Intelligence (AAAI), 2022

252

01 Jun 2022

Trust Region Bounds for Decentralized PPO Under Non-stationarityAdaptive Agents and Multi-Agent Systems (AAMAS), 2022

297

31 Jan 2022

Coordinated Proximal Policy Optimization

Junge Zhang

184

07 Nov 2021

EnTRPO: Trust Region Policy Optimization Method with Entropy Regularization

Sahar Roostaie

M. Ebadzadeh

202

26 Oct 2021

Trust Region Policy Optimisation in Multi-Agent Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2021

Jun Wang

363

327

23 Sep 2021

Policy Regularization via Noisy Advantage Values for Cooperative Multi-agent Actor-Critic methods

Jian Hu

Siyue Hu

Shih-Wei Liao

588

27 Jun 2021

A Game-Theoretic Approach to Multi-Agent Trust Region OptimizationInternational Conference on Distributed Artificial Intelligence (DAI), 2021

Jun Wang

204

12 Jun 2021

The Power of Exploiter: Provable Multi-Agent RL in Large State SpacesInternational Conference on Machine Learning (ICML), 2021

Chi Jin

Qinghua Liu

Tiancheng Yu

239

07 Jun 2021

Dealing with Non-Stationarity in MARL via Trust-Region DecompositionInternational Conference on Learning Representations (ICLR), 2021

364

21 Feb 2021