v1v2 (latest)

Proximal Policy Optimization Algorithms

20 July 2017

Papers citing "Proximal Policy Optimization Algorithms"

50 / 11,422 papers shown

Learning Robust, Agile, Natural Legged Locomotion Skills in the Wild

Yikai Wang

Zheyuan Jiang

Jianyu Chen

198

21 Apr 2023

Learning Semantic-Agnostic and Spatial-Aware Representation for Generalizable Visual-Audio NavigationIEEE Robotics and Automation Letters (RA-L), 2023

390

21 Apr 2023

DEIR: Efficient and Robust Exploration through Discriminative-Model-Based Episodic Intrinsic RewardsInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

137

21 Apr 2023

TempoRL: laser pulse temporal shape optimization with Deep Reinforcement Learning

20 Apr 2023

Interpretability for Conditional Coordinated Behavior in Multi-Agent Reinforcement LearningIEEE International Joint Conference on Neural Network (IJCNN), 2023

Yoshinari Motokawa

T. Sugawara

AI4CE

110

20 Apr 2023

Inducing Stackelberg Equilibrium through Spatio-Temporal Sequential Decision-Making in Multi-Agent Reinforcement LearningInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

202

20 Apr 2023

Neurosymbolic Models for Computer Graphics

Niloy J. Mitra

Karl D. D. Willis

Jiajun Wu

3DV

215

20 Apr 2023

Aiding reinforcement learning for set point controlIFAC-PapersOnLine (IFAC-PapersOnLine), 2023

Ruoqing Zhang

Per Mattsson

T. Wigren

172

20 Apr 2023

Robust nonlinear set-point control with reinforcement learningAmerican Control Conference (ACC), 2023

132

20 Apr 2023

Observer-Feedback-Feedforward Controller Structures in Reinforcement LearningIFAC-PapersOnLine (IFAC-PapersOnLine), 2023

Ruoqing Zhang

Per Mattsson

T. Wigren

155

20 Apr 2023

SocialLight: Distributed Cooperation Learning towards Network-Wide Traffic Signal ControlAdaptive Agents and Multi-Agent Systems (AAMAS), 2023

137

20 Apr 2023

Mastering Asymmetrical Multiplayer Game with Multi-Agent Asymmetric-Evolution Reinforcement Learning

Weidong Zhang

119

20 Apr 2023

Topological Guided Actor-Critic Modular Learning of Continuous Systems with Temporal Objectives

Lening Li

Zhentian Qian

216

20 Apr 2023

Robust Route Planning with Distributional Reinforcement Learning in a Stochastic Road Network Environment

164

19 Apr 2023

Learning policies for resource allocation in business processesInformation Systems (Inf. Syst.), 2023

130

19 Apr 2023

Bridging RL Theory and Practice with the Effective HorizonNeural Information Processing Systems (NeurIPS), 2023

271

19 Apr 2023

Heterogeneous-Agent Reinforcement Learning

Jiaming Ji

213

103

19 Apr 2023

H-TSP: Hierarchically Solving the Large-Scale Travelling Salesman ProblemAAAI Conference on Artificial Intelligence (AAAI), 2023

Lei Song

Jiang Bian

210

19 Apr 2023

Using Offline Data to Speed-up Reinforcement Learning in Procedurally Generated EnvironmentsNeurocomputing (Neurocomputing), 2023

Alain Andres

Lukas Schafer

Esther Villar-Rodriguez

Stefano V. Albrecht

Javier Del Ser

OffRL OnRL

179

18 Apr 2023

Cooperative Multi-Agent Reinforcement Learning for Inventory Management

Madhav Khirwar

Karthik S. Gurumoorthy

Ankit Jain

Shantala Manchenahally

154

18 Apr 2023

A study on a Q-Learning algorithm application to a manufacturing assembly problemJournal of manufacturing systems (JMS), 2021

17 Apr 2023

Tool Learning with Foundation ModelsACM Computing Surveys (ACM Comput. Surv.), 2023

Yankai Lin

...

Heng Ji

Zhiyuan Liu

Maosong Sun

389

315

17 Apr 2023

Promises and Pitfalls of the Linearized Laplace in Bayesian Optimization

250

17 Apr 2023

Training Automated Defense Strategies Using Graph-based Cyber Attack Simulations

Jakob Nyberg

Pontus Johnson

AAML

141

17 Apr 2023

STAS: Spatial-Temporal Return Decomposition for Multi-agent Reinforcement Learning

247

15 Apr 2023

Learning To Optimize Quantum Neural Network Without GradientsInternational Conference on Quantum Computing and Engineering (QCE), 2023

Ankit Kulshrestha

Xiaoyuan Liu

Hayato Ushijima-Mwesigwa

Ilya Safro

158

15 Apr 2023

Learning to Learn Group Alignment: A Self-Tuning Credo Framework with Multiagent Teams

David Radke

Kyle Tilbury

130

14 Apr 2023

OpenAssistant Conversations -- Democratizing Large Language Model AlignmentNeural Information Processing Systems (NeurIPS), 2023

...

793

786

14 Apr 2023

Learning Perceptive Bipedal Locomotion over Irregular Terrain

B. V. Marum

M. Sabatelli

Hamidreza Kasaei

147

14 Apr 2023

RAFT: Reward rAnked FineTuning for Generative Foundation Model Alignment

Wei Xiong

Tong Zhang

463

636

13 Apr 2023

Language Instructed Reinforcement Learning for Human-AI CoordinationInternational Conference on Machine Learning (ICML), 2023

Hengyuan Hu

Dorsa Sadigh

LM&Ro

270

13 Apr 2023

ImageReward: Learning and Evaluating Human Preferences for Text-to-Image GenerationNeural Information Processing Systems (NeurIPS), 2023

Xiao Liu

Yuxiao Dong

559

736

12 Apr 2023

Learning to Communicate and Collaborate in a Competitive Multi-Agent Setup to Clean the Ocean from Macroplastics

P. D. Siedler

AI4CE

145

12 Apr 2023

Facilitating Sim-to-real by Intrinsic Stochasticity of Real-Time Simulation in Reinforcement Learning for Robot ManipulationIEEE Transactions on Artificial Intelligence (IEEE TAI), 2023

Ram Dershan

Amir M. Soufi Enayati

Zengjie Zhang

D. Richert

Homayoun Najjaran

222

12 Apr 2023

Multi-agent Policy Reciprocity with Theoretical Guarantee

Jianye Hao

198

12 Apr 2023

Sample-Efficient Reinforcement Learning with Symmetry-Guided Demonstrations for Robotic Manipulation

Amir M. Soufi Enayati

191

12 Apr 2023

Frontier Semantic Exploration for Visual Target NavigationIEEE International Conference on Robotics and Automation (ICRA), 2023

Bangguo Yu

Hamidreza Kasaei

M. Cao

277

11 Apr 2023

L3MVN: Leveraging Large Language Models for Visual Target NavigationIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2023

267

166

11 Apr 2023

RRHF: Rank Responses to Align Language Models with Human Feedback without tearsNeural Information Processing Systems (NeurIPS), 2023

Zheng Yuan

Hongyi Yuan

Chuanqi Tan

427

481

11 Apr 2023

Feudal Graph Reinforcement Learning

423

11 Apr 2023

Optimal Interpretability-Performance Trade-off of Classification Trees with Black-Box Reinforcement Learning

190

11 Apr 2023

Reinforcement Learning Tutor Better Supported Lower Performers in a Math TaskMachine-mediated learning (ML), 2023

...

184

11 Apr 2023

Real-Time Model-Free Deep Reinforcement Learning for Force Control of a Series Elastic ActuatorIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2023

138

11 Apr 2023

Learning a Universal Human Prior for Dexterous Manipulation from Human Preference

Allen Z. Ren

220

10 Apr 2023

OpenAGI: When LLM Meets Domain ExpertsNeural Information Processing Systems (NeurIPS), 2023

Juntao Tan

317

308

10 Apr 2023

Eagle: End-to-end Deep Reinforcement Learning based Autonomous Control of PTZ CamerasInternational Conference on Internet-of-Things Design and Implementation (IoTDI), 2023

119

10 Apr 2023

Evolving Reinforcement Learning Environment to Minimize Learner's Achievable Reward: An Application on Hardening Active Directory SystemsAnnual Conference on Genetic and Evolutionary Computation (GECCO), 2023

129

08 Apr 2023

Stochastic Nonlinear Control via Finite-dimensional Spectral Dynamic EmbeddingIEEE Conference on Decision and Control (CDC), 2023

315

08 Apr 2023

Should ChatGPT be Biased? Challenges and Risks of Bias in Large Language ModelsFirst Monday (FM), 2023

Emilio Ferrara

SILM

460

339

07 Apr 2023

A Policy for Early Sequence ClassificationInternational Conference on Artificial Neural Networks (ICANN), 2023

Alexander Cao

J. Utke

Diego Klabjan

107

07 Apr 2023