v1v2 (latest)

Proximal Policy Optimization Algorithms

20 July 2017

Papers citing "Proximal Policy Optimization Algorithms"

50 / 11,422 papers shown

Multi-objective Deep Reinforcement Learning for Mobile Edge ComputingInternational Symposium on Modeling and Optimization in Mobile, Ad-Hoc and Wireless Networks (WiOpt), 2023

179

05 Jul 2023

Citation: A Key to Building Responsible and Accountable Large Language Models

Jie Huang

Kevin Chen-Chuan Chang

HILM

326

05 Jul 2023

Generative Job Recommendations with Large Language Model

Hengshu Zhu

131

05 Jul 2023

Becoming self-instruct: introducing early stopping criteria for minimal instruct tuning

05 Jul 2023

Dynamic Feature-based Deep Reinforcement Learning for Flow Control of Circular Cylinder with Sparse Surface Pressure SensingJournal of Fluid Mechanics (JFM), 2023

240

05 Jul 2023

Hierarchical Planning and Policy Shaping Shared Autonomy for Articulated Robots

E. Yousefi

Mo Chen

I. Sharf

110

04 Jul 2023

Physics-based Motion Retargeting from Sparse InputsProceedings of the ACM on Computer Graphics and Interactive Techniques (PACMCGIT), 2023

162

04 Jul 2023

Emergent Resource Exchange and Tolerated Theft Behavior using Multi-Agent Reinforcement LearningArtificial Life (AL), 2023

Jack Garbus

Jordan Pollack

130

04 Jul 2023

RaidEnv: Exploring New Challenges in Automated Content Balancing for Boss Raid GamesIEEE Transactions on Games (IEEE Trans. Games), 2023

247

04 Jul 2023

Theory of Mind as Intrinsic Motivation for Multi-Agent Reinforcement Learning

219

03 Jul 2023

BatGPT: A Bidirectional Autoregessive Talker from Generative Pre-trained Transformer

271

01 Jul 2023

Thompson sampling for improved exploration in GFlowNets

Moksh Jain

Nikolay Malkin

214

30 Jun 2023

Design of Induction Machines using Reinforcement Learning

Yasmin SarcheshmehPour

30 Jun 2023

Navigation of micro-robot swarms for targeted delivery using reinforcement learning

Akshatha Jagadish

M. Varma

175

30 Jun 2023

Preference Ranking Optimization for Human AlignmentAAAI Conference on Artificial Intelligence (AAAI), 2023

Feifan Song

Fei Huang

Houfeng Wang

254

334

30 Jun 2023

Landmark Guided Active Exploration with State-specific Balance Coefficient

169

30 Jun 2023

Human-like Decision-making at Unsignalized Intersection using Social Value Orientation

Licheng Wen

219

30 Jun 2023

Decentralized Motor Skill Learning for Complex Robotic SystemsIEEE Robotics and Automation Letters (RA-L), 2023

122

30 Jun 2023

RObotic MAnipulation Network (ROMAN) -- Hybrid Hierarchical Learning for Solving Complex Sequential Tasks

Eleftherios Triantafyllidis

Fernando Acero

Zhaocheng Liu

Zhibin Li

414

30 Jun 2023

Probabilistic Constraint for Safety-Critical Reinforcement LearningIEEE Transactions on Automatic Control (TAC), 2023

Weiqin Chen

D. Subramanian

Santiago Paternain

267

29 Jun 2023

Learning Environment Models with Continuous Stochastic Dynamics

159

29 Jun 2023

Traceable Group-Wise Self-Optimizing Feature Transformation Learning: A Dual Optimization PerspectiveACM Transactions on Knowledge Discovery from Data (TKDD), 2023

170

29 Jun 2023

Policy Space Diversity for Non-Transitive GamesNeural Information Processing Systems (NeurIPS), 2023

294

29 Jun 2023

Principles and Guidelines for Evaluating Social Robot Navigation Algorithms

Anthony G. Francis

Claudia Pérez-DÁrpino

Chengshu Li

Fei Xia

Alexandre Alahi

...

Xuesu Xiao

Peng Xu

Naoki Yokoyama

Alexander Toshev

Roberto Martin-Martin Logical Robotics

351

137

29 Jun 2023

SRL: Scaling Distributed Reinforcement Learning to Over Ten Thousand CoresInternational Conference on Learning Representations (ICLR), 2023

406

29 Jun 2023

RL4CO: an Extensive Reinforcement Learning for Combinatorial Optimization Benchmark

...

517

29 Jun 2023

SARC: Soft Actor Retrospective Critic

154

28 Jun 2023

Learning Continuous Control with Geometric Regularity from Robot Intrinsic SymmetryIEEE International Conference on Robotics and Automation (ICRA), 2023

Shengchao Yan

Baohe Zhang

Yuan Zhang

Joschka Boedecker

Wolfram Burgard

297

28 Jun 2023

Towards a Better Understanding of Learning with Multiagent TeamsInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

221

28 Jun 2023

Query Understanding in the Age of Large Language Models

Venktesh V

259

28 Jun 2023

Action and Trajectory Planning for Urban Autonomous Driving with Hierarchical Reinforcement Learning

Xinyang Lu

Flint Xiaofeng Fan

Tianying Wang

169

28 Jun 2023

^3

: Boosting Meta Reinforcement Learning via RL inside RL

^2

370

28 Jun 2023

Diversity is Strength: Mastering Football Full Game with Interactive Reinforcement Learning of Multiple AIs

Chenglu Sun

Shuo Shen

Sijia Xu

Weidong Zhang

151

28 Jun 2023

A Population-Level Analysis of Neural Dynamics in Robust Legged Robots

174

27 Jun 2023

Rethinking Closed-loop Training for Autonomous DrivingEuropean Conference on Computer Vision (ECCV), 2023

280

27 Jun 2023

IIFL: Implicit Interactive Fleet Learning from Heterogeneous Human SupervisorsConference on Robot Learning (CoRL), 2023

234

27 Jun 2023

Learning non-Markovian Decision-Making from State-only SequencesNeural Information Processing Systems (NeurIPS), 2023

304

27 Jun 2023

RVT: Robotic View Transformer for 3D Object ManipulationConference on Robot Learning (CoRL), 2023

339

223

26 Jun 2023

Supervised Pretraining Can Learn In-Context Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

319

120

26 Jun 2023

ANYmal Parkour: Learning Agile Navigation for Quadrupedal RobotsScience Robotics (Sci. Robot.), 2023

David Hoeller

Nikita Rudin

Dhionis V. Sako

Marco Hutter

281

285

26 Jun 2023

ChiPFormer: Transferable Chip Placement via Offline Decision TransformerInternational Conference on Machine Learning (ICML), 2023

Jianye Hao

192

26 Jun 2023

Augmenting Control over Exploration Space in Molecular Dynamics Simulators to Streamline De Novo Analysis through Generative Control Policies

Paloma Gonzalez-Rojas

172

26 Jun 2023

Estimating player completion rate in mobile puzzle games using reinforcement learning

J. Kristensen

Arturo Valdivia

Paolo Burelli

110

26 Jun 2023

A Framework for dynamically meeting performance objectives on a service meshIEEE Transactions on Network and Service Management (TNSM), 2023

Forough Shahab Samani

Rolf Stadler

147

25 Jun 2023

Provably Convergent Policy Optimization via Metric-aware Trust Region Methods

220

25 Jun 2023

Safety-Critical Scenario Generation Via Reinforcement Learning Based EditingIEEE International Conference on Robotics and Automation (ICRA), 2023

317

25 Jun 2023

Towards Optimal Pricing of Demand Response -- A Nonparametric Constrained Policy Optimization ApproachIEEE Power & Energy Society General Meeting (PESGM), 2023

Jun Song

Chaoyue Zhao

OffRL

24 Jun 2023

Action Q-Transformer: Visual Explanation in Deep Reinforcement Learning with Encoder-Decoder Model using Action Query

150

24 Jun 2023

Minigrid & Miniworld: Modular & Customizable Reinforcement Learning Environments for Goal-Oriented TasksNeural Information Processing Systems (NeurIPS), 2023

Maxime Chevalier-Boisvert

356

308

24 Jun 2023

Maintaining Plasticity in Deep Continual Learning

Shibhansh Dohare

J. F. Hernandez-Garcia

421

23 Jun 2023