v1v2 (latest)

Proximal Policy Optimization Algorithms

20 July 2017

Papers citing "Proximal Policy Optimization Algorithms"

50 / 11,424 papers shown

PyTAG: Challenges and Opportunities for Reinforcement Learning in Tabletop Games

Diego Perez-Liebana

203

19 Jul 2023

Amortised Design Optimization for Item Response TheoryInternational Conference on Artificial Intelligence in Education (AIED), 2023

147

19 Jul 2023

Amortised Experimental Design and Parameter Estimation for User Models of PointingInternational Conference on Human Factors in Computing Systems (CHI), 2023

203

19 Jul 2023

Reinforcement Learning for Credit Index Option Hedging

19 Jul 2023

Scaling Laws for Imitation Learning in Single-Agent Games

277

18 Jul 2023

Llama 2: Open Foundation and Fine-Tuned Chat Models

Louis Martin

...

Sharan Narang

Sergey Edunov

8.4K

15,388

18 Jul 2023

Task Space Control of Hydraulic Construction Machines using Reinforcement LearningInternational Workshop on Human Friendly Robotics (HFR), 2023

Hyung-Joo Lee

S. Brell-Çokcan

111

18 Jul 2023

Learning Dynamic Attribute-factored World Models for Efficient Multi-object Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

Fan Feng

Sara Magliacane

OffRL OCL

253

18 Jul 2023

REX: Rapid Exploration and eXploitation for AI Agents

...

Ran Xu

Silvio Savarese

238

18 Jul 2023

IxDRL: A Novel Explainable Deep Reinforcement Learning Toolkit based on Analyses of Interestingness

Pedro Sequeira

Melinda Gervasio

186

18 Jul 2023

Natural Actor-Critic for Robust Reinforcement Learning with Function ApproximationNeural Information Processing Systems (NeurIPS), 2023

379

17 Jul 2023

An Alternative to Variance: Gini Deviation for Risk-averse Policy GradientNeural Information Processing Systems (NeurIPS), 2023

352

17 Jul 2023

Accelerating Cutting-Plane Algorithms via Reinforcement Learning SurrogatesAAAI Conference on Artificial Intelligence (AAAI), 2023

191

17 Jul 2023

Quarl: A Learning-Based Quantum Circuit Optimizer

110

17 Jul 2023

Do Models Explain Themselves? Counterfactual Simulatability of Natural Language ExplanationsInternational Conference on Machine Learning (ICML), 2023

Yanda Chen

Ruiqi Zhong

Narutatsu Ri

Kathleen McKeown

234

17 Jul 2023

CoAD: Automatic Diagnosis through Symptom and Disease Collaborative GenerationAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

187

17 Jul 2023

Towards Self-Assembling Artificial Neural Networks through Neural Developmental Programs

Elias Najarro

Shyam Sudhakaran

S. Risi

174

17 Jul 2023

Enabling Efficient, Reliable Real-World Reinforcement Learning with Approximate Physics-Based ModelsConference on Robot Learning (CoRL), 2023

T. Westenbroek

Jacob Levy

David Fridovich-Keil

235

16 Jul 2023

POMDP inference and robust solution via deep reinforcement learning: An application to railway optimal maintenanceMachine-mediated learning (ML), 2023

188

16 Jul 2023

The SocialAI School: Insights from Developmental Psychology Towards Artificial Socio-Cultural Agents

177

15 Jul 2023

SafeDreamer: Safe Reinforcement Learning with World ModelsInternational Conference on Learning Representations (ICLR), 2023

Jiaming Ji

206

14 Jul 2023

Robotic Manipulation Datasets for Offline Compositional Reinforcement Learning

Marcel Hussing

Jorge Armando Mendez Mendez

339

13 Jul 2023

Learning Multiple Coordinated Agents under Directed Acyclic Graph Constraints

Balakrishnan Ananthanarayanan

Husam Dauod

Tzung-Han Juang

109

13 Jul 2023

Why Guided Dialog Policy Learning performs well? Understanding the role of adversarial learning and its alternative

140

13 Jul 2023

Aeolus Ocean -- A simulation environment for the autonomous COLREG-compliant navigation of Unmanned Surface Vehicles using Deep Reinforcement Learning and Maritime Object Detection

A. Vekinis

S. Perantonis

213

13 Jul 2023

Prescriptive Process Monitoring Under Resource Constraints: A Reinforcement Learning Approach

Mahmoud Shoush

Marlon Dumas

260

13 Jul 2023

Bi-Touch: Bimanual Tactile Manipulation with Sim-to-Real Deep Reinforcement LearningIEEE Robotics and Automation Letters (RA-L), 2023

237

12 Jul 2023

Learning Decentralized Partially Observable Mean Field Control for Artificial Collective BehaviorInternational Conference on Learning Representations (ICLR), 2023

316

12 Jul 2023

Maneuver Decision-Making Through Automatic Curriculum Reinforcement Learning Without Handcrafted Reward functionsApplied Sciences (Appl. Sci.), 2023

Hong-Peng Zhang

136

12 Jul 2023

Learning Hierarchical Interactive Multi-Object Search for Mobile ManipulationIEEE Robotics and Automation Letters (RA-L), 2023

F. Schmalstieg

Daniel Honerkamp

Tim Welschehold

Abhinav Valada

412

12 Jul 2023

Transformers in Reinforcement Learning: A Survey

Samira Ebrahimi Kahou

OffRL

252

12 Jul 2023

Automatically Reconciling the Trade-off between Prediction Accuracy and Earliness in Prescriptive Business Process MonitoringInformation Systems (Inf. Syst.), 2023

168

12 Jul 2023

Prompt Generate Train (PGT): Few-shot Domain Adaption of Retrieval Augmented Generation Models for Open Book Question-Answering

C. Krishna

RALM

145

12 Jul 2023

PID-Inspired Inductive Biases for Deep Reinforcement Learning in Partially Observable Control TasksNeural Information Processing Systems (NeurIPS), 2023

I. Char

J. Schneider

265

12 Jul 2023

Grid Cell-Inspired Fragmentation and Recall for Efficient Map Building

Jaedong Hwang

Ila Fiete

258

11 Jul 2023

A Survey From Distributed Machine Learning to Distributed Deep Learning

Mohammad Dehghani

Zahra Yazdanparast

314

11 Jul 2023

Secrets of RLHF in Large Language Models Part I: PPO

Rui Zheng

Jiajun Sun

Songyang Gao

Yuan Hua

Wei Shen

...

Hang Yan

Tao Gui

Xipeng Qiu

Xuanjing Huang

ALM OffRL

328

236

11 Jul 2023

BeaverTails: Towards Improved Safety Alignment of LLM via a Human-Preference DatasetNeural Information Processing Systems (NeurIPS), 2023

Jiaming Ji

Juntao Dai

Chi Zhang

Chi Zhang

406

724

10 Jul 2023

Assessing the efficacy of large language models in generating accurate teacher responsesWorkshop on Innovative Use of NLP for Building Educational Applications (UNBEA), 2023

165

09 Jul 2023

ScriptWorld: Text Based Environment For Learning Procedural KnowledgeInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

175

08 Jul 2023

MARBLER: An Open Platform for Standardized Evaluation of Multi-Robot Reinforcement Learning AlgorithmsInternational Symposium on Multi-Robot and Multi-Agent Systems (MRS), 2023

355

08 Jul 2023

RADAR: Robust AI-Text Detection via Adversarial LearningNeural Information Processing Systems (NeurIPS), 2023

Xiaomeng Hu

Pin-Yu Chen

Tsung-Yi Ho

DeLMO

339

197

07 Jul 2023

SpawnNet: Learning Generalizable Visuomotor Skills from Pre-trained NetworksIEEE International Conference on Robotics and Automation (ICRA), 2023

Pieter Abbeel

334

07 Jul 2023

Discovering Hierarchical Achievements in Reinforcement Learning via Contrastive LearningNeural Information Processing Systems (NeurIPS), 2023

398

07 Jul 2023

Push Past Green: Learning to Look Behind Plant Foliage by Moving ItConference on Robot Learning (CoRL), 2023

Xiaoyun Zhang

Saurabh Gupta

334

06 Jul 2023

Learning Multi-Agent Intention-Aware Communication for Optimal Multi-Order Execution in FinanceKnowledge Discovery and Data Mining (KDD), 2023

Jiang Bian

Dongsheng Li

Weinan Zhang

Yong Yu

Tie-Yan Liu

171

06 Jul 2023

Sequential Neural Barriers for Scalable Dynamic Obstacle AvoidanceIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2023

225

06 Jul 2023

ContainerGym: A Real-World Reinforcement Learning Benchmark for Resource AllocationInternational Conference on Machine Learning, Optimization, and Data Science (MOD), 2023

111

06 Jul 2023

A Neuromorphic Architecture for Reinforcement Learning from Real-Valued ObservationsIEEE International Joint Conference on Neural Network (IJCNN), 2023

283

06 Jul 2023

Safe & Accurate at Speed with Tendons: A Robot Arm for Exploring Dynamic Motion

Hao Ma

...

319

05 Jul 2023