v1v2 (latest)

Proximal Policy Optimization Algorithms

20 July 2017

Papers citing "Proximal Policy Optimization Algorithms"

50 / 11,422 papers shown

PMP: Learning to Physically Interact with Environments using Part-wise Motion PriorsInternational Conference on Computer Graphics and Interactive Techniques (SIGGRAPH), 2023

173

05 May 2023

Causal Policy Gradient for Whole-Body Mobile Manipulation

Jiaheng Hu

Peter Stone

Roberto Martín-Martín

422

04 May 2023

Single Node Injection Label Specificity Attack on Graph Neural Networks via Reinforcement LearningIEEE Transactions on Computational Social Systems (IEEE TCSS), 2023

206

04 May 2023

Simple Noisy Environment Augmentation for Reinforcement Learning

Raad Khraishi

Ramin Okhrati

OffRL

155

04 May 2023

Maximum Causal Entropy Inverse Constrained Reinforcement LearningMachine-mediated learning (ML), 2023

Mattijs Baert

Pietro Mazzaglia

Sam Leroux

Pieter Simoens

CML

257

04 May 2023

Explainable Reinforcement Learning via a Causal World ModelInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

436

04 May 2023

An Asynchronous Updating Reinforcement Learning Framework for Task-oriented Dialog SystemIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

04 May 2023

Toward Evaluating Robustness of Reinforcement Learning with Adversarial PolicyDependable Systems and Networks (DSN), 2023

314

04 May 2023

Learning Generalizable Pivoting SkillsIEEE International Conference on Robotics and Automation (ICRA), 2023

Xiang Zhang

Siddarth Jain

Baichuan Huang

Masayoshi Tomizuka

Diego Romeres

263

04 May 2023

Sim2Rec: A Simulator-based Decision-making Approach to Optimize Real-World Long-term User Engagement in Sequential Recommender SystemsIEEE International Conference on Data Engineering (ICDE), 2023

202

03 May 2023

Gym-preCICE: Reinforcement Learning Environments for Active Flow ControlSoftwareX (SoftwareX), 2023

M. Shams

A. Elsheikh

AI4CE

155

03 May 2023

Enhancing Efficiency of Quadrupedal Locomotion over Challenging Terrains with Extensible FeetIEEE International Conference on Systems, Man and Cybernetics (SMC), 2023

L. Kumar

Sarvesh Sortee

Titas Bera

Ranjan Dasgupta

104

03 May 2023

Mitigating Approximate Memorization in Language Models via Dissimilarity Learned Policy

Aly M. Kassem

109

02 May 2023

Get Back Here: Robust Imitation by Return-to-Distribution Planning

Sertan Girgin

Olivier Pietquin

261

02 May 2023

An Improved Yaw Control Algorithm for Wind Turbines via Reinforcement Learning

Alban Puech

Jesse Read

02 May 2023

CALM: Conditional Adversarial Latent Models for Directable Virtual CharactersInternational Conference on Computer Graphics and Interactive Techniques (SIGGRAPH), 2023

206

105

02 May 2023

Multi-Task Multi-Behavior MAP-Elites

Timothée Anne

Jean-Baptiste Mouret

MoE

152

02 May 2023

Early Classifying Multimodal SequencesInternational Conference on Multimodal Interaction (ICMI), 2023

Alexander Cao

J. Utke

Diego Klabjan

144

02 May 2023

ArK: Augmented Reality with Knowledge Interactive Emergent Ability

...

Yejin Choi

194

01 May 2023

Bridging the Gap: A Survey on Integrating (Human) Feedback for Natural Language Generation

Patrick Fernandes

Aman Madaan

Emmy Liu

António Farinhas

Pedro Henrique Martins

...

José G. C. de Souza

Shuyan Zhou

Tongshuang Wu

Graham Neubig

Marcely Zanon Boito

ALM

304

01 May 2023

Representations and Exploration for Deep Reinforcement Learning using Singular Value DecompositionInternational Conference on Machine Learning (ICML), 2023

287

01 May 2023

BCEdge: SLO-Aware DNN Inference Services with Adaptive Batching on Edge Platforms

162

01 May 2023

Learning Achievement Structure for Structured Exploration in Domains with Sparse RewardInternational Conference on Learning Representations (ICLR), 2023

Zihan Zhou

Animesh Garg

OffRL

254

30 Apr 2023

Modality-invariant Visual Odometry for Embodied VisionComputer Vision and Pattern Recognition (CVPR), 2023

Marius Memmel

Roman Bachmann

Amir Zamir

321

29 Apr 2023

A Coupled Flow Approach to Imitation LearningInternational Conference on Machine Learning (ICML), 2023

187

29 Apr 2023

Semi-Infinitely Constrained Markov Decision Processes and Efficient Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

Liangyu Zhang

Yang Peng

Wenhao Yang

Zhihua Zhang

159

29 Apr 2023

X-RLflow: Graph Reinforcement Learning for Neural Network Subgraphs TransformationConference on Machine Learning and Systems (MLSys), 2023

Guoliang He

Sean Parker

Eiko Yoneki

169

28 Apr 2023

Learning adaptive manipulation of objects with revolute joint: A case study on varied cabinet doors openingCybersecurity and Cyberforensics Conference (CC), 2023

280

28 Apr 2023

Adversarial Policy Optimization in Deep Reinforcement Learning

Md Masudur Rahman

Yexiang Xue

AAML

112

27 Apr 2023

Learning Environment for the Air Domain (LEAD)Online World Conference on Soft Computing in Industrial Applications (WSCIA), 2023

136

27 Apr 2023

Convergence of Adam Under Relaxed AssumptionsNeural Information Processing Systems (NeurIPS), 2023

Haochuan Li

Alexander Rakhlin

Ali Jadbabaie

403

27 Apr 2023

CROP: Towards Distributional-Shift Robust Reinforcement Learning using Compact Reshaped Observation ProcessingInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

Claudia Linnhoff-Popien

Thomy Phan

OOD OffRL

256

26 Apr 2023

Optimizing Energy Efficiency in Metro Systems Under Uncertainty Disturbances Using Reinforcement Learning

130

26 Apr 2023

Can Agents Run Relay Race with Strangers? Generalization of RL to Out-of-Distribution TrajectoriesInternational Conference on Learning Representations (ICLR), 2023

219

26 Apr 2023

Multi-criteria Hardware Trojan Detection: A Reinforcement Learning ApproachMidwest Symposium on Circuits and Systems (MWSCAS), 2023

Amin Sarihi

Peter Jamieson

Ahmad Patooghy

Abdel-Hameed A. Badawy

26 Apr 2023

SCM: Enhancing Large Language Model with Self-Controlled Memory Framework

Jian Yang

Zhoujun Li

380

26 Apr 2023

Dynamic Datasets and Market Environments for Financial Reinforcement LearningMachine-mediated learning (ML), 2023

Daochen Zha

221

25 Apr 2023

Roll-Drop: accounting for observation noise with a single parameterConference on Learning for Dynamics & Control (L4DC), 2023

Luigi Campanaro

D. Martini

Siddhant Gangapurwala

W. Merkt

Ioannis Havoutis

SyDa

215

25 Apr 2023

The Update-Equivalence Framework for Decision-Time PlanningInternational Conference on Learning Representations (ICLR), 2023

J. Zico Kolter

293

25 Apr 2023

Proximal Curriculum for Reinforcement Learning Agents

Georgios Tzannetos

Bárbara Gomes Ribeiro

Parameswaran Kamalaruban

Adish Singla

230

25 Apr 2023

Zero-shot Transfer Learning of Driving Policy via Socially Adversarial Traffic Flow

233

25 Apr 2023

Synthesizing Stable Reduced-Order Visuomotor Policies for Nonlinear Systems via Sums-of-Squares OptimizationIEEE Conference on Decision and Control (CDC), 2023

Glen Chou

Russ Tedrake

329

24 Apr 2023

Stubborn: An Environment for Evaluating Stubbornness between Agents with Aligned Incentives

Ram Rachum

Yonatan Nakar

Reuth Mirsky

24 Apr 2023

Parallel bootstrap-based on-policy deep reinforcement learning for continuous flow control applicationsFluids (Fluids), 2023

J. Viquerat

E. Hachem

174

24 Apr 2023

Towards Effective and Interpretable Human-Agent Collaboration in MOBA Games: A Communication PerspectiveInternational Conference on Learning Representations (ICLR), 2023

Liang Wang

...

Wei Liu

176

23 Apr 2023

Differentiate ChatGPT-generated and Human-written Medical TextsJMIR Medical Education (JMIR Med Educ), 2023

Shaochen Xu

...

Dajiang Zhu

Tianming Liu

Xiang Li

LM&MA DeLMO MedIm AI4MH

165

23 Apr 2023

LayerNAS: Neural Architecture Search in Polynomial Complexity

Xin Wang

157

23 Apr 2023

AutoVRL: A High Fidelity Autonomous Ground Vehicle Simulator for Sim-to-Real Deep Reinforcement LearningIFAC-PapersOnLine (IFAC-PapersOnLine), 2023

Shathushan Sivashangaran

Apoorva Khairnar

A. Eskandarian

186

22 Apr 2023

AutoNeRF: Training Implicit Scene Representations with Autonomous AgentsIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2023

Devendra Singh Chaplot

OffRL

219

21 Apr 2023

A Cubic-regularized Policy Newton Algorithm for Reinforcement LearningInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

Mizhaan Prajit Maniyar

Akash Mondal

Prashanth L.A.

S. Bhatnagar

191

21 Apr 2023