v1v2 (latest)

Proximal Policy Optimization Algorithms

20 July 2017

Papers citing "Proximal Policy Optimization Algorithms"

50 / 11,421 papers shown

Task-Driven Graph Attention for Hierarchical Relational Object NavigationIEEE International Conference on Robotics and Automation (ICRA), 2023

Roberto Martín-Martín

Ruohan Zhang

Li Fei-Fei

Jiajun Wu

240

23 Jun 2023

Creating Valid Adversarial Examples of MalwareJournal of Computer Virology and Hacking Techniques (JCVHT), 2023

152

23 Jun 2023

Correcting discount-factor mismatch in on-policy policy gradient methodsInternational Conference on Machine Learning (ICML), 2023

135

23 Jun 2023

Transferable Curricula through Difficulty Conditioned GeneratorsInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

Sidney Tio

Pradeep Varakantham

175

22 Jun 2023

MP3: Movement Primitive-Based (Re-)Planning Policy

283

22 Jun 2023

Robust Recovery Motion Control for Quadrupedal Robots via Learned Terrain Imagination

158

22 Jun 2023

LMFlow: An Extensible Toolkit for Finetuning and Inference of Large Foundation ModelsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2023

Wei Xiong

Tong Zhang

ALM

300

21 Jun 2023

Introspective Action Advising for Interpretable Transfer Learning

244

21 Jun 2023

ScenarioNet: Open-Source Platform for Large-Scale Traffic Scenario Simulation and ModelingNeural Information Processing Systems (NeurIPS), 2023

518

21 Jun 2023

Tailstorm: A Secure and Fair Blockchain for Cash TransactionsConference on Advances in Financial Technologies (AFT), 2023

199

21 Jun 2023

AdCraft: An Advanced Reinforcement Learning Benchmark Environment for Search Engine Marketing Optimization

386

21 Jun 2023

Efficient Dynamics Modeling in Interactive Environments with Koopman TheoryInternational Conference on Learning Representations (ICLR), 2023

Arnab Kumar Mondal

Siba Smarak Panigrahi

Sai Rajeswar

K. Siddiqi

Siamak Ravanbakhsh

286

20 Jun 2023

Reinforcement Learning-based Virtual Fixtures for Teleoperation of Hydraulic Construction MachineIEEE International Symposium on Robot and Human Interactive Communication (RO-MAN), 2023

Hyung-Joo Lee

S. Brell-Çokcan

106

20 Jun 2023

Learning to Generate Better Than Your LLM

272

20 Jun 2023

Learning Profitable NFT Image Diffusions via Multiple Visual-Policy Guided Reinforcement LearningACM Multimedia (ACM MM), 2023

348

20 Jun 2023

Multi-Fidelity Active Learning with GFlowNets

Alex Hernandez-Garcia

Moksh Jain

179

20 Jun 2023

IMP-MARL: a Suite of Environments for Large-scale Infrastructure Management Planning via MARLNeural Information Processing Systems (NeurIPS), 2023

266

20 Jun 2023

Give Us the Facts: Enhancing Large Language Models with Knowledge Graphs for Fact-aware Language ModelingIEEE Transactions on Knowledge and Data Engineering (TKDE), 2023

358

142

20 Jun 2023

Multi-user Reset Controller for Redirected Walking Using Reinforcement Learning

20 Jun 2023

Deep Reinforcement Learning for Privacy-Preserving Task Offloading in Integrated Satellite-Terrestrial NetworksIEEE Transactions on Mobile Computing (IEEE TMC), 2023

20 Jun 2023

Cooperative Multi-Agent Learning for Navigation via Structured State AbstractionIEEE Transactions on Communications (IEEE Trans. Commun.), 2023

Mohamed K. Abdel-Aziz

Mohammed S. Elbamby

S. Samarakoon

M. Bennis

229

20 Jun 2023

Autonomous Driving with Deep Reinforcement Learning in CARLA Simulation

Jumman Hossain

145

20 Jun 2023

Sim-to-real transfer of active suspension control using deep reinforcement learning

344

19 Jun 2023

CAMMARL: Conformal Action Modeling in Multi Agent Reinforcement Learning

Nikunj Gupta

Somjit Nath

Samira Ebrahimi Kahou

191

19 Jun 2023

Deep Reinforcement Learning for ESG financial portfolio management

E.C. Garrido-Merchán

Sol Mora-Figueroa-Cruz-Guzmán

Maria Coronado Vaca

AIFin

155

19 Jun 2023

LARG, Language-based Automatic Reward and Goal Generation

Julien Perez

153

19 Jun 2023

AdaStop: adaptive statistical testing for sound comparisons of Deep RL agents

Odalric-Ambrym Maillard

Philippe Preux

167

19 Jun 2023

Practical First-Order Bayesian Optimization Algorithms

158

19 Jun 2023

Collaborative Optimization of Multi-microgrids System with Shared Energy Storage Based on Multi-agent Stochastic Game and Reinforcement Learning

19 Jun 2023

Integrating Tick-level Data and Periodical Signal for High-frequency Market Making

127

19 Jun 2023

Deep Reinforcement Learning with Task-Adaptive Retrieval via Hypernetwork

Junge Zhang

287

19 Jun 2023

Acceleration in Policy Optimization

329

18 Jun 2023

LAGOON: Language-Guided Motion ControlIEEE International Conference on Robotics and Automation (ICRA), 2023

Chao Yu

303

18 Jun 2023

Variational Sequential Optimal Experimental Design using Reinforcement LearningComputer Methods in Applied Mechanics and Engineering (CMAME), 2023

Wanggang Shen

Jiayuan Dong

Xun Huan

172

17 Jun 2023

The RL Perceptron: Generalisation Dynamics of Policy Learning in High DimensionsPhysical Review X (PRX), 2023

Nishil Patel

Sebastian Lee

Stefano Sarao Mannelli

Sebastian Goldt

Adrew Saxe

OffRL

445

17 Jun 2023

Empowering NLG: Offline Reinforcement Learning for Informal Summarization in Online Domains

Zhiwei Tai

Po-Chuan Chen

OffRL

169

17 Jun 2023

Snowman: A Million-scale Chinese Commonsense Knowledge Graph Distilled from Foundation Model

Zhixu Li

235

17 Jun 2023

Genes in Intelligent Agents

Jing Wang

143

17 Jun 2023

Active Policy Improvement from Multiple Black-box OraclesInternational Conference on Machine Learning (ICML), 2023

375

17 Jun 2023

ALP: Action-Aware Embodied Learning for Perception

Pieter Abbeel

261

16 Jun 2023

SLACK: Stable Learning of Augmentations with Cold-start and KL regularizationComputer Vision and Pattern Recognition (CVPR), 2023

155

16 Jun 2023

Fairness in Preference-based Reinforcement Learning

Umer Siddique

Abhinav Sinha

Yongcan Cao

208

16 Jun 2023

Actor-Critic Model Predictive ControlIEEE International Conference on Robotics and Automation (ICRA), 2023

Angel Romero

Yunlong Song

Davide Scaramuzza

509

16 Jun 2023

Unlocking the Potential of User Feedback: Leveraging Large Language Model as User Simulator to Enhance Dialogue SystemInternational Conference on Information and Knowledge Management (CIKM), 2023

Zhiyuan Hu

Yue Feng

Anh Tuan Luu

Bryan Hooi

Aldo Lipani

311

16 Jun 2023

Mimicking Better by Matching the Approximate Action DistributionInternational Conference on Machine Learning (ICML), 2023

Joao A. Candido Ramos

Lionel Blondé

Naoya Takeishi

Alexandros Kalousis

215

16 Jun 2023

Meta Generative Flow Networks with Personalization for Task-Specific AdaptationInformation Sciences (Inf. Sci.), 2023

178

16 Jun 2023

Semi-Offline Reinforcement Learning for Optimized Text GenerationInternational Conference on Machine Learning (ICML), 2023

Rui Yan

215

16 Jun 2023

Cooperative Multi-Objective Reinforcement Learning for Traffic Signal Control and Carbon Emission Reduction

Cheng Ruei Tang

J. Hsieh

Shin-You Teng

16 Jun 2023

DeepMPR: Enhancing Opportunistic Routing in Wireless Networks through Multi-Agent Deep Reinforcement Learning

153

16 Jun 2023

CAJun: Continuous Adaptive Jumping using a Learned Centroidal ControllerConference on Robot Learning (CoRL), 2023

Yuxiang Yang

Guanya Shi

Xiang Meng

Wenhao Yu

Tingnan Zhang

Jie Tan

Byron Boots

221

16 Jun 2023