Phasic Policy Gradient

International Conference on Machine Learning (ICML), 2020

9 September 2020

Papers citing "Phasic Policy Gradient"

50 / 99 papers shown

Blindfolded Experts Generalize Better: Insights from Robotic Manipulation and Videogames

E. Zisselman

Mirco Mutti

Shelly Francis-Meretzki

Elisei Shafer

Aviv Tamar

OffRL

200

28 Oct 2025

Greener Deep Reinforcement Learning: Analysis of Energy and Carbon Efficiency Across Atari Benchmarks

158

05 Sep 2025

Imitate Optimal Policy: Prevail and Induce Action Collapse in Policy Gradient

226

02 Sep 2025

Scaling DRL for Decision Making: A Survey on Data, Network, and Training Budget Strategies

236

05 Aug 2025

Is Exploration or Optimization the Problem for Deep Reinforcement Learning?

Glen Berseth

OffRL

221

02 Aug 2025

Adaptive Network Security Policies via Belief Aggregation and Rollout

339

21 Jul 2025

Relative Entropy Pathwise Policy Optimization

Amir-massoud Farahmand

Igor Gilitschenski

491

15 Jul 2025

The Actor-Critic Update Order Matters for PPO in Federated Reinforcement Learning

Zhijie Xie

Shenghui Song

277

02 Jun 2025

Improving Value Estimation Critically Enhances Vanilla Policy Gradient

245

25 May 2025

BQSched: A Non-intrusive Scheduler for Batch Concurrent Queries via Reinforcement LearningIEEE International Conference on Data Engineering (ICDE), 2025

283

27 Apr 2025

A Reinforcement Learning Method for Environments with Stochastic Variables: Post-Decision Proximal Policy Optimization with Dual Critic Networks

L. Felizardo

Edoardo Fadda

Paolo Brandimarte

E. Del-Moral-Hernandez

Mariá Cristina Vasconcelos Nascimento

OffRL

376

07 Apr 2025

Studying the Interplay Between the Actor and Critic Representations in Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2025

417

08 Mar 2025

Pre-Trained Video Generative Models as World Simulators

472

10 Feb 2025

Adaptive Data Exploitation in Deep Reinforcement Learning

979

22 Jan 2025

Beyond The Rainbow: High Performance Deep Reinforcement Learning on a Desktop PC

581

06 Nov 2024

Accelerating Task Generalisation with Multi-Level Skill HierarchiesInternational Conference on Learning Representations (ICLR), 2024

Thomas P Cannon

Özgür Simsek

AI4CE

266

05 Nov 2024

Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive ApproachNeural Information Processing Systems (NeurIPS), 2024

Riccardo Poiani

Nicole Nobili

Alberto Maria Metelli

Marcello Restelli

188

17 Oct 2024

Improving Generalization on the ProcGen Benchmark with Simple Architectural Changes and Scale

Andrew Jesson

Yiding Jiang

OffRL

331

13 Oct 2024

Improving Deep Reinforcement Learning by Reducing the Chain Effect of Value and Policy ChurnNeural Information Processing Systems (NeurIPS), 2024

Hongyao Tang

Glen Berseth

OffRL

363

07 Sep 2024

PG-Rainbow: Using Distributional Reinforcement Learning in Policy Gradient Methods

132

18 Jul 2024

Pretraining-finetuning Framework for Efficient Co-design: A Case Study on Quadruped Robot Parkour

Yue Wang

374

09 Jul 2024

Multi-Task Decision-Making for Multi-User 360 Video Processing over Wireless Networks

Babak Badnava

Jacob Chakareski

Morteza Hashemi

277

03 Jul 2024

Explore-Go: Leveraging Exploration for Generalisation in Deep Reinforcement Learning

321

12 Jun 2024

Representation Learning For Efficient Deep Multi-Agent Reinforcement Learning

Dom Huh

Prasant Mohapatra

283

05 Jun 2024

Multi-Agent Reinforcement Learning Meets Leaf Sequencing in Radiotherapy

Riqiang Gao

Florin-Cristian Ghesu

179

03 Jun 2024

Phasic Diversity Optimization for Population-Based Reinforcement Learning

Xin Yang

285

17 Mar 2024

Open RL Benchmark: Comprehensive Tracked Experiments for Reinforcement Learning

Rousslan Fernand Julien Dossa

...

312

05 Feb 2024

The Definitive Guide to Policy Gradients in Deep Reinforcement Learning: Theory, Algorithms and Implementations

Matthias Lehmann

356

24 Jan 2024

Bridging Evolutionary Algorithms and Reinforcement Learning: A Comprehensive Survey on Hybrid AlgorithmsIEEE Transactions on Evolutionary Computation (IEEE Trans. Evol. Comput.), 2024

Jianye Hao

Yan Zheng

416

22 Jan 2024

A Survey Analyzing Generalization in Deep Reinforcement Learning

Ezgi Korkmaz

OffRL

341

04 Jan 2024

Multi-agent Reinforcement Learning: A Comprehensive Survey

Dom Huh

Prasant Mohapatra

AI4CE

422

15 Dec 2023

An Invitation to Deep Reinforcement Learning

Bernhard Jaeger

Andreas Geiger

OffRL OOD

557

13 Dec 2023

Guaranteed Trust Region Optimization via Two-Phase KL Penalization

249

08 Dec 2023

DGMem: Learning Visual Navigation Policy without Any Labels by Dynamic Graph Memory

397

30 Nov 2023

C-Procgen: Empowering Procgen with Controllable Contexts

Zhenxiong Tan

Kaixin Wang

Xinchao Wang

262

13 Nov 2023

Reward Scale Robustness for Proximal Policy Optimization via DreamerV3 TricksNeural Information Processing Systems (NeurIPS), 2023

227

26 Oct 2023

Accelerate Multi-Agent Reinforcement Learning in Zero-Sum Games with Subgame Curriculum LearningAAAI Conference on Artificial Intelligence (AAAI), 2023

Chao Yu

332

07 Oct 2023

RLLTE: Long-Term Evolution Project of Reinforcement LearningAAAI Conference on Artificial Intelligence (AAAI), 2023

260

28 Sep 2023

Diagnosing and exploiting the computational demands of videos games for deep reinforcement learning

239

22 Sep 2023

Machine Learning Meets Advanced Robotic ManipulationInformation Fusion (Inf. Fusion), 2023

279

22 Sep 2023

Guide Your Agent with Adaptive Multimodal RewardsNeural Information Processing Systems (NeurIPS), 2023

454

19 Sep 2023

Query-Dependent Prompt Evaluation and Optimization with Offline Inverse RLInternational Conference on Learning Representations (ICLR), 2023

342

13 Sep 2023

Discovering Hierarchical Achievements in Reinforcement Learning via Contrastive LearningNeural Information Processing Systems (NeurIPS), 2023

446

07 Jul 2023

Correcting discount-factor mismatch in on-policy policy gradient methodsInternational Conference on Machine Learning (ICML), 2023

158

23 Jun 2023

Explore to Generalize in Zero-Shot RLNeural Information Processing Systems (NeurIPS), 2023

405

05 Jun 2023

Truncating Trajectories in Monte Carlo Reinforcement LearningInternational Conference on Machine Learning (ICML), 2023

Riccardo Poiani

Alberto Maria Metelli

Marcello Restelli

240

07 May 2023

DEIR: Efficient and Robust Exploration through Discriminative-Model-Based Episodic Intrinsic RewardsInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

184

21 Apr 2023

Using Offline Data to Speed-up Reinforcement Learning in Procedurally Generated EnvironmentsNeurocomputing (Neurocomputing), 2023

Alain Andres

Lukas Schafer

Esther Villar-Rodriguez

Stefano V. Albrecht

Javier Del Ser

OffRL OnRL

240

18 Apr 2023

CFlowNets: Continuous Control with Generative Flow NetworksInternational Conference on Learning Representations (ICLR), 2023

Yinchuan Li

Shuang Luo

Haozhi Wang

Jianye Hao

343

04 Mar 2023

Scaling laws for single-agent reinforcement learning

Jacob Hilton

Jie Tang

John Schulman

357

31 Jan 2023