v1v2 (latest)

Learning to Explore with Meta-Policy Gradient

International Conference on Machine Learning (ICML), 2018

13 March 2018

Papers citing "Learning to Explore with Meta-Policy Gradient"

32 / 32 papers shown

Meta-DiffuB: A Contextualized Sequence-to-Sequence Text Diffusion Model with Meta-ExplorationNeural Information Processing Systems (NeurIPS), 2024

247

17 Oct 2024

Autonomous Driving at Unsignalized Intersections: A Review of Decision-Making Challenges and Reinforcement Learning-Based Solutions

Mohammad K. Al-Sharman

250

20 Sep 2024

MESA: Cooperative Meta-Exploration in Multi-Agent Learning through Exploiting State-Action Space Structure

198

01 May 2024

Optimistic Meta-GradientsNeural Information Processing Systems (NeurIPS), 2023

246

09 Jan 2023

A Survey of Exploration Methods in Reinforcement Learning

317

01 Sep 2021

Learning an Explicit Hyperparameter Prediction Function Conditioned on Tasks

Jun Shu

Deyu Meng

Zongben Xu

303

06 Jul 2021

Improving Context-Based Meta-Reinforcement Learning with Self-Supervised Trajectory Contrastive Learning

120

10 Mar 2021

Credit Assignment with Meta-Policy Gradient for Multi-Agent Reinforcement Learning

204

24 Feb 2021

Rank the Episodes: A Simple Approach for Exploration in Procedurally-Generated EnvironmentsInternational Conference on Learning Representations (ICLR), 2021

Daochen Zha

249

20 Jan 2021

Locally Persistent Exploration in Continuous Control Tasks with Sparse RewardsInternational Conference on Machine Learning (ICML), 2020

175

26 Dec 2020

Towards Continual Reinforcement Learning: A Review and PerspectivesJournal of Artificial Intelligence Research (JAIR), 2020

560

381

25 Dec 2020

Temporal Difference Uncertainties as a Signal for Exploration

211

05 Oct 2020

OCEAN: Online Task Inference for Compositional Tasks with Context Adaptation

108

17 Aug 2020

Dual Policy Distillation

Daochen Zha

214

07 Jun 2020

Meta-Learning in Neural Networks: A SurveyIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2020

Timothy M. Hospedales

Antreas Antoniou

P. Micaelli

Amos Storkey

OOD

767

2,421

11 Apr 2020

Learning Context-aware Task Reasoning for Efficient Meta-reinforcement LearningAdaptive Agents and Multi-Agent Systems (AAMAS), 2020

167

03 Mar 2020

What Can Learned Intrinsic Rewards Capture?International Conference on Machine Learning (ICML), 2019

David Silver

302

11 Dec 2019

Context-aware Active Multi-Step Reinforcement Learning

Gang Chen

Dingcheng Li

Ran Xu

120

11 Nov 2019

Single Episode Policy Transfer in Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2019

296

17 Oct 2019

A Review of Robot Learning for Manipulation: Challenges, Representations, and AlgorithmsJournal of machine learning research (JMLR), 2019

Oliver Kroemer

S. Niekum

George Konidaris

399

445

06 Jul 2019

Experience Replay OptimizationInternational Joint Conference on Artificial Intelligence (IJCAI), 2019

Daochen Zha

146

116

19 Jun 2019

Efficient Exploration via State Marginal Matching

358

271

12 Jun 2019

Learning Efficient and Effective Exploration Policies with Counterfactual Meta Policy

Ruihan Yang

Qiwei Ye

Tie-Yan Liu

101

28 May 2019

Meta Reinforcement Learning with Task Embedding and Shared PolicyInternational Joint Conference on Artificial Intelligence (IJCAI), 2019

337

16 May 2019

Multitask Soft Option Learning

350

01 Apr 2019

Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context VariablesInternational Conference on Machine Learning (ICML), 2019

283

746

19 Mar 2019

Learning Hierarchical Teaching Policies for Cooperative Agents

304

07 Mar 2019

Learning to Generalize from Sparse and Underspecified Rewards

477

103

19 Feb 2019

Meta-Learning for Contextual Bandit Exploration

Amr Sharaf

Hal Daumé

OffRL

134

23 Jan 2019

NADPEx: An on-policy temporally consistent exploration method for deep reinforcement learning

Junning Huang

112

21 Dec 2018

Learning to Learn How to Learn: Self-Adaptive Visual Navigation Using Meta-Learning

396

248

03 Dec 2018

Small Sample Learning in Big Data Era

Jun Shu

Zongben Xu

Deyu Meng

355

14 Aug 2018