What Can Learned Intrinsic Rewards Capture?

What Can Learned Intrinsic Rewards Capture?

11 December 2019

David Silver

Papers citing "What Can Learned Intrinsic Rewards Capture?"

15 / 15 papers shown

Title
Mastering Asymmetrical Multiplayer Game with Multi-Agent Asymmetric-Evolution Reinforcement Learning Chenglu Sun Yi-cui Zhang Yu Zhang Ziling Lu Jingbin Liu Si-Qi Xu Weidong Zhang 25 0 0 20 Apr 2023
A Survey of Meta-Reinforcement Learning Jacob Beck Risto Vuorio E. Liu Zheng Xiong L. Zintgraf Chelsea Finn Shimon Whiteson OOD OffRL 37 122 0 19 Jan 2023
A Domain-Agnostic Approach for Characterization of Lifelong Learning Systems Megan M. Baker Alexander New Mario Aguilar-Simon Ziad Al-Halah Sébastien M. R. Arnold ... Zifan Xu A. Yanguas-Gil Harel Yedidsion Shangqun Yu Gautam K. Vallabha 30 15 0 18 Jan 2023
Human-Timescale Adaptation in an Open-Ended Task Space Adaptive Agent Team Jakob Bauer Kate Baumli Satinder Baveja Feryal M. P. Behbahani ... Jakub Sygnowski K. Tuyls Sarah York Alexander Zacherl Lei Zhang LM&Ro OffRL AI4CE LRM 38 109 0 18 Jan 2023
Hypernetworks for Zero-shot Transfer in Reinforcement Learning S. Rezaei-Shoshtari Charlotte Morissette F. Hogan Gregory Dudek D. Meger OffRL 17 14 0 28 Nov 2022
Redeeming Intrinsic Rewards via Constrained Optimization Eric Chen Zhang-Wei Hong Joni Pajarinen Pulkit Agrawal OnRL 36 24 0 14 Nov 2022
An Investigation of the Bias-Variance Tradeoff in Meta-Gradients Risto Vuorio Jacob Beck Shimon Whiteson Jakob N. Foerster Gregory Farquhar 33 8 0 22 Sep 2022
On the Expressivity of Markov Reward David Abel Will Dabney Anna Harutyunyan Mark K. Ho Michael L. Littman Doina Precup Satinder Singh 29 82 0 01 Nov 2021
Wasserstein Distance Maximizing Intrinsic Control Ishan Durugkar Steven Hansen Stephen Spencer Volodymyr Mnih 21 6 0 28 Oct 2021
Hindsight Foresight Relabeling for Meta-Reinforcement Learning Michael Wan Jian-wei Peng Tanmay Gangwani 34 7 0 18 Sep 2021
Target Languages (vs. Inductive Biases) for Learning to Act and Plan Hector Geffner 42 6 0 15 Sep 2021
Exploration in Deep Reinforcement Learning: From Single-Agent to Multiagent Domain Jianye Hao Tianpei Yang Hongyao Tang Chenjia Bai Jinyi Liu Zhaopeng Meng Peng Liu Zhen Wang OffRL 36 93 0 14 Sep 2021
Learning to Utilize Shaping Rewards: A New Approach of Reward Shaping Yujing Hu Weixun Wang Hangtian Jia Yixiang Wang Yingfeng Chen Jianye Hao Feng Wu Changjie Fan OffRL 13 173 0 05 Nov 2020
Task-Agnostic Exploration via Policy Gradient of a Non-Parametric State Entropy Estimate Mirco Mutti Lorenzo Pratissoli Marcello Restelli 11 19 0 09 Jul 2020
Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks Chelsea Finn Pieter Abbeel Sergey Levine OOD 377 11,700 0 09 Mar 2017