Exploration by Random Network Distillation

30 October 2018

Amos Storkey

Papers citing "Exploration by Random Network Distillation"

50 / 277 papers shown

Title
A general Markov decision process formalism for action-state entropy-regularized reward maximization D. Grytskyy Jorge Ramírez-Ruiz R. Moreno-Bote 22 3 0 02 Feb 2023
Anti-Exploration by Random Network Distillation Alexander Nikulin Vladislav Kurenkov Denis Tarasov Sergey Kolesnikov 38 24 0 31 Jan 2023
Sample Efficient Deep Reinforcement Learning via Local Planning Dong Yin S. Thiagarajan N. Lazić Nived Rajaraman Botao Hao Csaba Szepesvári 25 4 0 29 Jan 2023
Neural Episodic Control with State Abstraction Zhuo Li Derui Zhu Yujing Hu Xiaofei Xie L. Ma Yan Zheng Yan Song Yingfeng Chen Jianjun Zhao OffRL 18 14 0 27 Jan 2023
Deep Laplacian-based Options for Temporally-Extended Exploration Martin Klissarov Marlos C. Machado OffRL 16 18 0 26 Jan 2023
Automatic Intrinsic Reward Shaping for Exploration in Deep Reinforcement Learning Mingqi Yuan Bo Li Xin Jin Wenjun Zeng OffRL 24 8 0 26 Jan 2023
A Data-Efficient Visual-Audio Representation with Intuitive Fine-tuning for Voice-Controlled Robots Peixin Chang Shuijing Liu Tianchen Ji Neeloy Chakraborty Kaiwen Hong Katherine Driggs-Campbell 51 3 0 23 Jan 2023
Multi-Agent Interplay in a Competitive Survival Environment Andrea Fanti 18 0 0 19 Jan 2023
A Survey of Meta-Reinforcement Learning Jacob Beck Risto Vuorio E. Liu Zheng Xiong L. Zintgraf Chelsea Finn Shimon Whiteson OOD OffRL 37 122 0 19 Jan 2023
Learning Goal-Conditioned Policies Offline with Self-Supervised Reward Shaping Lina Mezghani Sainbayar Sukhbaatar Piotr Bojanowski A. Lazaric Alahari Karteek OffRL 41 18 0 05 Jan 2023
Self-Motivated Multi-Agent Exploration Shaowei Zhang Jiahan Cao Lei Yuan Yang Yu De-Chuan Zhan 44 5 0 05 Jan 2023
Dexterous Manipulation from Images: Autonomous Real-World RL via Substep Guidance Kelvin Xu Zheyuan Hu Ria Doshi Aaron Rovinsky Vikash Kumar Abhishek Gupta Sergey Levine 26 19 0 19 Dec 2022
MoDem: Accelerating Visual Model-Based Reinforcement Learning with Demonstrations Nicklas Hansen Yixin Lin H. Su Xiaolong Wang Vikash Kumar Aravind Rajeswaran OffRL 29 49 0 12 Dec 2022
Distributed Deep Reinforcement Learning: A Survey and A Multi-Player Multi-Agent Learning Toolbox Qiyue Yin Tongtong Yu S. Shen Jun Yang Meijing Zhao Kaiqi Huang Bin Liang Liangsheng Wang OffRL 20 13 0 01 Dec 2022
Five Properties of Specific Curiosity You Didn't Know Curious Machines Should Have Nadia M. Ady R. Shariff J. Günther P. Pilarski 14 0 0 01 Dec 2022
CIM: Constrained Intrinsic Motivation for Sparse-Reward Continuous Control Xiang Zheng Xingjun Ma Cong Wang 28 1 0 28 Nov 2022
Choreographer: Learning and Adapting Skills in Imagination Pietro Mazzaglia Tim Verbelen Bart Dhoedt Alexandre Lacoste Sai Rajeswar 29 21 0 23 Nov 2022
Curiosity in Hindsight: Intrinsic Exploration in Stochastic Environments Daniel Jarrett Corentin Tallec Florent Altché Thomas Mesnard Rémi Munos Michal Valko 45 5 0 18 Nov 2022
Offline Reinforcement Learning with Adaptive Behavior Regularization Yunfan Zhou Xijun Li Qingyu Qu OffRL 21 1 0 15 Nov 2022
Redeeming Intrinsic Rewards via Constrained Optimization Eric Chen Zhang-Wei Hong Joni Pajarinen Pulkit Agrawal OnRL 36 24 0 14 Nov 2022
Foundation Models for Semantic Novelty in Reinforcement Learning Tarun Gupta Peter Karkus Tong Che Danfei Xu Marco Pavone VLM OffRL LRM 42 7 0 09 Nov 2022
Leveraging Sequentiality in Reinforcement Learning from a Single Demonstration Alexandre Chenu Olivier Serris Olivier Sigaud Nicolas Perrin-Gilbert 17 4 0 09 Nov 2022
Reward Shaping Using Convolutional Neural Network Hani Sami Hadi Otrok Jamal Bentahar Azzam Mourad Ernesto Damiani 24 3 0 30 Oct 2022
Learning General World Models in a Handful of Reward-Free Deployments Yingchen Xu Jack Parker-Holder Aldo Pacchiano Philip J. Ball Oleh Rybkin Stephen J. Roberts Tim Rocktaschel Edward Grefenstette OffRL 55 8 0 23 Oct 2022
A Mixture of Surprises for Unsupervised Reinforcement Learning Andrew Zhao Matthieu Lin Yangguang Li Yong-Jin Liu Gao Huang 28 13 0 13 Oct 2022
Exploration via Elliptical Episodic Bonuses Mikael Henaff Roberta Raileanu Minqi Jiang Tim Rocktaschel OffRL 29 39 0 11 Oct 2022
ELIGN: Expectation Alignment as a Multi-Agent Intrinsic Reward Zixian Ma Rose E. Wang Li Fei-Fei Michael S. Bernstein Ranjay Krishna 21 16 0 09 Oct 2022
Learning Social Navigation from Demonstrations with Conditional Neural Processes Yigit Yildirim Emre Ugur 19 8 0 07 Oct 2022
Query The Agent: Improving sample efficiency through epistemic uncertainty estimation Julian Alverio Boris Katz Andrei Barbu 32 0 0 05 Oct 2022
An information-theoretic perspective on intrinsic motivation in reinforcement learning: a survey A. Aubret L. Matignon S. Hassas 34 35 0 19 Sep 2022
Rewarding Episodic Visitation Discrepancy for Exploration in Reinforcement Learning Mingqi Yuan Bo Li Xin Jin Wenjun Zeng 31 12 0 19 Sep 2022
Task-Agnostic Learning to Accomplish New Tasks Xianqi Zhang Xingtao Wang Xu Liu Wenrui Wang Xiaopeng Fan Debin Zhao OffRL 85 0 0 09 Sep 2022
Learning to Deceive in Multi-Agent Hidden Role Games Matthew Aitchison L. Benke Penny Sweetser OffRL 17 5 0 04 Sep 2022
Go-Explore Complex 3D Game Environments for Automated Reachability Testing Cong Lu Raluca Georgescu J. Verwey 24 7 0 01 Sep 2022
Dynamic Memory-based Curiosity: A Bootstrap Approach for Exploration Zijian Gao Yiying Li Kele Xu Yuanzhao Zhai Dawei Feng Bo Ding Xinjun Mao Huaimin Wang 35 0 0 24 Aug 2022
Entropy Augmented Reinforcement Learning Jianfei Ma 28 0 0 19 Aug 2022
Impact Makes a Sound and Sound Makes an Impact: Sound Guides Representations and Explorations Xufeng Zhao C. Weber Muhammad Burhan Hafez S. Wermter 18 8 0 04 Aug 2022
Uncertainty-aware Multi-modal Learning via Cross-modal Random Network Prediction Hu Wang Jianpeng Zhang Yuanhong Chen Congbo Ma Jodie Avery Louise Hull G. Carneiro UQCV 19 18 0 22 Jul 2022
Bootstrap State Representation using Style Transfer for Better Generalization in Deep Reinforcement Learning Md Masudur Rahman Yexiang Xue OffRL 34 4 0 15 Jul 2022
Reactive Exploration to Cope with Non-Stationarity in Lifelong Reinforcement Learning C. Steinparz Thomas Schmied Fabian Paischer Marius-Constantin Dinu Vihang Patil Angela Bitto-Nemling Hamid Eghbalzadeh Sepp Hochreiter CLL 24 11 0 12 Jul 2022
Towards Semantic Communication Protocols: A Probabilistic Logic Perspective Sejin Seo Jihong Park Seung-Woo Ko Jinho D. Choi M. Bennis Seong-Lyun Kim 30 22 0 08 Jul 2022
Phasic Self-Imitative Reduction for Sparse-Reward Goal-Conditioned Reinforcement Learning Yunfei Li Tian Gao Jiaqi Yang Huazhe Xu Yi Wu OffRL 19 22 0 24 Jun 2022
Towards Understanding How Machines Can Learn Causal Overhypotheses Eliza Kosoy David M. Chan Adrian Liu Jasmine Collins Bryanna Kaufmann Sandy Han Huang Jessica B. Hamrick John F. Canny Nan Rosemary Ke Alison Gopnik CML AI4CE 28 18 0 16 Jun 2022
BYOL-Explore: Exploration by Bootstrapped Prediction Z. Guo S. Thakoor Miruna Pislar Bernardo Avila-Pires Florent Altché ... Yunhao Tang Michal Valko Rémi Munos M. G. Azar Bilal Piot 22 68 0 16 Jun 2022
Action Noise in Off-Policy Deep Reinforcement Learning: Impact on Exploration and Performance Jakob J. Hollenstein Sayantan Auddy Matteo Saveriano Erwan Renaudo J. Piater 36 17 0 08 Jun 2022
Incorporating Explicit Uncertainty Estimates into Deep Offline Reinforcement Learning David Brandfonbrener Rémi Tachet des Combes Romain Laroche OffRL 37 5 0 02 Jun 2022
Minimax Optimal Online Imitation Learning via Replay Estimation Gokul Swamy Nived Rajaraman Matt Peng Sanjiban Choudhury J. Andrew Bagnell Zhiwei Steven Wu Jiantao Jiao Kannan Ramchandran OffRL 29 18 0 30 May 2022
Reinforcement Learning for Branch-and-Bound Optimisation using Retrospective Trajectories Christopher W. F. Parsonson Alexandre Laterre Thomas D. Barrett 17 19 0 28 May 2022
Reward Uncertainty for Exploration in Preference-based Reinforcement Learning Xinran Liang Katherine Shu Kimin Lee Pieter Abbeel 21 58 0 24 May 2022
Nuclear Norm Maximization Based Curiosity-Driven Learning Chao Chen Zijian Gao Kele Xu Sen Yang Yiying Li Bo Ding Dawei Feng Huaimin Wang 140 5 0 21 May 2022