Surprise-Based Intrinsic Motivation for Deep Reinforcement Learning

6 March 2017

Papers citing "Surprise-Based Intrinsic Motivation for Deep Reinforcement Learning"

38 / 38 papers shown

Title
Leveraging Skills from Unlabeled Prior Data for Efficient Online Exploration Max Wilcoxson Qiyang Li Kevin Frans Sergey Levine SSL OffRL OnRL 57 0 0 23 Oct 2024
World Models with Hints of Large Language Models for Goal Achieving Zeyuan Liu Ziyu Huan Xiyao Wang Jiafei Lyu Jian Tao Xiu Li Furong Huang Huazhe Xu LM&Ro LRM AI4CE 46 1 0 11 Jun 2024
Adaptive trajectory-constrained exploration strategy for deep reinforcement learning Guojian Wang Faguo Wu Xiao Zhang Ning Guo Zhiming Zheng 28 3 0 27 Dec 2023
Neuro-Inspired Fragmentation and Recall to Overcome Catastrophic Forgetting in Curiosity Jaedong Hwang Zhang-Wei Hong Eric Chen Akhilan Boopathy Pulkit Agrawal Ila Fiete CLL 35 5 0 26 Oct 2023
LESSON: Learning to Integrate Exploration Strategies for Reinforcement Learning via an Option Framework Woojun Kim Jeonghye Kim Young-Jin Sung 18 5 0 05 Oct 2023
Subwords as Skills: Tokenization for Sparse-Reward Reinforcement Learning David Yunis Justin Jung Falcon Z. Dai Matthew R. Walter OffRL 39 0 0 08 Sep 2023
Off-Policy RL Algorithms Can be Sample-Efficient for Continuous Control via Sample Multiple Reuse Jiafei Lyu Le Wan Zongqing Lu Xiu Li OffRL 28 9 0 29 May 2023
A general Markov decision process formalism for action-state entropy-regularized reward maximization D. Grytskyy Jorge Ramírez-Ruiz R. Moreno-Bote 22 3 0 02 Feb 2023
STEERING: Stein Information Directed Exploration for Model-Based Reinforcement Learning Souradip Chakraborty Amrit Singh Bedi Alec Koppel Mengdi Wang Furong Huang Dinesh Manocha 24 7 0 28 Jan 2023
Multi-Agent Interplay in a Competitive Survival Environment Andrea Fanti 18 0 0 19 Jan 2023
Exploration via Elliptical Episodic Bonuses Mikael Henaff Roberta Raileanu Minqi Jiang Tim Rocktaschel OffRL 29 39 0 11 Oct 2022
ELIGN: Expectation Alignment as a Multi-Agent Intrinsic Reward Zixian Ma Rose E. Wang Li Fei-Fei Michael S. Bernstein Ranjay Krishna 21 16 0 09 Oct 2022
An information-theoretic perspective on intrinsic motivation in reinforcement learning: a survey A. Aubret L. Matignon S. Hassas 34 35 0 19 Sep 2022
Dynamic Memory-based Curiosity: A Bootstrap Approach for Exploration Zijian Gao Yiying Li Kele Xu Yuanzhao Zhai Dawei Feng Bo Ding Xinjun Mao Huaimin Wang 32 0 0 24 Aug 2022
A Cooperation Graph Approach for Multiagent Sparse Reward Reinforcement Learning Qing Fu Tenghai Qiu Zhiqiang Pu Jianqiang Yi Wanmai Yuan 26 2 0 05 Aug 2022
Reactive Exploration to Cope with Non-Stationarity in Lifelong Reinforcement Learning C. Steinparz Thomas Schmied Fabian Paischer Marius-Constantin Dinu Vihang Patil Angela Bitto-Nemling Hamid Eghbalzadeh Sepp Hochreiter CLL 24 11 0 12 Jul 2022
ASE: Large-Scale Reusable Adversarial Skill Embeddings for Physically Simulated Characters Xue Bin Peng Yunrong Guo L. Halper Sergey Levine Sanja Fidler 28 15 0 04 May 2022
Exploration in Deep Reinforcement Learning: A Survey Pawel Ladosz Lilian Weng Minwoo Kim H. Oh OffRL 23 324 0 02 May 2022
A Subgame Perfect Equilibrium Reinforcement Learning Approach to Time-inconsistent Problems Nixie S. Lesmana Chi Seng Pun OffRL 15 4 0 27 Oct 2021
Deep Reinforcement Learning Versus Evolution Strategies: A Comparative Survey Amjad Yousef Majid Serge Saaybi Tomas van Rietbergen Vincent François-Lavet R. V. Prasad Chris Verhoeven OffRL 60 54 0 28 Sep 2021
Is Curiosity All You Need? On the Utility of Emergent Behaviours from Curious Exploration Oliver Groth Markus Wulfmeier Giulia Vezzani Vibhavari Dasagi Tim Hertweck Roland Hafner N. Heess Martin Riedmiller LRM 38 20 0 17 Sep 2021
Exploration in Deep Reinforcement Learning: From Single-Agent to Multiagent Domain Jianye Hao Tianpei Yang Hongyao Tang Chenjia Bai Jinyi Liu Zhaopeng Meng Peng Liu Zhen Wang OffRL 36 92 0 14 Sep 2021
APS: Active Pretraining with Successor Features Hao Liu Pieter Abbeel 36 119 0 31 Aug 2021
Offline Reinforcement Learning as Anti-Exploration Shideh Rezaeifar Robert Dadashi Nino Vieillard Léonard Hussenot Olivier Bachem Olivier Pietquin M. Geist OffRL 34 51 0 11 Jun 2021
BeBold: Exploration Beyond the Boundary of Explored Regions Tianjun Zhang Huazhe Xu Xiaolong Wang Yi Wu Kurt Keutzer Joseph E. Gonzalez Yuandong Tian 28 40 0 15 Dec 2020
Novelty Search in Representational Space for Sample Efficient Exploration Ruo Yu Tao Vincent François-Lavet Joelle Pineau 30 43 0 28 Sep 2020
Explore and Explain: Self-supervised Navigation and Recounting Roberto Bigazzi Federico Landi Marcella Cornia S. Cascianelli Lorenzo Baraldi Rita Cucchiara EgoV LM&Ro 13 17 0 14 Jul 2020
A Unifying Framework for Reinforcement Learning and Planning Thomas M. Moerland Joost Broekens Aske Plaat Catholijn M. Jonker OffRL 25 9 0 26 Jun 2020
Non-local Policy Optimization via Diversity-regularized Collaborative Exploration Zhenghao Peng Hao Sun Bolei Zhou 13 18 0 14 Jun 2020
Planning to Explore via Self-Supervised World Models Ramanan Sekar Oleh Rybkin Kostas Daniilidis Pieter Abbeel Danijar Hafner Deepak Pathak SSL 22 396 0 12 May 2020
Scaling MAP-Elites to Deep Neuroevolution Cédric Colas Joost Huizinga Vashisht Madhavan Jeff Clune 30 86 0 03 Mar 2020
Bayesian Residual Policy Optimization: Scalable Bayesian Reinforcement Learning with Clairvoyant Experts Gilwoo Lee Brian Hou Sanjiban Choudhury S. Srinivasa BDL OffRL 28 7 0 07 Feb 2020
Learning-Driven Exploration for Reinforcement Learning Muhammad Usama D. Chang 15 10 0 17 Jun 2019
Self-Supervised Exploration via Disagreement Deepak Pathak Dhiraj Gandhi Abhinav Gupta SSL 27 374 0 10 Jun 2019
Learning Gentle Object Manipulation with Curiosity-Driven Deep Reinforcement Learning Sandy H. Huang Martina Zambelli Jackie Kay M. Martins Yuval Tassa P. Pilarski R. Hadsell 10 50 0 20 Mar 2019
World Discovery Models M. G. Azar Bilal Piot Bernardo Avila-Pires Jean-Bastien Grill Florent Altché Rémi Munos 18 26 0 20 Feb 2019
CLIC: Curriculum Learning and Imitation for object Control in non-rewarding environments Pierre Fournier Olivier Sigaud Cédric Colas Mohamed Chetouani OffRL 32 26 0 28 Jan 2019
Automatic Goal Generation for Reinforcement Learning Agents Carlos Florensa David Held Xinyang Geng Pieter Abbeel 55 497 0 17 May 2017