Compositional Planning Using Optimal Option Models

International Conference on Machine Learning (ICML), 2012

27 June 2012

David Silver

K. Ciosek

ArXiv (abs)PDF HTML

Papers citing "Compositional Planning Using Optimal Option Models"

35 / 35 papers shown

Multi-layer Abstraction for Nested Generation of Options (MANGO) in Hierarchical Reinforcement Learning

Alessio Arcudi

Davide Sartor

Alberto Sinigaglia

Vincent François-Lavet

Gian Antonio Susto

25 Aug 2025

A Unified Theory of Compositionality, Modularity, and Interpretability in Markov Decision Processes

Thomas J. Ringstrom

Paul Schrater

160

11 Jun 2025

TAG: A Decentralized Framework for Multi-Agent Hierarchical Reinforcement Learning

Giuseppe Paolo

Khyati Khandelwal

Abdelhakim Benechehab

Albert Thomas

Jun Yao

387

21 Feb 2025

Contrastive Abstraction for Reinforcement Learning

Vihang Patil

M. Hofmarcher

Elisabeth Rumetshofer

Sepp Hochreiter

OffRL SSL

305

01 Oct 2024

A General Theory for Compositional Generalization

254

20 May 2024

Hierarchical Reinforcement Learning for Power Network Topology Control

Blazej Manczak

Jan Viebahn

H. V. Hoof

238

03 Nov 2023

Consciousness-Inspired Spatio-Temporal Abstractions for Better Generalization in Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2023

474

30 Sep 2023

Offline Skill Graph (OSG): A Framework for Learning and Planning using Offline Reinforcement Learning Skills

173

23 Jun 2023

Hierarchical Imitation Learning with Vector Quantized ModelsInternational Conference on Machine Learning (ICML), 2023

Kalle Kujanpää

Joni Pajarinen

Alexander Ilin

251

30 Jan 2023

Multi-Task Option Learning and Discovery for Stochastic Path Planning

Naman Shah

Siddharth Srivastava

331

30 Sep 2022

Generalised Policy Improvement with Geometric Policy CompositionInternational Conference on Machine Learning (ICML), 2022

186

17 Jun 2022

Reward-Respecting Subtasks for Model-Based Reinforcement LearningArtificial Intelligence (AIJ), 2022

R. Sutton

Marlos C. Machado

G. Z. Holland

David Szepesvari Finbarr Timbers

Finbarr Timbers

B. Tanner

Adam White

340

07 Feb 2022

A First-Occupancy Representation for Reinforcement Learning

Theodore H. Moskovitz

S. Wilson

M. Sahani

283

28 Sep 2021

Systematic Evaluation of Causal Discovery in Visual Model Based Reinforcement Learning

Stefan Bauer

Danilo Jimenez Rezende

221

02 Jul 2021

Probabilistic Mixture-of-Experts for Efficient Deep Reinforcement Learning

Wei Pan

136

19 Apr 2021

Solving Compositional Reinforcement Learning Problems via Task ReductionInternational Conference on Learning Representations (ICLR), 2021

205

13 Mar 2021

Discovery of Options via Meta-Learned SubgoalsNeural Information Processing Systems (NeurIPS), 2021

David Silver

202

12 Feb 2021

Interpretable Reinforcement Learning Inspired by Piaget's Theory of Cognitive Development

Aref Hakimzadeh

Yanbo Xue

P. Setoodeh

123

01 Feb 2021

Align-RUDDER: Learning From Few Demonstrations by Reward Redistribution

Vihang Patil

M. Hofmarcher

Marius-Constantin Dinu

Matthias Dorfer

P. Blies

Johannes Brandstetter

Jose A. Arjona-Medina

Sepp Hochreiter

348

29 Sep 2020

Learning Compositional Neural Programs for Continuous Control

Thomas Pierrot

Nicolas Perrin

Feryal M. P. Behbahani

270

27 Jul 2020

Planning with Abstract Learned Models While Learning Transferable SubtasksAAAI Conference on Artificial Intelligence (AAAI), 2019

140

16 Dec 2019

Learning from Trajectories via Subgoal DiscoveryNeural Information Processing Systems (NeurIPS), 2019

S. Paul

J. Baar

Amit K. Roy-Chowdhury

260

03 Nov 2019

Combating the Compounding-Error Problem with a Multi-step Model

Michel L. Littman

256

30 May 2019

Learning Robust Options by Conditional Value at Risk OptimizationNeural Information Processing Systems (NeurIPS), 2019

338

22 May 2019

DAC: The Double Actor-Critic Architecture for Learning OptionsNeural Information Processing Systems (NeurIPS), 2019

Shangtong Zhang

Shimon Whiteson

544

29 Apr 2019

Diversity-Driven Extensible Hierarchical Reinforcement Learning

164

10 Nov 2018

Finding Options that Minimize Planning Time

Michael Littman

170

16 Oct 2018

Compositional planning in Markov decision processes: Temporal abstraction meets generalized logic composition

Xuan Liu

Jie Fu

116

05 Oct 2018

Improving On-policy Learning with Statistical Reward Accumulation

101

07 Sep 2018

Variational Intrinsic Control

Karol Gregor

Danilo Jimenez Rezende

Daan Wierstra

DRL OffRL

310

457

22 Nov 2016

Reinforcement Learning with Unsupervised Auxiliary Tasks

Max Jaderberg

Volodymyr Mnih

Wojciech M. Czarnecki

David Silver

459

1,277

16 Nov 2016

Principled Option Learning in Markov Decision Processes

Roy Fox

Michal Moshkovitz

Naftali Tishby

153

18 Sep 2016

The Option-Critic Architecture

Pierre-Luc Bacon

J. Harb

Doina Precup

OffRL

288

1,198

16 Sep 2016

Adaptive Skills, Adaptive Partitions (ASAP)

D. Mankowitz

Timothy A. Mann

Shie Mannor

221

10 Feb 2016

Value Iteration with Options and State Aggregation

K. Ciosek

David Silver

116

16 Jan 2015