Modelling transition dynamics in MDPs with RKHS embeddings

International Conference on Machine Learning (ICML), 2012

18 June 2012

Papers citing "Modelling transition dynamics in MDPs with RKHS embeddings"

50 / 50 papers shown

Sampling Complexity of TD and PPO in RKHS

156

29 Sep 2025

Doubly-Robust Estimation of Counterfactual Policy Mean Embeddings

428

03 Jun 2025

Operator World Models for Reinforcement Learning

379

28 Jun 2024

Nonparametric Bellman Mappings for Reinforcement Learning: Application to Robust Adaptive Filtering

Yuki Akiyama

Minh Vu

Konstantinos Slavakis

292

29 Mar 2024

Distributional Bellman Operators over Mean EmbeddingsInternational Conference on Machine Learning (ICML), 2023

Marcus Hutter

Arthur Gretton

Mark Rowland

OffRL

301

09 Dec 2023

Proximal Bellman mappings for reinforcement learning and their application to robust adaptive filteringIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

Yuki Akiyama

Konstantinos Slavakis

230

14 Sep 2023

Bayesian Exploration NetworksInternational Conference on Machine Learning (ICML), 2023

Matt Fellows

Brandon Kaplowitz

Christian Schroeder de Witt

Shimon Whiteson

BDL

519

24 Aug 2023

Stochastic Nonlinear Control via Finite-dimensional Spectral Dynamic EmbeddingIEEE Conference on Decision and Control (CDC), 2023

382

08 Apr 2023

Efficient Preference-Based Reinforcement Learning Using Learned Dynamics ModelsIEEE International Conference on Robotics and Automation (ICRA), 2023

345

11 Jan 2023

Physics-Informed Kernel Embeddings: Integrating Prior System Knowledge with Data-Driven ControlAmerican Control Conference (ACC), 2023

Ufuk Topcu

339

09 Jan 2023

Bayesian Counterfactual Mean Embeddings and Off-Policy Evaluation

Diego Martinez-Taboada

Dino Sejdinovic

CML OffRL

173

02 Nov 2022

Sequential Decision Making on Unmatched Data using Bayesian Kernel Embeddings

Diego Martinez-Taboada

Dino Sejdinovic

BDL

181

25 Oct 2022

Statistical Estimation of Confounded Linear MDPs: An Instrumental Variable Approach

Wenhao Yang

249

12 Sep 2022

Optimal Rates for Regularized Conditional Mean Embedding LearningNeural Information Processing Systems (NeurIPS), 2022

376

02 Aug 2022

Illusory Attacks: Information-Theoretic Detectability Matters in Adversarial AttacksInternational Conference on Learning Representations (ICLR), 2022

João F. Henriques

Christian Schroeder de Witt

AAML

368

20 Jul 2022

The Sufficiency of Off-Policyness and Soft Clipping: PPO is still Insufficient according to an Off-Policy MeasureAAAI Conference on Artificial Intelligence (AAAI), 2022

Hechang Chen

553

20 May 2022

Approximate discounting-free policy evaluation from transient and recurrent states

Vektor Dewanto

M. Gallagher

OffRL

08 Apr 2022

SOCKS: A Stochastic Optimal Control and Reachability Toolbox Using Kernel MethodsInternational Conference on Hybrid Systems: Computation and Control (HSCC), 2022

Adam J. Thorpe

Meeko Oishi

134

12 Mar 2022

Optimal policy evaluation using kernel-based temporal difference methodsAnnals of Statistics (Ann. Stat.), 2021

Yaqi Duan

Mengdi Wang

Martin J. Wainwright

OffRL

256

24 Sep 2021

Sobolev Norm Learning Rates for Conditional Mean EmbeddingsInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2021

Prem M. Talwai

A. Shameli

D. Simchi-Levi

354

16 May 2021

Proximal Causal Learning with Kernels: Two-Stage Estimation and Moment RestrictionInternational Conference on Machine Learning (ICML), 2021

676

10 May 2021

Towards Theoretical Understandings of Robust Markov Decision Processes: Sample Complexity and Asymptotics

Wenhao Yang

Liangyu Zhang

Zhihua Zhang

304

09 May 2021

Sample Complexity of Offline Reinforcement Learning with Deep ReLU Networks

Thanh Nguyen-Tang

508

11 Mar 2021

Online Learning for Unknown Partially Observable MDPsInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2021

Mehdi Jafarnia-Jahromi

Rahul Jain

A. Nayyar

338

25 Feb 2021

Accountable Off-Policy Evaluation With Kernel Bellman Statistics

294

15 Aug 2020

Kernel Autocovariance Operators of Stationary Processes: Estimation and ConvergenceJournal of machine learning research (JMLR), 2020

276

02 Apr 2020

Minimax-Optimal Off-Policy Evaluation with Linear Function ApproximationInternational Conference on Machine Learning (ICML), 2020

Yaqi Duan

Mengdi Wang

OffRL

330

160

21 Feb 2020

Frequency-based Search-control in DynaInternational Conference on Learning Representations (ICLR), 2020

Yangchen Pan

Jincheng Mei

Amir-massoud Farahmand

163

14 Feb 2020

A Measure-Theoretic Approach to Kernel Conditional Mean EmbeddingsNeural Information Processing Systems (NeurIPS), 2020

Junhyung Park

Krikamol Muandet

699

116

10 Feb 2020

A New Distribution-Free Concept for Representing, Comparing, and Propagating Uncertainty in Dynamical Systems with Kernel Probabilistic ProgrammingIFAC-PapersOnLine (IFAC-PapersOnLine), 2019

244

25 Nov 2019

Learning low-dimensional state embeddings and metastable clusters from time series dataNeural Information Processing Systems (NeurIPS), 2019

232

01 Jun 2019

Kernel Instrumental Variable RegressionNeural Information Processing Systems (NeurIPS), 2019

Rahul Singh

M. Sahani

Arthur Gretton

820

197

01 Jun 2019

Organizing Experience: A Deeper Look at Replay Mechanisms for Sample-based Planning in Continuous State Domains

340

12 Jun 2018

Nonparametric Stochastic Compositional Gradient Descent for Q-Learning in Continuous Markov Decision ProblemsAmerican Control Conference (ACC), 2018

Alec Koppel

Ekaterina V. Tolstaya

Ethan Stump

Alejandro Ribeiro

148

19 Apr 2018

Practical Issues of Action-conditioned Next Image Prediction

Hao Chen

168

08 Feb 2018

Barrier-Certified Adaptive Reinforcement Learning with Applications to Brushbot Navigation

346

29 Jan 2018

Learning from Conditional Distributions via Dual Embeddings

320

15 Jul 2016

Kernel Bayesian Inference with Posterior RegularizationNeural Information Processing Systems (NeurIPS), 2016

Yang Song

Jun Zhu

Yong Ren

301

07 Jul 2016

Difference of Convex Functions Programming Applied to Control with Expert Data

Bilal Piot

Matthieu Geist

Olivier Pietquin

OffRL

210

03 Jun 2016

Uncertain programming model for multi-item solid transportation problemInternational Journal of Machine Learning and Cybernetics (IJMLC), 2016

Hasan Dalman

551

859

31 May 2016

Policy Error Bounds for Model-Based Reinforcement Learning with Factored Linear Models

Bernardo Avila-Pires

Csaba Szepesvári

OffRL

143

19 Feb 2016

Doubly Robust Off-policy Value Evaluation for Reinforcement Learning

Nan Jiang

Lihong Li

OffRL

608

693

11 Nov 2015

Model-based Kernel Sum Rule: Kernel Bayesian Inference with Probabilistic ModelsMachine-mediated learning (ML), 2014

461

18 Sep 2014

Practical Kernel-Based Reinforcement LearningJournal of machine learning research (JMLR), 2014

227

21 Jul 2014

Characteristic Kernels and Infinitely Divisible DistributionsJournal of machine learning research (JMLR), 2014

Yu Nishiyama

Kenji Fukumizu

364

28 Mar 2014

Filtering with State-Observation Examples via Kernel Monte Carlo FilterNeural Computation (Neural Comput.), 2013

411

17 Dec 2013

Hilbert Space Embeddings of Predictive State RepresentationsConference on Uncertainty in Artificial Intelligence (UAI), 2013

Byron Boots

Geoffrey J. Gordon

Arthur Gretton

281

26 Sep 2013

Hilbert Space Embeddings of POMDPsConference on Uncertainty in Artificial Intelligence (UAI), 2012

Yu Nishiyama

Abdeslam Boularias

Arthur Gretton

Kenji Fukumizu

257

16 Oct 2012

Path Integral Control by Reproducing Kernel Hilbert Space EmbeddingInternational Joint Conference on Artificial Intelligence (IJCAI), 2012

K. Rawlik

Marc Toussaint

S. Vijayakumar

438

13 Aug 2012

Conditional mean embeddings as regressors - supplementaryInternational Conference on Machine Learning (ICML), 2012

436

159

21 May 2012