On-line Policy Improvement using Monte-Carlo Search

9 January 2025

Papers citing "On-line Policy Improvement using Monte-Carlo Search"

2 / 52 papers shown

Title
Fast Reinforcement Learning with Large Action Sets using Error-Correcting Output Codes for MDP Factorization Gabriel Dulac-Arnold Ludovic Denoyer Philippe Preux Patrick Gallinari OffRL 60 24 0 29 Feb 2012
Approximate Policy Iteration with a Policy Language Bias: Solving Relational Markov Decision Processes Alan Fern R. Givan S. Yoon 61 63 0 09 Sep 2011