Bandit Linear Optimization for Sequential Decision Making and Extensive-Form Games

8 March 2021

Papers citing "Bandit Linear Optimization for Sequential Decision Making and Extensive-Form Games"

8 / 8 papers shown

Title
Efficient Near-Optimal Algorithm for Online Shortest Paths in Directed Acyclic Graphs with Bandit Feedback Against Adaptive Adversaries Arnab Maiti Zhiyuan Fan Kevin Jamieson Lillian J. Ratliff Gabriele Farina 513 1 0 01 Apr 2025
Best of Both Worlds: Regret Minimization versus Minimax Play Adrian Müller Jon Schneider Stratis Skoulakis Luca Viano Volkan Cevher OffRL 14 0 0 17 Feb 2025
Adapting to game trees in zero-sum imperfect information games Côme Fiegel Pierre Ménard Tadashi Kozuno Rémi Munos Vianney Perchet Michal Valko 376 10 0 23 Dec 2022
Partially Observable RL with B-Stability: Unified Structural Condition and Sharp Sample-Efficient Algorithms Fan Chen Yu Bai Song Mei 93 22 0 29 Sep 2022
Efficient Phi-Regret Minimization in Extensive-Form Games via Online Mirror Descent Yu Bai Chi Jin Song Mei Ziang Song Tiancheng Yu OffRL 103 19 0 30 May 2022
Near-Optimal Learning of Extensive-Form Games with Imperfect Information Yunru Bai Chi Jin Song Mei Tiancheng Yu 104 26 0 03 Feb 2022
Model-Free Learning for Two-Player Zero-Sum Partially Observable Markov Games with Perfect Recall Tadashi Kozuno Pierre Ménard Rémi Munos Michal Valko 126 18 0 11 Jun 2021
Model-Free Online Learning in Unknown Sequential Decision Making Problems and Games Gabriele Farina Tuomas Sandholm OffRL 83 18 0 08 Mar 2021