Regularized Behavior Value Estimation

17 March 2021

Çağlar Gülçehre

Sergio Gomez Colmenarejo

Papers citing "Regularized Behavior Value Estimation"

30 / 30 papers shown

Title
Integrating Domain Knowledge for handling Limited Data in Offline RL Briti Gangopadhyay Zhao Wang Jia-Fong Yeh Shingo Takamatsu OffRL 32 0 0 11 Jun 2024
PlanDQ: Hierarchical Plan Orchestration via D-Conductor and Q-Performer Chang Chen Junyeob Baek Fei Deng Kenji Kawaguchi Çağlar Gülçehre Sungjin Ahn OffRL 22 1 0 10 Jun 2024
Reinformer: Max-Return Sequence Modeling for Offline RL Zifeng Zhuang Dengyun Peng Jinxin Liu Ziqi Zhang Donglin Wang OffRL AI4TS 43 13 0 14 May 2024
Reinforced Self-Training (ReST) for Language Modeling Çağlar Gülçehre T. Paine S. Srinivasan Ksenia Konyushkova L. Weerts ... Chenjie Gu Wolfgang Macherey Arnaud Doucet Orhan Firat Nando de Freitas OffRL 19 274 0 17 Aug 2023
AlphaStar Unplugged: Large-Scale Offline Reinforcement Learning Michaël Mathieu Sherjil Ozair Srivatsan Srinivasan Çağlar Gülçehre Shangtong Zhang ... Sergio Gomez Colmenarejo Aaron van den Oord Wojciech M. Czarnecki Nando de Freitas Oriol Vinyals OffRL 16 10 0 07 Aug 2023
Offline Reinforcement Learning with On-Policy Q-Function Regularization Laixi Shi Robert Dadashi Yuejie Chi P. S. Castro M. Geist OffRL 20 5 0 25 Jul 2023
Design from Policies: Conservative Test-Time Adaptation for Offline Policy Optimization Jinxin Liu Hongyin Zhang Zifeng Zhuang Yachen Kang Donglin Wang Bin Wang OffRL 34 8 0 26 Jun 2023
Knowledge Transfer from Teachers to Learners in Growing-Batch Reinforcement Learning P. Emedom-Nnamdi A. Friesen Bobak Shahriari Nando de Freitas Matthew W. Hoffman OffRL 15 0 0 05 May 2023
Hierarchical Reinforcement Learning in Complex 3D Environments Bernardo Avila-Pires Feryal M. P. Behbahani Hubert Soyer Kyriacos Nikiforou Thomas Keck Satinder Singh OffRL 8 0 0 28 Feb 2023
Efficient Communication via Self-supervised Information Aggregation for Online and Offline Multi-agent Reinforcement Learning Cong Guan F. Chen Lei Yuan Zongzhang Zhang Yang Yu OffRL 29 4 0 19 Feb 2023
Offline Robot Reinforcement Learning with Uncertainty-Guided Human Expert Sampling Ashish Kumar Ilya Kuzovkin OffRL OnRL 19 1 0 16 Dec 2022
Learning from Good Trajectories in Offline Multi-Agent Reinforcement Learning Qiangxing Tian Kun Kuang Furui Liu Baoxiang Wang OffRL 16 9 0 28 Nov 2022
Controlling Commercial Cooling Systems Using Reinforcement Learning Jerry Luo Cosmin Paduraru Octavian Voicu Yuri Chervonyi Scott A. Munns ... Sims Witherspoon D. Parish Peter Dolan Chenyu Zhao D. Mankowitz OffRL AI4CE 15 25 0 11 Nov 2022
A Policy-Guided Imitation Approach for Offline Reinforcement Learning Haoran Xu Li Jiang Jianxiong Li Xianyuan Zhan OffRL 21 61 0 15 Oct 2022
DCE: Offline Reinforcement Learning With Double Conservative Estimates Chen Zhao K. Huang Chun yuan OffRL 22 1 0 27 Sep 2022
Optimizing Industrial HVAC Systems with Hierarchical Reinforcement Learning William Wong Praneet Dutta Octavian Voicu Yuri Chervonyi Cosmin Paduraru Jerry Luo OffRL AI4CE 11 5 0 16 Sep 2022
An Empirical Study of Implicit Regularization in Deep Offline RL Çağlar Gülçehre Srivatsan Srinivasan Jakub Sygnowski Georg Ostrovski Mehrdad Farajtabar Matt Hoffman Razvan Pascanu Arnaud Doucet OffRL 14 16 0 05 Jul 2022
Incorporating Explicit Uncertainty Estimates into Deep Offline Reinforcement Learning David Brandfonbrener Rémi Tachet des Combes Romain Laroche OffRL 29 5 0 02 Jun 2022
Towards Learning Universal Hyperparameter Optimizers with Transformers Yutian Chen Xingyou Song Chansoo Lee Z. Wang Qiuyi Zhang ... Greg Kochanski Arnaud Doucet MarcÁurelio Ranzato Sagi Perel Nando de Freitas 24 63 0 26 May 2022
Don't Change the Algorithm, Change the Data: Exploratory Data for Offline Reinforcement Learning Denis Yarats David Brandfonbrener Hao Liu Michael Laskin Pieter Abbeel A. Lazaric Lerrel Pinto OffRL OnRL 13 84 0 31 Jan 2022
A Dataset Perspective on Offline Reinforcement Learning Kajetan Schweighofer Andreas Radler Marius-Constantin Dinu M. Hofmarcher Vihang Patil Angela Bitto-Nemling Hamid Eghbalzadeh Sepp Hochreiter OffRL 17 17 0 08 Nov 2021
Offline Reinforcement Learning with Implicit Q-Learning Ilya Kostrikov Ashvin Nair Sergey Levine OffRL 212 837 0 12 Oct 2021
Accelerating Offline Reinforcement Learning Application in Real-Time Bidding and Recommendation: Potential Use of Simulation Haruka Kiyohara K. Kawakami Yuta Saito OffRL 17 12 0 17 Sep 2021
Offline RL Without Off-Policy Evaluation David Brandfonbrener William F. Whitney Rajesh Ranganath Joan Bruna OffRL 37 161 0 16 Jun 2021
Offline Reinforcement Learning as Anti-Exploration Shideh Rezaeifar Robert Dadashi Nino Vieillard Léonard Hussenot Olivier Bachem Olivier Pietquin M. Geist OffRL 19 51 0 11 Jun 2021
Heuristic-Guided Reinforcement Learning Ching-An Cheng Andrey Kolobov Adith Swaminathan OffRL 25 61 0 05 Jun 2021
Continuous Doubly Constrained Batch Reinforcement Learning Rasool Fakoor Jonas W. Mueller Kavosh Asadi Pratik Chaudhari Alex Smola OffRL 202 27 0 18 Feb 2021
EMaQ: Expected-Max Q-Learning Operator for Simple Yet Effective Offline and Online RL Seyed Kamyar Seyed Ghasemipour Dale Schuurmans S. Gu OffRL 209 119 0 21 Jul 2020
Acme: A Research Framework for Distributed Reinforcement Learning Matthew W. Hoffman Bobak Shahriari John Aslanides Gabriel Barth-Maron Nikola Momchev ... Srivatsan Srinivasan A. Cowie Ziyun Wang Bilal Piot Nando de Freitas 44 225 0 01 Jun 2020
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 329 1,949 0 04 May 2020