Advantage-Weighted Regression: Simple and Scalable Off-Policy Reinforcement Learning

1 October 2019

Papers citing "Advantage-Weighted Regression: Simple and Scalable Off-Policy Reinforcement Learning"

50 / 404 papers shown

Title
Importance Weighted Actor-Critic for Optimal Conservative Offline Reinforcement Learning Hanlin Zhu Paria Rashidinejad Jiantao Jiao OffRL 49 15 0 30 Jan 2023
Improving Behavioural Cloning with Positive Unlabeled Learning Qiang-qiang Wang Robert McCarthy David Córdova Bulens Kevin McGuinness Noel E. O'Connor Nico Gürtler Felix Widmaier Francisco Roldan Sanchez S. Redmond OffRL OnRL 36 8 0 27 Jan 2023
PIRLNav: Pretraining with Imitation and RL Finetuning for ObjectNav Ram Ramrakhya Dhruv Batra Erik Wijmans Abhishek Das OffRL 33 53 0 18 Jan 2023
Extreme Q-Learning: MaxEnt RL without Entropy Divyansh Garg Joey Hejna M. Geist Stefano Ermon OffRL 41 66 0 05 Jan 2023
Benchmarks and Algorithms for Offline Preference-Based Reward Learning Daniel Shin Anca Dragan Daniel S. Brown OffRL 22 53 0 03 Jan 2023
On Pathologies in KL-Regularized Reinforcement Learning from Expert Demonstrations Tim G. J. Rudner Cong Lu Michael A. Osborne Yarin Gal Yee Whye Teh OffRL 38 27 0 28 Dec 2022
Local Policy Improvement for Recommender Systems Dawen Liang N. Vlassis OffRL 21 3 0 22 Dec 2022
Bridging the Gap Between Offline and Online Reinforcement Learning Evaluation Methodologies Shivakanth Sujit Pedro H. M. Braga J. Bornschein Samira Ebrahimi Kahou OffRL 33 1 0 15 Dec 2022
Learning Robotic Navigation from Experience: Principles, Methods, and Recent Results Sergey Levine Dhruv Shah SSL 54 21 0 13 Dec 2022
Confidence-Conditioned Value Functions for Offline Reinforcement Learning Joey Hong Aviral Kumar Sergey Levine OffRL 39 20 0 08 Dec 2022
TD3 with Reverse KL Regularizer for Offline Reinforcement Learning from Mixed Datasets Yuanying Cai Chuheng Zhang Li Zhao Wei Shen Xuyun Zhang Lei Song Jiang Bian Tao Qin Tie-Yan Liu OffRL 25 3 0 05 Dec 2022
Flow to Control: Offline Reinforcement Learning with Lossless Primitive Discovery Yiqin Yang Haotian Hu Wenzhe Li Siyuan Li Jun Yang Qianchuan Zhao Chongjie Zhang OffRL 30 9 0 02 Dec 2022
Offline Reinforcement Learning with Closed-Form Policy Improvement Operators Jiachen Li Edwin Zhang Ming Yin Qinxun Bai Yu Wang William Yang Wang OffRL 41 15 0 29 Nov 2022
Offline Q-Learning on Diverse Multi-Task Data Both Scales And Generalizes Aviral Kumar Rishabh Agarwal Xinyang Geng George Tucker Sergey Levine OffRL 44 48 0 28 Nov 2022
SkillS: Adaptive Skill Sequencing for Efficient Temporally-Extended Exploration Giulia Vezzani Dhruva Tirumala Markus Wulfmeier Dushyant Rao A. Abdolmaleki ... Tim Hertweck Thomas Lampe Fereshteh Sadeghi N. Heess Martin Riedmiller OffRL 43 6 0 24 Nov 2022
Data-Driven Offline Decision-Making via Invariant Representation Learning Qi Yi-Hsun Su Aviral Kumar Sergey Levine OffRL 42 19 0 21 Nov 2022
Learning Reward Functions for Robotic Manipulation by Observing Humans Minttu Alakuijala Gabriel Dulac-Arnold Julien Mairal Jean Ponce Cordelia Schmid OffRL 41 27 0 16 Nov 2022
Offline Reinforcement Learning with Adaptive Behavior Regularization Yunfan Zhou Xijun Li Qingyu Qu OffRL 27 1 0 15 Nov 2022
Contextual Transformer for Offline Meta Reinforcement Learning Runji Lin Ye Li Xidong Feng Zhaowei Zhang Xian Hong Wu Fung Haifeng Zhang Jun Wang Yali Du Yaodong Yang OffRL 28 6 0 15 Nov 2022
Wall Street Tree Search: Risk-Aware Planning for Offline Reinforcement Learning D. Elbaz Gal Novik Oren Salzman OffRL 33 0 0 06 Nov 2022
Dual Generator Offline Reinforcement Learning Q. Vuong Aviral Kumar Sergey Levine Yevgen Chebotar OffRL 34 1 0 02 Nov 2022
Offline RL With Realistic Datasets: Heteroskedasticity and Support Constraints Anika Singh Aviral Kumar Q. Vuong Yevgen Chebotar Sergey Levine OffRL 32 14 0 02 Nov 2022
Optimal Conservative Offline RL with General Function Approximation via Augmented Lagrangian Paria Rashidinejad Hanlin Zhu Kunhe Yang Stuart J. Russell Jiantao Jiao OffRL 69 27 0 01 Nov 2022
Learning on the Job: Self-Rewarding Offline-to-Online Finetuning for Industrial Insertion of Novel Connectors from Vision Ashvin Nair Brian Zhu Gokul Narayanan Eugen Solowjow Sergey Levine OffRL OnRL 33 15 0 27 Oct 2022
Adaptive Behavior Cloning Regularization for Stable Offline-to-Online Reinforcement Learning Yi Zhao Rinu Boney Alexander Ilin Arno Solin Joni Pajarinen OffRL OnRL 28 39 0 25 Oct 2022
Boosting Offline Reinforcement Learning via Data Rebalancing Yang Yue Bingyi Kang Xiao Ma Zhongwen Xu Gao Huang Shuicheng Yan OffRL 26 22 0 17 Oct 2022
A Policy-Guided Imitation Approach for Offline Reinforcement Learning Haoran Xu Li Jiang Jianxiong Li Xianyuan Zhan OffRL 31 62 0 15 Oct 2022
Eliciting Compatible Demonstrations for Multi-Human Imitation Learning Kanishk Gandhi Siddharth Karamcheti Madeline Liao Dorsa Sadigh 49 22 0 14 Oct 2022
Mutual Information Regularized Offline Reinforcement Learning Xiao Ma Bingyi Kang Zhongwen Xu Min Lin Shuicheng Yan OffRL 35 7 0 14 Oct 2022
Monte Carlo Augmented Actor-Critic for Sparse Reward Deep Reinforcement Learning from Suboptimal Demonstrations Albert Wilcox Ashwin Balakrishna Jules Dedieu Wyame Benslimane Daniel S. Brown Ken Goldberg OffRL 22 19 0 14 Oct 2022
Sustainable Online Reinforcement Learning for Auto-bidding Zhiyu Mou Yusen Huo Rongquan Bai Mingzhou Xie Chuan Yu Jian Xu Bo Zheng OffRL OnRL 36 15 0 13 Oct 2022
Pre-Training for Robots: Offline RL Enables Learning New Tasks from a Handful of Trials Aviral Kumar Anika Singh F. Ebert Mitsuhiko Nakamoto Yanlai Yang Chelsea Finn Sergey Levine OffRL OnRL 131 66 0 11 Oct 2022
State Advantage Weighting for Offline RL Jiafei Lyu Aicheng Gong Le Wan Zongqing Lu Xiu Li OffRL 46 9 0 09 Oct 2022
VIP: Towards Universal Visual Reward and Representation via Value-Implicit Pre-Training Yecheng Jason Ma Shagun Sodhani Dinesh Jayaraman Osbert Bastani Vikash Kumar Amy Zhang SSL OffRL 38 288 0 30 Sep 2022
Offline Reinforcement Learning via High-Fidelity Generative Behavior Modeling Huayu Chen Cheng Lu Chengyang Ying Hang Su Jun Zhu DiffM OffRL 110 106 0 29 Sep 2022
DCE: Offline Reinforcement Learning With Double Conservative Estimates Chen Zhao K. Huang Chun yuan OffRL 35 1 0 27 Sep 2022
Opportunities and Challenges from Using Animal Videos in Reinforcement Learning for Navigation Vittorio Giammarino James Queeney Lucas C. Carstensen Michael Hasselmo I. Paschalidis OffRL 55 4 0 25 Sep 2022
C^2:Co-design of Robots via Concurrent Networks Coupling Online and Offline Reinforcement Learning Ci Chen Pingyu Xiang Haojian Lu Yue Wang R. Xiong OffRL 27 3 0 14 Sep 2022
Q-learning Decision Transformer: Leveraging Dynamic Programming for Conditional Sequence Modelling in Offline RL Taku Yamagata Ahmed Khalil Raúl Santos-Rodríguez OffRL 160 72 0 08 Sep 2022
MO2: Model-Based Offline Options Sasha Salter Markus Wulfmeier Dhruva Tirumala N. Heess Martin Riedmiller R. Hadsell Dushyant Rao OffRL 32 13 0 05 Sep 2022
Some Supervision Required: Incorporating Oracle Policies in Reinforcement Learning via Epistemic Uncertainty Metrics Jun Jet Tai Jordan Terry M. Innocente J. Brusey N. Horri 29 1 0 22 Aug 2022
MoCapAct: A Multi-Task Dataset for Simulated Humanoid Control Nolan Wagener Andrey Kolobov Felipe Vieira Frujeri Ricky Loynd Ching-An Cheng Matthew J. Hausknecht 34 21 0 15 Aug 2022
Diffusion Policies as an Expressive Policy Class for Offline Reinforcement Learning Zhendong Wang Jonathan J. Hunt Mingyuan Zhou OffRL 30 343 0 12 Aug 2022
A Maintenance Planning Framework using Online and Offline Deep Reinforcement Learning Zaharah Bukhsh N. Jansen Hajo Molegraaf OffRL AI4CE 38 6 0 01 Aug 2022
Robot Policy Learning from Demonstration Using Advantage Weighting and Early Termination A. Mohtasib Gerhard Neumann Heriberto Cuayáhuitl OffRL 44 2 0 31 Jul 2022
Addressing Optimism Bias in Sequence Modeling for Reinforcement Learning Adam R. Villaflor Zheng Huang Swapnil Pande John M. Dolan J. Schneider OffRL 25 24 0 21 Jul 2022
Learning Deformable Object Manipulation from Expert Demonstrations G. Salhotra Isabella Liu Marcus Dominguez-Kuhne Gaurav Sukhatme 39 27 0 20 Jul 2022
Discriminator-Weighted Offline Imitation Learning from Suboptimal Demonstrations Haoran Xu Xianyuan Zhan Honglei Yin Huiling Qin OffRL 33 66 0 20 Jul 2022
Don't Start From Scratch: Leveraging Prior Data to Automate Robotic Reinforcement Learning Homer Walke Jonathan Yang Albert Yu Aviral Kumar Jedrzej Orbik Avi Singh Sergey Levine OffRL OnRL 31 32 0 11 Jul 2022
Prompting Decision Transformer for Few-Shot Policy Generalization Mengdi Xu Songlin Yang Shun Zhang Yuchen Lu Ding Zhao J. Tenenbaum Chuang Gan OffRL 18 136 0 27 Jun 2022