Causal Reinforcement Learning: A Survey

Causal Reinforcement Learning: A Survey

4 July 2023

Papers citing "Causal Reinforcement Learning: A Survey"

13 / 13 papers shown

Title
D3HRL: A Distributed Hierarchical Reinforcement Learning Approach Based on Causal Discovery and Spurious Correlation Detection Chenran Zhao Dianxi Shi Mengzhu Wang Jianqiang Xia Huanhuan Yang Songchang Jin Shaowu Yang Chunping Qiu 20 0 0 04 May 2025
Sharing Knowledge in Multi-Task Deep Reinforcement Learning Carlo DÉramo Davide Tateo Andrea Bonarini Marcello Restelli Jan Peters 48 121 0 17 Jan 2024
Invariant Causal Imitation Learning for Generalizable Policies Ioana Bica Daniel Jarrett Mihaela van der Schaar CML OffRL OOD 55 32 0 02 Nov 2023
Improving alignment of dialogue agents via targeted human judgements Amelia Glaese Nat McAleese Maja Trkebacz John Aslanides Vlad Firoiu ... John F. J. Mellor Demis Hassabis Koray Kavukcuoglu Lisa Anne Hendricks G. Irving ALM AAML 225 495 0 28 Sep 2022
A Review of Safe Reinforcement Learning: Methods, Theory and Applications Shangding Gu Longyu Yang Yali Du Guang Chen Florian Walter Jun Wang Alois C. Knoll OffRL AI4TS 111 231 0 20 May 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 303 11,730 0 04 Mar 2022
Achieving Counterfactual Fairness for Causal Bandit Wen Huang Lu Zhang Xintao Wu CML 104 22 0 21 Sep 2021
Lifelong Robotic Reinforcement Learning by Retaining Experiences Annie Xie Chelsea Finn OffRL CLL 104 43 0 19 Sep 2021
Unsupervised Causal Binary Concepts Discovery with VAE for Black-box Model Explanation Thien Q. Tran Kazuto Fukuchi Youhei Akimoto Jun Sakuma CML 32 10 0 09 Sep 2021
Improving Generalization in Reinforcement Learning with Mixture Regularization Kaixin Wang Bingyi Kang Jie Shao Jiashi Feng 104 113 0 21 Oct 2020
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 329 1,944 0 04 May 2020
Fine-Tuning Language Models from Human Preferences Daniel M. Ziegler Nisan Stiennon Jeff Wu Tom B. Brown Alec Radford Dario Amodei Paul Christiano G. Irving ALM 275 1,561 0 18 Sep 2019
Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks Chelsea Finn Pieter Abbeel Sergey Levine OOD 243 11,568 0 09 Mar 2017