Woulda, Coulda, Shoulda: Counterfactually-Guided Policy Search

International Conference on Learning Representations (ICLR), 2018

15 November 2018

Jean-Baptiste Lespiau

N. Heess

CML

ArXiv (abs)PDF HTML

Papers citing "Woulda, Coulda, Shoulda: Counterfactually-Guided Policy Search"

50 / 99 papers shown

CauSight: Learning to Supersense for Visual Causal Discovery

Yize Zhang

145

01 Dec 2025

ExoPredicator: Learning Abstract Models of Dynamic Worlds for Robot Planning

Carl Edward Rasmussen

192

30 Sep 2025

Goal Discovery with Causal Capacity for Efficient Reinforcement Learning

133

13 Aug 2025

Abstract Counterfactuals for Language Model Agents

270

03 Jun 2025

Null Counterfactual Factor Interactions for Goal-Conditioned Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2025

327

06 May 2025

D3HRL: A Distributed Hierarchical Reinforcement Learning Approach Based on Causal Discovery and Spurious Correlation Detection

270

04 May 2025

CAIMAN: Causal Action Influence Detection for Sample-efficient Loco-manipulation

442

02 Feb 2025

Dynamical-VAE-based Hindsight to Learn the Causal Dynamics of Factored-POMDPs

320

12 Nov 2024

Counterfactual Token Generation in Large Language ModelsCLEaR (CLEaR), 2024

Manuel Gomez Rodriguez

LRM

404

25 Sep 2024

BECAUSE: Bilinear Causal Representation for Generalizable Offline Model-based Reinforcement Learning

Ding Zhao

493

15 Jul 2024

Disentangled Representations for Causal Cognition

Filippo Torresan

Manuel Baltieri

CML

261

30 Jun 2024

Fine-Grained Causal Dynamics Learning with Quantization for Improving Robustness in Reinforcement Learning

Byoung-Tak Zhang

296

05 Jun 2024

Causal Action Influence Aware Counterfactual Data Augmentation

191

29 May 2024

Learning Causal Dynamics Models in Object-Oriented Environments

Zhongwei Yu

Jingqing Ruan

Dengpeng Xing

233

21 May 2024

Do No Harm: A Counterfactual Approach to Safe Reinforcement Learning

Sean Vaskov

Wilko Schwarting

Chris Baker

262

19 May 2024

What Hides behind Unfairness? Exploring Dynamics Fairness in Reinforcement Learning

247

16 Apr 2024

Automated Discovery of Functional Actual Causes in Complex Environments

Caleb Chuck

Sankaran Vaidyanathan

309

16 Apr 2024

Mitigating Cascading Effects in Large Adversarial Graph Environments

James Cunningham

Conrad S. Tucker

AI4CE AAML

134

12 Apr 2024

Counterfactual Influence in Markov Decision Processes

313

13 Feb 2024

Where and How to Attack? A Causality-Inspired Recipe for Generating Counterfactual Adversarial Examples

371

21 Dec 2023

Personalized Path Recourse for Reinforcement Learning Agents

Dat Hong

Tong Wang

331

14 Dec 2023

Agent-Specific Effects: A Causal Effect Propagation Analysis in Multi-Agent MDPsInternational Conference on Machine Learning (ICML), 2023

Stelios Triantafyllou

A. Sukovic

Debmalya Mandal

Goran Radanović

389

17 Oct 2023

Offline Imitation Learning with Variational Counterfactual ReasoningNeural Information Processing Systems (NeurIPS), 2023

Shuai Zhang

267

07 Oct 2023

Estimation of Counterfactual Interventions under UncertaintiesAsian Conference on Machine Learning (ACML), 2023

197

15 Sep 2023

Bayesian Inverse Transition Learning for Offline Settings

Leo Benac

S. Parbhoo

Finale Doshi-Velez

OffRL

129

09 Aug 2023

Hindsight-DICE: Stable Credit Assignment for Deep Reinforcement Learning

274

21 Jul 2023

Adversarial Conversational Shaping for Intelligent Agents

173

20 Jul 2023

Causal Reinforcement Learning: A Survey

345

04 Jul 2023

Would I have gotten that reward? Long-term credit assignment by counterfactual contribution analysisNeural Information Processing Systems (NeurIPS), 2023

354

29 Jun 2023

Finding Counterfactually Optimal Action Sequences in Continuous State SpacesNeural Information Processing Systems (NeurIPS), 2023

Stratis Tsirtsis

Manuel Gomez Rodriguez

CML OffRL

328

06 Jun 2023

Partial Counterfactual Identification of Continuous Outcomes with a Curvature Sensitivity ModelNeural Information Processing Systems (NeurIPS), 2023

Valentyn Melnychuk

Dennis Frauen

Stefan Feuerriegel

519

02 Jun 2023

Q-Cogni: An Integrated Causal Reinforcement Learning FrameworkIEEE Transactions on Artificial Intelligence (IEEE TAI), 2023

166

26 Feb 2023

Towards Computationally Efficient Responsibility Attribution in Decentralized Partially Observable MDPsAdaptive Agents and Multi-Agent Systems (AAMAS), 2023

Stelios Triantafyllou

Goran Radanović

182

24 Feb 2023

A Survey on Causal Reinforcement LearningIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2023

430

10 Feb 2023

Causal Temporal Reasoning for Markov Decision Processes

Milad Kazemi

Nicola Paoletti

LRM AI4CE

237

16 Dec 2022

Counterfactuals for the FutureAAAI Conference on Artificial Intelligence (AAAI), 2022

Lucius E.J. Bynum

Joshua R. Loftus

Julia Stoyanovich

167

07 Dec 2022

Curiosity in Hindsight: Intrinsic Exploration in Stochastic EnvironmentsInternational Conference on Machine Learning (ICML), 2022

246

18 Nov 2022

The Benefits of Model-Based Generalization in Reinforcement LearningInternational Conference on Machine Learning (ICML), 2022

334

04 Nov 2022

Counterfactual Data Augmentation via Perspective Transition for Open-Domain DialoguesConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Jiao Ou

Jinchao Zhang

Yang Feng

Jie Zhou

229

30 Oct 2022

MoCoDA: Model-based Counterfactual Data AugmentationNeural Information Processing Systems (NeurIPS), 2022

Silviu Pitis

186

20 Oct 2022

Causal Dynamics Learning for Task-Independent State AbstractionInternational Conference on Machine Learning (ICML), 2022

Xuesu Xiao

198

27 Jun 2022

Adversarial Counterfactual Environment Model LearningNeural Information Processing Systems (NeurIPS), 2023

...

213

10 Jun 2022

Counterfactual Analysis in Dynamic Latent State ModelsInternational Conference on Machine Learning (ICML), 2022

Martin Haugh

Raghav Singal

CML

264

27 May 2022

Counterfactual harmNeural Information Processing Systems (NeurIPS), 2022

Jonathan G. Richens

R. Beard

Daniel H. Thompson

372

27 Apr 2022

On the link between conscious function and general intelligence in humans and machines

277

24 Mar 2022

Learning to reason about and to act on physical cascading eventsInternational Conference on Machine Learning (ICML), 2022

172

02 Feb 2022

A Validation Tool for Designing Reinforcement Learning Environments

Ruiyang Xu

Zhengxing Chen

OffRL

100

10 Dec 2021

Counterfactual Temporal Point ProcessesNeural Information Processing Systems (NeurIPS), 2021

Kimia Noorbakhsh

Manuel Gomez Rodriguez

194

15 Nov 2021

Causal Multi-Agent Reinforcement Learning: Review and Open Problems

St John Grimbly

Jonathan P. Shock

Arnu Pretorius

218

12 Nov 2021

Learning Generalized Gumbel-max Causal MechanismsNeural Information Processing Systems (NeurIPS), 2021

133

11 Nov 2021