v1v2 (latest)

DISCO: Mitigating Bias in Deep Learning with Conditional Distance Correlation

13 June 2025

ArXiv (abs)PDF HTML Github (17160★)

Main:9 Pages

15 Figures

Bibliography:3 Pages

4 Tables

Appendix:13 Pages

Abstract

Dataset bias often leads deep learning models to exploit spurious correlations instead of task-relevant signals. We introduce the Standard Anti-Causal Model (SAM), a unifying causal framework that characterizes bias mechanisms and yields a conditional independence criterion for causal stability. Building on this theory, we propose DISCO $_m$ and sDISCO, efficient and scalable estimators of conditional distance correlation that enable independence regularization in black-box models. Across five diverse datasets, our methods consistently outperform or are competitive in existing bias mitigation approaches, while requiring fewer hyperparameters and scaling seamlessly to multi-bias scenarios. This work bridges causal theory and practical deep learning, providing both a principled foundation and effective tools for robust prediction. Source Code:this https URL.

View on arXiv

Comments on this paper