Modality Competition: What Makes Joint Training of Multi-modal Network Fail in Deep Learning? (Provably)

International Conference on Machine Learning (ICML), 2022

23 March 2022

Yu Huang

Junyang Lin

Chang Zhou

Hongxia Yang

Longbo Huang

ArXiv (abs)PDF HTML

Papers citing "Modality Competition: What Makes Joint Training of Multi-modal Network Fail in Deep Learning? (Provably)"

50 / 70 papers shown

Mitigating Modality Imbalance in Multi-modal Learning via Multi-objective Optimization

Heshan Devaka Fernando

222

10 Nov 2025

MILES: Modality-Informed Learning Rate Scheduler for Balancing Multimodal Learning

Alejandro Guerra-Manzanares

Farah E. Shamout

128

20 Oct 2025

MCE: Towards a General Framework for Handling Missing Modalities under Imbalanced Missing RatesPattern Recognition (Pattern Recogn.), 2025

Binyu Zhao

Wei Zhang

Zhaonian Zou

144

12 Oct 2025

Shaping Initial State Prevents Modality Competition in Multi-modal Fusion: A Two-stage Scheduling Framework via Fast Partial Information Decomposition

138

25 Sep 2025

Robust Multi-Omics Integration from Incomplete Modalities Significantly Improves Prediction of Alzheimer's Disease

...

25 Sep 2025

AIM: Adaptive Intra-Network Modulation for Balanced Multimodal Learning

Shu Shen

Chao Chen

Tong Zhang

232

27 Aug 2025

SEAM: Semantically Equivalent Across Modalities Benchmark for Vision-Language Models

142

25 Aug 2025

Investigating Redundancy in Multimodal Large Language Models with Multiple Vision Encoders

...

187

04 Jul 2025

$G$^{2}$D: Boosting Multimodal Learning with Gradient-Guided Distillation$

^{2}

D: Boosting Multimodal Learning with Gradient-Guided Distillation

Mohammed Rakib

A. Bagavathi

252

26 Jun 2025

RollingQ: Reviving the Cooperation Dynamics in Multimodal Transformer

294

13 Jun 2025

Improving Multimodal Learning Balance and Sufficiency through Data Remixing

Xiaoyu Ma

Hao Chen

Yongjian Deng

244

13 Jun 2025

RMMSS: Towards Advanced Robust Multi-Modal Semantic Segmentation with Hybrid Prototype Distillation and Feature Selection

Jiaqi Tan

Xu Zheng

Yuhang Liu

339

19 May 2025

DeepMLF: Multimodal language model with learnable tokens for deep fusion in sentiment analysis

Efthymios Georgiou

Vassilis Katsouros

Yannis Avrithis

Alexandros Potamianos

393

15 Apr 2025

Adaptive Unimodal Regulation for Balanced Multimodal Information AcquisitionComputer Vision and Pattern Recognition (CVPR), 2025

284

24 Mar 2025

See-Saw Modality Balance: See Gradient, and Sew Impaired Vision-Language Balance to Mitigate Dominant Modality BiasNorth American Chapter of the Association for Computational Linguistics (NAACL), 2025

225

18 Mar 2025

Rebalanced Multimodal Learning with Data-aware Unimodal Sampling

221

05 Mar 2025

DeepSuM: Deep Sufficient Modality Learning Framework

147

03 Mar 2025

Rethinking Multimodal Learning from the Perspective of Mitigating Classification Ability Disproportion

Qingyuan Jiang

Longfei Huang

Yang Yang

276

27 Feb 2025

MIND: Modality-Informed Knowledge Distillation Framework for Multimodal Clinical Prediction Tasks

Alejandro Guerra-Manzanares

Farah E. Shamout

333

03 Feb 2025

Balanced Multi-view Clustering

457

05 Jan 2025

Discrepancy-Aware Attention Network for Enhanced Audio-Visual Zero-Shot Learning

266

16 Dec 2024

Rebalanced Vision-Language Retrieval Considering Structure-Aware DistillationIEEE Transactions on Image Processing (TIP), 2024

294

14 Dec 2024

Multimodal Integration of Longitudinal Noninvasive Diagnostics for Survival Prediction in Immunotherapy Using Deep Learning

Marcel A J van Gerven

309

27 Nov 2024

Balancing Multimodal Training Through Game-Theoretic Regularization

Konstantinos Kontras

Thomas Strypsteen

Christos Chatzichristos

Paul P. Liang

Matthew Blaschko

M. D. Vos

396

11 Nov 2024

Classifier-guided Gradient Modulation for Enhanced Multimodal LearningNeural Information Processing Systems (NeurIPS), 2024

231

03 Nov 2024

On-the-fly Modulation for Balanced Multimodal LearningIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

233

15 Oct 2024

MedUniSeg: 2D and 3D Medical Image Segmentation via a Prompt-driven Universal Model

Yiwen Ye

Ziyang Chen

Jianpeng Zhang

Yutong Xie

Yong Xia

MedIm

133

08 Oct 2024

Investigating the Impact of Model Complexity in Large Language Models

Jing Luo

Huiyuan Wang

Weiran Huang

217

01 Oct 2024

Early Joint Learning of Emotion Information Makes MultiModal Model Understand You Better

Tao Zhang

225

12 Sep 2024

Multimodal Emotion Recognition with Vision-language Prompting and Modality Dropout

Zhongliang Liu

151

11 Sep 2024

Audio-Guided Fusion Techniques for Multimodal Emotion Analysis

Pujin Shi

Fei Gao

242

08 Sep 2024

Cross-Modality Clustering-based Self-Labeling for Multimodal Data Classification

P. Zyblewski

Leandro L. Minku

199

05 Aug 2024

Detached and Interactive Multimodal LearningACM Multimedia (MM), 2024

345

28 Jul 2024

Hierarchical and Decoupled BEV Perception Learning Framework for Autonomous Driving

Yuqi Dai

Jian Sun

Shengbo Eben Li

Qing Xu

Jianqiang Wang

Lei He

Keqiang Li

284

17 Jul 2024

Diagnosing and Re-learning for Balanced Multimodal Learning

Yake Wei

Siwei Li

Ruoxuan Feng

Di Hu

214

12 Jul 2024

Enhance the Robustness of Text-Centric Multimodal Alignments

256

06 Jul 2024

Multimodal Data Integration for Precision Oncology: Challenges and Future Directions

Fengtao Zhou

Hao Chen

304

28 Jun 2024

Generalist Multimodal AI: A Review of Architectures, Challenges and Opportunities

Sai Munikoti

Ian Stewart

Sameera Horawalavithana

244

08 Jun 2024

MMPareto: Boosting Multimodal Learning with Innocent Unimodal Assistance

Yake Wei

Di Hu

295

28 May 2024

Mitigating Noisy Correspondence by Geometrical Structure Consistency Learning

Zihua Zhao

Mengxi Chen

Tianjie Dai

Jiangchao Yao

Bo han

Ya Zhang

Yanfeng Wang

NoLa

207

27 May 2024

ReconBoost: Boosting Can Achieve Modality ReconcilementInternational Conference on Machine Learning (ICML), 2024

204

15 May 2024

Improving Multimodal Learning with Multi-Loss Gradient ModulationBritish Machine Vision Conference (BMVC), 2024

Konstantinos Kontras

Christos Chatzichristos

Matthew Blaschko

M. D. Vos

210

13 May 2024

Multimodal Fusion on Low-quality Data: A Comprehensive Survey

...

311

27 Apr 2024

Learning to Rebalance Multi-Modal Optimization by Adaptively Masking Subnetworks

186

12 Apr 2024

Gradient-Guided Modality Decoupling for Missing-Modality Robustness

209

26 Feb 2024

Can Text-to-image Model Assist Multi-modal Learning for Visual Recognition with Visual Modality Missing?

Tiantian Feng

Daniel Yang

Digbalay Bose

Shrikanth Narayanan

274

14 Feb 2024

Enhancing ID and Text Fusion via Alternative Training in Session-based Recommendation

195

14 Feb 2024

Quantifying and Enhancing Multi-modal Robustness with Modality Preference

324

09 Feb 2024

PowMix: A Versatile Regularizer for Multimodal Sentiment Analysis

Efthymios Georgiou

Yannis Avrithis

Alexandros Potamianos

162

19 Dec 2023

Understanding Unimodal Bias in Multimodal Deep Linear NetworksInternational Conference on Machine Learning (ICML), 2023

Yedi Zhang

Peter E. Latham

Andrew Saxe

272

01 Dec 2023