Balanced Multimodal Learning via On-the-fly Gradient Modulation

Computer Vision and Pattern Recognition (CVPR), 2022

29 March 2022

ArXiv (abs)PDF HTML Github (274★)

Papers citing "Balanced Multimodal Learning via On-the-fly Gradient Modulation"

50 / 143 papers shown

DynCIM: Dynamic Curriculum for Imbalanced Multimodal Learning

431

09 Mar 2025

Rebalanced Multimodal Learning with Data-aware Unimodal Sampling

227

05 Mar 2025

Attention Bootstrapping for Multi-Modal Test-Time AdaptationAAAI Conference on Artificial Intelligence (AAAI), 2025

306

04 Mar 2025

Rethinking Multimodal Learning from the Perspective of Mitigating Classification Ability Disproportion

Qingyuan Jiang

Longfei Huang

Yang Yang

298

27 Feb 2025

MIND: Modality-Informed Knowledge Distillation Framework for Multimodal Clinical Prediction Tasks

Alejandro Guerra-Manzanares

Farah E. Shamout

341

03 Feb 2025

Enhancing Scene Classification in Cloudy Image Scenarios: A Collaborative Transfer Method with Information Regulation Mechanism using Optical Cloud-Covered and SAR Remote Sensing Images

325

08 Jan 2025

Balanced Multi-view Clustering

490

05 Jan 2025

Balance-aware Sequence Sampling Makes Multi-modal Learning BetterInternational Joint Conference on Artificial Intelligence (IJCAI), 2025

Zhi-Hao Guan

149

01 Jan 2025

Discrepancy-Aware Attention Network for Enhanced Audio-Visual Zero-Shot Learning

277

16 Dec 2024

Rebalanced Vision-Language Retrieval Considering Structure-Aware DistillationIEEE Transactions on Image Processing (TIP), 2024

304

14 Dec 2024

Balancing Multimodal Training Through Game-Theoretic Regularization

Konstantinos Kontras

Thomas Strypsteen

Christos Chatzichristos

Paul P. Liang

Matthew Blaschko

M. D. Vos

404

11 Nov 2024

Classifier-guided Gradient Modulation for Enhanced Multimodal LearningNeural Information Processing Systems (NeurIPS), 2024

241

03 Nov 2024

On-the-fly Modulation for Balanced Multimodal LearningIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

240

15 Oct 2024

Recent Advances of Multimodal Continual Learning: A Comprehensive Survey

Dianzhi Yu

Xinni Zhang

Yankai Chen

Aiwei Liu

Yifei Zhang

Philip S. Yu

Irwin King

VLM CLL

360

07 Oct 2024

Anchors Aweigh! Sail for Optimal Unified Multi-Modal Representations

452

02 Oct 2024

A Survey of Foundation Models for Music Understanding

Wenjun Li

Ying Cai

Ziyang Wu

Wenyi Zhang

Yifan Chen

...

Junwei Han

Bao Ge

Tianming Liu

Lin Gan

Tuo Zhang

266

15 Sep 2024

DSCLAP: Domain-Specific Contrastive Language-Audio Pre-Training

Shengqiang Liu

Anna Wang

134

14 Sep 2024

Multimodal Emotion Recognition with Vision-language Prompting and Modality Dropout

Zhongliang Liu

153

11 Sep 2024

Distribution-Level Memory Recall for Continual Learning: Preserving Knowledge and Avoiding ConfusionIEEE transactions on multimedia (IEEE TMM), 2024

Shaoxu Cheng

Linfeng Xu

Qingbo Wu

Fanman Meng

Hongliang Li

CLL

219

04 Aug 2024

Detached and Interactive Multimodal LearningACM Multimedia (MM), 2024

346

28 Jul 2024

Unifying Visual and Semantic Feature Spaces with Diffusion Models for Enhanced Cross-Modal Alignment

223

26 Jul 2024

Modality-Balanced Learning for Multimedia Recommendation

Jinghao Zhang

Guofan Liu

Qiang Liu

Shu Wu

Liang Wang

151

26 Jul 2024

Balanced Multi-Relational Graph Clustering

Zhixiang Shen

Haolan He

Zhao Kang

215

23 Jul 2024

PASSION: Towards Effective Incomplete Multi-Modal Medical Image Segmentation with Imbalanced Missing Rates

Xin Yang

233

20 Jul 2024

Diagnosing and Re-learning for Balanced Multimodal Learning

Yake Wei

Siwei Li

Ruoxuan Feng

Di Hu

220

12 Jul 2024

GTP-4o: Modality-prompted Heterogeneous Graph Learning for Omni-modal Biomedical Representation

Chenxin Li

232

08 Jul 2024

Multimodal Classification via Modal-Aware Interactive Enhancement

Qing-Yuan Jiang

Zhouyang Chi

Yang Yang

227

05 Jul 2024

Robust Multimodal Learning via Representation Decoupling

229

05 Jul 2024

Adaptive Modality Balanced Online Knowledge Distillation for Brain-Eye-Computer based Dim Object Detection

294

02 Jul 2024

Fairness and Bias in Multimodal AI: A Survey

344

27 Jun 2024

LUMA: A Benchmark Dataset for Learning from Uncertain and Multimodal DataAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2024

287

14 Jun 2024

MA-AVT: Modality Alignment for Parameter-Efficient Audio-Visual Transformers

186

07 Jun 2024

Predictive Dynamic FusionInternational Conference on Machine Learning (ICML), 2024

277

07 Jun 2024

MMPareto: Boosting Multimodal Learning with Innocent Unimodal Assistance

Yake Wei

Di Hu

303

28 May 2024

EgoChoir: Capturing 3D Human-Object Interaction Regions from Egocentric Views

Yang Cao

318

22 May 2024

ReconBoost: Boosting Can Achieve Modality ReconcilementInternational Conference on Machine Learning (ICML), 2024

217

15 May 2024

Improving Multimodal Learning with Multi-Loss Gradient ModulationBritish Machine Vision Conference (BMVC), 2024

Konstantinos Kontras

Christos Chatzichristos

Matthew Blaschko

M. D. Vos

211

13 May 2024

Beyond Unimodal Learning: The Importance of Integrating Multiple Modalities for Lifelong Learning

202

04 May 2024

MiPa: Mixed Patch Infrared-Visible Modality Agnostic Object Detection

H. R. Medeiros

David Latortue

Fidel Alejandro Guerrero Peña

Eric Granger

M. Pedersoli

198

29 Apr 2024

Multimodal Fusion on Low-quality Data: A Comprehensive Survey

...

344

27 Apr 2024

Learning to Rebalance Multi-Modal Optimization by Adaptively Masking Subnetworks

191

12 Apr 2024

Unified Multi-modal Diagnostic Framework with Reconstruction Pre-training and Heterogeneity-combat Tuning

311

09 Apr 2024

Attribution Regularization for Multimodal Paradigms

Sahiti Yerramilli

Jayant Sravan Tamarapalli

Jonathan M Francis

Eric Nyberg

199

02 Apr 2024

360+x: A Panoptic Multi-modal Scene Understanding Dataset

229

01 Apr 2024

Path-GPTOmic: A Balanced Multi-modal Learning Framework for Survival Outcome Prediction

Danny Z. Chen

208

18 Mar 2024

Unleashing Network Potentials for Semantic Scene CompletionComputer Vision and Pattern Recognition (CVPR), 2024

368

12 Mar 2024

Answering Diverse Questions via Text Attached with Key Audio-Visual Clues

Qilang Ye

Zitong Yu

Xin Liu

243

11 Mar 2024

MADTP: Multimodal Alignment-Guided Dynamic Token Pruning for Accelerating Vision-Language Transformer

Peng Ye

Tao Chen

208

05 Mar 2024

AlignMiF: Geometry-Aligned Multimodal Implicit Field for LiDAR-Camera Joint Synthesis

Peng Chen

Kaicheng Yu

213

27 Feb 2024

Gradient-Guided Modality Decoupling for Missing-Modality Robustness

231

26 Feb 2024