Multimodal Deep Learning

International Conference on Machine Learning (ICML), 2011

12 January 2023

Christopher Marquardt

Papers citing "Multimodal Deep Learning"

50 / 844 papers shown

DyFuLM: An Advanced Multimodal Framework for Sentiment Analysis

01 Dec 2025

Advanced Data Collection Techniques in Cloud Security: A Multi-Modal Deep Learning Autoencoder Approach

Aamiruddin Syed

Mohammed Ilyas Ahmad

26 Nov 2025

Distilling Cross-Modal Knowledge via Feature Disentanglement

150

25 Nov 2025

New York Smells: A Large Multimodal Dataset for Olfaction

109

25 Nov 2025

Solar-GECO: Perovskite Solar Cell Property Prediction with Geometric-Aware Co-Attention

130

24 Nov 2025

Transparent Early ICU Mortality Prediction with Clinical Transformer and Per-Case Modality Attribution

Alexander Bakumenko

Janine Hoelscher

Hudson Smith

19 Nov 2025

Reconstruction-Driven Multimodal Representation Learning for Automated Media Understanding

Yassir Benhammou

Suman Kalyan

Sujay Kumar

124

17 Nov 2025

Robust Defense Strategies for Multimodal Contrastive Learning: Efficient Fine-tuning Against Backdoor Attacks

239

17 Nov 2025

Multimodal ML: Quantifying the Improvement of Calorie Estimation Through Image-Text Pairs

Arya Narang

12 Nov 2025

Countering Multi-modal Representation Collapse through Rank-targeted Fusion

116

09 Nov 2025

The Algorithmic Phase Transition in Correlated Spiked Models

Zhangsong Li

240

08 Nov 2025

Modality-Aware SAM: Sharpness-Aware-Minimization Driven Gradient Modulation for Harmonized Multimodal Learning

141

28 Oct 2025

FrogDeepSDM: Improving Frog Counting and Occurrence Prediction Using Multimodal Data and Pseudo-Absence Imputation

102

22 Oct 2025

Multi-modal Co-learning for Earth Observation: Enhancing single-modality models via modality collaboration

119

22 Oct 2025

Spectral Thresholds in Correlated Spiked Models and Fundamental Limits of Partial Least Squares

Pierre Mergny

Lenka Zdeborová

106

20 Oct 2025

Graph4MM: Weaving Multimodal Learning with Structural Information

125

19 Oct 2025

PassREfinder-FL: Privacy-Preserving Credential Stuffing Risk Prediction via Graph-Based Federated Learning for Representing Password Reuse between WebsitesExpert systems with applications (ESWA), 2025

17 Oct 2025

A Multimodal Approach to Heritage Preservation in the Context of Climate Change

15 Oct 2025

Contrastive Dimension Reduction: A Systematic Review

159

13 Oct 2025

Mixup Helps Understanding Multimodal Video Better

Xiaoyu Ma

Ding Ding

Hao Chen

133

13 Oct 2025

Partial Information Decomposition via Normalizing Flows in Latent Gaussian Distributions

167

06 Oct 2025

MultiModal Action Conditioned Video Generation

Yichen Li

Antonio Torralba

VGen

185

02 Oct 2025

Creative synthesis of kinematic mechanisms

134

30 Sep 2025

PEARL: Performance-Enhanced Aggregated Representation Learning

Wenhui Li

Shijin Gong

Xinyu Zhang

117

29 Sep 2025

Defeating Cerberus: Concept-Guided Privacy-Leakage Mitigation in Multimodal Language Models

195

29 Sep 2025

InfMasking: Unleashing Synergistic Information by Contrastive Multimodal Interactions

252

28 Sep 2025

^3

F-Net: A Multi-Modal Approach to Medical Image Classification via Spatial-Spectral Summarizer Fusion Network

Md. Saiful Bari Siddiqui

Mohammed Imamul Hassan Bhuiyan

MedIm

102

27 Sep 2025

AudioFuse: Unified Spectral-Temporal Learning via a Hybrid ViT-1D CNN Architecture for Robust Phonocardiogram Classification

Md. Saiful Bari Siddiqui

Utsab Saha

27 Sep 2025

Multi-modal Bayesian Neural Network Surrogates with Conjugate Last-Layer Estimation

Ian Taylor

Juliane Mueller

Julie Bessac

26 Sep 2025

Causal Representation Learning from Multimodal Clinical Records under Non-Random Modality Missingness

128

21 Sep 2025

Insight-LLM: LLM-enhanced Multi-view Fusion in Insider Threat Detection

Chengyu Song

Jianming Zheng

104

01 Sep 2025

AIM: Adaptive Intra-Network Modulation for Balanced Multimodal Learning

Shu Shen

Chao Chen

Tong Zhang

237

27 Aug 2025

The next question after Turing's question: Introducing the Grow-AI test

Alexandru Tugui

ELM

119

22 Aug 2025

SPANER: Shared Prompt Aligner for Multimodal Semantic Representation

Thye Shan Ng

Caren Soyeon Han

Eun-Jung Holden

135

18 Aug 2025

Arabic Multimodal Machine Learning: Datasets, Applications, Approaches, and Challenges

143

17 Aug 2025

A Semi-supervised Generative Model for Incomplete Multi-view Data Integration with Missing Labels

Yiyang Shen

Weiran Wang

15 Aug 2025

Landmark Guided Visual Feature Extractor for Visual Speech Recognition with Limited Resource

10 Aug 2025

Chain of Questions: Guiding Multimodal Curiosity in Language Models

Nima Iji

Kia Dashtipour

LRM

165

06 Aug 2025

Intrusion Detection in Heterogeneous Networks with Domain-Adaptive Multi-Modal Learning

Mabin Umman Varghese

Zahra Taghiyarrenani

05 Aug 2025

Closing the Modality Gap for Mixed Modality Search

133

25 Jul 2025

Principled Multimodal Representation Learning

231

23 Jul 2025

EVOLVE-X: Embedding Fusion and Language Prompting for User Evolution Forecasting on Social Media

21 Jul 2025

A Survey of Pun Generation: Datasets, Evaluations and Methodologies

Diana Benavides-Prado

Michael J. Witbrock

187

07 Jul 2025

Large Language Models for Crash Detection in Video: A Survey of Methods, Datasets, and Challenges

304

02 Jul 2025

Improving Multimodal Learning Balance and Sufficiency through Data Remixing

Xiaoyu Ma

Hao Chen

Yongjian Deng

259

13 Jun 2025

Hearing Hands: Generating Sounds from Physical Interactions in 3D ScenesComputer Vision and Pattern Recognition (CVPR), 2025

190

11 Jun 2025

Towards Efficient Multi-LLM Inference: Characterization and Analysis of LLM Routing and Hierarchical Techniques

204

06 Jun 2025

Towards LLM-Centric Multimodal Fusion: A Survey on Integration Strategies and Techniques

444

05 Jun 2025

Computational Thresholds in Multi-Modal Learning via the Spiked Matrix-Tensor Model

172

03 Jun 2025

Leveraging CLIP Encoder for Multimodal Emotion RecognitionIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2025

Yehun Song

Sunyoung Cho

VLM

176

01 Jun 2025