Multimodal Deep Learning

International Conference on Machine Learning (ICML), 2011

12 January 2023

Christopher Marquardt

Papers citing "Multimodal Deep Learning"

50 / 844 papers shown

Crisscrossed Captions: Extended Intramodal and Intermodal Semantic Similarity Judgments for MS-COCOConference of the European Chapter of the Association for Computational Linguistics (EACL), 2020

288

30 Apr 2020

Multimodal Routing: Improving Local and Global Interpretability of Multimodal Language Analysis

Louis-Philippe Morency

146

29 Apr 2020

EmbraceNet for Activity: A Deep Multimodal Fusion Architecture for Activity Recognition

Jun-Ho Choi

Jong-Seok Lee

29 Apr 2020

Cross-modal Speaker Verification and Recognition: A Multilingual Perspective

Muhammad Haroon Yousaf

Alessio Del Bue

CVBM

348

28 Apr 2020

Deep Auto-Encoders with Sequential Learning for Multimodal Dimensional Emotion RecognitionIEEE transactions on multimedia (TMM), 2020

Thanh Thi Nguyen

124

28 Apr 2020

Data-driven Flood Emulation: Speeding up Urban Flood Predictions by Deep Convolutional Neural NetworksJournal of Flood Risk Management (JFRM), 2020

106

146

17 Apr 2020

How to Teach DNNs to Pay Attention to the Visual Modality in Speech RecognitionIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2020

George Sterpu

Christian Saam

N. Harte

198

17 Apr 2020

Sound of Guns: Digital Forensics of Gun Audio Samples meets Artificial IntelligenceMultimedia tools and applications (MTA), 2020

Simone Raponi

I. M. Ali

Gabriele Oligeri

129

15 Apr 2020

Composite Travel Generative Adversarial Networks for Tabular and Sequential Population Synthesis

Godwin Badu-Marfo

Bilal Farooq

Zachary Patterson

112

15 Apr 2020

Analysis of Social Media Data using Multimodal Deep Learning for Disaster ResponseInternational Conference on Information Systems for Crisis Response and Management (ISCRAM), 2020

Ferda Ofli

Firoj Alam

Muhammad Imran

140

123

14 Apr 2020

Multimodal Categorization of Crisis Events in Social MediaComputer Vision and Pattern Recognition (CVPR), 2020

289

113

10 Apr 2020

Deep Multimodal Feature Encoding for Video Ordering

Vivek Sharma

Makarand Tapaswi

Rainer Stiefelhagen

173

05 Apr 2020

Multimodal Material Classification for Robots using Spectroscopy and High Resolution Texture ImagingIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2020

255

02 Apr 2020

Mapping individual differences in cortical architecture using multi-view representation learningIEEE International Joint Conference on Neural Network (IJCNN), 2020

A. Sellami

Franccois-Xavier Dupé

142

01 Apr 2020

Shared Cross-Modal Trajectory Prediction for Autonomous DrivingComputer Vision and Pattern Recognition (CVPR), 2020

489

01 Apr 2020

Knowledge as Priors: Cross-Modal Knowledge Generalization for Datasets without Superior KnowledgeComputer Vision and Pattern Recognition (CVPR), 2020

261

01 Apr 2020

Fashion Meets Computer Vision: A SurveyACM Computing Surveys (ACM CSUR), 2020

292

108

31 Mar 2020

Integrating Physiological Time Series and Clinical Notes with Deep Learning for Improved ICU Mortality Prediction

Satya Narayan Shukla

Benjamin M. Marlin

141

24 Mar 2020

Variational Inference for Deep Probabilistic Canonical Correlation Analysis

Mahdi Karami

Dale Schuurmans

BDL

149

09 Mar 2020

Adversarial Multimodal Representation Learning for Click-Through Rate PredictionThe Web Conference (WWW), 2020

Xiang Li

129

07 Mar 2020

Deep Multi-Modal Sets

Ser-Nam Lim

222

03 Mar 2020

A Semi-supervised Graph Attentive Network for Financial Fraud DetectionIndustrial Conference on Data Mining (IDM), 2019

Peng Cui

186

427

28 Feb 2020

RMP-SNN: Residual Membrane Potential Neuron for Enabling Deeper High-Accuracy and Low-Latency Spiking Neural NetworkComputer Vision and Pattern Recognition (CVPR), 2020

Bing Han

G. Srinivasan

Kaushik Roy

271

376

25 Feb 2020

Real-time Fusion Network for RGB-D Semantic Segmentation Incorporating Unexpected Obstacle Detection for Road-driving ImagesIEEE Robotics and Automation Letters (RA-L), 2020

Kailun Yang

Kaiwei Wang

286

155

24 Feb 2020

AutoFoley: Artificial Synthesis of Synchronized Sound Tracks for Silent Videos with Deep LearningIEEE transactions on multimedia (TMM), 2020

Sanchita Ghose

John J. Prevost

VGen

180

21 Feb 2020

Neural Attentive Multiview MachinesIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2020

127

18 Feb 2020

Learning Robust Representations via Multi-View Information BottleneckInternational Conference on Learning Representations (ICLR), 2020

255

309

17 Feb 2020

Hi-Net: Hybrid-fusion Network for Multi-modal MR Image SynthesisIEEE Transactions on Medical Imaging (TMI), 2020

370

325

11 Feb 2020

Audiovisual SlowFast Networks for Video Recognition

Christoph Feichtenhofer

630

232

23 Jan 2020

Multimodal Deep Unfolding for Guided Image Super-ResolutionIEEE Transactions on Image Processing (TIP), 2020

Iman Marivani

Evaggelia Tsiligianni

Bruno Cornelis

Nikos Deligiannis

SupR

204

21 Jan 2020

A multimodal deep learning approach for named entity recognition from social media

282

19 Jan 2020

Deep Audio-Visual Learning: A SurveyInternational Journal of Automation and Computing (IJAC), 2020

223

178

14 Jan 2020

Improved Robust ASR for Social Robots in Public Spaces

14 Jan 2020

Multiview Representation Learning for a Union of Subspaces

Nils Holzenberger

R. Arora

30 Dec 2019

Learning from Learning Machines: Optimisation, Rules, and Social Norms

Travis LaCroix

Yoshua Bengio

29 Dec 2019

Pathomic Fusion: An Integrated Framework for Fusing Histopathology and Genomic Features for Cancer Diagnosis and PrognosisIEEE Transactions on Medical Imaging (TMI), 2019

Richard J. Chen

Ming Y. Lu

Jingwen Wang

Drew F. K. Williamson

S. Rodig

N. Lindeman

Faisal Mahmood

377

545

18 Dec 2019

Multimodal Self-Supervised Learning for Medical Image AnalysisInformation Processing in Medical Imaging (IPMI), 2019

353

122

11 Dec 2019

Multimodal Generative Models for Compositional Representation Learning

Mike Wu

Noah D. Goodman

GAN DRL

210

11 Dec 2019

Self-Supervised Learning of Video-Induced Visual InvariancesComputer Vision and Pattern Recognition (CVPR), 2019

370

05 Dec 2019

See and Read: Detecting Depression Symptoms in Higher Education Students Using Multimodal Social Media DataInternational Conference on Web and Social Media (ICWSM), 2019

Paulo Mann

A. Paes

Elton H. Matsushima

208

03 Dec 2019

Dividing and Conquering Cross-Modal Recipe Retrieval: from Nearest Neighbours Baselines to SoTA

242

28 Nov 2019

Self-Supervised Learning by Cross-Modal Audio-Video ClusteringNeural Information Processing Systems (NeurIPS), 2019

503

461

28 Nov 2019

MMTM: Multimodal Transfer Module for CNN FusionComputer Vision and Pattern Recognition (CVPR), 2019

Hamid Reza Vaezi Joze

Amirreza Shaban

Michael L. Iuzzolino

K. Koishida

407

350

20 Nov 2019

Modal-aware Features for Multimodal Hashing

160

19 Nov 2019

VLUC: An Empirical Benchmark for Video-Like Urban Computing on Citywide Crowd and Traffic Prediction

111

16 Nov 2019

Towards Pose-invariant Lip-ReadingIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2019

Shiyang Cheng

Pingchuan Ma

Georgios Tzimiropoulos

270

14 Nov 2019

Multimodal Intelligence: Representation Learning, Information Fusion, and ApplicationsIEEE Journal on Selected Topics in Signal Processing (JSTSP), 2019

Chao Zhang

Zichao Yang

Xiaodong He

Li Deng

HAI AI4TS

325

408

10 Nov 2019

Adaptive Fusion Techniques for Multimodal Data

Gaurav Sahu

Olga Vechtomova

140

10 Nov 2019

Variational Mixture-of-Experts Autoencoders for Multi-Modal Deep Generative ModelsNeural Information Processing Systems (NeurIPS), 2019

Yuge Shi

Siddharth Narayanaswamy

Brooks Paige

Juil Sock

DRL

255

324

08 Nov 2019

Towards a General Model of Knowledge for Facial Analysis by Multi-Source Transfer Learning

164

08 Nov 2019