v1v2 (latest)

Multimodal Machine Learning: A Survey and Taxonomy

26 May 2017

T. Baltrušaitis

Chaitanya Ahuja

Louis-Philippe Morency

ArXiv (abs)PDF HTML

Papers citing "Multimodal Machine Learning: A Survey and Taxonomy"

50 / 941 papers shown

Pan-Cancer Integrative Histology-Genomic Analysis via Interpretable Multimodal Deep LearningJournal of Pathology Informatics (J Pathol Inform), 2021

Richard J. Chen

Ming Y. Lu

Drew F. K. Williamson

Tiffany Y. Chen

Jana Lipkova

...

139

04 Aug 2021

Exploiting BERT For Multimodal Target Sentiment Classification Through Input Space Translation

Zaid Khan

Y. Fu

174

178

03 Aug 2021

Desk Organization: Effect of Multimodal Inputs on Spatial Relational Learning

Ryan Rowe

Shivam Singhal

Daqing Yi

Tapomayukh Bhattacharjee

S. Srinivasa

138

03 Aug 2021

Multimodal Feature Fusion for Video Advertisements Tagging Via Stacking Ensemble

171

02 Aug 2021

Multimodal Co-learning: Challenges, Applications with Datasets, Recent Advances and Future DirectionsInformation Fusion (Inf. Fusion), 2021

402

176

29 Jul 2021

Squeeze-Excitation Convolutional Recurrent Neural Networks for Audio-Visual Scene ClassificationWorkshop on Detection and Classification of Acoustic Scenes and Events (DCASE), 2021

Javier Naranjo-Alcazar

28 Jul 2021

Adversarial Stacked Auto-Encoders for Fair Representation Learning

129

27 Jul 2021

Imbalanced Big Data Oversampling: Taxonomy, Algorithms, Software, Guidelines and Future DirectionsACM Computing Surveys (CSUR), 2021

W. Sleeman

R. Kapoor

AI4TS

222

24 Jul 2021

Multimodal Representations Learning and Adversarial Hypergraph Fusion for Early Alzheimer's Disease PredictionChinese Conference on Pattern Recognition and Computer Vision (CPRCV), 2021

Shuqiang Wang

134

21 Jul 2021

M2Lens: Visualizing and Explaining Multimodal Models for Sentiment AnalysisIEEE Transactions on Visualization and Computer Graphics (TVCG), 2021

Huamin Qu

237

17 Jul 2021

MultiBench: Multiscale Benchmarks for Multimodal Representation Learning

...

Peter Wu

Michelle A. Lee

Yuke Zhu

Ruslan Salakhutdinov

Louis-Philippe Morency

VLM

294

224

15 Jul 2021

FairyTailor: A Multimodal Generative Framework for Storytelling

177

13 Jul 2021

Cognitive Visual Commonsense Reasoning Using Dynamic Working Memory

Wenbin Zhang

201

04 Jul 2021

Multimodal Representation for Neural Code Search

Jian Gu

Zimin Chen

Monperrus Martin

162

02 Jul 2021

Case Relation Transformer: A Crossmodal Language Generation Model for Fetching Instructions

Motonari Kambara

K. Sugiura

ViT

150

02 Jul 2021

Towards Model-informed Precision Dosing with Expert-in-the-loop Machine LearningIEEE International Conference on Information Reuse and Integration (IRI), 2021

Yihuang Kang

Y. Chiu

Ming-Yen Lin

F. Su

Sheng-Tai Huang

133

28 Jun 2021

Deep Learning for Technical Document ClassificationIEEE transactions on engineering management (IEEE Trans. Eng. Manage.), 2021

252

27 Jun 2021

Core Challenges in Embodied Vision-Language PlanningJournal of Artificial Intelligence Research (JAIR), 2021

Jean Oh

544

26 Jun 2021

Learning Language and Multimodal Privacy-Preserving Markers of Mood from Mobile Data

Louis-Philippe Morency

212

24 Jun 2021

DravidianMultiModality: A Dataset for Multi-modal Sentiment Analysis in Tamil and Malayalam

Bharathi Raja Chakravarthi

K. JishnuParameswaranP.

B. Premjith

Kritik Soman

Rahul Ponnusamy

Prasanna Kumar Kumaresan

K. Thamburaj

John P. Mccrae

09 Jun 2021

What Makes Multi-modal Learning Better than Single (Provably)Neural Information Processing Systems (NeurIPS), 2021

Hang Zhao

290

339

08 Jun 2021

Exploring modality-agnostic representations for music classification

Ho-Hsiang Wu

Magdalena Fuentes

J. P. Bello

248

02 Jun 2021

Rethinking the constraints of multimodal fusion: case study in Weakly-Supervised Audio-Visual Video Parsing

228

30 May 2021

Self-Supervised Multimodal Opinion SummarizationAnnual Meeting of the Association for Computational Linguistics (ACL), 2021

124

27 May 2021

Recent Advances and Trends in Multimodal Deep Learning: A Review

Xi Li

340

24 May 2021

A Review on Explainability in Multimodal Deep Neural NetsIEEE Access (IEEE Access), 2021

Gargi Joshi

Rahee Walambe

K. Kotecha

402

171

17 May 2021

VSR: A Unified Framework for Document Layout Analysis combining Vision, Semantics and RelationsIEEE International Conference on Document Analysis and Recognition (ICDAR), 2021

166

13 May 2021

Relation-aware Hierarchical Attention Framework for Video Question AnsweringInternational Conference on Multimedia Retrieval (ICMR), 2021

223

13 May 2021

Cross-Modal and Multimodal Data Analysis Based on Functional Mapping of Spectral Descriptors and Manifold Regularization

M. Behmanesh

Peyman Adibi

Jocelyn Chanussot

Sayyed Mohammad Saeed Ehsani

143

12 May 2021

Including Signed Languages in Natural Language ProcessingAnnual Meeting of the Association for Computational Linguistics (ACL), 2021

207

131

11 May 2021

Cross-Modal Generative Augmentation for Visual Question AnsweringBritish Machine Vision Conference (BMVC), 2021

Zixu Wang

Yishu Miao

Lucia Specia

220

11 May 2021

Graph Inference Representation: Learning Graph Positional Embeddings with Anchor Path Encoding

104

09 May 2021

Blockchain Systems, Technologies and Applications: A Methodology PerspectiveIEEE Communications Surveys and Tutorials (COMST), 2021

Lei Zhang

184

08 May 2021

Generalized Multimodal ELBOInternational Conference on Learning Representations (ICLR), 2021

Thomas M. Sutter

Imant Daunhawer

Julia E. Vogt

298

120

06 May 2021

Watershed of Artificial Intelligence: Human Intelligence, Machine Intelligence, and Biological Intelligence

117

27 Apr 2021

Multi-view Deep One-class Classification: A Systematic Exploration

27 Apr 2021

Weakly-supervised Multi-task Learning for Multimodal Affect Recognition

170

23 Apr 2021

Literature review on vulnerability detection using NLP technology

Jiajie Wu

384

23 Apr 2021

Uncertainty-Aware Boosted Ensembling in Multi-Modal SettingsIEEE International Joint Conference on Neural Network (IJCNN), 2021

197

21 Apr 2021

Continual learning in cross-modal retrieval

154

14 Apr 2021

Adversarial Sticker: A Stealthy Attack Method in the Physical WorldIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

272

163

14 Apr 2021

Integrating Information Theory and Adversarial Learning for Cross-modal RetrievalPattern Recognition (Pattern Recogn.), 2021

124

11 Apr 2021

Software/Hardware Co-design for Multi-modal Multi-task Learning in Autonomous SystemsInternational Conference on Artificial Intelligence Circuits and Systems (ICAICS), 2021

Cong Hao

Deming Chen

257

08 Apr 2021

Synthesis of Compositional Animations from Textual DescriptionsIEEE International Conference on Computer Vision (ICCV), 2021

581

214

26 Mar 2021

Audio Description from Image by Modal Translation NetworkNeurocomputing (Neurocomputing), 2021

127

18 Mar 2021

Multimodal End-to-End Sparse Model for Emotion RecognitionNorth American Chapter of the Association for Computational Linguistics (NAACL), 2021

243

101

17 Mar 2021

Leveraging Recent Advances in Deep Learning for Audio-Visual Emotion RecognitionPattern Recognition Letters (PR), 2021

Liam Schoneveld

Alice Othmani

Hazem Abdelkawy

254

203

16 Mar 2021

Reconsidering Representation Alignment for Multi-view ClusteringComputer Vision and Pattern Recognition (CVPR), 2021

Daniel J. Trosten

Sigurd Løkse

Robert Jenssen

Michael C. Kampffmeyer

197

180

13 Mar 2021

Orthogonalized Kernel Debiased Machine Learning for Multimodal Data Analysis

Xiaowu Dai

Lexin Li

226

12 Mar 2021

What is Multimodality?

Letitia Parcalabescu

Nils Trost

Anette Frank

230

10 Mar 2021