v1v2 (latest)

Multimodal Machine Learning: A Survey and Taxonomy

26 May 2017

T. Baltrušaitis

Chaitanya Ahuja

Louis-Philippe Morency

ArXiv (abs)PDF HTML

Papers citing "Multimodal Machine Learning: A Survey and Taxonomy"

50 / 941 papers shown

Introducing Representations of Facial Affect in Automated Multimodal Deception DetectionInternational Conference on Multimodal Interaction (ICMI), 2020

Leena Mathur

Maja J. Matarić

CVBM

195

31 Aug 2020

Collaborative Multi-Robot Systems for Search and Rescue: Coordination and Perception

Jorge Peña Queralta

139

28 Aug 2020

Training Multimodal Systems for Classification with Multiple Objectives

160

26 Aug 2020

A Baseline Analysis for Podcast Abstractive Summarization

181

24 Aug 2020

A Efficient Multimodal Framework for Large Scale Emotion Recognition by Fusing Music and Electrodermal Activity Signals

Dian Yu

121

22 Aug 2020

A Survey of Visual Analytics Techniques for Machine Learning

286

255

21 Aug 2020

Linguistically-aware Attention for Reducing the Semantic-Gap in Vision-Language Tasks

256

18 Aug 2020

Audio-Visual Event Localization via Recursive Fusion by Joint Co-Attention

Yan Yan

156

14 Aug 2020

Audio- and Gaze-driven Facial Animation of Codec AvatarsIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2020

Juergen Gall

164

11 Aug 2020

Auto-weighting for Breast Cancer Classification in Multimodal UltrasoundInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2020

Yang Xin

...

133

08 Aug 2020

HAMLET: A Hierarchical Multimodal Attention-based Human Activity Recognition Algorithm

Md. Mofijul Islam

Tariq Iqbal

158

03 Aug 2020

Characterizing Communities of Hashtag Usage on Twitter During the 2020 COVID-19 Pandemic by Multi-view Clustering

Iain J. Cruickshank

Kathleen M. Carley

163

03 Aug 2020

AiRound and CV-BrCT: Novel Multi-View Datasets for Scene Classification

Gabriel L. S. Machado

03 Aug 2020

From Robotic Process Automation to Intelligent Process Automation: Emerging TrendsInternational Conference on Business Process Management (BPM), 2020

Tathagata Chakraborti

154

27 Jul 2020

Federated Self-Supervised Learning of Multi-Sensor Representations for Embedded IntelligenceIEEE Internet of Things Journal (IEEE IoT J.), 2020

233

117

25 Jul 2020

Deep Learning Techniques for Future Intelligent Cross-Media Retrieval

150

21 Jul 2020

Audio-Visual Understanding of Passenger Intents for In-Cabin Conversational Agents

143

08 Jul 2020

MAMO: Memory-Augmented Meta-Optimization for Cold-start Recommendation

Liming Zhu

142

184

07 Jul 2020

Jointly Modeling Motion and Appearance Cues for Robust RGB-T Tracking

Huchuan Lu

167

176

04 Jul 2020

Deep Feature Space: A Geometrical Perspective

Ioannis Kansizoglou

Loukas Bampis

Antonios Gasteratos

307

30 Jun 2020

BERTERS: Multimodal Representation Learning for Expert Recommendation System with Transformer

Narjes Nikzad Khasmakhi

30 Jun 2020

X-ModalNet: A Semi-Supervised Deep Cross-Modal Network for Classification of Remote Sensing DataIsprs Journal of Photogrammetry and Remote Sensing (ISPRS J. Photogramm. Remote Sens.), 2020

158

24 Jun 2020

Multimodal Generative Learning Utilizing Jensen-Shannon-Divergence

Thomas M. Sutter

Imant Daunhawer

Julia E. Vogt

294

15 Jun 2020

Towards Robust Pattern Recognition: A ReviewProceedings of the IEEE (Proc. IEEE), 2020

203

126

12 Jun 2020

Interpretable, similarity-driven multi-view embeddings from high-dimensional biomedical data

Brian B. Avants

Nicholas J. Tustison

J. Stone

171

11 Jun 2020

Report from the NSF Future Directions Workshop, Toward User-Oriented Agents: Research Directions and Challenges

M. Eskénazi

Tiancheng Zhao

LLMAG AI4TS AI4CE

222

10 Jun 2020

mEBAL: A Multimodal Database for Eye Blink Detection and Attention Level Estimation

Roberto Daza

Aythami Morales

Julian Fierrez

Ruben Tolosana

CVBM

180

09 Jun 2020

Hysia: Serving DNN-Based Video-to-Retail Applications in Cloud

114

09 Jun 2020

Large Scale Audiovisual Learning of Sounds with Weakly Labeled DataInternational Joint Conference on Artificial Intelligence (IJCAI), 2020

Haytham M. Fayek

Anurag Kumar

205

29 May 2020

Learning Tversky SimilarityInternational Conference on Information Processing and Management of Uncertainty (IPMU), 2020

J. Rahnama

Eyke Hüllermeier

116

27 May 2020

Should we hard-code the recurrence concept or learn it instead ? Exploring the Transformer architecture for Audio-Visual Speech Recognition

George Sterpu

Christian Saam

N. Harte

114

19 May 2020

Cross-Task Transfer for Geotagged Audiovisual Aerial Scene Recognition

166

18 May 2020

COBRA: Contrastive Bi-Modal Representation Algorithm

Vishaal Udandarao

A. Maiti

Deepak Srivatsav

Suryatej Reddy Vyalla

Yifang Yin

R. Shah

221

07 May 2020

Designing Accurate Emulators for Scientific Processes using Calibration-Driven Deep ModelsNature Communications (Nat Commun), 2020

Jayaraman J. Thiagarajan

220

05 May 2020

MultiQT: Multimodal Learning for Real-Time Question Tracking in SpeechAnnual Meeting of the Association for Computational Linguistics (ACL), 2020

Jakob Drachmann Havtorn

Nicolai Frost Jakobsen

R. Sdun

Zeljko Agic

135

02 May 2020

Multi-View Self-Attention for Interpretable Drug-Target Interaction PredictionJournal of Biomedical Informatics (JBI), 2020

Brighter Agyemang

Wei-Ping Wu

Michael Y. Kpiebaareh

Zhihua Lei

Ebenezer Nanor

Lei Chen

140

01 May 2020

Crisscrossed Captions: Extended Intramodal and Intermodal Semantic Similarity Judgments for MS-COCOConference of the European Chapter of the Association for Computational Linguistics (EACL), 2020

274

30 Apr 2020

Multimodal Routing: Improving Local and Global Interpretability of Multimodal Language Analysis

Louis-Philippe Morency

143

29 Apr 2020

Skeleton Focused Human Activity Recognition in RGB Video

Bruce X. B. Yu

Yan Liu

Keith C. C. Chan

202

29 Apr 2020

Computation on Sparse Neural Networks: an Inspiration for Future Hardware

314

24 Apr 2020

How to Teach DNNs to Pay Attention to the Visual Modality in Speech RecognitionIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2020

George Sterpu

Christian Saam

N. Harte

191

17 Apr 2020

Bias in Multimodal AI: Testbed for Fair Automatic Recruitment

Alejandro Peña

Ignacio Serna

Aythami Morales

Julian Fierrez

159

15 Apr 2020

Brain-inspired self-organization with cellular neuromorphic computing for multimodal unsupervised learning

Lyes Khacef

Laurent Rodriguez

Benoit Miramond

217

11 Apr 2020

Conditioned Source Separation for Music Instrument PerformancesIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2020

Olga Slizovskaia

G. Haro

E. Gómez

244

08 Apr 2020

Predicting the Popularity of Micro-videos with Multimodal Variational Encoder-Decoder FrameworkIEEE transactions on multimedia (TMM), 2020

Yaochen Zhu

Jiayi Xie

Zhenzhong Chen

28 Mar 2020

End-to-End Entity Classification on Multimodal Knowledge Graphs

152

25 Mar 2020

Emotions Don't Lie: An Audio-Visual Deepfake Detection Method Using Affective CuesACM Multimedia (ACM MM), 2020

415

306

14 Mar 2020

Adversarial Multimodal Representation Learning for Click-Through Rate PredictionThe Web Conference (WWW), 2020

Xiang Li

123

07 Mar 2020

Noise Estimation Using Density Estimation for Self-Supervised Multimodal LearningAAAI Conference on Artificial Intelligence (AAAI), 2020

327

130

06 Mar 2020

ASMD: an automatic framework for compiling multimodal datasets with audio and scores

Federico Simonetta

Stavros Ntalampiras

F. Avanzini

190

04 Mar 2020