Unpaired Image-to-Speech Synthesis with Multimodal Information Bottleneck

19 August 2019

Papers citing "Unpaired Image-to-Speech Synthesis with Multimodal Information Bottleneck"

7 / 7 papers shown

Title
Multimodal Information Bottleneck: Learning Minimal Sufficient Unimodal and Multimodal Representations Sijie Mai Ying Zeng Haifeng Hu 32 67 0 31 Oct 2022
SVGraph: Learning Semantic Graphs from Instructional Videos Madeline Chantry Schiappa Y. S. Rawat 17 4 0 16 Jul 2022
Variational Distillation for Multi-View Learning Xudong Tian Zhizhong Zhang Cong Wang Wensheng Zhang Yanyun Qu Lizhuang Ma Zongze Wu Yuan Xie Dacheng Tao 20 5 0 20 Jun 2022
COMPASS: Contrastive Multimodal Pretraining for Autonomous Systems Shuang Ma Sai H. Vemprala Wenshan Wang Jayesh K. Gupta Yale Song Daniel J. McDuff Ashish Kapoor SSL 24 9 0 20 Feb 2022
LatteGAN: Visually Guided Language Attention for Multi-Turn Text-Conditioned Image Manipulation Shoya Matsumori Yukikoko Abe Kosuke Shingyouchi K. Sugiura M. Imai 34 9 0 28 Dec 2021
Everything at Once -- Multi-modal Fusion Transformer for Video Retrieval Nina Shvetsova Brian Chen Andrew Rouditchenko Samuel Thomas Brian Kingsbury Rogerio Feris David F. Harwath James R. Glass Hilde Kuehne ViT 23 129 0 08 Dec 2021
Self-Supervised MultiModal Versatile Networks Jean-Baptiste Alayrac Adrià Recasens R. Schneider Relja Arandjelović Jason Ramapuram J. Fauw Lucas Smaira Sander Dieleman Andrew Zisserman SSL 40 371 0 29 Jun 2020