VisualVoice: Audio-Visual Speech Separation with Cross-Modal Consistency

8 January 2021

Papers citing "VisualVoice: Audio-Visual Speech Separation with Cross-Modal Consistency"

3 / 3 papers shown

Title
VisualEchoes: Spatial Image Representation Learning through Echolocation Ruohan Gao Changan Chen Ziad Al-Halah Carl Schissler Kristen Grauman MDE SSL 133 76 0 04 May 2020
Lipreading using Temporal Convolutional Networks Brais Martínez Pingchuan Ma Stavros Petridis M. Pantic 145 211 0 23 Jan 2020
VoxCeleb2: Deep Speaker Recognition Joon Son Chung Arsha Nagrani Andrew Zisserman 192 1,954 0 14 Jun 2018