v1v2 (latest)

VocaLiST: An Audio-Visual Synchronisation Model for Lips and Voices

Interspeech (Interspeech), 2022

5 April 2022

Papers citing "VocaLiST: An Audio-Visual Synchronisation Model for Lips and Voices"

11 / 11 papers shown

SyncLipMAE: Contrastive Masked Pretraining for Audio-Visual Talking-Face Representation

190

11 Oct 2025

Mask-Free Audio-driven Talking Face Generation for Enhanced Visual Quality and Identity Preservation

246

28 Jul 2025

SyncFusion: Multimodal Onset-synchronized Video-to-Audio Foley SynthesisIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

Joshua D. Reiss

291

23 Oct 2023

GestSync: Determining who is speaking without a talking headBritish Machine Vision Conference (BMVC), 2023

Sindhu B. Hegde

Andrew Zisserman

210

08 Oct 2023

Speech inpainting: Context-based speech synthesis guided by videoInterspeech (Interspeech), 2023

319

01 Jun 2023

Laughing Matters: Introducing Laughing-Face Generation using Diffusion Models

Antoni Bigata Casademunt

Rodrigo Mira

Nikita Drobyshev

Konstantinos Vougioukas

Stavros Petridis

Maja Pantic

DiffM

288

15 May 2023

ModEFormer: Modality-Preserving Embedding for Audio-Video Synchronization using TransformersIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

Akash Gupta

Rohun Tripathi

Won-Kap Jang

283

21 Mar 2023

Talking Head Generation with Probabilistic Audio-to-Visual Diffusion PriorsIEEE International Conference on Computer Vision (ICCV), 2022

248

07 Dec 2022

Multimodal Transformer Distillation for Audio-Visual SynchronizationIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Haibin Wu

200

27 Oct 2022

Sparse in Space and Time: Audio-visual Synchronisation with Trainable SelectorsBritish Machine Vision Conference (BMVC), 2022

Vladimir E. Iashin

Weidi Xie

Esa Rahtu

Andrew Zisserman

182

13 Oct 2022

Deep Learning for Visual Speech Analysis: A SurveyIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

373

22 May 2022