v1v2 (latest)

VSEGAN: Visual Speech Enhancement Generative Adversarial Network

IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

4 February 2021

Papers citing "VSEGAN: Visual Speech Enhancement Generative Adversarial Network"

6 / 6 papers shown

AUREXA-SE: Audio-Visual Unified Representation Exchange Architecture with Cross-Attention and Squeezeformer for Speech Enhancement

Harshith Jai Surya Ganji

A. Rahaman

Harshvardhan Choudhary

Nasir Saleem

Amir Hussain

M. Tanveer

151

06 Oct 2025

Vision-Integrated High-Quality Neural Speech Coding

277

29 May 2025

Incorporating Ultrasound Tongue Images for Audio-Visual Speech Enhancement through Knowledge DistillationIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2023

Ruixin Zheng

Yang Ai

Zhenhua Ling

314

24 May 2023

LA-VocE: Low-SNR Audio-visual Speech Enhancement using Neural VocodersIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

251

20 Nov 2022

VoViT: Low Latency Graph-based Audio-Visual Voice Separation TransformerEuropean Conference on Computer Vision (ECCV), 2022

350

08 Mar 2022

Multi-layer Feature Fusion Convolution Network for Audio-visual Speech Enhancement

Xinmeng Xu

Jia Hao

261

15 Jan 2021