v1v2 (latest)

Audio-driven Talking Face Video Generation with Learning-based Personalized Head Pose

24 February 2020

Papers citing "Audio-driven Talking Face Video Generation with Learning-based Personalized Head Pose"

50 / 90 papers shown

Do You See What I Say? Generalizable Deepfake Detection based on Visual Speech Recognition

156

27 Nov 2025

Towards Generalizable Deepfake Detection via Forgery-aware Audio-Visual Adaptation: A Variational Bayesian Approach

229

24 Nov 2025

Referee: Reference-aware Audiovisual Deepfake Detection

Hyemin Boo

Eunsang Lee

Jiyoung Lee

142

31 Oct 2025

SpeechForensics: Audio-Visual Speech Representation Learning for Face Forgery DetectionNeural Information Processing Systems (NeurIPS), 2025

249

13 Aug 2025

Robust Deepfake Detection for Electronic Know Your Customer Systems Using Registered ImagesIEEE International Conference on Automatic Face & Gesture Recognition (FG), 2025

181

30 Jul 2025

JOLT3D: Joint Learning of Talking Heads and 3DMM Parameters with Application to Lip-Sync

295

28 Jul 2025

MemoryTalker: Personalized Speech-Driven 3D Facial Animation via Audio-Guided Stylization

Hyung Kyu Kim

Sangmin Lee

Hak Gu Kim

236

28 Jul 2025

Detecting Lip-Syncing Deepfakes: Vision Temporal Transformer for Analyzing Mouth Inconsistencies

Soumyya Kanti Datta

Shan Jia

Siwei Lyu

373

02 Apr 2025

Personalized Generation In Large Model Era: A SurveyAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

643

04 Mar 2025

InsTaG: Learning Personalized 3D Talking Head from Few-Second VideoComputer Vision and Pattern Recognition (CVPR), 2025

455

27 Feb 2025

Driving Towards Inclusion: A Systematic Review of AI-powered Accessibility Enhancements for People with Disability in Autonomous VehiclesIEEE Access (IEEE Access), 2024

393

10 Jan 2025

JoyVASA: Portrait and Animal Image Animation with Diffusion-Based Audio-Driven Facial Dynamics and Head Motion Generation

Pei Xie

553

14 Nov 2024

MimicTalk: Mimicking a personalized and expressive 3D talking face in minutesNeural Information Processing Systems (NeurIPS), 2024

Yi Ren

...

Zehan Wang

360

09 Oct 2024

A Comprehensive Survey with Critical Analysis for Deepfake Speech DetectionComputer Science Review (CSR), 2024

Lam Pham

Phat Lam

Dat Tran

Hieu Tang

Tin Nguyen

Alexander Schindler

Canh Vu

Alexander Polonsky

Canh Vu

720

23 Sep 2024

StyleTalk++: A Unified Framework for Controlling the Speaking Styles of Talking HeadsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

Suzhen Wang

Yifeng Ma

Yu Ding

Zhipeng Hu

Changjie Fan

Tangjie Lv

Zhidong Deng

Xin Yu

289

14 Sep 2024

S^3D-NeRF: Single-Shot Speech-Driven Neural Radiance Field for High Fidelity Talking Head SynthesisEuropean Conference on Computer Vision (ECCV), 2024

Dongze Li

Kang Zhao

Wei Wang

265

18 Aug 2024

Content and Style Aware Audio-Driven Facial AnimationBritish Machine Vision Conference (BMVC), 2024

417

13 Aug 2024

A Comprehensive Taxonomy and Analysis of Talking Head Synthesis: Techniques for Portrait Generation, Driving Mechanisms, and Editing

414

15 Jun 2024

AVFF: Audio-Visual Feature Fusion for Video Deepfake Detection

423

05 Jun 2024

Faces that Speak: Jointly Synthesising Talking Face and Speech from TextComputer Vision and Pattern Recognition (CVPR), 2024

Ji-Hoon Kim

Joon Son Chung

322

16 May 2024

Dyadic Interaction Modeling for Social Behavior GenerationEuropean Conference on Computer Vision (ECCV), 2024

440

14 Mar 2024

FlowVQTalker: High-Quality Emotional Talking Face Generation through Normalizing Flow and QuantizationComputer Vision and Pattern Recognition (CVPR), 2024

Shuai Tan

Bin Ji

Ye Pan

514

11 Mar 2024

Learning Dynamic Tetrahedra for High-Quality Talking Head Synthesis

Zicheng Zhang

Ruobing Zheng

Congying Han

Jingdong Chen

Ming Yang

243

27 Feb 2024

Exposing Lip-syncing Deepfakes from Mouth Inconsistencies

Soumyya Kanti Datta

Shan Jia

Siwei Lyu

317

18 Jan 2024

Real3D-Portrait: One-shot Realistic 3D Talking Portrait SynthesisInternational Conference on Learning Representations (ICLR), 2024

Tianyun Zhong

Jiaqi Yang

...

Xiang Yin

Zhou Zhao

366

16 Jan 2024

DreamTalk: When Expressive Talking Head Generation Meets Diffusion Probabilistic Models

447

15 Dec 2023

GSmoothFace: Generalized Smooth Talking Face Generation via Fine Grained 3D Face GuidanceIEEE Transactions on Visualization and Computer Graphics (TVCG), 2023

216

12 Dec 2023

GMTalker: Gaussian Mixture-based Audio-Driven Emotional Talking Video Portraits

Yibo Xia

Lizhen Wang

Xiang Deng

Xiaoyan Luo

Yunhong Wang

Yebin Liu

VGen

377

12 Dec 2023

R2-Talker: Realistic Real-Time Talking Head Synthesis with Hash Grid Landmarks Encoding and Progressive Multilayer Conditioning

280

09 Dec 2023

3DiFACE: Diffusion-based Speech-driven 3D Facial Animation and Editing

Balamurugan Thambiraja

336

01 Dec 2023

THInImg: Cross-modal Steganography for Presenting Talking Heads in ImagesIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

270

28 Nov 2023

OSM-Net: One-to-Many One-shot Talking Head Generation with Spontaneous Head Motions

201

28 Sep 2023

ReliTalk: Relightable Talking Portrait Generation from a Single VideoInternational Journal of Computer Vision (IJCV), 2023

Ziwei Liu

275

05 Sep 2023

RADIO: Reference-Agnostic Dubbing Video SynthesisIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

384

05 Sep 2023

Audio-Driven Dubbing for User Generated Contents via Style-Aware Semi-Parametric Synthesis

285

31 Aug 2023

A Survey on Deep Multi-modal Learning for Body Language Recognition and Generation

Fengji Ma

225

17 Aug 2023

Speech-Driven 3D Face Animation with Composite and Regional Facial MovementsACM Multimedia (ACM MM), 2023

Jia Jia

359

10 Aug 2023

UniBriVL: Robust Universal Representation and Generation of Audio Driven Diffusion Models

275

29 Jul 2023

MODA: Mapping-Once Audio-driven Portrait Animation with Dual AttentionsIEEE International Conference on Computer Vision (ICCV), 2023

Yunfei Liu

Lijian Lin

Fei Yu

Changyin Zhou

Yu Li

DiffM VGen

268

19 Jul 2023

A Comprehensive Multi-scale Approach for Speech and Dynamics Synchrony in Talking Head Generation

Louis Airale

Dominique Vaufreydaz

Xavier Alameda-Pineda

184

04 Jul 2023

Parametric Implicit Face Representation for Audio-Driven Facial ReenactmentComputer Vision and Pattern Recognition (CVPR), 2023

262

13 Jun 2023

IFaceUV: Intuitive Motion Facial Image Generation by Identity Preservation via UV map

180

08 Jun 2023

LPMM: Intuitive Pose Control for Neural Talking-Head Model via Landmark-Parameter Morphable Model

358

17 May 2023

StyleSync: High-Fidelity Generalized and Personalized Lip Sync in Style-based GeneratorComputer Vision and Pattern Recognition (CVPR), 2023

...

Errui Ding

Ziwei Liu

Jingdong Wang

310

112

09 May 2023

High-fidelity Generalized Emotional Talking Face Generation with Multi-modal Emotion Space LearningComputer Vision and Pattern Recognition (CVPR), 2023

Chengjie Wang

282

04 May 2023

GeneFace++: Generalized and Stable Real-Time Audio-Driven 3D Talking Face Generation

Rongjie Huang

Xiang Yin

Zhou Zhao

247

01 May 2023

Audio-Driven Talking Face Generation with Diverse yet Realistic Facial AnimationsPattern Recognition (Pattern Recogn.), 2023

253

18 Apr 2023

That's What I Said: Fully-Controllable Talking Face GenerationACM Multimedia (ACM MM), 2023

Joon Son Chung

318

06 Apr 2023

DAE-Talker: High Fidelity Speech-Driven Talking Face Generation with Diffusion AutoencoderACM Multimedia (ACM MM), 2023

Chenpeng Du

Qi Chen

Xie Chen

K. Yu

DiffM

506

30 Mar 2023

MusicFace: Music-driven Expressive Singing Face SynthesisComputational Visual Media (CVM), 2023

223

24 Mar 2023