v1v2v3 (latest)

MakeItTalk: Speaker-Aware Talking-Head Animation

27 April 2020

Papers citing "MakeItTalk: Speaker-Aware Talking-Head Animation"

50 / 258 papers shown

EmoCAST: Emotional Talking Portrait via Emotive Text Description

246

24 Dec 2025

EvalTalker: Learning to Evaluate Real-Portrait-Driven Multi-Subject Talking Humans

...

312

01 Dec 2025

AI killed the video star. Audio-driven diffusion model for expressive talking head generation

118

27 Nov 2025

Investigating self-supervised representations for audio-visual deepfake detection

Dragos-Alexandru Boldisor

365

21 Nov 2025

Is It Truly Necessary to Process and Fit Minutes-Long Reference Videos for Personalized Talking Face Generation?

491

11 Nov 2025

LiveNeRF: Efficient Face Replacement Through Neural Radiance Fields Integration

Tung Vu

Hai Nguyen

Cong Tran

118

10 Nov 2025

Learning Disentangled Speech- and Expression-Driven Blendshapes for 3D Talking Face Animation

146

29 Oct 2025

MAGIC-Talk: Motion-aware Audio-Driven Talking Face Generation with Customizable Identity Control

148

26 Oct 2025

Audio Driven Real-Time Facial Animation for Social Telepresence

193

01 Oct 2025

Human Motion Video Generation: A SurveyIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025

...

280

04 Sep 2025

MIDAS: Multimodal Interactive Digital-humAn Synthesis via Real-time Autoregressive Video Generation

...

289

26 Aug 2025

Warm Chat: Diffuse Emotion-aware Interactive Talking Head Avatar with Tree-Structured Guidance

254

25 Aug 2025

Audio2Face-3D: Audio-driven Realistic Facial Animation For Digital Avatars

347

22 Aug 2025

Taming Transformer for Emotion-Controllable Talking Face Generation

Ziqi Zhang

Cheng Deng

CVBM

196

20 Aug 2025

EDTalk++: Full Disentanglement for Controllable Talking Head Synthesis

Shuai Tan

Bin Ji

312

19 Aug 2025

RealTalk: Realistic Emotion-Aware Lifelike Talking-Head Synthesis

Wenqing Wang

Yun Fu

173

16 Aug 2025

Text2Lip: Progressive Lip-Synced Talking Face Generation from Text via Viseme-Guided Rendering

203

04 Aug 2025

X-Actor: Emotional and Expressive Long-Range Portrait Acting from Audio

...

202

04 Aug 2025

Who is a Better Talker: Subjective and Objective Quality Assessment for AI-Generated Talking Heads

31 Jul 2025

Mask-Free Audio-driven Talking Face Generation for Enhanced Visual Quality and Identity Preservation

258

28 Jul 2025

Silence is Golden: Leveraging Adversarial Examples to Nullify Audio Control in LDM-based Talking-Head GenerationComputer Vision and Pattern Recognition (CVPR), 2025

261

02 Jun 2025

FaceEditTalker: Controllable Talking Head Generation with Facial Attribute Editing

288

28 May 2025

CAD: A General Multimodal Framework for Video Deepfake Detection via Cross-Modal Alignment and Distillation

452

21 May 2025

Model See Model Do: Speech-Driven Facial Animation with Style Control

Yifang Pan

Karan Singh

Luiz Gustavo Hafemann

DiffM

377

02 May 2025

Disentangle Identity, Cooperate Emotion: Correlation-Aware Emotional Talking Portrait Generation

386

25 Apr 2025

Design Activity for Robot Faces: Evaluating Child Responses To Expressive Faces

10 Apr 2025

Exploiting Temporal Audio-Visual Correlation Embedding for Audio-Driven One-Shot Talking Head AnimationIEEE transactions on multimedia (TMM), 2025

235

08 Apr 2025

DiTaiListener: Controllable High Fidelity Listener Video Generation with Diffusion

369

05 Apr 2025

OmniTalker: One-shot Real-time Text-Driven Talking Audio-Video Generation With Multimodal Style Mimicking

Zhongjian Wang

Peng Zhang

Jinwei Qi

Guangyuan Wang Sheng Xu

460

03 Apr 2025

Monocular and Generalizable Gaussian Talking Head AnimationComputer Vision and Pattern Recognition (CVPR), 2025

259

01 Apr 2025

ChatAnyone: Stylized Real-time Portrait Video Generation with Hierarchical Motion Diffusion Model

275

27 Mar 2025

DisentTalk: Cross-lingual Talking Face Generation via Semantic Disentangled Diffusion Model

289

24 Mar 2025

Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion GenerationComputer Vision and Pattern Recognition (CVPR), 2025

362

24 Mar 2025

3D Engine-ready Photorealistic Avatars via Dynamic Textures

395

19 Mar 2025

Unlock Pose Diversity: Accurate and Efficient Implicit Keypoint-based Spatiotemporal Diffusion for Audio-driven Talking Portrait

340

17 Mar 2025

SyncDiff: Diffusion-based Talking Head Synthesis with Bottlenecked Temporal Visual Prior for Improved SynchronizationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2025

Mark Hasegawa-Johnson

DiffM

370

17 Mar 2025

Removing Averaging: Personalized Lip-Sync Driven Characters Based on Identity Adapter

428

09 Mar 2025

FREAK: Frequency-modulated High-fidelity and Real-time Audio-driven Talking Portrait SynthesisInternational Conference on Multimedia Retrieval (ICMR), 2025

Ziqi Ni

Ao Fu

Yi Zhou

489

06 Mar 2025

FLAP: Fully-controllable Audio-driven Portrait Video Generation through 3D head conditioned diffusion model

Lingzhou Mu

Baiji Liu

Ruonan Zhang

Guiming Mo

Jiawei Jin

Kai Zhang

Haozhi Huang

DiffM VGen

626

26 Feb 2025

Dimitra: Audio-driven Diffusion model for Expressive Talking Head Generation

339

24 Feb 2025

Emotion Recognition and Generation: A Comprehensive Review of Face, Speech, and Text Modalities

Rebecca Mobbs

Dimitrios Makris

Vasileios Argyriou

236

02 Feb 2025

Joint Learning of Depth and Appearance for Portrait Image Animation

392

15 Jan 2025

DEGSTalk: Decomposed Per-Embedding Gaussian Fields for Hair-Preserving Talking Face SynthesisIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2024

258

31 Dec 2024

FADA: Fast Diffusion Avatar Synthesis with Mixed-Supervised Multi-CFG DistillationComputer Vision and Pattern Recognition (CVPR), 2024

577

22 Dec 2024

INFP: Audio-Driven Interactive Head Generation in Dyadic ConversationsComputer Vision and Pattern Recognition (CVPR), 2024

281

05 Dec 2024

Stereo-Talker: Audio-driven 3D Human Synthesis with Prior-Guided Mixture-of-ExpertsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

Yebin Liu

358

31 Oct 2024

Takin-ADA: Emotion Controllable Audio-Driven Animation with Canonical and Landmark Loss Optimization

300

18 Oct 2024

DAWN: Dynamic Frame Avatar with Non-autoregressive Diffusion Framework for Talking Head Video GenerationInternational Conference on Learning Representations (ICLR), 2024

1.1K

17 Oct 2024

MimicTalk: Mimicking a personalized and expressive 3D talking face in minutesNeural Information Processing Systems (NeurIPS), 2024

Yi Ren

...

Zehan Wang

360

09 Oct 2024

EmoGene: Audio-Driven Emotional 3D Talking-Head GenerationIEEE International Conference on Automatic Face & Gesture Recognition (FG), 2024

Wenqing Wang

Yun Fu

VGen

411

07 Oct 2024