v1v2 (latest)

Towards Accurate Generative Models of Video: A New Metric & Challenges

3 December 2018

Thomas Unterthiner

Sjoerd van Steenkiste

Papers citing "Towards Accurate Generative Models of Video: A New Metric & Challenges"

50 / 715 papers shown

LiDAR-BIND-T: Improved and Temporally Consistent Sensor Modality Translation and Fusion for Robotic Applications

293

06 Sep 2025

Human Motion Video Generation: A SurveyIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025

...

233

04 Sep 2025

O-DisCo-Edit: Object Distortion Control for Unified Realistic Video Editing

141

01 Sep 2025

Look Beyond: Two-Stage Scene View Generation via Panorama and Video Diffusion

127

31 Aug 2025

Attention of a Kiss: Exploring Attention Maps in Video Diffusion for XAIxArts

Adam Cole

Mick Grierson

VGen

165

30 Aug 2025

ManipDreamer3D : Synthesizing Plausible Robotic Manipulation Video with Occupancy-aware 3D Trajectory

351

29 Aug 2025

InfinityHuman: Towards Long-Term Audio-Driven Human

134

27 Aug 2025

Lightning Fast Caching-based Parallel Denoising Prediction for Accelerating Talking Head Generation

173

25 Aug 2025

GWM: Towards Scalable Gaussian World Models for Robotic Manipulation

203

25 Aug 2025

Seeing Clearly, Forgetting Deeply: Revisiting Fine-Tuned Video Generators for Driving Simulation

242

22 Aug 2025

CineScale: Free Lunch in High-Resolution Cinematic Visual Generation

166

21 Aug 2025

Diverse Signer Avatars with Manual and Non-Manual Feature Modelling for Sign Language Production

Mohamed Ilyes Lakhal

Richard Bowden

DiffM

151

21 Aug 2025

MoVieDrive: Multi-Modal Multi-View Urban Scene Video Generation

131

20 Aug 2025

TalkVid: A Large-Scale Diversified Dataset for Audio-Driven Talking Head Synthesis

...

120

19 Aug 2025

EgoTwin: Dreaming Body and View in First Person

154

18 Aug 2025

Versatile Video Tokenization with Generative 2D Gaussian Splatting

136

15 Aug 2025

Animate-X++: Universal Character Image Animation with Dynamic Backgrounds

260

13 Aug 2025

Preview WB-DH: Towards Whole Body Digital Human Bench for the Generation of Whole-body Talking Avatar Videos

12 Aug 2025

Omni-Effects: Unified and Spatially-Controllable Visual Effects Generation

340

11 Aug 2025

StableAvatar: Infinite-Length Audio-Driven Avatar Video Generation

164

11 Aug 2025

ShoulderShot: Generating Over-the-Shoulder Dialogue Videos

221

11 Aug 2025

PoseGen: In-Context LoRA Finetuning for Pose-Controllable Long Human Video Generation

118

07 Aug 2025

LayerT2V: Interactive Multi-Object Trajectory Layering for Video Generation

144

06 Aug 2025

Scaling Up Audio-Synchronized Visual Animation: An Efficient Training Paradigm

...

168

05 Aug 2025

QuaDreamer: Controllable Panoramic Video Generation for Quadruped Robots

251

04 Aug 2025

PoseGuard: Pose-Guided Generation with Safety Guardrails

04 Aug 2025

Text2Lip: Progressive Lip-Synced Talking Face Generation from Text via Viseme-Guided Rendering

117

04 Aug 2025

TITAN-Guide: Taming Inference-Time AligNment for Guided Text-to-Video Diffusion Models

130

01 Aug 2025

SpA2V: Harnessing Spatial Auditory Cues for Audio-driven Spatially-aware Video Generation

1.1K

01 Aug 2025

Compositional Video Synthesis by Temporal Object-Centric Learning

Adil Kaan Akan

Yucel Yemez

DiffM OCL

234

28 Jul 2025

JWB-DH-V1: Benchmark for Joint Whole-Body Talking Avatar and Speech Generation Version 1

215

28 Jul 2025

ChoreoMuse: Robust Music-to-Dance Video Generation with Style Transfer and Beat-Adherent Motion

Xuanchen Wang

Heng Wang

Weidong (Tom) Cai

225

26 Jul 2025

MVG4D: Image Matrix-Based Multi-View and Motion Generation for 4D Content Creation from a Single Image

271

24 Jul 2025

AirScape: An Aerial Generative World Model with Motion Controllability

...

173

10 Jul 2025

EchoMimicV3: 1.3B Parameters are All You Need for Unified Multi-Modal and Multi-Task Human Animation

284

05 Jul 2025

HumanGif: Single-View Human Diffusion with Generative Prior

526

01 Jul 2025

LatentMove: Towards Complex Human Movement Video Generation

275

01 Jul 2025

Adapting Vision-Language Models for Evaluating World Models

188

22 Jun 2025

Advanced Sign Language Video Generation with Compressed and Quantized Multi-Condition Tokenization

398

19 Jun 2025

STAGE: A Stream-Centric Generative World Model for Long-Horizon Driving-Scene Simulation

317

16 Jun 2025

Foundation Models in Autonomous Driving: A Survey on Scenario Generation and Scenario Analysis

...

347

13 Jun 2025

Rethinking Generative Human Video Coding with Implicit Motion Transformation

256

12 Jun 2025

HunyuanVideo-HOMA: Generic Human-Object Interaction in Multimodal Driven Human Animation

...

221

10 Jun 2025

From Pixels to Graphs: using Scene and Knowledge Graphs for HD-EPIC VQA Challenge

Agnese Taluzzi

Davide Gesualdi

Riccardo Santambrogio

290

10 Jun 2025

EgoM2P: Egocentric Multimodal Multitask Pretraining

408

09 Jun 2025

Audio-Sync Video Generation with Multi-Stream Temporal Control

205

09 Jun 2025

FEAT: Full-Dimensional Efficient Attention Transformer for Medical Video GenerationInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025

254

05 Jun 2025

DenseDPO: Fine-Grained Temporal Preference Optimization for Video Diffusion Models

389

04 Jun 2025

SG2VID: Scene Graphs Enable Fine-Grained Control for Video SynthesisInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025

Ssharvien Kumar Sivakumar

292

03 Jun 2025

CamCloneMaster: Enabling Reference-based Camera Control for Video Generation

205

03 Jun 2025