Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2204.03458
Cited By

Video Diffusion Models

v1v2 (latest)

Video Diffusion Models

Neural Information Processing Systems (NeurIPS), 2022

7 April 2022

Alexey A. Gritsenko

Mohammad Norouzi

David J. Fleet

ArXiv (abs)PDF HTML HuggingFace (5 upvotes)

Papers citing "Video Diffusion Models"

50 / 1,556 papers shown

Human Activity Recognition using RGB-Event based Sensors: A Multi-modal Heat Conduction Model and A Benchmark Dataset

Human Activity Recognition using RGB-Event based Sensors: A Multi-modal Heat Conduction Model and A Benchmark Dataset

748

1

0

08 Apr 2025

FantasyTalking: Realistic Talking Portrait Generation via Coherent Motion Synthesis

FantasyTalking: Realistic Talking Portrait Generation via Coherent Motion Synthesis

286

56

0

07 Apr 2025

Can You Count to Nine? A Human Evaluation Benchmark for Counting Limits in Modern Text-to-Video Models

Can You Count to Nine? A Human Evaluation Benchmark for Counting Limits in Modern Text-to-Video Models

660

14

0

05 Apr 2025

Multi-identity Human Image Animation with Structural Video Diffusion

Multi-identity Human Image Animation with Structural Video Diffusion

331

7

0

05 Apr 2025

Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets

Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets

Benjamin Burchfiel

557

68

0

03 Apr 2025

MG-Gen: Single Image to Motion Graphics Generation

MG-Gen: Single Image to Motion Graphics Generation

Takahiro Shirakawa

Tomoyuki Suzuki

Takuto Narumoto

Daichi Haraguchi

695

0

0

03 Apr 2025

Autonomous Human-Robot Interaction via Operator Imitation

Autonomous Human-Robot Interaction via Operator Imitation

Georg Wiedebach

Michael A. Hopkins

314

2

0

03 Apr 2025

Comprehensive Relighting: Generalizable and Consistent Monocular Human Relighting and Harmonization

Comprehensive Relighting: Generalizable and Consistent Monocular Human Relighting and HarmonizationComputer Vision and Pattern Recognition (CVPR), 2025

Krishna Kumar Singh

...

Tuanfeng Y. Wang

359

5

0

03 Apr 2025

OmniCam: Unified Multimodal Video Generation via Camera Control

OmniCam: Unified Multimodal Video Generation via Camera Control

...

318

7

0

03 Apr 2025

Random Conditioning with Distillation for Data-Efficient Diffusion Model Compression

Random Conditioning with Distillation for Data-Efficient Diffusion Model CompressionComputer Vision and Pattern Recognition (CVPR), 2025

Paul Hongsuck Seo

379

1

0

02 Apr 2025

Enhanced Diffusion Sampling via Extrapolation with Multiple ODE Solutions

Enhanced Diffusion Sampling via Extrapolation with Multiple ODE SolutionsInternational Conference on Learning Representations (ICLR), 2025

213

3

0

02 Apr 2025

Hyperbolic Diffusion Recommender Model

Hyperbolic Diffusion Recommender ModelThe Web Conference (WWW), 2025

372

12

0

02 Apr 2025

FreSca: Scaling in Frequency Space Enhances Diffusion Models

FreSca: Scaling in Frequency Space Enhances Diffusion Models

284

1

0

02 Apr 2025

Domain Guidance: A Simple Transfer Approach for a Pre-trained Diffusion Model

Domain Guidance: A Simple Transfer Approach for a Pre-trained Diffusion ModelInternational Conference on Learning Representations (ICLR), 2025

Xiangcheng Zhang

306

4

0

02 Apr 2025

Can Test-Time Scaling Improve World Foundation Model?

Can Test-Time Scaling Improve World Foundation Model?

423

7

0

31 Mar 2025

MoCha: Towards Movie-Grade Talking Character Synthesis

MoCha: Towards Movie-Grade Talking Character Synthesis

...

837

24

0

30 Mar 2025

SketchVideo: Sketch-based Video Generation and Editing

SketchVideo: Sketch-based Video Generation and EditingComputer Vision and Pattern Recognition (CVPR), 2025

387

11

0

30 Mar 2025

Learning Coordinated Bimanual Manipulation Policies using State Diffusion and Inverse Dynamics Models

Learning Coordinated Bimanual Manipulation Policies using State Diffusion and Inverse Dynamics ModelsIEEE International Conference on Robotics and Automation (ICRA), 2025

Katherine Driggs-Campbell

429

9

0

30 Mar 2025

CoGen: 3D Consistent Video Generation via Adaptive Conditioning for Autonomous Driving

CoGen: 3D Consistent Video Generation via Adaptive Conditioning for Autonomous Driving

315

7

0

28 Mar 2025

EchoFlow: A Foundation Model for Cardiac Ultrasound Image and Video Generation

EchoFlow: A Foundation Model for Cardiac Ultrasound Image and Video Generation

Hadrien Reynaud

247

6

0

28 Mar 2025

Mono2Stereo: A Benchmark and Empirical Study for Stereo Conversion

Mono2Stereo: A Benchmark and Empirical Study for Stereo ConversionComputer Vision and Pattern Recognition (CVPR), 2025

258

3

0

28 Mar 2025

SyncSDE: A Probabilistic Framework for Diffusion Synchronization

SyncSDE: A Probabilistic Framework for Diffusion SynchronizationComputer Vision and Pattern Recognition (CVPR), 2025

514

1

0

27 Mar 2025

VideoMage: Multi-Subject and Motion Customization of Text-to-Video Diffusion Models

VideoMage: Multi-Subject and Motion Customization of Text-to-Video Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2025

366

11

0

27 Mar 2025

FB-4D: Spatial-Temporal Coherent Dynamic 3D Content Generation with Feature Banks

FB-4D: Spatial-Temporal Coherent Dynamic 3D Content Generation with Feature Banks

...

390

3

0

26 Mar 2025

Guiding Human-Object Interactions with Rich Geometry and Relations

Guiding Human-Object Interactions with Rich Geometry and RelationsComputer Vision and Pattern Recognition (CVPR), 2025

300

9

0

26 Mar 2025

VPO: Aligning Text-to-Video Generation Models with Prompt Optimization

VPO: Aligning Text-to-Video Generation Models with Prompt Optimization

...

345

16

0

26 Mar 2025

Unconditional Priors Matter! Improving Conditional Generation of Fine-Tuned Diffusion Models

Unconditional Priors Matter! Improving Conditional Generation of Fine-Tuned Diffusion Models

Prin Phunyaphibarn

592

6

0

26 Mar 2025

Free4D: Tuning-free 4D Scene Generation with Spatial-Temporal Consistency

Free4D: Tuning-free 4D Scene Generation with Spatial-Temporal Consistency

Longxiang Zhang

551

20

0

26 Mar 2025

Debiasing Kernel-Based Generative Models

Debiasing Kernel-Based Generative Models

402

0

0

26 Mar 2025

EfficientMT: Efficient Temporal Adaptation for Motion Transfer in Text-to-Video Diffusion Models

EfficientMT: Efficient Temporal Adaptation for Motion Transfer in Text-to-Video Diffusion Models

308

2

0

25 Mar 2025

ICE: Intrinsic Concept Extraction from a Single Image via Diffusion Models

ICE: Intrinsic Concept Extraction from a Single Image via Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2025

Fernando Julio Cendra

493

1

0

25 Mar 2025

FuXi-RTM: A Physics-Guided Prediction Framework with Radiative Transfer Modeling

FuXi-RTM: A Physics-Guided Prediction Framework with Radiative Transfer Modeling

359

2

0

25 Mar 2025

Long-Context Autoregressive Video Modeling with Next-Frame Prediction

Long-Context Autoregressive Video Modeling with Next-Frame Prediction

Mike Zheng Shou

611

84

0

25 Mar 2025

Reverse Prompt: Cracking the Recipe Inside Text-to-Image Generation

Reverse Prompt: Cracking the Recipe Inside Text-to-Image Generation

384

2

0

25 Mar 2025

AccVideo: Accelerating Video Diffusion Model with Synthetic Dataset

AccVideo: Accelerating Video Diffusion Model with Synthetic Dataset

331

9

0

25 Mar 2025

Target-Aware Video Diffusion Models

Target-Aware Video Diffusion Models

562

5

0

24 Mar 2025

EvAnimate: Event-conditioned Image-to-Video Generation for Human Animation

EvAnimate: Event-conditioned Image-to-Video Generation for Human Animation

398

3

0

24 Mar 2025

DiffusedWrinkles: A Diffusion-Based Model for Data-Driven Garment Animation

DiffusedWrinkles: A Diffusion-Based Model for Data-Driven Garment AnimationBritish Machine Vision Conference (BMVC), 2025

332

1

0

24 Mar 2025

LongDiff: Training-Free Long Video Generation in One Go

LongDiff: Training-Free Long Video Generation in One GoComputer Vision and Pattern Recognition (CVPR), 2025

Hossein Rahmani

333

6

0

23 Mar 2025

TransAnimate: Taming Layer Diffusion to Generate RGBA Video

TransAnimate: Taming Layer Diffusion to Generate RGBA Video

459

20

0

23 Mar 2025

Generating, Fast and Slow: Scalable Parallel Video Generation with Video Interface Networks

Generating, Fast and Slow: Scalable Parallel Video Generation with Video Interface Networks

Krishna Kumar Singh

453

1

0

21 Mar 2025

Enabling Versatile Controls for Video Diffusion Models

Enabling Versatile Controls for Video Diffusion Models

316

4

0

21 Mar 2025

Bezier Distillation

Bezier Distillation

171

0

0

20 Mar 2025

LaPIG: Cross-Modal Generation of Paired Thermal and Visible Facial Images

LaPIG: Cross-Modal Generation of Paired Thermal and Visible Facial Images

300

0

0

20 Mar 2025

VideoRFSplat: Direct Scene-Level Text-to-3D Gaussian Splatting Generation with Flexible Pose and Multi-View Joint Modeling

VideoRFSplat: Direct Scene-Level Text-to-3D Gaussian Splatting Generation with Flexible Pose and Multi-View Joint Modeling

455

11

0

20 Mar 2025

ScalingNoise: Scaling Inference-Time Search for Generating Infinite Videos

ScalingNoise: Scaling Inference-Time Search for Generating Infinite Videos

...

962

11

0

20 Mar 2025

MagicMotion: Controllable Video Generation with Dense-to-Sparse Trajectory Guidance

MagicMotion: Controllable Video Generation with Dense-to-Sparse Trajectory Guidance

503

28

0

20 Mar 2025

Text-Driven Diffusion Model for Sign Language Production

Text-Driven Diffusion Model for Sign Language Production

385

5

0

20 Mar 2025

SV4D 2.0: Enhancing Spatio-Temporal Consistency in Multi-View Video Diffusion for High-Quality 4D Generation

SV4D 2.0: Enhancing Spatio-Temporal Consistency in Multi-View Video Diffusion for High-Quality 4D Generation

Vikram S. Voleti

670

35

0

20 Mar 2025

Temporal Regularization Makes Your Video Generator Stronger

Temporal Regularization Makes Your Video Generator Stronger

Harold Haodong Chen

411

9

0

19 Mar 2025

1 2 3...8 9 10...30 31 32

Page 9 of 32

Pageof 32