Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2204.03458
Cited By

Video Diffusion Models

v1v2 (latest)

Video Diffusion Models

Neural Information Processing Systems (NeurIPS), 2022

7 April 2022

Alexey A. Gritsenko

Mohammad Norouzi

David J. Fleet

ArXiv (abs)PDF HTML HuggingFace (5 upvotes)

Papers citing "Video Diffusion Models"

50 / 1,539 papers shown

Preacher: Paper-to-Video Agentic System

Preacher: Paper-to-Video Agentic System

455

2

0

13 Aug 2025

OneVAE: Joint Discrete and Continuous Optimization Helps Discrete Video VAE Train Better

OneVAE: Joint Discrete and Continuous Optimization Helps Discrete Video VAE Train Better

...

Ming-Ming Cheng

204

1

0

13 Aug 2025

Towards Safe Imitation Learning via Potential Field-Guided Flow Matching

Towards Safe Imitation Learning via Potential Field-Guided Flow Matching

Noémie Jaquier

Yoshihiko Nakamura

140

0

0

12 Aug 2025

Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models

Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models

208

15

0

12 Aug 2025

Preview WB-DH: Towards Whole Body Digital Human Bench for the Generation of Whole-body Talking Avatar Videos

92

0

0

12 Aug 2025

DiffPose-Animal: A Language-Conditioned Diffusion Framework for Animal Pose Estimation

DiffPose-Animal: A Language-Conditioned Diffusion Framework for Animal Pose Estimation

149

0

0

12 Aug 2025

CD-TVD: Contrastive Diffusion for 3D Super-Resolution with Scarce High-Resolution Time-Varying Data

CD-TVD: Contrastive Diffusion for 3D Super-Resolution with Scarce High-Resolution Time-Varying Data

167

1

0

11 Aug 2025

LaVieID: Local Autoregressive Diffusion Transformers for Identity-Preserving Video Creation

LaVieID: Local Autoregressive Diffusion Transformers for Identity-Preserving Video Creation

145

2

0

11 Aug 2025

Learning an Implicit Physics Model for Image-based Fluid Simulation

Learning an Implicit Physics Model for Image-based Fluid Simulation

Emily Yue-Ting Jia

79

0

0

11 Aug 2025

S^2VG: 3D Stereoscopic and Spatial Video Generation via Denoising Frame Matrix

S^2VG: 3D Stereoscopic and Spatial Video Generation via Denoising Frame Matrix

137

0

0

11 Aug 2025

CObL: Toward Zero-Shot Ordinal Layering without User Prompting

CObL: Toward Zero-Shot Ordinal Layering without User Prompting

Todd E. Zickler

124

0

0

11 Aug 2025

Consistent and Controllable Image Animation with Motion Linear Diffusion Transformers

Consistent and Controllable Image Animation with Motion Linear Diffusion Transformers

160

0

0

10 Aug 2025

Genie Envisioner: A Unified World Foundation Platform for Robotic Manipulation

Genie Envisioner: A Unified World Foundation Platform for Robotic Manipulation

...

282

24

0

07 Aug 2025

Intention Enhanced Diffusion Model for Multimodal Pedestrian Trajectory Prediction

Intention Enhanced Diffusion Model for Multimodal Pedestrian Trajectory Prediction

72

1

0

06 Aug 2025

LayerT2V: Interactive Multi-Object Trajectory Layering for Video Generation

LayerT2V: Interactive Multi-Object Trajectory Layering for Video Generation

144

0

0

06 Aug 2025

Macro-from-Micro Planning for High-Quality and Parallelized Autoregressive Long Video Generation

Macro-from-Micro Planning for High-Quality and Parallelized Autoregressive Long Video Generation

...

202

5

0

05 Aug 2025

Fine-Tuning Text-to-Speech Diffusion Models Using Reinforcement Learning with Human Feedback

Fine-Tuning Text-to-Speech Diffusion Models Using Reinforcement Learning with Human Feedback

Andrew Perrault

105

1

0

05 Aug 2025

Towards Immersive Human-X Interaction: A Real-Time Framework for Physically Plausible Motion Synthesis

Towards Immersive Human-X Interaction: A Real-Time Framework for Physically Plausible Motion Synthesis

155

5

0

04 Aug 2025

Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference

Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference

...

164

66

0

04 Aug 2025

QuaDreamer: Controllable Panoramic Video Generation for Quadruped Robots

QuaDreamer: Controllable Panoramic Video Generation for Quadruped Robots

254

1

0

04 Aug 2025

DisCo3D: Distilling Multi-View Consistency for 3D Scene Editing

DisCo3D: Distilling Multi-View Consistency for 3D Scene Editing

139

2

0

03 Aug 2025

DBLP: Noise Bridge Consistency Distillation For Efficient And Reliable Adversarial Purification

DBLP: Noise Bridge Consistency Distillation For Efficient And Reliable Adversarial Purification

Belal Alsinglawi

167

0

0

01 Aug 2025

Unraveling Hidden Representations: A Multi-Modal Layer Analysis for Better Synthetic Content Forensics

Unraveling Hidden Representations: A Multi-Modal Layer Analysis for Better Synthetic Content Forensics

188

1

0

01 Aug 2025

GuidPaint: Class-Guided Image Inpainting with Diffusion Models

GuidPaint: Class-Guided Image Inpainting with Diffusion Models

234

0

0

29 Jul 2025

Reconstructing 4D Spatial Intelligence: A Survey

Reconstructing 4D Spatial Intelligence: A Survey

...

351

8

0

28 Jul 2025

JWB-DH-V1: Benchmark for Joint Whole-Body Talking Avatar and Speech Generation Version 1

221

0

0

28 Jul 2025

Compositional Video Synthesis by Temporal Object-Centric Learning

Compositional Video Synthesis by Temporal Object-Centric Learning

234

0

0

28 Jul 2025

MagicAnime: A Hierarchically Annotated, Multimodal and Multitasking Dataset with Benchmarks for Cartoon Animation Generation

MagicAnime: A Hierarchically Annotated, Multimodal and Multitasking Dataset with Benchmarks for Cartoon Animation Generation

171

1

0

27 Jul 2025

SonicGauss: Position-Aware Physical Sound Synthesis for 3D Gaussian Representations

SonicGauss: Position-Aware Physical Sound Synthesis for 3D Gaussian Representations

115

1

0

26 Jul 2025

ChoreoMuse: Robust Music-to-Dance Video Generation with Style Transfer and Beat-Adherent Motion

ChoreoMuse: Robust Music-to-Dance Video Generation with Style Transfer and Beat-Adherent Motion

Weidong (Tom) Cai

226

3

0

26 Jul 2025

HumanSAM: Classifying Human-centric Forgery Videos in Human Spatial, Appearance, and Motion Anomaly

HumanSAM: Classifying Human-centric Forgery Videos in Human Spatial, Appearance, and Motion Anomaly

253

2

0

26 Jul 2025

A Comprehensive Review of Diffusion Models in Smart Agriculture: Progress, Applications, and Challenges

A Comprehensive Review of Diffusion Models in Smart Agriculture: Progress, Applications, and Challenges

432

2

0

24 Jul 2025

Unmasking Synthetic Realities in Generative AI: A Comprehensive Review of Adversarially Robust Deepfake Detection Systems

Unmasking Synthetic Realities in Generative AI: A Comprehensive Review of Adversarially Robust Deepfake Detection Systems

218

3

0

24 Jul 2025

Captain Cinema: Towards Short Movie Generation

Captain Cinema: Towards Short Movie Generation

Gordon Wetzstein

Maneesh Agrawala

178

20

0

24 Jul 2025

Improving Multislice Electron Ptychography with a Generative Prior

Improving Multislice Electron Ptychography with a Generative Prior

Christian K. Belardi

Justin Lovelace

Kilian Q. Weinberger

David A. Muller

Daniel Schwalbe-Koda

294

3

0

23 Jul 2025

An h-space Based Adversarial Attack for Protection Against Few-shot Personalization

Muhammad Atif Butt

Bogdan Raducanu

153

0

0

23 Jul 2025

Sparse-View 3D Reconstruction: Recent Advances and Open Challenges

Sparse-View 3D Reconstruction: Recent Advances and Open Challenges

201

1

0

22 Jul 2025

PUSA V1.0: Surpassing Wan-I2V with $500 Training Cost by Vectorized Timestep Adaptation

PUSA V1.0: Surpassing Wan-I2V with $500 Training Cost by Vectorized Timestep Adaptation

...

Raymond H. F. Chan

Jean-Michel Morel

189

1

0

22 Jul 2025

CHORDS: Diffusion Sampling Accelerator with Multi-core Hierarchical ODE Solvers

CHORDS: Diffusion Sampling Accelerator with Multi-core Hierarchical ODE Solvers

216

0

0

21 Jul 2025

Distilling Parallel Gradients for Fast ODE Solvers of Diffusion Models

Distilling Parallel Gradients for Fast ODE Solvers of Diffusion Models

143

4

0

20 Jul 2025

Light Future: Multimodal Action Frame Prediction via InstructPix2Pix

Light Future: Multimodal Action Frame Prediction via InstructPix2Pix

268

0

0

20 Jul 2025

Advances in Feed-Forward 3D Reconstruction and View Synthesis: A Survey

Advances in Feed-Forward 3D Reconstruction and View Synthesis: A Survey

...

Hanspeter Pfister

Fangneng Zhan

638

8

0

19 Jul 2025

VITA: Vision-to-Action Flow Matching Policy

VITA: Vision-to-Action Flow Matching Policy

214

3

0

17 Jul 2025

RODS: Robust Optimization Inspired Diffusion Sampling for Detecting and Reducing Hallucination in Generative Models

RODS: Robust Optimization Inspired Diffusion Sampling for Detecting and Reducing Hallucination in Generative Models

154

0

0

16 Jul 2025

Contrastive Conditional-Unconditional Alignment for Long-tailed Diffusion Model

Contrastive Conditional-Unconditional Alignment for Long-tailed Diffusion Model

164

1

0

11 Jul 2025

Beyond Scores: Proximal Diffusion Models

Beyond Scores: Proximal Diffusion Models

147

2

0

11 Jul 2025

Inference-Time Scaling of Diffusion Language Models with Particle Gibbs Sampling

Inference-Time Scaling of Diffusion Language Models with Particle Gibbs Sampling

Akash Srivastava

116

7

0

11 Jul 2025

Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers

Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers

203

5

0

11 Jul 2025

Identity-Preserving Text-to-Video Generation Guided by Simple yet Effective Spatial-Temporal Decoupled Representations

Identity-Preserving Text-to-Video Generation Guided by Simple yet Effective Spatial-Temporal Decoupled Representations

294

2

0

07 Jul 2025

Discrete Diffusion Trajectory Alignment via Stepwise Decomposition

Discrete Diffusion Trajectory Alignment via Stepwise Decomposition

181

4

0

07 Jul 2025

1 2 3 4 5 6...29 30 31