v1v2 (latest)

Video Diffusion Models

Neural Information Processing Systems (NeurIPS), 2022

7 April 2022

David J. Fleet

ArXiv (abs)PDF HTML HuggingFace (5 upvotes)

Papers citing "Video Diffusion Models"

50 / 1,543 papers shown

SVAD: From Single Image to 3D Avatar via Synthetic Data Generation with Video Diffusion and Data Augmentation

Yonwoo Choi

3DGS VGen

291

08 May 2025

T2VTextBench: A Human Evaluation Benchmark for Textual Control in Video Generation Models

1.1K

08 May 2025

DualReal: Adaptive Joint Training for Lossless Identity-Motion Fusion in Video Customization

438

04 May 2025

VIDSTAMP: A Temporally-Aware Watermark for Ownership and Integrity in Video Diffusion Models

Mohammadreza Teymoorianfard

485

02 May 2025

FreePCA: Integrating Consistency Information across Long-short Frames in Training-free Long Video Generation via Principal Component AnalysisComputer Vision and Pattern Recognition (CVPR), 2025

338

02 May 2025

KeySync: A Robust Approach for Leakage-free Lip Synchronization in High Resolution

Konstantinos Vougioukas

Stavros Petridis

Maja Pantic

341

01 May 2025

T2VPhysBench: A First-Principles Benchmark for Physical Consistency in Text-to-Video Generation

488

01 May 2025

A Survey of Interactive Generative Video

435

30 Apr 2025

ReVision: Refining Video Diffusion with Explicit 3D Motion Modeling

515

30 Apr 2025

Direct Motion Models for Assessing Generated Videos

...

Sjoerd van Steenkiste

EGVM DiffM VGen

491

30 Apr 2025

ADiff4TPP: Asynchronous Diffusion Models for Temporal Point Processes

277

29 Apr 2025

AnimateAnywhere: Rouse the Background in Human Image Animation

384

28 Apr 2025

Global Stress Generation and Spatiotemporal Super-Resolution Physics-Informed Operator under Dynamic Loading for Two-Phase Random Materials

315

26 Apr 2025

Stealing Creator's Workflow: A Creator-Inspired Agentic Framework with Iterative Feedback Loop for Improved Scientific Short-form Generation

314

26 Apr 2025

We'll Fix it in Post: Improving Text-to-Video Generation with Neuro-Symbolic Feedback

425

24 Apr 2025

Synthetic Power Flow Data Generation Using Physics-Informed Denoising Diffusion Probabilistic Models

Junfei Wang

Darshana Upadhyay

Marzia Zaman

Pirathayini Srikantha

DiffM

169

24 Apr 2025

DIVE: Inverting Conditional Diffusion Models for Discriminative TasksIEEE transactions on multimedia (TMM), 2025

327

24 Apr 2025

VideoMark: A Distortion-Free Robust Watermarking Framework for Video Diffusion Models

510

23 Apr 2025

PMG: Progressive Motion Generation via Sparse Anchor Postures Curriculum Learning

Yingjie Xi

Jiangning Zhang

Xiaosong Yang

298

23 Apr 2025

DriVerse: Navigation World Model for Driving Simulation via Multimodal Trajectory Prompting and Motion Alignment

410

22 Apr 2025

T2VShield: Model-Agnostic Jailbreak Defense for Text-to-Video Models

377

22 Apr 2025

DRAGON: Distributional Rewards Optimize Diffusion Generative Models

500

21 Apr 2025

DC4CR: When Cloud Removal Meets Diffusion Control in Remote Sensing

Zhenyu Yu

Mohd Yamani Idna Idris

Pei Wang

DiffM

275

21 Apr 2025

Emergence and Evolution of Interpretable Concepts in Diffusion Models

285

21 Apr 2025

MirrorVerse: Pushing Diffusion Models to Realistically Reflect the WorldComputer Vision and Pattern Recognition (CVPR), 2025

Tao Lu

Manan Shah

R. V. Babu

299

21 Apr 2025

Solving New Tasks by Adapting Internet Video KnowledgeInternational Conference on Learning Representations (ICLR), 2025

242

21 Apr 2025

FlowLoss: Dynamic Flow-Conditioned Loss Strategy for Video Diffusion Models

367

20 Apr 2025

Entropic Time Schedulers for Generative Diffusion Models

Dejan Stancevic

Luca Ambrogioni

DiffM OOD

344

18 Apr 2025

SkyReels-V2: Infinite-length Film Generative Model

...

517

17 Apr 2025

The Devil is in the Prompts: Retrieval-Augmented Prompt Optimization for Text-to-Video GenerationComputer Vision and Pattern Recognition (CVPR), 2025

496

16 Apr 2025

LANGTRAJ: Diffusion Model and Dataset for Language-Conditioned Trajectory Simulation

520

15 Apr 2025

OmniVDiff: Omni Controllable Video Diffusion for Generation and Understanding

607

15 Apr 2025

Analysis of Attention in Video Diffusion Transformers

281

14 Apr 2025

On Equivariance and Fast Sampling in Video Diffusion Models Trained with Warped Noise

Chao Liu

Arash Vahdat

DiffM VGen

402

14 Apr 2025

Scalable Motion In-betweening via Diffusion and Physics-Based Character Adaptation

Jia Qin

DiffM VGen

236

13 Apr 2025

KeyVID: Keyframe-Aware Video Diffusion for Audio-Synchronized Visual Animation

283

13 Apr 2025

Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model

...

580

11 Apr 2025

TokenMotion: Decoupled Motion Control via Token Disentanglement for Human-centric Video GenerationComputer Vision and Pattern Recognition (CVPR), 2025

289

11 Apr 2025

Discriminator-Free Direct Preference Optimization for Video Diffusion

853

11 Apr 2025

Geo4D: Leveraging Video Generators for Geometric 4D Scene Reconstruction

442

10 Apr 2025

Beyond the Frame: Generating 360° Panoramic Videos from Perspective Videos

425

10 Apr 2025

IGG: Image Generation Informed by Geodesic Dynamics in Deformation SpacesInformation Processing in Medical Imaging (IPMI), 2025

352

09 Apr 2025

EIDT-V: Exploiting Intersections in Diffusion Trajectories for Model-Agnostic, Zero-Shot, Training-Free Text-to-Video GenerationComputer Vision and Pattern Recognition (CVPR), 2025

148

09 Apr 2025

Human Activity Recognition using RGB-Event based Sensors: A Multi-modal Heat Conduction Model and A Benchmark Dataset

713

08 Apr 2025

FantasyTalking: Realistic Talking Portrait Generation via Coherent Motion Synthesis

216

07 Apr 2025

Multi-identity Human Image Animation with Structural Video Diffusion

267

05 Apr 2025

Can You Count to Nine? A Human Evaluation Benchmark for Counting Limits in Modern Text-to-Video Models

508

05 Apr 2025

Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets

505

03 Apr 2025

MG-Gen: Single Image to Motion Graphics Generation

623

03 Apr 2025

Comprehensive Relighting: Generalizable and Consistent Monocular Human Relighting and HarmonizationComputer Vision and Pattern Recognition (CVPR), 2025

...

315

03 Apr 2025