v1v2 (latest)

Video Diffusion Models

Neural Information Processing Systems (NeurIPS), 2022

7 April 2022

David J. Fleet

ArXiv (abs)PDF HTML HuggingFace (5 upvotes)

Papers citing "Video Diffusion Models"

50 / 1,542 papers shown

Training-Free Multi-Style Fusion Through Reference-Based Adaptive Modulation

147

23 Sep 2025

OmniBridge: Unified Multimodal Understanding, Generation, and Retrieval via Latent Space Alignment

Teng Xiao

Zuchao Li

Lefei Zhang

187

23 Sep 2025

Text Slider: Efficient and Plug-and-Play Continuous Concept Control for Image/Video Synthesis via LoRA Adapters

135

23 Sep 2025

How Far are VLMs from Visual Spatial Intelligence? A Benchmark-Driven Perspective

...

324

23 Sep 2025

OmniInsert: Mask-Free Video Insertion of Any Reference via Diffusion Transformer Models

...

173

22 Sep 2025

DiffQ: Unified Parameter Initialization for Variational Quantum Algorithms via Diffusion Models

22 Sep 2025

VidCLearn: A Continual Learning Approach for Text-to-Video Generation

131

21 Sep 2025

$$\mathtt{M^3VIR}$: A Large-Scale Multi-Modality Multi-View Synthesized Benchmark Dataset for Image Restoration and Content Creation$

\mathtt{M^3VIR}

: A Large-Scale Multi-Modality Multi-View Synthesized Benchmark Dataset for Image Restoration and Content Creation

177

21 Sep 2025

Follow-Your-Emoji-Faster: Towards Efficient, Fine-Controllable, and Expressive Freestyle Portrait Animation

...

272

20 Sep 2025

SAMPO:Scale-wise Autoregression with Motion PrOmpt for generative world models

185

19 Sep 2025

OpenViGA: Video Generation for Automotive Driving Scenes by Streamlining and Fine-Tuning Open Source Models with Public Data

185

18 Sep 2025

Lightweight and Accurate Multi-View Stereo with Confidence-Aware Diffusion ModelIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025

206

18 Sep 2025

BWCache: Accelerating Video Diffusion Transformers through Block-Wise Caching

312

17 Sep 2025

Dense-Jump Flow Matching with Non-Uniform Time Scheduling for Robotic Policies: Mitigating Multi-Step Inference Degradation

105

16 Sep 2025

TeraSim-World: Worldwide Safety-Critical Data Synthesis for End-to-End Autonomous Driving

184

16 Sep 2025

Data-Efficient Ensemble Weather Forecasting with Diffusion Models

199

14 Sep 2025

Every Camera Effect, Every Time, All at Once: 4D Gaussian Ray Tracing for Physics-based Camera Effect Data Generation

193

13 Sep 2025

Automated Tuning for Diffusion Inverse Problem Solvers without Generative Prior Retraining

143

11 Sep 2025

Kling-Avatar: Grounding Multimodal Instructions for Cascaded Long-Duration Avatar Animation Synthesis

...

193

11 Sep 2025

GeneVA: A Dataset of Human Annotations for Generative Text to Video Artifacts

155

10 Sep 2025

Foundation Models for Autonomous Driving Perception: A Survey Through Core CapabilitiesIEEE Open Journal of Vehicular Technology (JOVT), 2025

Rajendramayavan Sathyam

Yueqi Li

VLM LRM

180

10 Sep 2025

UniVerse-1: Unified Audio-Video Generation via Stitching of Experts

145

07 Sep 2025

STADI: Fine-Grained Step-Patch Diffusion Parallelism for Heterogeneous GPUs

173

05 Sep 2025

Fitting Image Diffusion Models on Video Datasets

Juhun Lee

Simon S. Woo

VGen

104

04 Sep 2025

Scale-Adaptive Generative Flows for Multiscale Scientific Data

Yifan Chen

Eric Vanden-Eijnden

160

03 Sep 2025

Data-Dependent Smoothing for Protein Discovery with Walk-Jump Sampling

02 Sep 2025

Look Beyond: Two-Stage Scene View Generation via Panorama and Video Diffusion

127

31 Aug 2025

Visually Grounded Narratives: Reducing Cognitive Burden in Researcher-Participant Interaction

144

30 Aug 2025

Learning Primitive Embodied World Models: Towards Scalable Robotic Learning

...

416

28 Aug 2025

ControlEchoSynth: Boosting Ejection Fraction Estimation Models via Controlled Video Diffusion

126

25 Aug 2025

On the Edge of Memorization in Diffusion Models

279

25 Aug 2025

Seeing Clearly, Forgetting Deeply: Revisiting Fine-Tuned Video Generators for Driving Simulation

265

22 Aug 2025

On the Collapse Errors Induced by the Deterministic Sampler for Diffusion Models

189

22 Aug 2025

Scaling Group Inference for Diverse and High-Quality Generation

181

21 Aug 2025

Data Auctions for Retrieval Augmented Generation

188

21 Aug 2025

CineScale: Free Lunch in High-Resolution Cinematic Visual Generation

193

21 Aug 2025

MoVieDrive: Multi-Modal Multi-View Urban Scene Video Generation

133

20 Aug 2025

Ouroboros: Single-step Diffusion Models for Cycle-consistent Forward and Inverse Rendering

174

20 Aug 2025

InfiniteTalk: Audio-driven Video Generation for Sparse-Frame Video Dubbing

...

129

19 Aug 2025

4DNeX: Feed-Forward 4D Generative Modeling Made Easy

147

18 Aug 2025

Lumen: Consistent Video Relighting and Harmonious Background Replacement with Video Generative Models

190

18 Aug 2025

EgoTwin: Dreaming Body and View in First Person

160

18 Aug 2025

CTFlow: Video-Inspired Latent Flow Matching for 3D CT Synthesis

Jiayi Wang

Hadrien Reynaud

Franciskus Xaverius Erick

Bernhard Kainz

DiffM MedIm VGen

109

18 Aug 2025

GaitCrafter: Diffusion Model for Biometric Preserving Gait Synthesis

Sirshapan Mitra

Yogesh S Rawat

DiffM

165

18 Aug 2025

Navigating the Exploration-Exploitation Tradeoff in Inference-Time Scaling of Diffusion Models

167

17 Aug 2025

Projected Coupled Diffusion for Test-Time Constrained Joint Generation

216

14 Aug 2025

Diffusion is a code repair operator and generator

14 Aug 2025

Integrating Reinforcement Learning with Visual Generative Models: Foundations and Advances

334

14 Aug 2025

ToonComposer: Streamlining Cartoon Production with Generative Post-Keyframing

177

14 Aug 2025

GenFlowRL: Shaping Rewards with Generative Object-Centric Flow in Visual Reinforcement Learning

14 Aug 2025