v1v2 (latest)

CAT4D: Create Anything in 4D with Multi-View Video Diffusion Models

Computer Vision and Pattern Recognition (CVPR), 2024

27 November 2024

ArXiv (abs)PDF HTML HuggingFace (58 upvotes)Github

Papers citing "CAT4D: Create Anything in 4D with Multi-View Video Diffusion Models"

50 / 62 papers shown

Joint 3D Geometry Reconstruction and Motion Generation for 4D Synthesis from a Single Image

311

04 Dec 2025

YingVideo-MV: Music-Driven Multi-Stage Video Generation

296

02 Dec 2025

ChronosObserver: Taming 4D World with Hyperspace Diffusion Sampling

214

01 Dec 2025

Generative Video Motion Editing with 3D Point Tracks

352

01 Dec 2025

RemedyGS: Defend 3D Gaussian Splatting against Computation Cost Attacks

27 Nov 2025

ReDirector: Creating Any-Length Video Retakes with Rotary Camera Encoding

290

25 Nov 2025

One4D: Unified 4D Generation and Reconstruction via Decoupled LoRA Control

212

24 Nov 2025

Generative Photographic Control for Scene-Consistent Video Cinematic Editing

...

233

17 Nov 2025

DIMO: Diverse 3D Motion Generation for Arbitrary Objects

214

10 Nov 2025

Gait Recognition via Collaborating Discriminative and Generative Diffusion Models

217

09 Nov 2025

MotionStream: Real-Time Video Generation with Interactive Motion Controls

480

03 Nov 2025

DynamicTree: Interactive Real Tree Animation via Sparse Voxel Spectrum

174

25 Oct 2025

From Volume Rendering to 3D Gaussian Splatting: Theory and Applications

273

20 Oct 2025

Skyfall-GS: Synthesizing Immersive 3D Urban Scenes from Satellite Imagery

370

17 Oct 2025

iMoWM: Taming Interactive Multi-Modal World Model for Robotic Manipulation

153

10 Oct 2025

A Scene is Worth a Thousand Features: Feed-Forward Camera Localization from a Collection of Image Features

220

01 Oct 2025

UniLat3D: Geometry-Appearance Unified Latents for Single-Stage 3D Generation

...

226

29 Sep 2025

PhysCtrl: Generative Physics for Controllable and Physics-Grounded Video Generation

725

24 Sep 2025

Lyra: Generative 3D Scene Reconstruction via Video Diffusion Model Self-Distillation

...

190

23 Sep 2025

T2Bs: Text-to-Character Blendshapes via Video Generation

...

267

12 Sep 2025

Scaling Transformer-Based Novel View Synthesis Models with Token Disentanglement and Synthetic Data

Nithin Gopalakrishnan Nair

126

08 Sep 2025

CausNVS: Autoregressive Multi-view Diffusion for Flexible 3D Novel View Synthesis

181

08 Sep 2025

LSD-3D: Large-Scale 3D Driving Scene Generation with Geometry Grounding

263

26 Aug 2025

Sketch3DVE: Sketch-based 3D-Aware Scene Video Editing

259

19 Aug 2025

4DNeX: Feed-Forward 4D Generative Modeling Made Easy

213

18 Aug 2025

ViPE: Video Pose Engine for 3D Geometric Perception

...

288

12 Aug 2025

Dream4D: Lifting Camera-Controlled I2V towards Spatiotemporally Consistent 4D Generation

196

11 Aug 2025

Macro-from-Micro Planning for High-Quality and Parallelized Autoregressive Long Video Generation

...

274

05 Aug 2025

Advances in Feed-Forward 3D Reconstruction and View Synthesis: A Survey

...

789

19 Jul 2025

Cameras as Relative Positional Encoding

313

14 Jul 2025

Voyaging into Perpetual Dynamic Scenes from a Single View

318

05 Jul 2025

Shape-for-Motion: Precise and Consistent Video Editing with 3D Proxy

238

27 Jun 2025

Emergent Temporal Correspondences from Video Diffusion Transformers

428

20 Jun 2025

Where and How to Perturb: On the Design of Perturbation Guidance in Diffusion and Flow Models

532

12 Jun 2025

4DGT: Learning a 4D Gaussian Transformer Using Real-World Monocular Videos

297

09 Jun 2025

Restereo: Diffusion stereo video generation and restoration

344

06 Jun 2025

WonderPlay: Dynamic 3D Scene Generation from a Single Image and Actions

329

23 May 2025

M2SVid: End-to-End Inpainting and Refinement for Monocular-to-Stereo Video Conversion

366

22 May 2025

SOAP: Style-Omniscient Animatable Portraits

1.1K

08 May 2025

Vivid4D: Improving 4D Reconstruction from Monocular Video by Video Inpainting

769

15 Apr 2025

GaussVideoDreamer: 3D Scene Generation with Video Diffusion and Inconsistency-Aware Gaussian Splatting

743

14 Apr 2025

In-2-4D: Inbetweening from Two Single-View Images to 4D Generation

525

11 Apr 2025

OmniCam: Unified Multimodal Video Generation via Camera Control

...

329

03 Apr 2025

Zero4D: Training-Free 4D Video Generation From Single Video Using Off-the-Shelf Video Diffusion

552

28 Mar 2025

Aether: Geometric-Aware Unified World Modeling

...

569

24 Mar 2025

SV4D 2.0: Enhancing Spatio-Temporal Consistency in Multi-View Video Diffusion for High-Quality 4D Generation

704

20 Mar 2025

Animating the Uncaptured: Humanoid Mesh Animation with Video Diffusion Models

Marc Benedí San Millán

Angela Dai

Matthias Nießner

DiffM

358

20 Mar 2025

Advances in 4D Generation: A Survey

628

18 Mar 2025

Bolt3D: Generating 3D Scenes in Seconds

Stanislaw Szymanowicz

Ricardo Martín Brualla

Jonathan T. Barron

Philipp Henzler

546

18 Mar 2025

SteerX: Creating Any Camera-Free 3D and 4D Scenes with Geometric Steering

511

15 Mar 2025