DragNUWA: Fine-grained Control in Video Generation by Integrating Text, Image, and Trajectory

16 August 2023

Jian Liang

ArXiv (abs)PDF HTML HuggingFace (22 upvotes)Github

Papers citing "DragNUWA: Fine-grained Control in Video Generation by Integrating Text, Image, and Trajectory"

50 / 147 papers shown

BulletTime: Decoupled Control of Time and Camera Pose for Video Generation

252

04 Dec 2025

Generative Video Motion Editing with 3D Point Tracks

357

01 Dec 2025

DisMo: Disentangled Motion Representations for Open-World Motion Transfer

147

28 Nov 2025

Motion Marionette: Rethinking Rigid Motion Transfer via Prior Guidance

229

25 Nov 2025

MotionV2V: Editing Motion in a Video

312

25 Nov 2025

Point-to-Point: Sparse Motion Guidance for Controllable Video Editing

131

23 Nov 2025

Generative Augmented Reality: Paradigms, Technologies, and Future Applications

214

20 Nov 2025

Generative Photographic Control for Scene-Consistent Video Cinematic Editing

...

234

17 Nov 2025

Diff4Splat: Controllable 4D Scene Generation with Latent Dynamic Reconstruction Models

...

223

01 Nov 2025

World-in-World: World Models in a Closed-Loop World

...

322

20 Oct 2025

Generalized Dynamics Generation towards Scannable Physical World Model

174

16 Oct 2025

STANCE: Motion Coherent Video Generation Via Sparse-to-Dense Anchored Encoding

244

16 Oct 2025

What If : Understanding Motion Through Sparse Interactions

188

14 Oct 2025

Real-Time Motion-Controllable Autoregressive Video Diffusion

278

09 Oct 2025

An approach for systematic decomposition of complex llm tasks

237

09 Oct 2025

FlexTraj: Image-to-Video Generation with Flexible Point Trajectory Control

290

09 Oct 2025

MultiCOIN: Multi-Modal COntrollable Video INbetweening

229

09 Oct 2025

UniVerse: Unleashing the Scene Prior of Video Diffusion Models for Robust Radiance Field Reconstruction

196

02 Oct 2025

ASTRA: Let Arbitrary Subjects Transform in Video Editing

Maocheng Zhao

184

01 Oct 2025

Drag4D: Align Your Motion with Text-Driven 3D Scene Generation

177

26 Sep 2025

NewtonGen: Physics-Consistent and Controllable Text-to-Video Generation via Neural Newtonian Dynamics

Yu Yuan

Xijun Wang

Tharindu Wickremasinghe

1.6K

25 Sep 2025

SpatialVID: A Large-Scale Video Dataset with Spatial Annotations

...

445

11 Sep 2025

Zo3T: Zero-Shot 3D-Aware Trajectory-Guided Image-to-Video Generation via Test-Time Training

418

08 Sep 2025

O-DisCo-Edit: Object Distortion Control for Unified Realistic Video Editing

200

01 Sep 2025

Precise Action-to-Video Generation Through Visual Action Prompts

177

18 Aug 2025

RealisMotion: Decomposed Human Motion Control and Video Generation in the World Space

203

12 Aug 2025

LayerT2V: A Unified Multi-Layer Video Generation Framework

Lei Zhang

Xiaohong Liu

DiffM VGen

195

06 Aug 2025

QuaDreamer: Controllable Panoramic Video Generation for Quadruped Robots

322

04 Aug 2025

TransFlow: Motion Knowledge Transfer from Video Diffusion Models to Video Salient Object Detection

154

26 Jul 2025

T2VWorldBench: A Benchmark for Evaluating World Knowledge in Text-to-Video Generation

803

24 Jul 2025

Bridging Perspectives: A Survey on Cross-view Collaborative Intelligence with Egocentric-Exocentric Vision

567

06 Jun 2025

EX-4D: EXtreme Viewpoint 4D Video Synthesis via Depth Watertight Mesh

210

05 Jun 2025

Learning Video Generation for Robotic Manipulation with Collaborative Trajectory Control

376

02 Jun 2025

GeoDrive: 3D Geometry-Informed Driving World Model with Precise Action Control

404

28 May 2025

ATI: Any Trajectory Instruction for Controllable Video Generation

430

28 May 2025

Frame In-N-Out: Unbounded Controllable Image-to-Video Generation

452

27 May 2025

EF-VI: Enhancing End-Frame Injection for Video Inbetweening

399

27 May 2025

MotionPro: A Precise Motion Controller for Image-to-Video GenerationComputer Vision and Pattern Recognition (CVPR), 2025

437

26 May 2025

Force Prompting: Video Generation Models Can Learn and Generalize Physics-based Control Signals

519

26 May 2025

WonderPlay: Dynamic 3D Scene Generation from a Single Image and Actions

329

23 May 2025

FinePhys: Fine-grained Human Action Generation by Explicitly Incorporating Physical Laws for Effective Skeletal GuidanceComputer Vision and Pattern Recognition (CVPR), 2025

485

19 May 2025

RoPECraft: Training-Free Motion Transfer with Trajectory-Guided RoPE Optimization on Diffusion Transformers

Ahmet Berke Gokmen

Yigit Ekin

Bahri Batuhan Bilecen

Aysegül Dündar

942

19 May 2025

ProFashion: Prototype-guided Fashion Video Generation with Multiple Reference Images

327

10 May 2025

On Equivariance and Fast Sampling in Video Diffusion Models Trained with Warped Noise

Chao Liu

Arash Vahdat

DiffM VGen

464

14 Apr 2025

TokenMotion: Decoupled Motion Control via Token Disentanglement for Human-centric Video GenerationComputer Vision and Pattern Recognition (CVPR), 2025

336

11 Apr 2025

Training-free Guidance in Text-to-Video Generation via Multimodal Planning and Structured Noise Initialization

434

11 Apr 2025

PanoDreamer: Consistent Text to 360-Degree Scene Generation

347

07 Apr 2025

Multi-identity Human Image Animation with Structural Video Diffusion

340

05 Apr 2025

3D Scene Understanding Through Local Random Access Sequence Modeling

318

04 Apr 2025

ConMo: Controllable Motion Disentanglement and Recomposition for Zero-Shot Motion TransferComputer Vision and Pattern Recognition (CVPR), 2025

398

03 Apr 2025