NUWA-XL: Diffusion over Diffusion for eXtremely Long Video Generation

Annual Meeting of the Association for Computational Linguistics (ACL), 2023

22 March 2023

Fan Yang

Zicheng Liu

ArXiv (abs)PDF HTML HuggingFace (1 upvotes)

Papers citing "NUWA-XL: Diffusion over Diffusion for eXtremely Long Video Generation"

27 / 77 papers shown

FreeLong: Training-Free Long Video Generation with SpectralBlend Temporal AttentionNeural Information Processing Systems (NeurIPS), 2024

Yi Yang

311

29 Jul 2024

Unlearning Concepts from Text-to-Video Diffusion Models

Shiqi Liu

Yihua Tan

DiffM

225

19 Jul 2024

MimicMotion: High-Quality Human Motion Video Generation with Confidence-aware Pose Guidance

429

153

28 Jun 2024

Text Prompting for Multi-Concept Video Customization by Autoregressive Generation

232

22 May 2024

Video Diffusion Models: A Survey

340

06 May 2024

FlexiFilm: Long Video Generation with Flexible Conditions

223

29 Apr 2024

Predicting Long-horizon Futures by Conditioning on Geometry and Time

Tarasha Khurana

Deva Ramanan

AI4TS

213

17 Apr 2024

Frame by Familiar Frame: Understanding Replication in Video Diffusion Models

227

28 Mar 2024

Sora as a World Model? A Complete Survey on Text-to-Video Generation

Joseph Cho

Fachrina Dewi Puspitasari

Sheng Zheng

Jingyao Zheng

Noor Ul Eman

...

Caiyan Qin

Tae-Ho Kim

Choong Seon Hong

Yang Yang

Heng Tao Shen

EGVM VGen

284

08 Mar 2024

DreamFrame: Enhancing Video Understanding via Automatically Generated QA and Style-Consistent Keyframes

469

03 Mar 2024

Diffusion Model-Based Image Editing: A Survey

Yi Huang

Jiancheng Huang

Yifan Liu

Wei Xiong

Liangliang Cao

871

196

27 Feb 2024

Snap Video: Scaled Spatiotemporal Transformers for Text-to-Video Synthesis

...

340

22 Feb 2024

Using Left and Right Brains Together: Towards Vision and Language Planning

Jun Cen

276

16 Feb 2024

The Essential Role of Causality in Foundation World Models for Embodied AI

Chao Ma

...

Stefan Bauer

287

06 Feb 2024

Vlogger: Make Your Dream A VlogComputer Vision and Pattern Recognition (CVPR), 2024

Ziwei Liu

Yu Qiao

Yali Wang

VGen DiffM

147

17 Jan 2024

Generating Illustrated Instructions

286

07 Dec 2023

GPT4Motion: Scripting Physical Motions in Text-to-Video Generation via Blender-Oriented GPT Planning

Jiancheng Huang

Yifan Liu

Shifeng Chen

375

21 Nov 2023

Make Pixels Dance: High-Dynamic Video Generation

241

149

18 Nov 2023

SEINE: Short-to-Long Video Diffusion Model for Generative Transition and PredictionInternational Conference on Learning Representations (ICLR), 2023

Dahua Lin

Yu Qiao

Ziwei Liu

VGen DiffM

337

206

31 Oct 2023

Show-1: Marrying Pixel and Latent Diffusion Models for Text-to-Video GenerationInternational Journal of Computer Vision (IJCV), 2023

609

290

27 Sep 2023

VideoDirectorGPT: Consistent Multi-scene Video Generation via LLM-Guided Planning

440

111

26 Sep 2023

Hierarchical Masked 3D Diffusion Model for Video OutpaintingACM Multimedia (ACM MM), 2023

256

05 Sep 2023

AI-Generated Content (AIGC) for Various Data Modalities: A SurveyACM Computing Surveys (ACM Comput. Surv.), 2023

Lin Geng Foo

Hossein Rahmani

Jing Liu

746

27 Aug 2023

DragNUWA: Fine-grained Control in Video Generation by Integrating Text, Image, and Trajectory

Jian Liang

250

213

16 Aug 2023

AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific TuningInternational Conference on Learning Representations (ICLR), 2023

Yu Qiao

944

1,284

10 Jul 2023

Intelligent Grimm -- Open-ended Visual Storytelling via Latent Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2023

Chang-rui Liu

Haoning Wu

Yujie Zhong

295

01 Jun 2023

Text-driven Video PredictionACM Transactions on Multimedia Computing, Communications, and Applications (TOMCCAP) (TOMM), 2022

164

06 Oct 2022