v1v2 (latest)

Towards Accurate Generative Models of Video: A New Metric & Challenges

3 December 2018

Thomas Unterthiner

Sjoerd van Steenkiste

Papers citing "Towards Accurate Generative Models of Video: A New Metric & Challenges"

50 / 715 papers shown

DreamForge: Motion-Aware Autoregressive Video Generation for Multi-View Driving Scenes

535

06 Sep 2024

SVP: Style-Enhanced Vivid Portrait Talking Head Diffusion Model

Weipeng Tan

Chuming Lin

Chengming Xu

Xiaozhong Ji

Junwei Zhu

Chengjie Wang

Yanwei Fu

DiffM

153

05 Sep 2024

OD-VAE: An Omni-dimensional Video Compressor for Improving Latent Video Diffusion Model

Xinhua Cheng

Li Yuan

DiffM

361

02 Sep 2024

Follow-Your-Canvas: Higher-Resolution Video Outpainting with Extensive Content Generation

Qifeng Chen

226

02 Sep 2024

DriveGenVLM: Real-world Video Generation for Vision Language Model based Autonomous Driving

Xuan Di

218

29 Aug 2024

GenRec: Unifying Video Generation and Recognition with Diffusion ModelsNeural Information Processing Systems (NeurIPS), 2024

Yu-Gang Jiang

336

27 Aug 2024

Empowering Sign Language Communication: Integrating Sentiment and Semantics for Facial Expression SynthesisComputers & graphics (CG), 2024

Erickson R. Nascimento

SLR

214

27 Aug 2024

TC-PDM: Temporally Consistent Patch Diffusion Models for Infrared-to-Visible Video Translation

Ian Reid

182

26 Aug 2024

SurGen: Text-Guided Diffusion Model for Surgical Video Generation

308

26 Aug 2024

K-Sort Arena: Efficient and Reliable Benchmarking for Generative Models via K-wise Human PreferencesComputer Vision and Pattern Recognition (CVPR), 2024

Kurt Keutzer

351

26 Aug 2024

E-Bench: Subjective-Aligned Benchmark Suite for Text-Driven Video Editing Quality Assessment

262

21 Aug 2024

TrackGo: A Flexible and Efficient Method for Controllable Video GenerationAAAI Conference on Artificial Intelligence (AAAI), 2024

551

21 Aug 2024

Factorized-Dreamer: Training A High-Quality Video Generator with Limited and Low-Quality Data

Lei Zhang

206

19 Aug 2024

Kubrick: Multimodal Agent Collaborations for Synthetic Video Generation

461

19 Aug 2024

Quality Assessment in the Era of Large Models: A Survey

Zicheng Zhang

Guangtao Zhai

344

17 Aug 2024

Benchmarking AIGC Video Quality Assessment: A Dataset and Unified Model

Zhichao Zhang

Xinyue Li

Wei Sun

Jun Jia

Xiongkuo Min

...

Guangtao Zhai

250

31 Jul 2024

Tora: Trajectory-oriented Diffusion Transformer for Video Generation

558

111

31 Jul 2024

Faster Image2Video Generation: A Closer Look at CLIP Image Embedding's Impact on Spatio-Temporal Cross-AttentionsIEEE Access (IEEE Access), 2024

256

27 Jul 2024

HumanVid: Demystifying Training Data for Camera-controllable Human Image Animation

...

Jing Tan

Dahua Lin

385

24 Jul 2024

SV4D: Dynamic 3D Content Generation with Multi-Frame and Multi-View Consistency

384

24 Jul 2024

Fréchet Video Motion Distance: A Metric for Evaluating Motion Consistency in Videos

331

23 Jul 2024

VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control

...

549

107

17 Jul 2024

QVD: Post-training Quantization for Video Diffusion Models

Jinyang Guo

Xianglong Liu

Shengxi Li

Hao Yang

Tao Xie

VGen MQ

280

16 Jul 2024

IDOL: Unified Dual-Modal Latent Diffusion for Human-Centric Joint Video-Depth Generation

Zicheng Liu

241

15 Jul 2024

Towards Robust Event-based Networks for Nighttime via Unpaired Day-to-Night Event Translation

Yuhwan Jeong

Hoonhee Cho

Kuk-Jin Yoon

DiffM

202

15 Jul 2024

Kinetic Typography Diffusion Model

298

15 Jul 2024

TCAN: Animating Human Images with Temporally Consistent Pose Guidance using Diffusion Models

Min-Jung Kim

204

12 Jul 2024

A Comprehensive Survey on Human Video Generation: Challenges, Methods, and Insights

Wentao Lei

289

11 Jul 2024

PredBench: Benchmarking Spatio-Temporal Prediction across Diverse Disciplines

Tong He

239

11 Jul 2024

Controlling Space and Time with Diffusion Models

458

10 Jul 2024

Video In-context Learning: Autoregressive Transformers are Zero-Shot Video Imitators

Li Zhao

340

10 Jul 2024

MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions

Xuan Ju

Xintao Wang

291

104

08 Jul 2024

VIMI: Grounding Video Generation through Multi-modal Instruction

332

08 Jul 2024

Towards a Scalable Reference-Free Evaluation of Generative Models

Jingwei Zhang

251

03 Jul 2024

MimicMotion: High-Quality Human Motion Video Generation with Confidence-aware Pose Guidance

429

153

28 Jun 2024

OmniJARVIS: Unified Vision-Language-Action Tokenization Enables Open-World Instruction Following Agents

Yitao Liang

310

27 Jun 2024

MultiDiff: Consistent Novel View Synthesis from a Single Image

Lorenzo Porzi

Matthias Nießner

Peter Kontschieder

DiffM

300

26 Jun 2024

DiffuseHigh: Training-free Progressive High-Resolution Image Synthesis through Structure Guidance

688

26 Jun 2024

FreeTraj: Tuning-Free Trajectory Control in Video Diffusion Models

Zhaoxi Chen

Ziwei Liu

208

24 Jun 2024

Listen and Move: Improving GANs Coherency in Agnostic Sound-to-Video Generation

Rafael Redondo

193

23 Jun 2024

Image Conductor: Precision Control for Interactive Video Synthesis

Yaowei Li

Xintao Wang

Zhaoyang Zhang

Ying Shan

257

21 Jun 2024

VideoScore: Building Automatic Metrics to Simulate Fine-grained Human Feedback for Video Generation

Ge Zhang

...

Wenhu Chen

313

118

21 Jun 2024

Video Generation with Learned Action Prior

Meenakshi Sarkar

Devansh Bhardwaj

Debasish Ghose

VGen GAN

306

20 Jun 2024

IRASim: A Fine-Grained World Model for Robot Manipulation

329

20 Jun 2024

Neural Residual Diffusion Models for Deep Scalable Vision GenerationNeural Information Processing Systems (NeurIPS), 2024

Bowen Zhou

412

19 Jun 2024

L4GM: Large 4D Gaussian Reconstruction ModelNeural Information Processing Systems (NeurIPS), 2024

Xiaohui Zeng

...

Ziwei Liu

Antonio Torralba

Sanja Fidler

Seung Wook Kim

Huan Ling

3DGS

261

14 Jun 2024

Training-free Camera Control for Video GenerationInternational Conference on Learning Representations (ICLR), 2024

Chen Hou

Guoqiang Wei

VGen DiffM

627

14 Jun 2024

SimGen: Simulator-conditioned Driving Scene Generation

Bolei Zhou

301

13 Jun 2024

Rethinking Human Evaluation Protocol for Text-to-Video Models: Enhancing Reliability,Reproducibility, and Practicality

Kai Wang

...

Yu Qiao

Kaipeng Zhang

356

13 Jun 2024

Hierarchical Patch Diffusion Models for High-Resolution Video Generation

245

12 Jun 2024