Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models

18 April 2023

Sanja Fidler

Papers citing "Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models"

50 / 826 papers shown

Title
Generative Pre-trained Autoregressive Diffusion Transformer Yuan Zhang Jiacheng Jiang Guoqing Ma Zhiying Lu Haoyang Huang Jianlong Yuan Nan Duan VGen 18 0 0 12 May 2025
BridgeIV: Bridging Customized Image and Video Generation through Test-Time Autoregressive Identity Propagation Panwen Hu Jiehui Huang Qiang Sun Xiaodan Liang DiffM VGen 23 0 0 11 May 2025
ProFashion: Prototype-guided Fashion Video Generation with Multiple Reference Images Xianghao Kong Qiaosong Qi Yuanbin Wang Anyi Rao Biaolong Chen Aixi Zhang Si Liu Hao Jiang DiffM VGen 20 0 0 10 May 2025
SVAD: From Single Image to 3D Avatar via Synthetic Data Generation with Video Diffusion and Data Augmentation Yonwoo Choi 3DGS VGen 60 0 0 08 May 2025
Fast Flow-based Visuomotor Policies via Conditional Optimal Transport Couplings Andreas Sochopoulos Nikolay Malkin Nikolaos Tsagkas João Moura Michael Gienger S. Vijayakumar 37 1 0 02 May 2025
FreePCA: Integrating Consistency Information across Long-short Frames in Training-free Long Video Generation via Principal Component Analysis Jiangtong Tan Hu Yu Jie Huang Jie Xiao Feng Zhao 62 1 0 02 May 2025
T2VPhysBench: A First-Principles Benchmark for Physical Consistency in Text-to-Video Generation Xuyang Guo Jiayan Huo Zhenmei Shi Zhao-quan Song Jiahao Zhang Jiale Zhao EGVM VGen PINN 77 1 0 01 May 2025
Direct Motion Models for Assessing Generated Videos Kelsey R. Allen Carl Doersch Guangyao Zhou Mohammed Suhail Danny Driess ... Thomas Kipf Mehdi S. M. Sajjadi Kevin P. Murphy João Carreira Sjoerd van Steenkiste EGVM DiffM VGen 74 0 0 30 Apr 2025
NoiseController: Towards Consistent Multi-view Video Generation via Noise Decomposition and Collaboration Haotian Dong X. Wang D. Lin Yipeng Wu Qin Chen R. Liu Kairui Yang Ping Li Qing-Wu Guo VGen 42 0 0 25 Apr 2025
We'll Fix it in Post: Improving Text-to-Video Generation with Neuro-Symbolic Feedback Minkyu Choi Sundar Sripada V. S. Harsh Goel Sahil Shah Sandeep P. Chinchali DiffM VGen 86 0 0 24 Apr 2025
Dynamic Camera Poses and Where to Find Them C. Rockwell Joseph Tung Tsung-Yi Lin Ming-Yu Liu David Fouhey Chen-Hsuan Lin 35 0 0 24 Apr 2025
BadVideo: Stealthy Backdoor Attack against Text-to-Video Generation Ruotong Wang Mingli Zhu Jiarong Ou R. J. Chen Xin Tao Pengfei Wan Baoyuan Wu DiffM AAML VGen 45 0 0 23 Apr 2025
Latent Diffusion Planning for Imitation Learning Amber Xie Oleh Rybkin Dorsa Sadigh Chelsea Finn 33 1 0 23 Apr 2025
FlowLoss: Dynamic Flow-Conditioned Loss Strategy for Video Diffusion Models Kuanting Wu Kei Ota Asako Kanezaki DiffM VGen 41 0 0 20 Apr 2025
Generalization through variance: how noise shapes inductive biases in diffusion models John J. Vastola DiffM 83 1 0 16 Apr 2025
EgoExo-Gen: Ego-centric Video Prediction by Watching Exo-centric Videos J. Xu Y. Huang Baoqi Pei Junlin Hou Qingqiu Li Guo Chen Y. Zhang Rui Feng Weidi Xie DiffM 46 0 0 16 Apr 2025
InterAnimate: Taming Region-aware Diffusion Model for Realistic Human Interaction Animation Yukang Lin Y. Hong Zunnan Xu X. Li Chao Xu ... Jun Lan Huijia Zhu Weiqiang Wang Jianfu Zhang Xiu Li VGen 46 0 0 15 Apr 2025
Taming Consistency Distillation for Accelerated Human Image Animation X. Wang Shiwei Zhang Hangjie Yuan Yujie Wei Y. Zhang Changxin Gao Yuehuan Wang Nong Sang VGen 22 0 0 15 Apr 2025
VideoPanda: Video Panoramic Diffusion with Multi-view Attention Kevin Xie Amirmojtaba Sabour Jiahui Huang Despoina Paschalidou G. Klár Umar Iqbal Sanja Fidler Xiaohui Zeng VGen MDE 34 0 0 15 Apr 2025
NormalCrafter: Learning Temporally Consistent Normals from Video Diffusion Priors Yanrui Bin Wenbo Hu Haoyuan Wang Xinya Chen Bing Wang DiffM 45 0 0 15 Apr 2025
UniAnimate-DiT: Human Image Animation with Large-Scale Video Diffusion Transformer X. Wang Shiwei Zhang Longxiang Tang Y. Zhang Changxin Gao Yuehuan Wang Nong Sang VGen 21 0 0 15 Apr 2025
OmniVDiff: Omni Controllable Video Diffusion for Generation and Understanding Dianbing Xi J. Wang Yuanzhi Liang Xi Qiu Yuchi Huo R. Wang Chi Zhang X. Li DiffM VGen 62 0 0 15 Apr 2025
EquiVDM: Equivariant Video Diffusion Models with Temporally Consistent Noise Chao Liu Arash Vahdat DiffM VGen 42 0 0 14 Apr 2025
SpinMeRound: Consistent Multi-View Identity Generation Using Diffusion Models Stathis Galanakis Alexandros Lattas Stylianos Moschoglou Bernhard Kainz S. Zafeiriou DiffM 33 0 0 14 Apr 2025
KeyVID: Keyframe-Aware Video Diffusion for Audio-Synchronized Visual Animation Xingrui Wang Jiang-Long Liu Z. Wang Xiaodong Yu Jialian Wu X. Sun Yusheng Su Alan L. Yuille Zicheng Liu Emad Barsoum DiffM VGen 43 0 0 13 Apr 2025
Discriminator-Free Direct Preference Optimization for Video Diffusion Haoran Cheng Qide Dong Liang Peng Zhizhou Sha Weiguo Feng Jinghui Xie Zhao Song Shilei Wen Xiaofei He Boxi Wu VGen 64 0 0 11 Apr 2025
Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model Team Seawead Ceyuan Yang Zhijie Lin Yang Zhao Shanchuan Lin ... Zuquan Song Zhenheng Yang Jiashi Feng Jianchao Yang Lu Jiang DiffM 81 1 0 11 Apr 2025
TokenMotion: Decoupled Motion Control via Token Disentanglement for Human-centric Video Generation Ruineng Li Daitao Xing Huiming Sun Yuanzhou Ha Jinglin Shen C. Ho DiffM VGen 37 0 0 11 Apr 2025
In-2-4D: Inbetweening from Two Single-View Images to 4D Generation Sauradip Nag Daniel Cohen-Or Hao Zhang Ali Mahdavi-Amiri DiffM VGen 41 0 0 11 Apr 2025
Beyond the Frame: Generating 360° Panoramic Videos from Perspective Videos Rundong Luo Matthew Wallingford Ali Farhadi Noah Snavely Wei-Chiu Ma VGen 19 0 0 10 Apr 2025
Geo4D: Leveraging Video Generators for Geometric 4D Scene Reconstruction Zeren Jiang Chuanxia Zheng Iro Laina Diane Larlus Andrea Vedaldi VGen 41 0 0 10 Apr 2025
RAGME: Retrieval Augmented Video Generation for Enhanced Motion Realism E. Peruzzo Dejia Xu Xingqian Xu Humphrey Shi N. Sebe DiffM VGen 54 0 0 09 Apr 2025
EIDT-V: Exploiting Intersections in Diffusion Trajectories for Model-Agnostic, Zero-Shot, Training-Free Text-to-Video Generation Diljeet Jagpal Xi Chen Vinay P. Namboodiri DiffM VGen 46 0 0 09 Apr 2025
Video-Bench: Human-Aligned Video Generation Benchmark Hui Han Siyuan Li Jiaqi Chen Yiwen Yuan Yuling Wu ... Y. Li J. Zhang Chi Zhang Li Li Yongxin Ni EGVM VGen 65 0 0 07 Apr 2025
Multi-identity Human Image Animation with Structural Video Diffusion Zhenzhi Wang Y. Li Yanhong Zeng Yuwei Guo D. Lin Tianfan Xue Bo Dai VGen 24 0 0 05 Apr 2025
HumanDreamer-X: Photorealistic Single-image Human Avatars Reconstruction via Gaussian Restoration Boyuan Wang Runqi Ouyang Xiaofeng Wang Zheng Zhu Guosheng Zhao Chaojun Ni Guan Huang Lihong Liu Xingang Wang 3DGS 66 0 0 04 Apr 2025
SkyReels-A2: Compose Anything in Video Diffusion Transformers Zhengcong Fei D. Li Di Qiu J. Wang Yikun Dou ... J. Xu Mingyuan Fan Guibin Chen Yang Li Yahui Zhou DiffM VGen 63 2 0 03 Apr 2025
OmniCam: Unified Multimodal Video Generation via Camera Control Xiaoda Yang Jiayang Xu Kaixuan Luan Xinyu Zhan Hongshun Qiu ... Shuai Yang Li Zhang Checheng Yu Cewu Lu Lixin Yang DiffM VGen 62 0 0 03 Apr 2025
Random Conditioning with Distillation for Data-Efficient Diffusion Model Compression Dohyun Kim S. Park Geonhee Han Seung Wook Kim Paul Hongsuck Seo DiffM 45 0 0 02 Apr 2025
FlowR: Flowing from Sparse to Dense 3D Reconstructions Tobias Fischer Samuel Rota Buló Yung-Hsu Yang Nikhil Varma Keetha Lorenzo Porzi Norman Muller Katja Schwarz Jonathon Luiten Marc Pollefeys Peter Kontschieder 3DGS 48 0 0 02 Apr 2025
WorldPrompter: Traversable Text-to-Scene Generation Zhaoyang Zhang Yannick Hold-Geoffroy Miloš Hašan Chen Ziwen Fujun Luan Julie Dorsey Yiwei Hu VGen 45 0 0 02 Apr 2025
Can Test-Time Scaling Improve World Foundation Model? Wenyan Cong Hanqing Zhu Peihao Wang Bangya Liu Dejia Xu Kevin Wang David Z. Pan Yan Wang Zhiwen Fan Z. Wang 34 0 0 31 Mar 2025
JointTuner: Appearance-Motion Adaptive Joint Training for Customized Video Generation Fangda Chen Shanshan Zhao Chuanfu Xu Long Lan VGen 37 0 0 31 Mar 2025
Learning Coordinated Bimanual Manipulation Policies using State Diffusion and Inverse Dynamics Models Haonan Chen Jiaming Xu Lily Sheng Tianchen Ji Shuijing Liu Yunzhu Li Katherine Driggs-Campbell 54 1 0 30 Mar 2025
SketchVideo: Sketch-based Video Generation and Editing Feng-Lin Liu Hongbo Fu Xintao Wang Weicai Ye Pengfei Wan Di Zhang Lin Gao DiffM VGen 40 0 0 30 Mar 2025
Follow Your Motion: A Generic Temporal Consistency Portrait Editing Framework with Trajectory Guidance Haijie Yang Z. Zhang Hao Tang Jianjun Qian Jian Yang DiffM VGen 50 0 0 28 Mar 2025
EchoFlow: A Foundation Model for Cardiac Ultrasound Image and Video Generation Hadrien Reynaud Alberto Gomez Paul Leeson Qingjie Meng B. Kainz MedIm 54 0 0 28 Mar 2025
VBench-2.0: Advancing Video Generation Benchmark Suite for Intrinsic Faithfulness Dian Zheng Ziqi Huang Hongbo Liu Kai Zou Yinan He ... Y. Zhang Jingwen He Wei-Shi Zheng Yu Qiao Ziwei Liu EGVM VGen 48 3 0 27 Mar 2025
HOT: Hadamard-based Optimized Training Seonggon Kim Juncheol Shin Seung-taek Woo Eunhyeok Park 45 0 0 27 Mar 2025
VideoMage: Multi-Subject and Motion Customization of Text-to-Video Diffusion Models Chi-Pin Huang Yen-Siang Wu Hung-Kai Chung Kai-Po Chang Fu-En Yang Yu-Jie Wang DiffM VGen 55 0 0 27 Mar 2025