Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models

18 April 2023

Sanja Fidler

Papers citing "Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models"

50 / 827 papers shown

Title
SAVE: Protagonist Diversification with Structure Agnostic Video Editing Yeji Song Wonsik Shin Junsoo Lee Jeesoo Kim Nojun Kwak DiffM VGen 103 4 0 05 Dec 2023
DreamVideo: High-Fidelity Image-to-Video Generation with Image Retention and Text Guidance Cong Wang Jiaxi Gu Panwen Hu Songcen Xu Hang Xu Xiaodan Liang VGen 19 14 0 05 Dec 2023
VideoSwap: Customized Video Subject Swapping with Interactive Semantic Point Correspondence Yuchao Gu Yipin Zhou Bichen Wu Licheng Yu Jia-Wei Liu Rui Zhao Jay Zhangjie Wu David Junhao Zhang Mike Zheng Shou Kevin Tang DiffM VGen 60 37 0 04 Dec 2023
Generative Rendering: Controllable 4D-Guided Video Generation with 2D Diffusion Models Shengqu Cai Duygu Ceylan Matheus Gadelha C. Huang Tuanfeng Y. Wang Gordon Wetzstein VGen 19 17 0 03 Dec 2023
ViVid-1-to-3: Novel View Synthesis with Video Diffusion Models Jeong-gi Kwak Erqun Dong Yuhe Jin Hanseok Ko Shweta Mahajan Kwang Moo Yi DiffM VGen 72 38 0 03 Dec 2023
3DiFACE: Diffusion-based Speech-driven 3D Facial Animation and Editing Balamurugan Thambiraja S. Aliakbarian Darren Cosker Justus Thies DiffM VGen 38 11 0 01 Dec 2023
VideoBooth: Diffusion-based Video Generation with Image Prompts Yuming Jiang Tianxing Wu Shuai Yang Chenyang Si Dahua Lin Yu Qiao Chen Change Loy Ziwei Liu DiffM VGen 32 65 0 01 Dec 2023
TrackDiffusion: Tracklet-Conditioned Video Generation via Diffusion Models Pengxiang Li Kai Chen Zhili Liu Ruiyuan Gao Lanqing Hong Guo Zhou Hua Yao Dit-Yan Yeung Huchuan Lu Xu Jia VGen DiffM 20 0 0 01 Dec 2023
Motion-Guided Latent Diffusion for Temporally Consistent Real-world Video Super-resolution Xi Yang Chenhang He Jianqi Ma Lei Zhang DiffM VGen 25 11 0 01 Dec 2023
VMC: Video Motion Customization using Temporal Attention Adaption for Text-to-Video Diffusion Models Hyeonho Jeong Geon Yeong Park Jong Chul Ye VGen DiffM 109 53 0 01 Dec 2023
$ART$\boldsymbol{\cdot}$V: Auto-Regressive Text-to-Video Generation with Diffusion Models$ ART $\boldsymbol{\cdot}$ V: Auto-Regressive Text-to-Video Generation with Diffusion Models Wenming Weng Ruoyu Feng Yanhui Wang Qi Dai Chunyu Wang ... Jianmin Bao Yuhui Yuan Chong Luo Yueyi Zhang Zhiwei Xiong VGen 22 32 0 30 Nov 2023
MicroCinema: A Divide-and-Conquer Approach for Text-to-Video Generation Yanhui Wang Jianmin Bao Wenming Weng Ruoyu Feng Dacheng Yin ... Yuhui Yuan Chuanxin Tang Xiaoyan Sun Chong Luo Baining Guo DiffM VGen 66 15 0 30 Nov 2023
Motion-Conditioned Image Animation for Video Editing Wilson Yan Andrew Brown Pieter Abbeel Rohit Girdhar S. Azadi DiffM VGen 58 12 0 30 Nov 2023
DiffusionAvatars: Deferred Diffusion for High-fidelity 3D Head Avatars Tobias Kirschstein Simon Giebenhain Matthias Nießner 26 27 0 30 Nov 2023
Driving into the Future: Multiview Visual Forecasting and Planning with World Model for Autonomous Driving Yu-Quan Wang Jiawei He Lue Fan Hongxin Li Yuntao Chen Zhaoxiang Zhang VGen 54 116 0 29 Nov 2023
4D-fy: Text-to-4D Generation Using Hybrid Score Distillation Sampling Sherwin Bahmani Ivan Skorokhodov Victor Rong Gordon Wetzstein Leonidas J. Guibas Peter Wonka Sergey Tulyakov Jeong Joon Park Andrea Tagliasacchi David B. Lindell DiffM 41 103 0 29 Nov 2023
CG3D: Compositional Generation for Text-to-3D via Gaussian Splatting Alexander Vilesov Pradyumna Chari A. Kadambi 3DGS 14 33 0 29 Nov 2023
VBench: Comprehensive Benchmark Suite for Video Generative Models Ziqi Huang Yinan He Jiashuo Yu Fan Zhang Chenyang Si ... Xinyuan Chen Limin Wang Dahua Lin Yu Qiao Ziwei Liu VGen 62 346 0 29 Nov 2023
Fair Text-to-Image Diffusion via Fair Mapping Jia Li Lijie Hu Jingfeng Zhang Tianhang Zheng Hua Zhang Di Wang 36 13 0 29 Nov 2023
SmoothVideo: Smooth Video Synthesis with Noise Constraints on Diffusion Models for One-shot Video Tuning Liang Peng Haoran Cheng Zheng Yang Ruisi Zhao Linxuan Xia Chaotian Song Qinglin Lu Boxi Wu Wei Liu VGen 15 2 0 29 Nov 2023
MagDiff: Multi-Alignment Diffusion for High-Fidelity Video Generation and Editing Haoyu Zhao Tianyi Lu Jiaxi Gu Xing Zhang Qingping Zheng Zuxuan Wu Hang Xu Yu-Gang Jiang VGen DiffM 27 10 0 29 Nov 2023
Adversarial Diffusion Distillation Axel Sauer Dominik Lorenz A. Blattmann Robin Rombach 138 329 0 28 Nov 2023
Space-Time Diffusion Features for Zero-Shot Text-Driven Motion Transfer Danah Yatim Rafail Fridman Omer Bar-Tal Yoni Kasten Tali Dekel DiffM VGen 19 50 0 28 Nov 2023
SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models Yuwei Guo Ceyuan Yang Anyi Rao Maneesh Agrawala Dahua Lin Bo Dai DiffM VGen 18 113 0 28 Nov 2023
A Unified Approach for Text- and Image-guided 4D Scene Generation Yufeng Zheng Xueting Li Koki Nagano Sifei Liu Karsten Kreis Otmar Hilliges Shalini De Mello 33 47 0 28 Nov 2023
Panacea: Panoramic and Controllable Video Generation for Autonomous Driving Yuqing Wen Yucheng Zhao Yingfei Liu Fan Jia Yanhui Wang Chong Luo Chi Zhang Tiancai Wang Xiaoyan Sun Xiangyu Zhang 70 57 0 28 Nov 2023
Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation Liucheng Hu Xin Gao Peng Zhang Ke Sun Bang Zhang Liefeng Bo DiffM VGen 33 338 0 28 Nov 2023
MotionZero:Exploiting Motion Priors for Zero-shot Text-to-Video Generation Sitong Su Litao Guo Lianli Gao Hengtao Shen Jingkuan Song VGen 21 4 0 28 Nov 2023
MobileDiffusion: Instant Text-to-Image Generation on Mobile Devices Yang Zhao Yanwu Xu Zhisheng Xiao Haolin Jia Tingbo Hou VLM 39 11 0 28 Nov 2023
Enhancing Perceptual Quality in Video Super-Resolution through Temporally-Consistent Detail Synthesis using Diffusion Models C. Rota M. Buzzelli J. Weijer DiffM 23 3 0 27 Nov 2023
FLAIR: A Conditional Diffusion Framework with Applications to Face Video Restoration Zihao Zou Jiaming Liu S. Shoushtari Yubo Wang Weijie Gan Ulugbek S. Kamilov VGen DiffM 23 2 0 26 Nov 2023
Flow-Guided Diffusion for Video Inpainting Bohai Gu Yongsheng Yu Hengrui Fan Libo Zhang VGen DiffM 28 12 0 26 Nov 2023
Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets A. Blattmann Tim Dockhorn Sumith Kulal Daniel Mendelevitch Maciej Kilian ... Zion English Vikram S. Voleti Adam Letts Varun Jampani Robin Rombach VGen 150 1,009 0 25 Nov 2023
Decouple Content and Motion for Conditional Image-to-Video Generation Cuifeng Shen Yulu Gan Chen Chen Xiongwei Zhu Lele Cheng Tingting Gao Jinzhi Wang VGen DiffM 20 5 0 24 Nov 2023
A Somewhat Robust Image Watermark against Diffusion-based Editing Models Mingtian Tan Tianhao Wang Somesh Jha WIGM 18 3 0 22 Nov 2023
ADriver-I: A General World Model for Autonomous Driving Fan Jia Weixin Mao Yingfei Liu Yucheng Zhao Yuqing Wen Chi Zhang Xiangyu Zhang Tiancai Wang 22 63 0 22 Nov 2023
FusionFrames: Efficient Architectural Aspects for Text-to-Video Generation Pipeline V.Ya. Arkhipkin Zein Shaheen Viacheslav Vasilev E. Dakhova Andrey Kuznetsov Denis Dimitrov DiffM VGen 16 5 0 22 Nov 2023
Breathing Life Into Sketches Using Text-to-Video Priors Rinon Gal Yael Vinker Yuval Alaluf Amit H. Bermano Daniel Cohen-Or Ariel Shamir Gal Chechik VGen DiffM 27 29 0 21 Nov 2023
GPT4Motion: Scripting Physical Motions in Text-to-Video Generation via Blender-Oriented GPT Planning Jiaxi Lv Yi Huang Mingfu Yan Jiancheng Huang Jianzhuang Liu Yifan Liu Yafei Wen Xiaoxin Chen Shifeng Chen VGen DiffM 28 23 0 21 Nov 2023
Applications of Large Scale Foundation Models for Autonomous Driving Yu Huang Yue Chen Zhu Li ELM AI4CE LRM ALM LM&Ro 46 15 0 20 Nov 2023
FrePolad: Frequency-Rectified Point Latent Diffusion for Point Cloud Generation Chenliang Zhou Fangcheng Zhong Param Hanji Zhilin Guo Kyle Fogarty Alejandro Sztrajman Hongyun Gao Cengiz Öztireli 19 3 0 20 Nov 2023
MoVideo: Motion-Aware Video Generation with Diffusion Models Jingyun Liang Yuchen Fan Kai Zhang Radu Timofte Luc Van Gool Rakesh Ranjan DiffM VGen 28 10 0 19 Nov 2023
EditShield: Protecting Unauthorized Image Editing by Instruction-guided Diffusion Models Ruoxi Chen Haibo Jin Yixin Liu Jinyin Chen Haohan Wang Lichao Sun 23 10 0 19 Nov 2023
Mitigating Exposure Bias in Discriminator Guided Diffusion Models Eleftherios Tsonis Paraskevi Tzouveli Athanasios Voulodimos DiffM 10 2 0 18 Nov 2023
MagicPose: Realistic Human Poses and Facial Expressions Retargeting with Identity-aware Diffusion Di Chang Yichun Shi Quankai Gao Jessica Fu Hongyi Xu Guoxian Song Qing Yan Yizhe Zhu Xiao Yang Mohammad Soleymani DiffM VGen 11 48 0 18 Nov 2023
Make Pixels Dance: High-Dynamic Video Generation Yan Zeng Guoqiang Wei Jiani Zheng Jiaxin Zou Yang Wei Yuchen Zhang Hang Li DiffM VGen 19 90 0 18 Nov 2023
Emu Video: Factorizing Text-to-Video Generation by Explicit Image Conditioning Rohit Girdhar Mannat Singh Andrew Brown Quentin Duval S. Azadi Sai Saketh Rambhatla Akbar Shah Xi Yin Devi Parikh Ishan Misra DiffM VGen 35 189 0 17 Nov 2023
Text-to-Sticker: Style Tailoring Latent Diffusion Models for Human Expression Animesh Sinha Bo Sun Anmol Kalia Arantxa Casanova Elliot Blanchard ... Ankit Ramchandani Maziar Sanjabi Sonal Gupta Amy Bearman Dhruv Mahajan DiffM 28 4 0 17 Nov 2023
Generative AI-Based Probabilistic Constellation Shaping With Diffusion Models Mehdi Letafati Samad Ali Matti Latva-aho DiffM 16 6 0 15 Nov 2023
VideoCon: Robust Video-Language Alignment via Contrast Captions Hritik Bansal Yonatan Bitton Idan Szpektor Kai-Wei Chang Aditya Grover 28 14 0 15 Nov 2023