Probabilistic Adaptation of Text-to-Video Models

2 June 2023

Pieter Abbeel

Papers citing "Probabilistic Adaptation of Text-to-Video Models"

30 / 30 papers shown

Title
ReVision: High-Quality, Low-Cost Video Generation with Explicit 3D Physics Modeling for Complex Motion and Interaction Qihao Liu Ju He Qihang Yu Liang-Chieh Chen Alan Yuille DiffM VGen 78 0 0 30 Apr 2025
Solving New Tasks by Adapting Internet Video Knowledge Calvin Luo Zilai Zeng Yilun Du Chen Sun 21 0 0 21 Apr 2025
The Devil is in the Prompts: Retrieval-Augmented Prompt Optimization for Text-to-Video Generation Bingjie Gao Xinyu Gao Xiaoxue Wu Yujie Zhou Yu Qiao Li Niu Xinyuan Chen Yaohui Wang 71 0 0 16 Apr 2025
AdaWorld: Learning Adaptable World Models with Latent Actions Shenyuan Gao Siyuan Zhou Yilun Du Jun Zhang Chuang Gan VGen 54 3 0 24 Mar 2025
Generative Trajectory Stitching through Diffusion Composition Yunhao Luo Utkarsh Aashu Mishra Yilun Du Danfei Xu 99 1 0 07 Mar 2025
VideoAgent: Self-Improving Video Generation Achint Soni Sreyas Venkataraman Abhranil Chandra Sebastian Fischmeister Percy Liang Bo Dai Sherry Yang LM&Ro VGen 50 7 0 14 Oct 2024
Potential Based Diffusion Motion Planning Yunhao Luo Chen Sun Joshua B. Tenenbaum Yilun Du DiffM 38 15 0 08 Jul 2024
StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation Yupeng Zhou Daquan Zhou Ming-Ming Cheng Jiashi Feng Qibin Hou DiffM VGen 30 88 0 02 May 2024
RoboDreamer: Learning Compositional World Models for Robot Imagination Siyuan Zhou Yilun Du Jiaben Chen Yandong Li Dit-Yan Yeung Chuang Gan VGen LM&Ro 69 27 0 18 Apr 2024
Video as the New Language for Real-World Decision Making Sherry Yang Jacob Walker Jack Parker-Holder Yilun Du Jake Bruce Andre Barreto Pieter Abbeel Dale Schuurmans VGen 24 45 0 27 Feb 2024
Compositional Generative Modeling: A Single Model is Not All You Need Yilun Du L. Kaelbling PINN GAN 49 20 0 02 Feb 2024
Compositional Generative Inverse Design Tailin Wu Takashi Maruyama Long Wei Tao Zhang Yilun Du Gianluca Iaccarino J. Leskovec DiffM AI4CE 18 5 0 24 Jan 2024
Benchmarks for Physical Reasoning AI Andrew Melnik Robin Schiewer Moritz Lange Andrei Muresanu Mozhgan Saeidi Animesh Garg Helge J. Ritter 19 8 0 17 Dec 2023
Generating Illustrated Instructions Sachit Menon Ishan Misra Rohit Girdhar DiffM 24 4 0 07 Dec 2023
MotionZero:Exploiting Motion Priors for Zero-shot Text-to-Video Generation Sitong Su Litao Guo Lianli Gao Hengtao Shen Jingkuan Song VGen 26 4 0 28 Nov 2023
A Somewhat Robust Image Watermark against Diffusion-based Editing Models Mingtian Tan Tianhao Wang Somesh Jha WIGM 18 3 0 22 Nov 2023
A Survey on Video Diffusion Models Zhen Xing Qijun Feng Haoran Chen Qi Dai Hang-Rui Hu Hang Xu Zuxuan Wu Yu-Gang Jiang EGVM VGen 55 115 0 16 Oct 2023
Video Language Planning Yilun Du Mengjiao Yang Peter R. Florence Fei Xia Ayzaan Wahid ... Pieter Abbeel Josh Tenenbaum L. Kaelbling Andy Zeng Jonathan Tompson PINN LM&Ro 89 84 0 16 Oct 2023
Learning Interactive Real-World Simulators Mengjiao Yang Yilun Du Kamyar Ghasemipour Jonathan Tompson Leslie Kaelbling Dale Schuurmans Pieter Abbeel LM&Ro PINN 16 174 0 09 Oct 2023
Compositional Foundation Models for Hierarchical Planning Anurag Ajay Seung-Jun Han Yilun Du Shaung Li Abhi Gupta Tommi Jaakkola Josh Tenenbaum L. Kaelbling Akash Srivastava Pulkit Agrawal LRM 17 64 0 15 Sep 2023
RenAIssance: A Survey into AI Text-to-Image Generation in the Era of Large Model Fengxiang Bie Yibo Yang Zhongzhu Zhou Adam Ghanem Minjia Zhang ... Pareesa Ameneh Golnari David A. Clifton Yuxiong He Dacheng Tao S. Song EGVM 25 17 0 02 Sep 2023
Energy-based Models are Zero-Shot Planners for Compositional Scene Rearrangement N. Gkanatsios Ayush Jain Zhou Xian Yunchu Zhang C. Atkeson Katerina Fragkiadaki LM&Ro 98 31 0 27 Apr 2023
Muse: Text-To-Image Generation via Masked Generative Transformers Huiwen Chang Han Zhang Jarred Barber AJ Maschinot José Lezama ... Kevin Patrick Murphy William T. Freeman Michael Rubinstein Yuanzhen Li Dilip Krishnan DiffM 197 517 0 02 Jan 2023
CogVideo: Large-scale Pretraining for Text-to-Video Generation via Transformers Wenyi Hong Ming Ding Wendi Zheng Xinghan Liu Jie Tang DiffM 243 564 0 29 May 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 315 8,402 0 28 Jan 2022
Denoising Diffusion Restoration Models Bahjat Kawar Michael Elad Stefano Ermon Jiaming Song DiffM 204 774 0 27 Jan 2022
RePaint: Inpainting using Denoising Diffusion Probabilistic Models Andreas Lugmayr Martin Danelljan Andrés Romero F. I. F. Richard Yu Radu Timofte Luc Van Gool DiffM 213 1,353 0 24 Jan 2022
Palette: Image-to-Image Diffusion Models Chitwan Saharia William Chan Huiwen Chang Chris A. Lee Jonathan Ho Tim Salimans David J. Fleet Mohammad Norouzi DiffM VLM 325 1,584 0 10 Nov 2021
Ego4D: Around the World in 3,000 Hours of Egocentric Video Kristen Grauman Andrew Westbury Eugene Byrne Zachary Chavis Antonino Furnari ... Mike Zheng Shou Antonio Torralba Lorenzo Torresani Mingfei Yan Jitendra Malik EgoV 224 1,018 0 13 Oct 2021
Bridge Data: Boosting Generalization of Robotic Skills with Cross-Domain Datasets F. Ebert Yanlai Yang Karl Schmeckpeper Bernadette Bucher G. Georgakis Kostas Daniilidis Chelsea Finn Sergey Levine 161 217 0 27 Sep 2021