v1v2v3v4v5 (latest)

Learning to Generate Long-term Future via Hierarchical Prediction

19 April 2017

Papers citing "Learning to Generate Long-term Future via Hierarchical Prediction"

50 / 211 papers shown

Bridging Text and Video Generation: A Survey

264

06 Oct 2025

MoReFlow: Motion Retargeting Learning through Unsupervised Flow Matching

Wontaek Kim

Tianyu Li

Sehoon Ha

173

29 Sep 2025

Integrating Reinforcement Learning with Visual Generative Models: Foundations and Advances

307

14 Aug 2025

FG-DFPN: Flow Guided Deformable Frame Prediction Network

M. Akın Yılmaz

Ahmet Bilican

A. Murat Tekalp

248

14 Mar 2025

Continuous Video Process: Modeling Videos as Continuous Multi-Dimensional Processes for Video Prediction

Gaurav Shrivastava

Abhinav Shrivastava

VGen DiffM

274

06 Dec 2024

COIN: Control-Inpainting Diffusion Prior for Human and Camera Motion EstimationEuropean Conference on Computer Vision (ECCV), 2024

Ye Yuan

Cewu Lu

Jan Kautz

Umar Iqbal

DiffM VGen

267

29 Aug 2024

Enhancing Bandwidth Efficiency for Video Motion Transfer Applications using Deep Learning Based Keypoint Prediction

214

17 Mar 2024

Predictive Temporal Attention on Event-based Video Stream for Energy-efficient Situation Awareness

Yiming Bu

Jiayang Liu

Qinru Qiu

163

14 Feb 2024

Modeling Spatio-temporal Dynamical Systems with Neural Discrete Learning and Levels-of-ExpertsIEEE Transactions on Knowledge and Data Engineering (TKDE), 2024

Roger Zimmermann

186

06 Feb 2024

SFGANS Self-supervised Future Generator for human ActioN Segmentation

Or Berman

Adam Goldbraikh

S. Laufer

241

31 Dec 2023

HMP: Hand Motion Priors for Pose and Shape Estimation from Video

183

27 Dec 2023

Earthfarseer: Versatile Spatio-Temporal Dynamical Systems Modeling in One Model

427

13 Dec 2023

PACE: Human and Camera Motion Estimation from in-the-wild Videos

Otmar Hilliges

216

20 Oct 2023

Predicting Future Spatiotemporal Occupancy Grids with Semantics for Autonomous Driving

Maneekwan Toyungyernsub

Esen Yel

Jiachen Li

Mykel J. Kochenderfer

193

03 Oct 2023

Dancing Avatar: Pose and Text-Guided Human Motion Videos Synthesis with Image Diffusion Model

162

15 Aug 2023

Does Unpredictability Influence Driving Behavior?IEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2023

Sepehr Samavi

Florian Shkurti

Angela P. Schoellig

128

28 Jul 2023

DDLP: Unsupervised Object-Centric Video Prediction with Deep Dynamic Latent Particles

Tal Daniel

Aviv Tamar

DiffM

254

09 Jun 2023

Putting People in Their Place: Affordance-Aware Human Insertion into ScenesComputer Vision and Pattern Recognition (CVPR), 2023

Jiajun Wu

177

27 Apr 2023

Combining Vision and Tactile Sensation for Video Prediction

Willow Mandil

Amir M. Ghalamzan-E.

110

21 Apr 2023

Prior based Sampling for Adaptive LiDAR

Amit Shomer

S. Avidan

3DV 3DPC MDE

247

14 Apr 2023

Model-Based Reinforcement Learning with Isolated ImaginationsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

338

27 Mar 2023

Towards End-to-End Generative Modeling of Long Videos with Memory-Efficient Bidirectional TransformersComputer Vision and Pattern Recognition (CVPR), 2023

Jaehoon Yoo

225

20 Mar 2023

Implicit Stacked Autoregressive Model for Video Prediction

Junghoon Seo

143

14 Mar 2023

Locomotion-Action-Manipulation: Synthesizing Human-Scene Interactions in Complex 3D EnvironmentsIEEE International Conference on Computer Vision (ICCV), 2023

Jiye Lee

Hanbyul Joo

336

09 Jan 2023

Motion and Context-Aware Audio-Visual Conditioned Video PredictionBritish Machine Vision Conference (BMVC), 2022

382

09 Dec 2022

MIMO Is All You Need : A Strong Multi-In-Multi-Out Baseline for Video Prediction

Qian Chen

203

09 Dec 2022

SimVP: Towards Simple yet Powerful Spatiotemporal Predictive LearningIEEE transactions on multimedia (IEEE TMM), 2022

Cheng Tan

Zhangyang Gao

Siyuan Li

Stan Z. Li

VLM AI4TS

273

22 Nov 2022

Autoregressive GAN for Semantic Unconditional Head Motion Generation

Louis Airale

Xavier Alameda-Pineda

Stéphane Lathuilière

Dominique Vaufreydaz

217

02 Nov 2022

SlotFormer: Unsupervised Visual Dynamics Simulation with Object-Centric ModelsInternational Conference on Learning Representations (ICLR), 2022

362

116

12 Oct 2022

Hierarchical Capsule Prediction Network for Marketing Campaigns EffectInternational Conference on Information and Knowledge Management (CIKM), 2022

156

22 Aug 2022

A new way of video compression via forward-referencing using deep learning

13 Aug 2022

Large-scale Knowledge Distillation with Elastic Heterogeneous Computing ResourcesConcurrency and Computation (CCPE), 2022

Dianhai Yu

185

14 Jul 2022

Snipper: A Spatiotemporal Transformer for Simultaneous Multi-Person 3D Pose Estimation Tracking and Forecasting on a Video Snippet

266

09 Jul 2022

SimVP: Simpler yet Better Video PredictionComputer Vision and Pattern Recognition (CVPR), 2022

Zhangyang Gao

Cheng Tan

Lirong Wu

Stan Z. Li

372

329

09 Jun 2022

Patch-based Object-centric Transformers for Efficient Video Generation

Pieter Abbeel

269

08 Jun 2022

FlexLip: A Controllable Text-to-Lip SystemItalian National Conference on Sensors (INS), 2022

151

07 Jun 2022

Cascaded Video Generation for Videos In-the-WildInternational Conference on Pattern Recognition (ICPR), 2022

Lluis Castrejon

Nicolas Ballas

Aaron Courville

VGen

191

01 Jun 2022

Iso-Dream: Isolating and Leveraging Noncontrollable Visual Dynamics in World ModelsNeural Information Processing Systems (NeurIPS), 2022

344

27 May 2022

Future Object Detection with Spatiotemporal Transformers

Adam Tonderski

Joakim Johnander

Christoffer Petersson

Kalle AAstrom

ViT

186

21 Apr 2022

When Physics Meets Machine Learning: A Survey of Physics-Informed Machine Learning

282

128

31 Mar 2022

Stochastic Video Prediction with Structure and Motion

Adil Kaan Akan

Sadra Safadoust

Fatma Guney

VGen

176

20 Mar 2022

Transframer: Arbitrary Frame Prediction with Generative Models

277

17 Mar 2022

MSPred: Video Prediction at Multiple Spatio-Temporal Scales with Hierarchical Recurrent NetworksBritish Machine Vision Conference (BMVC), 2022

Angel Villar-Corrales

Ani J. Karapetyan

Andreas Boltres

Sven Behnke

375

17 Mar 2022

Show Me What and Tell Me How: Video Synthesis via Multimodal ConditioningComputer Vision and Pattern Recognition (CVPR), 2022

Hsin-Ying Lee

224

04 Mar 2022

Filtered-CoPhy: Unsupervised Learning of Counterfactual Physics in Pixel SpaceInternational Conference on Learning Representations (ICLR), 2022

Natalia Neverova

209

01 Feb 2022

Autoencoding Video Latents for Adversarial Video Generation

Sai Hemanth Kasaraneni

VGen

127

18 Jan 2022

Image Animation with Keypoint Mask

117

20 Dec 2021

A Hierarchical Spatio-Temporal Graph Convolutional Neural Network for Anomaly Detection in Videos

219

08 Dec 2021

GLAMR: Global Occlusion-Aware Human Mesh Recovery with Dynamic Cameras

322

153

02 Dec 2021

Layered Controllable Video Generation

395

24 Nov 2021