Aligning Visual Foundation Encoders to Tokenizers for Diffusion Models

29 September 2025

Papers citing "Aligning Visual Foundation Encoders to Tokenizers for Diffusion Models"

1 / 1 papers shown

Title
VIST3A: Text-to-3D by Stitching a Multi-view Reconstruction Network to a Video Generator Hyojun Go Dominik Narnhofer Goutam Bhat Prune Truong Federico Tombari Konrad Schindler VGen 76 0 0 15 Oct 2025