An Intermediate Fusion ViT Enables Efficient Text-Image Alignment in Diffusion Models

25 March 2024

Papers citing "An Intermediate Fusion ViT Enables Efficient Text-Image Alignment in Diffusion Models"

3 / 3 papers shown

Title
Lateralization MLP: A Simple Brain-inspired Architecture for Diffusion Zizhao Hu Mohammad Rostami 27 0 0 25 May 2024
One Transformer Fits All Distributions in Multi-Modal Diffusion at Scale Fan Bao Shen Nie Kaiwen Xue Chongxuan Li Shiliang Pu Yaole Wang Gang Yue Yue Cao Hang Su Jun Zhu DiffM 199 147 0 12 Mar 2023
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 253 4,735 0 24 Feb 2021