v1v2 (latest)

Improving Visual Quality of Image Synthesis by A Token-based Generator with Transformers

5 November 2021

Papers citing "Improving Visual Quality of Image Synthesis by A Token-based Generator with Transformers"

18 / 18 papers shown

TART: Token-based Architecture Transformer for Neural Network Performance Prediction

Yannis Y. He

293

02 Jan 2025

Denoising with a Joint-Embedding Predictive ArchitectureInternational Conference on Learning Representations (ICLR), 2024

Dengsheng Chen

Jie Hu

Xiaoming Wei

Enhua Wu

DiffM

626

02 Oct 2024

Learning Trimodal Relation for AVQA with Missing Modality

Kyu Ri Park

Hong Joo Lee

Jung Uk Kim

262

23 Jul 2024

Can SAM Boost Video Super-Resolution?

396

11 May 2023

Transformer-based Generative Adversarial Networks in Computer Vision: A Comprehensive SurveyIEEE Transactions on Artificial Intelligence (IEEE TAI), 2023

S. Dubey

Satish Kumar Singh

ViT

319

17 Feb 2023

Learning Spatiotemporal Frequency-Transformer for Low-Quality Video Super-Resolution

Zhongwei Qiu

186

27 Dec 2022

MM-Diffusion: Learning Multi-Modal Diffusion Models for Joint Audio and Video GenerationComputer Vision and Pattern Recognition (CVPR), 2022

Qin Jin

519

279

19 Dec 2022

Rethinking Vision Transformers for MobileNet Size and SpeedIEEE International Conference on Computer Vision (ICCV), 2022

438

290

15 Dec 2022

BiViT: Extremely Compressed Binary Vision TransformerIEEE International Conference on Computer Vision (ICCV), 2022

Bohan Zhuang

339

14 Nov 2022

Fine-Grained Image Style Transfer with Visual TransformersAsian Conference on Computer Vision (ACCV), 2022

266

11 Oct 2022

AI Illustrator: Translating Raw Descriptions into Images by Prompt-based Cross-Modal GenerationACM Multimedia (ACM MM), 2022

295

07 Sep 2022

StableFace: Analyzing and Improving Motion Stability for Talking Face GenerationIEEE Journal on Selected Topics in Signal Processing (IEEE JSTSP), 2022

Jun Ling

210

29 Aug 2022

ARMANI: Part-level Garment-Text Alignment for Unified Cross-Modal Fashion DesignACM Multimedia (ACM MM), 2022

Xujie Zhang

Yuyang Sha

Michael C. Kampffmeyer

Xiaodan Liang

227

11 Aug 2022

Learning Spatiotemporal Frequency-Transformer for Compressed Video Super-ResolutionEuropean Conference on Computer Vision (ECCV), 2022

Zhongwei Qiu

219

05 Aug 2022

EfficientFormer: Vision Transformers at MobileNet SpeedNeural Information Processing Systems (NeurIPS), 2022

838

571

02 Jun 2022

Learning Trajectory-Aware Transformer for Video Super-ResolutionComputer Vision and Pattern Recognition (CVPR), 2022

384

110

08 Apr 2022

ITTR: Unpaired Image-to-Image Translation with Transformers

268

30 Mar 2022

Advancing High-Resolution Video-Language Representation with Large-Scale Video TranscriptionsComputer Vision and Pattern Recognition (CVPR), 2021

312

261

19 Nov 2021