v1v2v3 (latest)

Taming Transformers for High-Resolution Image Synthesis

Computer Vision and Pattern Recognition (CVPR), 2020

17 December 2020

ArXiv (abs)PDF HTML Github (6185★)

Papers citing "Taming Transformers for High-Resolution Image Synthesis"

50 / 2,402 papers shown

RealisMotion: Decomposed Human Motion Control and Video Generation in the World Space

114

12 Aug 2025

Enhanced Generative Structure Prior for Chinese Text Image Super-resolutionIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025

Xiaoming Li

Wangmeng Zuo

Chen Change Loy

175

11 Aug 2025

AR-GRPO: Training Autoregressive Image Generation Models via Reinforcement Learning

145

09 Aug 2025

NEP: Autoregressive Image Editing via Next Editing Token Prediction

144

08 Aug 2025

WeTok: Powerful Discrete Tokenization for High-Fidelity Visual Reconstruction

219

07 Aug 2025

Deeper Inside Deep ViT

Sungrae Hong

151

06 Aug 2025

UniEdit-I: Training-free Image Editing for Unified VLM via Iterative Understanding, Editing and Verifying

180

05 Aug 2025

HPSv3: Towards Wide-Spectrum Human Preference Score

149

05 Aug 2025

CIVQLLIE: Causal Intervention with Vector Quantization for Low-Light Image Enhancement

116

05 Aug 2025

Cross-Domain Image Synthesis: Generating H&E from Multiplex Biomarker Imaging

104

05 Aug 2025

GL-LCM: Global-Local Latent Consistency Models for Fast High-Resolution Bone Suppression in Chest X-Ray ImagesInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025

05 Aug 2025

Skywork UniPic: Unified Autoregressive Modeling for Visual Understanding and Generation

...

132

05 Aug 2025

VeOmni: Scaling Any Modality Model Training with Model-Centric Distributed Recipe Zoo

...

350

04 Aug 2025

PESTO: Real-Time Pitch Estimation with Self-supervised Transposition-equivariant ObjectiveTransactions of the International Society for Music Information Retrieval (TISMIR), 2025

264

02 Aug 2025

StorySync: Training-Free Subject Consistency in Text-to-Image Generation via Region Harmonization

Gopalji Gaur

Mohammadreza Zolfaghari

Thomas Brox

DiffM

159

31 Jul 2025

X-NeMo: Expressive Neural Motion Reenactment via Disentangled Latent AttentionInternational Conference on Learning Representations (ICLR), 2025

174

30 Jul 2025

Subtyping Breast Lesions via Generative Augmentation based Long-tailed Recognition in UltrasoundInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025

125

30 Jul 2025

Bi-Level Optimization for Self-Supervised AI-Generated Face Detection

148

30 Jul 2025

Generative Recommendation with Semantic IDs: A Practitioner's Handbook

120

29 Jul 2025

HDR Environment Map Estimation with Latent Diffusion Models

142

28 Jul 2025

Kernel Learning for Sample Constrained Black-Box OptimizationAAAI Conference on Artificial Intelligence (AAAI), 2025

Rajalaxmi Rajagopalan

Yu-Lin Wei

Romit Roy Choudhury

136

28 Jul 2025

Frequency-Aware Autoregressive Modeling for Efficient High-Resolution Image Synthesis

147

28 Jul 2025

MagicAnime: A Hierarchically Annotated, Multimodal and Multitasking Dataset with Benchmarks for Cartoon Animation Generation

171

27 Jul 2025

Local Prompt Adaptation for Style-Consistent Multi-Object Generation in Diffusion Models

Ankit Sanjyal

DiffM

259

27 Jul 2025

RARE: Refine Any Registration of Pairwise Point Clouds via Zero-Shot Learning

169

26 Jul 2025

A Survey on Generative Model Unlearning: Fundamentals, Taxonomy, Evaluation, and Future Direction

262

26 Jul 2025

SeeDiff: Off-the-Shelf Seeded Mask Generation from Diffusion ModelsAAAI Conference on Artificial Intelligence (AAAI), 2025

201

26 Jul 2025

SCALAR: Scale-wise Controllable Visual Autoregressive Learning

298

26 Jul 2025

KB-DMGen: Knowledge-Based Global Guidance and Dynamic Pose Masking for Human Image Generation

233

26 Jul 2025

Reconstruct or Generate: Exploring the Spectrum of Generative Modeling for Cardiac MRI

167

25 Jul 2025

A Survey of Multimodal Hallucination Evaluation and Detection

352

25 Jul 2025

Even Faster Simulations with Flow Matching: A Study of Zero Degree Calorimeter Responses

Maksymilian Wojnar

AI4CE

118

24 Jul 2025

Improving Large Vision-Language Models' Understanding for Field Data

152

24 Jul 2025

Vec2Face+ for Face Dataset Generation

212

23 Jul 2025

Lumina-mGPT 2.0: Stand-Alone AutoRegressive Image Modeling

...

208

23 Jul 2025

HarmonPaint: Harmonized Training-Free Diffusion Inpainting

172

22 Jul 2025

Scale Your Instructions: Enhance the Instruction-Following Fidelity of Unified Image Generation Model by Self-Adaptive Attention Scaling

153

22 Jul 2025

Latent Denoising Makes Good Visual Tokenizers

192

21 Jul 2025

A Practical Investigation of Spatially-Controlled Image Generation with Transformers

210

21 Jul 2025

ReDi: Rectified Discrete Flow

Jaehoon Yoo

Wonjung Kim

Seunghoon Hong

199

21 Jul 2025

Discrete Tokenization for Multimodal LLMs: A Comprehensive Survey

156

21 Jul 2025

Quantizing Text-attributed Graphs for Semantic-Structural IntegrationKnowledge Discovery and Data Mining (KDD), 2025

Jianyuan Bo

Hao Wu

Yuan Fang

296

20 Jul 2025

Aesthetics is Cheap, Show me the Text: An Empirical Evaluation of State-of-the-Art Generative Models for OCR

296

20 Jul 2025

Advances in Feed-Forward 3D Reconstruction and View Synthesis: A Survey

...

638

19 Jul 2025

DynFaceRestore: Balancing Fidelity and Quality in Diffusion-Guided Blind Face Restoration with Dynamic Blur-Level Mapping and Guidance

268

18 Jul 2025

Implementing Adaptations for Vision AutoRegressive Model

Kaif Shaikh

Franziska Boenisch

Adam Dziedzic

212

15 Jul 2025

Latent Diffusion Models with Masked AutoEncoders

203

14 Jul 2025

Vision Foundation Models as Effective Visual Tokenizers for Autoregressive Image Generation

191

11 Jul 2025

Kernel Density Steering: Inference-Time Scaling via Mode Seeking for Image Restoration

Yuyang Hu

Kangfu Mei

Mojtaba Sahraee-Ardakan

306

08 Jul 2025

ICAS: Detecting Training Data from Autoregressive Image Generative Models

135

07 Jul 2025