v1v2v3 (latest)

Taming Transformers for High-Resolution Image Synthesis

Computer Vision and Pattern Recognition (CVPR), 2020

17 December 2020

ArXiv (abs)PDF HTML Github (6185★)

Papers citing "Taming Transformers for High-Resolution Image Synthesis"

50 / 2,404 papers shown

WorldScore: A Unified Evaluation Benchmark for World Generation

402

01 Apr 2025

Style Quantization for Data-Efficient GAN TrainingComputer Vision and Pattern Recognition (CVPR), 2025

260

31 Mar 2025

Training-Free Text-Guided Image Editing with Visual Autoregressive Model

287

31 Mar 2025

FastVAR: Linear Visual Autoregressive Modeling via Cached Token Pruning

446

30 Mar 2025

HiPART: Hierarchical Pose AutoRegressive Transformer for Occluded 3D Human Pose EstimationComputer Vision and Pattern Recognition (CVPR), 2025

270

30 Mar 2025

Beyond Synthetic Replays: Turning Diffusion Features into Few-Shot Class-Incremental Learning Knowledge

431

30 Mar 2025

LSNet: See Large, Focus SmallComputer Vision and Pattern Recognition (CVPR), 2025

304

29 Mar 2025

Exploiting Mixture-of-Experts Redundancy Unlocks Multimodal Generative Abilities

361

28 Mar 2025

Data Quality Matters: Quantifying Image Quality Impact on Machine Learning Performance

Christian Steinhauser

119

28 Mar 2025

Arch-LLM: Taming LLMs for Neural Architecture Generation via Unsupervised Discrete Representation Learning

Deshani Geethika Poddenige

248

28 Mar 2025

Evaluating Text-to-Image and Text-to-Video Synthesis with a Conditional Fréchet Distance

339

27 Mar 2025

Harmonizing Visual Representations for Unified Multimodal Understanding and Generation

988

27 Mar 2025

Can Video Diffusion Model Reconstruct 4D Geometry?

313

27 Mar 2025

Efficient Multi-Instance Generation with Janus-Pro-Dirven Prompt Parsing

299

27 Mar 2025

VBench-2.0: Advancing Video Generation Benchmark Suite for Intrinsic Faithfulness

...

339

27 Mar 2025

Beyond Words: Advancing Long-Text Image Generation via Multimodal Autoregressive Models

290

26 Mar 2025

MAR-3D: Progressive Masked Auto-regressor for High-Resolution 3D GenerationComputer Vision and Pattern Recognition (CVPR), 2025

507

26 Mar 2025

Long-Context Autoregressive Video Modeling with Next-Frame Prediction

506

25 Mar 2025

VTD-CLIP: Video-to-Text Discretization via Prompting CLIP

371

24 Mar 2025

DiffV2IR: Visible-to-Infrared Diffusion Model via Vision-Language Understanding

287

24 Mar 2025

From Fragment to One Piece: A Survey on AI-Driven Graphic Design

Xingxing Zou

Wen Zhang

Nanxuan Zhao

349

24 Mar 2025

Uncertainty-guided Perturbation for Image Super-Resolution Diffusion ModelComputer Vision and Pattern Recognition (CVPR), 2025

361

24 Mar 2025

Causal Links Between Anthropogenic Emissions and Air Pollution Dynamics in Delhi

209

24 Mar 2025

Diffusion-4K: Ultra-High-Resolution Image Synthesis with Latent Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2025

365

24 Mar 2025

Panorama Generation From NFoV Image Done RightComputer Vision and Pattern Recognition (CVPR), 2025

330

24 Mar 2025

SG-Tailor: Inter-Object Commonsense Relationship Reasoning for Scene Graph Manipulation

310

23 Mar 2025

CODA: Repurposing Continuous VAEs for Discrete Tokenization

313

22 Mar 2025

DVG-Diffusion: Dual-View Guided Diffusion Model for CT Reconstruction from X-Rays

323

22 Mar 2025

Halton Scheduler For Masked Generative Image TransformerInternational Conference on Learning Representations (ICLR), 2025

278

21 Mar 2025

ProDehaze: Prompting Diffusion Models Toward Faithful Image Dehazing

319

21 Mar 2025

Structure Is Not Enough: Leveraging Behavior for Neural Network Weight Reconstruction

370

21 Mar 2025

D2C: Unlocking the Potential of Continuous Autoregressive Image Generation with Discrete Tokens

318

21 Mar 2025

Zero-Shot Styled Text Image Generation, but Make It AutoregressiveComputer Vision and Pattern Recognition (CVPR), 2025

336

21 Mar 2025

PromptMobile: Efficient Promptus for Low Bandwidth Mobile Video StreamingAsia-Pacific Workshop on Networking (AN), 2025

265

20 Mar 2025

Tokenize Image as a Set

229

20 Mar 2025

Scale-wise Distillation of Diffusion Models

296

20 Mar 2025

Improving Autoregressive Image Generation through Coarse-to-Fine Token Prediction

Ziyao Guo

Jianchao Tan

Michael Qizhe Shieh

218

20 Mar 2025

Bridging Continuous and Discrete Tokens for Autoregressive Visual Generation

405

20 Mar 2025

LaPIG: Cross-Modal Generation of Paired Thermal and Visible Facial Images

Leyang Wang

Joice Lin

DiffM

274

20 Mar 2025

Unleashing Vecset Diffusion Model for Fast Shape Generation

...

1.1K

20 Mar 2025

CAM-Seg: A Continuous-valued Embedding Approach for Semantic Image Generation

458

19 Mar 2025

The Change You Want To Detect: Semantic Change Detection In Earth Observation With Hybrid Data GenerationComputer Vision and Pattern Recognition (CVPR), 2025

Benidir Yanis

Gonthier Nicolas

Mallet Clement

367

19 Mar 2025

Forensics-Bench: A Comprehensive Forgery Detection Benchmark Suite for Large Vision Language ModelsComputer Vision and Pattern Recognition (CVPR), 2025

425

19 Mar 2025

Generating Multimodal Driving Scenes via Next-Scene PredictionComputer Vision and Pattern Recognition (CVPR), 2025

337

19 Mar 2025

3D Engine-ready Photorealistic Avatars via Dynamic Textures

311

19 Mar 2025

MMAIF: Multi-task and Multi-degradation All-in-One for Image Fusion with Language Guidance

287

19 Mar 2025

Conjuring Positive Pairs for Efficient Unification of Representation Learning and Image Synthesis

Imanol G. Estepa

Jesús M. Rodríguez-de-Vera

Ignacio Sarasúa

Bhalaji Nagarajan

Petia Radeva

449

19 Mar 2025

Exploiting Diffusion Prior for Real-World Image Dehazing with Unpaired TrainingAAAI Conference on Artificial Intelligence (AAAI), 2025

227

19 Mar 2025

Learn Your Scales: Towards Scale-Consistent Generative Novel View Synthesis

Fereshteh Forghani

Jason J. Yu

Tristan Aumentado-Armstrong

Konstantinos G. Derpanis

Marcus A. Brubaker

DiffM

339

19 Mar 2025

Detect-and-Guide: Self-regulation of Diffusion Models for Safe Text-to-Image Generation via Guideline Token OptimizationComputer Vision and Pattern Recognition (CVPR), 2025

310

19 Mar 2025