Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2206.10789
Cited By

Scaling Autoregressive Models for Content-Rich Text-to-Image Generation

Scaling Autoregressive Models for Content-Rich Text-to-Image Generation

22 June 2022

Vijay Vasudevan

Burcu Karagol Ayan

Jason Baldridge

ArXiv (abs)PDF HTML HuggingFace (4 upvotes)

Papers citing "Scaling Autoregressive Models for Content-Rich Text-to-Image Generation"

50 / 1,010 papers shown

A Training-Free Style-Personalization via SVD-Based Feature Decomposition

A Training-Free Style-Personalization via SVD-Based Feature Decomposition

156

0

0

06 Jul 2025

CooT: Learning to Coordinate In-Context with Coordination Transformers

CooT: Learning to Coordinate In-Context with Coordination Transformers

Hsiang-Chun Chuang

157

0

0

30 Jun 2025

How to Train your Text-to-Image Model: Evaluating Design Choices for Synthetic Training Captions

How to Train your Text-to-Image Model: Evaluating Design Choices for Synthetic Training Captions

Felix Friedrich

Kristian Kersting

178

1

0

20 Jun 2025

Reward-Agnostic Prompt Optimization for Text-to-Image Diffusion Models

Reward-Agnostic Prompt Optimization for Text-to-Image Diffusion Models

239

3

0

20 Jun 2025

Watermarking Autoregressive Image Generation

Watermarking Autoregressive Image Generation

Nikola Jovanović

Tomáš Souček

Pierre Fernandez

448

3

0

19 Jun 2025

Evolutionary Caching to Accelerate Your Off-the-Shelf Diffusion Model

Evolutionary Caching to Accelerate Your Off-the-Shelf Diffusion Model

Anirud Aggarwal

Abhinav Shrivastava

415

0

0

18 Jun 2025

FLUX.1 Kontext: Flow Matching for In-Context Image Generation and Editing in Latent Space

FLUX.1 Kontext: Flow Matching for In-Context Image Generation and Editing in Latent Space

Black Forest Labs

Stephen Batifol

Frederic Boesel

...

352

343

0

17 Jun 2025

ASMR: Augmenting Life Scenario using Large Generative Models for Robotic Action Reflection

ASMR: Augmenting Life Scenario using Large Generative Models for Robotic Action Reflection

Angel García Contreras

Koichiro Yoshino

247

2

0

16 Jun 2025

SpectralAR: Spectral Autoregressive Visual Generation

SpectralAR: Spectral Autoregressive Visual Generation

296

5

0

12 Jun 2025

LeVo: High-Quality Song Generation with Multi-Preference Alignment

LeVo: High-Quality Song Generation with Multi-Preference Alignment

Huaicheng Zhang

...

280

14

0

09 Jun 2025

CuRe: Cultural Gaps in the Long Tail of Text-to-Image Systems

Aditya Kusupati

Ramya Korlakai Vinayak

260

4

0

09 Jun 2025

OneIG-Bench: Omni-dimensional Nuanced Evaluation for Image Generation

OneIG-Bench: Omni-dimensional Nuanced Evaluation for Image Generation

450

21

0

09 Jun 2025

STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis

STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis

David Berthelot

Miguel Angel Bautista

246

13

0

06 Jun 2025

Improving AI-generated music with user-guided training

Vishwa Mohan Singh

Sai Anirudh Aryasomayajula

Ahan Chatterjee

Rifat Mehreen Amin

203

0

0

05 Jun 2025

HMAR: Efficient Hierarchical Masked Auto-Regressive Image GenerationComputer Vision and Pattern Recognition (CVPR), 2025

Hermann Kumbong

Christopher Ré

David W. Romero

217

8

0

04 Jun 2025

How Far Are We from Generating Missing Modalities with Foundation Models?

How Far Are We from Generating Missing Modalities with Foundation Models?

307

0

0

04 Jun 2025

Native-Resolution Image Synthesis

Native-Resolution Image Synthesis

315

4

0

03 Jun 2025

EDITOR: Effective and Interpretable Prompt Inversion for Text-to-Image Diffusion Models

EDITOR: Effective and Interpretable Prompt Inversion for Text-to-Image Diffusion Models

Richard Cartwright

237

0

0

03 Jun 2025

Flexiffusion: Training-Free Segment-Wise Neural Architecture Search for Efficient Diffusion Models

Flexiffusion: Training-Free Segment-Wise Neural Architecture Search for Efficient Diffusion Models

307

0

0

03 Jun 2025

Smoothed Preference Optimization via ReNoise Inversion for Aligning Diffusion Models with Varied Human Preferences

Smoothed Preference Optimization via ReNoise Inversion for Aligning Diffusion Models with Varied Human Preferences

332

5

0

03 Jun 2025

Ultra-High-Resolution Image Synthesis: Data, Method and Evaluation

Ultra-High-Resolution Image Synthesis: Data, Method and Evaluation

229

2

0

02 Jun 2025

Cycle Consistency as Reward: Learning Image-Text Alignment without Human Preferences

Cycle Consistency as Reward: Learning Image-Text Alignment without Human Preferences

412

7

0

02 Jun 2025

One-Way Ticket:Time-Independent Unified Encoder for Distilling Text-to-Image Diffusion Models

One-Way Ticket:Time-Independent Unified Encoder for Distilling Text-to-Image Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2025

Joost van de Weijer

Fahad Shahbaz Khan

259

4

0

28 May 2025

MMIG-Bench: Towards Comprehensive and Explainable Evaluation of Multi-Modal Image Generation Models

MMIG-Bench: Towards Comprehensive and Explainable Evaluation of Multi-Modal Image Generation Models

Daniel G. Aliaga

398

2

0

26 May 2025

Harnessing the Power of Training-Free Techniques in Text-to-2D Generation for Text-to-3D Generation via Score Distillation Sampling

Harnessing the Power of Training-Free Techniques in Text-to-2D Generation for Text-to-3D Generation via Score Distillation Sampling

285

0

0

26 May 2025

LlamaSeg: Image Segmentation via Autoregressive Mask Generation

LlamaSeg: Image Segmentation via Autoregressive Mask Generation

364

0

0

26 May 2025

Align Beyond Prompts: Evaluating World Knowledge Alignment in Text-to-Image Generation

Align Beyond Prompts: Evaluating World Knowledge Alignment in Text-to-Image Generation

273

0

0

24 May 2025

Rethinking Direct Preference Optimization in Diffusion Models

Rethinking Direct Preference Optimization in Diffusion Models

1.0K

0

0

24 May 2025

A Minimalist Method for Fine-tuning Text-to-Image Diffusion Models

A Minimalist Method for Fine-tuning Text-to-Image Diffusion Models

Suraj Kothawade

268

0

0

23 May 2025

Conditional Panoramic Image Generation via Masked Autoregressive Modeling

Conditional Panoramic Image Generation via Masked Autoregressive Modeling

322

3

0

22 May 2025

DetailMaster: Can Your Text-to-Image Model Handle Long Prompts?

DetailMaster: Can Your Text-to-Image Model Handle Long Prompts?

231

2

0

22 May 2025

MARché: Fast Masked Autoregressive Image Generation with Cache-Aware Attention

MARché: Fast Masked Autoregressive Image Generation with Cache-Aware Attention

Hossein Entezari Zarch

Murali Annavaram

222

0

0

22 May 2025

Replace in Translation: Boost Concept Alignment in Counterfactual Text-to-Image

Replace in Translation: Boost Concept Alignment in Counterfactual Text-to-Image

362

0

0

20 May 2025

MSDformer: Multi-scale Discrete Transformer For Time Series Generation

MSDformer: Multi-scale Discrete Transformer For Time Series Generation

249

2

0

20 May 2025

AKRMap: Adaptive Kernel Regression for Trustworthy Visualization of Cross-Modal Embeddings

AKRMap: Adaptive Kernel Regression for Trustworthy Visualization of Cross-Modal Embeddings

406

0

0

20 May 2025

Few-Step Diffusion via Score identity Distillation

Few-Step Diffusion via Score identity Distillation

340

5

0

19 May 2025

Context-Aware Autoregressive Models for Multi-Conditional Image Generation

Context-Aware Autoregressive Models for Multi-Conditional Image Generation

272

3

0

18 May 2025

LOVE: Benchmarking and Evaluating Text-to-Video Generation and Video-to-Text Interpretation

LOVE: Benchmarking and Evaluating Text-to-Video Generation and Video-to-Text Interpretation

...

459

5

0

17 May 2025

One Image is Worth a Thousand Words: A Usability Preservable Text-Image Collaborative Erasing Framework

One Image is Worth a Thousand Words: A Usability Preservable Text-Image Collaborative Erasing Framework

532

4

0

16 May 2025

Attend to Not Attended: Structure-then-Detail Token Merging for Post-training DiT Acceleration

Attend to Not Attended: Structure-then-Detail Token Merging for Post-training DiT AccelerationComputer Vision and Pattern Recognition (CVPR), 2025

316

4

0

16 May 2025

The ML.ENERGY Benchmark: Toward Automated Inference Energy Measurement and Optimization

The ML.ENERGY Benchmark: Toward Automated Inference Energy Measurement and Optimization

Mosharaf Chowdhury

669

8

0

09 May 2025

Diffusion Model Quantization: A Review

Diffusion Model Quantization: A Review

373

4

0

08 May 2025

A Preliminary Study on GPT-Image Generation Model for Image Restoration

A Preliminary Study on GPT-Image Generation Model for Image Restoration

379

2

0

08 May 2025

Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities

Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities

...

1.1K

31

0

05 May 2025

Multi-Modal Language Models as Text-to-Image Model Evaluators

Multi-Modal Language Models as Text-to-Image Model Evaluators

Reyhane Askari Hemmat

Adriana Romero-Soriano

387

1

0

01 May 2025

The Dual Power of Interpretable Token Embeddings: Jailbreaking Attacks and Defenses for Diffusion Model Unlearning

The Dual Power of Interpretable Token Embeddings: Jailbreaking Attacks and Defenses for Diffusion Model Unlearning

1.0K

0

0

30 Apr 2025

A Survey of Interactive Generative Video

A Survey of Interactive Generative Video

432

16

0

30 Apr 2025

Masked Language Prompting for Generative Data Augmentation in Few-shot Fashion Style Recognition

Masked Language Prompting for Generative Data Augmentation in Few-shot Fashion Style Recognition

Ryotaro Shimizu

275

0

0

28 Apr 2025

Open-set Anomaly Segmentation in Complex Scenarios

Open-set Anomaly Segmentation in Complex Scenarios

244

1

0

28 Apr 2025

Fast Autoregressive Models for Continuous Latent Generation

Fast Autoregressive Models for Continuous Latent Generation

248

3

0

24 Apr 2025

1 2 3 4 5 6...19 20 21