Scaling Autoregressive Models for Content-Rich Text-to-Image Generation

22 June 2022

ArXiv (abs)PDF HTML HuggingFace (4 upvotes)

Papers citing "Scaling Autoregressive Models for Content-Rich Text-to-Image Generation"

50 / 1,010 papers shown

Inst-Inpaint: Instructing to Remove Objects with Diffusion Models

310

06 Apr 2023

Taming Encoder for Zero Fine-tuning Image Customization with Text-to-Image Diffusion Models

219

123

05 Apr 2023

GINA-3D: Learning to Generate Implicit Neural Assets in the WildComputer Vision and Pattern Recognition (CVPR), 2023

327

04 Apr 2023

Toward Verifiable and Reproducible Human Evaluation for Text-to-Image GenerationComputer Vision and Pattern Recognition (CVPR), 2023

Esa Rahtu

Shiníchi Satoh

224

04 Apr 2023

Text-Conditioned Sampling Framework for Text-to-Image Generation with Masked Generative ModelsIEEE International Conference on Computer Vision (ICCV), 2023

239

04 Apr 2023

Scientists' Perspectives on the Potential for Generative AI in their Fields

Meredith Ringel Morris

AI4CE

157

04 Apr 2023

Subject-driven Text-to-Image Generation via Apprenticeship LearningNeural Information Processing Systems (NeurIPS), 2023

921

227

01 Apr 2023

Forget-Me-Not: Learning to Forget in Text-to-Image Diffusion Models

351

260

30 Mar 2023

Discriminative Class Tokens for Text-to-Image Diffusion ModelsIEEE International Conference on Computer Vision (ICCV), 2023

Idan Schwartz

Vésteinn Snaebjarnarson

Hila Chefer

Robert Bamler

Serge Belongie

Lior Wolf

Sagie Benaim

399

30 Mar 2023

Qualitative Failures of Image Generation Models and Their Application in Detecting DeepfakesImage and Vision Computing (IVC), 2023

Ali Borji

504

29 Mar 2023

Planning with Sequence Models through Iterative Energy MinimizationInternational Conference on Learning Representations (ICLR), 2023

Patricio A. Vela

167

28 Mar 2023

Variational Distribution Learning for Unsupervised Text-to-Image GenerationComputer Vision and Pattern Recognition (CVPR), 2023

194

28 Mar 2023

StyleDiffusion: Prompt-Embedding Inversion for Text-Based Editing

Jian Yang

398

28 Mar 2023

Anti-DreamBooth: Protecting users from personalized text-to-image synthesisIEEE International Conference on Computer Vision (ICCV), 2023

Thuan Hoang Nguyen

359

134

27 Mar 2023

Text-to-Image Diffusion Models are Zero-Shot ClassifiersNeural Information Processing Systems (NeurIPS), 2023

Kevin Clark

P. Jaini

DiffM VLM

381

149

27 Mar 2023

Seer: Language Instructed Video Prediction with Latent Diffusion ModelsInternational Conference on Learning Representations (ICLR), 2023

307

27 Mar 2023

Equivariant Similarity for Vision-Language Foundation ModelsIEEE International Conference on Computer Vision (ICCV), 2023

Hanwang Zhang

Zicheng Liu

Lijuan Wang

CoGe

282

25 Mar 2023

Freestyle Layout-to-Image SynthesisComputer Vision and Pattern Recognition (CVPR), 2023

Wenjun Zhang

327

25 Mar 2023

High Fidelity Image Synthesis With Deep VAEs In Latent Space

Troy Luhman

Eric Luhman

DRL 3DV

139

23 Mar 2023

Ablating Concepts in Text-to-Image Diffusion ModelsIEEE International Conference on Computer Vision (ICCV), 2023

Jun-Yan Zhu

482

283

23 Mar 2023

DreamBooth3D: Subject-Driven Text-to-3D GenerationIEEE International Conference on Computer Vision (ICCV), 2023

Nataniel Ruiz

...

Kfir Aberman

Michael Rubinstein

Jonathan T. Barron

Yuanzhen Li

Varun Jampani

DiffM

317

268

23 Mar 2023

CoBIT: A Contrastive Bi-directional Image-Text Generation ModelInternational Conference on Learning Representations (ICLR), 2023

210

23 Mar 2023

Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video GeneratorsIEEE International Conference on Computer Vision (ICCV), 2023

308

733

23 Mar 2023

TAPS3D: Text-Guided 3D Textured Shape Generation from Pseudo SupervisionComputer Vision and Pattern Recognition (CVPR), 2023

Jiacheng Wei

Hao Wang

Jiashi Feng

Guosheng Lin

Kim-Hui Yap

150

23 Mar 2023

A Word is Worth a Thousand Pictures: Prompts as AI Design Material

Chinmay Kulkarni

Stefania Druga

Minsuk Chang

Alexander J. Fiannaca

Carrie J. Cai

Michael Terry

3DV

141

22 Mar 2023

NUWA-XL: Diffusion over Diffusion for eXtremely Long Video GenerationAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

...

Zicheng Liu

245

178

22 Mar 2023

The Prompt ArtistsCreativity & Cognition (C&C), 2023

Minsuk Chang

Stefania Druga

Alexander J. Fiannaca

162

22 Mar 2023

MAGVLT: Masked Generative Vision-and-Language TransformerComputer Vision and Pattern Recognition (CVPR), 2023

129

21 Mar 2023

TIFA: Accurate and Interpretable Text-to-Image Faithfulness Evaluation with Question AnsweringIEEE International Conference on Computer Vision (ICCV), 2023

Mari Ostendorf

337

344

21 Mar 2023

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Yu Qiao

...

Lik-Hang Lee

Yang Yang

Heng Tao Shen

In So Kweon

Choong Seon Hong

303

199

21 Mar 2023

Large AI Models in Health Informatics: Applications, Challenges, and the FutureIEEE journal of biomedical and health informatics (IEEE JBHI), 2023

...

Wu Yuan

284

185

21 Mar 2023

Localizing Object-level Shape Variations with Text-to-Image Diffusion ModelsIEEE International Conference on Computer Vision (ICCV), 2023

Daniel Cohen-Or

399

143

20 Mar 2023

Retrieving Multimodal Information for Augmented Generation: A SurveyConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

Hailin Chen

...

416

128

20 Mar 2023

Deep Image Fingerprint: Towards Low Budget Synthetic Image Detection and Model Lineage AnalysisIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Sergey Sinitsa

Ohad Fried

243

19 Mar 2023

IRGen: Generative Modeling for Image RetrievalEuropean Conference on Computer Vision (ECCV), 2023

Yidan Zhang

Ting Zhang

Dong Chen

Yujing Wang

Qi Chen

...

Fan Yang

326

17 Mar 2023

GlueGen: Plug and Play Multi-modal Encoders for X-to-image GenerationIEEE International Conference on Computer Vision (ICCV), 2023

Ran Xu

378

17 Mar 2023

HIVE: Harnessing Human Feedback for Instructional Visual EditingComputer Vision and Pattern Recognition (CVPR), 2023

...

Silvio Savarese

Ran Xu

327

163

16 Mar 2023

StylerDALLE: Language-Guided Style Transfer Using a Vector-Quantized Tokenizer of a Large-Scale Generative ModelIEEE International Conference on Computer Vision (ICCV), 2023

285

16 Mar 2023

Text-to-image Diffusion Models in Generative AI: A Survey

Chenshuang Zhang

Chaoning Zhang

Mengchun Zhang

In So Kweon

VLM

315

380

14 Mar 2023

One Transformer Fits All Distributions in Multi-Modal Diffusion at ScaleInternational Conference on Machine Learning (ICML), 2023

Hang Su

Jun Zhu

DiffM

534

177

12 Mar 2023

Scaling up GANs for Text-to-Image SynthesisComputer Vision and Pattern Recognition (CVPR), 2023

Jun-Yan Zhu

328

601

09 Mar 2023

Cones: Concept Neurons in Diffusion Models for Customized GenerationInternational Conference on Machine Learning (ICML), 2023

Jingren Zhou

300

152

09 Mar 2023

disco: a toolkit for Distributional Control of Generative ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

Germán Kruszewski

Jos Rozen

Marc Dymetman

213

08 Mar 2023

Video-P2P: Video Editing with Cross-attention ControlComputer Vision and Pattern Recognition (CVPR), 2023

391

308

08 Mar 2023

Vector Quantized Time Series Generation with a Bidirectional Prior ModelInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

Daesoo Lee

Sara Malacarne

Erlend Aune

BDL

310

08 Mar 2023

A Prompt Log Analysis of Text-to-Image Generation SystemsThe Web Conference (WWW), 2023

295

08 Mar 2023

ELODIN: Naming Concepts in Embedding Spaces

310

07 Mar 2023

Lformer: Text-to-Image Generation with L-shape Block Parallel Decoding

157

07 Mar 2023

A Complete Recipe for Diffusion Generative ModelsIEEE International Conference on Computer Vision (ICCV), 2023

Kushagra Pandey

Stephan Mandt

DiffM

207

03 Mar 2023

A Pathway Towards Responsible AI Generated ContentInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

Chen Chen

Jie Fu

Lingjuan Lyu

344

02 Mar 2023