Face0: Instantaneously Conditioning a Text-to-Image Model on a FaceACM SIGGRAPH Conference and Exhibition on Computer Graphics and Interactive Techniques in Asia (SIGGRAPH Asia), 2023

Dani Valevski

Danny Lumen

Yossi Matias

Yaniv Leviathan

DiffM VLM

181

11 Jun 2023

High-Fidelity Audio Compression with Improved RVQGANNeural Information Processing Systems (NeurIPS), 2023

294

561

11 Jun 2023

Image Vectorization: a ReviewJournal of Mathematical Sciences (J. Math. Sci.), 2023

174

10 Jun 2023

Grounded Text-to-Image Synthesis with Attention RefocusingComputer Vision and Pattern Recognition (CVPR), 2023

390

157

08 Jun 2023

Improving Tuning-Free Real Image Editing with Proximal GuidanceIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Qi Chen

...

Akash Srivastava

330

08 Jun 2023

AGIQA-3K: An Open Database for AI-Generated Image Quality Assessment

Chunyi Li

Zicheng Zhang

Haoning Wu

Wei Sun

Xiongkuo Min

Xiaohong Liu

Guangtao Zhai

Weisi Lin

EGVM

258

193

07 Jun 2023

A survey of Generative AI ApplicationsJournal of Computer Science (JCS), 2023

Roberto Gozalo-Brizuela

Eduardo C. Garrido-Merchán

3DV MedIm

382

135

05 Jun 2023

Efficient Text-Guided 3D-Aware Portrait Generation with Score Distillation Sampling on Distribution

Yujiu Yang

158

03 Jun 2023

Probabilistic Adaptation of Text-to-Video Models

Pieter Abbeel

269

02 Jun 2023

KL-Divergence Guided Temperature Sampling

192

02 Jun 2023

Insights into Closed-form IPM-GAN Discriminator Guidance for Diffusion Modeling

308

02 Jun 2023

Diffusion Self-Guidance for Controllable Image GenerationNeural Information Processing Systems (NeurIPS), 2023

Aleksander Holynski

379

345

01 Jun 2023

StyleDrop: Text-to-Image Generation in Any Style

Nataniel Ruiz

...

Yuanzhen Li

Yuan Hao

Irfan Essa

Michael Rubinstein

Dilip Krishnan

242

205

01 Jun 2023

StableRep: Synthetic Images from Text-to-Image Models Make Strong Visual Representation LearnersNeural Information Processing Systems (NeurIPS), 2023

436

205

01 Jun 2023

SnapFusion: Text-to-Image Diffusion Model on Mobile Devices within Two SecondsNeural Information Processing Systems (NeurIPS), 2023

Huan Wang

343

234

01 Jun 2023

ViCo: Plug-and-play Visual Condition for Personalized Text-to-image Generation

220

01 Jun 2023

The Hidden Language of Diffusion ModelsInternational Conference on Learning Representations (ICLR), 2023

Lior Wolf

345

01 Jun 2023

T2IAT: Measuring Valence and Stereotypical Biases in Text-to-Image GenerationAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

202

01 Jun 2023

Learning Disentangled Prompts for Compositional Image Synthesis

198

01 Jun 2023

Wuerstchen: An Efficient Architecture for Large-Scale Text-to-Image Diffusion Models

232

01 Jun 2023

Cones 2: Customizable Image Synthesis with Multiple SubjectsNeural Information Processing Systems (NeurIPS), 2023

Jingren Zhou

245

109

30 May 2023

SAVE: Spectral-Shift-Aware Adaptation of Image Diffusion Models for Text-driven Video Editing

Nazanin Rahnavard

154

30 May 2023

Controllable Text-to-Image Generation with GPT-4

Tianjun Zhang

313

29 May 2023

Mix-of-Show: Decentralized Low-Rank Adaptation for Multi-Concept Customization of Diffusion ModelsNeural Information Processing Systems (NeurIPS), 2023

...

Ying Shan

359

253

29 May 2023

Gen-L-Video: Multi-Text to Long Video Generation via Temporal Co-Denoising

Han-Jia Ye

252

124

29 May 2023

COMCAT: Towards Efficient Compression and Customization of Attention-Based Vision ModelsInternational Conference on Machine Learning (ICML), 2023

328

26 May 2023

Generating Images with Multimodal Language ModelsNeural Information Processing Systems (NeurIPS), 2023

Jing Yu Koh

Daniel Fried

Ruslan Salakhutdinov

MLLM

360

328

26 May 2023

High-Fidelity Image Compression with Score-based Generative Models

375

26 May 2023

Improved Visual Story Generation with Adaptive Context ModelingAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

234

26 May 2023

Uni-ControlNet: All-in-One Control to Text-to-Image Diffusion ModelsNeural Information Processing Systems (NeurIPS), 2023

Jianmin Bao

Lu Yuan

424

389

25 May 2023

Image as First-Order Norm+Linear Autoregression: Unveiling Mathematical Invariance

Lu Yuan

Zicheng Liu

Youzuo Lin

231

25 May 2023

Break-A-Scene: Extracting Multiple Concepts from a Single ImageACM SIGGRAPH Conference and Exhibition on Computer Graphics and Interactive Techniques in Asia (SIGGRAPH Asia), 2023

Kfir Aberman

Daniel Cohen-Or

253

241

25 May 2023