v1v2 (latest)

Photographic Text-to-Image Synthesis with a Hierarchically-nested Adversarial Network

26 February 2018

Papers citing "Photographic Text-to-Image Synthesis with a Hierarchically-nested Adversarial Network"

50 / 129 papers shown

Z-SASLM: Zero-Shot Style-Aligned SLI Blending Latent Manipulation

Alessio Borgi

Luca Maiano

Irene Amerini

256

29 Mar 2025

End-to-end Training for Text-to-Image Synthesis using Dual-Text Embeddings

Yeruru Asrar Ahmed

Anurag Mittal

DiffM

346

03 Feb 2025

DiT4Edit: Diffusion Transformer for Image EditingAAAI Conference on Artificial Intelligence (AAAI), 2024

347

05 Nov 2024

TAGE: Trustworthy Attribute Group Editing for Stable Few-shot Image GenerationInternational Conference on Signal Processing Systems (ICSPS), 2024

377

23 Oct 2024

ArtiFade: Learning to Generate High-quality Subject from Blemished ImagesComputer Vision and Pattern Recognition (CVPR), 2024

Kwan-Yee K. Wong

132

05 Sep 2024

Detection-Driven Object Count Optimization for Text-to-Image Diffusion Models

355

21 Aug 2024

Deep Multi-Task Learning for Malware Image ClassificationJournal of Information Security and Applications (JISA), 2022

A. Bensaoud

Jugal Kalita

283

09 May 2024

A Survey on Deep Learning and State-of-the-art Applications

Mohd Halim Mohd Noor

A. O. Ige

AILaw MLAU

271

26 Mar 2024

The Right Losses for the Right Gains: Improving the Semantic Consistency of Deep Text-to-Image Generation with Distribution-Sensitive Losses

Mahmoud Ahmed

Omer Moussa

Ismail Shaheen

Mohamed S. Abdelfattah

331

18 Dec 2023

CogCartoon: Towards Practical Story Visualization

Zhongyang Zhu

Jie Tang

DiffM

310

17 Dec 2023

Object-aware Inversion and Reassembly for Image EditingInternational Conference on Learning Representations (ICLR), 2023

Zhen Yang

Dinggang Gui

Wen Wang

Hao Chen

Bohan Zhuang

Chunhua Shen

DiffM

364

18 Oct 2023

Breaking Barriers to Creative Expression: Co-Designing and Implementing an Accessible Text-to-Image Interface

230

05 Sep 2023

RenAIssance: A Survey into AI Text-to-Image Generation in the Era of Large ModelIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

...

Pareesa Ameneh Golnari

Yuxiong He

294

02 Sep 2023

Iterative Multi-granular Image Editing using Diffusion ModelsIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Aishwarya Agarwal

Balaji Vasan Srinivasan

DiffM

351

01 Sep 2023

DreamIdentity: Improved Editability for Efficient Face-identity Preserved Image Generation

Mengqi Huang

307

01 Jul 2023

DomainStudio: Fine-Tuning Diffusion Models for Domain-Driven Image Generation using Limited DataInternational Journal of Computer Vision (IJCV), 2023

584

25 Jun 2023

Learning Profitable NFT Image Diffusions via Multiple Visual-Policy Guided Reinforcement LearningACM Multimedia (ACM MM), 2023

378

20 Jun 2023

The Big Data Myth: Using Diffusion Models for Dataset Generation to Train Deep Detection Models

299

16 Jun 2023

Vision + Language Applications: A Survey

Yutong Zhou

N. Shimada

VLM

341

24 May 2023

SceneGenie: Scene Graph Guided Diffusion Models for Image Synthesis

Nassir Navab

280

28 Apr 2023

IconShop: Text-Guided Vector Icon Synthesis with Autoregressive TransformersACM Transactions on Graphics (TOG), 2023

581

27 Apr 2023

ALR-GAN: Adaptive Layout Refinement for Text-to-Image SynthesisIEEE transactions on multimedia (IEEE TMM), 2023

199

13 Apr 2023

Gradient-Free Textual InversionACM Multimedia (ACM MM), 2023

Zhengcong Fei

Mingyuan Fan

Junshi Huang

DiffM

300

12 Apr 2023

Toward Verifiable and Reproducible Human Evaluation for Text-to-Image GenerationComputer Vision and Pattern Recognition (CVPR), 2023

Esa Rahtu

Shiníchi Satoh

255

04 Apr 2023

Discriminative Class Tokens for Text-to-Image Diffusion ModelsIEEE International Conference on Computer Vision (ICCV), 2023

Idan Schwartz

Vésteinn Snaebjarnarson

Hila Chefer

Robert Bamler

Serge Belongie

Lior Wolf

Sagie Benaim

498

30 Mar 2023

Factor Decomposed Generative Adversarial Networks for Text-to-Image Synthesis

171

24 Mar 2023

MagicFusion: Boosting Text-to-Image Generation Performance by Fusing Diffusion ModelsIEEE International Conference on Computer Vision (ICCV), 2023

Wenjing Yang

386

23 Mar 2023

Unified Multi-Modal Latent Diffusion for Joint Subject and Text Conditional Image Generation

171

16 Mar 2023

Highly Personalized Text Embedding for Image Manipulation by Stable Diffusion

357

15 Mar 2023

Fine-grained Cross-modal Fusion based Refinement for Text-to-Image SynthesisChinese journal of electronics (CJE), 2023

338

17 Feb 2023

Multi-modal Machine Learning in Engineering Design: A Review and Future DirectionsJournal of Computing and Information Science in Engineering (JCISE), 2023

429

14 Feb 2023

Attribute-Centric Compositional Text-to-Image GenerationInternational Journal of Computer Vision (IJCV), 2023

361

04 Jan 2023

One Model to Edit Them All: Free-Form Text-Driven Image Manipulation with Semantic ModulationsNeural Information Processing Systems (NeurIPS), 2022

Chun Yuan

393

14 Oct 2022

Adma-GAN: Attribute-Driven Memory Augmented GANs for Text-to-Image GenerationACM Multimedia (ACM MM), 2022

Liangli Zheng

245

28 Sep 2022

AI Illustrator: Translating Raw Descriptions into Images by Prompt-based Cross-Modal GenerationACM Multimedia (ACM MM), 2022

296

07 Sep 2022

DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven GenerationComputer Vision and Pattern Recognition (CVPR), 2022

Nataniel Ruiz

Yuanzhen Li

Varun Jampani

Yael Pritch

Michael Rubinstein

Kfir Aberman

1.5K

4,101

25 Aug 2022

Vision-Language Matching for Text-to-Image Synthesis via Generative Adversarial NetworksIEEE transactions on multimedia (IEEE TMM), 2022

188

20 Aug 2022

T-Person-GAN: Text-to-Person Image Generation with Identity-Consistency and Manifold Mix-UpExpert systems with applications (ESWA), 2022

Deyin Liu

Yang Wang

Q. Tian

Zongyuan Ge

DiffM

337

18 Aug 2022

ARMANI: Part-level Garment-Text Alignment for Unified Cross-Modal Fashion DesignACM Multimedia (ACM MM), 2022

Xujie Zhang

Yuyang Sha

Michael C. Kampffmeyer

Xiaodan Liang

227

11 Aug 2022

Prompt-to-Prompt Image Editing with Cross Attention ControlInternational Conference on Learning Representations (ICLR), 2022

Amir Hertz

Ron Mokady

J. Tenenbaum

Kfir Aberman

Yael Pritch

Daniel Cohen-Or

DiffM

976

2,554

02 Aug 2022

Diffsound: Discrete Diffusion Model for Text-to-sound GenerationIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2022

Dongchao Yang

Helin Wang

Dong Yu

360

403

20 Jul 2022

Transforming Image Generation from Scene GraphsInternational Conference on Pattern Recognition (ICPR), 2022

246

01 Jul 2022

Avocodo: Generative Adversarial Network for Artifact-free VocoderAAAI Conference on Artificial Intelligence (AAAI), 2022

319

27 Jun 2022

Improved Vector Quantized Diffusion Models

Jianmin Bao

576

31 May 2022

Text-to-Face Generation with StyleGAN2

D. M. A. Ayanthi

Sarasi Munasinghe

CVBM

165

25 May 2022

Synthetic Data -- what, why and how?

376

180

06 May 2022

DR-GAN: Distribution Regularization for Text-to-Image GenerationIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2022

213

17 Apr 2022

PixelFolder: An Efficient Progressive Pixel Synthesis Network for Image GenerationEuropean Conference on Computer Vision (ECCV), 2022

368

02 Apr 2022

One-shot Ultra-high-Resolution Generative Adversarial Network That Synthesizes 16K Images On A Single GPUImage and Vision Computing (IVC), 2022

Junseok Oh

Donghwee Yoon

Injung Kim

410

28 Feb 2022

Multimodal Image Synthesis and Editing: The Generative AI EraIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

702

27 Dec 2021