Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2402.05408
Cited By

MIGC: Multi-Instance Generation Controller for Text-to-Image Synthesis

v1v2 (latest)

MIGC: Multi-Instance Generation Controller for Text-to-Image Synthesis

8 February 2024

ArXiv (abs)PDF HTML

Papers citing "MIGC: Multi-Instance Generation Controller for Text-to-Image Synthesis"

46 / 46 papers shown

DreamingComics: A Story Visualization Pipeline via Subject and Layout Customized Generation using Video Models

DiffM AI4TS VGen

210

1

0

01 Dec 2025

SAIDO: Generalizable Detection of AI-Generated Images via Scene-Aware and Importance-Guided Dynamic Optimization in Continual Learning

121

0

0

29 Nov 2025

A Training-Free Approach for Multi-ID Customization via Attention Adjustment and Spatial Control

A Training-Free Approach for Multi-ID Customization via Attention Adjustment and Spatial Control

315

0

0

25 Nov 2025

BideDPO: Conditional Image Generation with Simultaneous Text and Condition Alignment

BideDPO: Conditional Image Generation with Simultaneous Text and Condition Alignment

225

2

0

24 Nov 2025

Are Image-to-Video Models Good Zero-Shot Image Editors?

Are Image-to-Video Models Good Zero-Shot Image Editors?

592

0

0

24 Nov 2025

DiP: Taming Diffusion Models in Pixel Space

DiP: Taming Diffusion Models in Pixel Space

Jiangning Zhang

338

3

0

24 Nov 2025

ConsistCompose: Unified Multimodal Layout Control for Image Composition

ConsistCompose: Unified Multimodal Layout Control for Image Composition

417

0

0

23 Nov 2025

Compositional Image Synthesis with Inference-Time Scaling

Compositional Image Synthesis with Inference-Time Scaling

DiffM MLLM EGVM VLM

289

0

0

28 Oct 2025

UltraHR-100K: Enhancing UHR Image Synthesis with A Large-Scale High-Quality Dataset

UltraHR-100K: Enhancing UHR Image Synthesis with A Large-Scale High-Quality Dataset

190

13

0

23 Oct 2025

ContextGen: Contextual Layout Anchoring for Identity-Consistent Multi-Instance Generation

ContextGen: Contextual Layout Anchoring for Identity-Consistent Multi-Instance Generation

240

3

0

13 Oct 2025

DragFlow: Unleashing DiT Priors with Region Based Supervision for Drag Editing

DragFlow: Unleashing DiT Priors with Region Based Supervision for Drag Editing

385

10

0

02 Oct 2025

Does FLUX Already Know How to Perform Physically Plausible Image Composition?

Does FLUX Already Know How to Perform Physically Plausible Image Composition?

323

14

0

25 Sep 2025

OverLayBench: A Benchmark for Layout-to-Image Generation with Dense Overlaps

OverLayBench: A Benchmark for Layout-to-Image Generation with Dense Overlaps

Divyansh Srivastava

178

1

0

23 Sep 2025

InstanceAssemble: Layout-Aware Image Generation via Instance Assembling Attention

InstanceAssemble: Layout-Aware Image Generation via Instance Assembling Attention

314

2

0

20 Sep 2025

Double Helix Diffusion for Cross-Domain Anomaly Image Generation

Double Helix Diffusion for Cross-Domain Anomaly Image Generation

217

0

0

16 Sep 2025

MUSE: Multi-Subject Unified Synthesis via Explicit Layout Semantic Expansion

MUSE: Multi-Subject Unified Synthesis via Explicit Layout Semantic Expansion

180

2

0

20 Aug 2025

LaRender: Training-Free Occlusion Control in Image Generation via Latent Rendering

LaRender: Training-Free Occlusion Control in Image Generation via Latent Rendering

204

3

0

11 Aug 2025

YOLO-Count: Differentiable Object Counting for Text-to-Image Generation

YOLO-Count: Differentiable Object Counting for Text-to-Image Generation

179

6

0

01 Aug 2025

LLMControl: Grounded Control of Text-to-Image Diffusion-based Synthesis with Multimodal LLMs

LLMControl: Grounded Control of Text-to-Image Diffusion-based Synthesis with Multimodal LLMs

188

0

0

26 Jul 2025

GenEscape: Hierarchical Multi-Agent Generation of Escape Room Puzzles

GenEscape: Hierarchical Multi-Agent Generation of Escape Room Puzzles

Brian L. Curless

Ira Kemelmacher-Shlizerman

215

0

0

27 Jun 2025

ControlThinker: Unveiling Latent Semantics for Controllable Image Generation through Visual Reasoning

ControlThinker: Unveiling Latent Semantics for Controllable Image Generation through Visual Reasoning

311

3

0

04 Jun 2025

Seg2Any: Open-set Segmentation-Mask-to-Image Generation with Precise Shape and Semantic Control

Seg2Any: Open-set Segmentation-Mask-to-Image Generation with Precise Shape and Semantic Control

368

2

0

31 May 2025

ISAC: Training-Free Instance-to-Semantic Attention Control for Improving Multi-Instance Generation

ISAC: Training-Free Instance-to-Semantic Attention Control for Improving Multi-Instance Generation

1.1K

0

0

27 May 2025

CreatiDesign: A Unified Multi-Conditional Diffusion Transformer for Creative Graphic Design

CreatiDesign: A Unified Multi-Conditional Diffusion Transformer for Creative Graphic Design

623

16

0

25 May 2025

Hierarchical and Step-Layer-Wise Tuning of Attention Specialty for Multi-Instance Synthesis in Diffusion Transformers

Hierarchical and Step-Layer-Wise Tuning of Attention Specialty for Multi-Instance Synthesis in Diffusion Transformers

435

1

0

14 Apr 2025

Marmot: Object-Level Self-Correction via Multi-Agent Reasoning

Marmot: Object-Level Self-Correction via Multi-Agent Reasoning

451

0

0

10 Apr 2025

TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes

TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes

740

22

0

30 Mar 2025

DreamRenderer: Taming Multi-Instance Attribute Control in Large-Scale Text-to-Image Models

DreamRenderer: Taming Multi-Instance Attribute Control in Large-Scale Text-to-Image Models

563

18

0

17 Mar 2025

PlanGen: Towards Unified Layout Planning and Image Generation in Auto-Regressive Vision Language Models

PlanGen: Towards Unified Layout Planning and Image Generation in Auto-Regressive Vision Language Models

541

8

0

13 Mar 2025

CE-SDWV: Effective and Efficient Concept Erasure for Text-to-Image Diffusion Models via a Semantic-Driven Word Vocabulary

CE-SDWV: Effective and Efficient Concept Erasure for Text-to-Image Diffusion Models via a Semantic-Driven Word Vocabulary

426

7

0

26 Jan 2025

DynamicControl: Adaptive Condition Selection for Improved Text-to-Image Generation

DynamicControl: Adaptive Condition Selection for Improved Text-to-Image Generation

...

658

4

0

04 Dec 2024

AnyEdit: Mastering Unified High-Quality Image Editing for Any Idea

AnyEdit: Mastering Unified High-Quality Image Editing for Any IdeaComputer Vision and Pattern Recognition (CVPR), 2024

Juncheng Billy Li

574

146

0

24 Nov 2024

AeroGen: Enhancing Remote Sensing Object Detection with Diffusion-Driven Data Generation

AeroGen: Enhancing Remote Sensing Object Detection with Diffusion-Driven Data GenerationComputer Vision and Pattern Recognition (CVPR), 2024

Yin Li

Deyu Meng

600

37

0

23 Nov 2024

Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances

Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to AdvancesInternational Conference on Learning Representations (ICLR), 2024

611

92

0

24 Oct 2024

The Scene Language: Representing Scenes with Programs, Words, and Embeddings

The Scene Language: Representing Scenes with Programs, Words, and EmbeddingsComputer Vision and Pattern Recognition (CVPR), 2024

530

19

0

22 Oct 2024

Layout-your-3D: Controllable and Precise 3D Generation with 2D Blueprint

Layout-your-3D: Controllable and Precise 3D Generation with 2D BlueprintInternational Conference on Learning Representations (ICLR), 2024

Ming-Hsuan Yang

352

14

0

20 Oct 2024

3DIS: Depth-Driven Decoupled Instance Synthesis for Text-to-Image Generation

3DIS: Depth-Driven Decoupled Instance Synthesis for Text-to-Image Generation

437

26

0

16 Oct 2024

IterComp: Iterative Composition-Aware Feedback Learning from Model Gallery for Text-to-Image Generation

IterComp: Iterative Composition-Aware Feedback Learning from Model Gallery for Text-to-Image GenerationInternational Conference on Learning Representations (ICLR), 2024

Xinchen Zhang

Ling Yang

Mengdi Wang

Bin Cui

368

20

0

09 Oct 2024

MIGC++: Advanced Multi-Instance Generation Controller for Image Synthesis

MIGC++: Advanced Multi-Instance Generation Controller for Image Synthesis

424

31

0

02 Jul 2024

Semantic-guided Adversarial Diffusion Model for Self-supervised Shadow
Removal

Semantic-guided Adversarial Diffusion Model for Self-supervised Shadow Removal

Weiling Cai

262

5

0

01 Jul 2024

Prompt-Consistency Image Generation (PCIG): A Unified Framework
Integrating LLMs, Knowledge Graphs, and Controllable Diffusion Models

Prompt-Consistency Image Generation (PCIG): A Unified Framework Integrating LLMs, Knowledge Graphs, and Controllable Diffusion Models

Zhan Qin

Kui Ren

251

2

0

24 Jun 2024

MS-Diffusion: Multi-subject Zero-shot Image Personalization with Layout Guidance

MS-Diffusion: Multi-subject Zero-shot Image Personalization with Layout Guidance

Wanggui He

Hao Jiang

658

112

0

11 Jun 2024

A Survey on Personalized Content Synthesis with Diffusion Models

A Survey on Personalized Content Synthesis with Diffusion ModelsMachine Intelligence Research (MIR), 2024

Zhaoxiang Zhang

667

32

0

09 May 2024

HeadStudio: Text to Animatable Head Avatars with 3D Gaussian Splatting

HeadStudio: Text to Animatable Head Avatars with 3D Gaussian Splatting

Hehe Fan

220

37

0

09 Feb 2024

Wavelet-based Fourier Information Interaction with Frequency Diffusion
Adjustment for Underwater Image Restoration

Wavelet-based Fourier Information Interaction with Frequency Diffusion Adjustment for Underwater Image RestorationComputer Vision and Pattern Recognition (CVPR), 2023

403

161

0

28 Nov 2023

LoCo: Locally Constrained Training-Free Layout-to-Image Synthesis

LoCo: Locally Constrained Training-Free Layout-to-Image Synthesis

522

19

0

21 Nov 2023

Page 1 of 1