Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2403.03206
Cited By

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

5 March 2024

Frederic Boesel

ArXiv (abs)PDF HTML HuggingFace (68 upvotes)

Papers citing "Scaling Rectified Flow Transformers for High-Resolution Image Synthesis"

50 / 1,247 papers shown

A Unified Multi-Agent Framework for Universal Multimodal Understanding and Generation

A Unified Multi-Agent Framework for Universal Multimodal Understanding and Generation

106

1

0

14 Aug 2025

Gen-AFFECT: Generation of Avatar Fine-grained Facial Expressions with Consistent identiTy

Rupayan Mallick

Sarah Adel Bargal

83

0

0

13 Aug 2025

MangaDiT: Reference-Guided Line Art Colorization with Hierarchical Attention in Diffusion Transformers

MangaDiT: Reference-Guided Line Art Colorization with Hierarchical Attention in Diffusion Transformers

90

0

0

13 Aug 2025

A Survey on 3D Gaussian Splatting Applications: Segmentation, Editing, and Generation

A Survey on 3D Gaussian Splatting Applications: Segmentation, Editing, and Generation

293

9

0

13 Aug 2025

OneVAE: Joint Discrete and Continuous Optimization Helps Discrete Video VAE Train Better

OneVAE: Joint Discrete and Continuous Optimization Helps Discrete Video VAE Train Better

...

Ming-Ming Cheng

210

1

0

13 Aug 2025

Edge General Intelligence Through World Models and Agentic AI: Fundamentals, Solutions, and Challenges

Edge General Intelligence Through World Models and Agentic AI: Fundamentals, Solutions, and Challenges

...

209

5

0

13 Aug 2025

Lay2Story: Extending Diffusion Transformers for Layout-Togglable Story Generation

Lay2Story: Extending Diffusion Transformers for Layout-Togglable Story Generation

162

5

0

12 Aug 2025

Per-Query Visual Concept Learning

Per-Query Visual Concept Learning

114

0

0

12 Aug 2025

Stand-In: A Lightweight and Plug-and-Play Identity Control for Video Generation

Stand-In: A Lightweight and Plug-and-Play Identity Control for Video Generation

Zheng-Peng Duan

179

5

0

11 Aug 2025

Generative Video Matting

Generative Video Matting

104

2

0

11 Aug 2025

Enhancing Small-Scale Dataset Expansion with Triplet-Connection-based Sample Re-Weighting

Enhancing Small-Scale Dataset Expansion with Triplet-Connection-based Sample Re-Weighting

139

0

0

11 Aug 2025

VSF: Simple, Efficient, and Effective Negative Guidance in Few-Step Image Generation Models By Value Sign Flip

VSF: Simple, Efficient, and Effective Negative Guidance in Few-Step Image Generation Models By Value Sign Flip

452

1

0

11 Aug 2025

Learning User Preferences for Image Generation Model

Learning User Preferences for Image Generation Model

88

2

0

11 Aug 2025

TBAC-UniImage: Unified Understanding and Generation by Ladder-Side Diffusion Tuning

TBAC-UniImage: Unified Understanding and Generation by Ladder-Side Diffusion Tuning

229

5

0

11 Aug 2025

OMGSR: You Only Need One Mid-timestep Guidance for Real-World Image Super-Resolution

OMGSR: You Only Need One Mid-timestep Guidance for Real-World Image Super-Resolution

116

1

0

11 Aug 2025

X2Edit: Revisiting Arbitrary-Instruction Image Editing through Self-Constructed Data and Task-Aware Representation Learning

X2Edit: Revisiting Arbitrary-Instruction Image Editing through Self-Constructed Data and Task-Aware Representation Learning

156

5

0

11 Aug 2025

Score Augmentation for Diffusion Models

Score Augmentation for Diffusion Models

129

0

0

11 Aug 2025

Exploring Multimodal Diffusion Transformers for Enhanced Prompt-based Image Editing

Exploring Multimodal Diffusion Transformers for Enhanced Prompt-based Image Editing

122

4

0

11 Aug 2025

Consistent and Controllable Image Animation with Motion Linear Diffusion Transformers

Consistent and Controllable Image Animation with Motion Linear Diffusion Transformers

160

0

0

10 Aug 2025

DCoAR: Deep Concept Injection into Unified Autoregressive Models for Personalized Text-to-Image Generation

DCoAR: Deep Concept Injection into Unified Autoregressive Models for Personalized Text-to-Image Generation

134

0

0

10 Aug 2025

HiMat: DiT-based Ultra-High Resolution SVBRDF Generation

HiMat: DiT-based Ultra-High Resolution SVBRDF Generation

227

0

0

09 Aug 2025

MultiRef: Controllable Image Generation with Multiple Visual References

MultiRef: Controllable Image Generation with Multiple Visual References

288

2

0

09 Aug 2025

CannyEdit: Selective Canny Control and Dual-Prompt Guidance for Training-Free Image Editing

CannyEdit: Selective Canny Control and Dual-Prompt Guidance for Training-Free Image Editing

Yongxiang Huang

203

0

0

09 Aug 2025

Towards High-Order Mean Flow Generative Models: Feasibility, Expressivity, and Provably Efficient Criteria

Towards High-Order Mean Flow Generative Models: Feasibility, Expressivity, and Provably Efficient Criteria

174

7

0

09 Aug 2025

SwiftVideo: A Unified Framework for Few-Step Video Generation through Trajectory-Distribution Alignment

SwiftVideo: A Unified Framework for Few-Step Video Generation through Trajectory-Distribution Alignment

161

3

0

08 Aug 2025

Diffusion LLMs Can Do Faster-Than-AR Inference via Discrete Diffusion Forcing

Diffusion LLMs Can Do Faster-Than-AR Inference via Discrete Diffusion Forcing

170

31

0

08 Aug 2025

MeanAudio: Fast and Faithful Text-to-Audio Generation with Mean Flows

MeanAudio: Fast and Faithful Text-to-Audio Generation with Mean Flows

259

2

0

08 Aug 2025

WeTok: Powerful Discrete Tokenization for High-Fidelity Visual Reconstruction

WeTok: Powerful Discrete Tokenization for High-Fidelity Visual Reconstruction

224

2

0

07 Aug 2025

MAISI-v2: Accelerated 3D High-Resolution Medical Image Synthesis with Rectified Flow and Region-specific Contrastive Loss

MAISI-v2: Accelerated 3D High-Resolution Medical Image Synthesis with Rectified Flow and Region-specific Contrastive Loss

Benjamin D. Simon

Stephanie Harmon

82

3

0

07 Aug 2025

DualMat: PBR Material Estimation via Coherent Dual-Path Diffusion

DualMat: PBR Material Estimation via Coherent Dual-Path Diffusion

113

1

0

07 Aug 2025

UNCAGE: Contrastive Attention Guidance for Masked Generative Transformers in Text-to-Image Generation

UNCAGE: Contrastive Attention Guidance for Masked Generative Transformers in Text-to-Image Generation

180

0

0

07 Aug 2025

Voost: A Unified and Scalable Diffusion Transformer for Bidirectional Virtual Try-On and Try-Off

Voost: A Unified and Scalable Diffusion Transformer for Bidirectional Virtual Try-On and Try-Off

237

1

0

06 Aug 2025

HierarchicalPrune: Position-Aware Compression for Large-Scale Diffusion Models

HierarchicalPrune: Position-Aware Compression for Large-Scale Diffusion Models

S. Bhattacharya

Stylianos I. Venieris

168

2

0

06 Aug 2025

TempFlow-GRPO: When Timing Matters for GRPO in Flow Models

TempFlow-GRPO: When Timing Matters for GRPO in Flow Models

342

25

0

06 Aug 2025

SonicMaster: Towards Controllable All-in-One Music Restoration and Mastering

SonicMaster: Towards Controllable All-in-One Music Restoration and Mastering

J. Melechovský

Dorien Herremans

185

2

0

05 Aug 2025

Injecting Measurement Information Yields a Fast and Noise-Robust Diffusion-Based Inverse Problem Solver

Injecting Measurement Information Yields a Fast and Noise-Robust Diffusion-Based Inverse Problem Solver

332

0

0

05 Aug 2025

RAAG: Ratio Aware Adaptive Guidance

RAAG: Ratio Aware Adaptive Guidance

229

1

0

05 Aug 2025

Draw Your Mind: Personalized Generation via Condition-Level Modeling in Text-to-Image Diffusion Models

Draw Your Mind: Personalized Generation via Condition-Level Modeling in Text-to-Image Diffusion Models

130

1

0

05 Aug 2025

LORE: Latent Optimization for Precise Semantic Control in Rectified Flow-based Image Editing

LORE: Latent Optimization for Precise Semantic Control in Rectified Flow-based Image Editing

Liangyang Ouyang

204

1

0

05 Aug 2025

Likelihood Matching for Diffusion Models

Likelihood Matching for Diffusion Models

158

0

0

05 Aug 2025

READ: Real-time and Efficient Asynchronous Diffusion for Audio-driven Talking Head Generation

READ: Real-time and Efficient Asynchronous Diffusion for Audio-driven Talking Head Generation

297

1

0

05 Aug 2025

UniEdit-I: Training-free Image Editing for Unified VLM via Iterative Understanding, Editing and Verifying

UniEdit-I: Training-free Image Editing for Unified VLM via Iterative Understanding, Editing and Verifying

Shanghang Zhang

185

1

0

05 Aug 2025

DreamPainter: Image Background Inpainting for E-commerce Scenarios

DreamPainter: Image Background Inpainting for E-commerce Scenarios

114

0

0

04 Aug 2025

StrandDesigner: Towards Practical Strand Generation with Sketch Guidance

StrandDesigner: Towards Practical Strand Generation with Sketch Guidance

Jiangning Zhang

92

0

0

03 Aug 2025

The Promise of RL for Autoregressive Image Editing

The Promise of RL for Autoregressive Image Editing

Amirhossein Kazemnejad

...

Aishwarya Agrawal

271

2

0

01 Aug 2025

AudioGen-Omni: A Unified Multimodal Diffusion Transformer for Video-Synchronized Audio, Speech, and Song Generation

AudioGen-Omni: A Unified Multimodal Diffusion Transformer for Video-Synchronized Audio, Speech, and Song Generation

757

8

0

01 Aug 2025

DC-AE 1.5: Accelerating Diffusion Model Convergence with Structured Latent Space

DC-AE 1.5: Accelerating Diffusion Model Convergence with Structured Latent Space

185

16

0

01 Aug 2025

SDMatte: Grafting Diffusion Models for Interactive Matting

SDMatte: Grafting Diffusion Models for Interactive Matting

225

2

0

01 Aug 2025

FMPlug: Plug-In Foundation Flow-Matching Priors for Inverse Problems

FMPlug: Plug-In Foundation Flow-Matching Priors for Inverse Problems

175

1

0

01 Aug 2025

SpA2V: Harnessing Spatial Auditory Cues for Audio-driven Spatially-aware Video Generation

SpA2V: Harnessing Spatial Auditory Cues for Audio-driven Spatially-aware Video Generation

1.1K

1

0

01 Aug 2025

1 2 3...9 10 11...23 24 25

Page 10 of 25

Pageof 25