Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2403.03206
Cited By

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

5 March 2024

Frederic Boesel

ArXiv (abs)PDF HTML HuggingFace (68 upvotes)

Papers citing "Scaling Rectified Flow Transformers for High-Resolution Image Synthesis"

50 / 1,247 papers shown

RynnVLA-001: Using Human Demonstrations to Improve Robot Manipulation

RynnVLA-001: Using Human Demonstrations to Improve Robot Manipulation

...

95

8

0

18 Sep 2025

LowDiff: Efficient Diffusion Sampling with Low-Resolution Condition

LowDiff: Efficient Diffusion Sampling with Low-Resolution Condition

156

0

0

18 Sep 2025

Radiology Report Conditional 3D CT Generation with Multi Encoder Latent diffusion Model

Radiology Report Conditional 3D CT Generation with Multi Encoder Latent diffusion Model

Zohaib Salahuddin

Henry C. Woodruff

Philippe Lambin

129

0

0

18 Sep 2025

FlowCast-ODE: Continuous Hourly Weather Forecasting with Dynamic Flow Matching and ODE Solver

FlowCast-ODE: Continuous Hourly Weather Forecasting with Dynamic Flow Matching and ODE Solver

Shuangshuang He

174

0

0

18 Sep 2025

MultiEdit: Advancing Instruction-based Image Editing on Diverse and Challenging Tasks

MultiEdit: Advancing Instruction-based Image Editing on Diverse and Challenging Tasks

144

0

0

18 Sep 2025

AToken: A Unified Tokenizer for Vision

AToken: A Unified Tokenizer for Vision

236

7

0

17 Sep 2025

BiasMap: Leveraging Cross-Attentions to Discover and Mitigate Hidden Social Biases in Text-to-Image Generation

BiasMap: Leveraging Cross-Attentions to Discover and Mitigate Hidden Social Biases in Text-to-Image Generation

Rajatsubhra Chakraborty

109

0

0

16 Sep 2025

LazyDrag: Enabling Stable Drag-Based Editing on Multi-Modal Diffusion Transformers via Explicit Correspondence

LazyDrag: Enabling Stable Drag-Based Editing on Multi-Modal Diffusion Transformers via Explicit Correspondence

208

1

0

15 Sep 2025

Beyond Sliders: Mastering the Art of Diffusion-based Image Manipulation

Beyond Sliders: Mastering the Art of Diffusion-based Image Manipulation

151

0

0

14 Sep 2025

TrueSkin: Towards Fair and Accurate Skin Tone Recognition and Generation

TrueSkin: Towards Fair and Accurate Skin Tone Recognition and Generation

110

1

0

13 Sep 2025

MagicMirror: A Large-Scale Dataset and Benchmark for Fine-Grained Artifacts Assessment in Text-to-Image Generation

MagicMirror: A Large-Scale Dataset and Benchmark for Fine-Grained Artifacts Assessment in Text-to-Image Generation

194

1

0

12 Sep 2025

Unified Multimodal Model as Auto-Encoder

Unified Multimodal Model as Auto-Encoder

...

326

1

0

11 Sep 2025

FLUX-Reason-6M & PRISM-Bench: A Million-Scale Text-to-Image Reasoning Dataset and Comprehensive Benchmark

FLUX-Reason-6M & PRISM-Bench: A Million-Scale Text-to-Image Reasoning Dataset and Comprehensive Benchmark

EGVM VGen ReLM LRM

227

14

0

11 Sep 2025

RewardDance: Reward Scaling in Visual Generation

RewardDance: Reward Scaling in Visual Generation

...

218

20

0

10 Sep 2025

Integrating Anatomical Priors into a Causal Diffusion Model

Integrating Anatomical Priors into a Causal Diffusion Model

142

0

0

10 Sep 2025

Universal Few-Shot Spatial Control for Diffusion Models

Universal Few-Shot Spatial Control for Diffusion Models

109

0

0

09 Sep 2025

ANYPORTAL: Zero-Shot Consistent Video Background Replacement

ANYPORTAL: Zero-Shot Consistent Video Background Replacement

141

1

0

09 Sep 2025

Testing chatbots on the creation of encoders for audio conditioned image generation

Testing chatbots on the creation of encoders for audio conditioned image generation

Miguel Carrasco

156

0

0

09 Sep 2025

RaC: Robot Learning for Long-Horizon Tasks by Scaling Recovery and Correction

RaC: Robot Learning for Long-Horizon Tasks by Scaling Recovery and Correction

Zackory Erickson

122

8

0

09 Sep 2025

SplatFill: 3D Scene Inpainting via Depth-Guided Gaussian Splatting

SplatFill: 3D Scene Inpainting via Depth-Guided Gaussian Splatting

Mahtab Dahaghin

Milind G. Padalkar

Alessio Del Bue

126

0

0

09 Sep 2025

Reconstruction Alignment Improves Unified Multimodal Models

Reconstruction Alignment Improves Unified Multimodal Models

Luke Zettlemoyer

218

15

0

08 Sep 2025

MeanFlow-Accelerated Multimodal Video-to-Audio Synthesis via One-Step Generation

MeanFlow-Accelerated Multimodal Video-to-Audio Synthesis via One-Step Generation

129

0

0

08 Sep 2025

LLaDA-VLA: Vision Language Diffusion Action Models

LLaDA-VLA: Vision Language Diffusion Action Models

207

8

0

08 Sep 2025

UMO: Scaling Multi-Identity Consistency for Image Customization via Matching Reward

UMO: Scaling Multi-Identity Consistency for Image Customization via Matching Reward

104

6

0

08 Sep 2025

Interleaving Reasoning for Better Text-to-Image Generation

Interleaving Reasoning for Better Text-to-Image Generation

...

244

11

0

08 Sep 2025

Coefficients-Preserving Sampling for Reinforcement Learning with Flow Matching

Coefficients-Preserving Sampling for Reinforcement Learning with Flow Matching

255

12

0

07 Sep 2025

Moment- and Power-Spectrum-Based Gaussianity Regularization for Text-to-Image Models

Moment- and Power-Spectrum-Based Gaussianity Regularization for Text-to-Image Models

127

0

0

07 Sep 2025

DreamAudio: Customized Text-to-Audio Generation with Diffusion Models

DreamAudio: Customized Text-to-Audio Generation with Diffusion Models

Mark D. Plumbley

136

1

0

07 Sep 2025

Effectively obtaining acoustic, visual and textual data from videos

Effectively obtaining acoustic, visual and textual data from videos

Miguel Carrasco

135

1

0

06 Sep 2025

Diffusion Secant Alignment for Score-Based Density Ratio Estimation

Diffusion Secant Alignment for Score-Based Density Ratio Estimation

188

0

0

05 Sep 2025

FLOWER: Democratizing Generalist Robot Policies with Efficient Vision-Language-Action Flow Policies

FLOWER: Democratizing Generalist Robot Policies with Efficient Vision-Language-Action Flow Policies

Ömer Erdinç Yagmurlu

Rudolf Lioutikov

162

16

0

05 Sep 2025

Skywork UniPic 2.0: Building Kontext Model with Online RL for Unified Multimodal Model

Skywork UniPic 2.0: Building Kontext Model with Online RL for Unified Multimodal Model

...

182

12

0

04 Sep 2025

Transition Models: Rethinking the Generative Learning Objective

Transition Models: Rethinking the Generative Learning Objective

159

10

0

04 Sep 2025

Hyper Diffusion Avatars: Dynamic Human Avatar Generation using Network Weight Space Diffusion

Florian Bernard

204

1

0

04 Sep 2025

Plotñ Polish: Zero-shot Story Visualization and Disentangled Editing with Text-to-Image Diffusion Models

Plotñ Polish: Zero-shot Story Visualization and Disentangled Editing with Text-to-Image Diffusion Models

129

0

0

04 Sep 2025

PromptEnhancer: A Simple Approach to Enhance Text-to-Image Models via Chain-of-Thought Prompt Rewriting

PromptEnhancer: A Simple Approach to Enhance Text-to-Image Models via Chain-of-Thought Prompt Rewriting

...

363

10

0

04 Sep 2025

MEPG:Multi-Expert Planning and Generation for Compositionally-Rich Image Generation

MEPG:Multi-Expert Planning and Generation for Compositionally-Rich Image Generation

191

0

0

04 Sep 2025

OneCAT: Decoder-Only Auto-Regressive Model for Unified Understanding and Generation

OneCAT: Decoder-Only Auto-Regressive Model for Unified Understanding and Generation

364

12

0

03 Sep 2025

Easier Painting Than Thinking: Can Text-to-Image Models Set the Stage, but Not Direct the Play?

Easier Painting Than Thinking: Can Text-to-Image Models Set the Stage, but Not Direct the Play?

315

6

0

03 Sep 2025

Distribution estimation via Flow Matching with Lipschitz guarantees

Distribution estimation via Flow Matching with Lipschitz guarantees

130

2

0

02 Sep 2025

MOSAIC: Multi-Subject Personalized Generation via Correspondence-Aware Alignment and Disentanglement

MOSAIC: Multi-Subject Personalized Generation via Correspondence-Aware Alignment and Disentanglement

121

2

0

02 Sep 2025

InfoScale: Unleashing Training-free Variable-scaled Image Generation via Effective Utilization of Information

InfoScale: Unleashing Training-free Variable-scaled Image Generation via Effective Utilization of Information

301

0

0

01 Sep 2025

ManiFlow: A General Robot Manipulation Policy via Consistency Flow Training

ManiFlow: A General Robot Manipulation Policy via Consistency Flow Training

...

145

6

0

01 Sep 2025

FantasyHSI: Video-Generation-Centric 4D Human Synthesis In Any Scene through A Graph-based Multi-Agent Framework

FantasyHSI: Video-Generation-Centric 4D Human Synthesis In Any Scene through A Graph-based Multi-Agent Framework

152

0

0

01 Sep 2025

GPSToken: Gaussian Parameterized Spatially-adaptive Tokenization for Image Representation and Generation

GPSToken: Gaussian Parameterized Spatially-adaptive Tokenization for Image Representation and Generation

Zhengqiang Zhang

277

2

0

01 Sep 2025

Delta Velocity Rectified Flow for Text-to-Image Editing

Delta Velocity Rectified Flow for Text-to-Image Editing

Gaspard Beaudouin

233

1

0

01 Sep 2025

Identity-Preserving Text-to-Video Generation via Training-Free Prompt, Image, and Guidance Enhancement

Identity-Preserving Text-to-Video Generation via Training-Free Prompt, Image, and Guidance Enhancement

141

2

0

01 Sep 2025

Mixture of Global and Local Experts with Diffusion Transformer for Controllable Face Generation

Mixture of Global and Local Experts with Diffusion Transformer for Controllable Face Generation

191

0

0

30 Aug 2025

Domain Generalization in-the-Wild: Disentangling Classification from Domain-Aware Representations

Domain Generalization in-the-Wild: Disentangling Classification from Domain-Aware Representations

233

0

0

29 Aug 2025

Reusing Computation in Text-to-Image Diffusion for Efficient Generation of Image Sets

Reusing Computation in Text-to-Image Diffusion for Efficient Generation of Image Sets

Thibault Groueix

Vladimir G. Kim

Matheus Gadelha

137

0

0

28 Aug 2025

1 2 3...7 8 9...23 24 25