Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2403.03206
Cited By

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

5 March 2024

Frederic Boesel

ArXiv (abs)PDF HTML HuggingFace (68 upvotes)

Papers citing "Scaling Rectified Flow Transformers for High-Resolution Image Synthesis"

50 / 1,247 papers shown

Video Generators are Robot Policies

Video Generators are Robot Policies

Sruthi Sudhakar

Rares Andrei Ambrus

284

15

0

01 Aug 2025

ROVI: A VLM-LLM Re-Captioned Dataset for Open-Vocabulary Instance-Grounded Text-to-Image Generation

ROVI: A VLM-LLM Re-Captioned Dataset for Open-Vocabulary Instance-Grounded Text-to-Image Generation

159

0

0

01 Aug 2025

PixNerd: Pixel Neural Field Diffusion

PixNerd: Pixel Neural Field Diffusion

220

16

0

31 Jul 2025

UniLiP: Adapting CLIP for Unified Multimodal Understanding, Generation and Editing

UniLiP: Adapting CLIP for Unified Multimodal Understanding, Generation and Editing

234

10

0

31 Jul 2025

H-RDT: Human Manipulation Enhanced Bimanual Robotic Manipulation

H-RDT: Human Manipulation Enhanced Bimanual Robotic Manipulation

197

13

0

31 Jul 2025

One-Step Flow Policy Mirror Descent

One-Step Flow Policy Mirror Descent

258

1

0

31 Jul 2025

DivControl: Knowledge Diversion for Controllable Image Generation

DivControl: Knowledge Diversion for Controllable Image Generation

174

1

0

31 Jul 2025

On the Reliability of Vision-Language Models Under Adversarial Frequency-Domain Perturbations

On the Reliability of Vision-Language Models Under Adversarial Frequency-Domain Perturbations

Richard Hartley

210

2

0

30 Jul 2025

Enhancing Generalization in Data-free Quantization via Mixup-class Prompting

Enhancing Generalization in Data-free Quantization via Mixup-class Prompting

190

0

0

29 Jul 2025

X-Omni: Reinforcement Learning Makes Discrete Autoregressive Image Generative Models Great Again

X-Omni: Reinforcement Learning Makes Discrete Autoregressive Image Generative Models Great Again

...

177

30

0

29 Jul 2025

MixGRPO: Unlocking Flow-based GRPO Efficiency with Mixed ODE-SDE

MixGRPO: Unlocking Flow-based GRPO Efficiency with Mixed ODE-SDE

266

47

0

29 Jul 2025

Harnessing Diffusion-Yielded Score Priors for Image Restoration

Harnessing Diffusion-Yielded Score Priors for Image Restoration

Jimmy S. J. Ren

287

7

0

28 Jul 2025

JAM: A Tiny Flow-based Song Generator with Fine-grained Controllability and Aesthetic Alignment

JAM: A Tiny Flow-based Song Generator with Fine-grained Controllability and Aesthetic Alignment

Navonil Majumder

Taylor Gautreaux

Amir Ali Bagherzadeh

Dorien Herremans

182

4

0

28 Jul 2025

Investigation of Accuracy and Bias in Face Recognition Trained with Synthetic Data

Investigation of Accuracy and Bias in Face Recognition Trained with Synthetic Data

Pavel Korshunov

Christophe Ecabert

Sébastien Marcel

176

2

0

28 Jul 2025

HDR Environment Map Estimation with Latent Diffusion Models

HDR Environment Map Estimation with Latent Diffusion Models

Jean-Yves Guillemaut

143

0

0

28 Jul 2025

Fine-structure Preserved Real-world Image Super-resolution via Transfer VAE Training

Fine-structure Preserved Real-world Image Super-resolution via Transfer VAE Training

284

7

0

27 Jul 2025

ATCTrack: Aligning Target-Context Cues with Dynamic Target States for Robust Vision-Language Tracking

ATCTrack: Aligning Target-Context Cues with Dynamic Target States for Robust Vision-Language Tracking

184

3

0

26 Jul 2025

LLMControl: Grounded Control of Text-to-Image Diffusion-based Synthesis with Multimodal LLMs

LLMControl: Grounded Control of Text-to-Image Diffusion-based Synthesis with Multimodal LLMs

181

0

0

26 Jul 2025

Back to the Features: DINO as a Foundation for Video World Models

Back to the Features: DINO as a Foundation for Video World Models

Federico Baldassarre

Marc Szafraniec

Francisco Massa

Patrick Labatut

Maximilian Seitzer

Piotr Bojanowski

197

26

0

25 Jul 2025

RealisVSR: Detail-enhanced Diffusion for Real-World 4K Video Super-Resolution

RealisVSR: Detail-enhanced Diffusion for Real-World 4K Video Super-Resolution

147

1

0

25 Jul 2025

Enhancing Reward Models for High-quality Image Generation: Beyond Text-Image Alignment

Enhancing Reward Models for High-quality Image Generation: Beyond Text-Image Alignment

241

6

0

25 Jul 2025

GS-Occ3D: Scaling Vision-only Occupancy Reconstruction with Gaussian Splatting

GS-Occ3D: Scaling Vision-only Occupancy Reconstruction with Gaussian Splatting

358

3

0

25 Jul 2025

Identifying Prompted Artist Names from Generated Images

Identifying Prompted Artist Names from Generated Images

Aaron Hertzmann

177

0

0

24 Jul 2025

TTS-VAR: A Test-Time Scaling Framework for Visual Auto-Regressive Generation

TTS-VAR: A Test-Time Scaling Framework for Visual Auto-Regressive Generation

260

8

0

24 Jul 2025

TeEFusion: Blending Text Embeddings to Distill Classifier-Free Guidance

TeEFusion: Blending Text Embeddings to Distill Classifier-Free Guidance

228

0

0

24 Jul 2025

Adversarial Distribution Matching for Diffusion Distillation Towards Efficient Image and Video Synthesis

Adversarial Distribution Matching for Diffusion Distillation Towards Efficient Image and Video Synthesis

272

11

0

24 Jul 2025

Zero-Shot Dynamic Concept Personalization with Grid-Based LoRA

Zero-Shot Dynamic Concept Personalization with Grid-Based LoRA

Ekaterina Deyneka

Aliaksandr Siarohin

Sergey Tulyakov

Daniel Cohen-Or

123

3

0

23 Jul 2025

Detail++: Training-Free Detail Enhancer for Text-to-Image Diffusion Models

Detail++: Training-Free Detail Enhancer for Text-to-Image Diffusion Models

182

1

0

23 Jul 2025

Lumina-mGPT 2.0: Stand-Alone AutoRegressive Image Modeling

Lumina-mGPT 2.0: Stand-Alone AutoRegressive Image Modeling

...

211

24

0

23 Jul 2025

A Practical Investigation of Spatially-Controlled Image Generation with Transformers

A Practical Investigation of Spatially-Controlled Image Generation with Transformers

Harleen Hanspal

Petru-Daniel Tudosiu

210

0

0

21 Jul 2025

FreeCus: Free Lunch Subject-driven Customization in Diffusion Transformers

FreeCus: Free Lunch Subject-driven Customization in Diffusion Transformers

140

1

0

21 Jul 2025

Aesthetics is Cheap, Show me the Text: An Empirical Evaluation of State-of-the-Art Generative Models for OCR

Aesthetics is Cheap, Show me the Text: An Empirical Evaluation of State-of-the-Art Generative Models for OCR

296

2

0

20 Jul 2025

SegQuant: A Semantics-Aware and Generalizable Quantization Framework for Diffusion Models

SegQuant: A Semantics-Aware and Generalizable Quantization Framework for Diffusion Models

364

0

0

20 Jul 2025

PositionIC: Unified Position and Identity Consistency for Image Customization

PositionIC: Unified Position and Identity Consistency for Image Customization

364

2

0

18 Jul 2025

Imbalance in Balance: Online Concept Balancing in Generation Models

Imbalance in Balance: Online Concept Balancing in Generation Models

216

0

0

17 Jul 2025

VITA: Vision-to-Action Flow Matching Policy

VITA: Vision-to-Action Flow Matching Policy

219

3

0

17 Jul 2025

Taming Diffusion Transformer for Efficient Mobile Video Generation in Seconds

Taming Diffusion Transformer for Efficient Mobile Video Generation in Seconds

Ivan Skorokhodov

...

Aliaksandr Siarohin

Dhritiman Sagar

Sergey Tulyakov

256

1

0

17 Jul 2025

Cameras as Relative Positional Encoding

Cameras as Relative Positional Encoding

Angjoo Kanazawa

246

20

0

14 Jul 2025

Flows and Diffusions on the Neural Manifold

Flows and Diffusions on the Neural Manifold

252

2

0

14 Jul 2025

MP1: MeanFlow Tames Policy Learning in 1-step for Robotic Manipulation

MP1: MeanFlow Tames Policy Learning in 1-step for Robotic Manipulation

265

5

0

14 Jul 2025

Latent Diffusion Models with Masked AutoEncoders

Latent Diffusion Models with Masked AutoEncoders

207

5

0

14 Jul 2025

From Wardrobe to Canvas: Wardrobe Polyptych LoRA for Part-level Controllable Human Image Generation

From Wardrobe to Canvas: Wardrobe Polyptych LoRA for Part-level Controllable Human Image Generation

286

0

0

14 Jul 2025

CADmium: Fine-Tuning Code Language Models for Text-Driven Sequential CAD Design

CADmium: Fine-Tuning Code Language Models for Text-Driven Sequential CAD Design

Prashant Govindarajan

Davide Baldelli

Quentin Fournier

129

7

0

13 Jul 2025

Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers

Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers

209

6

0

11 Jul 2025

Divergence Minimization Preference Optimization for Diffusion Model Alignment

Divergence Minimization Preference Optimization for Diffusion Model Alignment

272

2

0

10 Jul 2025

ADIEE: Automatic Dataset Creation and Scorer for Instruction-Guided Image Editing Evaluation

ADIEE: Automatic Dataset Creation and Scorer for Instruction-Guided Image Editing Evaluation

241

3

0

09 Jul 2025

Scaling can lead to compositional generalization

Scaling can lead to compositional generalization

Florian Redhardt

208

0

0

09 Jul 2025

Bridging the Last Mile of Prediction: Enhancing Time Series Forecasting with Conditional Guided Flow Matching

Bridging the Last Mile of Prediction: Enhancing Time Series Forecasting with Conditional Guided Flow Matching

268

1

0

09 Jul 2025

Concept-TRAK: Understanding how diffusion models learn concepts through concept-level attribution

Concept-TRAK: Understanding how diffusion models learn concepts through concept-level attribution

Satoshi Hayakawa

Wei-Hsiang Liao

226

1

0

09 Jul 2025

Integrating Diffusion-based Multi-task Learning with Online Reinforcement Learning for Robust Quadruped Robot Control

Integrating Diffusion-based Multi-task Learning with Online Reinforcement Learning for Robust Quadruped Robot Control

235

2

0

08 Jul 2025

1 2 3...10 11 12...23 24 25

Page 11 of 25

Pageof 25