Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2403.03206
Cited By

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

5 March 2024

Frederic Boesel

ArXiv (abs)PDF HTML HuggingFace (68 upvotes)

Papers citing "Scaling Rectified Flow Transformers for High-Resolution Image Synthesis"

50 / 1,247 papers shown

Consistent Story Generation: Unlocking the Potential of Zigzag Sampling

Consistent Story Generation: Unlocking the Potential of Zigzag Sampling

Marie-Francine Moens

445

0

0

11 Jun 2025

Audio Generation Through Score-Based Generative Modeling: Design Principles and Implementation

241

3

0

10 Jun 2025

CAIRe: Cultural Attribution of Images by Retrieval-Augmented Evaluation

CAIRe: Cultural Attribution of Images by Retrieval-Augmented Evaluation

Arnav Yayavaram

Siddharth Yayavaram

249

0

0

10 Jun 2025

Bias Analysis in Unconditional Image Generative Models

Aaron Courville

189

0

0

10 Jun 2025

HunyuanVideo-HOMA: Generic Human-Object Interaction in Multimodal Driven Human Animation

...

225

5

0

10 Jun 2025

Flow Diverse and Efficient: Learning Momentum Flow Matching via Stochastic Velocity Field Sampling

235

2

0

10 Jun 2025

Edit Flows: Flow Matching with Edit Operations

Ricky T. Q. Chen

506

18

0

10 Jun 2025

FlagEvalMM: A Flexible Framework for Comprehensive Multimodal Model Evaluation

FlagEvalMM: A Flexible Framework for Comprehensive Multimodal Model Evaluation

285

2

0

10 Jun 2025

Re-Thinking the Automatic Evaluation of Image-Text Alignment in Text-to-Image Models

188

0

0

10 Jun 2025

CulturalFrames: Assessing Cultural Expectation Alignment in Text-to-Image Models and Evaluation Metrics

Lisa Anne Hendricks

Sjoerd van Steenkiste

Karolina Stañczak

Aishwarya Agrawal

395

5

0

10 Jun 2025

How Much To Guide: Revisiting Adaptive Guidance in Classifier-Free Guidance Text-to-Vision Diffusion Models

192

2

0

10 Jun 2025

Rethinking Cross-Modal Interaction in Multimodal Diffusion Transformers

Rethinking Cross-Modal Interaction in Multimodal Diffusion Transformers

Kwan-Yee K. Wong

300

5

0

09 Jun 2025

Evaluating Robustness in Latent Diffusion Models via Embedding Level Augmentation

Evaluating Robustness in Latent Diffusion Models via Embedding Level Augmentation

Boris Martirosyan

Alexey Karmanov

146

0

0

09 Jun 2025

Diffuse Everything: Multimodal Diffusion Models on Arbitrary State Spaces

Diffuse Everything: Multimodal Diffusion Models on Arbitrary State Spaces

267

11

0

09 Jun 2025

Dreamland: Controllable World Creation with Simulator and Generative Models

Dreamland: Controllable World Creation with Simulator and Generative Models

134

1

0

09 Jun 2025

Generative Modeling of Weights: Generalization or Memorization?

Generative Modeling of Weights: Generalization or Memorization?

309

4

0

09 Jun 2025

SUDER: Self-Improving Unified Large Multimodal Models for Understanding and Generation with Dual Self-Rewards

SUDER: Self-Improving Unified Large Multimodal Models for Understanding and Generation with Dual Self-Rewards

236

1

0

09 Jun 2025

Snap-and-tune: combining deep learning and test-time optimization for high-fidelity cardiovascular volumetric meshing

Danny Bluestein

James S. Duncan

229

9

0

09 Jun 2025

PairEdit: Learning Semantic Variations for Exemplar-based Image Editing

PairEdit: Learning Semantic Variations for Exemplar-based Image Editing

Aurele Tohokantche Gnanha

353

1

0

09 Jun 2025

OneIG-Bench: Omni-dimensional Nuanced Evaluation for Image Generation

OneIG-Bench: Omni-dimensional Nuanced Evaluation for Image Generation

450

21

0

09 Jun 2025

R3D2: Realistic 3D Asset Insertion via Diffusion for Autonomous Driving Simulation

R3D2: Realistic 3D Asset Insertion via Diffusion for Autonomous Driving Simulation

William Ljungbergh

Bernardo Taveira

...

Christoffer Petersson

Michael Felsberg

Masayoshi Tomizuka

227

6

0

09 Jun 2025

VIVAT: Virtuous Improving VAE Training through Artifact Mitigation

VIVAT: Virtuous Improving VAE Training through Artifact Mitigation

Viacheslav Vasilev

209

1

0

09 Jun 2025

PolyVivid: Vivid Multi-Subject Video Generation with Cross-Modal Interaction and Enhancement

PolyVivid: Vivid Multi-Subject Video Generation with Cross-Modal Interaction and Enhancement

Zhengguang Zhou

Jiangning Zhang

230

4

0

09 Jun 2025

Difference Inversion: Interpolate and Isolate the Difference with Token Consistency for Image Analogy Generation

Difference Inversion: Interpolate and Isolate the Difference with Token Consistency for Image Analogy GenerationComputer Vision and Pattern Recognition (CVPR), 2025

231

1

0

09 Jun 2025

Breaking Data Silos: Towards Open and Scalable Mobility Foundation Models via Generative Continual Learning

Breaking Data Silos: Towards Open and Scalable Mobility Foundation Models via Generative Continual Learning

196

0

0

07 Jun 2025

FontAdapter: Instant Font Adaptation in Visual Text Generation

FontAdapter: Instant Font Adaptation in Visual Text Generation

290

1

0

06 Jun 2025

STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis

STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis

David Berthelot

Miguel Angel Bautista

246

13

0

06 Jun 2025

AQUATIC-Diff: Additive Quantization for Truly Tiny Compressed Diffusion Models

AQUATIC-Diff: Additive Quantization for Truly Tiny Compressed Diffusion Models

391

0

0

06 Jun 2025

FlowDirector: Training-Free Flow Steering for Precise Text-to-Video Editing

FlowDirector: Training-Free Flow Steering for Precise Text-to-Video Editing

277

6

0

05 Jun 2025

ContentV: Efficient Training of Video Generation Models with Limited Compute

...

442

3

0

05 Jun 2025

FPSAttention: Training-Aware FP8 and Sparsity Co-Design for Fast Video Diffusion

FPSAttention: Training-Aware FP8 and Sparsity Co-Design for Fast Video Diffusion

...

Gholamreza Haffari

530

8

0

05 Jun 2025

Contrastive Flow Matching

Vivek Ramanujan

319

9

0

05 Jun 2025

Rectified Point Flow: Generic Point Cloud Pose Estimation

Rectified Point Flow: Generic Point Cloud Pose Estimation

287

3

0

05 Jun 2025

Towards Reliable Identification of Diffusion-based Image Manipulations

Towards Reliable Identification of Diffusion-based Image Manipulations

Alex Costanzino

Marc Gorriz Blanch

268

1

0

05 Jun 2025

FocusDiff: Advancing Fine-Grained Text-Image Alignment for Autoregressive Visual Generation through RL

FocusDiff: Advancing Fine-Grained Text-Image Alignment for Autoregressive Visual Generation through RL

Juncheng Billy Li

224

9

0

05 Jun 2025

DIMCIM: A Quantitative Evaluation Framework for Default-mode Diversity and Generalization in Text-to-Image Generative Models

Adriana Romero-Soriano

Matthew Muckley

352

2

0

05 Jun 2025

HuGeDiff: 3D Human Generation via Diffusion with Gaussian Splatting

Maksym Ivashechkin

213

0

0

04 Jun 2025

RAID: A Dataset for Testing the Adversarial Robustness of AI-Generated Image Detectors

RAID: A Dataset for Testing the Adversarial Robustness of AI-Generated Image Detectors

Federico Cocchi

Lorenzo Baraldi

...

Marcella Cornia

Lorenzo Baraldi

Battista Biggio

521

0

0

04 Jun 2025

Negative-Guided Subject Fidelity Optimization for Zero-Shot Subject-Driven Generation

Negative-Guided Subject Fidelity Optimization for Zero-Shot Subject-Driven Generation

356

0

0

04 Jun 2025

Resolving Task Objective Conflicts in Unified Model via Task-Aware Mixture-of-Experts

Resolving Task Objective Conflicts in Unified Model via Task-Aware Mixture-of-Experts

356

0

0

04 Jun 2025

DenseDPO: Fine-Grained Temporal Preference Optimization for Video Diffusion Models

DenseDPO: Fine-Grained Temporal Preference Optimization for Video Diffusion Models

Ivan Skorokhodov

Igor Gilitschenski

Sergey Tulyakov

Aliaksandr Siarohin

391

11

0

04 Jun 2025

DGMO: Training-Free Audio Source Separation through Diffusion-Guided Mask Optimization

DGMO: Training-Free Audio Source Separation through Diffusion-Guided Mask Optimization

Paul Hongsuck Seo

236

1

0

03 Jun 2025

Rectified Flows for Fast Multiscale Fluid Flow Modeling

Rectified Flows for Fast Multiscale Fluid Flow Modeling

Victor Armegioiu

Siddhartha Mishra

228

2

0

03 Jun 2025

Smoothed Preference Optimization via ReNoise Inversion for Aligning Diffusion Models with Varied Human Preferences

Smoothed Preference Optimization via ReNoise Inversion for Aligning Diffusion Models with Varied Human Preferences

337

5

0

03 Jun 2025

FlexPainter: Flexible and Multi-View Consistent Texture Generation

FlexPainter: Flexible and Multi-View Consistent Texture Generation

244

1

0

03 Jun 2025

EDITOR: Effective and Interpretable Prompt Inversion for Text-to-Image Diffusion Models

EDITOR: Effective and Interpretable Prompt Inversion for Text-to-Image Diffusion Models

Richard Cartwright

239

0

0

03 Jun 2025

Controllable Human-centric Keyframe Interpolation with Generative Prior

Controllable Human-centric Keyframe Interpolation with Generative Prior

Chen Change Loy

204

1

0

03 Jun 2025

DFBench: Benchmarking Deepfake Image Detection Capability of Large Multimodal Models

DFBench: Benchmarking Deepfake Image Detection Capability of Large Multimodal Models

...

246

3

0

03 Jun 2025

Rethinking Machine Unlearning in Image Generation Models

Rethinking Machine Unlearning in Image Generation Models

327

1

0

03 Jun 2025

RefEdit: A Benchmark and Method for Improving Instruction-based Image Editing Model on Referring Expressions

RefEdit: A Benchmark and Method for Improving Instruction-based Image Editing Model on Referring Expressions

Bimsara Pathiraja

177

2

0

03 Jun 2025

1 2 3...12 13 14...23 24 25

Page 13 of 25

Pageof 25