Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

5 March 2024

ArXiv (abs)PDF HTML HuggingFace (68 upvotes)

Papers citing "Scaling Rectified Flow Transformers for High-Resolution Image Synthesis"

50 / 1,247 papers shown

USB: A Comprehensive and Unified Safety Evaluation Benchmark for Multimodal Large Language Models

...

167

26 May 2025

What Changed? Detecting and Evaluating Instruction-Guided Image Edits with Multimodal Large Language Models

390

26 May 2025

Decision Flow Policy Optimization

333

26 May 2025

VisRet: Visualization Improves Knowledge-Intensive Text-to-Image Retrieval

Di Wu

Yixin Wan

Kai-Wei Chang

309

26 May 2025

HunyuanVideo-Avatar: High-Fidelity Audio-Driven Human Animation for Multiple Characters

304

26 May 2025

In-Context Brush: Zero-shot Customized Subject Insertion with Context-Aware Latent Space Manipulation

209

26 May 2025

FUDOKI: Discrete Flow-based Unified Understanding and Generation via Kinetic-Optimal Velocities

396

26 May 2025

STRICT: Stress Test of Rendering Images Containing Text

297

25 May 2025

CreatiDesign: A Unified Multi-Conditional Diffusion Transformer for Creative Graphic Design

527

25 May 2025

Enhancing Text-to-Image Diffusion Transformer via Split-Text Conditioning

274

25 May 2025

Querying Kernel Methods Suffices for Reconstructing their Training Data

217

25 May 2025

Training-free Stylized Text-to-Image Generation with Fast Inference

1.2K

25 May 2025

Fast Kernel-Space Diffusion for Remote Sensing Pansharpening

392

25 May 2025

So-Fake: Benchmarking and Explaining Social Media Image Forgery Detection

...

706

24 May 2025

Align Beyond Prompts: Evaluating World Knowledge Alignment in Text-to-Image Generation

273

24 May 2025

Localizing Knowledge in Diffusion Transformers

320

24 May 2025

OmniGenBench: A Benchmark for Omnipotent Multimodal Generation across 50+ Tasks

259

24 May 2025

OmniConsistency: Learning Style-Agnostic Consistency from Paired Stylization Data

411

24 May 2025

T2VUnlearning: A Concept Erasing Method for Text-to-Video Diffusion Models

427

23 May 2025

FLEX: A Backbone for Diffusion-Based Modeling of Spatio-temporal Physical Systems

1.0K

23 May 2025

Direct3D-S2: Gigascale 3D Generation Made Easy with Spatial Sparse Attention

...

337

23 May 2025

Scaling Image and Video Generation via Test-Time Evolutionary Search

402

23 May 2025

Co-Reinforcement Learning for Unified Multimodal Understanding and Generation

780

23 May 2025

Diffusion Classifiers Understand Compositionality, but Conditions Apply

1.3K

23 May 2025

InfLVG: Reinforce Inference-Time Consistent Long Video Generation with GRPO

563

23 May 2025

ComfyMind: Toward General-Purpose Generation via Tree-Based Planning and Reactive Feedback

209

23 May 2025

Delving into RL for Image Generation with CoT: A Study on DPO vs. GRPO

432

22 May 2025

Flow Matching based Sequential Recommender ModelInternational Joint Conference on Artificial Intelligence (IJCAI), 2025

274

22 May 2025

DetailMaster: Can Your Text-to-Image Model Handle Long Prompts?

231

22 May 2025

Creatively Upscaling Images with Global-Regional PriorsInternational Journal of Computer Vision (IJCV), 2025

383

22 May 2025

Training-Free Efficient Video Generation via Dynamic Token Carving

435

22 May 2025

Conditional Panoramic Image Generation via Masked Autoregressive Modeling

327

22 May 2025

dKV-Cache: The Cache for Diffusion Language Models

424

21 May 2025

My Face Is Mine, Not Yours: Facial Protection Against Diffusion Model Face Swapping

239

21 May 2025

Angle Domain Guidance: Latent Diffusion Requires Rotation Rather Than Extrapolation

213

21 May 2025

Harnessing Caption Detailness for Data-Efficient Text-to-Image Generation

301

21 May 2025

Riemannian Flow Matching for Brain Connectivity Matrices via Pullback Geometry

218

20 May 2025

RoPECraft: Training-Free Motion Transfer with Trajectory-Guided RoPE Optimization on Diffusion Transformers

Ahmet Berke Gokmen

Yigit Ekin

Bahri Batuhan Bilecen

Aysegül Dündar

818

19 May 2025

PiT: Progressive Diffusion Transformer

616

19 May 2025

PhySense: Sensor Placement Optimization for Accurate Physics Sensing

511

19 May 2025

Fine-tuning Quantized Neural Networks with Zeroth-order Optimization

354

19 May 2025

Synthetic History: Evaluating Visual Representations of the Past in Diffusion Models

Maria-Teresa De Rosa Palmini

Eva Cetinic

263

18 May 2025

Is Artificial Intelligence Generated Image Detection a Solved Problem?

280

18 May 2025

Video-GPT via Next Clip Diffusion

629

18 May 2025

Towards Self-Improvement of Diffusion Models via Group Preference Optimization

327

16 May 2025

Attend to Not Attended: Structure-then-Detail Token Merging for Post-training DiT AccelerationComputer Vision and Pattern Recognition (CVPR), 2025

317

16 May 2025

DRAGON: A Large-Scale Dataset of Realistic Images Generated by Diffusion Models

403

16 May 2025

DiCo: Revitalizing ConvNets for Scalable and Efficient Diffusion Modeling

363

16 May 2025

PSDiffusion: Harmonized Multi-Layer Image Generation via Layout and Appearance Alignment

305

16 May 2025

CompAlign: Improving Compositional Text-to-Image Generation with a Complex Benchmark and Fine-Grained Feedback

Yixin Wan

Kai-Wei Chang

EGVM CoGe

289

16 May 2025