Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2403.03206
Cited By

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

5 March 2024

Frederic Boesel

ArXiv (abs)PDF HTML HuggingFace (68 upvotes)

Papers citing "Scaling Rectified Flow Transformers for High-Resolution Image Synthesis"

50 / 1,247 papers shown

MobileI2V: Fast and High-Resolution Image-to-Video on Mobile Devices

MobileI2V: Fast and High-Resolution Image-to-Video on Mobile Devices

204

0

0

26 Nov 2025

ReDirector: Creating Any-Length Video Retakes with Rotary Camera Encoding

ReDirector: Creating Any-Length Video Retakes with Rotary Camera Encoding

190

0

0

25 Nov 2025

CREward: A Type-Specific Creativity Reward Model

CREward: A Type-Specific Creativity Reward Model

Ali Mahdavi-Amiri

105

0

0

25 Nov 2025

Restora-Flow: Mask-Guided Image Restoration with Flow Matching

Restora-Flow: Mask-Guided Image Restoration with Flow Matching

Lea Bogensperger

Simon Johannes Joham

550

0

0

25 Nov 2025

PromptMoG: Enhancing Diversity in Long-Prompt Image Generation via Prompt Embedding Mixture-of-Gaussian Sampling

PromptMoG: Enhancing Diversity in Long-Prompt Image Generation via Prompt Embedding Mixture-of-Gaussian Sampling

Teng-Fang Hsiao

185

0

0

25 Nov 2025

HiCoGen: Hierarchical Compositional Text-to-Image Generation in Diffusion Models via Reinforcement Learning

HiCoGen: Hierarchical Compositional Text-to-Image Generation in Diffusion Models via Reinforcement Learning

348

0

0

25 Nov 2025

DINO-Tok: Adapting DINO for Visual Tokenizers

DINO-Tok: Adapting DINO for Visual Tokenizers

...

192

0

0

25 Nov 2025

Training-Free Generation of Diverse and High-Fidelity Images via Prompt Semantic Space Optimization

Training-Free Generation of Diverse and High-Fidelity Images via Prompt Semantic Space Optimization

Georgios Tzimiropoulos

267

0

0

25 Nov 2025

A Training-Free Approach for Multi-ID Customization via Attention Adjustment and Spatial Control

A Training-Free Approach for Multi-ID Customization via Attention Adjustment and Spatial Control

272

0

0

25 Nov 2025

The Image as Its Own Reward: Reinforcement Learning with Adversarial Reward for Image Generation

The Image as Its Own Reward: Reinforcement Learning with Adversarial Reward for Image Generation

Mike Zheng Shou

272

0

0

25 Nov 2025

HBridge: H-Shape Bridging of Heterogeneous Experts for Unified Multimodal Understanding and Generation

HBridge: H-Shape Bridging of Heterogeneous Experts for Unified Multimodal Understanding and Generation

...

172

0

0

25 Nov 2025

EmoFeedback$^2$: Reinforcement of Continuous Emotional Image Generation via LVLM-based Reward and Textual Feedback

^2

: Reinforcement of Continuous Emotional Image Generation via LVLM-based Reward and Textual Feedback

395

1

0

25 Nov 2025

Flash-DMD: Towards High-Fidelity Few-Step Image Generation with Efficient Distillation and Joint Reinforcement Learning

Flash-DMD: Towards High-Fidelity Few-Step Image Generation with Efficient Distillation and Joint Reinforcement Learning

189

1

0

25 Nov 2025

The Consistency Critic: Correcting Inconsistencies in Generated Images via Reference-Guided Attentive Alignment

The Consistency Critic: Correcting Inconsistencies in Generated Images via Reference-Guided Attentive Alignment

Ming-Ming Cheng

Mike Zheng Shou

128

0

0

25 Nov 2025

STARFlow-V: End-to-End Video Generative Modeling with Normalizing Flows

STARFlow-V: End-to-End Video Generative Modeling with Normalizing Flows

Miguel Angel Bautista

David Berthelot

302

3

0

25 Nov 2025

Block Cascading: Training Free Acceleration of Block-Causal Video Models

Block Cascading: Training Free Acceleration of Block-Causal Video Models

Hmrishav Bandyopadhyay

Nikhil Pinnaparaju

100

1

0

25 Nov 2025

SONIC: Spectral Optimization of Noise for Inpainting with Consistency

SONIC: Spectral Optimization of Noise for Inpainting with Consistency

Shadan Namazifard

Mark J. Matthews

145

1

0

25 Nov 2025

RubricRL: Simple Generalizable Rewards for Text-to-Image Generation

RubricRL: Simple Generalizable Rewards for Text-to-Image Generation

274

0

0

25 Nov 2025

iMontage: Unified, Versatile, Highly Dynamic Many-to-many Image Generation

iMontage: Unified, Versatile, Highly Dynamic Many-to-many Image Generation

...

344

1

0

25 Nov 2025

One Attention, One Scale: Phase-Aligned Rotary Positional Embeddings for Mixed-Resolution Diffusion Transformer

One Attention, One Scale: Phase-Aligned Rotary Positional Embeddings for Mixed-Resolution Diffusion Transformer

Dimitris Samaras

89

0

0

24 Nov 2025

Large Language Models for the Summarization of Czech Documents: From History to the Present

Large Language Models for the Summarization of Czech Documents: From History to the Present

Jean-Pierre Salmon

83

0

0

24 Nov 2025

HunyuanVideo 1.5 Technical Report

HunyuanVideo 1.5 Technical Report

...

328

4

0

24 Nov 2025

Dynamic Granularity Matters: Rethinking Vision Transformers Beyond Fixed Patch Splitting

Dynamic Granularity Matters: Rethinking Vision Transformers Beyond Fixed Patch Splitting

125

0

0

24 Nov 2025

Beyond Reward Margin: Rethinking and Resolving Likelihood Displacement in Diffusion Models via Video Generation

Beyond Reward Margin: Rethinking and Resolving Likelihood Displacement in Diffusion Models via Video Generation

Tianxiang Zheng

159

0

0

24 Nov 2025

Test-Time Preference Optimization for Image Restoration

Test-Time Preference Optimization for Image Restoration

125

0

0

24 Nov 2025

ProxT2I: Efficient Reward-Guided Text-to-Image Generation via Proximal Diffusion

ProxT2I: Efficient Reward-Guided Text-to-Image Generation via Proximal Diffusion

212

0

0

24 Nov 2025

Terminal Velocity Matching

Terminal Velocity Matching

70

0

0

24 Nov 2025

DiP: Taming Diffusion Models in Pixel Space

DiP: Taming Diffusion Models in Pixel Space

Jiangning Zhang

283

0

0

24 Nov 2025

One4D: Unified 4D Generation and Reconstruction via Decoupled LoRA Control

One4D: Unified 4D Generation and Reconstruction via Decoupled LoRA Control

164

0

0

24 Nov 2025

BideDPO: Conditional Image Generation with Simultaneous Text and Condition Alignment

BideDPO: Conditional Image Generation with Simultaneous Text and Condition Alignment

196

0

0

24 Nov 2025

Are Image-to-Video Models Good Zero-Shot Image Editors?

Are Image-to-Video Models Good Zero-Shot Image Editors?

557

0

0

24 Nov 2025

Beyond Words and Pixels: A Benchmark for Implicit World Knowledge Reasoning in Generative Models

Beyond Words and Pixels: A Benchmark for Implicit World Knowledge Reasoning in Generative Models

480

0

0

23 Nov 2025

ConsistCompose: Unified Multimodal Layout Control for Image Composition

ConsistCompose: Unified Multimodal Layout Control for Image Composition

385

0

0

23 Nov 2025

Zero-Shot Video Deraining with Video Diffusion Models

Zero-Shot Video Deraining with Video Diffusion Models

Juan Luis Gonzalez

148

0

0

23 Nov 2025

CADTrack: Learning Contextual Aggregation with Deformable Alignment for Robust RGBT Tracking

CADTrack: Learning Contextual Aggregation with Deformable Alignment for Robust RGBT Tracking

124

0

0

22 Nov 2025

Plan-X: Instruct Video Generation via Semantic Planning

Plan-X: Instruct Video Generation via Semantic Planning

Guillermo Sapiro

93

0

0

22 Nov 2025

UltraFlux: Data-Model Co-Design for High-quality Native 4K Text-to-Image Generation across Diverse Aspect Ratios

UltraFlux: Data-Model Co-Design for High-quality Native 4K Text-to-Image Generation across Diverse Aspect Ratios

92

0

0

22 Nov 2025

Where Culture Fades: Revealing the Cultural Gap in Text-to-Image Generation

Where Culture Fades: Revealing the Cultural Gap in Text-to-Image Generation

...

225

0

0

21 Nov 2025

Align & Invert: Solving Inverse Problems with Diffusion and Flow-based Models via Representational Alignment

Align & Invert: Solving Inverse Problems with Diffusion and Flow-based Models via Representational Alignment

Loukas Sfountouris

Paris Giampouras

106

0

0

21 Nov 2025

Energy Scaling Laws for Diffusion Models: Quantifying Compute and Carbon Emissions in Image Generation

Energy Scaling Laws for Diffusion Models: Quantifying Compute and Carbon Emissions in Image Generation

Aniketh Iyengar

Marcin Detyniecki

192

0

0

21 Nov 2025

Designing and Generating Diverse, Equitable Face Image Datasets for Face Verification Tasks

Designing and Generating Diverse, Equitable Face Image Datasets for Face Verification Tasks

Georgia Baltsou

Ioannis Sarridis

Symeon Papadopoulos

160

0

0

21 Nov 2025

Diversity Has Always Been There in Your Visual Autoregressive Models

Diversity Has Always Been There in Your Visual Autoregressive Models

Abdelrahman M. Shaker

Fahad Shahbaz Khan

136

0

0

21 Nov 2025

RoomPlanner: Explicit Layout Planner for Easier LLM-Driven 3D Room Generation

RoomPlanner: Explicit Layout Planner for Easier LLM-Driven 3D Room Generation

222

0

0

21 Nov 2025

EvDiff: High Quality Video with an Event Camera

EvDiff: High Quality Video with an Event Camera

184

0

0

21 Nov 2025

Loomis Painter: Reconstructing the Painting Process

Loomis Painter: Reconstructing the Painting Process

Markus Pobitzer

235

0

0

21 Nov 2025

SPIDER: Spatial Image CorresponDence Estimator for Robust Calibration

SPIDER: Spatial Image CorresponDence Estimator for Robust Calibration

Abhay Kumar Yadav

Cheng-Fang Peng

81

0

0

21 Nov 2025

Saving Foundation Flow-Matching Priors for Inverse Problems

Saving Foundation Flow-Matching Priors for Inverse Problems

175

0

0

20 Nov 2025

TRIM: Scalable 3D Gaussian Diffusion Inference with Temporal and Spatial Trimming

92

1

0

20 Nov 2025

Pluggable Pruning with Contiguous Layer Distillation for Diffusion Transformers

134

0

0

20 Nov 2025

Thinking-while-Generating: Interleaving Textual Reasoning throughout Visual Generation

245

4

0

20 Nov 2025

1 2 3 4 5...23 24 25