v1v2v3v4 (latest)

Training Diffusion Models with Reinforcement Learning

International Conference on Learning Representations (ICLR), 2023

22 May 2023

ArXiv (abs)PDF HTML HuggingFace (4 upvotes)

Papers citing "Training Diffusion Models with Reinforcement Learning"

50 / 270 papers shown

Fine-Grained GRPO for Precise Preference Alignment in Flow Models

225

02 Oct 2025

Plug-and-Play Prompt Refinement via Latent Feedback for Diffusion Model Alignment

Suhyeon Lee

Jong Chul Ye

167

01 Oct 2025

DisCo: Reinforcement with Diversity Constraints for Multi-Human Generation

257

01 Oct 2025

PCPO: Proportionate Credit Policy Optimization for Aligning Image Generation Models

J. Lee

Jong Chul Ye

111

30 Sep 2025

IMG: Calibrating Diffusion Models via Implicit Multimodal Guidance

143

30 Sep 2025

Training-Free Reward-Guided Image Editing via Trajectory Optimal Control

J. Chang

Jaemin Kim

Jong Chul Ye

183

30 Sep 2025

TraceDet: Hallucination Detection from the Decoding Trace of Diffusion Large Language Models

156

30 Sep 2025

Advantage Weighted Matching: Aligning RL with Pretraining in Diffusion Models

142

29 Sep 2025

Enhancing Blind Face Restoration through Online Reinforcement Learning

432

27 Sep 2025

Follow-Your-Preference: Towards Preference-Aligned Image Inpainting

192

27 Sep 2025

RAPID^3: Tri-Level Reinforced Acceleration Policies for Diffusion Transformer

184

26 Sep 2025

MultiCrafter: High-Fidelity Multi-Subject Generation via Disentangled Attention and Identity-Aware Preference Alignment

212

26 Sep 2025

d2: Improved Techniques for Training Reasoning Diffusion Language Models

192

25 Sep 2025

DriftLite: Lightweight Drift Control for Inference-Time Scaling of Diffusion Models

194

25 Sep 2025

PIRF: Physics-Informed Reward Fine-Tuning for Diffusion Models

141

24 Sep 2025

ComposableNav: Instruction-Following Navigation in Dynamic Environments via Composable Diffusion

146

22 Sep 2025

RLGF: Reinforcement Learning with Geometric Feedback for Autonomous Driving Video Generation

282

20 Sep 2025

DiffusionNFT: Online Diffusion Reinforcement with Forward Process

241

19 Sep 2025

Enhancing Generative Auto-bidding with Offline Reward Evaluation and Policy Search

...

213

19 Sep 2025

What Makes a Good Generated Image? Investigating Human and Multimodal LLM Image Preference Alignment

187

16 Sep 2025

RewardDance: Reward Scaling in Visual Generation

...

218

10 Sep 2025

UMO: Scaling Multi-Identity Consistency for Image Customization via Matching Reward

111

08 Sep 2025

Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference

317

08 Sep 2025

Coefficients-Preserving Sampling for Reinforcement Learning with Flow Matching

Feng Wang

Zihao Yu

DiffM

256

07 Sep 2025

Moment- and Power-Spectrum-Based Gaussianity Regularization for Text-to-Image Models

Jisung Hwang

Jaihoon Kim

Minhyuk Sung

137

07 Sep 2025

BranchGRPO: Stable and Efficient GRPO with Structured Branching in Diffusion Models

281

07 Sep 2025

Diffusion Generative Models Meet Compressed Sensing, with Applications to Imaging and Finance

237

04 Sep 2025

Skywork UniPic 2.0: Building Kontext Model with Online RL for Unified Multimodal Model

...

182

04 Sep 2025

MEPG:Multi-Expert Planning and Generation for Compositionally-Rich Image Generation

Yuan Zhao

Lin Liu

DiffM MoE

206

04 Sep 2025

Connections between reinforcement learning with feedback,test-time scaling, and diffusion guidance: An anthology

129

04 Sep 2025

Relative Trajectory Balance is equivalent to Trust-PCL

157

01 Sep 2025

FocusDPO: Dynamic Preference Optimization for Multi-Subject Personalized Image Generation via Adaptive Focus

144

01 Sep 2025

The Mind's Eye: A Multi-Faceted Reward Framework for Guiding Visual Metaphor Generation

118

26 Aug 2025

Composition and Alignment of Diffusion Models using Constrained Learning

163

26 Aug 2025

Constraints-Guided Diffusion Reasoner for Neuro-Symbolic Learning

176

22 Aug 2025

Guiding Diffusion Models with Reinforcement Learning for Stable Molecule Generation

210

22 Aug 2025

Cognitive Structure Generation: From Educational Priors to Policy Optimization

155

18 Aug 2025

MDPO: Overcoming the Training-Inference Divide of Masked Diffusion Language Models

179

18 Aug 2025

Integrating Reinforcement Learning with Visual Generative Models: Foundations and Advances

315

14 Aug 2025

Object Fidelity Diffusion for Remote Sensing Image Generation

211

14 Aug 2025

TempFlow-GRPO: When Timing Matters for GRPO in Flow Models

342

06 Aug 2025

ORVIT: Near-Optimal Online Distributionally Robust Reinforcement Learning

302

05 Aug 2025

Uni-Layout: Integrating Human Feedback in Unified Layout Generation and Evaluation

149

04 Aug 2025

The Promise of RL for Autoregressive Image Editing

Saba Ahmadi

Rabiul Awal

Ankur Sikarwar

Amirhossein Kazemnejad

...

271

01 Aug 2025

MixGRPO: Unlocking Flow-based GRPO Efficiency with Mixed ODE-SDE

266

29 Jul 2025

X-Omni: Reinforcement Learning Makes Discrete Autoregressive Image Generative Models Great Again

...

177

29 Jul 2025

Multimodal LLMs as Customized Reward Models for Text-to-Image Generation

372

28 Jul 2025

Flow Matching Policy Gradients

265

28 Jul 2025

TTS-VAR: A Test-Time Scaling Framework for Visual Auto-Regressive Generation

260

24 Jul 2025

Inversion-DPO: Precise and Efficient Post-Training for Diffusion Models

371

14 Jul 2025