v1v2v3v4 (latest)

Training Diffusion Models with Reinforcement Learning

International Conference on Learning Representations (ICLR), 2023

22 May 2023

ArXiv (abs)PDF HTML HuggingFace (4 upvotes)

Papers citing "Training Diffusion Models with Reinforcement Learning"

50 / 268 papers shown

Inference-Time Scaling of Diffusion Language Models with Particle Gibbs Sampling

111

11 Jul 2025

Divergence Minimization Preference Optimization for Diffusion Model Alignment

267

10 Jul 2025

Discrete Diffusion Trajectory Alignment via Stepwise Decomposition

181

07 Jul 2025

Interactive Groupwise Comparison for Reinforcement Learning from Human Feedback

169

06 Jul 2025

Iterative Distillation for Reward-Guided Fine-Tuning of Diffusion Models in Biomolecular Design

182

01 Jul 2025

Nabla-R2D3: Effective and Efficient 3D Diffusion Alignment with 2D Rewards

255

18 Jun 2025

Where and How to Perturb: On the Design of Perturbation Guidance in Diffusion and Flow Models

470

12 Jun 2025

ReGuidance: A Simple Diffusion Wrapper for Boosting Sample Quality on Hard Inverse Problems

Aayush Karan

Kulin Shah

Sitan Chen

293

12 Jun 2025

Rethinking Cross-Modal Interaction in Multimodal Diffusion Transformers

288

09 Jun 2025

AssetDropper: Asset Extraction via Diffusion Models with Reward-Driven Optimization

188

06 Jun 2025

When Models Know More Than They Can Explain: Quantifying Knowledge Transfer in Human-AI Collaboration

328

05 Jun 2025

DenseDPO: Fine-Grained Temporal Preference Optimization for Video Diffusion Models

389

04 Jun 2025

Smoothed Preference Optimization via ReNoise Inversion for Aligning Diffusion Models with Varied Human Preferences

332

03 Jun 2025

Cycle Consistency as Reward: Learning Image-Text Alignment without Human Preferences

412

02 Jun 2025

Psi-Sampler: Initial Particle Sampling for SMC-Based Inference-Time Reward Alignment in Score Models

358

02 Jun 2025

ADEPT: Adaptive Diffusion Environment for Policy Transfer Sim-to-Real

Youwei Yu

Junhong Xu

Lantao Liu

308

02 Jun 2025

Inference-Time Alignment of Diffusion Models via Evolutionary Algorithms

Purvish Jajal

Nick Eliopoulos

Benjamin Shiue-Hal Chou

George K. Thiruvathukal

James C. Davis

Yung-Hsiang Lu

187

30 May 2025

Diffusion Sampling Path Tells More: An Efficient Plug-and-Play Strategy for Sample Filtering

172

29 May 2025

A Survey of Generative Categories and Techniques in Multimodal Generative Models

399

29 May 2025

Rhetorical Text-to-Image Generation via Two-layer Diffusion Policy Optimization

239

28 May 2025

Inference-Time Scaling of Discrete Diffusion Models via Importance Weighting and Optimal Proposal Design

Chinmay Pani

Yingzhen Li

DiffM

378

28 May 2025

SDPO: Importance-Sampled Direct Preference Optimization for Stable Diffusion Training

289

28 May 2025

Text2Stereo: Repurposing Stable Diffusion for Stereo Generation with Consistency Rewards

263

27 May 2025

Decision Flow Policy Optimization

333

26 May 2025

LLaDA 1.5: Variance-Reduced Preference Optimization for Large Language Diffusion Models

...

425

25 May 2025

Step-level Reward for Free in RL-based T2I Diffusion Model Fine-tuning

218

25 May 2025

Rethinking Direct Preference Optimization in Diffusion Models

1.0K

24 May 2025

Diffusion Blend: Inference-Time Multi-Preference Alignment for Diffusion Models

287

24 May 2025

InfLVG: Reinforce Inference-Time Consistent Long Video Generation with GRPO

561

23 May 2025

A Minimalist Method for Fine-tuning Text-to-Image Diffusion Models

267

23 May 2025

Scaling Image and Video Generation via Test-Time Evolutionary Search

399

23 May 2025

RLVR-World: Training World Models with Reinforcement Learning

498

20 May 2025

Minimum-Excess-Work Guidance

Christopher Kolloff

Tobias Höppe

Emmanouil Angelis

Mathias Jacob Schreiner

Stefan Bauer

Andrea Dittadi

Simon Olsson

388

19 May 2025

Towards Self-Improvement of Diffusion Models via Group Preference Optimization

327

16 May 2025

CompAlign: Improving Compositional Text-to-Image Generation with a Complex Benchmark and Fine-Grained Feedback

Yixin Wan

Kai-Wei Chang

EGVM CoGe

287

16 May 2025

Diffusion-NPO: Negative Preference Optimization for Better Preference Aligned Generation of Diffusion ModelsInternational Conference on Learning Representations (ICLR), 2025

244

16 May 2025

DanceGRPO: Unleashing GRPO on Visual Generation

...

539

140

12 May 2025

You Only Look One Step: Accelerating Backpropagation in Diffusion Sampling with Gradient Shortcuts

529

12 May 2025

Flow-GRPO: Training Flow Matching Models via Online RL

820

173

08 May 2025

Convergence Of Consistency Model With Multistep Sampling Under General Data Assumptions

262

06 May 2025

DRAGON: Distributional Rewards Optimize Diffusion Generative Models

481

21 Apr 2025

Design Topological Materials by Reinforcement Fine-Tuned Generative Model

173

17 Apr 2025

Aligning Constraint Generation with Design Intent in Parametric CAD

Joseph George Lambourne

P. Jayaraman

K. Willis

322

17 Apr 2025

ADT: Tuning Diffusion Models with Adversarial Supervision

347

15 Apr 2025

Aligning Anime Video Generation with Human Feedback

387

14 Apr 2025

F5R-TTS: Improving Flow-Matching based Text-to-Speech with Group Relative Policy Optimization

476

03 Apr 2025

ORIGEN: Zero-Shot 3D Orientation Grounding in Text-to-Image Generation

464

28 Mar 2025

DSO: Aligning 3D Generators with Simulation Feedback for Physical Soundness

350

28 Mar 2025

Inference-Time Scaling for Flow Models via Stochastic Generation and Rollover Budget Forcing

478

25 Mar 2025

RL4Med-DDPO: Reinforcement Learning for Controlled Guidance Towards Diverse Medical Image Generation using Vision-Language Foundation ModelsInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025

281

20 Mar 2025