v1v2v3v4 (latest)

Training Diffusion Models with Reinforcement Learning

International Conference on Learning Representations (ICLR), 2023

22 May 2023

ArXiv (abs)PDF HTML HuggingFace (4 upvotes)

Papers citing "Training Diffusion Models with Reinforcement Learning"

50 / 270 papers shown

Reinforcement Learning for Large Model: A Survey

317

24 Dec 2025

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

103

04 Dec 2025

PaCo-RL: Advancing Reinforcement Learning for Consistent Image Generation with Pairwise Reward Modeling

02 Dec 2025

Multi-GRPO: Multi-Group Advantage Estimation for Text-to-Image Generation with Tree-Based Trajectories and Multiple Rewards

...

129

30 Nov 2025

Ar2Can: An Architect and an Artist Leveraging a Canvas for Multi-Human Generation

27 Nov 2025

Designing Instance-Level Sampling Schedules via REINFORCE with James-Stein Shrinkage

117

27 Nov 2025

SpatialBench: Benchmarking Multimodal Large Language Models for Spatial Cognition

344

26 Nov 2025

Test-Time Alignment of Text-to-Image Diffusion Models via Null-Text Embedding Optimisation

Taehoon Kim

Henry Gouk

Timothy M. Hospedales

198

25 Nov 2025

HiCoGen: Hierarchical Compositional Text-to-Image Generation in Diffusion Models via Reinforcement Learning

351

25 Nov 2025

The Image as Its Own Reward: Reinforcement Learning with Adversarial Reward for Image Generation

273

25 Nov 2025

Seeing What Matters: Visual Preference Policy Optimization for Visual Generation

124

24 Nov 2025

ProxT2I: Efficient Reward-Guided Text-to-Image Generation via Proximal Diffusion

215

24 Nov 2025

Synthetic Curriculum Reinforces Compositional Text-to-Image Generation

228

23 Nov 2025

SceneDesigner: Controllable Multi-Object Image Generation with 9-DoF Pose Manipulation

197

20 Nov 2025

BD-Net: Has Depth-Wise Convolution Ever Been Applied in Binary Neural Networks?

157

19 Nov 2025

Masked Auto-Regressive Variational Acceleration: Fast Inference Makes Practical Reinforcement Learning

248

19 Nov 2025

Distribution Matching Distillation Meets Reinforcement Learning

...

413

17 Nov 2025

Generative AI Meets 6G and Beyond: Diffusion Models for Semantic Communications

422

11 Nov 2025

PC-Diffusion: Aligning Diffusion Models with Human Preferences via Preference Classifier

203

11 Nov 2025

EVLP:Learning Unified Embodied Vision-Language Planner with Reinforced Supervised Fine-Tuning

103

03 Nov 2025

Reg-DPO: SFT-Regularized Direct Preference Optimization with GT-Pair for Improving Video Generation

369

03 Nov 2025

MIRO: MultI-Reward cOnditioned pretraining improves T2I quality and efficiency

378

29 Oct 2025

Diffusion Adaptive Text Embedding for Text-to-Image Diffusion Models

231

28 Oct 2025

GRPO-Guard: Mitigating Implicit Over-Optimization in Flow Matching via Regulated Clipping

...

161

25 Oct 2025

Sample By Step, Optimize By Chunk: Chunk-Level GRPO For Text-to-Image Generation

151

24 Oct 2025

StableSketcher: Enhancing Diffusion Model for Pixel-based Sketch Generation via Visual Question Answering Feedback

124

23 Oct 2025

From Competition to Synergy: Unlocking Reinforcement Learning for Subject-Driven Image Generation

190

21 Oct 2025

Adaptive Divergence Regularized Policy Optimization for Fine-tuning Generative Models

100

20 Oct 2025

UniRL-Zero: Reinforcement Learning on Unified Models with Joint Language Model and Diffusion Model Experts

150

20 Oct 2025

Fine-tuning Flow Matching Generative Models with Intermediate Feedback

162

20 Oct 2025

Soft-Masked Diffusion Language Models

317

20 Oct 2025

Uniworld-V2: Reinforce Image Editing with Diffusion Negative-aware Finetuning and MLLM Implicit Feedback

...

406

19 Oct 2025

Iterative Refinement of Flow Policies in Probability Space for Online Reinforcement Learning

186

17 Oct 2025

DialectGen: Benchmarking and Improving Dialect Robustness in Multimodal Generation

147

16 Oct 2025

RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning

354

16 Oct 2025

RealDPO: Real or Not Real, that is the Preference

321

16 Oct 2025

ImagerySearch: Adaptive Test-Time Search for Video Generation Beyond Semantic Dependency Constraints

368

16 Oct 2025

Learning an Image Editing Model without Image Editing Pairs

309

16 Oct 2025

A Black-Box Debiasing Framework for Conditional Sampling

Han Cui

Jingbo Liu

13 Oct 2025

Understanding Sampler Stochasticity in Training Diffusion Models for RLHF

142

12 Oct 2025

Calibrating Generative Models to Distributional Constraints

Henry D. Smith

Nathaniel L. Diamant

Brian L. Trippe

158

11 Oct 2025

GTAlign: Game-Theoretic Alignment of LLM Assistants for Social Welfare

Siqi Zhu

David Zhang

Pedro Cisneros-Velarde

J. You

LRM

210

10 Oct 2025

Computationally-efficient Graph Modeling with Refined Graph Random Features

117

09 Oct 2025

Reinforcing Diffusion Models by Direct Group Preference Optimization

Yihong Luo

Tianyang Hu

Jing Tang

145

09 Oct 2025

Deterministic algorithms for inhomogeneous Bernoulli trials: Shapley value of network devices

Jesse D Wei

Guo Wei

FAtt

227

08 Oct 2025

No MoCap Needed: Post-Training Motion Diffusion Models with Reinforcement Learning using Only Textual Prompts

130

08 Oct 2025

Asynchronous Denoising Diffusion Models for Aligning Text-to-Image Generation

189

06 Oct 2025

Principled and Tractable RL for Reasoning with Diffusion Language Models

Anthony Zhan

DiffM AI4CE

111

05 Oct 2025

Diffusion-Classifier Synergy: Reward-Aligned Learning via Mutual Boosting Loop for FSCIL

231

04 Oct 2025

D2 Actor Critic: Diffusion Actor Meets Distributional Critic

266

03 Oct 2025