v1v2v3v4 (latest)

Training Diffusion Models with Reinforcement Learning

International Conference on Learning Representations (ICLR), 2023

22 May 2023

ArXiv (abs)PDF HTML HuggingFace (4 upvotes)

Papers citing "Training Diffusion Models with Reinforcement Learning"

50 / 270 papers shown

EvolvingGrasp: Evolutionary Grasp Generation via Efficient Preference Alignment

408

18 Mar 2025

Revealing higher-order neural representations of uncertainty with the Noise Estimation through Reinforcement-based Diffusion (NERD) model

Hojjat Azimi Asrari

Megan A. K. Peters

DiffM

486

18 Mar 2025

PANDORA: Diffusion Policy Learning for Dexterous Robotic Piano Playing

284

17 Mar 2025

Reward-Instruct: A Reward-Centric Approach to Fast Photo-Realistic Image Generation

1.1K

17 Mar 2025

BalancedDPO: Adaptive Multi-Metric Alignment

225

16 Mar 2025

SteerX: Creating Any Camera-Free 3D and 4D Scenes with Geometric Steering

400

15 Mar 2025

Towards Better Alignment: Training Diffusion Models with Reinforcement Learning Against Sparse RewardsComputer Vision and Pattern Recognition (CVPR), 2025

586

14 Mar 2025

Controllable Latent Diffusion for Traffic Simulation

Yizhuo Xiao

Mustafa Suphi Erden

Cheng Wang

367

14 Mar 2025

Flow to the Mode: Mode-Seeking Diffusion Autoencoders for State-of-the-Art Image Tokenization

453

14 Mar 2025

Adding Additional Control to One-Step Diffusion with Joint Distribution Matching

336

13 Mar 2025

Learning Personalized Driving Styles via Reinforcement Learning from Human Feedback

...

285

13 Mar 2025

Aligning Text to Image in Diffusion Models is Easier Than You Think

711

11 Mar 2025

Preference-Based Alignment of Discrete Diffusion Models

268

11 Mar 2025

Learning to Match Unpaired Data with Minimum Entropy Coupling

Mustapha Bounoua

Giulio Franzese

Pietro Michiardi

369

11 Mar 2025

Seedream 2.0: A Native Chinese-English Bilingual Image Generation Foundation Model

...

365

10 Mar 2025

Boosting Diffusion-Based Text Image Super-Resolution Model Towards Generalized Real-World Scenarios

455

10 Mar 2025

Dynamic Search for Inference-Time Alignment in Diffusion Models

420

03 Mar 2025

A Simple and Effective Reinforcement Learning Method for Text-to-Image Diffusion Fine-tuning

589

02 Mar 2025

Posterior Inference with Diffusion Models for High-dimensional Black-box Optimization

420

24 Feb 2025

Score-Based Diffusion Policy Compatible with Reinforcement Learning via Optimal Transport

416

24 Feb 2025

Reward-Guided Iterative Refinement in Diffusion Models at Test-Time with Applications to Protein and DNA Design

246

20 Feb 2025

CHATS: Combining Human-Aligned Optimization and Test-Time Sampling for Text-to-Image Generation

398

18 Feb 2025

Training-Free Guidance Beyond Differentiability: Scalable Path Steering with Tree Search in Diffusion and Flow Models

428

17 Feb 2025

Learning a Diffusion Model Policy from Rewards via Q-Score MatchingInternational Conference on Machine Learning (ICML), 2023

461

17 Feb 2025

Learning to Sample Effective and Diverse Prompts for Text-to-Image GenerationComputer Vision and Pattern Recognition (CVPR), 2025

317

17 Feb 2025

DexVLA: Vision-Language Model with Plug-In Diffusion Expert for General Robot Control

481

104

09 Feb 2025

Dual Caption Preference Optimization for Diffusion Models

329

09 Feb 2025

Score as Action: Fine-Tuning Diffusion Generative Models by Continuous-time Reinforcement Learning

570

03 Feb 2025

Fine-Tuning Discrete Diffusion Models with Policy Gradient Methods

Oussama Zekri

Nicolas Boullé

DiffM

607

03 Feb 2025

Refining Alignment Framework for Diffusion Models with Intermediate-Step Preference Ranking

281

01 Feb 2025

Visual Generation Without Guidance

446

26 Jan 2025

Improving Video Generation with Human Feedback

...

491

103

23 Jan 2025

DiffDoctor: Diagnosing Image Diffusion Models Before Treating

366

21 Jan 2025

FDPP: Fine-tune Diffusion Policy with Human PreferenceIEEE International Conference on Robotics and Automation (ICRA), 2025

329

14 Jan 2025

Text-Diffusion Red-Teaming of Large Language Models: Unveiling Harmful Behaviors with Proximity ConstraintsAAAI Conference on Artificial Intelligence (AAAI), 2025

388

14 Jan 2025

A General Framework for Inference-time Scaling and Steering of Diffusion Models

574

101

12 Jan 2025

AdaDiff: Adaptive Step Selection for Fast Diffusion Models

332

31 Dec 2024

Pareto-Optimal Energy Alignment for Designing Nature-Like Antibodies

271

30 Dec 2024

Efficient Diversity-Preserving Diffusion Alignment via Gradient-Informed GFlowNetsInternational Conference on Learning Representations (ICLR), 2024

699

10 Dec 2024

DyMO: Training-Free Diffusion Model Alignment with Dynamic Multi-Objective SchedulingComputer Vision and Pattern Recognition (CVPR), 2024

Xin Xie

Dong Gong

587

01 Dec 2024

Enhancing Exploration with Diffusion Policies in Hybrid Off-Policy RL: Application to Non-Prehensile ManipulationIEEE Robotics and Automation Letters (RA-L), 2024

456

22 Nov 2024

Reward Fine-Tuning Two-Step Diffusion Models via Learning Differentiable Latent-Space Surrogate RewardComputer Vision and Pattern Recognition (CVPR), 2024

542

22 Nov 2024

FlipSketch: Flipping Static Drawings to Text-Guided Sketch AnimationsComputer Vision and Pattern Recognition (CVPR), 2024

Hmrishav Bandyopadhyay

Yi-Zhe Song

DiffM VGen

233

16 Nov 2024

David and Goliath: Small One-step Model Beats Large Diffusion with Score Post-training

379

28 Oct 2024

Towards Visual Text Design Transfer Across LanguagesNeural Information Processing Systems (NeurIPS), 2024

Giyeong Oh

154

24 Oct 2024

Diff-Instruct++: Training One-step Text-to-image Generator Model to Align with Human Preferences

Weijian Luo

EGVM

351

24 Oct 2024

Training Free Guided Flow Matching with Optimal ControlInternational Conference on Learning Representations (ICLR), 2024

426

23 Oct 2024

Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein DesignInternational Conference on Learning Representations (ICLR), 2024

Chenyu Wang

287

17 Oct 2024

Preference Optimization with Multi-Sample Comparisons

Chaoqi Wang

Zhuokai Zhao

Chen Zhu

Karthik Abinav Sankararaman

...

337

16 Oct 2024

Improving Long-Text Alignment for Text-to-Image Diffusion ModelsInternational Conference on Learning Representations (ICLR), 2024

308

15 Oct 2024