v1v2v3v4 (latest)

Training Diffusion Models with Reinforcement Learning

International Conference on Learning Representations (ICLR), 2023

22 May 2023

ArXiv (abs)PDF HTML HuggingFace (4 upvotes)

Papers citing "Training Diffusion Models with Reinforcement Learning"

50 / 270 papers shown

Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior PredictionInternational Conference on Learning Representations (ICLR), 2024

...

Michael Bronstein

Avishek Joey Bose

273

10 Oct 2024

IterComp: Iterative Composition-Aware Feedback Learning from Model Gallery for Text-to-Image GenerationInternational Conference on Learning Representations (ICLR), 2024

Xinchen Zhang

Ling Yang

Mengdi Wang

Bin Cui

EGVM CoGe

332

09 Oct 2024

Gen-Drive: Enhancing Diffusion Generative Driving Policies with Reward Modeling and Reinforcement Learning Fine-tuningIEEE International Conference on Robotics and Automation (ICRA), 2024

Yuxiao Chen

Marco Pavone

Chen Lv

170

08 Oct 2024

Training-free Diffusion Model Alignment with Sampling DemonsInternational Conference on Learning Representations (ICLR), 2024

Po-Hung Yeh

Kuang-Huei Lee

Jun-Cheng Chen

284

08 Oct 2024

DiffusionGuard: A Robust Defense Against Malicious Diffusion-based Image Editing

255

08 Oct 2024

Bridging SFT and DPO for Diffusion Model Alignment with Self-Sampling Preference Optimization

...

Christopher G. Brinton

Jiebo Luo

EGVM

348

07 Oct 2024

HERO: Human-Feedback Efficient Reinforcement Learning for Online Diffusion Model FinetuningInternational Conference on Learning Representations (ICLR), 2024

400

07 Oct 2024

Text2Chart31: Instruction Tuning for Chart Generation with Automatic FeedbackConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Fatemeh Pesaran Zadeh

339

05 Oct 2024

Tuning Timestep-Distilled Diffusion Model Using Pairwise Sample OptimizationInternational Conference on Learning Representations (ICLR), 2024

Zichen Miao

Zhengyuan Yang

Kevin Lin

Ze Wang

Zicheng Liu

Lijuan Wang

Qiang Qiu

400

04 Oct 2024

ComfyGen: Prompt-Adaptive Workflows for Text-to-Image Generation

188

02 Oct 2024

Task-Agnostic Pre-training and Task-Guided Fine-tuning for Versatile Diffusion Planner

406

30 Sep 2024

TinyVLA: Towards Fast, Data-Efficient Vision-Language-Action Models for Robotic ManipulationIEEE Robotics and Automation Letters (RA-L), 2024

...

743

217

19 Sep 2024

Alignment of Diffusion Models: Fundamentals, Challenges, and Future

463

11 Sep 2024

Elucidating Optimal Reward-Diversity Tradeoffs in Text-to-Image Diffusion ModelsIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024

415

09 Sep 2024

Reward-Directed Score-Based Diffusion Models via q-Learning

257

07 Sep 2024

RLCP: A Reinforcement Learning-based Copyright Protection Method for Text-to-Image Diffusion Model

433

29 Aug 2024

Constrained Diffusion Models via Dual TrainingNeural Information Processing Systems (NeurIPS), 2024

Shervin Khalafi

Dongsheng Ding

Alejandro Ribeiro

311

27 Aug 2024

Towards Reliable Advertising Image Generation Using Human FeedbackEuropean Conference on Computer Vision (ECCV), 2024

...

341

01 Aug 2024

Aligning Diffusion Behaviors with Q-functions for Efficient Continuous Control

Huayu Chen

Kaiwen Zheng

Hang Su

Jun Zhu

368

12 Jul 2024

MJ-Bench: Is Your Multimodal Reward Model Really a Good Judge for Text-to-Image Generation?

...

Chelsea Finn

Huaxiu Yao

EGVM MLLM

327

05 Jul 2024

Diminishing Stereotype Bias in Image Generation Model using Reinforcemenlent Learning Feedback

Xin Chen

Virgile Foussereau

EGVM

148

27 Jun 2024

Aligning Diffusion Models with Noise-Conditioned Perception

Alexander Gambashidze

Anton Kulikov

Yuriy Sosnin

Ilya Makarov

325

25 Jun 2024

Beyond Thumbs Up/Down: Untangling Challenges of Fine-Grained Feedback for Text-to-Image Generation

Katherine M. Collins

...

Adrian Weller

Krishnamurthy Dvijotham

EGVM

188

24 Jun 2024

Adding Conditional Control to Diffusion Models with Reinforcement Learning

500

17 Jun 2024

InstructRL4Pix: Training Diffusion for Image Editing by Reinforcement Learning

Huajun Chen

285

14 Jun 2024

Margin-aware Preference Optimization for Aligning Diffusion Models without Reference

310

10 Jun 2024

Ouroboros3D: Image-to-3D Generation via 3D-aware Recursive Diffusion

377

05 Jun 2024

Spectrum-Aware Parameter Efficient Fine-Tuning for Diffusion Models

Akash Srivastava

192

31 May 2024

Amortizing intractable inference in diffusion models for vision, language, and control

...

406

31 May 2024

Curriculum Direct Preference Optimization for Diffusion and Consistency Models

Florinel-Alin Croitoru

626

22 May 2024

Deep Reward Supervisions for Tuning Text-to-Image Diffusion Models

Keqiang Sun

246

01 May 2024

Large Multi-modality Model Assisted AI-Generated Image Quality Assessment

Puyi Wang

Wei Sun

Zicheng Zhang

Jun Jia

Yanwei Jiang

Zhichao Zhang

Xiongkuo Min

Guangtao Zhai

EGVM

157

27 Apr 2024

YaART: Yet Another ART Rendering Technology

...

214

08 Apr 2024

Aligning Diffusion Models by Optimizing Human Utility

Shufan Li

Konstantinos Kallidromitis

Akash Gokul

Yusuke Kato

Kazuki Kozuka

305

06 Apr 2024

Idea-2-3D: Collaborative LMM Agents Enable 3D Model Generation from Interleaved Multimodal Inputs

Xiang Li

Hao Zhao

400

05 Apr 2024

Pixel-wise RL on Diffusion Models: Reinforcement Learning from Rich Feedback

121

05 Apr 2024

CoMat: Aligning Text-to-Image Diffusion Model with Image-to-Text Concept MatchingNeural Information Processing Systems (NeurIPS), 2024

459

04 Apr 2024

Confidence-aware Reward Optimization for Fine-tuning Text-to-Image ModelsInternational Conference on Learning Representations (ICLR), 2024

Krishnamurthy Dvijotham

Jinwoo Shin

Kimin Lee

EGVM

178

02 Apr 2024

TextCraftor: Your Text Encoder Can be Image Quality Controller

301

27 Mar 2024

Antigen-Specific Antibody Design via Direct Energy-based Preference Optimization

Liang Wang

Quanquan Gu

DiffM

387

25 Mar 2024

MyVLM: Personalizing VLMs for User-Specific Queries

Yuval Alaluf

Elad Richardson

Sergey Tulyakov

Kfir Aberman

Daniel Cohen-Or

MLLM VLM

309

21 Mar 2024

SELMA: Learning and Merging Skill-Specific Text-to-Image Experts with Auto-Generated DataNeural Information Processing Systems (NeurIPS), 2024

Mohit Bansal

254

11 Mar 2024

Fine-tuning of diffusion models via stochastic control: entropy regularization and beyond

Wenpin Tang

Fuzhong Zhou

402

10 Mar 2024

On the Challenges and Opportunities in Generative AI

...

761

28 Feb 2024

Fine-Tuning of Continuous-Time Diffusion Models as Entropy-Regularized Control

273

23 Feb 2024

Score-based Diffusion Models via Stochastic Differential Equations -- a Technical TutorialStatistics Survey (Stat. Surv.), 2024

Wenpin Tang

Hanyang Zhao

DiffM

396

12 Feb 2024

Implicit Diffusion: Efficient Optimization through Stochastic Sampling

Felipe Llinares-López

Courtney Paquette

Quentin Berthet

435

08 Feb 2024

DITTO: Diffusion Inference-Time T-Optimization for Music GenerationInternational Conference on Machine Learning (ICML), 2024

Cheng-i Wang

Julian McAuley

Taylor Berg-Kirkpatrick

Nicholas J. Bryan

DiffM

283

22 Jan 2024

DiffusionAgent: Navigating Expert Models for Agentic Image Generation

179

18 Jan 2024

A New Creative Generation Pipeline for Click-Through Rate with Stable Diffusion ModelThe Web Conference (WWW), 2024

219

17 Jan 2024