v1v2 (latest)

A Generalized Algorithm for Multi-Objective Reinforcement Learning and Policy Adaptation

Neural Information Processing Systems (NeurIPS), 2019

21 August 2019

Papers citing "A Generalized Algorithm for Multi-Objective Reinforcement Learning and Policy Adaptation"

50 / 138 papers shown

Limitations of Scalarisation in MORL: A Comparative Study in Discrete Environments

Muhammad Saóod Shah

Asad Jeewa

170

20 Nov 2025

Parametric Pareto Set Learning for Expensive Multi-Objective Optimization

Ji Cheng

Bo Xue

Qingfu Zhang

127

08 Nov 2025

Iterative Foundation Model Fine-Tuning on Multiple Rewards

156

31 Oct 2025

Multi-Objective Reinforcement Learning with Max-Min Criterion: A Game-Theoretic Approach

223

23 Oct 2025

Game-Theoretic Understandings of Multi-Agent Systems with Multiple Objectives

Yue Wang

187

27 Sep 2025

Goals and the Structure of Experience

Nadav Amir

Stas Tiomkin

Angela Langdon

187

20 Aug 2025

Pareto Multi-Objective Alignment for Language Models

Qiang He

S. Maghsudi

163

11 Aug 2025

Multi-Policy Pareto Front Tracking Based Online and Offline Multi-Objective Reinforcement Learning

238

04 Aug 2025

Reinforcement Learning for Multi-Objective Multi-Echelon Supply Chain Optimisation

143

26 Jul 2025

BEAVER: Building Environments with Assessable Variation for Evaluating Multi-Objective Reinforcement Learning

Ruohong Liu

Jack Umenberger

Yize Chen

291

10 Jul 2025

Dual-Objective Reinforcement Learning with Novel Hamilton-Jacobi-Bellman Formulations

223

19 Jun 2025

Dynamic Preference Multi-Objective Reinforcement Learning for Internet Network Management

DongNyeong Heo

Daniela N. Rim

Heeyoul Choi

155

16 Jun 2025

Interpretability by Design for Efficient Multi-Objective Reinforcement Learning

Qiyue Xia

J. Michael Herrmann

283

04 Jun 2025

AMOR: Adaptive Character Control through Multi-Objective Reinforcement Learning

294

29 May 2025

Diffusion Blend: Inference-Time Multi-Preference Alignment for Diffusion Models

357

24 May 2025

DSADF: Thinking Fast and Slow for Decision Making

619

13 May 2025

Constructing an Optimal Behavior Basis for the Option Keyboard

306

01 May 2025

FAST-Q: Fast-track Exploration with Adversarially Balanced State Representations for Counterfactual Action Estimation in Offline Reinforcement LearningThe Web Conference (WWW), 2025

282

30 Apr 2025

HypRL: Reinforcement Learning of Control Policies for Hyperproperties

Tzu-Han Hsu

Arshia Rafieioskouei

Borzoo Bonakdarpour

579

07 Apr 2025

Efficient Action-Constrained Reinforcement Learning via Acceptance-Rejection Method and Augmented MDPsInternational Conference on Learning Representations (ICLR), 2025

Wei-Ting Hung

Shao-Hua Sun

Ping-Chun Hsieh

283

17 Mar 2025

SNPL: Simultaneous Policy Learning and Evaluation for Safe Multi-Objective Policy Improvement

282

17 Mar 2025

Incentivizing Multi-Tenant Split Federated Learning for Foundation Models at the Network Edge

932

06 Mar 2025

On Generalization Across Environments In Multi-Objective Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2025

341

02 Mar 2025

Reward Dimension Reduction for Scalable Multi-Objective Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2025

Giseung Park

Y. Sung

OffRL

248

28 Feb 2025

Multi-Objective Reinforcement Learning for Critical Scenario Generation of Autonomous Vehicles

170

18 Feb 2025

Navigating the Social Welfare Frontier: Portfolios for Multi-objective Reinforcement Learning

353

13 Feb 2025

Mol-MoE: Training Preference-Guided Routers for Molecule Generation

Diego Calanzone

P. DÓro

Pierre-Luc Bacon

335

08 Feb 2025

Pareto Set Learning for Multi-Objective Reinforcement LearningAAAI Conference on Artificial Intelligence (AAAI), 2025

682

12 Jan 2025

LLM-Rubric: A Multidimensional, Calibrated Approach to Automated Evaluation of Natural Language TextsAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

561

03 Jan 2025

Preference-Conditioned Gradient Variations for Multi-Objective Quality-Diversity

415

19 Nov 2024

Policy AggregationNeural Information Processing Systems (NeurIPS), 2024

287

06 Nov 2024

Unlocking the Potential of Global Human ExpertiseNeural Information Processing Systems (NeurIPS), 2024

316

31 Oct 2024

How to Find the Exact Pareto Front for Multi-Objective MDPs?International Conference on Learning Representations (ICLR), 2024

Yining Li

Peizhong Ju

Ness B. Shroff

994

21 Oct 2024

MFC-EQ: Mean-Field Control with Envelope Q-Learning for Moving Decentralized Agents in FormationIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2024

Qiushi Lin

Hang Ma

238

15 Oct 2024

Domains as Objectives: Domain-Uncertainty-Aware Policy Optimization through Explicit Multi-Domain Convex Coverage Set Learning

Wendyam Eric Lionel Ilboudo

Taisuke Kobayashi

Takamitsu Matsubara

264

07 Oct 2024

C-MORL: Multi-Objective Reinforcement Learning through Efficient Discovery of Pareto Front

306

03 Oct 2024

Inferring Preferences from Demonstrations in Multi-objective Reinforcement Learning

Junlin Lu

Patrick Mannion

Karl Mason

257

30 Sep 2024

Stage-Wise Reward Shaping for Acrobatic Robots: A Constrained Multi-Objective Reinforcement Learning ApproachIEEE International Conference on Robotics and Automation (ICRA), 2024

234

24 Sep 2024

MODULI: Unlocking Preference Generalization via Diffusion Models for Offline Multi-Objective Reinforcement Learning

415

28 Aug 2024

Thresholded Lexicographic Ordered Multiobjective Reinforcement LearningEuropean Conference on Artificial Intelligence (ECAI), 2024

Alperen Tercan

Vinayak S. Prabhu

209

24 Aug 2024

Pareto Inverse Reinforcement Learning for Diverse Expert Policy GenerationInternational Joint Conference on Artificial Intelligence (IJCAI), 2024

228

22 Aug 2024

Balancing Act: Prioritization Strategies for LLM-Designed Restless Bandit Rewards

531

22 Aug 2024

Preference-Optimized Pareto Set Learning for Blackbox Optimization

Zhang Haishan

Chen Liang

Koji Tsuda

286

19 Aug 2024

Learning in Multi-Objective Public Goods Games with Non-Linear UtilitiesEuropean Conference on Artificial Intelligence (ECAI), 2024

Erman Acar

176

01 Aug 2024

A Meta-Learning Approach for Multi-Objective Reinforcement Learning in Sustainable Home Environments

Junlin Lu

Patrick Mannion

Karl Mason

231

16 Jul 2024

Any-Property-Conditional Molecule Generation with Self-Criticism using Spanning Trees

Alexia Jolicoeur-Martineau

379

12 Jul 2024

Learning Pareto Set for Multi-Objective Continuous Robot Control

241

27 Jun 2024

OCCAM: Online Continuous Controller Adaptation with Meta-Learned Models

Hersh Sanghvi

Spencer Folk

Camillo J Taylor

264

25 Jun 2024

Training Greedy Policy for Proposal Batch Selection in Expensive Multi-Objective Combinatorial Optimization

263

21 Jun 2024

The Max-Min Formulation of Multi-Objective Reinforcement Learning: From Theory to a Model-Free Algorithm

Youngchul Sung

264

12 Jun 2024