v1v2v3 (latest)

Identifiability in inverse reinforcement learning

Neural Information Processing Systems (NeurIPS), 2021

7 June 2021

Papers citing "Identifiability in inverse reinforcement learning"

41 / 41 papers shown

Blind Inverse Game Theory: Jointly Decoding Rewards and Rationality in Entropy-Regularized Competitive Games

Hamza Virk

Sandro Amaglobeli

Zuhayr Syed

135

07 Nov 2025

Generalizing Behavior via Inverse Reinforcement Learning with Closed-Form Reward Centroids

Filippo Lazzati

Alberto Maria Metelli

142

15 Sep 2025

Inference of Altruism and Intrinsic Rewards in Multi-Agent Systems

Victor Villin

Christos Dimitrakakis

FaML

396

09 Sep 2025

$Icon$^{2}$: Aligning Large Language Models Using Self-Synthetic Preference Data via Inherent Regulation$

Icon

^{2}

: Aligning Large Language Models Using Self-Synthetic Preference Data via Inherent Regulation

142

06 Sep 2025

Efficient Reward Identification In Max Entropy Reinforcement Learning with Sparsity and Rank Priors

Mohamad Louai Shehab

Alperen Tercan

Necmiye Ozay

107

10 Aug 2025

Model-Based Soft Maximization of Suitable Metrics of Long-Term Human Power

Jobst Heitzig

Ram Potham

181

31 Jul 2025

Where You Go is Who You Are: Behavioral Theory-Guided LLMs for Inverse Reinforcement Learning

199

22 May 2025

Agency Is Frame-Dependent

...

424

06 Feb 2025

Robustness in the Face of Partial Identifiability in Reward Learning

Filippo Lazzati

Alberto Maria Metelli

272

10 Jan 2025

Bootstrapped Reward ShapingAAAI Conference on Artificial Intelligence (AAAI), 2025

279

02 Jan 2025

On Reward Transferability in Adversarial Inverse Reinforcement Learning: Insights from Random Matrix Theory

Yangchun Zhang

Wang Zhou

Yirui Zhou

289

31 Dec 2024

Rethinking Inverse Reinforcement Learning: from Data Alignment to Task AlignmentNeural Information Processing Systems (NeurIPS), 2024

Weichao Zhou

Wenchao Li

269

31 Oct 2024

Insights from the Inverse: Reconstructing LLM Training Goals Through Inverse Reinforcement Learning

366

16 Oct 2024

Inverse Reinforcement Learning with Multiple Planning Horizons

Jiayu Yao

Weiwei Pan

Finale Doshi-Velez

Barbara E. Engelhardt

255

26 Sep 2024

Boosting Soft Q-Learning by Bounding

Rahul V. Kulkarni

293

26 Jun 2024

Towards the Transferability of Rewards Recovered via Regularized Inverse Reinforcement Learning

Andreas Schlaginhaufen

Maryam Kamgarpour

OffRL

369

03 Jun 2024

Inference of Utilities and Time Preference in Sequential Decision-Making

Haoyang Cao

Zhengqi Wu

Renyuan Xu

235

24 May 2024

Randomized algorithms and PAC bounds for inverse reinforcement learning in continuous spaces

Angeliki Kamoutsi

Peter Schmitt-Förster

Tobias Sutter

Volkan Cevher

John Lygeros

252

24 May 2024

Towards Guaranteed Safe AI: A Framework for Ensuring Robust and Reliable AI Systems

...

Ding Zhao

Joshua Tenenbaum

401

106

10 May 2024

Rethinking Adversarial Inverse Reinforcement Learning: Policy Imitation, Transferable Reward Recovery and Algebraic Equilibrium Proof

377

21 Mar 2024

Quantifying the Sensitivity of Inverse Reinforcement Learning to MisspecificationInternational Conference on Learning Representations (ICLR), 2024

Joar Skalse

Alessandro Abate

218

11 Mar 2024

Toward Computationally Efficient Inverse Reinforcement Learning via Reward Shaping

Finale Doshi-Velez

412

15 Dec 2023

FoMo Rewards: Can we cast foundation models as reward functions?

302

06 Dec 2023

Eliciting Risk Aversion with Inverse Reinforcement Learning via Interactive Questioning

Ziteng Cheng

Anthony Coache

S. Jaimungal

227

16 Aug 2023

PAGAR: Taming Reward Misalignment in Inverse Reinforcement Learning-Based Imitation Learning with Protagonist Antagonist Guided Adversarial Reward

Weichao Zhou

Wenchao Li

344

02 Jun 2023

Identifiability and Generalizability in Constrained Inverse Reinforcement LearningInternational Conference on Machine Learning (ICML), 2023

Andreas Schlaginhaufen

Maryam Kamgarpour

321

01 Jun 2023

Coherent Soft Imitation LearningNeural Information Processing Systems (NeurIPS), 2023

Joe Watson

Sandy H. Huang

Nicholas Heess

311

25 May 2023

K-SHAP: Policy Clustering Algorithm for Anonymous Multi-Agent State-Action PairsInternational Conference on Machine Learning (ICML), 2023

371

23 Feb 2023

Leveraging Prior Knowledge in Reinforcement Learning via Double-Sided Bounds on the Value Function

189

19 Feb 2023

When Demonstrations Meet Generative World Models: A Maximum Likelihood Framework for Offline Inverse Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

325

15 Feb 2023

On the Sensitivity of Reward Inference to Misspecified Human ModelsInternational Conference on Learning Representations (ICLR), 2022

Joey Hong

Kush S. Bhatia

Anca Dragan

196

09 Dec 2022

Misspecification in Inverse Reinforcement LearningAAAI Conference on Artificial Intelligence (AAAI), 2022

Joar Skalse

Alessandro Abate

320

06 Dec 2022

Utilizing Prior Solutions for Reward Shaping and Composition in Entropy-Regularized Reinforcement LearningAAAI Conference on Artificial Intelligence (AAAI), 2022

215

02 Dec 2022

Environment Design for Inverse Reinforcement LearningInternational Conference on Machine Learning (ICML), 2022

Thomas Kleine Buening

Victor Villin

Christos Dimitrakakis

395

26 Oct 2022

Maximum-Likelihood Inverse Reinforcement Learning with Finite-Time GuaranteesNeural Information Processing Systems (NeurIPS), 2022

420

04 Oct 2022

Identifiability and generalizability from multiple experts in Inverse Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

344

22 Sep 2022

Calculus on MDPs: Potential Shaping as a Gradient

Erik Jenner

H. V. Hoof

Adam Gleave

239

20 Aug 2022

Transferable Reward Learning by Dynamics-Agnostic Discriminator Ensemble

371

01 Jun 2022

A Primer on Maximum Causal Entropy Inverse Reinforcement Learning

Adam Gleave

Sam Toyer

205

22 Mar 2022

Invariance in Policy Optimisation and Partial Identifiability in Reward LearningInternational Conference on Machine Learning (ICML), 2022

Joar Skalse

Matthew Farrugia-Roberts

Stuart J. Russell

Alessandro Abate

Adam Gleave

312

14 Mar 2022

Necessary and Sufficient Conditions for Inverse Reinforcement Learning of Bayesian Stopping Time Problems

Kunal Pattanayak

Vikram Krishnamurthy

OffRL

549

07 Jul 2020