v1v2v3 (latest)

Critic Regularized Regression

26 June 2020

Ziyun Wang

Alexander Novikov

Konrad Zolna

Jost Tobias Springenberg

Papers citing "Critic Regularized Regression"

50 / 242 papers shown

Real-World Reinforcement Learning of Active Perception Behaviors

284

01 Dec 2025

$$π^{*}_{0.6}$: a VLA That Learns From Experience$

π^{*}_{0.6}

: a VLA That Learns From Experience

Physical Intelligence

...

1.2K

18 Nov 2025

Adaptive Neighborhood-Constrained Q Learning for Offline Reinforcement Learning

189

04 Nov 2025

Beyond Static LLM Policies: Imitation-Enhanced Reinforcement Learning for Recommendation

157

15 Oct 2025

Expert or not? assessing data quality in offline reinforcement learning

156

14 Oct 2025

DEAS: DEtached value learning with Action Sequence for Scalable Offline RL

166

09 Oct 2025

A KL-regularization framework for learning to plan with adaptive priors

139

05 Oct 2025

Physics-informed Value Learner for Offline Goal-Conditioned Reinforcement Learning

260

08 Sep 2025

floq: Training Critics via Flow-Matching for Scaling Compute in Value-Based RL

278

08 Sep 2025

RAD: Retrieval High-quality Demonstrations to Enhance Decision-making

253

21 Jul 2025

2048: Reinforcement Learning in a Delayed Reward Environment

246

07 Jul 2025

CAWR: Corruption-Averse Advantage-Weighted Regression for Robust Policy Optimization

Ranting Hu

OffRL

325

18 Jun 2025

Horizon Reduction Makes RL Scalable

719

04 Jun 2025

Reachability Weighted Offline Goal-conditioned Resampling

Wenyan Yang

Joni Pajarinen

OffRL

231

03 Jun 2025

Diffusion Guidance Is a Controllable Policy Improvement Operator

371

29 May 2025

FlowQ: Energy-Guided Flow Policies for Offline Reinforcement Learning

Marvin Alles

Nutan Chen

Patrick van der Smagt

Botond Cseke

463

20 May 2025

Temporal Distance-aware Transition Augmentation for Offline Model-based Reinforcement Learning

Dongsu Lee

Minhae Kwon

OffRL

401

19 May 2025

DARLR: Dual-Agent Offline Reinforcement Learning for Recommender Systems with Dynamic RewardAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2025

310

12 May 2025

VLM Q-Learning: Aligning Vision-Language Models for Interactive Decision-Making

415

06 May 2025

An Optimal Discriminator Weighted Imitation Perspective for Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2025

455

17 Apr 2025

Human-Level Competitive Pokémon via Scalable Offline Reinforcement Learning with Transformers

348

06 Apr 2025

Behavior Preference Regression for Offline Reinforcement Learning

Padmanaba Srinivasan

William J. Knottenbelt

OffRL

241

02 Mar 2025

LEGATO: Cross-Embodiment Imitation Using a Grasping ToolIEEE Robotics and Automation Letters (RA-L), 2024

595

20 Feb 2025

Behavioral Entropy-Guided Dataset Generation for Offline Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2025

353

06 Feb 2025

The Best Instruction-Tuning Data are Those That Fit

640

06 Feb 2025

Geometric-Averaged Preference Optimization for Soft Preference LabelsNeural Information Processing Systems (NeurIPS), 2024

480

31 Dec 2024

Hierarchical Multi-agent Meta-Reinforcement Learning for Cross-channel BiddingIEEE Transactions on Knowledge and Data Engineering (TKDE), 2024

Shenghong He

Chao Yu

300

26 Dec 2024

Contrastive Representation for Interactive RecommendationAAAI Conference on Artificial Intelligence (AAAI), 2024

405

24 Dec 2024

ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement LearningIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2024

496

22 Dec 2024

Enhancing Decision Transformer with Diffusion-Based Trajectory Branch Generation

430

18 Nov 2024

AMAGO-2: Breaking the Multi-Task Barrier in Meta-Reinforcement Learning with TransformersNeural Information Processing Systems (NeurIPS), 2024

357

17 Nov 2024

Offline Reinforcement Learning with OOD State Correction and OOD Action SuppressionNeural Information Processing Systems (NeurIPS), 2024

646

25 Oct 2024

Solving Continual Offline RL through Selective Weights Activation on Aligned Spaces

Zhejian Yang

250

21 Oct 2024

Robust Offline Imitation Learning from Diverse Auxiliary Data

Udita Ghosh

Dripta S. Raychaudhuri

Jiachen Li

Konstantinos Karydis

Amit K. Roy-Chowdhury

OffRL

538

04 Oct 2024

Unsupervised-to-Online Reinforcement Learning

Junsu Kim

Seohong Park

Sergey Levine

OnRL

295

27 Aug 2024

SelfBC: Self Behavior Cloning for Offline Reinforcement LearningEuropean Conference on Artificial Intelligence (ECAI), 2024

319

04 Aug 2024

Diffusion-DICE: In-Sample Diffusion Guidance for Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2024

420

29 Jul 2024

ROLeR: Effective Reward Shaping in Offline Reinforcement Learning for Recommender Systems

398

18 Jul 2024

Aligning Diffusion Behaviors with Q-functions for Efficient Continuous Control

Huayu Chen

Kaiwen Zheng

Hang Su

Jun Zhu

390

12 Jul 2024

DigiRL: Training In-The-Wild Device-Control Agents with Autonomous Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2024

495

151

14 Jun 2024

Is Value Learning Really the Main Bottleneck in Offline RL?

Seohong Park

323

13 Jun 2024

Integrating Domain Knowledge for handling Limited Data in Offline RL

253

11 Jun 2024

Decision Mamba: A Multi-Grained State Space Model with Self-Evolution Regularization for Offline RLNeural Information Processing Systems (NeurIPS), 2024

603

08 Jun 2024

UDQL: Bridging The Gap between MSE Loss and The Optimal Value Function in Offline Reinforcement Learning

Rui Yu

306

05 Jun 2024

Preferred-Action-Optimized Diffusion Policies for Offline Reinforcement Learning

...

Lusong Li

330

29 May 2024

AlignIQL: Policy Alignment in Implicit Q-Learning through Constrained Optimization

Longxiang He

Li Shen

Xueqian Wang

355

28 May 2024

Constrained Ensemble Exploration for Unsupervised Skill Discovery

Xuelong Li

482

25 May 2024

Towards Robust Policy: Enhancing Offline Reinforcement Learning with Adversarial Attacks and DefensesInternational Conferences on Pattern Recognition and Artificial Intelligence (ICCPRAI), 2024

309

18 May 2024

Reinformer: Max-Return Sequence Modeling for Offline RLInternational Conference on Machine Learning (ICML), 2024

373

14 May 2024

Learning Robot Soccer from Egocentric Vision with Deep Reinforcement LearningConference on Robot Learning (CoRL), 2024

Markus Wulfmeier

Sandy Huang

...

Martin Riedmiller

285

03 May 2024