Identifying Policy Gradient Subspaces

12 January 2024

Papers citing "Identifying Policy Gradient Subspaces"

7 / 7 papers shown

Title
Can We Optimize Deep RL Policy Weights as Trajectory Modeling? Hongyao Tang OffRL 72 0 0 06 Mar 2025
Low-Rank Agent-Specific Adaptation (LoRASA) for Multi-Agent Policy Learning Beining Zhang Aditya Kapoor Mingfei Sun 52 0 0 08 Feb 2025
SubTrack your Grad: Gradient Subspace Tracking for Memory and Time Efficient Full-Parameter LLM Training Sahar Rajabi Nayeema Nonta Sirisha Rambhatla 85 0 0 03 Feb 2025
Does SGD really happen in tiny subspaces? Minhak Song Kwangjun Ahn Chulhee Yun 56 4 1 25 May 2024
The Ladder in Chaos: A Simple and Effective Improvement to General DRL Algorithms by Policy Path Trimming and Boosting Hongyao Tang M. Zhang Jianye Hao 18 1 0 02 Mar 2023
Is High Variance Unavoidable in RL? A Case Study in Continuous Control Johan Bjorck Carla P. Gomes Kilian Q. Weinberger 57 23 0 21 Oct 2021
Motion Planning Among Dynamic, Decision-Making Agents with Deep Reinforcement Learning Michael Everett Yu Fan Chen Jonathan P. How 133 507 0 04 May 2018