Evolved Policy Gradients

13 February 2018

Pieter Abbeel

Papers citing "Evolved Policy Gradients"

50 / 160 papers shown

Title
Meta knowledge assisted Evolutionary Neural Architecture Search Yangyang Li Guanlong Liu Ronghua Shang L. Jiao 56 0 0 30 Apr 2025
EvoRL: A GPU-accelerated Framework for Evolutionary Reinforcement Learning Bowen Zheng Ran Cheng Kay Chen Tan 42 0 0 25 Jan 2025
Hierarchical Multi-agent Meta-Reinforcement Learning for Cross-channel Bidding Shenghong He Chao Yu 39 0 0 26 Dec 2024
Adam on Local Time: Addressing Nonstationarity in RL with Relative Adam Timesteps Benjamin Ellis Matthew Jackson Andrei Lupu Alexander David Goldie Mattie Fellows Shimon Whiteson Jakob Foerster 85 0 0 22 Dec 2024
Task-driven Image Fusion with Learnable Fusion Loss Haowen Bai Jiangshe Zhang Zixiang Zhao Yichen Wu Lilun Deng Yukun Cui Tao Feng Shuang Xu 83 0 0 04 Dec 2024
Black box meta-learning intrinsic rewards for sparse-reward environments Octavio Pappalardo Rodrigo Ramele Juan Miguel Santos OffRL 38 0 0 31 Jul 2024
Behaviour Distillation Andrei Lupu Chris Xiaoxuan Lu Jarek Liesen R. T. Lange Jakob Foerster DD 41 4 0 21 Jun 2024
EvIL: Evolution Strategies for Generalisable Imitation Learning Silvia Sapora Gokul Swamy Chris Xiaoxuan Lu Yee Whye Teh Jakob Nicolaus Foerster 36 6 0 15 Jun 2024
Discovering Preference Optimization Algorithms with and for Large Language Models Chris Xiaoxuan Lu Samuel Holt Claudio Fanconi Alex J. Chan Jakob Foerster M. Schaar R. T. Lange OffRL 37 15 0 12 Jun 2024
Preparing for Black Swans: The Antifragility Imperative for Machine Learning Ming Jin 36 2 0 18 May 2024
Fast and Efficient Local Search for Genetic Programming Based Loss Function Learning Christian Raymond Qi Chen Bing Xue Mengjie Zhang 43 2 0 01 Mar 2024
Evolutionary Reinforcement Learning: A Systematic Review and Future Directions Y. Lin Fan Lin Guorong Cai Hong Chen Lixin Zou Pengcheng Wu 52 3 0 20 Feb 2024
Discovering Temporally-Aware Reinforcement Learning Algorithms Matthew Jackson Chris Xiaoxuan Lu Louis Kirsch R. T. Lange Shimon Whiteson Jakob N. Foerster 24 18 0 08 Feb 2024
ReFusion: Learning Image Fusion from Reconstruction with Learnable Loss via Meta-Learning Haowen Bai Zixiang Zhao Jiangshe Zhang Yichen Wu Lilun Deng Yukun Cui Shuang Xu Baisong Jiang 35 6 0 13 Dec 2023
Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment Annie S. Chen Govind Chada Laura M. Smith Archit Sharma Zipeng Fu Sergey Levine Chelsea Finn 49 7 0 02 Nov 2023
A Survey on Knowledge Editing of Neural Networks Vittorio Mazzia Alessandro Pedrani Andrea Caciolai Kay Rottmann Davide Bernardi KELM 20 24 0 30 Oct 2023
Deep Model Predictive Optimization Jacob Sacks Rwik Rana Kevin Huang Alex Spitzer Guanya Shi Byron Boots 43 7 0 06 Oct 2023
Discovering General Reinforcement Learning Algorithms with Adversarial Environment Design Matthew Jackson Minqi Jiang Jack Parker-Holder Risto Vuorio Chris Xiaoxuan Lu Gregory Farquhar Shimon Whiteson Jakob N. Foerster OOD 13 9 0 04 Oct 2023
AdaptNet: Policy Adaptation for Physics-Based Character Control Pei Xu Kaixiang Xie Sheldon Andrews P. Kry Michael Neff Morgan McGuire Ioannis Karamouzas Victor Zordan TTA 37 16 0 30 Sep 2023
Diagnosing and exploiting the computational demands of videos games for deep reinforcement learning L. Govindarajan Rex G Liu Drew Linsley A. Ashok Max Reuter M. Frank Thomas Serre OffRL 15 0 0 22 Sep 2023
Fine-grained Recognition with Learnable Semantic Data Augmentation Yifan Pu Yizeng Han Yulin Wang Junlan Feng Chao Deng Gao Huang 29 27 0 01 Sep 2023
BiERL: A Meta Evolutionary Reinforcement Learning Framework via Bilevel Optimization Junyi Wang Yuanyang Zhu Zhi Wang Yan Zheng Jianye Hao Chun-Han Chen OffRL 19 0 0 01 Aug 2023
Acceleration in Policy Optimization Veronica Chelu Tom Zahavy A. Guez Doina Precup Sebastian Flennerhag 43 0 0 18 Jun 2023
Empowering NLG: Offline Reinforcement Learning for Informal Summarization in Online Domains Zhiwei Tai Po-Chuan Chen OffRL 13 0 0 17 Jun 2023
Fast Context Adaptation in Cost-Aware Continual Learning Seyyidahmed Lahmer Federico Mason Federico Chiariotti Andrea Zanella 20 1 0 06 Jun 2023
Efficient automatic design of robots David Matthews Andrew Spielberg Daniela Rus Sam Kriegman Josh Bongard 14 21 0 05 Jun 2023
DAC-MR: Data Augmentation Consistency Based Meta-Regularization for Meta-Learning Jun Shu Xiang Yuan Deyu Meng Zongben Xu 28 4 0 13 May 2023
Policy Gradient Algorithms Implicitly Optimize by Continuation Adrien Bolland Gilles Louppe D. Ernst 39 3 0 11 May 2023
Structured State Space Models for In-Context Reinforcement Learning Chris Xiaoxuan Lu Yannick Schroecker Albert Gu Emilio Parisotto Jakob N. Foerster Satinder Singh Feryal M. P. Behbahani AI4TS 97 82 0 07 Mar 2023
Evolutionary Reinforcement Learning: A Survey Hui Bai Ran Cheng Yaochu Jin OffRL 45 52 0 07 Mar 2023
Unsupervised Meta-Learning via Few-shot Pseudo-supervised Contrastive Learning Huiwon Jang Hankook Lee Jinwoo Shin VLM SSL 34 16 0 02 Mar 2023
Hebbian and Gradient-based Plasticity Enables Robust Memory and Rapid Learning in RNNs Y. Duan Zhongfan Jia Qian Li Yi Zhong Kaisheng Ma AAML 30 2 0 07 Feb 2023
Learning to Optimize for Reinforcement Learning Qingfeng Lan Rupam Mahmood Shuicheng Yan Zhongwen Xu OffRL 26 6 0 03 Feb 2023
Rewarded meta-pruning: Meta Learning with Rewards for Channel Pruning Athul Shibu Abhishek Kumar Heechul Jung Dong-Gyu Lee 17 1 0 26 Jan 2023
AutoCost: Evolving Intrinsic Cost for Zero-violation Reinforcement Learning Tairan He Weiye Zhao Changliu Liu OffRL 31 17 0 24 Jan 2023
A Survey of Meta-Reinforcement Learning Jacob Beck Risto Vuorio E. Liu Zheng Xiong L. Zintgraf Chelsea Finn Shimon Whiteson OOD OffRL 37 122 0 19 Jan 2023
General-Purpose In-Context Learning by Meta-Learning Transformers Louis Kirsch James Harrison Jascha Narain Sohl-Dickstein Luke Metz 40 72 0 08 Dec 2022
Implicit Training of Energy Model for Structure Prediction Shiv Shankar Vihari Piratla 19 0 0 21 Nov 2022
Simple Emergent Action Representations from Multi-Task Policy Training Pu Hua Yubei Chen Huazhe Xu MLAU 22 6 0 18 Oct 2022
Reinforcement Learning with Automated Auxiliary Loss Search Tairan He Yuge Zhang Kan Ren Minghuan Liu Che Wang Weinan Zhang Yuqing Yang Dongsheng Li 35 16 0 12 Oct 2022
Discovered Policy Optimisation Chris Xiaoxuan Lu J. Kuba Alistair Letcher Luke Metz Christian Schroeder de Witt Jakob N. Foerster OffRL 39 75 0 11 Oct 2022
Learning Symbolic Model-Agnostic Loss Functions via Meta-Learning Christian Raymond Qi Chen Bing Xue Mengjie Zhang FedML 29 11 0 19 Sep 2022
Learning to learn online with neuromodulated synaptic plasticity in spiking neural networks Samuel Schmidgall Joe Hays 40 3 0 25 Jun 2022
Robust Task Representations for Offline Meta-Reinforcement Learning via Contrastive Learning Haoqi Yuan Zongqing Lu SSL OffRL 30 36 0 21 Jun 2022
A Survey on Model-based Reinforcement Learning Fan Luo Tian Xu Hang Lai Xiong-Hui Chen Weinan Zhang Yang Yu OffRL LRM 44 101 0 19 Jun 2022
On the Effectiveness of Fine-tuning Versus Meta-reinforcement Learning Mandi Zhao Pieter Abbeel Stephen James OffRL 28 33 0 07 Jun 2022
A Comprehensive Survey of Few-shot Learning: Evolution, Applications, Challenges, and Opportunities Yisheng Song Ting-Yuan Wang S. Mondal J. P. Sahoo SLR 50 344 0 13 May 2022
Evolving Pareto-Optimal Actor-Critic Algorithms for Generalizability and Stability Juan Jose Garau-Luis Yingjie Miao John D. Co-Reyes Aaron T Parisi Jie Tan Esteban Real Aleksandra Faust 29 0 0 08 Apr 2022
Model Based Meta Learning of Critics for Policy Gradients Sarah Bechtle Ludovic Righetti Franziska Meier OffRL 19 0 0 05 Apr 2022
Meta-Reinforcement Learning with Self-Modifying Networks Mathieu Chalvidal Thomas Serre Rufin VanRullen KELM 24 5 0 04 Feb 2022