Large Language Model as a Policy Teacher for Training Reinforcement
Learning Agents

Large Language Model as a Policy Teacher for Training Reinforcement Learning Agents

22 November 2023

Papers citing "Large Language Model as a Policy Teacher for Training Reinforcement Learning Agents"

13 / 13 papers shown

Title
Internet of Agents: Fundamentals, Applications, and Challenges Yuntao Wang Shaolong Guo Yanghe Pan Zhou Su Fahao Chen Tom H. Luan Peng Li Jiawen Kang Dusit Niyato LLMAG LM&Ro AI4CE 50 0 0 12 May 2025
The Evolving Landscape of LLM- and VLM-Integrated Reinforcement Learning Sheila Schoepp Masoud Jafaripour Yingyue Cao Tianpei Yang Fatemeh Abdollahi Shadan Golestan Zahin Sufiyan Osmar Zaiane Matthew E. Taylor OffRL LM&Ro 46 0 0 24 Feb 2025
Language-Driven Policy Distillation for Cooperative Driving in Multi-Agent Reinforcement Learning Jiaqi Liu Chengkai Xu Peng Hang Jian-jun Sun Mingyu Ding W. Zhan M. Tomizuka 32 2 0 31 Oct 2024
How to Build a Pre-trained Multimodal model for Simultaneously Chatting and Decision-making? Zuojin Tang Bin-Bin Hu Chenyang Zhao De Ma Gang Pan Bin Liu 13 0 0 21 Oct 2024
Choices are More Important than Efforts: LLM Enables Efficient Multi-Agent Exploration Yun Qu Boyuan Wang Yuhang Jiang Jianzhun Shao Yixiu Mao Cheems Wang Chang Liu Xiangyang Ji 46 4 0 03 Oct 2024
Cut the Crap: An Economical Communication Pipeline for LLM-based Multi-Agent Systems Guibin Zhang Yanwei Yue Zhixun Li Sukwon Yun Guancheng Wan Kun Wang Dawei Cheng Jeffrey Xu Yu Tianlong Chen 32 8 0 03 Oct 2024
A Survey on the Integration of Generative AI for Critical Thinking in Mobile Networks Athanasios Karapantelakis Alexandros Nikou Ajay Kattepur Jean Martins Leonid Mokrushin S. Mohalik Marin Orlic Aneta Vulgarakis Feljan 19 1 0 10 Apr 2024
LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving Hao Sha Yao Mu Yuxuan Jiang Li Chen Chenfeng Xu Ping Luo Shengbo Eben Li Masayoshi Tomizuka Wei Zhan Mingyu Ding 107 159 0 04 Oct 2023
Enabling Intelligent Interactions between an Agent and an LLM: A Reinforcement Learning Approach Bin-Bin Hu Chenyang Zhao Pushi Zhang Zihao Zhou Yuanhang Yang Zenglin Xu Bin Liu LM&Ro LLMAG 17 21 0 06 Jun 2023
Foundation Models for Decision Making: Problems, Methods, and Opportunities Sherry Yang Ofir Nachum Yilun Du Jason W. Wei Pieter Abbeel Dale Schuurmans LM&Ro OffRL LRM AI4CE 90 148 0 07 Mar 2023
ReAct: Synergizing Reasoning and Acting in Language Models Shunyu Yao Jeffrey Zhao Dian Yu Nan Du Izhak Shafran Karthik Narasimhan Yuan Cao LLMAG ReLM LRM 229 2,413 0 06 Oct 2022
Self-Consistency Improves Chain of Thought Reasoning in Language Models Xuezhi Wang Jason W. Wei Dale Schuurmans Quoc Le Ed H. Chi Sharan Narang Aakanksha Chowdhery Denny Zhou ReLM BDL LRM AI4CE 297 3,163 0 21 Mar 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 315 8,261 0 28 Jan 2022