Beyond A*: Better Planning with Transformers via Search Dynamics Bootstrapping

21 February 2024

Papers citing "Beyond A*: Better Planning with Transformers via Search Dynamics Bootstrapping"

34 / 34 papers shown

Title
DYNUS: Uncertainty-aware Trajectory Planner in Dynamic Unknown Environments Kota Kondo Mason B. Peterson Nicholas Rober Juan Rached Viso Lucas Jia Jialin Chen Harvey Merton Jonathan P. How 31 0 0 23 Apr 2025
PLANET: A Collection of Benchmarks for Evaluating LLMs' Planning Capabilities Haoming Li Zhaoliang Chen Jonathan Zhang Fei Liu LLMAG 35 0 0 21 Apr 2025
LongPerceptualThoughts: Distilling System-2 Reasoning for System-1 Perception Yuan-Hong Liao Sven Elflein Liu He Laura Leal-Taixe Yejin Choi Sanja Fidler David Acuna ReLM LRM VLM 88 0 0 21 Apr 2025
Teaching Large Language Models to Reason through Learning and Forgetting Tianwei Ni Allen Nie Sapana Chaudhary Yao Liu Huzefa Rangwala Rasool Fakoor ReLM CLL LRM 101 0 0 15 Apr 2025
(How) Do reasoning models reason? S. Kambhampati Kaya Stechly Karthik Valmeekam ReLM ELM LRM AI4CE 64 0 0 14 Apr 2025
Solving Sokoban using Hierarchical Reinforcement Learning with Landmarks Sergey Pastukhov 21 0 0 06 Apr 2025
Optimizing Test-Time Compute via Meta Reinforcement Fine-Tuning Yuxiao Qu Matthew Y. R. Yang Amrith Rajagopal Setlur Lewis Tunstall E. Beeching Ruslan Salakhutdinov Aviral Kumar OffRL 62 11 0 10 Mar 2025
Cognitive Behaviors that Enable Self-Improving Reasoners, or, Four Habits of Highly Effective STaRs Kanishk Gandhi Ayush Chakravarthy Anikait Singh Nathan Lile Noah D. Goodman ReLM LRM 88 30 0 03 Mar 2025
PlanGenLLMs: A Modern Survey of LLM Planning Capabilities Hui Wei Zihao Zhang Shenghua He Tian Xia Shijia Pan Fei Liu 48 4 0 16 Feb 2025
Lower Bounds for Chain-of-Thought Reasoning in Hard-Attention Transformers Alireza Amiri Xinting Huang Mark Rofin Michael Hahn LRM 140 0 0 04 Feb 2025
Spend Wisely: Maximizing Post-Training Gains in Iterative Synthetic Data Boostrapping Pu Yang Yunzhen Feng Ziyuan Chen Yuhang Wu Zhuoyuan Li DiffM 101 0 0 31 Jan 2025
Transformer-based Heuristic for Advanced Air Mobility Planning Jun Xiang Jun Chen 69 0 0 21 Nov 2024
Beyond Autoregression: Discrete Diffusion for Complex Reasoning and Planning Jiacheng Ye Jiahui Gao Shansan Gong Lin Zheng Xin Jiang Z. Li Lingpeng Kong DiffM LRM 44 15 0 18 Oct 2024
FLARE: Faithful Logic-Aided Reasoning and Exploration Erik Arakelyan Pasquale Minervini Pat Verga Patrick Lewis Isabelle Augenstein ReLM LRM 61 2 0 14 Oct 2024
Thinking LLMs: General Instruction Following with Thought Generation Tianhao Wu Janice Lan Weizhe Yuan Jiantao Jiao Jason Weston Sainbayar Sukhbaatar LRM 16 15 0 14 Oct 2024
Guided Stream of Search: Learning to Better Search with Language Models via Optimal Path Guidance Seungyong Moon Bumsoo Park Hyun Oh Song RALM AIFin 21 1 0 03 Oct 2024
AnyCar to Anywhere: Learning Universal Dynamics Model for Agile and Adaptive Mobility Wenli Xiao Haoru Xue Tony Tao Dvij Kalaria John M. Dolan Guanya Shi 29 5 0 24 Sep 2024
Causal Language Modeling Can Elicit Search and Reasoning Capabilities on Logic Puzzles Kulin Shah Nishanth Dikkala Xin Wang Rina Panigrahy ELM ReLM LRM 29 9 0 16 Sep 2024
LASP: Surveying the State-of-the-Art in Large Language Model-Assisted AI Planning Haoming Li Zhaoliang Chen Jonathan Zhang Fei Liu LM&Ro LLMAG LRM 44 4 0 03 Sep 2024
Agent Q: Advanced Reasoning and Learning for Autonomous AI Agents Pranav Putta Edmund Mills Naman Garg S. Motwani Chelsea Finn Divyansh Garg Rafael Rafailov LLMAG LRM 28 65 0 13 Aug 2024
From Decoding to Meta-Generation: Inference-time Algorithms for Large Language Models Sean Welleck Amanda Bertsch Matthew Finlayson Hailey Schoelkopf Alex Xie Graham Neubig Ilia Kulikov Zaid Harchaoui 33 48 0 24 Jun 2024
Cognitive Map for Language Models: Optimal Planning via Verbally Representing the World Model Doyoung Kim Jongwon Lee Jinho Park Minjoon Seo LM&Ro 36 0 0 21 Jun 2024
Exploring and Benchmarking the Planning Capabilities of Large Language Models Bernd Bohnet Azade Nova Aaron T Parisi Kevin Swersky Katayoon Goshvadi Hanjun Dai Dale Schuurmans Noah Fiedel Hanie Sedghi 28 8 0 18 Jun 2024
UniZero: Generalized and Efficient Planning with Scalable Latent World Models Yuan Pu Yazhe Niu Jiyuan Ren Zhenjie Yang Hongsheng Li Yu Liu OffRL 41 1 0 15 Jun 2024
Intelligent Go-Explore: Standing on the Shoulders of Giant Foundation Models Cong Lu Shengran Hu Jeff Clune LLMAG 39 9 0 24 May 2024
From Explicit CoT to Implicit CoT: Learning to Internalize CoT Step by Step Yuntian Deng Yejin Choi Stuart M. Shieber ReLM LRM 35 53 0 23 May 2024
Playing Board Games with the Predict Results of Beam Search Algorithm Sergey Pastukhov 13 0 0 23 Apr 2024
Frontier AI Ethics: Anticipating and Evaluating the Societal Impacts of Generative Agents Seth Lazar SILM 29 1 0 10 Apr 2024
The Case for Developing a Foundation Model for Planning-like Tasks from Scratch Biplav Srivastava Vishal Pallagani LRM 32 2 0 06 Apr 2024
Stream of Search (SoS): Learning to Search in Language Kanishk Gandhi Denise Lee Gabriel Grand Muxin Liu Winson Cheng Archit Sharma Noah D. Goodman RALM AIFin LRM 44 44 0 01 Apr 2024
Stop Regressing: Training Value Functions via Classification for Scalable Deep RL Jesse Farebrother Jordi Orbay Q. Vuong Adrien Ali Taïga Yevgen Chebotar ... Sergey Levine Pablo Samuel Castro Aleksandra Faust Aviral Kumar Rishabh Agarwal OffRL 56 56 0 06 Mar 2024
What's the Plan? Evaluating and Developing Planning-Aware Techniques for Language Models Eran Hirsch Guy Uziel Ateret Anaby-Tavor LM&Ro LLMAG 55 2 0 18 Feb 2024
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 315 8,448 0 28 Jan 2022
Emerging Properties in Self-Supervised Vision Transformers Mathilde Caron Hugo Touvron Ishan Misra Hervé Jégou Julien Mairal Piotr Bojanowski Armand Joulin 303 5,773 0 29 Apr 2021