Title
ZeroSearch: Incentivize the Search Capability of LLMs without Searching Hao-Lun Sun Zile Qiao Jiayan Guo Xuanbo Fan Yingyan Hou Yong-feng Jiang Pengjun Xie Fei Huang Yan Zhang OffRL 48 0 0 07 May 2025
Benchmarking LLMs' Swarm intelligence Kai Ruan Mowen Huang Ji-Rong Wen Hao Sun 33 0 0 07 May 2025
Sailing AI by the Stars: A Survey of Learning from Rewards in Post-Training and Test-Time Scaling of Large Language Models Xiaobao Wu LRM 60 0 0 05 May 2025
WebThinker: Empowering Large Reasoning Models with Deep Research Capability X. Li Jiajie Jin Guanting Dong Hongjin Qian Yutao Zhu Yongkang Wu Ji-Rong Wen Zhicheng Dou LLMAG LRM 79 1 0 30 Apr 2025
Nemotron-Research-Tool-N1: Exploring Tool-Using Language Models with Reinforced Reasoning Shaokun Zhang Yi Dong Jieyu Zhang Jan Kautz Bryan Catanzaro Andrew Tao Qingyun Wu Zhiding Yu Guilin Liu LLMAG OffRL KELM LRM 83 0 0 25 Apr 2025
SARI: Structured Audio Reasoning via Curriculum-Guided Reinforcement Learning Cheng Wen Tingwei Guo Shuaijiang Zhao Wei Zou Xiangang Li OffRL AuLLM LRM 45 1 0 22 Apr 2025
AlignRAG: An Adaptable Framework for Resolving Misalignments in Retrieval-Aware Reasoning of RAG Jiaqi Wei Hao Zhou Xiang Zhang Di Zhang Zijie Qiu Wei Wei Jinzhe Li Wanli Ouyang Siqi Sun 22 0 0 21 Apr 2025
Collaborative Learning of On-Device Small Model and Cloud-Based Large Model: Advances and Future Directions Chaoyue Niu Yucheng Ding Junhui Lu Zhengxiang Huang Hang Zeng Yutong Dai Xuezhen Tu Chengfei Lv Fan Wu Guihai Chen 17 0 0 17 Apr 2025
ToolRL: Reward is All Tool Learning Needs Cheng Qian Emre Can Acikgoz Qi He Hongru Wang X. Chen Dilek Hakkani-Tür Gökhan Tür Heng Ji OffRL LRM 17 3 0 16 Apr 2025
ReTool: Reinforcement Learning for Strategic Tool Use in LLMs Jiazhan Feng Shijue Huang Xingwei Qu Ge Zhang Yujia Qin Baoquan Zhong Chengquan Jiang Jinxin Chi Wanjun Zhong OffRL ReLM SyDa KELM LRM 54 4 0 15 Apr 2025
Deep Reasoning Translation via Reinforcement Learning Jiaan Wang Fandong Meng Jie Zhou OffRL LRM 27 0 0 14 Apr 2025
LiveVQA: Live Visual Knowledge Seeking Mingyang Fu Yuyang Peng Benlin Liu Yao Wan D. Z. Chen 21 0 0 07 Apr 2025
Collab-RAG: Boosting Retrieval-Augmented Generation for Complex Question Answering via White-Box and Black-Box LLM Collaboration Ran Xu W. Shi Yuchen Zhuang Yue Yu Joyce C. Ho Haoyu Wang Carl Yang 14 0 0 07 Apr 2025
RARE: Retrieval-Augmented Reasoning Modeling Zhengren Wang Jiayang Yu Dongsheng Ma Z. Chen Yu Wang ... Feiyu Xiong Yanfeng Wang W. Elwasif Linpeng Tang W. Zhang RALM LRM 31 1 0 30 Mar 2025