ProgRM: Build Better GUI Agents with Progress Rewards

23 May 2025

Papers citing "ProgRM: Build Better GUI Agents with Progress Rewards"

28 / 28 papers shown

Title
Exploring Expert Failures Improves LLM Agent Tuning Li-Cheng Lan Andrew Bai Minhao Cheng Ruochen Wang Cho-Jui Hsieh LRM 372 1 0 17 Apr 2025
GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents Run Luo Lu Wang Wanwei He Xiaobo Xia LLMAG 92 28 0 14 Apr 2025
Optimizing Test-Time Compute via Meta Reinforcement Fine-Tuning Yuxiao Qu Matthew Y. R. Yang Amrith Rajagopal Setlur Lewis Tunstall E. Beeching Ruslan Salakhutdinov Aviral Kumar OffRL 107 28 0 10 Mar 2025
R1-Searcher: Incentivizing the Search Capability in LLMs via Reinforcement Learning Huatong Song Jinhao Jiang Yingqian Min Jie Chen Zhongfu Chen Wayne Xin Zhao Lei Fang Ji-Rong Wen AI4TS LRM KELM 129 29 0 07 Mar 2025
VEM: Environment-Free Exploration for Training GUI Agent with Value Environment Model Jiani Zheng Lu Wang Fangkai Yang Chen Zhang Lingrui Mei Wenjie Yin Qingwei Lin Dongmei Zhang Saravan Rajmohan Qi Zhang OffRL 73 5 0 26 Feb 2025
DistRL: An Asynchronous Distributed Reinforcement Learning Framework for On-Device Control Agents Taiyi Wang Zhihao Wu Jianheng Liu Jianye Hao Jun Wang Kun Shao OffRL 62 20 0 24 Feb 2025
Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning Tian Xie Zitian Gao Qingnan Ren Haoming Luo Yuqian Hong Bryan Dai Joey Zhou Kai Qiu Zhirong Wu Chong Luo ReLM OffRL LRM 117 55 0 21 Feb 2025
Explorer: Scaling Exploration-driven Web Trajectory Synthesis for Multimodal Web Agents Vardaan Pahuja Yadong Lu Corby Rosset Boyu Gou Arindam Mitra Spencer Whitehead Yu Su Ahmed Awadallah LLMAG LM&Ro Presented at ResearchTrend Connect \| LLMAG on 14 Mar 2025 180 5 1 17 Feb 2025
WebRL: Training LLM Web Agents via Self-Evolving Online Curriculum Reinforcement Learning Zehan Qi Xiao-Chang Liu Iat Long Iong Hanyu Lai Xingwu Sun ... Shuntian Yao Tianjie Zhang Wei Xu J. Tang Yuxiao Dong 120 30 0 28 Jan 2025
UI-TARS: Pioneering Automated GUI Interaction with Native Agents Yujia Qin Yining Ye Junjie Fang Han Wang Shihao Liang ... Haifeng Liu F. Lin Tao Peng Xin Liu Guang Shi LLMAG LM&Ro 53 46 0 21 Jan 2025
Proposer-Agent-Evaluator(PAE): Autonomous Skill Discovery For Foundation Model Internet Agents Yifei Zhou Qianlan Yang K. Lin Min Bai Xiong Zhou Yu-Xiong Wang Sergey Levine Erran L. Li LLMAG 80 10 0 17 Dec 2024
Free Process Rewards without Process Labels Lifan Yuan Wendi Li Huayu Chen Ganqu Cui Ning Ding Kaiyan Zhang Bowen Zhou Ziqiang Liu Hao Peng OffRL 77 55 0 02 Dec 2024
Synatra: Turning Indirect Knowledge into Direct Demonstrations for Digital Agents at Scale Tianyue Ou Frank F. Xu Aman Madaan J. Liu Robert Lo Abishek Sridhar Sudipta Sengupta Dan Roth Graham Neubig Shuyan Zhou OffRL 70 12 0 24 Sep 2024
DigiRL: Training In-The-Wild Device-Control Agents with Autonomous Reinforcement Learning Hao Bai Yifei Zhou Mert Cemri Jiayi Pan Alane Suhr Sergey Levine Aviral Kumar OffRL 46 52 0 14 Jun 2024
Reinforcing Language Agents via Policy Optimization with Action Decomposition Muning Wen Bo Liu Weinan Zhang Jun Wang Ying Wen 60 10 0 23 May 2024
Autonomous Evaluation and Refinement of Digital Agents Jiayi Pan Yichi Zhang Nicholas Tomlin Yifei Zhou Sergey Levine Alane Suhr ELM 79 54 0 09 Apr 2024
UFO: A UI-Focused Agent for Windows OS Interaction Chaoyun Zhang Liqun Li Shilin He Xu Zhang Bo Qiao ... Yu Kang Qingwei Lin Saravan Rajmohan Dongmei Zhang Qi Zhang LLMAG 75 76 0 08 Feb 2024
Mobile-Agent: Autonomous Multi-Modal Mobile Device Agent with Visual Perception Junyang Wang Haiyang Xu Jiabo Ye Mingshi Yan Weizhou Shen Ji Zhang Fei Huang Jitao Sang 59 119 0 29 Jan 2024
GPT-4V(ision) is a Generalist Web Agent, if Grounded Boyuan Zheng Boyu Gou Jihyung Kil Huan Sun Yu-Chuan Su MLLM VLM LLMAG 54 243 0 03 Jan 2024
Math-Shepherd: Verify and Reinforce LLMs Step-by-step without Human Annotations Peiyi Wang Lei Li Zhihong Shao R. X. Xu Damai Dai Yifei Li Deli Chen Y.Wu Zhifang Sui AIMat LRM ALM 71 316 0 14 Dec 2023
SteP: Stacked LLM Policies for Web Actions Paloma Sodhi S. Branavan Yoav Artzi Ryan McDonald LLMAG 45 28 0 05 Oct 2023
Large Language Models Are Semi-Parametric Reinforcement Learning Agents Danyang Zhang Lu Chen Situo Zhang Hongshen Xu Zihan Zhao Kai Yu LM&Ro KELM LLMAG 49 21 0 09 Jun 2023
Let's Verify Step by Step Hunter Lightman V. Kosaraju Yura Burda Harrison Edwards Bowen Baker Teddy Lee Jan Leike John Schulman Ilya Sutskever K. Cobbe ALM OffRL LRM 100 1,044 0 31 May 2023
Mobile-Env: Building Qualified Evaluation Benchmarks for LLM-GUI Interaction Danyang Zhang Zhennan Shen Rui Xie Situo Zhang Tianbao Xie ... Siyuan Chen Lu Chen Hongshen Xu Ruisheng Cao Kai Yu ELM LLMAG 58 6 0 14 May 2023
Dungeons and Data: A Large-Scale NetHack Dataset Eric Hambro Roberta Raileanu Dan Rothermel Vegard Mella Tim Rocktaschel Heinrich Küttler Naila Murray OffRL 174 19 0 01 Nov 2022
Making Large Language Models Better Reasoners with Step-Aware Verifier Yifei Li Zeqi Lin Shizhuo Zhang Qiang Fu B. Chen Jian-Guang Lou Weizhu Chen ReLM LRM 64 219 0 06 Jun 2022
Training Verifiers to Solve Math Word Problems K. Cobbe V. Kosaraju Mohammad Bavarian Mark Chen Heewoo Jun ... Jerry Tworek Jacob Hilton Reiichiro Nakano Christopher Hesse John Schulman ReLM OffRL LRM 191 4,175 0 27 Oct 2021
Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks Nils Reimers Iryna Gurevych 643 11,979 0 27 Aug 2019