Mobile-Agent-v2: Mobile Device Operation Assistant with Effective Navigation via Multi-Agent Collaboration

3 June 2024

Ming Yan

Ji Zhang

Fei Huang

Jitao Sang

LM&Ro

LLMAG

ArXiv (abs)PDF HTML HuggingFace (35 upvotes)Github (4278★)

Papers citing "Mobile-Agent-v2: Mobile Device Operation Assistant with Effective Navigation via Multi-Agent Collaboration"

50 / 63 papers shown

Title
OSWorld-MCP: Benchmarking MCP Tool Invocation In Computer-Use Agents Hongrui Jia Jitong Liao X. Zhang Haiyang Xu Tianbao Xie Chaoya Jiang Ming Yan Si Liu Wei Ye Fei Huang 72 1 0 28 Oct 2025
GhostEI-Bench: Do Mobile Agents Resilience to Environmental Injection in Dynamic On-Device Environments? Chiyu Chen Xinhao Song Yunkai Chai Yang Yao Haodong Zhao Lijun Li Jie Li Yan Teng Gongshen Liu Y. Wang AAML LLMAG 112 0 0 23 Oct 2025
ColorAgent: Building A Robust, Personalized, and Interactive OS Agent Ning Li Qiqiang Lin Zheng Wu Xiaoyun Mo Weiming Zhang ... Xingyu Lou Jun Wang Weiwen Liu Zhuosheng Zhang Weinan Zhang LLMAG VLM 77 0 0 22 Oct 2025
Empowering Real-World: A Survey on the Technology, Practice, and Evaluation of LLM-driven Industry Agents Yihong Tang Kehai Chen Liang Yue Jinxin Fan Caishen Zhou ... Kaiyang Guo Xingshan Zeng Wenjing Cun L. Shang Min Zhang LLMAG 110 0 0 20 Oct 2025
CORE: Reducing UI Exposure in Mobile Agents via Collaboration Between Cloud and Local LLMs Gucongcong Fan Chaoyue Niu Chengfei Lyu Fan Wu Guihai Chen 68 1 0 17 Oct 2025
A Survey on Agentic Multimodal Large Language Models Huanjin Yao Ruifei Zhang Jiaxing Huang Jingyi Zhang Yibo Wang ... Ruolin Zhu Yongcheng Jing Shunyu Liu Guanbin Li Dacheng Tao LM&Ro AIFin AI4TS LRM AI4CE 137 3 0 13 Oct 2025
Training-Free Group Relative Policy Optimization Yuzheng Cai Siqi Cai Yuchen Shi Zihan Xu Lichao Chen ... Zongyi Li Haojia Lin Yong Mao Ke Li Xing Sun OffRL 120 1 0 09 Oct 2025
Cross-Embodiment Dexterous Hand Articulation Generation via Morphology-Aware Learning Heng Zhang Kevin Yuchen Ma Mike Zheng Shou Weisi Lin Yan Wu 84 1 0 07 Oct 2025
Agent-ScanKit: Unraveling Memory and Reasoning of Multimodal Agents via Sensitivity Perturbations Pengzhou Cheng Lingzhong Dong Zeng Wu Zongru Wu Zhuosheng Zhang Chengwei Qin Zhuosheng Zhang Gongshen Liu LLMAG 342 0 0 01 Oct 2025
Learn the Ropes, Then Trust the Wins: Self-imitation with Progressive Exploration for Agentic Reinforcement Learning Yulei Qin Xiaoyu Tan Zhengbao He Gang Li Haojia Lin ... Yuzheng Cai Xuan Zhang Sheng Ye Ke Li Xing Sun 191 0 0 26 Sep 2025
MobileRAG: Enhancing Mobile Agent with Retrieval-Augmented Generation Gowen Loo Chang Liu Qinghong Yin Xiang Chen Jiawei Chen Jingyuan Zhang Yu Tian 52 0 0 04 Sep 2025
Succeed or Learn Slowly: Sample Efficient Off-Policy Reinforcement Learning for Mobile App Control Georgios Papoudakis Thomas Coste Jianye Hao Jun Wang Cheng Deng OffRL 186 0 0 01 Sep 2025
KG-RAG: Enhancing GUI Agent Decision-Making via Knowledge Graph-Driven Retrieval-Augmented Generation Ziyi Guan Jason Chun Lok Li Zhijian Hou Pingping Zhang Donglai Xu ... Pengfei Xian Wenao Ma Shengchao Qin G. Chesi Ngai Wong 76 0 0 30 Aug 2025
PG-Agent: An Agent Powered by Page Graph Weizhi Chen Ziwei Wang Leyang Yang Sheng Zhou Xiaoxuan Tang Jiajun Bu Yong Li Wei Jiang LLMAG 59 1 0 27 Aug 2025
AppAgent-Pro: A Proactive GUI Agent System for Multidomain Information Integration and User Assistance Yuyang Zhao Wentao Shi Fuli Feng Xiangnan He LLMAG 139 0 0 26 Aug 2025
PerPilot: Personalizing VLM-based Mobile Agents via Memory and Exploration Xin Wang Zhiyao Cui Hao Li Ya Zeng Chenxu Wang ... Qiaosheng Zhang Jinzhuo Liu Siyue Ren Shuyue Hu Zhen Wang 36 1 0 25 Aug 2025
Mobile-Agent-v3: Fundamental Agents for GUI Automation Jiabo Ye Xi Zhang Haiyang Xu Haowei Liu Junyang Wang ... Jitong Liao Qi Zheng Fei Huang Jingren Zhou Ming Yan LLMAG LM&Ro 200 27 0 21 Aug 2025
CRAFT-GUI: Curriculum-Reinforced Agent For GUI Tasks Songqin Nong Jingxuan Xu Sheng Zhou Jianfeng Chen Xiaoxuan Tang Tao Jiang Wenhao Xu 72 0 0 15 Aug 2025
UI-Venus Technical Report: Building High-performance UI Agents with RFT Zhangxuan Gu Zhengwen Zeng Zhenyu Xu Xingran Zhou Shuheng Shen ... Yuan Guo Yong Deng Zhenyu Guo Liang Chen Weiqiang Wang LLMAG LM&Ro 247 14 0 14 Aug 2025
MVISU-Bench: Benchmarking Mobile Agents for Real-World Tasks by Multi-App, Vague, Interactive, Single-App and Unethical Instructions Zeyu Huang Juyuan Wang L. Chen Boyi Xiao Leng Cai Yawen Zeng Jin Xu 76 2 0 12 Aug 2025
Uncertainty-Aware GUI Agent: Adaptive Perception through Component Recommendation and Human-in-the-Loop Refinement Chao Hao Shuai Wang Kaiwen Zhou 126 7 0 06 Aug 2025
NatureGAIA: Pushing the Frontiers of GUI Agents with a Challenging Benchmark and High-Quality Trajectory Dataset Zihan Zheng Tianle Cui Chuwen Xie Jiahui Zhang Jiahui Pan Lewei He Qianglong Chen LLMAG 148 1 0 02 Aug 2025
MapAgent: Trajectory-Constructed Memory-Augmented Planning for Mobile Task Automation Yi Kong Dianxi Shi Guoli Yang Zhang ke-di Chenlin Huang Xiaopeng Li Songchang Jin LLMAG LM&Ro 297 2 0 29 Jul 2025
Enhancing Jailbreak Attacks on LLMs via Persona Prompts Zheng Zhang Peilin Zhao Deheng Ye Hao Wang AAML 87 1 0 28 Jul 2025
OS-MAP: How Far Can Computer-Using Agents Go in Breadth and Depth? Xuetian Chen Yinghao Chen Xinfeng Yuan Zhuo Peng Lu Chen ... Tianbao Xie Zhiyong Wu Qiushi Sun Biqing Qi Bowen Zhou 115 3 0 25 Jul 2025
GUI-G $^2$ : Gaussian Reward Modeling for GUI Grounding Fei Tang Zhangxuan Gu Zhengxi Lu Xuyang Liu Shuheng Shen ... Wenqi Zhang Yongliang Shen Weiming Lu Jun Xiao Yueting Zhuang 265 22 0 21 Jul 2025
VisualTrap: A Stealthy Backdoor Attack on GUI Agents via Visual Grounding Manipulation Ziang Ye Yang Zhang Wentao Shi Xiaoyu You Fuli Feng Tat-Seng Chua AAML 154 3 0 09 Jul 2025
Mobile-R1: Towards Interactive Reinforcement Learning for VLM-Based Mobile Agent via Task-Level Rewards Jihao Gu Qihang Ai Y. X. R. Wang Pi Bu Jingxuan Xing ... Yingxiu Zhao Ming-Liang Zhang Jun Song Yuning Jiang Bo Zheng LRM 118 6 0 25 Jun 2025
Deep Research Agents: A Systematic Examination And Roadmap Y. Huang Yihao Chen Haozheng Zhang Kang Li Huichi Zhou ... Lifeng Shang Songcen Xu Jianye Hao Youssef Attia El Hili Jun Wang LLMAG 194 35 0 22 Jun 2025
Towards Pervasive Distributed Agentic Generative AI -- A State of The Art Gianni Molinari Fabio Ciravegna LLMAG LM&Ro AI4CE 189 3 0 16 Jun 2025
Multi-level Value Alignment in Agentic AI Systems: Survey and Perspectives Wei Zeng Hengshu Zhu Chuan Qin Han Wu Yihang Cheng ... Xiaowei Jin Yinuo Shen Zhenxing Wang Feimin Zhong Hui Xiong AI4TS 313 0 0 11 Jun 2025
GUI-Reflection: Empowering Multimodal GUI Models with Self-Reflection Behavior Penghao Wu Shengnan Ma Bo Wang Jiaheng Yu Lewei Lu Ziwei Liu 167 9 0 09 Jun 2025
Look Before You Leap: A GUI-Critic-R1 Model for Pre-Operative Error Diagnosis in GUI Automation Yuyang Wanyan Xi Zhang Haiyang Xu Haowei Liu Junyang Wang ... Ming Yan Fei Huang Xiaoshan Yang Weiming Dong Changsheng Xu LLMAG LRM 326 7 0 05 Jun 2025
BacktrackAgent: Enhancing GUI Agent with Error Detection and Backtracking Mechanism Qinzhuo Wu Pengzhi Gao Wei Liu Jian Luan LLMAG 183 5 0 27 May 2025
XBOUND: Exploring Capability Boundaries of Device-Control Agents at the State Level Shaoqing Zhang Kehai Chen Zhuosheng Zhang Rumei Li Rongxiang Weng Yang Xiang Liqiang Nie 269 0 0 27 May 2025
TransBench: Breaking Barriers for Transferable Graphical User Interface Agents in Dynamic Digital EnvironmentsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025 Yuheng Lu Qian Yu Hongru Wang Zeming Liu Wei Su Yanping Liu Yuhang Guo Maocheng Liang Yunhong Wang Haifeng Wang LLMAG 407 1 0 23 May 2025
Hidden Ghost Hand: Unveiling Backdoor Vulnerabilities in MLLM-Powered Mobile GUI Agents Pengzhou Cheng Haowen Hu Zheng Wu Zongru Wu Tianjie Ju Zhuosheng Zhang Zhuosheng Zhang LLMAG AAML 315 5 0 20 May 2025
Mobile-Agent-V: A Video-Guided Approach for Effortless and Efficient Operational Knowledge Injection in Mobile Automation Junyang Wang Haiyang Xu Xi Zhang Ming Yan Ji Zhang Fei Huang Jitao Sang 365 1 0 20 May 2025
From Assistants to Adversaries: Exploring the Security Risks of Mobile LLM Agents Liangxuan Wu Chao Wang Tianming Liu Yanjie Zhao Haoyu Wang AAML 347 9 0 19 May 2025
Enhancing Visual Grounding for GUI Agents via Self-Evolutionary Reinforcement Learning Xinbin Yuan Jian Zhang K. Li Zhuoxuan Cai Lujian Yao ... Enguang Wang Qibin Hou Jinwei Chen Peng-Tao Jiang Bo Li 331 28 0 18 May 2025
Can Global XAI Methods Reveal Injected Bias in LLMs? SHAP vs Rule Extraction vs RuleSHAP Francesco Sovrano 478 0 0 16 May 2025
EcoAgent: An Efficient Device-Cloud Collaborative Multi-Agent Framework for Mobile Automation Biao Yi Xavier Hu Yexin Chen Shengyu Zhang Hongxia Yang Fan Wu LLMAG 955 3 0 08 May 2025
Visual Test-time Scaling for GUI Agent Grounding Tiange Luo Lajanugen Logeswaran Justin Johnson Honglak Lee 289 8 0 01 May 2025
Towards Efficient Online Tuning of VLM Agents via Counterfactual Soft Reinforcement Learning Lang Feng Weihao Tan Zhiyi Lyu Longtao Zheng Haiyang Xu Ming Yan Fei Huang Jingyi Wang 234 3 0 01 May 2025
ViMo: A Generative Visual GUI World Model for App Agents Dezhao Luo Bohan Tang Kang Li Georgios Papoudakis Jifei Song S. Gong Haifeng Zhang Jun Wang Cheng Deng LM&Ro VGen 426 2 0 15 Apr 2025
CHOP: Mobile Operating Assistant with Constrained High-frequency Optimized Subtask Planning Yuqi Zhou Shuai Wang Sunhao Dai Qinglin Jia Zhaocheng Du Zhenhua Dong Jun Xu LM&Ro 261 4 0 05 Mar 2025
SpiritSight Agent: Advanced GUI Agent with One LookComputer Vision and Pattern Recognition (CVPR), 2025 Zhiyuan Huang Ziming Cheng Junting Pan Zhaohui Hou Mingjie Zhan LLMAG 344 9 0 05 Mar 2025
AutoEval: A Practical Framework for Autonomous Evaluation of Mobile Agents Jiahui Sun Zhichao Hua Yubin Xia 334 5 0 04 Mar 2025
AppAgentX: Evolving GUI Agents as Proficient Smartphone Users Wenjia Jiang Yangyang Zhuang Chenxi Song Xu Yang Chi Zhang Chi Zhang LLMAG 425 27 0 04 Mar 2025
UFO: A Unified Approach to Fine-grained Visual Perception via Open-ended Language Interface Hao Tang Chenwei Xie Haiyang Wang Xiaoyi Bao Tingyu Weng Nianzu Yang Yun Zheng Liwei Wang ObjD VLM 305 10 0 03 Mar 2025