Title
SWE-Compass: Towards Unified Evaluation of Agentic Coding Abilities for Large Language Models Jingxuan Xu K. Deng W. Li Songwei Yu Huaixi Tang ... Zhaoxiang Zhang Yuqun Zhang H. Zhang Bin Chen Jiaheng Liu ELM 320 1 0 07 Nov 2025
ReLook: Vision-Grounded RL with a Multimodal LLM Critic for Agentic Web Coding Yuhang Li Chenchen Zhang Ruilin Lv Ao Liu K. Deng Yuanxing Zhang Jiaheng Liu Wiggin Zhou B. Zhou LRM 75 3 0 13 Oct 2025