通义开源Mobile-Agent-v3.5：面向多端自动化操作，20+榜单实现SOTA

PaperWeekly 2026-03-03 18:14

文章摘要

背景：在真实场景中，GUI Agent面临数据采集困难、多平台操作差异以及能力不全面等挑战，常导致操作无效循环。研究目的：通义实验室开源Mobile-Agent-v3.5及GUI-Owl-1.5模型家族，旨在构建一个能在桌面、手机、浏览器等多端实现统一自动化操作、具备反思与工具调用能力的智能体，以完成长链路复杂任务。结论：GUI-Owl-1.5通过数据合成、DAG任务组织、知识注入及MRPO多平台优化等方法，在20多个基准测试中达到SOTA性能，显著提升了GUI Agent的准确性、稳定性和实用性，使其能够真正完成工作而非仅演示。

通义开源Mobile-Agent-v3.5：面向多端自动化操作，20+榜单实现SOTA

阅读全文

本站注明稿件来源为其他媒体的文/图等稿件均为转载稿，本站转载出于非商业性的教育和科研之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请作者速来电或来函联系。

最新文章

通义开源Mobile-Agent-v3.5：面向多端自动化操作，20+榜单实现SOTA

拒绝原地打转！通义实验室开源多端 GUI 基座，会反思、能调用工具，让 Agent 真正把活干完。说起 GUI Agent，最尴尬的时刻大概不是它点错按钮，而是它一本正经地操作了半天，最后把你带回了原

15小时前

Mac变身AI超算！用Claude逆向M4芯片，纯推理引擎跑通Transformer

你的 Mac 桌面，刚刚变成了一台超高能效的 AI 超算。苹果 M4 芯片内置的神经网络引擎（ANE）原本有着严格的官方定位：仅限推理，其底层权限被彻底封锁。但在近期，一项系统级开源项目硬是砸开了这个

15小时前

150B tokens实测反转！你的DeepSeek mHC可能根本不需要“m”约束

我们每天都在跟进最新的顶会和明星模型，但纸面上的精妙公式在实际训练中总是无懈可击吗？\u00A9作者 | 谢天单位 | 微软亚洲研究院研究员研究方向 | 大模型预训练算法最近几周在学习 DeepSeek mHC

2026-03-02

63万指令微调！LEADS登Nature子刊，重塑医学文献挖掘工作流

前不久 Nature 主刊上的 OpenScholar 把「用 AI 做科学文献综述」又推了一把：检索增强、4500 万篇开放获取论文、引用准确度媲美人类专家，而通用大模型在引用上动辄 78%–90%

2026-03-02