首页 > 计算机科学

通义开源Mobile-Agent-v3.5:面向多端自动化操作,20+榜单实现SOTA

PaperWeekly 2026-03-03 18:14
文章摘要
背景:在真实场景中,GUI Agent面临数据采集困难、多平台操作差异以及能力不全面等挑战,常导致操作无效循环。研究目的:通义实验室开源Mobile-Agent-v3.5及GUI-Owl-1.5模型家族,旨在构建一个能在桌面、手机、浏览器等多端实现统一自动化操作、具备反思与工具调用能力的智能体,以完成长链路复杂任务。结论:GUI-Owl-1.5通过数据合成、DAG任务组织、知识注入及MRPO多平台优化等方法,在20多个基准测试中达到SOTA性能,显著提升了GUI Agent的准确性、稳定性和实用性,使其能够真正完成工作而非仅演示。
通义开源Mobile-Agent-v3.5:面向多端自动化操作,20+榜单实现SOTA
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。
最新文章
通义开源Mobile-Agent-v3.5:面向多端自动化操作,20+榜单实现SOTA
通义开源Mobile-Agent-v3.5:面向多端自动化操作,20+榜单实现SOTA
拒绝原地打转!通义实验室开源多端 GUI 基座,会反思、能调用工具,让 Agent 真正把活干完。说起 GUI Agent,最尴尬的时刻大概不是它点错按钮,而是它一本正经地操作了半天,最后把你带回了原
15小时前
Mac变身AI超算!用Claude逆向M4芯片,纯推理引擎跑通Transformer
Mac变身AI超算!用Claude逆向M4芯片,纯推理引擎跑通Transformer
你的 Mac 桌面,刚刚变成了一台超高能效的 AI 超算。苹果 M4 芯片内置的神经网络引擎(ANE)原本有着严格的官方定位:仅限推理,其底层权限被彻底封锁。但在近期,一项系统级开源项目硬是砸开了这个
15小时前
150B tokens实测反转!你的DeepSeek mHC可能根本不需要“m”约束
150B tokens实测反转!你的DeepSeek mHC可能根本不需要“m”约束
我们每天都在跟进最新的顶会和明星模型,但纸面上的精妙公式在实际训练中总是无懈可击吗?\u00A9作者 | 谢天单位 | 微软亚洲研究院研究员研究方向 | 大模型预训练算法最近几周在学习 DeepSeek mHC
2026-03-02
63万指令微调!LEADS登Nature子刊,重塑医学文献挖掘工作流
63万指令微调!LEADS登Nature子刊,重塑医学文献挖掘工作流
前不久 Nature 主刊上的 OpenScholar 把「用 AI 做科学文献综述」又推了一把:检索增强、4500 万篇开放获取论文、引用准确度媲美人类专家,而通用大模型在引用上动辄 78%–90%
2026-03-02
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1