通义开源Mobile-Agent-v3.5:面向多端自动化操作,20+榜单实现SOTA
PaperWeekly
2026-03-03 18:14
文章摘要
背景:在真实场景中,GUI Agent面临数据采集困难、多平台操作差异以及能力不全面等挑战,常导致操作无效循环。研究目的:通义实验室开源Mobile-Agent-v3.5及GUI-Owl-1.5模型家族,旨在构建一个能在桌面、手机、浏览器等多端实现统一自动化操作、具备反思与工具调用能力的智能体,以完成长链路复杂任务。结论:GUI-Owl-1.5通过数据合成、DAG任务组织、知识注入及MRPO多平台优化等方法,在20多个基准测试中达到SOTA性能,显著提升了GUI Agent的准确性、稳定性和实用性,使其能够真正完成工作而非仅演示。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。