ICLR 2026 | LongHorizonUI:让 GUI 智能体不再"半途而废"——面向长链路任务的统一鲁棒自动化框架
机器学习算法与自然语言处理
2026-03-13 00:00
文章摘要
本文介绍了LongHorizonUI框架,旨在解决基于多模态大语言模型的GUI智能体在执行长步骤任务时成功率急剧下降的问题。研究背景是现有智能体在超过10-15步的操作序列中表现不佳,主要由于感知漂移和决策误差累积。研究目的是通过提出一个统一鲁棒自动化框架来提升长链路任务的自动化性能。该框架包含多模态增强感知、深度反思决策和补偿式执行三大核心模块,并构建了LongGUIBench基准进行系统评估。实验结果表明,LongHorizonUI在通用和游戏场景中均显著优于现有方法,有效缓解了误差累积,提高了任务成功率。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。