Meta公布“超级智能”新进展:无需人类,软件Agent即可自我训练!
学术头条
2025-12-26 17:11
文章摘要
背景:当前基于大语言模型的软件工程智能体高度依赖人类知识和人工策划的训练数据与环境,难以自主发现新问题与策略,限制了其向超级智能的发展。研究目的:Meta等研究团队提出Self-play SWE-RL(SSR)方法,旨在降低对人工标注和先验知识的依赖,使智能体仅通过访问沙盒化代码仓库即可自主获取学习经验,实现自我训练与提升。结论:实验表明,SSR能在无需任务描述和测试数据的情况下,通过自博弈循环(包括Bug注入与修复角色)持续提升性能,优于基线强化学习方法,展示了智能体自主增强软件工程能力的潜力,为迈向超级智能系统提供了新方向,但仍存在依赖显式测试、奖励投机等局限,需进一步探索。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。