Transformer已死?DeepMind正在押注另一条AGI路线
数据派THU
2026-01-15 19:06
文章摘要
背景:Transformer模型在长上下文处理、抽象知识层级、适应性及持续学习方面存在局限,特别是灾难性遗忘问题阻碍了AI的持续学习能力。研究目的:谷歌DeepMind团队提出嵌套学习(Nested Learning)框架,基于联想记忆(Associative Memory)概念,旨在通过优化器与架构的协同进化,构建可学习的记忆系统,解决AI模型短期记忆无法转化为长期记忆的问题,实现真正的持续学习。结论:嵌套学习不仅是一种架构创新,更是一种重新理解深度学习的范式,在长上下文和持续学习任务中展现显著优势,可能为AGI(通用人工智能)发展开启新路径,但同时也引发了关于AI安全与伦理的思考。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。