研究进展:忆阻器-类脑强化学习 | Nature Machine Intelligence
今日新材料
2025-12-12 11:30
文章摘要
背景:忆阻器技术被视为新一代仿生计算专用硬件,但现有方案多仅部分借鉴大脑结构,且硬件应用常限于算法特定环节,将昂贵计算留给软件。研究目的:苏黎世联邦理工学院的研究团队旨在通过模拟忆阻器硬件,实现完全生物启发的执行者-评论者时序差分强化学习算法,以模拟基于奖赏的学习原理,并探索其在自主机器人等低功耗实时学习应用中的潜力。结论:研究成功利用基于HfO₂-CMO双层的价态变化忆阻器作为人工突触,在硬件中同时完成了在线权重训练、动作决策和权重更新,实现了真正的“内存内计算”。该框架在T迷宫和莫里斯水迷宫导航任务中测试,智能体通过在线学习快速找到最优路径,标志着完全基于内存、在线学习的仿生神经形态计算的重要进展。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。