首页 > 计算机科学

Mac变身AI超算!用Claude逆向M4芯片,纯推理引擎跑通Transformer

PaperWeekly 2026-03-03 18:14
文章摘要
本文介绍了通过逆向工程解锁苹果M4芯片内置的神经网络引擎(ANE)底层权限,使其能够支持完整的Transformer模型训练。背景是ANE原本被限制为仅用于推理,且权限封闭。研究目的是通过绕过CoreML框架,直接调用私有API,以揭示ANE的真实硬件性能并实现训练功能。结论表明,直接访问ANE可大幅提升性能,其能效比高达6.6 TFLOPS/W,约为英伟达A100的80倍,同时成功在ANE上跑通了1.1亿参数的Transformer模型训练,并通过系统级hack解决了编译限制等问题,证明了Apple Silicon在端侧AI的潜力受限于软件生态。
Mac变身AI超算!用Claude逆向M4芯片,纯推理引擎跑通Transformer
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。
最新文章
通义开源Mobile-Agent-v3.5:面向多端自动化操作,20+榜单实现SOTA
通义开源Mobile-Agent-v3.5:面向多端自动化操作,20+榜单实现SOTA
拒绝原地打转!通义实验室开源多端 GUI 基座,会反思、能调用工具,让 Agent 真正把活干完。说起 GUI Agent,最尴尬的时刻大概不是它点错按钮,而是它一本正经地操作了半天,最后把你带回了原
15小时前
Mac变身AI超算!用Claude逆向M4芯片,纯推理引擎跑通Transformer
Mac变身AI超算!用Claude逆向M4芯片,纯推理引擎跑通Transformer
你的 Mac 桌面,刚刚变成了一台超高能效的 AI 超算。苹果 M4 芯片内置的神经网络引擎(ANE)原本有着严格的官方定位:仅限推理,其底层权限被彻底封锁。但在近期,一项系统级开源项目硬是砸开了这个
15小时前
150B tokens实测反转!你的DeepSeek mHC可能根本不需要“m”约束
150B tokens实测反转!你的DeepSeek mHC可能根本不需要“m”约束
我们每天都在跟进最新的顶会和明星模型,但纸面上的精妙公式在实际训练中总是无懈可击吗?\u00A9作者 | 谢天单位 | 微软亚洲研究院研究员研究方向 | 大模型预训练算法最近几周在学习 DeepSeek mHC
2026-03-02
63万指令微调!LEADS登Nature子刊,重塑医学文献挖掘工作流
63万指令微调!LEADS登Nature子刊,重塑医学文献挖掘工作流
前不久 Nature 主刊上的 OpenScholar 把「用 AI 做科学文献综述」又推了一把:检索增强、4500 万篇开放获取论文、引用准确度媲美人类专家,而通用大模型在引用上动辄 78%–90%
2026-03-02
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1