Mac变身AI超算!用Claude逆向M4芯片,纯推理引擎跑通Transformer
PaperWeekly
2026-03-03 18:14
文章摘要
本文介绍了通过逆向工程解锁苹果M4芯片内置的神经网络引擎(ANE)底层权限,使其能够支持完整的Transformer模型训练。背景是ANE原本被限制为仅用于推理,且权限封闭。研究目的是通过绕过CoreML框架,直接调用私有API,以揭示ANE的真实硬件性能并实现训练功能。结论表明,直接访问ANE可大幅提升性能,其能效比高达6.6 TFLOPS/W,约为英伟达A100的80倍,同时成功在ANE上跑通了1.1亿参数的Transformer模型训练,并通过系统级hack解决了编译限制等问题,证明了Apple Silicon在端侧AI的潜力受限于软件生态。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。