arXiv|微软研究院:驱动科学发现与创新的跨领域AI大模型NatureLM
智药邦
2025-03-29 08:00
文章摘要
本文介绍了微软研究院科学智能中心开发的NatureLM,这是一个旨在整合多个自然科学领域建模工作的基础语言模型。背景方面,自然科学各领域长期存在知识体系独立、跨学科协作困难的问题,制约了科学整体发展。研究目的是通过NatureLM打破学科壁垒,该模型融合自然语言和人类语言,覆盖小分子、蛋白质、材料等多个领域,提供跨学科AI工具。NatureLM基于GPT架构,通过多领域数据预训练和指令微调,提供三种规模版本以适应不同需求。应用案例显示,NatureLM在化合物分子设计、蛋白设计和材料设计等方面表现优异,如生成与靶点蛋白结合的化合物、设计血红素结合蛋白以及具有特定体积模量的新材料。结论指出,NatureLM为跨学科研究提供了强大工具,有望推动科学发现与创新,尽管在某些技术细节上仍有改进空间。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。