Nat Commun|百亿合成数据驱动智能合成规划研究
智药邦
2025-08-13 08:00
文章摘要
本研究由中国医学科学院药物研究所汪小涧团队与清华大学季向阳团队合作,开发了一种基于大规模预训练的逆合成规划模型RSGPT。该研究通过RDChiral算法生成百亿级合成数据,并引入RLAIF策略优化反应预测的合理性,最终在合成推断任务上达到SOTA水平。背景方面,传统逆合成分析依赖化学家经验且面临反应组合空间庞大等挑战,而现有AI模型受限于数据规模。研究目的旨在通过大规模数据预训练提升模型性能。结论显示,RSGPT在多个基准数据集上表现卓越,Top-1准确率达63.4%,并能应用于复杂药物的多步合成路线设计。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。