Nat Commun|郭天南团队开发端到端深度学习模型DDA-BERT; 提升蛋白质组学复杂样本的肽段鉴定性能
BioArtMED
2026-05-12 00:29
文章摘要
本文介绍了一种基于Transformer架构的端到端深度学习模型DDA-BERT,用于提升蛋白质组学中数据依赖型采集(DDA)质谱数据的肽段鉴定性能。背景方面,传统PSM重打分方法依赖搜库引擎打分和手工特征工程,限制了特征学习与判别决策的协同优化。研究目的是开发一个统一框架,将原始质谱信号表示学习与PSM重打分任务整合,减少多步骤信息损失。研究团队基于11个物种、2.71亿条PSM进行大规模训练,并通过过拟合检验、序列记忆化分析和假阳性发现比例评估验证模型可靠性。结论表明,DDA-BERT在人类、酵母、果蝇和拟南芥等跨物种数据集中,于1% FDR阈值下PSM鉴定量提升了2.24%–269.35%;在低至约0.4个HeLa细胞的痕量样本中,鉴定灵敏度提升4.14%–87.47%;在HLA免疫肽段组学中同样表现优越。模型实现了目标与诱饵PSM的清晰评分区分,且通过严格统计评估验证了错误率控制能力。该研究为AI驱动的高通量、高可信蛋白质组学鉴定提供了新方法。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。