文章摘要
细菌通过多种机制抵御噬菌体入侵,这些抗噬菌体防御系统种类繁多且尚未被充分发掘。近期发表在《Science》上的两篇文章开发了基于机器学习和自然语言处理的预测模型。第一篇来自MIT团队,通过蛋白质语言模型ESM2构建表征并训练了名为DefensePredictor的模型,成功在计算机模拟中识别了82%的新发现防御系统,并在大肠杆菌中实验验证了42个预测系统对噬菌体有防护作用,其中15个是全新结构域。第二篇来自法国团队,通过开发并微调了三种互补的深度学习模型,其中GeneCLRDF结合序列与基因组背景,在基准数据集上达到99%精准率和92%召回率。实验验证发现了12个全新的抗噬菌体系统。模型对超过32,000个细菌基因组的预测表明,约1.5%的基因专门用于抗病毒防御,超过85%的预测防御相关蛋白家族此前与免疫无关,共预测出239万个抗噬菌体蛋白和约23,000个操纵子家族。这些研究揭示了比以往认知更庞大、更多样化的抗噬菌体世界,为开发新一代精密分子工具提供了基础。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。