北大推出功能基因深度挖掘大模型SYMPLEX,推动生物制造与合成生物元件开发

北大推出功能基因深度挖掘大模型SYMPLEX,推动生物制造与合成生物元件开发

49日,北京大学定量生物学中心钱珑团队与中科院深圳先进技术研究院娄春波研究员合作,在《科学·进展》上发文,推出了全球首个面向合成生物学元件挖掘与生物制造应用的大语言模型SYMPLEX。该模型通过融合领域大语言模型训练、合成生物专家知识对齐和大规模生物信息分析,实现了从海量文献中自动化挖掘功能基因元件并精准推荐其工程化应用潜力。该成果不仅为合成生物学元件设计提供了人工智能驱动的新范式,更展现了大语言模型等人工智能技术在生物制造中的突破性应用前景。

在生物制造领域,功能基因的挖掘和利用一直是关键技术难题。传统方法依赖于序列或结构分析,难以拓展至复杂功能基因,导致大量潜在的功能基因未被充分利用。为解决这一问题,研究团队开发了SYMPLEX智能基因挖掘平台。该平台通过自动化阅读和理解千万级体量的生物学文献,在基因、功能和知识水平上进行提取分析,并与专家数据库进行概念对齐,生成高质量候选基因集合。与传统生物信息学方法相比,SYMPLEX在挖掘基因的深度、数量和多样性上具有显著优势,其基因多样性也超越了现有蛋白质功能预测模型的预测边界。

SYMPLEX的成功应用不仅展示了其在mRNA疫苗生产中的巨大潜力,还为合成生物学元件设计提供了新的思路。该平台现已上线供研究人员免费使用,有望推动生物制造进入人工智能驱动的科学研究AI for Science)的新纪元。未来,研究团队计划利用SYMPLEX进行更多关键酶元件的挖掘,并拓展至合成通路设计等领域,进一步巩固我国在合成生物学和生物制造领域的领先地位。

© 版权声明

相关文章

学术会议云

暂无评论

none
暂无评论...