研究开发基于深度学习的密码子优化模型
文章导读
你是否知道,让工程菌高效表达蛋白的关键,可能藏在那些被传统方法“误删”的稀有密码子中?中国科学院天津工业生物技术研究所江会锋团队突破性提出深度学习模型DeepCodon,不再一味追求高频密码子,而是智能保留与蛋白折叠密切相关的稀有密码子簇。实验证明,90%的优化基因表达表现 equal or better than 传统方法。这项融合AI与生物设计的创新,正为合成生物学带来更精准的序列优化方案——点击了解如何让基因表达“既高效又正确”。
— 内容由好学术AI分析文章内容生成,仅供参考。
在合成生物学与工业生物制造领域,密码子优化是提升外源基因表达水平的关键环节。然而,传统方法往往依赖高频密码子替换,这一策略虽然能够在一定程度上提高表达效率,但可能破坏自然序列中与蛋白折叠和翻译动力学相关的“稀有密码子簇”,产生不表达或低表达现象。
近日,中国科学院天津工业生物技术研究所研究员江会锋团队在密码子优化研究方面取得进展。研究团队开发出基于深度学习的密码子优化模型DeepCodon。该模型在提升密码子偏好性的同时,尽可能保留功能相关的稀有密码子特征,为工程菌株序列设计提供了新思路。
DeepCodon以人工智能学习密码子选择规律为基础,建立从蛋白质到编码序列的“翻译映射”。在大规模序列数据训练的基础上,研究团队对高表达基因进行微调,使模型在生成合理密码子序列的同时能够兼顾高表达性能。进一步,DeepCodon引入条件概率策略,优先保护进化上保守、与功能相关的稀有密码子簇,避免传统方法过度使用高频密码子带来的翻译拥堵和错误折叠风险。
在实验验证中,研究团队分别利用DeepCodon与传统方法优化20个基因,并在大肠杆菌中表达。结果显示,9个DeepCodon优化基因表达高于传统方法,10个基因与传统方法相当,仅1个基因低于传统方法。目前,该工具主要面向大肠杆菌应用场景,并提供免费在线密码子优化服务。
相关成果已发表在《生物设计研究》(BioDesign Research)上。研究工作得到国家自然科学基金和中国科学院战略性先导科技专项的支持。
DeepCodon示意图
© 版权声明
本文由分享者转载或发布,内容仅供学习和交流,版权归原文作者所有。如有侵权,请留言联系更正或删除。
相关文章
暂无评论...