研究揭示蛋白高阶特征的适应性趋同演化

查找参加最新学术会议,发表EI、SCI论文,上学术会议云
第十届计算机技术与机械电气工程国际学术论坛(ISCME 2025)暨2025年泰山学术论坛-鲁东大学微纳传感器及系统专题论坛
2025年第四届算法、数据挖掘与信息技术国际会议(ADMIT 2025)
2025年第八届机器学习和自然语言处理国际会议(MLNLP 2025)
2025年第八届数据科学和信息技术国际会议(DSIT 2025)
2025年数据科学与智能系统国际会议(DSIS 2025)
2025年第四届先进的电子、电气和绿色能源国际会议 (AEEGE 2025)
2025年第二届亚太计算技术、通信和网络会议(CTCNet 2025)
文章导读
你是否想过,生物演化中的“殊途同归”背后,藏着连基因序列都掩盖的真相?当传统方法无法解释功能相似蛋白的演化路径时,一项突破性研究揭示:决定趋同的,可能不是个别氨基酸,而是蛋白的高阶特征。中科院团队借助AI驱动的蛋白语言模型,构建全新分析框架ACEP,首次在全基因组水平捕捉到蝙蝠与齿鲸回声定位背后的隐性趋同信号,发现数百个候选基因——这不仅是演化机制的认知革新,更将人工智能深度融入生命科学探索,打开理解基因型与表型关系的新窗口。
— 内容由好学术AI分析文章内容生成,仅供参考。

趋同演化是生物演化中的重要现象。长期以来,演化生物学研究致力于探索表型趋同背后的分子适应性演化机制。传统研究方法聚焦于蛋白序列中单个氨基酸位点的趋同变化。但是,越来越多的证据表明,即使没有明确的位点趋同,同源蛋白仍可能通过高阶结构或理化特征的趋同演化实现功能相似性。 

近日,中国科学院动物研究所邹征廷团队提出ACEP计算分析框架,利用预训练蛋白语言模型,揭示了蛋白高阶特征在功能适应性趋同演化中的重要作用。 

通过在海量蛋白序列数据上进行预训练,蛋白语言模型能够捕捉序列中复杂的上下文信息和高阶特征,将蛋白序列转化为包含这些演化特征的高维嵌入向量 。研究发现,即使在已知不存在位点趋同的案例中,预训练蛋白语言模型生成的嵌入向量仍能反映蛋白高阶特征的相似性,表明高阶特征趋同是蛋白功能趋同的分子基础。 

基于这一发现,研究团队设计了ACEP分析流程,其核心包括三个步骤,即计算目标类群同源蛋白嵌入向量的真实距离,通过模拟中性演化过程构建背景距离分布,基于分布对真实距离进行统计检验,判断是否存在显著的高阶特征趋同信号。同时,ACEP在多个已知案例中得到显著结果。 

进一步,全基因组筛选显示,ACEP在蝙蝠与齿鲸中识别出数百个具有高阶特征趋同信号的候选基因,功能富集分析显著关联“感官感知”等条目,涵盖已知回声定位基因和多个新候选基因。部分候选基因还得到正选择检验的支持,增强了其发生适应性趋同的可信度。同时,为提升结果的可解释性,团队分析了嵌入向量趋同背后的具体高阶特征。 

上述究揭示了蛋白高阶特征趋同适应性演化的机制,展示了人工智能技术在针对复杂的基因型-表型映射进行演化生物学分析时的潜力。

ACEP框架为在全基因组水平系统挖掘基因的复杂适应性趋同模式提供了新工具,代码已通过HuggingFace平台开源。 

相关研究成果发表在《美国国家科学院院刊》(PNAS)上。研究工作得到国家自然科学基金和中国科学院战略性先导科技专项等的支持。

论文链接

代码

研究揭示蛋白高阶特征的适应性趋同演化

ACEP流程示意图以及在回声定位哺乳类中检测出的与“感官感知”相关的候选适应性趋同基因

© 版权声明
第九届电气、机械与计算机工程国际学术会议(ICEMCE 2025)
2025年第四届算法、数据挖掘与信息技术国际会议(ADMIT 2025)
2025年第八届机器学习和自然语言处理国际会议(MLNLP 2025)
2025年第八届数据科学和信息技术国际会议(DSIT 2025)
2025年数据科学与智能系统国际会议(DSIS 2025)
2025年第四届先进的电子、电气和绿色能源国际会议 (AEEGE 2025)
2025年第二届亚太计算技术、通信和网络会议(CTCNet 2025)

相关文章

查找最新学术会议,发表EI、SCI论文,上学术会议云
第四届能源与动力工程国际学术会议(EPE 2025)

暂无评论

none
暂无评论...