西安交大人机所博士生研究成果在《自然》子刊《自然机器智能》发表

查找参加最新学术会议,发表EI、SCI论文,上学术会议云
热门国际学术会议推荐 | 出版检索稳定,快至7天录用
2026年第五届网络、通信与信息技术国际会议(CNCIT 2026)
2026年智能机器人与控制技术国际会议(CIRCT 2026)
2026年传感器技术、自动化与智能制造国际会议(STAIM 2026
ACEEE 2026
文章导读
你以为AI制药的瓶颈在于算力,其实卡住脖子的是天然产物那“捉摸不透”的结构。传统模型面对这些复杂的分子往往“束手无策”,导致药物研发周期漫长且成本高昂。西安交大联合团队在《自然机器智能》上抛出的新模型NaFM,没有死磕通用算法,而是利用“母核感知”策略,精准捕捉到了分子骨架与生物活性间的隐秘关联。这一突破不仅解决了长期困扰学界的分布偏移难题,更让药物筛选的准确率有了质的飞跃——但这套模型究竟是如何从看似杂乱的数据中“读”出进化规律的?答案藏在它的预训练逻辑里。
— 内容由好学术AI分析文章内容生成,仅供参考。

近日,北京大学药学院联合西安交通大学人工智能与机器人研究所(以下简称“人机所”)、华盛顿大学、香港中文大学及石河子大学等单位,在小分子天然产物智能表征与药物发现研究方面取得新进展。研究团队提出了面向小分子天然产物的基础模型NaFM(Foundation Model for Natural Products),相关成果以《小分子天然产物的基础模型预训练》(Pretraining a foundation model for small-molecule natural products)为题,发表于国际高水平期刊《自然机器智能》(Nature Machine Intelligence)。

西安交大人机所博士生研究成果在《自然》子刊《自然机器智能》发表

在该研究中,西安交大人机所郑南宁院士团队深度参与了模型架构设计与人工智能方法开发工作。北京大学刘振明教授、西安交大人机所郑南宁教授以及博士生王裕淞为本文共同通讯作者,北京大学硕士生丁宇恒为第一作者。

天然产物是由微生物、动物或植物产生的代谢产物,具有结构多样性高、生物活性丰富等特点,是抗肿瘤、抗感染等药物发现的重要来源。然而,其发现过程长期面临周期长、成本高、标注数据有限等挑战。现有深度学习方法多依赖单一任务的监督学习,模型泛化能力有限;而针对合成分子的通用表征方法,也难以刻画天然产物在来源、骨架结构、合成途径与生物活性之间的复杂关联。进一步而言,天然产物在化学空间中呈现出以核心母核(scaffold)为中心的层级化分布特征,并与通用化合物空间存在显著分布偏移(distribution shift),导致现有模型难以直接迁移应用。因此,构建面向天然产物结构与生物学约束的专用预训练范式尤为迫切。为此,研究团队以分子母核为核心构建表征框架,系统刻画并对齐天然产物在生物来源、生物合成基因簇、合成途径及生物活性等多维属性之间的内在关联,提出了母核感知的预训练策略。

NaFM将掩码图学习与对比学习相结合:一方面,在天然产物分子骨架区域进行子图掩码,要求模型同时重建原子属性、化学键属性和拓扑连接信息;另一方面,以骨架相似性作为软权重,引导模型区分不同分子之间的强弱负样本关系,从而更有效地学习天然产物的进化规律与结构特征。在预训练阶段,研究团队基于COCONUT 数据库中约60万条未标注天然产物结构数据,构建了面向天然产物的分子表示学习框架。实验结果表明,相较于传统分子指纹和多种预训练图神经网络方法,NaFM在天然产物分类、来源识别、基因组挖掘、活性预测和虚拟筛选等任务中表现出更强的迁移能力和鲁棒性。

西安交大人机所博士生研究成果在《自然》子刊《自然机器智能》发表

NaFM的母核感知预训练框架。该框架结合母核子图重建与母核感知对比学习:在天然产物核心骨架区域遮蔽原子、化学键和拓扑连接信息,并基于骨架相似性加权对比学习,从而捕获天然产物生物来源、生物合成基因簇、合成途径与生物活性之间的内在关联。

论文链接:https://www.nature.com/articles/s42256-026-01226-8

© 版权声明
热门国际学术会议推荐 | 多学科征稿、征稿主题广 | 免费主题匹配
IOP-JPCS出版|2026年先进电子与自动化技术国际学术会议(AEAT 2026)
2026年第四届亚洲计算机视觉、图像处理与模式识别国际会议(CVIPPR 2026)
2026年智能机器人与控制技术国际会议(CIRCT 2026)
2026年传感器技术、自动化与智能制造国际会议(STAIM 2026)

相关文章

查找最新学术会议,发表EI、SCI论文,上学术会议云
热门国际学术会议推荐 | 立即查看超全会议列表

1 条评论

  • 火焰程序员
    火焰程序员 游客

    西安交大这波可以啊,郑院士团队还是稳的。

    广东省江门市
    回复