清华大学清华大学团队联合研发AI驱动的超高通量药物虚拟筛选平台DrugCLIP

查找参加最新学术会议,发表EI、SCI论文,上学术会议云
2025年数据科学与智能系统国际会议(DSIS 2025)
2025年第四届先进的电子、电气和绿色能源国际会议 (AEEGE 2025)
2025年第二届亚太计算技术、通信和网络会议(CTCNet 2025)
热门国际学术会议推荐 | 出版检索稳定,快至7天录用
2026年第五届算法、计算和机器学习国际会议(CACML 2026)
2026年第八届软件工程和计算机科学国际会议(CSECS 2026)
文章导读
新药研发的漫长等待即将成为历史。清华大学团队最新研发的AI药物筛选平台DrugCLIP,将传统需要数百年的计算任务压缩至一天完成,实现了百万倍的效率突破。它不仅精准预测了多个靶点的候选药物分子,更首次完成了覆盖整个人类基因组的虚拟筛选,并免费开放了海量数据库。这标志着我们距离快速攻克癌症、罕见病等难题,又迈进了一大步。
— 内容由好学术AI分析文章内容生成,仅供参考。

目前,人类对靶向药物的探索约覆盖人体全部可成药靶点的10%。面对数以万计的潜在靶点,如何在广阔的化学空间中,快速筛选苗头化合物,已成为该领域研究的瓶颈清华大学智能产业研究院教授(AIR)兰艳艳联合生命学院、化学系团队创新研发AI驱动的超高通量药物虚拟筛选平台DrugCLIP,比传统方法实现了百万倍提升,在预测准确率上也取得显著突破。依托该平台,团队首次完成了覆盖人类基因组规模的药物虚拟筛选,为创新药物发现带来了新的可能性

清华大学清华大学团队联合研发AI驱动的超高通量药物虚拟筛选平台DrugCLIP 

图1.DrugCLIP主页

目前,受限于自动移液工作站、超级计算机等工具的高昂成本,绝大多数潜在靶点和化合物仍未被充分探索。人类基因组编码2万余个蛋白,现有蛋白靶点开发只覆盖其中小部分。若使用当前最先进的分子对接工具筛选1万个蛋白靶点,假设每个靶点面对109个候选分子,则需完成约1013次蛋白-配体打分,一台计算机即使日夜不休,也需数百年才可完成计算。DrugCLIP将该计算量缩短为一台计算节点一天的机时,首次打通了从蛋白结构预测到药物发现的关键通道,实现覆盖人类基因组规模的虚拟筛选

硬件方面,基于128核中央处理器(CPU)和8张图形处理器(GPU)的计算节点,DrugCLIP即可实现万亿级蛋白口袋小分子对打分日吞吐能力其核心突破在于将传统的分子对接转化为蛋白口袋与小分子在向量空间中的高效语义检索,较分子对接等传统方法的速度提升百万倍

清华大学清华大学团队联合研发AI驱动的超高通量药物虚拟筛选平台DrugCLIP 

图2.基于DrugCLIP的超高速全基因组虚拟筛选

在生命学院闫创业团队协作下DrugCLIP模型从160万个候选分子中,为去甲肾上腺素转运体(NET)靶点筛选出约100个高评分分子。同位素配体转运实验检测显示,其中15%为有效抑制剂,其中12个分子结合能力优于现有抗抑郁药物安非他酮。

化学系刘磊团队通过DrugCLIP针对E3泛素连接酶TRIP12(thyroid hormone receptor interactor 12)进行了虚拟筛选与实验验证。通过使用TRIP12的AlphaFold结构,DrugCLIP模型从160万个候选分子中高通量筛选出约50个高评分分子。实验证实,其中10个分子与TRIP12有结合能力,两个亲和力较高的分子也对TRIP12的泛素连接酶活性有一定抑制活性。

依托DrugCLIP,联合团队首次完成了人类基因组规模的虚拟筛选项目可覆盖约1万个蛋白靶点、2万个蛋白口袋,分析筛选超过5亿个类药小分子,总共富集出超过200万个潜在活性分子,构建了目前已知最大规模的蛋白-配体筛选数据库,该数据库已免费面向全球科研社区开放,为基础研究与早期药物发现提供了强大数据支持。

同时,筛选服务平台也已同步上线,支持对用户上传的靶点和蛋白口袋m进行定制化筛选。截至论文发表,半年来该平台已经累计服务1400余名用户完成了1.35万余次筛选。

清华大学清华大学团队联合研发AI驱动的超高通量药物虚拟筛选平台DrugCLIP 

图3.人类基因组规模筛选项目覆盖的蛋白数目与现有数据库对比(左:覆盖的靶蛋白空间,使用ESM1b编码并进行t-SNE降维可视化;右:覆盖的UniProt ID数量)

未来,DrugCLIP将与科研与产业生态伙伴深度合作,在抗癌、传染病、罕见病等方向加速新靶点与First-in-class药物(首创新药)的发现。

研究成果以“深度对比学习实现基因组级别药物虚拟筛选”(Deep contrastive learning enables genome-wide virtual screening)为题,于北京时间1月9日在线发表于《科学》(Science)。

清华大学智能产业研究院(AIR)博士后贾寅君、计算机系2024级博士生高博文、生命学院博士后谭佳鑫、化学系博士后郑济青以及智能产业研究院(AIR)博士后洪鑫为论文共同第一作者;智能产业研究院(AIR)教授兰艳艳,生命学院副教授张伟、闫创业,化学系教授刘磊为论文共同通讯作者。

研究得到国家重点研发计划、国家自然科学基金委、新基石研究基金等项目的支持,以及清华大学无锡应用技术研究院智能产业创新中心、北京智源人工智能研究院、清华-IDG/麦戈文脑科学研究院、膜生物学全国重点实验室和北京结构高精尖中心等机构的支持。

论文链接:

https://doi.org/10.1126/science.ads9530

供稿:智能产业研究院

编辑:李华山

审核:郭玲

© 版权声明
2025年数据科学与智能系统国际会议(DSIS 2025)
第二届大数据分析与人工智能应用学术会议(BDAIA2025)
2025年第四届先进的电子、电气和绿色能源国际会议 (AEEGE 2025)
2025年第二届亚太计算技术、通信和网络会议(CTCNet 2025)
热门国际学术会议推荐 | 多学科征稿、征稿主题广 | 免费主题匹配
2026年第五届算法、计算和机器学习国际会议(CACML 2026)
2026年第八届软件工程和计算机科学国际会议(CSECS 2026)

相关文章

查找最新学术会议,发表EI、SCI论文,上学术会议云
第三届机器学习与自动化国际学术会议(CONF-MLA 2025)
热门国际学术会议推荐 | 立即查看超全会议列表

3 条评论

  • 细碎密集
    细碎密集 读者

    DrugCLIP用的对比学习具体是怎么设计的?能抗过拟合吗?

    吉林省长春市
    回复
  • 梦境织梦人
    梦境织梦人 游客

    感觉传统药筛确实太慢了,这波AI算是打通任督二脉了

    陕西省榆林市
    回复
  • 雪霁初晴
    雪霁初晴 读者

    这效率提升也太离谱了,百万倍?🤯

    吉林省延边
    回复