浙江大学开发“女娲”AI模型,精准预测基因组调控序列

查找参加最新学术会议,发表EI、SCI论文,上学术会议云
软件著作权申请198元全包

浙江大学开发“女娲”AI模型,精准预测基因组调控序列

文章导读
你是否好奇,AI如何破解生命最深奥的密码?浙江大学郭国骥团队发布革命性AI模型“女娲CE”,仅凭DNA序列即可精准预测脊椎动物单细胞水平的基因调控图谱,准确率超90%。依托自研的超高通量测序技术与覆盖多物种的百万级调控序列数据,该模型突破传统方法瓶颈,不仅能预测突变后果,还可为遗传病治疗设计靶点。这项登顶《细胞》的研究,正揭开基因组“暗物质”的神秘面纱,或将重塑医学与合成生物学的未来。
— 内容由好学术AI分析文章内容生成,仅供参考。

78日,浙江大学郭国骥教授团队在《细胞》发文,开发出基于超高通量超灵敏单核ATAC测序技术(UUATAC-seq)的多任务深度学习模型女娲CE”NvwaCE)。该模型能够从基因组序列直接预测单细胞水平的调控序列图谱,为解读基因组调控密码提供了强大的工具。这一成果不仅在多项指标上超越现有基因组AI模型,为理解遗传病发病机制和设计合成调控序列提供了新的方法。

基因组包含蛋白质编码序列和大量调控序列,这些序列协同作用决定了生物体的复杂表型特征。然而,科学家对基因组中调控序列的理解仍十分有限,传统方法在数据质量和批次效应上存在瓶颈。研究团队通过自主研发的UUATAC-seq技术,直接测量调控DNA,避免了低表达基因的扩增偏差,能够在单日内高效率绘制一个物种的染色质可及性图谱。基于高质量的UUATAC-seq数据,研究团队构建了覆盖多种脊椎动物的全身单细胞染色质可及性图谱,并鉴定出数百万个候选顺式调控序列(cCREs)。这些数据为女娲CE”模型提供了丰富的教材,使其能够学习调控序列编码规则,并基于一维DNA序列预测任意脊椎动物单细胞中的染色质可及性水平。与现有模型相比,女娲CE”在预测准确率上显著提升,对几乎所有细胞类型实现了AUROC>0.90的预测准确率。

女娲CE”不仅能够预测细胞位置发生突变后的表型变化,还能结合疾病表型设计治疗位点。不仅为解读基因组调控规则提供了新工具,还为生命科学、医学和农学研究提供了强大的支撑,未来有望在更多领域发挥重要作用。

© 版权声明
查找最新学术会议,发表EI、SCI论文,上学术会议云

相关文章

查找最新学术会议,发表EI、SCI论文,上学术会议云

暂无评论

none
暂无评论...