国产超算编程模型研究取得进展

查找参加最新学术会议,发表EI、SCI论文,上学术会议云
热门国际学术会议推荐 | 出版检索稳定,快至7天录用
2026年第二届无线与光通信国际会议(CWOC 2026)
2026年第五届算法、计算和机器学习国际会议(CACML 2026)
2026年第八届软件工程和计算机科学国际会议(CSECS 2026)
2026年多尺度人工智能国际会议(MAI 2026)
2026年第四届亚洲计算机视觉、图像处理与模式识别国际会议 (CVIPPR 2026)
文章导读
你或许从未关注过超算编程的底层逻辑,但它的每一次突破,都在悄悄决定中国科研的算力自由度。面对神威架构独特的硬件限制,大多数人还在用传统方式硬扛开发成本,而中科院团队已悄然推出swKokkos——一个能让代码跨平台高效运行的国产化解决方案。我们拆解发现,它不仅通过向量化哈希与FDSL调度库将内核开销压到极限,更以分块并行算法实现超10万核的稳定加速。在AXPY等核心任务中,性能竟逼近原生Athread的99%。这意味着什么?当国外还在封锁高性能计算生态时,我们是否已经摸到了换道超车的钥匙?
— 内容由好学术AI分析文章内容生成,仅供参考。

高性能计算应用的性能可移植性,是应对异构架构演进的关键。近期,中国科学院计算机网络信息中心等在国产超算编程模型研究方面取得进展,自主研发出面向神威异构架构的性能可移植后端——swKokkos。

针对神威处理器独特的硬件约束,研究团队通过引入并行执行抽象,实现了源代码到二进制级别的性能可移植,降低了超算应用的开发与迁移成本。科研人员在swKokkos中引入了向量化哈希索引与FDSL快速调度库,降低内核启动开销;同时,提出分块并行映射算法,进一步提升负载均衡与缓存利用率。swKokkos在AXPY、数值求解器等任务中性能达原生Athread的99%以上,还能支撑海洋模型LICOM超10万核规模的稳定模拟并实现加速。

相关研究成果被系统软件领域国际学术会议EuroSys 2026录用。研究工作得到了国家重点研发计划、中国科学院战略性先导科技专项等的支持。

国产超算编程模型研究取得进展

swKokkos示意图

© 版权声明
第二届大数据分析与人工智能应用学术会议(BDAIA2025)
热门国际学术会议推荐 | 多学科征稿、征稿主题广 | 免费主题匹配
2026年第二届无线与光通信国际会议(CWOC 2026)
2026年第五届算法、计算和机器学习国际会议(CACML 2026)
2026年第八届软件工程和计算机科学国际会议(CSECS 2026)
2026年多尺度人工智能国际会议(MAI 2026)
2026年第四届亚洲计算机视觉、图像处理与模式识别国际会议(CVIPPR 2026)

相关文章

查找最新学术会议,发表EI、SCI论文,上学术会议云
第三届机器学习与自动化国际学术会议(CONF-MLA 2025)
热门国际学术会议推荐 | 立即查看超全会议列表

4 条评论

  • 脉冲信号
    脉冲信号 游客

    国产超算终于有自己的编程模型了,支持一下!

    浙江省杭州市
    回复
  • 银针凝露
    银针凝露 读者

    性能能达到99%?有点怀疑

    浙江省嘉兴市
    回复
  • 甜橙泡泡
    甜橙泡泡 读者

    之前搞过并行计算,确实折腾了好久

    北京北京市
    回复
  • 魔导学者
    魔导学者 游客

    看着好复杂,完全看不懂

    北京北京市
    回复