国产超算编程模型研究取得进展
文章导读
你或许从未关注过超算编程的底层逻辑,但它的每一次突破,都在悄悄决定中国科研的算力自由度。面对神威架构独特的硬件限制,大多数人还在用传统方式硬扛开发成本,而中科院团队已悄然推出swKokkos——一个能让代码跨平台高效运行的国产化解决方案。我们拆解发现,它不仅通过向量化哈希与FDSL调度库将内核开销压到极限,更以分块并行算法实现超10万核的稳定加速。在AXPY等核心任务中,性能竟逼近原生Athread的99%。这意味着什么?当国外还在封锁高性能计算生态时,我们是否已经摸到了换道超车的钥匙?
— 内容由好学术AI分析文章内容生成,仅供参考。
高性能计算应用的性能可移植性,是应对异构架构演进的关键。近期,中国科学院计算机网络信息中心等在国产超算编程模型研究方面取得进展,自主研发出面向神威异构架构的性能可移植后端——swKokkos。
针对神威处理器独特的硬件约束,研究团队通过引入并行执行抽象,实现了源代码到二进制级别的性能可移植,降低了超算应用的开发与迁移成本。科研人员在swKokkos中引入了向量化哈希索引与FDSL快速调度库,降低内核启动开销;同时,提出分块并行映射算法,进一步提升负载均衡与缓存利用率。swKokkos在AXPY、数值求解器等任务中性能达原生Athread的99%以上,还能支撑海洋模型LICOM超10万核规模的稳定模拟并实现加速。
相关研究成果被系统软件领域国际学术会议EuroSys 2026录用。研究工作得到了国家重点研发计划、中国科学院战略性先导科技专项等的支持。

swKokkos示意图
© 版权声明
本文由分享者转载或发布,内容仅供学习和交流,版权归原文作者所有。如有侵权,请留言联系更正或删除。

















性能能达到99%?有点怀疑
之前搞过并行计算,确实折腾了好久
看着好复杂,完全看不懂