国内团队成功训练首个由万卡集群支持的万亿参数大模型

科研动态5个月前更新 0f6ec722422f273c

查找参加最新学术会议，发表EI、SCI论文，上学术会议云

2025年数据科学与智能系统国际会议（DSIS 2025）

2025年第四届先进的电子、电气和绿色能源国际会议 (AEEGE 2025)

2025年第二届亚太计算技术、通信和网络会议（CTCNet 2025）

热门国际学术会议推荐 | 出版检索稳定，快至7天录用

2026年第五届算法、计算和机器学习国际会议(CACML 2026)

2026年第八届软件工程和计算机科学国际会议(CSECS 2026)

文章导读

国产大模型如何突破万卡算力极限，实现近乎零崩溃的训练？TeleAI团队在万卡集群上成功训练出首个万亿参数模型，颠覆性地提升长文本写作、超长会议纪要生成和大型电子报表处理效率。李学龙教授领衔，利用天翼云国产算力池和自研“息壤”平台，通过多维混合并行、通信优化等关键技术，实现每周仅1.5次中断的高稳定性。开源星辰语义模型TeleChat2-115B以86.9分登顶C-Eval评测，国产算力性能超93%GPU，揭秘这些突破如何重塑中国AI未来。

— 内容由好学术AI分析文章内容生成，仅供参考。

国内团队成功训练首个由万卡集群支持的万亿参数大模型

近日，中国电信人工智能研究院（TeleAI）成功训练出首个由万卡集群支持的万亿参数大模型，在长文本写作、超长会议纪要生成以及大型电子报表处理方面表现出色。该模型由李学龙教授领导的团队开发，使用了天翼云的国产万卡算力池和自研的“息壤”一体化智算服务平台。TeleAI通过多维混合并行等关键技术提升了集群性能和稳定性，实现了国产算力集群的突破，模型训练表现出高稳定性，平均每周仅中断1.5次。TeleAI还开源了千亿参数的星辰语义大模型TeleChat2-115B，是央企首个开源的语义大模型，该模型在C-Eval评测中以86.9分的成绩位列第一。此外，TeleAI在大模型训练上采用了多项关键技术，包括多维混合并行、通信优化、DryRun仿真和灵活重计算配置等，以提升性能和稳定性。这些技术的应用使得国产算力万卡集群性能超过对应GPU的93%以上

© 版权声明

本文由分享者转载或发布，内容仅供学习和交流，版权归原文作者所有。如有侵权，请留言联系更正或删除。

2025年数据科学与智能系统国际会议（DSIS 2025）

第二届大数据分析与人工智能应用学术会议（BDAIA2025）

2025年第四届先进的电子、电气和绿色能源国际会议 (AEEGE 2025)

2025年第二届亚太计算技术、通信和网络会议（CTCNet 2025）

热门国际学术会议推荐 | 多学科征稿、征稿主题广 | 免费主题匹配

2026年第五届算法、计算和机器学习国际会议(CACML 2026)

2026年第八届软件工程和计算机科学国际会议(CSECS 2026)

相关文章

南京大学南京大学在跨国界流域可持续发展评估与治理策略研究方面取得重要突破

南京大学南京大学在跨国界流域可持续发展评估与治理策略研究方面取得重要突破

3个月前

04590

科学家利用基因编辑纠正病人来源增殖肝细胞治疗遗传代谢性肝脏疾病

科学家利用基因编辑纠正病人来源增殖肝细胞治疗遗传代谢性肝脏疾病

8个月前

03,0880

上海交大江治副教授在固体火箭推进剂研究中取得新进展

上海交大江治副教授在固体火箭推进剂研究中取得新进展

4周前

37000

我国学者获2025年杰克·唐加拉早期成就奖

我国学者获2025年杰克·唐加拉早期成就奖

6个月前

01,2740

查找最新学术会议，发表EI、SCI论文，上学术会议云

第三届机器学习与自动化国际学术会议（CONF-MLA 2025）

热门国际学术会议推荐 | 立即查看超全会议列表

暂无评论

none

暂无评论...