华为首次展出“算力核弹”!昇腾384超节点获评WAIC 2025镇馆之宝

7月28日消息,日前,2025世界人工智能大会(WAIC)在上海开幕,华为首次展出被称为“算力核弹”的昇腾384超节点真机,即Atlas900A3SuperPoD。华为表示,昇腾384超节点被评...

7月28日消息,日前,2025世界人工智能大会(WAIC)在上海开幕,华为首次展出被称为“算力核弹”的昇腾384超节点真机,即Atlas 900 A3 SuperPoD。

华为表示,昇腾384超节点被评选为本次WAIC 2025镇馆之宝。

昇腾384超节点通过高速互联总线,突破互联瓶颈,让超节点像一台计算机一样工作。

华为首次展出“算力核弹”!昇腾384超节点获评WAIC 2025镇馆之宝-图1

相比传统集群,主要有以下3大优势:

超大带宽

超节点内任意两个AI处理器之间通信带宽,相较于传统架构提升15倍,超节点内单跳时延降低10倍。

超低时延

昇腾超节点支持全局内存统一编址,具备更高效的内存语义通信能力。通过更低时延指令级内存语义通信,可满足大模型训练/推理中的小包通信需求,提升专家网络小包数据传输及离散随机访存通信效率。

昇腾384超节点是业界唯一突破Decode时延15ms的方案,满足实时深度思考下的用户体验需求。

超强性能

经过实际测试,在昇腾超节点集群上,LLaMA3等千亿稠密模型训练性能可达传统集群的2.5倍以上。

在通信占比更高的Qwen、DeepSeek等多模态、MoE模型上,可以达到3倍以上的提升。

据了解,昇腾384超节点首创将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”,其算力总规模达300Pflops,是英伟达NVL72的1.7倍。

网络互联总带宽达269TB/s,比英伟达NVL72提升107%;内存总带宽达1229TB/s,比英伟达NVL72提升113%;单卡推理吞吐量跃升到2300 Tokens/s。

华为首次展出“算力核弹”!昇腾384超节点获评WAIC 2025镇馆之宝-图2

华为首次展出“算力核弹”!昇腾384超节点获评WAIC 2025镇馆之宝-图3

华为首次展出“算力核弹”!昇腾384超节点获评WAIC 2025镇馆之宝-图4

本文转载于快科技,文中观点仅代表作者个人看法,本站只做信息存储

阅读前请先查看【免责声明】本文内容由互联网用户自发贡献,该文观点仅代表作者本人,本站仅供展示。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 1217266901@qq.com 举报,一经查实,本站将立刻删除。 转载请注明出处:https://jingfakeji.com/tech/93557.html

上一篇 2025年07月28日 17:21
下一篇 2025年07月28日 17:22

相关推荐

联系我们

在线咨询: QQ交谈

邮箱:1217266901@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信