电子行业点评:384架构引领,910C蓄势待发

股票资讯 阅读:2 2025-04-29 20:56:53 评论:0

  事件:据韶关发布4月26日消息,全球首个商用智算昇腾超节点在中国电信粤港澳大湾区(韶关)算力集群正式上线。本次昇腾超节点的商用落地,标志着国产AI算力在实际应用场景中的渗透步伐进一步加快,国产算力迎来破局元年。

  CloudMatrix384商用上线,国产算力破局元年。从发布历程来看,CloudMatrix384于今年4月10日在华为云生态大会上正式发布,在面向AI时代海量算力需求背景下,华为云实现从服务器级到矩阵级的资源供给模式转变。目前,CloudMatrix384超节点已在芜湖地区规模部署,并在实际应用中展现出强劲性能。在70亿参数规模的DeepSeek-R1模型训练中,相较于H100集群,迭代速度提升1.8倍,高横向带宽架构有效突破了算例性能与集群线性扩展的瓶颈。同时硅基流动也在同日宣布,基于CloudMatrix384超节点、曻腾云服务及高性能推理框架SiliconLLM,完成了DeepSeek-R1模型的推理上线测试效果显示,在用户保持20TPS水平下,系统推理吞吐量达到1920tokens/s有效比肩H100。同时,经过主流测试集验证及大规模线上盲测,在昇腾算力部署DeepSeek-R1的模型精度与DeepSeek官方保持一致。而在4月26日,CloudMatrix384在中国电信粤港澳大湾区(韶关)的商用落地,也标志着华为云在超节点集群领域的重要突破。展望未来,我们认为CloudMatrix384在地方算力数据中心的商用突破有望为CSP厂商认证提供基础,同时华为云超节点加速规模化布局,整体部署增量有望持续释放。

  系统级创新的全面升级,CloudMatrix384在芯片、架构、软件生态多维提升:

  1)芯片方面,CloudMatrix384超节点基于384颗昇腾910C芯片构建。

  910C作为当前昇腾系列最先进的AI芯片,集成530亿晶体管,采用Davinci增强架构,集成64个AI Core,支持多单位混合精度计算。同时,910C应用3DFabric封装技术,实现Die-to-Die带宽500GB/s,显著提升芯片间互联效率,强化并行处理能力。在能效方面,910C通过三维堆叠散热设计与液冷冷却方案实现2.5kW/片的热密度,单颗功耗仅310W,相较上一代下降约40%,进一步强化高密度集群部署能力。

  2)架构方面,为满足超大规模集群需求,华为云对系统架构进行了深度优化

  完整超节点由16个机柜组成,其中12个为计算机柜,每柜配置32颗GPU,中央4个机柜部署Scale-Up交换设备。系统采用Scale Up网络通过单层架构实现GPU全互联,整体网络基于16800台模块化交换机,搭建扁平化拓扑以降低延迟。为支撑数百颗GPU的全互联能力,华为云在每颗GPU上配备7个400G光收发器,通过堆叠设计实现2800Gbit/s的Scale Up带宽。同时因采用单层扁平化拓扑,交换机端亦部署同样规模的光模块,整体形成5376个收发器用于Scale Up网络,额外1536个用于Scale Out网络,总共搭配6912个400G光收发器,有效保障了功能指标的达成。

  3)软件方面,CloudMatrix384依托910C芯片在性能优化与适配效率上实现了显著提升。系统全面升级至CANN6.0,并实现对CUDA生态的代码自动转换并兼容PyTorch等主流框架,大幅降低开发者的代码迁移成本。同时,系统适配MindSpore3.0,通过引入动态图优化与自动并行技术,模型训练效率提升30%。

  华为云在系统工程设计、光互联、网络架构及软件适配方面持续优化,使CloudMatrix384能够在超大规模集群中实现更高效的算力利用,进一步强化在全球AI基础设施竞争格局中的整体竞争力。

  CloudMatrix384集群性能全面对标NVL72。CloudMatrix384在五倍芯片堆叠配置下,在算力指标上优势明显:BF16性能达到300PFLOPS,约为GB200NVL72的1.7倍;HBM总容量达49.2TB,是GB200的3.6倍;总内存带宽达1229TB/s,为GB200的2.1倍;但在功耗上,CloudMatrix384总功率上达到559.4kW,是GB200NVL72的近四倍功耗,每FLOP计算功耗也高出2.3倍,预计将会带来更多的电力成本。能耗设计上的取舍,换来了在大规模训练及推理场景下显著的性能释放。但考虑到未来硬件和系统架构的持续升级,随着算力性能同步提升,系统能耗问题也有望逐步得到优化与改善。

  CloudMatrix384正式推出,相关供应链有望迎来新一轮放量。液冷方面

  集群密度大幅提升将带来更高的热管理需求,英维克、申菱环境作为华为液冷系统核心供应商,有望受益份额提升;电源方面,384颗910C芯片集中部署带动整体功耗上升,泰嘉股份、欧陆通等电源供应链企业预计将获得持续增量;芯片领域,超节点有望在多地超算中心落地部署,将带动中芯国际等核心晶圆代工厂商需求增长;在高速连接器方面,随着超节点规模化落地,相关需求有望快速增长,预计华丰科技等核心供应商有望在需求增长中收益;PCB/CCL方面,深南电路、南亚新材、生益科技作为华为重点供应商,有望随超节点建设获得新一轮订单需求;同时,在多相控制器领域,杰华特也有望在新一轮高性能AI集群建设中实现价值量提升。

  投资建议:随着超节点未来有望持续规模化部署,相关产业链的需求有望同步放大,建议关注:1)算力芯片:中芯国际;2)电源:泰嘉股份、欧陆通;3温控:申菱环境、英维克;4)其他供应链:华丰科技、杰华特、深南电路、南亚新材、生益科技等

  风险提示:应用落地不及预期,超节点部署进度不及预期,宏观经济波动。


民生证券 方竞,李萌
声明

本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。