计算机：GTC Keynote点评-内存加强版GB300正式发布，后续产品迭代节奏不及预期

股票资讯阅读：268 2025-03-19 20:31:16 评论：0

　　摘要

　　NVIDIA发布了内存增强版Blackwell产品Blackwell Ultra。NVL7规格显示，单卡Dense FP4算力较B200提升50%，HBM配置升级至288GB HBM3e。网络层面，采用ConnectX8网卡替代ConnectX7，进一步提升性能。Blackwell Ultra预计于2025年下半年出货。此前市场预期的GB300采用“SXM Puck”形式及BGA封装的设计未在本次发布会上得到确认，整体发布符合市场预期。

　　NVIDIA发布了Blackwell继代产品Rubin和Rubin Ultra，并统一了GPU die计数标准。以Rubin NVL144为例，内含144颗die，实际由72颗Rubin芯片组成。Rubin Ultra单颗芯片整合4颗die，NVL576内仅有144颗Rubin Ultra芯片，低于此前预期的NVL288。Rubin Ultra采用纵向Tray结构，优化了机柜空间，预计将在大规模Scale Up场景中成为主流。值得注意的是，相较于GTC2024发布的路线图，Rubin系列的产品节奏出现约半年延迟，首款Rubin产品推迟至2026年下半年上市，而Rubin Ultra则需等待至2027年下半年，整体进度不及市场预期。此次延迟或与制程、封装及机柜层面的技术挑战有关，成为市场反应不佳的主要原因之一。

　　NVIDIA发布了Spectrum-X Photonics和Quantum-X Photonics硅光交换机平台，单端口速率达1.6Tb/s，总带宽最高400Tb/s，显著提升数据中心传输性能。Spectrum-X Photonics提供最高512个800Gb/s端口，Quantum-X Photonics提供144个800Gb/s InfiniBand端口，采用200Gb/s SerDes技术，进一步提升传输效率。该系列交换机提升了AI集群的扩展性，为超大规模数据中心提供更优解决方案。

　　NVIDIA发布了DGX Spark和DGX Station，进一步推动AI超算向个人桌面端普及。DGX Spark采用GB10Blackwell Superchip，具备128GB统一内存和最高4TB SSD，算力达1,000TOPS。DGX Station搭载更强的GB300Blackwell Ultra Superchip，AI性能达20PFLOPS，配备784GB统一内存，满足更高强度的AI训练和推理任务，进一步拓展AI计算的应用场景。

　　NVIDIA发布了开源推理服务框架NVIDIA Dynamo，旨在优化大规模AI模型的推理部署。Dynamo在运行DeepSeek-R1模型时，将请求处理能力提升多达30倍。其性能提升得益于解耦的Prefill/Decode阶段、动态GPU调度、LLM感知请求路由、加速GPU间异步数据传输及KV Cache跨内存层级卸载机制。Dynamo已在GitHub开源，并集成至NVIDIA AI Enterprise的NVIDIA NIM微服务，助力企业更高效部署AI推理模型。

　　风险提示

　　芯片制程发展与良率不及预期

　　中美科技领域政策恶化

　　智能手机销量不及预期

国金证券刘道明,黄晓军,麦世学

声明

本站内容源自互联网，如有内容侵犯了您的权益，请联系删除相关内容。本站不提供任何金融服务，站内链接均来自开放网络，本站力求但不保证数据的完全准确，由此引起的一切法律责任均与本站无关，请自行识别判断，谨慎投资。