计算机:GTC Keynote点评-内存加强版GB300正式发布,后续产品迭代节奏不及预期
摘要
NVIDIA发布了内存增强版Blackwell产品Blackwell Ultra。NVL7规格显示,单卡Dense FP4算力较B200提升50%,HBM配置升级至288GB HBM3e。网络层面,采用ConnectX8网卡替代ConnectX7,进一步提升性能。Blackwell Ultra预计于2025年下半年出货。此前市场预期的GB300采用“SXM Puck”形式及BGA封装的设计未在本次发布会上得到确认,整体发布符合市场预期。
NVIDIA发布了Blackwell继代产品Rubin和Rubin Ultra,并统一了GPU die计数标准。以Rubin NVL144为例,内含144颗die,实际由72颗Rubin芯片组成。Rubin Ultra单颗芯片整合4颗die,NVL576内仅有144颗Rubin Ultra芯片,低于此前预期的NVL288。Rubin Ultra采用纵向Tray结构,优化了机柜空间,预计将在大规模Scale Up场景中成为主流。值得注意的是,相较于GTC2024发布的路线图,Rubin系列的产品节奏出现约半年延迟,首款Rubin产品推迟至2026年下半年上市,而Rubin Ultra则需等待至2027年下半年,整体进度不及市场预期。此次延迟或与制程、封装及机柜层面的技术挑战有关,成为市场反应不佳的主要原因之一。
NVIDIA发布了Spectrum-X Photonics和Quantum-X Photonics硅光交换机平台,单端口速率达1.6Tb/s,总带宽最高400Tb/s,显著提升数据中心传输性能。Spectrum-X Photonics提供最高512个800Gb/s端口,Quantum-X Photonics提供144个800Gb/s InfiniBand端口,采用200Gb/s SerDes技术,进一步提升传输效率。该系列交换机提升了AI集群的扩展性,为超大规模数据中心提供更优解决方案。
NVIDIA发布了DGX Spark和DGX Station,进一步推动AI超算向个人桌面端普及。DGX Spark采用GB10Blackwell Superchip,具备128GB统一内存和最高4TB SSD,算力达1,000TOPS。DGX Station搭载更强的GB300Blackwell Ultra Superchip,AI性能达20PFLOPS,配备784GB统一内存,满足更高强度的AI训练和推理任务,进一步拓展AI计算的应用场景。
NVIDIA发布了开源推理服务框架NVIDIA Dynamo,旨在优化大规模AI模型的推理部署。Dynamo在运行DeepSeek-R1模型时,将请求处理能力提升多达30倍。其性能提升得益于解耦的Prefill/Decode阶段、动态GPU调度、LLM感知请求路由、加速GPU间异步数据传输及KV Cache跨内存层级卸载机制。Dynamo已在GitHub开源,并集成至NVIDIA AI Enterprise的NVIDIA NIM微服务,助力企业更高效部署AI推理模型。
风险提示
芯片制程发展与良率不及预期
中美科技领域政策恶化
智能手机销量不及预期
本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。