计算机行业点评报告:英伟达:重视AI推理计算,发布Rubin CPX芯片

股票资讯 阅读:15 2025-09-28 17:49:31 评论:0

  事件

  英伟达于9月9日宣布其Blackwell Ultra计算平台在MLPerf Debut测试中创下新的AI推理速度纪录。同日,英伟达发布了专门针对长上下文推理任务设计的Rubin CPX芯片。

  投资要点

  GB300服务器创下AI推理速度记录,分离式推理成为重要方向

  大模型发展对计算推理速度提出更高要求,英伟达算力系统具备领先表现。随着大语言模型参数量越来越大,且在推理过程中需要产生很多中间推理过程的token,对算力硬件的推理能力提出了更高要求。近期英伟达对其最新的基于Blackwell Ultra架构的算力系统(GB300 NVL72服务器)采用MLPerf Inferencev5.1测试标准,对DeepsSeek-R1、Llama3.1、Whisper等流行开源AI模型的推理速度进行了测试,结果显示,GB300服务器在每GPU每秒生成token数量上创下新纪录,大幅领先公司此前的DGX H200和GB200服务器。

  分离式推理成为重要方向,能够进一步增强AI推理速度。英伟达高度重视分离式推理的架构,在将GB200服务器中的16块GPU用于生成、56块GPU用于上下文处理之后,能够进一步提升服务器的整体推理速度。该技术趋势有望在未来广泛应用并促进AI模型的推理效率,从而推动AI应用的部署。

  发布Rubin CPX芯片,加速长上下文推理性能和效率

  AI智能体系统需要多步推理、持久记忆和长上下文以处理复杂任务,Rubin CPX芯片针对长上下文处理和分离式推理进行优化。本次新发布的Rubin CPX芯片专门针对长上下文进行优化,并且对视频编码解码能力给予支持,在长上下文推理和视频模型推理中具备特殊效果。其设计本身反映了英伟达对强化AI推理计算效能和分离式推理架构的重视。我们认为未来该芯片的推广应用有望巩固英伟达在AI计算生态中的领先地位,并加速AI模型和应用的部署应用。

  投资建议

  英伟达始终处于AI计算领域的前沿,不断通过革新硬件和计算架构增强AI算力对AI模型计算的支持。建议投资者重点关注其AI算力产品更新、泛AI生态圈拓展延申等方面的进展。

  风险提示

  (1)AI技术投入与成本控制压力;(2)市场竞争加剧;(3)用户增长可持续性挑战;(4)汇率波动与国际化风险。


华鑫证券 任春阳,谢孟津
声明

本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。