半导体行业研究:推理算力需求持续增长,ASIC端侧应用前景广阔

股票资讯 阅读:6 2025-03-21 20:13:24 评论:0

  推理算力需求扩容

  近年来大模型持续迭代,大模型参数规模总体呈现增加趋势,参数增加带动算力需求扩容。ChatGPT3.5加速了生成式人工智能的商业化进程,实现注册用户数量破亿仅耗时两个月,微软、谷歌等科技巨头纷纷接入,之后大模型热度持续火爆,带动算力需求激增。DeepseekR1问世推动大模型平价化,降低了大模型开发成本,利于为下游端侧和应用侧打开市场空间,下游爆发同样将催生大量算力需求,并推动算力需求由训练端向推理端转移。据IDC预测,推理服务器的工作负载占比预计由2020年的51.5%逐年增加至2026年的62.2%,中国人工智能服务器工作负载结构中的推理算力占比总体呈现增加趋势。

  Deepseek推动大模型平价化,端侧,应用侧商业化进程有望提速

  通过一系列算法优化,Deepseek-V3相较于同类模型,训练成本大幅下降,完成训练仅耗时不到两个月,按H800芯片算力测算,Deepseek-V3预训练阶段的训练时长为266,4万GPU小时,上下文扩展训练耗时11.9万GPU小时,后训练阶段耗时5,000GPU小时,假设H800每小时的租赁价格为2美元,则模型的总训练成本为557.6万美元,训练成本仅为GPT-4o的十分之一。

  ASIC适于端侧部署,市场空间广阔

  本地推理不仅可以降低延时、提高吞吐量,摆脱网络限制,还有助于保护数据安全和用户隐私,终端推理任务的本地化运行或是未来的发展趋势,本地推理需求的增加将促进ASIC市场需求扩容。ASIC芯片专门用来优化神经网络推理或者矩阵运算任务,专注于特定用途或特定模型,相较GPU在功耗、可靠性、性能、成本等方面具备优势,因此更适于在端侧和用户侧部署,如智驾、AI眼镜、智能家居等。随着大模型平价化,预期AI产品将在更多应用场景下实现商业落地,ASIC芯片具备广阔的市场前景。

  投资建议

  建议关注产品矩阵丰富,下游应用领域覆盖全面的芯原股份和寒武纪。

  风险提示

  建议关注技术迭代风险、下游需求不及预期的风险和中美贸易摩擦加剧的风险。


源达信息 吴起涤,赵毅轩
声明

本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。