人工智能动态点评:DeepSeek开源周:开源模式有望重塑市场格局

股票资讯 阅读:27 2025-03-02 15:00:46 评论:0

  核心观点

  事件:DeepSeek于2025年2月24日正式启动“开源周”,计划在2月24日-28日连续5天每天开源一个项目。

  Day1-FlashMLA:动态分配资源,优化算力使用FlashMLA是专为英伟达HopperGPU优化的高效MLA解码内核,专为处理可变长度序列设计。在同时处理长文本和短文本时,它可以精准地为不同长度的文本分配恰当的算力。

  Day2-DeepEP:MoE高效运转,提高整体效率DeepEP是首个用于MoE(混合专家模型)训练和推理的开源EP通信库,能够让MoE模型各部分间沟通更快、消耗更少,提升了整体运行效率。

  Day3-DeepGEMM:通用矩阵乘法性能优化DeepGEMM是一个矩阵乘法加速库,能够为V3/R1的训练和推理提供支持。其在各种矩阵形状上的性能与专家调优的库相当,在某些情况下更优,且安装时无需编译。

  Day4-DualPipe&EPLB:开源优化并行策略DualPipe是一种用于V3/R1训练中计算与通信重叠的双向管道并行算法,将硬件资源利用率提升超30%。EPLB则是一种针对V3/R1的专家并行负载均衡器,基于MoE架构,优化GPU间的负载分布,减少GPU闲置现象。

  Day5-3FS:高速数据访问,提高模型训练效率Fire-Flyer文件系统是一个专门为了充分利用现代SSD和RDMA网络带宽而设计的并行文件系统,能实现高速数据访问,提升AI模型训练和推理的效率。

  开源模式重塑市场格局,有望促进产业生态繁荣。DeepSeek以领先的模型性能和积极的开源策略,大幅缩小了以往开源模型和闭源模型间的性能差距,打破了技术垄断的局面。我们认为,DeepSeek的开源模式推动了大模型从“重资本军备竞赛”走向“合作共创平台”,改变了行业的商业模式。企业可以通过开源合作,利用全球开发者的智慧和力量进行创新,降低研发成本,提高创新效率。大模型从上游的硬件算力到下游的应用有望形成了一个完整的产业生态系统,进一步推动产业的生态繁荣。

  投资建议:DeepSeek的开源策略引发了行业震动,带动一众AI企业纷纷加入开源行列。2025年以来,字节豆包、阿里通义千问等均推出开源模型。众多企业的参与壮大了开源阵营,促进了AI产业生态的繁荣。同时,各方的紧密协作有助于推动AI产业的整体发展,提高产业的竞争力。建议关注:AI赋能下具有价值重塑空间、积极拥抱AI的头部互联网大厂:腾讯控股、阿里巴巴-W。

  风险提示:政策及监管环境的风险、AI技术发展不及预期的风险、AI应用落地不及预期的风险等


中国银河 岳铮,祁天睿
声明

本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。