电子行业事项点评:DeepSeek发布NSA,马斯克旗下XAI发布GroK 3
本期内容提要:
DeepSeek发布NSA,创新性降低成本的同时保障了模型性能。人工智能发展高度依赖海量数据和算力,DeepSeek提出神经缩放增强(Neural Scaling Augmentation,NSA)技术,可通数据生成和模型优化的方法,为突破模型瓶颈提供全新的解决方案。NSA引入了两个核心创新点:(1)硬件对齐系统:优化块级稀疏注意力,使其充分利用Tensor Core并优化内存访问,从而实现平衡的算术强度。(2)训练感知设计:通过高效算法和反向传播运算符实现稳定的端到端训练,使NSA能够同时支持高效推理与完整训练流程。在性能方面,尽管NSA具有稀疏性,但在一般基准测试上NSA与全注意力基线表现相当。在长文本评估中,NSA在64k上下文中的「大海捞针」测试中,在所有位置上都实现了完美的检索准确率,这表明其长文本处理方面具有良好的优势。在速度方面,随着上下文长度的增加,NSA实现了越来越大的加速,在64k上下文长度下实现了9.0倍的前向加速和6.0倍的反向加速。相比之下,随着解码长度的增加,NSA在延迟方面表现出显著的减少,在64k上下文长度下实现了高达11.6倍的加速。
马斯克旗下XAI发布GroK3,性能有所提升。GroK3/GroK3-mini在数学、科学、代码等性能上超过GPT-4o、Claude3.5Sonnet、DeepSeek-R1和Gemini-2Pro等主流模型。此外,Grok3具备代理/智能体(Agent)功能,它不仅可以搜索网页,查找现有资料,还可以加以思考,从而返回正确的信息。据悉,Grok3在10万个GPU上进行训练,总训练时长达到2亿GPU小时,Grok3的计算资源是Grok2的10倍。
算力投入叠加算法创新,2025年或为AI商业化大年。我们认为,从目前看,中国团队的创新工作降低了模型训练和推理的成本,有望较大程度将AI商业化推向繁荣。目前全球越来越多的厂商加入了AI的竞争之中,模型迭代速度不断加快。从训练端看,除了对模型的性能要求更高之外,研发迭代的周期也要不断缩短,否则相关的研究可能变得一文不值。这可能在某种程度上加大训练算力的需求。从推理端市场看,从DeepSeek的广泛铺开可以看到推理算力需求正以肉眼可见的速度成长,而目前推理成本的迅速降低,将有望推动复杂场景落地,AGI之路更近一步。总体上2025年算力需求仍然有很大空间,叠加是英伟达GB系列产品放量之年,模型端的迅速进展有望推动端侧创新,算力硬件和各类应用有望共同繁荣,相关产业链值得重点关注。
建议关注:【ODM】工业富联;【PCB】深南电路/生益科技/沪电股份/胜宏科技/生益电子/广合科技/景旺电子等;
风险因素:宏观经济下行风险;下游需求不及预期风险;中美贸易摩擦加剧风险。
本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。