电子行业事项点评：DeepSeek发布NSA，马斯克旗下XAI发布GroK 3

股票资讯阅读：107 2025-02-21 13:05:36 评论：0

　　本期内容提要:

　　DeepSeek发布NSA，创新性降低成本的同时保障了模型性能。人工智能发展高度依赖海量数据和算力，DeepSeek提出神经缩放增强（Neural Scaling Augmentation,NSA）技术，可通数据生成和模型优化的方法，为突破模型瓶颈提供全新的解决方案。NSA引入了两个核心创新点：（1）硬件对齐系统：优化块级稀疏注意力，使其充分利用Tensor Core并优化内存访问，从而实现平衡的算术强度。（2）训练感知设计：通过高效算法和反向传播运算符实现稳定的端到端训练，使NSA能够同时支持高效推理与完整训练流程。在性能方面，尽管NSA具有稀疏性，但在一般基准测试上NSA与全注意力基线表现相当。在长文本评估中，NSA在64k上下文中的「大海捞针」测试中，在所有位置上都实现了完美的检索准确率，这表明其长文本处理方面具有良好的优势。在速度方面，随着上下文长度的增加，NSA实现了越来越大的加速，在64k上下文长度下实现了9.0倍的前向加速和6.0倍的反向加速。相比之下，随着解码长度的增加，NSA在延迟方面表现出显著的减少，在64k上下文长度下实现了高达11.6倍的加速。

　　马斯克旗下XAI发布GroK3，性能有所提升。GroK3/GroK3-mini在数学、科学、代码等性能上超过GPT-4o、Claude3.5Sonnet、DeepSeek-R1和Gemini-2Pro等主流模型。此外，Grok3具备代理/智能体（Agent）功能，它不仅可以搜索网页，查找现有资料，还可以加以思考，从而返回正确的信息。据悉，Grok3在10万个GPU上进行训练，总训练时长达到2亿GPU小时，Grok3的计算资源是Grok2的10倍。

　　算力投入叠加算法创新，2025年或为AI商业化大年。我们认为，从目前看，中国团队的创新工作降低了模型训练和推理的成本，有望较大程度将AI商业化推向繁荣。目前全球越来越多的厂商加入了AI的竞争之中，模型迭代速度不断加快。从训练端看，除了对模型的性能要求更高之外，研发迭代的周期也要不断缩短，否则相关的研究可能变得一文不值。这可能在某种程度上加大训练算力的需求。从推理端市场看，从DeepSeek的广泛铺开可以看到推理算力需求正以肉眼可见的速度成长，而目前推理成本的迅速降低，将有望推动复杂场景落地，AGI之路更近一步。总体上2025年算力需求仍然有很大空间，叠加是英伟达GB系列产品放量之年，模型端的迅速进展有望推动端侧创新，算力硬件和各类应用有望共同繁荣，相关产业链值得重点关注。

　　建议关注：【ODM】工业富联；【PCB】深南电路/生益科技/沪电股份/胜宏科技/生益电子/广合科技/景旺电子等；

　　风险因素：宏观经济下行风险；下游需求不及预期风险；中美贸易摩擦加剧风险。

信达证券莫文宇,杨宇轩

声明

本站内容源自互联网，如有内容侵犯了您的权益，请联系删除相关内容。本站不提供任何金融服务，站内链接均来自开放网络，本站力求但不保证数据的完全准确，由此引起的一切法律责任均与本站无关，请自行识别判断，谨慎投资。