计算机行业2025年1月投资策略：国产deepseek+豆包发力，海内外大模型刺激推理算力

股票资讯阅读：431 2025-01-27 21:32:29 评论：0

　　核心观点

　　海外资本支出呈现持续上扬的态势，而国内资本支出近期承压。全球云计算厂商资本开支进入新一轮增长浪潮，AI基础设施成为核心驱动力。国外厂商中，微软24Q3资本开支同比增78.6%，主要投向AI和云服务；谷歌维持高位，聚焦服务器和数据中心；亚马逊连续五季环比增长，全年预计750亿美元。国内厂商中，阿里巴巴24Q3同比增239.63%，加码AI基础设施；腾讯同比增113.54%，布局GPU、CPU服务器及数据中心；百度虽承压，预计24年底或25年初迎来回升，重点投入AI模型和智能云服务。

　　全球服务器出货同比回升，B+C端应用逐步落地，思维链等新技术拉动推理算力需求增长。C端应用如ChatGPT访问量持续增长，国内多款AI产品MAU快速上升；B端AI赋能商业增长显著，AppLovin、Palantir等公司业绩大幅提升。AI推理侧需求因思维链（CoT）技术及模型参数量增加快速增长。CoT对千亿参数模型显著提升推理能力，同时推理次数和算力需求快速增加。中国AI芯片市场规模23年达1038.8亿元，预计25年增长至1780亿元，推理算力占比24年有望升至67.7%。国内外厂商如博通、Marvell、寒武纪等积极布局AI推理硬件，助推算力发展。

　　国产科技巨头在AI大模型与算力领域持续突破。字节跳动发布豆包Pro对标GPT-4o，API调用量大增，多场景渗透；召开冬季FORCE原动力大会，推出数据飞轮2.0，强化全模态数据管理；正式推出情感大模型，在豆包APP全量开放。小米升级MiLM2模型，参数灵活扩展，端云结合适配多场景；加速GPU集群建设提升算力。阿里倚天710芯片大规模落地，阿里云为双11提供百万核级算力。腾讯升级星脉网络2.0，优化网络协议与通信库，提升大模型训练效率。

　　多层面技术提升训练效率，测试性能领跑开源模型。2024年12月26日，DeepSeek上线并开源DeepSeek-V3模型，多项评测超同类开源模型，在重要领域与顶尖闭源模型相当，训练成本低。模型层采用MoE架构，经多阶段训练与能力提炼，在知识、代码、数学推理等测评中领先开源模型。架构层沿用V2架构，引入新技术，如无辅助损失负载均衡策略、MTP提升数据利用率。训练层通过DualPipe算法和FP8混合精度训练实现成本控制与效率提升。推理层先推出R1-Lite模型，后将R1推理能力迁移至V3提升其性能，推理算力包含GB300、博通、marvell等各类asic芯片。2025年1月发布的DeepSeek-R1模型在多测试中超越OpenAI的o1，在数学、编程及多种测试中表现出色。

　　风险提示：大模型研发进展不及预期、云厂商资本开支投入不及预期、国产算力迭代及供应不及预期。

国信证券熊莉,库宏垚,艾宪

声明

本站内容源自互联网，如有内容侵犯了您的权益，请联系删除相关内容。本站不提供任何金融服务，站内链接均来自开放网络，本站力求但不保证数据的完全准确，由此引起的一切法律责任均与本站无关，请自行识别判断，谨慎投资。