计算机行业2025年1月投资策略:国产deepseek+豆包发力,海内外大模型刺激推理算力

股票资讯 阅读:3 2025-01-27 21:32:29 评论:0

  核心观点

  海外资本支出呈现持续上扬的态势,而国内资本支出近期承压。全球云计算厂商资本开支进入新一轮增长浪潮,AI基础设施成为核心驱动力。国外厂商中,微软24Q3资本开支同比增78.6%,主要投向AI和云服务;谷歌维持高位,聚焦服务器和数据中心;亚马逊连续五季环比增长,全年预计750亿美元。国内厂商中,阿里巴巴24Q3同比增239.63%,加码AI基础设施;腾讯同比增113.54%,布局GPU、CPU服务器及数据中心;百度虽承压,预计24年底或25年初迎来回升,重点投入AI模型和智能云服务。

  全球服务器出货同比回升,B+C端应用逐步落地,思维链等新技术拉动推理算力需求增长。C端应用如ChatGPT访问量持续增长,国内多款AI产品MAU快速上升;B端AI赋能商业增长显著,AppLovin、Palantir等公司业绩大幅提升。AI推理侧需求因思维链(CoT)技术及模型参数量增加快速增长。CoT对千亿参数模型显著提升推理能力,同时推理次数和算力需求快速增加。中国AI芯片市场规模23年达1038.8亿元,预计25年增长至1780亿元,推理算力占比24年有望升至67.7%。国内外厂商如博通、Marvell、寒武纪等积极布局AI推理硬件,助推算力发展。

  国产科技巨头在AI大模型与算力领域持续突破。字节跳动发布豆包Pro对标GPT-4o,API调用量大增,多场景渗透;召开冬季FORCE原动力大会,推出数据飞轮2.0,强化全模态数据管理;正式推出情感大模型,在豆包APP全量开放。小米升级MiLM2模型,参数灵活扩展,端云结合适配多场景;加速GPU集群建设提升算力。阿里倚天710芯片大规模落地,阿里云为双11提供百万核级算力。腾讯升级星脉网络2.0,优化网络协议与通信库,提升大模型训练效率。

  多层面技术提升训练效率,测试性能领跑开源模型。2024年12月26日,DeepSeek上线并开源DeepSeek-V3模型,多项评测超同类开源模型,在重要领域与顶尖闭源模型相当,训练成本低。模型层采用MoE架构,经多阶段训练与能力提炼,在知识、代码、数学推理等测评中领先开源模型。架构层沿用V2架构,引入新技术,如无辅助损失负载均衡策略、MTP提升数据利用率。训练层通过DualPipe算法和FP8混合精度训练实现成本控制与效率提升。推理层先推出R1-Lite模型,后将R1推理能力迁移至V3提升其性能,推理算力包含GB300、博通、marvell等各类asic芯片。2025年1月发布的DeepSeek-R1模型在多测试中超越OpenAI的o1,在数学、编程及多种测试中表现出色。

  风险提示:大模型研发进展不及预期、云厂商资本开支投入不及预期、国产算力迭代及供应不及预期。


国信证券 熊莉,库宏垚,艾宪
声明

本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。