DeepSeek专题研究:“低成本、高性能、强推理”三位一体,DeepSeek驱动高质量模型平价化
Deepseek模型密集更新,用户数将持续高速增长
自2024年起,DeepSeek在AI领域迅速掘起并不断选代。2024年12月底至2025年1月底,更新尤为密集,发布了参数众多且性能提升的V3、支持思维链输出和模型训练的R1,以及深耕图像领域的视觉和多模态模型。2024年12月底到2025年1月底,全球用户数从34.7万激增至1.19亿。与ChatGPT相比,DeepSeek仅用一年多就达到ChatGPT两年的用户规模,在国内1月跃居月均活跃用户数榜首,APP下载量也大幅增长。
Deepseek具备低成本、高性能、强推理三大特点
DeepSeek-V3通过算法创新和工程优化大幅提升模型效率,从而降低成本,提高性价比。DeepSeekV3训练成本仅为557万美元,耗时不到两个月。DeepSeek通用及推理模型成本相较于OpenA等同类模型大幅下降。DeepSeek-R1在继承了V3的创新架构的基础上,在后训练阶段大规模使用了强化学习技术,自动选择有价值的数据进行标注和训练,减少数据标注量和计算资源浪费,并在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,DeepSeek在AIME2024测评中上获得79.8%的pass@1得分,略微超过OpenAl-01;在MATH-500上,获得了97.3%的得分,与OpenAl-01性能相当,并且显著优于其他模型
DeepSeek驱动模型平价化,建议关注算力、AI应用和端侧的投资机会
1)算力:随着更多用户对DeepSeek的使用,以及未来更多AI应用的不断涌现,对算力的需求呈现出几何级增长超势。AI技术的进步,虽然模型效率提高了,但不断增长的用户和应用数量,却对算力资源提出了更高要求,消耗也随之剧增。2)B端应用:AlAgent正在对传统SaaS应用进行全面重构。与传统知识库结构化管理模式相比,AlAgent的向量数据库具备强大的自主学习能力,能够自动理解文档内容,实现更加高效的知识管理,为企业的数字化转型提供了有力支持。C端应用:作为生成式AI的重要商业化应用,AlAgent在电商、教育、旅游、酒店以及客服等多个行业得到了广泛应用。3)端侧:AI正在内容、应用、硬件、生态上影响世界,AlAgent从“数字”走向“具身”随着市场发展,大模型更广泛地接入硬件产品,做好软硬件协同发展是未来竞争的关键。
投资建议
1)建议关注以国产算力和AI推理需求为核心的算力环节,尤其是IDC、服务器、国产芯片等算力配套产业,推荐海光信息、浪潮信息。2)DeepSeek迅速集成进各云厂商的平台中,直接拉高模型能力下限,AI应用开发提速升级。建议关注:B端:鼎捷数智、用友网络;C端:金山办公。3)小模型能力提升促进了端侧模型部署,我们看好AI终端作为新一代计算平台爆发可能。建议关注:科大讯飞、立讯精密、歌尔股份。
风险提示
AI产业商业化落地不及预期的风险、市场竞争加剧风险、政策不确定性风险
本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。