字节豆包事件点评：豆包产品快速迭代，有望推动推理算力需求持续提升

股票资讯阅读：303 2025-01-23 09:17:30 评论：0

　　主要观点

　　字节豆包实时语音大模型正式上线，AI版图持续扩张。2025年1月20日，豆包实时语音大模型正式上线，主要面向中文场景，是一款语音理解和生成一体化的模型，实现了端到端语音对话。相比传统级联模式，在语音表现力、控制力、情绪承接方面表现惊艳，并具备低时延、对话中可随时打断等特性。字节AI版图持续扩张，据硅星人统计，从2024年开始，字节在国内外推出包括豆包在内的20余款App，从集成式的聊天助手，到图像、视频、音乐等效率工具，加速渗透到教育、办公助手、开发平台、代码生成等行业。我们认为，本次豆包实时语音大模型的推出，有助于提升字节旗下应用体验，及豆包终端用户增长，将加速相关应用场景渗透。

　　依托于语音和语义联合建模，模型智商与情商双双在线。豆包团队研发出了一套端到端框架，面向语音生成和理解进行统一建模，实现多模态输入和输出效果，弥补了传统语音对话任务系统级联模式的缺陷。在预训练（Pretrain）阶段，团队对各模态交织数据进行深入训练，精准捕捉并高效压缩海量语音信息，通过Scaling，最大程度实现语音与文本能力深度融合和能力涌现。在后训练阶段，团队使用了高质量数据与RL算法，进一步提供模型高情商对话能力与安全性，并在“智商”与“情商”之间寻求平衡。

　　豆包实时语音大模型整体满意度高于GPT-4o。根据豆包大模型团队评测，团队围绕拟人度、有用性、情商、通话稳定性、对话流畅度等多个维度进行考评。整体满意度（以5分为满分）方面，豆包实时语音大模型评分为4.36，GPT-4o为3.18。其中，50%的测试者对豆包实时语音大模型表现打出满分。此外，在模型优点评测中，豆包实时语音大模型在情绪理解和情感表达方面优势明显。尤其是“一听就是AI与否”评测中，超过30%的反馈表示GPT-4o“过于AI”，而豆包实时语音大模型相应比例仅为2%以内。

　　投资建议

　　我们认为，字节豆包产品快速迭代，豆包生态愈发完善，在B端和C端有望加速落地和推广，带来推理算力需求的持续提升。同时，字节在AI的进一步发力和持续投入，有望拉动国内互联网大厂在算力端的支出，国内算力军备竞赛刚刚开始，国产算力厂商迎来发展机遇，建议关注：

　　AI芯片：海光信息、寒武纪、景嘉微、安博通（与江原合作）等服务器：浪潮信息、中科曙光、神州数码、软通动力、华勤技术、紫光股份等

　　交换机：锐捷网络、紫光股份等

　　光模块：光迅科技、华工科技等

　　IDC：润泽科技、光环新网、亚康股份、数据港、世纪互联等液冷：英维克、申菱环境、高澜股份、飞荣达、同飞股份等电源：欧陆通、泰嘉股份、麦格米特等

　　风险提示

　　AI应用落地不及预期；AI需求不及预期；行业竞争加剧。

上海证券吴婷婷

声明

本站内容源自互联网，如有内容侵犯了您的权益，请联系删除相关内容。本站不提供任何金融服务，站内链接均来自开放网络，本站力求但不保证数据的完全准确，由此引起的一切法律责任均与本站无关，请自行识别判断，谨慎投资。