字节豆包事件点评:豆包产品快速迭代,有望推动推理算力需求持续提升

股票资讯 阅读:1 2025-01-23 09:17:30 评论:0

  主要观点

  字节豆包实时语音大模型正式上线,AI版图持续扩张。2025年1月20日,豆包实时语音大模型正式上线,主要面向中文场景,是一款语音理解和生成一体化的模型,实现了端到端语音对话。相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。字节AI版图持续扩张,据硅星人统计,从2024年开始,字节在国内外推出包括豆包在内的20余款App,从集成式的聊天助手,到图像、视频、音乐等效率工具,加速渗透到教育、办公助手、开发平台、代码生成等行业。我们认为,本次豆包实时语音大模型的推出,有助于提升字节旗下应用体验,及豆包终端用户增长,将加速相关应用场景渗透。

  依托于语音和语义联合建模,模型智商与情商双双在线。豆包团队研发出了一套端到端框架,面向语音生成和理解进行统一建模,实现多模态输入和输出效果,弥补了传统语音对话任务系统级联模式的缺陷。在预训练(Pretrain)阶段,团队对各模态交织数据进行深入训练,精准捕捉并高效压缩海量语音信息,通过Scaling,最大程度实现语音与文本能力深度融合和能力涌现。在后训练阶段,团队使用了高质量数据与RL算法,进一步提供模型高情商对话能力与安全性,并在“智商”与“情商”之间寻求平衡。

  豆包实时语音大模型整体满意度高于GPT-4o。根据豆包大模型团队评测,团队围绕拟人度、有用性、情商、通话稳定性、对话流畅度等多个维度进行考评。整体满意度(以5分为满分)方面,豆包实时语音大模型评分为4.36,GPT-4o为3.18。其中,50%的测试者对豆包实时语音大模型表现打出满分。此外,在模型优点评测中,豆包实时语音大模型在情绪理解和情感表达方面优势明显。尤其是“一听就是AI与否”评测中,超过30%的反馈表示GPT-4o“过于AI”,而豆包实时语音大模型相应比例仅为2%以内。

  投资建议

  我们认为,字节豆包产品快速迭代,豆包生态愈发完善,在B端和C端有望加速落地和推广,带来推理算力需求的持续提升。同时,字节在AI的进一步发力和持续投入,有望拉动国内互联网大厂在算力端的支出,国内算力军备竞赛刚刚开始,国产算力厂商迎来发展机遇,建议关注:

  AI芯片:海光信息、寒武纪、景嘉微、安博通(与江原合作)等服务器:浪潮信息、中科曙光、神州数码、软通动力、华勤技术、紫光股份等

  交换机:锐捷网络、紫光股份等

  光模块:光迅科技、华工科技等

  IDC:润泽科技、光环新网、亚康股份、数据港、世纪互联等液冷:英维克、申菱环境、高澜股份、飞荣达、同飞股份等电源:欧陆通、泰嘉股份、麦格米特等

  风险提示

  AI应用落地不及预期;AI需求不及预期;行业竞争加剧。


上海证券 吴婷婷
声明

本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。