首页 行业研报 计算机行业周报:豆包稳居MAU国内第一,谷歌Gemini2.0聚焦智能体

计算机行业周报:豆包稳居MAU国内第一,谷歌Gemini2.0聚焦智能体

行业研报 69

  投资要点

  算力:算力租赁价格平稳,富士通Monaka处理器计划于2027财年亮相

  本周恒源云13核+128G价格环比上周持平。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G价格为8.50元/时;阿里云16核+125GiB价格为34.74元/时;显卡配置为A800-80G中,恒源云16+256G价格为9.00元/时。

  本周富士通展示了基于Arm的2nm Monaka处理器,该处理器采用博通推出的业内首个3.5D XDSiP技术平台。RIKEN计算科学中心(R-CCS)主任、东京工业大学教授SatoshiMatsuoka公开了Monaka的更多技术细节:

  1)在核心架构方面,Monaka采用基于台积电的CoWoS-L封装技术的博通3.5D XDSiP技术平台,拥有36个计算小芯片。其中主要的CPU计算核心基于Armv9指令集,拥有144个CPU内核,采用台积电2nm制程制造,并使用混合铜键合(HCB)以面对面(F2F)方式堆叠在SRAM tiles上。

  2)在内存接口方面,为应对广泛的数据中心工作处理需求,Monaka不依赖于高带宽内存,而是预计使用主流的DDR5DRAM,有望在其MR-DIMM和MCR-DIMM实施过程中运用并提供足够的容量、降低数据中心处理器的成本。

  3)在处理能力与安全性能方面,Monaka处理器将使用基于Armv9-A指令集架构构建的内核,并集成SVE2指令(第二代可扩展矢量扩展指令)。鉴于其A64FX处理器具备支持高达512位向量的卓越能力,Monaka处理器有望支持类似乃至更高位数的向量。同时,Monaka将整合高级安全功能,包括Armv9-A的机密计算架构(CCA),提供增强的工作负载隔离和强大的保护。

  4)在能效提升方面,富士通计划在2026年至2027年依赖空气冷却技术将处理器能效提高一倍。

  AI应用:豆包领跑国内AI应用市场,谷歌Gemini2.0引领智能体时代

  在国内AI模型领域,2024年第四季度字节跳动旗下AI应用产品豆包表现亮眼。在10月的国内月活跃人数排行榜上,豆包APP的MAU(月活跃人数)达到4717.47万人次,远超于排名第二Kimi的2028.65万人次。字节跳动在AI应用领域的迅速崛起可以归功于以下因素:

  1)流量投放战略谋求“弯道超车”:相较于竞争对手,字节跳动在人工智能领域的起步时间相对延后。为了迅速缩小与行业的差距,字节跳动采用巨额投入的“烧钱”战略。截至11月,旗下豆包产品的投放金额已达40363万元,仅次于Kimi的投放金额54214万元,并且巨幅领先投放金额排名第三的星野。

  2)巨量引擎流量资源支持:在各厂商所采用的投放渠道之中,字节跳动旗下的巨量引擎占据着极为关键的地位。尽管豆包投放相对Kimi较少,但得益于字节跳动独有的投放经验和流量优势,豆包能够实现更加高效的获客,实现10月MAU(月活跃人数)4717.47万人次,远超于排名第二Kimi的2028.65万人次

  当前,面临网络效应局限和付费订阅变现的难题,AI对话产品可能仅为过渡形态,长期发展需要注重用户视觉化体验和较低的用户门槛。字节跳动预计将提升即梦产品优先级,探索打造AI时代的“抖音”。

计算机行业周报:豆包稳居MAU国内第一,谷歌Gemini2.0聚焦智能体

  在国外AI模型领域,12月12日谷歌发布的Gemini2.0Flash实验版本,标志着Gemini2.0系列的正式启航。相较于前一代产品,Gemini2.0Flash在速度上实现了翻倍,支持图像、视频和音频等多模态输入。此外,2.0Flash版本新增了多模态输出功能,能够原生生成图像与文本的混合内容,并提供可控制的多语言文本转语音(TTS)音频。此次更新不仅是对语言模型的升级,而是构建了一个满足智能体基本需求的统一底层模型。

  在模型具体性能提升方面,Gemini2.0通过性能提升,增强了理解复杂指令、长期规划和组合函数调用能力,构成了其强大的规划能力基础。同时,Gemini模型多模态能力同样引人注目,能够理解和生成多种信息形式,实现了与其他先进模型不同的突破,构成其感知能力的基础。此外,Gemini2.0在长上下文理解方面的优势、具备海量上下文窗口,以及原生调用Google搜索、执行代码和使用第三方功能的能力,进一步提升了其记忆能力和工具使用能力。

  在模型应用方面,谷歌正将Gemini2.0技术与其“智能体全家桶”相结合。基于Gemini2.0架构之上,谷歌推出了三个新的AI智能体研究原型:Project Astra、Project Mariner和Jules,极大地增强用户与数字世界的交互体验感。

  除了上述主要应用场景之外,谷歌还在游戏行业内进行了富有创意的探索。谷歌公司正与Supercell等顶尖游戏开发企业携手合作,研究人工智能代理在各类游戏中的运用,涵盖了从《部落冲突》这类的策略性游戏到《卡通农场》这类的模拟经营类游戏。

  Gemini2.0Flash的正式版本预计将于2025年1月份推出。目前,谷歌正积极拓展Gemini2.0应用范畴。

  AI融资动向:面壁智能/hohem浩瀚获融资额前二,分别获数亿元/超亿元人民币融资

  本期AI初创公司的融资中,面壁智能/hohem浩瀚获融资额前二,分别获数亿元/超亿元人民币融资。今年上半年面壁智能发布的端侧AI模型面壁小钢炮MiniCPM凭借其以小搏大、高效低成本的性能优势,接连带来端侧GPT-4V和ChatGPT时刻,并将无限长文本、超清OCR识图、实时视频理解等功能首次集成到端侧。面壁小钢炮MiniCPM系列自发布以来,累计下载量突破300万,成为端侧智能的标杆。更重要的是,端侧AI可以快速切入商业化。公司一边在主流消费电子硬件和新兴硬件融入端侧AI,一边布局端云协同的未来范式,在端侧模型、算力、内存、模型算法和硬件调度等方面持续突破。当前,面壁智能正在与华为、联发科技、联想、英特尔、长城汽车、易来智能等企业紧密协作,业务覆盖AIPhone、AI PC、智能座舱、智能家居与具身机器人等领域。作为AI跟拍稳定器的开创者,hohem将智能科技融入影像拍摄,旨在为用户提供更便捷、高效的拍摄体验。过去,手持稳定器多被视为专业影视制作工具,而hohem浩瀚通过创新,将这一专业设备推向更广泛的消费群体。随着智能手机摄影功能的不断提升,消费者对高质量视频内容的需求与日俱增。除了追求拍摄稳定性,hohem浩瀚还洞察到用户在直播、短视频及旅行等场景下,对随行摄影师的需求,希望解放双手,记录生活中的美好瞬间。因此,hohem浩瀚致力于开发能够满足这些需求的智能影像产品。公司不断投入技术研发,2021年发布全球首款搭载端侧AI追踪模块的手机稳定器,无需蓝牙连接即可在任意App中实现人像追踪。今年10月,hohem浩瀚再次推出全球首款AI触控手机稳定器M7,集AI画面预览、可视化调参及远程触控功能于一体。M7稳定器采用分体式触屏控制器,搭载hohem浩瀚自主研发的端侧AI追踪模块,通过AI可视化预览的触控交互系统,用户只需框选目标即可实现快速识别和智能跟拍,极大地提升了创作的灵活性和效率。hohem浩瀚还推出了X系列和V系列稳定器,面向普通摄影爱好者,以轻巧便携的设计和专业防抖性能,降低了高质量视频创作的门槛。

  投资建议

  字节“大力出奇迹”弯道超车,关注其旗下的AI布局。相对竞品,字节跳动的AI起步相对较晚:国内百度、阿里巴巴、商汤、科大讯飞在去年3月开始都陆续推出了大模型新品和AI应用,而字节跳动的“豆包”则是在同年8月才发布。伽马数据显示,10月国内头部AI应用广告投放金额超4亿元,近半年翻了5倍;环比上升24.51%,连续6个月攀升。广告投放金额居前的5家公司中,Kimi与腾讯元宝金额分别环比增长172%和326%,即梦、豆包、猫箱则全部为字节旗下产品。在各家的投放渠道中,基本都离不开字节的巨量引擎,而背靠字节的豆包将流量池的优势发挥到了极致,“大力出奇迹”模式验证可行,字节旗下AI布局有望迎来全面爆发。

  AI终端即将迎来大规模爆发。一方面,AI陪伴或为AItoC赛道最快突破的方向,相较于其他品类更注重于功能性需求,AI陪伴玩具更像是“陪聊机器人”,主打提供情绪价值,目前大厂纷纷涉足AI玩具赛道。另一方面,以AI眼镜为代表的功能性AI端侧或以提升渗透率为路径,替代传统日常生活用品。随着Ray-BanMeta验证了AI眼镜技术路径的可行性,11月以来,AI眼镜领域持续升温,百度推出小度AI眼镜,Looktech、谷东科技发布新品,闪极科技完成数千万元A轮融资。与此同时,雷鸟创新宣布新款AI拍摄眼镜即将发布,闪极科技12月份也将发布新品。

  我们坚定持续看好AI软硬件机会,建议关注以AI为核心的龙头厂商科大讯飞(002230.SZ)、有望迎来需求爆发的AI应用金桥信息(603918.SH)、高速通信连接器业务或显著受益于GB200放量的鼎通科技(688668.SH)、已与Rokid等多家知名AI眼镜厂商建立紧密合作的亿道信息(001314.SZ)等。

  风险提示

  1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。


华鑫证券 宝幼琛