科技行业周报:AI应用持续迭代,海内外推理需求有望共振
国产AI大模型和应用持续迭代,推陈出新。
华为开发者大会HDC2025在松山湖召开,发布了鸿蒙6.0和全新鸿蒙智能体框架(Harmony Agent Framework HMAF)。鸿蒙6.0的发布标志着全场景能力的跃迁——全新的互联架构、星闪通讯、鸿蒙智能体框架、小艺AI,可以实现毫秒级交互与多智能体协同。鸿蒙操作系统有望成为全球第一个落地的AI原生操作系统。
字节跳动旗下火山引擎举办Force原动力大会·春,发布豆包大模型1.6、视频生成模型Seedance1.0pro等新模型,并升级了Agent开发平台等AI云原生服务。其中,豆包大模型1.6以颠覆性的统一定价模式,将企业常用区间的每百万Tokens价格降至历史低点,实现综合成本降低63%。综合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。截至2025年5月底,豆包大模型日均Tokens使用量超过16.4万亿。行业落地方面,全球Top10手机厂商有9家和火山引擎深度合作,8成主流车企接入豆包大模型,已服务70%的系统重要性银行、数十家券商和基金公司,五成985高校用豆包大模型做教学、科研创新。此外,字节跳动旗下的扣子空间推出了全新功能模块——播客音频生成,标志其打通了“文本—代码—音视频”的全流程。在内容创作领域,扣子空间能生成表现自然流畅,几乎听不出“AI痕迹”的播客。
DeepSeek发布DeepSeek-R1-0528,更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如Open AI的o3与谷歌的Gemini-2.5-Pro。此外,该版本还对幻觉、创意、工具调用等能力进行了更新升级。
海外方面,谷歌、亚马逊等公司持续加单自研ASIC芯片,Meta、OpenAI、xAI等公司也在加码各自的ASIC规划。ASIC需求旺盛证明了全球推理侧算力需求在快速提升。根据我们的调研,随着亚马逊AWS的Anthropic和谷歌GCP的Gemini的ARR(annual recurring revenue)起量,AWS的ASIC芯片Tranium系列(包括2/2.5,以及出现延迟的3)预期2026年出货增加至250至300万颗,谷歌TPU系列(主要是6/6E系列)在2026年出货增加至300万颗,Meta的ASIC芯片MTIA系列在2025年的出货预期也上调到了150万颗。
我们认为国产AI大模型和应用的持续迭代,尤其是多模态应用的升级,将提升对算力的需求。我们继续看好国产算力的主线机会。在美国限制先进芯片出口中国的行业大背景下,国产算力替代的紧迫性持续提升,而国产算力在AI应用持续迭代铺开的情况下,可用性大幅提升,龙头企业的先发优势将更加明显。海外算力端受益于CSP大厂ARR起量,ASIC芯片大幅加单,产业链相关行业如高端PCB、光模块、服务器ODM等景气度上升。
此外,我们也建议关注传统的存储、模拟芯片的周期复苏机会。TrendForce等机构调查数据显示,由于DRAM主要供应商将逐步收缩服务器和PC用DDR4存储的产出,以及美国关税导致买方积极提前备货,2025Q2价格涨幅超出此前预期,预计2025Q3在供给持续收敛的情况下,价格仍将持续向上,NAND端,全球AI资本开支向上带动企业级SSD需求成长,叠加龙头厂商减产,NAND价格有望在年内触底向上。
建议关注:
海外CSP/ASIC产业链:生益电子(688183.SH,未评级),胜宏科技(300476.SH,未评级),天弘科技(CLS.US,未评级),迅达(TTMI.US,未评级),CREDO(CRDO.US)
国产算力:寒武纪(688256,买入),中芯国际(0981.HK,买入),海光信息(688041,未评级),翱捷科技(688220,未评级)
存储及成熟制程芯片:华虹半导体(1347.HK,买入),兆易创新(603986,未评级),纳芯微(688052,未评级),圣邦股份(300661,未评级),美光(MU.US,未评级)等
行业及公司动态
1.6月20日,AWS正借助ASIC削弱Nvidia在AI芯片的领导地位。据CNBC报道,AWS即将宣布其CPU芯片——Graviton4的更新,预计将提供每秒600Gbps的网络频宽,将成为公有云的最高水准。此外,AWS在AI算力ASIC上也有不俗的竞争力。2024年底,其发布了Project Rainier计划,为旗下初创公司Anthropic打造超级AI电脑,用于训练Claude大模型。
2.6月20日,AI带动NAND控制器升级,Gen6传输速度将比Gen5翻倍,目前已有美光、慧荣科技、韩国Fadu等公司宣布进军数据中芯用Gen6控制器市场。相比生成式AI之前推出的PCIe Gen5控制器,Gen6将针对AI进行专门优化,传输速度将达到28GB/s,相比Gen5性能翻倍。业内预计2026年开始导入Gen6。
3.6月20日,传三星HBM3E通过博通认证,未来将争取Nvidia的突破。此前,在AMD发布的MI350X和MI355X上,搭载了三星的HBM3E,显示了三星在HBM市场开始展开反攻。
4.6月20日,据路透社消息,特斯拉已向少量客户发出Robotaxi测试邀请,参与其在德州奥斯汀的有限度测试。预计相关测试将在6月22日正式展开。马斯克表示关注测试阶段的安全问题,会有专人远程监测运行状况,同时测试时会有安全员全程坐在副驾侧。
5.6月20日,华为开发者大会HDC2025在松山湖召开,发布了鸿蒙6.0和全新鸿蒙智能体框架(Harmony Agent Framework HMAF)。鸿蒙6.0的发布标志着全场景能力的跃迁——全新的互联架构、星闪通讯、鸿蒙智能体框架、小艺AI,可以实现毫秒级交互与多智能体协同。鸿蒙操作系统有望成为全球第一个落地的AI原生操作系统。
6.6月19日,谷歌对Gemini2.5全系大模型进行重磅更新,Gemini2.5Pro及Flash发布正式版并进入稳定运行阶段,同时推出轻量版模型Gemini2.5Flash-Lite的预览版。Flash-Lite被定位为该系列模型中推理最快,成本效益最高的模型,在代码、翻译、推理等任务中综合性能显著优于上一代2.0模型,同时在响应速度上显著提升。
7.6月19日,阿里巴巴AI应用——通义APP升级翻译功能,覆盖文字、同传、文档、图片四大场景,支持119种语言和方言互译,在准确率、专业性、交互体验等维度实现全面跃升。无论是办公、学术、阅读还是旅游出行,通义APP都能提供真正“全场景、全模态”的翻译解决方案。
8.6月19日,知名分析师郭明錤爆料,苹果供应商富士康预计将于2025年第三季度末或第四季度初正式开始生产“折叠屏iPhone”。截至目前,苹果首款折叠屏iPhone的许多零部件的规格,包括备受市场关注的铰链轴承,尚未最终确定。目前已经确定的一个部件是该设备的可折叠显示屏。三星显示计划明年为这款设备生产700万至800万块可折叠面板。郭预计该产品2-3年生命周期的销量有望达到1,500-2,000万部,主要原因为其高端售价影响销售。
9.6月17日,Gartner预测,2030年守护型智能体(GuardianAgent)将在未来AI智能体中占据10-15%的市场份额。守护型智能体可自动审查、监视、保护AI智能体行为,应对潜在风险。Gartner预计,到2028年,70%的AI应用将采用多智能体架构,守护型智能体需求将持续提升。
10.6月17日,YOLE预测,AI热潮正加速CPO在数据中心的应用,收入规模将从2024年的数千万美元,提升至2030年的81亿美元。
11.阿里巴巴旗下通义千问团队近日正式宣布推出基于苹果MLX框架深度优化的Qwen3系列大模型,并一次性开源32款官方量化模型。此次发布的Qwen3MLX系列模型,包含4bit、6bit、8bit和BF16四种不同精度的量化版本,覆盖从MacPro、MacStudio到MacBook、iPad乃至iPhone等全系列苹果设备。此举或意味着苹果公司在推进“AppleIntelligence”(苹果智能)生态的关键技术布局,双方合作有望进入实质性落地阶段。
12.6月16日,据LightCounting预测,受800G以太网光模块拉动,光模块市场在经历2025Q1的平淡表现后,有望在2025Q2实现环比增长,受亚马逊、Meta、Oracle等公司向更高速光模块迁移的拉动。此外1.6T光模块也有望在今年迎来加速,拉动整体光模块市场的景气度。
13.6月16日,Meta就143亿美元收购ScaleAI49%股权后,引来部分客户的忧虑,谷歌或将终止合作,OpenAI,微软等也被曝将减少合作意向。公开资料显示,ScaleAI于2016年创立,主要提供数据标签服务,可帮助企业训练机器学习模型,其客户包括微软、OpenAI等公司。。
14.6月16日,据媒体报道,Synopsys等EDA供应商据报恢复部分中国业务,但是核心的EDA工具仍被禁售。被禁售的EDA工具目前无法接受新订单、拓展新客户。现有客户可在合约期限内继续使用工具,但将失去更新和技术支持。业内称短期影响有限,长期将迫使中国采用更多国产EDA产品。
本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。