海外AI应用近况点评:AI应用逐步落地,推理算力需求提速
事项:
To C 端, ChatGPT 等应用访问量数据持续上涨。 To B 端, AI 赋能公司业绩增长, 例如在广告领域, AppLovin通过 AI 提升工具性能, 拉动广告商支出增长; 在数据分析领域, Palantir 推出 AIP 平台, 集成多款大模型, 用于数据分析, 拉动其商业客户收入增长。
国信计算机观点: 1) C 端 AI 应用数据持续增长, B 端 AI 赋能公司业绩增长, 随着 AI 应用逐步落地, 模型推理次数提升, 拉动推理算力需求快速增长; 2) OpenAI 发布 GPT-O1, 通过思维链提升模型推理能力,思维链需要多步推理进而大幅提升推理算力的需求; 3) 推理算力占比有望提升, 根据《2023-2024 年中国人工智能计算力发展评估报告(IDC&浪潮) 》 发布数据, 预计 24 年中国推理算力占比为 67.7%, 同比+26.4个 pct; 4) 投资建议: AI 应用逐步落地, 叠加思维链等技术的使用, 推理侧算力需求有望快速提升, 建议关注国产算力芯片海光信息。 5) 风险提示: AI 应用落地不及预期, AI 芯片迭代不及预期, AI 芯片供应不及预期。
评论:
C 端 AI 应用数据持续增长, B 端 AI 赋能公司业绩增长
C 端: AI 应用数据持续增长。 从全球来看, ChatGPT 周度访问量持续提升, 根据 Similarweb 数据, 最近一周(11 月 28 日-12 月 4 日) 访问量合计为 8.99 亿次, 环比+0.5%; 根据 AI 产品榜数据, 11 月 ChatGPT 的MAU 数据为 287.25M, 环比+11.27%。 从国内来看, 豆包、 文小言、 Kimi、 智谱清言等 AI 应用快速发展,根据 AI 产品榜数据, 11 月豆包、 文小言、 Kimi、 智谱清言 MAU 分别为 59.98M、 12.99M、 12.82M、 6.37M,分别环比+16.92%、 3.33%、 27.40%、 22.18%。
B 端: AI 赋能公司业绩增长。 在广告领域, AppLovin 在 AppDiscovery 平台使用 AXON 2.0 AI 驱动技术拉动广告商支出增长, 三季度收入同比+39%、 净利润同比+300%, 且四季度展望乐观; 在数据分析领域,Palantir 推出 AIP 平台, 集成多款大模型, 用于数据分析, 拉动其商业客户收入增长, 三季度收入同比+30%(其中美国商业业务同比+54%) , 且上调全年收入指引为 28.05-28.09 亿美元(前值为 27.42-27.50 亿美元) 。 Saleforce、 DocuSign、 Asana 等公司受益于 AI 驱动, 三季度业绩表现出色。
AI 应用逐步落地, 拉动推理算力需求增长。 从单次推理来看, 主要包括分词(Tokenize) 、 嵌入(Embedding)、位置编码(Positional Encoding) 、 Transformer 层、 Softmax, 推理主要计算量在 Transfomer 解码层,对于每个 token、 每个模型参数, 需要进行 2× 1 Flops = 2 次浮点运算, 则单词推理算力消耗为模型参数量× (提问 Tokens + 回答 Tokens) × 2, 随着模型参数量增长、 模型向多模态发展, 单次推理算力消耗持续增长。 从推理次数来看, AI 应用逐步落地, 模型推理次数提升, 拉动推理算力需求快速增长。
OpenAI 发布 GPT-O1, 思维链拉动推理算力增长
OpenAI 发布 GPT-O1, 通过思维链提升模型推理能力。 24 年 9 月 12 日, OpenAI 发布 GPT-O1, 同 GPT-4O相比, GPT-O1 在数学、 代码、 科学问题(PhD 级别) 评分显著提升。 GPT-O1 在回复用户问题之前会生成一条较长的内部思维链, 将复杂的问题拆分为更简单的步骤, 且当前方法无效时, 会进一步尝试其他方式,引入思维链将显著提升模型的推理能力。
思维链(CoT) 拉动推理算力增长。 1) 思维链(CoT) 需要多步推理进而大幅提升推理算力的需求, 同时推 理 时间 的 增 长 亦 是推 理 算 力 消 耗增 长 的 反 映 ; 2 ) 根 据 Jason Wei 等 人 在 23 年 发 布的 文 章《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》 , 思维链仅对 1000 亿以上参数模型的推理有显著提升; 此前, 为节省推理算力消耗, 大多数模型通过蒸馏等方式缩小模型参数量, 而思维链反向限定模型参数量下限, 进而拉动推理阶段算力需求增长
推理算力占比有望提升, 定制化芯片或大有可为
中国 AI 芯片市场规模快速增长, 推理算力占比有望提升。 根据亿欧智库数据, 23 年中国 AI 芯片市场规模约 1038.8 亿元, 预计 25 年增长至 1780 亿元, 对标 23-25 年 CAGR 为 30.9%, 中国 AI 芯片市场规模快速增长。 随着 AI 应用逐步落地以及思维链等技术的运用, 推理侧算力需求有望快速提升, 根据《2023-2024 年中国人工智能计算力发展评估报告(IDC&浪潮) 》 发布数据, 预计 24 年中国推理算力占比为 67.7%, 同比+26.4 个 pct。
博通: 从客户来看, 公司为谷歌、 Meta 等客户定制 AI Asic 芯片; 从技术来看, 公司可以提供高复杂度的定制加速卡(XPU) 和 Asic, 主要包括: 1) 计算: 处理单元架构(客户提供) 、 设计流程和性能优化(博通) ; 2) 内存: HBM PHY、 集成与性能(博通) ; 3) 网络 I/O: 架构及执行(博通) ; 4) 封装: 2.5D、
3D 和硅光子体系结构(博通) 。Marvell: 公司 19 年收购 Avera, 随后宣布提供定制 Asic SOC 服务, 目前客户主要有亚马逊等。
海光信息: 公司深耕 AI 芯片领域, 采用 GPGPU 架构, 其 DCU 芯片在推理领域表现出色。
寒武纪: 公司云、 边、 端三位协同, 发布思元 370 加速卡, 推理领域表现出色。
云天励飞: 公司 Deep Edge 系列推理卡已经适配了包括云天天书、 通义千问、 百川智能、 以及 Llama2/3等在内的近十个主流大模型。
投资建议:
AI 应用逐步落地, 叠加思维链等技术的使用, 推理侧算力需求有望快速提升, 建议关注国产算力芯片海光信息。
AI 应用落地不及预期, AI 芯片迭代不及预期, AI 芯片供应不及预期