传媒互联网行业周报:GPT-4.5发布,阿里开源万相2.1

股票资讯 阅读:2 2025-03-03 16:03:38 评论:0

  报告摘要

  OpenAI发布GPT-4.5,未来计划合并GPT和o系列模型OpenAI发布最新模型GPT-4.5,该模型是公司迄今为止知识最丰富、情商最高的聊天模型。在提升AI大模型性能的两条技术路径中,不同于o系列模型扩展推理环节,此次发布的GPT-4.5延用了GPT系列模型的路径,通过扩展计算量和数据量以及架构优化来扩展无监督学习环节,进而使模型拥有更广泛的知识、对世界更深刻的理解、以及更低的幻觉率等。从测评结果来看,GPT-4.5在反映模型知识储备、语言理解与处理等能力的MMMLU测评中表现更佳;而在数学、编程领域的表现则较o3-mini更弱。从API定价来看,模型每百万tokens输入75元、输出150元,远高于GPT-4o、o1模型,较高的定价增加了模型大规模推广的难度。未来,OpenAI计划将GPT系列和o系列模型合并成最新的GPT-5模型,该模型将集成OpenAI发布的大部分技术工具。

  腾讯发布混元模型Turbo S,回答速度提升1倍

  腾讯发布混元快思考模型Turbo S,并将逐步开启腾讯元宝内的灰度测试。不同于注重运用慢思考生成推理思维链的混元T1、DeepSeek-R1等模型,Turbo S通过快思考实现快速响应,回答速度提升1倍,首字时延降低44%。并且,在保持文科问题快思考的同时,Turbo S结合此前推出的慢思考模型T1合成的长思维链数据,改进理科推理能力。根据测评得分,Turbo S在知识、推理、数学等领域的性能已对标GPT4o、DeepSeek-V3等领先模型。此外,模型采用Hybrid-Mamba-Transformer混合架构,有效降低Transformer架构的计算复杂度,实现训练和推理成本下降。从API定价来看,模型每百万tokens输入0.8元、输出2元;低于DeepSeek-V3每百万tokens输入0.5元(缓存命中)/2元(缓存未命中)、输出8元。

  阿里开源视频生成大模型万相,VBench测评位列榜首

  阿里开源视频生成大模型万相2.1,该模型是首个支持在视频中生成中文文字、中英文文字特效的视频生成模型。根据VBench测评,万相2.1以86.22%的得分位居榜首,领先于Sora、Luma、混元Video、Minimax等国内外模型。截至目前,国内已有智谱CogVideoX v1.5、腾讯混元Video、阶跃星辰Step-Video-T2V、阿里万相2.1共四款开源视频生成模型。从生成视频来看,四款模型对同一提示词生成的视频均实现了物理规律复现能力的提升,阶跃星辰和阿里的模型对人物复杂动作的生成更强;对于考验画面细节的场景生成,四款模型各有优势,但对细节的展现均仍不够精细;对于考验模型对不同应用场景适配度的风格化测试,四款模型均有各自擅长的风格,一个模型并不能完成所有风格的生成。

  核心观点

  我们认为,海内外模型持续迭代,在大语言模型方面,训练模型GPT-4.5的发布表明提升计算量及数据量仍可提升模型性能,但预训练大规模投入的性价比降低,目前推理模型的性能提升表现更优。此外,腾讯Turbo S通过提升模型的回答速度优化用户体验,元宝App通过集成混元及DeepSeek模型满足用户不同的使用需求,ios应用下载数据快速上升至免费榜第二。结合GPT-5计划结合GPT和o系列模型来看,更先进的大模型将是训练和推理模型的集合体,AI应用或正逐步朝着集成多样模型工具的超级应用发展。在多模态模型方面,国内多模态模型性能持续提升、开源生态持续发展,有望为拥有应用场景优势的公司提供底层技术支持,推动各垂直领域实现模型本地化部署及应用落地。建议关注:天娱数科、因赛集团、博纳影业等。

  风险提示

  AI技术发展不及预期的风险、政策监管的风险、行业竞争加剧的风险。


太平洋 郑磊,李林卉
声明

本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。