首页 行业研报 信息技术行业动态点评:Claude新版本发布,大模型能力持续高歌猛进

信息技术行业动态点评:Claude新版本发布,大模型能力持续高歌猛进

行业研报 87

  【事项】

信息技术行业动态点评:Claude新版本发布,大模型能力持续高歌猛进

  北京时间6月21日,Anthropic正式发布Claude3.5Sonnet。从Anthropic透露的信息来看,在阅读、编码、数学和视觉等几个主要AI基准测试中,新模型能力不仅超过了Claude3Sonnet,还超越了Anthropic此前最强版本的旗舰模型Claude3Opus。另外,在其释出的一系列与行业竞争对手的测试结果榜单中,Claude3.5Sonnet的大部分成绩优于OpenAI、Google、Meta的旗舰模型,包括刚推出不久的GPT-4o。细致来看,Claude3.5Sonnet在研究生水平推理(GPQA)、编码能力(HumanEval)、文本推理(DROP)等方面的成绩均好于GPT-4o,在数学问题解决能力上稍逊于后者。

  【评论】

  性能优异,多模态能力优秀。Claude3.5具有20万个token的上下文窗口,约合15万个单词。其图像理解能力也尤为突出,能轻易解读图表图形、转录低画质图像中的文字。应用场景上,可以做到从商品的包装、标签或收据上读取信息,或者识别大量的货物标签和运输文件,在零售、物流和金融服务领域发挥关键能力。

  价格降低,运行速度提高。从价格上来看,Claude3.5Sonnet每百万输入3美元,每百万输出15美元,是上一代Opus的1/5,运行速度却得到了一倍的提升。

  实际应用场景不局限于聊天机器人。Anthropic推出名为「Artfacts」的新功能。用户在需要Claude生成代码片段、文本、或网站设计等内容时,Claude会以「Artfacts」窗口呈现。用户可以在独立窗口中边聊边看边改,将AI生成的内容无缝地融入到项目和工作中。团队协作功能也在研发中,未来各团队将能在一个共享空间中集中管理工作,企业更多的应用场景得以满足。

  我们认为,海外大模型厂商之间的技术竞赛持续演绎,利于AI行业整体的发展,建议关注国内AI产业链大模型侧的新变化。

  建议关注:科大讯飞,三六零,商汤等

  【风险提示】

  技术发展不及预期;

  市场竞争加剧。