首页行业研报信息技术行业动态点评：Claude新版本发布，大模型能力持续高歌猛进

信息技术行业动态点评：Claude新版本发布，大模型能力持续高歌猛进

行业研报 2年前(24-06-24) 200

　　【事项】

　　北京时间6月21日，Anthropic正式发布Claude3.5Sonnet。从Anthropic透露的信息来看，在阅读、编码、数学和视觉等几个主要AI基准测试中，新模型能力不仅超过了Claude3Sonnet，还超越了Anthropic此前最强版本的旗舰模型Claude3Opus。另外，在其释出的一系列与行业竞争对手的测试结果榜单中，Claude3.5Sonnet的大部分成绩优于OpenAI、Google、Meta的旗舰模型，包括刚推出不久的GPT-4o。细致来看，Claude3.5Sonnet在研究生水平推理(GPQA)、编码能力(HumanEval)、文本推理（DROP）等方面的成绩均好于GPT-4o，在数学问题解决能力上稍逊于后者。

　　【评论】

　　性能优异，多模态能力优秀。Claude3.5具有20万个token的上下文窗口，约合15万个单词。其图像理解能力也尤为突出，能轻易解读图表图形、转录低画质图像中的文字。应用场景上，可以做到从商品的包装、标签或收据上读取信息，或者识别大量的货物标签和运输文件，在零售、物流和金融服务领域发挥关键能力。

　　价格降低，运行速度提高。从价格上来看，Claude3.5Sonnet每百万输入3美元，每百万输出15美元，是上一代Opus的1/5，运行速度却得到了一倍的提升。

　　实际应用场景不局限于聊天机器人。Anthropic推出名为「Artfacts」的新功能。用户在需要Claude生成代码片段、文本、或网站设计等内容时，Claude会以「Artfacts」窗口呈现。用户可以在独立窗口中边聊边看边改，将AI生成的内容无缝地融入到项目和工作中。团队协作功能也在研发中，未来各团队将能在一个共享空间中集中管理工作，企业更多的应用场景得以满足。

　　我们认为，海外大模型厂商之间的技术竞赛持续演绎，利于AI行业整体的发展，建议关注国内AI产业链大模型侧的新变化。

　　建议关注：科大讯飞，三六零，商汤等

　　【风险提示】

　　技术发展不及预期；

　　市场竞争加剧。

查看PDF