首页 行业研报 计算机行业周报:首款Transformer专用芯片Sohu亮相,10倍于B200速度成为最快AI芯片

计算机行业周报:首款Transformer专用芯片Sohu亮相,10倍于B200速度成为最快AI芯片

行业研报 87

  投资要点

  算力:算力租赁价格平稳,Transformer ASIC芯片Sohu计算速度超B20010倍

  本周算力租赁价格环比持平。在产业动态方面,6月26日,Etched公司推出全球首款Transformer专用集成电路(ASIC)芯片Sohu。Sohu采用台积电的4nm工艺制造,只有1个核心,每张芯片配有144GBHBM3E高带宽内存,推理性能明显优于GPU和其他通用人工智能芯片,同时能耗更低。在Llama70B吞吐量中,Sohu每秒可以处理超过50万个tokens,速度超过H100的20倍,并超过英伟达今年3月推出的顶配芯片B200的10倍。同时,Sohu实现了90%以上的FLOPS利用率,相比之下使用TRT-LLM的GPU约为30%。当前,OpenAI、谷歌、亚马逊、微软、Meta等所有大型科技公司都在使用Transformer模型,市场前景广阔。Sohu的推出无疑是Transformer芯片领域的一大进步,能够为未来亿万级参数模型的运行赋能。

计算机行业周报:首款Transformer专用芯片Sohu亮相,10倍于B200速度成为最快AI芯片

  AI应用:科大讯飞大发布星火大模型V4.0,全面对标GPT-4Turbo

  6月27日,科大讯飞正式对外发布了讯飞星火大模型V4.0,以及在医疗,教育,商业等多个领域的人工智能应用。讯飞星火V4.0七大核心能力全面升级,在国内外涵盖理解,推理,综合考试,数学,科学以及代码任务的12项中英文主流测试集中,讯飞星火V4.0在8项测试集中排名第一,领先国内大模型。讯飞星火V4.0在文本生成,语言理解,知识问答,逻辑推理和数学五大能力方面整体超越GPT-4Turbo,进一步缩小在代码,多模态能力方面的差距。目前,星火V4.0的多模态能力达到了GPT-4Turbo97%的水平。讯飞星火V4.0是基础全国首个国产万卡算力集群飞星一号训练而成,完全自主可控。

  AI融资动向:EvolutionaryScale获1.42亿美元种子轮融资

  本期AI初创公司的融资中,EvolutionaryScale/Etched融资额前二,分别为1.42亿/1.2亿美元。EvolutionaryScale是一家前沿人工智能研究实验室和公益公司,致力于开发生命科学领域的人工智能,构建了第一个蛋白质大型语言模型ESM1并持续开发下一代ESM3,此轮融资将用于进一步扩展模型能力。Etched专注于打造适用于Transformer架构推理的专业性AI芯片Sohu以及推理服务器,Sohu是迄今为止最快的Transformer芯片,有利于实现超级智能,成为领先的AI芯片供应商。

  投资建议

  “AI封锁”悄然升级,进一步提升全栈AI技术自主可控要求。6月25日,OpenAI通过官方推送邮件告知API用户,自7月9日起,将阻止来自未列入支持国家和地区名单的区域的API流量,如要继续使用OpenAI的服务,需要在受支持的区域进行访问。海外对于中国AI的限制一直存在,本次为OpenAI正式宣告停止中国的API服务,“AI封锁”下,全栈AI技术国产化迫切性进一步提升。预计随着国产大模型技术进一步提升,大模型将会逐渐向本地进行迁移,迎来新机遇。

  建议关注以AI为核心的龙头厂商科大讯飞(002230.SZ)、有望迎来需求爆发的AI应用金桥信息(603918.SH)等。

  风险提示

  1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。

华鑫证券宝幼琛