计算机行业周报:Genio 720和Genio 520联合发布,视频生成模型Open-Sora 2.0发布
投资要点
算力:算力租赁价格平稳,Genio720和Genio520联合发布
2025年3月12日,在国际嵌入式展(EMBEDDED WORLD)上,联发科技(MediaTek)发布高性能边缘AI物联网芯片Genio720和Genio520。作为Genio智能物联网平台的新一代产品,Genio720和Genio520支持先进的生成式AI模型、人机界面(HMI)、多媒体及连接功能,适用于智能家居、智慧零售等商业和工业物联网产品。
Genio720和Genio520拥有卓越的边缘计算性能,其搭载的MediaTek第八代NPU算力至高可达10TOPS,支持Transformer和卷积神经网络(CNN)模型硬件加速。Genio720和Genio520可通过高达16GB LPPDR5内存,支持边缘优化数据密集型的大语言模型(如Llama、Gemini、Phi和DeepSeek等),并显著提升生成式AI任务的运行速度。借助MediaTek广泛的全球AI生态支持,开发者可通过业界先进的全球大语言模型和通用框架高效部署多模态生成式AI应用,将产品加速推向市场。
Genio720和Genio520采用高能效6nm制程,集成八核CPU包括两个Arm Cortex-A78核心和六个Arm Cortex-A55核心,这同时兼顾性能和能效。并且两款平台针对低功耗应用进行了优化,更加适用于无风扇设计和电池供电的移动设备。
Genio720和Genio520具备多种先进的多媒体功能,适用于商业显示、智慧零售设备、HMI应用,以及各类多窗口和交互式应用。此外,统一的硬件及软件设计助力开发者一次编写,随处应用。同时,Genio720和Genio520支持定制设计,以满足特定的应用需求。
AI应用:文心一言搜索访问量环比+3.27%,商业级视频生成大模型Open-Sora2.0发布
潞晨科技正式推出Open-Sora2.0——一款全新开源的SOTA(State-of-the-Art)视频生成模型,仅用20万美元(224张GPU)成功训练商业级11B参数视频生成大模型,性能直追HunyuanVideo和30B参数的Step-Video,训练后在VBench和人工偏好(Human Preference)评测上都取得与用高昂成本开发的主流闭源大模型同等水平。
根据视频生成权威榜单VBench的评测结果,Open-Sora模型的性能进步显著。从Open-Sora1.2升级到2.0版本后,与行业领先的OpenAI Sora闭源模型之间的性能差距大幅缩小,从之前的4.52%缩减至仅0.69%,几乎实现了性能的全面追平。此外,Open-Sora2.0在VBench评测中取得的分数已超过腾讯的HunyuanVideo,以更低的成本实现了更高的性能。
在视觉表现、文本一致性和动作表现三个评估维度上,OpenSora在至少两个指标上超越了开源SOTA HunyuanVideo,以及商业模型Runway Gen-3Alpha等,以小成本获取了好性能。
根据估算,市面上10B以上的开源视频模型,动辄需要上百万美元的单次训练成本,而Open Sora2.0将该成本降低了5-10倍。作为开源视频生成领域的领导者,Open-Sora不仅继续开源了模型代码和权重,更开源了全流程训练代码,成功打造了强大的开源生态圈。据第三方技术平台统计,Open-Sora的学术论文引用量半年内获得近百引用,在全球开源影响力排名中稳居首位,领先所有开源的I2V/T2V视频生成项目,成为全球影响力最大的开源视频生成项目之一。
在训练完成后,Open-Sora面向未来,进一步探索高压缩比视频自编码器的应用,以大幅降低推理成本。目前,大多数视频模型仍采用4×8×8的自编码器,导致单卡生成768px、5秒视频耗时近30分钟。为解决这一瓶颈,Open-Sora训练了一款高压缩比(4×32×32)的视频自编码器,将推理时间缩短至单卡3分钟以内,推理速度提升10倍。
AI融资动向:智谱AI获本周AI融资额第一,近三个月总融资额已超过45亿元
就在本月3日,智谱刚宣布完成一笔金额超10亿元的战略融资,参与投资方包括杭州城投产业基金、上城资本等。2024年12月17日,智谱官宣完成的30亿元融资,投资方包括北京海淀中关村科学城等多家战投及国资机构。此前,2024年9月,中关村科学城公司宣布以投前200亿估值领投智谱,智谱也是国内估值率先超过200亿的大模型创企之一。据不完全统计,智谱的股东阵容包括高瓴资本、红杉中国、启明创投、君联资本、招商局创投等知名投资机构,以及美团、阿里及蚂蚁、腾讯、小米(顺为资本)在内的大厂。
2021年,智谱训练完成中国第一个百亿参数模型——GLM-10B,利用MoE架构成功训练出收敛的万亿稀疏模型。紧接着,2022年智谱联合清华大学,发布中英双语千亿级超大规模预训练模型——GLM-130B并开源。2023年推出千亿基座对话模型ChatGLM。基于ChatGLM,智谱AI推出了面向C端用户的聊天对话应用“智谱清言”。
2024年推出新一代基座大模型GLM-4和GLM-4-Plus,对标世界先进水平。这一年4月9日,智谱华章以71亿人民币的企业估值入选《2024·胡润全球独角兽榜》,同月入选2024福布斯中国人工智能科技企业。2025年1月10日消息,智谱GLM-4-9B模型在基于幻觉评估模型HHEM-2.1-Open的大模型幻觉排行榜中,以1.3%的幻觉率排名第一,超过OpenAI GPT系列和Google Gemini系列等。具体来看,智谱GLM-4-9B模型事实一致性率高达98.7%,回答率100%,幻觉率则仅有1.3%,在参评的85个模型中排名第一。
投资建议
多模态有望迎来“Deepseek-R1时刻”。根据视频生成权威榜单VBench的评测结果,Open-Sora模型的性能进步显著。从Open-Sora1.2升级到2.0版本后,与行业领先的OpenAISora闭源模型之间的性能差距大幅缩小,从之前的4.52%缩减至仅0.69%,几乎实现了性能的全面追平。此外,Open-Sora2.0在VBench评测中取得的分数已超过腾讯的HunyuanVideo,以更低的成本实现了更高的性能,为开源视频生成技术树立了全新标杆。作为开源视频生成领域的领导者,Open-Sora不仅继续开源了模型代码和权重,更开源了全流程训练代码,成功打造了强大的开源生态圈。我们认为,多模态开源领域及降本的突破正在发生,多模态的“Deepseek-R1时刻”即将到来。
建议关注临床AI产品成功落地验证的嘉和美康(688246.SH)、以AI为核心的龙头厂商科大讯飞(002230.SZ)、芯片技术有望创新突破的寒武纪(688256.SH)、高速通信连接器业务或显著受益于GB200放量的鼎通科技(688668.SH)、已与Rokid等多家知名AI眼镜厂商建立紧密合作的亿道信息(001314.SZ)、加快扩张算力业务的精密零部件龙头迈信林(688685.SH)、持续加码高速铜缆的泓淋电力(301439.SZ)、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ)等。
风险提示
1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。
本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。