计算机行业周报:阿里深夜开源Qwen2.5-Omni,DeepSeek-V3 上线新版本
投资要点
算力:算力租赁价格平稳,阿里深夜开源Qwen2.5-Omni
3月27日凌晨,阿里通义千问团队发布Qwen2.5-Omni。这是Qwen系列中全新的旗舰级多模态大模型,专为全面的多模式感知设计,可以无缝处理包括文本、图像、音频和视频的各种输入,同时支持流式的文本生成和自然语音合成输出。
团队提出了Thinker-Talker架构,这是一个端到端的多模态模型,旨在感知包括文本、图像、音频和视频在内的多种模态,同时以流式方式生成文本和自然语音响应。此外,团队还提出了一种名为TMRoPE(Time-aligned MultimodalRoPE)的新型位置嵌入,用于同步视频输入与音频的时间戳。实时语音和视频聊天方面,该架构专为完全实时交互而设计,支持分块输入和即时输出。它还具备自然且稳健的语音生成:在语音生成方面,Qwen2.5-Omni超越了许多现有的流式和非流式替代方案,展现出卓越的稳健性在和自然性。多模态性能强劲:在与同样大小的单模态模型进行基准测试时,Qwen2.5-Omni在所有模态上均展现出卓越的性能。Qwen2.5-Omni在音频能力上超越了同样大小的Qwen2-Audio,并且达到了与Qwen2.5-VL-7B相当的性能;出色的端到端语音指令遵循能力:Qwen2.5-Omni在端到端语音指令遵循方面的表现可与文本输入的有效性相媲美,这一点在MMLU和GSM8K等基准测试中得到了证明。
Thinker对于Qwen2.5-Omni就像大脑一样,负责处理和理解来自文本、音频和视频模态的输入,生成高级表示以及对应的文本。Talker则像人类的嘴巴,以流式方式接收Thinker产生的高级表示和文本,并流畅地输出离散的语音token。Thinker是一个Transformer解码器,配备有音频和图像的编码器,以便于提取信息。相比之下,Talker被设计为一种双轨自回归Transformer解码器架构。
AI应用:Gemini搜索访问量环比+6.85%,DeepSeek-V3上线新版本
DeepSeek上线新版本DeepSeek-V3-0324,参数量为6850亿,相较上个版本参数增幅不大(6710亿)。DeepSeek V3的一大亮点在于采用MIT开源协议,上个版本还是自定义许可证,这不仅可以自由修改、分发模型,还支持模型蒸馏、商业化应用。
DeepSeek-V3-0324所有指标性能暴涨,击败了Claude3.5Sonnet,成为目前最强的非推理模型。就代码能力来看,DeepSeek-V3-0324同样能够与Claude3.5Sonnet一决高下。另外,在Aider的多语言基准测试中,DeepSeek-V3-0324拿下55%的成绩,较前代版本显著提升,成为仅次于Sonnet3.7的非推理类模型第二名。其表现已可媲美R1和o3-mini等具备推理能力的模型。
在KCORES大模型竞技场中,Claude-3.7-Sonnet-Thinking无疑是LLM当之无愧的王者,DeepSeek-V3-0324以328.3分拿下第三名,仅次于Claude3.5Sonnet。在mandelbrot-set-meet-libai测试中,DeepSeek-V3-0324没有过多变化,较初版仅仅低了2分,完成度提升很高。还有在火星任务测试中,DeepSeek-V3-0324星球渲染正确,所有模型中位列第三。九大行星测试,DeepSeek-V3-0324真正绘制出了太阳系的完整图。此外,DeepSeek-V3-0324在MisguidedAttention基准上,跃居非推理类模型榜首,甚至超越了Claude Sonnet3.7(非推理模型)。
AI融资动向:两兄妹再次出手惊艳AI圈,再次融资250亿
近日,Anthropic宣布完成E轮35亿美元(约合人民币250亿元)融资,投后估值615亿美元(约合人民币4450亿元),这距离Anthropic上一轮10亿美元的融资仅仅过去不到10天。
达里奥·阿莫迪和丹妮拉·阿莫迪兄妹——2021年离开OpenAI开始创业,以他们为代表的AI新贵们正在进行一场史无前例的融资竞赛。2025年短短3个月,从OpenAI到xAI、再到Anthropic,以及OpenAI前CTO创立的新AI公司都在疯狂融资。
通过这项融资,Anthropic将推进其下一代AI系统的发展,扩大其计算能力,加深其在机械性和一致性方面的研究,并加速其国际扩张。
诞生于前OpenAI最早期员工达里奥·阿莫迪和妹妹丹妮拉·阿莫迪之手,Anthropic融资之路可谓势如破竹。就在两个月前已经获得来自谷歌的10亿美元投资,估值一度增长至600亿美元,条件之一是必须使用谷歌的云服务,在此之前,Anthropic也和亚马逊签过类似的条款。
2025年仅过去四分之一,Anthropic就拿下了超45亿美元。而再回过头来看,从2021年2月创立开始,Anthropic已经陆陆续续完成10多轮融资,估值飙升至615亿美元(约合人民币4400亿元),是崛起速度最快的AI公司之一。
投资建议
DeepSeek-V3-0324的新版本代码能力显著提升,数学与逻辑推理能力增强,模型架构与开源生态进一步提升,凸显中国AI企业在技术与成本上的竞争力,更重要的是,其性能跳跃表明该团队可能在为后续重大版本铺路。目前,借助借助新版DeepSeek-V3,Ai应用将在垂直领域加速渗透。建议关注临床AI产品成功落地验证的嘉和美康(688246.SH)、以AI为核心的龙头厂商科大讯飞(002230.SZ)、芯片技术有望创新突破的寒武纪(688256.SH)、高速通信连接器业务或显著受益于GB200放量的鼎通科技(688668.SH)、已与Rokid等多家知名AI眼镜厂商建立紧密合作的亿道信息(001314.SZ)、加快扩张算力业务的精密零部件龙头迈信林(688685.SH)、持续加码高速铜缆的泓淋电力(301439.SZ)、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ)等。
风险提示
1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。
本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。