计算机行业定期报告:大模型硝烟再起,DeepSeek、通义千问、Google、OpenAI先后迎来更新

股票资讯 阅读:8 2025-03-30 21:35:33 评论:0

  投资要点:

  DeepSeek-V3模型更新,各项能力全面进阶

  据DeepSeek官微,3月25日,DeepSeekV3模型已完成小版本升级,目前版本号DeepSeek-V3-0324,DeepSeek-V3-0324与之前的DeepSeek-V3使用同样的base模型,仅改进了后训练方法。私有化部署时只需要更新checkpoint和tokenizer_config.json(toolcalls相关变动)。模型参数约660B,开源版本上下文长度为128K(网页端、App和API提供64K上下文)。

  通义千问Qwen2.5-Omni-7B正式开源,展现全模态优异性能

  据阿里云开发者官微,3月27日,通义千问Qwen2.5-Omni-7B正式开源。作为通义系列模型中首个端到端全模态大模型,可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。Qwen2.5-Omni以接近人类的多感官方式「立体」认知世界并与之实时交互,还能通过音视频识别情绪,在复杂任务中进行更智能、更自然的反馈与决策。目前,开发者和企业可免费下载商用Qwen2.5-Omni,手机等终端智能硬件也可轻松部署运行。

  谷歌发布“最先进复杂任务模型”Gemini2.5Pro,支持原生多模态

  据量子位,3月26日,赶在OpenAI直播之前,谷歌发布Gemini2.5Pro。谷歌介绍,相较于Gemini2.0FlashThinking这个谷歌首个推理模型,Gemini2.5在基础模型和后训练技术上都有改进。不仅是在大模型竞技场上一举拿下高分,在各种推理、数学、科学、编程基准上,Gemini2.5Pro都表现出色,属于是编程能跟Claude3.7Sonnet掰手腕,数学能跟Grok3相媲美。

  OpenAI放出GPT-4o原生多模态图像生成功能

  据InfoQ,3月26日,OpenAI发布了GPT-4oimagegeneration,图像生成技术模型。此初始版本仅专注于图像创建,并将在ChatGPTPlus、Pro、Team和Free订阅层中提供。值得注意的是价格,OpenAI声称与GPT-4Turbo相比,价格降低了50%。更直观的对比是,GPT-4o成本恰好是10倍GPT-3.5;4o是5美元/百万输入token和15美元/百万输出token。3.5是0.50美元/百万输入token和1.50美元/百万输出token。价格下降尤其引人注目,因为OpenAI承诺也将向免费ChatGPT用户提供该模型——这是他们第一次直接向非付费客户提供“最佳”模型。

  风险提示

  市场需求不及预期,人工智能技术发展不及预期,政策发布不及预期,大模型商业落地不及预期的风险等。


华福证券 钱劲宇
声明

本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。