AI产业跟踪:马斯克将推出GROK3 预训练已完成 计算量比GROK2高10倍 可能改变大模型竞争态势
Grok-2指令遵循性能得分实际略好于 o1-preview,提升10倍计算量进行训练的Grok-3 得分有望更高,在复杂深度应用和多轮对话的表现上会更好;Grok-3 大模型支持通过X 平台实时贴和搜索连接实时信息世界; 其图像生成模块Aurora 持续提升大模型的多模态能力,预估Grok-3 图像生成能力更强;预估Grok-3 模型价格会更有竞争力,可能改变大模型竞争态势。
Grok-3 背后的10 万块H100,是支撑10 倍计算量提升以及更多的大模型训练参数的核心,大大缩短大模型训练时间:2024 年6 月,马斯克的xAI团队联合英伟达等合作伙伴在孟菲斯建立超级计算集群,整个数据中心建成上线仅用122 天,从服务器硬件安装到开始训练仅花19 天,创下行业最快速度。
Grok 依托X 平台实时帖和网络搜索来提供更好的Grok analysis 功能,让大模型连接实时信息世界;Grok-2 升级图像生成Aurora,提供自回归图像生成模型,持续提升大模型的多模态能力,预估Grok-3 图像生成能力更强:Grok 3 将进一步夯实X 平台的核心服务,包括搜索功能的优化、账户简介的完善、帖子的深度剖析,以及智能回复等。Grok 3 在预训练阶段,计算量相较于Grok 2 实现了10 倍的提升,这一显著的提升,预示着Grok 3 在信息处理能力上会实现质的突破,能够更加全面的满足用户对于智能化、个性化社交体验的需求。Grok 擅长制作创意照片和有趣的模因(amusing memes)。Aurora 提供尖端自回归图像生成模型。
得益于训练效率的提升,预估Grok-3 模型价格会更有竞争力,可能改变大模型竞争态势:得益于Grok-2 训练效率的提高,Grok-2 将模型的价格降低到2 美元/1M input tokens 和10 美元/1M output tokens。对比于o1-2024-12-17 的价格,分别是15 美元/1M input tokens,60 美元/1M outputtokens。目前暂时还无法得到Grok-3 发布时的最近定价,结合chatGPT o1比gpt4o,价格提升了6 倍,预估Grok-3 的定价可能是Grok-2 的2-4 倍。
风险提示:语言模型的技术进展不及预期;人工智能的知识幻觉无法避免;算法或功能优化不及预期等。
*免责声明:文章内容仅供参考,不构成投资建议
*风险提示:股市有风险,入市需谨慎
本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。