计算机行业周报:智源发布“悟界”系列大模型,高德开放平台发布智能眼镜解决方案

股票资讯 阅读:11 2025-06-12 13:19:22 评论:0

  投资要点

  算力:智源发布“悟界”系列大模型,多项技术实现突破

  6月6日,第七届智源大会开幕。作为主办方的智源研究院正式发布全新一代「悟界」系列大模型,标志着这家前沿科研机构在大模型领域的探索进入全新阶段。

  具体而言,「悟界」系列涵盖多项重要成果:原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体具身大小脑协作框架RoboOS2.0与具身大脑RoboBrain2.0,以及全原子微观生命模型OpenComplex2。

  此次「悟界」系列中的原生多模态世界模型Emu3颇具技术亮点:通过引入新型视觉tokenizer,将图像与视频编码为与文本同构的离散符号序列,构建起无需区分模态的统一表征空间,实现文本、图像、视频任意模态组合的理解与生成。

  6月6日,「悟界」系列推出跨本体具身大小脑协作框架RoboOS2.0与具身大脑RoboBrain2.0,较1.0版本实现性能跨越式提升。

  其中RoboOS2.0实现两项全球首创:全球首个基于具身智能SaaS平台的无服务器轻量化机器人本体部署开源框架,以及首个兼容MCP协议的跨本体具身大小脑协作框架。该框架通过引入「应用商店」模式,既推动协作生态繁荣,又降低开发成本;其开源特性对开发者友好,支持一键下载部署同型号机器人的小脑技能,实现大小脑即插即用协同。框架还采用小脑技能免适配注册机制,开发门槛显著降低,典型场景代码量仅为传统方式的1/10。

  同时,「高效、可靠、智能协同」成为RoboOS2.0的显著特征:通过端到端推理链路的系统级优化,框架整体性能提升30%,全链路平均响应时延压缩至3毫秒以下,端云通信效率提升27倍;新增多本体时空记忆场景图共享机制,支持动态环境实时感知建模;引入多粒度任务监控与闭环反馈模块,显著提升任务执行稳定性与成功率。多重技术优化使其工程可用性与商业落地能力大幅增强。

  配套的具身大脑RoboBrain2.0作为全球性能最强的开源具身智能大模型,在任务规划、空间推理等关键指标上全面超越主流模型,进一步巩固智源在具身智能领域的领先地位。RoboBrain2.0在任务规划上,从依赖Prompt进化为多机协同规划系统,任务规划准确率提升74%;空间智能方面,性能提升17%,新增空间推理能力,可感知相对/绝对空间并进行多步推理;还新增深度思考与闭环反馈能力,前者分解复杂任务提升执行准确率,后者实时调整策略应对环境变化,使机器人在复杂3D空间中操作更智能。

  智源在「悟界」系列中推出全原子微观生命模型OpenComplex2,标志多模态大模型在生命科学领域实现新突破。该模型不仅能预测蛋白质、DNA等生物分子静态结构,还可进行动态构象分布建模,描述能量景观并精准捕捉分子相互作用。其创新基于FloydNetwork图扩散框架与多尺度原子级表示,有效还原生物分子构象多样性和动态特性。

  AI应用:Perplexity周平均访问量环比+1.71%,高德开放平台发布智能眼镜解决方案

  6月5日,高德地图旗下高德开放平台正式发布智能眼镜解决方案,标志着其在空间计算与智能穿戴领域的技术创新迈入新阶段。

  作为专业领先的出行和位置服务解决方案提供商,阿里巴巴集团旗下高德地图依托AI大模型、北斗高精定位技术,并应用Planner-Executor创新技术理念和架构,率先推出全球首个集“感知、规划、执行、表达”于一体的全链路AI导航智能体(NaviAgent),重新定义了智能出行的行业技术理念,为与各领域合作伙伴深度协同打下坚实的技术底座。高德已与Rokid、雷鸟创新、逸文、星纪魅族等AR行业领军企业达成战略合作,共同推出基于智能眼镜的导航智能体(NaviAgent)应用,建设“AI+AR”导航新生态。

  通过深度场景化的Agent能力,高德智能眼镜解决方案实现了本地生活服务与导航功能的深度融合:一方面,它可提供深层次结构化信息查询服务,涵盖用户评分、榜单排行、门票价格、开放时间等多维度内容;另一方面,依托智能语音交互系统,支持用户执行包含路径偏好设定的复杂导航指令。

  不仅如此,基于地图导航生态与大规模数据基座的高阶导航HUD展示,可动态感知实时路径、后方来车、红绿灯读秒等信息,提升出行智能性与安全性。以骑行为例,用户不仅能提前知晓并实时监测路况,还能通过语音添加途径点、查询剩余时间,甚至获取骑行公园推荐,以及阴凉覆盖和坡度路线等贴心信息。

  除了导航与生活服务融合,高德在空间感知领域同样构建了卓越的技术壁垒。高德智能眼镜解决方案基于通义大模型,结合多元融合的技术方案,实现精准地点与建筑物识别,旅游导览时可自动识别景点并播放AR解说,语音提问可获实时解答。

  高德持续推进智能穿戴设备领域的技术创新,基于强大的大数据处理能力,正同步助力智能穿戴生态系统的全面升级,包括智能手表解决方案的建设。该方案灵活适配多平台、多系统需求,全面兼容Android及RTOS系统,操作体验与手机端高度一致。未来,高德将继续深化与行业伙伴的合作,优化AR导航技术的精准度与适用场景,探索车载HUD、工业AR等更多创新应用。通过联动手机、车机、手表、眼镜等多端设备,推动智能穿戴设备成为下一代人机交互的重要入口,为用户创造无缝连接的智慧出行体验。

  Cursor技术助估值近百亿

  6月5日,在Cursor1.0刚刚发布后的第二天,其背后公司Anysphere就宣布完成了一轮高达9亿美元的巨额融资。这轮融资由Thrive Capital、Andreessen Horowitz(a16z)、Accel及DST Global等多家知名投资机构共同领投,使Anysphere的估值达到了99亿美元。从成立到接近百亿估值,Anysphere只用了三年时间。

  Cursor之所以能在众多AI编程工具中获得如今的地位,主要得益于其几个核心的技术特点。其中最受关注的是它的“Agent Mode”(智能体模式)。该模式允许开发者用自然语言下达高层级的、跨文件的任务指令,例如“为整个项目重构数据库连接逻辑”或“实现用户登录的身份验证流程”。接到指令后,Cursor的智能体会自行分析项目中的相关文件,理解代码间的依赖关系,并自动执行一系列修改。支撑这一能力的是其底层所采用的“模型上下文协议”(MCP,Model Context Protocol)。Anysphere的团队认识到,AI模型生成代码的质量,直接取决于它所获取的上下文信息的广度和深度。而由Anthropic提出的MCP正是为此设计的,它允许Cursor高效地整合并理解整个代码库的信息,甚至可以连接到项目管理工具(如Linear)、设计工具(如Figma)和文档工具(如Notion)中的数据。

  通过这种方式,AI的“视野”不再局限于代码本身,而是扩展到了整个软件开发的生命周期,使其能够做出更符合项目全局逻辑的判断和修改。在Cursor1.0版本中,官方进一步简化了MCP服务器的部署,让开发者和团队能更容易地利用这一优势。

  此次获得的9亿美元融资,将为Anysphere的下一步发展提供充足的资源。公司称其将用于深化核心技术的研发,继续提升其AI智能体的能力,使其能应对更复杂的软件工程任务。同时,资金也将用于吸引更多顶尖技术人才,并加速其产品的商业化进程和市场拓展。

  投资建议


华鑫证券 宝幼琛
声明

本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。