当前位置:首页 > IT大事件 > 正文

荣耀AI技术里程碑:首个GUI开源大模型发布,荣耀MagicV5首发搭载

荣耀AI技术里程碑:首个GUI开源大模型发布,荣耀MagicV5首发搭载 荣耀MagicGUI GUI开源大模型 AI数字助理 一语打车 多智能体协同 荣耀MagicV5 AI终端生态 阿尔法战略 第1张

   当用户说出“打最快的车去公司”,手机屏幕自动亮起,高德地图被唤醒,目的地精准填入,高速优先选项被勾选,订单确认按钮自行按下——整个过程不过数秒。这是荣耀MagicV5用户正在经历的日常。支撑这一幕的,正是荣耀于2025年7月26日在上海世界人工智能大会(WAIC)上正式亮相的自研成果:MagicGUI大模型。作为业界首个面向GUI(图形用户界面)场景的开源大模型,它的发布标志着智能手机从“被动工具”向“主动助理”的进化迈出了关键一步。

   MagicGUI的核心突破在于将多模态理解转化为精准行动。这个拥有70亿参数的模型,其价值远不止于参数规模。它赋予手机一双“数字之手”,能“看见”屏幕内容、“思考”操作逻辑、“执行”复杂任务。实际测试中,在打车、购物、搜索等高频场景下,其操控准确率达到91.5%,超越行业同类顶级开源模型16.4%。这一数据的背后,是荣耀首创的“继续预训练+强化微调”两阶段训练框架。尤其强化学习阶段引入的DF-GRPO算法和空间增强复合奖励函数,让模型在面对从未训练过的新应用界面时,仍能灵活推理、稳定执行。正是这种技术底气,让荣耀敢将模型全面开源,相关报告与数据已在GitHub公布,接受全球开发者的检验与共创。

   用户可感知的革新,在荣耀MagicV5上体现得淋漓尽致。以“一语打车”为例,YOYO智能体在用户授权下,能自主调度高德、滴滴等应用,完成从地址修改、车型选择到订单支付的全链条操作。这背后是MagicGUI作为“行动大脑”的支撑:它实时分析屏幕视觉信息,预判下一步操作,遭遇突发状况(如地址模糊或网络中断)时能主动暂停并切换人工接管。这种能力已突破单一任务限制,向多智能体协同演进。例如处理“制作PPT+发送邮件”的复合指令时,YOYO可调度设计、排版、邮件等多个专项模块协同作业,真正接近人类助理的工作逻辑。

   荣耀此次开源策略的深意,在于打造生态协同的“基座”。自2023年与复旦大学共建自然语言处理联合实验室起,产学研融合便成为MagicGUI的研发基因。而此次开源,将进一步吸引开发者基于该模型构建差异化应用,推动技术从“同质竞争”转向“多样创新”。产业协作层面,荣耀已联合阿里、百度等百余家企业发布《智能体协议共建共享联合倡议》,并牵头10余项AI终端标准立项。这种开放姿态,与其“阿尔法战略”中从手机制造商向AI终端生态枢纽转型的目标紧密呼应——正如荣耀CEO李健所强调的“做生态的树干,连接根系与枝叶”。

   安全始终是智能跃迁的基石。所有YOYO的“自动驾驶”操作均通过ISO/IEC27701、ISO/IEC27001等国际权威隐私认证,确保用户数据在自动化流程中闭环处理。技术向善的理念同样体现在荣耀参与制定的《人工智能安全承诺》中,该框架提炼了20项安全标签,公开43项企业实践,为行业提供了可落地的安全范式。

   从Siri初代语音助手诞生至今已逾十年,AI助手长期被困在“设置闹钟”的浅层交互中。MagicGUI的突破性在于,它跳出了传统语音模型的“应答逻辑”,转而解决“如何让手机主动办成事”这一本质问题。当行业陷入硬件参数的内卷时,荣耀用行动证明:终端智能的终极战场,在于能否成为用户可托付的“数字伙伴”。随着开源生态的发酵与多智能体协同的深入,这场由MagicGUI掀起的交互革命,才刚刚开始。

发表评论