当前位置：首页 > IT大事件 > 正文

荣耀AI技术里程碑：首个GUI开源大模型发布，荣耀MagicV5首发搭载

ChaoMei
IT大事件
2025-07-28
508

荣耀AI技术里程碑：首个GUI开源大模型发布，荣耀MagicV5首发搭载荣耀MagicGUI GUI开源大模型 AI数字助理一语打车多智能体协同荣耀MagicV5 AI终端生态阿尔法战略第1张

当用户说出“打最快的车去公司”，手机屏幕自动亮起，高德地图被唤醒，目的地精准填入，高速优先选项被勾选，订单确认按钮自行按下——整个过程不过数秒。这是荣耀MagicV5用户正在经历的日常。支撑这一幕的，正是荣耀于2025年7月26日在上海世界人工智能大会（WAIC）上正式亮相的自研成果：MagicGUI大模型。作为业界首个面向GUI（图形用户界面）场景的开源大模型，它的发布标志着智能手机从“被动工具”向“主动助理”的进化迈出了关键一步。

MagicGUI的核心突破在于将多模态理解转化为精准行动。这个拥有70亿参数的模型，其价值远不止于参数规模。它赋予手机一双“数字之手”，能“看见”屏幕内容、“思考”操作逻辑、“执行”复杂任务。实际测试中，在打车、购物、搜索等高频场景下，其操控准确率达到91.5%，超越行业同类顶级开源模型16.4%。这一数据的背后，是荣耀首创的“继续预训练+强化微调”两阶段训练框架。尤其强化学习阶段引入的DF-GRPO算法和空间增强复合奖励函数，让模型在面对从未训练过的新应用界面时，仍能灵活推理、稳定执行。正是这种技术底气，让荣耀敢将模型全面开源，相关报告与数据已在GitHub公布，接受全球开发者的检验与共创。

用户可感知的革新，在荣耀MagicV5上体现得淋漓尽致。以“一语打车”为例，YOYO智能体在用户授权下，能自主调度高德、滴滴等应用，完成从地址修改、车型选择到订单支付的全链条操作。这背后是MagicGUI作为“行动大脑”的支撑：它实时分析屏幕视觉信息，预判下一步操作，遭遇突发状况（如地址模糊或网络中断）时能主动暂停并切换人工接管。这种能力已突破单一任务限制，向多智能体协同演进。例如处理“制作PPT+发送邮件”的复合指令时，YOYO可调度设计、排版、邮件等多个专项模块协同作业，真正接近人类助理的工作逻辑。

荣耀此次开源策略的深意，在于打造生态协同的“基座”。自2023年与复旦大学共建自然语言处理联合实验室起，产学研融合便成为MagicGUI的研发基因。而此次开源，将进一步吸引开发者基于该模型构建差异化应用，推动技术从“同质竞争”转向“多样创新”。产业协作层面，荣耀已联合阿里、百度等百余家企业发布《智能体协议共建共享联合倡议》，并牵头10余项AI终端标准立项。这种开放姿态，与其“阿尔法战略”中从手机制造商向AI终端生态枢纽转型的目标紧密呼应——正如荣耀CEO李健所强调的“做生态的树干，连接根系与枝叶”。

安全始终是智能跃迁的基石。所有YOYO的“自动驾驶”操作均通过ISO/IEC27701、ISO/IEC27001等国际权威隐私认证，确保用户数据在自动化流程中闭环处理。技术向善的理念同样体现在荣耀参与制定的《人工智能安全承诺》中，该框架提炼了20项安全标签，公开43项企业实践，为行业提供了可落地的安全范式。

从Siri初代语音助手诞生至今已逾十年，AI助手长期被困在“设置闹钟”的浅层交互中。MagicGUI的突破性在于，它跳出了传统语音模型的“应答逻辑”，转而解决“如何让手机主动办成事”这一本质问题。当行业陷入硬件参数的内卷时，荣耀用行动证明：终端智能的终极战场，在于能否成为用户可托付的“数字伙伴”。随着开源生态的发酵与多智能体协同的深入，这场由MagicGUI掀起的交互革命，才刚刚开始。