智元开源‘GenieEnvisioner’:让机器人在虚拟世界先彩排再上岗
- IT大事件
- 2025-07-27
- 1251
在浦东某汽车装配车间,一台人形机器人正尝试将零件精准插入底盘。前三次尝试均因毫米级偏差导致零件滑脱,但在第四次操作中,机械臂流畅地完成了任务——这不是现实场景,而是发生在智元机器人最新开源的虚拟仿真平台内。7月,这家由华为天才少年创立的公司正式推出全球首个具身世界模型开源平台“GenieEnvisioner”,其核心组件EVAC框架与EWMBench评测基准正重塑机器人训练范式。
传统机器人训练依赖海量真机数据收集,单次任务验证成本可达数万元。某医疗机器人企业工程师透露:“为训练静脉注射动作,团队耗费三个月录制2000次真人操作视频,真机测试中仍因手部微颤导致30%失败率。”而GenieEnvisioner的突破在于构建了物理世界的高保真数字镜像。其EVAC模型通过多级动作条件注入机制,将机械臂6D位姿(x,y,z,roll,pitch,yaw)映射为像素级动作图谱,实现对“抓取”“推拉”“抛掷”等复杂动力学行为的精准建模。更关键的是,该模型支持单视图连续生成30个动作片段,多视图下维持10段连贯输出,使机器人能在虚拟空间预演数万次操作。
上海某仓储物流企业接入测试版后,机器人路径规划迭代周期从两周压缩至三天。平台特有的失败轨迹学习功能,通过抓取滑脱、碰撞等2万组异常数据训练,使分拣机器人在低光照环境下的操作成功率提升29%。这种能力源于其对真实世界不确定性的仿真——当模拟机械臂触碰装满液体的杯子时,流体晃动轨迹与真实物理实验误差仅3.7%。
同步开源的EWMBench评测体系则像严格的“机器人考官”。该基准涵盖家居、工业、医疗三大场景的300余项测试任务,包含30%的低光照、部分遮挡等极端案例。其三维度评估指标中,动作合理性检测采用HSD距离算法捕捉0.1秒级动作偏差,语义对齐模块则通过多模态大模型解析“将螺丝逆时针旋入”等指令的执行吻合度。在近期全球赛事中,该系统评测结果与真机测试吻合度达92%,远超传统仿真工具68%的水平。
技术团队在厨房场景测试中揭示了平台价值。传统方法训练机器人煎蛋需200次真机演示,而基于EVAC的动作插值技术,仅用20次专家轨迹就生成800组动态数据。经虚拟训练的机器人首次真机测试即成功完成抛锅翻面,油温控制误差小于5℃。这种能力正推动产业变革:深圳某家电企业利用平台开发洗碗机器人,产品上市周期缩短40%,研发成本降低600万元。
随着灵渠OS操作系统开源计划启动,智元正构建具身智能的“安卓生态”。工业现场工程师在开发者社区反馈,曾用三周完成生产线巡检机器人的避障算法优化,而过去此类项目平均需半年。当机器人学会在虚拟世界反复彩排,人类距离真正的生产力解放或许只剩一次系统更新的距离。
本文由NingPanHuo于2025-07-27发表在吾爱品聚,如有疑问,请联系我们。
本文链接:https://521pj.cn/20256632.html
发表评论