在科技界的一次重要突破中,前华为“天才少年”计划成员、现任智元机器人联合创始人兼CTO彭志辉,在社交媒体上预告了一项即将发布的重要成果。彭志辉,以其网名“稚晖君”在B站拥有超过250万粉丝,近日透露智元机器人即将带来全新产品。
3月10日,智元机器人正式揭晓了谜底——首个通用具身基座模型“智元启元大模型GO-1(Genie Operator-1)”。这款模型基于Vision-Language-Latent-Action(ViLLA)框架,融合了VLM(多模态大模型)和MoE(混合专家)技术,旨在赋予机器人前所未有的学习能力。
GO-1模型以其独特的优势引起了广泛关注,包括采训推一体化设计、小样本快速泛化能力、“一脑多形”的跨本体应用潜力、持续进化能力,以及通过人类视频学习等特性。这些特性使得GO-1能够借助人类和多种机器人数据,为机器人带来革命性的学习进步。
消息发布后,迅速在网络上发酵,#华为离职天才少年官宣刷屏#、#稚晖君或再掀机器人行业风暴#等话题迅速登上微博热搜,引发了科技界和公众的热议。
在10日上午的沟通会上,智元具身研究中心常务主任任广辉表示,智元机器人已经量产下线了1000台机器人,GO-1模型基于通用数据训练,拥有强大的泛化能力,能够在零数据情况下适应新场景和新任务,且整体成本较低。他还强调,“具身智能”正朝着通用化、开放化和智能化的方向发展,不再局限于实验室。
智元机器人合伙人、研究院执行院长姚卯青进一步阐述了智元对于AI技术的坚定投入,并透露今年将开始规模化的生产和交付,而不会将AI研发投入显著转移到终端售价上。他认为,GO-1模型将使得智元机器人在G3-G4阶段能够更好地完成任务,并逐步具备通用能力。
姚卯青强调,AI能力是区分机器人产品竞争力的核心,未来机器人公司如果不做大模型,将没有未来。他指出,硬件方案可能会逐渐收敛,供应链也会高度整合,但最终比拼的将是AI能力,这对于机器人的落地和自主作业能力至关重要。
智元机器人成立于2023年,是国内人形机器人赛道的头部企业之一。公司成立不到一个月就完成了天使轮融资,并在一年内完成了四次融资,成立仅六个月就发布了首款人形机器人。去年底,智元还开源了百万真实机器人数据集,并年初率先实现了1000台机器人的量产。
GO-1模型的发布,标志着智元在解决现有具身模型面临的多个落地困境方面迈出了重要一步。这些困境包括泛化性差、扩展新任务成本高、不同本体数据无法共用、模型无法持续进化等。GO-1模型通过其创新的ViLLA架构,实现了利用人类视频学习、小样本快速泛化等能力,降低了具身智能的门槛。
据智元介绍,GO-1模型具有五大特点:采训推一体、小样本快速泛化、“一脑多形”、持续进化以及人类视频学习。相比已有的最优模型,GO-1在执行“倒水”、“清理桌面”和“补充饮料”等任务时,平均成功率提高了32%。
智元机器人方面表示,GO-1模型的出现为机器人代替人类完成各种工作提供了强大的脑力支持。从家庭场景到办公和商业场景,再到工业等更多场景,通用具身基座大模型都能够快速实现。这意味着“具身智能”正在从单一任务向多种任务、从封闭环境向开放世界、从预设程序向指令泛化加速迈进。
智元还透露了与阶跃星辰的合作计划,将围绕阶跃的多模态、推理和训练、工程化等底层模型能力进行深度合作,将阶跃星辰的多模态能力赋能到机器人上。
姚卯青认为,利用AI大模型能够加速机器人进入工厂、零售、服务业等场景工作,长期还能进入家庭。他呼吁人形机器人产业需要关注产品竞争力,而不是急于打价格战。
最后,姚卯青表示,未来1-2年人形机器人将在局部工业场景应用落地,走进家庭还需要5年左右的时间。而实现像人一样具有通用能力的物理世界AGI(通用人工智能)还需要5-10年时间。