ITBear旗下自媒体矩阵:

智元机器人发布通用基座大模型GO-1,新人形机器人即将亮相!

   时间:2025-03-11 15:34:29 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在人工智能领域迈出重要一步,智元机器人于近日震撼发布了其首个通用具身基座模型——智元启元大模型Genie Operator-1(简称GO-1)。这一创新成果不仅标志着机器人在理解与执行任务能力上的巨大飞跃,也预示着具身智能正加速向通用化、开放化与智能化迈进。

GO-1的核心在于其提出的Vision-Language-Latent-Action(ViLLA)框架,该框架巧妙融合了VLM(多模态大模型)与MoE(混合专家)技术。VLM作为主干网络,通过吸收互联网上的大规模纯文本和图文数据,赋予了GO-1强大的场景感知与理解能力。而MoE则通过隐动作专家模型和动作专家模型,分别利用人类操作和跨本体操作视频以及高质量的仿真和真机数据,让GO-1具备了动作的理解与精细执行能力。

GO-1的发布,意味着机器人将能够更加灵活地适应各种场景和任务。其小样本快速泛化的能力,使得后训练成本大幅降低,即使在极少数据甚至零样本的情况下,也能迅速泛化到新场景、新任务。“一脑多形”的跨本体应用能力,让GO-1能够在不同机器人形态之间自由迁移,快速适配到各种本体。

智元机器人的GO-1模型,是基于具身领域的数字金字塔构建的。从底层的大规模纯文本与图文数据,到上层的人类操作/跨本体视频,再到仿真数据和真机示教数据,这一金字塔结构为GO-1提供了全面的“基础教育”和“能力培训”。这使得GO-1能够轻松面对多种多样的环境和物体,快速学习新的操作。

在实际应用中,GO-1的表现令人瞩目。用户只需用平常讲话的方式告诉机器人要做的事情,比如“挂衣服”,GO-1就能根据所看到的画面和理解的知识,拆解任务步骤并精准完成。无论是家庭场景中的准备餐食、收拾桌面,还是办公和商业场景中的接待访客、发放物品,GO-1都能游刃有余。

更GO-1还具备持续进化的能力。通过智元的一整套数据回流系统,GO-1可以从实际执行中遇到的问题数据中不断学习,不断提升自己的表现。比如,在制作咖啡时,如果机器人不小心把杯子放歪了,它就能从这次失败中学习,直到成功完成任务。

智元机器人的这一创新成果,无疑为具身智能的发展注入了新的活力。GO-1的出现,让机器人更加智能、灵活和适应多变的环境。从家庭到办公,从商业到工业,GO-1都有望成为人类生活中的得力助手,为人类带来更多的便利和惊喜。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version