ITBear旗下自媒体矩阵:

智元机器人发布通用基座大模型GO-1,新人形机器人即将亮相!

   时间:2025-03-10 23:23:14 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在机器人技术的前沿探索中,智元机器人于近日震撼发布了其首个通用具身基座模型——智元启元大模型Genie Operator-1(简称GO-1)。这一创新成果不仅标志着机器人在智能化道路上迈出了重要一步,还预示着具身智能将加速向通用化、开放化与智能化转型。

GO-1的核心在于其提出的Vision-Language-Latent-Action(ViLLA)框架,该框架巧妙融合了VLM(多模态大模型)与MoE(混合专家)技术。这一组合使得GO-1具备了从数据采集、模型训练到模型推理的全链条能力,实现了真正的采训推一体化。

GO-1的ViLLA框架展现出了小样本快速泛化的能力,即使在极少数据甚至零样本的情况下,也能迅速适应新场景和新任务。这一特性得益于VLM对互联网大规模纯文本和图文数据的深度学习,以及MoE对人类操作和跨本体操作视频的广泛吸收。MoE中的动作专家模型还利用高质量的仿真数据和真机数据,赋予了GO-1精细的动作执行能力。

值得注意的是,GO-1不仅仅是一个孤立的模型,它构建在具身领域的数字金字塔之上。这个金字塔从底层的互联网大规模纯文本与图文数据开始,逐层叠加人类操作视频、仿真数据,直至顶层的真机示教数据。这样的结构让GO-1在接受到语言指令时,能够迅速拆解任务、理解环境、规划动作,并最终精准执行。

在实际应用中,GO-1展现出了惊人的适应性和灵活性。无论是家庭场景中的准备餐食、收拾桌面,还是办公和商业场景中的接待访客、发放物品,GO-1都能轻松应对。更令人兴奋的是,它还能通过数据回流系统持续进化,不断从执行过程中遇到的问题中学习,从而提升自身性能。

在演示视频中,我们可以看到GO-1在接收到“挂衣服”的指令后,迅速理解任务要求,规划出挂衣服的步骤,并精准地完成了整个任务。同样,在商务会议中,面对人类发出的“帮我拿一瓶饮料”的指令,GO-1也能迅速响应,将饮料送到指定位置。这些场景不仅展示了GO-1强大的语言理解和任务规划能力,还体现了其跨本体应用的潜力。

智元机器人还预告了未来几个月将推出基于强化学习的仿真模型,以及新的人形机器人。这些新成果的推出,将进一步推动具身智能的发展,让机器人在更多场景中发挥更大的作用。

GO-1的成功发布,无疑为具身智能领域注入了一股强大的动力。它不仅解决了具身智能在场景和物体泛化、语言理解、新技能学习以及跨本体部署等方面的难题,还为机器人走向更多不同场景、适应多变的真实世界提供了可能。随着技术的不断进步和应用场景的不断拓展,我们有理由相信,具身智能的未来将更加美好。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version