ITBear旗下自媒体矩阵:

智元机器人发布通用基座大模型GO-1,新人形机器人亮相在即

   时间:2025-03-12 14:56:25 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在人工智能领域的一次重要突破中,智元机器人公司近日震撼发布了其首个通用具身基座模型——智元启元大模型Genie Operator-1(简称GO-1)。这一创新成果不仅标志着机器人在理解和执行人类指令方面迈出了巨大一步,还为未来机器人的广泛应用奠定了坚实基础。

GO-1的核心在于其独特的Vision-Language-Latent-Action(ViLLA)框架,该框架巧妙融合了VLM(多模态大模型)与MoE(混合专家)技术。这一组合使得GO-1能够在极少量数据甚至无数据的情况下,快速适应新场景和新任务,展现了其强大的小样本快速泛化能力。

VLM作为GO-1的主干网络,继承了开源多模态大模型的权重,并通过互联网上的大规模纯文本和图文数据训练,赋予了机器人广泛的场景感知和理解能力。而MoE中的隐动作专家模型和动作专家模型,则分别通过人类操作和跨本体操作视频,以及高质量的仿真数据和真机数据,进一步提升了机器人的动作理解和执行能力。

智元机器人的GO-1不仅技术先进,其设计理念也极具前瞻性。GO-1作为一个通用机器人策略模型,能够轻松地在不同机器人形态之间迁移,实现“一脑多形”的跨本体应用。这意味着,无论是家庭服务机器人、工业机器人还是商业服务机器人,GO-1都能快速适配,发挥其强大的功能。

GO-1的工作流程也相当高效。用户只需通过简单的语言指令,GO-1就能将多相机的视觉信号与人类语言指令相结合,直接输出机器人的动作执行。这一过程中,ViLLA框架通过预测隐式动作标记,有效弥合了图像-文本输入与机器人执行动作之间的鸿沟,使得机器人的响应更加迅速和准确。

在实际应用中,GO-1的表现同样令人瞩目。无论是在家庭场景中准备餐食、收拾桌面,还是在办公和商业场景中接待访客、发放物品,GO-1都能游刃有余地完成各项任务。更令人兴奋的是,GO-1还具备持续进化的能力。通过智元的数据回流系统,GO-1可以从实际执行中遇到的问题数据中不断学习,不断提升自身的性能。

为了更直观地展示GO-1的能力,智元机器人还提供了多个生动的应用场景示例。在商务会议中,面对人类发出的“帮我拿一瓶饮料”或“帮我拿一个苹果”的语音指令,GO-1能够迅速响应,准确完成任务。而在制作咖啡的过程中,即使机器人不小心将杯子放歪,GO-1也能通过数据回流系统持续学习,直到成功完成任务。

智元机器人的GO-1无疑为具身智能的发展开辟了新的道路。从单一任务到多种任务、从封闭环境到开放世界、从预设程序到指令泛化,GO-1的出现加速了具身智能的通用化、开放化与智能化进程。未来,我们有理由相信,随着技术的不断进步和应用的不断拓展,GO-1将在更多领域发挥重要作用,为人们的生活带来更多便利和惊喜。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version