ITBear旗下自媒体矩阵:

智元机器人发布通用基座大模型GO-1,新人形机器人即将亮相!

   时间:2025-03-10 20:53:17 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在人工智能领域迎来新突破之际,智元机器人公司震撼发布了其首个通用具身基座模型——智元启元大模型Genie Operator-1(简称GO-1)。这一创新成果不仅标志着机器人在理解和执行任务方面迈出了巨大一步,还预示着具身智能正加速向通用化、开放化与智能化转型。

GO-1的核心在于其提出的Vision-Language-Latent-Action(ViLLA)框架,该框架巧妙融合了VLM(多模态大模型)与MoE(混合专家)技术。VLM作为模型的主干网络,通过吸收互联网上的大规模纯文本和图文数据,赋予了GO-1强大的场景感知和理解能力。而MoE则进一步增强了模型的动作规划和执行能力,使其能够精准地响应各种指令。

尤为GO-1展现了卓越的小样本快速泛化能力。这意味着,即便在数据稀缺甚至零样本的情况下,GO-1也能迅速适应新场景和新任务。“一脑多形”的特性使其能够在不同机器人形态之间灵活迁移,实现跨本体的快速适配。

为了更直观地理解GO-1的工作原理,我们可以想象这样一个场景:当用户以日常对话的方式向机器人发出“挂衣服”的指令时,GO-1会立即启动其复杂的处理流程。首先,它会利用VLM理解“挂衣服”在当前情境下的具体含义和要求。接着,MoE中的隐动作专家模型会调用互联网上的大规模人类操作和跨本体视频数据,规划出挂衣服的步骤。然后,通过仿真数据和真机数据的支持,动作专家模型会精确执行这些步骤,最终完成任务。

GO-1的广泛应用潜力同样不容小觑。从家庭场景中的准备餐食、收拾桌面,到办公和商业场景中的接待访客、发放物品,再到工业等更多领域的复杂操作任务,GO-1都能迅速胜任。这得益于其背后强大的数字金字塔架构,该架构从互联网的大规模纯文本与图文数据出发,逐步吸纳人类操作视频、仿真数据和真机示教数据,为机器人提供了全面的“基础教育”和“能力培训”。

在实际应用中,GO-1的表现同样令人瞩目。无论是早上为用户倒水、烤吐司,还是在商务会议中快速响应拿饮料、拿苹果的指令,GO-1都能游刃有余地完成。更令人兴奋的是,GO-1还具备持续进化的能力。当机器人在执行任务中遇到问题时,如做咖啡时不小心将杯子放歪,它能够通过数据回流系统不断学习并改进,直至成功完成任务。

智元机器人的这一创新成果,无疑为具身智能的发展注入了强劲动力。随着GO-1的广泛应用和持续改进,我们有理由相信,未来的机器人将更加智能、灵活和适应多变的环境。它们将不再局限于单一任务或封闭环境,而是能够迅速适应各种新场景和新任务,成为人类工作和生活中的得力助手。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version