ITBear旗下自媒体矩阵:

智元机器人发布通用基座大模型GO-1,新人形机器人亮相在即

   时间:2025-03-12 10:50:36 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

近日,智元机器人在科技界掀起波澜,宣布成功推出其首个通用具身基座模型——智元启元大模型Genie Operator-1(简称GO-1)。这一创新成果不仅标志着智元在机器人技术领域的重大突破,也为具身智能的发展开辟了新路径。

GO-1的核心在于其独特的Vision-Language-Latent-Action(ViLLA)框架,该框架巧妙融合了VLM(多模态大模型)与MoE(混合专家)技术。VLM作为模型的主干网络,通过学习和利用互联网上的大规模纯文本及图文数据,赋予了GO-1强大的场景感知与理解能力。而MoE则包含隐动作专家模型和动作专家模型,前者通过人类操作和跨本体操作视频的学习,使模型能够理解并执行各种动作;后者则利用高质量的仿真数据和真机数据,确保模型在执行动作时的精准与高效。

GO-1的推出,意味着机器人具备了前所未有的小样本快速泛化能力。这意味着,即便是在极少数据甚至零样本的情况下,GO-1也能迅速适应新场景和新任务。其“一脑多形”的特性,使得GO-1能够在不同形态的机器人之间自由迁移,轻松适配各种本体。智元还透露,GO-1配备了数据回流系统,能够在实际执行中不断学习进化,从而持续提升性能。

在功能实现上,GO-1采用了数字金字塔的构建方式。底层是互联网的大规模纯文本与图文数据,为机器人提供了丰富的知识库。之上则是人类操作/跨本体视频,帮助机器人学习各种动作模式。再上一层是仿真数据,用于增强机器人的泛化能力。而金字塔的顶层,则是高质量的真机示教数据,确保机器人能够精准执行动作。

在实际应用中,GO-1展现出了惊人的表现。用户只需通过简单的语言指令,机器人就能迅速理解并执行任务。例如,用户告诉机器人“挂衣服”,GO-1就能根据所看到的画面以及所学习的知识,拆解出挂衣服的步骤,并精准完成整个任务。无论是在家庭场景中准备餐食、收拾桌面,还是在办公和商业场景中接待访客、发放物品,GO-1都能游刃有余地应对。

GO-1还能通过数据回流持续进化。例如,当机器人在做咖啡时不小心把杯子放歪了,它就能从这次失败中学习,并在后续的任务中不断改进,直到成功完成任务。这种持续学习的能力,使得GO-1能够不断适应多变的真实世界,为机器人技术的发展注入了新的活力。

智元还预告了未来几个月将推出基于强化学习的仿真模型,并即将亮相新的人形机器人。这些新技术的引入,将进一步推动具身智能的发展,使机器人能够更好地服务于人类社会。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version