ITBear旗下自媒体矩阵:

智元机器人发布通用基座大模型GO-1,新人形机器人即将亮相!

   时间:2025-03-12 15:53:36 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在机器人技术的前沿探索中,一款名为智元启元大模型Genie Operator-1(简称GO-1)的通用具身基座模型于近日震撼发布,标志着机器人在智能化道路上迈出了重要一步。这款由智元机器人精心打造的模型,以其独特的Vision-Language-Latent-Action(ViLLA)框架,展现了前所未有的多模态学习与执行能力。

GO-1的核心竞争力在于其ViLLA框架,该框架巧妙融合了VLM(多模态大模型)与MoE(混合专家)技术。VLM作为主干网络,依托开源多模态大模型的强大基础,通过大规模互联网数据训练,赋予了GO-1广泛的场景感知与理解能力。而MoE则进一步增强了模型的动作规划与执行精度,通过隐动作专家模型和动作专家模型的协同工作,实现了从理解指令到精准执行的无缝衔接。

尤为值得一提的是GO-1的小样本快速泛化能力。这一特性使得GO-1能够在极少数据甚至零样本的情况下,迅速适应新场景和新任务,大大降低了后训练成本。同时,“一脑多形”的跨本体应用能力,让GO-1能够在不同形态的机器人之间灵活迁移,实现了真正的通用性。

GO-1的知识体系构建于一个数字金字塔之上,底层是基础的大规模纯文本与图文数据,为机器人提供了广泛的知识基础。往上则是人类操作视频和跨本体操作视频,这些视频数据帮助GO-1学习并模仿人类和其他本体的动作模式。再往上,仿真数据增强了模型的泛化性,使其能够适应不同场景和物体。而金字塔的顶层,则是高质量的真机示教数据,确保了GO-1在执行动作时的精准度。

在实际应用中,GO-1展现出了惊人的表现。用户只需通过简单的语言指令,如“挂衣服”,GO-1就能根据所学习的知识和数据,自动拆解任务步骤,并精准完成。从家庭场景中的倒水、烤吐司,到商业场景中的检票、发放物料,再到商务会议中的拿饮料、拿苹果,GO-1都能迅速响应,完美执行。

GO-1还具备持续进化的能力。通过数据回流系统,GO-1能够从实际执行中遇到的问题数据中不断学习和改进,从而实现自我完善。例如,当机器人在制作咖啡时不慎将杯子放歪时,它能够通过后续的数据回流和学习,逐渐纠正这一错误,直至成功完成任务。

智元启元大模型GO-1的发布,不仅为机器人技术带来了革命性的突破,更为具身智能的通用化、开放化与智能化发展指明了方向。随着技术的不断进步和应用的不断拓展,我们有理由相信,未来的机器人将更加智能、更加灵活,能够更好地服务于人类社会的各个领域。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version