ITBear旗下自媒体矩阵:

智元机器人发布通用基座大模型GO-1,新人形机器人即将亮相!

   时间:2025-03-12 13:28:22 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在机器人技术的前沿探索中,一款名为智元启元大模型Genie Operator-1(简称GO-1)的通用具身基座模型于近日震撼发布,标志着智元机器人在具身智能领域迈出了重要一步。这款模型由智元机器人公司倾力打造,以其独特的Vision-Language-Latent-Action(ViLLA)框架,展现了小样本快速泛化、“一脑多形”跨本体应用等前沿特性。

GO-1的核心竞争力在于其ViLLA框架,该框架巧妙融合了VLM(多模态大模型)与MoE(混合专家)技术。VLM作为模型的主干网络,借助互联网海量文本和图文数据,赋予了GO-1强大的场景感知与理解能力。而MoE则通过隐动作专家模型和动作专家模型,进一步提升了模型的动作理解和精细执行能力。这一组合使得GO-1在面对新场景、新任务时,能够迅速适应并精准执行。

在功能特性上,GO-1展现了五大亮点:采训推一体化设计,确保了数据采集、模型训练与推理的无缝衔接;小样本快速泛化能力,使得模型能够在极少数据甚至零样本情况下,快速泛化至新场景;一脑多形特性,让GO-1能够在不同机器人形态间灵活迁移,快速适配各类本体;持续进化能力,通过智元的数据回流系统,模型能够不断从实际执行中遇到的问题中学习进化;人类视频学习能力,则让GO-1能够结合互联网视频和真实人类示范,深化对人类行为的理解。

GO-1的构建基于具身领域的数字金字塔模型,从底层的互联网大规模纯文本与图文数据,到上层的人类操作/跨本体视频、仿真数据,再到顶层的真机示教数据,形成了一个完整的知识与技能学习链条。这一设计使得GO-1能够全面接受“基础教育”和“能力培训”,轻松应对多样环境与物体,快速学习新操作。

在实际应用中,GO-1展现了惊人的表现。无论是家庭场景中的倒水、烤吐司,还是商业场景中的检票、发放物料,甚至是商务会议中的拿饮料、拿苹果等指令,GO-1都能迅速响应并精准执行。GO-1还具备持续进化的能力,能够从执行过程中遇到的问题数据中不断学习,直至成功完成任务。

GO-1的出现,不仅解决了具身智能面临的场景和物体泛化能力不足、语言理解能力欠缺、新技能学习缓慢等问题,更为机器人替代人类完成各类工作提供了强有力的支持。从家庭到商业,从工业到更多场景,GO-1都能迅速适应并发挥出色表现。这一创新成果,无疑将加速具身智能向通用化、开放化与智能化迈进的步伐。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version