滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

智元机器人发布通用基座大模型GO-1，新人形机器人即将亮相！

时间：2025-03-10 16:33:54 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在机器人技术的前沿探索中，一款名为智元启元大模型Genie Operator-1（简称GO-1）的创新成果于近日震撼发布，标志着通用具身智能基座模型迈出了重要一步。这款由智元机器人精心打造的模型，凭借其独特的Vision-Language-Latent-Action（ViLLA）框架，正引领着具身智能向更加通用化、开放化与智能化的方向加速前进。

GO-1的核心竞争力在于其ViLLA框架，该框架巧妙融合了VLM（多模态大模型）与MoE（混合专家）技术。VLM作为主干网络，基于开源多模态大模型的权重，并通过互联网大规模纯文本和图文数据的训练，赋予了GO-1强大的场景感知与理解能力。而MoE则通过隐动作专家模型和动作专家模型的协同工作，利用互联网上的大规模人类操作和跨本体操作视频，以及高质量的仿真数据和真机数据，使GO-1具备了动作的理解与精细执行能力。

GO-1的五大特点尤为引人注目：采训推一体化设计，实现了数据采集、模型训练与模型推理的无缝对接；小样本快速泛化能力，让GO-1能够在极少数据甚至零样本的情况下快速适应新场景与新任务；一脑多形特性，使其能够轻松迁移至不同机器人形态，快速适配各种本体；持续进化机制，借助智元的数据回流系统，GO-1能够不断从实际执行中遇到的问题数据中学习进化；人类视频学习能力，则让GO-1能够结合互联网视频和真实人类示范，进一步增强对人类行为的理解。

在构建过程中，GO-1采用了具身领域的数字金字塔结构。底层是互联网的大规模纯文本与图文数据，为机器人提供通用知识与场景理解的基础。往上是人类操作/跨本体视频数据，帮助机器人学习动作操作模式。再往上则是仿真数据，用于增强泛化性。而金字塔的顶层，则是高质量的真机示教数据，确保机器人能够精准执行动作。这一结构使得GO-1能够全面适应新场景，轻松面对多样化的环境和物体，快速学习新的操作。

在实际应用中，GO-1展现出了惊人的表现。用户只需通过简单的语言指令，如“挂衣服”，GO-1便能根据视觉信号和语言指令，直接输出并执行相应的动作。这一过程中，GO-1能够准确理解指令含义，预测并规划出执行步骤，最终精准完成任务。无论是家庭场景中的准备餐食、收拾桌面，还是办公和商业场景中的接待访客、发放物品，GO-1都能游刃有余地应对。

GO-1的持续进化能力也让人印象深刻。例如，在机器人制作咖啡时，如果不小心将杯子放歪，GO-1便能从这次失败中学习，不断优化自身动作，直至成功完成任务。这种不断学习和进化的能力，使得GO-1能够不断适应新的环境和挑战，成为更加智能和可靠的机器人伙伴。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

华为悄然布局医疗领域，医疗卫生军团能否加速AI医疗落地？

03-10

罗永浩细红线科技2025春招启动，AI等领域人才招募中，小米前将加盟助力

03-10

智元启元大模型GO-1发布：具身智能新纪元，机器人通用能力大飞跃！

03-10

00后主播借AI工具DeepSeek，直播单日狂揽3.3亿销售额！

03-10

东南大学率先上线阿里QwQ-32B模型，科研AI推理能力大提升！

03-10

智元机器人发布通用基座大模型GO-1，新人形机器人即将亮相！

具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

03-10

智元机器人发布通用基座大模型GO-1，新人形机器人亮相在即

具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

03-10

iPhone 17 Pro机模曝光：横向大矩阵相机，神似小米11 Ultra？

03-10

神雲科技2025亚洲超算展：G4520G6与TN85-B8261服务器引领AI与HPC新纪元

03-10

汇立银行引领亚洲，本地化部署DeepSeek大模型创新金融科技

03-10

标普云《人民代表报》展AI实力，企业经营大模型引领智能变革

03-10

宿迁低空科技新公司成立，注册资本达2000万，业务覆盖航空服务与维修

03-10

智元机器人发布通用基座大模型GO-1，新人形机器人亮相在即

具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

03-10

光伏新能源检测：挑战、解决方案与未来智能化之路

03-10

AI算命热潮背后：寻求情绪价值还是科学指引？

因为设计原理决定了，大模型不论是否知道准确答案都必须预测出结果，这就会让它“脑补”一些内容——但人类是很难分辨的。还有人会特意让DeepSeek 用最刻薄的语气和自己交流，果不其然得到了非常狠毒的预言，让…

03-10

点击查看更多 +

全站最新

沃尔沃全新XC90四月上市，内外焕新增六座，能否搅动豪华SUV市场？

混动三国杀，领克07 EM-P、海豹07 DM-i、凯美瑞双擎谁主沉浮？

腾势N9大型SUV来袭，预售45万起，能否撼动问界M9市场地位？

沃尔沃2025新能源攻势：袁小林领航，新款XC60领衔七车矩阵

网易蜂巢模块将停服涉及约4000用户网易数智回应：其他业务不受影响

理想汽车VLA智驾大模型来袭，下半年能否引领智能驾驶新潮流？

热门内容

本栏最新

华为悄然布局医疗领域，医疗卫生军团能否加速AI医疗落地？

罗永浩细红线科技2025春招启动，AI等领域人才招募中，小米前将加盟助力

智元启元大模型GO-1发布：具身智能新纪元，机器人通用能力大飞跃！

东南大学率先上线阿里QwQ-32B模型，科研AI推理能力大提升！

智元机器人发布通用基座大模型GO-1，新人形机器人即将亮相！

智元机器人发布通用基座大模型GO-1，新人形机器人亮相在即

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.