滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

智元机器人发布通用基座大模型GO-1，新人形机器人即将亮相！

时间：2025-03-12 23:00:53 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在机器人技术的前沿探索中，一款名为智元启元大模型Genie Operator-1（简称GO-1）的创新成果近日由智元机器人公司正式发布。这一通用具身基座模型的问世，标志着机器人在理解指令、适应环境及执行任务方面迈出了重要一步。

GO-1的核心在于其提出的Vision-Language-Latent-Action（ViLLA）框架，该框架巧妙融合了VLM（多模态大模型）与MoE（混合专家）技术。这一组合不仅使GO-1拥有了从数据采集到模型推理的一体化能力，更赋予了它小样本快速泛化、“一脑多形”跨本体应用等独特优势。

GO-1的ViLLA框架通过VLM模型继承了开源多模态大模型的权重，并利用互联网上的大规模文本和图文数据，实现了对通用场景的理解。而MoE中的隐动作专家模型和动作专家模型，则分别通过人类操作视频和高质量仿真、真机数据，增强了模型的动作理解和执行能力。这种设计使得GO-1能够轻松应对多样化的环境和物体，快速学习并执行新操作。

智元机器人在构建GO-1时，采用了具身领域的数字金字塔结构。底层是互联网的大规模纯文本与图文数据，为机器人提供基础知识；中层是人类操作视频，帮助机器人学习动作模式；上层是仿真数据，用于增强泛化性；顶层则是高质量的真机示教数据，确保精准动作执行。这一结构让GO-1能够全面适应新场景，轻松面对各种挑战。

在实际应用中，GO-1展现出了惊人的能力。用户只需用日常语言向机器人发出指令，如“挂衣服”，GO-1便能迅速理解并执行。它首先根据画面和所学知识理解指令含义，然后参考人类操作视频规划动作步骤，接着通过仿真数据模拟操作过程，最后利用真机示教数据精准完成任务。这一过程流畅且高效，展现了GO-1在理解和执行指令方面的卓越能力。

GO-1的应用场景广泛，从家庭生活的倒水、烤吐司，到商务会议的拿饮料、拿苹果，再到活动现场的检票、发放物料，它都能轻松应对。GO-1还具备持续进化的能力。当机器人在执行任务中遇到问题时，如做咖啡时杯子放歪，它能够通过数据回流系统学习并改进，直到成功完成任务。

GO-1的成功发布，不仅为机器人技术的发展注入了新的活力，更为具身智能的通用化、开放化与智能化进程加速。它打破了机器人只能执行单一任务的局限，让机器人能够走向更多不同场景，适应多变的真实世界。随着技术的不断进步，我们有理由相信，未来的机器人将更加智能、更加灵活，为我们的生活带来更多便利和惊喜。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

DeepSeek与华为技术合作曝光，昇腾成国内唯一深度适配算力平台？

据自媒体闫跃龙，华为人士透露，早在2023年9月，DeepSeek就与华为进行了技术交流；去年7-9月份，DSV2在A2推理测试；今年2月初，在昇腾上工具化部署DS R1-Zero。目前来看，昇腾是国内算力…

03-12

成都糖酒会甜蜜启幕，6600家企业携AI新科技共赴盛宴！

03-12

AI盛会启幕在即，港股科技板块如何乘风破浪？

03-12

智元机器人发布通用基座大模型GO-1，新人形机器人即将亮相！

具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

03-12

法国三大协会联手起诉Meta，指控其用版权内容“盗窃式”训练AI

03-12

德壹机器人推出全能王AI理疗机器人，端侧大模型引领中医智能化新潮流

03-12

成都糖酒会即将启幕，6600家企业参展，AI设备专区首秀有多精彩？

03-12

智元发布具身基座大模型GO-1，新人形机器人即将亮相！

具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

03-12

AI新秀频出，大厂如何加速追赶AGI未来？

但在DeepSeek这个火爆全球的“鲶鱼”影响下，腾讯元宝抓住了腾飞的机遇，以后发先至的黑马姿态，从一众AI大模型APP中脱颖而出。这意味着，创新并非无缘之木，Manus的惊艳也是站在巨人的肩膀上，而面对…

03-12

智元机器人发布通用基座大模型GO-1，新人形机器人即将亮相！

具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

03-12

苹果M3 Ultra性能爆棚，DeepSeek测试竟超8张A100显卡？

03-12

北京创新发布：“慧思开物”引领具身智能平台新纪元

03-12

智元机器人发布通用基座大模型GO-1，新人形机器人亮相在即

具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

03-12

金种子酒透露：尚未采用DeepSeek，但将持续探索AI技术优化生产

03-12

九章云极DataCanvas团队突破！R1推理模型复现及强化学习新成果发布

03-12

点击查看更多 +

全站最新

大众2024财报：阵痛后能否一跃而起？

汽车经销商深陷价格战泥潭，八成面临价格倒挂，转型之路何在？

宝马全新R12巡航车北京首秀，强劲配置引期待！

春风25款450SR再升级，高颜值强动力，销量十几万，你还等什么？

杭州网友新车一天就急售，老人不会开成“烫手山芋”？

极氪9X光辉版首秀，国产豪车新标杆稳不稳？

热门内容

本栏最新

DeepSeek与华为技术合作曝光，昇腾成国内唯一深度适配算力平台？

成都糖酒会甜蜜启幕，6600家企业携AI新科技共赴盛宴！

AI盛会启幕在即，港股科技板块如何乘风破浪？

智元机器人发布通用基座大模型GO-1，新人形机器人即将亮相！

法国三大协会联手起诉Meta，指控其用版权内容“盗窃式”训练AI

德壹机器人推出全能王AI理疗机器人，端侧大模型引领中医智能化新潮流

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.