智元机器人发布通用基座大模型GO-1，新人形机器人亮相在即

时间：2025-03-11 02:52:53 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在机器人技术领域的最新突破中，智元机器人公司正式揭晓了其首个通用具身基座模型——智元启元大模型Genie Operator-1（简称GO-1）。这一创新成果不仅标志着机器人在智能交互与执行任务能力上的重大飞跃，还预示着具身智能正加速向通用化、开放化与智能化迈进。

GO-1的核心在于其提出的Vision-Language-Latent-Action（ViLLA）框架，该框架融合了VLM（多模态大模型）与MoE（混合专家）技术。VLM作为模型的主干网络，借助互联网上的大规模纯文本和图文数据，赋予了GO-1强大的场景感知与理解能力。而MoE则通过隐动作专家模型和动作专家模型，利用人类操作和跨本体操作视频以及高质量的仿真和真机数据，使GO-1具备了动作的理解与精细执行能力。

智元机器人的这一创新成果，在多个方面展现出了卓越的性能。GO-1能够实现采训推一体化，无缝衔接数据采集、模型训练与推理过程。其小样本快速泛化能力，使得模型能够在极少数据甚至零样本的情况下，快速适应新场景与新任务。“一脑多形”的跨本体应用能力，让GO-1能够在不同机器人形态间灵活迁移，快速适配各种本体。

更为先进的是，GO-1具备持续进化的能力。借助智元的数据回流系统，模型能够从实际执行中遇到的问题数据中不断学习进化，不断提升自身性能。而人类视频学习能力，则让GO-1能够结合互联网视频和真实人类示范进行学习，进一步增强了对人类行为的理解。

在应用场景方面，GO-1同样展现出了广泛的适用性。通过ViLLA框架，GO-1能够将多相机视觉信号和人类语言指令直接转化为机器人的动作执行。无论是家庭场景中的准备餐食、收拾桌面，还是办公和商业场景中的接待访客、发放物品，GO-1都能轻松应对。甚至在一些更复杂的工业场景中，GO-1同样能够展现出卓越的操作能力。

在实际操作中，用户只需用日常语言向GO-1发出指令，如“挂衣服”，模型便能根据所学习的知识和数据，理解指令的含义和要求，并规划出执行步骤。从理解场景、拆解环节，到模拟操作、精准执行，GO-1都能展现出令人惊叹的智能水平。

GO-1的持续进化能力也为其在未来的应用中提供了无限可能。例如，当机器人在制作咖啡时不慎将杯子放歪，GO-1便能从这次失败中学习，不断优化自身操作，直到成功完成任务。这种不断学习和进步的能力，无疑将极大提升机器人在实际应用中的可靠性和稳定性。

智元启元大模型GO-1的发布，无疑为机器人技术的发展注入了新的活力。随着具身智能技术的不断进步和应用场景的不断拓展，我们有理由相信，未来的机器人将更加智能、更加灵活，能够更好地服务于人类的生活和工作。

具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

钛媒体APP了解到，网易有道之所以能够实现14B小参数垂类模型，是因为，在数据层面，新的模型技术收集并清洗了高质量的翻译语料数据，并由英语专业八级认证人员及职业译员进行精细化人工标注，使得模型拥有海量的优质…

近日，微软CEO纳德拉在采访中谈到为何微软不执着于自建基础模型。他表示微软是一家全栈系统公司，可以在OpenAI的基础上构建系统、工具和产品。此外，微软和OpenAI有长期稳定的商业合作关系，拥有相应的知识产…

了解了Manus产品本质，也就明白了其为何更多地面向海外用户——Manus使用的大模型未经备案。实际上，肖弘团队肯定是了解相关规定的，因为其之前开发的Monica插件也有类似遭遇。那么，也可以猜测将来M…

今日Monica联合创始人、首席科学家季逸超在社交平台透露，Manus使用了Claude大模型和不同的阿里千问大模型的微调模型开发。季逸超表示，“当我们构建Manus时，只有Claude 3.5 Sonne…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.