滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

智元机器人发布通用基座大模型GO-1，新人形机器人即将亮相！

时间：2025-03-10 20:53:17 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在人工智能领域迎来新突破之际，智元机器人公司震撼发布了其首个通用具身基座模型——智元启元大模型Genie Operator-1（简称GO-1）。这一创新成果不仅标志着机器人在理解和执行任务方面迈出了巨大一步，还预示着具身智能正加速向通用化、开放化与智能化转型。

GO-1的核心在于其提出的Vision-Language-Latent-Action（ViLLA）框架，该框架巧妙融合了VLM（多模态大模型）与MoE（混合专家）技术。VLM作为模型的主干网络，通过吸收互联网上的大规模纯文本和图文数据，赋予了GO-1强大的场景感知和理解能力。而MoE则进一步增强了模型的动作规划和执行能力，使其能够精准地响应各种指令。

尤为GO-1展现了卓越的小样本快速泛化能力。这意味着，即便在数据稀缺甚至零样本的情况下，GO-1也能迅速适应新场景和新任务。“一脑多形”的特性使其能够在不同机器人形态之间灵活迁移，实现跨本体的快速适配。

为了更直观地理解GO-1的工作原理，我们可以想象这样一个场景：当用户以日常对话的方式向机器人发出“挂衣服”的指令时，GO-1会立即启动其复杂的处理流程。首先，它会利用VLM理解“挂衣服”在当前情境下的具体含义和要求。接着，MoE中的隐动作专家模型会调用互联网上的大规模人类操作和跨本体视频数据，规划出挂衣服的步骤。然后，通过仿真数据和真机数据的支持，动作专家模型会精确执行这些步骤，最终完成任务。

GO-1的广泛应用潜力同样不容小觑。从家庭场景中的准备餐食、收拾桌面，到办公和商业场景中的接待访客、发放物品，再到工业等更多领域的复杂操作任务，GO-1都能迅速胜任。这得益于其背后强大的数字金字塔架构，该架构从互联网的大规模纯文本与图文数据出发，逐步吸纳人类操作视频、仿真数据和真机示教数据，为机器人提供了全面的“基础教育”和“能力培训”。

在实际应用中，GO-1的表现同样令人瞩目。无论是早上为用户倒水、烤吐司，还是在商务会议中快速响应拿饮料、拿苹果的指令，GO-1都能游刃有余地完成。更令人兴奋的是，GO-1还具备持续进化的能力。当机器人在执行任务中遇到问题时，如做咖啡时不小心将杯子放歪，它能够通过数据回流系统不断学习并改进，直至成功完成任务。

智元机器人的这一创新成果，无疑为具身智能的发展注入了强劲动力。随着GO-1的广泛应用和持续改进，我们有理由相信，未来的机器人将更加智能、灵活和适应多变的环境。它们将不再局限于单一任务或封闭环境，而是能够迅速适应各种新场景和新任务，成为人类工作和生活中的得力助手。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

Manus合规疑云：中国团队打造AI产品如何跨越备案门槛？

了解了Manus产品本质，也就明白了其为何更多地面向海外用户——Manus使用的大模型未经备案。实际上，肖弘团队肯定是了解相关规定的，因为其之前开发的Monica插件也有类似遭遇。那么，也可以猜测将来M…

03-10

智元机器人发布通用基座大模型GO-1，新人形机器人亮相在即

具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

03-10

Manus背后的技术揭秘：季逸超透露产品融合Claude与阿里千问模型

今日Monica联合创始人、首席科学家季逸超在社交平台透露，Manus使用了Claude大模型和不同的阿里千问大模型的微调模型开发。季逸超表示，“当我们构建Manus时，只有Claude 3.5 Sonne…

03-10

AI赋能直播，“交个朋友”00后主播单日狂揽3.3亿销售额！

03-10

番茄小说AI风波：作者生态失衡与IP商业化之路探索

其中IP是凭借内容厚度来对抗周期，典型莫过于阅文旗下逐个被开发的老作品，而AI与短剧则是乘着时代的东风，以效率为核心命题。这一点我们也能自两者的变化中寻到端倪：随着阅文于去年收缩战线，推动去渠道化，意味着其…

03-10

字节跳动豆包团队开源MoE技术，大模型训练效率飙升1.7倍

03-10

国产芯片拥抱QwQ-32B，推理模型新宠儿能否超越DeepSeek-R1？

在一系列权威基准测试中，千问QwQ-32B 模型几乎完全超越了OpenAI-o1-mini，比肩最强开源推理模型DeepSeek-R1：在测试数学能力的AIME24评测集上，以及评估代码能力的LiveCod…

03-10

字节豆包大模型团队开源MoE优化技术，大模型训练成本直降40%！

字节豆包大模型团队官宣开源一项针对MoE架构的关键优化技术，可将大模型训练效率提升1.7倍，成本节省40%。据悉，该技术已实际应用于字节的万卡集群训练，累计帮助节省了数百万GPU小时训练算力。…

03-10

智元机器人发布大模型，产业链“隐形冠军”浮出水面

03-10

字节豆包大模型团队开源MoE优化技术，训练效率翻倍，成本直降四成

03-10

字节“筋斗云计划”启航，招募全球顶尖技术实习生共探前沿课题

03-10

中国信通院新动向：多模态智能体技术规范编制工作正式启动

03-10

字节跳动“筋斗云计划”启航，招募全球顶尖技术在校生共探未来！

03-10

智元机器人发布通用基座大模型GO-1，新人形机器人即将亮相！

具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

03-10

Rokid AR眼镜再进化，多款AI大模型加持，可自定义配置新体验

03-10

点击查看更多 +

全站最新

大厂反996新招：大疆强制9点下班，美的海尔力推双休，员工福音来了？

荣威飞凡、MG：以技术平权引领汽车行业新风尚

铂智3X福州上市，14万级激光雷达高阶智驾新选择！

小鹏汽车何小鹏：自动驾驶迈向L3，飞行汽车万亿市场待掘

星纪元ES增程版上市，售15.28-20.98万，搭载猎鹰智驾系统续航破千

上汽大众途昂Pro上市，搭载国产五代EA888，智能化升级性价比凸显！

热门内容

本栏最新

智元机器人发布通用基座大模型GO-1，新人形机器人即将亮相！

Manus背后的技术揭秘：季逸超透露产品融合Claude与阿里千问模型

智元机器人发布通用基座大模型GO-1，新人形机器人亮相在即

AI赋能直播，“交个朋友”00后主播单日狂揽3.3亿销售额！

番茄小说AI风波：作者生态失衡与IP商业化之路探索

字节跳动豆包团队开源MoE技术，大模型训练效率飙升1.7倍

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.