近期,科技界迎来了一则令人瞩目的消息:Figure公司宣布与Open AI的合作终止,并预告将在接下来的30天内推出一项人形机器人领域的创新技术。这一预告迅速引发了广泛的好奇与期待。
终于,Figure揭开了神秘面纱,推出了其自主研发的具身模型Helix,并将其首次应用于Figure机器人中。据Figure创始人兼CEO Brett Adcock介绍,搭载了Helix“大脑”的机器人,能够轻松拾取各种家庭物品。
在一则展示视频中,两台Figure机器人正协同工作,一台桌子和一台冰箱旁,它们将各种未见过的物品分类整理得井井有条,动作流畅且高效。尤其是两台机器人在传递物品时默契的对视,让众多网友惊叹不已,仿佛机器人拥有了某种意识。
这一切得益于Helix对机器人上半身的全控制,包括手腕、躯干、头部和各个手指,实现了高速率的连续控制。视频还罕见地展示了多机器人之间的协作,尽管这次的任务相对简单,但多机协作的交互和规划无疑是未来机器人技术的一个重要课题。
在具体任务执行上,Figure表示,只需向机器人发出指令,它便能拾起各种从未见过的家庭用品,如玩具、杯子等。这一能力得益于Helix强大的泛化能力。
Helix是一个集感知、语言理解和学习控制于一体的“视觉-语言-感知”(VLA)模型,实现了多项首创。它不仅能控制机器人上半身进行高速连续动作,还能实现多机器人协作,解决共享的远程操作任务。同时,只需按照自然语言提示,就能拿起几乎任何小型家居物品,包括数千种从未遇到过的物品。
更令人惊叹的是,Helix使用一组神经网络权重来学习所有行为,无需针对特定任务进行微调。这意味着,机器人能够灵活应对各种任务,无需进行额外的训练或编程。Helix还是首款完全在嵌入式低功耗GPU上运行的VLA,具备立即进行商业部署的条件。
在机器人上半身的控制上,Helix能以200Hz的频率协调35个自由度的动作空间,实现手指、手腕到头部的流畅高效动作。视频中,机器人用头部平稳地跟踪双手,同时调整躯干以获得最佳范围,同时保持精确的手指控制以抓握物品。这种程度的实施协调和多任务泛化能力,在此前的VLA中还未曾见过。
Figure还展示了Helix在高难度多智能体操作场景中的应用:两台Figure机器人之间协作实现零样本杂货存放。两台机器人采用相同的Helix模型权重进行操作,无需训练或分配角色,就能通过自然语言进行合作。这种能力使得机器人在非结构化环境中的部署成为可能。
Brett Adcock表示,团队花费了一年多的时间研发出了Helix,让人形机器人无需经过任何训练或代码,就能抓取几乎任何家庭用品。这一创新技术无疑为机器人领域带来了新的突破和可能性。