ITBear旗下自媒体矩阵:

具身智能的谨慎豪赌:下注端到端,胜算几何?

   时间:2024-10-09 03:21:03 来源:ITBEAR作者:钟景轩编辑:瑞雪 发表评论无障碍通道

然而,尽管人形机器人在形态和操作上具有优势,但要实现真正的智能,还需解决软件与硬件的耦合问题。为实现这一目标,具身智能领域的不同团队采取了多样化的技术路线,其中端到端架构和分层决策模型是最为突出的两种。

端到端架构,作为一种将“大脑”和“小脑”合为一体的方法,通过单一的神经网络,直接将任务目标转化为控制信号。特斯拉的Optimus机器人和谷歌的RT-2项目便是这一架构的典型代表。它们能够通过视觉输入直接生成动作输出,完成复杂的任务。然而,端到端模型需要大量的数据和算力来驱动,这使得其在实际应用中面临挑战。

相比之下,分层决策模型则通过将感知、规划决策、控制和执行各模块分解为多个层级,分别进行训练,最终再整合起来。这种方法在即时性、可解释性和可控性方面具有优势,且由于可以逐一精准突破,在训练单个模型中所需的数据量相对较少。Figure AI的Figure 02便是这一架构的佼佼者,其高达200hz的输出频率意味着执行动作的延时极低。

在国内,分层决策模型也受到了广泛的关注。智元机器人、穹彻智能和银河通用等初创公司都选择了这一技术路线,并根据自己的理解设计出各自的解决方案。他们致力于解决“大小脑”问题,实现从感知到执行的闭环。

无论是端到端架构还是分层决策模型,数据都是训练效果的关键因素。具身智能玩家们需要共同面临数据质量和数量的挑战,以提高机器人的智能水平。模仿学习与强化学习、真实数据与仿真数据之间的优劣也成为了研究的热点。

在具身智能的较量中,不同的技术路线和解决方案层出不穷。从登月派到落地派,从端到端到分层决策,每一种方法都有其独特的优势和挑战。然而,无论选择哪条道路,实现智能、攻克软件与硬件的耦合都是最终的目标。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  网站留言  |  RSS订阅  |  违规举报  |  开放转载  |  滚动资讯  |  English Version