ITBear旗下自媒体矩阵:

灵初智能Psi R0:强化学习赋能,双灵巧手挑战长程任务

   时间:2024-12-30 15:37:23 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

灵初智能在近期正式揭晓了其最新研发成果——基于强化学习(RL)技术的端到端具身模型Psi R0。这款模型在双灵巧手的协同操作上实现了突破,能够串联并混合训练多种技能,生成具备逻辑推理能力的智能体,从而成功完成一系列复杂的、长距离的灵巧操作任务。

Psi R0不仅具备出色的操作技能,还展现出了跨物品和跨场景的泛化能力。在电商场景中,商品打包是一个典型的长流程任务,需要对成千上万件商品进行抓取、扫码、放置以及塑料袋打结等一系列操作。令人惊叹的是,Psi R0凭借其双灵巧手,能够流畅地完成这一系列繁琐的步骤,据官方介绍,这一表现足以替代一个完整的工作岗位。

灵初智能透露,Psi R0模型利用了海量的仿真数据进行训练,通过双向训练框架将多种技能串联起来,率先在开放环境中完成了长程任务。该模型展现出了强大的泛化能力和鲁棒性,能够在不同的环境和条件下稳定工作。

为了实现这一目标,灵初智能开发了一种独特的技能训练框架。该框架从物体的时空轨迹中提取关键信息,构建出通用的目标函数,从而解决了奖励函数设计困难的问题。在后训练阶段,通过引入少量的高质量真实机器数据,进一步提升了长程任务的成功率。

双向训练框架中的转移可行性函数在技能串联过程中起到了至关重要的作用。该函数能够微调技能,提高串联的成功率和泛化性,同时赋予模型自主切换技能的能力。当遇到操作失败时,Psi R0能够迅速调整策略,确保任务的高成功率。

这一创新不仅展示了灵初智能在强化学习领域的技术实力,也为机器人技术的发展开辟了新的方向。Psi R0的成功应用,预示着未来机器人在长程灵巧操作任务中将发挥更加重要的作用,为工业自动化和智能化进程注入新的动力。

Psi R0的出色表现也离不开其背后的算法和数据处理技术的支持。灵初智能在算法优化和数据处理方面投入了大量的研发资源,确保了Psi R0能够在各种复杂环境中稳定工作,并展现出卓越的性能。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version