ITBear旗下自媒体矩阵:

商汤绝影R-UniAD:端到端自动驾驶新突破,上海车展见证实车部署

   时间:2025-02-22 17:47:41 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在自动驾驶技术的探索之路上,以模仿学习为主导的端到端技术正面临前所未有的挑战。尽管特斯拉凭借其庞大的车队规模和强大的算力,已经在该领域建立了显著的基础设施优势,但技术的瓶颈依然显著。

这一困境与人工智能领域的整体发展轨迹不谋而合。随着互联网数据资源的日益枯竭,大模型性能的提升越来越依赖于算力的扩张和模型参数的增加。一些人甚至开始质疑尺度定律的有效性,认为人工智能的发展已经陷入了一场算力的军备竞赛。

然而,在今年的春节期间,DeepSeek-R1项目通过纯强化学习的创新方法,为这一困境带来了新的曙光。该项目利用少量高质量数据进行冷启动,随后通过多阶段的强化学习训练,有效降低了大模型训练的数据门槛,同时也延续了尺度定律的有效性。更重要的是,强化学习使大模型具备了长思维链能力,显著提升了推理效果,甚至有望超越人类的思维能力。

在此背景下,王晓刚提出,基于强化学习的大模型技术路线完全有可能应用于端到端自动驾驶算法的训练与研发中。这一观点为自动驾驶技术的发展开辟了新的思路。

商汤绝影作为专注于汽车行业的AI公司,率先提出了“与世界模型协同交互的端到端技术路线”R-UniAD。该技术路线通过多阶段强化学习,大幅降低了端到端自动驾驶的数据规模门槛。具体而言,R-UniAD首先利用高质量数据进行冷启动,通过模仿学习训练出一个基础模型,然后在此基础上进行强化学习训练。据测算,这一技术路线有望使端到端自动驾驶的数据需求降低一个数量级,为车企合作伙伴提供了超越特斯拉FSD的可能性。

从技术上限来看,纯强化学习训练不仅提升了端到端智驾模型的性能,还使其能够充分探索多元场景和驾驶风格。未来,端到端智驾体验的上限将不再局限于“类人”,而是有望超越人类的驾驶表现。

商汤绝影的R-UniAD技术路线分为三个阶段:首先是依靠冷启动数据进行模仿学习,训练出云端的端到端自动驾驶大模型;然后基于强化学习,让云端大模型与世界模型进行协同交互,持续提升性能;最后通过高效蒸馏的方式,实现高性能端到端自动驾驶小模型的车端部署。这一过程中,与世界模型的在线交互和闭环奖励反馈是关键所在。

为了支持R-UniAD技术的实施,商汤绝影全新升级并发布了行业标杆级别的世界模型——“开悟”。该模型具备生成高质量视频数据的能力,基于“开悟”,单个GPU产生的仿真数据效果相当于500台量产车的数据采集效果。通过实车采集的真实数据和云端生成的仿真数据的闭环流转,使得端到端智驾系统的训练更加全面、高效,大幅缩短了研发周期,降低了成本。

在现场演示中,商汤绝影展示了“开悟”世界模型与主车的闭环交互方式。通过导入场景库文件,世界模型能够自动生成主车视角下的传感器仿真数据,并与端到端模型进行实时交互,实现数据的刷新和渲染。这一演示充分展示了R-UniAD技术的可行性和先进性。

据悉,商汤绝影的量产端到端智驾方案预计将在年底交付,而“开悟”世界模型也已正式用于数据生产。在即将到来的上海车展上,商汤绝影将展示“与世界模型协同交互的端到端自动驾驶方案”的实车部署。依托商汤大装置的算力基础设施,商汤绝影致力于助力车企合作伙伴,基于更小数量级的数据,超越特斯拉的自动驾驶方案,加速智能汽车驶向更加智能的未来。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version