ITBear旗下自媒体矩阵:

商汤绝影R-UniAD技术:自动驾驶能否迈向超越人类的新篇章?

   时间:2025-02-24 22:52:12 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在近期于上海盛大举行的2025GDC全球开发者先锋大会上,科技领域的众多领军企业纷纷亮出了他们的最新研发成果,旨在探索大模型产业化的有效路径,加速应用场景的落地,并构建可持续的商业生态。

尤为引人注目的是,商汤绝影在此次大会上推出了业界首个“与世界模型协同交互的端到端自动驾驶方案R-UniAD”。该方案通过构建一个能够生成在线交互仿真环境的世界模型,以此作为强化学习训练的“试验场”,为自动驾驶技术开辟了新的道路。

在商汤大模型生产力论坛上,商汤绝影的首席执行官、商汤科技联合创始人及首席科学家王晓刚分享了他的见解:“算法、算力与数据的深度融合,正驱动着人工智能技术不断向前发展。随着强化学习等先进算法被引入大模型训练并取得显著成效,我们正见证着新的尺度定律的诞生,数据价值被前所未有的挖掘,模型的能力边界也在不断拓展。”

R-UniAD方案的推出,与近期备受市场瞩目的DeepSeek技术创新理念不谋而合,即从模仿学习向强化学习迈进,以期在端到端自动驾驶领域实现超越人类的驾驶水平。

模仿学习与强化学习各有千秋。以AI下棋为例,模仿学习如同照着棋谱按部就班,而强化学习则是让AI在遵守规则的前提下自由探索,通过不断试错与奖励机制,最终摸索出最优策略。

在自动驾驶领域,模仿学习依赖海量高质量的人类驾驶数据,力求达到最佳的“模仿”效果。然而,这种方法虽能接近人类驾驶水平,却难以突破其上限。加之高质量场景数据的稀缺性和数据质量的参差不齐,端到端智能驾驶方案要达到人类驾驶的最高水平绝非易事。

人工智能领域同样面临着数据红利消退的挑战,大模型性能的提升日益依赖于算力的扩张和模型参数的增加,这导致了一些人开始质疑尺度定律的有效性。而DeepSeek的R1模型通过少量高质量数据的冷启动和多阶段强化学习训练,成功降低了大模型训练的数据门槛,延续了尺度定律,为模型性能的进一步提升铺平了道路。

强化学习的优势在于,它能够使大模型自发地涌现出长思维链能力,显著提升推理效果,甚至可能具备超越人类的思维能力。王晓刚表示,这一技术路线同样适用于端到端自动驾驶算法的训练与研发。

R-UniAD方案正是基于强化学习的理念,首先利用高质量数据进行冷启动,通过模仿学习训练出一个基础模型,再进一步通过强化学习进行精炼。据测算,这种小样本多阶段学习的技术路线能够显著降低端到端自动驾驶的数据需求,为车企合作伙伴提供了超越特斯拉FSD的潜在机会。

从性能上限来看,纯强化学习训练不仅能够提升端到端智能驾驶模型的性能,还能够充分探索多元场景和驾驶风格。未来,端到端智能驾驶的体验将不再局限于“类人”,而是有望超越人类的驾驶表现。

在大会现场,商汤绝影展示了端到端算法与世界模型仿真环境的实时交互能力。为了实现这一目标,商汤绝影还发布了行业标杆级别的世界模型——“开悟”。基于“开悟”,单个GPU产生的仿真数据效果相当于500台量产车的数据采集量,实车采集的真实数据与云端生成的仿真数据在“车云一体”的新范式下实现闭环流转,使得端到端智能驾驶系统的训练更加全面、高效,显著缩短了研发周期,降低了成本。

在2024年北京车展上,商汤绝影已经展示了UniAD的实车上路成果。而在即将到来的2025年4月上海车展上,商汤绝影的R-UniAD端到端自动驾驶方案也将正式发布,并完成实车部署,标志着自动驾驶技术迈向了新的里程碑。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version