ITBear旗下自媒体矩阵:

苹果自动驾驶“修仙”路:10天模拟950年驾驶经验,成本仅36元/百万公里

   时间:2025-02-24 19:57:52 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

苹果在自动驾驶领域的最新研究引起了广泛关注。近日,该公司在其机器学习研究页面上发布了一篇论文,详细介绍了其在自动驾驶技术上的新突破。

这篇论文的核心在于提出了一个名为GIGAFLOW的大规模自博弈强化学习框架。该框架旨在通过模拟数十亿公里的驾驶数据,训练出通用且具备鲁棒性的驾驶策略,而且这一过程无需依赖真实世界的数据。

据论文介绍,GIGAFLOW能够在8块GPU上同时模拟3.84万个虚拟环境,每小时生成4.4亿次状态转换,相当于42年的驾驶经验。在短短10天内,通过这一自监督训练体系,即可完成16亿公里的训练,等效于约9500年的驾驶经验。

值得注意的是,GIGAFLOW的模拟环境设计虽然简洁,但通过大规模自博弈的方式,成功弥补了设计上的简化。在模拟环境中,每个智能体从随机位置出发,目标是到达地图中随机生成的目的地,途中需要经过若干个中间点。这样的设计使得智能体在训练过程中能够逐步学会复杂的驾驶行为,包括在拥堵路段执行“拉链式”并线、在环岛中协调通行等。

GIGAFLOW在成本控制方面也表现出色。据估算,每百万公里的模拟成本低于5美元(约合人民币36.1元),远低于同类强化学习方案。这一成本优势主要得益于GIGAFLOW在单节点上进行大规模并行环境模拟的能力,以及通过GPU加速的物理计算和动态状态压缩来降低内存占用和通信开销。

在基准测试中,GIGAFLOW策略的零样本泛化能力得到了验证。在CARLA、nuPlan和Waymax三个主流自动驾驶基准上,GIGAFLOW的策略均超越了特定于基准的专家模型,展现出强大的泛化能力。甚至在未针对任何特定基准进行微调的情况下,其表现仍优于那些专门为基准优化的模型。

进一步分析表明,GIGAFLOW策略在长期驾驶鲁棒性方面也表现出色。在降低动态噪声和提高控制频率的条件下,智能体平均可以连续驾驶1750万公里才发生一次事故,而美国人类驾驶者的平均事故发生率为每82.9万公里一次。这一结果充分证明了GIGAFLOW策略的有效性和鲁棒性。

尽管GIGAFLOW取得了显著的成果,但该项目团队也承认仍存在一些局限性。例如,纯模拟训练的策略尚未在现实世界中进行验证,因此其在实际应用中的表现仍然未知。研究还假设感知系统是完美的,但在现实中,传感器噪声和环境的不确定性可能会显著影响策略的表现。

尽管如此,苹果在自动驾驶领域的这一新突破仍然具有重要意义。它不仅展示了自博弈在自动驾驶领域的巨大潜力,还为未来的自动驾驶研究开辟了新的方向。这一研究也为其他多智能体协作领域提供了有益的启发。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version