ITBear旗下自媒体矩阵:

自动驾驶新赛道:端到端技术,究竟在比拼什么?

   时间:2024-12-05 10:27:51 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

特斯拉近日宣布其“完全自动驾驶”软件FSD迎来了最新版本V13.2,并已顺利完成首批用户交付。此次更新亮点纷呈,新增了停车启动、自动换挡以及目的地自动泊车等功能,进一步提升了用户体验。特斯拉自动驾驶工程师Arek Sredzki强调,新系统的端到端网络如今能够直接将乘客从一个停车位安全送达至另一个,实现了P2P(点到点)的无缝衔接。

特斯拉FSD的每次重大更新,总是能迅速吸引国内外智能驾驶领域的广泛关注。年初,特斯拉推送FSD V12测试版时,就将城市街道驾驶的软件栈革新为单一的端到端神经网络,这一变革如同在平静的水面投下了一颗巨石,不仅在美国本土引起了轩然大波,也在遥远的中国掀起了一股端到端技术的热潮。

当前,众多致力于在自动驾驶领域拔得头筹的汽车制造商和智能驾驶供应商,纷纷将端到端技术置于其宣传的核心位置。2024年,多家车企和智能驾驶供应商宣称自己已进入“智驾第一梯队”,尽管技术和产品能力各异,但端到端技术无一例外地成为了他们的关键词。

端到端技术究竟有何魔力,又隐藏着哪些不为人知的秘密呢?从根本上看,端到端与传统自动驾驶算法的主要区别在于系统架构和数据处理方式。传统算法采用模块化部署,将感知、预测、规划和控制等功能分割为独立模块,虽然结构清晰,但容易导致误差累积和信息丢失。而端到端架构则将整个驾驶过程视为一个整体,通过统一的神经网络模型,直接从传感器数据映射到车辆控制指令,不仅简化了系统结构,还显著提高了整体性和稳定性。

在实践过程中,行业内部对于端到端的路径选择出现了分歧,主要分为一体化端到端(One Model)和分段式端到端(模块化端到端)两种方案。一体化端到端从感知到预测规划无缝衔接,确保了信息的完整传递,系统响应速度更快,但调试难度较大。分段式端到端则将感知和决策规划分开,并在中间嵌入人工接口,以实现更灵活和可扩展的系统设计,但可能面临信息损失和全局最优性问题。

为了进一步提升端到端系统决策的准确性和灵活性,行业普遍采用端到端+VLM(视觉语言模型)架构。在这种架构下,端到端系统负责处理感知、决策和执行的全过程,而VLM作为辅助系统,提供对复杂交通场景的理解和语义解析。例如,理想汽车的端到端与VLM相结合的双系统架构方案,就基于人类两套思维系统理论,旨在赋予车端模型更高的性能上限和发展潜力。

不过,许多专家认为,端到端+VLA(视觉语言动作模型)将是端到端+VLM的下一个发展阶段。VLA将端到端系统与多模态大模型更彻底地结合,形成一个统一的模型框架,能够更全面地理解和响应复杂的驾驶环境。元戎启行CEO周光表示,从VLM到VLA的进步,就像是从有人指导的初学者变成了经验丰富的老手直接操作,后者更为先进且可靠。

然而,端到端技术的落地并非易事,其中最大的挑战之一是对数据的高要求。商汤绝影指出,端到端智驾模型对于高质量数据的需求呈指数级增长,但目前受限于高阶智驾的量产规模、算力资源,高质量驾驶数据的获取难度大、效率低、成本高。为此,商汤绝影发布了“开悟”世界模型,以满足端到端模型训练和仿真对于数据质量的高要求。

蔚来也在今年的创新科技日上发布了其智能驾驶世界模型NWM,该模型能够在短时间内推演出多种可能发生的场景,并找到最优决策。理想汽车则运用云端世界模型对其快慢双系统进行能力的训练和测试,以加速系统的迭代升级。

尽管端到端技术的研发面临诸多困难,但众多企业仍在积极寻求解决方案。奇瑞汽车副总经理兼大卓智能CEO谷俊丽表示,面对越来越大的AI模型,企业需要强大的数据、云计算以及顶级AI科学家的支持。奇瑞推出的智驾大模型,也是通过云端世界模型生成丰富场景,预计将在未来几年内实现两段式和一段式端到端方案的量产上车。

随着端到端技术的不断发展和完善,它将进一步推动上游工具链、芯片等技术的加速发展,并提升数据和AI人才的重要性。然而,关于端到端是否就是自动驾驶的终极方案,行业内仍存在不同看法。但可以预见的是,这一轮端到端的技术竞争,将推动整个行业向更加智能化、高效化的方向发展。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version