广州车展上,智能驾驶技术迎来了新的里程碑。多家车企纷纷亮出自家的端到端智能驾驶方案,标志着智能驾驶技术进入了一个全新的发展阶段。
其中,小鹏汽车宣布将推送基于端到端大模型的XNGP智能驾驶系统,该系统覆盖从高速到城市道路的全场景。小米汽车也展示了其端到端智能驾驶测试实况,并预告将在12月推出“车位到车位”全场景智驾先锋版。而长城汽车则基于端到端智驾大模型SEE,宣布其全场景NOA在全国范围内开放。
这一系列发布表明,端到端智能驾驶已成为智能驾驶领域的共识,并被各大车企高度重视,投入大量资源进行研发。这一趋势的背后,是人们对人工智能实际应用需求的迫切,以及汽车作为人工智能落地最佳平台的共识。
汽车配备了众多传感器,拥有庞大的用户群体和丰富的运行数据,使得汽车成为大型模型介入现实世界的理想媒介。随着技术的演进,人们普遍认为,人工智能的下一步发展将聚焦于具身智能,而汽车本身就是一种具身智能的体现。
在这一背景下,理想汽车凭借其在智能驾驶领域的创新,迅速崛起,成为智能驾驶的第一梯队成员。在广州车展上,理想展示了其全新一代智能驾驶技术架构——端到端+VLM双系统,并宣布OTA 6.5版本车机系统将于11月底正式推送。该系统新增了“车位到车位”智能驾驶、全国高速收费站ETC通行功能以及后向自动紧急制动等功能。
理想发布的端到端+VLM智驾技术效果惊艳,成为行业首个全量推送车位到车位的智能驾驶系统,引发了整个智能驾驶行业的广泛关注。通过端到端的智能驾驶系统,车辆能够在复杂的交通环境中实现自主驾驶,从起点车位到终点车位全程无需人工干预。而VLM技术的加入,使得理想汽车的智驾系统更加智能和高效,能够更好地理解和处理复杂的交通场景,做出更加准确和及时的驾驶决策。
理想汽车的这一创新,得益于其对智能驾驶第一性的深刻洞察。理想公司认为,智能驾驶系统需要满足两个基本条件:确保安全和提供便利性,减少人为干预。基于这两个条件,理想公司进一步认识到,智能驾驶能力发展的首要任务是为智能驾驶系统配备一个能够确保安全并迅速根据用户意图做出决策的大脑,利用这个大脑来指挥和协调智能驾驶系统中的各个子系统,以实现最佳的驾驶体验和效率。
为了实现这一目标,理想汽车精心设计了一套端到端的智能驾驶模型和能力,并逐步替代了传统的规则指定和人工标注方法。通过大量的数据训练和学习,人工智能系统能够自主地理解和学习真实世界的各种情况,成为智能驾驶动作的执行者。同时,理想汽车在业内率先提出了在端到端模型的基础上增加一个视觉语言模型(VLM)的匹配,作为整个智能驾驶系统的核心思维中枢。
在智能驾驶过程中,任何需要做出决策的场景,端到端系统都会向VLM提出相关问题,并根据VLM提供的答案来执行相应的操作。这一创新模拟了人类的思维过程,使得驾驶体验越来越顺畅和自然。理想汽车的核心目标是让这个VLM模型的思维尽可能地贴近用户的需求。
为了对端到端+VLM进行测试和训练,理想汽车还构建了一个世界模型,能够尽可能真实地模拟现实世界的各种情况。通过这种方式,端到端的智能驾驶模型以及结合视觉语言模型(VLM)的智驾系统可以在一个虚拟环境中接受各种复杂场景的训练,极大地加速了系统的成熟过程。
理想汽车对智能驾驶第一性的深刻洞察,不仅体现在技术创新上,还体现在其对研发投入的坚定决心上。理想汽车董事长兼CEO李想表示,未来三到五年,最大的变量来自人工智能,包括基于真正的人工智能的智能驾驶和基于人工智能的智能助手,这将给消费者带来全新的体验。
理想汽车在研发上的投入巨大,2024年前三季度,研发费用累计达到86.6亿元,同比增长22.1%。近一年来,理想汽车累计研发投入超过120亿元。这样的投入使得理想汽车的智能驾驶能力得到了快速提升。
在数据、算力和算法方面,理想汽车也做了自己的设计和优化。其全栈自研的“端到端+VLM(视觉语言模型)”的新一代智驾方案以每周2至3个版本的速度快速迭代,模型训练数据规模从100万clips提升至500万clips,平均接管里程翻了约3.5倍。理想汽车智能驾驶训练里程已经达到26.7亿公里,用户NOA总里程达到14.4亿公里,累计使用智能泊车功能超过6417万次。
理想汽车在智能驾驶领域的崛起,不仅得益于其技术创新和研发投入,更得益于其对智能驾驶第一性的深刻洞察。这种洞察使得理想汽车能够找到智能驾驶的真正核心问题,并围绕这一问题进行技术创新和投入,从而实现了在智能驾驶领域的后来居上。