在近期举办的2024理想AI TALK活动中,理想汽车的首席执行官李想分享了他对人工智能与自动驾驶技术的独到见解。他透露,理想汽车将于12月31日正式推送全新的OTA7.0升级,此次升级的核心亮点在于高速城市全场景智能驾驶的端到端技术升级,以及VLM(视觉语言模型)的引入。
对于此次技术迭代,周光在之前的专访中使用了生动的比喻来解释。他将“端到端+VLM”模型比作是教练指导学员开车,教练通过语言指令来引导学员,但这种方式可能会因为沟通不及时而出现误差。相比之下,VLA(视觉语言行动)模型则更像是教练亲自驾驶,更加熟练和高效。VLA模型通过将VLM与端到端智能驾驶模块整合,直接接收传感器数据并输出驾驶轨迹给控制系统,实现了智能驾驶的进一步优化。
周光还强调,VLA模型的成功不仅依赖于强大的算力支持,如英伟达Thor芯片,还需要大量的数据积累。他指出,一个智能驾驶公司至少需要交付上万辆汽车才能进行端到端1.0(即“端到端+VLM”)的迭代,而要实现VLA架构的模块,则需要至少10万辆级的量产车数据。
在量产车规模方面,元戎启行已经取得了显著的进展。截至目前,他们搭载的量产车数量已超过3万台,仅在12月,全新蓝山的销量就达到了8057辆,同比增长高达214.24%。元戎启行还在与多个量产项目合作,预计年底前至少会有三款搭载其智能驾驶系统的车辆进入市场。
对于VLA模型的前景,周光充满信心。他认为,VLA模型将赋予智能驾驶系统更长时间的推理能力和更强的可解释性,这将是一次显著的性能提升。同时,商汤绝影的首席执行官王晓刚也对VLA技术表示了认可,但他也指出,端到端技术的发展还需要经历一个逐步成熟的过程,包括基础设施的完善、数据的积累与仿真等。
值得注意的是,VLA模型与传统的通过制定规则训练的模型有着本质的区别。VLA模型的内核是AI神经网络,这使得它具有更强的AI属性和更高的性能天花板。多位业内人士都认为,VLA模型将是未来智能驾驶发展的大方向。
随着2025年的到来,汽车行业正迎来“智能化”竞争的下半场。无论是理想汽车的端到端+VLM、元戎启行的VLA,还是小鹏、商汤等企业,都已经在智能驾驶领域明确了技术路线和布局。对于那些未能赢在起跑线的企业来说,他们正面临着更加紧迫的挑战,需要加快步伐,以争取在激烈的市场竞争中占据一席之地。