在英伟达GTC 2025技术大会上,理想汽车自动驾驶领域的领军人物贾鹏,向与会者展示了其最新的自动驾驶技术成果——MindVLA。这是一次深度的技术分享,主题名为《VLA:自动驾驶迈向物理智能体的关键跨越》。
MindVLA,一个集视觉、语言与行为于一体的先进大模型,代表了机器人大模型的新方向。它不仅融合了空间智能、语言智能与行为智能,还赋予模型卓越的3D空间理解能力、逻辑推理能力和行为生成能力。这种技术的突破,意味着自动驾驶系统不再仅仅是对环境的被动反应,而是能够感知、思考并主动适应环境,从而提供更加智能和人性化的驾驶体验。
贾鹏的演讲中,MindVLA被描绘为一个既能与用户进行顺畅沟通、理解用户意图的智能体,又能作为“听得懂、看得见、找得到”的专业司机,为乘客带来前所未有的驾驶与乘坐体验。这一技术的实现,标志着自动驾驶技术向更高层次的智能化迈进。
在更早前的2025年第一季度财报电话会议上,理想汽车的创始人兼CEO李想曾分享了他对自动驾驶技术的看法。他形象地比喻低阶自动驾驶如同昆虫或低等动物开车,而“端到端 + VLM”技术则类似猴子开车,仍需要人类的辅助。李想提到,理想汽车在2024年10月推出的“端到端 + VLM”智驾系统,并在今年1月通过OTA7.0更新实现了全城市覆盖的端到端功能,但他对此仍表示不满,认为“端到端”和“VLM”分别属于不同的脑系统,且功能尚不够强大。
李想进一步阐述了理想汽车的愿景,即成为AGI(人工智能通用智能体)时代的终端企业,就像手机时代的苹果一样。他预测,未来的AGI机器人将包括L4级别的自动驾驶空间机器人、与人合体增强能力的机器人以及人形机器人。这些机器人将像苹果设备一样,实现生态互联、功能互补,而理想汽车则希望像AGI终端机器人那样,具备全面的感知、决策、推理、执行及反馈能力。