ITBear旗下自媒体矩阵:

智能驾驶竞赛升级,AI推理能力成新战场

   时间:2025-04-01 11:54:08 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

随着科技的飞速发展,智能驾驶领域的竞争态势正发生深刻变化。过去,行业内的焦点多集中在VLM(视觉-语言模型)与VLA(视觉-语言-动作模型)的较量、一段式与两段式方案的选择,以及有无图像辅助等维度。然而,从今年起,智能驾驶的竞争悄然迈入了一个更为深层次的阶段,算力集群与算法架构成为了新的角力场。

无论是智能驾驶、大型模型还是具身智能,其竞争的核心正逐渐从快速预训练响应转向慢速深度推理。在这场关于推理能力的隐形竞赛中,人工智能将不再仅仅依赖于迅速的模式匹配,而是具备了深入思考、解决复杂问题的能力。这标志着人工智能正迈向突破智能瓶颈的“奇点时刻”。

“推理”被视为人工智能发展的下半场,这一转变并非偶然。OpenAI的联合创始人伊利亚·苏茨克维尔在NeurIPS大会上明确指出,AI的预训练时代已接近尾声。他指出,当前数据资源的增长已不再是指数级,而计算能力仍在持续攀升。这意味着,必须重新评估和利用现有数据,提高推理效率。

推理,这一源自逻辑学的术语,是指系统根据已知前提,通过规则推导出新的结论或做出决策的能力。它反映了AI在模拟人类思维方面的进步。人类的推理基于已有知识(经验或教育)对新情况进行分析,例如“如果天空乌云密布,那么可能会下雨”。AI的运行过程与此类似,它模仿了人类和逻辑系统中“从已知信息得出未知结论”的过程。

推理要求系统不仅能识别模式,还能理解其背后的原因和逻辑。这是机器学习技术漫长而复杂演进过程中的最后一步,被视为人工智能的“顿悟”时刻。例如,学生在学习过程中,通过课堂学习、写作业等方式接受训练。而考试则要求学生利用所学知识分析解答新题目,这一过程便是推理。

在AI的下半场,推理之所以变得尤为重要,是因为随着应用场景的复杂化和多样化,简单的数据处理和分类已无法满足需求。在智能驾驶领域,系统不仅要识别行人、车辆和交通信号,还要理解它们之间的交互关系,预测未来行为,并据此做出安全、合理的驾驶决策。这都需要强大的推理能力来支撑。

巴克莱的一份报告预计,AI推理计算需求将快速增长,预计占通用人工智能总计算需求的70%以上,甚至可能超过训练计算需求,达到后者的4.5倍。作为AI技术应用的两大基石,训练和推理共同决定着AI的智能化水平。

在训练阶段,AI模型通过大量数据和算法学会识别和生成规律。模型参数在此过程中不断调整,以最小化预测与实际值之间的误差。而在推理阶段,训练好的模型被应用于新的、未见过的数据,利用先前学到的规律进行预测、分类或生成新内容。

今年,汽车行业的智能驾驶之战尤为激烈。比亚迪、吉利、奇瑞、广汽等主流车企纷纷发力,推出各自的智能驾驶方案。自2023年以来,智能驾驶行业掀起BEV、端到端技术浪潮,车企们正逐步将AI神经网络融入感知、规划、控制等环节。

在此过程中,VLA(视觉-语言-动作)模型逐渐崭露头角。VLA模型拥有更高的场景推理能力与泛化能力,对于智能驾驶技术的演进意义重大。从长远来看,在从L2级辅助驾驶向L4级自动驾驶的技术跃迁过程中,VLA有望成为关键跳板。

在NVIDIA GTC 2025大会上,理想汽车发布了新一代自动驾驶架构——MindVLA。它通过整合空间智能、语言智能和行为智能,赋予自动驾驶系统以3D空间理解能力、逻辑推理能力和行为生成能力,并计划于2026年量产应用。

VLA模型最早见于机器人行业,谷歌DeepMind推出的RT-2便是全球首个控制机器人的VLA模型。RT-2能够直接和用户进行语言交互,并在接收摄像头的原始数据和语言指令后,直接输出控制信号,完成各种复杂的操作和任务。

VLA在机器人领域的成功很快也应用到了智能驾驶领域。谷歌旗下自动驾驶公司Waymo推出的EMMA便是基于端到端的自动驾驶多模态模型。EMMA建立在多模态大语言模型Gemini之上,将原始摄像头传感器数据直接映射到各种特定于驾驶的输出中。

从VLM到VLA的进化,就像是从有人指导的初学者变成了经验丰富的老手直接操作。VLA通过统一的大模型架构,将感知、决策、执行无缝串联,形成“图像输入-语义理解-类人决策-动作输出”的闭环,同步提高了智能驾驶的上限和下限。

然而,VLA要想实现全面上车,还需解决数据与信息深度融合的问题。这要求车企的智驾团队具备强大的模型框架定义能力和快速迭代能力。在当前技术路线骤然升级的背景下,许多尚未发力端到端技术的车企将面临更高的门槛。

VLA还面临数据闭环的挑战。虽然大语言模型已经基于海量的互联网数据进行训练,但对于驾驶相关的视频数据、激光雷达点云和车辆状态等数据,并没有公开的海量数据可用。这就需要车企具备强大的数据闭环能力。

随着技术的不断进步,智能驾驶领域的竞争将更加激烈。新一轮的智驾格局洗牌正在酝酿,对于在技术和数据方面具有双重优势的车企来说,这将是一个巩固市场地位的良机。而未及时跟进的车企则可能面临更加严峻的挑战。在这场没有硝烟的战争中,唯有“卷对方向”的玩家才有可能脱颖而出。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version