【ITBEAR】Waymo,作为谷歌母公司Alphabet旗下的无人驾驶叫车部门,近日揭开了其最新人工智能研究模型的神秘面纱。这一新型端到端多模式模型被命名为EMMA,标志着自动驾驶技术领域的又一重要突破。
在详细阐述其AI方法和EMMA模型的新闻稿中,Waymo透露了未来研究模型的发展蓝图。值得注意的是,该公司明确指出,EMMA当前仍处于研究阶段,并未应用于实际运营车辆中。这一策略显示出Waymo对于技术研发的严谨态度。
与特斯拉的全自动驾驶(FSD)技术及其他端到端模型相比,EMMA模型呈现出一种新颖的替代方案。Waymo副总裁兼研究主管Drago Anguelov强调,EMMA的研究展示了多模态模型在自动驾驶中的强大潜力和相关性。他表达了对进一步探索多模态方法和组件如何构建更通用、更适应性的驾驶系统的乐观态度。
据Waymo介绍,EMMA模型的核心在于其能够利用基于Gemini语言模型的真实世界知识。这种端到端的方法最终将使自动驾驶汽车能够直接从传感器数据和实时驾驶场景中获取运行指令,从而极大地提升了自动驾驶的智能化水平。
Waymo还突出强调了大型语言模型(LLM)和视觉语言模型(VLM)在其技术架构中的关键作用,并将这一架构命名为Waymo基础模型。这一创新性的模型设计为自动驾驶技术的发展开辟了新的道路。
在阐述EMMA研究的细节时,Waymo提到了几个关键方面,包括端到端学习、统一语言空间以及思路链推理。这些技术元素的融合使得EMMA能够处理原始的摄像头输入和文本数据,生成各种驾驶输出,并通过自然语言文本表示非传感器输入和输出,从而最大限度地发挥了Gemini的世界知识。
尽管Waymo对EMMA模型的前景充满信心,但也有一些行业专家对大规模端到端模型提出了质疑。他们担心,在没有充分安全措施的情况下,使用生成式人工智能模型可能带来过高的风险。然而,Waymo强调,他们目前仍在研究阶段,并未计划将这一技术商业化。
在推动自动驾驶技术创新的同时,Waymo也在积极拓展其业务范围。该公司最近完成了56亿美元的融资,估值已攀升至超过450亿美元。同时,Waymo还在积极研发基于现代Ioniq 5的下一代自动驾驶汽车,并计划在佐治亚州的新工厂进行生产。这些举措充分展示了Waymo在自动驾驶领域的雄心壮志和坚定决心。