近日,国内领先的人工智能企业商汤科技与知名汽车制造商携手,成功将行业首款原生流式多模态座舱产品推向市场,并通过OTA(在线升级)技术向用户推送了最新功能。
这款产品的诞生,标志着AI技术在汽车座舱领域的应用迈出了重要一步。早在两个月前,商汤科技就曾通过其AI汽车创新产品“你的家庭新成员”展示了其强大的AI能力。该产品能够敏锐地捕捉车内环境变化,如检测到后排孩子入睡时,会自动调整车内环境,如提升空调温度、降低音乐音量,并将驾驶模式切换至舒适状态。而这一切,都得益于其内置的原生流式多模态大模型。
现在,随着多模态舱外识别功能的量产上车,这款AI产品开始展现出对外部世界的认知与理解。据悉,它已具备前车识别、交通标志识别以及沿途风光识别三大AI能力。例如,在行驶过程中,若前方有三辆颜色分别为红、黄、蓝的汽车,用户询问“蓝色车辆是什么车”时,传统模型可能会误识别为中间的黄色车辆,而原生流式大模型则能准确识别出右前方的蓝色车辆,甚至能够识别出伪装车、无车标等特殊外观的车辆,通过尾灯、外形等特征进行品牌识别。
除了车辆识别外,这款AI产品还能在行驶过程中识别沿途的建筑物和景点,并提供详细的图文介绍,包括景点的历史典故、趣闻逸事等,极大地丰富了用户的驾驶体验。
商汤科技联合创始人、首席科学家王晓刚表示,原生流式多模态大模型能够同时处理文字、语音、视频等多种模态的信息,经过统一处理后输出相应的信息。这种交互方式非常自然且新颖,将成为直接接触用户的全新超级入口,而智能汽车则是这一超级入口的最佳落地场景。通过智能汽车内外常开的摄像头,用户可以实时与汽车进行多模态交互,同时,随着智能汽车保有量的不断增加,丰富的终端用户反馈和数据信息将为模型的迭代升级提供有力支持。