在2024年11月27日的商汤绝影AI DAY活动中,商汤绝影CEO、商汤科技联合创始人及首席科学家王晓刚接受了媒体采访,就自动驾驶行业的盈利前景和技术发展路径发表了独到见解。
王晓刚表示,自动驾驶行业距离实现盈亏平衡还需大约三年时间,关键在于自动驾驶车辆的规模化应用,需要达到百万级的数量来支撑业务的发展。他提到,这一预测基于两个核心要素:一是市场需求的增长,整车企业推出的车型项目日益增多;二是成本控制,通过创新的合作模式和高性价比的交付方式,以及新技术和新产品的开发,来实现更有效的资源利用。
王晓刚认为,当前自动驾驶市场的竞争态势和亏损现状并不合理,同质化竞争严重阻碍了行业和智能驾驶领域的健康发展。他强调,要打破这一局面,必须避免同质化竞争,开发既有用户价值又具备特色功能的产品,从产品设计和技术发展路线上找到独特的路线和价值。
在当天的发布会上,商汤绝影推出了三款新产品,分别针对智能座舱、智能驾驶和世界模型领域。在智能座舱方面,商汤绝影发布了名为“A New Member For U”的智舱座舱大模型创新产品。王晓刚介绍,这款产品与市面上其他大模型的使用存在本质区别,背后有多项新技术的支撑,旨在提升用户体验。它依靠前沿的AI大模型技术,如原生流式多模态大模型、车载类人记忆框架和持续运行框架,能够感知用户的语音、表情、手势及环境数据,并进行深度理解和推理思考,从而在车内空间与用户进行主动互动。
在智能驾驶领域,商汤绝影构建了“车云一体”的产品矩阵,发布了涵盖高速、城区及泊车等全场景的高阶智能驾驶和端到端智能驾驶产品体系。基于不同的算力平台,如J6E、J6M、Orin等,商汤绝影打造了全场景高阶智能驾驶和端到端智能驾驶等量产智能驾驶产品体系。其中,基于J6平台的智能驾驶方案预计将于2025年第二季度量产交付,而量产端到端智能驾驶方案则预计将在明年年底量产落地。
在世界模型方面,商汤科技全新升级了“开悟”世界模型,以此打造坚实的数据基础设施。该模型的基础与核心能力在于生成高质量视频数据,官方数据显示,在真实的基础上,“开悟”生成的场景视频时间最长可达150秒,分辨率可达1080P,视角可实现11V。通过多模态大模型,“开悟”世界模型可以支持多样化的自动驾驶场景及Corner case的可控生成。目前,商汤绝影基于1024类场景,能够泛化出更多的平行世界,打造了千万级的生成场景库,预计将于2025年对行业开放。
王晓刚指出,自动驾驶行业已经进入AGI(通用人工智能)时代的前夜。作为加速智能汽车驶入AGI时代的战略合作伙伴,商汤绝影将牢牢把握智能汽车变革的时间窗口,与车企伙伴进行全方位深度合作,共享大算力与大模型,共建数据基础设施,共同打造智能汽车大模型创新应用。
王晓刚还指出,数据基础设施是比数据本身更为重要的竞争要素。有效的数据随着算法的变化而变化,存储最原始数据的成本高昂。因此,数据基础设施和数据管线至关重要。商汤绝影通过与奇瑞大卓、东风汽车等企业在智驾和智舱领域的战略合作,共享数据资源,实现了资源的节约和高效的协同。这种合作模式不仅降低了成本,还提高了数据生产和算法开发的效率。