吉利汽车集团与其科技生态战略合作伙伴阶跃星辰,近日共同揭晓了一项重大合作成果:两款创新的阶跃Step系列多模态大模型将面向全球开发者开放源代码。这一举措标志着吉利在人工智能领域的又一重要突破。
据悉,这两款大模型分别是阶跃Step-Video-T2V和阶跃Step-Audio。前者被誉为全球参数量最大的开源视频生成模型,其强大的能力足以生成高质量、204帧、540P分辨率的视频内容。而后者,则是行业内首个达到产品级标准的开源语音交互模型,能够依据不同场景需求,灵活生成多样化的语音表达,实现与用户的高质量对话。
阶跃星辰与吉利的合作始于2023年,双方在预训练大模型、垂直领域应用、场景设计及工程开发等多个维度展开了深入合作。这一合作不仅显著提升了阶跃Step系列大模型的性能,还进一步巩固了吉利在智能科技领域的领先地位。
吉利研发人员透露,阶跃Step-Video-T2V模型凭借其庞大的参数量,为用户带来了前所未有的视频生成体验。而阶跃Step-Audio模型则通过精准的场景理解和个性化的语音生成,实现了与用户之间的自然对话,极大地提升了智能交互的体验。
吉利在智能科技领域的布局远不止于此。自2021年起,吉利便围绕芯片、软件操作系统、数据和卫星网等核心领域,构建了端到端的自研体系和生态联盟。2022年,吉利更是建成了全球首个“云、数、智”一体化的星睿智算中心,为智能驾驶和智能座舱等应用场景提供了强大的算力支持。
吉利在2023年发布了全球首个汽车行业全栈自研全场景AI大模型——星睿AI大模型,并获得了中国通信院的“4+级”行业最高评级。这一成就不仅彰显了吉利在AI技术方面的深厚积累,也为其后续的智能汽车全域AI技术体系奠定了坚实基础。
为了进一步提升智能汽车的交互体验,吉利还与DeepSeek进行了深度融合,对星睿车控FunctionCall大模型、汽车主动交互端侧大模型等进行了蒸馏训练。这一举措将使吉利智能汽车能够更精准地理解用户意图,准确调用车载接口,同时基于车内外场景主动分析用户潜在需求,为用户提供更加智能化、个性化的服务。