吉利汽车集团携手阶跃星辰,在技术创新领域迈出重要一步,共同宣布开源两款领先的多模态大模型——Step-Video-T2V视频生成模型与Step-Audio语音模型,此举标志着两家企业在人工智能技术研发上的深度合作。
据官方详细介绍,Step-Video-T2V视频生成模型在全球开源视频生成领域内展现出了卓越的实力,无论是参数量还是模型性能均处于领先地位。该模型凭借强大的技术支撑,能够直接生成分辨率为540P、包含204帧的高质量视频,为用户带来前所未有的视觉体验。
与此同时,阶跃Step-Audio语音模型作为业内首款产品级的开源语音交互模型,其表现同样令人瞩目。该模型具备高度智能化特点,能够根据不同的场景需求,灵活生成包含情绪、方言、语种、歌声及个性化风格的语音表达。在与用户的交互中,Step-Audio展现出了自然流畅、情商高的对话能力,极大地提升了用户体验。
阶跃Step-Audio还支持不同角色的音色克隆功能,这一创新技术使得模型能够模拟出多种角色的声音特征,进一步丰富了语音交互的多样性和趣味性。
在参数方面,阶跃Step-Video-T2V视频生成模型拥有高达300亿的参数量,这一庞大的参数规模为其强大的视频生成能力提供了坚实的基础。而Step-Audio语音模型则通过精细的模型设计和优化,实现了在语音交互领域的突破和创新。
此次开源的两款模型,不仅展示了阶跃星辰与吉利汽车集团在人工智能技术研发上的雄厚实力,也为相关行业提供了宝贵的技术资源和参考。未来,随着这两款模型的广泛应用和推广,相信将在视频生成和语音交互领域掀起新的技术浪潮。
阶跃星辰与吉利汽车集团的此次合作,也预示着双方在人工智能领域将展开更加深入和广泛的探索与合作。未来,双方将继续携手共进,共同推动人工智能技术的创新与发展,为人类社会带来更多的便利和惊喜。