吉利汽车集团与其科技生态战略合作伙伴阶跃星辰近日共同宣布了一项重大举措:将双方携手研发的阶跃Step系列多模态大模型向全球开发者全面开源。此次开源的两大模型,不仅在技术上实现了突破,更标志着中国在AI大模型领域向全球开源社区贡献的重要力量。
其中,阶跃Step-Video-T2V作为目前全球参数量最大、性能最优的开源视频生成模型,其参数量高达300亿。该模型能够直接生成204帧、分辨率为540P的高质量视频,这一技术成就无疑为视频生成领域树立了新的标杆。据阶跃星辰透露,经过严格的测评,Step-Video-T2V在各项性能指标上均表现出色,充分证明了其在开源视频生成大模型中的领先地位。
另一款开源模型阶跃Step-Audio,则是行业内首个达到产品级标准的开源语音交互大模型。它能够根据场景需求灵活调整情绪、方言、语种、歌声以及个性化风格,实现与用户的高质量自然对话。Step-Audio生成的语音不仅具有超自然的音质,还展现出高情商的对话能力,同时支持高质量的音色复刻。用户现在即可通过阶跃星辰推出的跃问App体验这一创新功能。
在阶跃Step系列大模型的研发过程中,吉利汽车集团与阶跃星辰展开了深入的合作。双方在算力算法、场景训练等领域实现了优势互补,共同推动了多模态大模型性能的大幅提升。阶跃星辰表示,此次开源的初衷是希望与全球开发者共享最新的多模态大模型技术成果,共同推动AI技术的发展。
阶跃星辰,这家成立于2023年的人工智能大模型公司,总部位于中国上海。由前微软全球副总裁姜大昕创办,阶跃星辰自成立以来便专注于AI大模型的研发和应用。在2024年3月,阶跃星辰成功发布了Step系列大模型,并在此基础上推出了两款AI应用产品:跃问和冒泡鸭。这些产品的推出,不仅丰富了阶跃星辰的产品线,也进一步展示了其在AI技术领域的创新实力。