【ITBEAR科技资讯】4月2日消息,昆仑万维集团今日正式公布,其最新研发的音乐生成大模型“天工SkyMusic”即日起启动免费邀测活动。据悉,此次邀测将向行业媒体、专家及广大音乐爱好者开放1000个免费名额,以供用户体验与测试。正式版本则预计在4月17日,随着昆仑万维旗下重磅产品「天工3.0」的发布,同步向全社会免费开放。
天工SkyMusic被誉为目前国内唯一一款公开可用的AI音乐生成大模型。据ITBEAR科技资讯了解,该模型采用了音乐音频领域的类Sora架构,其中包含Large-scale Transformer与Diffusion Transformer两大核心组件。Large-scale Transformer主要负责谱曲环节,通过深度学习Music Patches的上下文依赖关系,实现音乐创作的可控性;而Diffusion Transformer则担纲演唱部分,借助LDM技术将Music Patches还原为高质量音频。这一创新架构使得天工SkyMusic能够生成长达80秒、44100Hz采样率的双声道立体声歌曲。
天工SkyMusic的亮相,带来了五大令人瞩目的特点:其一,能够生成高质量AI音乐,以80秒44100Hz采样率双声道立体声呈现;其二,人声合成效果惊艳,“以假乱真”的程度令人难以置信,中文发音尤为清晰准确;其三,具备歌词段落控制能力,生成的歌曲能够清晰反映出不同歌词段落的情感变化;其四,支持多样化的音乐风格创作,涵盖说唱、民谣、放克、古风、电子等多种类型;其五,拥有出色的音乐智能表达能力,可以学习并掌握颤音、歌剧、吟唱、男女对唱以及自动和声等多种歌唱技巧。
在AI音乐生成领域,另一款名为Suno V3的工具也于上月末引起了广泛关注。这款被誉为“音乐版ChatGPT”的工具,能够根据用户提供的歌词生成不同曲风和流派的歌曲,甚至允许用户定制AI歌手的音色。随着天工SkyMusic和Suno V3等AI音乐生成工具的陆续亮相,AI技术在音乐创作领域的应用正逐渐走向成熟和多样化。