在今年的科技舞台上,音乐大模型以其独特的魅力脱颖而出,成为垂直大模型赛道上一颗璀璨的明星。这一领域不仅带来了令人耳目一新的音乐创作玩法,还以惊人的模型效果和现象级的产品传播方式,赢得了广大用户的青睐。
回溯到3月,Suno V3的问世如同一颗重磅炸弹,在音乐行业掀起了轩然大波。而最近,Suno再次发力,推出了V4版本,进一步提升了音乐的音质、悦耳度和时长,使得AI能够创作出完整的四分钟歌曲。这一突破性的进展,在国内外引发了广泛的讨论和关注。
然而,值得注意的是,尽管Suno在英文曲目上表现出色,但在中文曲目和中国用户市场的迭代需求上,却并未给予足够的重视。面对这一挑战,国内在AI音乐领域深耕已久的公司纷纷亮出了自己的杀手锏,推出了一系列具有竞争力的模型和应用,与全球顶级产品展开了激烈的较量。
在这场你追我赶的竞赛中,国内AI音乐应用主要形成了三大阵营:以字节跳动豆包旗下的海绵音乐为代表的大厂派,以昆仑万维旗下的天工SkyMusic为代表的新兴大模型厂商,以及以趣丸科技旗下天谱乐为代表的垂直赛道独角兽科技公司。这些玩家在各自的领域内发挥优势,不断推陈出新。
海绵音乐,作为字节跳动推出的一款免费AI音乐创作和分享平台,凭借其强大的人工智能技术,帮助用户轻松生成个性化的音乐作品。用户只需输入一句灵感或上传一张图片,即可获得专属的音乐作品,且平台提供了丰富的音乐风格和创作工具。
与Suno相比,海绵音乐在AI生成的中文歌曲方面表现更为出色,不仅提高了吐字的清晰度和演唱的流畅性,还使音乐曲风更符合中国人的喜好。
昆仑万维推出的天工SkyMusic,则是国内首个音乐SOTA模型,基于其“天工3.0”超级大模型打造。该模型能够快速生成多种风格的音乐作品,采用了音乐音频领域类Sora模型架构,通过Large-scale Transformer和Diffusion Transformer的协同工作,实现了高质量音频的生成。
而趣丸科技旗下的天谱乐,作为全球首个多模态配乐大模型,自今年7月发布以来,便以其独特的功能吸引了大量用户的关注。天谱乐不仅支持文生音乐和音频生音乐,还首创了图片和视频生成音乐的功能,这一创新使得其多模态输入能力超越了Suno。
天谱乐大模型集成了多项领先技术,包括图片理解算法、旋律生成算法、视频理解算法和配器识别算法等,能够生成高契合度的视频配乐。用户只需上传一张图片或一段视频,即可在1-2分钟内生成一首与画面高度适配的完整歌曲,且生成效果达到唱片发行级水准。
除了这些代表性的玩家外,国内音乐行业的两大巨头腾讯音乐和网易云音乐也分别推出了X·Studio和启明星等产品,以追赶当前生成式人工智能的浪潮。然而,尽管这些巨头拥有强大的版权库和市场份额,但在AI音乐上的投入和活跃度却不及上述代表性玩家。
在与全球科技巨头角逐AI大模型的竞赛中,国内公司的一个显著优势是AI应用。探索和创造出更多用户真正会使用的产品以及可落地的商业化场景,是国产大模型能够持续进化的关键。趣丸科技副总裁贾朔曾表示,“降低门槛让普通用户体验音乐创作的乐趣”是自研天谱乐产品的价值主张。
然而,尽管音乐大模型在2024年以惊人的速度发展,但版权问题仍然是一个难以回避的尴尬。多家唱片公司曾对Suno和Udio发起诉讼,指控它们非法使用版权音乐来训练AI模型。而AI生成的音乐作品是否享有版权保护,其版权归属如何界定,也尚无明确的法律规定。
针对这一问题,贾朔提出可以从技术手段上规避一些纷争。例如,在产品侧判断用户是否有主观意图模仿现有艺术家,并做出弹窗提示。然而,尽管AI能够模拟人类的创作模式,但它始终难以真正理解和表达人类复杂的情感。如何提升AI音乐的创意和情感表达能力,仍然是当前音乐大模型需要突破的方向之一。
AI音乐创作的发展也对人类音乐创作者的就业和创作空间造成了一定的挤压。在当前的阶段,我们需要寻找一种平衡,实现AI与人类创作者的共存。