阿里巴巴即将迈出重大一步,据新浪科技透露,公司内部消息人士证实,今晚,阿里将全面开放其先进的视频生成模型——通义万相2.1。
自今年1月升级至2.1版本以来,通义万相在视频和图像生成能力上实现了显著提升。这一升级不仅巩固了阿里巴巴在AI领域的领先地位,也为用户带来了更为丰富的创作体验。
在视频生成领域,通义万相2.1凭借自研的高效VAE和DiT架构,显著增强了时空上下文建模能力。该模型能够支持无限长的1080P视频高效编解码,并首次实现了中文文字视频生成功能,这一突破使其在VBench榜单上荣登榜首。
通义万相2.1的视频生成功能不仅限于中文,同样支持英文视频的一键艺术字生成。该模型还提供了丰富的视频特效选项,如过渡效果、粒子效果及模拟效果等,极大地增强了视频的视觉表现力。该模型还能实现复杂的运镜效果,并能精准还原真实世界的物理规律,如雨滴落在伞面上的水花溅起等。
在图像生成方面,通义万相2.1同样表现出色。无论是插画设计、涂鸦作画,还是局部重绘,该模型都能轻松应对,为用户提供了前所未有的创作自由度。同时,其短片创作和配乐生成功能也为用户带来了全新的创作体验。
回顾去年9月,通义万相已宣布支持文生视频和图生视频等功能,这些功能的推出标志着阿里巴巴在AI视频生成领域的重大突破。而此次全面开源通义万相2.1,无疑将进一步推动AI视频生成技术的发展和应用。
对于广大创作者而言,通义万相2.1的全面开源无疑是一个巨大的福音。他们可以利用这一先进的模型,轻松实现自己的创意和想法,创作出更多令人惊叹的作品。同时,这一举措也将为AI视频生成领域注入新的活力,推动该领域不断向前发展。
通义万相2.1的全面开源也将为学术界和工业界提供更多的研究资源和应用机会。研究人员可以利用这一模型进行更深入的研究和探索,推动AI技术的不断创新和发展。而企业则可以利用这一模型开发更多的应用场景和产品,为用户提供更为丰富和多样的服务。
总的来说,阿里巴巴全面开源通义万相2.1是一个具有里程碑意义的举措。这一举措不仅将推动AI视频生成技术的发展和应用,还将为创作者、研究人员和企业提供更多的机会和资源。我们有理由相信,在不久的将来,AI视频生成技术将在各个领域发挥更为重要的作用。