ITBear旗下自媒体矩阵:

阿里通义万相2.1大升级:视频图像生成能力显著增强,中文文字视频首亮相

   时间:2025-01-10 11:56:52 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

阿里巴巴旗下的通义万相近日宣布了其2.1版本模型的重大升级,此次升级在视频与图像生成能力上实现了显著提升,为用户带来了更为丰富和高质量的创作体验。

在视频生成领域,通义万相2.1凭借自研的高效VAE和DiT架构,显著增强了时空上下文建模能力。这一技术突破使得系统能够支持无限长1080P视频的高效编解码,大大提升了视频处理的灵活性和效率。尤为新版本首次实现了中文文字视频生成功能,并在VBench榜单上荣登榜首,彰显了其在视频生成技术上的领先地位。

通义万相2.1不仅支持中英文视频的一键艺术字生成,还提供了多种视频特效选项,如过渡效果、粒子效果和模拟效果等,极大地丰富了视频的视觉表现力。无论是制作宣传视频还是个人短片,用户都能轻松实现专业级的视觉效果。

在图像生成方面,通义万相2.1同样表现出色。新版本采用了IC-LoRA图像生成训练方法,结合DiT架构,显著增强了文本到图像的上下文能力。用户只需对多张图像进行拼接与联合描述,即可实现关联图像间的组合生成,并保持特征稳定连续。这一功能为设计师和摄影师提供了更多创意空间,让图像创作更加便捷和高效。

通义万相2.1还支持复杂运镜,能够还原碰撞、反弹、切割、挤压等真实世界的物理规律。例如,在模拟雨滴落在伞面上的场景中,系统能够精确呈现水花溅起的细节,使画面更加逼真和生动。这一功能在广告制作、动画制作等领域具有广泛的应用前景。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version