近期,阿里巴巴(中国)有限公司在视频生成技术领域的一项新进展引起了广泛关注。据天眼查知识产权信息透露,该公司已成功获得“一种图生视频方法和装置”的专利授权,标志着其在智能化视频生成领域取得了重要突破。
该专利的核心技术在于实现智能化、端到端的图像到视频的转换过程。具体而言,这一方法首先会将包含目标对象的源图像输入至一个先进的视频生成模型中,以此为基础生成初步的素材视频。随后,系统会分析素材视频,确定帧间变换矩阵序列,为后续的图像处理提供关键数据支持。
在此基础上,专利进一步利用源图像生成目标对象对应的对象掩码图像。通过应用帧间变换矩阵序列,系统能够生成一系列掩码图像和目标对象图像。这些图像序列为后续的视频生成提供了丰富的素材。
接下来,系统会整合源图像、掩码图像序列和目标对象图像序列,形成目标输入数据。这些数据随后被送入另一个支持局部重绘的视频生成模型中,经过精细处理,最终生成高质量的目标视频。这一过程巧妙地结合了两次模型生成,不仅显著提升了视频生成的智能化程度,还确保了目标对象在视频中的运动轨迹多样且自然,避免了不必要的扩散现象。
尤为该专利无需预设运动参数即可实现上述复杂的视频生成过程。这一创新特性赋予了视频生成更大的灵活性和多样性,使其能够适应更多样化的应用场景需求。无论是广告制作、动画制作还是虚拟现实等领域,该技术都有望发挥重要作用。