【ITBEAR】国产视频大模型厂商Vidu近日宣布,其全新版本Vidu 1.5已正式上线。该版本在技术上取得了重大突破,被誉为达到“世界领先水平”,尤其在处理多样化输入及解决“一致性”难题上表现卓越。
Vidu自上线以来,便以其出色的角色一致性生成能力受到关注。通过精准锁定人物面部特征,Vidu成功解决了视频生成中的关键痛点,确保了人物形象的连贯性。而在Vidu 1.5中,厂商进一步展现了其上下文学习能力,显著提升了视频模型的可控性。
新版本在三个方面显著展示了技术上的革新与突破。首先,对于复杂主体,如细节丰富的角色或复杂物体,Vidu 1.5能够在多个视角下保持高度的一致性。例如,在处理3D动画风格角色时,无论视角如何变换,其头型、服饰等细节始终如一,有效避免了传统模型在视角切换时可能出现的问题。
其次,在人物特写镜头中,Vidu 1.5自然且流畅地维持了人物面部特征和动态表情的连贯性。这有效消除了面部僵硬或失真的现象,使得生成的视频更加自然真实。
最后,Vidu 1.5还实现了多主体一致性。用户现在可以上传包括人物角色、道具物体、环境背景等多个主题图像,并在视频生成过程中实现这些元素的交互。这一功能为用户提供了更高的自定义空间,能够创造出更为丰富和个性化的视频内容。
Vidu 1.5的发布无疑标志着国产视频大模型技术迈上了新的台阶,其在处理复杂视频生成任务时展现出的卓越性能和高度可控性,必将为用户带来更加出色的使用体验。