腾讯公司近期在人工智能领域取得了新的里程碑式进展,其混元大模型正式推出了视频生成功能。这一技术的实现,标志着腾讯在文本生成图像、3D建模等能力之外,又增添了视频生成的强大实力。据悉,混元大模型的参数量惊人,达到了130亿,是当前最大的视频开源模型之一。
这款大模型不仅支持中文输入,还兼容英文,进一步拓宽了其应用场景和受众范围。其视频生成能力尤为突出,生成的画面质量极高,几乎达到了“超写实”级别,且在动态场景中保持了高度的稳定性和准确性。尤为在包含镜面反射的场景中,模型能够精准模拟出镜面反射与外部环境的同步变化,光影效果自然流畅,符合物理原理。
混元大模型的成功,离不开其背后强大的技术支持。该模型采用了先进的DiT架构,并结合了新一代文本编码器,这一组合使得模型在理解和处理语义信息方面更加高效和精准。这一改进在描绘复杂场景和多主体互动时尤为明显,能够呈现出更加细腻和丰富的画面效果。
为了让更多用户能够体验到这一前沿技术,腾讯公司特别推出了试用申请服务。感兴趣的普通用户可以在腾讯元宝App的“AI应用”板块中找到“AI视频”功能,并提交试用申请。而对于企业客户,腾讯云也提供了便捷的接入服务,目前API内测申请已经同步开放。此次开源行动不仅涵盖了模型权重、推理代码等核心要素,还提供了完整的模型算法,企业和个人开发者均可免费获取和使用。