昆仑万维公司在科技领域迈出了重要一步,正式揭晓了其自主研发的“Matrix-Zero世界模型”。这一创新技术不仅标志着中国AI企业在空间智能探索上的崭新高度,还预示着游戏、影视及虚拟交互等多个行业即将迎来智能化变革的浪潮。
Matrix-Zero世界模型由两大核心组件构成,每一部分都展现了其独特的技术优势。首个组件为3D场景生成大模型,用户只需简单输入一张图片,即可迅速生成一个可自由探索的真实3D场景。这一场景不仅支持动态物理效果,还能实现多风格迁移,相较于国际同类产品,其探索范围与自由度更胜一筹。例如,用户可以在生成的场景中自由行走,观察每一处细节,体验如临其境的真实感。
另一大组件是可交互视频生成大模型,该模型以用户实时输入为驱动,能够生成动态互动视频,并精准控制视角移动。无论是虚拟环境还是沉浸式体验场景,都能得到完美适配。这意味着用户可以在视频中实时互动,改变剧情走向,享受前所未有的观影体验。
昆仑万维的技术团队透露,3D场景生成的逼真效果得益于两大自研模块:场景布局生成模块和纹理生成模块。前者通过可微渲染技术与扩散模型,将输入图片转化为几何结构一致的3D场景框架;后者则基于图像与视频生成模型训练,在用户移动视角时实时补全场景缺失区域的几何与纹理。这一设计确保了任意角度场景的合理性与一致性,为用户提供了无缝的3D体验。
除了逼真的3D场景生成,该模型还支持动态场景生成,如风吹草动、水流效果等,并能适配写实、卡通、水墨等多元风格输入。这意味着用户可以根据自己的喜好和需求,生成风格各异的3D场景和视频内容。
昆仑万维在可交互视频生成方面也有着显著的技术突破。其自研的“用户交互模块”结合生成式视频技术,实现了对视角移动的精细控制。在虚拟环境中,用户可以通过输入指令实时改变视频画面走向,使生成内容更加贴合交互预期。这一技术突破不仅提升了用户体验,还为AI驱动的内容生产与交互方式开辟了新的可能性。
Matrix-Zero世界模型计划于2024年4月正式上线,并将率先应用于昆仑万维的AI游戏生产、AI短剧制作等业务线。这一创新技术将为开发者提供高效的内容生成工具,极大地提升内容创作效率和质量。随着视频模型技术的不断成熟,未来游戏开发或许将不再依赖传统3D引擎,影视创作门槛也将大幅降低。
昆仑万维表示,将继续致力于AI平台的迭代升级,探索虚拟环境中的实验模拟、数字孪生等更多应用场景。这一举措将推动人工智能从“感知”向“行动与创造”进化,为人工智能技术的未来发展注入新的活力。