在AI领域的一次重大突破中,由知名学者李飞飞共同创立并领导的AI初创企业World Labs,近期揭开了其首个创新成果的神秘面纱——一个能够仅凭单张图片就生成可交互3D世界的模型。这一消息迅速引起了业界的广泛关注。
World Labs的这项新技术,实现了从2D图片到3D世界的跨越性转变。与传统的图片转3D产品相比,该模型生成的3D场景不仅高度还原了原始图片的风格,更赋予了用户前所未有的互动体验。用户可以在浏览器中实时与这些场景进行交互,仿佛置身于一个开放世界的游戏中,通过键盘和鼠标自由移动、转换视角,甚至模拟相机的对焦和变焦功能。
World Labs的3D世界生成模型不仅提升了用户体验,更在技术上实现了三大突破:连续性、实时控制和正确的几何结构。这意味着用户可以在不改变已生成场景的前提下,自由探索、观察每一个细节,同时享受真实的物理规律和立体感带来的视觉盛宴。用户还可以为这些场景添加交互效果和动画,如声纳、聚光灯和波纹动态效果,使场景更加生动有趣。
World Labs的团队表示,这项技术有望彻底改变电影、游戏、模拟器等数字媒体的制作方式。他们展示了两个令人惊叹的应用案例:一是将梵高等世界名画转化为可交互的3D世界,让用户能够身临其境地欣赏艺术之美;二是将这项技术与其他AI工具结合使用,加速内容创作过程。例如,用户可以先使用文本生成图像模型创建图像,再基于这些图像生成3D世界,从而快速制作出风格各异的作品。
尽管这项技术还处于早期阶段,存在一些限制,如生成的3D场景可探索区域有限,以及偶尔会出现渲染错误等,但World Labs的团队正在不断努力改进和完善。他们表示,将致力于提高生成世界的大小和拟真度,同时探索更多用户与场景交互的新方式。
World Labs于今年9月正式宣告成立,是一家专注于空间智能的AI公司。其联合创始人兼CEO李飞飞,前谷歌云AI负责人、斯坦福大学教授,凭借其深厚的学术背景和丰富的行业经验,带领团队致力于构建大型世界模型(LWM),以感知、生成并交互3D世界。成立不到一周,World Labs就获得了超过10亿美元的估值,并筹集了2.3亿美元的风投资金,投资方包括多家知名风投机构和知名企业。
World Labs的成立和技术的突破,标志着生成式AI正迈向一个新的阶段——空间智能。随着技术的不断进步和应用场景的拓展,我们有理由相信,未来的AI将更加智能、更加人性化,为人类的生活和工作带来更多的便利和惊喜。