在人工智能领域,一项令人瞩目的新突破正在悄然改变3D场景生成的格局。斯坦福大学教授李飞飞所带领的WorldLabs团队,近期推出了一款名为“空间智能”的模型,该模型仅需单张图片作为输入,便能生成一个栩栩如生的3D世界。这一创新成果被视为向空间智能领域迈出的重要一步。
与此同时,国内智源研究院也不甘落后,他们推出了一款名为See3D的3D生成模型。这款模型的最大特点在于,它利用了大规模无标注的互联网视频进行学习,从而实现了从视频到3D场景的生成。这一技术的推出,无疑为3D生成领域注入了新的活力。
与传统的3D生成模型相比,See3D采用了全新的视觉条件技术。它不再依赖于昂贵的相机参数标注,而是仅通过视频中的视觉线索来生成相机方向可控且几何一致的多视角图像。这一方法不仅降低了成本,还大大提高了生成效率。
See3D的应用范围非常广泛。它不仅能够支持零样本和开放世界的3D生成,还无需微调即可执行3D编辑、表面重建等任务。这意味着用户可以在不需要额外学习或调整的情况下,轻松地进行各种3D创作和应用。
See3D还支持从文本、单视图和稀疏视图到3D的生成。这一功能为用户提供了更多的创作选择,使他们能够根据自己的需求,灵活地进行3D场景的生成和编辑。同时,See3D还支持3D编辑与高斯渲染,进一步提升了其在3D创作领域的应用价值。
随着See3D和“空间智能”模型的推出,3D生成领域正迎来一场前所未有的变革。这些新技术不仅降低了3D生成的门槛,还为用户提供了更加便捷、高效的创作方式。未来,我们可以期待这些技术在更多领域得到广泛应用,为人们的生活带来更多便利和乐趣。