微软在近期的一项重大发布中,揭开了其专为游戏创意设计领域打造的生成式AI模型——Muse的神秘面纱。这一创新成果不仅引起了业界的广泛关注,还在《自然》杂志上发布了详细的研究报告。
Muse,这一由微软命名的新模型,实际上是一个世界与人类行动模型(WHAM)的实例化应用。它的独特之处在于,能够自动生成游戏视觉内容和控制器动作,为视频游戏的创作带来了革命性的变化。这一技术的开发,得益于微软研究游戏智能和可教学人工智能体验(Tai X)团队与Xbox游戏工作室中的Ninja Theory的紧密合作。
为了训练Muse,微软使用了Xbox游戏《Bleeding Edge》中的人类游戏数据,包括视觉和手柄动作。具体来说,Muse(采用WHAM-1.6B版本)在超过10亿张图片和对应的手柄动作数据上进行了深度训练,这些数据相当于人类连续游戏超过7年的时长,确保了模型的准确性和实用性。
当开发者与Muse进行交互时,WHAM演示器提供了一个直观的视觉界面,使得交互过程变得简单而高效。开发者只需提供一张游戏截图,Muse就能迅速生成多个可能的后续游戏画面,为游戏设计提供了丰富的创意选项。通过Xbox手柄控制角色,Muse还能即时生成与开发者操作相对应的后续游戏内容,极大地提升了游戏开发的效率和灵活性。
为了进一步推动这一技术的发展和应用,微软不仅发布了相关的研究论文,还向社区开放了Muse的开源权重、WHAM演示器和样本数据。这一举措无疑将激发更多开发者对生成式AI在游戏领域应用的探索和创新。
微软的这一发布,不仅展示了其在生成式AI技术领域的深厚积累和创新实力,也为游戏行业带来了新的发展机遇和可能。随着更多开发者的加入和探索,我们有理由相信,Muse将在未来成为游戏创作领域的重要工具之一。