【ITBEAR】9月23日消息,阿里巴巴的研究团队近日公布了一项令人瞩目的研究成果:他们成功开发出一个基于大模型的VARP智能体框架,该框架能让AI以视觉方式理解并操作游戏,且在《黑神话·悟空》中展现出了超越人类玩家的实力。
据ITBEAR了解,这项研究的核心在于VARP框架的独特设计。它不同于传统的强化学习方法,而是直接将游戏截图作为输入,通过视觉语言模型进行推理,生成Python代码形式的动作指令来操作游戏。这种方法的创新之处在于,它显著减少了所需的数据量,仅依靠1000条有效数据就实现了令人印象深刻的游戏操作水平。
在研究过程中,阿里巴巴的团队定义了12个与《黑神话·悟空》相关的任务,其中75%与战斗有关。他们构建了一个包含键鼠操作和游戏截图的人类操作数据集,并以此为基础训练了VARP智能体。该智能体在90%的简单和中等水平战斗场景中取得了胜利,甚至在面对某些精英怪时,其胜率已经超过了人类玩家。
值得一提的是,VARP框架还包含了三个库:情景库、动作库和人工引导库。这些库存储了智能体的自我学习和人类指导的内容,使其能够进行高效的检索和更新。这种设计不仅提升了AI的学习效率,还为其在面对复杂任务时提供了更多的灵活性。
尽管VARP智能体在游戏操作中取得了显著的成果,但研究团队也指出了其存在的局限性。例如,由于视觉语言模型的推理速度限制,AI无法实时处理每一帧画面,这可能导致其在某些情况下错过关键信息。此外,在没有人类引导的情况下,智能体可能无法自行找到正确的游戏路线。
阿里巴巴的这项研究无疑为AI在游戏领域的应用开辟了新的道路。它不仅展示了AI在理解和操作复杂游戏方面的巨大潜力,还为未来的游戏开发和AI技术研究提供了有价值的参考。
#阿里巴巴# #VARP智能体# #AI游戏操作# #黑神话悟空# #视觉语言模型#