亚马逊近日震撼发布了Nova Act,这是一款旨在简化网络浏览与操作的通用人工智能代理。这款创新产品由亚马逊在旧金山新建的AGI实验室精心打造,不仅标志着亚马逊在AI技术领域的又一重大突破,也预示着未来人机交互方式的深刻变革。
Nova Act的核心功能在于其能够自主控制网络浏览器,执行一系列简单却实用的在线操作。为了赋能开发者,亚马逊同步推出了Nova Act SDK,一个强大的工具包,让开发者能够基于Nova Act快速构建并测试自己的AI代理原型。这一举措无疑为AI技术的创新应用开辟了广阔空间。
值得注意的是,Nova Act还将作为即将面世的Alexa+升级版的关键组件,为亚马逊广受欢迎的语音助手增添生成式AI的强大能力。尽管目前提供的Nova Act版本被定位为“研究预览版”,但其潜力已足以引起业界的广泛关注。开发者可以通过访问nova.amazon.com,获取Nova Act工具包,并探索亚马逊的各种Nova基础模型。
在竞争激烈的AI市场中,Nova Act被视为亚马逊对OpenAI的Operator和Anthropic的Computer Use等同类产品的有力回应。这些科技巨头普遍认为,能够自主导航网络、执行任务的AI代理将极大提升现有AI聊天机器人的实用性和用户体验。
亚马逊在AI代理技术领域的布局虽非最早,但凭借Alexa+的庞大用户基础,其覆盖范围无疑是最广泛的。Nova Act SDK的推出,使得开发者能够整合多种工具,让AI代理轻松实现网页浏览、表单填写、日历管理等操作,进一步拓展了AI技术的应用场景。
据亚马逊透露,Nova Act在公司内部的多项测试中表现优异,特别是在衡量AI代理与屏幕文本交互能力的ScreenSpot Web Text测试中,Nova Act以94%的得分力压OpenAI的CUA(88%)和Anthropic的Claude 3.7 Sonnet(90%)。然而,亚马逊并未采用更常见的代理评估标准(如WebVoyager)对Nova Act进行基准测试,这在一定程度上引发了业界对其性能全面性的好奇与期待。
Nova Act的推出,是亚马逊AGI实验室的首款公开产品,该实验室由前OpenAI研究员David Luan和Pieter Abbeel共同领导。两位业界巨擘此前分别创立了Adept和Covariant等初创公司,去年被亚马逊招致麾下,负责领导其AI代理项目。在Luan看来,AI代理是创建超级智能AI系统的关键一步,而Nova Act正是这一愿景的初步实现。
Luan表示,Nova Act SDK的设计初衷是确保AI代理能够可靠地执行简短任务,并为开发者提供精确控制代理工作流程的工具。他期望通过这一平台,开发者能够创建出更加可靠、实用的AI代理应用程序,尽管这些应用可能仍需要一定程度的人工干预。
随着Nova Act的发布,亚马逊正式加入了通用人工智能代理技术的竞争行列。这款产品的早期测试不仅让人们得以窥见Alexa+的部分功能,更成为了亚马逊AI努力能否取得成功的关键时刻。面对OpenAI、谷歌和Anthropic等竞争对手在AI代理技术上的挑战,亚马逊能否破解可靠性难题,避免陷入同样的困境,将是业界关注的焦点。