在科技日新月异的今天,人类探索未知的脚步从未停歇。曾几何时,阿姆斯特朗那句“这是个人的一小步,却是人类的一大步”成为历史性时刻的注脚。而今,在人工智能领域,智谱科技的AutoGLM正以其独特的方式,书写着新时代的篇章。
11月末,智谱Agent OpenDay活动上,三款新品惊艳亮相:AutoGLM Web浏览器插件、GLM-PC电脑智能体大模型,以及备受瞩目的AutoGLM——智谱首个产品化的智能体Agent。短短一月间,AutoGLM的能力实现了质的飞跃,不仅限于简单的点外卖、朋友圈互动,更在多个方面取得了突破性进展。
AutoGLM现已能够自主执行超过50步的长流程任务,还能轻松跨越不同App完成复杂指令。它为用户开启了“全自动”上网新纪元,支持多个主流网站的无人驾驶操作。而GLM-PC,这款基于视觉多模态模型的通用Agent,更是实现了人机交互的新探索,用户只需设定好任务,GLM-PC便能如臂使指般完成。
或许有人会问,AutoGLM究竟是何方神圣?简而言之,它就像是手机的AI遥控器,用户只需一句话,AutoGLM便能模拟人类操作手机完成任务。从对话机器人到拥有“手、脑、眼”的自主Agent,AI的进化令人叹为观止。在实际测试中,AutoGLM无论是查找出行攻略、评论博主内容,还是购买水果、预订机票,都表现得游刃有余。当然,面对弹窗或需要人工确认的环节,AutoGLM还需用户的协助。
AutoGLM的升级不仅体现在任务执行上,更在于其对人机交互模式的深刻影响。过去,人们需要学习如何操作电脑、适应复杂的应用界面,而今,AI正逐渐打破这一僵局。用户只需用自然语言发出指令,AI便能自动处理复杂任务,人机协作的门槛大大降低。这种变化,不仅体现在AutoGLM上,苹果的Apple Intelligence、Anthropic的Computer Use、谷歌的Jarvis以及OpenAI即将发布的Operator,都在朝着这一方向努力。
在智谱Agent OpenDay上,荣耀、华硕、小鹏、高通、英特尔等企业纷纷分享了他们对智能终端的实践及展望。这表明,大模型重塑人机交互范式,已成为产业上下游的共识。随着AutoGLM能力的不断提升,它将能调用更多应用、适配更多系统,实现更加复杂、连贯的自主操作。
AutoGLM Web和GLM-PC同样表现出色。前者能理解用户指令,在网页上自动检索、总结多链接,甚至生成个性化内容;后者则能远程操控电脑,设定未来时间执行任务,让用户在工作与休息间自由切换。
值得注意的是,端侧算力的持续提升为AI的普及提供了有力支持。智谱推出的为AI原生设备适配的模型和端云同源的协同架构,意味着Agent不仅能在应用层面带来用户体验的变革,还能广泛推广至各类智能设备上。手机+AI、PC+AI、汽车+AI等新型智能设备将不断涌现,为用户带来前所未有的便捷体验。
大模型正逐步成为新时代的“操作系统”,以AutoGLM为代表的Agentic AI正引领着人机交互的新潮流。未来,我们或许将不再需要学习如何操作各种设备,而是直接通过自然语言与它们交流。这一变革将深刻影响我们的生活方式和工作模式,开启一个全新的智能时代。