在AI领域,六小虎之一的智谱科技,近期在OpenDay上展示了其在DeepSeek R1时代后的新成果——一款具备深度思考能力的Agent产品,“AutoGLM 沉思”(简称“沉思”)。这一产品的发布,标志着智谱在推理模型和AI Agent领域的又一次重要探索。
“沉思”的问世,正值国内AI市场风起云涌之际。百度、腾讯等巨头纷纷推出自己的推理模型,试图在这一领域站稳脚跟。而智谱,则选择了一条更为深入的道路,不仅跟进了R1和Manus的“plus版本”,更是在模型的思考能力上做出了显著提升。
“沉思”如同一位初入职场的实习生,能够基于开放的自然语言问题,进行理解、分析,并搜索信源。它不仅能够访问如知网、小红书、公众号等不对外开放API的信源,还具备多模态理解能力,能够解读网页上的图文信息。这一特性,使得“沉思”在处理复杂问题时,能够更加得心应手。
AutoGLM沉思界面
在OpenDay的演示中,智谱展示了“沉思”在小红书运营方面的能力。通过输入热门话题,如“手冲咖啡全套设备种草攻略”,“沉思”能够自动从多个平台搜集信息,生成总结性的内容。这一功能,不仅提高了内容更新的频率,还使得话题更加吸引人,从而在短时间内实现了粉丝数量的快速增长。
智谱用“沉思”运营的小红书账号
与Manus相比,“沉思”在交互界面设计上更加突显了模型本身的思考能力。在思考过程中,“沉思”会展示从理解问题、拆解问题,到信息检索,再列出解决方案框架的完整过程。而Manus则更注重于展示AI调用工具的过程和结果。
“沉思”和Manus的界面对比
尽管“沉思”在当前的预览版本中,仍无法像Manus那样实现跨PC、App等多端的操作,并交付出具体形态的结果,但智谱AutoGLM负责人刘潇表示,这只是一个开始,未来“沉思”将不断完善,提升其实用性和落地能力。
为了实现“沉思”所需的模型组合,智谱推出了三款新模型:基座模型GLM-4-Air-0414,推理模型GLM-Z1-Air,以及沉思模型GLM-Z1。这三款模型分别对应Agent所需的语言理解、问题分析,以及反思验证能力。同时,智谱还提出了“沉思大模型”的概念,标志着其对R1下一阶段的探索。
“沉思”背后的新模型
在发布会上,智谱CEO张鹏还分享了对Agent和模型技术,以及商业化的思考。他强调,预训练仍然是AI领域的重要基石,未来的新应用形态将回归到模型上。同时,他也承认,当前的Agent还存在短板,需要不断提升其聪明程度,以规避第三方平台的拦截。
在商业化方面,张鹏表示,开源并不等于完全免费,还需要后期技术人员的投入和维护成本。因此,服务将是开源的商业模式之一。对于智谱来说,他们并不将自己定义为To B的公司,而是专注于做自己认为有意义的事情,这些事情将在不同的场景和客户中产生不同的应用方式和价值。