在人工智能领域,智谱AI作为大模型赛道的佼佼者,近期公布了其最新的AI应用进展,引发了广泛关注。在北京智谱GLM OpenDay活动上,智谱AI首席执行官张鹏亲自揭晓了两款创新产品——AutoGLM和GLM-PC。
AutoGLM是智谱AI推出的首个产品化智能体Agent,它基于公司自研的“基础智能体解耦合中间界面”与“自进化在线课程强化学习框架”。这款智能体能够通过文字或语音指令模拟人类操作手机,实现了大模型从“言语”到“行动”的范式转变。目前,AutoGLM已经开启了“百万内测”的申请通道,吸引了众多用户的关注。
GLM-PC则是另一款令人瞩目的产品,它基于CogAgent模型的视觉理解和任务规划能力,能够操作计算机的桌面应用。用户只需通过简单的一句话,GLM-PC就能快速执行复杂任务。GLM-PC还具备任务规划、屏幕界面信息理解的能力,能够根据页面信息进行计划更改和自我纠错,从而精准完成用户指令。
在发布会上,张鹏表示,AI Agent目前备受瞩目,从苹果的Siri、谷歌的Assistant,到OpenAI即将推出的Operator,全球科技巨头都在这一领域进行布局。智谱AI率先开放AutoGLM内测,受到了业界的广泛关注,仅过去一个月,申请页面就已有超过百万的用户访问。
张鹏还透露,尽管业界对大模型寄予厚望,但这也是一个高投入的领域。信息的理解依赖于底层技术,而底层技术并非单一能力所能涵盖。若要将AI作为生产力工具,需面对全面性的需求,可能会存在明显的短板。因此,智谱AI不仅在技术上进行布局,还在产业生态上进行了深入规划。智谱AI的定位是“开放平台”,旨在助力合作伙伴改造原有产品,探索新的可能。
在谈到Scaling Law时,张鹏表示,尽管由于数据和训练规模的原因,Scaling Law可能不会像之前预测的那样指数级上涨,但放宽视野来看,我们仍在寻找现象的本质。他依然对Scaling Law持乐观态度,认为其仍有很大的发展空间,将继续推动技术进步。特别是视觉Scaling Law仍在上涨,计算量可能是其发展趋势的最佳解释。
成立于2019年的智谱AI,源自清华大学计算机系的技术成果转化,是清华大学知识工程(KEG)实验室的衍生企业。作为国内最早进入大模型赛道的公司之一,智谱AI在业界享有“大模型六小虎”之一的美誉。自2023年3月推出千亿开源基座对话模型ChatGLM系列以来,GLM大模型已经经历了四个大版本的迭代,发布了超过20款AI模型技术和产品。
智谱AI聚焦于基座模型的研发投入,以TO B赛道为主,TO C赛道为辅。张鹏曾表示,国内大模型赛道过于拥挤,导致内耗严重。更符合商业规律的模式应是先建立基座大模型,再发展行业侧模型,最后面向更加细分场景的推理模型。国内创业生态在分层方面较美国略慢,而美国在多样性方面则拥有更多选项。
在TO B端层面,截至2023年底,智谱AI已拥有超过2000家生态合作伙伴,超过1000个大模型规模化应用,覆盖了传媒、咨询、消费、金融、新能源、互联网、智能办公等多个细分场景。在融资方面,智谱AI已完成九轮融资,总额接近60亿元人民币,其中包括多家知名投资机构的参与。
如今,智谱AI全面发力AI智能体应用,已在芯片、应用App、操作系统OS和模型侧进行了长时间、全链路的布局。智谱AI与高通、三星、英特尔、荣耀、华硕等端侧芯片、手机、电脑厂商合作,共同推动大模型应用落地,在AIPC、智能助手等领域取得了显著成果。
张鹏认为,通过端侧芯片性能优化和端云一体架构,Agent不仅能在操作系统OS和应用App上实现用户体验变革,还能将其推广到各类智能设备上,实现基于大模型的互联互通。今天的Agent已经能够像人一样理解界面、规划任务、使用工具、完成任务,从而更聪明地代替人类行动。
他分析称,大模型发展至今已逐步具备与人类与现实物理世界互动的能力,包括L1语言能力(已达80%)、L2逻辑能力(多模态能力,已达60%)、L3使用工具的能力(已达30%),甚至L4自我学习的能力也正在逐渐出现。智谱AI致力于将这种“理解”能力融入各行各业及各种场景,不断探索大模型的“序列输出”意味着什么,以及应以何种形式呈现。
张鹏在会后交流时表示,看待问题应更多从技术导向和目标导向出发,而不仅仅是局限于单项技术的快速变现。智谱AI的最终目标是帮助大家切切实实地解决生产力的问题,而非简单盈利。因此,需要更长远地去做这个事情,从生态建设上也是如此。智谱AI正在与众多伙伴和客户合作,共同构建发展自己的应用和商业价值。
在谈到AI智能体和搜索的关系时,张鹏提到,在办公应用场景中,AI Agent助手可以帮助用户解决一些问题,提升工作效率。智谱AI希望推动AI Agent技术本身的应用产生价值,而搜索是一个重要场景。他强调,AI Agent已经对人机交互形式产生了极大的影响,未来有望基于大模型智能能力实现原生的人与机器交互方式LM-OS,这将从根本上改变人与机器交互的方式。