在人工智能领域,一场围绕推理模型的激烈竞争正在如火如荼地进行。这场竞赛的焦点,无疑是被众多大厂对标的DeepSeek R1模型。而就在近日,这场竞争再次升级,吸引了更多明星大模型公司的加入。
就在昨天,阿里率先发布了其推理模型QwQ-Max-Preview的预览版。紧接着,Anthropic也宣布推出全球首个“混合推理”模型Claude 3.7 Sonnet。与此同时,字节也被曝出其自研的深度思考型推理模型豆包正在小范围内进行测试。这一系列动作,无疑为这场推理模型大作战增添了更多看点。
而作为这场竞赛的发起者,DeepSeek也没有停下脚步。据路透社报道,DeepSeek正在加速推出其R2模型,原计划在5月初发布的该模型,现在有望提前面世。这一消息,无疑给正在紧锣密鼓准备自家推理模型的各大厂商带来了更大的压力。
在这场竞赛中,香港科技大学校董会主席、美国国家工程院外籍院士沈向洋指出,大模型的研究焦点已经从GPT模式转向了Reasoner模式,这是一种全新的学习范式。而DeepSeek R1,无疑成为了这场范式变革的重要参考对象。
不仅如此,腾讯、百度等国内科技大厂也纷纷加入了这场竞赛。腾讯上线了自研的深度思考模型“混元T1”,百度文小言则推出了深度搜索功能。而马斯克的xAI也发布了带有深度思考能力的Grok 3新模型。就连OpenAI,也在DeepSeek的压力下,进一步开放了自家推理模型o1和o3-mini的思维链。
然而,在这场竞赛中,字节似乎显得有些慢半拍。在ChatGPT时刻到来后,字节就已经落后了一步。如今,在DeepSeek R1引发的推理模型热潮中,字节的自研推理大模型才刚刚进入灰度测试阶段。不过,值得注意的是,虽然字节的推理模型尚未正式发布,但已经引起了业界的广泛关注。
与此同时,阿里新推出的QwQ-Max-Preview模型也只是一个预览版,而非正式版。在LiveCodeBench编程测试中,该模型只是小幅超越了OpenAI o1中档推理模型以及DeepSeek R1预览版。而Anthropic的Claude 3.7 Sonnet则是一个完整体,其在传统基准测试项目中的表现,都赶超了OpenAI o1和DeepSeek R1。
在这场竞赛的背后,是各大厂商对用户和开发者生态的争夺。DeepSeek的异军突起,再次激发了大厂对AI to C的重视。阿里在发布QwQ-Max-Preview的同时,还透露了将发布Qwen Chat APP的消息,意图通过专用APP来争夺全球受众。而腾讯、百度则选择了接入DeepSeek来争夺C端用户,但这一举措的潜在风险依然不小。
为了彻底留住用户,各大厂商都在自研大模型的同时,加快了在开源上的进度。阿里宣布未来将以Apache2.0许可协议开源自家推理模型;百度也开始重新拥抱开源路线;腾讯、字节也都在推动旗下垂类模型陆续开源。而DeepSeek则相继开源了多个代码库和计算库,把自己的训练秘密公之于众。
在这场竞赛中,唯一没有对外大范围提供推理模型服务的科技大厂,只剩下了字节。这或许与字节在大模型技术演进路线上的判断失误有关。在DeepSeek R1创新的长链思考模式成为行业热点后,字节并没有立即跟进复现。而在ChatGPT爆火后,字节也一度将AI重心移向了细分垂直赛道的AI for Science,导致在大模型推出时间上落后了百度、阿里一大截。
不过,借助2024年大模型技术迭代趋缓的利好因素,字节在过去一年大力补课,不仅使豆包一度成为国内月活用户最多的AI应用,而且从大模型性能到多模态布局,也都相继追赶上了国内头部厂商。然而,随着DeepSeek R2模型提早到来的动作,字节再次面临了追赶的压力。
在这场推理模型热潮中,各大厂商都在奋力追赶,试图在这场竞赛中脱颖而出。而DeepSeek作为这场竞赛的发起者,无疑成为了众多厂商对标的对象。未来,这场竞赛将如何发展,让我们拭目以待。