在AI领域的浩瀚星空中,2023年OpenAI凭借ChatGPT的横空出世,无疑点亮了一颗璀璨的明星,将行业焦点牢牢吸引。彼时,国内科技巨头与OpenAI的差距众说纷纭,有的认为是技术迭代上的2至3个月,有的则断言是3至5年,甚至更悲观的声音认为是10年的鸿沟。然而,不论差距几何,中国企业在大型语言模型赛道上始终扮演着追赶者的角色。
时间轴推进至2025年,AI舞台迎来了新的主角——DeepSeek。1月11日前后,DeepSeek App在全球范围内正式上线,据Sensor Tower数据显示,其在发布的短短18天内,下载量便突破了1600万大关,而同期ChatGPT的下载量为900万。截至2月5日,DeepSeek的全球下载量已逼近4000万,尽管与ChatGPT的4100万尚有差距,但其日活跃用户数在1月31日达到了2215万,占据了ChatGPT日活的41.6%,增速惊人。
DeepSeek的异军突起,不仅令同行侧目,更引发了业界对其成功秘诀的广泛探讨。百度集团执行副总裁、百度智能云事业群总裁沈抖在内部会议上指出,DeepSeek虽在短期内会对百度构成一定挑战,但从长远来看,利大于弊。他特别提到,面对DeepSeek的冲击,字节跳动的AI产品可能首当其冲,因其训练与投放成本高昂。那么,DeepSeek的崛起,究竟会如何改写AI行业的版图?
DeepSeek的故事,始于一家成立不久的杭州深度求索人工智能基础技术研究有限公司,其成立于2023年7月,若算上与其关系密切的幻方量化,其历史底蕴或能追溯得更远。然而,在科技领域,年龄并非衡量技术实力的唯一标尺,深度求索用实际成果证明了这一点。
2024年底,深度求索推出了新一代大语言模型V3,在多项评测中超越了主流开源模型,且成本优势显著。而真正让深度求索声名鹊起的,是今年1月24日发布的R1模型。R1在技术上实现了重大突破,通过纯深度学习的方法让AI具备了推理能力,在数学、代码、自然语言推理等任务上,性能与OpenAI的o1模型不相伯仲。更令人瞩目的是,R1的训练成本仅为600万美元,远低于OpenAI、谷歌等巨头数亿乃至数十亿美元的投入。
性能与成本的双重优势,让DeepSeek迅速成为全球关注的焦点,同时也引来了质疑。其中,最主要的争议在于其成本是否真的如此之低。此前,行业普遍遵循的是通过大规模算力与数据堆砌来提升模型性能的路径,DeepSeek的出现打破了这一逻辑。据半导体研究机构Semianalysis推算,深度求索虽在GPU使用上有所节省,但其服务器资本支出仍高达16亿美元,不过即便如此,其成本仍远低于行业平均水平。DeepSeek每百万个token的查询成本仅为0.14美元,相比之下,OpenAI的成本高达7.5美元。
关于DeepSeek的另一大争议,是其是否使用了OpenAI的数据。OpenAI与微软均对此表示质疑,认为DeepSeek可能通过“蒸馏”OpenAI模型的输出来提升自家模型的性能。然而,这一做法在行业内并不罕见,且OpenAI自身在训练模型时也使用了大量未经授权的数据。微软在指控后不久,便在其AI平台上接入了DeepSeek,这一举动无疑为DeepSeek的清白增添了一份有力的证明。
DeepSeek之所以能够脱颖而出,关键在于其超低成本带来的高性能。回顾中国企业在其他领域的发展轨迹,不难发现,质价比一直是他们的制胜法宝。DeepSeek在大模型领域的成功,正是这一传统智慧的延续。
大模型行业曾一度陷入算力信仰的怪圈,认为只有不断堆砌算力与数据,才能开发出性能更强的产品。然而,随着边际效应的递减,这一策略的有效性正逐渐受到质疑。OpenAI作为行业开创者,背负着巨大的成本包袱,若不能持续大幅提升模型性能,其商业模式将面临严峻挑战。相比之下,DeepSeek采取了开源策略,通过工程创新优化了大模型在推理环节上的痛点,让产品性能实现了大幅提升,为行业提供了一个更具普适性的方向。
DeepSeek的创新之处在于推理环节,通过多头注意力机制、可验证奖励的GRPO算法以及DualPipe等方法,显著提高了模型的效率和性能。这些创新不仅让DeepSeek在技术上取得了突破,更在成本上实现了巨大节省。
DeepSeek的崛起,无疑将对行业产生深远影响。一方面,它将冲击以OpenAI为首的闭源大模型厂商,迫使他们重新审视自身的商业模式;另一方面,它将推动对推理芯片的需求增长,加速AI应用的普及。然而,DeepSeek也面临着商业化的挑战,如何在保持开源优势的同时,找到合适的盈利模式,将是其未来发展的关键。
值得注意的是,尽管DeepSeek取得了显著成绩,但其开源策略也意味着竞争对手可以借鉴其技术开发相似产品。李飞飞与斯坦福大学、华盛顿大学的研究人员已成功以极低成本训练出了与R1性能相当的s1模型,这进一步证明了DeepSeek模式的可行性与挑战性。
DeepSeek的成功,不仅是中国企业在AI领域的一次重要突破,更是全球AI行业发展的一个重要里程碑。它用实际行动证明了,通过技术创新与成本优化,即使不是行业巨头,也能在AI领域大放异彩。