在科技界的聚光灯下,DeepSeek如同一颗新星迅速崛起,成为全球AI领域的焦点。自其发布以来,不仅在AI产业链上掀起波澜,还让科技巨头如OpenAI和英伟达感到前所未有的震撼。DeepSeek的初步表现令人瞩目,数据显示,上线仅5天,其日活跃用户就超越了ChatGPT,20天后日活更是突破2000万人次大关,占据了ChatGPT日活的23%,成为全球增速最快的AI应用。
DeepSeek的火爆不仅吸引了海外科技企业的关注,也让国内AI领域为之沸腾。阿里云、百度云、腾讯云、字节火山引擎等国内云计算巨头纷纷宣布支持DeepSeek,同时,百度昆仑芯、天数智芯、摩尔线程等芯片厂商也紧随其后,宣布对DeepSeek模型的支持。这一系列动作标志着国产AI厂商在全球AI竞赛中迈出了重要一步。
然而,DeepSeek的成功并非一帆风顺。围绕其技术突破性的争议从未停歇。有人质疑DeepSeek通过大幅缩减模型参数规模或依赖母公司幻方的廉价算力实现低成本训练。这些质疑虽有其依据,但无法否认DeepSeek“小力出奇迹”的打法所取得的实质成果。DeepSeek-R1在参数量仅为1.5亿的情况下,在数学基准测试中超越了GPT-4等大模型,同时,其轻量化模型在推理能力、性能以及成本方面均表现出色,为中小型企业和个人开发者提供了新的市场机遇。
幻方量化作为DeepSeek背后的推手,其在大模型赛道的布局早已开始。自2017年提出实现投资策略全面AI化以来,幻方不断加大在AI领域的投入。其自研的深度学习训练平台“萤火一号”和“萤火二号”分别搭载了上千张和上万张英伟达A100显卡,为DeepSeek的成功奠定了坚实基础。DeepSeek的出现,与其说是偶然,不如说是国产AI厂商在大模型布局中水到渠成的结果。
尽管DeepSeek取得了显著成绩,但其技术路径依赖风险仍然存在,尤其是“数据蒸馏技术”备受质疑。过度依赖蒸馏可能导致基础研究停滞,降低模型多样性。然而,这些挑战并未阻碍DeepSeek乃至整个国产大模型赛道的自我验证和持续发展。未来,国内或将涌现更多类似DeepSeek的AI应用。
与此同时,DeepSeek的开源模式也引发了全球科技圈对开源与闭源的激烈讨论。自meta发布LLama 2开源可商用版本以来,开源大模型如雨后春笋般涌现。2024年全年,开源大模型品牌超过10个,2025年初更是数不胜数。DeepSeek的开源策略无疑为其快速走红提供了助力,吸引了众多云厂商、芯片厂商和应用端企业的关注。然而,开源与否仍是大模型赛道亟待商榷的问题。
一方面,开源AI公司在资本市场上不受欢迎,而闭源AI企业则更具融资优势。另一方面,开源AI的定义日益复杂,真正意义上的开源需满足训练数据透明性、完整代码和模型参数等要求。DeepSeek虽被质疑不算真正意义上的开源,但其开源策略无疑为AI生态化进程注入了新的活力。
在算力投入方面,尽管DeepSeek在某些方面带来了突破,缓解了“垄断诅咒”,但全球大模型赛道的算力需求仍不容忽视。DeepSeek目前仅支持文字问答、读图、读文档等功能,尚未涉足图片、音频和视频生成领域。一旦拓展至这些领域,算力需求将呈爆炸式增长。因此,算力建设的必要性只增不减。
DeepSeek绕开了“芯片大关”,但优质的算力基础设施仍是算力产业的基石。在相同投入下,高效的算力基础设施能提供更高的算力效率与商业回报。因此,大模型赛道的“追芯”游戏远未结束。国内外AI巨头仍在不断加码算力建设,以抢占未来市场的先机。