近日,DeepSeek公司推出的V3模型在AI领域引发了广泛关注。这款模型以惊人的训练成本效益——仅557.6万,实现了与OpenAI O1推理模型相当的性能。这一突破不仅在全球范围内引发了连锁反应,还直接冲击了英伟达的市场地位,导致其股价在1月27日暴跌17%,市值瞬间蒸发6000亿美元。
尽管部分投资人担忧DeepSeek的崛起会减少市场对先进芯片的需求,但科技界普遍持另一种观点:高性能、低成本且开源的大模型将促进整个应用生态的繁荣,从而长期利好英伟达。这两种截然不同的观点,在科技界引发了激烈的讨论。
从技术层面来看,DeepSeek对英伟达、芯片行业乃至整个科技领域的影响远非简单。Inference.ai的创始人兼CEO John Yue指出,DeepSeek冲击了英伟达的两大核心壁垒——NVLink与CUDA,尽管并未完全冲垮这些壁垒,但确实打掉了英伟达的溢价。
在详细解读DeepSeek的技术创新时,加州大学戴维斯分校电子计算机工程系的助理教授、AIZip的联合创始人陈羽北表示,DeepSeek的成功关键在于其基础模型V3的能力。通过采用GRPO(分组相对策略优化)方法,DeepSeek在R1 Zero未经强化学习的情况下,每生成100条内容就有约10%的成功率,这一显著提升证明了基础模型能力的重要性。
陈羽北进一步解释说,DeepSeek在模型架构效率上进行了重大提升,包括优化混合专家网络(MoE)的负载均衡和节省键值缓存(KV Cache)。这些创新使得DeepSeek在600多B的大模型上表现出色,并通过自启发式回答和蒸馏学习的方法,成功将大模型的能力传授给小模型,实现了性能的进一步提升。
关于DeepSeek对英伟达的影响,John Yue认为这是一把双刃剑。一方面,DeepSeek的出现激发了更多初创企业探索AI应用层面的可能性,从而增加了对GPU的需求,这对英伟达是有利的。另一方面,DeepSeek通过优化MOE和直接调用PTX(并行线程执行)来绕过CUDA高层API,确实冲击了英伟达的溢价。
然而,John Yue强调,英伟达的核心壁垒——NVLink和CUDA——仍然坚挺。虽然DeepSeek提供了一种可能的替代方案,但尚未出现能够完全替代CUDA的通用系统。因此,长期来看,英伟达在GPU市场的领先地位仍难以撼动。
DeepSeek选择开源其模型,这一举措对整个AI行业产生了深远影响。John Yue指出,开源降低了AI应用的准入门槛,激发了更多开发者探索AI应用的热情。陈羽北也表示,开源生态对于提高AI应用的效率至关重要,它使得开发者能够基于开源模型快速构建自己的应用。
在谈到DeepSeek如何降低API成本时,John Yue表示,DeepSeek从上到下进行了整套优化,包括PTX调用、GPU切分等。这些优化措施使得DeepSeek能够在更低端的芯片上运行,从而大幅降低了每个Token的成本。DeepSeek还通过蒸馏学习等方法,成功将大模型的能力传授给小模型,进一步降低了推理成本。
陈羽北还提到了小模型在未来的发展潜力。他表示,随着小模型在性能上的不断提升,它们将在更多场景中取代大模型,从而降低AI应用的成本并提高普及程度。未来,AI基础设施将形成端-边-云的分层体系,小模型将在终端设备和边缘端发挥重要作用。
最后,陈羽北对DeepSeek的数据构成和训练细节表示了好奇。他指出,虽然DeepSeek已经公开了部分信息,但关于数据的具体构成和处理流程等关键细节仍然未披露。这些细节对于其他研究者复现DeepSeek的工作至关重要。