在AI领域的最新浪潮中,DeepSeek模型的出现如同一股强劲的风暴,引领着国产GPU公司纷纷投身于适配的洪流之中。尽管表面上各家公司动作相似,但背后却蕴含着不同的策略和考量。
当前,业界关注的焦点多集中在适配DeepSeek的公司数量上,却鲜有人深入探究这些公司之间的差异。这种差异究竟源自技术路线的分歧,还是性能表现的优劣?是生态建设各具特色,还是应用场景有所不同?这些问题亟待解答。
从适配DeepSeek模型的角度来看,芯片厂商的动作大致可以分为两类:一类是对原生R1和V3模型进行适配,另一类则是适配由R1蒸馏而来的小模型。其中,DeepSeek R1定位为推理优先的模型,专为深度逻辑分析和问题解决场景设计;而V3则定位为通用型大语言模型,满足多领域需求。这两类原版模型参数量大、结构复杂,对芯片的计算能力、内存带宽以及多卡互联等技术要求极高。
相比之下,DeepSeek-R1系列蒸馏模型则更为轻量级,参数量少、结构精简,旨在保持一定性能的同时降低资源消耗,适合轻量级部署和资源受限场景。这一特点使得那些主要支持蒸馏模型的国产GPU公司,如摩尔线程、壁仞科技等,在适配过程中能够减轻工作量,快速实现应用。
从图中可以看出,虽然主流GPU厂商均在加速适配DeepSeek模型的节奏,但明确宣布适配R1及V3原版模型的只有一半左右,其中包括华为昇腾、海光信息等。而另一半厂商则主要支持蒸馏模型,这些模型基于通义千问和LLAMA等原始模型蒸馏而来,因此原本能够支持这些模型的平台基本上就能适配DeepSeek的蒸馏模型。
除了适配的模型类型不同外,各家公司在技术路线和性能表现上也存在差异。首先,DeepSeek模型的运行和适配主要依赖于英伟达的硬件和编程语言,这对其他硬件平台的应用和性能产生了一定影响。因此,是否容易适配基于英伟达GPU开发的DeepSeek等大模型,与芯片是否兼容CUDA密切相关。能兼容CUDA的厂商在适配过程中更具优势,但彼此间的兼容程度也有所不同。
其次,从性能表现来看,不同GPU的计算能力和内存带宽直接影响DeepSeek在处理大规模深度学习任务时的速度。某些GPU在能效比上表现更优,适合在低功耗环境下运行DeepSeek。这些差异使得各家公司在适配过程中面临的难度和挑战也各不相同。
以华为昇腾为例,其拥有芯片+框架+工具链等全栈AI能力,与DeepSeek的技术栈适配潜力大。在硬件方面,昇腾910芯片针对AI训练和推理优化,算力密度高,适合大规模模型训练。在软件生态方面,CANN异构计算架构和MindSpore框架深度绑定,若DeepSeek基于MindSpore优化,则昇腾的适配性极强。然而,若DeepSeek依赖CUDA生态,则需要通过华为的兼容层转换,可能损失部分性能。
海光信息则凭借兼容通用的“类CUDA”环境和擅长高性能计算的优势,在适配DeepSeek方面表现突出。其基于AMD CDNA架构的DCU系列兼容ROCm生态,对CUDA代码迁移友好,适合需兼容现有生态的DeepSeek场景。在智算中心应用成熟的海光,若DeepSeek侧重HPC+AI融合场景,则更具优势。然而,海光在软件工具链成熟度上可能面临一些挑战。
燧原科技、沐曦、天数智芯等国产GPU公司也在积极适配DeepSeek模型。燧原科技的优势在于云端AI训练与推理,其邃思芯片针对Transformer等大模型优化,计算密度高,适合DeepSeek的大规模参数场景。沐曦则凭借GPU通用性与CUDA兼容性在适配过程中占据一定优势。天数智芯则兼容CUDA生态,对已有代码库的DeepSeek项目友好。然而,这些公司在生态影响力、软件栈成熟度等方面也面临着不同的挑战。
在DeepSeek模型的商用方面,云上部署和本地化部署是两种主要形式。云上部署通过云平台提供服务,企业用户可以通过API调用或云服务直接使用DeepSeek的功能,降低前期投入成本。本地化部署则包括一体机形式和企业自行部署两种方式,主要面向对数据安全、数据隐私较为敏感的企业用户或对性能要求极高的企业。
随着DeepSeek开源模型的发展,其私有化部署需求日益凸显,一体机化等相关市场正蓬勃发展。在这一背景下,国产GPU公司迎来了新的发展机遇。随着DeepSeek一体机等应用的推出和广泛应用,市场对国产芯片的需求正在显著增加。国产GPU公司需要抓住这一机遇,不断提升自身技术实力和生态建设能力,以满足市场需求并实现快速发展。
以昇腾和海光为例,它们在DeepSeek一体机的推出和商用方面取得了不错的进展。昇腾的产业联盟不断扩大,已有超过80家企业基于昇腾快速适配或上线了DeepSeek系列模型并对外提供服务。海光则与DeepSeek的合作覆盖智算中心、金融、智能制造等核心场景,推出了多种解决方案和一体机产品。
随着海外芯片算力限制带来的难题逼近,全球算力可能会形成两条并行路线并逐渐脱钩。在国内,一部分算力基座将由英伟达承担,另一部分则由国产芯片承担。这为国产GPU公司提供了更大的发展空间和机遇。然而,国产芯片公司还需在互联和生态等诸多方面进一步完善,以提升自身竞争力和市场占有率。