近期,DeepSeek R1在全国范围内迅速走红,从智能手机应用到新能源汽车,众多产品纷纷接入这一技术。对于内容编辑而言,DeepSeek R1无疑是一个强大的助手,从大纲制定到内容审阅,都能大幅提升工作效率。然而,官方满血版的DeepSeek R1虽然功能强大,但频繁掉线的问题让人头疼,平均每小时仅能稳定使用一次。第三方满血版虽然掉线较少,但用户对于上传隐私或保密数据至云端仍心存顾虑。
鉴于上述情况,不少用户开始考虑自行搭建DeepSeek R1。然而,满血版DeepSeek R1模型体积庞大,达到了404GB,远远超出了普通消费级显卡的显存容量。即便是32B的蒸馏模型,也需要20GB的显存空间。这对显卡性能提出了极高的要求,例如,拥有32GB显存的英伟达RTX 5090 D公版显卡,官方售价高达16999元,而实际购买成本往往还要高出万元。
面对高昂的硬件成本,用户开始探索经济实惠且高效的解决方案。多显卡协同工作成为了一个不错的选择,但AMD新显卡已不再支持交火,英伟达SLI技术也不支持显存叠加。幸运的是,Intel的Arc显卡不仅支持交火,而且显存可以叠加,价格也相对亲民。两张Arc A770 16GB显卡的价格大约在3600元左右,即可获得32GB的显存。本次测试选择了两张蓝戟Intel Arc A770 Photon 16G OC显卡进行交火,以部署DeepSeek R1的32B蒸馏模型。
蓝戟Intel Arc A770显卡分为8GB和16GB两个版本,本次选择的16GB版本配备了GDDR6显存,显存带宽高达512GB/s,拥有32个Xe核心,最高频率可达2400Mhz。由于采用双卡方案,主板和电源的配置也需特别注意。主板需至少具备两个PCIe显卡插槽,且每个插槽需支持PCIe 4.0 x8传输速率。电源方面,单张蓝戟Intel Arc A770 Photon 16G OC的TBP为285W,两张显卡总功耗接近600W。因此,选择了海韵1300W电源进行测试,该电源不仅能满足功率需求,还能提供两张显卡所需的4个PCIe 8Pin接口。模型部署方面,选择使用IPEX-LLM工具在Linux系统上运行,相比Windows系统,Linux系统的运行效率更高。
搭建完成后,通过另一台电脑在局域网内访问后端进行测试。在测试过程中,尽量避免对测试电脑进行截图或录屏操作,以减少对GPU资源的占用。
在性能与效果方面,本次测试使用了32B模型,要求模型编写一个包含特定功能的HTML贪吃蛇游戏。模型迅速生成了代码,两张Arc A770显卡的风扇全力运转,后端显示平均生成吞吐量稳定在26 tokens/s以上。相比之下,单张RTX 5090 D运行32B模型的性能约为46 tokens/s,而本次测试以不到两成的价格获得了五成以上的性能,表现令人惊喜。
生成的HTML贪吃蛇游戏可以直接预览运行,但在实际操作中发现,使用上下方向键会滚动网页,影响了游戏体验。因此,要求模型对代码进行修改,用A、S、D、W键代替方向键。DeepSeek R1准确理解了需求,并成功完成了修改。随后,又要求生成更为复杂的俄罗斯方块HTML代码,虽然参数量仅为32B,但DeepSeek R1生成的游戏几乎无Bug,表现同样出色。
在逻辑能力测试方面,选择了两个问题对双A770搭建的DeepSeek R1进行测试。对于“神父去世是离职还是升职?”这一令人一愣的问题,32B的DeepSeek R1能从现实与信仰两种角度出发给出分析与解释,展现出强大的逻辑能力。而对于“变形金刚应该交车险还是人险?”这一二选一的提问,DeepSeek R1并没有死板地做出选择,而是理解了变形金刚不同形态的特征,给出了两种保险都买的绝佳答案。