【ITBEAR】近日,NVIDIA Blackwell GPU的实测数据终于浮出水面,其强悍性能引发了业界的广泛关注。此前,这款GPU的强大能力仅限于官方宣传,但现在,我们有了来自MLCommons MLPerf v4.1的权威性能测试结果,为我们揭示了Blackwell的真实实力。
在与前两代服务器HGX B200和HGX H200的对比中,Blackwell GPU展现出了显著的优势。尤其是在AI训练推理性能方面,其表现尤为突出。在GPT-3预训练项目中,相较于上一代Hopper,Blackwell的性能实现了翻倍的增长。
更为惊人的是,在Llama 2 700亿参数微调项目中,Blackwell的性能提升了高达2.2倍。这一成就得益于其先进的硬件配备,包括ConnectX-7 SuperNICs网卡、Quantum-2 InfiniBand交换机,以及第五代NVLink互连总线。这些技术保障了节点间的通信效率,使得AI训练负载能够得到平衡分配,进而提升了整体效率。
举例来说,在处理GPT-3 1750亿参数性能的任务时,Hopper需要多达256颗GPU,而Blackwell则仅需64颗,这一对比充分展现了Blackwell的高效与强大。
此次实测数据的公布,不仅印证了NVIDIA Blackwell GPU的卓越性能,更为AI领域的发展注入了新的活力。无疑,Blackwell将成为未来AI训练和推理的重要推动力。