【ITBEAR科技资讯】1月9日消息,英伟达据传将在2024年第二季度为中国市场特别打造并量产一款AI芯片,以符合美国最新的出口管制规定。这款芯片被命名为H20,并被认为是这一系列中最强大的型号。然而,当被问及此事时,英伟达选择了不发表任何评论。
除了高端的HGX H20之外,英伟达还有意推出两款新的PCIe芯片,分别是L20和L2。这两款芯片同样被设计成能够满足美国的出口限制要求。不过,目前关于这两款芯片的具体细节仍然保持神秘。
据ITBEAR科技资讯了解,H20芯片原本计划在去年11月面市,但由于服务器制造商在集成过程中遭遇难题,这一计划被迫延后。有知情人士透露,由于初期产能有限,英伟达将优先满足其主要客户的需求。
根据行业分析机构SemiAnalysis的报告,尽管H20、L20和L2在算力上有所降低以符合新规定,但它们仍然保留了英伟达在AI领域的大部分功能特性。在LLM推理方面,这三款新芯片的性能预计将比现有的H100高出20%以上。
公开资料显示,NVIDIA的H100 Tensor Core GPU采用了创新的Hopper架构,并基于台积电的N4工艺制造,集成了惊人的800亿个晶体管。与前代产品相比,H100在多专家(MoE)模型的训练速度上提高了9倍。
此外,H100还配备了第四代Tensor Core和Transformer引擎(支持FP8精度),以及高度可扩展的NVLink互连技术。这项技术最多可以连接256个H100 GPU,与上一代相比,其带宽速度提高了9倍,达到了惊人的900GB/s,这得益于HDR Quantum InfiniBand网络的应用。