【ITBEAR科技资讯】5月21日消息,Ampere Computing近日发布了一款全新的云数据中心处理器,名为"AmpereOne"。这款处理器采用了台积电的5nm工艺制造,并基于Armv8.6+指令集自研的架构。与前代产品Ampere Altra相比,AmpereOne拥有更高的核心数量,可选配136个、144个、160个、172个或192个核心。处理器的稳定频率最高可达3.0GHz。
AmpereOne的每个核心集成了两个128位矢量单元,支持多种数据格式,包括FP16、BF16、INT16和INT8。一级缓存方面,每个核心拥有16KB的指令缓存和64KB的数据缓存,二级缓存容量为2MB(上代为1MB),此外,所有核心共享64MB的三级缓存。该处理器支持八通道DDR5 ECC内存(上代为八通道DDR4),单系统最多可支持16条内存通道,最大容量达到8TB。扩展性方面,AmpereOne支持128条PCIe 5.0通道(上代为128条PCIe 4.0),这来自于32个控制器。
从功耗角度来看,AmpereOne的功耗范围为200至350W,较上代产品的10至180W有所增加。
据ITBEAR科技资讯了解,Ampere对比了AMD和Intel x86平台的性能,不过有些颇具特色。首先,在虚拟机数量方面,AmpereOne在一台占据42U 16.5千瓦机架空间的情况下,可以容纳多达7296个虚拟机,而AMD霄龙9654 Genoa和Intel至强8480+ Sapphire Rapids分别只能容纳2496个和1680个虚拟机。然而,值得注意的是,现如今的机架功耗空间已经扩大了很多,很多机架的功耗已经增至20至50千瓦,这显然对于AMD和Intel更加有利,但是Ampere并没有提及这一点。
其次,在AI性能方面,Ampere宣称在Stable Diffusion和DLRM两个项目中,与AMD霄龙9654相比,其性能分别领先2.3倍和2倍。然而,需要注意的是,AmpereOne采用的是FP16精度,而AMD使用的是FP32精度,因此这样的对比并不公平。此外,大部分负载需要使用GPU来执行FP16精度计算任务。