近期,YouTube 知名频道 Compusemble 对英伟达 RTX 神经纹理压缩(NTC)技术进行了深入基准测试,揭示了该技术在3D工作负载中的卓越表现。测试数据表明,与传统纹理压缩技术相比,RTX NTC 能够将纹理内存大小惊人地降低96%,展现了其革命性的压缩效率。
在测试中,Compusemble 使用了 RTX 4090 显卡,并针对1440p和4K两种分辨率进行了对比。测试包含两种模式:“NTC 转码为 BCn”和“样本推理”。前者在加载时将纹理转换为 BCn 格式,后者则仅对渲染特定视图所需的单个纹理元素进行解压缩,从而进一步缩减内存占用。
在1440p分辨率下,当启用 DLSS 超分辨率功能时,“NTC 转码为 BCn”模式成功将测试应用的纹理内存占用从272MB削减至98MB,降幅达64%。而“样本推理”模式更是将纹理大小压缩至仅11.37MB,与非神经压缩技术相比,内存占用减少了95.8%,与先前的神经压缩模式相比也减少了88%。
尽管 RTX NTC 技术带来了显著的内存节省,但其对性能的影响也不容忽视。特别是在“样本推理”模式下,性能下降较为明显。然而,值得注意的是,测试使用的是上一代 RTX 4090 显卡,随着新一代 RTX 5090 显卡的推出,性能损失可能会有所缓解。
在“NTC 转码为 BCn”模式下,平均帧率与未启用 NTC 时几乎持平。但在“样本推理”模式下,性能下降显著,FPS 从1600多帧的中等水平降至1500多帧,1%低帧率更是降至840帧左右。不过,当使用 TAA 抗锯齿而非 DLSS 超分辨率时,虽然内存减少情况相同,但 GPU 性能表现却有所不同,三种模式下的运行速度均明显快于 DLSS,FPS接近2000帧。
将分辨率提升至4K后,性能下降更为显著。在启用 DLSS 的情况下,“NTC 转码为 BCn”模式的平均 FPS 约为1100帧,“样本推理”模式则略低于1000帧,两种模式的1%低帧率均在500帧左右。而关闭 DLSS,改用原生分辨率搭配 TAA 抗锯齿时,“NTC 转码为 BCn”模式的平均 FPS 提升至约1700帧,“样本推理”模式则约为1500帧。
Compusemble 还在4K分辨率下,针对“样本推理”模式测试了协同向量功能。启用协同向量时,平均帧率保持在1500帧左右;而关闭协同向量时,平均 FPS 急剧下降至略低于650帧。1%低帧率在启用协同向量时也明显高于关闭时的表现。
RTX 神经纹理压缩技术作为英伟达近年来开发的新技术,利用现代 GPU 中的张量核心进行纹理压缩,彻底颠覆了自1990年代以来一直沿用的传统块截断编码技术。RTX NTC 能够支持比当前 GPU 运行的纹理分辨率高出四倍的纹理,为3D应用和游戏带来了全新的可能。
尽管 RTX NTC 技术目前仍处于测试阶段,尚未确定发布日期,但其前景已备受瞩目。英伟达官方确认,该技术的最低 GPU 要求为 RTX 20 系列显卡,并且已在 GTX 10 系列显卡、AMD Radeon RX 6000 系列显卡以及 Arc A 系列显卡上得到验证。这意味着未来 RTX NTC 技术有望在非 RTX 显卡甚至游戏主机上得到广泛应用,为玩家和开发者带来更加高效的纹理处理体验。