英伟达近期推出的Blackwell架构GPU,被誉为半导体领域的巅峰之作,其复杂度前所未有,给制造、封装及测试环节带来了前所未有的挑战。据知情人士透露,这款GPU在正式投产前夕,遭遇了一系列生产瓶颈,导致初期良品率不尽如人意。面对这一困境,英伟达不得不调整策略,对GPU设计进行了细致入微的修改,并重新进行了流片,这一系列举措直接导致产品上市时间推迟了整整一个季度。
全球最大的芯片测试设备供应商Advantest的首席执行官Doug Lefever在近日的访谈中透露,相较于上一代Hopper架构,Blackwell架构的数据中心GPU测试时间大幅增加,几乎达到了三到四倍。这意味着,每一颗GPU在出厂前,都需要在不同的测试工具上经历数十次的严格检验。
随着晶体管数量的激增,测试工作的复杂性也随之呈现指数级增长。以Blackwell架构的B100/B200为例,这两款GPU内置了惊人的2080亿个晶体管,通过NVLink 5.0技术将两块独立制造的芯片紧密相连。这种创新的设计,虽然带来了性能上的飞跃,但也使得测试时间理论上需要翻倍。不仅如此,每个计算小芯片和内存小芯片(尽管HBM3堆栈已由DRAM制造商进行了初步测试)在集成到RDL中介层时,都需要进行多次的测试验证。
台积电的CoWoS-L 2.5D封装技术,为Blackwell架构GPU的封装过程增添了额外的测试步骤,有时这些测试还会分阶段进行,以确保封装中的每个组件都能正常工作,且互连稳定可靠。尽管具体的测试次数并未公开,但业内人士普遍认为,相较于前代H100,Blackwell架构GPU的测试流程要复杂得多。
Blackwell架构产品的超长测试周期,不仅反映了高性能芯片在设计上的日益复杂化,也凸显了对于AI和HPC领域应用的严苛要求。为了确保这些芯片能在各种数据中心环境中与其他组件无缝协作,同时保持卓越的性能和可靠性,业界不得不面对更加艰巨的验证挑战。这一趋势,无疑将对未来的半导体技术发展产生深远的影响。