近期,科技圈传出了一则关于NVIDIA下一代AI服务器的消息。据知名分析师郭明錤的最新研究报告,NVIDIA在为其备受期待的GB300和B300 AI服务器开发过程中,尝试引入DrMOS技术进行测试,然而,这一尝试却遭遇了不小的挑战。
具体而言,NVIDIA在测试阶段发现,由AOS公司提供的5x5 DrMOS芯片存在严重的过热问题。这一问题不仅可能影响GB300和B300的量产进度,还可能改变市场对AOS公司相关订单的预期。AOS公司在这方面的设计经验虽然丰富,但显然,这次他们在产品的热管理方面遇到了难题。
郭明錤在报告中指出,NVIDIA之所以优先选择AOS的5x5 DrMOS进行测试,主要是出于增强对MPS公司的议价能力、降低成本以及看重AOS在设计和生产方面的经验的考虑。然而,现实却给NVIDIA泼了一盆冷水。
据供应链消息透露,AOS的5x5 DrMOS过热问题并非仅仅源于芯片本身,而是涉及到系统芯片管理等多个方面的设计不足。这意味着,要解决这个问题,可能需要从多个角度入手,进行全面的优化和改进。
面对这一困境,NVIDIA显然不会坐以待毙。如果AOS公司在规定时限内无法解决过热问题,NVIDIA可能会考虑引入新的5x5 DrMOS供应商,或者转向使用成本更高但散热效能更佳的5x6 DrMOS。后者对MPS公司来说无疑是个好消息,因为他们在5x6设计上拥有技术优势。然而,对于NVIDIA来说,这可能意味着需要付出更高的成本。
NVIDIA原计划在2025年中期推出其全新一代AI服务器“BlackwellUltra”GB300。这款服务器在散热系统上进行了前所未有的创新,采用了全水冷设计,旨在突破AI算力的局限。然而,如果AOS的过热问题无法得到妥善解决,GB300/B300系统的量产可能会面临延期。
DrMOS技术是一种将驱动器和MOSFET集成在一个芯片上的技术,主要用于电压调节器,以提高电源系统的效率和性能。NVIDIA此次在AI服务器中引入这一技术,原本是为了进一步提升服务器的性能和稳定性。然而,现实却让他们不得不面对这一技术带来的挑战。