近期,英伟达首席执行官黄仁勋在GTC 2025大会上分享了对AI芯片技术未来的看法。他提到,尽管共封装光学(CPO)技术被视为提升AI芯片能效的关键途径,但遗憾的是,由于其可靠性尚未达到理想标准,英伟达短期内不会将其应用于旗舰GPU芯片。
CPO技术通过先进的2.5D或3D封装方式,将光模块(例如硅光芯片)与交换芯片或计算芯片紧密结合,显著缩短了光电信号的传输距离。然而,黄仁勋强调,目前光芯片技术的可靠性相较于传统的铜导线低得多,因此,在可靠性方面,铜缆仍占据明显优势。
黄仁勋进一步指出,直接使用光子连接GPU并不划算,因为铜缆在可靠性上远超现有光子连接。他明确表示:“尽管我们仍在寻找最佳的技术组合,但目前来看,铜缆无疑是最佳选择。”不过,这并不意味着英伟达忽视了CPO技术的潜力。事实上,英伟达已经通过投资光芯片初创公司Ayar Labs,为未来布局。
Ayar Labs的硅光子技术利用光来传输数据,能够实现带宽密度的大幅提升,同时降低功耗。英伟达计划在2025年底推出的下一代数据中心网络芯片中,将有限地整合这一光互联技术,目标是实现能效的三倍提升。然而,黄仁勋也坦诚地指出,当前的技术水平难以支撑全球AI基建投资所需的指数级算力增长。
据估计,未来两年内,全球AI基建投资可能达到数百亿美元。而Ayar Labs的CEO Mark Wade认为,光子技术是突破功耗瓶颈的唯一途径。然而,他也承认,要实现光子技术的量产可靠性和降低成本,还需要等到2028年以后。
与此同时,IBM正在加速推进光互联方案。他们最新推出的集成聚合物光学波导(PWG)的光模块,不仅带宽提升了80倍,能耗也降低了五分之一。IBM表示,这一技术使得GPU的闲置时间从3个月缩短至3周,单次训练节省的电力足以满足5000户美国家庭全年的用电需求。
IBM的共封装光学模块不仅在性能上取得了突破,还在实际应用中展现了显著的节能效果。这一创新不仅为AI领域的发展提供了新的动力,也为全球节能减排事业做出了贡献。
尽管英伟达和IBM在光互联技术的发展路径上有所不同,但他们都看到了这一技术的巨大潜力。未来,随着技术的不断进步和成本的降低,光互联技术有望在AI领域发挥更加重要的作用。
黄仁勋还透露,英伟达正在积极寻找其他技术组合,以期在未来实现更高效、更可靠的AI芯片。他相信,通过不断的创新和优化,英伟达将能够引领AI领域的技术发展。