在云计算与人工智能大模型训练的幕后,数据中心作为不可或缺的底层基础设施,其重要性日益凸显。与无形的云计算不同,数据中心是一项长期且重大的资产投资,其生命周期往往以十年计。这意味着,一旦初期的布局失误或无法紧跟市场需求,对于建设者而言,不仅回报无望,甚至可能面临投资成本和后续运营成本的双重损失。从运营商到独立的第三方IDC厂商,再到互联网和ICT企业,作为数据中心的主要参与者,都曾经或正在面临此类挑战。
尽管近年来受到政策调整、市场需求变化以及技术门槛降低等多重因素的影响,国内数据中心的建设热情并未减退。在需求端,算力,特别是AI算力仍存在巨大缺口。然而,Scale out芯片互联等技术方案导致的算力利用率不高也是不争的事实。因此,为了尽可能满足企业客户的算力需求,数据中心的建设不仅需要迅速见效,还需具备灵活扩容的能力。
政策方面,数据中心的发展始终朝着绿色低碳的方向前进。早在2016年,《“十三五”国家信息化规划》就提出了增加IT项目投资并逐步控制新建数据中心的PUE值的要求。自2021年以来,北京、广州等地相继出台了关于数据中心能耗保障的相关规定,对数据中心的PUE等能耗指标的考核愈发严格。同时,多地政策鼓励数据中心采用预制模块化等装配式建筑,一些国家级绿色数据中心已经开始积极应用液冷、高压直流等高效冷却技术、智能化运维管理技术及模块化系统解决方案。
在此背景下,数据中心预制化的解决方案逐渐受到建设者的青睐,这符合数据中心预制化、模块化的整体趋势。不过,随着时代的演进,预制化数据中心已从以通用算力结合风冷散热方案为主的上一代,逐步转变为以AI算力等多元算力结合液冷散热方案为主体的AIDC模式。
近日,钛媒体跟随浪潮信息探访了其位于济南的元脑“算力工厂”。这个智算中心是浪潮信息预制化AIDC解决方案的新典范,支撑了全球服务器大规模测试、客户POC测试、大模型开发与应用、智能化转型等多种业务场景的算力需求。
预制化数据中心通过在工厂预先集成设备模块到集装箱中并完成测试,现场只需像“乐高”一样快速组装,即可形成一个完整的数据中心。这种方式的优势在于与土建工作解耦,不受现场条件限制,所有机电设备在工厂预集成、预测试,接入市电、网络和水源后即可独立运行,预制装配率高,且集成工作与现场土建工作并行,大大缩短了建设工期。
根据功能的不同,集装箱可分为IT、电力、集成冷站、集成冷源、办公、走廊、电梯、楼梯等八种功能箱体,可根据不同场景和规模灵活组合,并按照功率区段分区部署,以满足不同算力应用场景的需求。对于客户而言,初期可根据资金水平和算力需求按需部署,后期可根据算力设备匹配数据中心模式进行在线柔性升级扩容,不仅支持水平扩容,还可实现竖向按需扩容,最高可达5层。
当前数据中心建设必须将绿色节能纳入考量。过去十年间,CPU和GPU的热设计功率大幅提升,单机柜功率密度也从5kW攀升至100kW以上。Scale Up带来的部署密度提升是实现Scale Out规模持续扩张的前提和基础,而液冷、智能温控等先进制冷技术则解决了Scale Up引发的散热问题。这意味着占地大、能耗高的数百兆瓦数据中心将进一步压缩为更加紧凑、节能的形态。
元脑算力工厂正是基于这一理念进行设计。一期建设规模已实现119台集装箱、419个机柜的一层部署,总容量达到10MW,使用年限可达50年。从规划到集装箱工厂生产预制、地基建设、吊装、调试等,总共耗时9个月完成交付,实际建成投运仅用时120天。
在投资建设初期,浪潮信息内部对采用集装箱方案进行了深入的论证和预想。浪潮信息服务器产品线副总经理李金波指出:“在国内,10MW以上规模的智算中心并不多。这意味着采用集装箱结构一旦上了规模,几百个集装箱进行组装实现互联互通,对技术要求非常高。同时,与楼宇建设相比,集装箱式不仅可以短时间内构建大规模集群,还可为未来基建节省更多投资。我们认为预制化是最能满足AI时代算力快速部署的需求。”
除了基建层面的预制化,元脑算力工厂还全面遵循了“高密+绿色”的未来智算中心设计理念。算力节点大量使用高密智算算力仓,将风冷机柜的负载上限提升至50kW,液冷机柜的负载上限高达130kW。为解决高密度部署带来的散热和能耗问题,浪潮信息结合液冷、光伏、储能、余热回收等多种技术,并采用智能管理平台实现IT和机房设备的控制联动,PUE可降至1.1以下。
光伏发电技术为智算中心提供清洁电力,储能技术平衡电网负荷并提高能源利用效率,集成冷站采用变频冷机实现自然冷却,并结合余热利用技术为办公区供暖。集装箱采用预制化钢结构建筑,材料回收率超80%,施工现场无粉尘噪音,建筑垃圾少,进一步实现了绿色环保。
元脑算力工厂的建设成效显著:一是建设周期大幅缩短,将同等规模智算中心的建设周期从18个月缩减至4个月,工期缩短了近80%;二是弹性可扩容,可根据业务规模分期高效进行水平及竖向扩容,有效节省前期投入成本;三是绿色节能,全年节省电费近2亿元,大幅降低运营成本。据测算,4个集装箱、千卡规模算力,每年可节省电费400万元。
面对复杂多变的市场需求和客户挑战,如何快速构建绿色高效的智算中心成为众多企业客户的共同难题。预制化智算中心的优势在于大幅缩短交付周期。然而,每个客户的业务场景、地理环境、能源政策等因素各不相同,因此没有最好的方案,只有最适合的方案。对于算力基础设施厂商而言,深入了解客户需求才能提供真正符合其实际需求的解决方案。
浪潮信息的实践经验已在互联网、金融、能源、教科研、汽车等行业落地,但更多是AIO或临建式的预制化模式。李金波表示:“以高校为例,有时会有一些偶发性算力需求,受制于科研经费、场地空间等因素,智算中心规模较小,采用两三个集装箱即可拼接建成。使用十几年达到生命周期报废后,对高校在场地和投入上也不会有太大影响。在海外,考虑到初期建设成本问题,企业为快速上线应用,也可以采用这种方案。”
国际咨询机构ResearchAndMarkets发布的报告指出,模块化数据中心市场预计将从2024年的299.3亿美元增长到2030年的794.9亿美元,预测期内的复合年增长率为17.7%。小型数据中心作为模块化数据中心市场的一个重要细分市场,旨在满足客户对本地化计算能力日益增长的需求,同时优化空间和能源使用。关键优势在于靠近最终用户,减少延迟并提高边缘计算等应用的性能,同时配备先进的冷却解决方案,提高能源效率并降低运营成本。