
各位朋友,侬好。今天阿拉来聊聊一个看似宏大,实则与我们每个人未来生活都息息相关的技术命题。当我们在手机上流畅地使用AI绘图,或者企业通过大模型优化供应链时,背后是成千上万张GPU(图形处理器)在数据中心里日夜不息地运转。特别是“东数西算”工程启动后,西部那些承载着海量算力任务的数据中心集群,其能源效率,也就是PUE(电能使用效率),已经从一个技术指标,演变成了关乎国家战略与产业可持续发展的核心课题。
现象是清晰的:一个容纳上万张高性能GPU的算力集群,其功耗可以轻松达到数十兆瓦级别,堪比一个小型城镇的用电量。这其中,真正用于计算的电能可能只占一部分,大量能源被冷却系统、配电损耗等“非计算”环节消耗掉了。PUE值越接近1,说明能源用于IT设备本身的比例越高,能效就越好。根据中国信通院发布的《数据中心白皮书(2023年)》,我国数据中心平均PUE仍存在优化空间,而“东数西算”节点对PUE提出了更严苛的要求。
数据不会说谎。我们来看一个典型的挑战:在西部某些地区,昼夜温差大,但传统风冷方案在应对GPU高密度、瞬时高热流的散热需求时,往往力不从心,导致PUE居高不下。这时,仅仅优化空调是不够的,需要从“能源侧”进行根本性的重构。这正是我们海集能深耕近二十年的领域。作为一家从上海出发,在江苏南通和连云港拥有两大生产基地的新能源储能与数字能源解决方案服务商,我们始终在思考,如何将我们在工商业储能、微电网,特别是站点能源领域积累的一体化供能与管理经验,应用到更大规模的算力基础设施中去。
那么,具体如何为万卡GPU集群“提效降耗”呢? 逻辑阶梯需要一步步搭建。首先,是“开源”,即引入绿色能源。在西部算力节点,太阳能资源往往非常丰富。利用光伏发电,直接为数据中心的部分负载供电,可以从源头上降低市电消耗和碳排放。但这带来了波动性问题——太阳下山了怎么办?
这就引出了第二步,“节流”与“调节”。这里,储能系统不再是简单的备用电源,而成为提升能效的关键角色。海集能在通信基站、物联网微站等关键站点能源场景中,早已实践了“光储柴一体化”方案。对于数据中心,我们可以将大型储能系统(例如我们连云港基地规模化生产的标准化储能柜)作为“电力海绵”。在光伏发电高峰时储存电能,在电价高峰或光伏出力不足时释放,实现削峰填谷,这不仅平抑了清洁能源的波动,更能通过参与电力需求侧响应,直接降低用电成本。更重要的是,一套设计精良的储能系统,可以作为UPS(不间断电源)的补充或部分替代,提升供电可靠性,这个思路在我们为偏远地区安防监控站点提供的解决方案中已被反复验证。
第三步,是“智能耦合”。提升PUE绝非堆砌设备,而是需要一套智慧能源管理系统(EMS),像一位经验丰富的“交响乐指挥”。这套系统需要实时采集光伏出力、储能SOC(荷电状态)、市电电价、数据中心IT负载乃至气象预报等多维数据,通过算法动态优化调度策略。海集能提供的“交钥匙”解决方案,正是从电芯、PCS(储能变流器)到系统集成与智能运维的全链条覆盖,确保发电、储电、用电环节无缝衔接,整体能效最优。
我们来看一个具有启发性的案例。虽然这不是一个直接的万卡GPU集群案例,但其原理相通。在某个位于青海的偏远气象监测超级站点,该站点需要处理海量的遥感数据,部署了高功耗的计算与通信设备。当地电网薄弱,且昼夜温差极大。海集能为其定制了一套光储一体能源解决方案,集成了高效光伏板、耐低温的专用储能电池柜(源自我们南通基地的定制化设计能力)和智能微网控制器。结果如何?该系统保障了站点7x24小时稳定运行,将站点的综合能源自给率提升至85%以上,等效PUE值得到了显著优化。这证明了,通过分布式能源与储能的精细化管理,即使在严苛环境下,也能为关键计算设施提供高效、绿色的能源保障。
所以,我的见解是,未来“东数西算”节点超大规模数据中心的能效之战,本质是“算力流”与“能源流”的协同优化之战。它不再仅仅是制冷技术的竞赛,更是如何将西部丰富的可再生能源,通过储能进行时间平移,再通过AI算法进行空间调配,最终与瞬息万变的算力需求精准匹配的全局优化。这需要像我们海集能这样的数字能源解决方案服务商,与数据中心设计方、运营商进行更紧密的、从规划阶段就开始的“跨界”合作。
最后,留给大家一个开放性的问题:当数据中心的“能源心脏”——供配电与储能系统——具备足够强的智能与弹性时,我们是否有可能重新定义数据中心的架构?例如,是否可能出现“算力跟随绿电”的调度模式,从而在更大地理范围内动态平衡计算任务与能源供给,最终实现全国算力网络整体PUE的极致优化?
——END——