前阵子跟几位在上海张江搞AI的朋友聊天,他们跟我倒苦水,说现在训练大模型,动辄就是上万张GPU卡。这算力是上去了,但供电问题成了“拦路虎”。你们知道吗,一个大型的万卡GPU集群,峰值功率需求能达到几十兆瓦,相当于一个小型城镇的用电量。很多地方现有的市电容量,根本不够用,扩容申请周期长、成本高,真是让人头疼。