2023年6月4日,工业和信息化部主办的第31届中国国际信息通信展览会在北京国家会议中心盛大开幕。本届展会以“打通信息大动脉 共创数智新时代”为主题,包括展览、论坛和活动三个板块。其中,由信息通信研究院主办的“算力创新发展高峰论坛”于6月5日举行,以“新型数据中心,绿色低碳先行”为主题,邀请了政府、产业界、学术界、研究机构和用户专家共同探讨。华为数据中心首席专家迟九虹应邀发表了题为《智能计算对数据中心基础设施的需求与挑战》的主题演讲。
智能计算带来的挑战
迟九虹在发言中指出,到2030年,智能计算将比2020年增长500倍。近期,以ChatGPT为代表的人工智能应用需求迅猛增长,用户角色由最初的内容消费者逐渐转变为内容生产者和二次内容加工者。由于人工智能应用所需的技能、时间和成本远低于人工劳动,各行业的人工智能与大数据计算应用得到了蓬勃发展。不论是训练阶段还是应用阶段的算力都呈现出前所未有的爆发性增长。承载算力的基础设施——数据中心与传统数据中心相比,至少有以下三个方面的变化:首先,服务器芯片功率的增加导致元器件散热成为一个问题;其次,单机柜功率密度的增加导致电力容量的增长问题;最后,快速发展的人工智能应用对机架供应提出了突发性需求。
华为的解决方案
针对上述挑战,迟九虹分享了华为在探索研究和实践方面的成果。智能计算带来了多样化的算力需求,液冷系统成为以液冷为主、风冷和水冷组合的数据中心的必备系统。目前国内主要采用的液冷技术路线有冷板式、浸没式和喷淋式。华为的冷板式液冷方案具有国产化程度高、产业链成熟、成本低和可靠性高等优势,最高支持66kW的单机柜功率密度。作为多样化散热方式下的风冷方案,华为的间接蒸发冷却方案具有分布式结构、易于维护、最大程度利用自然冷源等特点。根据外界气温和负载所需冷量的变化,该方案可以动态调节干模式、湿模式和混合模式三种工况,极大地减少了机械制冷的需求。华为还将增程式混动汽车的理念引入了数据中心的水冷系统。作为多样化散热方式下的增程式水冷方案,通过利用人工智能动态控制蓄放冷,使冷机工作效率始终保持最高状态。通过“源(绿色电力)、蓄(绿色蓄冷)和用(智能用冷)”的三元组,有效降低了电力使用效果(PUE)8%,利用峰谷电价差使年度电费下降20%,实现了数据中心园区绿色能源的高效利用。
应对机架功率密度提升的挑战
迟九虹介绍到,随着机架功率密度逐步提升,与之匹配的配电间面积也将逐步占据IT机房的空间。当机架功率密度进一步提升至65kW时,配电间面积将超过IT机房面积的两倍以上,严重挤占了IT机房的可用空间。因此,“高密化”的电力系统也成为必要的解决方案。为了应对这一挑战,华为开发了高密电力模块,该模块融合了从中压变压器到负载馈线端的全功率链路。通过创新的融合架构和超高密度的不间断电源(UPS)集成,该模块大幅提高了供电效率,节省了配电间面积的40%。
人工智能应用的快速发展
据了解,由于便捷、高效和低成本的优势,人工智能应用呈现出快速突发的特点。ChatGPT的用户增长速度仅用了两个月就达到了1亿用户,远远超过了传统应用的增长速度。这对数据中心的算力和机架供应提出了新的需求。传统数据中心基础设施的建设往往需要24个月的时间,包括土建和机电设备的安装。这难以满足快速突发的业务需求。为此,华为引入了建筑行业的装配式钢结构方案来进行数据中心的建设。通过预制化的钢结构与模块化的机电设备相结合,华为成功缩短了50%的建设时间。这不仅具有快速建设的优势,而且经过充分验证,其抗震性能和安全性也得到了保证。同时,该方案完全符合国家绿色可回收建筑标准。
数字经济的蓬勃发展和算力基础设施的进步
我国的数字经济正在蓬勃发展,全社会的数据总量爆发性增长,数据中心的机架年均增速超过30%。数据中心作为关键的基础设施,已成为推动千行百业应用的重要”数字底座”。迟九虹最后总结道,在以智能计算为主导的多样化算力时代,希望通过行业交流促进创新方案的孵化和落地,为中国算力基础设施的进步贡献力量。