NEWS INFORMATION新闻动态

关注微信公众号

首页  >   新闻动态  >   工作组动态

被忽视的“生命线”——深度解读算力中心冷却液的战略价值

2025-08-05

在AI与大数据驱动的算力革命浪潮中,我们正面临前所未有的散热挑战:芯片热设计功率(TDP)呈指数增长,单机柜功率密度屡创新高。传统风冷技术无法满足高热流密度散热、高制冷能效的要求,液冷技术凭借高密(热流密度≥80 W/cm2)、高效(PUE≤1.15)两大技术优势成为高密算力中心的标配解决方案。

作为当前主流方案的冷板式液冷技术,冷却液是一个常被低估的关键要素,作为液冷系统的“血液”,其健康状态更直接反映了算力中心基础设施的“生命体征”。本文对冷板式液冷算力中心应用的四种主要类型冷却液进行了对比,并重点阐述了冷却液典型失效表现,以期为液冷算力中心管理及“预防性”运维提供参考。

一、两类主流冷却液的性能对比

超越普通循环水的关键工质

在冷板式液冷系统中,冷却液并非简单的“循环水”,而是承载散热使命的核心介质。它流经冷板(通常由铜、铝等高导热金属构成的封闭腔体),吸收芯片热量后,通过循环管路将热量传递至CDU(冷却分配单元),再经CDU将热量传导至一次侧以排至室外。这一过程对冷却液的稳定性、兼容性和长期可靠性提出了严苛要求。

微信图片_20250805135858.png

图1.1 冷板式液冷冷却液分类

当前热流密度下,二次侧冷却液主流选择分为两大类:二醇型冷却液和去离子水型冷却液,它们在性能、运维及适用场景上存在显著差异。

(1)二醇型冷却液:高可靠性的主流选择

二醇型冷却液是以乙二醇-去离子水或丙二醇-去离子水为基础液,并复配缓蚀剂、杀菌剂等添加剂形成的功能性液体。其核心优势在于:20%-25%的乙二醇/丙二醇浓度可平衡流动性、传热效率和防腐抑菌能力,避免高浓度导致的流动和传热不佳或低浓度导致的添加剂耐用性降低;此外该浓度范围的乙二醇溶液和丙二醇溶液本身对微生物即可起到一定的抑制作用,结合杀菌/抑菌剂可进一步抑制微生物生长。未来二醇型冷却液将朝着低醇且长效方向发展,进一步提升冷却工质的传热能力,降低对电子设备的损害风险。

(2)去离子水型冷却液:高效传热但运维挑战大

去离子型冷却液是以去离子水作为基础液,与缓蚀剂、杀菌剂等添加剂复配而成的功能性液体。该类冷却液相比于二醇型冷却液,其缓蚀性能的时效较短,运维检测频率较高,换液周期较短,根据检测结果需要定期补加药剂。去离子水传热性能优良、制备工艺成熟、无毒安全,也可作为冷却液备选之一,建议在项目设计阶段增加去离子水在线净化装置或制水设备。去离子水冷却液和去离子水的冰点为0℃,需额外考虑运输、储存及极端环境下的防冻措施。

冷却液作为冷板式液冷系统的“血液”,必须具备传热高效性、材料兼容性、化学稳定性、抑菌防腐性等多重能力。任何一项性能的缺失,都可能引发隐蔽性、累积性的系统风险,最终导致散热效率下降、设备损坏甚至灾难性故障。 下文将详细剖析冷却液的 五大典型失效表现。

二、五大失效表现

冷却液引发的“蝴蝶效应”

(1)腐蚀:系统寿命的“隐形杀手”

产生原因

液冷系统中的金属部件可能会因为与冷却液的化学作用而发生腐蚀,当pH 值过低溶液呈酸性时易腐蚀;氯离子半径小穿透力强,易替代钝化膜中的氧原子加速腐蚀发生;当缓蚀剂消耗不足时,无法起到防护作用。

造成后果

腐蚀现象可能会导致系统部件穿孔进而发生腐蚀泄漏,泄漏可能发生在服务器内部、CDU管路、机柜内管路或机房管路,严重时造成器件短路、设备损坏,并对服务器内部的电子元件和线路造成腐蚀,影响服务器性能,甚至发生火灾。

(2)非金属材料不兼容:密封系统的“脆弱防线”

产生原因

橡胶、塑料前置兼容性风险识别不精准,其硬度变化率、体积变化率、断裂拉伸强度变化率、拉断伸长变化率、压缩永久变形变化率、冲击强度变化率等材料力学性能在接触液体前后都需要在规定的范围内。

造成后果

密封件弹性失效造成漏液、管路脆化或老化开裂漏液、橡胶或塑料材料析出易结垢物造成流道堵塞等。

(3)污垢沉积:散热效率的“慢性病”

产生原因

腐蚀产生的铁离子会与弱碱性冷却液中的氢氧根离子结合形成沉淀;硫酸根会与某些金属离子发生反应产生沉淀,如硫酸镁、硫酸钙等。冷却液配方体系中分散剂的分散性能不足时,将导致结垢颗粒进一步生长并聚合凝聚;由微生物、细菌群体及其排泄物与冷却液中的添加剂、灰尘等组成会形成生物粘泥,并黏附在液冷系统中的换热器、管道、冷板等壁上,影响换热效果。

造成后果

堵塞管道和冷板,增加管内循环的流动阻力,降低传热效率,CPU/GPU温度骤升,可能触发意外宕机。

(4)泡沫效应:传热系统的“空气栓塞”

产生原因

冷却液压力或流速过大或运行过程中有空气混入均会形成泡沫。另外在冷却液中消泡剂稳定性下降、冷却液变质等情况下均会导致泡沫产生,在高温环境下成分活跃的缓蚀剂在流动过程成也易产生气泡。

造成后果

当冷却液中带有大量泡沫时,泡沫会附着在冷板表面,导致传热效果明显下降,同时泡沫的存在还会增大系统运行中的阻力,对泵造成气穴腐蚀等,损坏设备。

(5)细菌污染:冷却液的“活体入侵者”

产生原因

20-25%的二醇型冷却液即具有一定的抑菌功能,且配方中含有抑菌/杀菌剂,而去离子水型冷却液中杀菌/抑菌剂的快速消耗需要额外注意。

后果

细菌代谢产物中含有各种酸类,使冷却液的pH下降,当超出金属材料的最佳保护pH值范围后会引起相关金属材料的腐蚀。细菌群容易附着在液冷系统管道、换热器和冷板的表面,妨碍缓蚀剂保护膜的形成及分解缓蚀剂有效组分,造成冷却液缓蚀性能降低。

微信图片_20250805140032.png

图2.1 冷板式液冷冷却液失效表现

结语与预告

冷却液管理绝非简单的"成本项",而是算力中心液冷系统安全运行的基石。如同人需要定期体检,液冷系统也需通过专业化的冷却液检测,分析各项指标性能,给出针对性调整措施,以确保算力基础设施“健康”运行。

中国移动通信集团设计院有限公司作为液冷技术的前沿探索者,以移动内部需求为依托,深耕冷却液预防性运维管理领域的关键技术与实践挑战,致力于为算力中心液冷系统的“血液”提供全生命周期的精准监控与可靠维护保障,未来将持续与生态伙伴共话冷却液管理新范式。

下期预告

我们将深度解析:

冷却液理化与使用性能。

互动话题

您的算力中心是否已建立冷却液定期检测规范?

欢迎行业同仁留言探讨,共同推动液冷产业发展!

作者

中国移动设计院:吴宏杰、李印、刘丹、许效锐

中国信通院:刘鑫宁、谢丽娜

联系人

刘老师,15010703319

微信图片_20250805140238.jpg

ODCC秘书处联系人

刘老师 13488889649(微信同号) 邮箱:liupengyun@caict.ac.cn