NEWS INFORMATION新闻动态

关注微信公众号

首页  >   新闻动态  >   工作组动态

OPPO 夏忠谋:数据中心散热新技术—浸没式液冷A100训练集群

2023-05-25

近日,ODCC(开放数据中心委员会)“浸没液冷智算产业发展论坛·AI Infra先进散热研讨会”在京顺利召开,OPPO AI算力架构师夏忠谋分享了A100训练计算集群在计算架构及制冷技术方面的优势。

1.png

OPPO与浸没液冷的先行者阿里共同开发了浸没式液冷智算集群,在计算架构上,基于OPPO的图像、语音、自然语言处理和推搜广等AI应用工作负载,兼顾未来几年发展趋势,采用了高速互联GPU卡+多网卡+存算分离架构,可支撑GPT千亿大模型预训练计算。

在制冷技术上,采用了浸没式液冷方案,一方面摩尔定律逐渐失效,采用堆核方式使得功耗不断攀升,风冷方案已达到极限,另一方面对数据中心越来越严格的PUE要求,采用浸没液冷能使PUE低于1.15,同时制冷的热能从“排出”变成“输出”,输出的稳定的高品位的余热可服务于数据中心周边企业和住户,也带动了就业和社会收入。实测数据显示,相比风冷集群,单位计算能耗降低25%,单机柜功率提升433%,噪音下降40%。浸没液冷也处于起步阶段,材料、工艺、运维等都有很大提升空间,后续需要更多企业、用户参与一起,完善产业链,丰富浸没液冷生态,共同推动绿色数据中心发展。

液冷项目联系人:

谢老师  xielina@caict.ac.cn

于老师  yumeize@caict.ac.cn