AI算力锐不可当 英特尔新一代浸没式液冷解决方案为数据中心绿色赋能

数据中心不能失去制冷系统,就像夏天不能没有西瓜和Wi-Fi。

这并不是开玩笑,制冷系统事实上已经成为了数据中心降低服务器CPU、GPU温度的必备系统,如果制冷系统中断散热,很容易造成服务器高温宕机,影响业务运行。现如今以AI为代表的算力需求急剧攀升,加之底层芯片的功耗增加,数据中心比以往任何时候都需要“冷静一下”,但仅靠自然风冷却或者机房专用精密空调很显然不能有效解决这个问题,一方面,作为能耗大户的数据中心耗电量在逐年增加,据国际能源署(IEA)的预测,到2030年,全球数据中心的总耗电量将达到1.3万亿度,占全球电力需求的3.2%左右,高昂的电费明显不符合经济效益,另一方面,基于风冷的高PUE也难以满足国家“2030年碳达峰,2060年碳中和”的双碳战略目标。

正因如此,散热效率更高的液冷技术也在如今受到了更多的关注,相较于风冷,液冷不但可以带走更多热量,噪音品质也更好,并且由于循环效率高,耗电量也更少,所占用的物理空间也更小,这无疑为数据中心降低PUE提供了有效的思路。

“从服务器本身出发,从风冷向液冷转化也是必然的趋势,大家都知道,风扇转的越快,风速越高,散热效果也越好,但风扇消耗的能量和速度的增加并非正比,而是3次方的关系。比如风冷服务器在20CFM这个节点工作,如果将转速提高到40CFM,散热能力的改进会非常显著,但能耗的提升并不大,如果再将转速提高到80CFM,散热收益就会十分有限,而能耗却有着非常显著的增加。如今通用的风冷服务器,350W功耗风扇的转速已经处在比较高的区间,如果进一步靠风冷散热,散热收益就会降低,能耗反而会越来越大,同时风扇转速越快,噪音也会越大,也会造成服务器可靠性的下降。”英特尔资深技术专家在接受采访时表示。

深耕数据中心领域多年的英特尔在液冷领域也拥有长期的技术积累,在液冷备受瞩目的当下,英特尔正在联合生态合作伙伴通过创新合作共同推进液冷技术的发展,并牵头、参与和制定了诸多行业标准和规范,以加速液冷在数据中心中的应用。不但如此,在中国,英特尔还推出了英特尔中国数据中心液冷创新加速计划,旨在通过英特尔中国数据中心与合作伙伴的技术创新与协作,打造一个先进、可靠的数据中心液冷全方位生态系统,加速数据中心向可持续、低碳环保的绿色化发展。

在此背景之下,英特尔于不久前发布了新一代数据中心液冷解决方案:G-Flow浸没式液冷,在降低总体拥有成本(TCO)和电能利用效率(PUE)的同时,为追求卓越冷却性能的密集计算环境提供出色的散热能力、系统稳定性和易操作性,并对环境更为友好。

从本质上讲,G-Flow浸没式液冷的推出是为了解决单相浸没式液冷所面临的几大挑战,首先,由于流阻的原因,泵入机柜的大部分液体并不会流经CPU的散热器,导致机柜流速增加时CPU的变化并不会特别显著;其次,CPU散热器中虽然有自然对流导致的液体流动,但速度较慢,散热能力有限;最后,目前的单相浸没式液冷的冷却液主要包括合成油和氟碳化合物两种,前者的散热能力在300-350W之间,成本更低且对环境友好,后者的散热能力在500-600W之间,成本更高但对环境有影响,无论选择哪种冷却液,散热能力都存在软上限,提升空间有限。

而G-Flow浸没式液冷的原理就是在散热器和机柜流体出口之间增加导流管,利用重力或泵的吸力来驱动液体流过散热器,由于机柜内外的液位差是由泵控制的,冷却液的重力势能将有很大一部分转化为动能,从而显著增加通过CPU或GPU散热器的冷却液流量。这种优化的流体管理不仅实现了高效的强迫对流换热模式,而且显著提高了冷却介质的使用效率和系统散热效能。

值得一提的是,G-Flow浸没式液冷作为基于传统单相浸没式液冷技术的新架构,仅需对机柜进行少量改动,改动成本低,并且由于全部采用已有的成熟技术实现组装,实施风险也很低。

为了进一步实现机柜设计和服务器系统的设计解耦,方便客户的产品进行升级换代,英特尔还创新地引入了转接板的概念,将机柜内腔分为主腔室和回液腔两部分,当冷却液进入主腔室之后会从下向上升,达到散热器的高度后就会流入散热器,并通过下方的管道回到回液腔,之后被CDU(冷却分配单元)带回去从而完成循环。这种方式同样适用于服务器内的其他部件,可以充分满足客户对于整体系统灵活性和兼容性的需求。目前,该技术已经可以满足包括英特尔至强6、英特尔GaudiAI加速器等在内的产品散热需求,可以在为客户提供更多的冷却方案的同时,带来更好的PUE和更低的TCO。

至于一直以来都被诸多企业所担心的冷却液维护难的问题,绿色云图CEO胡世轩则以实际操作的角度进行了回答:“事实上,和很多人所想的服务器冷却液和汽车机油一样需要经常更换不同,冷却液的使用年限是非常长的,首先因为它不挥发,自然无需补液;其次浸没式液冷是在以一个非常稳定的状态下运行的,原则上是不需要更换的。到目前为止,我们对客户提供的解决方案都是10年的使用周期,这个实际上已经和数据中心的生命周期很接近了。出于保险期间,我们也会独立设计自过滤的装置,来排除运行过程中产生的微小杂质。”

此外,为了更好地让G-Flow浸没式液冷实现落地,英特尔基于中国数据中心液冷创新加速计划,联合浸没式液冷解决方案制造商绿色云图、立讯技术,服务器OEM、ODM以及合成油冷却液供应商埃克森美孚等广泛生态伙伴,合作研发了基于G-Flow浸没式液冷解决方案的样机,并经过严苛测试验证了G-Flow浸没式液冷的可行性。

当然,对液冷这种实际上已经问世多年的技术来说,普及的难点实际上在于产业化和标准化,英特尔多年来一直在积极参与和制定相关的产业和行业标准,例如与生态合作伙伴共同发布基于水的单相冷板参考设计,并且作为开放行业组织OCP的重要参与者和贡献者,与埃克森美孚等液体制造商共同制定了单相浸没式液冷相关液体的规范,从安全性、可靠性、散热能力、电气性能、环境影响等因素出发,旨在明确理想的或适宜的流体特性。

“浸没式液冷的冷却液实际上非常多样,例如氟化液、矿物油以及埃克森美孚在用的合成油,横向对比来看,全合成油冷却液还是有不少优势的。具体来说,氟化液自身包含PFAS,不易降解,对环境和人体来存在潜在的危害,而且价格也相对较高,至于矿物油类冷却液则会包含一些杂质,无论从可靠性还是电气性能方面来说,都会对服务器造成一定的影响。”埃克森美孚产品解决方案业务部门亚太区产品总监王欣补充道。

机房冷却技术的发展将在很大程度上推动着数据中心的发展,伴随AI等新一代信息技术的落地,数据中心的散热也迎来了新一轮挑战,对液冷这个面世虽早,但仍然具有很大发展潜力的技术而言,也需要更多的实践和探索,相信在英特尔持续的创造力推动之下,可以与生态合作伙伴一起推动数据中心向更高效、更节能、更可持续发展迈进,并最终全面实现绿色节能数据中心的目标。

英特尔(Intel) i7-13700KF 酷睿13代 16核24线程 睿频至高5.4Ghz 五年质保 台式机CPU 畅玩黑神话悟空¥ 2499 京东 购买