主页 Enterprise JetCool SmartPlate 系统:弥补空气冷却和液体冷却之间的差距

JetCool SmartPlate 系统:弥补空气冷却和液体冷却之间的差距

by 迪伦·布莱恩

JetCool SmartPlate 系统是液体冷却的绝佳切入点——尤其是在无法使用完整液体循环时。

液体冷却比传统的空气冷却具有显著的优势,尤其适用于高密度计算环境。通过高效地散发处理器的热量,液体冷却可以降低能耗、降低工作温度并提高整体系统性能。JetCool 的 SmartPlate 系统是独立闭环液体冷却的绝佳切入点,尤其适用于无法使用完整液体循环的环境。

在计算和 GPU 服务器中添加闭环并不是什么新鲜事;我们已经在许多密集型服务器平台(如戴尔、HPE 和联想)中看到了闭环。这项技术很棒,因为它消除了对复杂基础设施修改的需求,从而降低了前期成本和持续维护要求。闭环系统的优势不如 CDU 和设施用水的完整循环那么强大,但它们仍然具有许多节能优势。

JetCool 是我们在 SuperCompute 等贸易展会上看到的名字,最近一次是在去年 100 月的戴尔科技世界大会上。作为一款适用于 CPU 和 GPU 驱动的高性能工作负载的解决方案,它们正受到关注。JetCool 支持各种英特尔和 AMD CPU 以及 NVIDIA H200 等插槽式和插卡式 GPU。JetCool 还发布了其工程师在 GBXNUMX Superchip 和下一代 CPU 架构等新兴平台上的成果。

 

在Instagram上查看此帖子

 

StorageReview (@storagereview) 分享的帖子

JetCool SmartPlate 系统现已通过戴尔及其渠道合作伙伴在全球范围内发售,这些合作伙伴提供全面的全球服务、支持和保修范围。在服务器上添加 JetCool 大约比基本服务器配置价格高出 10%。

为了更好地了解系统的工作原理,JetCool 向我们发送了带有闭环的 Dell PowerEdge R760 系统以供审查。

JetCool 有何不同?

JetCool 的专利微对流冷却技术利用流体喷射来瞄准热点,与传统方法相比,可提供卓越的传热和冷却效率。这种有针对性的液体冷却也提高了效率,Jetcool 声称冷却能耗可减少高达 50%,总功耗可降低近 18%。该解决方案在外观上与其他闭环液体冷却装置相似,但 JetCool SmartPlates 却与众不同。

Jetcool 的 SmartPlate 系统图

SmartPlate 系统中的流体喷射将冷却剂推到芯片上的热点上,从而比被动流动更有效地散热。这种冷却解决方案的有效性使 Jetcool 系统能够使用温度更高的冷却剂运行,同时仍能保持良好的性能。反过来,这种冷却效率可以提高冷却的能效,而且由于气流要求较低,它不仅可以降低 CPU 的温度,还可以降低整个数据中心的温度。降低数据中心温度可以降低整个设施的持续运营成本。

大多数数据中心提供商都根据美国采暖、制冷与空调工程师协会 (ASHRAE) 的指导方针(遵循 A1-A4 标准)建造其设施。这些标准规定,对于风冷数据中心,建议的温度范围为 64.4°F 至 80.6°F。随着组件性能的提高和计算任务需求的增加,新型高密度服务器会释放出更多的热量。这给数据中心带来了困难,因为 ASHRAE 的新 H1 标准规定环境温度应冷却到 64.4°F 至 71.6°F 的范围。这带来了升级整个设施的冷却能力(这会增加电力需求和运营成本)或安装全设施液体冷却系统的选择。这两种选择都会带来巨大的前期成本。 JetCool 系统旨在帮助将冷却转移到服务器机箱内,减少降低空气冷却温度的需要,并将需求保持在典型的 ASHRAE A1-A4 指南范围内,同时最大限度地降低运营成本的影响。

JetCool 的 SmartPlate 系统有助于改善的另一个领域是噪音污染。借助 SmartPlate 解决方案,由于机箱的风扇速度降低,系统可以更安静地运行 13dBA。这种更安静的运行减少了设施的噪音污染,并有助于减少设备振动。JetCool 表示,13dBA 的降低可将设施噪音降低多达 4 倍。他们对 R760 的研究发现,使用风冷系统时,噪音从 77.8 dBA 开始,而 JetCool 的 SmartPlate 系统时钟频率为 64.4 dBA。

JetCool 的另一个重要价值是易于部署,因为他们的解决方案不需要任何特殊的东西。部署 JetCool 的解决方案比数据中心的 DLC 系统具有低得多的部署和维护成本 — 不需要额外的外部硬件、管道、维护或安装成本。JetCool 的独立系统可以带来相当大的好处,可以在相同的占地面积内获得更高的效率,节省时间,然后再转向使用更高性能组件的完全液体冷却。

JetCool 硬件故障

JetCool 支持搭载英特尔第四代和第五代 Xeon 和第四代 EPYC CPU 的平台。这些系统的 TDP 额定值在 4U 机箱中高达 5W,在 4U 机箱中高达 850W。JetCool 系统支持的进气温度范围为 1°F 至 1,200°F。如前所述,JetCool 将支持更多芯片和 GPU,NVIDIA GB2 的开发工作已经在进行中。

JetCool 提供的这个特定平台建立在 Dell Poweredge R760 平台上;其规格如下。

JetCool 测试系统规格
CPU的 2 个英特尔至强铂金 8470Q(各 52C 104T)
内存 768GB(12x64g)5600MHz DDR5

下面是 Jetcool 发给我们的 R760 平台的照片。其组件清晰可见,JetCool 记录的图像和性能与我们在实验室中看到的一致。

下面是 JetCool 提供的照片,展示了其 SmartPlate 解决方案中的组件布局;不熟悉液体冷却的人会看到一些额外的部件,如散热器、泵和水箱。

下图显示了泵、泵控制器和冷却板。与其他解决方案相比,JetCool 冷却板非常薄,但冷却效果却非常好。

如上所述,系统核心的这个形状奇特的部件是冷却液储存器。这个储存器不大,但工作得很好。整个回路可容纳约 10 盎司的液体,在服务器保修期内无需维修或重新填充。

设计中还需要注意的是,即使散热器靠近风扇,也有足够的气流通过底盘流向系统背面。上图中很难看清,但也有一个间隙可以将气流引导至散热器下方的 DRAM。

配备 JetCool Performance 的 Dell PowerEdge R760

通常情况下,我们会使用风冷散热器测试此类系统,然后换上液体套件以获取性能数据,或将液体回路与风冷服务器中的相同 CPU 进行比较。 这次这两个选项都不是好选择,所以我们请 jetCool 帮忙进行一些自己的测试。

JetCool 在内部测试中提供了其 R760 平台的数据。这些数字比较了风扇速度、环境温度、CPU 最高温度和服务器总功耗。它们表明,即使低于 JetCool Smartplate 系统的最大容量,它也能达到风冷解决方案的最大性能,而且节省一些开销。

空气冷却性能

风扇转速 %PWM 环境温度(℃)由 TC 测量 全局最高 CPU 温度 (C) (CPU 1) 全局最高 CPU 温度 (C) (CPU 2) 服务器功率(瓦)
100% 24.8 62 62 1340.97
90% 24.9 64 62 1279.8
80% 24.3 65 64 1218.07
70% 24.0 66 66 1171.23
60% 23.9 67 68 1133.23
50% 23.03 70 71 1094.87

JetCool SPS 性能

风扇转速 %PWM 环境温度(℃)由 TC 测量 全局最高 CPU 温度 (C) (CPU 1) 全局最高 CPU 温度 (C) (CPU 2) 服务器功率(瓦)
100% 24.6 57 56 1393.47
90% 24.15 58 57 1327.95
80% 23.9 59 58 1265.47
70% 23.8 60 59 1217.43
60% 23.7 62 62 1179.33
50% 23.5 65 65 1149.70

考虑到风扇和 JetCool Smartplate 系统之间的功率差异,该系统中的 CPU 温度为 62C,风冷系统处于峰值风扇速度,而 JetCool SPS 仅为 60%。JetCool 的 SPS 提供的冷却效率差异导致在相同性能下功耗降低 214W。这个功率减少乘以仅五台服务器,大约节省了 1KW 的功率。

空气与 JetCool 风扇转速 %PWM 环境温度(℃)由 TC 测量 全局最高 CPU 温度 (C) (CPU 1) 全局最高 CPU 温度 (C) (CPU 2) 服务器功率(瓦)
风冷 100% 24.8 62 62 1393.47
JetCool SPS 60% 23.7 62 62 1179.33
区别 214.14

我们并不完全依赖 JetCool 数据。下图显示了我们测试中 JetCool 解决方案在一致工作负载下的温度稳定性。我们在 Pi BBP 数字提取上运行了 Y-Cruncher,数字为 10 万亿,耗时约 40 分钟。

在本次测试中,我们看到核心时钟在负载下降至 2300 MHz 并保持稳定,除了几次峰值之外。在这里,SmartPlate 系统经过测试以保持温度稳定,并且没有令人失望。在约 40 分钟的持续负载期间,CPU 温度飙升至 60°C,仅达到 61°C 的峰值,然后在测试后迅速下降。

基准性能

除了热测试外,我们还运行了标准服务器套件。我们没有英特尔专用液冷“Q”CPU 的良好对比,但如果它有助于比较此版本与我们过去评测过的其他版本的性能,我们仍会在此处提供数据。

  • 戴尔PowerEdge R760
  • CPU:2 个 Intel Xeon Platinum 8470Q(每个 52C 104T)
  • 内存:768GB(12x64g)5600MHz DDR5

Cinebench 2024

对于 Maxon 的 Cinebench 2024 测试,我们看到多核得分为 5,215 分,单核得分为 71 分,MP 比率为 73.53 倍。

Cinebench 2024 JetCool R760(2 个 Xeon Platinum 8470Q、768GB DDR5)
CPU 多核 5,215点
CPU单核 71点
MP比率 73.53x

 Cinebench R23

对于 Maxon 的 Cinebench R23,我们看到多核得分为 105,569 分,单核得分为 1,252 分,mp 比率为 84.32x。

Cinebench R23 JetCool R760(2 个 Xeon Platinum 8470Q、768GB DDR5)
CPU 多核 105,569
CPU单核 1,252
MP比率 84.32x

搅拌机 4.0 CPU

对于 Blender 4.0 CPU 测试,JetCool R760 平台的 Monster 得分为 948.049,Junkshop 得分为 630.348,Classroom 得分为 476.018。

搅拌机 4.0 CPU JetCool R760(2 个 Xeon Platinum 8470Q、768GB DDR5)
怪物 948.049
旧货店 630.348
课堂 476.018

搅拌机 4.1 CPU

对于 Blender 4.1 CPU 测试,JetCool R760 平台的 Monster 得分为 930.390,Junkshop 得分为 644.007,Classroom 得分为 473.364。

搅拌机 4.1 CPU JetCool R760(2 个 Xeon Platinum 8470Q、768GB DDR5)
怪物 930.390
旧货店 644.007
课堂 473.364

极客跑分 6 CPU

在 Geekbench 6 CPU 上,JetCool R760 平台的单核得分为 1,814,多核得分为 19,076。

极客跑分 6 CPU JetCool R760(2 个 Xeon Platinum 8470Q、768GB DDR5)
单核成绩 1,814
多核成绩 19,076

Blackmagic RAW 速度测试

对于 Blackmagic Raw Speedtest,我们看到 Dual Xeon Platinum 141Qs 的帧率为 8470FPS。

黑魔法RAW JetCool R760(2 个 Xeon Platinum 8470Q、768GB DDR5)
8K 中央处理器 FPS 141

Blackmagic Disk 速度测试

对于 Blackmagic Disk Speedtest,我们正在测试 Raid0 中四个 Dell NVME SSD 的配置。

Blackmagic Disk 速度测试 JetCool R760(2 个 Xeon Platinum 8470Q、768GB DDR5)
填写 11,704.1 MB / s的
阅读 9,762.7 MB / s的

Y-粉碎机

y-cruncher 是一款多线程可扩展程序,可以计算 Pi 和其他数学常数,精确到万亿位。自 2009 年推出以来,它已成为超频者和硬件爱好者的热门基准测试和压力测试应用程序。在这里,JetCool 平台的全面速度令人印象深刻。

Y-粉碎机 JetCool R760(2 个 Xeon Platinum 8470Q、768GB DDR5)
1B 5.270秒
2.5B 14.405秒
5B 31.490秒
10B 67.704秒
25B 191.599秒
50B 423.891秒

7-ZIP

流行的 7-Zip 实用程序包括我们用于性能测试的内存和 CPU 基准测试。

7 Zip JetCool R760(2 个 Xeon Platinum 8470Q、768GB DDR5)
压缩
当前 CPU 使用率 3,546%
当前额定值/使用情况 4.849 吉普斯
额定电流 171.925 吉普斯
产生的 CPU 使用率 2,551%
结果评级/使用情况 4.879 吉普斯
结果评级 173.263 吉普斯
解压
当前 CPU 使用率 3,865%
当前额定值/使用情况 4.060 吉普斯
额定电流 156.886 吉普斯
产生的 CPU 使用率 3,880%
结果评级/使用情况 4.038 吉普斯
结果评级 156.689 吉普斯
总评分
总 CPU 使用率 3,716%
总评分/使用情况 4.458 吉普斯
总评分 164.976 吉普斯

UL Procyon 2.7 AI 计算机视觉

对于 UL Procyon AI 计算机视觉,我们发现在 REAL-ESRGAN 之前推理时间非常快。我们的总分也达到了 141 分。本次测试使用 Xeon Platinum 8470Qs 进行推理。

为了与其他机器进行比较,UL 宣布 Procyon 2.7 之前的所有版本由于评分不同将无法进行比较。

南河三推理时报 JetCool R760(2 个 Xeon Platinum 8470Q、768GB DDR5)
总体得分 141
移动网络 V3 7.53毫秒
残差网络50 9.14毫秒
盗梦空间V4 29.64毫秒
深实验室V3 26.52毫秒
优洛V3 31.51毫秒
真爱斯甘 1,123.52毫秒

结论

凭借 JetCool 专有的喷嘴配置、局部冷却和较低的压力需求,JetCool SmartPlates 比传统散热器更具优势。此外,这种解决方案并不复杂,JetCool 还有一些有趣的技巧,比如 SmartPlates 中的专利喷嘴可将冷却剂压入热点。不过,从根本上讲,如果您的组织拥有配备 JetCool 的 R760,您从外部不会知道这一点,除非您注意到与风冷服务器相比,其运行更安静。

JetCool 于 2023 年与 Sabey 数据中心联合发布了一项案例研究,以评估效率差异,测试了 Poweredge R740XD。“在 Sabey 的评估中,与风冷服务器相比,由 SmartPlate 系统冷却的服务器的功耗降低了 13.5%。由于系统的液体冷却剂通过冷板直接从电子元件吸收热量,因此无需强烈的气流,从而显着降低了风扇速度。” Sabey 还看到了许多其他好处,包括更低的排气温度和更少的空气处理器负载。Sabey 案例研究的其余部分可以找到 这里。.

由于 CPU 和 GPU 功耗巨大,数据中心已经开始竞相应对现代服务器的巨大功率需求,而液体冷却是满足这些需求的唯一解决方案。值得庆幸的是,液体冷却有很多选择,但并不是每个人都能或愿意安装带有设施水连接的全液体循环、处理浸没式水箱或管理复杂的化学品。对于那些想要享受当今液体冷却的好处而又不想复杂的人来说,JetCool 是一个绝佳的选择。

JetCool 技术

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅