DUG Nomad 移动数据中心通过 Hypertec 服务器和 Solidigm SSD 在边缘提供浸入式冷却 AI 和 HPC 功能。
- DUG游牧民族 它是一个坚固耐用的模块化数据中心,旨在将人工智能和高性能计算 (HPC) 直接带到边缘,无论环境多么偏远或极端。Nomad 系统采用标准尺寸的集装箱运输,提供快速部署和即插即用功能,使企业能够在数据生成地就地处理数据。
DUG 专有的浸入式冷却技术是其高效性的核心。硬件组件浸入专用介电液中,大幅提高能源效率,降低维护成本,并显著延长硬件使用寿命。这种方法能够在恶劣环境下持续运行 AI/HPC 工作负载,并通过有效管理高强度任务所需的热条件,确保性能始终如一。
为了亲身体验这个移动数据中心,我们前往华盛顿特区, 阿达森 主持了 Nomad 10 的现场部署。在现场,我们探讨了浸入式冷却计算、密集存储和高效的热管理如何在边缘提供数据中心功能。
DUG Nomad — 移动数据中心!
DUG Nomad 专为多功能性和快速部署而设计。它拥有坚固耐用的独立式外壳,专为轻松运输和快速安装而设计。其坚固的结构确保在极端条件下(从干旱沙漠到科考船)也能可靠运行,而在这些条件下,传统的基础设施部署将面临挑战甚至无法实现。交付后,Nomad 可在数小时内投入使用,并在需要的地方立即提供计算、人工智能和高性能计算 (HPC) 功能。
Nomad 技术优势的核心在于其浸入式冷却系统 DUG Cool。DUG Cool 将计算硬件直接浸入专用介电流体中。在这种情况下,Nomad 使用了嘉实多 (Castrol) 的数据中心润滑油,与您在汽车领域所熟知的嘉实多 (Castrol) 相同。嘉实多的专用润滑油可提高浸入式冷却效率,优化传热并确保硬件的长期可靠性。
这种方法通过均匀散热来有效地管理热负荷,使处理器、GPU 甚至存储设备都能以最佳性能运行,避免过热或降温。除了温度调节之外,浸入式冷却还能保护组件免受灰尘、湿气、氧化和腐蚀等环境因素(恶劣部署中常见的威胁)的影响,从而显著降低维护成本并提高整体可靠性。
Nomad 最突出的工程壮举之一,在于其在全封闭移动环境中处理热量的方式。浸没式水箱吸收所有内部组件(CPU、GPU、RAM 和存储)的热量,并通过 26U 机架两端的两个集成热交换器进行循环。从那里,一个封闭的液体回路将加热的液体循环到容器的后部,在那里,开利 AquaSnap 风冷式液体冷却器将热量排放到外部环境中。这种紧凑的冷却架构通过带有防护网的板条式进气面板吸入环境空气,并将热空气从侧面排出。由于进气和排气之间仅相差 10°C,Nomad 几乎可以在任何环境下可靠运行——地球上除了活火山以外的任何地方。
DUG Nomad 单元提供 10 英尺、20 英尺和 40 英尺集装箱的可扩展配置,可满足各种计算需求。我们探索的 Nomad 是 10 英尺型号。更大的集装箱可以容纳更多的浸没式水箱,从而增加了数据中心的占地面积。您在此处看到的 Nomad 10 可提供 26 个机架单元的可用空间。鉴于浸没式冷却服务器的密度有所提高,这对于许多用例来说可能已经足够。对于那些需要更多空间的用户来说,更大的集装箱更合适。
Hypertec 沉浸式服务器
支持 Nomad 在边缘的任务需要专门构建的服务器,而不是改装的风冷装置。 Hypertec 沉浸式 Ciara Trident 服务器 专为浸入式冷却环境而设计,并采用无风扇设计。这不仅提升了电源效率,还为提高水箱内的硬件密度创造了条件。
Hypertec 浸没式冷却服务器因其无风扇设计而脱颖而出,这在很大程度上提升了浸没式服务器的能效。这些服务器的另一个有趣设计元素是,所有存储、I/O 和电源连接都经过精心设计,位于每台服务器的前端(顶部),方便访问和日常维护。线缆专为浸没式冷却而设计,灵活且易于管理。许多其他专为浸没式冷却设计的关键组件均由 Hypertec 开发。此外,Hypertec 还提供支持各种油粘度等级的专用散热器,为客户提供浸没式冷却液的灵活性。
对于需要更多维护(而非简单的热插拔)的情况,如果服务器是较小的 Hypertec 刀片服务器,可以方便地手动从水箱中取出。Nomad 内置的小型起重系统可用于更大的存储服务器和 GPU 服务器。
Solidigm – 领先液体曲线
思考像Nomad这样的系统中边缘AI的用例时,很容易被计算和GPU服务器的重要性和效率所束缚。然而,该解决方案的部分吸引力在于能够在最边缘收集和分析数据,因为直接连接到数据中心可能不可行或效率低下。Solidigm在SSD密度方面处于领先地位,使企业能够实现高达122.88TB的卓越存储容量。这意味着在紧凑的2U Hypertec存储服务器中,最高可达近1PB的容量。
这种密度优势在像 DUG Nomad 这样的浸入式冷却环境中尤为重要,因为这种环境中的物理空间非常受限,每个机架 U 都至关重要。Nomad 客户可以利用 Solidigm 的超高密度存储解决方案,显著最大化每 U 的存储空间,从而为 GPU 服务器留出宝贵的存储空间。这种高密度、高效存储与强大计算资源之间的战略平衡,最大限度地提升了边缘部署的整体性能和容量,使 Solidigm 的高密度 SSD 成为先进、空间优化的数据中心设计的基石。
也就是说,如果客户需要更高性能的存储,Solidigm 可以通过新的 D7-PS1010 固态硬盘 系列。这些驱动器采用 PCIe Gen5 接口,显著提升了吞吐量和延迟,这对于实时数据分析和高要求的 AI 工作负载至关重要。虽然我们在这里讨论的是浸入式冷却,但 Solidigm 在液冷领域遥遥领先。他们最近推出了 全球首款液冷企业级固态硬盘 去年年底,我们讨论了 SSD 电源状态 对液冷服务器整体功耗的影响。
结语
DUG Nomad 代表了移动式浸没式冷却数据中心的未来,无论数据生成在哪里,都能提供可靠的高性能计算、GPU 和存储。该平台将 DUG 成熟的浸没式技术(其数据中心使用超过 400 个浸没式水箱)与专用 Hypertec 服务器以及 Solidigm 的超高密度闪存相结合,展现了边缘计算的无限可能。无论部署在偏远的沙漠、船舶还是城市环境中,Nomad 都能为传统基础设施无法触及的地方带来数据中心级的性能。
如果您本周参加数据中心世界大会 (Data Centre World),千万不要错过亲眼见证这个移动数据中心生态系统的精彩。欢迎莅临 DUG Technology 和 Hypertec 展位,了解浸入式冷却、高密度计算和可扩展存储如何塑造下一代边缘计算和 AI/HPC 基础设施。
本报告由 Solidigm 赞助。 本报告中表达的所有观点和意见均基于我们对所考虑产品的公正看法。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅