首頁 企業 液體冷卻即將進入您的資料中心:戴爾科技世界重點介紹這些選項

液體冷卻即將進入您的資料中心:戴爾科技世界重點介紹這些選項

by 布賴恩·比勒

人工智慧正在推動伺服器功耗急劇上升——保持這些晶片冷卻的唯一方法是在資料中心使用液體冷卻。

戴爾科技世界的亮點不僅在於戴爾強勁的產品發布,還在於其合作夥伴在展會上展示的解決方案。今年,沒有什麼比展會上各種液體冷卻解決方案更受關注的了。人們對液體冷卻非常感興趣,以至於我們強調這些技術的社交媒體影片在過去幾週內就獲得了數百萬次觀看。除非您的工作負載完全是普通的,否則液體冷卻將會進入您的資料中心。這是一份入門指南,重點介紹了哪些技術可能適合,具體取決於您處於液體冷卻循環的哪個階段。

直接到晶片內部循環

到目前為止,在資料中心採用液體冷卻的最簡單方法是透過封閉的內部循環。與遊戲 PC 中的 CPU 冷卻器非常相似,這些系統利用帶有大型散熱器的冷板來帶走關鍵組件的熱量。 捷酷 提供這樣的解決方案,他們展示了戴爾的英特爾和 AMD 系統以及內部閉環。

 

在Instagram上查看此帖子

 

StorageReview (@storagereview) 分享的帖子

這些系統的最佳之處在於,它們可以顯著節省電力,根據 JetCool 的說法,可以節省 10-15% 的電力,而且無需複雜地利用設施用水。在某些資料中心,完整的液體冷卻迴路甚至可能不是一種選擇,因此這種方法是風冷伺服器的最佳替代方案。

JetCool 內部循環

雖然閉環的節能效果不會像其他替代方案那麼高,但對於資料中心來說,即使節省 10% 也是巨大的,因為資料中心受到單一機架可支援的電量的限制。由於封閉的內部循環,小幅節能可能意味著每個機架支援一台或兩台額外的伺服器。

另外值得注意的是,戴爾在 PowerEdge XE8640 GPU 伺服器上使用內部循環,您可以在 我們最近製作的 YouTube 影片.

直接到晶片的全液體迴路

內部循環的進展是與設施水連接的循環,不僅有助於將熱量從伺服器中排出,而且還有助於將熱量排出資料中心。不過,也有一些折衷的措施,我們推薦了 酷IT系統 在最近的一篇評論中,我們 對 R760 進行液冷改造,添加冷板。我們還安裝了一個小型歧管和冷卻劑分配裝置,儘管我們的 CDU 是從液體到空氣的。這意味著我們正在吸收 R760 的熱量,但我們仍然將其傾倒到資料中心並需要將其移除。

附 CoolIT 冷板的戴爾 R760

我們的小型部署可以支援一些伺服器,但如果您要為新的液冷做好準備 戴爾 PowerEdge XE9680L GPU 伺服器 例如,您需要一個更強大的解決方案。到目前為止,CoolIT 一直是戴爾液冷路線圖的重要組成部分,他們正在展示他們的新產品 Omni 冷板、新的 CDU 以及各種其他冷卻技術。

但即使直接晶片冷卻也不是一回事,有多種方法可以實現它。這並不比 祖塔核心 解決方案,它使用獨特的兩階段方法為晶片提供冷卻。 ZutaCore 進行了一些展示,亮點是改裝 XE9680 GPU 伺服器 ZutaCore 已轉換為 14 個冷板 - 8 個用於 GPU,4 個用於交換機,2 個用於 CPU。這是一項非常引人注目的技術,我們擁有一項 廣泛的播客關於 如果您想了解更多信息。

 

在Instagram上查看此帖子

 

StorageReview (@storagereview) 分享的帖子

為了強調直接晶片冷卻的另一個版本,我將重點放在 Chilldyne。雖然嚴格來說不是在 DTW 博覽會上,但我們確實在酒店的一家酒吧會見了他們的一些團隊成員,在我們看來,這已經足夠接近了。公平地說,Chilldyne 是戴爾合作夥伴,我們在戴爾實驗室見過他們的套件。

Chilldyne 因其負壓液體迴路而聞名,這意味著即使管線被切斷,也不會造成液體損失。洩漏是阻礙資料中心採用流動性的第一大擔憂,因此 Chilldyne 肯定在這方面有所作為。我們製作了一個簡短的影片來突出他們的技術,這是我們今年最受歡迎的社交影片之一。

 

在Instagram上查看此帖子

 

StorageReview (@storagereview) 分享的帖子

後門熱交換器 (RDHx)

後門熱交換器可以是替代伺服器機架後門的被動式或主動式熱交換器。它們本質上是從伺服器排出的空氣中吸收熱量,並將其卸載到液體迴路中進行冷卻。被動門基本上是安靜的,沒有風扇。 Active RDHx 可以為 RDHx 添加風扇以提高效率。

雖然 RDHx 並不是 DTW 的很大一部分,但由於兩個關鍵原因(在頻譜的兩端)值得一提。首先,它們是向資料中心添加液體冷卻的相對簡單的第一步,並且可以部署在各種獨立配置中。或者,RDHx 可以與其他液體冷卻技術配合使用,透過液體冷卻實現 100% 熱量回收,這是上週拉斯維加斯的一個主題。

利伯特 DCD50 RDHx

利伯特 DCD50 RDHx

任何在機架規模工作的人都可以以某種形式獲得 RDHx,包括 Dell Tech World 的公司,如 CoolIT 和 維蒂夫。還值得注意的是,戴爾將 RDHx 定位為 XE9680L部分推送”,“70KW 設計採用後門熱交換器 (RDHx) 風冷,支援 64 個 GPU – 非常適合 NVIDIA H100/H200/B100。我們還有一個 100KW 設計,採用 RDHx 液體冷卻,支援 72 個 B200 GPU——這是業界最緊湊的機架規模架構。

全浸入式液冷

到目前為止,我提出的所有資料中心液體冷卻選項都是相對主流的。根據我們收到的回饋,完全沉浸是指事情變得更加危險。顧名思義,該技術本質上採用原樣伺服器,進行一些修改,並將它們浸泡在工程流體(專有的介電冷卻劑)中。 BP 外殼類型 除此之外,兩者都為此目的生產液體。我們已經看到全浸入式機架在 DTW 等貿易展會上出現了 3-4 年。今年兩 潛水器 GRC的 提供沉浸式演示。

 

在Instagram上查看此帖子

 

StorageReview (@storagereview) 分享的帖子

單相浸沒式冷卻的想法(兩相曾經有一段時間但基本上已經失寵)在許多方面都是有意義的,並且是加密貨幣礦工的最愛。當考慮像 PowerEdge 這樣的企業伺服器時,規則會發生一些變化。對於伺服器,第一步是拆除風扇,這可以立即節省電力。對流或幫浦輔助對流使流體流過伺服器的元件。熱量可以透過熱交換器捕獲並從資料中心排出。

該系統消除了對空氣冷卻的需求,GRC 和 Submer 都指出,數據表明浸入式冷卻的伺服器實際上比空氣冷卻的伺服器具有更長的壽命和更少的服務事件。但這是最大的障礙之一,伺服器必須從池中出來才能獲得服務,雖然這並不難,但比維護傳統的機架式設備更尷尬。浸入水中的服務器必須從液體中取出,稍微乾燥,然後放在桌子上進行維修。不是不可能的行動,而是需要一點努力的行動。

與標準立式機架相比,還有其他一些問題涉及儲罐的重量以及流體和占地面積效率。浸入式產業認為,水箱可以堆疊,而且浸入式水箱中的系統實際上效率更高。我們有一個 關於沉浸式的好播客 如果您想了解更多信息。

結論

如果您的組織正在從事人工智慧或其他使用密集 GPU 盒的應用程序,那麼液體冷卻將無法阻止您的資料中心。如果您今天購買了 8 路 GPU 伺服器,那麼當一年後它出現在您的裝卸碼頭上時,如果您尚未投資於完整的液體循環,那麼它內部很可能會形成一個閉環。好消息是,該行業正在識別阻礙採用的問題,例如缺乏通用歧管連接器,並努力解決這些問題,因此企業更容易接受液體冷卻。

參與 StorageReview

電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱