Supermicro 推出 DCBBS 和 DLC-2,這是一種模組化解決方案,用於建立可擴展、液冷 AI 資料中心,並加快部署時間。
Supermicro 宣布推出其資料中心建置區塊解決方案 (DCBBS),這是一種旨在簡化液冷 AI 資料中心部署的綜合方法。 DCBBS 將所有關鍵基礎設施元件、伺服器、儲存、網路、機架、液體冷卻、軟體、服務和支援整合在一個標準化、模組化的架構下。該計劃旨在解決建造和運營人工智慧工廠日益複雜的問題,其中訓練和推理工作負載的需求正在迅速增加。
簡化AI資料中心部署
DCBBS 擴展了 Supermicro 的既有 系統建構塊解決方案 到資料中心級別,提供預先驗證的可擴展單元,以加速規劃、建置和營運。該解決方案旨在減少部署高效能人工智慧基礎架構的時間和成本。根據 Supermicro 介紹,DCBBS 提供包含平面圖、機架立面圖、物料清單和所有必要組件的軟體包,使客戶能夠在短短三個月內從設計轉向部署。
Supermicro 總裁兼執行長 Charles Liang 指出,DCBBS 旨在為客戶提供上市時間和上線時間優勢,並提供涵蓋資料中心佈局、網路拓撲、電源和電池備援的全面解決方案。最終結果是流程簡化,降低了成本並提高了整體品質。
模組化、可擴展、可自訂
DCBBS 的核心是模組化構建塊方法,分為三個層次:系統、機架和資料中心。這種架構允許客戶根據特定要求自訂其基礎設施,從在系統層級選擇單個 CPU、GPU、記憶體和存儲,到選擇機架配置(例如 42U、48U 或 52U)以及優化散熱和佈線。初步諮詢後,Supermicro 提供符合客戶功率預算、性能目標和其他營運需求的專案提案。
256 節點 AI Factory DCBBS 可擴充單元是一項關鍵產品,為大規模 AI 訓練和推理提供交鑰匙解決方案。每個單元包含多達 256 個液冷 4U Supermicro NVIDIA HGX 系統節點,每個節點配備 2,048 個 NVIDIA Blackwell GPU,每個單元總計 800 個 GPU。這些節點與高速 NVIDIA Quantum-X InfiniBand 或 Spectrum X 乙太網路互連,支援高達 5 GB/s 的頻寬。運算結構由使用 PCIe GenXNUMX NVMe 的可擴展分層儲存、TCO 最佳化的資料湖節點和彈性管理系統補充,以實現持續運作。
推進下一代資料中心的液體冷卻
超微計算機也宣布其 直接液體冷卻 (DLC) 解決方案,推出滿足高密度、AI 優化資料中心不斷變化的需求的新技術。隨著產業迅速轉向液體冷卻以支援現代工作負載的電力和熱量需求,Supermicro 的 DLC-2 解決方案旨在實現效率、部署速度和營運永續性方面的可衡量改進。
隨著運算資源密度的不斷增加以及人工智慧和機器學習工作負載的增加,資料中心採用液體冷卻的速度正在加快。產業分析師估計,在不久的將來,液冷資料中心可能佔所有新安裝資料中心的 30%。傳統空氣冷卻已達到其實際極限,特別是當組織部署具有產生大量熱量的高效能 GPU 和 CPU 的伺服器時。
Supermicro 最新的 DLC-2 解決方案旨在正面應對這些挑戰,提供全面的端到端液體冷卻架構,支援更快的部署、降低營運成本並提高永續性指標。該公司的 DLC-2 技術旨在解決現代 AI 工作負載的熱挑戰,其中 GPU 的 TDP 可能超過 1,000W。
DLC-2 使用冷板和設施規模的液體冷卻基礎設施直接從關鍵組件(CPU、GPU、記憶體、PCIe 交換器和電壓調節器)捕獲熱量。該系統包括機架內或行內冷卻劑分配單元 (CDU)、垂直冷卻劑分配歧管以及設施側冷卻水塔的支撐。這種方法可節省高達 40% 的電力、減少 60% 的資料中心佔地面積、降低高達 40% 的用水量,有助於降低約 20% 的總擁有成本 (TCO)。
Supermicro 的 DLC-2 專為快速部署和高密度環境而設計。它支援入口溫度高達 45°C 的溫水冷卻,從而減少了對冷水機組的需求並降低了營運成本。該解決方案與 Supermicro 的 SuperCloud Composer® 軟體完全集成,該軟體提供跨運算、儲存和網路資源的集中管理、分析和編排。
DLC-2 營運優勢
- 節省高達40%的電力: 與傳統風冷系統相比,可將資料中心整體功耗降低高達 40%。冷板技術透過直接從關鍵組件(例如 CPU、GPU、記憶體、PCIe 交換器和電壓調節器)進行高效傳熱來實現這一點。資料中心可以透過最大限度地減少對高速風扇和空氣冷卻基礎設施的依賴來顯著降低能源費用和碳足跡。
- 加快部署速度並減少上線時間: 專為快速部署而設計。此解決方案提供完全整合的端對端液體冷卻堆疊,包括冷板、冷卻劑分配單元 (CDU) 和垂直冷卻劑分配歧管 (CDM)
- 利用溫水冷卻減少水消耗: DLC-2架構支援溫水冷卻,入口溫度高達45°C。此功能減少了對昂貴且資源密集的傳統冷卻系統的需求。
- 安靜的資料中心運作: 憑藉全面的冷板覆蓋和較低的風扇需求,DLC-2 解決方案可使資料中心噪音水平降至約 50dB。
- 降低總擁有成本: 除了節省能源和水資源外,Supermicro 估計 DLC-2 解決方案還可以將總擁有成本 (TCO) 降低高達 20%。冷卻基礎設施的減少、電力和水的使用量的降低以及伺服器密度的提高都有助於提高資料中心運作的成本效益。
DLC-2 技術創新
- 全面的冷板覆蓋: DLC-2 解決方案的特點是冷板覆蓋 CPU、GPU、記憶體模組、PCIe 交換器和電壓調節器。這種方法可確保幾乎所有發熱組件都有效冷卻,從而減少了對補充空氣冷卻和後門熱交換器的需求。
- 支援高密度AI系統: 新架構的一大亮點是 GPU 優化的 Supermicro 伺服器,該伺服器在緊湊的 6U 機架高度內可容納八個 NVIDIA Blackwell GPU 和兩個 Intel Xeon 4 CPU。該系統專門設計用於處理升高的供應冷卻劑溫度、最大限度地提高每瓦性能並支援最新的 AI 工作負載。
- 高效冷卻液分配: 機架內冷卻液分配單元 (CDU) 可為每個機架移除高達 250kW 的熱量。垂直冷卻液分配歧管 (CDM) 可有效地在整個機架內循環冷卻液,與安裝的伺服器數量相匹配,並實現每單位佔地面積的更高計算密度。每個伺服器機架的液冷熱捕獲率高達 98%,進一步提高了效率。
- 綜合管理與編排: 整個 DLC-2 解決方案堆疊與 Supermicro 的 SuperCloud Composer® 軟體完全集成,提供資料中心級管理和基礎設施編排。
Supermicro 的 DLC-2 解決方案還採用了混合冷卻塔,結合了標準乾式冷卻水塔和水塔的特性。這種設計在季節性溫度變化明顯的地區尤其有利,因為它可以讓資料中心優化資源使用,並進一步降低全年的營運費用。
服務和軟體集成
DCBBS 提供全面的服務支持,從初步諮詢和資料中心設計到解決方案驗證、現場部署和持續支援。 Supermicro 為關鍵任務環境提供 4 小時現場回應選項,確保高可用性和快速問題解決。
在軟體方面,Supermicro 的專業知識擴展到 AI 訓練、推理、叢集管理和工作負載編排的應用程式整合。該公司支援 NVIDIA AI Enterprise 軟體平台的部署,並提供針對客戶堆疊客製化的軟體配置和驗證服務。
人工智慧訓練、推理及其他
DCBBS 的主要用例是部署大規模 AI 訓練集群,其中需要數千個 GPU 來開發基礎模型。該解決方案同樣適用於人工智慧推理工作負載,這類工作負載越來越需要高運算能力來跨多個模型和應用程式提供即時智慧。
除了人工智慧之外,DCBBS 還適用於任何需要高密度、高效能運算的資料中心環境,例如科學研究、金融建模和進階分析。此解決方案的模組化、可自訂特性使組織能夠隨著工作負載的變化調整其基礎設施。
人工智慧和高效能運算的快速發展推動了向液冷資料中心的轉變。雖然近年來只有不到 1% 的資料中心採用液冷,但產業預測表明,這一數字在未來一年內可能會達到 30%。 Supermicro 的 DCBBS 和 DLC-2 產品在過渡期間為 Supermicro 提供了積極地位,為高效、可擴展和可持續的資料中心營運提供了實用的、供應商整合的途徑。
參與 StorageReview
電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱