NVIDIA 宣布了其 Vera Rubin NVL144 MGX 新一代開放式架構機架伺服器的規格。超過 50 家 MGX 合作夥伴正在為此次發布做準備,同時 NVIDIA Kyber 也獲得了生態系統支援。 Kyber 連接了 576 個 Rubin Ultra GPU,旨在滿足日益增長的推理需求。
9 月,NVIDIA 宣布推出一款與英特爾擴大合作關係同時,英特爾宣布推出全新至強 6 處理器,其中一款處理器將作為該公司最新一代 AI 加速系統 NVIDIA DGX B300 的主機 CPU。 NVIDIA DGX B300 整合了英特爾至強 6776P 處理器,該處理器在管理、編排和支援 AI 加速系統方面發揮著至關重要的作用。憑藉強大的記憶體容量和頻寬,至強 6776P 能夠滿足日益增長的 AI 模型和資料集需求。
Xeon 6776P 設計為「GPU 主機」CPU,配備優先核心睿頻 (PCT) 和英特爾速度選擇睿頻 (SST-TF) 技術,因此一小部分核心可以加速並處理對延遲敏感的編排任務,而其他核心則以基準頻率運行。這有助於透過減少預處理、鍵值快取處理和調度過程中的停頓來提高 NVLink 叢集中 GPU 的有效利用率。
Vera Rubin NVL144:專為 AI 工廠擴充設計
Vera Rubin NVL144 MGX 計算托盤採用節能、全液冷的模組化設計。其中央印刷電路板中板取代了傳統的線連接,從而加快了組裝速度並簡化了維護。它還包含用於 NVIDIA ConnectX-9 800GB/s 網路和 NVIDIA Rubin CPX 的模組化擴充托架,支援大規模推理任務。
NVIDIA Vera Rubin NVL144 代表了加速運算架構和 AI 能力的重大進步。它旨在支援高級推理引擎並滿足 AI 代理的需求。
核心設計基於 MGX 機架架構,並將獲得 50 多個 MGX 系統和組件合作夥伴的支援。 NVIDIA 計畫將增強型機架和運算托盤創新作為開放標準貢獻給 OCP 聯盟。
其運算托盤和機架標準使合作夥伴能夠組裝模組化系統,並利用該架構更快地進行擴展。 Vera Rubin NVL144 機架設計採用節能的 45°C 液冷技術、可增強性能的新型液冷母線,以及 20 倍的儲能容量,以保持穩定的功率。
MGX 對運算托盤和機架架構的增強提高了 AI 工廠的性能並使組裝變得更加容易,從而可以快速擴展到千兆瓦級 AI 基礎設施。
NVIDIA NVLink Fusion 生態系進一步擴展
除了硬體之外,NVIDIA NVLink Fusion 也正在獲得發展勢頭,使企業能夠將其半客製化矽片無縫整合到高度優化、廣泛部署的資料中心架構中,從而降低複雜性並加快產品上市時間。
英特爾和三星代工廠正在加入 NVLink Fusion 生態系統,該生態系統涵蓋客製化矽片設計人員、CPU 和 IP 合作夥伴,使 AI 工廠能夠快速擴展和管理模型訓練和代理 AI 推理的密集工作負載。
- 作為最近宣布的 NVIDIA 和英特爾合作, 英特爾將使用 NVLink Fusion 建置整合到 NVIDIA 基礎架構平台的 x86 CPU。
- 三星代工廠已與 NVIDIA 合作,以滿足對客製化 CPU 和客製化 XPU 日益增長的需求,為客製化矽片提供從設計到製造的體驗。
NVIDIA Kyber Rack
超過 20 家產業合作夥伴將展示全新的晶片、組件、電源系統以及對下一代 800 伏特直流 (VDC) 資料中心的支援。這些面向千兆瓦時代的資料中心將支援 NVIDIA 的 Kyber 機架架構。
富士康公佈了其位於台灣高雄1號的40兆瓦資料中心的詳細信息,該中心正為800伏直流電時代而建。其他產業領導者,包括CoreWeave、Lambda、Nebius、Oracle雲端基礎設施和Together AI,也在規劃採用800伏直流電基礎設施的資料中心。此外,Vertiv推出了其800伏特直流電MGX參考架構,該解決方案旨在優化空間、成本和能源效率,同時提供完整的電力和冷卻基礎設施。同時,HPE正在支援NVIDIA Kyber和NVIDIA Spectrum-XGS乙太網路橫向擴展技術的產品,這兩項技術都是Spectrum-X乙太網路平台的組成部分。
從傳統的 415 或 480 VAC 三相繫統切換到 800 VDC 基礎設施,可提高資料中心的可擴展性、能源效率、減少材料消耗並提升效能。電動車和太陽能產業已經實施了 800 VDC 基礎設施,以實現這些優勢。
NVIDIA Kyber Rack 伺服器世代
OCP 生態系統也在為 NVIDIA Kyber 做準備,其特點是 800 VDC 電力傳輸、液體冷卻和機械設計方面的創新。
這些創新將促進向機架伺服器一代 NVIDIA Kyber(NVIDIA Oberon 的繼任者)的過渡,預計到 2027 年將採用具有 576 個 NVIDIA Rubin Ultra GPU 的高密度平台。
解決高功率配電難題的最佳方法是提高電壓。從標準的415或480 VAC三相繫統升級到800 VDC系統具有許多優勢。
正在進行的過渡使機架伺服器合作夥伴能夠將其機架內組件從 54 VDC 升級到 800 VDC,從而提升效能。在此次活動中,由直流基礎設施供應商、電源系統和冷卻合作夥伴以及晶片製造商組成的協作生態系統共同致力於 MGX 機架伺服器參考架構的開放標準。
NVIDIA Kyber 旨在提昇機架 GPU 密度、增強網路容量並優化大規模 AI 系統的效能。它採用垂直安裝計算刀片,每個機箱最多可支援 18 個刀片。此外, NVIDIA 的專業 NVLink 交換器刀片透過無線中板位於後部,從而實現無縫、可擴展的網路連接。
透過相同的 800 VDC 銅線傳輸的電力增加了 150% 以上,無需使用 200 公斤的銅母線來為單一機架供電。
Kyber 將成為超大規模 AI 資料中心的核心元件,提升高階生成式 AI 任務的效能、效率和可靠性。 NVIDIA Kyber 機架可協助客戶大幅減少銅的使用量,從而節省數百萬美元的成本。
擴展下一代人工智慧工廠
超過 20 家 NVIDIA 合作夥伴正在協助提供具有開放標準的機架式伺服器,為未來的千兆瓦 AI 工廠提供支援。
- 矽片供應商:ADI公司(ADI), AOS, EPC、英飛凌、Innoscience、MPS、Navitas、安森美、Power Integrations、瑞薩、立錜科技、ROHM、義法半導體等 德州儀器(TI)
- 電力系統組件供應商: Bizlink、台達、 柔性, GE Vernova、Lead Wealth、LITEON、Megmeet
- 資料中心電力系統供應商: ABB、伊頓、GE Vernova、Heron Power、 日立能源 三菱電機、施耐德電機、西門子和 Vertiv
NVIDIA 是主要貢獻者 符合多代硬體的 OCP 標準, 包括關鍵部分 NVIDIA GB200 NVL72 系統機電設計。相同的 MGX 機架空間支援 GB300 NVL72,並將支援 Vera Rubin NVL144、Vera Rubin NVL144 CPX 和 Vera Rubin CPX,以實現更高的效能和快速部署。




Amazon