存儲評論網

Broadcom Thor Ultra:符合 UEC 標準的 800G AI 乙太網路 NIC,支援 100K+ XPU 橫向擴展

企業  ◇  網路相關

博通推出了業界首款完全符合超級乙太網路聯盟 (UEC) 規範的 800G AI 乙太網路卡 Thor Ultra。它專為擁有超過 100,000 萬個 XPU 的叢集而設計。 Thor Ultra 突破了傳統 RDMA 的瓶頸,增加了資料包級多路徑、亂序資料放置、基於硬體 SACK 的重傳以及完全可編程的擁塞控制管線。

Broadcom Thor Ultra OCP 卡

Thor Ultra OCP 卡

此網卡與博通 Tomahawk 6 無縫集成,並相容於任何符合 UEC 標準的交換器產品線。博通重點強調了其安全功能,包括線速 PSP 加密、安全啟動和認證功能。該網路卡還支援 100G/200G SerDes,提供靈活的部署能力,並支援各種使用模式,包括 chiplet、IP、PCIe 和 OCP 3.0 卡。 Thor Ultra 是一款具有前瞻性、高頻寬、支援遙測的元件,適用於基於乙太網路的 AI 基礎架構。

AI 的 RDMA 已達到極限

AI 資料中心正在從可預測的 HPC 式流程過渡到不可預測、突發且分散的 AI 任務,包括訓練、微調和大規模推理。在這些條件下,傳統的 RDMA(在許多 RoCE 實作中使用)將面臨巨大的壓力。造成 RDMA 限制的因素包括:

  • 封包層級缺乏真正的多路徑,迫使資料流僅使用一條路徑,從而增加了 incast 事件和微突發期間的尾部延遲。
  • 當資料包無序到達時,按順序放置要求會阻礙 PCIe 的最佳利用,從而導致主機停頓和隊頭阻塞。
  • Go-Back-N 重傳會增加擁塞並導致頻寬浪費,且遺失後的恢復速度很慢。
  • 在 100K 節點規模上調整葉脊結構的擁塞控制是一項挑戰,通常因供應商而異。

Thor Ultra 透過將 RDMA 語義與大規模 AI 結構的要求更加緊密地結合起來,支援細粒度的負載分配、重新排序容忍度、快速丟失恢復以及隨著 UEC 發展而適應的可編程擁塞控制,從而克服了這些限制。

架構與特徵

Thor Ultra 旨在錨定符合 UEC 標準的 AI 乙太網路結構,其配備的 NIC 可消除主機端和結構端的瓶頸。 Thor Ultra 的功能包括:

  • Thor Ultra 的 RDMA 管道使用資料包級多路徑將流量分配到多條路徑,並支援直接在 XPU 記憶體中處理亂序資料包。它透過 SACK 和重傳機制確保可靠性,並具有完全可編程的擁塞控制功能,支援各種演算法,以實現策略統一性和靈活性。
  • Thor Ultra 優先考慮完全符合 UEC 規範,支援可靠性、擁塞訊號和遙測等行為。它與 Broadcom Tomahawk 6 和其他 UEC 交換器相容,從而推動了開放式乙太網路方法,避免了廠商鎖定,並支援混合供應商架構。
  • Thor Ultra 的線速安全性包括硬體加速加密/解密、帶有簽署韌體的安全啟動和裝置證明,確保多租戶 AI 叢集中的供應鍊和運行時完整性。
  • 支援橫向擴展 UEC 相容遙測功能,例如資料包修剪和明確擁塞訊號,從而增強了橫向擴展結構中的可觀察性、閉環擁塞控制調整和快速故障隔離。
  • 此 NIC 支援 100G 和 200G SerDes 配置,可提供靈活的連接埠和升級選項。它採用散熱效率高的被動銅纜 DAC,最長可達五米,適用於短距離機架連接,從而降低功耗和成本。這些型號包含用於定制闆卡的 chiplet/IP 以及標準 PCIe 和 OCP 3.0 外形規格,所有型號均共享韌體和工具,以便於管理。

乙太網路 AI 結構與專有替代方案

Thor Ultra 的推出契合了其關鍵的競爭優勢。專有的 AI 互連技術包括 InfiniBand 和供應商特定的乙太網路覆蓋。 NVIDIA 的 InfiniBand 解決方案(例如 ConnectX/BlueField 和 Quantum 交換器)提供 SHARP、自適應路由和最佳化擁塞控制等功能。然而,這些功能存在供應商鎖定的風險,並會增加整體擁有成本 (TCO)。 Thor Ultra 符合 UEC 標準,並具備先進的 RDMA 功能,旨在達到甚至超越使用標準乙太網路的尾部延遲和吞吐量效能。這為買家提供了一種基於標準的替代方案,確保了供應靈活性和熟悉的工具鏈。

與NVIDIA的Spectrum-X乙太網路策略(該策略瞄準具有專有調度/CC的AI架構)不同,博通則秉持「UEC優先」的開放性,並兼具Tomahawk/Jericho交換機的規模和商用光網路生態系統的廣度。然而,對於許多部署客製化硬體的雲端服務供應商(例如AWS和Google)來說,UEC可能並非一個強大的賣點。儘管部署客製化硬體可能會帶來一些麻煩,但他們認為掌控權比UEC合規性更為重要。

英特爾、AMD(Pensando)、Marvell 和 NVIDIA 為 AI 叢集提供競爭性乙太網路 NIC、SmartNIC 和 DPU 解決方案,並支援 RoCEv2 改進和主機卸載功能。 Thor Ultra 的獨特之處在於其提供 800G 線速、支援亂序放置的資料包級多路徑、硬體 SACK 重傳以及相容 UEC 的可程式擁塞控制引擎。

博通的 Tomahawk 6 和 Jericho 在超大規模商用乙太網路領域處於領先地位。 Thor Ultra 提供全面的乙太網路 AI 基礎架構。對於對單一供應商生態系統猶豫不決的營運商來說,UEC 相容性以及與其他頂級供應商的互通性提供了靈活性,使博通網路卡能夠與各種 UEC 交換器相容,反之亦然。

Thor Ultra 透過解決關鍵的 RoCE 挑戰並推廣基於標準的方法(而不是依賴單一供應商的結構),提高了乙太網路在超過 100,000 個節點上實現 AI 的可行性。

人工智慧資料中心設計

Thor Ultra 的功能推動建築師進行一些設計轉變,其中包括:

  • UEC 上的織物標準化: 預測符合 UEC 標準的 NIC 和交換器的參考設計,統一各供應商的壅塞訊號、遙測和可靠性標準。這將最大限度地減少整合挑戰,並簡化多源採購。
  • 乙太網路優先的 AI pod 具有可預測的尾部延遲,透過 資料包級多路徑和亂序佈局支援。這些pod設計採用800G網卡,透過100G/200G SerDes通道連接到ToR/葉子交換機,並基於深度ECMP結構進行分層。這種設定使設計人員能夠更積極地處理路徑分集和超額認購,同時保持較低的p99和p99.9延遲。
  • 可編程擁塞控製作為操作旋鈕: CC 在 NIC 晶片上運行且可編程,操作員無需更換硬體即可適應工作負載階段(資料並行訓練 vs. 管線並行推理)和結構條件。預計將進行基於接收方和發送方方案的 A/B 測試,並使用 UEC 遙測進行閉環控制。
  • 更簡單的主機資料路徑和 PCIe 效率:亂序佈局 XPU 記憶體和硬體 SACK 減少了 CPU/XPU 參與重新排序和復原的環節,從而釋放了主機週期並平滑了 PCIe 頻寬利用率。這對於已經在 PCIe 和記憶體頻寬邊緣運行的 GPU/加速器伺服器至關重要。
  • NIC 內建的安全性: 線速加密、安全啟動和硬體證明簡化了多租戶叢集中的合規性,特別是在訓練和推理租戶之間共享結構或跨內部團隊進行分區時。
  • 佈線和電源 TCO:用於 NIC 到 ToR 運行的長達 5 公尺的無源銅 DAC 可降低光學功率預算並簡化機架級散熱。
  • 營運遙測和 SLO:UEC 遙測原語(例如封包修剪和明確擁塞訊號)可實現更嚴格的 SLO 管理和更快的大規模 RCA。能否整合到現有的 NetOps/AI Ops 管道將成為選擇標準。

部署

Thor Ultra 支援 100G/200G SerDes 配置,以 chiplet/IP 的形式提供,方便定制集成,並支援標準 PCIe 和 OCP 3.0 卡。所有版本均共享統一的韌體、驅動程式和軟體工具鏈,以簡化設備群運作。博通將 Thor Ultra 定位為 Tomahawk 6 的“補充”,並聲明兼容其他廠商的 UEC 兼容交換器。

Broadcom Thor Ultra PCIe 卡

Thor Ultra PCIe 卡

博通推出的 Thor Ultra 是人工智慧乙太網路領域的重大突破。這款 800G 網路卡全面支援 UEC,並提供先進的 RDMA 功能,專注於效能、可擴充性和開放性。它透過提供 800G 網路卡,增強了人工智慧乙太網路的潛力,解決了傳統 RoCE 在超大規模環境下的關鍵限制,包括缺乏資料包級多路徑、順序傳輸不可靠、重傳速度慢以及擁塞控制脆弱等問題。

庫存情況

博通正在向特定客戶試用 Thor Ultra。

參與 StorageReview

電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱

哈羅德弗里茨

自 IBM 創建 Selectric 以來,我一直在科技行業工作。 不過,我的背景是寫作。 因此,我決定退出售前業務,回歸本源,從事一些寫作工作,但仍從事技術工作。