大規模 AI 訓練和推理正在重塑資料中心網路。 GPU/XPU 之間的東西向流量顯著增加,隨著叢集規模擴展到數萬個加速器,傳統的可插拔光模組正面臨功耗、延遲和物理複雜性等挑戰。博通第三代一體封裝光模組 (CPO) 平台 Tomahawk 6-Davisson(TH6-Davisson)現已上市,其光交換容量達到 102.4 Tb/s,是目前所有 CPO 交換器頻寬的兩倍。對於建構下一代 AI 架構的架構師來說,這標誌著吞吐量、效率和鏈路可靠性的顯著提升。
專為人工智慧網路打造
TH6-Davisson 的設計充分考慮了現代 AI 集群的實際需求。這相當於持續高速的東西向流量、對鏈路抖動的敏感度以及最大化加速器利用率的需求。 TH6-Davisson 的運行速度為每通道 200 Gbps,使每通道線路速率和總頻寬比上一代 TH5-Bailly 翻了一番。它以每通道 200 Gbps 的速度,在基於 DR 的收發器以及近封裝光模組 (NPO) 和 CPO 互連之間提供無縫的互通性。結果是,它能夠在當今的高階 NIC、XPU 和光纖交換器之間輕鬆實現縱向和橫向擴展。
從部署角度來看,這意味著:
- 透過減少連結引起的停頓和作業中斷來提高有效 FLOP 利用率。
- 透過縮短電路和最小化調節,與傳統可插拔設備相比,降低了端對端延遲。
- 交換器上更清潔的機械和熱外殼,簡化了機架和行規模的系統整合。
共封裝光學元件:功率和穩定性優勢
隨著速度的提高,可插拔光學元件會帶來功率損耗,並引入更多可變點。 TH6-Davisson 將光學引擎直接嵌入乙太網路交換器的共享封裝中,將台積電的緊湊型通用光子引擎 (COUPE) 技術與先進的基板級多晶片封裝相結合。這種異質整合減少了對訊號調節的需求,最大限度地減少了走線損耗和反射。
據博通稱,其優勢包括:
- 與傳統可插拔光纖相比,光纖互連功耗降低約 70%。這意味著功耗降低了 3.5 倍以上,從而顯著降低了超大規模和 AI 資料中心的整體擁有成本 (TCO),並提升了其永續性。
- 透過消除可插拔收發器常見的製造和測試差異,提升了鏈路穩定性。先前的 TH5-Bailly 鏈路抖動研究已被引用作為證據;TH6 更緊密的整合進一步減少了抖動事件,這對於長時間的 AI 訓練運行至關重要。
博通光學系統部門副總裁兼總經理 Near Margalit 表示,TH6-Davisson 將成為打造更大規模、更可靠 AI 集群的助推器。他強調,TH6-Davisson 的連結穩定性和能源效率提升將提高加速器利用率、減少作業中斷並提升整體可靠性。這些都是實現更快、更有效率模型訓練的關鍵。
互通性和標準一致性
TH6-Davisson 旨在適應異質環境,提供:
- 每條鏈路 200 Gbps,符合 IEEE 802.3 標準,可實現 400G/800G 互通性。
- 與基於 DR 的光學元件相容,以及每通道 200 Gbps 的 NPO/CPO 生態系統。
- 現場可更換的 ELSFP 雷射模組簡化了可維護性,同時又不喪失 CPO 的整合優勢。
這種以標準為中心的方法對於採購和網路工程團隊來說至關重要,他們必須在規劃升級路徑的同時將新部署與現有的 400G 和 800G 設備相結合。
產品亮點:TH6-Davisson BCM78919
- 102.4 Tb/s 交換容量
- 16 × 6.4 Tb/s Davisson DR光學引擎
- 每通道鏈路頻寬 200 Gbps
- 現場可更換的 ELSFP 雷射模組
- 每個群集可擴展至 512 個 XPU,雙層結構中可擴展至 100,000 多個 XPU,每條鏈路 200 Gbps
- 符合 IEEE 802.3 標準;可與目前 400G/800G 標準互通
這些規格意味著更密集的結構,單位頻寬所需的設備數量更少,功耗更低,預期作業完成可靠性更高。這些特點與 AI 建構的 ROI/TCO 模型直接相關。
甲板上每通道 400 Gbps
博通表示,其第四代CPO平台正在開發中,目標是實現每通道400 Gbps的頻寬,並進一步提高能源效率。如果實現,這一發展軌跡將保持翻倍的速率,同時繼續降低每位元功耗,這對於AI規模資料中心功耗受限的現實至關重要。
庫存情況
博通目前正在向早期試用客戶和合作夥伴提供 TH6-Davisson BCM78919 樣品,隨後將全面上市。
共封裝光學元件似乎仍然是人工智慧時代網路的理想工具。在叢集規模擴展到六位數加速器之際,它們能夠壓縮電路、降低功耗並穩定鏈路。 TH6-Davisson 聲稱其 102.4 Tb/s 的容量和 70% 的光功率降低設定了一個雄心勃勃的標準。




Amazon