AMD Instinct MI300 系列引入了一種新的 AI 加速器架構方法,結合先進技術來推動高效能運算和人工智慧的進步。 MI300系列憑藉其精密的設計,有望重塑運算能力和效率的界限。
AMD Instinct MI300 系列引入了一種新的 AI 加速器架構方法,結合先進技術來推動高效能運算和人工智慧的進步。 MI300系列憑藉其精密的設計,有望重塑運算能力和效率的界限。
MI300 系列概述
這裡有很多內容需要討論,兩者之間的細微差別很微妙但很重要。
規範 | 米300x | 米300a |
---|---|---|
CPU內核 | 12 個小晶片作為單一設備 • 四個 IOD 和八個 XCD • Infinity Fabric AP 和 3D 封裝 |
13 個小晶片作為單一 APU • 8c 16t x86 CPU x 3 CCD(總共24個核心) • 四個 IOD、三個 CCD 和六個 XCD • Infinity Fabric AP 和 3D 封裝 |
緩存(L3) | 32 個核心共享 3 MB 三級緩存 | 僅 L1 和 L2 |
HBM3 容量 | 196GB | 128GB |
無限緩存 | • 256 TB/s 峰值頻寬時為 17 MB • XCD 頻寬放大 • HBM 耗電量降低 • 多XCD 和CCD 快取一致性 • CPU 記憶體延遲的預取器 |
• 256 TB/s 峰值頻寬時為 17 MB • XCD 頻寬放大 • HBM 耗電量降低 • 多XCD 快取一致性 |
統一架構 | 不適用 | 統一 HBM 和無限緩存 • CCD 和XCD 資料共享 • 減少資料移動 • 簡化的編程 |
Zen 4 CPU 複合晶片 (CCD) 與增強功能
MI300A APU 的核心是「Zen 4」CPU 複合晶片 (CCD),具有八個多執行緒 AMD「Zen 4」x86 核心,每個核心擁有 1MB 二級快取和 2MB 共享三級快取。 這種強大的架構支援同步多執行緒 (SMT),並結合了必要的 ISA 更新,包括 BFLOAT32、VNNI 和 AVX-3,以及 16b 資料路徑。 記憶體系統同樣令人印象深刻,具有 512b/256b 虛擬/實體尋址能力,確保了廣泛的記憶體支援。
cDNA 3 計算單元與記憶體系統
MI3 系列中的 CDNA 300 計算單元引入了顯著的增強功能。 每個加速器複合晶片 (XCD) 容納 38 個 CDNA 3 計算單元,由 4 MB 共享 L2 快取和針對位元組/FLOP 優化的 L1 快取提供支援。 這些單位支援 TF32 和 FP8 等一系列數位格式,並符合 OCP FP8 標準。 由於 AMD 創新的 Infinity Cache 和 Infinity Fabric Interface,該記憶體系統旨在最大限度地提高資料共享效率並減少延遲。
3.5D 混合鍵合封裝:整合的飛躍
MI300 系列的一個主要亮點是其 3.5D 混合鍵合封裝,可顯著提高封裝內的運算能力和 HBM(高頻寬記憶體)。 這種封裝方法提供了密集、節能的小晶片互連,從而提高了整體系統級效率。 MI300系列採用模組化建構方式,可實現靈活的配置和可擴充性。
先進的電源管理和熱設計
MI300 系列的電源管理系統專為處理密集型運算工作負載而設計,其設計重點是電源效率和散熱。 獨特的散熱架構支援超過550W的TDP(熱設計功率),即使在嚴苛的條件下也能確保可靠的效能。 電力傳輸系統經過巧妙設計,可適應不同的堆疊晶片和方向,確保精確對準和效率。
AMD MI300 效能
AMD 憑藉其 Instinct MI300X 平台向市場推出了一款有趣的產品,並將其定位為 Nvidia 難以找到的 H100 HGX 的強大競爭對手。 MI300X 平台配備 1.5TB HBM3 內存,這大大超過了 H640 HGX 的 100GB 內存容量,這是每個開發人員都樂意擁有的。 在原始運算能力方面,AMD 以約 10.4 petaFLOPS 的 FP16/BF16 效能領先,約為 H1.3 HGX 的 100 倍,有望提高複雜計算的效率。
至於其他關鍵規格,這兩個平台接近同等水平,在聚合雙向頻寬和網路介面功能方面取得了相當大的進步,每個平台都提供高達400 GbE 的速度,並與5 GB/s 的PCIe Gen 128接口保持同等水平。 AMD 和 NVIDIA 之間的對決展現了 HPC/AI 領域前所未有的快速創新,製造商不斷發布新技術以滿足對更多記憶體和更快計算日益增長的需求。
關閉的思考
AMD Instinct MI300系列憑藉其先進的模組化和小晶片架構、強大的CPU和GPU核心以及創新的封裝和電源管理,在高效能運算和人工智慧領域大有作為。 其設計體現了功率、性能和效率的深思熟慮的集成,為未來的計算技術樹立了新的基準。
隨著運算界熱切期待 MI300 系列的全面部署,AMD 能否跟上供應和技術進步的步伐,同時不斷推動 HPC 和 AI 領域的創新,將會很有趣。 AMD 提供了一個與 MI300 系列相當的引人注目的解決方案。
參與 StorageReview
電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱