AMD Instinct MI300 系列引入了一种新的 AI 加速器架构方法,结合先进技术来推动高性能计算和人工智能的进步。 MI300系列凭借其精密的设计,有望重塑计算能力和效率的界限。
AMD Instinct MI300 系列引入了一种新的 AI 加速器架构方法,结合先进技术来推动高性能计算和人工智能的进步。 MI300系列凭借其精密的设计,有望重塑计算能力和效率的界限。
MI300 系列概述
这里有很多内容需要讨论,两者之间的细微差别很微妙但很重要。
规格 | 米300x | 米300a |
---|---|---|
CPU内核 | 12 个小芯片作为单个设备 • 四个 IOD 和八个 XCD • Infinity Fabric AP 和 3D 封装 |
13 个小芯片作为单个 APU • 8c 16t x86 CPU x 3 CCD(总共24个核心) • 四个 IOD、三个 CCD 和六个 XCD • Infinity Fabric AP 和 3D 封装 |
缓存 (L3) | 32 个核心共享 3 MB 三级缓存 | 仅 L1 和 L2 |
HBM3 容量 | 196GB | 128GB |
无限缓存 | • 256 TB/s 峰值带宽时为 17 MB • XCD 带宽放大 • HBM 功耗降低 • 多XCD 和CCD 缓存一致性 • CPU 内存延迟的预取器 |
• 256 TB/s 峰值带宽时为 17 MB • XCD 带宽放大 • HBM 功耗降低 • 多XCD 缓存一致性 |
统一架构 | 无 | 统一 HBM 和无限缓存 • CCD 和XCD 数据共享 • 减少数据移动 • 简化的编程 |
Zen 4 CPU 复合芯片 (CCD) 和增强功能
MI300A APU 的核心是“Zen 4”CPU 复合芯片 (CCD),具有八个多线程 AMD“Zen 4”x86 核心,每个核心拥有 1MB 二级缓存和 2MB 共享三级缓存。 这种强大的架构支持同步多线程 (SMT),并结合了必要的 ISA 更新,包括 BFLOAT32、VNNI 和 AVX-3,以及 16b 数据路径。 内存系统同样令人印象深刻,具有 512b/256b 虚拟/物理寻址能力,确保了广泛的内存支持。
cDNA 3 计算单元和内存系统
MI3 系列中的 CDNA 300 计算单元引入了显着的增强功能。 每个加速器复合芯片 (XCD) 容纳 38 个 CDNA 3 计算单元,由 4 MB 共享 L2 缓存和针对字节/FLOP 优化的 L1 缓存提供支持。 这些单位支持 TF32 和 FP8 等一系列数字格式,并符合 OCP FP8 标准。 得益于 AMD 创新的 Infinity Cache 和 Infinity Fabric Interface,该内存系统旨在最大限度地提高数据共享效率并减少延迟。
3.5D 混合键合封装:集成的飞跃
MI300 系列的一个主要亮点是其 3.5D 混合键合封装,可显着提高封装内的计算能力和 HBM(高带宽内存)。 这种封装方法提供了密集、节能的小芯片互连,从而提高了整体系统级效率。 MI300系列采用模块化构建方式,可实现灵活的配置和可扩展性。
先进的电源管理和热设计
MI300 系列的电源管理系统专为处理密集型计算工作负载而设计,其设计重点是电源效率和散热。 独特的散热架构支持超过550W的TDP(热设计功率),即使在苛刻的条件下也能确保可靠的性能。 电力传输系统经过巧妙设计,可适应不同的堆叠芯片和方向,确保精确对准和效率。
AMD MI300 性能
AMD 凭借其 Instinct MI300X 平台向市场推出了一款有趣的产品,并将其定位为 Nvidia 难以找到的 H100 HGX 的强大竞争对手。 MI300X 平台配备 1.5TB HBM3 内存,这大大超过了 H640 HGX 的 100GB 内存容量,这是每个开发人员都乐意拥有的。 在原始计算能力方面,AMD 以约 10.4 petaFLOPS 的 FP16/BF16 性能领先,约为 H1.3 HGX 的 100 倍,有望提高复杂计算的效率。
至于其他关键规格,这两个平台接近同等水平,在聚合双向带宽和网络接口功能方面取得了相当大的进步,每个平台都提供高达 400 GbE 的速度,并与 5 GB/s 的 PCIe Gen 128 接口保持同等水平。 AMD 和 NVIDIA 之间的对决展现了 HPC/AI 领域前所未有的快速创新,制造商不断发布新技术以满足对更多内存和更快计算日益增长的需求。
关闭的思考
AMD Instinct MI300系列凭借其先进的模块化和小芯片架构、强大的CPU和GPU内核以及创新的封装和电源管理,在高性能计算和人工智能领域大有作为。 其设计体现了功率、性能和效率的深思熟虑的集成,为未来的计算技术树立了新的基准。
随着计算界热切期待 MI300 系列的全面部署,AMD 能否跟上供应和技术进步的步伐,同时不断推动 HPC 和 AI 领域的创新,将会很有趣。 AMD 提供了一个与 MI300 系列相当的引人注目的解决方案。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅