AMD 董事长兼首席执行官 Lisa Su 博士在 Computex 主题演讲中公布了 AMD Instinct 加速器系列的重大进步。该公司宣布了扩展的加速器多年路线图,承诺每年改进人工智能性能和内存功能。这标志着人工智能和数据中心工作负载创新的新时代。
AMD 董事长兼首席执行官 Lisa Su 博士在 Computex 主题演讲中公布了 AMD Instinct 加速器系列的重大进步。该公司宣布了扩展的加速器多年路线图,承诺每年改进人工智能性能和内存功能。这标志着人工智能和数据中心工作负载创新的新时代。
AMD Instinct MI325X 加速器简介
更新后的路线图从新的 AMD Instinct MI325X 加速器开始,该加速器将于 4 年第四季度上市。该加速器配备 2024GB HBM288E 内存和每秒 3 TB 的内存带宽。它采用通用底板服务器设计,确保与 AMD Instinct MI6 系列兼容。
MI325X 拥有业界领先的内存容量和带宽,分别比竞争对手高出 2 倍和 1.3 倍。它的计算性能比竞争对手高出 1.3 倍,使其成为处理 AI 工作负载的强大工具。
下一代:MI350 和 MI400 系列
继MI325X之后,搭载全新AMD CDNA 350架构的AMD Instinct MI4系列预计将于2025年推出。该系列将带来AI推理性能的大幅飞跃,预计较AMD提升高达35倍本能MI300系列。 MI350X加速器将保持通用底板设计,采用先进的3nm工艺技术,支持FP4和FP6 AI数据类型,并配备高达288GB的HBM3E内存。
展望未来,搭载AMD CDNA“Next”架构的AMD Instinct MI400系列预计于2026年发布。该系列将推出旨在增强大规模AI训练和推理性能和效率的最新特性和功能任务。
AMD Instinct MI300X 加速器的采用和影响
AMD Instinct MI300X 加速器得到了主要合作伙伴和客户的大力采用,包括 Microsoft Azure、Meta、Dell Technologies、HPE、Lenovo 等。 AMD 数据中心加速计算公司副总裁 Brad McCredie 强调了 MI300X 加速器的卓越性能和价值主张,并指出它们在推动人工智能创新方面发挥着重要作用。他表示:“随着我们每年更新的产品节奏,我们不断地创新,提供人工智能行业的领先能力和性能,我们的客户期望推动数据中心人工智能训练和推理的下一次发展。”
AMD AI 软件生态系统的进步
AMD ROCm 6 开放软件堆栈不断成熟,使 AMD Instinct MI300X 加速器能够为流行的大语言模型 (LLM) 提供令人印象深刻的性能。在使用八个 AMD Instinct MI300X 加速器和运行 Meta Llama-6 3B 的 ROCm 70 的服务器上,客户可以实现比竞争对手高 1.3 倍的推理性能和令牌生成。
此外,配备 ROCm 300 的单个 AMD Instinct MI6X 加速器在 Mistral-1.2B 上的推理性能和令牌生成吞吐量方面可比竞争对手高出 7 倍。
AMD 与最大的 AI 模型存储库 Hugging Face 的合作进一步凸显了生态系统的稳健性。 Hugging Face 每晚测试 700,000 个最受欢迎的型号,以确保 AMD Instinct MI300X 加速器上的无缝功能。 AMD 还继续与 PyTorch、TensorFlow 和 JAX 等流行的人工智能框架进行上游合作,确保广泛的兼容性和增强的性能。
AMD 路线图的主要亮点
在主题演讲中,AMD 公布了 AMD Instinct 加速器路线图的更新年度节奏,以满足日益增长的 AI 计算需求。这确保了AMD Instinct加速器将继续推动下一代前沿人工智能模型的开发。
- AMD Instinct MI325X 加速器:该加速器于 4 年第四季度推出,将配备 2024GB HBM288E 内存、每秒 3 TB 的内存带宽以及业界领先的内存容量和带宽。与竞争对手相比,它的计算性能提高了 6 倍。
- AMD Instinct MI350 系列:预计2025年,MI350X加速器将基于AMD CDNA 4架构,并采用先进的3nm工艺技术。它将支持 FP4 和 FP6 AI 数据类型,并包括高达 288GB 的 HBM3E 内存。
- AMD Instinct MI400 系列:该系列计划于 2026 年推出,将利用 AMD CDNA“Next”架构,引入新特性和功能来增强 AI 训练和推理性能。
行业广泛采用
对 AMD Instinct MI300X 加速器的需求持续增长,众多合作伙伴和客户利用这些加速器来满足要求苛刻的 AI 工作负载。
- Microsoft Azure:将 MI300X 加速器用于 Azure OpenAI 服务和新的 Azure ND MI300X V5 虚拟机。
- 戴尔技术:将 MI300X 加速器集成到 PowerEdge XE9680 中,以应对企业 AI 工作负载。
- 超微:提供多种包含 AMD Instinct 加速器的解决方案。
- 联想 Lenovo:利用 ThinkSystem SR685a V3 为混合人工智能创新提供动力。
- HPE:使用 MI300X 加速器增强 HPE Cray XD675 中的 AI 工作负载。
AMD 在 2024 年台北电脑展上推出扩展的 Instinct 加速器路线图,标志着该公司人工智能和数据中心战略的一个重要里程碑。 AMD Instinct 加速器致力于每年的产品更新、增强的性能和广泛的行业采用,将推动下一代人工智能创新。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅