存储评论网

AMD Ryzen Threadripper 9980X 和 9970X 评测:Zen 5 带来巨大提升

电子消费品  ◇  打标工作站

AMD 持续升级其高端台式机产品线,推出全新锐龙 Threadripper 9980X 和 9970X。这两款新芯片基于最新的 Zen 5 架构,面向在多线程环境中工作的专业用户,例如 3D 渲染、视频制作、软件编译和科学计算工作负载。它们也标志着 TRX50 平台的最新成员。TRX50 平台是 AMD 的发烧级基础架构,将工作站级性能与台式机的易用性完美结合。TRX5 支持超频,配备 PCIe Gen5 和四通道 DDR90 内存,对于不需要 WRXXNUMX 平台完整功能的用户来说,TRXXNUMX 是一个更具成本效益的选择。

AMD Ryzen Threadripper 9980X

虽然型号名称耳熟能详,但新款 Threadripper CPU 的内部架构却发生了显著变化。9980X 采用 64 核 128 线程布局,采用 12+1 CCD(核心复合芯片)配置;这意味着 9970 个计算 CCD 与单个 I/O 芯片配对,这与 AMD 基于 chiplet 的高端芯片扩展策略一致。32X 通过 64+6 CCD 布局将其精简为 1 核 XNUMX 线程。

这两款 CPU 均基于 AMD 最新的 Zen 5 架构,采用 4nm 工艺制造,并支持 AVX-512 和完整的 512 位数据路径,这在 Threadripper 级别中尚属首创。Boost 频率最高可达 5.4GHz,搭配高达 256MB 的三级缓存,平台支持包括 3 条 PCIe Gen 80 通道和四通道 DDR5-5 内存,为这些芯片提供了充足的带宽和 I/O,足以处理要求严苛的创意和模拟工作负载。

AMD Threadripper 9980X 和 9970X:Zen 5 架构和平台

Zen 5 架构带来了一些重大改进,这意味着在专业工作负载下性能将获得显著提升。其核心是重新设计的前端,改进了分支预测、扩展了指令调度范围并提高了调度效率,所有这些都有助于提高指令吞吐量。该架构的升级执行引擎拥有更宽的整数和浮点流水线,从而实现了更高的吞吐量并支持更新的数据类型,这对于计算密集型工作负载尤为有用。

禅宗5架构

Zen 5 还引入了完全优化的 AVX-512 实现,具有原生 512 位执行性能(此前,在 Zen 512 中,AVX-256 以两个周期的分割 4 位模式支持),首次将高吞吐量矢量处理功能引入主流 Threadripper 系列。这在浮点运算强度较高的科学和工程应用中尤为重要。支持此架构的是响应速度更快的缓存层次结构,每个 CCD 提供高达 32MB 的 L3 缓存,并通过改进的 L1/L2 结构和更宽的加载/存储引擎实现更快的访问速度。

该平台还保留了 sTR5 插槽,这意味着在安装和基础架构方面具有向后兼容性,但 TRX50 和 WRX90 主板将提供更广泛的支持。TRX50 支持 4 通道 DDR5-6400 内存和 80 条 PCIe Gen5 通道,而 WRX90 可扩展至 8 通道内存和 128 条 PCIe Gen5 通道,适用于真正带宽受限的环境。两个平台均支持 ECC RDIMM 内存。

得益于 Zen 5 改进的电源门控和更精细的升压行为,电源管理也得到了提升。这些增强功能有助于在负载下保持更高的持续频率,同时在空闲或轻线程场景下提供更好的效率扩展。

AMD Ryzen Threadripper 9000 系列 Zen5 SKU

Ryzen Threadripper 9000 系列通过两条产品线将 Zen 5 引入 HEDT 和工作站市场:标准“X” SKU(例如 9980X、9970X、7960X)和“WX” PRO 版本(96WX 最多 7995 个核心)。虽然核心数量与上一代相似,但 Zen 5 允许更高的主频和更强大的单核性能。所有 SKU 均具有 350W TDP,并支持在支持的主板上进行超频。

值得注意的是,Threadripper 9000 CPU 均不具备集成显卡,这意味着任何显示输出都需要独立的 GPU。

型号 CPU 核心数 # 线程 最大限度。 升压时钟 基地时钟 默认 TDP
AMD Ryzen Threadripper 9980X 64 128 高达5.4GHz 3.2GHz 350W
AMD Ryzen Threadripper 9970X 32 64 高达5.4GHz 4.0GHz 350W
AMD Ryzen Threadripper 7980X 64 128 高达5.1GHz 3.2GHz 350W
AMD Ryzen Threadripper 7970X 32 64 高达5.3GHz 4.0GHz 350W
AMD Ryzen Threadripper 7960X 24 48 高达5.3GHz 4.2GHz 350W
AMD锐龙Threadripper PRO 7995WX 96 192 高达5.1GHz 2.5GHz 350W
AMD锐龙Threadripper PRO 7985WX 64 128 高达5.1GHz 3.2GHz 350W
AMD锐龙Threadripper PRO 7975WX 32 64 高达5.3GHz 4.0GHz 350W
AMD锐龙Threadripper PRO 7965WX 24 48 高达5.3GHz 4.2GHz 350W
AMD锐龙Threadripper PRO 7955WX 16 32 高达5.3GHz 4.5GHz 350W
AMD锐龙Threadripper PRO 7945WX 12 24 高达5.3GHz 4.7GHz 350W

AMD Threadripper 9980X 和 9970X:Zen5 的潜在实际性能

AMD Zen 5 核心的使用使得单核效率相较 Zen 4 有了显著提升。根据 AMD 使用固定频率(例如上文提到的 9980X 12+1 CCD 配置)进行的内部测试,Zen 5 在 16 个工作站基准测试的几何平均值中平均实现了约 10% 的 IPC 提升。这反映了核心前端效率、分支预测和调度的普遍提升。在与 AI 和机器学习明确相关的工作负载中,AMD 报告称其在 SPEC 工作站测试中获得了约 25% 的提升,这些测试侧重于浮点性能和推理相关任务。这些提升对用户至关重要。

AMD ryzen Threadripper 9980X CPU英雄

在直接比较 AMD 的 64 核 Threadripper 9980X 和英特尔的 60 核 Xeon W9-3595X 时,AMD 声称其在各种专业工作负载下都实现了显著的性能提升。Autodesk Maya 和 Cinebench (nT) 等应用程序的性能提升分别高达 92% 和 83%,凸显了该芯片处理多线程渲染和计算密集型任务的能力。

在内容创作方面,Adobe Premiere Pro 和 After Effects 的效能提升分别高达 22% 和 80%。可视化和 3D 渲染工作负载也受益匪浅,其中 Autodesk Revit 的效能提升高达 41%,Corona Render 的效能提升高达 108%。在软件开发方面,MATLAB、Chromium 编译器和 Unreal Engine 编译器的效能提升分别高达 41% 和 68%。这表明,9980X 能够在创意、工程和开发等高核心利用率和高效率的场景中表现出色。

AMD 声称,尽管核心数量较少,但 32 核 Threadripper 9970X 的性能相比英特尔 44 核 Xeon W9-3575X 仍有显著提升。在创意工作负载方面,AMD 报告称 Adobe Premiere Pro 的性能提升高达 31%,After Effects 的性能提升高达 79%。Maya 和 Cinebench (nT) 的性能也显著提升,分别提升 26% 和 18%。在 CAD 和可视化任务方面,Autodesk Revit 的性能提升了 45%,Corona Render 的性能提升了 35%,这表明设计和渲染方面均有显著优势。

最显著的飞跃是在 MATLAB 方面,AMD 报告称其性能提升了 137%,这意味着它在模拟和科学计算方面具有真正的优势。在开发方面,虚幻引擎的编译速度提升了 69%,甚至 Chromium 的编译速度也提升了 10%,尽管速度不快,但仍然值得衡量。虽然我们无法验证所有这些说法,但我们将一如既往地在基准测试和实际测试中验证这些性能数据是否属实。

AMD Threadripper 9980X 和 9970X:用例

AMD Threadripper 9980X 和 9970X CPU 专为处理严肃的专业工作负载而设计,其预期用例涵盖多个高需求领域。在 3D CAD 环境中,这些芯片旨在加速 AI 辅助设计工作流程、复杂的 3D 渲染和产品可视化流程。其高线程数和强大的浮点性能使其非常适合计算密集型的模拟任务。同样,在建筑可视化领域,这些 CPU 旨在处理大型复杂模型的逼真渲染,并支持沉浸式实时漫游和虚拟现实预览,这对于现代设计验证至关重要。

AMD 线程撕裂者 9970X

在内容创作领域,AMD 重点支持高负载 VFX 流水线,尤其强调 8K120(高帧率)工作负载。这对于虚拟制作环境和虚拟场景中的实时渲染来说非常理想。AI 增强的视频处理、调色和转码功能也受益于全新 Threadripper 架构。

在软件开发方面,AMD 表示,它们将与 LLM 的本地 AI 模型开发和微调完美契合。AMD 还提到了油气勘探、图像和数据处理以及编码辅助工具等工作负载。9980X 和 9970X 的多核性能和带宽有望在这些领域带来明显优势,而从历史上看,Threadripper CPU 也确实如此。

AMD Threadripper 9980X 和 9970X:使用 Zen 5 进行超频

Threadripper 9000 系列的超频支持与前几代产品相似,Precision Boost Overdrive (PBO) 可根据主板 VRM 和 BIOS 定义的功率输出限制进行调整。PPT、TDC 和 EDC 等功率阈值会自动调整,同时用户可以应用 Auto-OC 将升压频率提高高达 200 MHz。Zen 5 的改进对此有所帮助,尤其是更好的分支预测和更短的电源状态转换时间,使升压能够持续更长时间并更快地恢复。AMD 的曲线优化器也可用,提供每核电压调节,有助于改善频率扩展或降低发热量,同时保持相同的功率范围。

手动调校仍然可行,但 AMD 建议认真考虑散热和电源容量以确保稳定性。对于挑战极限的用户,建议使用 1500W 电源和高端液冷散热器,因为满载下的总功耗可能超过 800W。频率可以跨所有核心或按 CCX 进行调整,Zen 5 统一了按 CCX 和按 CCD 进行的调整行为。电压可以设置为静态值或偏移量,一旦找到稳定的超频,用户可能会受益于 SOC 电压的微调。得益于 Zen 5 在效率和调度方面的优化,Threadripper 9000 系列能够更好地在高负载下保持更高性能,并降低热量和电压不稳定性。

在下面的性能部分中,我们将确定它们是否确实是 Threadripper 已经做得很好的改进,以及它们是否在相同的占用空间下提供了更多功能。

性能测试

我们将在基于华硕 Pro WS TRX9980-SAGE WIFI 主板构建的高性能工作站平台上测试全新的 AMD 锐龙 Threadripper 9970X 和 50X CPU。该测试平台此前曾用于评估上一代 Threadripper CPU 和高端 GPU,因此是进行持续性能对比的理想基础。该系统采用全水冷设计,确保在持续高负载下也能保持最佳散热管理。

搭载 AMD ryzen Threadripper 9980X

StorageReview AMD ThreadRipper 测试平台

  • 主板: 华硕 Pro WS TRX50-SAGE WIFI
  • RAM: 128GB DDR5 6400MT/s
  • 存储: 2TB 三星 980 Pro
  • OS: Windows 11 Pro 工作站版和 Ubuntu Server 24.04
经过测试的 Threadripper CPU

UL Procyon:AI 计算机视觉推理

UL Procyon AI 推理旨在评估工作站在专业应用中的性能。需要注意的是,此测试不利用多 CPU 功能。具体来说,此工具旨在评估工作站处理 AI 驱动任务和工作流程的能力,并详细评估其处理复杂 AI 算法和应用程序的效率和速度。

在 UL Procyon 的 AI 计算机视觉测试中,两款全新 Threadrippers 的推理时间均较上一代产品有显著提升,尤其是在复杂模型中。9970X 的总得分最高,为 240 分;其次是 9980X,得分为 222 分,远超 7980X 的 154 分和 7970X 的 187 分。

UL Procyon:AI 计算机视觉推理时间 CPU(越低越好) Threadripper 9980X 64C Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
移动网络 V3 3.58ms 1.68ms 3.66ms 2.08ms
残差网络 50 5.09ms 5.07ms 6.33ms 5.74ms
盗梦空间V4 14.63ms 13.50ms 23.84ms 21.35ms
深实验室V3 19.76ms 21.20ms 31.22ms 25.66ms
优洛V3 21.71ms 24.95ms 32.44ms 31.91ms
真实ESRGAN 1,122.61ms 1,312ms 2,059.92ms 1,704.68ms
总分(越高越好) 222 240 154 187

规格工作站 4

SPECworkstation 4.0 基准测试是一个综合工具,可以评估工作站性能的所有关键方面。 它提供了 CPU、图形、加速器和磁盘性能的真实衡量标准,确保专业人员拥有数据来对其硬件投资做出明智的决策。 该基准测试包括一组专门针对 AI 和 ML 工作负载的测试,包括数据科学任务和基于 ONNX 运行时的推理测试,反映了 AI/ML 在工作站环境中日益增长的重要性。 它涵盖七个垂直行业和四个硬件子系统,为当今工作站的性能提供了详细而相关的衡量标准。

在 SPECworkstation 4.0.0 测试中,AMD 全新 Threadripper 9980X(64 核)和 9970X(32 核)相较上一代产品取得了显著提升。与 9980X 相比,6.88X 在能源(5.75 vs. 7.82)和金融服务(6.98 vs. 7980)等高线程工作负载方面始终保持领先,展现出明显的代际提升。在人工智能和机器学习领域,它以 4.28 vs. 3.56 的成绩略胜一筹,同时在生命科学和媒体与娱乐领域也略有领先。

9970X 的核心数量虽然只有 9980X 的一半,但在各方面仍然胜过 7970X。值得注意的是,它在生产力与开发方面的得分为 3.00,优于两款 64 核芯片,这表明其更高的主频和更低的核心争用率有利于轻线程任务的执行。

SPECworkstation 4.0.0(越高越好) Threadripper 9980X 64C  Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
人工智能与机器学习 4.28 3.89 3.56 3.22
新能源 6.88 4.63 5.75 4.04
金融服务 7.82 4.94 6.98 4.44
生命科学 4.70 3.77 4.17 3.38
媒体与娱乐 4.43 3.84 4.14 3.54
生产力与发展 1.57 3.00 1.51 1.43
产品设计 3.56 1.54 3.23 2.74

3DMark CPU 配置文件

3DMark CPU Profile 评估处理器在六个线程级别下的性能:1、2、4、8、16 和最大线程。每个测试运行相同的基于个体的模拟工作负载,以评估 CPU 在不同线程数下(GPU 参与度最低)的扩展性能。该基准测试有助于确定单线程效率以及游戏、内容创作和渲染等任务的多线程潜力。12 线程的分数通常与现代 DirectX 1 游戏性能一致,而 4-XNUMX 线程的结果则反映较老的游戏或电竞游戏场景。

在 3DMark 的 CPU Profile 测试中,AMD 的 Threadripper 9980X 和 9970X 相比 7980X 和 7970X 表现出了明显的性能提升,尤其是在线程数增加的情况下。在最大线程数下,9980X 的得分达到 30,442,比 21X 的 7980 提升了 25,224%;而 9970X 的得分为 23,771,比 15X 提升了 7970%。

两代产品的 1 线程和 2 线程性能几乎相同,这表明 AMD 在此版本中优先考虑多线程扩展而不是单线程改进。

当线程数达到 16 时,性能差距开始更加明显;而当线程数达到 9970 时,9980X 的得分为 17,049 分,而 15,526X 的得分为 9970 分,领先优势更加明显。这很可能反映了 9980X 在核心数量较少的情况下拥有更高的性能提升。当所有核心都满负荷运转时,XNUMXX 便会明显领先。

3DMark CPU 配置文件(越高越好) Threadripper 9980X 64C  Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
1主题 1,245 1,243 1,103 1,123
2个线程 2,477 2,471 2,136 2,193
4个线程 4,691 4,866 4,132 4,223
8个线程 9,041 9,071 7,285 7,482
16个线程 15,526 17,049 13,843 13,775
最大线程数 30,442 23,771 25,224 20,593

Geekbench 6

Geekbench 6 跨平台基准测试可衡量系统性能并提供比较分数。它旨在在多个平台上运行,并在各种设备(包括智能手机、平板电脑、台式机和服务器)上提供一致的性能测量。

在 Geekbench 6 跑分中,新款 AMD CPU 的单核性能略有提升,9980X 和 9970X 的得分分别为 3,267 分和 3,260 分。相比 7980X 和 7970X 的 2,956 分和 2,940 分,这些只是小幅提升。两者之间的微小差距凸显了 AMD 架构的改进,而非彻底的重新设计。

有趣的是多核性能。9970X 以 28,039 分的成绩位居榜首,甚至超过了 64 核 9980X(26,621 分)。这一结果表明,在 Geekbench 的测试环境下,32 核处理器的性能提升更为强劲。不过,这两款芯片都比上一代产品取得了显著提升,7980X 为 24,812 分,7970X 为 21,836 分。

Geekbench 6(越高越好) Threadripper 9980X 64C Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
单核 3,267 3,260 2,956 2,940
多核 26,621 28,039 24,812 21,836

Blackmagic RAW 速度测试

我们进行了 Blackmagic RAW 速度测试,以评估新款 AMD CPU 在未安装 GPU 的情况下,仅使用 CPU 处理 Blackmagic RAW 解码任务的性能。此测试衡量了不同分辨率和压缩级别下的性能。

在 RAW 速度测试中,9970X 在基于 CPU 的 8K 处理中表现出色,达到了 202 FPS,略高于 9980X 的 187 FPS。老款 7980X 的 FPS 略低,为 151 FPS,而 7970X 的 FPS 几乎与新款 32 核芯片持平,为 197 FPS,这可能是因为在特定工作负载下,两者的时钟行为相似。

RAW速度测试 Threadripper 9980X 64C Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
8K CPU FPS 187 202 151 197

PCMark 10

PCMark 10 是一款行业标准基准测试,旨在衡量现代办公环境中的完整系统性能。它针对 Windows 10 系统更新了工作负载,并评估日常任务,例如生产力、网页浏览、视频会议和内容创作。该基准测试运行简单,提供多级评分(从高级别的总体评分到详细的工作负载评分),并包含专门的电池续航时间和存储测试。虽然 UL Solutions 现在推荐使用 Procyon 进行基于应用程序的较新测试,但 PCMark 10 仍然是评估一般 PC 性能的可靠且广泛使用的工具。

在 PCMark 10 测试中,9980X 得分 9,406,9970X 得分 9,398。这些结果显示,与 7980X 的 8,467 和 7970X 的 8,614 相比,新一代产品的性能提升了约 10%。

64 核和 32 核型号的性能几乎相同,这表明 PCMark 的工作负载更依赖于时钟速度和效率,而非原始核心数量。这一趋势在两代产品中都保持一致。

PCMark 10(越高越好) Threadripper 9980X 64C Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
CPU 得分 9,406 9,398 8,467 8,614

麦克森·辛本奇

Cinebench 是一款广泛使用的基准测试工具,它使用 Maxon Cinema 4D 进行渲染,测量 CPU 和 GPU 的性能。它提供的分数可以帮助您比较不同系统和组件的性能。我们运行了四个常用的 Cinebench 版本,以便您可以在热门在线排行榜上比较结果。

在 Cinebench 2024 中,9980X 的多核性能领先,得分为 6,429 分,比 15X 的 7980 分提升了 5,575%。9970X 的得分为 4,083 分,高于 7970X 的 3,571 分,这标志着 32 核型号的得分也有类似的提升。

所有芯片的单核得分都比较接近。9970X 以 128 分领先,紧随其后的是 9980X,得分为 126 分,而两款上一代芯片的得分均为 115 分。这反映出不同代际之间每核性能的架构提升较为有限。

Cinebench 2024(越高越好) Threadripper 9980X 64C  Threadripper 9970X 32C Threadripper 7980X 64C  Threadripper 7970X 32C
CPU(多核) 6,429点 4,083点 5,575点 3,571点
CPU(单核) 126点 128点 115点 115点

在 Cinebench 2023 测试中,9980X 的多核得分为 115,279 分,比 15X 的 7980 分提升了 100,009%;而 9970X 的多核得分则达到了 76,075 分,比 7970X 的 64,916 分提升了约 17%。这表明两个核心层级的性能都得到了一致的提升。

单核性能方面,新一代处理器保持稳定。9980X 和 9970X 的得分均略高于 2,190 分,而上一代型号的得分分别为 1,969 分和 2,007 分。这些结果证实了新一代处理器在单线程响应速度方面略有提升,而在多核方面则有更显著的提升。

Cinebench R23(越高越好) Threadripper 9980X 64C  Threadripper 9970X 32C Threadripper 7980X 64C  Threadripper 7970X 32C
CPU(多核) 115,279点 76,075点 100,009点 64,916点
CPU(单核) 2,191点 2,192点 1,969点 2,007点

y 粉碎机

y-cruncher 是一款多线程、可扩展的程序,能够计算圆周率 (Pi) 和其他精确到万亿位的数学常数。自 2009 年推出以来,它已成为超频玩家和硬件爱好者们热衷的基准测试和压力测试应用程序。

在 y-cruncher 测试中,9980X 在所有 Pi 计算规模上的表现均优于 7980X。在 10 亿位上,它只需 88.97 秒即可完成,比 14X 的 7980 秒提升了近 102.77 秒。9970X 的性能也比 7970X 有所提升,但由于核心数量较少,在处理较大数据集时,差距较小。

在 1 亿位运算下,9970X 最快完成时间为 7.25 秒,略胜 9980X。10X 仅在工作负载超过 XNUMX 亿位时才领先。这反映出它在轻负载下具有更好的加速性能。

在对内存和缓存更敏感的 BBP 测试中,9980X 在各个级别都处于领先地位。例如,在 100 亿位运算中,它用时 16.07 秒,明显快于 7980X 的 25.70 秒和 9970X 的 24.15 秒。与 7970X 相比,差距更大,后者用时 41.89 秒。

y-cruncher 总计算时间 (越低越好) Threadripper 9980X 64C  Threadripper 9970X 32C Threadripper 7980X 64C  Threadripper 7970X 32C
1亿PI 8.032秒 7.250秒 9.288秒 8.825秒
2.5亿PI 20.456秒 19.577秒 23.395秒 23.810秒
5亿PI 41.962秒 42.413秒 48.924秒 51.326秒
10亿PI 88.972秒 92.795秒 102.774秒 111.965秒
25亿PI 249.660秒 264.683秒 284.471秒 319.469秒
1亿PI BBP 0.213秒 0.226秒 0.293秒 0.369秒
10亿PI BBP 1.522秒 2.201秒 2.358秒 3.810秒
100亿PI BBP 16.070秒 24.147秒 25.701秒 41.896秒

搅拌机优化

Blender OptiX 是一款开源 3D 建模应用程序。此基准测试使用 Blender Benchmark CLI 实用程序运行。分数以每分钟采样数计算,值越高越好。

在 Blender 4.3 中,9980X 在所有场景中均处于领先地位,在 Monster 测试中每分钟可获得 867.30 个样本,比 16X 的 7980 个样本提升了 746.73%。9970X 也展现出明显的代际提升,得分为 503.43,而 7970X 为 440.73,提升了约 14%。

类似的趋势也出现在“旧货店”和“教室”场景中。9980X 以 620.86 分和 429.83 分保持领先,而 9970X 则以 359.39 分和 254.06 分领先,均优于上一代产品。

Blender 4.3 每分钟 CPU 采样数(越高越好) Threadripper 9980X 64C Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
怪物 867.30 503.43 746.73 440.73
旧货店 620.86 359.39 535.06 312.17
课堂 429.83 254.06 378.69 224.50

7-Zip 压缩基准

7-Zip 实用程序中的内置内存基准测试可测量系统 CPU 和内存在压缩和解压缩任务期间的性能,表明系统处理数据密集型操作的能力。我们尽可能以 128MB 的字典大小运行此测试。 

在 7-Zip 基准测试中,各代产品之间的总体性能差异很小。9970X 以 376.30 GIPS 的总成绩略微领先,略高于 9980X 的 372.74 GIPS。上一代 7980X 的总体成绩最高,为 380.49 GIPS,7970X 紧随其后,为 375.48 GIPS。

7-Zip 压缩基准 (越高越好) Threadripper 9980X 64C Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
压缩
当前 CPU 使用率 5,789% 5,664% 5,701% 5,648%
当前额定值/使用情况 5.283 吉普斯 5.361 吉普斯 5.251 吉普斯 5.257 吉普斯
额定电流 305.856 吉普斯 303.636 吉普斯 299.398 吉普斯 296.903 吉普斯
产生的 CPU 使用率 5,785% 5,670% 5,687% 5,618%
结果评级/使用情况 5.286 吉普斯 5.352 吉普斯 5.210 吉普斯 5.269 吉普斯
结果评级 305.776 吉普斯 303.458 吉普斯 296.314 吉普斯 296.012 吉普斯
解压
当前 CPU 使用率 6,150% 6,258% 6,254% 6,335%
当前额定值/使用情况  7.170 吉普斯 7.334 吉普斯 7.397 吉普斯 7.195 吉普斯
额定电流 440.961 吉普斯 458.971 吉普斯 462.602 吉普斯 455.836 吉普斯
产生的 CPU 使用率 6,177% 6,123% 6,144% 6,309
结果评级/使用情况 7.119 吉普斯 7.335 吉普斯 7.563 吉普斯 7.212 吉普斯
结果评级 439.708 吉普斯 449.133 吉普斯 464.659 吉普斯 454.943 吉普斯
总评分
总 CPU 使用率 5,981% 5,897% 5,916% 5,963%
总评分/使用情况 6.202 吉普斯 6.343 吉普斯 6.387 吉普斯 6.240 吉普斯
总评分 372.742 吉普斯 376.295 吉普斯 380.486 吉普斯 375.478 吉普斯

vLLM 工作量

vLLM 基准测试使用大型语言模型模拟推理性能。它重点关注 CPU 如何高效地管理令牌生成、延迟和整体吞吐量,同时强调并发性、内存带宽和调度。这些对于本地 AI 开发和推理工作负载至关重要,因为 CPU 端性能仍然至关重要。

在 vLLM 推理基准测试中,Threadripper 9980X 的整体性能最强,仅用 193.05 秒就完成了测试,总令牌吞吐量为 175.20 tok/s。紧随其后的是 9970X,耗时 231.56 秒,吞吐量为 146.06 tok/s。尽管如此,与上一代 7970X 相比,Threadripper 263.07X 仍然取得了显著的提升,后者耗时 128.56 秒,吞吐量为 XNUMX tok/s。

9980X 在延迟指标方面也处于领先地位,其平均首次令牌时间 (TTFT) 为 6,235 毫秒,中位数 TTFT 为 2,789 毫秒,而 7,350X 的平均 TTFT 为 7,697 毫秒,中位数为 9970 毫秒。虽然 7980X 的 TTFT 与 9980X 相似,但在吞吐量和生成效率方面有所落后。

在持续生成方面,9980X 的每输出令牌时间 (TPOT) 最低,为 84.77 毫秒,而 9970X 则为 102.06 毫秒。令牌间延迟 (ITL) 也呈现出同样的趋势,9980X 以 85.18 毫秒领先,而 102.28 则为 9970 毫秒。

指标(持续时间越短/tok/s 越高越好) Threadripper 9980X 64C Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
成功的请求 16 16 16 16
基准持续时间(秒) 193.05 231.56 234.98 263.07
总输入令牌 20,308 20,308 20,308 20,308
生成的代币总数 13,513 13,513 13,513 13,513
请求吞吐量(req/s) 0.08 0.07 0.07 0.06
输出令牌吞吐量(tok/s) 70.00 58.36 57.51 51.37
总代币吞吐量(tok/s): 175.20 146.06 143.93 128.56
第一个令牌的时间(TTFT)(延迟越低越好)
平均TTFT(毫秒) 6,235.77 7,350.04 6,015.70 9,368.04
中位TTFT(毫秒) 2,789.67 7,697.26 3,015.48 4,464.59
P99 TTFT(毫秒) 12,172.51 14,720.60 11,379.67 19,731.04
每个输出令牌的时间(TPOT,不包括第一个令牌)(延迟越低越好)
平均 TPOT(毫秒) 84.77 102.06 104.14 114.59
中位 TPOT(毫秒) 84.27 103.94 97.14 113.36
P99 TPOT(毫秒) 101.02 110.97 98.98 138.15
令牌间延迟(ITL)(延迟越低越好)
平均 ITL(毫秒) 85.18 102.28 98.92 115.95
中位 ITL(毫秒) 78.74 93.37 97.14 104.08
P99 ITL(毫秒) 80.60 95.01 98.92 105.74

结语

从 Threadripper 9980X 和 9970X 可以看出,Zen 5 带来了一系列直接影响实际工作负载的改进,从而带来了显著的性能提升。将 Threadripper 9980X 与上一代 7980X 进行比较:在 UL Procyon AI 推理测试中,9980X 缩短了复杂模型的运行时间,总分从 7980X 的 154 分跃升至 222 分,这使得 MobileNet 和 Inception 的运行速度感觉更快。在 SPECworkstation 测试中,它在能源和金融服务等领域也处于领先地位,在每个类别中都领先 15X 大约一分或更多。 Cinebench 多核显示出类似的结果,例如比旧款 64 核增加了 3%,而 9980DMark 的 CPU Profile 在最大线程测试中 30,000X 的最高得分超过 25,000,而 7980X 的最高得分约为 XNUMX。

9970X 与其 32 核前代 7970X 相比,也实现了同样的改进。例如,在 UL Procyon AI 推理测试中,它的得分从 187 跃升至 240;在 SPECworkstation 4 的生产力与开发套件中,它的领先优势也相当显著。Geekbench 6 也展现了类似的表现,单核和多核得分均超越了之前的 32 核和 64 核型号,而 Blackmagic RAW 8K 解码和 y-cruncher Pi 计算等实际测试也显示出了持续的性能提升。最终,这些基准测试结果代表了其在 AI、渲染、压缩和模拟任务方面的显著提升。

最终,Threadripper 9980X 和 9970X 并非试图重新定义高端桌面 CPU,而是以有意义的方式推动了架构的发展。AMD 并未追求更高的核心数量或重大的平台变革,而是专注于提升 Zen 5 的效率、响应速度和处理实际工作负载的能力。最终,这两款 CPU 有望提供更强大的单核性能和更高的整体计算密度。因此,如果您在 HEDT 硬件上运行繁重的创意或科学工作负载(或者,即使您只是一位希望充分发挥高端设备性能的发烧友),那么 9980X 和 9970X 都能带来显著的提升,即使没有额外的核心,也值得升级。

产品页

参与 StorageReview

资讯订阅 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter(现为X) | TikTok | RSS订阅

莱尔·史密斯

Lyle 是 StorageReview 的撰稿人,文章涵盖了广泛的终端用户和企业 IT 主题。