主页 电子消费品 英特尔至强 w7-2595X 评测 – Sapphire Rapids Refresh

英特尔至强 w7-2595X 评测 – Sapphire Rapids Refresh

by 乔丹拉努斯

对于需要尖端性能来处理繁重工作负载的专业人士来说,Intel Xeon w7-2595X CPU 是一个重大的飞跃。

Intel Xeon w7-2595X 处理器是 Xeon W-2500 系列的最新成员,面向高性能工作站应用。它专为 AI 开发、数据科学、媒体和工程工作负载而设计。这款 26 核 52 线程处理器的最大时钟速度为 4.8 GHz,比之前的型号有所提升,并具有 48.75 MB 的 L3 智能缓存,可帮助处理数据密集型任务。

板载 Intel Xeon W7-2595X

架构与特点

Xeon w7-2595X 基于英特尔 7 处理器,设计有 26 个性能核心和 52 个线程。这使其能够处理繁重的并行工作负载,例如渲染、AI 推理和模拟。时钟速度高达 4.8 GHz,与前几代相比有了相当大的改进,尤其是在多线程应用程序中。

英特尔至强 W7-2595X

英特尔大幅扩展了 Xeon W 平台的计算能力,w7-2595X 受益于增加的 L2 和 L3 缓存,旨在优化数据访问并提高计算密集型场景的性能。凭借 48.75 MB 的智能缓存,该处理器可以处理大型数据集和密集的多任务处理,而不会出现明显的延迟。

该处理器支持高达 2TB 的 DDR5 ECC RDIMM,运行速度为 4800MT/s,非常适合深度学习模型训练或大规模模拟等内存密集型工作负载。据英特尔估计,英特尔高级矩阵扩展 (AMX) 的引入进一步增强了 AI 性能,可将 AI 推理工作负载提高 3 倍。

另一个关键功能是 PCIe 5.0 支持,它最多有 64 个通道直接连接到 CPU。这允许进行涉及多 GPU 设置、超快速存储和网络接口的高级系统配置。无论是 NAS 部署还是高端渲染农场,Xeon w7-2595X 都可以相应地扩展。

平台整合

Xeon w7-2595X 与英特尔的 W790 芯片组配合使用,后者通过英特尔 vPro 技术提供额外的 PCIe 通道、集成的 Wi-Fi 6E 和增强的安全功能。这使该平台功能强大,但在企业环境中也安全且易于管理。此外,我们测试设置中使用的 ASRock W790 WS R2.0 主板展示了处理此处理器功能所需的带宽和稳定性,尤其是在运行多个 GPU 或存储阵列时。

对于那些关心系统冷却和电源效率的人来说,值得注意的是,Xeon w7-2595X 的 TDP 高达 250W。然而,有了适当的冷却解决方案,比如我们在测试设置中使用的 Noctua NH-U14S,系统即使在繁重的多线程负载下也能保持稳定。还支持超频,包括英特尔 XMP 3.0 内存配置文件,让发烧友能够进一步推动他们的系统。

绩效要求和工作量适宜性

英特尔的内部测试表明,Xeon w7-2595X 在各种专业工作负载方面表现出色,从 3D 渲染到 AI 推理。Blender、Adobe Premiere Pro 的 PugetBench 和 Cinebench R23 等基准测试都是该处理器大放异彩的领域。具体来说,英特尔声称,当应用扩展封装功率时间窗口等优化时,多线程工作负载的性能比前几代产品提高了 6%。

Xeon w7-2595X 的另一个定位领域是 AI 模型训练和推理。借助对 Intel AMX 的支持,该处理器可以加速矩阵乘法等运算,这对于深度学习工作负载至关重要。结合 Intel OpenVINO 优化,w7-2595X 可在各个框架中提供更出色的推理性能。

该处理器还为企业带来了英特尔博锐技术,增强了系统安全性、远程可管理性和稳定性。金融服务、媒体和娱乐以及工程等依赖这些关键任务系统的行业将发现这些功能非常重要。 

可比

我们将比较我们的设备结果(如上所述,ASRock w790 主板、8x 96GB DDR5 Kingston DIMMS)与以下内容:

戴尔 Precision 3680(英特尔酷睿 i9-14900K)

Dell Precision 3680 配备最新一代 Intel Core i9-14900K,这是一款专为游戏和专业工作负载设计的高性能 CPU。它采用 24 核、32 线程处理器混合架构,混合了性能核心 (P 核) 和高效核心 (E 核),最高时钟速度可达 6.0 GHz。这种架构使 i9-14900K 能够在受益于高单线程性能的应用程序中表现出色,同时仍提供强大的多线程处理能力。搭配 64GB DDR5 RAM 和 NVIDIA RTX 6000 Ada Generation GPU,此设置非常适合 3D 渲染、视频编辑和复杂模拟等任务。i9-14900 K 的高时钟速度使其特别适合单线程应用程序和需要快速处理速度的工作负载。

AMD Ryzen 9 9950X(启用 PBO)

AMD Ryzen 9 9950X 是 AMD Zen 5 架构的一部分,采用 16 核 32 线程配置,兼具性能和效率。我们的测试台采用华硕 ROG CROSSHAIR X670E HERO 主板,并由华硕 ROG RYUJIN III 360 AIO 冷却。如前所述,Ryzen 9 9950X 旨在在 Precision Boost Overdrive (PBO) 下突破其极限。该技术允许 CPU 动态提高其时钟速度,同时优化单线程和多线程任务的性能。它还支持 DDR5 内存和 PCIe Gen5,使其成为游戏、内容创建和软件开发等要求苛刻的工作负载的理想选择。我们的测试台还配备了 XFX Radeon 7900 GRE GPU。

基准测试结果

搅拌机优化

首先是 Blender 基准测试,它使用开源 3D 建模和渲染应用程序来评估性能。该基准测试测量每分钟处理的样本数量,分数越高表示性能越好。

Intel Xeon w7-2595X 的全面性能令人钦佩,在怪物、垃圾店和教室场景中,每分钟的采样率分别为 307.705、216.70 和 155.83。虽然 AMD Ryzen 9 9950X 紧随其后,但搭载 Intel Core i3680-9K 的 Dell Precision 14900 的表现远远优于这两款产品,得分明显更高。然而,值得注意的是,这种差异主要是由于戴尔系统依赖强大的 GPU,而不是 CPU 本身。

由于 Blender 的 OptiX 基准测试大量使用 GPU 资源,因此不应将 Intel Xeon w7-2595X 的得分视为其 CPU 性能的直接衡量标准,而应视为其 CPU 和 GPU 能力的结合。当仅关注 CPU 性能时,Xeon 表现出稳定、一致的结果,尤其是在多线程任务中,因为它有 26 个内核和 52 个线程,在多核工作负载方面超过了 Ryzen 9。

Blender OptiX(每分钟采样数,越高越好) 英特尔至强 w7-2595X(26c,52t) AMD 锐龙 9 9950X PBO(Zen5、16c、32t) 戴尔Precision 3680
(英特尔酷睿 i9-14900K(24c,32t)
怪物 307.705  285.489 5,805.6
旧货店 216.70  201.311 2,649.8
课堂 155.83  142.251 2,800.76

Blackmagic RAW 速度测试

我们还开始运行 Blackmagic 的 RAW 速度测试。此基准测试 CPU 处理高分辨率视频播放的性能。

Intel Xeon w7-2595X 在 160K CPU 测试中以 8 fps 领先,这可能归因于其更高的核心数(26c、52t)。Ryzen 9 9950X 以 101 fps 落后,而配备 Intel Core i3680-9K 的 Dell Precision 14900 也落后于 108 fps。即使在 8K CUDA 测试中,新的 Xeon CPU 仍以 138 fps 保持竞争力。

Blackmagic RAW 速度测试(越高越好)  英特尔至强 w7-2595X(26c,52t) AMD 锐龙 9 9950X PBO(Zen5、16c、32t) 戴尔Precision 3680
(英特尔酷睿 i9-14900K(24c,32t)
8K 中央处理器 FPS 160 101帧/秒 FPS 108
8K 图形处理器 FPS 138 FPS 119 FPS 119

7-Zip 压缩

7-Zip 压缩基准测试评估 CPU 压缩数据的能力,这项任务受益于高核心数和高效的内存处理。

英特尔至强 W7-2595X

Intel Xeon w7-2595X 在本次测试中表现出色,总评级为 210.255 GIPS(每秒千兆指令),远高于上一代 Intel Core i9-14900 K 的 162.318 GIPS。Xeon 的高核心和线程数量显著提高了它更高效地处理压缩工作负载的能力,其卓越的 GIPS 评级和 CPU 使用率指标(例如,当前 CPU 使用率为 2718%)就是明证。

尽管 Xeon w7-2595X 的 CPU 使用率较高,但它在性能上仍比 Core i9 保持优势。它与 AMD Ryzen 9 9950X 竞争激烈,后者在某些情况下的评级略高(例如 225.200 GIPS)。这可能意味着 Xeon w7-2595X 特别针对高强度、多线程任务进行了优化,并且可以有效利用其核心架构,在以 CPU 为中心的应用程序中胜过竞争对手。

7-Zip 压缩基准(越高越好) 英特尔至强 w7-2595X(26c,52t) AMD 锐龙 9 9950X PBO(Zen5、16c、32t) 戴尔Precision 3680
(英特尔酷睿 i9-14900K(24c,32t)
当前 CPU 使用率 2,718%  1,235% 1,080%
电流额定值/使用 7.562 吉普斯  14.050 吉普斯 11.763 吉普斯
额定电流 205.522 吉普斯  173.536 吉普斯 127.011 吉普斯
产生的 CPU 使用率 2714%  1211% 1,153%
结果评级/使用 7.559 吉普斯  14.436 吉普斯 11.099 吉普斯
结果评级 205.518 吉普斯  174.506 吉普斯 127.542 吉普斯
当前 CPU 使用率 5,149%  3,128% 3,021%
电流额定值/使用 4.176 吉普斯  8.879 吉普斯 6.521 吉普斯
额定电流 215.016 吉普斯  277.706 吉普斯 197.036 吉普斯
产生的 CPU 使用率 5095%  3111% 3,022%
结果评级/使用 4.227 吉普斯  8.868 吉普斯 6.523 吉普斯
结果评级 215.331 吉普斯  275.894 吉普斯 197.094 吉普斯
总 CPU 使用率 3,905%  2,161% 2,087%
总评分/使用情况 5.893 吉普斯  11.652 吉普斯 8.811 吉普斯
总评分 210.255 吉普斯  225.200 吉普斯 162.318 吉普斯

UL Procyon 人工智能推理

UL Procyon AI 推理基准 使用不同的框架评估 CPU 的 AI 模型推理性能。Intel Xeon w7-2595X 表现出强劲的性能,尤其是在使用 Intel 的 OpenVINO 工具包时,其多个模型的平均推理时间明显低于运行 Windows ML 的同一 CPU。例如,在 MobileNet V3 测试中,Xeon 使用 OpenVINO 实现 0.75 毫秒,而使用 Windows ML 实现 1.15 毫秒。同样,对于 Inception V4 和 DeepLab V3 等更复杂的模型,OpenVINO 具有明显优势,推理时间分别为 12.51 毫秒和 12.69 毫秒,而使用 Windows ML 则为 15.94 毫秒和 21.75 毫秒。

下面的是英特尔至强 W7-2595X

与 AMD Ryzen 9 9950X 和 Dell Precision 3680 相比,使用 OpenVINO 的 Xeon w7-2595X 始终优于这两个系统,展示了优化的 AI 推理库的优势。虽然 Ryzen 9 在某些模型(例如 YOLO V3 和 MobileNet V3)中的表现与 Xeon 相似,但在测试要求更高的模型时通常会滞后,例如 Real-ESRGAN,其中使用 OpenVINO 的 Xeon 在 678.53 毫秒内完成,而 Ryzen 则为 2,029.39 毫秒。

在使用英特尔 OpenVINO 时,英特尔至强 w7-2595X 在该基准测试中表现最佳,证明了其在 AI 推理任务中的效率。这使其适合涉及推理速度至关重要的 AI 模型部署的工作负载。

UL Procyon 平均推理时间(越低越好) 英特尔至强 w7-2595X(26c,52t)
(Windows 机器学习)
英特尔至强 w7-2595X(26c,52t)
(英特尔 OpenVINO)
AMD 锐龙 9 9950X PBO
(Zen5、16c、32t)
戴尔Precision 3680
(英特尔酷睿 i9-14900K(24c,32t)
移动网络 V3 1.15ms 0.75ms 1.03ms 0.89毫秒
残差网络 50 5.98ms 5.07ms 5.59ms 7.13毫秒
盗梦空间V4 15.94ms 12.51ms 14.86ms 20.79毫秒
深实验室V3 21.75ms 12.69ms 21.49ms 24.05毫秒
优洛V3 26.61ms 37.99ms 26.83ms 50.92毫秒
真实ESRGAN 1,215.30ms 678.53ms 2,029.39ms 2,413.15毫秒
总体得分 242 316 232 184

y 粉碎机

y-cruncher 基准测试利用 CPU 的多核和多线程功能来衡量计算大量 Pi 数字的计算效率和速度。自 2009 年推出以来,它已成为超频者和硬件爱好者的热门基准测试和压力测试应用程序。

在本次测试中,英特尔至强 w7-2595X 的表现非常出色,仅用 1 秒就完成了 10.819 亿位数字的计算。这比 AMD Ryzen 9 9950X 和戴尔 Precision 3680 快得多,后两者分别需要 17.494 秒和 22.246 秒。

随着计算规模的增加,预期的性能差距也会扩大。对于 2.5 亿位数字,Xeon 用时 31.393 秒,比 Ryzen 的 50.120 秒和戴尔的 62.443 秒快得多。在 5 亿位数字时,Xeon 的优势更加明显,用时 70.952 秒,而 Ryzen 用时 116.049 秒,戴尔用时 138.698 秒。

Xeon w7-2595X 在 y-cruncher 中的卓越性能归功于其高核心数量和高效的资源利用率,使其能够更有效地处理密集型计算工作负载。

y-cruncher(总计算时间,以秒为单位;越低越好) 英特尔至强 w7-2595X(26c,52t) AMD 锐龙 9 9950X PBO(Zen5、16c、32t) 戴尔Precision 3680
(英特尔酷睿 i9-14900K(24c,32t)
1亿位数字 10.819秒  17.494秒 22.246秒
2.5十亿 31.393秒  50.120秒 62.443秒
5十亿 70.952秒  116.049秒 138.698秒

y-cruncher BBP

y-cruncher BBP(Bailey-Borwein-Plouffe)基准测试评估 CPU 在计算 Pi 的大十六进制数字时的性能,重点关注多核效率和总计算时间。在此基准测试中,Intel Xeon w7-2595X 展示了其稳定的多核性能和效率。

在 1 BBP 测试中,新 Xeon CPU 耗时 0.584 秒,CPU 利用率高达 3,581.07%,多核效率为 68.87%。AMD Ryzen 9 9950X 以 0.326 秒的速度更快地完成此测试,但 CPU 利用率(732.71%)和多核效率(22.90%)明显较低,表明其可用内核的利用效率较低。Xeon 的结果表明,在高计算负载下,其内核的使用更加均衡和高效。

随着 BBP 计算数量的增加,Xeon 保持较高的多核效率,97.50 BBP 达到 10%,99.73 BBP 达到 100%,总时间分别为 5.536 秒和 60.647 秒。尽管 Ryzen CPU 在 1 BBP 测试中时间更快,但在更高计数下效率一致性较差。多核效率和总计算时间的一致性使 Xeon w7-2595X 成为需要持续多核性能的工作负载的有力竞争者。

基准 英特尔至强 w7-2595X
(26c、52t)
AMD 锐龙 9 9950X PBO
(Zen5、16c、32t)
 戴尔Precision 3680
(英特尔酷睿 i9-14900K(24c,32t)
1 BBP · 总时间:0.584秒

  • CPU 利用率:3581.07%
  • 多核效率:68.87%
  • 总时间:0.326秒
  • CPU 利用率:732.71%
  • 多核效率:22.90%
 无
10 BBP  

  • 总时间:5.536秒
  • CPU 利用率:5070.17%
  • 多核效率:97.50%
  • 总时间:3.76秒
  • CPU 利用率:3,120.43%
  • 多核效率:97.51%
 无
100 BBP  

  • 总时间:60.647秒
  • CPU 利用率:5186.01%
  • 多核效率:99.73%
  • 总时间:3.76秒
  • CPU 利用率:3,120.43%
  • 多核效率:97.51%
 无

Geekbench 6

Geekbench 6 基准测试衡量不同平台上的整体系统性能,重点是 CPU 性能。基准测试为单核和多核性能提供单独的分数,全面了解处理器在不同工作负载下的性能。您可以在 Geekbench浏览器.

单核性能

在 Geekbench 6 单核测试中,Intel Xeon w7-2595X 得分为 2,436,低于 AMD Ryzen 9 9950X(3,346)和 Intel Core i9-14900K(3,059)。这一结果是意料之中的,因为 Geekbench 更看重更高的 CPU 时钟速度而不是核心数量,而 Ryzen 9 和 Core i9 的基本时钟速度和加速时钟速度都高于 Xeon w7-2595X。Ryzen 9 9950X 处于领先地位,表明它在三者中单线程性能最高,这使其成为严重依赖单核性能的任务(例如某些游戏和轻量计算任务)的更可靠选择。

多核性能

对于多核性能,Intel Xeon w7-2595X 的得分为 19,676,略低于 AMD Ryzen 9 9950X 的 20,801,但优于 Intel Core i9-14900 K 的 19,216。Xeon 相对较高的多核得分反映了其在工作负载方面的优势,可以有效利用其 26 个内核和 52 个线程,例如视频渲染、3D 建模和其他并行任务。尽管如此,Ryzen 9 9950X 在多核性能方面仍处于领先地位,这可能是因为它结合了更高的时钟速度和高效的核心架构,从而提供了更好的每个内核性能。Core i9-14900 K 的竞争性能受到与 Xeon 相比内核数量较少的阻碍,但它仍然受益于其高时钟速度。

Geekbench 6
(越高越好)
英特尔至强 w7-2595X(26c,52t) AMD 锐龙 9 9950X PBO(Zen5、16c、32t) 戴尔Precision 3680
(英特尔酷睿 i9-14900K(24c,32t)
CPU单核  2,436 3,346 3,059
CPU 多核 19,676 20,801 19,216

Maxon Cinebench 结果

  • Cinebench R15: 这是一个较旧的基准测试工具,使用场景渲染任务来评估 CPU 性能,主要测量多核性能。
  • Cinebench R20: Cinebench R15 的更新版本,具有更复杂的场景和更高的计算要求,反映了现实世界的使用情况并支持更新的指令集。
  • Cinebench R23: 在 R20 的基础上,延长测试时间以评估热节流,并包括多核和单核分数,以进行全面的 CPU 性能评估。
  • Cinebench 2024(R24): 最新版本具有苛刻的渲染任务,针对现代 CPU 和扩展负载进行了优化,可提供多核和单核性能结果。

Cinebench R15 多核性能

在 Cinebench R15 多核测试中,Intel Xeon w7-2595X 得分为 7,114 cb,紧随 AMD Ryzen 9 9950X 之后,后者得分为 7,168 cb。结果表明,这两款 CPU 在利用多核的工作负载下均表现良好,尽管 Xeon 在此较旧的基准测试版本中未充分利用其更高的核心数量。

Cinebench R20 多核性能

转到 Cinebench R20,Intel Xeon w7-2595X 的得分提高到 18,905 分,超过了 Ryzen 9 9950X 的 18,032 分。这表明 Xeon 的 26 核、52 线程配置开始在此基准测试中更有效地利用其并行处理能力,该基准测试利用了更复杂的场景,对 CPU 的要求比 R15 更高。这使得 Xeon 成为可以使用其扩展核心数的较新的多线程工作负载的略好选择。

Cinebench R23性能

Cinebench R23 多核测试结果显示,Intel Xeon w7-2595X 的领先优势更加明显,得分为 48,442 分,而 AMD Ryzen 9 9950X 得分为 45,571 分,并且明显优于 Dell Precision 3680 的上一代 Intel Core i9-14900K,得分为 35,108 分。这一大幅领先凸显了 Xeon 在繁重的多线程任务中的优势,可以充分利用其额外的核心和线程。然而,在 Cinebench R23 单核测试中,Xeon 得分为 1,715 分,落后于 Ryzen 9 9950X(2,296 分)和 Core i9-14900K(2,266 分)。这意味着,虽然 Xeon 在多线程任务方面表现出色,但由于其时钟速度较低,在单线程工作负载方面竞争力较弱。

Cinebench 2024 性能

Cinebench 2024 的结果进一步深入了解了这些处理器之间的性能动态。在多核测试中,Intel Xeon w7-2595X 得分 2,657 分,超过了 Dell Precision 3680 的 1,950 分。新 Xeon CPU 的优势反映了它适用于随着核心数量不断扩展的工作负载。相比之下,Cinebench 2024 单核测试中 Xeon 得分为 103 分。这再次明显低于 Core i9-14900 K 的 131 分,这进一步加剧了 Xeon 在单线程性能至关重要的场景中的相对劣势。

基准 CPU测试 英特尔至强 w7-2595X(26c,52t) AMD 锐龙 9 9950X PBO(Zen5、16c、32t) 戴尔 Precision 3680(英特尔酷睿 i9-14900K,24c,32t)
Cinebench R15 多核 7,114 cb 7,168 cb
Cinebench R20 多核 18,905点 18,032点
Cinebench R23 多核 48,442点 45,571点 35,108点
Cinebench R23 单核 1,715点 2,296点 2,266点
Cinebench 2024 多核 2,657点 1,950点
Cinebench 2024 单核 103点 131点

但是 Emerald Rapids 在 Workstation 中的哪里呢?

当被要求对英特尔发表评论时,英特尔表示对 Emerald Rapids(也称为第五代 Xeon Scalable)所做的更改与工作站芯片组不兼容,并且会导致 PCIe 通道限制。

结论

Intel Xeon w7-2595X 处理器为高性能工作站应用提供了强大的选择,特别是在 3D 渲染、AI 开发和数据密集型模拟等多核任务中。其 26 核、52 线程设计、PCIe 5.0 支持和用于 AI 工作负载的 Intel AMX 提供了一个功能强大的平台。虽然与其他产品相比,其单核性能在基准测试中可能并不领先,但 Xeon w7-2595X 表现出可靠的多线程性能,使其成为寻求可扩展、并行处理能力的人士的不二之选。

产品页

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅