主页 Enterprise 英特尔至强 6 评测(Sierra Forest – 6780E、6766E)

英特尔至强 6 评测(Sierra Forest – 6780E、6766E)

by 乔丹拉努斯

英特尔至强 6 Sierra Forest CPU 将所有 E 核以高能效封装的形式推向市场。本次评测从144核6780E CPU开始。

几周前推出了英特尔至强 6 系列服务器 CPU,取代了之前的“可扩展”品牌。有两个芯片系列:提供E核的Sierra Forest和提供P核的Granite Rapids。在本次评测中,我们对几组早期的 Sierra Forest CPU 进行了采样,其中包括高端 6780E,它将 144 个内核推向市场。

英特尔至强 6 塞拉森林

Xeon 6 CPU 旨在支持几乎所有工作负载,从明显的 AI 用例一直到要求较低的边缘部署。为了帮助客户了解这两条泳道,英特尔表示 Sierra Forest“针对高密度计算和横向扩展工作负载中的每瓦性能进行了优化”。 P 核 Granite Rapids CPU“针对计算密集型工作负载中的每核性能进行了优化”。不过,所有 Xeon 6 CPU 都使用通用平台和固件堆栈。

Intel Xeon 6 量子测试台

为了提供有关 CPU 性能的更多背景信息,英特尔将 Sierra Forest 定位为达到 5 年更新周期的系统的绝佳替代品。在这种情况下,每瓦性能数据应该会更加有利。

Xeon 6 即将推出,6700E 系列将于今天发布。但还有更多的事情要做。 Intel Xeon 6900P CPU 计划于今年第三季度上市。我们预计 3 年第一季度将出现大量芯片,包括 6900E、6700P、6500P、Xeon 6 SoC 和 6300P。

建筑创新

英特尔至强 6 设计演变

Xeon 6 引入了两种微架构设计:性能优化核心(P 核心)和效率优化核心(E 核心)平台。这种混合方法允许数据中心设计一个机架,其中计算密集型工作负载(例如人工智能和高性能计算)可以从最大性能中受益,而面向吞吐量的任务(例如微服务和网络)则可以实现新的能源效率水平。

增加核心数量

Xeon 6 Sierra Forest 处理器的主要特点是核心数量的显着增加。通过在每个处理器中集成更多内核,英特尔使数据中心能够同时处理更广泛的工作负载。核心密度的增加对于需要高水平并行处理的应用程序特别有利,可确保资源得到最佳利用,以最大限度地提高吞吐量并最大限度地减少延迟。

增强内存带宽

几代人以来,随着消费市场的速度已远远超过 7000MT/s,我们感觉我们一直受困于较慢的服务器 DRAM 速度。 Xeon 5 Sierra Forest 处理器中 DDR2.0 内存与 Ultra Path Interconnect (UPI) 6 的集成显着增强了内存带宽。这可以实现更快的数据访问并减少瓶颈,确保高性能应用程序能够顺利运行。改进的内存带宽对于处理大型数据集并需要快速数据检索和处理的应用程序至关重要,例如人工智能训练和大数据分析。

英特尔至强 6 高级 I/O 功能

对 PCIe 5.0 和 Compute Express Link (CXL) 2.0 的支持为 Xeon 6 Sierra Forest 处理器提供了先进的 I/O 功能。 PCIe 5.0 提供的带宽是其前身的两倍,使处理器和外围设备之间的通信速度更快。 CXL 2.0 通过为处理器、加速器、内存和存储提供高带宽、低延迟互连,进一步增强连接性。这确保了数据中心能够满足现代高速应用的需求,并能够与未来技术无缝集成。

模块化多芯片架构

Xeon 6 Sierra Forest 处理器采用由嵌入式多芯片互连桥 (EMIB) 技术支持的模块化多芯片架构。这种设计允许在单个封装中组合多个芯片,提供高带宽和低延迟,同时保持高效的功耗。模块化方法提供了灵活性和可扩展性,允许数据中心定制其基础设施以满足特定的工作负载要求。该架构还支持更好的热管理和电源效率,这对于在高密度环境中保持性能和可靠性至关重要。

英特尔至强 6 芯片架构

Xeon 6 Sierra Forest 处理器的芯片架构是对英特尔最大化性能和效率的创新方法的有趣见解。与传统的大型硅中介层不同,EMIB 实现了具有多个布线层的小型桥芯片。通过利用 EMIB 技术,英特尔可以在单个封装内互连多个芯片,从而减小整体封装尺寸并增强信号完整性。这种配置可实现芯片之间更快的数据传输速率,这对于在各种应用中保持高性能至关重要。

对数据中心的重要性

绩效与效率

与前几代相比,至强 6 处理器的每瓦性能提高了 2.7 倍,非常适合人工智能推理、媒体转码和一般计算任务。这种平衡确保数据中心能够以更低的能耗处理更多的工作负载,从而直接降低运营成本并提高可持续性。

可扩展性和灵活性

模块化架构允许数据中心根据特定的工作负载需求定制其基础设施。跨平台混合部署 P 核和 E 核的能力提供了一种定制方法来管理不同的计算需求,从而提高性能和效率。这提出了一个有趣的概念,可以选择一个机箱然后进行部署,其中一些机箱配备 E 核 CPU,可有效运行核心服务并在要求较低的时间处理操作,而其他机箱则配备 P 核 CPU 来处理高峰需求和苛刻的工作负载。

增强的安全性和可靠性

Xeon 6 处理器采用硬件增强的安全功能,为数据完整性和系统可靠性提供强大的保护。这对于在数据敏感环境中维持信任和合规性至关重要。

先进技术面向未来

凭借对 DDR5、PCIe 5.0 和 CXL 2.0 等最新技术的支持,至强 6 处理器可确保数据中心为未来的进步做好准备,并可以与新兴硬件和软件解决方案无缝集成。

现代问题的现代解决方案

英特尔至强 6 Sierra Forest 处理器代表了数据中心架构的重大飞跃。通过结合高性能、能源效率和可扩展性,它们满足了现代数据中心的多方面需求,为提高运营效率、降低成本以及处理人工智能和其他计算密集型应用日益增长的需求铺平了道路。

Intel Xeon 6 E-core SKU 地图

所有 Sierra Forest SKU 均配备具有 88 通道 PCIe Gen5/CXL 的 E-Core。

Intel Xeon 6 Sierra Forest CPU 顶部和底部

SKU 颜色 基本GHz 睿频GHz 最大睿频GHz L3 缓存 MB TDP 瓦数 马克斯·斯卡拉。 DDR5 内存速度 1DPC
6780E 144 2.2 3.0 3.0 108 330 2S 6400
6766E 144 1.9 2.7 2.7 108 250 2S 6400
6756E 128 1.8 2.6 2.6 96 225 2S 6400
6746E 112 2.0 2.7 2.7 96 250 2S 5600
6740E 96 2.4 3.2 3.2 96 250 2S 6400
6731E 96 2.2 3.1 3.1 96 250 1S 5600
6710E 64 2.4 3.2 3.2 96 205 2S 5600

英特尔至强 6 性能测试

我们的实验室为本次评测抽取了两组 CPU,即 6780E 和 6766E。 Intel提供了QCT服务器平台进行测试。我们想注意我们的数据中的一些关键注意事项。服务器平台本身在我们的许多测试环境中都不稳定。例如,它无法正确运行 Windows Server 2022,因此我们使用 2025。

这些 CPU 是早期样品,并非全新零售 CPU。因此,我们无法运行完整的测试,也没有时间在禁运取消之前从根本上解决我们所看到的一些问题、性能和稳定性问题。因此,以下数据应视为指导性数据,而不是最终数据。我们将等待英特尔 OEM 厂商推出平台,然后再对 Sierra Forest CPU 的功能做出更结论性的判断。

英特尔向我们提供了 Quanta QuantaGrid D55Q-2U 系统作为展示新 CPU 的测试平台。该服务器提供 24 盘位 NVMe 直连背板,支持 U.2 Gen4/Gen5 SSD。

我们的测试配置包括 16 x 16GB DDR5-6400 RAM 和 Micron MTC10F1084S1RC64BDY 模块

至强 6780E 和 至强6766E

  • 广达QuantaGrid D55Q-2U
  • 256GB DDR5 6400MHz

至强铂金 8592+ 

至强黄金6430

至强铂金 8480+

随着早期测试平台 gremlin 的投入使用,新的 Xeon 6780E 和 6766E CPU 在 Windows Server 2025 环境中进行测试,而过去的 CPU 在 Windows Server 2022 环境中进行测试。

搅拌机 OptiX 4.0

在 Blender OptiX 中,我们有 3 个不同的测试:Monster、Junkshop 和 Classroom。对于 Monster,我们看到 6780E 和 6766E 分别超过 8592+ 21% 和 14%,两者之间相差 18%。在 Junkshop 上,6780E 领先 8592+ 10.5%,而 6766E 仅落后 8592+ 0.35%。 Junkshop 上 10.8E 和 6780E 之间存在 6766% 的差异。对于教室部分,6780E 和 6766E 领先 8592+ 20% 和 22%,其中 10E 和 6780E 之间相差 6766%。

搅拌机 4.0 CPU 2 个至强 6780E(256GB DDR5) 2 个至强 6766E(256GB DDR5) 2 个至强铂金 8592+(ER) (R760 – 1TB DDR5 4800MHz) 2x 至强白金 8480+(SR) (ML350 G11 – 256GB DDR5 4400MHz) 2x 至强金牌 6430(SR) (R760 – 1TB DDR5 4800MHz)
怪物 1410.463 1297.715 1115.057 943.300 540.039
旧货店 862.418 777.716 780.408 627.662 361.066
课堂 696.543 628.960 556.550 475.144 278.228

 Cinebench R23

对于 Cinebench R23,多核性能显示 6780E 和 6766E 分别落后 8592+ 38% 和 42%。单核性能方面,6780E 比 24+ 落后 8592%,6766E 落后 31%。 6780E 和 6766E 多核得分差异下降约 5%,单核得分差异下降 18%

Cinebench R23 2 个至强 6780E(256GB DDR5) 2 个至强 6766E(256GB DDR5) 2 个至强铂金 8592+(ER) (R760 – 1TB DDR5 4800MHz) 2x 至强白金 8480+(SR) (ML350 G11 – 256GB DDR5 4400MHz) 2x 至强金牌 6430(SR) (R760 – 1TB DDR5 4800MHz)
CPU多核 67,984 64,326 110,498 79,164 69,663
CPU 单核 873 793 1,144 1,461 1,022
MP比率 77.91x 81.10x 96.63x 54.20x 68.17x

Cinebench 2024

在 Cinebench 2024 中,多核得分从 55+ 到 8592E 下降了约 6780%,从 61+ 到 8592E 下降了 6766%。 13E 和 6780E 在多核方面也存在 6766% 的差异。单核成绩方面,6780E和6766E仅相差5%,其中6780E和6766E分别落后37+34%和8592%。

Cinebench R23 2 个至强 6780E(256GB DDR5) 2 个至强 6766E(256GB DDR5) 2 个至强铂金 8592+(ER) (R760 – 1TB DDR5 4800MHz) 2x 至强金牌 6430(SR) (R760 – 1TB DDR5 4800MHz) 2x 至强白金 8480+(SR) (ML350 G11 – 256GB DDR5 4400MHz)
CPU多核 2,687 2,347 6,001 3,746 4,699
CPU 单核 43 45 68 59 76
MP比率 62.85x 52.65x 88.48x 63.22x 61.44x

Y-粉碎机

Y-cruncher 是一款流行的基准测试和压力测试应用程序,于 2009 年推出。该测试是多线程且可扩展的,计算 Pi 和其他常数高达数万亿位。在这个测试中越快越好。

新的 6780E 和 6766E 的运行速度比 Emerald Rapids 8592+ 稍慢,但它们并不完全是直接竞争对手。在 6780 亿次测试中,13E 的运行速度比 Xeon Gold 6430 快大约 1%,但比 Xeon Platinum 39+ 慢大约 8592%。 6766E 的运行速度比 Gold 19 慢 6439%,比 Platinum 42+ 慢 8592%

Y-Cruncher(越低越好) 至强 6780E(256GB DDR5) 至强 6766E(256GB DDR5) 2 个至强铂金 8592+(ER) (R760 – 1TB DDR5 4800MHz) 2x 至强金牌 6430(SR) (R760 – 1TB DDR5 4800MHz) 2x 至强白金 8480+(SR) (ML350 G11 – 256GB DDR5 4400MHz)
1亿 6.927秒 7.254秒 4.239秒 6.060秒 5.136秒
2.5亿 17.898秒 19.507秒 11.466秒 16.896秒 13.768秒
5亿 38.454秒 41.116秒 25.325秒 36.843秒 29.889秒
10亿 81.146秒 87.403秒 54.921秒 80.574秒 65.194秒
25亿 217.530秒 238.813秒 156.923秒 229.017秒 186.841秒
50亿 565.913秒 502.245秒

7-ZIP

流行的 7-Zip 实用程序具有内置内存基准测试,可以很好地展示 CPU 性能。在此测试中,我们尽可能以 128MB 字典大小运行它。在本次测试中,6780E 在总评分上勉强领先于 Platinum 8592+。在减压方面,6766E 也领先于 8592+。

7-Zip 压缩 至强 6780E(256GB DDR5) 至强 6766E(256GB DDR5) 2 个至强铂金 8592+(ER) (R760 – 1TB DDR5 4800MHz) 2x 至强金牌 6430(SR) (R760 – 1TB DDR5 4800MHz) 2x 至强白金 8480+(SR) (ML350 G11 – 256GB DDR5 4400MHz)
压缩
当前 CPU 使用率 5,891% 4,768% 5,609% 5,732% 5,482%
电流额定值/使用 4.985 吉普斯 4.614 吉普斯 4.912 吉普斯 3.912 吉普斯 4.628 吉普斯
额定电流 293.689 吉普斯 220.001 吉普斯 275,503 吉普斯 224.209 吉普斯 253.724 吉普斯
产生的 CPU 使用率 5,603% 5,103% 5,605% 5,669% 5,475%
结果评级/使用 4.954 吉普斯 4.638 吉普斯 4.883 吉普斯 3.923 吉普斯 4.628 吉普斯
结果评级 277.670 吉普斯 236.910 吉普斯 273.716 吉普斯 222.407 吉普斯 253.382 吉普斯
解压
当前 CPU 使用率 5,962 吉普斯 5,798% 6,243% 5,852% 6,219%
电流额定值/使用 4.550 吉普斯 4.152 吉普斯 3.635 吉普斯 3.423 吉普斯 3.745 吉普斯
额定电流 271.266 吉普斯 240.693 吉普斯 226.917 吉普斯 200.350 吉普斯 231.916 吉普斯
产生的 CPU 使用率 5,832% 6,029% 6,232% 5,894% 6,129%
结果评级/使用 4.540 吉普斯 4.161 吉普斯 3.654 吉普斯 3.385 吉普斯 3.871 吉普斯
结果评级 264.764 吉普斯 250.853 吉普斯 227.744 吉普斯 199.363 吉普斯 237.259 吉普斯
总评分
总 CPU 使用率 5,717% 5,566% 5,919% 5,781% 5,802%
总评分/使用情况 4.747 吉普斯 4.399 吉普斯 4.269 吉普斯 3.654 吉普斯 4.249 吉普斯
总评分 271.217 吉普斯 243.882 吉普斯 250.730 吉普斯 210.363 吉普斯 245.320 吉普斯

结论

全新 E 核英特尔至强 6 系列是 Sierra Forest 系列的一部分,在审查节奏方面发生了变化。在过去的 Intel 版本中,我们通常首先看到的是高端 CPU;这一次,英特尔凭借中端高效 SKU 处于领先地位。

也就是说,即使与之前的第五代可扩展型号相比,Sierra Forest CPU 的性能也表现良好。但按照英特尔的计算方式,想要购买新硬件的客户会将这些硬件与运行英特尔至强 5 CPU 之类的已退役约 5 年的系统进行比较。以这些系统作为比较,E-Core Xeon 8280 CPU 提供了巨大的密度和节能优势。

Intel Xeon 6 服务器设置

在本次评测中,我们正在处理非常早期的 CPU 和服务器,该服务器足以游览塞拉森林,但还达不到我们想要进行完整评测的程度。在 Windows 操作系统的错误(在我们的 Ubuntu 测试中不存在)和等待 BIOS 修订之间,很明显,这些 CPU 的性能还有增长和最大化的空间。不过,凭借这一点,我们对 Sierra Forest 目前能够提供的功能以及 Granite Rapids CPU 在今年晚些时候能够提供的性能工作负载感到乐观。另外,我们不要对未来几个季度最终推出的 288 E-Core 6900 系列抱有期待。在为应用程序调整基础设施时,英特尔将为客户提供比以往更多的选择。

我们预计很快就会在实验室中推出采用 Sierra Forest CPU 的最终发货硬件。我们将在接下来的评论中深入探讨功耗、存储性能等。

英特尔至强

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅