戴尔 PowerEdge R770AP 并非通用服务器,而这正是它的关键所在。大多数 2U 双路平台追求灵活性,而 R770AP 则反其道而行之,牺牲了 GPU 支持、混合存储选项和原始内存容量,换取了戴尔当前英特尔产品线中最高的核心密度、内存带宽和执行确定性。这是一款基于特定处理器架构、专为特定工作负载打造的服务器,它对自身的功能缺失毫不掩饰。
要了解它存在的意义,首先要了解它所依附的平台。戴尔的 PowerEdge R7x0 系列历来是该公司功能最全面的 2U 英特尔服务器,而搭载 AMD 处理器的服务器则更是如此。 PowerEdge R7725 在EPYC方面扮演同等角色。 PowerEdge R770 它延续了英特尔的传统,支持 Xeon 6 P 核和 E 核处理器、GPU 加速器、混合 SAS/SATA/NVMe 存储、32 个 DIMM 插槽,最高可达 8 TB 内存,以及足够的 PCIe Gen5 扩展能力,足以满足从虚拟化到 AI 推理的所有需求。
PowerEdge R770AP 不是那款服务器。
“AP”代表“高级性能”,但这个名称远不足以体现这台机器的真正区别。R770采用LGA 4710插槽的英特尔Granite Rapids-SP芯片,配备8个内存通道和最多86个P核心;而R770AP则采用LGA 7529插槽的Granite Rapids-AP平台,每个插槽最多可提供128个P核心(我们测试的配置为120个核心),并支持12个DDR5内存通道。英特尔在其整个Xeon 6 6900系列战略中都秉持着同样的理念:AP平台上的6900P处理器代表了英特尔性能最高的服务器芯片,专为那些对单核性能、内存带宽和执行确定性要求高于服务器整体配置灵活性的应用场景而设计。

英特尔新款 Granite Rapids-AP LGA 7529 插槽
英特尔更广泛的至强6架构将数据中心分为两个通道。E核心处理器面向云原生、横向扩展工作负载(例如微服务和内容分发),追求高密度和高能效。P核心处理器则面向计算密集型工作,这类工作对每个线程的稳定性至关重要,例如高性能计算模拟、实时分析、大型内存数据库以及对延迟敏感的金融计算。6900P系列位于P核心架构的顶端,它拥有最高的核心数量,并配备12通道内存带宽、每个插槽最多96条PCIe Gen5通道、最多6个UPI 2.0链路,以及在高端SKU(例如英特尔至强6978P)上高达504MB的L3缓存池。该架构的目标不仅是原始吞吐量,更是可预测的吞吐量,从而最大限度地减少调度抖动和内存访问波动,避免在对时间要求严格的环境中降低性能。
R770AP 是戴尔对这一理念的机箱诠释。它剔除了 Granite Rapids-AP 平台所有不必要的功能:完全取消了 GPU 支持,SAS 和 SATA 存储选项也被移除,取而代之的是纯 NVMe 配置(最多 16 个 2.5 英寸 Gen5 NVMe 或最多 32 个 E3.S Gen5 NVMe,具体取决于配置),内存容量上限为 3 TB,分布在 24 个 DIMM 插槽中(每个插槽 12 个,每个插槽 1 个 DPC 以实现最大单通道速度),PCIe 扩展也精简为 5 个 Gen5 x16 插槽和双 OCP NIC 3.0 网卡。最终呈现的是一个 2U 双路平台,针对计算密度、内存带宽以及高频交易、实时风险分析和大规模并行模拟等工作负载所需的确定性行为进行了优化。

凯文拿着装有英特尔 6900 系列芯片的 R770AP 散热器
我们评测的这台机器配备了两颗英特尔至强6978P处理器,每颗处理器拥有120个P核心,基础频率为2.1GHz,全核睿频可达3.2GHz,并配备了3TB的DDR5-6400内存,分布在全部24个DIMM插槽中。与配备两颗至强6787P处理器(每颗86个核心,8个内存通道,2TB DDR5内存)的R770相比,R770AP的核心数量增加了39.5%,内存通道数量增加了50%。问题在于,这些架构优势能否转化为实际应用中的相应性能提升,以及对于戴尔和英特尔所针对的工作负载而言,这种平台性能上的权衡是否值得。
戴尔 PowerEdge R770AP 规格
下表列出了戴尔 PowerEdge R770AP 平台的物理和支持的配置规格。
| 规格 | 戴尔 PowerEdge R770AP |
|---|---|
| 处理器 | |
| 处理器 | 两颗英特尔® 至强® 6 6900 系列处理器,每颗处理器最多可达 128 个 P 核心 |
| 内存 | |
| DIMM 插槽 | 24 个 DDR5 DIMM 插槽 |
| 最大内存 | 3 TB |
| 记忆体速度 | 最高6400 MT / s |
| 内存类型 | 仅限注册型 ECC DDR5 RDIMM |
| 存放 | |
| 存储控制器(RAID) | PERC H975i DC-MHS 前面板(内置) |
| 内部启动 | BOSS-N1 DC-MHS:HWRAID 1,2 个 M.2 NVMe SSD 或 USB |
| 前驱动器托架 | 最多可配备 16 个 2.5 英寸 G5 x4 NVMe SSD(最大 245.76 TB) 最多可配备 16 个 2.5 英寸 G5 x2 NVMe SSD(最大 245.76 TB) 最多可支持 32 个 EDSFF E3.S Gen5 NVMe SSD(最大 491.52 TB) |
| 后置驱动舱 | 无 |
| 电力 | |
| 电源 | 1500瓦钛金版,100-120伏LLAC或200-240伏HLAC,240伏直流,支持热插拔冗余 1800瓦钛金版,200-240伏交流电,240伏直流电,支持热插拔冗余 2400瓦钛金版,100-120伏LLAC或200-240伏HLAC,240伏直流,支持热插拔冗余 3200瓦钛金版,200-220伏交流电或220.1-240伏交流电,240伏直流电,支持热插拔冗余 3200瓦钛金版,277伏交流电和高压直流电,支持热插拔冗余* |
| 冷却和风扇 | |
| 冷却选项 | 空气冷却 |
| 风机 | 最多可安装 6 个热插拔风扇 |
| 外形尺寸和尺寸 | |
| 外形 | 2U机架服务器 |
| 高度 | 86.8毫米(3.42英寸) |
| 宽度 | 482毫米(19.0英寸) |
| 深度(含表圈) | 802.40毫米(31.59英寸) |
| 深度(不含边框) | 801.51毫米(31.56英寸) |
| 表圈 | 可选金属边框 |
| 人脉拓展与扩张 | |
| OCP网络选项 | 最多可支持两张 OCP NIC 3.0 卡 插槽 4:1×8 或 1×16 Gen5 OCP 3.0 插槽 10:1×16 Gen5 OCP 3.0 |
| 嵌入式网卡 | 1 Gb 专用 BMC 以太网端口 |
| PCIe插槽 | 最多 5 个 Gen5 PCIe 插槽(x16 连接器) 插槽 2:1×16 Gen5,全高,半长 插槽 3:1×16 Gen5,全高/矮型,半长 插槽 5:1×16 Gen5,全高,半长 插槽 7:1×16 Gen5,全高,半长 插槽 9:1×16 Gen5,全高/矮型,半长 |
| GPU 选项 | 无 |
| 端口 | |
| 前端口 | 1x USB 2.0 C型 |
| 后端口 | 1 个专用 BMC 以太网端口 2x USB 3.1 A型 1x VGA |
| 内部端口 | 1x USB 3.1 A型 |
| 管理学 | |
| 嵌入式管理 | iDRAC10、iDRAC Direct、iDRAC RESTful API(含 Redfish)、RACADM CLI、iDRAC 服务模块 |
| 安保防护 | |
| 安全功能 | 加密签名固件、静态数据加密(采用本地或外部密钥管理的静态数据加密设备)、安全启动、安全组件验证(硬件完整性检查)、安全擦除、硅信任根、系统锁定(需要 iDRAC10 企业版或数据中心版)、TPM 2.0 FIPS/CC-TCG 认证、机箱入侵检测 |
| 操作系统和管理程序 | |
| 支持的操作系统/虚拟机管理程序 | Canonical Ubuntu Server LTS、Red Hat Enterprise Linux、SUSE Linux Enterprise Server、VMware vSAN / VMware ESXi*、Microsoft Windows、Microsoft Windows Server、Microsoft Windows Server Datacenter |
设计与建造
戴尔 PowerEdge 770AP 是一款 2U 机架式服务器,属于戴尔第 17 代 PowerEdge 产品线,其外观设计与我们评测过的 R770 一脉相承。它的尺寸为:高 3.42 英寸,宽 19.0 英寸,深 31.59 英寸。前面板为可选配件。前面板包含 iDRAC Direct 接口、一个 USB 2.0 Type-C 端口、电源按钮和一个系统 ID 按钮。
存放
770AP 支持三种存储配置。该设备最多可配备 16 块 2.5 英寸 Gen 5 x4 NVMe SSD,最大容量为 245.76 TB。此外,还可选配最多 16 块 2.5 英寸 Gen 5 x2 NVMe SSD,容量上限同样为 245.76 TB;以及最多 32 块 EDSFF E3.S Gen 5 NVMe SSD,容量可扩展至 491.52 TB。在 16 盘位配置中,戴尔将硬盘分为左右两组,每组 8 块,中间位置为进气口,用于空气流通。
深入机箱内部,770AP 采用了简洁的 NVMe 线缆布局。线缆直接从存储背板连接到主板前端,缩短了信号路径,使内部布局更加整齐。
后部 I/O 和网络接口
770AP 的后部两端各配备一个冗余的 2400W 电源单元。BOSS-N1 模块负责启动系统,并内置两块 480GB 硬盘用于安装操作系统。
为了扩展性能,服务器在插槽 2、3、5、7 和 9 上提供了多达五个第五代 PCIe 插槽,全部采用 x16 全高配置。OCP 3.0 网络由最多两张网卡负责:插槽 4 支持 x8 或 x16 第五代 PCIe,插槽 10 提供专用的 x16 第五代 PCIe 连接。我们收到的这台服务器配备了一张 200GbE OCP 网卡以及多张 100GbE 网卡,网络带宽绰绰有余。
标准后置 I/O 包括一个专用的 BMC 以太网端口、两个 USB 3.1 Type-A 端口和一个 VGA 端口。
仔细观察 BOSS-N1 模块,可以看到两个 480GB 启动驱动器并排排列,均可热插拔,需要时可以快速访问和更换。
拆下顶盖和导风罩后,R770AP 的内部布局简洁有序。六个热插拔风扇将空气吹过大型散热片,为 Xeon 6900 系列处理器散热,双 CPU 和内存配置对称分布在主板上。机箱内随处可见蓝色标签,这些标签可作为拆卸导向,方便拆卸线缆和检修组件。
处理器
拆下CPU后,英特尔至强6900系列芯片的庞大体积便一目了然。R770AP采用LGA 7529插槽,我们评测的这台机器配备了两颗英特尔至强6978P处理器。每颗芯片的TDP为500W,拥有120个核心,两个插槽加起来总共有240个核心。
散热和内存
为了仅通过风冷散热来应对 1000W 的 CPU 散热需求,戴尔精心设计了散热器。前后散热器均采用水平鳍片和热管,以高效导热。同时,中间部分采用垂直鳍片阵列,增加了气流停留时间和接触面积,使风扇有更多时间将热量排出机箱。散热器之间共有 24 个 DIMM 内存插槽,每个 CPU 两侧各有 12 个插槽,每侧 6 个。
电力
R770AP 支持四种电源选项,全部通过 80 Plus 钛金认证并支持热插拔冗余:1500W、1800W、2400W 和 3200W。仅 CPU 的功耗就高达 1000W,因此 1500W 的基准功率在考虑硬盘和扩展卡后几乎没有余量。我们评测的这台机器配备的是 2400W 电源,其效率为 96%,这对于满载存储配置来说是实际所需的最低功率。
iDRAC 10 管理
R770AP 的远程管理由 iDRAC10 负责,该平台也是戴尔在其整个第 17 代 PowerEdge 产品线(包括以下产品)中标配的平台: PowerEdge R770 和 PowerEdge R7725 我们之前已经评测过。该界面在整个产品组合中保持一致,因此已经熟悉其他 PowerEdge 平台上 iDRAC 的管理员会感到非常熟悉。
iDRAC10 控制面板提供所有主要子系统的完整、一目了然的健康概览,包括:系统健康、处理器、内存、散热、存储、电压、电源、电池和入侵检测。评测样机显示,所有子系统在测试时均报告运行正常。系统信息和固件版本详情以及许可证状态(评测样机确认为企业版)直接显示在控制面板上。任务摘要面板跟踪待处理、进行中和已完成的作业,评测样机显示了初始配置周期中已完成的作业,其中包括少量错误作业和一个失败作业,这在新部署中很常见。
深入查看“系统环境”部分,可以实时了解散热详情,包括各个风扇的状态、PWM 转速、散热曲线设置和进气温度读数。这对于验证高密度机架配置中的气流或在无需物理接触服务器的情况下排查散热问题尤为有用。
电源可视化也遵循同样的模式。“电源信息”部分详细列出了电源单元的运行状况、电流消耗和容量利用率,并配有滚动历史趋势图。管理员可以快速查看一段时间内的平均功率和峰值功率,这对于容量规划和识别工作负载引起的功率峰值非常有价值,而无需单独的电源监控工具。
这些观点共同使 iDRAC10 成为一款功能强大的带外管理解决方案,涵盖了 R770AP 的整个运行生命周期,从初始部署到日常监控,所有这些都可以通过浏览器或 RESTful Redfish API 远程访问。
戴尔 PowerEdge R770AP 性能
为了评估 R770AP,我们将其与 R770 进行了直接比较。R770AP 配备两颗 Intel Xeon 6978P 处理器,每颗处理器有 120 个核心,总共 240 个核心,并配备 3TB DDR5 内存。相比之下,R770 则配备两颗 Intel Xeon 6787P 处理器,总共 172 个核心,并配备 2TB DDR5 内存。
为了全面测试两个系统上的 CPU 性能,我们使用了一组专门的计算基准测试。y-cruncher 用于评估原始算术吞吐量和多线程浮点性能。Blender 提供了一个实际应用场景下的渲染工作负载,其性能会随着可用核心数和内存带宽的变化而变化。Phoronix 测试套件则提供了一系列更广泛的 CPU 密集型工作负载,从而更全面地展现了两个平台持续计算性能的全貌。
测试系统规格
- 平台: 戴尔 PowerEdge R770AP
- CPU: 双英特尔 Xeon 6978P,120 核
- 记忆: 3TB DDR5
- 存储: 老板 RAID1
y 粉碎机
y-cruncher 是一款流行的基准测试和压力测试应用程序,于 2009 年发布。该测试采用多线程和可扩展设计,能够计算圆周率和其他常数,精度可达万亿位。在这个测试中,速度越快越好。这款软件非常适合测试高核心数平台,并能展现单路和双路平台之间的计算优势。
在 y-cruncher 基准测试中,R770AP 在所有测试规模下均表现优于 R770。在 10 亿位数的测试中,R770AP 仅用时 2.692 秒,而 R770 则耗时 2.753 秒。在 100 亿位数的测试中,R770AP 仅用时 30.399 秒,而 R770 则耗时 34.873 秒。在 1 亿位数的测试中,R770AP 仅用时 192.128 秒,而 R770 则耗时 221.255 秒。在最大工作负载下,差距进一步扩大,R770AP 在 50 亿位数的测试中仅用时 430.208 秒,而 R770 则耗时 491.737 秒,两者相差约 61 秒,R770AP 的性能优势约为 12.5%。
| Y-cruncher(持续时间越短越好) | 戴尔 PowerEdge R770(2x 英特尔至强 6787P | 2TB 内存) | 戴尔 PowerEdge R770AP(2 个英特尔至强 6978P 处理器 | 3TB 内存) |
|---|---|---|
| 1亿 | 2.753秒 | 2.692秒 |
| 2.5亿 | 7.365秒 | 6.747秒 |
| 5亿 | 16.223秒 | 14.235秒 |
| 10亿 | 34.873秒 | 30.399秒 |
| 25亿 | 99.324秒 | 86.298秒 |
| 50亿 | 221.255秒 | 192.128秒 |
| 100亿 | 491.737秒 | 430.208秒 |
混合器
一款开源 3D 建模应用程序。此基准测试使用 Blender Benchmark 实用程序运行。分数以每分钟样本数计算,分数越高越好。
在 Blender 4.3 基准测试中,R770AP 在所有三个场景中均优于 R770。在“怪物”场景中,R770AP 的采样率为每分钟 2,200.116 次,而 R770 为每分钟 1,706.002 次。在“废品站”场景中,R770AP 的采样率为每分钟 1,565.643 次,而 R770 为每分钟 1,169.370 次。在“教室”场景中,R770AP 的采样率为每分钟 1,076.122 次,而 R770 为每分钟 791.475 次,这意味着在该工作负载下,R770AP 的性能优势约为 36%。
| Blender 4.3 CPU 基准测试(每分钟采样数越高越好) | 戴尔 PowerEdge R770(2x 英特尔至强 6787P | 2TB 内存) | 戴尔 PowerEdge R770AP(2 个英特尔至强 6978P 处理器 | 3TB 内存) |
|---|---|---|
| 怪物 | 1,706.002 个样本/分钟 | 2,200.116 个样本/分钟 |
| 旧货店 | 1,169.370 个样本/分钟 | 1,565.643 个样本/分钟 |
| 课堂 | 791.475 个样本/分钟 | 1,076.122 个样本/分钟 |
Phoronix 基准测试
Phoronix 测试套件是一个开源的自动化基准测试平台,通过 OpenBenchmarking.org 支持超过 450 个测试配置文件和 100 多个测试套件。它能够处理从安装依赖项到运行测试和收集结果的所有步骤,使其成为性能比较、硬件验证和持续集成的理想选择。我们将重点比较 R770AP 和 R770 在 Stream、7-Zip、Linux 内核构建、Apache 和 OpenSSL 测试中的表现。
资讯
在流式内存带宽测试中,R770AP 的性能比 R770 有了显著提升,得分达到 869,965.3 MB/s,而 R770 的得分为 472,135.6 MB/s。这几乎是基准系统的两倍内存带宽,反映了 R770AP 更大、更快的内存配置。
7-ZIP
在 7-Zip 压缩基准测试中,R770AP 的得分为 806,375 MIPS,而 R770 的得分为 628,206 MIPS,这得益于 6978P 处理器更高的核心数量,实现了显著提升。
内核编译
在 Linux 内核编译测试中,时间越短越好,R770AP 完成 allmod 编译用时 176.391 秒,而 R770 用时 188.793 秒,编译时间缩短了大约 12 秒。
Apache (阿帕奇)
在 Apache 测试中,R770 的表现略胜 R770AP 一筹,其每秒请求数达到 60,258.5 次,而 R770AP 仅为 48,729.63 次。值得注意的是,Web 服务工作负载的性能并非总是与核心数量呈线性关系,还会受到内存延迟和 I/O 特性的影响。
OpenSSL的
在 OpenSSL 验证测试中,R770AP 的验证速度为 2,515,270,390,853 次/秒,而 R770 的验证速度为 2,216,883,554,350 次/秒,加密吞吐量有了显著提高,突显了 6978P 在大规模应用时的计算效率。
| Phoronix 基准测试 | 戴尔 PowerEdge R770(2x 英特尔至强 6787P 86 核) | 戴尔 PowerEdge R770AP(2 个英特尔至强 6978P 处理器 | 3TB 内存) |
|---|---|---|
| 资讯 | 472,135.6 MB / s的 | 869,965.3 MB / s的 |
| 7个邮递区号 | 628,206 MIP/秒 | 806,375 MIP/秒 |
| 内核编译(allmod)(数值越低越好) | 188.793秒 | 176.391秒 |
| Apache(每秒请求数) | 60,258.5 卢比/秒 | 48,729.63 卢比/秒 |
| OpenSSL的 | 2,216,883,554,350 验证/秒 | 2,515,270,390,853 验证/秒 |
戴尔 PowerEdge R770AP:高频交易和确定性性能
虽然我们的标准基准测试套件侧重于计算吞吐量、内存带宽和一般工作负载扩展性,但 R770AP 的设计重点延伸到了我们通常不会测试的领域:微秒级的执行确定性。为了说明该平台能够为要求最苛刻的目标用户带来什么, 戴尔发布了一份技术简报 我们与 Metrum AI 合作,专门针对高频交易工作负载对 R770AP 进行了评估。我们并未进行这项测试,也没有对测试结果进行独立审核。尽管如此,我们仍在此提供一份概要,因为它最直接地展示了这款服务器与 R770 的区别。
Metrum AI 方法论的核心是一个名为 jitter-c 的定制工具,它用于测量每个核心的唤醒延迟抖动,本质上衡量的是线程在特定时刻实际开始运行的一致性。该指标将 CPU 调度波动与网络、内存和应用程序层面的因素隔离开来,使其成为跨处理器世代进行清晰比较的基准。该研究使用配备双路 Xeon 6980P 处理器(共 256 个核心)的 R770AP 与配备双路 Xeon Platinum 8592+ 处理器(共 128 个核心)的上一代 R760 进行对比,发现 Granite Rapids-AP 架构将 p99 唤醒抖动降低至约 1 微秒,约为旧平台的一半,同时核心密度翻了一番。这些抖动数据随后被输入到回测仿真引擎中,以模拟其对财务的影响,结果总结如下。
| Metrum AI 高频交易回测结果 | 戴尔 PowerEdge R760(2 个 Xeon 8592+ 处理器,128 核) | 戴尔 PowerEdge R770AP(2x Xeon 6980P,256 核) |
|---|---|---|
| 第99页 醒来时的紧张不安 | ~2 微秒 | ~1 微秒 |
| 均值回归:总交易量 | 5,175 | 6,229(+ 20.4%) |
| 均值回归:每秒交易次数 | 819 | 991(+ 21.1%) |
| 做市:交易总数 | 21,765 | 32,491(+ 49.3%) |
| 做市:交易/秒 | 2,067 | 3,072(+ 48.6%) |
正如戴尔公司的西莫斯·琼斯在对这项研究的评论中所指出的那样,价值主张不在于速度,而在于速度的可预测性,因为在交易中,一个速度快但不稳定的系统会带来风险。相反,一个确定性的系统则是一种战略资产。
结语
戴尔 PowerEdge R770AP 在第 17 代 PowerEdge 产品线中占据着一个明确而独特的定位。它并非 R770 的替代品,戴尔也并未将其定位为替代品。R770 依然是一款功能全面、配置灵活的 2U 英特尔平台,支持 GPU、SAS/SATA/NVMe 混合存储、E 核和 P 核处理器选项,以及通过 32 个 DIMM 插槽支持高达 8TB 的内存。对于运行通用虚拟化、混合企业应用或需要灵活配置的工作负载的企业而言,R770 仍然是理想之选。
R770AP 的存在是为了应对 R770 从未针对其优化过的工作负载。通过迁移到 Granite Rapids-AP 平台,戴尔打造了一款 2U 系统。该平台采用 12 通道内存架构,每个插槽最多可配备 128 个 P 核心,并拥有 504 MB 的 L3 缓存。R770AP 优先考虑计算密度、内存带宽和执行确定性,而非通用性。我们的基准测试结果也印证了这一点:STREAM 带宽几乎翻了一番,Blender 渲染性能提升了 29-36%,并且随着工作集超出缓存,y-cruncher 的扩展性也持续提升。值得注意的是 Apache 的性能下降,这表明 R770AP 的 NUMA 拓扑结构需要对工作负载进行感知才能充分发挥其性能,并非所有应用程序都能在不进行调优的情况下从平台升级中获益。
戴尔随该平台发布的 Metrum AI 测试结果进一步强化了其确定性优势。将 p99 调度抖动减半,同时将核心密度提升一倍,对于运行高频交易、实时风险引擎、大规模内存分析和大规模并行模拟的企业而言,这是一项意义重大的架构改进。对于这些工作负载,R770AP 是一款设计精良、专用的平台。而对于其他应用场景,主流 PowerEdge 产品组合中的 R770 和 R7725 仍然是更合适的选择。




Amazon