主页 企业 Dell PowerEdge C6615 服务器评测

Dell PowerEdge C6615 服务器评测

by 凯文·奥布莱恩

Dell PowerEdge C6615 节点提供单个 AMD EPYC CPU,最多可容纳 64 个内核和六个支持 5GB DIMM 的 DDR96 插槽。

Dell PowerEdge C 系列平台拥有一个 2U 机箱,支持 Dell 模块化基础设施类别内的四台服务器。根据工作负载,C 系列系统可以配置两种不同的节点类型:AMD 单插槽 C6615 节点或 Intel 双插槽 C6620 节点。

我们的评测将重点关注 C 系列机箱,它有四个单插槽 AMD EPYC 节点,连接到 8 托架 E3.S PCIe Gen5 驱动器背板。

Dell PowerEdge C6615 英雄正面

从存储角度来看,该平台可以设置 2.5 英寸 SFF 驱动器背板,该背板最多支持 24 个 NVMe SSD 或 Gen5 支持,利用 8 托架 E3.S 背板。在内部,这些驱动器直接连接到每个节点,均匀分布在四台服务器上。例如,在 24 托架配置中,每个节点有六个驱动器;在 8 托架设置中,每个节点有两个驱动器。

C6600 机箱为安装的四个节点提供共享冗余电源和冷却,但除此之外,每个节点都是独立管理的。因此,与带有机箱管理门户的托管刀片机箱不同,这更像是一个金属屋顶下的四台小型 PowerEdge 服务器。每个 C6615 节点都有专用的网络连接、iDRAC 接口和用于扩展的 PCIe 插槽。

Dell PowerEdge C6615 节点规格

C6615规格
处理器 一个 AMD EPYC 处理器,最多 64 个核心
内存 6 个 DDR5 DIMM 插槽,支持最大 576 GB(6 x 96 GB)的 RDIMM,速度高达 4800 MT/s
存储控制器 内部控制器 (RAID):PERC H755N、PERC H355
内部启动:启动优化存储子系统 (NVMe BOSS-N1):HWRAID 1、2 x M.2 SSD
内部 12 Gbps SAS HBA(非 RAID):HBA355i
软件 RAID:S160
可用性 热插拔冗余驱动器和 PSU
驱动器托架 前舱:
最多 16 个 2.5 英寸 SAS/SATA(HDD/SSD)驱动器,最大 61 TB
通用背板配置上最多可配 16 个 2.5 英寸 SATA/NVMe 驱动器,最大容量为 15.36 TB
NVMe 背板上最多 16 x 2.5 英寸
NVMe SSD 硬盘背板上最多可支持 8 个 E3.s
热插拔、冗余电源 3200W 277 VAC 或 336 VDC
2800W 钛金 200-240 VAC 或 240 VDC
2400W 白金 100-240 VAC 或 240 VDC
1800W 钛金 200-240 VAC 或 240 VDC
尺寸 高度 – 40.0 毫米(1.57 英寸)
宽度 – 174.4 毫米(6.86 英寸)
深度 – 549.7 毫米(21.64 英寸)、561.3 毫米(22.10 英寸)– SAS/SATA 或 NVMe 或 E3.S 或通用配置
重量 3.7公斤(8.15磅)
嵌入式管理 IDRAC9
IDRAC直接
带有 Redfish 的 IDRAC RESTful API
IDRAC 服务模块
开放管理软件 CloudIQ for PowerEdge 插件
开放管理企业
适用于 VMware Vcenter 的 OpenManage Enterprise 集成
适用于 Microsoft System Center 的 OpenManage Integration
OpenManage 与 Windows 管理中心的集成
OpenManage 电源管理器插件
OpenManage 服务插件
OpenManage 更新管理器插件
集成 BMC真视
微软系统中心
OpenManage 与 ServiceNow 集成
OpenManage 与 Windows 管理中心的集成
OpenManage 电源管理器插件
OpenManage 服务插件
OpenManage 更新管理器插件
安全 AMD 安全加密虚拟化 (SEV)
AMD 安全内存加密 (SME)
密码签名的固件
静态数据加密(具有本地或外部密钥管理的 SED)
安全启动安全组件验证(硬件完整性检查)
安全擦除
信任的硅根
系统锁定(需要 IDRAC9 Enterprise 或 Datacenter)
TPM 2.0 FIPS,CC-TCG认证,TPM 2.0 China NationZ
嵌入式网卡 1 x 1 GBE
后端口 1 x的USB 3.0
1 个 IDRAC 以太网端口
1 个 IDRAC Direct (Micro-AB USB) 端口
1个Mini-DisplayPort
PCIE 插槽 最多 2 个 PCIe x16 Gen5 薄型插槽
1 个 OCP 3.0 x16 Gen5
操作系统和管理程序 规范的 Ubuntu 服务器 LTS
带有 Hyper-V 的 Microsoft Windows 服务器
红帽企业Linux
SUSE Linux Enterprise Server
VMware ESXi/vSAN

建筑与设计

Dell PowerEdge C6600 机箱和 C6615 节点为需要最小化机架式环境中使用的物理空间的部署场景提供了极其密集的计算选项。这适用于在集群环境中运行的超融合解决方案,需要多个节点或计算密集型工作负载,而不需要通过传统的 4U 或 8U 服务器设计占用 1U 或 2U。机箱占用 2U 空间,深度为 30 英寸。机箱的重量可能会根据最终配置而增加。戴尔列出了 16 托架 C6600 配置的最大重量,所有驱动器均已安装,重量为 93.69 磅。

Dell PowerEdge C6615 E3.S SSD

与其他 PowerEdge 平台相比,该系统的前端非常基础,没有太多戴尔品牌。此服务器类型不提供标准 PowerEdge 挡板,但将驱动器和风扇进气口放在前面和中间。E3.S C6600 构造的前端中间有八个 Gen5 NVMe SSD,两侧是冷却风扇进气口。

Dell PowerEdge C6615 前置风扇

机箱的侧耳包含每个节点的专用电源按钮和指示该节点的状态或问题的信息按钮。

Dell PowerEdge C6615 后视图

与传统的 6615U 或 1U 服务器相比,每个 C2 节点在机箱后部均具有精简的端口布局。端口包括 USB、iDRAC、显示器连接器和 USB 服务端口。

Dell PowerEdge C6615 节点近照

对于网络,OCP 插槽可用于不同的接口选项(我们的有一个四端口 25GbE NIC),还有两个 PCIe 插槽可用。OCP 和双 PCIe 插槽均提供 Gen5 接口。

打开 PowerEdge C6600 机箱后,您可以看到冷却、配电和驱动器 I/O 路径的处理布局。驱动器背板的 PCIe/SAS 电缆通过快速连接配件直接布线到每个节点,这些配件还可以传输数据和电源。

根据每个节点的内部配置,驱动器连接直接连接到主板或 PERC 卡以实现硬件 RAID 选项。

Dell PowerEdge C6615 机箱连接器

除了冷却和电力之外,节点不共享任何其他资源。

Dell PowerEdge C6615 CPU 散热器

Dell PowerEdge C6615 性能

测试节点规格

我们所有四个 C6615 节点的配置都相同。我们将对它们进行比较,并显示各个节点的平均性能。

  • 1 个 AMD EPYC 8534P 64 核 CPU
  • 6 x 96 GB DDR5 4800 MB/s(576 GB)
  • Windows Server标准2022的
  • 戴尔 RAID1 BOSS 启动 SSD
  • 2 个 PCIe Gen5 E3.S SSD

在我们的性能测试中,节点并行运行,以给出考虑共享电力和冷却资源的总体分数。

储存效能

四个 Dell Power Edge C6615 节点均包含一个用于启动的 BOSS RAID1 SSD 和两个用于 Gen3 企业级 SSD 的 E5.S 托架。虽然 BOSS 卡并不逊色,但它提供的性能与 E3.S SSD 大不相同。
虽然本次评测主要关注整体系统级性能,但我们在四角工作负载下对该系统上的两种存储类型进行了轻微测试。我们的第一项测试侧重于 BOSS RAID1 启动 SSD 组。

戴尔 BOSS RAID1 阅读性能 写入性能
连续 1MB Q32/4T 2,963MB /秒 1,067MB /秒
随机 4K Q32/8T 600,786 IOPS(0.426毫秒) 249,819 IOPS(1.024毫秒)

接下来我们研究了单个 Gen5 E3.S SSD, 包括了 7.68TB 铠侠 CM7 我们的评测系统中的读取密集型 SSD.

KIOXIA 7.68TB CM7-R 阅读性能 写入性能
连续 1MB Q32/4T 13,736MB /秒 7,089MB /秒
随机 4K Q32/8T 931,671 IOPS(0.266毫秒) 768,739 IOPS(0.329毫秒)

Cinebench R23

Maxon 的 Cinebench R23 是一款利用所有 CPU 核心和线程的 CPU 渲染基准测试。我们对其进行了多核和单核测试。分数越高越好。以下是所有 EPYC 芯片的结果。

在 Cinebench R23 中,所有四个节点的多核分数都在 74,000 左右,节点 3 的分数甚至超过了 75,000。所有四个节点的单核分数都比较接近,节点 1 和 4 的分数为 1,088。节点 3 仅落后 8 分,节点 2 领先 5 分。总体而言,所有节点的性能差距都很小,这在不同的 CPU 之间很常见,尽管它们都是同一型号。

Cinebench R23  节点1 节点2 节点3 节点4 一般
CPU 多核 74,877 74,961 75,011 74,745 74,898.5
CPU单核 1,088 1,093 1,084 1,088 1,088.25
MP比率 64.84 68.60 69.17 68.70 67.83

Cinebench 2024

Maxon 的 Cinebench 2024 是一款利用所有 CPU 核心和线程的 CPU 和 GPU 渲染基准测试。我们对其进行了多核和单核测试。由于这些节点没有 GPU,因此我们只有多核和单核数字。

在 Cinebench 2024 中,所有节点都保持紧密联系,多核和单核部分的差异都很小。多核平均性能为 4,509 分,单核平均性能为 67.25 分,MP 比率为 66.98。

Cinebench 2024 节点1 节点2 节点3 节点4 一般
CPU 多核 4,544 4,577 4,436 4,481 4,509.5
CPU单核 68 68 65 68 67.25
MP比率 66.79 67.23 68.21 65.69 66.98

极客跑分 6 CPU

Geekbench 6 是衡量整体系统性能的跨平台基准测试。此测试包括 CPU 测试部分和 GPU 测试部分,但由于这些节点没有 GPU,因此我们只有 CPU 数字。分数越高越好。

在 Geekbench 中,我们看到数字一直很紧张,直到节点 3 时,单核和多核的得分略有下降。所有节点之间的平均值在单核上为 1,687,在多核上为 19,319.5。

极客跑分 6 CPU 节点1 节点2 节点3 节点4 一般
单核 1,707 1,708 1,625 1,708 1,687
多核 19,544 19,234 18,999 19,501 19,319.5

搅拌机 4.0 CPU

接下来是 Blender OptiX – 一款开源 3D 建模应用程序。此基准测试使用 Blender Benchmark CLI 实用程序运行。分数以每分钟样本数计算,分数越高越好。

C6615 节点的成绩相当稳定。Monster 上的平均得分为 591.79,Junkshop 上的平均得分为 415.88,Classroom 上的平均得分为 311.74。

搅拌机 4.0 CPU 节点1 节点2 节点3 节点4 一般
怪物 595.23 593.51 584.35 594.07 591.79
旧货店 415.26 415.11 418.05 415.08 415.88
课堂 308.57 312.91 312.69 312.78 311.74

搅拌机 4.1 CPU

Blender OptiX 4.1 带来了新功能,例如 GPU 加速去噪、简化渲染过程以及减少去噪任务所需的时间。尽管有这些进步,但与 4.0 版本相比,基准测试分数的整体性能改进很小,表明效率仅略有提高。

我们再次看到各方面的数字都比较一致,Monster 的平均分为 587.22,Junkshop 的平均分为 420.20,Classroom 的平均分为 306.60。

搅拌机 4.1 CPU 节点1 节点2 节点3 节点4 一般
怪物 590.46 590.58 584.76 583.08 587.22
旧货店 418.38 416.71 426.73 419.03 420.20
课堂 306.86 304.81 308.95 305.79 306.60

7-Zip 压缩

流行的 7-Zip 实用程序具有内置内存基准测试功能,可展示 CPU 性能。在此测试中,我们尽可能针对 128 MB 字典大小运行它。

所有节点的评分都比较公平。在总评分中,我们看到总 CPU 使用率为 5,778.75%,总评分/使用率为 4.355 GIPS,总评分为 252 GIPS。

搅拌机 4.1 CPU 节点1 节点2 节点3 节点4 一般
压缩
当前 CPU 使用率 5,548% 5,549% 5,633% 5,585% 5,578.75%
当前额定值/使用情况 4.256 吉普斯 4.210 吉普斯 4.156 吉普斯 4.177 吉普斯 4.20 吉普斯
额定电流 236.158 吉普斯 233.626 吉普斯 234.092 吉普斯 233.285 吉普斯 234.290 吉普斯
产生的 CPU 使用率 5,536% 5,537% 5,601% 5,553% 5,556.75%
结果评级/使用情况 4.193 吉普斯 4.202 吉普斯 4.172 吉普斯 4.168 吉普斯 4.184 吉普斯
结果评级 232.118 吉普斯 232.631 吉普斯 233.691 吉普斯 231.443 吉普斯 232.470 吉普斯
解压
当前 CPU 使用率 5,973% 6,027% 5,992% 6,014% 6,001.5%
当前额定值/使用情况 4.543 吉普斯 4.501 吉普斯 4.565 吉普斯 4.509 吉普斯 4.530 吉普斯
额定电流 271.343 吉普斯 271.287 吉普斯 273.507 吉普斯 271.196 吉普斯 271.833 吉普斯
产生的 CPU 使用率 5,997% 6,015% 5,999% 5,990% 6,000.25%
结果评级/使用情况 4.537 吉普斯 4.519 吉普斯 4.550 吉普斯 4.499 吉普斯 4.526 吉普斯
结果评级 272.066 吉普斯 271.775 吉普斯 272.946 吉普斯 269.509 吉普斯 271.574 吉普斯
总评分
总 CPU 使用率 5,767% 5,776% 5,800% 5,772% 5,778.75%
总评分/使用情况 4.365 吉普斯 4.360 吉普斯 4.361 吉普斯 4.333 吉普斯 4.355 吉普斯
总评分 252.092 吉普斯 252.203 吉普斯 253.318 吉普斯 250.476 吉普斯 252.022 吉普斯

Blackmagic 原始速度测试

我们一直在使用 Blackmagic 的 Raw Speed Test 来评估机器在实际 RAW 解码中的表现。此测试可以同时包含 CPU 和 GPU 的使用情况,但我们只会测试 CPU 的使用情况。

所有四个节点都表现出极为接近的性能,平均为 119.75 FPS。

Blackmagic 原始速度测试 节点1 节点2 节点3 节点4 一般
8K 中央处理器 FPS 121 FPS 121 FPS 118 FPS 119 FPS 119.75

Blackmagic磁盘速度测试

接下来是 Blackmagic Disk Speed Test。此测试运行 5 GB 样本文件的读写速度。由于它是单线程的,因此不会显示磁盘的最高速度,但仍能提供良好的视角。

C6615 内部有 BOSS 卡,使用 RAID2 中的双 M.1 驱动器,因此性能略有下降,但可靠性更高。写入速度平均为 991.6 MB/s,读取速度平均为 2,801 MB/s。

Blackmagic磁盘速度测试 节点1 节点2 节点3 节点4 一般
填写 999.8 MB / s的 977.4 MB / s的 991.4 MB / s的 997.7 MB / s的 991.6 MB / s的
阅读 2,807.4 MB / s的 2,790.1 MB / s的 2,828.0 MB / s的 2,780.4 MB / s的 2,801.5 MB / s的

Y 粉碎机

y-cruncher 是一个多线程和可扩展的程序,可以将 Pi 和其他数学常数计算到数万亿位。 自 2009 年推出以来,它已成为超频玩家和硬件爱好者的热门基准测试和压力测试应用程序。

就我们的平均速度而言,9.5 亿需要 1 秒,24.20 亿需要 2.5 秒,50.73 亿需要 5 秒。在更高位数字的计算中,105.73 亿需要 10 秒,288.85 亿需要 25 秒,633.5 亿需要 50 秒。

Y Cruncher(总计算时间,以秒为单位) 节点1 节点2 节点3 节点4 一般
1亿 9.587 9.459 9.350 9.633 9.507
2.5亿 24.490 24.225 23.334 24.740 24.197
5亿 51.427 50.990 49.303 51.214 50.734
10亿 107.084 107.646 103.772 107.443 105.736
25亿 291.918 290.944 280.632 291.902 288.849
50亿 641.709 640.289 619.100 640.917 635.504

UL Procyon AI 计算机视觉基准

UL Procyon AI 推理旨在衡量工作站在专业应用中的性能。需要注意的是,这个测试并没有利用多CPU能力。具体来说,该工具对工作站处理人工智能驱动的任务和工作流程的能力进行了基准测试,提供了对其处理复杂人工智能算法和应用程序的效率和速度的详细评估。

本次测试中,我们使用了 Procyon V2.7.0。本次测试中,时间越短越好。在所有节点中,MobileNet V3.91 的平均时间为 3 毫秒,Resnet8.4.0 的平均时间为 50 毫秒,Real-ESRGAN 的平均时间为 29.47 毫秒。其余分数中,DeepLab V30.96 的平均时间为 3 毫秒,YOLO V44.68 的平均时间为 3 毫秒,Real-ESRGAN 的平均时间为 2008.65 毫秒。总体得分中,节点的平均得分为 133.5。

UL Procyon 计算机视觉
(平均推理时间)
节点1 节点2 节点3 节点4 一般
移动网络 V3 3.87毫秒 3.94毫秒 3.84毫秒 4.00毫秒 3.91毫秒
残差网络50 8.47毫秒 8.45毫秒 8.23毫秒 8.46毫秒 8.40毫秒
盗梦空间V4 29.76毫秒 29.55毫秒 28.74毫秒 29.84毫秒 29.47毫秒
深实验室V3 30.39毫秒 30.21毫秒 33.18毫秒 30.07毫秒 30.96毫秒
优洛V3 44.71毫秒 44.58毫秒 44.79毫秒 44.63毫秒 44.68毫秒
真实ESRGAN 2003.18毫秒 1971.97毫秒 2018.26毫秒 2041.18毫秒 2008.65毫秒
总体得分 134 134 133 133 133.5

结论

Dell PowerEdge C6615 节点提供单个 AMD EPYC CPU,最多 64 个内核和六个支持 5GB DIMM 的 DDR96 插槽。容纳这些节点的 C6600 机箱提供了一些存储配置。我们的评测系统有 8x E3.S Gen5 SSD 背板。在 C6600 设计中,每个节点都可以访问其中两个 SSD;机箱只提供电源和对驱动器的直接有线访问。对于管理,每个 C6615 都提供 iDRAC;机箱没有任何专用管理。

我们在性能测试中独立评估了每个 C6615 节点的功能,并计算了所有四个节点的平均分数,以识别性能异常。性能数据表明,节点性能始终如一,没有异常值或性能不均匀。这种可预测性对于服务提供商和超大规模客户来说至关重要,他们可以从这种密集系统中受益。

我们发现该系统的设计非常适合其预期用例;我们唯一的抱怨是 Gen5 SSD 支持相对有限——每个节点只有两个驱动器。戴尔可能会认为计算密集型客户不需要那么多本地存储,而冷却更多 Gen5 驱动器是一项严峻的技术挑战,他们可能是对的,我们只是在几乎每一个机会中都更喜欢驱动器数量多而不是数量少。还有一点值得一提,我们在这里评测的是 C6615,但正如这篇评测开头所指出的,戴尔确实为这个平台提供了其他节点类型,基于英特尔的 C6620 有液冷版本,有些人可能会觉得很有吸引力。

Dell PowerEdge C6615 计算节点为服务提供商提供了令人惊叹的每机架 U 性能组合。我们之前见过很多 2U4N 配置,但这种设计比许多竞争系统在每台服务器上提供了更大的宽度,因此扩展灵活性更高。将出色的设计与 iDRAC 和 OpenManage Enterprise 等管理软件相结合,我们非常喜欢最终的结果。

Dell PowerEdge C6615 产品页面

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅