Dell EMC PowerEdge R740xd 是在三年多前发布的,当时该公司将其 PowerEdge 服务器系列从 Broadwell 升级到 Xeon SP。 R740xd 是 R740 的一个分支,RXNUMX 是具有更多存储选项的“极限磁盘”版本。 我们审查了 Dell EMC PowerEdge R740xd 并且非常喜欢它。 事实上,我们授予它编辑选择奖,并且我们使用八人一组作为我们几乎所有企业测试的支柱。 快进到去年和黎明的曙光 第二代英特尔至强可扩展 CPU。 我们也 使用新处理器升级我们的实验室 R740xd 并在此处详细解释。 今天,我们将了解更多可与这款升级后的 R740xd 服务器一起使用的 NVMe 存储选项。
Dell EMC PowerEdge R740xd 是在三年多前发布的,当时该公司将其 PowerEdge 服务器系列从 Broadwell 升级到 Xeon SP。 R740xd 是 R740 的一个分支,RXNUMX 是具有更多存储选项的“极限磁盘”版本。 我们审查了 Dell EMC PowerEdge R740xd 并且非常喜欢它。 事实上,我们授予它编辑选择奖,并且我们使用八人一组作为我们几乎所有企业测试的支柱。 快进到去年和黎明的曙光 第二代英特尔至强可扩展 CPU。 我们也 使用新处理器升级我们的实验室 R740xd 并在此处详细解释。 今天,我们将了解更多可与这款升级后的 R740xd 服务器一起使用的 NVMe 存储选项。
与 PowerEdge 的所有产品一样,R740xd 具有高度可配置性。 在 NVMe 方面,有多种选择。 首先是前海湾。 根据服务器在购买时的配置方式,用户可以将所有前托架用于 2.5 英寸 NVMe SSD。 为了最大化带宽,用户可以将前托架配置为 12 个 NVMe SSD 和 12 个 SAS SSD。 在 4 个一组中,NVMe SSD 可以通过 PCI 扩展卡映射到其中一个 CPU。 如果您更看重前面的最大 NVMe 存储容量,则所有 24 个托架都可以装满 NVMe SSD,每个托架映射 12 个到 PCIe 交换机,以允许系统为更多 NVMe 驱动器过度提供 PCIe 通道,同时保留 I/O 插槽,从而实现低每个 CPU 对十二个设备的延迟 CPU 访问。
对于这次审查,我们实质上是在查看在上面的第一个选项中配置的构建。 我们在前托架中装载了 12 个 Micron 9300 NVMe (3.84TB) SSD。 这在三个后插槽中使用了三个 PCIe 桥接卡。 虽然这将为我们提供更好的存储性能,但它会带走一些选项,例如在背面添加 GPU、FPGA 或什至更多存储。 戴尔提供了上图,以便读者更好地了解他们的布局方式。
Dell EMC PowerEdge R740xd 服务器规格
处理器 | 最多两个第二代英特尔至强可扩展处理器,每个处理器最多 2 个内核 |
外形 | 2U 机架式服务器 |
运行系统 | 规范的 Ubuntu 服务器 LTS 思杰Hypervisor 带有 Hyper-V 的 Microsoft Windows 服务器 红帽企业Linux SUSE Linux Enterprise Server VMware的ESXi的 |
尺寸和重量 | 高度 86.8m (3.4”) 宽度 434 毫米(17.1 英寸) 深度 737.5 毫米(29.0 英寸) 重量 33.1 千克(73.0 磅) |
内存 | |
DIMM速度 | 最高2933MT / s |
内存类型 | RDIMM LRDIMM NVDIMM DCPMM(英特尔傲腾 DC 持久内存) |
内存模块插槽 | 24 个 DDR4 DIMM 插槽(仅限 12 个 NVDIMM 或 12 个 DCPMM) 仅支持注册的ECC DDR4 DIMM |
最大RAM | RDIMM 1.53TB 内存条 3TB NVDIMM 192GB DCPMM 6.14TB(使用 LRDIMM 时为 7.68TB) |
嵌入式/服务器上 | iDRAC9 带有 Redfish 的 iDRAC RESTful API iDRAC 直接 Quick Sync 2 BLE/无线模块 |
控制台 | 开放管理企业 OpenManage 电源中心 |
流动性 | OpenManage 移动版 |
工具 | 戴尔易安信 RACADM CLI Dell EMC 存储库管理器 Dell EMC 系统更新 Dell EMC 服务器更新实用程序 Dell EMC 更新目录 iDRAC 服务模块 OpenManage 服务器管理员 OpenManage 存储服务 |
OpenManage 集成 | BMC真视 微软系统中心 RedHat Ansible 模块 VMware虚拟中心 |
OpenManage 连接 | IBM Tivoli Netcool/OMNIbus IBM Tivoli Network Manager IP 版 Micro Focus 运营经理 I Nagios核心 Nagios XI |
端口 | |
网络选项 | 4 x 1GbE 2 个 10GbE + 2 个 1bGE 4 x 10GbE 2 x 25GbE |
前端口 | 1 个专用 iDRAC 直接 USB 2 x的USB 2.0 1 个 USB 3.0(可选) 1个VGA |
后端口 | 1 x 专用 iDRAC 网络端口 1 x Serial 2 x的USB 3.0 1个VGA |
存储控制器 | 内部控制器:PERC H330、H730P、H740P、HBA330 外部控制器 (RAID):H840、12 Gbps SAS HBA 软件 RAID:S140 内部引导:引导优化存储子系统 (BOSS):HWRAID 2 x M.2 SSD 240GB、480 GB 内部双SD模块 |
加速器 | 最多三个 300W 或六个 150W GPU 最多三个双宽 FPGA 或四个单宽 FPGA GPU 和 FPGA 选项仅适用于 24 x 2.5” 驱动机箱。 NVMe 配置最多支持两个 GPU。 |
前海湾 | 多达 24 个 2.5” SAS/SSD/NVMe,最大 184TB 高达 12 个 3.5” SAS,最大 192TB |
中湾 | 高达 4 个 3.5” SAS,最大 64TB 多达 4 个 2.5” SAS/SSD,最大 30.72TB |
后托架 | 多达 4 个 2.5” SAS/SSD,最大 30.72TB 高达 2 个 3.5” SAS,最大 32TB |
安全性 | 密码签名的固件 安全启动 安全擦除 信任的硅根 系统锁定(需要 OpenManage Enterprise)TPM 1.2/2.0、TCM 2.0 可选 |
电源 | 495W白金 750W白金 750W 钛 750W 240VDC 1100W白金 1100W 380VDC 1600W白金 2000W白金 2400W白金 1100W -48VDC 金牌 具有完全冗余选件的热插拔电源 多达 6 个完全冗余的热插拔风扇 |
老虎机 | |
PCIe | 8 个 Gen3 插槽 (4 x 16) |
视频卡 | 1个VGA |
本次审核的配置
- CPU 2 个英特尔可扩展白金 8280
- 内存 12 x 32GB DDR4-2933MHz
- 存储 12 x Micron 9300 3.84TB U.2 NVMe SSD
性能
SQL Server 性能
StorageReview 的 Microsoft SQL Server OLTP 测试协议采用事务处理性能委员会的基准 C (TPC-C) 的最新草案,这是一种模拟复杂应用程序环境中活动的在线事务处理基准。 TPC-C 基准比综合性能基准更接近于衡量数据库环境中存储基础设施的性能优势和瓶颈。
每个 SQL Server VM 都配置有两个虚拟磁盘:100GB 卷用于启动,500GB 卷用于数据库和日志文件。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、64GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。 虽然我们之前测试的 Sysbench 工作负载在存储 I/O 和容量方面使平台饱和,但 SQL 测试寻找延迟性能。
此测试使用在 Windows Server 2014 R2012 来宾虚拟机上运行的 SQL Server 2,并由戴尔的数据库基准工厂进行压力测试。 虽然我们对该基准的传统用法是在本地或共享存储上测试 3,000 规模的大型数据库,但在本次迭代中,我们专注于在我们的服务器上均匀分布四个 1,500 规模的数据库。
SQL Server 测试配置(每个虚拟机)
- Windows服务器2012 R2的
- 存储空间:分配 600GB,使用 500GB
- SQL Server的2014的
-
- 数据库大小:1,500 规模
- 虚拟客户端负载:15,000
- 内存缓冲区:48GB
- 测试时长:3 小时
- 2.5 小时预处理
- 30分钟采样期
对于我们的 SQL Server 基准测试,这次我们只查看平均延迟,对于英特尔至强可扩展 8280s,服务器的总得分为 1 毫秒,单个虚拟机均达到 1 毫秒。 这意味着配备 NVMe 的 Dell EMC PowerEdge R740xd 在此特定测试中获得了最高分。 对于 8180,我们总共看到了 4 毫秒。
Sysbench MySQL 性能
我们的第一个本地存储应用程序基准测试包括通过 SysBench 测量的 Percona MySQL OLTP 数据库。 该测试测量平均 TPS(每秒事务数)、平均延迟和平均 99% 延迟。
每个 Sysbench VM 配置了三个虚拟磁盘:一个用于启动 (~92GB),一个用于预构建数据库 (~447GB),第三个用于测试中的数据库 (270GB)。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、60GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。
Sysbench 测试配置(每个虚拟机)
- CentOS 6.3 64 位
- Percona XtraDB 5.5.30-rel30.1
-
- 数据库表:100
- 数据库大小:10,000,000
- 数据库线程:32
- 内存缓冲区:24GB
- 测试时长:3 小时
- 2 小时预处理 32 个线程
- 1 小时 32 个线程
我们使用 Sysbench OLTP 测试了英特尔至强可扩展 8280,在 R4 中配备 8 个 NVMe 固态硬盘和 640 个虚拟机(总得分为 18,897 TPS),在 R8xd 中测试了 8 个 NVMe 固态硬盘和 740 个虚拟机(总得分为 19,656 TPS)。 我们还测试了配备 8180 个 NVMe 固态硬盘和 4 个虚拟机的英特尔至强可扩展 4,总得分为 13,046 TPS。
R640 4 NVMe 8VM 的平均延迟达到 13.55 毫秒的总延迟。 对于 R740xd 8 NVMe 8VM,它达到了 13.02 毫秒的总延迟。 R640 4 NVMe 4VM 的总延迟为 9.81 毫秒。
对于我们最坏情况下的延迟(第 99 个百分位数),R640 4 NVMe 8VM 的总延迟达到 25.2 毫秒。 对于 R740xd 8 NVMe 8VM,它达到了 25.6 毫秒的总延迟。 R640 4 NVMe 4VM 的总延迟为 19.9 毫秒。
VDBench 工作负载分析
在对存储阵列进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,包括“四个角”测试、常见的数据库传输大小测试,以及来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。
简介:
- 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
- 4K 随机写入:100% 写入,64 线程,0-120% iorate
- 64K 顺序读取:100% 读取,16 个线程,0-120% 迭代
- 64K 顺序写入:100% 写入,8 个线程,0-120% 迭代
- 综合数据库:SQL 和 Oracle
- VDI 完整克隆和链接克隆跟踪
对于随机 4K 读取,R740xd 以 583,280µs 的 97.3 IOPS 开始表现强劲,然后以 5,718,018 IOPS 的峰值达到峰值,延迟仅为 231.4µs。
4K 随机写入使服务器以 364,364 IOPS 的速度启动,仅需 19.5µs。 延迟保持在 100 微秒以下,直到接近峰值,峰值为 2,635,495 IOPS,延迟为 131.5 微秒,然后下降了一些。
接下来是我们研究 64k 的顺序工作负载。 对于 64K 读取,R740xd 的峰值为 644,539 IOPS 或 40.3GB/s,延迟为 552.8µs。
64K 顺序写入看到服务器以 55,601 IOPS 或 3.5GB/s 的延迟 47.4µs 开始,然后以 236,987 IOPS 或 14.8GB/s 的延迟 499.6µs 达到峰值,然后再次下降一些。
我们的下一组测试是我们的 SQL 工作负载:SQL、SQL 90-10 和 SQL 80-20。 从 SQL 开始,服务器在 2,397,926µs 的延迟下达到 155.8 IOPS 的峰值。
对于 SQL 90-10,R740xd 在 2,283,529µs 的延迟下达到了 152.4 IOPS 的峰值。
使用 SQL 80-20 时,戴尔服务器的峰值为 2,038,981 IOPS,延迟为 160.4µs。
接下来是我们的 Oracle 工作负载:Oracle、Oracle 90-10 和 Oracle 80-20。 从 Oracle 开始,服务器的启动时间不到 100 微秒,然后以 1,955,923 IOPS 的峰值达到 163.5 IOPS,延迟为 XNUMX 微秒。
Oracle 90-10 的峰值为 1,918,464 IOPS,延迟为 130.2µs。
接下来是 Oracle 80-20,其中 R740xd 再次以低于 100µs 的延迟开始,并以 1,755,168 IOPS 的峰值达到 133.7µs 的延迟。
接下来,我们切换到我们的 VDI 克隆测试,完整和链接。 对于 VDI 完整克隆 (FC) 启动,Dell EMC PowerEdge R740xd 峰值为 1,839,481 IOPS,延迟为 193.9µs。
VDI FC 初始登录发现服务器启动时间低于 100 微秒,然后以 547,765 IOPS 的峰值达到峰值,延迟为 235.5 微秒。
对于 VDI FC Monday Login,R740xd 在 493,984µs 的延迟下达到了 197.7 IOPS 的峰值。
切换到 VDI 链接克隆 (LC) 引导后,戴尔服务器达到了 820,857 IOPS 的峰值,延迟为 185.6µs。
VDI LC 初始登录的峰值为 316,762 IOPS,延迟为 196.1µs。
最后,使用 VDI LC Monday Login 时,R740xd 的峰值为 313,815 IOPS,延迟为 274.1µs。
总结
多年来,Dell EMC PowerEdge R740xd 一直是我们多项基准测试的支柱。 PowerEdge 系列的最大优势之一是可配置性。 在这篇评测中,我们查看了 R740xd 提供的半 NVMe 配置,配备 12 个 SATA/SAS 托架和 12 个 NVMe 托架。
在我们的应用程序工作负载分析中,我们测试了 Intel Xeon Scalable 8280 和 8180。对于 8280,我们测试了 8 个和 4 个 NVMe SSD 以及 8 个 VM 和 4 个 VM,而对于 8180,我们测试了 4 个 NVMe SSD 和 4 个 VM。 在 SQL Server 中,我们只查看了延迟,1 的整体延迟为 8280 毫秒,这是所有服务器在此测试中可以获得的最好成绩。 对于 8280 8 NVMe 8VM 的 Sysbench,我们看到了 18,897 TPS、13.56 毫秒的平均延迟和 25.2 毫秒的最坏情况延迟。 我们看到 8280 8 NVMe 4VM 的 TPS 为 19,656,平均延迟为 13.02 毫秒,最坏情况下的延迟为 25.6 毫秒。 8180 的 TPS 为 13,046,平均延迟为 9.81 毫秒,最坏情况下的延迟为 19.9 毫秒。
继续使用带有 NVMe 的 R740xd 的 VDbench 令人印象深刻。 亮点包括 5.7K 读取 4 万 IOPS、2.6K 写入 4 万 IOPS、40.3K 读取 64GB/s 和 14.8K 写入 64GB/s。 对于 SQL,我们看到了 2.4 万 IOPS,SQL 2.3-90 为 10 万 IOPS,SQL 2-80 为 20 万 IOPS。 对于 Oracle,我们看到了 1.96 万 IOPS 的峰值,Oracle 1.9-90 为 10 万 IOPS,Oracle 1.76-80 为 20 万 IOPS。 在我们的 VDI 克隆中,我们在 VDI FC 引导中看到了 1.8 万 IOPS,然后看到性能下降到百万 IOPS 以下,VDI FC 初始登录为 548K IOPS,VDI FC 星期一登录为 494K IOPS,VDI LC 引导为 821K IOPS,VDI 317K IOPS 的 LC 初始登录和 314K IOPS 的 VDI LC 星期一登录。
具有 740 个 NVMe 托架的高度灵活的 Dell EMC PowerEdge R12xd 取得了令人印象深刻的结果。 我们在大多数 VDBench 中看到了数百万的 IOPS 以及 40.3GB/s 的带宽。 为了达到这种性能水平,牺牲了一些 PCIe 扩展插槽,但如果服务器需要高存储性能,那么 Dell EMC PowerEdge R740xd 符合要求。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS订阅