随着 AMD 今天推出其新的 EPYC Rome 7002 CPU 系列,多家供应商已宣布支持新技术的服务器,包括 GIGABYTE。 事实上,技嘉已经发布了支持EPYC Rome R系列的全系列机架式服务器。 R 系列是一个资源平衡的通用服务器系列。 该系列提供 1U 和 2U 服务器以及多种存储介质组合。 对于本次特别评测,我们将关注配备 272 个 U.32 NVMe 托架的 GIGABYTE R24-Z2 服务器。
随着 AMD 今天推出其新的 EPYC Rome 7002 CPU 系列,多家供应商已宣布支持新技术的服务器,包括 GIGABYTE。 事实上,技嘉已经发布了支持EPYC Rome R系列的全系列机架式服务器。 R 系列是一个资源平衡的通用服务器系列。 该系列提供 1U 和 2U 服务器以及多种存储介质组合。 对于本次特别评测,我们将关注配备 272 个 U.32 NVMe 托架的 GIGABYTE R24-Z2 服务器。
从硬件方面来看,服务器采用了技嘉的 EPYC Rome MZ32-AR0 服务器主板。 该主板适合单个 AMD EPYC 7002 SoC 以及 16 个用于 DDR4 内存的 DIMM 插槽。 该服务器有 24 个用于 NVMe 存储的插槽,可热插拔,后面还有两个插槽用于 SATA SSD 或 HDD。 为了扩展,主板配备了七个 PCIe 扩展槽和一个夹层连接器,为客户提供了扩展或添加所需配件的空间。 在配置的服务器中,NVMe 托架占用了大部分可用的 PCIe 插槽以及用于 PCIe 通道到前背板的夹层插槽。 最终客户只剩下三个 PCIe 插槽来实现真正的扩展。
与所有技嘉服务器一样,R272-Z32 使用技嘉服务器管理 (GSM) 作为其远程管理软件。 技嘉AMD EPYC Rome服务器还可以利用AMI MegaRAC SP-X平台进行BMC服务器管理。 这种基于浏览器的直观且功能丰富的 GUI 具有多项显着功能,包括 RESTful API 支持、基于 HTML5 的 iKVM、详细的 FRU 信息、事前自动视频录制和 SAS/RAID 控制器监控。
对于我们的特定构建,我们使用 AMD EPYC 7702P CPU。 对于 RAM,我们使用了 8 个 32GB 3200MHz Micron 品牌的 DDR4 模块。 对于存储,我们使用了 12 个 Micron Pro 9300 SSD,即 3.84TB 容量版本。
技嘉R272-Z32服务器主要规格
中央处理器 | AMD EPYC 7002 |
外形尺寸 | 2U |
母板 | EATX MZ32-AR0 |
内存 | 16 个 DIMM 插槽 |
驱动器托架 | |
面前 | 24 x 2.5” 热插拔 U.2 NVMe SSD |
后 | 2 x 2.5:热插拔硬盘 |
扩展插槽 | |
7 x 薄型插槽 | (Slot7)PCIe x16 插槽 @Gen4 x16 s/w 带有 4 x U.4 的 4 x Slim-SAS 2i (Slot6)PCIe x16 插槽 @Gen4 x16 (Slot5)PCIe x16 插槽 @Gen4 x8 (Slot4)PCIe x16 插槽 @Gen4 x16 (Slot3)PCIe x16 插槽 @Gen4 x16 (Slot2)PCIe x8 插槽 @Gen3 x8 (Slot1)PCIe x16 插槽 @Gen3 x16 夹层 @Gen3 x16 (Type 1, P1,P2,P3,P4; Type2 P5 with NCSI support) |
背板 | U.2硬盘背板(CBP20O5+CEPM080x3) |
IO连接器 | 后置 1 x VGA, 1 x COM, 2 x 1G LAN, 1 x MLAN, 3 x USB3.0, 1 x ID Button 内部 1 x COM, 1 x TPM, 1 x USB3.0(2ports), 1 x USB2.0(2ports) |
可编程电源 | 冗余 1200W 80+ 铂金 |
系统冷却 | 4 x 8cm 易插拔反向旋转风扇 |
尺寸 | 87.5 x 438 x 660毫米 |
技嘉 R272-Z32 设计与建造
从正面开始,我们将逐步深入到服务器的内部和背面,并详细介绍所有功能。 服务器正面有 24 个 2.5 英寸 U.2 NVMe 托架、两个 USB 3.0 端口、一个电源按钮、一个嵌入式重置按钮和一个 ID 按钮。 ID 按钮在数据中心很有用,因为从服务器的正面和背面都有一个 LED 可见。 在一个有几十台服务器的房间里,ID 指示灯会亮起,以帮助您识别您正在使用的机器。
在内部,我们在单处理器主板上有 16 个 DDR4 插槽和 7 个 PCIe 插槽。 主板上的所有插槽都是 Gen 4,速度比上一代快一倍。 由于每个 NVMe 托架都需要自己的 PCIe 连接到主板,我们的配置包括五个子板来为 NVMe 托架提供连接。 对于用户自定义,有三个开放式 PCIe 插槽,均为半高。 在三个开放插槽中,一个是机械和电气 x8。 另外两个插槽是机械 x16,一个是 x8 电气,另一个是 x16 电气。 使用 PCIe 布线时,流向卡的气流可能会受到限制,因此这些更多用于网络连接,与需要额外冷却的 GPU 相比,LFM 气流要求较低。 靠近服务器前部有一排 4 个可现场热插拔的机箱风扇。
最后是服务器的背面。 就服务器而言,这是非常标准的东西。 共有三个 USB 3.0 端口、两个 1GbE 端口、一个管理端口、一个 ID 开关、一个串行端口、一个 VGA 端口、两个 SATA 托架和两个 1200 瓦电源。 虽然前面有 NVMe 托架和昂贵的高性能存储,但背面的 SATA 托架为引导驱动器提供高容量低成本存储。 与前面看到的相匹配的是背面相应的 ID 按钮。 很高兴看到串行端口仍然在下一代平台上为仍然利用它的遗留产品保留。
技嘉R272-Z32管理
如前所述,技嘉 R272-Z32 拥有自己的 GSM 远程管理软件,但也可以利用 AMI MegaRAC SP-X 平台进行 BMC 服务器管理。 我们将使用 MegaRAC 来查看 KVM 的两个组件:管理屏幕及其关联的登录页面以及用于服务器操作系统管理和加载软件的远程控制台弹出窗口。
从主管理屏幕,可以在登录页面上查看快速统计信息,并在左侧看到几个主要选项卡,包括:仪表板、传感器、系统库存、FRU 信息、日志和报告、设置、远程控制、图像重定向、电源控制、和维护。 第一页是仪表板。 在这里,您可以轻松查看 BMC 的正常运行时间、未决断言、访问日志以及出现的问题数量、传感器监控、驱动器插槽以及它们在过去 24 小时和 30 天内发生的事件数量。
单击传感器,用户可以快速查看离散传感器及其当前状态。 用户还可以看到正常的传感器以及它们当前的读数和行为方式(例如,风扇转速及其启动时间)。
“系统清单”选项卡让管理员可以查看服务器中的各种硬件。 单击 CPU 会提供有关它是哪一个的详细信息,在本例中为 AMD EPYC 7702P。 用户还可以查看 CPU 的缓存信息。
与 CPU 非常相似,DIMM 清单子选项卡提供有关 RAM 的详细信息,包括最大可能、安装在哪个插槽上的内存量、是否为 ECC,以及各个 DIMM 的详细信息。
HDD Inventory 子选项卡与上面类似,提供有关已安装驱动器的信息以及向下钻取更多信息的能力。
下一个主要选项卡是 FRU(现场可更换单元)信息。 顾名思义,此选项卡提供有关 FRU 单元的信息,在这里我们可以看到有关机箱和主板的信息。
“设置”选项卡相当全面。 它使管理员能够访问他们需要的所有设置选项,并能够更改它们以满足他们选择的工作负载。
下一个选项卡是远程控制。 在这里,用户可以选择启动 KVM 或启动 JAVA SOL。 我们启动了 KVM。
一旦启动,它就会让用户远程访问服务器操作系统,在我们的示例中是一个 Linux 加载屏幕。 远程控制台窗口是数据中心中的一个非常宝贵的工具,您可以在数据中心进行本地控制,而不必拖着监视器、键盘和鼠标来进行操作。 在窗口的右上角可以看到 CD 映像功能,它允许您从本地系统安装 ISO,以便在服务器上远程访问以加载软件。
“电源控制”选项卡提供了一小部分电源操作,包括关机、开机、重启、硬重置和 ACPI 关机。
维护选项卡允许访问管理员可能需要处理的多项事情,包括备份配置、固件映像位置、固件信息、固件更新、HPM 固件更新、保留配置、恢复配置、恢复出厂默认设置和系统管理员。
也可以通过维护选项卡下的固件信息访问 BIOS 信息。
技嘉R272-Z32配置与性能
对于我们的初始测试阵容,我们专注于裸机 Linux 环境中的综合基准测试。 我们安装了 Ubuntu 18.04.02 并利用 vdbench 来应用我们的存储驱动基准测试。 将 12 个 Micron 9300 Pro 3.84TB SSD 加载到服务器后,我们的重点是使 CPU 与存储 I/O 饱和。 随着完全支持 AMD EYPC Rome 的其他操作系统支持的出现,主要是 VMware vSphere(等待 6.7 U3 成为 GA),我们将添加到该服务器平台上的测试。
VDBench 工作负载分析
在对存储阵列进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,包括“四个角”测试、常见的数据库传输大小测试,以及来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。
简介:
- 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
- 4K 随机写入:100% 写入,64 线程,0-120% iorate
- 64K 顺序读取:100% 读取,16 个线程,0-120% 迭代
- 64K 顺序写入:100% 写入,8 个线程,0-120% 迭代
- 综合数据库:SQL 和 Oracle
- VDI 完整克隆和链接克隆跟踪
对于随机 4K 读取,技嘉 R272-Z32 的启动时间略高于 100µs,峰值为 6,939,004 IOPS,延迟为 189.6µs。
对于随机 4K 写入,服务器 158,161 IOPS,延迟仅为 28µs。 服务器保持在 100µs 以下,直到大约 1.27 万 IOPS,并在 1,363,259µs 的延迟下达到 699.8 IOPS 的峰值。
切换到顺序工作负载,我们看到服务器峰值为 645,240 IOPS 或 40.3GB/s,592.9K 读取延迟为 64µs。
在 64K 写入中,服务器在 110µs 的延迟下达到约 6.8K IOPS 或约 246.1GB/s 的峰值,然后显着下降。
我们的下一组测试是我们的 SQL 工作负载:SQL、SQL 90-10 和 SQL 80-20。 对于 SQL,服务器峰值为 2,489,862 IOPS,延迟为 151.2µs。
对于 SQL 90-10,服务器的峰值性能为 2,123,201 IOPS,延迟为 177.2µs。
我们上次的 SQL 测试 80-20 看到服务器达到了 1,849,018 IOPS 的峰值性能,延迟为 202.1µs。
接下来是我们的 Oracle 工作负载:Oracle、Oracle 90-10 和 Oracle 80-20。 使用 Oracle 时,GIGABYTE 服务器的峰值为 1,652,105 IOPS,延迟为 227.5µs。
使用 Oracle 90-10,服务器的峰值为 1,727,168 IOPS,延迟仅为 150.1µs。
对于 Oracle 80-20,服务器以 1,551,361µs 的延迟达到了 166.8 IOPS 的峰值。
接下来,我们切换到我们的 VDI 克隆测试,完整和链接。 对于 VDI 完整克隆 (FC) 启动,由 EPYC Rome 提供支持的服务器在 1,680,812 微秒的延迟下具有 220.4 IOPS 的峰值性能。
使用 VDI FC 初始登录时,服务器以 39,309 IOPS 启动,延迟为 79.8µs。 服务器保持在 100µs 以下,直到大约 200K IOPS,并以 393,139µs 的延迟达到 627.3 IOPS 的峰值。
对于 VDI FC Monday Login,服务器峰值为 351,133 IOPS,延迟为 326.6µs。
对于 VDI LC Boot,服务器峰值为 777,722 IOPS,延迟为 197.6µs。
使用 VDI LC 初始登录时,技嘉服务器在 211,720µs 延迟时达到 341.9 IOPS 的峰值。
最后,使用 VDI LC Monday Login,EPYC Rome 服务器的峰值性能为 216,084 IOPS,延迟为 521.9µs。
结论
新的 AMD EPYC 7002 CPU 已经推出,第一台配备新处理器的服务器(无论如何在我们的实验室)是 GIGABYTE R272-Z32。 这款 2U 通用服务器使用 MZ32-AR0 主板,使其与单个新的 EPYC Rome 处理器兼容。 该服务器有 16 个 DIMM 插槽,总共可能有 1TB 的 DDR4 3200MHz RAM。 R272-Z32 前面有 24 个热插拔托架,用于所有 NVMe 存储,后面有两个托架用于 SATA SSD 或 HDD。 如果客户需要添加PCIe设备(包括现在的Gen4设备),后面有七个插槽,虽然只有三个是开放的。 服务器还支持用于 BMC 服务器管理的 AMI MegaRAC SP-X。
为了进行测试,我们使用了 AMD EPYC 7702P CPU、256GB 的 3,200MHz Micron DDR4 RAM 和 12 个 3.84TB Micron Pro 9300 SSD。 有了上面这个小服务器真的带来了风头。 仅使用我们的 VDBench 工作负载,我们看到服务器在 7K 读取中达到 4 万 IOPS,在 1.4K 写入中达到 4 万 IOPS,在 40.3K 顺序读取中达到惊人的 64GB/s,在 6.8K 顺序写入中达到惊人的 64GB/s。 进入我们的 SQL 工作负载,服务器继续以 2.5 万 IOPS、SQL 2.1-90 中的 10 万 IOPS 和 SQL 1.85-80 中的 20 万 IOPS 给人留下深刻印象。 在 Oracle 中,服务器达到 1.65 万 IOPS,1.73-90 达到 10 万 IOPS,1.55-80 达到 20 万 IOPS。 即使在我们的 VDI 克隆测试中,服务器也能够以 1.68 万次在 VDI FC 启动中突破 100 万次 IOPS。 虽然延迟大部分超过 1µs,但在顺序 64K 写入测试中仅超过 XNUMXms。
对于通用服务器,AMD EPYC Rome 将 GIGABYTE R272-Z32 变成了野兽。 虽然我们在服务器中拥有良好的设备,但我们甚至没有接近最大限度地发挥其潜力。 随着支持 Rome 的操作系统列表不断增加,我们将能够看到新 CPU 在处理大量工作负载时的表现如何。 这些带有支持它们的服务器的新处理器可能会让我们进入数据中心的新性能水平,这是我们尚未看到的,尤其是当您开始考虑 PCIe Gen4 未开发的潜力时