Supermicro SuperServer 1029U-TN10RT 是一个 1U 双处理器完整系统。 Supermicro 设计 SuperServer 是为了解决大量流行的用例,例如虚拟化、数据库、云计算和其他可以从高密度计算能力中受益的用例。 该系统已更新为支持第二代 Intel Xeon 可扩展 CPU,并且是首批支持 英特尔傲腾 DC 持久内存模块.
Supermicro SuperServer 1029U-TN10RT 是一个 1U 双处理器完整系统。 Supermicro 设计 SuperServer 是为了解决大量流行的用例,例如虚拟化、数据库、云计算和其他可以从高密度计算能力中受益的用例。 该系统已更新为支持第二代 Intel Xeon 可扩展 CPU,并且是首批支持 英特尔傲腾 DC 持久内存模块 (PMM)。
除了支持最新的英特尔数据中心技术外,该系统还通过前面的十个热插拔 2.5 英寸 NVMe 托架提供存储。 Supermicro 内部支持两个 M.2 插槽,一个 SATA 和一个 NVMe,但可以选择添加额外的 M.2 插槽。 该主板支持 24 个 DIMM 插槽,可以以传统方式与 DRAM 一起使用,也可以与本评测中的配置一起与 PMEM 一起使用。 在连接性方面,系统有两个板载 10GBase-T LAN 端口。 可通过两个 PCI-E 3.0 x16(FH,10.5 英寸长)卡槽扩展额外的连接性。
如前所述,我们的评测系统具有两个英特尔至强可扩展 8268(2.9GHz,24C)以及 12 个 DRAM 棒和 12 个英特尔傲腾 DC 持久内存模块。 虽然持久内存之旅仍处于早期阶段,但这种使用主板上所有内存插槽和两个英特尔 CPU 的 4:1 持久内存与 DRAM 的配置可能会成为典型的推荐服务器配置,以充分利用这些新技术。 除了这些核心组件外,正在审查的系统还包括十个 英特尔 DC P4510 NVMe 固态硬盘.
Supermicro SuperServer 1029U-TN10RT 规格
- 机箱 – 超 1U SYS-1029U-TN10RT
- CPU – 2 个英特尔至强可扩展 8268(2.9GHz,24C)
- 存储 – 10 x Intel DC P4510 2TB NVMe SSD, 1DWPD
- 内存 – 12 x 32GB DDR4-2933
- 持久内存 – 12 个 128GB DDR4-2666 Intel Optane DC PMM
- 网络 – 2 x 10GBaseT
设计与建造
如前所述,Supermicro SuperServer 1029U-TN10RT 是一款高密度 1U 服务器,可以容纳两个新的英特尔至强可扩展处理器。 设备正面的大部分空间被 2.5 英寸 NVMe 驱动器托架占据,总共有 3.0 个。 右侧是带有电源按钮、UID 按钮和状态 LED 的控制面板。 下面是两个 USB XNUMX A 型端口。
将设备翻转到背面,左侧有两个 PSU,然后是两个 10GBase-T PJ45 LAN 端口、两个 USB 3.0 端口、一个 IPMI 专用 LAN 端口、一个串行端口、UID 指示灯和开关、视频端口和两个PCIe 插槽。
正面的 2.5 英寸托架支持热插拔,用户可以轻松推动橙色卡舌以伸出手柄,以便快速拆卸/安装。 在此服务器和 Supermicro 的其他服务器上,橙色球童表示支持 NVMe。
配备 2.5 个 10 英寸托架的 SuperServer,我们的评测系统随附 4510 个 Intel P2 XNUMXTB NVMe SSD。
英特尔傲腾持久内存模块具有与传统 DRAM 相同的外形尺寸。 它们不需要额外的电源线或冷却装置。 散热器作为持久性内存设计的一部分包含在内,其在宽度和高度方面遵循与 DRAM 模块相同的设计考虑因素。 所以我们不应该看到在 DRAM 插槽上有气流罩的超薄服务器有任何新的变化。
与许多 Supermicro 服务器一样,顶盖可以通过两个按钮轻松取下,并卸下后部的连接螺丝。 这提供了对新 CPU、RAM、安装 GPU 或其他 PCIe 设备的快速访问,对于本次审查来说重要的是,安装英特尔傲腾 DC PMM。
性能
在我们第一次看到新的英特尔傲腾 DC 持久内存时,我们专注于以相当传统的形式衡量其性能; 将其块存储性能与标准发行的 NVMe SSD 进行比较。 虽然持久内存有不同的运行模式,但我们计划在不久的将来围绕内存模式和 App Direct 字节级专注于特定用例。 具体来说,我们将 12 个 128GB 持久内存模块(每个 CPU 6 个)配置在两个池中,与 10 个 Intel P4510 2TB NVMe SSD 相对应。 我们在这种情况下的基准测试应用程序仍然使用 vdbench 处理我们的四个角工作负载以及数据库工作负载配置文件。 展望未来,我们将过渡回 FIO 以及直接使用持久内存的数据库应用程序。
就我们的基准技术配置而言,我们将 6 个持久内存模块组合在一起形成一个池(每个 CPU 一个池)并将整个池空间分配给持久内存命名空间。 在操作系统级别,我们然后预填充原始持久内存模块,将它们分区为总大小的 50%,并在较小的部分上执行我们的工作负载。 然后应用工作负载以显示持续的性能,这模仿了应用程序数据集在它们上的运行方式。
我们的第一个测试是 4K 随机读取测试,持久内存在 1,371,386 微秒时以 4.6 IOPS 开始,然后在仅 13,169,761 微秒的延迟时达到 12.1 IOPS 的峰值。 虽然英特尔 NVMe 驱动器表现不错,峰值为 5,263,647 IOPS,延迟为 191.4μs,但 PMM 显然以超过两倍的吞吐量和延迟只有 NVMe 驱动器的 6% 击败了它。
看看 4K 随机写入,我们看到了写入技术的局限性。 如上图所示,性能显着提高,持久内存将在写入时更快地达到峰值。 在这里,持久内存以 162,642 IOPS 开始,延迟为 8.9 微秒,峰值约为 980K IOPS,延迟约为 60 微秒,然后下降。
切换到顺序工作负载,在 64K 读取中,Optane DC PMM 以 106,739 IOPS 或 6.67GB/s 和 31.9μs 的延迟开始,然后以 1,055,634 IOPS 或 65.98GB/s 的延迟 57.2μs 达到峰值。 NVMe 驱动器再次表现出色,峰值得分为 431,252 IOPS 或 26.6GB/s,延迟为 721.5μs,但远不及持久内存。
在 64K 顺序写入中,持久内存以 52,472 IOPS 或 1.64GB/s 的速度开始,延迟为 78.8μs。 持久内存模块继续达到 255,405 IOPS 或 15.96GB/s 的峰值,延迟仅为 121.8μs。 这与 Intel P4510 组形成鲜明对比,后者在驱动器达到并超过其饱和点时延迟激增。
接下来是 SQL VDBench 测试,包括 SQL、SQL 90-20 和 SQL 80-20。 对于 SQL,持久内存以 547,821 微秒延迟时的 6.4 IOPS 开始,然后在 5,095,690 微秒延迟时达到 10.7 IOPS 的峰值。 NVMe 驱动器再次具有强大的性能,峰值性能为 188,170 IOPS 和 170µs。
对于 SQL 90-10,这两个比较在吞吐量方面更接近一些,尽管在延迟方面没有问题,持久内存无疑具有更低的延迟。 持久性内存以 169,874 IOPS 开始,延迟为 8.1 微秒,峰值为 1,911,900 IOPS,延迟为 27.1 微秒,而 NVMe 的峰值为 1,612,337 IOPS,延迟为 189.8 微秒。
对于 SQL 80-20,持久内存具有更好的峰值延迟,65.3 微秒,但吞吐量低得多,为 668,983 IOPS,而 NVMe 驱动器的吞吐量为 1,482,554 IOPS,延迟为 206 微秒。
本次审查的最后一批测试是我们的 Oracle 工作负载、Oracle、Oracle 90-10 和 Oracle 80-20。 Oracle 测试显示持久内存在 453,449 IOPS 的早期达到峰值,延迟为 103 微秒。 NVMe 驱动器能够继续达到 1,366,615 IOPS 的峰值,延迟为 225.8μs。
对于 Oracle 90-10,持久内存从 181,455 IOPS 开始,延迟为 7.8 微秒,然后达到峰值 2,080,543 IOPS,延迟仅为 16.9 微秒。 再次碾压峰值为 1,357,112 IOPS 且延迟为 157.1μs 的 NVMe 驱动器的性能。
最后,对于我们的 Oracle 80-20,持久内存以 225,492 IOPS 和 8.5 微秒的延迟开始,然后在 1,146,229 微秒的延迟时达到 30.4 IOPS 的峰值。 NVMe 驱动器的吞吐量较低,为 1,265,479 IOPS,但延迟也高得多,为 165.9μs。
总结
Supermicro SuperServer 1029U-TN10RT 是一个双插槽系统,具有 10 个 2.5 英寸 NVMe 驱动器托架,适合 1U 占用空间。 除了 2.5 英寸 NVMe 驱动器托架外,服务器还可以配置两个 M.2 存储插槽,一个 SATA 和另一个 NVMe。 该服务器专为虚拟化、数据库和云计算以及其他利用高计算能力的密集外形的用例而设计。 说到计算,该服务器支持新发布的第二代英特尔至强可扩展 CPU。 CPU 旁边是 24 个 DIMM 插槽。 除了为该服务器配备大量 DRAM 外,对新 CPU 的支持还意味着对英特尔新的 Optane DC 持久内存模块的支持。
在性能方面,英特尔持久内存模块能够达到我们实验室尚未见过的性能水平。 由于英特尔或多或少是目前市面上唯一具有持久内存的游戏,因此我们没有竞争对手或旧版本可供比较。 相反,我们将其与英特尔 P4510 2TB NVMe 驱动器进行了比较,以此作为利用新技术时的预期结果示例。 在读取方面,PMM 超越了 NVMe 技术,4K 读取为 13.2 万次 IOPS,延迟仅为 12.1μs,64K 顺序读取达到 66GB/s,延迟仅为 57.2μs。 随机写入看到了该技术的一些局限性,持久内存迅速飙升至 980K IOPS,并且在下降之前有大约 60μs 的延迟,远低于 NVMe 驱动器。 然而,64K 写入看到持久内存以 15.96GB/s 的速度占据主导地位,延迟仅为 121.8μs。 对于 SQL 基准测试,持久内存在 SQL(5,095,690 IOPS,延迟 10.7μs)和 SQL 90-10(1,911,900 IOPS,延迟 27.1μs)中击败了 NVMe 驱动器。 在我们的 Oracle 测试中,持久内存在 Oracle 90-10 中显示出更高的分数(2,080,543 IOPS,延迟仅为 16.9μs),但从吞吐量的角度来看,在其他两个测试中落后。 需要注意的是延迟。 持久内存的最高峰值延迟为 103 微秒,最低峰值延迟为 10.7 微秒。
在查看本次审查的初步结果时,显然有充分的理由感到非常热情。 我们从整体上看到了新的至强可扩展 CPU 的提升,但当然 Optane DC 持久内存模块是这里的明星。 如前所述,这个初步审查并不是我们如何评估具有持久内存的系统的终点; 这只是开始。 我们目前正在努力更深入地研究该系统中的应用程序性能,并将继续突破边界和最佳实践,以在 App Direct 和内存模式下评估英特尔傲腾 DC 持久内存。 不过就目前而言,要感谢 Supermicro 及其工程团队如此快速和全面地将这个套件组合在一起,这将是一个有趣的系列评论。
Supermicro SuperServer 1029U-TN10RT 产品页面