首页 企业版 联想 ThinkSystem SR950 评测

联想 ThinkSystem SR950 评测

by 莱尔·史密斯
联想SR950

Lenovo 4U ThinkSystem SR950 专为资源密集型和任务关键型工作负载而打造。 这台巨大的服务器被认为是该公司的旗舰服务器之一,重点关注连续运行和“始终在线”的可靠性,以及多个级别的弹性来保护数据。 这款企业级服务器专为需要四个或更多处理器、大量内存和一系列 I/O 连接的服务器而设计。


Lenovo 4U ThinkSystem SR950 专为资源密集型和任务关键型工作负载而打造。 这台巨大的服务器被认为是该公司的旗舰服务器之一,重点关注连续运行和“始终在线”的可靠性,以及多个级别的弹性来保护数据。 这款企业级服务器专为需要四个或更多处理器、大量内存和一系列 I/O 连接的服务器而设计。

SR950 具有多达八个第二代英特尔至强处理器可扩展系列 CPU (每个处理器有 28 个内核)并且可以配置多达 24 个 2.5" 托架,可以容纳 SAS/SATA HDD/SSD,包括 12 个 2.5" NVMe SSD。 SR950 还可以使用 24GB DIMM 通过 96 个插槽容纳高达 256TB 的 RAM,这也支持 英特尔傲腾 DC 持久内存. 服务器可以从 Optane DC 持久内存模块 (PMM) 中受益匪浅,特别是在现实世界的数据中心运营中,因为与传统 DRAM 相比,PMM 的容量要高得多(128GB、256GB 和 512GB 与 4GB 至 32GB)。

SR950还使用 X清晰度 Administrator,联想的集中式免代理、用户友好的资源管理解决方案。 该系统管理软件具有简化的界面,专为降低复杂性、提高系统响应和增强 SR950 等 Lenovo 解决方案的可用性而设计。 和 X清晰度,管理员将能够自动化和扩展基础架构部署,这将使企业能够专注于其他项目并将其资源用于更重要的领域。

我们还有该系统的视频演练:

[yotuwp type=”videos” id=”5oSuyJTGbtY” ]

联想 4U ThinkSystem SR950 规格

外形/高度 机架/4U
处理器(最大) 多达 8 个第二代 Intel® Xeon® Platinum 处理器,每个处理器多达 28 个内核,高达 205W
内存(最大) 24 个插槽中高达 96TB,使用 256GB DIMM; 2666MHz / 2933MHz TruDDR4, 支持 Intel® Optane™ DC Persistent Memory
扩展插槽
多达 14 个后置 PCIe,(11 个 x16 +、3 个 x8)、2 个共享 ML2 和 PCIe x16)和 1 个 LOM; 加上 2 个前置专用 RAID
内部存储(总计/热插拔) 多达 24 个 2.5" 托架,支持 SAS/SATA HDD/SSD,包括 12 个 2.5" NVMe SSD
网络接口 多达 2 个(1/2/4 端口)1GbE、10GbE、25GbE 或 InfiniBand ML2 适配器; 加上 1x(2/4 端口)1GbE 或 10GbE LOM 卡
功率(标准/最大值) 多达 4 个共享的 1100W、1600W 或 2000W AC 80 PLUS Platinum
安全性和可用性功能 联想 ThinkShield,TPM 1.2/2.0; 心理急救; 热插拔/冗余驱动器、风扇和 PSU; 内部光路诊断 LED; 通过专用 USB 端口进行前端访问诊断
热插拔/冗余组件 电源、风扇、SAS/SATA/NVMe 存储
RAID支持 可选硬件RAID; 带有可选 RAID 的 M.2 引导支持
系统管理 XClarity Controller 嵌入式管理、XClarity Administrator 集中式基础架构交付、XClarity Integrator 插件和 XClarity Energy Manager 集中式服务器电源管理
支持的操作系统
Microsoft Windows Server、SUSE、Red Hat、VMware vSphere。 访问 lenovopress.com/osig 网站 了解详情。
有限保修 1 年和 3 年客户更换部件和现场服务,下一工作日 9×5; 可选服务升级

设计和建造

Lenovo ThinkSystem SR950 无疑是我们评测过的最大的服务器之一。 这东西看起来像是 StorageReview 实验室中的野兽选址。 也就是说,SR950 是一款坚固耐用、质量上乘的设备,可以处理任何抛给它的东西,提供大量的扩展选项和性能。

前面板有 12-23 个 2.5 英寸驱动器托架(因型号而异),位于顶部和底部。 右下角附近是电源按钮、电源 LED、系统错误 LED、系统 ID 按钮/LED 和网络活动 LED。

LED 正上方是一个选项卡,可以拉动该选项卡以访问 LCD 系统信息显示面板,其中包括带有选择、向上滚动和向下滚动按钮的信息显示面板本身。 这允许快速访问系统状态、固件、网络和健康信息。

前面板左下方是两个 USB 2.0 端口(其中一个用作 Lenovo XClarity Controller 管理端口)和 VGA 视频端口。 转动 SR950 可以看到(最多)17 个 PCIe 插槽,它们分布在后面板周围。 电源位于左侧; 用户最多可以添加三个额外的冗余。 后面板底部是 NMI 按钮、XClarity Controller 网络连接器 (RJ45)、串行连接器、两个 USB 3.0 端口和一个 VGA 视频端口。

冗余也是 SR950 的主要关注点。 借助 XClarity 控制器,用户可以设置以太网连接故障转移功能:如果主要以太网连接意外离线,所有以太网流量将自动切换到可选的冗余以太网连接,而不会丢失数据或用户干预。 只要确保安装了特定的设备驱动程序即可。

SR950 还具有冗余冷却和电源功能(可选构建并取决于您的配置)。 Lenovo 服务器最多支持四个 1100 瓦(110V 或 220V 交流电)、1600 瓦(220V 交流电)或 2000 瓦(220V 交流电)热插拔电源以及 6 个或 12 个热插拔风扇。 如果其中一个发生故障,冗余冷却风扇将接管。 风扇本身很容易从前面拆卸下来。

服务器的正面有两个易于拆卸的支架,用户可以在其中访问 CPU 和内存。 在这里,用户可以将 Intel Optane PMEM 与系统的 RAM 结合起来,以获得更大的性能提升。

联想ThinkSystem SR950配置

出于测试目的,联想为我们的 SR950 配置了以下组件。 在系统内存上,我们的构建包括 24 个 2666MHz DDR4 DIMM(每个 CPU 6 个),总内存占用为 768GB。 在处理方面,我们的服务器包括 4 个 8280M CPU,每个 CPU 有 28 个主频为 2.7GHz 的内核。 总的来说,这为我们提供了 302.4GHz 的计算性能。 在存储方面,我们的系统还包括一个用于引导的板载 SATA m.2 SSD 和 12 个 1.6TB 英特尔 P4610 NVMe 固态硬盘. 对于我们的 SQL Server 测试,我们为 4 个 VM 工作负载使用了 4 个 SSD,而 Sysbench 为我们的 8 个和 12 个 VM 工作负载强调了 8 个和 12 个 SSD。 我们的裸机 VDbench 工作负载对所有 SSD 施加压力,显示出聚合存储性能。

性能

SQL Server 性能

StorageReview 的 Microsoft SQL Server OLTP 测试协议采用事务处理性能委员会的基准 C (TPC-C) 的最新草案,这是一种模拟复杂应用程序环境中活动的在线事务处理基准。 TPC-C 基准比综合性能基准更接近于衡量数据库环境中存储基础设施的性能优势和瓶颈。

每个 SQL Server VM 都配置有两个虚拟磁盘:100GB 卷用于启动,500GB 卷用于数据库和日志文件。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、64GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。 虽然我们之前测试的 Sysbench 工作负载在存储 I/O 和容量方面使平台饱和,但 SQL 测试寻找延迟性能。

此测试使用在 Windows Server 2014 R2012 来宾虚拟机上运行的 SQL Server 2,并由戴尔的数据库基准工厂进行压力测试。 虽然我们对该基准的传统用法是在本地或共享存储上测试 3,000 规模的大型数据库,但在本次迭代中,我们专注于在我们的服务器上均匀分布四个 1,500 规模的数据库。

SQL Server 测试配置(每个虚拟机)

  • Windows服务器2012 R2的
  • 存储空间:分配 600GB,使用 500GB
  • SQL Server的2014的
    • 数据库大小:1,500 规模
    • 虚拟客户端负载:15,000
    • 内存缓冲区:48GB
  • 测试时长:3 小时
    • 2.5 小时预处理
    • 30分钟采样期

对于我们的事务性 SQL Server 基准测试,SR950 的总得分为 12,644.58 TPS,单个虚拟机的得分从 3,160.85 TPS 到 3,161.34 TPS 不等。

对于 SQL Server 平均延迟,SR950 给我们的总分是 2 毫秒,单个虚拟机都达到 2 毫秒。

Sysbench MySQL 性能

我们的第一个本地存储应用程序基准测试包括通过 SysBench 测量的 Percona MySQL OLTP 数据库。 该测试测量平均 TPS(每秒事务数)、平均延迟和平均 99% 延迟。

每个 Sysbench VM 配置了三个虚拟磁盘:一个用于启动 (~92GB),一个用于预构建数据库 (~447GB),第三个用于测试中的数据库 (270GB)。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、60GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。

Sysbench 测试配置(每个虚拟机)

  • CentOS 6.3 64 位
  • Percona XtraDB 5.5.30-rel30.1
    • 数据库表:100
    • 数据库大小:10,000,000
    • 数据库线程:32
    • 内存缓冲区:24GB
  • 测试时长:3 小时
    • 2 小时预处理 32 个线程
    • 1 小时 32 个线程

使用 Sysbench OLTP,我们测试了 8VM 和 12VM SR950,它们分别发布了 25,088.5 TPS 和 32,555.88 TPS 的总和

对于 Sysbench 延迟,联想服务器的平均延迟为 10.2 毫秒(8 个虚拟机)和 141.55 毫秒(12 个虚拟机)。

在我们最坏的情况下(第 99 个百分位数),SR950 的延迟给了我们 20.76 毫秒(8 个虚拟机)和 282.3 毫秒(12 个虚拟机)。

VDBench 工作负载分析

在对存储阵列进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,包括“四个角”测试、常见的数据库传输大小测试,以及来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。

简介:

  • 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
  • 4K 随机写入:100% 写入,64 线程,0-120% iorate
  • 64K 顺序读取:100% 读取,16 线程,0-120% 迭代
  • 64K 顺序写入:100% 写入,8 个线程,0-120% 迭代
  • 综合数据库:SQL 和 Oracle
  • VDI 完整克隆和链接克隆跟踪

在随机 4K 读取中,SR950 的启动时间略高于 100µs,峰值为 5,072,541 IOPS,延迟为 269µs。

在随机 4K 写入中,SR950 在 371,795µs 延迟时以 32.8 IOPS 开始,保持在 100µs 以下直到大约 2.97 万 IOPS,并在 3233498µs 延迟时达到 291 IOPS 的峰值。

切换到顺序工作负载,我们看到服务器在 514,760K 读取期间以 32.2µs 的延迟达到 569.7 IOPS(或 64GB/s)的峰值。

在 64K 写入中,服务器在 230,000µs 的延迟下达到约 14.3 IOPS 或约 695GB/s 的峰值,这恰好在急剧下降之前。

我们的下一组测试是我们的 SQL 工作负载,其中包括 SQL、SQL 90-10 和 SQL 80-20。 对于 SQL,SR950 的峰值为 1578973 IOPS,延迟为 228µs。

对于 SQL 90-10,SR950 的峰值性能为 1,355,035 IOPS,延迟为 275.4µs。

最后,对于 SQL 80-20,服务器记录的峰值性能为 1,112,054 IOPS,延迟为 316.1µs。

接下来是我们的 Oracle 工作负载:Oracle、Oracle 90-10 和 Oracle 80-20。 使用 Oracle 时,SR950 服务器的峰值为 1,143,534 IOPS,延迟为 321.8µs。

使用 Oracle 90-10,服务器以 1,094,019µs 的延迟发布了 230.4 IOPS 的性能。

对于 Oracle 80-20,SR950 的峰值得分为 993,536 IOPS,延迟为 250.6µs。

接下来,我们切换到 VDI 完整克隆和链接克隆测试。 对于 VDI 完整克隆 (FC) 启动,Lenovo 在 1,039,601µs 的延迟下记录了 350.1 IOPS 的峰值性能。

在查看 VDI FC 初始登录时,联想服务器以 71,000 IOPS 和 129.6µs 的延迟开始,以 683,095 IOPS 和 417.1µs 的延迟达到峰值。

对于 VDI FC Monday Login,服务器峰值为 393,891 IOPS,延迟为 369µs。

转到 VDI(链接克隆)引导,SR950 达到 457,901 IOPS 的峰值,延迟为 337.3µs。

使用 VDI LC 初始登录时,SR950 服务器在 251,937µs 延迟时达到 319.5 IOPS 的峰值。

最后,使用 VDI LC Monday Login,Lenovo 服务器在 328,937µs 的延迟下表现出 446 IOPS 的峰值性能。

结语

Lenovo ThinkSystem SR950 是一款大型 4U 服务器,专为需要始终如一地处理资源密集型和任务关键型工作负载的企业而设计。 由(最多)8 个第二代 Intel Xeon Platinum 处理器提供支持,每个处理器(最多)28 个内核,联想服务器通过可用的 24 个 4GB DIMM 插槽支持高达 96TB 的 TruDDR256 RAM,并支持 Intel Optane DC Persistent记忆。 SR950 配备 24 个 2.5" 托架,支持 SAS/SATA HDD/SSD,包括 12 个 2.5" NVMe SSD。 希望添加 PCIe 设备的用户可选择安装最多 14 个((11) x16 和 (3) x8)、2 个共享 ML2 和 PCIe x16)以及两个前端专用 RAID 插槽。

为了测试新的联想服务器,我们的构建包括 4 个英特尔 8280M、768GB(24 个 32GB DDR4)2666MHz 内存和 12 个 1.6TB 英特尔 P4600 NVMe SSD。 即使使用这个中级构建,我们也能够看到一些令人印象深刻的性能。 在我们的 VDBench 工作负载中,我们看到服务器在 5K 读取中达到超过 4 万次 IOPS,在 3.2K 写入中达到 4 万次 IOPS,在 32.2K 顺序读取和写入中达到令人印象深刻的 14.3GB/s 和 64GB/s——前两者是特别令人印象深刻。 服务器在我们的 SQL 工作负载期间继续表现出色,在 SQL 1.6-1.3 中达到 90 万次 IOPS,在 SQL 10-1.1 中达到 80 万次 IOPS,在 SQL 20-1.14 中达到 1.1 万次 IOPS,而 Oracle 性能达到 90 万次 IOPS,在 SQL 10-80 中达到 20 万次 IOPS 950,在 1.04-500 中略低于百万 IOPS。 在我们的 VDI 克隆测试中,SR64 能够以 200 万次的速度在 VDI FC 引导中突破 400 万次 IOPS。 此外,就延迟而言,它唯一一次超过 XNUMXµs 是在 XNUMXK 写入期间,整个过程平均约为 XNUMX-XNUMXµs。

Lenovo ThinkSystem SR950 是服务器的庞然大物,可以配备多达 8 个英特尔至强 CPU 和高达 24TB 的内存,并包含英特尔傲腾 PMEM。 通过我们的设置和测试,服务器达到了我们的期望。 这个服务器绝对不适合所有人,它是一艘航空母舰,有些用户只需要一个肮脏的地方。 然而,SR950 非常适合当前和新兴的 AI/ML 套件和其他工作负载,这些工作负载可以在仅 4 个机架单元的空间中充分利用令人难以置信的计算能力。

联想 ThinkSystem SR950

讨论这篇评论

注册 StorageReview 时事通讯