首页 企业版 由 ScaleIO 提供支持的 EMC VxRack 节点:Scaled Sysbench OLTP 性能评估 (HCI)

由 ScaleIO 提供支持的 EMC VxRack 节点:Scaled Sysbench OLTP 性能评估 (HCI)

by StorageReview 企业实验室

Scaled Sysbench 是在 HCI 中配置的全闪存 EMC ScaleIO VxRack 节点的最终性能测试。 在二层中,我们 将系统压至 99.2% 容量 并看到四台戴尔服务器作为负载源的惊人吞吐量。 这一次,在 2U 机箱中将计算和存储放在一起,我们运行相同的测试以查看会发生什么。 我们希望看到更多的 CPU 权重成为限制因素,因为系统有更多的工作要做,但到目前为止,在 HCI 测试中,从开销的角度来看,ScaleIO 已被证明是极其高效和轻量级的; 这在其他 HCI 解决方案中通常是相反的。


Scaled Sysbench 是在 HCI 中配置的全闪存 EMC ScaleIO VxRack 节点的最终性能测试。 在二层中,我们 将系统压至 99.2% 容量 并看到四台戴尔服务器作为负载源的惊人吞吐量。 这一次,在 2U 机箱中将计算和存储放在一起,我们运行相同的测试以查看会发生什么。 我们希望看到更多的 CPU 权重成为限制因素,因为系统有更多的工作要做,但到目前为止,在 HCI 测试中,从开销的角度来看,ScaleIO 已被证明是极其高效和轻量级的; 这在其他 HCI 解决方案中通常是相反的。

VCE VxRack 节点(性能计算全闪存 PF100)规格

  • 机箱 – 节点数:2U-4 节点
  • 每个节点的处理器:双 Intel E5-2680 V3、12c、2.5GHz
  • 芯片组:Intel 610
  • 每个节点 DDR4 内存:512G​​B (16x 32GB)
  • 每个节点的嵌入式 NIC:双 1 Gbps 以太网端口 + 1 个 10/100 管理端口
  • 每个节点的 RAID 控制器:1 个 LSI 3008
  • 每个节点的 SSD:4.8TB(6 个 2.5 英寸 800GB eMLC)
  • 每个节点的 SATADOM:32GBSLC
  • 每个节点 10GbE 端口:4 个 10Gbps 端口 SFP+
  • 电源:双 1600W 白金 PSU AC
  • 路由器:Cisco Nexus C3164Q-40GE

系统性能

我们对 VxRack 节点 HCI 测试应用了与双层测试相同的配置,但 VM 的运行位置除外。 在我们的两层中,我们将存储托管在 VxRack 节点上,但计算是通过四到八台 Dell PowerEdge R730 13G 服务器提供的。 在此迭代测试中,VxRack 节点本身运行工作负载。 在某个时刻,无论 ScaleIO 有多快,我们都会看到两层和 HCI 之间的权衡,由于 HCI 配置中计算 VM 的增加重量和 CPU 差异,我们会耗尽 CPU 周期。 在 HCI 案例中,我们有八个 Intel E5-2680 v3 CPU。 在两层配置中,我们在顶端扩展到八台服务器,运行 5 个 Intel E2690-3 v240 CPU。 这转化为最大工作负载下 499.2GHz 与 XNUMXGHz 的差异以供参考。 

Sysbench 测试配置(每个虚拟机)

  • CentOS 6.3 64 位
  • 存储空间:1TB,已使用 800GB
  • Percona XtraDB 5.5.30-rel30.1
    • 数据库表:100
    • 数据库大小:10,000,000
    • 数据库线程:32
    • 内存缓冲区:24GB
  • 测试时长:3 小时
    • 2 小时预处理 32 个线程
    • 1 小时 32 个线程

我们将比较 HCI 中的 EMC VxRack 节点和双层中的 EMC VxRack 节点,分别将结果称为 HCI 和 2L。 在 4VM 时,HCI 为我们提供了 5,664.9 TPS,而 2L 为 3,979.4 TPS。 随着我们继续扩大规模,HCI 一直领先于 2L,直到我们达到 24 个 VM; 在这里,HCI 为我们提供了 12,817.3 TPS,而 2L 为我们提供了 13,858.3 TPS。 虽然 HCI 配置仍略微提高了其整体总体性能,但在 20 个虚拟机后性能逐渐下降,到 32 个虚拟机时,我们看到性能开始下降。 这是 CPU 达到临界点的标志。

通过运行 32 个 VM 的 ScaleIO GUI 查看存储影响,我们看到系统级别的流量约为 2.6GB/s,IOP 略高于 143k。

按比例缩放的平均延迟描绘了一幅有点相似的画面,HCI 最初显示出比 2L 更低的延迟。 在 4VM 时,HCI 的延迟仅为 22.6ms,而 2L 的延迟为 32.16ms。 随着我们扩大规模,我们慢慢地看到潮流开始转变,2L 从 24VMs 开始具有更低的延迟。 尽管如此,在 32 个虚拟机上,HCI 的平均延迟仅为 78.4 毫秒。 

将我们的注意力转移到具有第 99 个百分位延迟的峰值延迟配置文件,这里 HCI 以较低的延迟开始(45.33VMs 时为 4ms),并再次在 2VMs 时输给 24L。 然而,一旦我们达到 32 个虚拟机,HCI 的延迟为 179.26 毫秒,超过了 2L 的 197.01 毫秒。 

结语

同样,EMC VxRack 节点在此测试中表现非常出色。 虽然我们预计 HCI 配置中会有一些管理开销,但我们确实没有看到任何不利影响。 事实上,HCI 配置在某种程度上击败了两层配置,其中 CPU 成为限制因素。 这也反映在我们最近关于在 HCI 上运行的 SQL Server 测试的文章中,它在低延迟指标方面优于两层。 不管怎样,性能都非常出色,再次轻松证明 ScaleIO 在性能和灵活性方面是市场上领先的软件定义解决方案。 

深入了解细节,ScaleIO 可以轻松平衡在与 MySQL 工作负载相同的系统上运行的 SDS worker 的开销。 与我们的两层测试(2.5GHz 与 2.6GHz)相比,平台的时钟速度较低,我们看到在 HCI 环境中运行的延迟有所改善,交易性能更高,工作负载更接近存储本身。 虽然乍一看这似乎很直观,但我们从未在任何其他 HCI 环境中看到过这种情况,因为它们总是比连接到专用计算服务器的外部存储阵列慢。 当我们的 Sysbench worker 消耗了集群上所有可用的 CPU 资源时,突破点就发生了,与两层相比,它在运行 20 个 VM 时失去了优势。

有趣的是,仍然有未开发的存储 IO,它仍然可以在 ScaleIO HCI 集群之外呈现。 这意味着除了 HCI 负载之外,您还可以同时以两层模式共享存储。 这是 ScaleIO 提供的价值主张的基础,它允许组织使系统适应他们的需求。 尽管 ScaleIO 既灵活又高效,但除了容量耗尽或主机本身的可用 CPU 周期耗尽之外,ScaleIO 实际上从未显示出任何弱点。

EMC VxRack 节点评论:概述
由 ScaleIO 提供支持的 EMC VxRack 节点:Scaled Sysbench OLTP 性能评估(2 层)
由 ScaleIO 提供支持的 EMC VxRack 节点:SQL Server 性能评估(2 层)
由 ScaleIO 提供支持的 EMC VxRack 节点:综合性能评估(2 层)
EMC VxRack Node Powered By ScaleIO 审查:综合性能审查 (HCI)
由 ScaleIO 提供支持的 EMC VxRack 节点:SQL Server 性能评估 (HCI)
由 ScaleIO 提供支持的 EMC VxRack 节点:VMmark 性能评估 (HCI)

ScaleIO

讨论这篇评论

注册 StorageReview 时事通讯