主页 企业 Memblaze PBlaze5 NVMe SSD 评测

Memblaze PBlaze5 NVMe SSD 评测

by 亚当·阿姆斯特朗

Memblaze 发布了另一个带有 PBlaze5 的 NVMe SSD 系列。 这是该公司继PBlaze4之后的第二代NVMe SSD产品。 新驱动器有两种外形规格,U.2 和 HHHL AIC,分为两个系列,即 700 和 900 系列。 700 系列的容量最高可达 11TB,旨在供数据中心使用。 900系列续航能力更高,面向企业应用。


Memblaze 发布了另一个带有 PBlaze5 的 NVMe SSD 系列。 这是该公司继PBlaze4之后的第二代NVMe SSD产品。 新驱动器有两种外形规格,U.2 和 HHHL AIC,分为两个系列,即 700 和 900 系列。 700 系列的容量最高可达 11TB,旨在供数据中心使用。 900系列续航能力更高,面向企业应用。

这两个系列都是为企业设计的,具有高达 6GB/s 的顺序速度和低至 90μs 的读取延迟的性能要求。 这两个系列的不同之处在于 700 系列具有更低的成本、更低的续航能力和更高的容量。 另一方面,900 系列具有更高的耐用性、更高可用性的双端口和数据加密。 这些主要区别适用于不同的用例:数据库、云、超大规模、SDS、大数据、3 系列和任务关键型数据库的 700D 渲染、ERP、SAP HANNA、BOSS、银行、高频交易征税和在线支付900系列。

对于本次审查,我们将关注 3.2TB、U.2、900 系列 PBlaze5。

Memblaze PBlaze5 NVMe SSD 900 系列规格:

外形 2.5英寸U.2 HHHL AIC
接口 PCIe 3.0 x4 PCIe 3.0 x 8
协议 NVMe 1.2a
NAND闪存 3D eTLC NAND
容量 2TB 3.2TB 4TB 8TB
性能
顺序读取 (128KB) 高达 3.2GB/秒 高达 6GB/秒
顺序写入 (128KB) 高达 2.4GB/秒
持续随机读取 (4KB/8KB) 高达760K IOPS 高达 1.042 万次 IOPS
持续随机写入 (4KB) 高达304K IOPS
延迟读/写 90 /15μs
耐力
DWPD 3
平均无故障时间 2.1万小时
静默位错误 < 1 个扇区错误每 10^23 位读取
不可纠正的误码率 < 1 个扇区错误每 10^17 位读取
能量消耗 7〜23W

设计与建造

我们正在审查的 Memblaze PBlaze5 是 2.5” U.2 外形设计。 该驱动器具有坚固的亚光黑色外壳。 驱动器顶部的右侧有品牌标识。

驱动器的底部几乎完全被散热器占据。

在驱动器的两端都有开口以帮助冷却。 在远离 NVMe 接口的一侧,可以看到第二个端口。

性能

测试平台

我们的企业级 SSD 评测利用 Lenovo ThinkSystem SR850 进行应用程序测试和 戴尔 PowerEdge R740xd 用于综合基准。 ThinkSystem SR850 是一个装备精良的四 CPU 平台,提供的 CPU 能力远远超过对高性能本地存储施加压力所需的能力。 不需要大量 CPU 资源的综合测试使用更传统的双处理器服务器。 在这两种情况下,目的都是以尽可能符合存储供应商最大驱动器规格的最佳方式展示本地存储。

联想 ThinkSystem SR850

  • 4 个 Intel Platinum 8160 CPU(2.1GHz x 24 核)
  • 16 x 32GB DDR4-2666Mhz ECC 内存
  • 2 个 RAID 930-8i 12Gb/s RAID 卡
  • 8 个 NVMe 托架
  • VMware ESXI 6.5

戴尔 PowerEdge R740xd

  • 2 个英特尔金牌 6130 CPU(2.1GHz x 16 核)
  • 16 x 16GB DDR4-2666MHz ECC 内存
  • 1x PERC 730 2GB 12Gb/s RAID 卡
  • 附加 NVMe 适配器
  • Ubuntu-16.04.3-桌面-amd64

测试背景和比较

 StorageReview 企业测试实验室 提供了一个灵活的架构,用于在与管理员在实际部署中遇到的环境相当的环境中对企业存储设备进行基准测试。 企业测试实验室结合了各种服务器、网络、电源调节和其他网络基础设施,使我们的员工能够建立真实世界的条件,以便在我们的审查期间准确地衡量性能。

我们将这些关于实验室环境和协议的详细信息纳入审查,以便 IT 专业人员和负责存储采购的人员能够了解我们取得以下成果的条件。 我们的评论都不是由我们正在测试的设备制造商支付或监督的。 有关的其他详细信息 StorageReview 企业测试实验室 和 其网络功能的概述 在这些相应的页面上可用。

本次审查的可比性:

应用程序工作负载分析

为了了解企业存储设备的性能特征,必须对实时生产环境中的基础架构和应用程序工作负载进行建模。 因此,我们对 Memblaze PBlaze5 的基准测试是 通过 SysBench 的 MySQL OLTP 性能 和 Microsoft SQL Server OLTP 性能 具有模拟的 TCP-C 工作负载。 对于我们的应用程序工作负载,每个驱动器将运行 2-4 个配置相同的虚拟机。

SQL Server 性能

每个 SQL Server VM 都配置有两个虚拟磁盘:100GB 卷用于启动,500GB 卷用于数据库和日志文件。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、64GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。 虽然我们之前测试的 Sysbench 工作负载在存储 I/O 和容量方面使平台饱和,但 SQL 测试正在寻找延迟性能。

此测试使用在 Windows Server 2014 R2012 来宾虚拟机上运行的 SQL Server 2,并由 Quest 的数据库基准工厂进行压力测试。 存储评论的 Microsoft SQL Server OLTP 测试协议 采用事务处理性能委员会基准 C (TPC-C) 的当前草案,这是一种在线事务处理基准,可模拟复杂应用程序环境中的活动。 TPC-C 基准比综合性能基准更接近于衡量数据库环境中存储基础设施的性能优势和瓶颈。 我们用于本次审核的 SQL Server VM 的每个实例都使用 333GB(1,500 规模)的 SQL Server 数据库,并测量 15,000 个虚拟用户负载下的事务性能和延迟。

SQL Server 测试配置(每个虚拟机)

  • Windows服务器2012 R2的
  • 存储空间:分配 600GB,使用 500GB
  • SQL Server的2014的
    • 数据库大小:1,500 规模
    • 虚拟客户端负载:15,000
    • 内存缓冲区:48GB
  • 测试时长:3 小时
    • 2.5 小时预处理
    • 30分钟采样期

对于我们的 SQL Server 事务基准测试,Memblaze PBlaze5 以 4 TPS 位居第二,仅次于 PBlaze12,6239.9。 值得注意的是,最低的 HGST SN100 与最高的 Memblaze PBlaze4 之间的结果差异仅为 41.4 TPS。 还应该注意的是,memblaze 是使用原始固件运行的,然后在我们的整个测试过程中更新了固件,并且可以在结果中看到。

对于 SQL 平均延迟,PBlaze5 以 7.5 毫秒的延迟再次位居第二,而 PBlaze4 只有 5 毫秒。

系统性能

下一个应用程序基准包括 Percona MySQL OLTP 数据库 通过 SysBench 测量。 该测试测量平均 TPS(每秒事务数)、平均延迟和平均 99% 延迟。

每 系统平台 VM 配置了三个虚拟磁盘:一个用于引导 (~92GB),一个用于预建数据库 (~447GB),第三个用于测试中的数据库 (270GB)。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、60GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。

Sysbench 测试配置(每个虚拟机)

  • CentOS 6.3 64 位
  • Percona XtraDB 5.5.30-rel30.1
    • 数据库表:100
    • 数据库大小:10,000,000
    • 数据库线程:32
    • 内存缓冲区:24GB
  • 测试时长:3 小时
    • 2 小时预处理 32 个线程
    • 1 小时 32 个线程

在 Sysbench 事务基准测试中,我们看到 Memblaze PBlaze5 以 8,260.5 TPS 位居榜首。

查看 Sysbench 平均延迟,PBlaze5 再次获得最佳分数,为 15.5 毫秒。

就我们的最坏情况 MySQL 延迟场景(第 99 个百分位延迟)而言,PBlaze5 以 29.4 毫秒位居榜首。

SideFX 的胡迪尼

Houdini 测试专门用于评估与 CGI 渲染相关的存储性能。 此应用程序的测试台是核心的变体 戴尔 PowerEdge R740xd 我们在实验室中使用的服务器类型具有双 Intel 6130 CPU 和 64GB DRAM。 在这种情况下,我们安装了运行裸机的 Ubuntu 桌面 (ubuntu-16.04.3-desktop-amd64)。 基准测试的输出以秒为单位来衡量,越少越好。

Maelstrom 演示代表了渲染管线的一部分,它通过演示其有效使用交换文件作为扩展内存形式的能力来突出存储的性能。 测试不会写出结果数据或处理点,以隔离延迟对底层存储组件的影响。 测试本身由五个阶段组成,我们将其中三个阶段作为基准测试的一部分运行,如下所示:

  1. 从磁盘加载打包点。 这是从磁盘读取的时间。 这是单线程的,可能会限制整体吞吐量。
  2. 将点解压缩到一个平面数组中,以便对其进行处理。 如果这些点不依赖于其他点,则可以调整工作集以保留在核心中。 这一步是多线程的。
  3. (不运行)处理点。
  4. 将它们重新打包成适合存储回磁盘的分桶块。 这一步是多线程的。
  5. (未运行)将分桶块写回磁盘。

在我们的 Houdini 工作负载中,Memblaze PBlaze5 落后于 PBlaze4 和 NVMe 组中的其他产品,8 帧渲染时间为 3,259 秒。

VDBench 工作负载分析

在对存储设备进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,从“四个角”测试、常见的数据库传输大小测试到来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。 我们针对这些基准测试的测试过程用数据填充整个驱动器表面,然后将驱动器部分分区为驱动器容量的 25%,以模拟驱动器如何响应应用程序工作负载。 这与使用 100% 的驱动器并使它们进入稳定状态的全熵测试不同。 因此,这些数字将反映更高的持续写入速度。

简介:

  • 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
  • 4K 随机写入:100% 写入,64 线程,0-120% iorate
  • 64K 顺序读取:100% 读取,16 线程,0-120% 迭代
  • 64K 顺序写入:100% 写入,8 个线程,0-120% 迭代
  • 综合数据库:SQL 和 Oracle
  • VDI 完整克隆和链接克隆跟踪

在我们的第一个 VDBench 工作负载分析中,我们研究了随机 4K 读取性能。 在整个基准测试中,所有测试的驱动器都有亚毫秒级的延迟。 Memblaze PBlaze5 的峰值为 748,510 IOPS,延迟为 170μs,使其成为迄今为止表现最好的。

接下来我们查看了 4K 写入性能,这里 PBlaze5 以 597,647 IOPS 和 211μs 延迟达到峰值,再次大幅领先性能。

转向顺序性能,我们查看了我们的 64K 基准测试。 在 64K 顺序读取时,PBlaze5 的峰值为 43,653 IOPS 或 2.72GB/s,延迟为 366μs,再次位居榜首。

对于 64K 顺序写入,PBlaze5 领先,峰值为 43,352 IOPS 或 2.71GB/s,延迟为 363μs。

接下来,我们查看了我们的 SQL 工作负载,其中没有驱动器的延迟超过 1 毫秒。 Memblaze PBlaze5 的峰值为 243,899 IOPS,延迟为 131μs。

在我们的 SQL 90-10 中,PBlaze5 继续以 235,428 IOPS 的峰值得分和 135μs 的延迟占据主导地位。

SQL 80-20 显示 PBlaze5 以迄今为止最大的优势领先,峰值得分为 229,029 IOPS,延迟为 139μs。

Oracle 工作负载再次显示所有驱动器都具有亚毫秒级性能。 在 Oracle 工作负载中,PBlaze5 的峰值为 277,100 IOPS,延迟为 157μs。

对于 Oracle 90-10,PBlaze5 以 178,747 IOPS 和 123μs 的延迟位居榜首。

我们上次的 Oracle 基准测试 80-20 显示 PBlaze5 的最佳峰值得分为 177,851 IOPS,延迟为 123μs。

接下来我们切换到我们的 VDI 克隆测试,完整和链接。 对于 VDI Full Clone Boot,PBlaze5 再次以 184,936 IOPS 的峰值和 189μs 的延迟位居榜首。

对于 VDI FC 初始登录,PBlaze5 以 118,389 IOPS 的峰值和 251μs 的延迟领先于其他驱动器。

借助 VDI FC Monday Login,PBlaze5 的峰值性能为 75,691 IOPS,延迟为 209μs。

在 VDI LC 启动测试中,我们看到 Toshiba PX04 的运行速度比任何其他驱动器都更接近 PBlaze5。 PBlaze5 仍然以 88,179 IOPS 的峰值得分和 180μs 的延迟位居榜首。

VDI LC 初始登录再次看到 PBlaze5 以 41,657 IOPS 的峰值得分和 189μs 的延迟突破。

我们的最终测试,即 VDI LC 星期一登录,PBlaze5 的峰值达到 59,449 IOPS 和 267μs 延迟。

结论

Memblaze PBlaze5 NVMe SSD 是该公司的第二代 NVMe 企业驱动器。 该驱动器的最大容量为 11TB(700 系列),速度为 6GB/s,IOPS 超过 1 万,延迟低至 15μs。 该驱动器有两种外形尺寸:热插拔 2.5 英寸 U.2 和 HHHL AIC。 该驱动器还提供两个系列:低耐用性、低成本、高容量的 700 系列和高耐用性、高可用性和加密的 900 系列。 在我们的评测中,我们测量了 900 系列的性能。

在性能方面,在我们的应用程序工作负载分析中,Memblze PBlaze5 在 SQL Server 中表现出色,达到 12,629.9 TPS,平均延迟为 7.5 毫秒; 但是,PBlaze4 能够以 2.5 毫秒的优势击败它。 在 Sysbench 中,PBlaze5 在事务测试中得分最高,为 8,260.5 TPS,平均延迟为 15.5 毫秒,最坏情况为 29.4 毫秒。 在我们的 Houdini 工作负载中,PBlaze5 落后于上一代驱动器和其他 NVMe 企业级 SSD。

在我们的 VDbench 测试中,PBlaze5 主导了每项测试,有时甚至遥遥领先。 在我们的 4K 测试中,PBlaze5 能够以 750μs 的读取延迟达到近 170K IOPS,以 597μs 的延迟达到超过 211K IOPS。 对于 64K 顺序,驱动器达到 2.71GB/s,写入延迟为 363μs,达到 2.73GB/s,读取延迟为 365μs。 PBlaze5 在进入 SQL 测试时继续给人留下深刻印象,峰值分数约为 244K IOPS,235-90 为 10K IOPS,229-80 为 20K IOPS。 Oracle 展示了该驱动器的分数约为 227K IOPS,178-90 为 10K IOPS,178-80 为 20K IOPS。 在我们的 VDI 克隆测试中,PBlaze5 处于领先地位,尽管其他一些驱动器在其中一项链接克隆测试中使其物有所值。

底线

Memblaze PBlaze5 NVMe SSD 提供了比上一代更好的渐进式更新,同时设置了 11TB 的容量标记,这对于 NVMe 接口 SSD 来说非常高。

PBlaze5 900

PBlaze5 700

讨论这篇评论

注册 StorageReview 时事通讯