Memblaze PBlaze5 910 是一款高性能 NVMe SSD,旨在显着提高应用程序性能。 PBlaze64配备3层5D NAND,单盘容量高达15.36TB,较前代机型提升40%。 Memblaze 表示,这将使他们的新 SSD 能够提高存储服务器应用程序中的机架密度,从而节省空间并降低能源成本。 据报道,910 系列为数据中心增加了更高的能效,每瓦性能提高了 38%,并支持 16 种功率模式设置,范围从 10W 到 25W。
Memblaze PBlaze5 910 是一款高性能 NVMe SSD,旨在显着提高应用程序性能。 PBlaze64配备3层5D NAND,单盘容量高达15.36TB,较前代机型提升40%。 Memblaze 表示,这将使他们的新 SSD 能够提高存储服务器应用程序中的机架密度,从而节省空间并降低能源成本。 据报道,910 系列为数据中心增加了更高的能效,每瓦性能提高了 38%,并支持 16 种功率模式设置,范围从 10W 到 25W。
就性能而言,Memblaze 引用 910 系列的读写速度分别高达 6GB/s 和 3.8GB/s,持续随机吞吐量为 1 万 IOPS 读取和 135,000 IOPS 写入。
PBlaze5 910 系列支持 AES 256 数据加密、完整数据路径保护和增强型电源故障保护,有助于确保企业应用数据的完整性。 它还具有双端口功能,从根本上消除了单路径故障问题,因为两个端口可以同时访问。
Memblaze PBlaze5 910 NVMe SSD 规格
外形尺寸 | HHHL AIC | ||
容量 | 3.84TB | 7.68TB | |
NAND闪存 | 3D薄层色谱 | ||
接口 | PCIe 3.0 x 8 | ||
协议 | NVMe 1.2a | ||
性能 | |||
顺序读取 (128KB) | 5.5GB /秒 | 6.0GB /秒 | |
顺序写入 (128KB) | 3.1GB /秒 | 3.8GB /秒 | |
持续随机读取 (4KB) | 850K IOPS | 1万次IOPS | |
持续随机写入 (4KB) | 99K IOPS | 135K IOPS | |
延迟读/写 | 87 /12μs | ||
DWPD | 1 | ||
UBER | <10^-17 | ||
平均无故障时间 | 2万小时 | ||
能量消耗 | 7〜25W |
性能
测试平台
我们的企业级 SSD 评测利用 Lenovo ThinkSystem SR850 进行应用程序测试和 戴尔 PowerEdge R740xd 用于综合基准。 ThinkSystem SR850 是一个装备精良的四 CPU 平台,提供的 CPU 能力远远超过对高性能本地存储施加压力所需的能力。 不需要大量 CPU 资源的综合测试使用更传统的双处理器服务器。 在这两种情况下,目的都是以尽可能符合存储供应商最大驱动器规格的最佳方式展示本地存储。
联想 ThinkSystem SR850
- 4 个 Intel Platinum 8160 CPU(2.1GHz x 24 核)
- 16 x 32GB DDR4-2666Mhz ECC 内存
- 2 个 RAID 930-8i 12Gb/s RAID 卡
- 8 个 NVMe 托架
- VMware ESXI 6.5
戴尔 PowerEdge R740xd
- 2 个英特尔金牌 6130 CPU(2.1GHz x 16 核)
- 16 x 16GB DDR4-2666MHz ECC 内存
- 1x PERC 730 2GB 12Gb/s RAID 卡
- 附加 NVMe 适配器
- Ubuntu-16.04.3-桌面-amd64
测试背景和比较
- StorageReview 企业测试实验室 提供了一个灵活的架构,用于在与管理员在实际部署中遇到的环境相当的环境中对企业存储设备进行基准测试。 企业测试实验室结合了各种服务器、网络、电源调节和其他网络基础设施,使我们的员工能够建立真实世界的条件,以便在我们的审查期间准确地衡量性能。
我们将这些关于实验室环境和协议的详细信息纳入审查,以便 IT 专业人员和负责存储采购的人员能够了解我们取得以下成果的条件。 我们的评论都不是由我们正在测试的设备制造商支付或监督的。 有关的其他详细信息 StorageReview 企业测试实验室 和 其网络功能的概述 在这些相应的页面上可用。
本次审查的可比性:
应用程序工作负载分析
为了了解企业存储设备的性能特征,必须对实时生产环境中的基础架构和应用程序工作负载进行建模。 因此,我们对 Memblaze PBlaze5 910 的基准测试是 通过 SysBench 的 MySQL OLTP 性能 和 Microsoft SQL Server OLTP 性能 具有模拟的 TCP-C 工作负载。 对于我们的应用程序工作负载,每个驱动器将运行 2-4 个配置相同的虚拟机。
SQL Server 性能
每个 SQL Server VM 都配置有两个虚拟磁盘:100GB 卷用于启动,500GB 卷用于数据库和日志文件。 从系统资源的角度来看,我们为每个 VM 配置了 16 个 vCPU、64GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。 虽然我们之前测试的 Sysbench 工作负载在存储 I/O 和容量方面使平台饱和,但 SQL 测试正在寻找延迟性能。
此测试使用在 Windows Server 2014 R2012 来宾虚拟机上运行的 SQL Server 2,并由 Quest 的数据库基准工厂进行压力测试。 存储评论的 Microsoft SQL Server OLTP 测试协议 采用事务处理性能委员会基准 C (TPC-C) 的当前草案,这是一种在线事务处理基准,可模拟复杂应用程序环境中的活动。 TPC-C 基准比综合性能基准更接近于衡量数据库环境中存储基础设施的性能优势和瓶颈。 我们用于本次审核的 SQL Server VM 的每个实例都使用 333GB(1,500 规模)的 SQL Server 数据库,并测量 15,000 个虚拟用户负载下的事务性能和延迟。
SQL Server 测试配置(每个虚拟机)
- Windows服务器2012 R2的
- 存储空间:分配 600GB,使用 500GB
- SQL Server的2014的
- 数据库大小:1,500 规模
- 虚拟客户端负载:15,000
- 内存缓冲区:48GB
- 测试时长:3 小时
- 2.5 小时预处理
- 30分钟采样期
对于我们的 SQL Server 事务基准测试,Memblaze PBlaze5 910 AIC 以 12,645.1 TPS 的最高性能而自豪。
910 AIC型号的延迟也最低,仅为1.5ms,是第二名华为ED3000延迟的一半。
系统性能
下一个应用程序基准包括 Percona MySQL OLTP 数据库 通过 SysBench 测量。 该测试测量平均 TPS(每秒事务数)、平均延迟和平均 99% 延迟。
每 系统平台 VM 配置了三个虚拟磁盘:一个用于引导 (~92GB),一个用于预建数据库 (~447GB),第三个用于测试中的数据库 (270GB)。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、60GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。
Sysbench 测试配置(每个虚拟机)
- CentOS 6.3 64 位
- Percona XtraDB 5.5.30-rel30.1
- 数据库表:100
- 数据库大小:10,000,000
- 数据库线程:32
- 内存缓冲区:24GB
- 测试时长:3 小时
- 2 小时预处理 32 个线程
- 1 小时 32 个线程
在 Sysbench 事务基准测试中,AIC 910 以 9,190.7 TPS 继续其令人印象深刻的性能,位居排行榜首位。
在 Sysbench 平均延迟方面,AIC 910 再次以 13.9 毫秒的成绩名列前茅。
在我们最坏情况下的延迟基准测试中,AIC 910 仅以 25.9 毫秒位居榜首。
SideFX 的胡迪尼
Houdini 测试专门用于评估与 CGI 渲染相关的存储性能。 此应用程序的测试台是核心的变体 戴尔 PowerEdge R740xd 我们在实验室中使用的服务器类型具有双 Intel 6130 CPU 和 64GB DRAM。 在这种情况下,我们安装了运行裸机的 Ubuntu 桌面 (ubuntu-16.04.3-desktop-amd64)。 基准测试的输出以秒为单位来衡量,越少越好。
Maelstrom 演示代表了渲染管线的一部分,它通过演示其有效使用交换文件作为扩展内存形式的能力来突出存储的性能。 测试不会写出结果数据或处理点,以隔离延迟对底层存储组件的影响。 测试本身由五个阶段组成,我们将其中三个阶段作为基准测试的一部分运行,如下所示:
- 从磁盘加载打包点。 这是从磁盘读取的时间。 这是单线程的,可能会限制整体吞吐量。
- 将点解压缩到一个平面数组中,以便对其进行处理。 如果这些点不依赖于其他点,则可以调整工作集以保留在核心中。 这一步是多线程的。
- (未运行)处理点。
- 将它们重新打包成适合存储回磁盘的分桶块。 这一步是多线程的。
- (未运行)将分桶块写回磁盘。
在 Houdini 测试中,910 AIC 以 3,077.7 秒的成绩位于中低端,刚好高于 U.2 型号和 Memblaze 产品。
VDBench 工作负载分析
在对存储设备进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,从“四个角”测试、常见的数据库传输大小测试到来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。 我们针对这些基准测试的测试过程用数据填充整个驱动器表面,然后将驱动器部分分区为驱动器容量的 25%,以模拟驱动器如何响应应用程序工作负载。 这与使用 100% 的驱动器并使它们进入稳定状态的全熵测试不同。 因此,这些数字将反映更高的持续写入速度。
简介:
- 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
- 4K 随机写入:100% 写入,64 线程,0-120% iorate
- 64K 顺序读取:100% 读取,16 线程,0-120% 迭代
- 64K 顺序写入:100% 写入,8 个线程,0-120% 迭代
- 综合数据库:SQL 和 Oracle
- VDI 完整克隆和链接克隆跟踪
在我们的第一个 VDBench 工作负载分析随机 4K 读取中,Memblaze PBlaze5 910 AIC 在整个测试过程中能够保持在 1ms 以下,峰值为 814,640 IOPS,延迟为 155.9μs,位居第一。
同样,4K 随机写入性能再次显示出亚毫秒级延迟。 910 AIC 在测试驱动器中排名第二(PBlaze 900 排名第一),峰值性能为 550,864 IOPS,延迟为 229.3μs。
切换到顺序工作负载时,910 AIC 在 64K 顺序读取中名列前茅,峰值得分为 50,372 IOPS 或 3.14GB/s,延迟为 317μs。
使用 PBlaze 900 改变位置,910 AIC 在 42,563K 顺序写入中达到 2.66 IOPS 或 370GB/s 的峰值,延迟为 64μs。
转到 SQL 工作负载,910 AIC 的峰值为 270,432 IOPS,延迟仅为 117.8 微秒,再次位居排行榜榜首。
SQL 90-10 以 910 IOPS 的峰值得分和 273,321 微秒的延迟以大幅优势保持了 116.6 的榜首。
910 AIC 在 SQL 277,815-114 基准测试中以 80.μs 的延迟达到 20 IOPS 的峰值,使其保持在排行榜的首位。
在我们的 Oracle 工作负载中,910 AIC 以 282,326 IOPS 的峰值得分和 126.2 微秒的延迟继续占据主导地位。
对于 Oracle 90-10,910 AIC 显示出 202,695 IOPS 的峰值和 108μs 的延迟,位居榜首。
在 80-20 中,910 以令人印象深刻的 210,228 IOPS 峰值性能和 104μs 的延迟结束了其 Oracle 测试。
接下来,我们继续我们的 VDI 克隆基准测试,完整和链接,其中 910 AIC 在大多数测试中表现出最佳性能。 对于 VDI Full Clone Boot,910 AIC 的峰值性能为 219,337 IOPS,延迟为 158.2μs。
VDI FC Initial Login 看到 910 AIC 以 150,121 IOPS 的峰值性能和 197μs 的延迟位居榜首。
使用 VDI FC Monday Login,910 AIC 以 2 结束nd 以 101,128 IOPS 和 156.3μs 的延迟仅次于华为。
切换到链接克隆 (LC),我们首先查看启动测试。 在这种情况下,910 AIC 以 98,284 IOPS 和 161.3μs 的延迟位居第一。
VDI LC Initial Login 在 910 AIC 和华为之间显示出几乎相同的性能,为 55,061 IOPS 和 143.4μs 的延迟。
在VDI LC Monday Login测试中,华为和910 AIC再次表现出并驾齐驱的表现,峰值为77,721 IOPS,延迟为203.8μs,再次排名第四。
结语
Memblaze 的 PBlaze2 5 由 U.910 和 AIC 外形模型组成,是他们使用 64 层 3D NAND 的最新 NVMe 数据中心驱动器。 我们查看了本次评测的 AIC 模型,其容量为 3.84TB 和 7.68TB,性能达到 6.0GB/s 读取和 3.8GB/s 写入,同时声称吞吐量性能高达 1 万 IOPS 读取。 910 AIC 具有在几乎任何应用中都表现出色的强大功能,以及一系列保护功能,包括 AES 256 数据加密和支持高达 8TB/s 的 TRIM 功能。
深入了解性能细节后发现,910 AIC 在我们测试的许多工作负载中都处于领先地位。 在我们的 SQL Server 基准测试中,它以 12,645.1 TPS 和仅 1.5 毫秒的平均延迟排名第一。 在 Sysbench 中,该驱动器以 9,190.7 TPS、平均延迟 13.3 毫秒和最坏情况延迟 25.9 毫秒再次位居排行榜首位。 在我们的 Houdini by SideFX 基准测试中,910 AIC 记录了 3,077.7 秒,略好于 U.2 型号和其他 Memblaze 产品。 在我们的 VDBench 基准测试中,910 AIC 在我们所有的测试中都保持了亚毫秒级的延迟,在大多数类别中表现最佳。 在随机 4K 读写中,Memblaze PBlaze5 910 AIC 分别达到 814,640 IOPS 和 550,864 IOPS,而顺序工作负载分别达到 3.14GB/s 和 2.66GB/s。 SQL 结果保持大约 277,000 万次 IOPS,而 Oracle 测试运行在 270,000 IOPS 和 XNUMX IOPS 之间。
从 x4 接口转变为 x8 接口,与 sme 系列中的 U.5 外形版本相比,Memblaze PBlaze910 2 提供了巨大的性能提升。 AIC 910 全面展示了其优于接口有限的 U.2 型号的优势,并向客户展示了如果给定的应用程序可以利用更大的外形尺寸,则可以实现什么。