NVMe 接口,特别是 PCIe 3.0 NVMe 1.3,一段时间以来一直是几乎所有用例的首选 SSD 接口。 随着供应商不断提高每一代产品的性能,此接口已被反复使用。 PCIe 现已进入 4.0,带来了顺序和随机性能的巨大提升。 KIOXIA CD6 是最新上市的 SSD(也是首批面向企业的 PCIe 4.0 之一),专注于在苛刻的 24×7 环境中保持一致的性能。 这使其成为具有混合使用和读取密集型耐用性需求的数据中心的理想选择。 KIOXIA CD6 SSD 也符合 SFF-TA-1001 标准,允许在同一背板上连接 SAS、SATA 和 NVMe 驱动器(以及三模控制器)。 KIOXIA 系列的容量从 800GB 到 15.36TB 不等,并提供多种不同的安全性和耐用性选项。
NVMe 接口,特别是 PCIe 3.0 NVMe 1.3,一段时间以来一直是几乎所有用例的首选 SSD 接口。 随着供应商不断提高每一代产品的性能,此接口已被反复使用。 PCIe 现已进入 4.0,带来了顺序和随机性能的巨大提升。 KIOXIA CD6 是最新上市的 SSD(也是首批面向企业的 PCIe 4.0 之一),专注于在苛刻的 24×7 环境中保持一致的性能。 这使其成为具有混合使用和读取密集型耐用性需求的数据中心的理想选择。 KIOXIA CD6 SSD 也符合 SFF-TA-1001 标准,允许在同一背板上连接 SAS、SATA 和 NVMe 驱动器(以及三模控制器)。 KIOXIA 系列的容量从 800GB 到 15.36TB 不等,并提供多种不同的安全性和耐用性选项。 CD6 还采用 2.5 英寸、15 毫米 Z 高度外形尺寸,并由铠侠的专有控制器、固件和 BiCS FLASH 96 层 3D TLC 内存提供支持。 它采用单端口设计(即从主机到SSD只有一条数据路径)。
4 年 2 月 22 日更新 – 我们重新审查了 铠侠CD6 固件更成熟
PCIe 4.0 的性能有可能达到一些相当令人难以置信的数字,铠侠 CD6 当然也不例外。 KIOXIA 引用了他们的新驱动器系列,分别提供高达 6.2GB/s 和 4.0GB/s 的读取和写入顺序性能,而随机性能有可能达到高达 250,000 万次读取 IOPS 和 XNUMX 次写入 IOPS。 这些至少可以说是令人印象深刻的数字。
它还具有一系列内置可靠性功能,包括第 6 代驱动器故障恢复、双奇偶校验保护、断电保护 (PLP)、端到端数据校正以提供额外的可靠性。 KIOXIA CD6 符合 NVMe 1.4 标准,为驱动器带来了一些重要功能。 这包括持久事件日志、清理改进和命名空间粒度以及命名空间写保护。
铠侠 CD6 规格
规格 | CM6-R(精读) | CM6-V(混合用途) |
外形 |
2.5 英寸 15 毫米 Z 高度 |
|
容量[1][2] | 960GB、1.92TB、3.84TB、 7.68TB, 15.36TB | 800GB、1.6TB、3.2TB、6.4TB、12.8TB |
接口 | PCIe Gen3/4,1×4 | |
合规性 | PCIe 4.0 和 NVMe 1.4 | |
NAND型 | KIOXIA BiCS FLASH 96 层 3D TLC | |
顺序阅读 | Gen3 = 高达 3,500MB/s; Gen4 = 高达 6,200MB/s | Gen3 = 高达 3,500MB/s; Gen4 = 高达 6,200MB/s |
顺序写入 | Gen3 = 高达 2,350MB/s; Gen4 = 高达 4,000MB/s | Gen3 = 高达 2,350MB/s; Gen4 = 高达 4,000MB/s |
随机阅读 | Gen3 = 高达 770K IOPS; Gen4 = 高达 1.0M IOPS | Gen3 = 高达 770K IOPS; Gen4 = 高达 1.0M IOPS |
随机写入 | Gen3 = 高达 75K IOPS; Gen4 = 高达 85K IOPS | Gen3 = 高达 165K IOPS; Gen4 = 高达 250K IOPS |
能量消耗 |
有源:20W; 闲置:<5W |
|
耐力 | 1 DWPD 5 年 | 3 DWPD 5 年 |
不可纠正的误码率 |
每 1^10 位读取 17 个扇区 |
|
平均无故障时间/平均故障率 |
2.5 万小时 / 0.35% |
|
工作温度 |
0至70C |
铠侠 CD6 性能
测试平台
我们新的 PCIe Gen4 Enterprise SSD 评测利用了 联想 ThinkSystem SR635 用于应用程序测试和综合基准。 ThinkSystem SR635 是一个装备精良的单 CPU AMD 平台,提供的 CPU 能力远远超过强调高性能本地存储所需的能力。 它也是我们实验室中唯一具有 PCIe Gen4 U.2 托架的平台(也是目前市场上为数不多的平台之一)。 综合测试不需要大量 CPU 资源,但仍利用相同的 Lenovo 平台。 在这两种情况下,目的都是以尽可能符合存储供应商最大驱动器规格的最佳方式展示本地存储。
PCIe Gen4综合及应用平台(Lenovo ThinkSystem SR635)
- 1 个 AMD 7452(2.35GHz x 32 核)
- 8 x 64GB DDR4-3200MHz ECC 内存
- CentOS 7.7 1908
- ESXi 6.7u3
PCIe Gen3 应用平台 (联想 ThinkSystem SR850)
- 4 个 Intel Platinum 8160 CPU(2.1GHz x 24 核)
- 16 x 32GB DDR4-2666Mhz ECC 内存
- 2 个 RAID 930-8i 12Gb/s RAID 卡
- 8 个 NVMe 托架
- VMware ESXI 6.7u3
PCIe Gen3 综合平台 (戴尔 PowerEdge R740xd)
- 2 个英特尔金牌 6130 CPU(2.1GHz x 16 核)
- 4 x 16GB DDR4-2666MHz ECC 内存
- 1x PERC 730 2GB 12Gb/s RAID 卡
- 附加 NVMe 适配器
- Ubuntu-16.04.3-桌面-amd64
作为新平台上的第一组评论,我们包括了过去的驱动结果,这些结果很接近但不是 100% 的同类比较,因为它们是在旧平台上进行测试的。 我们的综合测试差异不会在结果上产生太大偏差,但在单 CPU AMD 平台与四 CPU Intel 平台上运行的应用程序工作负载可能在某种程度上存在差异。 在我们的 MySQL 测试中,一款新的 Gen4 KIOXIA 产品确实领先,但在 SQL Server 中延迟是平均水平。 我们只有两个 Gen4 驱动器可以发布,我们没有大量的可比较数据,但在查看这些结果时需要注意。 我们还加强了综合测试以利用更快的 SSD,现在显示的测试结果具有更高的峰值线程数。
测试背景和比较
这款 StorageReview 企业测试实验室 提供了一个灵活的架构,用于在与管理员在实际部署中遇到的环境相当的环境中对企业存储设备进行基准测试。 企业测试实验室结合了各种服务器、网络、电源调节和其他网络基础设施,使我们的员工能够建立真实世界的条件,以便在我们的审查期间准确地衡量性能。
我们将这些关于实验室环境和协议的详细信息纳入审查,以便 IT 专业人员和负责存储采购的人员能够了解我们取得以下成果的条件。 我们的评论都不是由我们正在测试的设备制造商支付或监督的。 有关的其他详细信息 StorageReview 企业测试实验室 和 其网络功能的概述 在这些相应的页面上可用。
应用程序工作负载分析
为了了解企业存储设备的性能特征,必须对实时生产环境中的基础架构和应用程序工作负载进行建模。 因此,我们对 Kioxia CD6 的基准测试是 通过 SysBench 的 MySQL OLTP 性能 和 Microsoft SQL Server OLTP 性能 具有模拟的 TCP-C 工作负载。 对于我们的应用程序工作负载,每个驱动器将运行 4 个配置相同的虚拟机。
SQL Server 性能
每个 SQL Server VM 都配置有两个虚拟磁盘:100GB 卷用于启动,500GB 卷用于数据库和日志文件。 从系统资源的角度来看,我们为每个虚拟机配置了 8 个 vCPU、64GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。 虽然我们之前测试的 Sysbench 工作负载在存储 I/O 和容量方面使平台饱和,但 SQL 测试正在寻找延迟性能。
此测试使用在 Windows Server 2014 R2012 来宾虚拟机上运行的 SQL Server 2,并由 Quest 的数据库基准工厂进行压力测试。 存储评论的 Microsoft SQL Server OLTP 测试协议 采用事务处理性能委员会基准 C (TPC-C) 的当前草案,这是一种在线事务处理基准,可模拟复杂应用程序环境中的活动。 TPC-C 基准比综合性能基准更接近于衡量数据库环境中存储基础设施的性能优势和瓶颈。 我们用于本次审核的 SQL Server VM 的每个实例都使用 333GB(1,500 规模)的 SQL Server 数据库,并测量 15,000 个虚拟用户负载下的事务性能和延迟。
SQL Server 测试配置(每个虚拟机)
- Windows服务器2012 R2的
- 存储空间:分配 600GB,使用 500GB
- SQL Server的2014的
-
- 数据库大小:1,500 规模
- 虚拟客户端负载:15,000
- 内存缓冲区:48GB
- 测试时长:3 小时
- 2.5 小时预处理
- 30分钟采样期
对于我们的 SQL Server 事务基准测试,铠侠 CD6 在 12,633.7 个虚拟机上的得分为 4 TPS。
KIOXIA CD6 在 5.5VM 时的平均延迟为 4 毫秒(与 CD6 相同),略微落后于华为和 Memblaze 驱动器。
系统性能
下一个应用程序基准包括 Percona MySQL OLTP 数据库 通过 SysBench 测量。 该测试测量平均 TPS(每秒事务数)、平均延迟和平均 99% 延迟。
每 系统平台 VM 配置了三个虚拟磁盘:一个用于引导 (~92GB),一个用于预构建数据库 (~447GB),第三个用于测试中的数据库 (270GB)。 从系统资源的角度来看,我们为每个虚拟机配置了 8 个 vCPU、60GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。
Sysbench 测试配置(每个虚拟机)
- CentOS 6.3 64 位
- Percona XtraDB 5.5.30-rel30.1
-
- 数据库表:100
- 数据库大小:10,000,000
- 数据库线程:32
- 内存缓冲区:24GB
- 测试时长:3 小时
- 2 小时预处理 32 个线程
- 1 小时 32 个线程
转到 Sysbench 事务基准测试,KIOXIA 在 9,333VMs 上发布了 4 TPS 的领先分数。
在 Sysbench 平均延迟中,我们看到 CD6 在 13.71 个 VM 时的延迟仅为 4 毫秒,再次领先。
对于我们最坏情况下的延迟(第 99 个百分位数),CD6 在 27.48 个虚拟机上达到 4 毫秒,这次仅落后于华为(27.22 毫秒)。
VDBench 工作负载分析
在对存储设备进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,从“四个角”测试、常见的数据库传输大小测试到来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。 我们针对这些基准测试的测试过程用数据填充整个驱动器表面,然后将驱动器部分分区为驱动器容量的 25%,以模拟驱动器如何响应应用程序工作负载。 这与使用 100% 的驱动器并使它们进入稳定状态的全熵测试不同。 因此,这些数字将反映更高的持续写入速度。
简介:
- 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
- 4K 随机写入:100% 写入,128 线程,0-120% iorate
- 4K 随机读取(高负载):100% 读取,512 线程,0-120% 迭代
- 4K 随机写入(高负载):100% 写入,512 线程,0-120% iorate
- 64K 顺序读取:100% 读取,32 线程,0-120% 迭代
- 64K 顺序写入:100% 写入,16 个线程,0-120% 迭代
- 64K 顺序读取(高负载):100% 读取,64 线程,0-120% iorate
- 64K 顺序写入(高负载):100% 写入,64 个线程,0-120% iorate
- 综合数据库:SQL 和 Oracle
- VDI 完整克隆和链接克隆跟踪
可比物:
在我们的第一个 VDBench 工作负载分析随机 4K 读取中,KIOXIA CD6 的峰值得分为 760,160 IOPS,延迟为 165.5µs在随机 4K 读取的高负载期间,我们看到 KIOXIA CD6 在接近 1 万 IOPS 大关时有所放缓,最终在 1,067,840 µs 时达到 472 IOPS 的峰值。
对于 4K 随机写入,CD6 表现最佳,峰值为 579,919 IOPS,延迟为 211.1µs。
在高写入负载下,铠侠 CD6 表现出令人印象深刻的 709,547 IOPS 峰值和 713.3µs 的延迟。
切换到顺序工作负载后,CD6 显示出可靠的结果,在 68,413 µs 时达到 4.28 IOPS(或 465.6GB/s)的峰值(另一款 KIOXIA 预计是读取方面最好的驱动器)。 在顺序读取的高负载期间,CD6 达到 75,598 IOPS (4.72GB/s) 的峰值,然后减速达到高达 843.5 毫秒的延迟。
对于 64K 顺序写入,铠侠 CD6 再次显示出它是写入的强大力量,峰值为 53,402 IOPS(或 3.33GB/s),延迟为 291.6 毫秒,最后略有下降。
在高写入负载下,铠侠 CD6 达到 42,299 IOPS(或 2.58GB/s)的峰值,延迟仅为 65.1 毫秒。
我们的下一组测试是我们的 SQL 工作负载:SQL、SQL 90-10 和 SQL 80-20。 从 SQL 开始,铠侠 CD6 的稳定峰值为 241,700 IOPS,延迟为 131.1 毫秒。 在 SQL 90-10 中,CD6 的性能与 Memblaze 驱动器几乎相同,峰值为 243,292 IOPS 和 129.9 毫秒的延迟。在 SQL 80-20 中,顶级性能驱动器拥有非常相似的性能,CD6 的峰值为 244,857 IOPS,延迟为 128.3 毫秒。
接下来是我们的 Oracle 工作负载:Oracle、Oracle 90-10 和 Oracle 80-20。 从 Oracle 开始,KIOXIA CD6 以稳定的 253,635 IOPS 和 137.5µs 的延迟位居第三。
Oracle 90-10 向我们展示了更多上述内容,CD6 的峰值为 168,000 IOPS,延迟为 116.8µs。对于 Oracle 80-20,前 4 个驱动器表现出非常相似的性能,因为 CD6 峰值为 192,663,延迟为 112.3 毫秒。接下来,我们切换到我们的 VDI 克隆测试,完整和链接。 对于 VDI 完整克隆 (FC) 启动,KIOXIA CD6 的峰值为 196,584 IOPS,延迟为 172.3µs,位居第三。 VDI FC 初始登录,铠侠 CD6 的性能最好,在 169,412 毫秒时达到 172.6 IOPS 的峰值。
VDI FC Monday Login,CD6 以 109,488 IOPS 的峰值在 142.7 毫秒再次表现出最佳性能。
对于 VDI 链接克隆 (LC) 引导,CD6 在 100,678 毫秒的延迟下表现出令人印象深刻的 157 IOPS,仅次于铠侠 CM6。 VDI LC 初始登录在初始登录配置文件中显示出不均匀的数字,在性能大幅下降之前达到 25,235 IOPS 的峰值和 313.8 毫秒的延迟。最后,借助 VDI LC Monday Login,KIOXIA CD6 以另一项出色的性能结束了我们的测试,在 84,903 毫秒时达到 184.3 IOPS。
总结
KIOXIA CD6 是最新上市的高性能数据中心 SSD,采用新的 PCIe 4.0 接口。 它专为苛刻的 24×7 环境而设计,特别是那些具有混合使用和读取密集型耐用性需求的环境。 全新铠侠硬盘采用 2.5 英寸 15 毫米 Z 轴高度外形,采用铠侠 BiCS FLASH 96 层 3D TLC,提供从 960GB 到 15.36TB 的各种容量。 它还带有一系列安全选项。
对于性能,我们将 CD6 与其他同类固态硬盘(包括铠侠 CM6)进行了比较。 对于应用程序工作负载分析,我们看到 CD6 在 SQL Server 中达到 12,633.7 TPS,平均延迟为 5.5 毫秒,仅次于 Memblaze 和华为驱动器。 对于 Sysbench,该驱动器达到了 9,333 TPS、13.71 毫秒的平均延迟和 27.48 米的最坏情况延迟。
在我们的 VDbench 测试中,铠侠的性能更加稳定。 然而,在大多数情况下,它落后于 CM6 驱动器。 亮点包括:760,160K 读取 4 IOPS(1,067,840 IOPS 高负载)、579,919K 写入 4 IOPS(709,547 IOPS 高负载)、4.28K 读取 64GB/s(4.72GB/s 高负载)和 3.33K 64GB/s写入(2.58GB/s 高负载)。 SQL 工作负载的 IOPS 为 242K,SQL 243-90 为 10K IOPS,SQL 245-80 为 20K IOPS。 在 Oracle 中,性能最好的驱动器的性能非常相似(其中的 CD6),发布的工作负载为 254 IOPS,Oracle 168-90 为 10K IOPS,Oracle 192-80 为 20K IOPS。 在我们的 VDI 克隆测试中,CD6 表现出令人印象深刻的全面性能,突出表现在我们的 VDI FC 星期一登录和 VDI FC 初始登录测试中的顶级性能。
这篇评论的重点是 CD6 的性能,它汇集了令人印象深刻的记分卡。 也许更大的故事是 PCIe Gen4 的未来。 联想率先推出一款从前到后都支持 PCIe Gen4 的服务器。 大多数其他服务器仅在后端支持 Gen4,这是一个基本的设计决策。 跳过前托架更容易也更快。 联想采取了更全面的方式,开发了他们的 Rome 服务器,以便能够利用 AMD 必须提供的一切。 最终结果是,联想可以利用新技术,例如 KIOXIA 的 CD6,而大多数其他公司无法做到这一点。 这使 KIOXIA 处于先有鸡还是先有蛋的局面,至少在英特尔推出下一代服务器 CPU 之前是这样。 可以说,在这种情况下领先于 IT 曲线是可以的,CD6 可以很好地与旧平台一起工作,准备好在 PCIe Gen4 系统可用时提供更多。 目前,期待看到大量的基准测试宣扬 AMD 服务器的优势,尤其是在联想双 CPU 系统进入市场时。
4 年 2 月 22 日更新 – 我们重新审查了 铠侠CD6 固件更成熟
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS订阅