Fusion-io ioDrive2 MLC 应用程序加速器在半高半长 (HHHL) 外形规格(或 FHHL 中为 1.2TB)中容量高达 3TB,并且具有极低的读写访问延迟。 虽然我们之前已经审查了 ioDrive2 旗舰 Duo SLC,非常适合要求最苛刻的应用程序,带有 MLC 的 ioDrive2 单驱动器专为更多“行人”工作负载而设计。 Pedestrian 在 ioMemory 语言中意味着像数据库这样的应用程序可以接受 68 微秒的读取延迟,而高端 SLC ioDrive47 的延迟为 2 微秒。 当然,提供带有 MLC NAND 的驱动器会带来降低成本等好处,而且 MLC 迭代还具有更高的容量。 ioDrive2 单 MLC 在 HHHL 中的最大容量为 1.2TB,在 FHHL 中的最大容量为 3TB,而 SLC Duo 的最高容量分别为 600GB 和 1.2TB(尽管 Duo 的 MLC 最大容量为 1.2TB HHHL 和 2.4TB FHHL 容量)。
Fusion-io ioDrive2 MLC 应用程序加速器在半高半长 (HHHL) 外形规格(或 FHHL 中为 1.2TB)中容量高达 3TB,并且具有极低的读写访问延迟。 虽然我们之前已经审查了 ioDrive2 旗舰 Duo SLC,非常适合要求最苛刻的应用程序,带有 MLC 的 ioDrive2 单驱动器专为更多“行人”工作负载而设计。 Pedestrian 在 ioMemory 语言中意味着像数据库这样的应用程序可以接受 68 微秒的读取延迟,而高端 SLC ioDrive47 的延迟为 2 微秒。 当然,提供带有 MLC NAND 的驱动器会带来降低成本等好处,而且 MLC 迭代还具有更高的容量。 ioDrive2 单 MLC 在 HHHL 中的最大容量为 1.2TB,在 FHHL 中的最大容量为 3TB,而 SLC Duo 的最高容量分别为 600GB 和 1.2TB(尽管 Duo 的 MLC 最大容量为 1.2TB HHHL 和 2.4TB FHHL 容量)。
我们将重点介绍围绕设计和构建的一些关键点,但由于我们在 SLC Duo 评测中花了很多时间讨论这一点,因此我们将跳过本评测中的大部分内容,转而关注性能. Fusion-io 使用 FPGA 作为 NAND 控制器,这很重要,因为它为他们提供了更多的编程控制,并允许在驱动器的整个生命周期内对驱动器逻辑进行更大程度的持续定制。 或者,可以使用 ASIC 更新固件,但不能更新硅的核心逻辑。 该驱动器还采用 Adaptive FlashBack 技术,该技术允许驱动器遭受 NAND 故障,而不会在驱动器重新映射时冒任何数据丢失或停机的风险。 最后,Fusion-io 增强了他们的 VSL 软件以提供改进的小块性能,并且它通过 ioSphere 提供了市场上最强大的驱动器管理软件。
Fusion-io 的 ioDrive2 单卡配备 MLC NAND,容量为 365GB、785GB 和 1.2TB,采用 HHHL 外形规格,3TB 在 FHHL PCB 上。 所有驱动器均提供五年保修(或使用的最大耐用性)。 我们的审查模型是 1.2TB 容量、HHHL 外形模型。
Fusion-io ioDrive2 规格
- 性能
- 读取带宽(1MB):1.5GB/s(3TB、1.2TB、785GB); 910MB/s (365GB)
- 写入带宽(1MB):1.3GB/s(3TB、1.2TB); 1.1GB/秒(785GB); 590MB/s (365GB)
- 跑了。 读取 IOPS (512B):143,000 (3TB); 275,000(1.2TB); 270,000(785GB); 137,000 (365GB)
- 跑了。 写入 IOPS (512B):535,000(3TB、365GB); 800,000(1.2TB,765GB)
- 跑了。 读取 IOPS (4K):136,000 (3TB); 245,000(1.2TB); 215,000(785GB); 110,000 (365GB)
- 跑了。 写入 IOPS (4K):242,000 (3TB)、250,000 (1.2TB)、230,000 (785GB); 140,000 (365GB)
- 读取访问延迟:68µs(全部)
- 写访问延迟:15µs(全部)
- 2xnm MLC NAND闪存
- 总线接口:PCI-Express 2.0 x4
- 重量:FHHL 9 盎司,HHHL 6.6 盎司
- 外形:半高、半长 (HHHL)
- 保修期:5 年或最长使用期限
- 续航力:16.26PB
- 支持的操作系统
- Microsoft Windows:64 位 Windows Server 2012、Windows Server 2008 R2、Windows Server 2008、Windows Server 2003
- Linux:RHEL 5/6; SLES 10/11; OEL 5/6; 中央操作系统 5/6; Debian 挤压; 软呢帽 16/17; 开放SUSE 12; Ubuntu 10/11/12
- UNIX:Solaris 10/11 x64; OpenSolaris 2009.06 x64; 操作系统 10.6/10.7/10.8
- 虚拟机管理程序:VMware ESX 4.0/4.1/ESXi 4.1/5.0/5.1、带有 Hyper-V 的 Windows 2008 R2、Hyper-V Server 2008 R2
设计与建造
Fusion-io ioDrive2 1.2TB MLC 是半高半长 (HHHL) x4 PCIe 2.0 卡,在设计上与我们评测过的 ioDrive2 Duo SLC 相似,只是减半了。 (有关设计的更多信息,请查看 双重审查.) 与 Duo 不同,在此迭代中,NAND 通过使用一个控制器的单个 NAND 池连接。 控制器与 Duo 的相同——40nm Xilinx Virtex-6 FPGA。
我们的 ioDrive2 容量为 1.2TB,在 4 个通道上通过 PCIe 连接运行。 ioDrive2 使用 MLC NAND,分为 24 个 64GB NAND 封装。 在这个数字上,库存格式化的超额配置水平为 22%。 与 ioDrive2 Duo 一样,NAND 与制造商无关,我们的特定测试仪型号使用英特尔 MLC NAND。
测试背景和比较
Fusion-io ioDrive2 MLC 使用 40nm Xilinx Virtex-6 FPGA 控制器和带有 PCIe 2.0 x4 接口的 Intel MLC NAND。
本次审查的可比性:
- 英特尔SSD 910 (800GB,4 个英特尔 EW29AA31AA1 控制器,eMLC NAND,PCIe 2.0 x8)
- LSI Nytro WarpDrive BLP4-400 (400GB,SandForce SF-2500 控制器,东芝 eMLC NAND,PCIe 2.0 x8)
所有 SAS/SATA 企业级固态硬盘均在我们的第二代企业级测试平台上进行基准测试,该平台基于 联想ThinkServer RD630. 这个新的基于 Linux 的测试平台包括最新的互连硬件,例如 LSI 9207-8i HBA 以及面向最佳闪存性能的 I/O 调度优化。 对于综合基准测试,我们使用适用于 Linux 的 FIO 2.0.10 版和适用于 Windows 的 2.0.12.2 版。 由于 Fusion-io ioDrive2 利用主机端资源,更快的服务器时钟速度使其能够产生更高的性能。 在我们的综合测试环境中,我们使用时钟速度为 2.0GHz 的主流服务器配置,尽管具有更强大处理器的服务器配置可以产生更高的性能。
- 2 x Intel Xeon E5-2620(2.0GHz,15MB 缓存,6 核)
- 英特尔 C602 芯片组
- 内存 – 16GB (2 x 8GB) 1333Mhz DDR3 Registered RDIMM
- Windows Server 2008 R2 SP1 64 位、Windows Server 2012 Standard、CentOS 6.3 64 位
- 100GB 美光 RealSSD P400e 启动固态硬盘
- LSI 9211-4i SAS/SATA 6.0Gb/s HBA(用于启动 SSD)
- LSI 9207-8i SAS/SATA 6.0Gb/s HBA(用于基准测试 SSD 或 HDD)
应用性能分析
在企业市场中,产品声称在纸面上的表现与它们在生产环境中的表现之间存在巨大差异。 我们了解评估存储作为大型系统组件的重要性,最重要的是存储在与关键企业应用程序交互时的响应速度。 为此,我们推出了我们的第一个应用程序测试,包括我们专有的 MarkLogic NoSQL 数据库存储基准 和 通过 SysBench 的 MySQL 性能.
在我们的 MarkLogic NoSQL 数据库环境中,我们测试了四个可用容量大于或等于 200GB 的 SATA 或 SAS SSD 的组。 我们的 NoSQL 数据库需要大约 650GB 的可用空间才能使用,平均分配给四个数据库节点。 在我们的测试环境中,我们使用 SCST 主机并在 JBOD 中呈现每个单独的 SSD,每个数据库节点分配一个。 该测试以 24 个间隔重复进行,对于此类 SSD 总共需要 30-36 小时。 测量 MarkLogic 软件看到的内部延迟,我们记录了总平均延迟以及每个 SSD 的间隔延迟。
对于我们在 MarkLogic NoSQL 数据库基准测试中的总体平均延迟排名,Fusion-io ioDrive2 MLC 略微落后于英特尔 SSD 910,响应时间为 4.685 毫秒,而响应时间为 4.286 毫秒。
Fusion-io ioDrive2 MLC 提供与 Intel SSD 910 相似的延迟,范围为 6-50 毫秒。 然而,ioDrive2 在大部分测试中保持了较低的日志写入延迟。
英特尔 SSD 910 发布了与 Fusion-io ioDrive2 相似的数据,峰值延迟范围为 6-50 毫秒。 尽管它的保存写入和合并读取和写入数字具有可比性,但它的日志写入标记在大部分测试中更高。 总体而言,英特尔 SSD 910 在我们的 NoSQL 测试中略微超过了 Fusion-io ioDrive2 MLC。
我们的下一个应用程序测试包括通过 SysBench 进行的 Percona MySQL 数据库测试,它测量 OLTP 活动的性能。 在此测试配置中,我们使用一组 Lenovo ThinkServer RD630 并将数据库环境加载到单个 SATA、SAS 或 PCIe 驱动器上。 该测试测量平均 TPS(每秒事务数)、平均延迟以及 99 到 2 个线程范围内的平均 32% 延迟。 Percona 和 MariaDB 在其最新版本的数据库中使用 Fusion-io 闪存感知应用程序 API,尽管为了进行比较,我们在其“传统”块存储模式下测试了每个设备。
在我们的 SysBench 测试中,Fusion-io ioDrive2 1.2TB 领先于 LSI Nytro WarpDrive 400GB,ioDrive2 的平均 TPS 从 305 线程时的大约 2 TPS 扩展到 2,354 线程时的 32 TPS。
Fusion-io ioDrive2 1.2TB 在 SysBench 中的平均延迟从 6.55 线程时的 2 毫秒扩展到 13.59 线程时的 32 毫秒。
在我们的 SysBench 测试中比较第 99 个百分位数的延迟,Fusion-io ioDrive2 1.2TB 再次击败了 LSI Nytro WarpDrive,在整个测试中延迟更好,在 30 毫秒时保持在 29.35 毫秒以下,而 WarpDrive 为 39.30 毫秒。
企业综合工作负载分析
闪存性能在每个存储设备的整个预处理阶段各不相同。 我们的综合企业存储基准流程从分析驱动器在彻底的预处理阶段的运行方式开始。 每个可比较的驱动器都使用供应商的工具进行安全擦除,在 16 个线程的重负载下使用相同的工作负载预处理到稳定状态,每个线程有 16 个未完成队列,然后按设定的时间间隔进行测试在多个线程/队列深度配置文件中显示轻度和重度使用情况下的性能。
预处理和初级稳态测试:
- 吞吐量(读+写 IOPS 聚合)
- 平均延迟(读+写延迟一起平均)
- 最大延迟(峰值读取或写入延迟)
- 延迟标准偏差(读+写标准偏差一起平均)
我们的企业综合工作负载分析包括两个基于实际任务的配置文件。 开发这些配置文件是为了更容易与我们过去的基准测试以及广泛发布的值(例如最大 4k 读写速度和 8k 70/30,通常用于企业硬件)进行比较。
- 4k
- 100% 读取或 100% 写入
- 100% 万
- 8k 70/30
- 70% 读取,30% 写入
- 100% 万
在此测试中,我们比较了所有三种驱动器,即 LSI Nytro WarpDrive、英特尔 SSD 910 和 Fusion-io ioDrive2 在 Linux 和 Windows 上的性能。 此外,对于 ioDrive2,我们将其过度配置功能用于高性能 (HP) 测试模式。
我们的第一个测试测量 100% 4k 随机写入性能,负载为 16T/16Q。 在此设置中,Fusion-io ioDrive2 MLC HP 的爆发特性在 Windows 上测试为 253,000,在 Linux 上测试为 293,000,然后分别稳定在接近稳态的 113,000 IOPS/118,000 IOPS 的同类最佳水平。 爆发的 HP 数据与爆发的股票数据相似。 在稳定状态下,英特尔 SSD 910 确实超越了现有的 ioDrive2 Windows 和 Linux。
在 16T/16Q 负载很重的情况下,Fusion-io ioDrive2 HP 的突发时间为 0.87-1 毫秒,并在接近稳态时扩大到 2.16-2.24 毫秒左右。 库存数量在爆发时相似,但在稳定状态下更高,再次被英特尔 SSD 910 淘汰。
比较最大延迟,Fusion-io ioDrive2 MLC 在 Linux 下的最大响应时间明显优于 Windows。 此外,其 Windows HP Max 延迟远远落后于竞争对手。 总体而言,最好的数据分别来自 Intel SSD 910 Linux 和 ioDrive2 Linux HP,分别为 26 毫秒和 15 毫秒。
进一步观察我们 4k 随机写入工作负载的延迟一致性,Fusion-io ioDrive2 Linux 和 Windows HP 均仅次于英特尔 SSD 910,后者得分最高,Linux 为 2.38 毫秒,Windows 为 2.72 毫秒。
经过 6 小时的预处理后,Fusion-io ioDrive2 Windows stock 和 HP 以令人难以置信的 4 IOPS 提供 252,000k 随机读取性能,HP 的写入速度为 111,597 IOPS,stock 为 61,847 IOPS。 英特尔固态盘 910 提供了更高的写入吞吐量。
在 16T/16Q 的工作负载下,Fusion-io ioDrive2 Windows(HP 和标准版)提供了平均 4k 的随机读取延迟,以 1.013ms 领先该组,而最佳写入延迟性能则由 Intel SSD 910 Windows 获得延迟甚至为 2.097 毫秒。
Fusion-io ioDrive2 Windows 库存的最大延迟对于读取活动来说是最好的,仅为 7.98 毫秒,尽管其写入活动最大值是该组中最高的,为 1030.50 毫秒。
比较延迟一致性,Fusion-io ioDrive2 MLC 在 4k 随机读写一致性方面的数据接近小组最后。
在我们的下一个工作负载中,我们查看具有 8/70 读/写混合比率的 30k 配置文件。 在此设置中,各种配置的 Fusion-io ioDrive2 以 210,000+ IOPS 爆发开始,然后减慢到 stock 的 70,000 IOPS 和 HP 的 88,000 IOPS 左右。 突发性能远远领先于竞争对手,稳态速率接近竞争驱动器的突发速度,不包括 Nytro WarpDrive Windows。
在我们的 2K 1.2/8 预处理测试开始时,Fusion-io ioDrive70 在所有模式下的平均延迟为 30 毫秒,随着接近稳态,HP 增加到约 2.88 毫秒,库存增加到 3.65 毫秒。 这些数字超过了比赛的分数。
在我们的 8k 70/30 测试期间,Fusion-io ioDrive2 Linux HP 提供了最佳的峰值响应时间,在大部分测试中最大延迟低于 25 毫秒。 同样,ioDrive2 Windows HP 产生了很高的最大延迟。
Fusion-io ioDrive2 HP Linux 和 Windows 延迟一致性在整个过程中得分最低,分别为 2.5 毫秒和 2.55 毫秒。
与我们在 16% 16k 写入测试中执行的固定 100 线程、4 队列最大工作负载相比,我们的混合工作负载配置文件可在各种线程/队列组合中扩展性能。 在这些测试中,我们将工作负载强度从 2 个线程和 2 个队列扩展到 16 个线程和 16 个队列。 在扩展的 8k 70/30 测试中,适用于 Linux 和 Windows 的 Fusion-io ioDrive2 HP 达到了大约 88,000 IOPS 的峰值,在该组中名列前茅,尽管 ioDrive2 股票也击败了竞争对手,尽管利润率要小得多。
Fusion-io ioDrive2 HP Linux 和 Windows 的平均延迟在同类产品中处于领先地位,普通版也优于竞争对手。
在我们的可变负载 8k 70/30 测试期间,最大延迟在所有环境中都比 Fusion-io ioDrive2 的竞争产品高很多。 惠普的峰值保持在 110 毫秒以下,股票的峰值范围高达近 300 毫秒。
在我们的测试环境中,与 Fusion-io ioDrive2 HP 的标准偏差是同类产品中最好的,并且 ioDrive2 股票的峰值恰好与英特尔 SSD 910 相同。
结语
Fusion-io ioDrive2 MLC 应用加速器以高达 1.2TB 的容量在 HHHL 外形规格中运行,FHHL 提供高达 3TB 的容量。 虽然我们最近审查了它的兄弟姐妹,但 ioDrive2 旗舰 Duo SLC,旨在通过其 SLC NAND 和双控制器配置处理要求最苛刻的应用程序,带有 MLC 的 ioDrive2 单驱动器仍然可以承担需要超低延迟和高吞吐量的高端工作负载。 MLC NAND 还意味着 Fusion-io 可以提供容量更大且价格低于 SLC 版本的此型号。
不久前已经测试过 ioDrive2 Duo SLC,我们对 ioDrive2 single 的性能有了很好的参考。 然而,这一次我们的测试环境已经更新,因为我们已经逐步淘汰了一些遗留的综合基准测试,转而使用我们的 MarkLogic 和 SysBench MySQL 真实世界测试环境。 我们从这些测试开始,ioDrive2 表现良好。 尽管 ioDrive2 的总体平均延迟在 MarkLogic 测试中略微被英特尔 SSD 910 压低,但其性能具有竞争力,其日志写入延迟峰值比英特尔 SSD 910 低很多。 在我们的 SysBench 测试中,ioDrive2 与 LSI Nytro WarpDrive 并驾齐驱,产生了数百个以上的 TPS,同时提供了更少的延迟。
然后,我们将 ioDrive2 与英特尔 SSD 910 和 LSI Nytro WarpDrive 进行了比较,利用 ioDrive2 的高性能 (HP) 模式超量配置,并在 Linux 和 Windows 上测试了所有驱动器。 当涉及到一般吞吐量数据时,ioDrive2 始终表现最佳。 它的 HP 模式提供了最大的整体吞吐量,在我们的 250,000k 随机测试中最高超过 4。 ioDrive2 在延迟方面的测试也很好,但在 Windows 中达到最大延迟时除外,我们在测试 ioDrive2 Duo SLC 时也观察到了这一点。 除了该类别之外,ioDrive2 的表现非常出色。
优点
- 卓越的管理软件包
- 与入门级企业型号相比,在 4k 和 8k 工作负载中提供最高的吞吐量
- Sysbench 和 MarkLogic 真实世界测试中的延迟和吞吐量与竞争对手相当或更好
缺点
- Windows 和 Linux 中的最大延迟问题
底线
Fusion-io ioDrive2 MLC 可以通过在行业领先的软件管理套件之上提供一流的令人印象深刻的吞吐量数据来加速系统处理最密集的工作负载。