首页 企业版 LSI Nytro WarpDrive BLP4-400 应用加速器评测

LSI Nytro WarpDrive BLP4-400 应用加速器评测

by 凯文·奥布莱恩

LSI Nytro WarpDrive BLP4-400 是一款半高半长 PCIe 应用加速器,可提供 400GB 的 eMLC NAND。 像 WLP4-200 200GB单片机 在我们之前审查过的模型中,BLP4-400 将利用 SandForce 控制器的四个 NAND 池组合到一个存储卷中。 该驱动器的设计易于部署; 通用的外形尺寸很容易插入大多数服务器,而且由于 LSI 在 HBA 和 RAID 卡方面的背景,WarpDrive 通常不需要安装额外的软件或驱动程序。 WarpDrive 系列在企业闪存环境中即插即用。


LSI Nytro WarpDrive BLP4-400 是一款半高半长 PCIe 应用加速器,可提供 400GB 的 eMLC NAND。 像 WLP4-200 200GB单片机 在我们之前审查过的模型中,BLP4-400 将利用 SandForce 控制器的四个 NAND 池组合到一个存储卷中。 该驱动器的设计易于部署; 通用的外形尺寸很容易插入大多数服务器,而且由于 LSI 在 HBA 和 RAID 卡方面的背景,WarpDrive 通常不需要安装额外的软件或驱动程序。 WarpDrive 系列在企业闪存环境中即插即用。

由于我们去年审查了 200GB SLC 并且大部分审查适用于此,因此我们不会在本次审查中深入探讨那么多细节。 不过,了解在 Nytro WarpDrive 系列中 LSI 提供了许多针对不同用例而设计的迭代是有帮助的。 高耐久性 SLC 型号有 200GB 和 400GB 容量,而更主流的 eMLC 驱动器有 400GB、800GB 和 1.6TB。 虽然 Nytro WarpDrive 系列最明显的用例是服务器内存储,但 LSI 产品正被广泛部署 NetApp 等作为缓存卡 在附加存储前面。 LSI 还提供他们自己的缓存软件与 400GB 和 800GB eMLC 卡相结合——在这些情况下,驱动器被称为 Nytro XD。 对于需要帮助确定缓存解决方案及其热点数据程度的企业买家,LSI 是为数不多的提供工具来满足这一需求的公司之一。 该工具是他们的 Nytro Predictor。

LSI Nytro WarpDrive 规格

  • 单层电池 (SLC)
    • 200GB Nytro WarpDrive WLP4-200
      • 顺序 IOPS (4K) – 238,000 读取,133,000 写入
      • 顺序读取和写入 IOPS (8K) – 189,000 读取,137,000 写入
      • 带宽 (256K) – 2.0GB/s 读取,1.7GB/s 写入
    • 400GB Nytro WarpDrive WLP4-400
      • 顺序 IOPS (4K) – 238,000 读取,133,000 写入
      • 顺序读取和写入 IOPS (8K) – 189,000 读取,137,000 写入
      • 带宽 (256K) – 2.0GB/s 读取,1.7GB/s 写入
  • 企业多级单元 (eMLC)
    • 400GB Nytro WarpDrive BLP4-400
      • 顺序 IOPS (4K) – 218,000 读取,75,000 写入
      • 顺序读取和写入 IOPS (8K) – 183,000 读取,118,000 写入
      • 带宽 (256K) – 2.0GB/s 读取,1.0GB/s 写入
    • 800GB Nytro WarpDrive BLP4-800
      • 顺序 IOPS (4K) – 218,000 读取,75,000 写入
      • 顺序读取和写入 IOPS (8K) – 183,000 读取,118,000 写入
      • 带宽 (256K) – 2.0GB/s 读取,1.0GB/s 写入
    • 1600GB Nytro WarpDrive BLP4-1600
      • 顺序 IOPS (4K) – 218,000 读取,75,000 写入
      • 顺序读取和写入 IOPS (8K) – 183,000 读取,118,000 写入
      • 带宽 (256K) – 2.0GB/s 读取,1.0GB/s 写入
  • 平均延迟 < 50 微秒
  • 接口 – x8 PCI Express 2.0
  • 功耗 – <25 瓦
  • 外形尺寸 – 薄型(半长,MD2)
  • 环境 在 0 至 45C 下运行
  • 操作系统兼容性
    • 微软:Windows XP、Vista、2003、7; Windows 服务器 2003 SP2、2008 SP2、2008 R2 SP1
    • Linux:CentOS 6; RHEL 5.4、5.5、5.6、5.7、6.0、6.1; SLES:10SP1、10SP2、10SP4、11SP1; 职业接触限值 5.6、6.0
    • UNIX:FreeBSD 7.2、7.4、8.1、8.2; Solaris 10U10、11(x86 和 SPARC)
    • 管理程序:VMware 4.0 U2、4.1 U1、5.0
  • 寿命终止数据保留 >6 个月 SLC,>3 个月 eMLC
  • 产品健康监控自我监控、分析和报告技术 (SMART) 命令,以及额外的 SSD 监控

建筑与设计

LSI Nytro WarpDrive 是一种半高半长 x8 PCI-Express 卡,由四个定制外形的 SSD 组成,以 RAID0 方式连接到主接口板。 作为半高卡,Nytro WarpDrive 只需更换背板适配器即可与更多服务器兼容。 LSI 在 Nytro WarpDrive 的核心使用四个 SATA 6.0Gb/s SF-2500 SandForce 处理器。 Nytro 在两个夹在中间的散热器“组”中容纳了两个这样的 SSD,它们通过一条小带状电缆连接到主板。 为了将这些控制器与主机连接起来,LSI 使用了他们自己的 SAS2008 PCIe 到 SAS 桥接器,该桥接器具有跨多个操作系统的广泛驱动程序支持。

与第一代 WarpDrive 不同,这些被动散热器允许 NAND 和 SandForce 控制器首先将热量散发到散热器中,然后通过服务器机箱中的气流被动冷却。 这减少了热点并确保在产品的整个生命周期内更稳定的硬件性能。 卡上方的视图显示了为 Nytro WarpDrive 提供动力的定制 SSD 下方、之间和顶部的紧密夹层铝板。 Nytro 还支持传统 HDD 指示灯,适合那些希望从外部看到特定级别监控的用户。

为 400GB MLC LSI Nytro WarpDrive 提供动力的四个 SSD 中的每一个都有一个 SandForce SF-2500 控制器和八个 16GB Toshiba MLC Toggle NAND 块。 这使每个 SSD 的总容量为 128GB,然后超额配置 22% 以获得 100GB 的可用容量。 LSI Nytro WarpDrive 完全符合 PCIe 2.0 x8 电源标准,在运行期间仅消耗 <25 瓦的功率。

测试背景和比较

本次评测中比较的所有 PCIe 应用程序加速器都在我们的第二代企业测试平台上进行了测试,该平台由基于 Intel Romley 的 Lenovo ThinkServer RD630 组成。 这个新平台配置了 Windows Server 2008 R2 SP1 和 Linux CentOS 6.3,使我们能够有效地测试不同 AA 在其驱动程序支持的各种环境中的性能。 每个操作系统都针对最高性能进行了优化,包括将 Windows 电源配置文件设置为高性能以及在 CentOS 6.3 中禁用 cpuspeed 以将处理器锁定在其最高时钟速度。 对于综合基准测试,我们使用适用于 Linux 的 FIO 版本 2.0.10 和适用于 Windows 的版本 2.0.12.2,并在允许的情况下在每个操作系统中使用相同的测试参数。

存储回顾联想ThinkServer RD630配置:

  • 2 x Intel Xeon E5-2620(2.0GHz,15MB 缓存,6 核)
  • 英特尔 C602 芯片组
  • 内存 – 16GB (2 x 8GB) 1333Mhz DDR3 Registered RDIMM
  • Windows Server 2008 R2 SP1 64 位、Windows Server 2012 Standard、CentOS 6.3 64 位
  • 100GB 美光 RealSSD P400e 启动固态硬盘
  • LSI 9211-4i SAS/SATA 6.0Gb/s HBA(用于启动 SSD)
  • LSI 9207-8i SAS/SATA 6.0Gb/s HBA(用于基准测试 SSD 或 HDD)

在为本次评测选择可比产品时,我们选择了性能最佳的最新 SLC 应用程序加速器。 这些加速器是根据各自的性能特征和价格范围选择的。 在适用的情况下,如果制造商通过软件包含该级别的配置以针对不同的产品用例,我们将包括库存和高性能基准测试结果。 对于 FlashMAX II,我们包括全容量和高性能基准测试。

200GB 大规模集成电路 Nytro WarpDrive WLP4-200

  • 发布时间:1H2012
  • NAND 类型:SLC
  • 控制器:4 x LSI SandForce SF-2500 通过 LSI SAS2008 PCIe 到 SAS 桥
  • 设备可见性:固定硬件 RAID0
  • 大规模集成电路视窗:2.10.51.0
  • LSI Linux:原生 CentOS 6.3 驱动程序
  • 预处理时间:6小时

400GB 大规模集成电路 Nytro WarpDrive BLP4-400

  • 发布时间:1H2012
  • NAND 类型:MLC
  • 控制器:4 x LSI SandForce SF-2500 通过 LSI SAS2008 PCIe 到 SAS 桥
  • 设备可见性:固定硬件 RAID0
  • LSI Windows:v07.00.00.00
  • LSI Linux:原生 CentOS 6.3 驱动程序
  • 预处理时间:6小时

800GB 英特尔固态硬盘 910

  • 发布时间:1H2012
  • NAND 类型:eMLC
  • 控制器:4 x Intel EW29AA31AA1 通过 LSI SAS2008 PCIe 到 SAS 桥
  • 设备可见性:JBOD、软件 RAID 取决于操作系统
  • 英特尔视窗:13.0
  • Intel Linux:原生 CentOS 6.3 驱动程序

企业综合工作负载分析

我们看待 PCIe 存储解决方案的方式比仅仅关注传统的突发或稳态性能更深入。 查看长时间内的平均性能时,您会忽略设备在整个时间段内的性能背后的细节。 由于闪存性能随时间变化很大,我们的基准测试过程分析了每个设备整个预处理阶段的总吞吐量、平均延迟、峰值延迟和标准偏差等方面的性能。 对于高端企业产品,延迟通常比吞吐量更重要。 出于这个原因,我们竭尽全力展示我们通过企业测试实验室测试的每台设备的全部性能特征。

我们还包括性能比较,以显示每个设备在 Windows 和 Linux 操作系统的不同驱动程序集下的性能。 对于 Windows,我们在最初审查时使用最新的驱动程序,然后在 64 位 Windows Server 2008 R2 环境下对每台设备进行测试。 对于 Linux,我们使用 64 位 CentOS 6.3 环境,每个 Enterprise PCIe Application Accelerator 都支持该环境。 我们进行此测试的主要目标是展示操作系统性能的差异,因为在产品表上将操作系统列为兼容并不总是意味着它们之间的性能相同。

闪存性能在每个存储设备的整个预处理阶段各不相同。 根据不同的设计和不同的容量,我们的预处理过程持续 6 小时或 12 小时,具体取决于达到稳态行为所需的时间长度。 我们的主要目标是确保每个驱动器在我们开始初步测试时都完全进入稳态模式。 总的来说,每个可比较的设备都使用供应商的工具进行了安全擦除,在 16 个线程的重负载和每个线程 16 个未完成队列的情况下,以相同的工作负载预处理到稳定状态,然后进行测试在多个线程/队列深度配置文件中设置间隔,以显示轻度和重度使用情况下的性能。

在预处理和初级稳态测试中监测的属性:

  • 吞吐量(读+写 IOPS 聚合)
  • 平均延迟(读+写延迟一起平均)
  • 最大延迟(峰值读取或写入延迟)
  • 延迟标准偏差(读+写标准偏差一起平均)

我们的企业综合工作负载分析包括四个基于实际任务的配置文件。 开发这些配置文件是为了更容易与我们过去的基准测试以及广泛发布的值(例如最大 4K 读写速度和 8K 70/30,通常用于企业驱动器)进行比较。 我们还包括两个传统的混合工作负载,传统的文件服务器和网络服务器,每个都提供广泛的传输大小组合。

  • 4K
    • 100% 读取或 100% 写入
    • 100% 4K
  • 8K 70/30
    • 70% 读取,30% 写入
    • 100% 8K
  • 文件服务器
    • 80% 读取,20% 写入
    • 10% 512b、5% 1k、5% 2k、60% 4k、2% 8k、4% 16k、4% 32k、10% 64k
  • 支持网络端
    • 100% 阅读
    • 22% 512b、15% 1k、8% 2k、23% 4k、15% 8k、2% 16k、6% 32k、7% 64k、1% 128k、1% 512k

在我们的第一个工作负载中,我们查看具有 4T/16Q 出色工作负载的完全随机 16K 写入预处理配置文件。 在此测试中,400GB LSI Nytro WarpDrive 在 Windows 中提供了 81,000 IOPS 的突发速度,在 Linux 中提供了 58,000 IOPS。 在接近稳定状态后,eMLC Nytro WarpDrive 在 Windows 和 Linux 中稳定在 14,000 IOPS 左右。

在我们的预处理 4K 随机写入 16T/16Q 工作负载中,400GB eMLC LSI Nytro WarpDrive 的范围从突发时的 3.1-4.4 毫秒到稳态时的 17.4-18 毫秒。

查看我们 4K 预处理工作负载的最大延迟,400GB WarpDrive 的峰值响应时间从 50-60 毫秒开始,随着它接近稳定状态增加到 100-150 毫秒。

比较延迟标准偏差,eMLC Nytro WarpDrive 比英特尔 SSD 910 和基于 SLC 的 Nytro WarpDrive 高得多。

在我们对 6GB LSI Nytro WarpDrive 进行 400 小时预调节期结束后,它具有稳态随机写入 4k 性能,在 Windows 中测得峰值为 14,295 IOPS,读取速度为 124,261 IOPS。 这与提供 910 IOPS 读取和 219,795 IOPS 写入稳态的英特尔 SSD 121,850 相比。

比较具有 16% 16K 随机读取活动的繁重 100T/4Q 工作负载的平均延迟,400GB LSI Nytro WarpDrive 在 Windows 中测量为 2.058ms,在 Linux 中测量为 3.277ms。 在 Windows 中测得的平均稳态写入延迟为 17.9 毫秒,在 Linux 中为 18.244 毫秒。

在我们的 4k 稳态测试中比较最大延迟时,400GB LSI Nytro WarpDrive 在 Windows 中的峰值写入延迟为 104 毫秒,在 Linux 中为 172 毫秒。 在 Windows 中测得读取延迟为 31.74 毫秒,在 Linux 中测得为 63.78 毫秒。

比较 MLC Nytro WarpDrive 与基于 MLC 的英特尔 SSD 910 之间的延迟标准差,Nytro 在写入活动方面的一致性较低,而在读取延迟一致性方面排名中等。

我们的下一个测试切换到 8K 70/30 混合工作负载,其中 400GB Nytro WarpDrive 在 Linux 和 Windows 中的突发速度分别为 84-120,000 IOPS,然后在稳定状态下稳定到 36-43,000 IOPS。

比较我们 8k 70/30 预处理 16T/16Q 工作负载的平均延迟,400GB LSI Nytro WarpDrive 提供的突发延迟在 2.1-3 毫秒之间,增加到接近稳态的 6.0-6.9 毫秒。

对于 8k 70/30 工作负载,400GB LSI Nytro WarpDrive 的峰值延迟范围从突发期间的 30-40 毫秒到驱动器接近稳态时的 50-80 毫秒。

比较我们 8k 70/30 预处理工作负载中的延迟一致性,基于 MLC 的 LSI Nytro WarpDrive 的标准偏差在稳态下比英特尔 SSD 910 高,也比基于 SLC 的 WarpDrive 高。

与我们在 16% 16K 写入测试中执行的固定 100 线程、4 队列最大工作负载相比,我们的混合工作负载配置文件可在各种线程/队列组合中扩展性能。 在这些测试中,我们将工作负载强度从 2 个线程和 2 个队列扩展到 16 个线程和 16 个队列。 在我们扩展的 8K 70/30 测试中,400GB LSI Nytro WarpDrive 在 Windows 和 Linux 中从 11T/11.2Q 时的 2-2k IOPS 扩展到 Linux 和 Windows 中 36.8T/42.7Q 时的 16k-16k IOPS。 这比英特尔 SSD 910 和基于 SLC 的 Nytro WarpDrive 都低。

在我们 8k 70/30 测试的缩放平均延迟部分中,我们发现 400GB LSI Nytro WarpDrive 在 Linux 和 Windows 中从 0.35T/2Q 时的 2ms 缩放到 5.9T/6.9Q 时的 16-16ms。

在我们的 8k 70/30 主测试中,基于 MLC 的 LSI Nytro WarpDrive 测得的最大延迟更高,峰值响应时间范围为 32-142 毫秒。

比较主流英特尔 SSD 910 和基于 MLC 的 LSI Nytro WarpDrive 的延迟一致性,Linux 中的 WarpDrive 比 SSD 910 更高,但在 Windows 中提供更高工作负载下的优势。

文件服务器工作负载代表了每个特定设备的更大传输大小频谱,因此驱动器必须处理从 4b 到 8K 的请求,而不是适应静态 512k 或 64k 工作负载。 在此工作负载中,基于 MLC 的 LSI Nytro WarpDrive 提供了比英特尔 910 更高的突发速度,测得 69.7-83k IOPS,但当它接近稳态时,性能降至该组底部,测得 23.9-27.7k IOPS。

在我们的文件服务器预处理测试的低工作负载下,平均延迟在 3T/3.6Q 时测量为 2-2 毫秒,在 9.2T/10.6Q 时增加到 16-16 毫秒。

在我们的文件服务器测试的预处理阶段,基于 MLC 的 LSI Nytro WarpDrive 的峰值响应时间在突发模式下为 40-50 毫秒,随着驱动器接近稳定状态增加到 60-140 毫秒。

比较 400GB LSI Nytro WarpDrive 和英特尔 SSD 910 之间的延迟一致性,在突发模式下,Nytro 具有较低的延迟标准偏差,尽管随着它接近稳定状态,其在 Linux 中的性能落后于 SSD 910。

在文件服务器预处理过程以恒定的 16T/16Q 负载完成后,我们开始进行主要测试,测量 2T/2Q 和 16T/16Q 之间设定水平的性能。 在我们的主要文件服务器工作负载中,基于 400GB MLC 的 LSI Nytro WarpDrive 从 Windows 和 Linux 中 7,500T/2Q 时的约 2 IOPS 扩展到 Linux 和 Windows 中 23.7T/27.2Q 时的 16-16k IOPS。

400GB LSI Nytro WarpDrive 的平均延迟在 Linux 和 Windows 中 0.52T/0.53Q 时为 2-2,在 9.39T/10.76Q 时增加到 16-16ms

比较基于 MLC 的 LSI Nytro WarpDrive 和英特尔 SSD 910 之间的最大延迟,Nytro 在我们的文件服务器主测试中的延迟范围更高,峰值响应时间位于 75-150 毫秒之间的范围内。

从峰值延迟到延迟标准偏差,基于 MLC 的 Nytro WarpDrive 在大部分测试中都落后于该组,并且在 Windows 的某些领域略微优于英特尔 SSD 910。

在我们最后一个涵盖 Web 服务器配置文件的综合工作负载(传统上是 100% 读取测试)中,我们应用 100% 写入活动以在我们的主要测试之前完全预处理每个驱动器。 在这种压力很大的预处理测试下,基于 400GB MLc 的 LSI Nytro WarpDrive 的突发速度与英特尔 SSD 910 相似,测量值在 29.6-35.6k IOPS 之间,尽管它接近稳态性能时跌至 5.6-5.7 组的底部IOPS。

在我们的压力 Web 服务器预处理测试中,平均延迟从 7.1-8.6 毫秒开始,随着 Nytro 接近稳定状态增加到 44-45 毫秒。

当基于 MLC 的 LSI Nytro WarpDrive 接近稳态时,其峰值响应时间介于 240-360 毫秒之间,而英特尔 SSD 910 的峰值响应时间介于 80-250 毫秒之间。

基于 MLC 的 LSI Nytro WarpDrive 的延迟一致性落后于英特尔 SSD 910 以及基于 SLC 的 Nytro,随着驱动器接近稳态条件而扩展得更高。

切换到具有 100% 读取配置文件的 Web 服务器测试的主要部分,400GB LSI Nytro WarpDrive 的性能从 11.7T/12Q 的 2-2k IOPS 扩展到 47.5T/57.6Q 的 16-16k IOPS 的峰值。 这与英特尔 SSD 910 相比,后者在 15T/15.4Q 时的 IOPS 范围为 2-2k,在 57.4T/64.6Q 时增加到 16-16k IOPS 的峰值。

在我们的读取密集型 Web 服务器主测试中,基于 MLC 的 Nytro 提供的平均延迟从 0.33T/2Q 的 2 毫秒扩展到 4.4T/5.3Q 的 16-16 毫秒。

与英特尔 SSD 910 相比,基于 MLC 的 LSI Nytro WarpDrive 的峰值响应时间略长。在工作负载过程中测得的最大延迟在 25-70 毫秒之间。

虽然与 SSD 910 相比,Nytro WarpDrive 的峰值响应时间更长,但切换到延迟一致性后,WarpDrive 在低工作负载和高工作负载下都提供了更好的延迟标准偏差。

结语

LSI Nytro WarpDrive BLP4-400 是一款主流应用加速器,旨在比我们之前评测过的 SLC 版本具有更广泛的用途。 400GB 的容量可以很好地满足小型数据库的计算需求或作为缓存卡来加速较慢的硬盘驱动器层。 半高半长的卡设计也使其适用于大多数服务器,LSI 已在以无驱动服务器兼容性着称的长期 HBA 平台上构建了 WarpDrive。

也就是说,与自 LSI 推出此 Nytro WarpDrive 系列以来发布的更多现代应用程序加速器相比,LSI 使用的多控制器设计显得有些软弱。 在我们的 8k 70/30 或文件服务器测试中进行基准测试时,400GB Nytro 落后英特尔 SSD 910 30-40%。 我们还注意到 Linux 中的性能下降,其中 WarpDrive 支持 Windows 以获得更高的性能。 这在 Intel SSD 910 上并不明显。考虑到这种差异,Intel 依赖于软件 RAID,而 WarpDrive 使用固定硬件 RAID0。

尽管 LSI 产品因其易用性、可靠性和兼容性而受到许多企业用户和解决方案经销商的青睐。 虽然比性能指标更难量化,但可以说这些因素在许多用例中同样重要,在这些用例中,知道卡可以轻松工作比为最大 IOPS 进行实际调整更重要。

优点

  • 高度兼容
  • 通用 HHHL 外形规格
  • 可以作为引导驱动器运行

缺点

  • 性能落后于竞争对手

底线

LSI Nytro WarpDrive BLP4-400 400GB eMLC 闪存卡是一种更容易部署的应用程序加速器,它本身是一个可引导的单一卷,具有通用的 HHHL 外形。 它也是最兼容的解决方案之一,内置了 Windows 和 Linux 等操作系统的支持。

BLP4-400 产品页面