美光 RealSSD P320h 是一款半高半长 (HHHL) 应用程序加速器,它利用 SLC NAND 和 PCIe Gen 2 x8 接口来驱动 3.2 GB/s 顺序读取和高达 785,000 随机读取 IOPS 的引用性能。 P320h 架构不同于我们审查过的许多其他最近的应用程序加速器,这些加速器通常将多个闪存驱动器组合在一起。 Micron 的产品有所不同,而是使用带有自定义控制器的 RAIN(独立 NAND 冗余阵列),这类似于 Fusion-io 和 Virident 所采用的方法。 这种架构让 Micron 拥有一些令人兴奋的速度和延迟声明,同时在驱动器上提供高级别的数据安全性。 在本次审查中,我们测试了一对 700GB 卡,不仅可以了解它们的运行速度,还可以了解 P320h 在 Windows Server 2012 中的扩展能力。
美光 RealSSD P320h 是一款半高半长 (HHHL) 应用程序加速器,它利用 SLC NAND 和 PCIe Gen 2 x8 接口来驱动 3.2 GB/s 顺序读取和高达 785,000 随机读取 IOPS 的引用性能。 P320h 架构不同于我们审查过的许多其他最近的应用程序加速器,这些加速器通常将多个闪存驱动器组合在一起。 Micron 的产品有所不同,而是使用带有自定义控制器的 RAIN(独立 NAND 冗余阵列),这类似于 Fusion-io 和 Virident 所采用的方法。 这种架构让 Micron 拥有一些令人兴奋的速度和延迟声明,同时在驱动器上提供高级别的数据安全性。 在本次审查中,我们测试了一对 700GB 卡,不仅可以了解它们的运行速度,还可以了解 P320h 在 Windows Server 2012 中的扩展能力。
如前所述,从吞吐量和延迟的角度来看,驱动器架构和 NAND 管理策略在设备性能方面起着至关重要的作用。 通过 P320h,Micron 将他们自己的 IP 与 IDT 的 ASIC 设计和制造融合在一起。 最终结果是一个 ASIC 控制器,其中包含美光围绕 NAND 管理和控制的专有智能,其中包括 RAIN。 Micron 的 RAIN 方法在处理 NAND 方面非常高效,而这种效率最终是推动 P320h 性能和数据保护的因素。 Micron 在 RAIN 中使用相当于 7+1P RAID5 架构。 通过在 7+1 级别使用条带化,美光能够提供与无奇偶校验驱动器相同的性能,同时仍提供企业所需的数据保护。
由于采用了美光 NAND 管理技术,P320h 很有趣,但它在物理上也很有趣。 HHHL PCB 全是 Micron 部件,当然包括 SLC NAND 和 DDR,它不需要外部电源连接即可达到最佳性能。 我们的 700GB 驱动器有 64 个 NAND 片夹在板上,单个控制器上的无源散热器突出显示了这一点。 与依赖通过硬件和软件组合多个控制器的竞争解决方案相比,单一控制器设计具有更好的性能和可靠性。 使用专为 Micron NAND 设计的控制器在驱动器的互操作性、性能和支持方面为 Micron 提供了另一个优势。 与其他地方报道的相反,该驱动器不支持 NVMe,但美光肯定会在未来的产品中朝着这个方向发展。
美光为 P320h 提供两种 SLC 专用容量,350GB 和 700GB 可用容量。 一个 350GB 的驱动器以 512GB RAW 开始,但在减去 12.5% 的 RAIN 和 22% 的超额配置后,该驱动器的容量为 350GB。 P320h 为 25GB 型号提供高达 350PB 的耐用性,为 50GB 型号提供高达 700PB 的耐用性,并随附用于驱动器管理和健康报告的软件工具。
美光 RealSSD P320h 规格
- 容量
- 350GB(MTFDGAR350SAH-1N1AB)
- 顺序读取:3.2 GB/s(128KB,稳态)
- 顺序写入:1.9 GB/s(128KB,稳态)
- 随机读取:785,000 IOPS(4KB,稳态)
- 随机写入:175,000 IOPS(4KB,稳态)
- 700GB(MTFDGAR700SAH-1N1AB)
- 顺序读取:3.2 GB/s(128KB,稳态)
- 顺序写入:1.9 GB/s(128KB,稳态)
- 随机读取:785,000 IOPS(4KB,稳态)
- 随机写入:205,000 IOPS(4KB,稳态)
- 350GB(MTFDGAR350SAH-1N1AB)
- 就绪延迟:<42µs(512 字节)
- 写入延迟:<9µs
- 接口:PCIe Gen2 x8
- 功率:最大 25W,闲置 10W
- 外形:HHHL
- 本机命令排队多达 256 个命令
- 耐力:350GB – 25PB,700GB – 50PB
- 尺寸:68.90mm X 167.65mm X 18.71mm
- 工作温度:0°C 至 +50°C
- 操作系统兼容性
- 微软:Windows Server 2008 R2 SP1 (x86-64)、Windows Server 2008 R2 SP1 Hyper-V (x86-64)、Windows Server 2012 (x86-64) SP128、Windows Server 2012 Hyper-V (x64)
- Linux:RHEL Linux 5.5、5.6、5.7、5.8 (SP128)、6.1、6.2 (x86-64)、SLES Linux 11 SP1 和 SP2 (x86-64)
- 开源 GPL(内核版本 2.6.25+)
- 寿命终止数据保留 1 年
影片总览
建筑与设计
Micron RealSSD P320h 是一款半高半长 x8 PCI-Express 卡,在设计方面采用了市场上最基本的 PCIe AA 布局。 它带有一个控制器和两个小子卡,比我们迄今为止审查过的任何其他解决方案都更纤薄,而且是迄今为止最简单的解决方案。 这在多个方面对美光有利。 首先,该卡自动适用于市场上几乎所有支持 PCIe 扩展卡的服务器,但在比较企业解决方案的整体可靠性时,它也发挥了作用。 使用单个控制器,甚至没有 Fusion-io“Duo”产品上的 PCIe 开关,可能发生故障的部件更少。 这与一些将多个 SandForce 控制器 RAID 在一起的竞争解决方案中的多控制器配置形成鲜明对比。 在一个讨厌平台一旦投入生产就关闭的市场中,除了最终的更换之外,知道您今天安装的设备可以工作多年而不会引起问题是一个巨大的优势。
Micron RealSSD P320h 的核心是定制的 Micron/IDT ASIC 控制器,这是该解决方案所独有的。 在我们的两个 700GB 样本上,该控制器随后链接到 1TB 的美光 SLC NAND 池,并使用 2.25GB 的美光 DDR RAM 进行缓冲。 根据您的看法,这些项目为美光提供了巨大的优势,因为他们非常详细地了解所有这些组件如何在核心级别上通过内部制造来工作。
Micron RealSSD P320h 在功耗方面非常灵活,PCIe 25 x2.0 总线的功耗不到 8 瓦; 无需外部电源连接。 这使 P320h 在寻找合适的安装平台时具有更大的灵活性,无需额外的电源线或测试服务器即可通过 PCIe 规范供电。
管理软件
虽然大多数应用程序加速器都附带一些软件,但这些工具的可用性和有效性参差不齐。 Micron 提供了他们的 RealSSD Manager 工具,旨在更有效地管理 P320h,包括 CLI 和 GUI。 这些工具与 Windows 和 Linux 兼容,并提供广泛的功能。 用户可以利用这些软件工具来更新驱动器固件、检查 PCIe AA 的运行状况以及启动设备格式。 在更高级的级别上,您可以使用内置的日志记录功能监控当前的驱动器使用情况和温度。
与我们迄今为止看到的制造商附带的实用程序相比,美光的功能集和整体设计仅次于 Fusion-io。 与 ioSphere 相比,Micron RealSSD Manager 虽然在设计上有所缩减,但它提供了许多相同的管理和监控功能,尽管只是在本地级别。 目前它不支持远程系统上的监控设备,但与 LSI 或 OCZ 管理工具相比,总体上在功能上有了巨大的提升。
测试背景和比较
在测试企业硬件时,环境与用于评估它的测试过程一样重要。 在 StorageReview,我们提供与许多数据中心相同的硬件和基础设施,我们测试的设备最终将用于这些数据中心。 这包括仅使用企业服务器以及适当的基础设施设备(如企业网络、机架空间、电源调节/监控)和同类可比硬件进行测试,以正确评估设备的性能。 我们的评论都不是由我们正在测试的设备的制造商支付或控制的; 与我们自行决定从我们拥有的产品中挑选的相关可比对象 在我们的实验室.
StorageReview 企业测试平台:
- 2 个英特尔至强 X5650(2.66GHz,12MB 缓存)
- Windows Server 2008 Standard Edition R2 SP1 64 位和 CentOS 6.2 64 位
- 英特尔 5500+ ICH10R 芯片组
- 内存 – 8GB (2 x 4GB) 1333Mhz DDR3 Registered RDIMM
在为本次评测选择可比产品时,我们选择了每个制造商的领先者,但仅限于与配备 SLC 的美光 RealSSD P320h 相比有意义的领域。 出于这个原因,我们放弃了第一代 LSI WarpDrive,因为它被第二代 Nytro WarpDrive 和 OCZ Z-Drive R4 所取代,后者远远超出了性能企业存储市场需求的延迟曲线.
640GB Fusion-io ioDrive 双核
- 发布时间:1H2009
- NAND 类型:MLC
- 控制器:2 x 专有
- 设备可见性:JBOD、软件 RAID 取决于操作系统
- 融合 io VSL Windows:3.1.1
- Fusion-io VSL Linux 3.1.1
200GB LSI Nytro WarpDrive WLP4-200
- 发布时间:1H2012
- NAND 类型:SLC
- 控制器:4 x LSI SandForce SF-2500 通过 LSI SAS2008 PCIe 到 SAS 桥
- 设备可见性:固定硬件 RAID0
- 大规模集成电路视窗:2.10.51.0
- LSI Linux:原生 CentOS 6.2 驱动程序
700GB 美光 RealSSD P320h
- 发布时间:2H2011
- NAND 类型:SLC
- 控制器:1 x 专有
- 设备可见性:单个设备
- 美光视窗:7.03.3452.00
- 美光 Linux:1.3.7-1
企业综合工作负载分析(库存设置)
我们看待 PCIe 存储解决方案的方式比仅仅关注传统的突发或稳态性能更深入。 查看长时间内的平均性能时,您会忽略设备在整个时间段内的性能背后的细节。 由于闪存性能随时间变化很大,我们新的基准测试过程分析了每个设备整个预处理阶段的总吞吐量、平均延迟、峰值延迟和标准偏差等方面的性能。 对于高端企业产品,延迟通常比吞吐量更重要。 出于这个原因,我们竭尽全力展示我们通过我们的每台设备的全部性能特征 企业测试实验室.
我们还添加了性能比较,以显示每个设备如何使用 Fio 工作负载生成器在 Windows 和 Linux 操作系统的不同驱动程序集下执行。 对于 Windows,我们在最初审查时使用最新的驱动程序,然后在 64 位 Windows Server 2008 R2 环境下对每台设备进行测试。 对于 Linux,我们使用 64 位 CentOS 6.2 环境,每个 Enterprise PCIe Application Accelerator 都支持该环境。 我们进行此测试的主要目标是展示操作系统性能的差异,因为在产品表上将操作系统列为兼容并不总是意味着它们之间的性能相同。
所有经过测试的设备从头到尾都遵循相同的测试策略。 目前,对于每个单独的工作负载,设备都使用供应商提供的工具进行安全擦除,以相同的工作负载预处理到稳定状态,设备将在 16 个线程的重负载下进行测试,每个线程有 16 个未完成队列,并且然后在多个线程/队列深度配置文件中以设定的时间间隔进行测试,以显示轻度和重度使用情况下的性能。 对于具有 100% 读取活动的测试,预处理使用相同的工作负载,但翻转为 100% 写入。
预处理和初级稳态测试:
- 吞吐量(读+写 IOPS 聚合)
- 平均延迟(读+写延迟一起平均)
- 最大延迟(峰值读取或写入延迟)
- 延迟标准偏差(读+写标准偏差一起平均)
目前,Enterprise Synthetic Workload Analysis 包括四个通用配置文件,它们可以尝试反映真实世界的活动。 选择这些与我们过去的基准有一些相似之处,以及与广泛发布的值(例如最大 4K 读写速度)以及企业驱动器常用的 8K 70/30 进行比较的共同点。 我们还包括两个遗留的混合工作负载,包括传统的文件服务器和 Web 服务器,提供各种传输大小。 最后两个将随着我们网站上介绍的那些类别的应用程序基准逐步淘汰,并替换为新的合成工作负载。
- 4K
- 100% 读取或 100% 写入
- 100% 4K
- 8K 70/30
- 70% 读取,30% 写入
- 文件服务器
- 80% 读取,20% 写入
- 10% 512b、5% 1k、5% 2k、60% 4k、2% 8k、4% 16k、4% 32k、10% 64k
- 支持网络端
- 100% 阅读
- 22% 512b、15% 1k、8% 2k、23% 4k、15% 8k、2% 16k、6% 32k、7% 64k、1% 128k、1% 512k
进入我们的第一个测试,该测试涵盖 4K 随机写入预处理工作负载,美光 RealSSD P320h 起步很高,在我们的 Lenovo ThinkServer 中突发速度略低于 400k IOPS。 在 200 分钟左右,性能稳定在 80k IOPS 以上,我们的 CentOS 6.2 和 Windows Server 2008 测试环境之间的性能非常相似。
查看我们 4K 预处理测试期间的平均延迟,P320h 在 1T/16Q 负载下很快稳定在略高于 16 毫秒的延迟,远低于配备 SLC 的 LSI Nytro WarpDrive。
在我们的预处理工作负载期间比较 Windows 和 Linux 的最大延迟时,我们发现 Linux 环境提供的高延迟峰值最少,而 Windows 驱动程序集有时会波动到 1,000 毫秒。
虽然 1,000 毫秒的尖峰可能令人不安,但比较标准偏差可以更好地了解整个测试期间的整体延迟情况。 就 P320h 而言,即使它在 Windows Server 2008 中的峰值更高,它在 Linux 中仍然仅次于它自己。
过渡出预调节阶段后,我们在 4K 工作负载和 16T/16Q 负载下对每个应用程序加速器进行了更长时间的采样。 美光 RealSSD P320h 在 4K 随机读取和随机写入方面提供了迄今为止最高的性能,其 Linux 驱动程序集具有优势。 在 CentOS 中,我们测量了 417k IOPS 读取,而在 Windows 中“仅”为 378k IOPS。 4K 随机写入速度在两个平台上保持一致,测得超过 202k IOPS。
凭借近乎难以置信的吞吐量,P320h 的平均延迟最低也就不足为奇了。 平均读取延迟略高于 0.6 毫秒,写入延迟为 1.26 毫秒。
在比较我们最终的 4K 随机读写性能样本中的峰值延迟时,美光 RealSSD P320h 在 Windows 和 Linux 中具有一些最高的 4K 随机读取信号。 随机写入性能更加分裂,Windows 端的峰值延迟更高,Linux 端的峰值延迟更低。
进一步研究整体延迟,美光 realSSD P320h 在 Linux 中提供了迄今为止最一致的随机 4K 性能,而其 Windows 驱动程序的性能稍差。
我们的下一个测试将重点转移到我们的 8K 70/30 工作负载上,美光 P320h 在吞吐量方面再次领先该组。 在此部分中,突发速度在 30 分钟内转变为测试,然后在 120 分钟标记附近趋于稳定。
P320h 在我们的 8K 70/30 工作负载中提供了非常低的平均延迟,在预处理过程中测得的延迟约为 1.5 毫秒。 Linux 驱动程序集略有领先,但在整体方案中您很难注意到这种差异。
将焦点从平均延迟切换到峰值延迟,Windows 和 Linux 中的行为之间存在明显差异。 Windows 驱动程序的最大响应时间在 1,000-1,200 毫秒之间波动,而 Linux 端的响应时间较低,约为 200 毫秒。
虽然峰值延迟显示了最差的单一响应时间,但我们的下一节将着眼于标准偏差,以了解在我们的预处理阶段延迟的整体情况如何。 在 Linux 中,与 Windows 端相比,Micron P320h 提供了更高级别的一致性。 虽然 Windows 的性能不太稳定,但仍处于中等水平。
与我们在 16% 16K 写入测试中执行的固定 100 线程、4 队列最大工作负载相比,我们的混合工作负载配置文件可在各种线程/队列组合中扩展性能。 在这些测试中,我们将工作负载强度从 2 个线程和 2 个队列扩展到 16 个线程和 16 个队列。 美光 P320h 在更高队列深度方面领先该组同类产品,同时在 2T/2Q 级别仅放弃最低限度的性能。 在整个范围内,Linux 驱动程序集在大多数领域都提供了小幅度的更高吞吐量。
Micron RealSSD P320h 在除 2T/2Q 负载之外的所有部分中提供了组中最好的响应时间,并且在除 1T/16Q 部分之外的所有部分都保持在 16ms 以下。
在测试进行到中期时,Windows 中的 P320h 开始出现更高的响应时间,并发线程数超过 4 个。 除了接近 128 毫秒的最高有效 QD256 和 QD200 测试之外,Linux 驱动程序将这些信号保留在所有测试中。
比较标准偏差,美光 RealSSD P320h 在 Linux 下提供了最稳定的性能,并且在其 Windows 驱动程序集方面排名中等。
文件服务器工作负载代表了每个特定设备的更大传输大小频谱,因此驱动器必须处理从 4b 到 8K 的请求,而不是适应静态 512k 或 64k 工作负载。 文件服务器预处理测试是美光 P320h 在突发速度方面没有超越其他型号的第一个领域,尽管它只是在测试结束时从安全擦除状态继续变得更快。 虽然开始时低于 80k IOPS,但在 100 分钟后它超过了 120k IOPS 的稳定状态。 这远远超过了该细分市场中的现有模型。
查看平均延迟,当 Micron RealSSD P320h 在有效队列深度 256 处接近稳定状态时,它的响应时间平均为 2 毫秒。
将我们的注意力转移到峰值响应时间上,Windows 驱动程序集再次显示出更高的峰值响应时间,在我们的整个测试过程中徘徊在 1,000 毫秒左右。 这与 Linux 驱动程序集相比,Linux 驱动程序集保持峰值水平不超过 50 毫秒。
虽然峰值响应时间不一定看起来很好,但我们将重点转移到标准偏差上,以更清晰地描绘美光 P320h 的整体延迟。 在此区域中,您可以在 Windows 中的 P320h 测试期间看到一些光点,但它仍然保持在该组中最低的水平。
完成预处理阶段后,我们开始进行初步测试,负载在 16T/16Q 到 2T/2Q 之间变化。 美光 RealSSD P320h 起步很快,随着有效队列深度的增加,它以巨大的领先优势领先群雄。 在我们的双处理器服务器中,最终性能达到 130k IOPS 以下。
比较平均延迟,P320h 在 130T/16Q 时提供了其最高的 4k IOPS 吞吐量,平均延迟约为 0.5 毫秒,在 EQD1 和 EQD2 级别上上升到 128-256 毫秒。
在我们的文件服务器测试的主要部分中的最大延迟图片在我们的测试的 Windows 部分中与之前的测试有相同的 1,000 ms blips,而 Linux 驱动程序提供的峰值响应时间要低得多。
比较延迟标准偏差,美光 RealSSD P320h 在 Linux 中提供了最好的延迟分布,在 Windows 中接近中间位置。
在我们最后一个涵盖 Web 服务器配置文件的综合工作负载(传统上是 100% 读取测试)中,我们应用 100% 写入活动以在我们的主要测试之前完全预处理每个驱动器。 在此测试中,美光 RealSSD P320h 的稳态性能最快,但此测试的新内容是 Windows 和 Linux 驱动程序之间吞吐量的明显差异。 Linux 性能更高,并提供更好的突发性能。
将焦点转移到平均延迟上,美光 P320h 从刚开始的 20 多分钟开始就提供了一条平坦的曲线,Linux 性能领先近 2 毫秒。
与之前测试中显示 P1,000h 频繁出现 320 毫秒信号的混合读/写工作负载相比,相比之下,Web 服务器预处理测试要平静得多。 话虽如此,Linux 方面仍然更加平静,在预处理过程中没有显示出延迟问题。
在我们的 Web 服务器预处理阶段比较延迟标准偏差,Micron RealSSD P320h 提供了迄今为止最一致的延迟,即使我们包括了 Windows 驱动程序看到的信号。 当驱动器接近稳定状态时,观察非常温和的延迟斜坡,我们看到性能在 60 到 80 分钟之间完全趋于平稳。
切换到我们具有 100% 读取配置文件的 Web 服务器测试的主要部分,美光 P320h 仍然在所有类别中领先,除了我们测试的 2T/2Q 部分的 Windows 性能。 比较其性能的一个有趣方面是,虽然 Linux 端提供了更高的写入性能,但 Windows 驱动程序集提供了更高的读取性能。 这导致所有部分的 Windows 性能更高,队列深度更重,最高速度更高(152k vs 170k IOPS)
Micron RealSSD P320h 的平均延迟在所有阶段都保持在 1 毫秒以下,有效队列深度为 256 时除外。将其峰值吞吐量与平均延迟进行比较,我们发现该卡在我们的 Web 服务器跟踪中的最佳点介于 64 的有效队列深度之间和 128。
尽管 Windows 驱动程序最终在吞吐量和平均延迟方面占据上风,但在测试的大部分部分中,最大响应时间仍徘徊在 1,000 毫秒附近; Linux 性能没有任何高延迟峰值
比较这组驱动器之间的延迟标准偏差,Linux 中的 Micron RealSSD 提供了最佳的延迟分布,而 Windows 驱动程序则处于中间位置。
企业综合工作负载分析(多驱动器/网络)
我们配备了两个 700GB Micron RealSSD P320h PCIe 应用加速器,配置了一个由运行 Windows Server 2012 的高性能 Supermicro 服务器组成的测试环境。该测试平台通过两个独立的 PCIe 3.0 Mellanox InfiniBand 适配器连接到我们的 SX6036 IB 交换机,到两个HP Proliant DL380p Gen8 服务器也运行 Windows Server 2012。在高性能 Supermicro 存储服务器上,我们使用存储空间创建了一个简单的存储阵列,然后通过 SMB 共享。 与我们测试整个驱动器 LBA 表面的主要基准测试不同,这些测试强调分布在条带卷上的两个 50GB 段,在本地和 InfiniBand 网络上进行基准测试。
我们在下面提供了 InfiniBand 测试的概述视频:
StorageReview 56Gb/s 企业测试平台:
超微电脑 超级服务器 7047R-TXRF
- 超微电脑X9DRX+-F
- 双 Intel E5-2670 CPU(2.6GHz,20MB 缓存)
- Windows Server 2012 数据中心
- 128GB 内存(8GB x 16 Hynix DDR3,每个 CPU 64GB)
- 英特尔至强 E5-2640(6 核,2.50 GHz,15MB,95W)
- Windows Server标准2012的
- 英特尔 C600 芯片组
- 64GB (8 x 8GB) 和 16GB (4 x 4GB) 1333Mhz DDR3 Registered RDIMM
Mellanox SX6036 56Gb/s InfiniBand 交换机和硬件
- 36 个 56Gb/s FDR 端口
- 无源 QSFP 铜缆
- Mellanox ConnectX-3 VPI PCIe 3.0 双 56Gb/s InfiniBand 适配器
我们当前的 InfiniBand 高性能互连测试基础设施包括两台配备 Mellanox ConnectX-380 VPI PCIe 适配器的 HP Proliant DL8p Gen3 服务器,通过 Mellanox 的 36 端口 56Gb/s IB 交换机连接。 这种环境允许我们正在测试的存储设备成为 I/O 瓶颈,而不是网络设备本身。
在我们的本地简单空间和 InfiniBand 测试部分,我们缩小了有限的测试选择范围,而不是我们的完整套件。 为了便于比较,我们使用 8K 70/30 工作负载来显示本地访问与通过网络共享时的性能差异。
在我们的主要测试中使用较小的总体占用空间进行测试,我们发现在双卡环境中性能扩展得非常好。 在本地,通过同时运行两个工作负载生成器会话来模拟在网络上运行的两个服务器,我们在 490K 8/70 工作负载中测量了超过 30k IOPS 的性能。 在两个共享上呈现单个条带阵列并从我们的两个 HP Proliant DL380p Gen8 服务器访问它,性能下降到 402k IOPS。 我们能够在这两种情况下将吞吐量提高一倍以上,并且仍然保持出色的每服务器性能。
查看我们的双 P320h 环境中的平均延迟,本地访问与通过 InfiniBand 的远程访问相比,平均延迟存在一些差异,但延迟仍低于我们在主要测试台上从一个 P320h 测得的延迟。 鉴于在多个系统之间共享这种高 I/O 设备对延迟的影响很小,它确实为将昂贵的高性能资源共享给多个系统打开了大门。
与本地访问和远程访问相比,峰值延迟确实没有可测量的差异,这一点很重要,因为您知道 InfiniBand 网络不会显着增加 PCIe 应用程序加速器等设备的延迟。
与峰值延迟类似,我们发现在本地条带环境或我们的 InfiniBand 网络上看到的延迟标准偏差之间没有明显差异。
在看到两个有效队列深度为 8 的同时负载的 70K 30/256 性能与本地性能相比,每个负载在网络上的性能都有小幅下降后,我们将重点转移到从 2T/2Q 到 16T/16Q 的不同工作负载上. 由于这同时发生在两台服务器或两个本地工作负载生成器上,因此总负载将从 4T/2Q 到 32T/16Q。 对条带化 P320h 阵列的本地和网络访问都对不断增加的负载提供了相同的响应。 两项测试在整个频谱范围内显示出几乎相同的模式,本地访问提供了最佳性能。
在条带化 P8h 配置上,我们 70K 30/320 工作负载主要部分的平均延迟在本地和我们的网络上提供了出色的性能。 最令人印象深刻的是 InfiniBand 结果,其中每台服务器的延迟都低于 0.8 毫秒,网络上的 IOPS 超过 400,000。
将 8K 70/30 工作负载中的最大延迟与我们的双 P320h 设置进行比较显示了本地与远程的相似结果,在测试期间两者都有超过 1,000 毫秒的信号。
与上面的最大延迟结果类似,本地访问 P320h 阵列与通过我们的 InfiniBand 网络通过 Windows 存储空间共享它之间的差异很小。
总结
Micron RealSSD P320h 只是执行良好工程的一个很好的例子。 从电路板设计和布局到定制控制器的一切都使 P320h 成为真正的集成单元,即使在企业存储空间中也并非总是如此。 美光找到了在整个驱动器中增加价值的方法,从定制 ASIC 中的 NAND 管理 IP 到尽可能深入的 NAND 特性,从而实现 SLC 闪存组件的最大性能和耐用性。
当我们评估 P320h 的性能时,驱动器发出尖叫声,在我们的 CentOS 和 Windows Server 测试环境之间保持接近对等。 就其更好的环境而言,Linux 始终具有优势,尤其是在最佳延迟方面。 说美光 P320h 速度快有点轻描淡写。 它大大超越了我们迄今为止测试过的任何其他解决方案,其突发速度高于大多数解决方案,稳态性能也远高于竞争解决方案。 深入研究其响应能力,平均延迟无可挑剔,但更令人印象深刻的是其全新的完美 Linux 性能,具有非常低的峰值延迟和延迟标准偏差。 Windows 方面相距不远,尽管相比之下其峰值延迟和延迟标准差处于中间位置。
在兼容性方面,我们发现美光 RealSSD P320h 可以在企业环境中完美运行。 对我们来说,在消费者平台上测试这个顶级企业产品是没有意义的,因为它永远不会被带入在其中运行的生产环境中。 为此,在我们对其进行测试的一级服务器中,它可以在多个操作系统上正常运行。 P320h 在我们运行 Windows Server 7047 的 Supermicro SuperServer 2012R 的双驱动器配置中也没有遇到任何问题,如我们的视频所示。
如果我们要抱怨很多,那就是 Windows 环境留下了一些需要改进的小区域,尤其是当我们比较所有工作负载的峰值延迟和标准偏差时。 即使有更高的延迟,它仍然超过许多(如果不是全部)我们测试过的 PCIe 应用程序加速器,但我们认为仍然有一些性能有待更完善的驱动程序挤出。 另一个引起轻微抱怨的领域是仅提供两种功能的 SLC 产品。 竞争对手提供 MLC 或 eMLC 驱动器,这允许较低的成本切入点以及更大的容量; 在某些情况下,一张卡上的容量超过 2TB。 诚然,阅读量大的入门级企业市场并不是 P320h 的目标,但满足更多需求的更多品种可以使 P320h 系列更加通用。
优点
- 我们迄今为止测试过的最快的 PCIe 应用程序加速器
- 极低的平均和峰值延迟
- Windows 和 Linux 环境中的出色性能对等
缺点
- 限于SLC NAND
- 最高 700GB
底线
Micron RealSSD P320h 是一款执行良好的完整产品,适用于希望获得 PCIe 存储最佳性能的企业。 P320h 是同类产品中的佼佼者,由于控制器中集成了美光组件和卓越的 NAND 管理知识产权,因此可实现出色且一致的多操作系统性能。
讨论这篇评论