存储评论网

美光 7600 MAX 评测:专为现代应用打造的混合用途 3 DWPD SSD

企业版  ◇  SSD

美光 7600 MAX 是公司面向主流数据中心部署的最新 PCIe Gen5 NVMe SSD,旨在为人工智能、云和混合用途工作负载提供卓越的服务质量和持续的响应能力。7600 系列提供 U.2、E1.S 和 E3.S 三种规格,涵盖 PRO(读取密集型,每日全盘写入次数 1 次)和 MAX(混合用途,每日全盘写入次数 3 次)两种耐用性等级。本次评测我们收到的是 6.4TB 的 7600 MAX E3.S 型号。

美光 7600 MAX E3.S 和 U.2 SSD 正面。

7600 MAX 基于美光第九代 TLC NAND 打造,是全球首款采用该先进闪存技术的主流数据中心 SSD。结合美光自主研发的垂直集成控制器和固件堆栈,该 SSD 在持续负载下可提供一流的一致性和低延迟,尤其是在 70/30 混合负载和 RocksDB 工作负载下,美光表示其延迟一致性比竞品第五代数据中心 SSD 提升高达 76%。

理论上,6.4TB MAX 型号可实现 12 GB/s 的顺序读取速度、7 GB/s 的顺序写入速度、高达 2.1 万 IOPS 的随机读取速度和 675K IOPS 的随机写入速度,且功耗均在 ≤ 14 W RMS 的范围内。这些性能特性使其非常适合 AI 数据管道、数据库后端、虚拟化节点以及实时分析应用,在这些应用中,可预测的延迟和持续的吞吐量比峰值突发数据更重要。

安全性和标准合规性也是重中之重。该硬盘支持 SPDM 1.2 认证、硬件信任根以及可选的 FIPS 140-3 2 级 SED 加密,同时符合 OCP 2.5 规范,以实现开放数据中心的互操作性。

本次评测中,我们收到了美光 7600 MAX 6.4TB 硬盘。我们将比较同类 Gen5 硬盘,并在企业级测试条件下评估其性能,重点关注效率和工作负载一致性。

美光 7600 MAX 规格

下表概述了 Micron 7600 MAX 的支持规格,这是一款混合用途 PCIe Gen5 NVMe SSD,额定每天最多可进行 3 次驱动器写入 (DWPD)。

美光 7600 MAX 规格(U.2 / E3.S / E1.S)
用例 混合用途(每天 3 次驱动器写入)
接口/协议 PCIe Gen5 x4,NVMe v2.0d
NAND闪存 Micron G9 TLC NAND
可靠性 MTTF:2.0万小时 @ 0–55 °C;2.5万小时 @ 0–50 °C | UBER < 1 个扇区/1017 读取位数 | 5 年保修
功率(平均 RMS) ≤ 14 W 顺序读取;≤ 14 W 顺序写入
工作温度 0–70 °C(如果 SMART 温度 > 77 °C,则节流)
容量和性能(7600 MAX)
容量 顺序。 读取(MB/秒) 顺序。 写入(MB/秒) 随机读取(K IOPS) 随机写入(K IOPS) 70/30 读/写(千 IOPS)
1.6 TB 12,000 3,300 1,800 260 450
3.2 TB 12,000 6,500 2,100 560 700
6.4 TB 12,000 7,000 2,100 675 1,000
12.8 TB 12,000 7,000 2,100 675 1,100
典型延迟(µs)
阅读 75
填写 15
耐久度(写入的总字节数,TB)
容量 RND TBW 序列号 笔记
1.6 TB 8,700 18,000 最大(每日 3 次 DWPD)
3.2 TB 17,500 37,200 最大(每日 3 次 DWPD)
6.4 TB 35,000 74,200 最大(每日 3 次 DWPD)
12.8 TB 70,000 143,100 最大(每日 3 次 DWPD)

Micron 7600 Max 6.4TB 设计和构建

美光 7600 MAX 专为注重可靠性、效率和高负载下可预测散热性能的企业环境打造。U.2 版本采用坚固的铝制外壳,顶部带有散热片,可在持续运行 PCIe Gen5 工作负载时辅助被动散热。其半哑光黑色表面赋予硬盘专业的外观,同时有助于在长时间运行期间均匀分布表面热量。E3.S 型号采用更纤薄的坚固外壳设计,注重紧凑性和高效的热传导,适用于高密度服务器环境。

美光 7600 MAX E3.S 底部。

7600 MAX 提供单硬盘 1.6TB 至 12.8TB 的容量范围,可满足从小型缓存层到高密度混合用途存储池的各种部署需求。在连续读写工作负载下,平均功耗高达 14W,在提供顶级性能的同时,保持高效率。

可靠性评级包括:0–55°C 下平均故障时间 (MTTF) 为 2.0 万小时,0–50°C 下为 2.5 万小时,不可纠正误码率 (UBER) 低于每 10¹⁷ 位读取一个扇区。该硬盘的工作温度范围为 0°C 至 70°C,如果内部 SMART 温度超过 77°C,则会启动性能调节。

Micron 7600 MAX E3.S 连接器侧。

美光科技为 7600 MAX 提供 5 年质保,彰显其耐用性,并可满足数据中心全天候不间断工作负载的需求。其内部采用美光科技第九代 TLC NAND,搭配美光自主设计的 DRAM 和控制器,实现全集成设计。U.2 规格与现有的 Gen4 和 Gen5 背板广泛兼容,而 E1.S 和 E3.S 版本则扩展了更高密度机架配置的部署选项。

美光 7600 最大性能

为了评估美光 7600 MAX 6.4TB,我们采用了标准的企业级 SSD 基准测试方法对其进行了测试,该方法旨在衡量实际数据中心工作负载下的持续性能、延迟一致性和效率。我们的测试方法注重在一系列综合和应用级基准测试中获得可重复的稳定结果,以便与同级别的其他第五代 NVMe SSD 进行公平的比较。

路测平台

我们使用运行 Ubuntu 22.04.02 LTS 的 Dell PowerEdge R760 作为本次评测所有工作负载的测试平台。配备了 串行电缆 Gen5 JBOF它与 U.2、E1.S、E3.S 和 M.2 SSD 广泛兼容。我们的测试系统配置概述如下:

  • 2 个英特尔至强金牌 6430(32 核,2.1GHz)
  • 16个64GB DDR5-4400
  • 480GB 戴尔 BOSS 固态硬盘
  • 串行电缆 Gen5 JBOF
驱动器比较

DLIO 检查点基准

为了评估 SSD 在 AI 训练环境中的实际性能,我们使用了数据和学习输入/输出 (DLIO) 基准测试工具。DLIO 由阿贡国家实验室开发,专门用于测试深度学习工作负载中的 I/O 模式。它能够深入了解存储系统如何应对检查点设置、数据提取和模型训练等挑战。下图展示了两款硬盘如何在 36 个检查点之间处理整个过程。在训练机器学习模型时,检查点对于定期保存模型状态至关重要,可防止在中断或断电期间丢失进度。这种存储需求需要强大的性能,尤其是在持续或密集的工作负载下。我们使用了 2024 年 8 月 13 日发布的 DLIO 基准测试 2.0 版。

为了确保基准测试能够反映真实场景,我们基于 LLAMA 3.1 405B 模型架构进行测试。我们使用 torch.save() 实现检查点,以捕获模型参数、优化器状态和层状态。我们的设置模拟了一个八 GPU 系统,并实施了一种混合并行策略,将四路张量并行和双向流水线并行处理分布在八个 GPU 上。此配置产生的检查点大小为 1,636GB,反映了训练现代大型语言模型的需求。

在本次基准测试中,美光 9550 MAX 12.8TB 脱颖而出,成为当之无愧的领导者。在完整的 18 个检查点运行过程中,它保持了最低的平均完成时间,范围从 457 秒到 575 秒。该硬盘表现出色,检查点之间的差异极小,这表明其固件设计均衡,并针对混合读/写工作负载进行了优化。

紧随其后的是美光 7600 MAX 6.4TB,其运行时间在 459 秒至 586 秒之间。虽然其平均速度仍然具有竞争力,但在测试点 4 和 7 之间出现了短暂的性能波动,直到测试结束时才趋于稳定。尽管如此,它仍然稳居顶级水平,在持续运行 AI 和 HPC 工作负载时表现出卓越的效率。

美光 9550 7.68TB 的表现略逊于两款旗舰型号,成绩范围从 458 秒到 582 秒。它保持了稳定的扩展性,并与高端 MAX 硬盘保持竞争力,进一步巩固了美光 9550 平台的领先优势。

在测试的其他企业级 SSD 中,Solidigm PS1010、SanDisk SN861 和 Kingston DC3000ME 占据了中等水平,大多数检查点的完成时间都在 450 秒到 610 秒之间。Pascari X200P 的性能稳定性最差,在运行中期达到了 690 多秒,直到接近尾声才稳定下来。

在本次平均测试中,Solidigm PS1010 7.68TB 以最快的平均完成时间领跑各组,三次测试的平均完成时间范围从 458 秒到 564 秒不等。该硬盘表现出了极佳的一致性,在运行之间保持了较低的差异,并在混合 I/O 工作负载下展现了强大的效率。

SanDisk SN861 7.68TB 紧随其后,其平均成绩几乎相同,介于 461 秒到 553 秒之间,证实了其能够以最小的退化提供可靠的检查点性能。

紧随其后的是美光 9550 7.68TB,在相同测试中,成绩在 461 秒到 559 秒之间。其性能依然非常有竞争力,略微落后于领先者,但在所有迭代中都保持了稳定的扩展性和稳定的吞吐量。

美光 9550 MAX 12.8TB 和美光 7600 MAX 6.4TB 位列第五,平均得分略高,为 462–555 秒和 464–567 秒。两者在一段时间内都保持了一致的表现,但落后于容量较小的美光科技和两款领先的硬盘 固晶 和 SanDisk。

在该系列的其他产品中,金士顿 DC3000ME 和 帕斯卡里 X200P 的总体耗时最长,平均分别为 580 秒和 660 秒。这些结果反映出在持续检查点条件下,性能差距更大,尤其是在需要频繁写入持久存储的工作负载下。

FIO性能基准

为了衡量每款 SSD 在常见行业指标上的存储性能,我们利用了 FIO。每块硬盘都经过相同的测试流程,其中包括一个预处理步骤,即使用顺序写入工作负载进行两次全盘填充,然后进行稳态性能测量。随着被测工作负载类型的变化,我们会再次运行一次基于新传输大小的预处理填充。

在本节中,我们重点关注以下 FIO 基准:

  • 128K 连续
  • 64K随机
  • 16K随机
  • 16k 连续
  • 4K随机

128K 顺序写入(IODepth 16/NumJobs 1)

进入128K顺序写入测试,结果与我们在预处理过程中观察到的结果几乎相同。美光9550 Max(12.8TB)再次遥遥领先,保持10,957.9MB/s的速度,稳居榜首。金士顿DC3000ME(7.68TB)以8,477.4MB/s的速度紧随其后,Pascari X200P(7.68TB)则以8,369.7MB/s的速度紧随其后。

紧随其后的是 Solidigm PS1010(7,126.5MB/s)和 SanDisk DC SN861(7,116.5MB/s),而 Micron 7600 Max(6.4TB)以 6,960.6MB/s 的速度位居榜末。

128K 顺序写入延迟 (IODepth 16 / NumJobs 1)

谈到延迟,128K 顺序写入测试在 IODepth 为 16 的情况下运行,并执行单个作业,而预处理时队列深度更大,为 256。正如预期的那样,所有硬盘的延迟均显著下降。美光 9550 Max (12.8TB) 再次以 0.18 毫秒的最低延迟领先,展现了其以最小延迟维持最高吞吐量的能力。

金士顿 DC3000ME(7.68TB)紧随其后,为 0.24ms;Pascari X200P(7.68TB)紧随其后,为 0.24ms。与此同时,Solidigm PS1010(0.28ms)和 SanDisk DC SN861(0.28ms)的结果也相近,而美光 7600 Max(6.4TB)则以 0.29ms 的成绩垫底。

128K 顺序读取(IODepth 64 / NumJobs 1)

转到读取测试,128K 顺序读取测试中,各竞品 SSD 的成绩更加接近。Pascari X200P(7.68TB)以 14,242.1MB/s 的读取速度夺得桂冠,略高于 Solidigm PS1010(7.68TB)的 14,163.3MB/s,而 Micron 9550 Max(12.8TB)则以 14,047.5MB/s 的读取速度紧随其后。这三款 SSD 的持续顺序读取吞吐量在实际应用中差距很小。

金士顿 DC3000ME(7.68TB)以 13,513.8MB/s 的速度略微落后于前三名,而闪迪 DC SN861(7.68TB)的速度为 12,631.2MB/s。美光 7600 Max(6.4TB)的速度较低,为 11,240.5MB/s,是该组中唯一一款低于 12GB/s 门槛的硬盘。

128K 顺序读取延迟(IODepth 64 / NumJobs 1)

延迟方面,128K 顺序读取测试 (IODepth 64 / NumJobs 1) 凸显了顶级产品之间的激烈竞争。Pascari X200P (7.68TB) 以 0.56ms 领先,Solidigm PS1010 (0.56ms) 和美光 9550 Max (12.8TB) 的延迟均为 0.57ms,两者几乎旗鼓相当。这三款硬盘的性能实际上旗鼓相当,这与我们在吞吐量方面看到的差距不大相符。

紧随其后的是金士顿 DC3000ME(7.68TB),时间为 0.59ms;闪迪 DC SN861(7.68TB)则为 0.63ms;美光 7600 Max(6.4TB)则以 0.71ms 的成绩垫底,这与其较低的顺序读取带宽一致。

64K 随机写入

在 64K 随机写入测试中,美光 7600 MAX (6.4TB) 表现出色且稳定,速度范围从 2.39GB/s 到 6.8GB/s,平均吞吐量为 5.16GB/s。这使其稳居高端硬盘之列,在整个测试过程中保持了卓越的稳定性,并在更高的队列深度下保持了可靠的扩展能力。

美光 9550 MAX(12.8TB)总体上依然保持领先,性能范围更广,从 2.45GB/s 到峰值 10.6GB/s,平均速度为 7.34GB/s。它是唯一一款持续突破 10GB/s 大关的硬盘,展现了其高端配置和固件调优的优势。

在其他同类产品中,金士顿 DC3000ME (7.68TB) 和闪迪 DC SN861 (7.68TB) 在 4 至 6GB/s 范围内表现稳定,尽管未能达到美光的更高性能,但仍保持竞争力。Solidigm PS1010 (7.68TB) 和 Pascari X200P (7.68TB) 紧随其后,通常集中在 2-4 GB/s 范围内,远远落后于这两款美光硬盘。

64K随机写入延迟

在延迟方面,美光 7600 MAX (6.4TB) 在压力下保持了稳定的控制,平均延迟为 0.41 毫秒,在队列深度较大时峰值达到 2.3 毫秒。其延迟曲线在整个扫描过程中展现了一致的响应能力,使其成为持续写入条件下效率更高的硬盘之一。

Micron 9550 MAX(12.8TB)仍然是一致性的基准,平均仅为 0.30 毫秒,峰值低于 1.71 毫秒,即使在最大负载下也表现出卓越的延迟管理。

金士顿 DC3000ME 和闪迪 DC SN861 的延迟处于中等水平,延迟通常在 0.05 毫秒到 2.7 毫秒之间,虽然提供了不错的平衡性,但比不上美光的精度。与此同时,Pascari X200P 和 Solidigm PS1010 的波动最为明显,在更高的队列深度下分别达到 4.1 毫秒和 6.0 毫秒。

64K 随机读取

在 64K 随机读取测试中,美光 7600 MAX (6.4TB) 表现出色,起始速度为 0.61GB/s,峰值为 11.0GB/s,平均速度为 6.94GB/s。其读取一致性和在较高队列深度下的稳定扩展突显了其高效的架构和固件调优。

美光 9550 MAX (12.8TB) 的表现与此非常相似,其速度范围从最低的 0.49GB/s 到最高的 13.7GB/s,平均速度为 6.96GB/s。这使得这两款美光硬盘的性能都接近顶级水平,两者之间只有细微的差别。

纵观整个领域,Solidigm PS1010 和 Pascari X200P 在峰值吞吐量方面略有领先,在更高的队列深度下达到了 13-14GB/s。金士顿 DC3000ME 紧随其后,速度为 12 至 13GB/s,而 SanDisk DC SN861 则略低,稳定在 12.3GB/s 左右。

64K随机读取延迟

在 64K 随机读取测试中,美光 7600 MAX(6.4TB)表现出了强劲的延迟特性,平均延迟为 0.26 毫秒,在高负载下最低降至 0.10 毫秒,峰值达到 1.42 毫秒。其结果在整个测试过程中表现出极佳的一致性,即使队列深度增加也能保持稳定的响应速度。

美光 9550 MAX(12.8TB)的表现几乎相同,平均延迟为 0.25 毫秒,最低延迟为 0.12 毫秒,最高延迟为 1.14 毫秒。两款美光硬盘均表现出紧凑且可预测的延迟行为,保持紧密的分组,并在整个扫描过程中保持平稳运行。

从图表来看,Solidigm PS1010 和 Pascari X200P 的突发延迟略高,通常在 0.1 到 1.2 毫秒之间。与此同时,金士顿 DC3000ME 和闪迪 DC SN861 的延迟范围也与之相似,峰值略高于 1.2 毫秒。总体而言,美光硬盘仍然是该领域最稳定、最具竞争力的产品之一,与其他顶级产品之间只有细微的差别。

16K 顺序写入

在 16K 顺序写入测试中,美光 7600 MAX(6.4TB)表现稳定,吞吐量范围从 0.84GB/s 到 6.8GB/s,平均速度为 5.63GB/s。测试结果显示,其写入行为一致,在中高队列深度下保持稳定。

美光 9550 MAX(12.8TB)在该类别中占据主导地位,传输速度在 0.85GB/s 至 10.7GB/s 之间,平均吞吐量为 7.75GB/s。它脱颖而出,成为唯一一款在峰值运行期间能够维持每秒两位数 GB 传输速度的硬盘,成为当之无愧的领导者。

从更广泛的图表来看,金士顿 DC3000ME 和 Pascari X200P 在较高队列深度下的速度集中在 6 到 8GB/s 范围内,总体上具有竞争力,但落后于 9550 MAX。Solidigm PS1010 的速度略低,为 5 到 6GB/s,而 SanDisk DC SN861 的整体表现最差,经常跌破 4GB/s,最低甚至接近 1GB/s。

16K 顺序写入延迟

在 16K 顺序写入延迟测试中,美光 7600 MAX(6.4TB)展现出强大的响应能力,平均延迟为 0.18 毫秒,最低延迟为 0.018 毫秒,在高负载下峰值延迟为 1.15 毫秒。其延迟曲线在整个测试过程中保持稳定,在所有队列深度上均表现出可靠的写入控制。

Micron 9550 MAX(12.8TB)整体响应速度最佳,平均为 0.12ms,最低为 0.018ms,在负载下峰值为 0.75ms,使其成为此类别中性能最稳定的产品。

从更广泛的图表来看,金士顿 DC3000ME 和 Pascari X200P 处于中间位置,通常在 0.05 到 1.2 毫秒之间,而 Solidigm PS1010 的延迟更高,在较高队列深度下超过 1.5 毫秒。SanDisk DC SN861 的延迟最高,在压力下超过 2.0 毫秒。

16K 顺序读取

在 16K 顺序读取测试中,美光 7600 MAX(6.4TB)表现出色,起始速度为 1.03GB/s,峰值为 11.0GB/s,平均速度为 6.08GB/s。其强大的中端扩展能力使其在整体平衡性和持续性能方面略胜 9550 MAX。

美光 9550 MAX(12.8TB)紧随其后,起始速度为 1.02GB/s,峰值达到 12.5GB/s,平均速度为 5.59GB/s。虽然它的绝对吞吐量更高,但其性能曲线在队列深度上的波动比 7600 MAX 更稳定的结果更大。

从更广泛的图表来看,金士顿 DC3000ME 在更高的队列深度下领先,速度一度突破 12.8GB/s,而 Pascari X200P 和 Solidigm PS1010 均达到了 12GB/s 的范围。SanDisk DC SN861 略微落后,在扫描的上限略低于 10GB/s。

16K 顺序读取延迟

在 16K 顺序读取延迟测试中,美光 7600 MAX(6.4TB)表现出略微更严格的延迟控制,起始延迟为 0.014 毫秒,峰值为 0.71 毫秒,平均延迟为 0.13 毫秒。这使其在读取响应速度方面略有优势,并在整个工作负载过程中保持了平滑一致的延迟。

美光 9550 MAX(12.8TB)紧随其后,其结果从最低的 0.015 毫秒到最高的 0.78 毫秒不等,总体平均值为 0.15 毫秒。虽然略高,但其性能仍然位居同类产品之首,在持续的顺序读取操作下表现出色。

从更广泛的图表来看,金士顿 DC3000ME 和 Pascari X200P 表现出类似的中端模式,平均值在 0.1 到 0.2 毫秒之间,峰值略高于 0.8 毫秒。Solidigm PS1010 的变化幅度更大,峰值接近 0.75 毫秒,而 SanDisk DC SN861 与金士顿的差距较小,但随着队列深度的增加,波动性也更大。

16K 随机写入

在 16K 随机读取测试中,美光 7600 MAX (6.4TB) 在整个测试过程中表现出色,最低 17K IOPS,平均 350K IOPS 左右,在较高队列深度下峰值接近 720K IOPS。其稳定性使其成为性能更可预测的硬盘之一,即使未能登顶榜首,也能在整个测试过程中保持平稳的扩展。

美光 9550 MAX(12.8TB)实现了更高的整体吞吐量,最低可达 18K IOPS,最高可达 900K IOPS 以上,平均约为 420K IOPS。它在原始性能方面领先于美光两款产品,但扩展性能差异略大于 7600 MAX。

从整体来看,Pascari X200P 和 Solidigm PS1010 均表现强劲,Pascari 的最高性能几乎与 9550 MAX 匹敌,略低于 900K IOPS,而 Solidigm 的性能则保持在 820K 到 850K IOPS 之间。金士顿 DC3000ME 最初领先,但稳定在 620K IOPS 左右,而 SanDisk DC SN861 则落后,最高性能略高于 500K IOPS。

16K随机写入延迟

在 16K 随机写入延迟测试中,美光 7600 MAX(6.4TB)保持了极具竞争力且稳定的性能,从低端的 0.016 毫秒到峰值的 1.26 毫秒不等,平均延迟为 0.21 毫秒。即使其效率不如更高容量的同类产品,但在压力下,其响应速度依然强劲,在不同队列深度下仍能保持稳定的控制。

Micron 9550 MAX(12.8TB)整体表现出卓越的延迟性能,保持在 0.015ms 和 0.77ms 之间,平均为 0.13ms,巩固了其作为持续写入负载下最高效驱动器的地位。

从更广泛的图表来看,金士顿 DC3000ME 和 Pascari X200P 处于中间水平,通常运行在 0.2-1.5 毫秒范围内。SanDisk DC SN861 在高队列深度下表现出更频繁的延迟峰值,超过 1.8 毫秒,而 Solidigm PS1010 则表现出最严重的稳定性问题,最差时甚至超过 3 毫秒。

16K 随机读取

在 16K 随机读取测试中,美光 7600 MAX (6.4TB) 在整个运行过程中表现出了极高的一致性,从 17.1K IOPS 开始,最高可达 720K IOPS,平均速度为 362K IOPS。其性能曲线保持平滑且可预测,即使未能达到图表的最高点,也反映出其在较低和中等队列深度下的出色控制。

美光 9550 MAX(12.8TB)实现了更高的峰值吞吐量,范围从低端的 16.7K IOPS 到高端的 904K IOPS,平均为 433K IOPS。它在原始扩展能力方面领先,但 7600 MAX 在整个测试窗口内提供了更严格的一致性。

在竞争对手中,Pascari X200P 的表现几乎与 9550 MAX 旗鼓相当,峰值达到了 900 万 IOPS。Solidigm PS1010 紧随其后,IOPS 峰值在 820 万到 850 万之间,而金士顿 DC3000ME 的最高IOPS 约为 620 万 IOPS。SanDisk DC SN861 的表现略高于 500 万 IOPS,但在更高的队列深度下扩展性能有限。

16K随机读取延迟

在 16K 随机读取延迟测试中,美光 7600 MAX(6.4TB)保持了灵敏且稳定的延迟曲线,起始延迟为 0.065 毫秒,峰值为 0.71 毫秒,平均延迟为 0.14 毫秒。在整个测试过程中,其性能始终保持流畅且可预测,即使队列深度增加,也能提供出色的响应能力。

美光 9550 MAX(12.8TB)紧随其后,延迟范围从低端的 0.073 毫秒到高端的 0.57 毫秒,平均延迟为 0.12 毫秒。虽然容量更大的硬盘在队列深度较高时曲线略微收紧,但两款美光型号都展现出了顶级的一致性和控制力。

在其他同类产品中,Pascari X200P 和金士顿 DC3000ME 在中等范围内表现不俗,在大部分测试中,延迟时间在 0.1 到 0.3 毫秒之间,峰值负载时会攀升至 0.8 毫秒。SanDisk DC SN861 和 Solidigm PS1010 的延迟变化较大,尤其是 Solidigm,延迟峰值在 0.6 到 0.65 毫秒左右,在效率和一致性方面落后于美光和 Pascari 等领先厂商。

4K 随机写入

在 4K 随机写入测试中,美光 7600 MAX (6.4TB) 表现出色,IOPS 范围从 320K 到 1.78M,并展现出同类产品中最强劲的扩展性能。它在中等速度范围内加速迅速,并在较高队列深度下保持稳固控制,使其成为该工作负载下性能最均衡的处理器之一。其平稳的进程和跨线程组合的最小波动,突显了其在持续写入压力下的企业级效率。

美光 9550 MAX(12.8TB)紧随其后,成绩在 320 万至 1.56 万 IOPS 之间。虽然它没有达到 7600 MAX 那样的峰值,但它在整个扫描过程中表现出色,尤其是在更高的队列深度下,并且在混合线程环境中保持了一流的一致性。

在竞品中,SanDisk DC SN861 和 Kingston DC3000ME 表现良好,但落后于美光硬盘,峰值分别约为 1.3 万 IOPS 和 960 万 IOPS。Pascari X200P 表现出中等的一致性,峰值约为 1.6 万 IOPS,而 Solidigm PS1010 则难以保持稳定性,在大多数高深度场景中,IOPS 会急剧下降至 550 万 IOPS 以上。

4K随机写入延迟

在 4K 随机写入延迟测试中,美光 7600 MAX(6.4TB)的响应时间极短,最低仅为 0.012 毫秒,峰值为 0.29 毫秒,平均响应时间为 0.05 毫秒。在整个运行过程中,其延迟始终保持较低水平,在高负载下表现出色,即使在更高的队列深度下也能保持流畅的性能。

美光 9550 MAX(12.8TB)的表现几乎相同,延迟范围从最低的 0.013 毫秒到最高 0.37 毫秒,平均延迟为 0.06 毫秒。虽然容量更大的 9550 MAX 在最高延迟时稳定性略高,但两款美光型号在整个测试中都保持了出色的控制力和响应能力。

从更广泛的图表来看,金士顿 DC3000ME 和 Pascari X200P 表现出更大的波动性,通常在 0.1-0.5 毫秒范围内运行,在最大负载下峰值略高于 0.5 毫秒。SanDisk DC SN861 也表现出类似的中期波动,而 Solidigm PS1010 表现最为糟糕,峰值超过 0.7 毫秒,整体响应速度落后于同类产品。

4K 随机读取

在 4K 随机读取测试中,美光 7600 MAX (6.4TB) 展现了卓越的扩展性和一致性,峰值略高于 2.0 万 IOPS,平均速度为 1.4 万 IOPS。其性能曲线在不同的队列深度和线程数下保持平滑,展现出强大的负载控制能力,并在持续的随机工作负载下保持卓越的效率。

美光 9550 MAX (12.8TB) 紧随其后,峰值略高,达到 2.2 万 IOPS,整体平均值约为 1.3 万 IOPS。两款美光硬盘均保持着强劲的竞争力,根据队列深度和测试阶段频繁交替排名,展现出顶级的响应能力和可扩展性。

从更广泛的图表来看,SanDisk DC SN861 的性能一度飙升至 2.5M IOPS 以上,但在负载下表现出明显的波动性和性能下降。Pascari X200P 和金士顿 DC3000ME 的峰值均在 2.0M IOPS 左右,吞吐量强劲,但稳定性不如美光的硬盘。Solidigm PS1010 在中端表现良好,但较早进入稳定期,在扫描结束时达到了 2.1M IOPS 左右的最高点。

4K随机读取延迟

在 4K 随机写入延迟测试中,美光 7600 MAX (6.4TB) 在整个测试过程中保持了出色的响应速度,在扫描初期平均延迟为 0.03-0.05 毫秒,并在峰值吞吐量时逐渐上升至略低于 0.30 毫秒。虽然其差异略大于其更大的同类产品,但它仍然提供了极具竞争力的延迟控制和在持续负载下的平稳扩展。

美光 9550 MAX (12.8TB) 的整体响应时间最低且最稳定,在负载较轻的阶段平均响应时间为 0.03-0.05 毫秒,满载时仅略微增加至 0.35-0.38 毫秒。在队列深度较高的情况下,其可预测的行为进一步巩固了其在测试中作为顶级产品之一的效率。

相比之下,SanDisk DC SN861 和 Pascari X200P 在吞吐量增加时经历了更明显的延迟峰值,SanDisk 的峰值超过 0.40 毫秒,而 Pascari 的峰值达到 0.50 毫秒。金士顿 DC3000ME 紧随其后,峰值略高于 0.50 毫秒,但在较轻的工作负载下表现更稳定。Solidigm PS1010 在压力下表现最为挣扎,早期爬升至 0.10 毫秒以上,峰值接近 0.73 毫秒,表明在高队列深度随机写入操作期间存在不稳定性。

GPU 直接存储

我们在这个测试平台上进行的测试之一是 Magnum IO GPU 直接存储 (GDS) 测试。GDS 是 NVIDIA 开发的一项功能,允许 GPU 在访问存储在 NVMe 驱动器或其他高速存储设备上的数据时绕过 CPU。GDS 无需通过 CPU 和系统内存路由数据,而是实现 GPU 和存储设备之间的直接通信,从而显著降低延迟并提高数据吞吐量。

GPU 直接存储的工作原理

传统上,当 GPU 处理存储在 NVMe 驱动器上的数据时,数据必须先经过 CPU 和系统内存,才能到达 GPU。由于 CPU 充当了中间环节,这一过程会造成瓶颈,增加延迟并消耗宝贵的系统资源。GPU 直接存储技术使 GPU 能够通过 PCIe 总线直接从存储设备访问数据,从而消除了这种低效率。这种直接路径减少了数据移动开销,从而实现了更快、更高效的数据传输。

AI 工作负载(尤其是涉及深度学习的工作负载)是高度数据密集型的。训练大型神经网络需要处理数 TB 的数据,数据传输的任何延迟都可能导致 GPU 利用率不足和训练时间延长。GPU Direct Storage 通过确保尽快将数据传送到 GPU、最大限度地减少空闲时间并最大限度地提高计算效率来解决这一挑战。

此外,GDS 对于涉及流式传输大型数据集的工作负载(例如视频处理、自然语言处理或实时推理)尤其有益。通过减少对 CPU 的依赖,GDS 可加速数据移动并释放 CPU 资源以用于其他任务,从而进一步提高整体系统性能。

GDSIO 顺序读取

在我们的 GDSIO 顺序读取测试中,从 16K 的小块传输开始,美光 7600 MAX (6.4TB) 在低队列深度下起始速度约为 0.5 GiB/s,并稳步扩展到 QD128 时的约 1.9 GiB/s。迁移到 128K 块大小后,速度显著提升,起始速度为 2.2 GiB/s,并在 QD64 到 QD128 时达到峰值,接近 5.0 GiB/s。在 1M 块测试中,7600 MAX 继续保持稳定的扩展速度,从浅队列的 2.0 GiB/s 开始,在 QD128 时达到约 5.6 GiB/s。在所有块大小下,它都表现出出色的平衡性和可预测的吞吐量行为,体现了高效的队列管理和强劲的持续性能。

美光 9550 MAX (12.8TB) 的运行轨迹几乎相同,但整体峰值吞吐量略高。其 16K 测试从约 0.5 GiB/s 开始,上升至 1.9 GiB/s;而 128K 块测试结果则从队列深度 1 时的 1.4 GiB/s 攀升至更高队列深度时的约 5.3 GiB/s。在 1M 块范围内,其性能表现最为强劲,从低端的 2.0 GiB/s 扩展到队列深度 128 时的 6.1 GiB/s。两款硬盘在所有工作负载下均展现出稳定的扩展性和效率,其中 9550 MAX 在更高队列深度和更大块传输量下略有性能优势。

在其余测试的企业级固态硬盘中,包括 Pascari X200P、金士顿 DC3000ME、Solidigm PS1010 和闪迪 DC SN861,吞吐量结果范围从 5.0 GiB/s 到最高 6.1 GiB/s。不同型号之间的吞吐量范围仍然很小,突显了现代企业级固态硬盘如何高效地处理 GPU 直接工作负载。在这一类别中,美光固态硬盘始终位居前列,与最接近的竞争对手之间仅存在细微的差距。

GDSIO 顺序读取延迟

在顺序读取延迟测试中,美光 7600 MAX (6.4TB) 在所有块大小和队列深度下均表现出紧密一致的响应时间。在较小的块大小下,它的启动速度略快于其较大的同类产品,在 QD1 下 16K 传输的测量值为 27µs,在 QD128 下上升至约 1.0ms。对于 128K 块,延迟范围为 54µs 至 3.1ms,而 1M 工作负载在浅队列下起始延迟为 391µs,在 QD128 下达到约 22.3ms。结果显示了平滑的扩展和稳定的控制,突显了该硬盘在不同工作负载下的响应能力。

美光 9550 MAX (12.8TB) 的延迟模式几乎相同,在 QD1 下,16K 传输的延迟从 31µs 开始,到 QD128 时增加到约 1.0ms。在 128K 块的情况下,延迟范围从 86µs 到 3.0ms;对于 1M 工作负载,延迟从低端的 482µs 上升到更高队列深度下的 20.6ms。随着工作负载强度的增加,两款美光硬盘都表现出可预测且管理良好的延迟变化。

在整个测试组中,所有硬盘在中小型块大小下的性能表现均较为接近,但在 1M 工作负载下,随着队列深度的增加,性能表现则大幅提升。美光 7600 MAX 和 9550 MAX 在整个测试过程中保持着紧密的分组,与 Pascari X200P、金士顿 DC3000ME 和 Solidigm PS1010 等同类产品相比,其延迟扩展性能出色,且变化幅度较小。

GDSIO 顺序写入

在 GDSIO 顺序写入测试中,美光 7600 MAX (6.4TB) 在所有工作负载下均展现出持续强劲的吞吐量,与其更大容量产品一样表现出色。在 16K 块大小下,性能起始于 0.5 GiB/s 左右,到队列深度 32 时攀升至约 1.5 GiB/s,然后在最高队列深度时略有下降。迁移到 128K 块大小后,该驱动器的吞吐量从队列深度 1 时的 2.2 GiB/s 平稳扩展到队列深度 32-64 时的 5.2 GiB/s,始终保持可靠的输出。对于 1M 块大小的工作负载,吞吐量在中等队列深度范围内从 4.1 GiB/s 到 5.4 GiB/s 不等,即使在工作负载增加的情况下也表现出出色的一致性。

美光 9550 MAX (12.8TB) 的运行轨迹几乎相同,16K 传输时速度从 0.5 GiB/s 开始,峰值为 1.5 GiB/s,然后在更高的队列深度下趋于平稳。在 128K 传输时,速度从 2.3 GiB/s 攀升至约 5.3 GiB/s;而 1M 数据块测试时速度从 4.7 GiB/s 附近开始,并维持在 5.0 GiB/s 至 5.4 GiB/s 之间,然后在 QD128 时略有下降。两款硬盘的变化都很小,反映了美光针对 GPU 直接工作负载的固件优化效率。

在更广泛的数据集中,所有测试的企业级固态硬盘在峰值负载下的吞吐量均收敛在 4.0 至 5.4 GiB/s 的窄范围内。美光 7600 MAX 和 Pascari X200P 徘徊在较高水平附近。与此同时,金士顿 DC3000ME、Solidigm PS1010 和闪迪 DC SN861 等型号紧随其后,展现了这一代企业级固态硬盘的竞争力和稳定性。

GDSIO 顺序写入延迟

在顺序写入延迟测试中,美光 7600 MAX (6.4TB) 展现出稳定且可预测的响应时间,且响应时间与队列深度和块大小呈线性关系。在 16K 块的情况下,延迟在队列深度 1 时起始于 30µs,在队列深度 128 时上升至 1.5ms。对于 128K 传输,延迟范围为 54µs 至 3.0ms,而 1M 块工作负载的延迟起始于 237µs,在队列深度最大时达到约 40.7ms。7600 MAX 在所有工作负载下均保持严格控制,体现了高效的固件行为和在顺序写入压力下的可靠性能。

美光 9550 MAX (12.8TB) 的扩展曲线几乎相同,在 QD1 下,16K 块的延迟为 30µs,在 QD128 下则上升至 2.7ms。在 128K 块下,延迟从 52µs 逐渐上升至 3.2ms,而 1M 工作负载则从 QD1 下的 207µs 上升至 QD128 下的约 40ms。两款美光硬盘在整个测试范围内均表现出一致的扩展特性,波动极小。

在整个组别比较中,所有硬盘都表现出类似的行为,随着队列深度的增加,响应时间保持稳定的线性增长。美光 7600 MAX 和 9550 MAX 与 Pascari X200P 和金士顿 DC3000ME 的表现非常接近,在较小的块大小下表现出卓越的低延迟性能,并在更繁重的顺序写入条件下实现了可预测的扩展。

结语

美光 7600 MAX 6.4TB 固态硬盘彰显了美光致力于为现代数据中心提供可靠、经​​济且延迟优化的存储解决方案。作为一款主流 PCIe Gen5 混合用途固态硬盘,它结合了第九代 TLC NAND 以及自主研发的控制器和固件,可在持续的企业级工作负载下提供卓越的一致性。

在我们的测试中,7600 MAX 在模拟和实际场景中都表现出了强大的效率和可预测的扩展性。在 DLIO 检查点方面,即使在繁重的混合活动期间,它的性能也与 9550 MAX 保持接近,吞吐量稳定且方差较低。FIO 结果凸显了其在 4K 和 64K 随机操作中的优势,在这些操作中,它保持了严格的延迟控制,并在整个队列深度范围内平稳运行。它并非在所有顺序图上都领先,但它始终倾向于平衡且可重复的行为,这正是生产团队持续工作所需要的。

Micron 7600 MAX E3.S 底部。GDSIO 测试结果进一步印证了该驱动器的成熟度。吞吐量与块大小完美匹配,且在浅队列和深队列中延迟均得到良好控制。此性能表现使 7600 MAX 成为 AI 训练管道、数据库后端和虚拟化节点的可靠之选,在这些应用中,可预测的响应时间比短时突发响应更为重要。

总体而言,美光 7600 MAX 6.4TB 性能均衡,尤其注重延迟和一致性。虽然它可能无法达到峰值,但它在压力下依然保持稳定,长期高效运行,并且非常适合用于 AI 和云环境中的混合用途 Gen5 部署。

产品页

参与 StorageReview

订阅消息 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅

迪伦·多尔蒂

K-12 网络管理员,精通 Cisco 网络、IP 安全和 NAC 解决方案。UniFi 爱好者和家庭实验室人员,负责测试和审查网络和安全产品。