2021 年,Graid 推出了他们所谓的 NVMe“RAID 卡”,但它不仅如此,它还是 NVIDIA GPU 和 Graid 软件的独特融合。 从那时起我们就一直是 SupremeRAID 的忠实粉丝,它的性能简直令人惊叹,而且集成非常简单。
2021 年,Graid 推出了他们所谓的 NVMe“RAID 卡”,但它不仅如此,它还是 NVIDIA GPU 和 Graid 软件的独特融合。 从那时起我们就一直是 SupremeRAID 的忠实粉丝,其性能简直令人惊叹。
正在进行的高性能 Gen5 Graid 项目让我们思考他们的解决方案。 出于永远的好奇心,我们开始走神,思考实验室里我们最喜欢的其他一些东西。 问题是,我们没有免费的 SupremeRAID 卡可供随意使用。 永远不要让硬件缺失之类的事情阻止我们无聊的追求,我们认为我们可以做一些有趣的事情。
如果我们将令人惊叹的 Tyan AMD EPYC 服务器与 26 个大容量 Solidigm 30.72TB SSD 和一个纤薄的 NVIDIA A2 GPU 作为 Graid 卡结合起来,看看我们可以从这个极其密集的低成本平台中榨取多少性能?
唯一的问题确实是 A2 的选择。 我们选择 A2 是因为它易于安装且“即插即用”,因为它不需要电源线即可工作,并且比 Graid 的标准卡更适合该服务器。 也就是说,我们应该注意到 Graid 尚未正式支持 A2,他们的 至尊RAID SR-1010 在 A2000 上运行。 但 A2 实际上在这个特定的服务器上工作得更好,它闲置着,乞求做点什么。 Graid 很高兴地答应了,提供了我们期望能与 A2 愉快配合的部分。
什么是格纹?
回顾一下,Graid 软件旨在最大限度地发挥 NVMe 存储的潜力,而不受 RAID 配置的传统限制的阻碍。 通过利用GPU来处理RAID计算,该软件有效地释放了CPU资源,可以更好地利用这些资源来处理数据库和应用程序的实际工作负载。
这种方法不仅提高了性能,还简化了 RAID 系统的管理,因为它消除了对复杂硬件设置的需求,并允许更简化、以软件为中心的管理流程。 对于任何希望最大限度地提高数据中心性能和效率、且无需传统 RAID 卡的开销或软件 RAID 解决方案的资源消耗的企业来说,这是一个引人注目的解决方案。
回顾我们之前对 Graid SupremeRAID 的评论,我们对该技术能够提供近 50GB/s 的连续读取速度以及超过 10 万 IOPS 的 4K 随机读取能力印象深刻。 SR-1000的 (Gen3),同时达到相似的读取速度(尽管写入性能更高) SR-1010的 (第四代)。 这一RAID解决方案不仅打破了性能天花板,还重新定义了高速存储的效率。 这些数字远远领先于 SW RAID4 配置和最佳硬件 RAID 卡。
我们期望在利用 TYAN 服务器、NVIDIA A2 GPU 和 5316 个 Solidigm P2 SSD 时获得更多相同的结果,但切换到 QLC 确实带来了一些麻烦。 虽然 Solidigm 驱动器在大量读取环境中表现出色,但当工作负载转向写入时,它确实会恢复一些性能。 此外,虽然我们对 Graid 卡进行了大量测试,但我们仍处于 AXNUMX 和这些 SSD 提供的巨大容量占用的未知领域。
Grid SupremeRAID QLC 性能
正如我们所指出的,我们将利用 TYAN Transport SX TS70AB8056 作为测试平台来衡量性能。 我们在 TYAN 服务器上安装了 30.72 个 5336TB Solidigm P5 SSD,这为我们在 RAID5 配置中使用提供了巨大的空间。 我们正在测试 Graid 硬件 RAID5 和 mdadm 软件 RAIDXNUMX 的性能。
TYAN Transport SX TS70AB8056 规格:
- 1 个 AMD EPYC 9684X CPU
- 8 个 64GB 金士顿 DDR5-4800 带寄存器 ECC DRAM 模块 (KSM48R40BD4TMM-64HMR)
- 26 个 Solidigm P5336 SSD (30.72TB)
- SupremeRAID Driver: 1.5.0-659.g10e76f72.010
测试 | Graid HW RAID(4KB 条带) |
软件 RAID5 (mdadm)(4KB 块) |
1MB 顺序读取 (192T/16Q) | 95.5GB/秒,33.7 毫秒 | 33.8GB/秒,95.4 毫秒 |
1MB 顺序写入 (192T/16Q) | 12.7GB/秒,231.9 毫秒 | 1.7GB/秒,1,888 毫秒 |
64K随机写入(192T/16Q) | 1,894MB/秒,106.3 毫秒 | 2,051MB/秒,98.1 毫秒 |
4K随机写入(192T/32Q) | 255K IOPS,12.1 毫秒 | 252k IOPS,12.2 毫秒 |
4K随机读取 (192T/32Q) |
19.1 万 IOPS,0.32 毫秒 | 7.82 万 IOPS,0.79 毫秒 |
从 1MB 顺序读取带宽开始,Graid 配置具有巨大优势,与软件 RAID95.5 相比,测量速度为 33.8GB/s,而软件 RAID5 为 3GB/s,性能提升了 12.7 倍。 转向顺序写入,主要的领先优势再次是 Graid 配置。 我们测得 Graid 的速度为 1.7GB/s,而 SW RAID5 的速度为 XNUMXGB/s。
在我们的随机 64K 工作负载中,我们看到 Graid 的速度为 1,894MB/s,而 SW RAID2,051 的速度为 5MB/s。 在这里,组合的硬件解决方案并没有提供太大的差异化,显然更喜欢大块顺序工作负载。 这可能是底层 QLC 存储的一个特性。
向下移动到 4K 随机工作负载,我们看到与写入相同。 Graid 配置测量为 255K IOPS,而 SW RAID252 为 5K IOPS。 在 4K 随机读取中,情况很快就会逆转,Graid 的性能提高了一倍以上,达到 19.1 万 IOPS,而软件 RAID5 配置则达到 7.82 万 IOPS。
结论
在大多数情况下,性能结果显然有利于 Graid 硬件 RAID 配置,因为它拥有令人惊叹的顺序读写速度,大大超过了软件 RAID5。 值得注意的是,这些数字也超过了传统的硬件 RAID 卡,后者在单个 PCIe 插槽中的速度限制为 28GB/s,很容易被 4 个 SSD 饱和。
回到软件 RAID 的 H2H,Graid 的顺序读取吞吐量为 95.5GB/s,几乎是软件 RAID5 的三倍,使其成为需要快速处理大数据块的任务的理想解决方案。 此外,其12.7GB/s的顺序写入速度明显优于软件RAID1.7提供的5GB/s。
也就是说,软件 RAID5 在特定用例中表现还不错,例如随机 64K 写入操作,其性能略优于 Graid。 这表明软件 RAID5 对于某些随机访问工作负载来说可以更高效,但说实话,这更像是 SSD 的产物,而不是 Graid 软件或 GPU。
最终,即使在我们不受支持的运行中,Graid 解决方案在 Solidigm 的这些高容量、低成本 SSD 的帮助下看起来也非常强大。 随着海量数据足迹变得越来越普遍,企业将需要一种解决方案来轻松处理其数据。 虽然软件是一种选择,基于 ASIC 的硬件 RAID 是另一种选择,但如果组织希望最大限度地提高 NVMe SSD 投资的性能,我们强烈建议首先使用 Graid PoC,看看您可能会错过什么。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅