主页 电子消费品 工作站需要企业存储

工作站需要企业存储

by 布赖恩·比勒

众所周知,创意专业人士、数据科学家和其他使用数据密集型应用程序的人会在他们的工作站上进行大量投资。 并且有充分的理由,这些平台旨在快速执行任务,创造直接的商业价值。 所有这些工作都为存储带来了新问题。 要么工作站中没有足够快的闪存,要么硬件/软件的复杂性使其无法维持。 虽然有多种方法可以解决此问题,但这是解决问题的最简单方法,使用 30.72TB 企业级闪存和单个 PCIe 插槽。

众所周知,创意专业人士、数据科学家和其他使用数据密集型应用程序的人会在他们的工作站上进行大量投资。 并且有充分的理由,这些平台旨在快速执行任务,创造直接的商业价值。 所有这些工作都为存储带来了新问题。 要么工作站中没有足够快的闪存,要么硬件/软件的复杂性使其无法维持。 虽然有多种方法可以解决此问题,但这是解决问题的最简单方法,使用 30.72TB 企业级闪存和单个 PCIe 插槽。

在评估存储选项时,专业人士并不缺少选择。 联想、戴尔、惠普和其他公司的大多数高端产品都包含大量 M.2 插槽以及一些其他 HDD 和 SSD 选项。 不过,M.2 通常很小,在大多数工作站配置器中最高可达 4TB。 虽然您可以将几个 M.2 放入一个系统中,但许多工作数据集会扩展到这些驱动器之外,这意味着软件 RAID 解决方案需要发挥作用。

或者,用户可以部署标准 RAID 卡,但即便如此,大多数工作站设备也没有配置一堆 2.5 英寸 SSD 托架。 即使他们这样做了,大多数 RAID 卡也会限制闪存的性能并给系统增加相当多的复杂性。 但是,如果数据弹性至关重要,他们仍然有一席之地。

工作站用户还可以选择网络附加存储,或者如果他们喜欢冒险并且有 IT 支持,他们可以放入光纤通道卡以获得与阵列的低延迟连接。 NAS 显然可以通过网络提供“无限”存储,但性能无法与本地 NVMe 相提并论。 将大量存储从全闪存阵列专用于桌面用户还有成本方面的问题。 虽然 FC 在某些情况下绝对可行,但仍存在物理布线支持问题需要解决,而且许多桌面并不位于或靠近 FC 交换机通常所在的数据中心。

随着我们最近看到的 AMD Threadripper 系统系列进入实验室,我们决定探索替代选项,以了解本地企业 SSD 在现代高级工作站中的易用性和可靠性。

联想 ThinkStation P620 + Solidigm P5316 30.72TB SSD

联想ThinkStation P620 是首批 AMD Threadripper 平台之一,去年夏天进行了更新,支持 AMD Ryzen Threadripper PRO 5995WX 处理器。 这种芯片是专业人士的梦想,提供多达 64 个内核和 128 个线程。 P620 还支持多达两个 NVIDIA A6000 GPU,这意味着它可以随时投入工作。

即使拥有所有这些功能,P620 仍具有几乎所有工作站中常见的驱动器支持的典型混杂,并且每个选项都带有上文所述的某种程度的妥协。 我们选择了一个非常简单的解决方案 20 美元的 PCIe 适配卡固体P5316 30.72TB 固态硬盘。 公平地说,这些驱动器的数量为 3000 美元左右。 也就是说,使用单个 A6000 构建的 Threadripper 往往徘徊在 15 美元左右,因此对某些人来说,合理的存储投资可能是必要的。

遗憾的是,大部分高端工作站尚未找到采用企业级闪存的好方法。 升级到企业级 SSD 时的一个主要问题是冷却,这是一个合理的问题。 企业 SSD 的功耗远高于典型的客户端驱动器,这意味着更多的热量。 如果不处理热量,驱动器将降低性能以保持在线状态。 不过那是最好的情况; 如果不考虑适当的冷却,我们会看到驱动器经常消失。

在我们见过的每个 Threadripper 系统中,冷却都是系统设计中的核心租户。 联想提供了冷却风扇速度的步进,用户将希望在两个 GPU 都在工作或长时间进行大量计算的情况下使用这些步进。 那时我们很好奇; 如果我们将企业级 SSD 放入 P620 并让它在周末运行,会发生什么?

500 亿 Pi 以后

在此测试中,我们着重于 Pi 计算,因为它往往会对 CPU 和我们新添加的存储产生很大的组合影响。 我们将 y-cruncher 设置为计算 Pi 的 500 亿个位置,根据之前的运行,我们预计需要大约一天的不间断工作。 我们认为这足以使驱动器处于足够的工作状态,以至于 P620 的冷却能力或不冷却能力将变得显而易见。

42 小时 8 分钟后,我们完成了 Pi 计算。 顺便说一句,时间是相当可观的; 我们在双处理器 AMD Genoa 机器上运行此计算的最快服务器不到 XNUMX 小时。 对于 AMD 芯片的单处理器 Threadripper 版本,大约一天是相当可观的。

但重要的是,该驱动器从未接近热节流。 在其峰值时,我们保持在 50C 以下,远低于规格表上的 70C 限制。

总结

除了 Pi 计算之外,还有一些关键要点值得注意。 首先,在整体系统构建方面,我们在工作站中添加了一个企业级 SSD,占用一个插槽。 这为我们的系统中的 A6000 留出了空间,如果用例需要,还可以再加一个。 或者,如果需要大量容量,您可以插入多个 SSD。

其次,我们的解决方案简单且广泛兼容。 除了 PCIe sled 之外,不需要额外的硬件,Windows 或 Linux 会将其视为单个驱动器,这意味着不需要软件 RAID 或其他组件。 这是一个重要的注意事项,我们正在处理对它们进行物质投资的工作站,并且系统需要在线并努力提供投资回报。

最后,单个 SSD 的本机性能将比网络存储选项更快。 对于以太网,您需要 100GbE 连接才能超过本地 NVMe Gen4 读取性能的速度,而光纤通道则需要两个以上的 32Gb 链路。 这些共享存储选项还存在成本和距离问题,仅在基础设施成本上可能会超过本地 QLC 闪存的成本。

我们在这里没有涵盖大量新领域,工作站 PCIe 插槽长期以来一直是为系统提供更多存储空间的方式。 也就是说,它通常与 M.2 SSD 搭配使用,后者在向系统提供存储所需的容量、耐用性和复杂性方面有所妥协。 并非每个工作站都需要 30 TB 或更多的快速、简单的存储空间。 尽管如此,对于那些这样做的人,我们对最新工作站(如 P620)处理冷却要求以适当地保持这些 SSD 的能力印象深刻。

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅