Datrium 提供“开放式融合”,这就是他们所说的下一代融合基础设施。 与企业 IT 领域的供应商一样,在融合方面可能会有很多重复,而对于他们而言,Datrium 并不羞于宣传他们对基础设施的看法。 Datrium 认为计算、主存储、二级存储和云在一个高度弹性的配置中结合在一起,该配置可扩展且易于管理,没有每个存储类别的孤岛。 此外,由于大多数数据调用将命中具有板载闪存缓存的计算节点,因此 Datrium 几乎在所有情况下都无需访问数据节点即可提供出色的性能。 这转化为 200GB/s 和 16GB/s 的峰值 32K 读写带宽和 18M IOPS 4K 随机读取。
Datrium 提供“开放式融合”,这就是他们所说的下一代融合基础设施。 与企业 IT 领域的供应商一样,在融合方面可能会有很多重复,而对于他们而言,Datrium 并不羞于宣传他们对基础设施的看法。 Datrium 认为计算、主存储、二级存储和云在一个高度弹性的配置中结合在一起,该配置可扩展且易于管理,没有每个存储类别的孤岛。 此外,由于大多数数据调用将命中具有板载闪存缓存的计算节点,因此 Datrium 几乎在所有情况下都无需访问数据节点即可提供出色的性能。 这转化为 200GB/s 和 16GB/s 的峰值 32K 读写带宽和 18M IOPS 4K 随机读取。
从根本上说,Datrium 由构成 DVX 系统的计算节点和存储节点组成。 计算节点可以由 Datrium 提供,或者客户可以利用他们自己现有的服务器基础设施。 计算节点处理 IO 处理,将缓存保留在本地闪存上。 闪存几乎可以是任何东西,从低成本、高容量的 SATA 驱动器到高性能的 NVMe。 闪存的决定完全取决于工作负载,并且可以进行调整以满足客户需求。 由于持久性数据驻留在数据节点上,因此计算节点是无状态的,可以离线而不会有数据丢失或损坏的风险,从而保持 n-1 可用性。 Datrium 支持多种环境,包括 vSphere 5.5-6.5、Red Hat 7.3、CentOS 7 1611 和裸机 Docker 1.2。
数据节点维护数据的持久副本,并在磁盘或闪存配置中可用。 在 Datrium DVX 中,数据始终经过压缩、全局重复数据删除和具有双重容错的纠删码。 Datrium 还在 DVX 中提供加密、快照和复制功能。 数据节点依赖于计算节点进行所有处理,使存储系统可以自由地通过双热插拔控制器提供 IO。 数据节点包括用于快速写入的镜像、电池供电的 NVRAM,以及具有负载平衡和路径故障转移功能的高速以太网网络。 Datrium 的最新节点包括 DVX with Flash End-to-End。 这意味着计算节点中有闪存,以及全闪存 DVX 数据节点。 F12X2 数据节点拥有 16TB 可用存储(12×1.92TB SSD),有效容量高达 32-96TB,数据减少 2-6 倍,支持 25GbE 网络。 最新的计算节点 CN2100 添加了新的 Skylake CPU、NVMe 支持和高达 25GbE 的网络。
这篇评论有些独特,因为我们可以远程访问 Datrium 测试环境,该环境配置了 32 个 Dell PowerEdge C6320 计算节点和 10 个 Datrium DVX 全闪存数据节点。
- 32 台戴尔 PowerEdge C6320 服务器
- 已安装 VMware ESXi 6.0 Update3
- 双 Xeon CPU E5-2697 v4 CPU
- 128GB内存
- 4 x 1.92TB 三星 PM863a SSD 作为数据缓存
- 2 x 10Gb/s NIC(管理/数据)
- 网络配置
- 核心交换机上有 10 个 F12X2 数据节点
- 32 个 TOR 交换机上的 8 个计算节点
- 每个 TOR 交换机都有到核心交换机的 160Gbps 上行链路
DVX 通过浏览器或作为 VMware vCenter 插件使用基于 HTML5 的用户界面进行管理。 DVX UI 的整个前提依赖于简单性,消除了以传统方式管理存储的需要。 从存储配置到复制管理,一切都发生在同一个 UI 中。
快速浏览一下,用户能够找到有关集群 VM IOPS、吞吐量、网络传输速度以及 Datrium 平均读/写延迟以及主机闪存命中率的性能信息。 鉴于 Datrium DVX 平台的分层结构,检查主机和底层数据节点之间的性能水平有助于衡量整体性能。 除了性能指标外,还提供显示总数据占用空间和快照空间的总可用容量以及当前数据缩减指标。
上面的屏幕截图中需要注意的一个有趣项目是网络流量(其中一个显示 4K 随机写入活动,另一个显示读取活动)。 由于 Datrium DVX 利用主机端闪存进行读取活动并将写入活动提交到数据节点,您可以看到它以网络速度表示。 在我们的 4K 随机测试中,网络活动的测量速度为 7.3GB/s,而在我们从内部主机闪存中提取数据的读取测试中,网络流量不存在。
性能基准
为了衡量如此大型集群的性能,我们选择了 VMware 的 HCIBench,因为它易于部署并且能够跨数百个 vdbench VM 聚合性能数据。 对于大型集群,该工具使我们能够快速增加通常用于测量企业存储的工作负载,并使我们能够处理具有用户定义的重复模式的数据。 对于提供数据缩减服务的平台,它让用户有机会在更接近真实世界的情况下展示性能。 在这种情况下,我们为每个工作负载使用了 2:1 的压缩设置。 应该注意所有基准测试、压缩、重复数据删除和内联纠删码都在运行。 换句话说,所有基准测试都是在完整的真实世界操作条件下进行的。
在我们的 HCIbench 4K 中,我们查看了具有完全随机 4K 工作负载配置文件的峰值随机吞吐量。 Datrium DVX 能够达到 9.5725GB/s 的读取速度和 2.524GB/s 的写入速度。
接下来,我们查看同一 4K 配置文件中的峰值 I/O。 在这里,Datrium DVX 的另一个令人印象深刻的表现是超过 2.45 万次 IOPS 读取和 646,162 次 IOPS 写入。
下一个指标着眼于完全随机的 4K 工作负载配置文件的平均延迟。 虽然不是亚毫秒级延迟,但 DVX 仍然能够达到令人印象深刻的 1.05 毫秒读取和 3.96 毫秒写入。
我们的下一个测试着眼于一个更大的 8K 随机数据配置文件,其中混合了 70% 的读取和 30% 的写入活动。 此处 DVX 的吞吐量为 9,229.5GB/s。 查看峰值 I/O,DVX 能够达到超过 1.18 万次 IOPS。 8K 70/30 延迟仅为 2.17 毫秒。
最后一个工作负载切换到峰值带宽焦点,由 32K 顺序读写配置文件组成。 在这里,DVX 能够达到 42.16GB/s 的巨大读取速度和 13.26GB/s 的写入速度。
查看相同工作负载的峰值 I/O,DVX 继续提供一些令人印象深刻的数字,读取 IOPS 超过 1.349 万,写入 IOPS 超过 424,282。
凭借 DVX 在 32K 测试中的所有高数字,它以 1.9 毫秒读取和 6.02 毫秒写入的相当低的延迟超越了一切。
作为一个融合平台,CPU 利用率是一个需要考虑的重要因素,因为一些存储开销来自用于操作工作负载本身的相同系统。 在每个工作负载期间监控平台时,我们查看了整个集群性能(等式的两边),包括利用 vdbench 的 HCIbench 工作人员,分布在整个集群中,加上存储 VM 本身的开销。
在繁重的顺序写入活动期间(其中大部分工作直接卸载到闪存节点),我们看到使用的总系统资源不到 40%。 在繁重的读取活动期间,例如在 4K 随机读取工作负载中,该指标增加到略高于 60%。 因此,即使系统同时为工作负载和 VM 消耗工作负载,我们仍有 60% 的 CPU 资源留给其他应用程序和工作负载,最坏的情况下会下降到 40%。 因此,在运行完整内联数据服务的最坏情况下,运行 Insane Mode(最大主机利用率为 40%,正常情况下为 20%)时,Datrium 平台仍有大量剩余系统资源。
结语
Datrium DVX 系列已更新以支持最新一代的存储和计算资源。 在这种情况下,我们查看了端到端闪存配置,其中包括计算节点中的闪存缓存以及用于持久存储的全闪存数据节点。 Datrium 的“开放融合”平台还包括通常在更成熟的产品上发现的数据服务; 使用 Datrium DVX,数据始终经过压缩、全局重复数据删除和纠删码,具有双重容错功能。 客户可以选择使用 Datrium 的计算节点,但正如本次审查中的情况一样,这不是必需的(我们的测试利用了 32 个 Dell PowerEdge 节点)。 这些计算节点以最高 20% 的最低开销处理 IO 处理和缓存。 然而,对于需要更高存储性能的实例,DVX 可以置于 Insane 模式,在这种模式下 DVX 可以利用高达 40% 的计算资源。
在性能方面,我们选择了 HCIbench 基准测试,因为它们最能反映 Datrium DVX 在更大规模环境中的真正能力。 马上,全闪存 DVX 就取得了令人印象深刻的数字。 在 4K 基准测试中,DVX 的读取吞吐量超过 9.57GB/s 和 2.45 万 IOPS,写入吞吐量超过 2.52GB/s 和 646K IOPS。 DVX 以低至 1.05 毫秒的读取延迟和 3.96 毫秒的写入延迟实现了这些数字。 切换到 8K 70% 读取 30% 写入,DVX 再次以超过 9.2GB/s 的吞吐量、超过 1.18 万次 IOPS 以及 2.17 毫秒的延迟给人留下深刻印象。 在我们的 32K 顺序测试中,DVX 达到了惊人的 42.16GB/s 读取速度和超过 1.349 万次 IOPS,延迟为 1.9ms。
显然,Datrium 对融合的看法是独一无二的。 利用具有本地化闪存的计算节点的“剩余”CPU 非常有意义,同时仍然能够将闪存用于持久存储以获得所有 TCO 优势。 实现这项工作的一个关键驱动因素是 DVX 系统提供的存储效率,这对于充分利用数据节点中的闪存至关重要。 对于那些需要更高性能的用户来说,很容易在计算节点中加入 NVMe 存储,尽管我们显然用低成本选项做得很好。 然而,没有弹性,任何性能都没有多大意义。 使用 DVX,计算节点是无状态的,并支持 N-1 服务器容错模型。 这意味着我们可能会丢失测试配置中 31 台服务器中的 32 台,但所有数据仍然可用。 即使所有服务器都丢失了,DVX 也不会丢失数据,因为数据的权威副本存储和保护在数据节点上,而不是在计算节点上。
归根结底,目前企业 IT 中没有什么比融合基础设施更令人兴奋的了。 虽然有很多方法可以实现这一愿景,但 Datrium 已经将他们的 DVX 推销到一起,其中包括深度数据管理服务和出色的性能配置文件。 然而,在融合领域,很少有人同时具备性能和功能,这使得 Datrium 的 DVX 成为一款功能齐全、脱颖而出的产品。