Violin Windows Flash Array (WFA) 是一种全闪存 SMB 和 NFS 存储解决方案,它将 Violin Memory 的闪存结构架构与 Windows Storage Server 2012 R2 相结合,以提供具有 10Gb 以太网和 56Gb FDR InfiniBand 连接的简单的应用程序服务器存储解决方案。 Violin 和 Microsoft 合作开发了 WFA,例如 Windows Server 内核优化,使 WFA 能够充分利用 SMB 3.0 协议,支持 SMB Direct over RDMA 网络接口。
Violin Windows Flash Array (WFA) 是一种全闪存 SMB 和 NFS 存储解决方案,它将 Violin Memory 的闪存结构架构与 Windows Storage Server 2012 R2 相结合,以提供具有 10Gb 以太网和 56Gb FDR InfiniBand 连接的简单的应用程序服务器存储解决方案。 Violin 和 Microsoft 合作开发了 WFA,例如 Windows Server 内核优化,使 WFA 能够充分利用 SMB 3.0 协议,支持 SMB Direct over RDMA 网络接口。
WFA 建立在 3U Violin 全闪存阵列 6000 平台上,双刀片运行 Windows Storage Server 作为一个 2 节点集群,可以扩展到 280TB 的原始容量。 该系统通过以 35 或 70TB 的原始容量增量向 Windows 集群添加新的 WFA 设备来扩展,最多可支持 4 个阵列或 8 个节点。 Violin 使用服务器租赁和“按需付费”许可模式,旨在利用平台的无中断扩展功能,允许用户许可较小的容量而不是整个阵列,并随着时间的推移提高利用率。 这篇评论基于 WFA-64 的性能,WFA-64 是 Windows 闪存阵列阵容中最大的阵列,采用 1xXNUMXTiB Violin 内联内存模块 (VIMM)。
Windows 闪存阵列型号 | WFA-64 | WFA-48 | WFA-32 | WFA-24 | WFA-16 |
---|---|---|---|---|---|
外形/闪存类型 | 3U/多层板 | 3U/多层板 | 3U/多层板 | 3U/多层板 | 3U/多层板 |
原始容量 (TB) | 70 | 52 | 35 | 26 | 17.5 |
可用容量 (TB) 在 84% 格式级别 |
44 | 33 | 22 | 16 | 11 |
输入输出连接 | 40GbE、56Gb IB | 40GbE、56Gb IB | 40GbE、56Gb IB | 40GbE、56Gb IB | 40GbE、56Gb IB |
最大限度。 4KB IOPS | 1.1 万次 IOPS | 1.1 万次 IOPS | 800K IOPS | 800K IOPS | 800K IOPS |
最大限度。 带宽 | 4GB /秒 | 4GB /秒 | 4GB /秒 | 4GB /秒 | 4GB /秒 |
标称延迟 | <500 微秒 | <500 微秒 | <500 微秒 | <500 微秒 | <500 微秒 |
Windows 闪存阵列的主要卖点之一是它通过 Windows Server 3.0 R2012 全面支持 SMB 2 协议。 例如,SMB 3.0 包括多通道支持以聚合多个网络端口以实现故障转移和提高性能。 与基于块的端口绑定和聚合不同,后者在接口之间拆分时必须保持单个数据包完好无损,SMB 多通道能够拆分单个数据包以在多个链路上传输。 根据环境和工作负载,这种聚合形式有可能改善延迟和吞吐量。
存储和文件系统 | 文件和块访问 | 网络 |
---|---|---|
重复数据删除 压缩 NTFS 可用性 卸载数据传输 (ODX) 精简配置 加密 |
中小企业3.0 NFS 3.0 和 NFS 4.1 通过 NFS 支持 VMware 虚拟机 横向扩展文件服务器 (SOFS) 用于远程 SMB 文件共享的 VSS(快照) |
SMB 直通 (RDMA) 中小企业多渠道 加密 透明故障转移 |
聚类 | 虚拟化 | |
集群共享卷 v2 DFS复制 |
实时存储迁移 新的 VHDX 标准 |
微软系统中心 PowerShell的 |
对 SMB 3.0 的全面支持还意味着 Windows 闪存阵列可以利用 SMB 新增的远程直接内存访问 (RDMA),这一功能被称为 SMB Direct。 SMB Direct 允许网络接口直接访问系统 RAM 而不是通过操作系统以减少网络延迟和 CPU 利用率。 据微软称,SMB Direct 可将应用服务器的 CPU 消耗减少 30%,其中 I/O 密集型工作负载受益最大。 Violin 还很快指出,这种提高的 CPU 效率对于按内核评估许可费用的应用程序具有财务影响。
我们的评测型号是 Violine WFA-64,建议零售价约为 585,000 美元。
小提琴 WFA-64 规格
- 闪存类型:MLC
- 原始容量:64TiB / 70TB
- 最大可用容量:40 TiB / 44TB
- 最大 4K IOPS:1,100,000
- 最小延迟:220 微秒
- VIMM 数量(数据 + 热备份):60+4
- 可靠性/弹性:高可用性硬件配置; 基于系统级硬件的 vRAID 双或四 vRAID 控制器模块; 2个阵列控制器模块和内存网关; 99.999% 可用性
- IO/连接:8 个 56Gb FDR Infiniband 或 8 个 40Gb 以太网
- 高度:3RU
- 宽度:17.5英寸
- 深度:27“
- 电缆管理:6″
- 重量:92lbs
- 功率:1500W
- 冷却:4961 BTU/小时
- 闪光灯耐久性:享受 3 年保修或维护合同,以较长者为准
建筑与设计
Windows 闪存阵列包含两个运行 Windows Server 2012 R2 的服务器刀片,位于机箱左侧。 通过部署带有启用 RDMA 的网络接口的 WFA(位于服务器刀片的正后方),该阵列可以利用 SMB Direct 来提高性能和降低延迟。 机箱的前部主要是用于大型冷却风扇的巨大进气格栅,以及坚固的手柄和状态 LED。
WFA 的 Violin 智能内存模块 (VIMM) 位于机箱中央的风扇后面。 VIMM 是 Violin 的 SSD 存储替代品,可管理其底层存储介质的垃圾收集、磨损均衡和错误/故障管理。 VIMM 由基于逻辑的闪存控制器、管理处理器、用于元数据的 DRAM 和用于存储的 NAND 闪存组成。 每个都可热插拔以方便维护,并且采用卡式外形而非传统的 2.5 英寸 SSD。
从机箱的后部我们可以看到主要的电源和网络连接。
管理和操作系统
Windows 闪存阵列管理体验的核心是该平台与从阵列的双服务器刀片运行的 Windows Server 2012 R2 实例的紧密集成。 WFA 部署旨在通过 Microsoft System Center 和 PowerShell 进行管理,这允许已经具有 Microsoft 管理能力的组织通过避免另一个管理环境的开销来简化他们的流程。
这种方法使 Violin 能够在尚未提供对 Microsoft SMB Direct 的支持以提高阵列和应用程序服务器性能的竞争阵列上取得优势。 根据 Violin 的说法,带有 SMB Direct 的 WFA 可以将 SQL Server CPU 利用率降低多达 30%,从而在制造商基准测试中达到 1.1 万 4K IOPS 的持续吞吐量和 4GB/s 的带宽。
Windows 闪存阵列提供对数据服务部署的精细控制,允许为节点和共享选择性地激活重复数据删除和其他功能。
WFA 在主动-主动配置中作为 Windows 故障转移群集故障转移运行,并且可以利用 SMB 多路径来检测连接故障并重新路由流量。 它还提供 Hyper-V Replica,用于虚拟机的异步复制以及实时 VM 迁移。 大部分功能都集中在 SMB 协议上; 实时迁移只能通过 SMB 使用。
性能测试
在实验室中使用 Violin WFA 的目的是多方面的。 首先,我们的目标是与我们的许多优秀合作伙伴进行整合。 我们利用戴尔的经验来充分利用 PowerEdge R920 测试平台。 Mellanox 提供了 Infiniband 配置支持,并且 Microsoft 可以确保使用 SMB 3.0 最佳实践。 其次,我们想在我们的实验室中部署一个更密集的基准测试,旨在强调高端全闪存配置,如 WFA 和 Violin 系列的其余部分。 因此,我们与 Stream Financial 合作复制他们的 数据融合性能测试 在我们的实验室。 最后,我们希望能够击败 Violin 之前通过此测试产生的结果,为闪存的功能设置一个新的高水位标记。
DataFusion 最简单的形式旨在演示超过一万亿行风险数据的处理和聚合,其中包含 13 万亿个数据点,每行一个风险点。 该测试着眼于一个非常真实的大数据用例,其中处理数据所需的时间可能会阻碍决策制定。 该测试模拟了一个交易环境,其风险数据包含 12 年期间交易账簿的 delta、gamma、vega 和 theta 风险桶。 为了模拟典型的业务视图,数据使用 SQL“where”、“like”和“group by”查询进行聚合,以显示按风险类型、货币和交易对手分类的风险敞口。 整体高度压缩的数据库占用空间略高于 8TB,扩展后超过 100TB。 出于此测试的目的,数据库在没有索引的情况下运行,迫使服务器和存储实时处理所有数据。
与我们实验室中的 R920 配置相比,英国“The Test People”所做的初始测试有点适度。 他们的发现使用了 Violin WFA-32 与单个 Intel Xeon CPU E5-2690 v2 @3.00GHZ 接口。 测试过程耗时4小时19分钟。 他们进一步评论说,“通过扩展服务器和阵列,可以进一步减少处理时间。”
随着挑战的提出,Violin 为我们提供了 WFA-64 供我们使用数周,我们试图看看我们能在多大程度上推动 Violin 闪光灯、Windows 和 Infiniband 结构。 我们利用 Dell PowerEdge R920 来了解仅使用一台功能强大的服务器可以将处理时间缩短多少。 我们的 R920 配置提供 138GHz 的总 CPU 处理能力,而原始新闻稿使用的是 30GHz。
戴尔PowerEdge R920
- 四个 Intel E7-4870 v2 CPU(2.3GHz,15 核,30MB 缓存)
- 512GB 内存(8GB x 64 DDR3,每个 CPU 128GB)
- 2 个 300GB 10K SAS RAID1 引导
- 4 个 Mellanox ConnectX-3 双端口 InfiniBand 适配器
通过选择并配置 Windows Server 2012 R2 的新测试平台,我们能够在基准测试期间使 R920 完全饱和。 在测试过程中,CPU 利用率为 90-100%,网络流量为 2-3GB/s。 说完一切后,我们以 56 分 16 秒的极短时间完成了比赛。 这比原来的处理时间缩短了大约 80%,显示了四 CPU 服务器(如 Dell PowerEdge R920)在计算繁重任务中与快速互连(如我们的 Mellanox Infiniband 结构)相结合的优势。 虽然基准时间确实显着改善,但 WFA-64 在两个控制器和可用带宽上仍有余量可供利用。
结语
全闪存存储阵列从根本上说是一种从单一平台中榨取最大性能的练习。 Violin Windows 闪存阵列采用一种非常具体的方法来最大限度地提高 Violin 的全闪存阵列平台的性能,方法是专注于为需要为基于 Windows 的应用程序服务器工作负载和 SMB 协议存储的组织进行调整和集成。 Violin 的论点对许多管理员来说听起来很有说服力:通过完全致力于 Windows Server 功能集和管理范式,Windows Flash Array 的部署和管理将变得更简单、成本更低。 对于 Windows 商店来说,这可能是正确的,而对于那些使用其他平台的人来说,Violin 7000 闪存平台是一种更传统的阵列,更适合那里。
我们在本次审查中的测试在一定程度上限制了设置新测试环境所花费的时间以及通常对阵列的访问。 虽然并不打算全面,但在考虑我们发现的结果时,数据点是令人鼓舞的。 我们的测试虽然硬件得到了显着改进,但将完成基准测试所需的时间缩短了将近 80%。 考虑到阵列的整体密度和 R920 的组合,这是相当令人印象深刻的。 凭借 WFA-64 上的一些剩余空间,更快或更新的计算硬件可以获得更好的结果。 考虑到像 R930 这样的新四 CPU 平台,我们预计 Violin WFA 可以发挥更多的性能,它甚至没有在内部运行最新的 Intel Haswell CPU。
WFA 并非没有妥协,CPU 没有更新到最新的 Intel 产品,除了 Violin 提供的硬件设计优势外,在软件方面没有太多 Microsoft 未提供的“特殊调味料”。 这不一定是个问题,在 Windows 环境中它可能是一个好处。 问题将归结为与更传统的 SAN 产品相比,企业对这一层性能的需求有多迫切。 但是,从我们在这种有限的交互中看到的情况来看,如果您有足够的计算能力来处理 WFA 并且应用程序对延迟高度敏感,那么 WFA 真的会大喊大叫。 我们没有看到其他 Windows 设备甚至全闪存 DIY 解决方案让我们相信在这一类别中有更好的选择。
讨论这篇评论