首页 企业版 Permabit Albireo SANblox 评论

Permabit Albireo SANblox 评论

by 布赖恩·比勒

Permabit Albireo SANblox 是一种专门构建的数据缩减设备,旨在从光纤通道 SAN 释放更多容量。 Permabit 估计用户将看到驻留在 SAN 上的数据足迹至少减少 6:1,从而允许存储投资大幅改变标准价值主张。 SANblox 通过精简配置提供重复数据删除和压缩,进一步增强了功能集。 所有数据缩减都是在线完成的,SANblox 设备简单地滑入并虚拟化 SAN,SAN 和应用程序不会注意到 SANblox 解决方案的驻留。 SANblox 适用于任何 FC 存储,无论磁盘配置如何——硬盘、混合和全闪存解决方案都将看到相同的数据占用空间减少。


Permabit Albireo SANblox 是一种专门构建的数据缩减设备,旨在从光纤通道 SAN 释放更多容量。 Permabit 估计用户将看到驻留在 SAN 上的数据足迹至少减少 6:1,从而允许存储投资大幅改变标准价值主张。 SANblox 通过精简配置提供重复数据删除和压缩,进一步增强了功能集。 所有数据缩减都是在线完成的,SANblox 设备简单地滑入并虚拟化 SAN,SAN 和应用程序不会注意到 SANblox 解决方案的驻留。 SANblox 适用于任何 FC 存储,无论磁盘配置如何——硬盘、混合和全闪存解决方案都将看到相同的数据占用空间减少。

6 倍的数据减少被普遍认为是标准企业混合应用程序工作负载的良好标志。 但是,根据存储的使用情况,数字可能会更高。 VDI 用例可以将 SANblox 的优势提升一个数量级,例如,使用多个数据库副本进行开发的 IT 商店将看到巨大的数据足迹减少。 事实上,仅仅为了开发目的而能够分离数据副本可能会启用新的业务流程,而之前部署完整数据集的成本可能太高了。

Permabit 长期以来一直从事重复数据删除业务。 虽然数据缩减直到最近才在备份设备之外广泛流行,但基于闪存的设备已经将这一概念推向了更主流的工作负载。 许多全闪存设备背后的重复数据删除技术很可能是 Permabit 解决方案。 重复数据删除并非无处不在,硬盘驱动器阵列甚至大多数混合驱动器根本就没有考虑到这一概念,甚至许多闪存阵列也提供了一组有限的数据缩减服务。 Permabit 通过 SANblox 设备开放这些服务,为新的或现有的存储提供一套新的技巧。

Permabit Albireo SANblox 现已出货,建议零售价根据与该设备配对的存储供应商和促销价格而有所不同。 显然,当容量足够大以实现规模经济时,定价争论最有效。 Permabit 提供了一个定价示例,以展示传统闪存存储如何与 SANblox 环境相媲美:

  • 60 TB 原始数据的成本:720,000 美元
  • 扣除数据保护开销后的成本:12 美元/GB
  • SANblox 6:1 容量节省成本:70,000 美元
  • 扣除数据保护开销后的 10TB 成本:120,000 美元
  • 折扣前总成本:190,000 美元
  • 折扣前每 GB(存储 + sanblox)的有效成本:3.16 美元
  • 净储蓄:74%

Permabit Albireo SANblox 规格

  • 中央处理器:英特尔至强E5-1650v2
  • 内存:128 GB
  • FC 端口:4 x 16 Gb (Emulex)
  • 最大限度。 可用容量:256 TiB
  • 最大限度。 支持的 LUN:256
  • 随机 IO(4K IOPS):
    • 阅读:230,000
    • 写:111,000
    • 混合 RW70:180,000
  • 顺序吞吐量:
    • 读取:1045MB/s
    • 写入:800MB/s
  • 最小延迟:
    • 读取:300us
    • 写入:400us
  • 可靠性:在确认写入之前,所有数据/元数据都写入后端存储。 SANblox 上没有缓存数据。
  • 可用性:无缝高可用性可在 30 秒内提供透明的故障转移。
  • 可维护性:软件和硬件组件的 SMTP 警报和透明升级。
  • 物理特性:
    • 外形:1U 机架式
    • 宽度:17.2“(437毫米)
    • 重量:38 磅(16.5 公斤)
  • 电源:
    • 电压:100-240V,50-60Hz
    • 瓦特:330
    • 安培:最大 4.5
  • 工作温度:10°C 至 35°C(50°F 至 95°F)
  • 工作相对湿度:8% 至 90%(非冷凝)
  • 公司证书
    • 电磁辐射:FCC A 类、ICES-003、CISPR 22 A 类、AS/NZS CISPR 22 A 类、EN 61000-3-2/-3-3、VCCI:V-3、KN22 A 类
    • 电磁抗扰度:CISPR 24、KN 24、(EN 61000-4-2、EN 61000-4-3、EN 61000-4-4、EN 61000-4-5、EN 61000-4-6、EN 61000-4- 8、EN 61000-4-11)
    • 电源效率:80 Plus 金牌认证

重复数据删除

重复数据删除只是防止重复数据占用主存储中宝贵空间的过程。 购买专门用于备份的数据缩减设备与专为主存储设计的数据缩减设备之间的区别可能会让一些购买者感到困惑。 具有数据缩减功能的主存储旨在优化随机访问固定大小数据块的性能交付。 为了达到更快的性能,主存储数据缩减侧重于固定的数据块,通常是更多、更小的块(但根据特定供应商的不同而有所不同)。 另一方面,重复数据删除备份设备更侧重于顺序吞吐量,以加快备份和恢复过程。 具有连续焦点的备份重复数据删除设备能够处理大量数据流并将它们写入具有可变块大小的介质。 一方面,这意味着设备可以使用更大的块,因此需要跟踪的块更少; 另一方面,如果需要回读的数据量很少,则必须读取整个块。

就重复数据删除而言,主要有两种执行方法:内联或后处理。 内联重复数据删除只是意味着当数据向其目标移动时,重复项被发现并且永远不会被写入。 因为它是内联的,混合阵列中的缓存和更快的存储层都受益于有效容量的增加。 这是节省磁盘空间的理想选择,更不用说节省对闪存介质的写入(闪存在开始降级之前只能进行这么多写入)。 除了这些好处之外,内联还允许立即复制以保护数据。 内联重复数据删除的不利方面是几乎不可避免的性能下降。

后处理重复数据删除意味着重复数据删除过程在数据到达其存储目标或到达存储缓存时开始。 虽然这可以跳过写入时的初始性能影响,但它确实引入了其他问题。 其一,重复项在等待重复数据删除过程开始或追赶(如果它一直在运行)时正在占用存储空间。 如果先将数据发送到缓存,缓存会很快填满。 因此,混合阵列可能只会在最低层节省容量。 在重复数据删除之前先将所有内容写入存储介质也会对闪存造成更大的损失。 虽然可以跳过初始性能影响,但重复数据删除过程一旦开始后处理仍将不得不使用资源。

从供应商的角度来看,性能通常是最关心的问题,因为他们不希望自己的设备运行速度比竞争对手慢(即使他们使用的磁盘空间总体上更少)。 性能影响和总体性能上限来自可用资源以及给定设备中使用的特定软件的组合。 虽然性能也可能是客户关注的问题,并且是一个主要问题,但他们也担心数据丢失,因为重复数据删除过程确实改变了数据的存储方式和最初的写入方式。

那么 Permabit 在哪里适合重复数据删除的这种差异? Permabit 位于 SAN 前面,并在数据移向目标时对数据进行重复数据删除。 Permabit 使用内联、多核可扩展和低内存开销的重复数据删除方法。 具体来看我们正在测试的设备 Permabit Albireo SANblox,它可以在主存储环境中以 4K 粒度为需要重复数据删除的数据编制索引。 因此,Permabit Albireo SANblox 可以采用 256TB 的配置 LUN 并将其呈现为 2.5PB 的逻辑存储,但它仅在 128GB 的​​ RAM 中实现。 这允许设备通过读回更小的数据块以及使用更少的资源来解决性能方面的问题。 解决 Permabit 性能问题的另一种方法是将其软件嵌入到设备中。 Permabit 表示,使用此方法的客户已经看到超过 600,000 IOPS 的性能。

任何公司都可以轻松地说出该设备(在本例中为重复数据删除)的功能非常出色。 但是,在客户和希望将 Permabit 与其 SAN 设备结合起来的供应商可以理解的上下文中提供一些证据总是更好。 几年前,Permabit 与 Enterprise Strategy Group (ESG) 进行了一项研究。 该研究考察了各种环境下的数据缩减率,并比较了单独使用压缩、单独使用重复数据删除以及压缩和重复数据删除相结合的方法。

设置和配置

SANblox 设备是一个 1U 服务器,它基本上将自身插入到路由通过的 LUN 的数据路径中。 当然,并非所有 LUN 都必须通过 SANblox。 SANblox 单元通常部署在 HA 对中,根据底层存储的需求或功能,可以使用多个 HA 对来满足任何存储或性能要求。

在线获取 SANblox 非常简单快捷。 您为系统分配了两个 IP 地址:一个用于 IPMI,另一个用于 Web 管理和 SSH 接口。 当它上线时,您可以获取两个后端 FC 端口(将连接到您的存储系统的端口)的 WWN,并使用它们创建一个单独的 FC 区域。

在阵列级别,您配置存储,以便您有一个 1GB LUN 用于设备设置,多个 LUN 用于您的主要数据存储。 所有元数据也都存储在这些卷上,SANblox 不会在设备中保留任何数据,这是通过其同步、内联功能实现的。 对于我们的屏幕截图示例,我们使用了 DotHill Ultra48 阵列,为 SANblox 设置配置了 1 个 1GB LUN,为 SANblox 存储池配置了 2 个 1TB LUN。

配置存储后,SANblox 使用 1GB LUN 自动检测和配置自己进行设备设置,并查看其他 LUN 以创建存储池。 在这种情况下,它在创建池时将所有这些分组在一起,并允许您选择是否要打开或关闭重复数据删除,以及打开或关闭压缩。

使用创建的池,Permabit SANblox 默认允许用户以 10:1 的逻辑可寻址大小对物理存储进行寻址。 因此,在创建卷时,1TB 原始空间变为 10TB 可用空间。 在我们的例子中,它将 1.8TB 的原始存储映射为我们可以分配的 18TB 可用存储。

整理好底层存储后,界面的其余部分与基本存储阵列的工作方式类似。 您可以创建 LUN,将它们分配给主机或主机组,以及定义只读访问或读/写访问等规则。

性能

并非所有高性能存储都提供重复数据删除。 X-IO ISE G3 闪存阵列系列就是一个很好的例子,最近评论 X-IO 伊势 860 主要设计为表演游戏。 X-IO 有意识地决定不叠加太多功能,所有这些功能都需要更多的 RAM 和 CPU,同时削弱了阵列提供领先性能的能力。 也就是说,在某些用例中,应用程序必须在性能和容量之间进行权衡,并且每 TB 的闪存成本仍然相对较高,重复数据删除可以显着改变性能存储的经济性,足以解决成本问题并保持高性能特性。 以此为背景,我们在 ISE 860 前面部署了 SANblox 以评估其功能。 主要关注重复数据删除如何影响应用程序性能,我们利用我们的 Microsoft SQL Server、MySQL Sysbench 和 VMware VMmark 测试环境来对单个 SANblox 设备进行压力测试。 这些测试中的每一个都在多个同时工作负载同时命中给定存储阵列的情况下运行,从而为 Permabit SANblox 等数据减少系统提供了减少已部署工作负载的数据足迹的绝佳机会。

在重复数据删除和性能方面需要了解的一个重要因素是,当您减少数据占用空间时,您也会增加后端存储上的 I/O 负载。 在许多情况下,吞吐量会降低,因为您发送的数据比以前少得多,但小块随机 I/O 请求会大幅增加。 这是 DR 和闪存可以很好地结合在一起的原因之一,但这也意味着在某些情况下,您可以并且仍然会在某些情况下使后端存储饱和。 幸运的是,SANblox 的专利技术将数据减少的开销控制在最低限度,从而为扩展留出空间或将阵列本机用于其他应用程序。 对于具有大量 I/O 潜力的大型环境或平台,用户可以扩展 SANblox 设备的数量以提高性能和容量。 虽然我们只获得了一台设备进行审查,但我们很可能会看到两对一起工作时测得的性能更高,而不是只有一对。

存储评论的 Microsoft SQL Server OLTP 测试协议 采用事务处理性能委员会基准 C (TPC-C) 的当前草案,这是一种在线事务处理基准,模拟复杂应用程序环境中的活动。 TPC-C 基准比综合性能基准更接近于衡量数据库环境中存储基础设施的性能优势和瓶颈。

此测试使用在 Windows Server 2014 R2012 来宾虚拟机上运行的 SQL Server 2,由戴尔的数据库基准工厂进行压力测试。 虽然我们对该基准测试的传统用法是在本地或共享存储上测试 3,000 规模的大型数据库,但在本次迭代中,我们专注于在我们的 X-IO ISE 1,500 上均匀分布四个 860 规模的数据库,以更好地说明内部的总体性能一个 4 节点 VMware 集群。

二代SQL Server OLTP基准工厂LoadGen设备

  • Dell PowerEdge R730 VMware ESXi vSphere 虚拟客户端主机 (2)
    • 集群中 5 个 2690GHz Intel E3-124 v2.6 CPU(每个节点两个,12GHz,30 核,XNUMXMB 缓存)
    • 512GB RAM(每个节点 256GB,16GB x 16 DDR4,每个 CPU 128GB)
    • SD 卡引导 (Lexar 16GB)
    • 2 个 Mellanox ConnectX-3 InfiniBand 适配器(用于 vMotion 和 VM 网络的 vSwitch)
    • 2点¯x Emulex 16GB 双端口 FC HBA
    • 2点¯x Emulex 10GbE 双端口网卡
    • VMware ESXi vSphere 6.0 / Enterprise Plus 4-CPU
  • Dell PowerEdge R730 虚拟化 SQL 4 节点集群
    • 集群中 5 个 2690GHz 的 Intel E3-249 v2.6 CPU(每个节点两个,12GHz,30 核,XNUMXMB 缓存)
    • 1TB RAM(每个节点 256GB,16GB x 16 DDR4,每个 CPU 128GB)
    • SD 卡引导 (Lexar 16GB)
    • 4 个 Mellanox ConnectX-3 InfiniBand 适配器(用于 vMotion 和 VM 网络的 vSwitch)
    • 4点¯x Emulex 16GB 双端口 FC HBA
    • 4点¯x Emulex 10GbE 双端口网卡
    • VMware ESXi vSphere 6.0 / Enterprise Plus 8-CPU

每个 SQL Server VM 配置有两个虚拟磁盘,一个 100GB 用于启动,另一个 500GB 用于数据库和日志文件。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、64GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。

查看在 X-IO ISE 860 上运行我们的 SQL TPC-C 工作负载与通过 Permabit SANblox 运行 SQL TPC-C 工作负载之间的 TPS 性能变化,从 12,564 到 12,431TPS 的下降相当小。

尽管我们看到数据减少对工作负载的影响,但将重点从事务性能转移到延迟。 对于通过 SANblox 运行的工作负载,延迟从平均 13 毫秒增加到平均 84 毫秒; 略低于 5.5 倍的跳跃。 Permabit 解释说,我们可能接近单个 SANblox 对的最大负载,稍微减少工作负载或添加第二个 SANblox 可以显着降低平均延迟。

- 联机事务处理平台 基准运行在 Percona MySQL 之上,利用在 CentOS 安装中运行的 InnoDB 存储引擎。 为了使我们对传统 SAN 的测试与较新的超融合设备保持一致,我们已将许多基准测试转移到更大的分布式模型。 主要区别在于,我们现在不是在裸机服务器上运行一个基准测试,而是在虚拟化环境中运行该基准测试的多个实例。 为此,我们在 X-IO ISE 4 上部署了 8 个和 860 个 Sysbench VM,每个节点 1-2 个,并测量了集群上所有同时运行的总体性能。 我们绘制了 4 个和 8 个 VM 如何在闪存阵列原始上以及通过 Permabit SANblox 运行。

Dell PowerEdge R730 虚拟化 Sysbench 4 节点集群

  • 集群中 5 个 2690GHz 的 Intel E3-249 v2.6 CPU(每个节点两个,12GHz,30 核,XNUMXMB 缓存)
  • 1TB RAM(每个节点 256GB,16GB x 16 DDR4,每个 CPU 128GB)
  • SD 卡引导 (Lexar 16GB)
  • 4 个 Mellanox ConnectX-3 InfiniBand 适配器(用于 vMotion 和 VM 网络的 vSwitch)
  • 4点¯x Emulex 16GB 双端口 FC HBA
  • 4点¯x Emulex 10GbE 双端口网卡
  • VMware ESXi vSphere 6.0 / Enterprise Plus 8-CPU

每个 Sysbench VM 配置了三个虚拟磁盘,一个用于启动 (~92GB),一个用于预构建数据库 (~447GB),第三个用于我们将测试的数据库 (400GB)。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、64GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。

我们的 Sysbench 测试测量平均 TPS(每秒事务数)、平均延迟以及在 99 个线程的峰值负载下的平均 32% 延迟。

通过在具有 860VM 工作负载的 X-IO ISE 8 上本地运行 Sysbench,我们测得整个集群的总计为 6,568TPS。 将 SANblox 添加到组合中后,该速度降至 2,971TPS。 在负载 4 个虚拟机的情况下,我们发现下降幅度较小,从 4,424TPS 下降到 2,752TPS。 在这两种情况下,通过数据缩减设备进行操作的开销分别占 55% 和 38%。 一个关键方面是这个开销数字不会直接影响存储阵列提供的 LUN。 作为外部系统,用户可以选择将更高优先级的流量路由到阵列本身,尽管没有数据减少的成本优势。

比较我们配置之间的平均延迟,我们看到 4VM 平均延迟从 29 毫秒增加到 47ms,而 8VM 平均延迟从 39ms 增加到 86ms。

在将 SANblox 添加到我们的环境后查看第 99 个百分位数的延迟,我们测量到 57 个虚拟机的延迟从 89 毫秒增加到 4 毫秒,83 个虚拟机的延迟从 178 毫秒增加到 8 毫秒。

VMmark 性能分析

与我们所有的应用程序性能分析一样,我们试图展示产品在实际生产环境中的性能与公司的性能声明相比如何。 我们了解评估存储作为大型系统组件的重要性,最重要的是存储在与关键企业应用程序交互时的响应速度。 在这个测试中我们使用 VMware 的 VMmark 虚拟化基准测试 在多服务器环境中。

VMmark 的设计本身就是一个高度资源密集型基准测试,它广泛地混合了基于 VM 的应用程序工作负载,强调存储、网络和计算活动。 在测试虚拟化性能时,几乎没有更好的基准测试了,因为 VMmark 考虑了很多方面,包括存储 I/O、CPU,甚至 VMware 环境中的网络性能。

Dell PowerEdge R730 VMware VMmark 4 节点集群规格

  • Dell PowerEdge R730 服务器 (x4)
  • CPU:八个 Intel Xeon E5-2690 v3 2.6GHz (12C/24T)
  • 内存:64 x 16GB DDR4 RDIMM
  • Emulex LightPulse LPe16002B 16Gb FC 双端口 HBA
  • Emulex OneConnect OCe14102-NX 10Gb 以太网双端口 NIC
  • VMware ESXI 6.0

ISE 860 G3(每个 DataPac 20×1.6TB SSD)

  • RAID 之前:51.2TB
  • RAID 10 容量:22.9TB
  • RAID 5 容量:36.6TB
  • 标价:575,000 美元

在配置 Permabit SANblox 以使用 VMware 的 VMmark 进行测试时,我们优化了数据分布方式。 传统上,对于给定的阵列,VM 部署在“全有或全无”配置中,这意味着完整的数据被完全移动到被测试的存储阵列上。 借助 SANblox,它位于存储设备前面的独特方式,我们能够将存储直接用于一些写入密集型工作负载,以及通过 SANblox 用于大多数操作系统磁盘和 VMmark 工作负载,其中重复数据删除节省了成本是最棒的.. 在我们的特定配置中,我们将所有 VM 迁移到 SANblox,除了我们直接放置在 X-IO ISE 40 上的单个 860GB Mailserver 邮箱虚拟磁盘。

通过我们的优化配置,我们能够使用 X-IO ISE 8 前面的 Permabit SANblox 使用 VMmark 达到总共 860 个区块。这与我们之前直接托管在阵列上测量的 26 个区块的峰值相比。 从性能的角度来看,通过 SANblox 运行我们的工作负载有 70% 的开销。 不过,就数据缩减而言,消耗的空间保持在 1 个 tile。 将额外的图块迁移到阵列上对消耗的空间没有明显影响。 在这种情况下,拥有第二个 HA 对 SANblox 设备将提高整体性能。

结语

Permabit Albireo SANblox 是一种易于部署的设备,通过大大减少组织的数据足迹提供巨大的好处。 Permabit 表示,Albireo SANblox 可以放在任何光纤通道 SAN 前面,客户可以看到数据足迹减少了 6:1。 所有数据缩减都是在 SAN 不知道 SANblox 存在的情况下发生的。 除了典型的 6:1 数据缩减,SANblox 还提供自动精简配置和压缩。 Permabit 是重复数据删除领域历史悠久且广受尊重的品牌,可以帮助客户看到根据工作负载减少占用空间的潜力。

从表面上看,重复数据删除听起来很棒。 组织可以充分利用他们购买的存储,而不是让它被重复的存储填满,甚至旧的基于磁盘的存储也可以重获新生。 Permabit Albireo SANblox 的工作原理与它后面的配置无关,这是考虑它的另一个重要理由。 重复数据删除的最大缺点是性能必须受到影响,在某些情况下,性能受到的影响可能非常大。 潜在客户不应将此视为破坏交易的因素,而应意识到虽然与原始全闪存相比性能受到打击,但它仍然比在类似价格范围内发挥作用的传统 HDD 存储阵列更快。

如果需要超高性能和极低延迟而不是利用他们所有的存储投资,那么他们应该跳过重复数据删除。 但是,如果企业可以承受性能损失并且仍然在其定义的参数范围内运行,那么他们无论如何都应该考虑使用 Permabit Albireo SANblox 等设备。 还有一种折衷方案,第三种选择是通过 SANblox 运行对性能要求较低的数据(例如开发),同时让生产数据通过而不进行重复数据删除。 如何看待我们的绩效结果需要采用类似的思路。 这种比较不是“看看没有 SANblox 时 X-IO 的性能有多好”,而是一种展示人们在将重复数据删除应用到 SAN 时可以预期的性能类型的方式。

如前所述,将设备添加到存储堆栈取决于许多变量。 最终,Permabit 提供的是存储容量和寿命的扩展,尤其是在工作负载没有性能需求的情况下。 在当今的 IT 环境中,像为开发而经常启动数据库这样的任务正在成为标准做法,SANblox 可以在没有数据足迹损失的情况下实现这一点。 集成到企业中也很简单,如果需要调整和定制,该设备允许这样做。

优点

  • 简单集成到存储架构中
  • 符合现代开发实践
  • 可以通过 LUN 打开/关闭

缺点

  • 重复数据删除有开销,对延迟敏感的应用程序可能需要绕过设备

底线

Permabit Albireo SANblox 可轻松集成到现有系统中并执行在线数据缩减,使组织能够充分利用其存储投资的潜力。 数据缩减可以打开或关闭,或仅适用于某些工作负载,以最大限度地提高性能和容量。

Permabit Albireo SANblox 产品页面

讨论这篇评论

注册 StorageReview 时事通讯