在小型办公室和远程/分支办公室(ROBO)环境中,计算资源的部分和持续管理一直是个问题,可能有很多不同的竞争因素要思考。许多企业和中小型企业(SMB)依靠ROBO HCI系统来处理日常的关键业务交易,而这些交易是这些组织的脉络。这些系统要求成本低,但又具备高性能,提供其他,组件数量要尽可能少,维护良好,但每个站点又没有特殊的昂贵IT资源和人员。
适用于微软件Azure Stack HCI的戴尔易安信解决方案
在小型办公室和远程/分支办公室(ROBO)环境中,计算资源的部分和持续管理一直是个问题,可能有很多不同的竞争因素要思考。许多企业和中小型企业(SMB)依靠ROBO HCI系统来处理日常的关键业务交易,而这些交易是这些组织的脉络。这些系统要求成本低,但又具备高性能,提供其他,组件数量要尽可能少,维护良好,但每个站点又没有特殊的昂贵IT资源和人员。
幸运的是,IT供应商已经了解了ROBO系统的特殊挑战,并提出了应对这些挑战的解决方案。在本文中,我们将探索运行微软件的戴尔科技硬件如何应对这些挑战。我们的方案将与我们的常规文章有一些不相同。在常规文章中,我们通常侧重于系统性能。虽然我们将对系统进行性能测试,但我们也将从初开始开始计划模型确定开始,对其整个生命周期进行检查。
ROBO人机交互简介
这里测评的系统是适用于微软件Azure Stack HCI群的戴尔易安信解决方案,其中包含2个运行Windows Server 2019 (2NC)的AX节点。今年早些时候,戴尔科技发布了专为运行Azure Stack HCI而设计(带试验证明和认可)证)的AX节点。戴尔科技目标前在其解决方案组合中提供了三种不同的节点类型:AX-640、AX-740xd和AX-6515。在这些节点中,每个型号都让客户能够通过配置不同的组件,为其ROBO HCI部分设计理念的平台。
AX-640和AX-740xd节点是双插槽节点,使用第二代英特尔至强可扩展处理器,而AX-6515是单插槽节点,运行64核第二代AMD EPYC处理器。戴尔易安信的AX节点型号允许客户选择最适合其用例的节点。AX-640面向计算密集的工作负载,AX-740xd面向存储容量大的工作负载,而AX-6515则面向需要在企业数据中心实现价值优化系统和处理器多样化的用户。

我们将在本文中详细探讨的系统是AX-640,这是一款双插槽1U节点,支持96到768GB的内存。它可以配置3到92TB的NVMe、SSD和/或HDD存储器,以创建混合或全闪存存储。它目前是AX产品组合中唯一支持英特尔超高性能傲腾持久内存和SSD设备的节点。如果配置得当,AX-640节点是最快商用HCI节点称号的有力竞争者。戴尔科技提供了一张简单明了的图表,概述了其AX节点的Azure Stack HCI配置选项。
本文将探讨的AX-640节点配备了双英特至强6230 CPU、384GB DDR4内存以及十个4TB NVMe SSD。
在部属ROBO HCI解决方案时,拥有可靠和性能出众的硬件只是故事的一半;另外一半是软件。在本文中,我们将运行一次Azure Stack HCI试验的系统。Azure Stack HCI允许客户运行Windows Server操作系统,并通过微软件Windows管理中心无线连接到Azure云端以获取额外的服务(如备件和灾难修复)。Azure服务通过同一个管理平面中的WAC扩展进行集合。
Azure Stack HCI使用Hyper-V作为其管理程序,使用存储空间直通作为其本地存储器。在ROBO HCI部分中使用2NC可以大大降低实施成本。对于极其注重成本的实施,可以将其配置为2NC方式工作,无需为其他存储结构单链或双链配置交换机。对于采用交换机的实施项目,10GbE网络即可工作。戴尔科技术推荐使用 25GbE 存储网络,因为它的成本并不会比 10GbE 网络高太多。
显然,如果系统不可恢复,减少公司在设备上的投资是不可能的。在每个系统上,存储空间直接支持双向以和三向镜像及单奇偶校试、双奇偶校试擦除编辑码。微软件在描述这些不同保护方法的存量效率、一般优势和权衡方面做得非常好。我们推荐大家仔细阅读,以确定哪种方案最适合您的环境。镜像通常是性能最强的,这也是我们测试中使用的方案。
Azure Stack HCI可以使用复组双向镜或复组镜加速奇偶校试作为还原的一种选择。前者可提供更好的性能,后者可提供更高的数据效率。双向镜像针对主机上的数据和其他节点上的数据制作一个RAID 1副本。套镜像加速奇偶校试在每台服务器上制作一份数据副本,但使用擦除编码方式,而不是RAID 1,以保证数据的恢复能力(但最近的写入使用双向镜像,以确保可靠)。套双向镜像的数据效率为25%,因为数据的四份复制都会写入磁盘;相比之下,附套镜像加速奇偶校试的数据效率为33%到40%。

这两种方法都能同时支持硬盘故障和服务器故障。
两种套件都不需要特殊的RAID硬件。
微软2NC拓扑需要一个作为中立第三方的证明,为幸存点增加一张票,以防出现“分区”场景。您可以使用文件共享(我们在测试中使用的方法)或Azure云作证。如果群集的两个节点均有可靠的互联网连接,微软件建议使用后端。Azure云验证是一个blob存储对象,而文件共享则是SMB文件共享。见证只包含见证日志文件。
ROBO HCI 采购和安装
正如所承诺的,我们希望全面地了解如何在ROBO场景下采购、部门和管理AX节点群需要哪些东西。
部属新系统时,第一步是确定系统规范。戴尔科技让客户可以通过Live Optics轻松计算出部所需要的设备。Live Optics是一项免费费用的在线工具,用于收集有关环境的存储、数据保护、服务器和文件系统的信息。虽然它在部署后24小时内就能深入了解环境,但您让Live Optics运行的时间越长,它对您正处于运行的工作负载的特性会有更好的理解。Live Optics可以从微软件Windows、VMware vCenter或Linux/Unix服务器收集数据。
Live Optics仪表板将会发现有关整个环境的CPU、内存和存储使用情况的编译数据。所有这些数据将帮助您准确地了解您的环境环境中需要什么样的系统。如果您想让其他用户(如同事、 VAR等)提出计划模型,您也可以与他们分享这些数据。

从Live Optics中集的数据使用于Azure Stack HCI规范确定工具。该工具可通过戴尔科技客户团队获得,内部设置了所有工程的最佳实践续,不仅可以生成满足您当前需要的配置选项,而且也可以考虑到您未来的增长。
ROBO环境的其中一个问题就是寻找本地IT人才能进行设置和配置。完成这项工作的其中一种途径就是使用戴尔易安信的ProDeploy服务。这种方式可以帮助企业加快程站点,这意味着系统可以立即上线并增值。另外,如果您拥有本地资源并希望自己部属,戴尔也有文档和脚本指南您完成此一过程。
对于任何组织来说,最头疼的问题之一就是为系统提供支持。支持恢复杂系统的一大难题在于摸及许多硬件和软件提供应用商。例如,您可能有一个应用商提供服务和存储器,或者一个供应商提供网络交换机,第三个供应商提供操作系统。戴尔易安信的ProSupport服务为HCI解决方案配件专门的支持人员,帮助简化了这一过程。这些支持工程师经过培训,对戴尔Azure Stack HCI系统的硬件和软件都很好理解。如果需要,他们知道将问题上报给合适的人。
当我们在安装系统时无意中配置错误时,我们有机会协助戴尔科技HCI解决方案的专职支持人员。与我们合作的支持工程师知识渊博,能够帮助我们走出困境。
AX节点日常理
在完美的世界里,ROBO HCI部根本不需要管理。但现在实际上并不是这样,戴尔科技和微软件提供了次优选择。当系统位置远程序位置,只有很少或没有本地IT支持时,要有系统维护所需要的工具就显得非常重要。戴尔科技使用Windows Admin Center (WAC)和一些面向自己IP的扩展,即适用于Windows Admin Center的戴尔易安信OpenManage Integration解解决方案来现实这一点。
WAC是一个基于浏览器的管理平台工具,用于管理Windows 10和Windows Server。它安装在客户系统上,通过Windows远程管理(WinRM)使用远程电源Shell 和 Windows Management Instrumentation (WMI) 来监控和管理 Windows 系统和 Azure Stack HCI 群。
WAC的概览窗格提供系统资源使用情况摘要和管理系统证明书和设备所需的工具。WAC还允许您查看事件和进程,安装角颜色和功能,并管理本地用户和组、防火墙、服务和存储。

戴尔科技利用WAC的可扩展性,创建了与面向微软件Windows Admin Center的戴尔易安信OpenManage Integration (OMIMSWAC)工具。这样做的目标是为了简化深度固化件监控和存储,协调BIOS、固件和驱动程序更新的过程。OMIMSWAC使用Windows Server 2019的群知道更新功能来更新AX节点和Azure Stack HCI群。要启动OMIMSWAC,请单击位在WAC功能区上的Dell EMC OpenManage 集成。
启动WAC,单击“Settings”设置,然后单击“Extensions”扩展,在搜索文档中输入Dell EMC,选择Dell EMC Open Manage Integration,然后单击安装,即可将OMIMSWAC添加到系统中。
我们可以使用OMIMSWAC来查看我们的群,可以查看系统的健康状况,并深入到硬件查看其他组件的存储以及它们所使用的固定件。
您甚至可以使用OMIMSWAC来启动iDRAC控制台,对AX节点进行带外管理。
一时发现群,就可以使用OMIMSWAC查看群级节点的合规性报告。如果未在“Settings”中配置Dell EMC System Update (DSU)和Dell EMC Inventory Collector (IC),当运行OMIM SWAC的系统拥有互联网连接时,系统将自动从 download.dell.com 下载 Dell EMC System Update (DSU) 和 Dell EMC Inventory Collector (IC) 实用工具,以进行合规性检查和更新目标节点。
OMIMSWAC在完成常规任务(如更新)方面确实大放异彩。OMIMSWAC不仅会自动下载所需要的Dell Update Packages (DUP),还会对群进行滚动更新,以消除停机时间。
AX节点测试
当我们查看戴尔易安信的2节点HCI集群时,我们希望同时查看其性能和不同故障场景中的应用可用性。为此,我们配置了一个SQL Server性能测试,由平衡在我们的2点群上的多达8个运行Windows Server 2019的SQL Server 2019虚拟机组合。然后,每个SQL Server实例都被赋予一个1500规格的TPC-C数据库,其中的数据库和日志文件相 当于每个实例350GB容量。给我们提供了一个数据库存储占用情况,范围从4虚拟机1.4TB到8虚拟机2.8TB。我们使用Quest的Benchmark Factory作为这个项目的工作负载生成器,每个虚拟机有15000个虚拟用户进行交互。
每个虚拟机都被分配了8个虚拟CPU、60GB RAM及存储占用情况。我们的群集配置为每台主机384GB RAM,在我们的故障节点场景中,我们将虚拟机RAM分配降低到40GB,以适应单一主机上的所有8个虚拟机。
我们的数据库的四个测试场景是:
- 工作集群:共8个虚拟机,每个节点4个虚拟机
- 每个节点上有1个故障SSD:共8个虚拟机,每个节点4个虚拟机
- 一个故障节点:共8个虚拟机,每个节点4个虚拟机
在我们的第一次测试中,测试量8个虚拟机的性能,每个节点上4个虚拟机,数字增加到平均5ms。

虽然强大的性能和低数据库延迟是很好的事情,但是了解了平台在不太理智条下的表现同样重要。我们的第一个场景涵盖了平台如何应对SSD故障。我们启动了工作负载,在工作负载刚稳定后,我们马上从一个节点上拔出一块SSD。在这种情况下,性能可以从正常情况下的5ms略微放宽到6.5ms。
我们的第二个场景测试的是,如果一个节点脱线维护,群将如何运行,或者如果一个节点故障,任务将如何运行行。在这两种情况下,一次都会回到只有一个节点的状态。尽管有一个微妙的优势,即没有流量通过后端网络,但区域别大。在这种情况下,我们测得的平均延迟为5.875ms。
写在最后
我们看到越来越多的人对 2NC 在 ROBO 中的应用感兴趣。动态的系统,因为获得这些IT资源可能是一个难题。面向Azure Stack HCI 的戴尔易安信解决方案满足了所有这些需求。

我们研究了正确确定2NC ROBO HCI系统的规范、获取和设置的路径。戴尔科技给我们留下了深刻的印象,因为它让一刀变得如此简单。在了解完初始系统设置后,我们又看有了维护系统所需要的工作,WAC使这一过程变得如此简单,再次给我们留下深刻的印象。然而,真正让我们震惊的是戴尔科技的OMIMSWAC集合,因为它对我们的系统进行了滚动升级,涵盖了从固定件到上层的所有内容,几乎不需要操作员的互动。这是戴尔科技的一个最根本的与众不同之处,因为这种深度集合对Azure Stack HCI提供商来说是独一无二的。
当我们在系统上运行基准测试时,我们发现在最佳条件下,应用工作负载性能强劲。我们的SQL Server TPC-C工作负载在4个均匀放置在群集中的1500规模虚拟机上测得的数据为2.25ms,当工作负载增加到8个虚拟机时,测得数据为5ms。不过,更令人印象深刻的是,在一个SSD发生故障或只有一个节点运行的情况下,群集的表现。在第一种情况下,有一个SSD故障,我们的8虚拟机工作负载延迟从5ms增加到6.5ms。不过在一个节点完全离线的情况下,延迟几乎没有超过5.875ms。
总的来说我们在这个系统上的测试,我们发现它可以轻松处理ROBO部服会给它带来的负载。这一点很重要,这一类部属对系常规性的忧虑比较少,更多的是忧虑长周期运行。对于第一点,戴尔科技已经将这些AX节点设计到了基本无需要承担能力问题的等级。问题地被吸取,我们所有的测试都验证了这一点。
如果有效解决了ROBO HCI用例的性能问题,那么企业就需要转向第2天的操作。这才是戴尔易安信AX节点真正开始拉开距离的地方。从持续管理的角度来看,与WAC集合而来进行群更新是至关重要的。在Azure Stack HCI方面,戴尔科技显然独领风骚。最后,企业应注意系统的复原力。只有两个节点,而且在很多情况下没有及时的现场支持,经常运行时间对业务至关重要。在我们对几种下降状态的测试中,AX节点在没有中间断的情况下坚守岗位,这意味着办公室始永久保持在线,不会对应用性能产生影响。部属Azure Stack HCI方法有很多,但是没有比戴尔科技的AX节点更全面的解决方案了。
