主页 企业 规模计算:拆箱立即启动并运行

规模计算:拆箱立即启动并运行

by 哈罗德弗里茨

Scale Computing 声称拥有一个 HCI 解决方案,可以在几分钟内安装,不到一个小时即可投入生产,并且专为边缘位置而构建。 作为边缘计算、虚拟化和超融合解决方案的领导者,Scale Computing 设计了一个非常适合边缘并且可以在几分钟内安装的系统。 StorageReview 决定让他们承担这项任务,并记录从拆箱到启动和运行的步骤,看看它是否像他们声称的那样简单。

Scale Computing 声称拥有一个 HCI 解决方案,可以在几分钟内安装,不到一个小时即可投入生产,并且专为边缘位置而构建。 作为边缘计算、虚拟化和超融合解决方案的领导者,Scale Computing 设计了一个非常适合边缘并且可以在几分钟内安装的系统。 StorageReview 决定让他们承担这项任务,并记录从拆箱到启动和运行的步骤,看看它是否像他们声称的那样简单。

Scale Computing 发送了一个 3 节点系统,通过电子邮件发送了相关的数据表,并在我们需要时设置了一个支持电话来完成安装。 这与典型客户在购买 Scale Computing HyperCore 集群时会经历的过程相同。

SC//超核

SC//HyperCore 消除了对传统虚拟化软件、灾难恢复软件、服务器和共享存储的需求,取而代之的是一个完全集成的、高可用的系统来运行应用程序。 使用获得专利的 HyperCore™ 技术,自我修复平台可以实时自动识别、缓解和纠正基础设施问题,使应用程序能够实现最长的正常运行时间。 当易用性、高可用性和 TCO 很重要时,NUC 11(HE151)上的 Scale Computing HyperCore 可能是您组织的基础架构平台。

在开箱仪式上,我们首先注意到的是 HE151 的尺寸。 这些东西很小! 基于英特尔下一代计算单元 (NUC) 11 平台,机箱尺寸为 117 x 112 x 54 [mm] (LxWxH)。 查看下方 NUC11 上的 Scale Computing HyperCore 的规格。

SC//平台设置和配置

拆箱 Scale Computing Platform 时,必须将节点序列号和关联的软件密钥放在一起,因为它们需要在集群的初始配置期间匹配。 遵循安装数据表将为您准备安装过程中的后续步骤。

初始设置很简单。 将节点放置在所需位置,连接电源,然后插入两根以太网电缆。 两条以太网电缆在发生交换机故障或其他灾难时提供冗余。 在按下设备前面的电源按钮之前,节点不会启动。 在服务器初始化时,找到带有每个节点的序列号和软件密钥的卡。

设备背面提供两个 HDMI 接口。 将电缆连接到其中一个 HDMI 端口。 希望那根电缆的另一端有一台显示器。 大约一分钟后,服务器将询问登录信息。 请务必注意,只有在初始设置期间才需要通过命令行登录系统。

节点初始化后,将通过 Cluster Manager GUI 进行访问。 默认登录名是 admin/admin。 登录后,以下提示要求输入 IP 地址以访问 Scale UI(Scale Computing 提供的信息)。 接下来,输入节点的 IP 地址,然后提示输入硬件序列号和软件密钥。 将密钥输入节点时,连字符是可选的。

节点 1 就是这样。现在在节点 2 和节点 3 上执行相同的步骤。

所有三个节点都初始化后,重新登录到每个系统以输入初始化节点和集群的命令。 登录后,输入“sudo scnodeinit”以初始化节点。 完成此命令大约需要一分钟。 完成该命令后,输入第二个命令“sudo scclusterinit”以指示该节点在其他节点处于活动状态时加入集群。 对于小型安装,集群命令大约需要五分钟才能完成。 更大的集群环境将需要更长的时间来初始化。

初始化后,可以通过 Scale Computing UI 访问集群。 使用节点的相同登录信息 (admin/admin) 登录到 Scale Computing UI。 此时,集群已准备好加载所需的操作系统。 如果安装 Windows Server 10,相应的驱动程序将自动安装。

规模计算集群管理器

Scale Computing 使集群管理器像安装和创建集群一样易于使用。 管理 Scale Computing Cluster 有两种方法:本地集群管理器和 Fleet Manager 云访问。 本地集群管理器是通过已安装集群的图形用户界面。 我们只有一个本地三节点集群,因此这通常是管理像我们这样的小型安装的方法。

Fleet Manager 是一个云选项,用于管理安装在远程位置的集群,以及用于从任何地方访问已安装集群的管理工具。 通过 Scale Computing 云访问 Fleet Manager。
当您从 Scale Computing 购买系统时,需要在 Scale Edge 上设置一个帐户以获得支持、开票、软件访问等。该登录信息用于访问 SC//Fleet Manager,并且特定于您安装的簇。

本地集群管理

以下是我们本地集群的屏幕截图。 通过连接到本地集群的 IP 地址(通常来自同一网络)来提供对 GUI 的访问。 界面直观且易于使用。

显示集群中每个节点的详细信息以便于识别。 显示屏右上角突出显示警告消息,以及用户名和注销选项。 甚至可以选择直接从管理窗口与 ScaleCare 支持人员聊天。

因为我们的安装非常基础,所以信息可能不太令人兴奋,但这在生产环境中是一个有价值的工具。 屏幕左侧的显示选项可用于获取集群和节点的运行状况详细信息。

显示屏是分开的,在上半部分显示 RAM 或磁盘信息。 选择 RAM 视图时,顶部还将显示特定 VM 以及已分配、已用和可用内存的详细信息。 双击顶部的 VM 将带您进入该虚拟机和已安装的操作系统。

以下部分基于特定于该虚拟机的配置。 显示的中间是对该集群中 VM 的全局访问。 显示屏下部左侧下方的图标也是如此。 每个 VM 窗口中的图标只会影响该 VM 的输出。

选择齿轮图标将显示集群中所有 VM 的配置。

可以选择特定于单个节点和组件的工具并查看集群。 在 VM 视图中选择齿轮图标可以访问文件系统和已安装的操作系统,并能够弹出特定磁盘。 根据每个节点的配置,可以滚动每个节点以获取文件系统详细信息。 堆栈图标将为您提供有关任何快照的详细信息以及执行即时快照的选项。

将管理窗口顶部的视图从 RAM 更改为 DISK 将更改该部分中的显示。 还有一个选项可以通过单击所有虚拟机详细信息并从下拉菜单中选择操作来同时跨集群中的所有节点执行功能。

选择中间栏上的齿轮图标将提供更多特定于集群的选项。 这些选项中的每一个都将提供更多详细信息。 下面的屏幕详细介绍了集群日志。

选择特定于 VM 的图标之一可以更改该节点的显示输出,而不会影响其余集群的显示。 选择特定 VM 上的齿轮图标可提供执行测试、电源循环、检查磁盘目标等的选项。

移动虚拟机既快速又简单

移动 VM 就像拖放一样简单。 在节点显示中,选择仪表图标。 节点底部的图标显示更改并提供用户维护、移动 VM、删除 VM、克隆和快照的选项。

选择移动图标(看起来像一个堆栈,其中一部分向右伸出)以移动 VM。 选择它将更改管理器的上半部分并提供可用节点来移动该特定 VM。 选择要移动 VM 的节点。

右下角会显示一个弹出窗口,其中包含有关移动的信息。

VM 移动后,显示屏将显示新位置以及该节点的详细信息。

将 VM 移回原始位置同样简单。

当 VM 移动到选定位置时,显示屏将指示所做的更改。

有几个选项可以让 VM 的节点视图变得简单。 需要克隆虚拟机? 选择“相机”旁边的图标以显示一个弹出窗口,其中包含用于克隆 VM 的所有适当字段。

快照同样简单。 单击相机并拍摄快照。 弹出窗口提供了为快照添加标签的机会。

编辑 VM 快速且易于访问。 选择扳手将显示一个编辑框,用于更改 VM 参数、名称、启动类型等。

在 VM 视图中选择齿轮将提供添加磁盘和配置网络端口的选项。

单击看起来像外部磁盘的图标并提供必要的信息以添加驱动器。

VM 节点视图中的最后一个图标提供了 VM 特定命令的选项。

提供了一个弹出窗口,可以轻松导出 VM。

位于中心栏左侧的看起来像一个带箭头指向它的框的图标将打开一个弹出窗口,提供导入 HyperCore VM 所需的输入字段。

可以通过选择中心栏中的齿轮图标来访问控制中心菜单。 本地集群管理器的这一部分提供了日志、条件、软件更新等。

显示是按字母顺序排列的,第一个选项是“集群日志”。 所有事件都将显示在此窗口中。 显示的事件来自我们之前进行的一些测试。 我们执行了强制断电以查看集群将如何处理虚拟机。 详细信息将在文章中进一步介绍。

“条件”将显示配置或集群中的任何异常情况。

“控制”允许通过单击关闭整个集群。 Scale Computing 要求在关闭之前联系他们,因为集群还与 Scale 云服务通信以进行远程管理和支持。

选择“媒体”可以查看加载和运行的系统以及上传新 ISO 的选项。

可以从此屏幕访问和管理部署了远程集群的客户。

“远程支持”屏幕链接到 Scale Computing 支持以连接集群和排除故障。

任何系统时间表都会显示在“时间表”屏幕上。

系统设置显示在此屏幕上。

可以从此屏幕管理 SSL 证书。

如果 Scale Computing 有集群的更新,除了屏幕顶部版本号附近的“可用更新”提示外,还会显示在该屏幕上。 它节省了管理员搜索任何可用更新的时间。

集群会主动联系 Scale Computing 以验证集群是否正在运行最新版本,确保环境可以访问最新的功能和增强功能以​​及错误和安全修复。 通过以滚动方式应用更新,应用这些对于用户和集群上运行的工作负载的任何连接都不是事件。

如果需要添加或更改用户信息,可以从“用户管理”屏幕完成。

也可以从此菜单联系 Scale Computing Support。 这包括以客户或合作伙伴身份打开工单的选项,或者如果需要立即响应,则会显示拨打支持的号码。 有指向文档的链接和对用户社区的访问。

Scale Computing 非常有效地使用了社区概念。 有一个单独的 Web 位置,用户可以在其中共享信息、向他人寻求帮助、检查配置选项等。 对于部署这些集群的任何人来说,这是一个很好的工具。

如果一个节点在规模计算集群中发生故障会怎样?

我们想看看集群如何处理突然的电源循环,所以拔掉了其中一个节点的插头。 我们记录了事件的顺序,包括从电源故障到电源恢复的系统消息。

在 TestVM2 节点上拔下插头后,警报计数器(位于显示屏的右上角)加一,右下角的弹出窗口指示冗余问题。

查看 Control Center 中的集群日志,错误消息表明节点无法访问,并带有通知、严重和警告消息。 SC//HyperCore UI 还在右下角显示了新消息。 无论当前屏幕如何,这些弹出窗口都会显示。

管理器屏幕顶部的节点视图指示 VM 处于脱机状态。 右上角的错误计数器也增加了,表明有更多错误。

清除了信息警报以仅提供当前警报以专注于手头的问题。

此视图显示来自故障节点的 VM 已移动到其他节点之一。 这是一个不需要任何干预的自动化过程。 来自 TestVM1 的资源已更新以反映负载、磁盘使用情况和可用性。

集群日志也已更新,以指示 VM 在故障节点中的新位置,显示为信息警报,因为 VM 已备份并正在运行。

现在 VM 已经启动并可供用户使用,“故障”节点被插入并启动。

一旦节点可用,集群日志就会指示 VM 将重新加入原始集群。

该节点通过背板显示为可用,并且警报已从管理器屏幕顶部的指示器中清除。 弹出窗口也在清除。

这是虚拟机尝试重新加入首选节点时弹出窗口反映的信息的更大视图。

显示显示节点在线,但 VM 尚未迁移。

一旦虚拟机返回到首选节点,屏幕就会更新位置,资源也恢复正常。 该日志还指示 VM 已返回到首选节点。

而一切又回到了原来的状态。

这个序列的主要收获是整个过程是自动的。 集群上没有任何配置来强制从故障节点移动 VM。 Scale 集群负责从断电到通电再重启的所有过程。

如果有必要关闭节点,Scale Computing 会要求在关闭系统之前联系支持人员,这会向远程系统发送警报。

本地集群管理器提供了大量信息和整体配置。 如果发生故障,集群管理器会提供即时的详细信息和集群采取的自动操作。

SC//车队管理器远程管理

Scale Computing Fleet Manager 是第一个为大规模超融合边缘计算基础设施构建的云托管监控和管理工具。 SC//Fleet Manager 可以轻松安全地监控和管理运行 Scale Computing HyperCore 的整个集群。 对于拥有多个集群的 IT 经理,由于该平台设计简单,维护时间将减少 50% 或更多。

SC//Fleet Manager 整合了所有 SC//HyperCore 集群的实时条件和资源利用率。 SC//Fleet Manager 消除了导航到各个集群 UI 的需要,使管理人员能够从单一管理面板查看每个集群。

SC//车队管理器特点:

  • 通过任何设备(甚至是移动设备)上的任何浏览器快速浏览检查连接和运行状况
  • 深入到特定集群以诊断和修复任何问题
  • 在集群、节点和 VM 级别实时查看 CPU 和磁盘利用率
  • 深入到任何集群的 HyperCore 登录
  • 一目了然查看所有集群的当前固件
  • 从 SC//Fleet Manager 中单击一次,将固件升级应用于集群
  • 从单一管理平台监控整个机群中集群的实时固件升级

SC//车队经理在行动

登录云托管的 SC//Fleet Manager 可提供有关全球所有集群的详细信息。 GUI 的外观和感觉类似于本地管理器。

显示屏左侧下方有图标,用于访问集群、执行特定管理功能以及添加用户和组织详细信息。

这是包含运行状况详细信息以及内存、磁盘和 CPU 利用率的集群视图。

单击速度计图标会将显示更改为仪表板视图,详细说明集群和节点事件。

通过选择插头图标访问特定于节点的功能。

单击用户图标会提供一个用于添加或修改用户帐户的屏幕。

齿轮图标将显示组织详细信息。

在屏幕的右上角,有一个选项可以在不登录另一个系统的情况下与支持人员聊天或查看文档。 另一个图标将使用户退出 SC//Fleet Manager 工具。

SC//平台功耗

该 SC//HyperCore 集群在紧凑高效的英特尔 NUC 11 平台上运行,非常省电。 鉴于 Scale Computing 集群的灵活部署选项,我们使用 XiTRON XT2640 功率分析仪测量了集群在启动和正常运行时的功耗。

分析仪显示,在启动过程中,随着每个节点开启,功率逐渐上升。 我们延迟按下每个节点上的电源按钮约 5 秒,以查看每个节点增加的抽取量。 分析仪在快速启动过程中测得的峰值功耗低于 150 瓦,然后逐渐降低其基线功耗。

在 3 节点集群在线且我们的 3 个虚拟机处于活动状态的情况下,集群的总功耗保持在 90 到 115 瓦之间。 这只是单个全尺寸服务器消耗的一小部分,这使得这些紧凑型节点几乎可以部署到任何位置。

询问规模计算社区

Scale Computing 拥有非常活跃的用户社区。 如此之多,以至于有一个专门的网站供用户和订阅者提问、发布解决方案、获得建议以及与其他 Scale Computing 用户互动。 当然,如果社区网站上没有答案,我们始终提供 24/7 全天候支持。

社区网站位于 社区.scalecomputing.com. 注册也很简单。 注册用户可以从主页查看知识库、打开案例或查看状态、获得入职帮助、访问用户论坛以及下载软件更新。 Scale Computing 投入了大量精力来维护这种类型的访问。

Harrison Steel Castings Company——早期采用者

在考虑小型 HCI 集群可以在哪里增加价值时,边缘应用程序会立即冒泡到顶部。 边缘市场现在很火爆,安装和操作小巧简单的解决方案有很多机会。 零售业是首要考虑因素,安全性可能紧随其后。 但是,在我们的边缘场景中,一家铸钢公司会排在名单的后面多远?

输入 哈里森铸钢公司. Scale Computing 的客户 Harrison Steel Castings Company 同意花几分钟时间介绍他们对 Scale Computing 的 HyperCore 解决方案的体验。

顾名思义,这家位于印第安纳州的公司从事生产精密设计的铸钢解决方案的业务。 这些铸件中的每一个都可能需要数周的时间才能生产出来,如果不合适的铸件被认为有缺陷,则必须将其全部报废。

铸钢件并不像听起来那么简单。 该过程中的某些阶段需要特定的振动、添加测量的熔化物和温度监控,仅举几例。 Harrison 需要一种经济高效、易于管理、可靠的解决方案来帮助他们收集这些传感器数据。

这种工业边缘问题非常普遍。 公司发现,如果他们能够有效地跟踪湿度、振动、PSI、来自机器的遥测数据和其他重要数据等元素,那么这些新的可操作见解将影响业务运营和盈利能力。

Harrison 致力于此分析之旅。 他们正试图发现他们的工程师如何更好地利用数据来减少浪费并最终提高效率和盈利能力。 他们最初的 HE150 HCI 集群非常有效地处理了这项任务,作为所有这些传感器数据的聚合器坐在车间里。 每天晚上,Harrison 都会对数据进行批处理,并将其导入包含 Scale Computing 更大的 HCI 系统的核心数据中心,以进行进一步处理和分析。

在成功进行为期六个月的概念验证后,他们购买了一个生产集群。 生产 H150 集群在测试环境中投入了六个月,并最终投入生产。 该生产集群已经运行了六个月,从第一天起就没有对任何单位提出投诉。

Harrison Steel Castings 的 IT 总监 Shane Rogers 从一开始就参与了 Scale Computing Platform 的安装,并且是数据收集分析的倡导者。 当被问及可靠性和故障时,Shane 说:

“我们保留了 POC 集群,这些集群已经运行了将近两年而没有出现故障。 铸造厂环境并不漂亮。 微尘是我们处理的一个大问题。 因此,为了保持对系统的掌控,我每隔一段时间就会让我的生产节点出现故障,只是为了测试故障转移。 他们工作得很好。 我将在集群上四处移动节点,以确保每个节点都得到有效利用。”

最终,正是这种易于管理的方式为 Harrison 带来了巨大的收益。 正如我们在实验室测试中看到的那样,在第 0 天启动系统非常简单。 尽管如此,从那时起持续的运营收益可能难以量化,但客户对此表示赞赏。

总结

NUC11 上的 Scale Computing HyperCore 实现了承诺。 Scale Computing 的人员告诉我们,可以在 30 分钟内启动并运行 HyperCore 集群,他们达到了目标。 通过一组易于导航的工具,设置和配置非常直观。 当然,Scale Computing 通过 Zoom 提供支持,可以引导任何人完成整个过程,以确保过程中没有任何障碍。

安装节点之前提供的数据表详细说明了这些步骤,因此在此过程中没有任何意外。

规模计算

由英特尔® 提供支持的边缘计算转型

Scale Computing Platform 是英特尔物联网 RFP 就绪套件(英特尔 RRK)。 英特尔 RRK 是专注于解决一类市场问题的技术产品,已在现场部署和测试,并提供捆绑的硬件、软件和支持。 该技术具有可扩展性,旨在随着客户需求的增长而发展,从而加快开发速度并缩短上市时间。

英特尔提供针对企业优化的节能性能和智能。 借助边缘的视觉技术和深度学习功能,您的企业可以实现新的用例和更快的响应时间。 我们内置的安全功能基线套件可以更轻松地实施一致的安全模型,帮助抵御各种威胁。1

借助广泛的连接支持,英特尔简化了设备与云之间的数据共享。 我们的虚拟化专业技术可帮助您简化 IT 环境,提高技术投资的效率和价值。 由于英特尔产品专为高可靠性和长使用寿命而设计,因此您可以信赖多年的支持。

当今可用的解决方案使边缘实施变得简单和无缝。 结果意味着在没有架构复杂性或 IT 人员限制的情况下快速开发和分发新技术的全部能力。

1没有计算机系统可以绝对安全。 请咨询您的系统制造商或零售商,或访问 intel.com 了解更多信息。

本报告由 Scale Computing 赞助 本报告中表达的所有观点和意见均基于我们对所考虑产品的公正看法。

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | TikTok | RSS订阅