主页 Enterprise DPU 生命周期管理需要 Creative 服务器解决方案

DPU 生命周期管理需要 Creative 服务器解决方案

by 哈罗德弗里茨

在数据驱动应用程序主导的时代,长期由 CPU 和 GPU 主导的传统计算格局正在经历范式转变。 随着企业和机构进入更复杂的计算环境,特别是随着人工智能 (AI)、大数据分析和云原生应用领域的蓬勃发展,对处理能力的需求已经发生了变化。 数据处理单元 (DPU) 带来了另一个元素,但企业中的 DPU 生命周期管理比听起来要复杂一些。

在数据驱动应用程序主导的时代,长期由 CPU 和 GPU 主导的传统计算格局正在经历范式转变。 随着企业和机构进入更复杂的计算环境,特别是随着人工智能 (AI)、大数据分析和云原生应用领域的蓬勃发展,对处理能力的需求已经发生了变化。 数据处理单元 (DPU) 带来了另一个元素,但企业中的 DPU 生命周期管理比听起来要复杂一些。

DPU 生命周期管理 NVIDIA BlueField DPU

NVIDIA BlueField DPU

DPU 通常称为 SmartNIC 或基础设施处理单元 (IPU),通过成为计算 (CPU)、图形 (GPU) 和存储网络基础设施之间的纽带而发挥着关键作用。 DPU 在公共云和超大规模数据中心部署多年,将常驻工作负载与网络、安全、存储和其他通常与数据中心功能相关的基础设施操作隔离开来。 这种增强的功能将 CPU 和 GPU 从这些任务中解放出来,使它们能够专注于计算和渲染的主要功能。

DPU 的引入带来了一系列新的挑战——如何管理、优化并确保这些单元与现有基础设施的无缝运行。 DPU 管理变得至关重要,因为它引入了新的复杂性。 适当的管理可确保充分利用 DPU 的潜力,提供诸如减少延迟、提高吞吐量和提高整体系统效率等优势。

将 DPU 集成到更广泛的计算生态系统中并确保有效的 DPU 管理、企业和机构可以解锁新的性能、敏捷性和可扩展性领域。 随着世界不断朝着更加以数据为中心的运营迈进,拥抱和管理 DPU 将成为在数字领域保持竞争优势的基础。

VMware,DPU 技术兴趣背后的驱动力

DPU 已成为计算领域的一项变革性技术,在当今市场上获得了极大的关注和吸引力。 随着组织努力应对数据爆炸式增长、工作负载日益复杂以及对更高性能和效率的需求,DPU 已成为一种强大的解决方案。

VMware 一直致力于将其软件堆栈引入 DPU。 然而,与 DPU 硬件相关的专有、特定于供应商的软件使集成任务变得更具挑战性。 当 VMware 扩展时,大门敞开了 DPU 对 vSphere 的支持,使客户能够使用其首选的虚拟化堆栈实现通常与云到数据中心相关的效率。 DPU 也是 vSAN 8 的基本组成部分,可以卸载安全和网络任务。

DPU 生命周期管理 Riser 1 中的 NVIDIA BlueField DPU

Riser 1 中的 NVIDIA BlueField DPU

VMware 显然打算随着时间的推移继续更多地利用 DPU; 考虑未来某些 vSphere 节点完全由 DPU 驱动、完全不使用 x86 也并非完全不可能。 不过,VMware 已经开始宣传 DPU 带来的性能提升。

VMware,在 vSphere 8 上运行 REDIS 键值存储,发现启用 DPU 的主机实现的性能与未启用 DPU 的主机相似,但 CPU 核心数减少了 20%。 在另一项测试中,启用 DPU 的主机吞吐量提高了 36%,事务延迟降低了 27%。

由于 VMware,DPU 的兴趣不断增加,像戴尔这样的供应商必须找出将 DPU 纳入设计的方法,同时又不能忘记 DPU 生命周期管理。 事实是,DPU 本质上是它们自己的计算机,其管理设计为通过以太网或其他管理端口在本地完成。 但这与企业管理硬件生命周期的方式不一致,因此当戴尔采用 DPU 时,他们必须发挥一点创意。

Dell PowerEdge、DPU 和 iDRAC

当您查看 NVIDIA BlueField DPU 的端口端时,它看起来就像一个标准的 NVIDIA ConnectX NIC,带有一个额外的以太网端口用于管理。 不过,如上所述,企业希望能够通过通用生命周期管理控制台来管理所有服务器组件。 对于戴尔来说,这意味着 iDRAC。 因此,戴尔必须发挥一点创意,才能建立 iDRAC 识别 DPU 所需的硬件连接。

DPU 生命周期管理 NVIDIA BlueField DPU 端口

NVIDIA BlueField DPU 端口

DPU 本身只需插入转接卡(具体来说,转接卡 1A 插槽 2),就像任何 PCIe 卡一样。 这为 DPU 提供电源并将其连接到系统总线上。 但卡的管理不能像 GPU 一样通过 PCIe 完成,至少目前不能。 所需要的是一个额外的硬件元件来连接这些点。 在下面的 R750 主板照片中,精明的人会注意到 LOM (NIC) 通常所在的插槽中有一张不同的卡。

带管理接口卡 (MIC) 的 Dell PowerEdge 主板

带管理接口卡 (MIC) 的 Dell PowerEdge 主板

当我们仔细观察管理接口卡 (MIC) 时,我们可以看到它位于板载 LOM 通常所在的位置。 MIC 在 DPU 和服务器 BMC 之间启用网络控制器边带接口 (NC-SI)。

Dell PowerEdge 管理接口卡 (MIC)

Dell PowerEdge 管理接口卡 (MIC)

使用 iDRAC 进行 DPU 生命周期管理

有一些工具可以帮助您充分利用 DPU 技术。 戴尔的集成戴尔远程访问控制器 (iDRAC) 是专为 Dell PowerEdge 服务器设计的综合管理工具。 它提供了用于远程服务器监视、管理和控制的高级功能。

iDRAC 提供服务器运行状况参数的实时监控,使管理员能够监控 CPU、内存、存储、电源和温度等关键组件。 iDRAC 简化了固件更新,包括 BIOS、RAID 控制器和网络适配器。 这种集中式界面使管理员能够跨多个服务器管理和部署固件更新,从而确保一致性并减少手动工作。

由于用于 MIC 交换的 LOM 和额外的布线硬度,戴尔可以通过 iDRAC 管理 DPU,使 DPU 生命周期管理与 PowerEdge 服务器中的所有其他关键组件保持一致。 虽然这对于 iDRAC 管理员来说似乎非常简单,但为实现 DPU 的这种轻松管理而进行的幕后工作却令人印象深刻。

使用 iDRAC 进行 DPU 生命周期管理

使用 iDRAC 进行 DPU 生命周期管理

总结

现在说每个 VMware vSphere 或 vSAN 节点都应该配置 DPU 以利用 vSphere 分布式服务引擎还为时尚早,但很难忽视其好处。 随着现代工作负载的数量和复杂性不断增加,以及对新软件定义服务的需求,服务器 CPU 的负荷不断增加,用于工作负载处理的计算周期越来越少。 DPU 已广泛部署在超大规模企业中,以处理更多基础设施功能并释放 CPU 周期以用于创收工作负载。

DPU 生命周期管理 MIC 连接器

NVIDIA BlueField DPU 管理端口已连接

虽然 DPU 对 vSphere 的好处是显而易见的,但在服务器中引入新的加速器会带来必须解决的新挑战; 在本例中,这就是 DPU 生命周期管理。 得益于戴尔的一些创造性工程,DPU 可以连接到本机 BMC,并通过 iDRAC 等传统生命周期工具进行管理。 这对于在数据中心采用新技术产生了很大的影响,并且应该可以简化戴尔客户对 DPU 的采用。

vSphere 8 新功能概览

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅