存储评论网

戴尔科技集团 PowerScale 获得 NVIDIA 云提供商计划认证

企业版  ◇  企业存储

戴尔科技集团正式加入NVIDIA云提供商(NCP)计划,其PowerScale平台荣获高性能存储认证。这一里程碑在NVIDIA GTC大会上宣布,彰显了戴尔致力于为企业和服务提供商环境中的AI工作负载提供可扩展、生产就绪型基础架构的承诺。

什么是 NVIDIA 云提供商计划?

NVIDIA 云提供商 (NCP) 计划旨在验证和认证能够为 GPU 加速 AI 工作负载提供强大、生产级环境的基础设施合作伙伴。通过认证符合严格性能、互操作性和可扩展性的平台,NVIDIA 确保其服务提供商生态系统能够自信地提供针对整个 NVIDIA AI 堆栈(从模型训练和推理到分析和部署)优化的 AI 解决方案。

PowerScale:AI数据基础设施的支柱

的心脏 戴尔的人工智能数据平台PowerScale 提供可扩展的高性能存储基础,可简化数据管道并加速 AI 成果。凭借近期的 NCP 认证,PowerScale 现已被认可为 GPU 加速 AI 的认证存储层,提供与 NVIDIA 参考架构的可靠集成,并提供以下认证支持: 基于HGX的AI工厂。这使得大型语言模型 (LLM) 的训练、推理和分析能够实现无缝数据访问,消除基础设施提供商的猜测,并加快新 AI 服务的上市时间。

PowerScale 加入 NCP 计划不仅仅是一个标志,更是对戴尔规模化交付能力的认可。经认证的技术经过严格测试,确保与包括 DGX SuperPOD 和 NVIDIA AI Enterprise 在内的主要 NVIDIA 平台兼容。PowerScale 的 NCP 认证加入了日益壮大的 NVIDIA 认证行列,例如 DGX SuperPOD 参考架构和 NVIDIA 企业存储认证,这进一步巩固了戴尔对 AI 堆栈每一层性能、可扩展性和可靠性的承诺。

联合蓝图和生命周期管理

戴尔与 NVIDIA 的合作远不止认证。PowerScale 客户可受益于经过验证的 NVIDIA-Dell 参考设计,从而加快部署速度并确保两家供应商提供一致的生命周期支持。这些蓝图对于启动多租户 AI 环境的提供商尤其有价值,因为可预测性、可重复性和支持协调性对于成功至关重要。内置优化的数据吞吐量和跨堆栈性能调优功能,使企业能够安心部署。

PowerScale 的横向扩展架构旨在支持从 PB 到 EB 的各种规模环境,且不会造成任何中断。凭借 NCP 认证,云服务提供商 (CSP) 可以调整其数据存储策略,使其与 GPU 的增长同步,而服务提供商则可以满怀信心地规划 AI 路线图的部署。最终用户可以享受可预测的高吞吐量各种规模的训练数据访问,确保存储限制不会成为 AI 工作负载的瓶颈。

PowerScale 与 NVIDIA 集成

NVIDIA GPU(例如 HGX 和 Dell PowerEdge XE 系列中的 GPU)专为在 AI、机器学习 (ML) 和高性能计算 (HPC) 工作负载中提供卓越性能而打造。 戴尔 PowerScale F710 采用 NVIDIA HGX H100、H200 和 B200 服务器的集群存储,可提供业界领先的性能、容量和持久性。PowerScale 集群至少从三个节点开始,线性扩展至数百 PB,提供无缝的容量和吞吐量增长,同时与 NVIDIA Base Command Manager Essentials 集成,实现集中监控。

NVIDIA NCP 参考架构

PowerScale F710 平台由 OneFS 提供支持,可在并发、顺序和混合 I/O 模式下为小型和大型文件提供最佳吞吐量。其 1U 10 驱动器机箱提供多种 NVMe TLC SSD 配置,确保为各种工作负载提供高性能。PowerScale 的架构专为高性能文件和对象服务而构建,利用 NVMe 闪存实现轻松访问和管理。

统一的智能文件系统

OneFS 是 PowerScale 核心的分布式文件系统,它将文件系统、卷管理和数据保护统一到单个软件层中。这创建了一个覆盖所有节点的统一智能文件系统,支持单个集群上的各种应用程序和工作负载。其企业级功能包括基于策略的自动化存储分层、云存储集成和多协议数据访问(NFS、SMB、S3、HTTP、FTP、HDFS、IPv4 和 IPv6),从而实现高效的数据共享,而无需中断迁移。

Dell OneFS 管理

性能和容量可从 TB 级线性扩展至数百 PB 级,并采用动态的逐文件擦除编码技术进行数据保护。OneFS 可确保整个集群的完全一致性和连贯性,自动管理缓存并消除手动干预,使其成为性能关键型应用程序的理想选择。

规模化简化和高效

PowerScale 的简单性使企业无需增加人员即可管理大规模数据环境。增加容量或性能非常简单:将节点安装到机架上并通电,将其连接到后端网络,然后指示集群添加节点,通常只需不到一分钟即可完成。OneFS Autobalance 和 SmartConnect 可自动重新平衡容量并分配客户端连接,而 SmartQuotas 和 SmartQoS 则可对资源分配和性能 SLA 进行精细控制。

PowerScale 的综合数据服务

PowerScale OneFS 提供一套企业数据服务,包括:

  • SnapshotIQ 用于只读快照
  • 数据缩减 通过内联压缩和重复数据删除
  • 智能池 实现跨闪存、混合和归档节点的自动分层
  • 云池 用于集群外分层到 S3 目标
  • 同步智商智能同步 用于异步复制和云复制
  • SmartLock 蠕虫病毒 为了数据不变性
  • 智能QoS 用于协议操作限制和业务优先级
  • SFSE 提高小文件存储效率

这些功能可以实现数据集和工作负载的安全、自动化和经济高效的管理,确保较低的总体拥有成本 (TCO) 并最大限度地节省存储成本。

高性能网络和多租户

GPU 计算与 PowerScale 存储之间的融合网络构建于 NVIDIA Spectrum-4 SN5600 交换机之上,采用叶脊拓扑结构,确保高可用性和高吞吐量。PowerScale 的私有后端网络使用冗余的 200 GbE 网卡,充当节点间通信的分布式系统总线。存储通过标准 NFS 挂载点安装在 NVIDIA HGX 计算节点上,戴尔的 PowerScale NFS 多路径客户端驱动程序可充分利用 RDMA 和 nconnect,从而实现最佳性能。

NVIDIA Spectrum-A 以太网交换机

PowerScale 的多租户功能构建于四大支柱之上:安全、数据、网络和管理。OneFS 访问区域、SmartConnect 和 SmartPools 可实现身份验证提供程序、数据访问和网络接口的安全分离,从而支持复杂的多租户环境。

管理和遥测

PowerScale 提供三个管理门户:图形化 WebUI、命令行界面 (CLI) 和 RESTful API 端点。直观的 WebUI 支持快速配置、配置和监控,而详细的遥测和事件日志记录则可让您深入了解系统运行状况和性能。

戴尔科技集团加入 NVIDIA 云提供商计划,并凭借 PowerScale 获得高性能存储认证,标志着企业在大规模构建 AI 基础架构方面迈出了重要一步。凭借成熟的集成能力、强大的数据服务和无与伦比的可扩展性,PowerScale 助力企业和服务提供商自信地部署、管理和扩展 AI 工作负载,并面向当前和未来。

参与 StorageReview

订阅消息 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅

哈罗德弗里茨

自 IBM 创建 Selectric 以来,我一直在科技行业工作。 不过,我的背景是写作。 因此,我决定退出售前业务,回归本源,从事一些写作工作,但仍从事技术工作。