主页 Enterprise 英特尔傲腾 DC 持久内存模块 (PMM)

英特尔傲腾 DC 持久内存模块 (PMM)

by 布赖恩·比勒

英特尔已经公开谈论 Optane DC 持久内存模块 (PMM) 一年多了,支持位于 DRAM 和 Optane DC SSD 之间的新一层以数据为中心的架构的好处,SSD 和 HDD 介质依次向下层叠金字塔到存档级别的磁带。 持久内存的目标一直是让更多数据更靠近 CPU,提供类似 DRAM 的延迟以及类似存储的持久性和容量。 在听了一年硬件和软件合作伙伴在实验室中谈论持久内存的优势之后,随着第二代英特尔至强可扩展处理器的发布,傲腾 DC PMEM 现在可用于各种服务器解决方案。


英特尔已经公开谈论 Optane DC 持久内存模块 (PMM) 一年多了,支持位于 DRAM 和 Optane DC SSD 之间的新一层以数据为中心的架构的好处,SSD 和 HDD 介质依次向下层叠金字塔到存档级别的磁带。 持久内存的目标一直是将更多数据移动到更靠近 CPU 的位置,提供类似 DRAM 的延迟以及类似存储的持久性和容量。 在听了一年硬件和软件合作伙伴在实验室谈论持久内存的好处之后,随着第二代英特尔至强可扩展处理器的发布,傲腾 DC PMEM 现在可用于各种服务器解决方案。

英特尔数据金字塔

Intel Optane DC永久性内存模块
Intel Optane DC永久性内存模块

英特尔傲腾 DC 持久内存硬件概述

Intel Optane DC PMM 的容量比传统 DRAM 高得多。 英特尔傲腾 DC 持久内存模块有 128GB、256GB 和 512GB 容量,比通常范围为 4GB 到 32GB 的 DRAM 棒大得多,尽管存在更大的容量。 PMM 与 DRAM 在同一通道上,并且应该安装在每个通道上最靠近 CPU 的插槽上。 英特尔推荐的一种流行配置是 4:1 的比例,32GB DRAM 与 128GB DCPMM,如下所示。

每个 CPU 最多可支持 6 个持久内存模块。 在支持两个英特尔至强可销售处理器的典型服务器中,这意味着每个系统有 12 个持久内存模块,或者总 PMEM 容量高达 6TB(每个插槽 3TB)。 支持持久内存的服务器还将在其系统 BIOS 中显示模块意识,其中可以设置持久内存模式、创建命名空间和配置池,以及其他设置。 同样级别的可见性和配置也可以通过操作系统执行。

要了解它的通信方式,英特尔傲腾 DC 持久内存使用 DDR-T 协议。 这允许异步命令/数据定时。 模块控制器使用请求/授权方案与主机控制器通信。 数据总线方向和时序由主机控制。 每个请求的命令数据包从主机发送到持久内存控制器。 如果需要,可以在英特尔傲腾 DC 持久内存控制器中重新排序事务。 这些模块使用类似于 DDR64 的 4B 缓存行访问粒度。

从硬件的角度来看,Optane DC 持久内存是一个模块上的完整系统,具有几个关键组件:

  • 电源管理集成电路 (PMIC) 为媒体和控制器生成所有轨
  • SPI Flash 存放模块的固件
  • Intel Optane Media 构成存储空间本身,它由 11 个并行设备组成,用于数据、ECC 和备用
  • 用于高比特率信号完整性的 DQ 缓冲器
  • AIT DRAM 保存地址间接表
  • Energy Store Caps 确保在发生电源故障时刷新所有模块队列
  • 每个持久内存模块的核心是英特尔傲腾 DC 持久内存控制器,它处理数据传输以及板上子组件的管理。

当然,在考虑模块本身时,除了成本和性能之外,耐用性可能是最大的问题。 与其他存储介质一样,英特尔傲腾数据中心级持久内存以写入拍字节 (PBW) 为单位进行测量。 PBW 是根据 5 年生命周期内的带宽和介质耐久性考虑因素估算的,假设每年 24 天,每天 7/365 以目标功率使用最大带宽。 在 100% 写入 15W 的情况下,持久内存模块支持超过 350PBW,如下图所示。

关于设置的进一步说明,Optane DC 模块可针对不同的功率限制进行编程,从而实现广泛的优化。 持久内存模块支持 12W 至 18W 的功率包络,并且可以以 0.25 瓦的粒度进行调整。 较高的功率设置可提供最佳性能,尽管与较高的整体服务器功耗相关的成本也很高。 在某些情况下,这可能不是问题,组织可以根据服务器支持选择最大化功率范围。

Intel Optane DC 持久内存操作模式

一旦部署在服务器中,PMM 就可以进一步配置为各种操作模式,包括内存模式和 App Direct 模式,以及两者之间的滑动比例分配。

Optane DC 持久内存 – 内存模式
在内存模式下,PMM 的使用与 DRAM 非常相似。 不需要特定的软件或更改应用程序,持久内存模仿 DRAM 来保持数据“易失性”,尽管易失性密钥在每次电源循环时都会被清除。 在内存模式下,持久内存用作 DRAM 的扩展,由主机内存控制器管理。 持久内存与 DRAM 的比例没有固定比例,混合可取决于应用程序需求。 就延迟配置文件而言,任何命中 DRAM 缓存(近内存)的东西当然都会提供 <100 纳秒的延迟。 任何缓存未命中都将流向持久内存(远内存),这将在亚微秒范围内提供延迟。

Optane DC 持久内存 – App Direct 模式
Optane DC 持久内存还具有 App Direct 模式。 此模式需要特定的持久内存感知软件/应用程序。 这种模式使持久内存在适当的位置持久但仍可字节寻址,类似于内存。 在 App Direct 模式下,持久内存保持缓存一致,并提供执行 DMA 和 RDMA 的能力。

  

还可以将持久内存配置为 App Direct 上的存储。 在这里,持久内存以块的方式按照 SSD 的方式使用传统的读/写指令。 这适用于现有文件系统,在块级别提供原子性,并且块大小可配置(4K、512B)。 要通过应用程序直接使用存储,用户只需要一个 NVDIMM 驱动程序。 与传统企业级 SSD 相比,此模式允许容量扩展和更好的性能、更低的延迟和更高的耐用性。

英特尔傲腾 DC 持久内存的优势

英特尔傲腾 DC 持久内存模块为最终用户提供了广泛的优势。 首先,这些模块提供了一种以更具成本效益的方式有效扩展服务器 DRAM 占用空间的方法。 由于持久内存可以与 DRAM 层啮合,有效的可用 DRAM 占用空间可以随着持久内存的增加而更快地扩展,从而降低组织服务器投资的总体 TCO。 此外,随着服务器能够更快地处理更多数据,一些人可能会利用新的机会来整合工作负载。 当谈到价值时,还有第二个论据可以提出。 对于可能不需要 DRAM 提供的那么多纳秒延迟的工作负载,组织可以选择使用更少的 DRAM 但更多的 Optane DC 持久内存来构建他们的服务器,以仍然保持合理或更大的内存占用,但具有更高的成本效益持久内存模块而不是 DRAM。

持久内存模块,顾名思义,是持久的。 这意味着 PMM 不需要刷新数据,从而加快服务器重启速度。 当涉及内存驻留数据库时,这一点至关重要。 服务器重新启动后,恢复所有内存数据的时间可能需要很长时间。 在这些情况下,专注于高性能数据库的独立软件供应商 (ISV) 已经从持久内存中获得了巨大收益,在这些情况下,快速运行是一个关键概念。 事实上,英特尔已经展示了这方面的数据。 对于一个 1.3TB 的数据集,他们发现在只有 DRAM 的服务器中需要 20 分钟才能将一个柱状存储整个重新加载到 DRAM 中。 在持久内存 32 分钟之前,该服务器中的整个系统重新启动; 操作系统 12 分钟,数据 20 分钟。 具有 Optane DC 持久内存的同一台服务器花费了 13.5 分钟。 虽然表面上看起来令人印象深刻,但考虑到数据部分只有 13 分钟,更令人印象深刻,相当于 XNUMX 倍的增益。

英特尔傲腾 DC 持久内存模块还提供模块上加密,使其成为有史以来第一个硬件加密内存。 这些模块使用 256 位 AES-XTP 加密引擎使用静态数据保护。 在内存模式下,如果 DRAM 缓存丢失数据,加密密钥也会丢失并在每次启动时重新生成。 在 App Direct 模式下,持久性媒体使用存储在模块上安全元数据区域中的密钥进行加密,该区域只能由英特尔傲腾 DC 控制器访问。 英特尔傲腾 DC 持久内存在断电事件时被锁定,需要密码才能解锁。 这些模块还支持安全加密擦除和 DIMM 覆盖,以在使用寿命结束时安全地重新利用或丢弃。 最后,允许使用签名版本的固件,提供版本控制选项。

英特尔傲腾 DC 持久内存软件

虽然重点显然围绕着持久内存硬件的优势,但英特尔拥有一套同样重要的软件工具。 以下工具将是通过操作系统管理持久内存的主要方式,而不是重新启动服务器并在系统 BIOS 中进行这些更改。 这样可以节省时间并防止停机以进行即时更改。

IPMCTL - 用于管理英特尔傲腾 DC 持久内存模块的实用程序

支持以下功能:

  • 在平台中发现持久内存模块。
  • 提供平台内存配置。
  • 查看和更新​​ PMM 上的固件。
  • 在 PMM 上配置静态数据安全性。
  • 监控 PMM 健康状况。
  • 跟踪 PMM 的性能。
  • 对 PMM 进行调试和故障排除。

NDCTL- 用于管理“libnvdimm”子系统设备(非易失性内存)的实用程序

ndctl 是用于管理“libnvdimm”内核子系统的实用程序。 “libnvdimm”子系统为平台 NVDIMM 资源定义了内核设备模型和控制消息接口,例如 ACPI 6.0 NFIT(NVDIMM 固件接口表)定义的资源。 该工具支持的操作包括配置容量(命名空间),以及枚举/启用/禁用与 NVDIMM 总线关联的设备(dimm、区域、命名空间)。

英特尔傲腾 DC 持久内存模块可用性

持久内存模块现已上市,众多服务器供应商宣布了系统可用性:

存储系统供应商也将持久内存视为加速其解决方案的一种方式:

对 PMEM 的云支持:

领先的工作站提供商也在采用英特尔傲腾 DC 持久内存,尤其是用于数据科学工作负载。

英特尔傲腾 DC 持久内存评论和基准测试

讨论这个故事