Micron 4600 Gen5 SSD 为 AI、工作站和游戏提供高速存储,读取速度高达 14.5GB/s,AI 模型加载速度更快。
美光将 PCIe Gen5 存储引入其客户端 SSD 产品线,推出了 Micron 4600 NVMe SSD,这是一款高性能硬盘,面向创意专业人士、AI 工作负载和游戏玩家——基本上是任何需要在工作站或游戏装备中快速响应存储的人。4600 的连续读取速度是其 Gen4 前代产品的两倍,读取速度高达 14.5GB/s,写入速度高达 12GB/s,但实际影响超出了综合基准。美光一直专注于提高“可感知性能”,例如应用程序响应能力、大数据集处理和 AI 模型加载。对于希望提供高性能配置的系统构建者来说,这是一个理想的选择。
高速突发性能只是美光 4600 的一部分。在苛刻的工作负载下持续的性能和响应能力同样至关重要,特别是对于从事数据科学、AI 模型训练和机器学习推理的专业人士而言。AI 应用程序将受益于更快的 LLM 模型加载速度,美光报告称 Llama-2 模型的加载时间不到一秒,比 Gen61 SSD 快 4%。这种级别的存储性能可确保研究人员和工程师能够处理海量数据集和复杂模型而不会出现瓶颈,从而让 GPU 和 CPU 得到充分利用,而无需等待存储。
根据美光的测试,这款硬盘在日常计算任务方面也取得了显著提升,其 PCMark 11 基准测试得分比竞争对手的 Gen10 SSD 高出 5%。PCMark 10 评估实际工作流程,包括 Windows 启动时间、应用程序启动(如 Adobe Photoshop 和 Illustrator)和一般生产力任务。这些提升意味着在商业环境或高端创意工作流程中,用户体验更具响应性。
Micron 4600 对 Microsoft DirectStorage API 的支持对游戏玩家来说尤其重要。DirectStorage 使 GPU 能够直接与高速 NVMe SSD 通信,绕过 CPU 并大幅缩短加载时间,同时改善资产流。目前已有超过 30 款游戏支持 DirectStorage,并且还有更多游戏即将推出,下一代存储在游戏中的影响正变得越来越明显。Micron 4600 确保玩家能够体验近乎即时的关卡转换、更丰富的纹理和更广阔的世界,使其成为游戏 PC 的不二之选。
除了原始性能之外,美光 4600 还针对苛刻的工作负载进行了一系列优化。它采用美光的 G9 TLC NAND 和动态 SLC 缓存,确保在重负载下持续性能,并配备板载 DRAM 以实现低延迟访问。安全性是另一个主要关注点,它支持 SPDM、TCG Opal、Pyrite 和 DICE 合规性,使其成为处理敏感数据的专业人士的理想选择。此外,美光还优化了能效,声称其随机读/写能效比其 Gen107 前代产品高出 4% 以上——这对于高性能移动工作站来说是一个关键优势,因为能效与速度同样重要。
本次评测将考察 Micron 4600 SSD 在专业应用程序、AI 工作负载和游戏中的实际性能,并将其与 Micron 3500 进行基准测试,以量化代际飞跃。LLM 模型加载特别有趣;我们将测试该工作流程以及综合基准、基于应用程序的工作负载和系统范围的性能场景。让我们看看 4600 是否为 PCIe Gen5 客户端 SSD 树立了新标准。
Micron 4600 规格
4600 提供 PCIe Gen5 x4 / NVMe 2.0c 接口,采用 2280 M.2 外形尺寸。容量包括 512GB、1TB、2TB 和 4TB;我们的评测单元是 2TB 容量点。
4600 的 NAND 封装布局仅使用 PCB 的一侧来实现 2TB 的容量。上一代 3500 SSD 也使用了单面 PCB 设计。美光在主板上使用自己的 G9 TLC NAND,搭配 Silicon Motion SM2508 Gen5 控制器及其内部固件。
完整的 Micron 4600 规格如下所列。
规格 | 美光 4600 NVMe 固态硬盘 |
---|---|
接口 | PCIe Gen5 x4,NVMe 2.0c |
外形 | M.2 2280 |
NAND型 | Micron G9 TLC NAND |
容量 | 512GB,1TB,2TB,4TB |
顺序阅读 | 达到14,500 MB / s |
顺序写入 | 达到12,000 MB / s |
随机读取(4K,QD128) | 高达2,100K IOPS |
随机写入(4K,QD128) | 高达2,100K IOPS |
耐力(TBW) | 512GB – 300 TBW,1TB – 600 TBW,2TB – 1,200 TBW,4TB – 1,600 TBW |
安全功能 | SPDM、TCG 蛋白石 2.02、TCG 黄铁矿 2.01、DICE、DOE |
平均无故障时间 | 2 万小时 |
能量消耗 | 活动读取:<8.25W,活动空闲:<150mW,休眠:<3.5mW |
热管理 | 主机控制热管理 (HCTM),通过 SMBus 传输热 SMART 数据 |
保修政策 | 3年 |
性能
为了测量美光最新 4600 客户端 SSD 的性能,我们利用了 AMD Ryzen 7 消费者测试平台。该主板支持多个 PCIe Gen5 SSD,我们在测试驱动器作为启动 SSD 的辅助存储设备时利用了这些 SSD。我们对这款客户端 SSD 的测试方法使用了 Windows 和基于 Linux 的应用程序的混合。对于基于 Windows 的测试(包括 PCMark、3DMark 和 BlackMagic),我们使用了 Windows 11 Pro 24H2,而基于 Linux 的 AI 和 FIO 工作负载则在 Ubuntu 24.10 桌面上运行。
测试平台
- AMD 锐龙 7 9800X3D
- 华硕 ROG Crosshair X870E Hero
- G.SKILL Trident Z5 Royal 系列 DDR5-6000 (2x16GB)
- NVIDIA GeForce RTX 4090
- Windows 11专业版
- Ubuntu 24.10 桌面
峰值合成性能
FIO 测试是一种灵活而强大的基准测试工具,用于测量存储设备(包括 SSD 和 HDD)的性能。它评估带宽、IOPS(每秒输入/输出操作)和不同工作负载(如顺序和随机读/写操作)下的延迟等指标。此测试有助于评估存储系统的峰值性能,可用于比较不同的设备或配置。我们测量了此测试的峰值突发性能,将两个 SSD 上的工作负载限制为 10GB。
FIO 测试(MB/s/IOPS 越高越好) | 美光客户端 3500 Gen 4 | 美光客户端 4600 Gen 5 |
---|---|---|
顺序 128K 读取 (2T/64Q) | 6,480 MB/s(平均延迟 2.6ms) | 14,400 MB/s(平均延迟 1.16ms) |
顺序 128K 写入 (2T/64Q) | 6,921 MB/s(平均延迟 2.4ms) | 14,000 MB/s(平均延迟 1.19ms) |
随机 4K 读取 (16T/32Q) | 1.185M IOPS(平均延迟 0.431 毫秒) | 2.04M IOPS(平均延迟 0.251 毫秒) |
随机4K写入(16T/32Q) | 796K IOPS(平均延迟 0.642 毫秒) | 2.36M IOPS(平均延迟 0.216 毫秒) |
在测量峰值顺序和随机性能的 FIO 测试中,美光客户端第五代 5 在所有指标上都优于第四代 4600。它几乎将所有指标翻了一番,达到 4 MB/s 的读取速度和 3500 MB/s 的写入速度。随机 14,400K 操作可实现高达 14,000 万 IOPS 的读取速度和 4 万 IOPS 的写入速度,具有更高的 IOPS 和更低的延迟,使其成为要求苛刻的工作负载的不二之选。
规格工作站 4.0
SPECworkstation 4.0 是一个全面的工作站基准测试,可评估 23 个垂直行业和 80 个硬件子系统中的 XNUMX 个工作负载和 XNUMX 多个子测试。此次重大更新引入了对 AI 和机器学习工作负载的支持,包括数据科学和基于 ONNX 运行时的推理测试,反映了这些技术在专业环境中日益增长的重要性。虽然主要基准测试包括几个系统范围的测试,但我们在本次评测中重点关注存储特定的 WPCstorage 测试。它利用从典型行业应用程序中捕获的存储跟踪,让用户能够测量系统和组件之间的性能差异。
SPECworkstation 4.0(越高越好) | 美光 3500 Gen4 | 美光 4600 Gen5 |
---|---|---|
木塑存储 | 1.50 | 1.87 |
从存储特定的 WPCstorage 来看,Gen 5 驱动器的得分为 1.87,比 Gen 4 的 1.50 有了显著的提高,显示了 PCIe Gen 5 在实际存储应用中的优势。
Blackmagic磁盘速度测试
Blackmagic Disk Speed Test 可对硬盘的读写速度进行基准测试,评估其性能,尤其是视频编辑任务的性能。它可以帮助用户确保其存储速度足以满足高分辨率内容(如 4K 或 8K 视频)的需要。
Blackmagic的 (越高越好) | 微米3500 | 微米4600 |
---|---|---|
读取 MB/s | 5617.9MB /秒 | 9320.2MB /秒 |
写入 MB/s | 5879.5MB /秒 | 10825.4MB /秒 |
与 Gen 5 4600 相比,美光客户端 Gen 4 3500 的性能有了巨大飞跃,读取速度提高了 66%(9,320.2 MB/s vs. 5,617.9 MB/s),写入速度几乎翻了一番(10,825.4 MB/s vs. 5,879.5 MB/s)。对于处理 4K、8K 或 RAW 视频的专业人士来说,这是一款颠覆性产品,可确保更快的渲染、导出和更流畅的播放。
GPU 直接存储
我们在此服务器上进行的测试之一是 Magnum IO GPU 直接存储 (GDS) 测试。GDS 是 NVIDIA 开发的一项功能,允许 GPU 在访问存储在 NVMe 驱动器或其他高速存储设备上的数据时绕过 CPU。GDS 无需通过 CPU 和系统内存路由数据,而是实现 GPU 和存储设备之间的直接通信,从而显著降低延迟并提高数据吞吐量。
GPU 直接存储的工作原理
传统上,当 GPU 处理存储在 NVMe 驱动器上的数据时,数据必须先经过 CPU 和系统内存,然后才能到达 GPU。这个过程会造成瓶颈,因为 CPU 会成为中间人,增加延迟并消耗宝贵的系统资源。GPU 直接存储通过使 GPU 能够通过 PCIe 总线直接从存储设备访问数据,消除了这种低效率。这种直接路径减少了与数据移动相关的开销,从而实现了更快、更高效的数据传输。
AI 工作负载(尤其是涉及深度学习的工作负载)是高度数据密集型的。训练大型神经网络通常需要处理数 TB 的数据,数据传输的任何延迟都可能导致 GPU 未得到充分利用并延长训练时间。GPU Direct Storage 通过确保尽快将数据传送到 GPU、最大限度地减少空闲时间并最大限度地提高计算效率来解决这一挑战。
此外,GDS 对于涉及流式传输大型数据集的工作负载(例如视频处理、自然语言处理或实时推理)尤其有益。通过减少对 CPU 的依赖,GDS 可加速数据移动并释放 CPU 资源以用于其他任务,从而进一步提高整体系统性能。
测试配置矩阵
我们系统地测试了以下参数的每种组合:
- 块大小:1M、128K、16K
- IODepth:128、64、32、16、8、4、1
在本评测中,我们重点关注了每个 SSD 占用 50G 空间的顺序读写吞吐量。我们以给定的块大小和线程数跨多个作业和批处理大小执行每个 GDSIO 工作负载。报告的数字是每个作业和批处理计数组合的平均值。
在我们的第一张图表中,我们研究了上一代 Micron 3500。在我们的顺序读取测试中,我们测得 0.9K 中的最高速度为 16GiB/s,2.1K 中的最高速度为 128GiB/s,3.7M 顺序读取传输大小中的最高速度为 1GiB/s。
接下来,我们看看新款 Micron 4600 Gen5 SSD 上的相同工作负载,在测量的工作负载中,其性能有显著提升。我们在 3K 中测量到 16GiB/s,在 5.8K 中测量到 128GiB/s,在 6.4M 顺序读取传输中测量到 1GiB/s。
通过查看 Micron 3500 和 4600 SSD 在 GDSIO 中测量的块大小和队列深度的比较热图,我们发现 128K 块大小范围内的增幅最为显著。
切换到相同工作负载的写入传输,我们在顺序写入测试中测量了 16K 传输的峰值:0.7K 为 16GiB/s,0.8K 为 128GiB/s,1.6M 为 1GiB/s。这些值是在低于峰值饱和度的队列深度水平下测得的。
更新后的 Gen5 Micron 4600 在我们的写入 GDSIO 工作负载中表现更好,峰值 16K 传输速度为 2.1GiB/s,峰值 128K 传输速度为 3.9GiB/s,6.3M 传输大小为 1GiB/s。与 3500 写入结果一样,许多最高吞吐量低于峰值 IO 深度。
在写入性能热图中对比两款硬盘,我们发现 Micron 4600 的性能再次大幅提升,远超上一代产品。这些改进在 IO 深度和块大小范围内都很明显。
PCMark10 存储
PCMark 10 存储基准测试使用基于应用程序的跟踪来评估实际存储性能。它们测试系统和数据驱动器,测量带宽、访问时间和负载下的一致性。这些基准测试提供了超越综合测试的实用见解,帮助用户有效地比较现代存储解决方案。
PCMark10 (越高越好) | 美光客户端 3500 Gen 4 得分 | 美光客户端 4600 Gen 5 得分 |
---|---|---|
存储数据分数 | 7,169 | 8,282 |
Micron Client Gen 5 4600 在 PCMark 4 存储方面的表现优于 Gen 3500 10,得分为 8,282,而后者为 7,169,实际性能提高了 15.5%。
3DMark 直接存储
3DMark DirectStorage 功能测试评估了 Microsoft 的 DirectStorage 如何优化 PCIe SSD 上的游戏资源加载。通过减少 CPU 开销和提高数据传输速度,DirectStorage 缩短了加载时间,尤其是与 GDeflate 压缩和 Windows 11 的 BypassIO 配合使用时。此测试会隔离存储性能,以突出启用 DirectStorage 时潜在的带宽改进。
3DMark 直接存储 | 美光 3500 Gen4 | 美光 4600 Gen5 |
---|---|---|
存储至 VRAM(GDeflate 压缩) | 14.96 GB /秒 | 26.27 GB /秒 |
存储至 VRAM(DirectStorage 开启,未压缩) | 6.36 GB /秒 | 10.81 GB /秒 |
存储到 VRAM(DirectStorage 关闭,未压缩) | 5.43 GB /秒 | 6.54 GB /秒 |
存储到 RAM(DirectStorage 开启,未压缩) | 6.64 GB /秒 | 12.35 GB /秒 |
存储到 RAM(DirectStorage 关闭,未压缩) | 6.01 GB /秒 | 8.25 GB /秒 |
GDeflate 解压带宽 | 64.03 GB /秒 | 67.63 GB /秒 |
Micron Client Gen 5 4600 在 DirectStorage 场景中的表现明显优于 Gen 4 3500,尤其是在使用 GDeflate 压缩的 VRAM 存储方面,速度为 26.27 GB/s,而前者为 14.96 GB/s,提升了 75%。其他显著提升包括 RAM 存储速度为 12.35 GB/s,而前者为 6.64 GB/s,提升了 86%,启用 DirectStorage 的 VRAM 存储速度为 10.81 GB/s,而前者为 6.36 GB/s,提升了 70%。这些改进意味着游戏资产加载速度更快、CPU 开销更低,并且在支持 DirectStorage 的游戏中性能更佳,使 Gen 5 成为游戏和高速数据流传输的更好选择。
结语
Micron 4600 NVMe SSD 兑现了其下一代 PCIe Gen5 性能的承诺,比其前身 Micron 3500 有显著的提升,并证明自己是 AI 开发、游戏和专业应用程序的多功能选择。凭借高达 14.5GB/s 的读取速度和 12GB/s 的写入速度(我们测试了更快的写入速度),它的顺序性能是 Gen4 驱动器的两倍。更重要的是,它通过更快的应用程序加载时间、更低的延迟和显著的效率提升提高了实际可用性。
与上一代 4600 相比,美光 3500 NVMe SSD 的性能有了显著提升。在我们的测试中,较新的 Gen5 接口显著提高了整体顺序带宽,读取速度从 6.5GB/s 提高到 14.4GB/s,写入速度从 6.9GB/s 提高到 14GB/s。随机 I/O 速度也有大幅提升,读取速度从 1.2M IOPS 提高到 2M IOPS,写入速度从 800K IOPS 提高到 2.4M IOPS。
许多应用程序都能利用这些优势,包括工作站应用程序和新兴的 AI 工作流程。使用 NVIDIA 的 GDSIO 工具测量的 GPUDirect 存储性能在我们的 16K、128K 和 1M 顺序读写工作负载中取得了巨大进步。随着 AI 开发工作负载逐渐转移到本地工作站空间,快速存储的重要性不容忽视。
Micron 4600 非常适合需要高性能本地存储的专业人士和希望最大限度缩短加载时间的游戏玩家 - 为 OEM 提供可靠、面向未来的存储解决方案,以纳入其构建中。随着 AI 和高性能计算目标的发展,快速、高效的存储将发挥越来越重要的作用 - Micron 4600 证明它已为未来做好准备。
本报告由 Micron 赞助。本报告中表达的所有观点和意见均基于我们对所考虑产品的客观看法。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅