今年早些时候,我们测试了 4TB 的三星 9100 Pro,它很快就脱颖而出,成为我们见过的性能最强的第五代 x5 SSD 之一,在某些情况下甚至在我们的性能排行榜上树立了新的标杆。这款固态硬盘基于三星自主研发的 Presto 控制器和第八代 V-NAND 技术构建,拥有强大的吞吐量,可以轻松处理 AI 模型、海量视频项目和下一代游戏。发布时,4TB 版本是当时市面上容量最高的,但三星强调,4TB 版本正在规划中。现在,这款固态硬盘终于来了。
三星 9100 Pro 8TB 功能
8TB 9100 Pro 的性能与小容量版本相同,顺序读取速度高达 14,800MB/s,写入速度高达 13,400MB/s,随机工作负载高达 2,200K IOPS。它真正带来的是容量的提升。这是三星首款单 M.8 固态硬盘容量达到 2TB 的消费级 SSD,容量是 4TB 版本的两倍,在高性能固态硬盘中实属罕见。对于处理数 TB 数据集的专业人士或视频项目异常繁忙的创作者来说,额外的容量空间非常受欢迎。
三星 9100 Pro 与前几代产品对比
| 专栏 | 9100临 | 990临 | 990 EVO |
| 推出年份 | 2025 | 2022 | 2023 |
| 接口 | PCIe Gen5 x4 | PCIe Gen4 x4 | PCIe Gen4 x4 / Gen5 x2 |
| NAND型 | 第八代 V-NAND TLC | 第八代 V-NAND TLC | 第八代 V-NAND TLC |
| 控制器 | Presto(5nm) | 帕斯卡 (8nm) | 内部(Pascal-Lite) |
| 最大容量 | 截至8TB | 截至4TB | 截至2TB |
| 顺序读/写 | 高达 14,800MB/秒 / 13,400MB/秒 | 高达 7,450MB/秒 / 6,900MB/秒 | 高达 5,000MB/秒 / 4,200MB/秒 |
| 随机读/写 | 高达 2,200K / 2,600K IOPS | 高达 1,600K / 1,550K IOPS | 高达 700K / 800K IOPS |
| 电源效率 | 比 49 Pro 高出 990% | 与 980 Pro 相比有所改进 | 比 70 EVO Plus 提升高达 970% |
| 耐力(TBW) | 最高4,800 TB | 最高2,400 TB | 最高1,200 TB |
| 散热器选项 | 是 | 是 | 没有 |
| 目标受众 | 高端专业消费者、人工智能、8K 视频、内容创作 | 高性能游戏、专业工作负载 | 主流用户、休闲游戏、一般用途 |
从设计角度来看,它仍然搭载三星的 Presto 5nm 控制器、支持动态 SLC 缓存的智能 TurboWrite 2.0,以及在这一新容量层级上最高可扩展至 4,800 TBW 的耐久性等级。8TB 型号还搭载了更大的板载 DRAM(8GB LPDDR4X),以便在如此大规模的情况下控制映射开销。
8TB 型号的最大优势在于,您可以将庞大的 AI 模型保存在本地,无需依赖外部存储即可管理 8K 视频时间线,或者安装庞大的游戏库,并且仍然有剩余空间。对于拥有合适平台的桌面用户来说,这堪称一体化解决方案。即使是 PlayStation 5 用户,如果选择带散热片的版本,也可以获得即插即用的选项,不过 11.25TB 带散热片的型号 Z 轴高度为 8 毫米,比小容量版本略厚一些。
最终,我们已经了解 9100 Pro 的速度和效率,4TB 型号在我们的测试中证明了这一点。8TB 版本无疑将以重度用户所期待的方式,通过海量本地存储的便利性,进一步扩展其性能。
三星 9100 Pro 8TB 供货情况
8TB 型号现已上市,售价 999.99 美元,含散热器售价 1,019.99 美元。此外,还有 1TB、2TB 和 4TB 型号可供选择。
三星 9100 Pro 8TB 规格
下表概述了三星 9100 PRO 系列产品线,重点介绍了标准型号和散热器型号的可用容量、性能特征、功耗、耐用性和主要功能。
| 规格 | 三星9100 PRO | 三星 9100 PRO 带散热器 |
| 接口 | PCIe® 5.0 x4,NVMe™ 2.0 | |
| 外形 | M.2 (2280) | M.2(2280,带散热器) |
| NAND闪存 | 三星 V-NAND TLC(V8) | |
| 控制器 | 三星内部控制器 | |
| 快取记忆体 | 1GB / 2GB / 4GB / 8GB LPDDR4X(基于容量) | |
| 容量 | 1TB、2TB、4TB、8TB | |
| 顺序读/写 | 1TB:14,700 / 13,300 MB/秒 2TB:14,700 / 13,400 MB/秒 4TB:14,800 / 13,400 MB/秒 8TB:14,800 / 13,400 MB/秒 |
|
| 随机读/写(QD32) | 1TB–2TB:1,850K / 2,600K IOPS 4TB–8TB:2,200K / 2,600K IOPS |
|
| 功率(有效) | 1TB:7.6瓦(右)/ 7.2瓦(右) 2TB:8.1瓦(右)/ 7.9瓦(右) 4TB:9.0瓦(右)/ 8.2瓦(右) 8TB:待定 |
|
| 设备休眠(L1.2) | 1TB:4.0毫瓦/3.3毫瓦 2TB:4.8毫瓦/4.0毫瓦 4TB:6.5毫瓦/5.7毫瓦 8TB:待定 |
|
| 智能 TurboWrite 2.0 | 1TB:114GB 2TB:226GB 4TB:442GB 8TB:待定 |
|
| 数据加密 | AES 256 位、TCG/Opal v2.0、MS eDrive (IEEE1667) | |
| 耐力(TBW) | 1TB:600TBW 2TB:1,200TBW 4TB:2,400TBW 8TB:4,800TBW |
|
| 保修政策 | 5年限制保修 | |
三星 9100 Pro 8TB 性能
在深入研究基准测试之前,这里列出了与三星 5 Pro 9100TB 一起测试的 Gen8 硬盘以及一些 Gen4 SSD:
- Phison E28 (参考设计)
- PNY CS2150
- Lexar Professional NM1090 PRO
- SK海力士白金P51
- 金士顿FURY Renegade G5
- 闪迪 WD_BLACK SN8100
- 关键T705
- 至关重要的P510
- 三星9100 Pro
- 关键T710
- WD SN5100(PCIe Gen4)
- 三星990 Pro (PCIe Gen4)
- 西部数据 SN850X (PCIe Gen4)
我们对这些硬盘进行了各种测试,以评估它们的实际性能和综合性能。其中包括 LLM 加载时间测试(用于衡量它们处理大型 AI 模型的速度)、DirectStorage 测试(用于评估它们加载游戏资源和处理游戏内数据的速度)以及 BlackMagic Design 测试(用于评估高分辨率视频编辑的读写速度)。我们还将运行 PCMark 10 测试来评估整体系统响应能力,运行 3DMark Storage 测试游戏性能,以及 FIGO 测试来测量高负载下的峰值顺序和随机读写速度。
这是我们用于基准测试的高性能测试台:
- CPU: AMD 锐龙 7 9800X3D
- 主板:华硕 ROG Crosshair X870E Hero
- 内存:G.SKILL Trident Z5 Royal 系列 DDR5-6000(2x16GB)
- GPU: NVIDIA GeForce RTX 4090
- 操作系统:Windows 11 Pro,Ubuntu 24.10 桌面版
峰值合成性能
FIO 测试是一种灵活而强大的基准测试工具,用于测量存储设备(包括 SSD 和 HDD)的性能。它评估带宽、IOPS(每秒输入/输出操作)和不同工作负载(如顺序和随机读/写操作)下的延迟等指标。此测试有助于评估存储系统的峰值性能,可用于比较不同的设备或配置。我们测量了此测试的峰值突发性能,将两个 SSD 上的工作负载限制为 10GB。
将三星 9100 PRO 系列与其他 PCIe Gen5 固态硬盘进行比较时,结果既突显了一致性,也体现了容量之间的一些有趣的权衡。8TB 型号的顺序性能基本与 4TB 相同,读取和写入速度几乎相同,分别约为 14.6GB/s 和 13.3GB/s。差异体现在随机工作负载上。4TB 固态硬盘凭借出色的 4K 随机性能领跑全场,读取和写入速度均为 2.73M IOPS,在本次测试中击败了众多竞争对手。8TB 虽然仍然表现强劲,但随机读取速度略低,为 2.25M IOPS,但随机写入速度与 4TB 相当(略有超过),为 2.74M IOPS。
与 SanDisk SN5、Kingston Fury Renegade G8100 或 SK Hynix Platinum P5 等其他 Gen51 旗舰产品相比,三星 9100 PRO 系列在各方面均保持竞争力。4TB 型号尤其突破了随机性能的极限,而 8TB 型号则表明,扩展到更高容量并不意味着牺牲顺序吞吐量。
| FIO 测试(MB/s/IOPS 越高越好) | 顺序 128K 读取 (1T/64Q) | 顺序 128K 写入 (1T/64Q) | 随机 4K 读取 (16T/32Q) | 随机4K写入(16T/32Q) |
| 闪迪 SN8100 2TB | 15,000MB/s(平均延迟 0.56ms) | 14,100MB/s(平均延迟 0.59ms) | 2.312M IOPS(平均延迟 0.22ms) | 2.144M IOPS(平均延迟 0.24ms) |
| 金士顿 FURY Renegade G5 2TB | 14,600MB/s(平均延迟 0.57ms) | 14,100MB/s(平均延迟 0.59ms) | 2.028M IOPS(平均延迟 0.25ms) | 2.028M IOPS(平均延迟 0.25ms) |
| 三星 9100 Pro 4TB | 14,600MB/s(平均延迟 0.57ms) | 13,300MB/s(平均延迟 0.63ms) | 2.734M IOPS(平均延迟 0.18ms) | 2.734M IOPS(平均延迟 0.19ms) |
| 三星 9100 Pro 8TB | 14,600MB/s(平均延迟 0.57ms) | 13,300MB/s(平均延迟 0.63ms) | 2.253M IOPS(平均延迟 0.22ms) | 2.746M IOPS(平均延迟 0.18ms) |
| SK 海力士白金 P51 2TB | 14,500MB/s(平均延迟 0.58ms) | 13,500MB/s(平均延迟 0.62ms) | 2.369M IOPS(平均延迟 0.22ms) | 2.669M IOPS(平均延迟 0.19ms) |
| 英睿达 T710 2TB | 14,400MB/s(平均延迟 0.58ms) | 13,500MB/s(平均延迟 0.62ms) | 2.265M IOPS(平均延迟 0.23ms) | 2.306M IOPS(平均延迟 0.22ms) |
| 英睿达 T705 2TB | 14,400MB/s(平均延迟 0.58ms) | 12,300MB/s(平均延迟 0.68ms) | 1.585M IOPS(平均延迟 0.32ms) | 2.703M IOPS(平均延迟 0.19ms) |
| 群联 PS5028-E28 2TB | 14,00MB/s(平均延迟 0.60ms) | 14,000MB/s(平均延迟 0.57ms) | 2.559M IOPS(平均延迟 0.32ms) | 3.288M IOPS(平均延迟 0.32ms) |
| Lexar Professional NM1090 PRO 2TB | 13,800GB/s(平均延迟 0.61ms) | 13,600 MB/s(平均延迟 0.62ms) | 2.073M IOPS(平均延迟 0.32ms) | 2.215M IOPS(平均延迟 0.23ms) |
| PNY CS2150 2TB | 10,400GB/s(平均延迟 0.80ms) | 8,801MB/s(平均延迟 0.95ms) | 1.379M IOPS(平均延迟 0.371ms) | 1.623 IOPS(平均延迟 0.32 毫秒) |
| 关键 P510 1TB | 8,835 MiB/s(平均延迟 0.90 毫秒) | 9,961MB/s(平均延迟 0.80 毫秒) | 1.163M IOPS(平均延迟 0.44ms) | 1.196M IOPS(平均延迟 0.51ms) |
| 三星 990 Pro 2TB | 7,483MB/s(平均延迟 1.12ms) | 7,197MB/s(平均延迟 1.16ms) | 1.400M IOPS(平均延迟 0.36ms) | 1.403M IOPS(平均延迟 0.36ms) |
| 西数SN5100 2TB | 7,329MB/s(平均延迟 1.14ms) | 6,740MB/s(平均延迟 1.24ms) | 415K IOPS(平均延迟 1.23ms) | 931K IOPS(平均延迟 0.55ms) |
| WD SN850X 2TB | 6,632MB/s(平均延迟 0.76ms) | 7,235MB/s(平均延迟 0.92ms) | 1.2M IOPS(平均延迟 0.43ms) | 825K IOPS(平均延迟 0.62ms) |
法学硕士 (LLM) 平均加载时间
平均 LLM 加载时间测试评估了三种不同 LLM 的加载时间:DeepSeek R1 7B、Meta Llama 3.2 11B 和 DeepSeek R1 32B。每个模型测试 10 次,并计算平均加载时间。此测试衡量驱动器将大型语言模型 (LLM) 快速加载到内存中的能力。LLM 加载时间对于 AI 相关任务至关重要,尤其是实时推理和处理大型数据集。更快的加载速度使模型能够快速处理数据,从而提高 AI 响应速度并减少等待时间。
平均 LLM 加载时间测试突显了每款硬盘在实际 AI 工作负载下的表现。三星 9100 PRO 8TB 的测试成绩分别为 2.60 秒(DeepSeek R1 7B)、3.64 秒(Llama 3.2 11B)和 4.46 秒(DeepSeek R1 32B),而 4TB 型号的测试成绩分别为 2.62 秒、3.60 秒和 4.37 秒。实际测试中,4TB 型号在 11B 和 32B 的测试中略胜一筹,但两款型号之间的差距从未超过 0.09 秒。
SK 海力士 Platinum P51 2TB 以 2.55 秒 / 3.58 秒 / 4.18 秒的成绩领跑,紧随其后的是 SanDisk SN8100 2TB,成绩为 2.57 秒 / 3.59 秒 / 4.29 秒。这使得三星 9100 PRO 系列与最快的第五代固态硬盘(Gen5)的差距不小,在大多数情况下仅落后 0.05 到 0.10 秒。
| 法学硕士平均加载时间(越低越好) | DeepSeek R1 7B | Meta Llama 3.2 11B 视觉 | DeepSeek R1 32B |
| SK 海力士白金 P51 2TB | 2.5481s | 3.5809s | 4.1790s |
| 闪迪 SN8100 2TB | 2.5702s | 3.5856s | 4.2870s |
| 群联 PS5028-E28 2TB | 2.5730s | 3.6380s | 4.3407s |
| 英睿达 T710 2TB | 2.6138s | 3.6942s | 4.4588s |
| 三星 9100 Pro 8TB | 2.6039s | 3.6352s | 4.4561s |
| 三星 9100 Pro 4TB | 2.6173s | 3.6017s | 4.3735s |
| PNY CS2150 2TB | 2.8107s | 3.6820s | 4.8962s |
| 英睿达 T705 2TB | 2.8758s | 3.6312s | 5.1080s |
| 三星 990 Pro 2TB | 2.8758s | 3.6312s | 5.1080s |
| 关键 P510 1TB | 2.8817s | 3.6631s | 5.0594s |
| 西数SN5100 2TB | 2.9940s | 3.6650s | 5.5808s |
| WD SN850X 2TB | 3.0082s | 3.6543s | 5.4844s |
| 金士顿 FURY Renegade G5 2TB | 3.1843s | 4.8009s | 4.6523s |
| Lexar Professional NM1090 PRO 2TB | 3.2135s | 4.9504s | 7.2108s |
3DMark 直接存储
3DMark DirectStorage 功能测试评估了 Microsoft 的 DirectStorage 如何优化 PCIe SSD 上的游戏资源加载。通过减少 CPU 开销和提高数据传输速度,DirectStorage 缩短了加载时间,尤其是与 GDeflate 压缩和 Windows 11 的 BypassIO 配合使用时。此测试会隔离存储性能,以突出启用 DirectStorage 时潜在的带宽改进。
在启用 GDeflate 压缩的情况下,将数据存储到显存 (VRAM) 时,排名靠前的硬盘均集中在 25-26GB/s 范围内,包括 SK 海力士 Platinum P51 (26.32GB/s)、SanDisk SN8100 (26.11GB/s) 和 Phison PS5028-E28 (26.22GB/s)。三星 9100 PRO 8TB 紧随其后,速度为 25.39GB/s,而 4TB 则略逊一筹,速度为 23.77GB/s。
在启用 DirectStorage 的情况下,从未压缩的存储到显存 (VRAM) 的传输中,三星 8TB 型号的速度达到 11.00GB/s,而 11.26TB 型号的速度为 4GB/s。禁用 DirectStorage 后,吞吐量全面下降,8TB 型号的速度降至 8.48GB/s,4TB 型号的速度降至 8.92GB/s。对于从存储到显存 (RAM) 的传输,8TB 型号的速度为 11.75GB/s(启用 DirectStorage)和 8.83GB/s(禁用 DirectStorage),与 4TB 型号的 11.62GB/s 和 9.48GB/s 几乎相同。
GDeflate 解压带宽数据也表现出高度一致性,三星 9100 PRO 4TB 达到了 66.61GB/s,是同类产品中最高的之一,而 8TB 则略低,为 63.46GB/s。总体而言,这两款三星型号均位列 Gen5 测试结果的上端,与 SK 海力士和闪迪等领先厂商旗鼓相当,也证明了即使是 8TB 这样的大容量硬盘,在 DirectStorage 的帮助下,也能提供极具竞争力的游戏加载加速性能。
| 3DMark 直接存储,(GB/s,越高越好) | 存储至 VRAM(GDeflate 压缩) | 存储至 VRAM(DirectStorage 开启,未压缩) | 存储到 VRAM(DirectStorage 关闭,未压缩) | 存储到 RAM(DirectStorage 开启,未压缩) | 存储到 RAM(DirectStorage 关闭,未压缩) | GDeflate 解压带宽 |
| SK 海力士白金 P51 2TB | 26.32 | 11.20 | 7.75 | 12.85 | 9.46 | 64.68 |
| 群联 PS5028-E28 2TB | 26.22 | 10.89 | 7.46 | 11.15 | 9.86 | 65.58 |
| 闪迪 SN8100 2TB | 26.11 | 12.94 | 7.63 | 12.94 | 9.78 | 64.51 |
| Crucial T710 2TB 2TB | 25.96 | 10.60 | 7.57 | 12.70 | 9.76 | 64.07 |
| 英睿达 T705 2TB | 25.75 | 10.71 | 8.79 | 12.03 | 8.83 | 66.36 |
| 三星 9100 Pro 8TB | 25.39 | 11.00 | 8.48 | 11.75 | 8.83 | 63.46 |
| Lexar Professional NM1090 PRO 2TB | 24.03 | 11.23 | 7.57 | 12.18 | 8.72 | 63.15 |
| 三星 9100 Pro 4TB | 23.77 | 11.26 | 8.92 | 11.62 | 9.48 | 66.61 |
| 金士顿 FURY Renegade G52TB | 23.29 | 10.03 | 7.44 | 11.81 | 9.63 | 65.79 |
| 关键 P510 1TB | 19.63 | 8.33 | 6.92 | 9.06 | 7.49 | 66.22 |
| PNY CS2150 2TB | 19.49 | 8.60 | 6.98 | 9.22 | 7.70 | 62.43 |
| WD SN850X 2TB | 15.28 | 11.11 | 8.93 | 6.78 | 6.27 | 64.96 |
| 西数SN5100 2TB | 15.22 | 11.06 | 5.83 | 6.70 | 6.34 | 65.61 |
| 三星 990 Pro 2TB | 14.18 | 11.28 | 8.84 | 6.57 | 6.20 | 65.71 |
BlackMagic 磁盘速度测试
BlackMagic 磁盘速度测试会测试硬盘的读写速度,评估其性能,尤其是在视频编辑任务中。它可以帮助用户确保其存储速度足以支持高分辨率内容,例如 4K 或 8K 视频。
在我们的 BlackMagic 磁盘速度测试中,三星 9100 PRO 8TB 以 10,557MB/s 的读取速度和 10,555MB/s 的写入速度夺得了总成绩第二名,仅次于群联 PS5028-E28 2TB。三星 9100 PRO 4TB 则以 9,542MB/s 的读取速度和 9,908MB/s 的写入速度位居第五,遥遥领先于大多数竞争对手,但略逊于第五代硬盘的顶级产品。
以下是我们当前的 BlackMagic 磁盘速度排行榜:
| BlackMagic 磁盘速度(MB/s,越高越好) | 读取 MB/s | 写入 MB/s |
| 群联 PS5028-E28 2TB | 11,216.1 | 10,570.7 |
| 三星 9100 Pro 8TB | 10,557.3 | 10,554.7 |
| 闪迪 SN8100 2TB | 10,005.2 | 10,581.0 |
| 金士顿 FURY Renegade G5 2TB | 9,665.0 | 10,831.0 |
| 三星 9100 Pro 4TB | 9,542.3 | 9,907.9 |
| 英睿达 T710 2TB | 9,415.3 | 10,688.2 |
| SK 海力士白金 P51 2TB | 9,241.0 | 9,109.0 |
| Lexar Professional NM1090 PRO 2TB | 9,149.2 | 10,466.6 |
| 英睿达 T705 2TB | 8,464.2 | 10,256.4 |
| 关键 P510 1TB | 7,853.9 | 7,939.6 |
| PNY CS2150 2TB | 6,625.5 | 7,299.5 |
| WD SN850X 2TB | 5,862.6 | 5,894.8 |
| 三星 990 Pro 2TB | 5,769.5 | 5,842.9 |
| 西数SN5100 2TB | 5,394.6 | 5,865.8 |
PCMark10 存储
PCMark 10 存储基准测试使用基于应用程序的追踪数据来评估实际存储性能。它们测试系统和数据驱动器,测量带宽、访问时间和负载下的一致性。这些基准测试提供了超越综合测试的实用见解,使用户能够有效地比较各种现代存储解决方案。
在 PCMark 10 测试中,三星 9100 PRO 8TB 以 7,602 分的成绩位居第八,而三星 9100 PRO 4TB 则以 7,552 分的成绩位居第九。这两款硬盘的表现都比较稳健,但落后于第五代硬盘的顶级竞争对手,例如群联 PS5-E5028 28TB(2 分,第一名)和 Crucial T9,347 705TB(2 分,第二名)。
| PCMark 10 数据驱动器(越高越好) | 总体得分 |
| 群联 PS5028-E28 2TB | 9,347 |
| Crucial T705 2TB 2TB | 8,783 |
| SK 海力士白金 P51 2TB | 8,665 |
| 闪迪 SN8100 2TB | 8,644 |
| Lexar Professional NM1090 PRO 2TB | 8,247 |
| 金士顿 FURY Renegade G5 2TB | 8,062 |
| 英睿达 T710 2TB | 7.918 |
| 三星 9100 Pro 8TB | 7,602 |
| 三星 9100 Pro 4TB | 7,552 |
| 三星 990 Pro 2TB | 7,173 |
| 关键 P310 2TB | 6,436 |
| 西数SN5100 2TB | 6,379 |
| PNY CS2150 2TB | 6,070 |
| WD SN850X 2TB | 4,988 |
3DMark 存储
3DMark 存储基准测试通过测量加载游戏、保存进度、安装游戏文件和录制游戏等任务来测试 SSD 的游戏性能。它评估您的存储处理真实游戏活动的能力,并支持最新的存储技术以获得准确的性能见解。
在 3DMark 存储基准测试中,三星 9100 PRO 4TB 以 4,779 分的成绩位居第八。三星 9100 PRO 8TB 紧随其后,以 4,516 分的成绩位居第九。两款固态硬盘均表现出色,尽管它们的表现略逊于 SanDisk SN8100 2TB(6,047 分,第一名)和 Phison PS5028-E28 2TB(5,879 分,第二名)等领先产品。
| 3DMark 存储基准(越高越好) | 总体得分 |
| 闪迪 SN8100 2TB | 6,047 |
| 群联 PS5028-E28 2TB | 5,879 |
| 金士顿 FURY Renegade G5 2TB | 5,670 |
| 英睿达 T705 2TB | 5,100 |
| 英睿达 T710 2TB | 5,083 |
| SK 海力士白金 P51 2TB | 5,082 |
| Lexar Professional NM1090 PRO 2TB | 4,828 |
| 三星 9100 Pro 4TB | 4,779 |
| 三星 9100 Pro 8TB | 4,516 |
| 西数SN5100 2TB | 4,192 |
| Crucial P510 1TB 2TB | 4,148 |
| PNY CS2150 2TB | 4,193 |
| 三星 990 Pro 2TB | 4,128 |
| WD SN850X 2TB | 3,962 |
| 关键 P310 2TB | 3,848 |
GPU 直接存储
我们在这个测试平台上进行的测试之一是 Magnum IO GPU 直接存储 (GDS) 测试。GDS 是 NVIDIA 开发的一项功能,允许 GPU 在访问存储在 NVMe 驱动器或其他高速存储设备上的数据时绕过 CPU。GDS 无需通过 CPU 和系统内存路由数据,而是实现 GPU 和存储设备之间的直接通信,从而显著降低延迟并提高数据吞吐量。
GPU 直接存储的工作原理
传统上,当 GPU 处理存储在 NVMe 驱动器上的数据时,数据必须先经过 CPU 和系统内存,然后才能到达 GPU。这个过程会造成瓶颈,因为 CPU 会成为中间人,增加延迟并消耗宝贵的系统资源。GPU 直接存储通过使 GPU 能够通过 PCIe 总线直接从存储设备访问数据,消除了这种低效率。这种直接路径减少了与数据移动相关的开销,从而实现了更快、更高效的数据传输。
AI 工作负载(尤其是涉及深度学习的工作负载)是高度数据密集型的。训练大型神经网络需要处理数 TB 的数据,数据传输的任何延迟都可能导致 GPU 利用率不足和训练时间延长。GPU Direct Storage 通过确保尽快将数据传送到 GPU、最大限度地减少空闲时间并最大限度地提高计算效率来解决这一挑战。
此外,GDS 对于涉及流式传输大型数据集的工作负载(例如视频处理、自然语言处理或实时推理)尤其有益。通过减少对 CPU 的依赖,GDS 可加速数据移动并释放 CPU 资源以用于其他任务,从而进一步提高整体系统性能。
功能验证
在我们的 GDSIO 测试中,三星 9100 Pro 8TB 在不同块大小下均表现出强劲且稳定的吞吐量,尽管其性能与 4TB 型号相比略有不同。在 16K 块大小(128 队列深度)下,8TB 的读取速度达到 3.4GiB/s(220K IOPS),写入速度达到 2.4GiB/s(155K IOPS),读取速度与 4TB(3.4GiB/s,226K IOPS)几乎相同,但写入吞吐量略高于 4TB 的 2.3GiB/s(161K IOPS)。在 128K 块大小下,8TB 的顺序写入速度与 4TB 相当,均为 5.9GiB/s,但 4TB 的读取性能更强,为 5.2GiB/s,而 8TB 为 5.9GiB/s,这突显了不同容量之间的一些差异。
在最大 1M 块大小下,两种容量的 SSD 都提供了稳定的连续性能:8TB 的读取速度为 6.0GiB/s,写入速度为 6.1GiB/s;而 4TB 的读取速度为 6.3GiB/s,写入速度为 6.1GiB/s。这使得这两款 SSD 在持续大块传输方面的表现基本相当,不过 4TB 在读取带宽方面略有优势。
与其他硬盘相比,9100 Pro 8TB 的性能与群联 PS5-E5028 和金士顿 FURY Renegade G28 等领先的第五代硬盘型号保持了竞争力,这些型号在 5K 工作负载下表现出更高的一致性,而上一代三星 128 Pro 和西部数据 SN4X 等第四代硬盘则在所有块大小上都明显落后。总体而言,990 Pro 850TB 的性能与容量扩展性良好,与 9100TB 型号保持同步,同时在某些工作负载下仅略有不足。
以下是完整的概述:
| GDSIO 图表(16K、128K、1M 块大小平均值) | (16K 块大小 128 IO 深度)平均读取 | (16K 块大小 128 IO 深度)平均写入 | (128K 块大小 128 IO 深度)平均读取 | (128K 块大小 128 IO 深度)平均写入 | (1M 块大小 128 IO 深度)平均读取 | (1M 块大小 128 IO 深度)平均写入 |
| 群联 PS5028-E28 2TB | 3.7GiB/秒(0.519毫秒)IOPS:245.1K | 2.4GiB/秒(0.824毫秒)IOPS:154.7K | 5.9GiB/秒(2.647毫秒)IOPS:48.2K | 5.9GiB/秒(2.650毫秒)IOPS:48.31K | 6.4GiB/秒(19.650毫秒)IOPS:6.5K | 6.2GiB/秒(20.033毫秒)IOPS:6.4K |
| 金士顿 FURY Renegade G5 2TB | 3.7GiB/秒(0.526毫秒)IOPS:242.1K | 2.4GiB/秒(0.824毫秒)IOPS:154.7K | 5.9GiB/秒(2.704毫秒)IOPS:48.5K | 5.8GiB/秒(0.564毫秒)IOPS:47.3K | 6.5GiB/秒(19.356毫秒)IOPS:6.6K | 6.3GiB/秒(19.690毫秒)IOPS:6.5K |
| 英睿达 T710 2TB | 3.7GiB/秒(0.526毫秒)IOPS:242.0K | 2.4GiB/秒(0.823毫秒)IOPS:155.0K | 5.8GiB/秒(2.613毫秒)IOPS:48.9K | 3.7GiB/秒(2.669毫秒)IOPS:47.9K | 6.4GiB/秒(0.526毫秒)IOPS:6.6K | 6.1GiB/秒(19.479毫秒)IOPS:6.3K |
| Lexar Professional NM1090 PRO 2TB | 3.6GiB/秒(0.533毫秒)IOPS:238.7K | 2.3GiB/秒(0.845毫秒)IOPS:150.8K | 5.9GiB/秒(2.639毫秒)IOPS:48.4K | 4.2GiB/秒(3.714毫秒)IOPS:34.4K | 6.5GiB/秒(19.274毫秒)IOPS:6.6K | 6.2GiB/秒(20.127毫秒)IOPS:6.4K |
| 闪迪 SN8100 2TB | 3.4GiB/秒(0.564毫秒)IOPS:225.9K | 2.1GiB/秒(0.907毫秒)IOPS:140.6K | 5.9GiB/秒(2.626毫秒)IOPS:48.7K | 5.8GiB/秒(2.668毫秒)IOPS:47.9K | 6.5GiB/秒(19.264毫秒)IOPS:6.6K | 5.9GiB/秒(21.063毫秒)IOPS:6.1K |
| 三星 9100 Pro 4TB | 3.4GiB/秒(0.565毫秒)IOPS:226.4K | 2.3GiB/秒(0.839毫秒)IOPS:161.7K | 5.2GiB/秒(3.001毫秒)IOPS:44.9K | 5.9GiB/秒(2.662毫秒)IOPS:47.3K | 6.3GiB/秒(19.877毫秒)IOPS:6.4K | 6.1GiB/秒(20.579毫秒)IOPS:6.2K |
| 三星 9100 Pro 8TB | 3.4GiB/秒(0.577毫秒)IOPS:220.4K | 2.4GiB/秒(0.821毫秒)IOPS:155.3K | 5.9GiB/秒(2.676毫秒)IOPS:47.8K | 5.9GiB/秒(2.659毫秒)IOPS:48.1K | 6.0GiB/秒(19.592毫秒)IOPS:6.5K | 6.1GiB/秒(20.847毫秒)IOPS:6.1K |
| 英睿达 T705 2TB | 3.3GiB/秒(0.587毫秒)IOPS:217.0K | 2.3GiB/秒(.836毫秒)IOPS:152.6K | 5.5GiB/秒(2.863毫秒)IOPS:44.7K | 5.6GiB/秒(2.799毫秒)IOPS:45.7K | 6.0GiB/秒(20.738毫秒)IOPS:6.2K | 6.0GiB/秒(20.855毫秒)IOPS:6.1K |
| SK 海力士白金 P51 2TB | 3.1GiB/秒(0.634毫秒)IOPS:200.9K | 1.5GiB/秒(1.314毫秒)IOPS:97.2K | 5.6GiB/秒(2.781毫秒)IOPS:46.0K | 3.9GiB/秒(4.014毫秒)IOPS:31.9K | 6.2GiB/秒 (20.126毫秒)IOPS:6.4K | 4.2GiB/秒(29.576毫秒)IOPS:4.3K |
| 三星 990 Pro 2TB | 2.7GiB/秒(0.731毫秒)IOPS:174.4K | 2.2GiB/秒(0.903毫秒)IOPS:141.2K | 4.0GiB/秒(3.944毫秒)IOPS:32.4K | 4.1GiB/秒(3.849毫秒)IOPS:33.2K | 3.9GiB/秒(32.415毫秒)IOPS:3.9K | 4.2GiB/秒(29.520毫秒)IOPS:4.3K |
| PNY CS2150 2TB | 2.5GiB/秒(0.779毫秒)IOPS:163.5K | 1.8GiB/秒 1.107毫秒)IOPS:115.3K | 4.5GiB/秒(3.473毫秒)IOPS:36.8K | 4.7GiB/秒(3.357毫秒)IOPS:38.1K | 4.6GiB/秒(27.157毫秒)IOPS:174.4K | 4.9GiB/秒(25.682毫秒)IOPS:5.0K |
| 关键 P510 1TB | 2.3GiB/秒(0.837毫秒)IOPS:152.2K | 2.3GiB/秒(0.842毫秒)IOPS:151.5K | 4.5GiB/秒(3.450毫秒)IOPS:37.1K | 4.8GiB/秒(3.262毫秒)IOPS:39.2K | 4.8GiB/秒(26.2181毫秒)IOPS:4.9K | 5.0GiB/秒(25.121毫秒)IOPS:5.1K |
| WD SN850X 2TB | 2.3GiB/秒(0.736毫秒)IOPS:173.2K | 2.0GiB/秒(0.989毫秒)IOPS:129.0K | 4.1GiB/秒(3.878毫秒)IOPS:33.3K | 4.0GiB/秒(3.958毫秒)IOPS:33.0K | 4.4GiB/秒(30.501毫秒)IOPS:4.5K | 4.1GiB/秒(30.782毫秒)IOPS:4.2K |
| 西数SN5100 2TB | 2.3GiB/秒(0.847毫秒)IOPS:150.4K | 2.2GiB/秒(0.877毫秒)IOPS:145.4K | 3.8GiB/秒(4.161毫秒)IOPS:30.7K | 3.6GiB/秒(4.318毫秒)IOPS:29.6K | 4.1GiB/秒(30.223毫秒)IOPS:4.2K | 4.0GiB/秒(30.981毫秒)IOPS:4.1K |
结语
今年早些时候,我们测试了三星 9100 Pro 的 4TB 版本,它给我们留下了深刻的印象。8TB 版本带来的是容量上的提升。它使最大容量翻倍,同时保持了与小容量版本相同的性能、一致性和效率。
在我们的基准测试中,8TB 硬盘的表现恰到好处。它的顺序吞吐量与 4TB 硬盘相当,在某些情况下,随机写入工作负载方面甚至略胜一筹。LLM 加载时间和 DirectStorage 测试显示,两种容量之间差距不大,但差异很小,大多数用户几乎察觉不到。真正的亮点在于,三星将硬盘容量扩展到 8TB 时,并没有牺牲性能,也没有在散热或功耗方面做出重大妥协。
当然,8TB 型号价格不菲,而且并非所有人都需要在单个 M.2 插槽中拥有如此大的存储空间。对于处理数 TB 数据集的专业人士、拥有大型 8K 项目的创作者,或想要一次性安装海量资料库的游戏玩家来说,它提供了小型硬盘无法比拟的可能性。即使是 PlayStation 5 用户,如果选择带散热片的版本,也可以充分利用它,不过 8TB 型号较厚的 z 轴高度可能会在某些机型中受到限制。
三星证明了 9100 Pro 可以在不失去 4TB 型号出色性能的同时,扩大容量。4TB 版本仍然为发烧友提供了良好的平衡性,而 8TB 版本则是希望彻底突破存储限制的重度用户的旗舰之选。凭借比 990 Pro 更高的效率、出色的耐用性以及三星提供的五年质保,9100 Pro 系列仍然是第五代 SSD 领域最强大的选择之一。




Amazon