首页 电子消费品客户端SSD Crucial P510 评测:Gen5 性能,Gen4 价格

Crucial P510 评测:Gen5 性能,Gen4 价格

by 迪伦·多尔蒂

Crucial P510 以强大的效率、稳定的吞吐量以及广泛的台式机/笔记本电脑支持为主流用户带来 Gen5 SSD 性能。

Crucial P510 是我们实验室推出的第二款 PCIe Gen5 M.2 SSD,之前评测过的高端产品 关键T705与其高性能兄弟产品不同,P510 更注重性价比。它的目标客户是那些既想体验第五代速度又不想花费太多的用户,因此设计了一款兼顾笔记本电脑和台式机的固态硬盘,注重能效、散热性能和广泛的兼容性。随着人工智能工作负载、大型游戏资源流水线和高分辨率内容创作的兴起,像 P5 这样的固态硬盘定位于一个实用的中间地带,以更亲民的价格提供稳定的吞吐量。本篇评测将展示 P510 在一系列真实世界和模拟测试中的表现,包括人工智能模型加载、DirectStorage 和传统存储基准测试。

Crucial P510 盒子

至关重要的P510 规格

规格 美光 Crucial P510
接口 PCIe 5.0 ×4
向后兼容性 Yes
外形 M.2 2280
散热器选项 Yes
NAND存储内存 美光 G9 276 层 3D NAND
控制器 群联 PS5031-E31T
容量 1TB,2TB
DRAM 无内存(使用主机内存缓冲区)
连续读取速度(最高) 11,000 MB / s的
连续写入速度(最高) 9,500 MB / s的
随机读取速度 (QD32) 1.5 万次 IOPS
随机写入速度 (QD32) 1.5 万次 IOPS
管理软件 关键存储主管
数据加密 没有
耐力(TBW) 每 600TB 1TBW
保修政策 5年限
美国上市价格 无散热器:1TB:119.99 美元,2TB:199.99 美元

加散热器:1TB:129.99 美元,2TB:209.99 美元

Crucial P510 的构造和设计

Crucial P510 采用美光先进的 G9 276 层 TLC NAND 打造。它采用无 DRAM 配置的 Phison PS5031-E31T 控制器,有助于降低高达 25% 的功耗,非常适合延长笔记本电脑和低功耗环境中的电池续航时间。它采用标准 M.2 2280 尺寸规格,支持 PCIe 5.0 ×4,同时保持与前几代 PCIe 的完全向后兼容性。

Crucial P510 群联控制器

耐久度额定功率高达每 600TB 1TBW,适用于一般和重度使用场景。外观方面,P510 采用时尚的黑色 PCB,可与现代系统完美契合。Crucial 为台式机用户提供可选散热器,有助于在持续负载下控制散热,确保在高负载下也能保持稳定的性能。

至关重要的P510

管理和软件支持

Crucial P510 支持 关键存储主管是一款免费软件工具,旨在帮助用户监控、管理和优化其固态硬盘 (SSD)。该实用程序可让用户轻松查看硬盘健康状况、检查已使用的存储空间、跟踪工作温度以及更新固件以提高稳定性和性能。该软件还支持安全密码重置和访问 Momentum Cache 等功能,Momentum Cache 可通过利用系统内存缓存写入数据,将固态硬盘 (SSD) 运行速度提升高达 10 倍。Storage Executive 增强了可用性,并确保 P510 在整个生命周期内保持最佳性能。

至关重要的 P510 性能

在深入研究基准测试之前,以下是与 Micron Crucial P510 及其各自的 PCIe 代一起测试的可比驱动器列表:

我们将测试这些硬盘,以评估实际和综合性能。其中包括 LLM 加载时间,以衡量它们处理大型 AI 模型的速度。DirectStorage 测试用于了解它们加载游戏资源和处理游戏内数据的速度,以及 Blackmagic Design 测试用于评估高分辨率视频编辑的读写速度。我们还将运行 PCMark 10 来评估整体系统响应能力,运行 3DMark Storage 来测试游戏性能,以及 FIO 测试来测量高负载下的峰值顺序和随机读写速度。

这是我们用于基准测试的高性能测试台:

峰值合成性能

FIO 测试是一种灵活而强大的基准测试工具,用于测量存储设备(包括 SSD 和 HDD)的性能。它评估带宽、IOPS(每秒输入/输出操作)和不同工作负载(如顺序和随机读/写操作)下的延迟等指标。此测试有助于评估存储系统的峰值性能,可用于比较不同的设备或配置。我们测量了此测试的峰值突发性能,将两个 SSD 上的工作负载限制为 10GB。

在 FIO 突发测试中,Crucial P510 1TB 在各种工作负载下均表现出色,峰值性能表现稳健。其顺序读取速度达到 8,835 MiB/s,顺序写入速度达到 9,961 MiB/s,在两个方面均超越 990 Pro、P310 和 SN850X。延迟保持较低水平,读取延迟为 0.90 毫秒,写入延迟为 0.80 毫秒。

对于 4K 随机操作,P510 的读取速度为 1.163M IOPS,写入速度为 1.196M IOPS,平均延迟分别为 0.44 毫秒和 0.51 毫秒。虽然它比不上 T705 或三星 9100 Pro,但在吞吐量和延迟方面却超过了 SN850X。

FIO 测试(MB/s/IOPS 越高越好) 关键 P310 2TB 关键 P510 1TB 英睿达 T705 2TB 三星 990 Pro 2TB 三星 9100 Pro 4TB WD SN850X 2TB
顺序 128K 读取 (2T/64Q) 7,197 MB/s(平均延迟 1.16ms) 8,835 MiB/s(平均延迟 0.90 毫秒) 14,400 MB/s(平均延迟 0.58ms) 7,483 MB/s(平均延迟 1.12ms) 14,600 MB/s(平均延迟 1.92ms) 6,632 MB/s(平均延迟 0.76ms)
顺序 128K 写入 (2T/64Q) 6,376 MB/s(平均延迟 1.31ms) 9,961 MiB/s(平均延迟 0.80 毫秒) 12,300 MB/s(平均延迟 0.68ms) 7,197 MB/s(平均延迟 1.16ms) 13,300 MB/s(平均延迟 2.15ms) 7,235 MB/s(平均延迟 0.92ms)
随机 4K 读取 (16T/32Q) 1.163M IOPS(平均延迟 0.80ms) 1.163M IOPS(平均延迟 0.44ms) 1.585M IOPS(平均延迟 0.32ms) 1.400M IOPS(平均延迟 0.36ms) 2.734M IOPS(平均延迟 0.18ms) 1.2M IOPS(平均延迟 0.43ms)
随机4K写入(16T/32Q) 1.196M IOPS(平均延迟 0.43ms) 1.196M IOPS(平均延迟 0.51ms) 2.703M IOPS(平均延迟 0.19ms) 1.403M IOPS(平均延迟 0.36ms) 2.734M IOPS(平均延迟 0.19ms) 825K IOPS(平均延迟 0.62ms)
法学硕士 (LLM) 平均加载时间

平均 LLM 加载时间测试评估了三种不同 LLM 的加载时间:DeepSeek R1 7B、Meta Llama 3.2 11B 和 DeepSeek R1 32B。每个模型测试 10 次,并计算平均加载时间。此测试衡量驱动器将大型语言模型 (LLM) 加载到内存中的速度。LLM 加载时间对于 AI 相关任务至关重要,尤其是实时推理和大数据集处理。更快的加载速度意味着模型可以快速处理数据,从而提高 AI 响应速度并减少等待时间。

Crucial P510 1TB 在平均 LLM 加载时间测试中,与大多数型号相比都表现出色。它加载 DeepSeek R1 7B 耗时 2.8817 秒,略逊于 T705(2.8758 秒)和三星 990 Pro(2.8758 秒),但领先于 WD SN850X(3.0082 秒)和 Crucial P310(3.1889 秒)。对于 Meta Llama 3.2 11B Vision,P510 的加载时间为 3.6631 秒,落后于顶级硬盘,但仍优于 P310(3.7083 秒)和 SN850X(3.6543 秒)。它在 DeepSeek R1 32B 负载中表现更为强劲,在 5.0594 秒内完成 - 比 T705(5.1080 秒)、990 Pro(5.1080 秒)、SN850X(5.4844 秒)和 P310(5.4844 秒)更快,但落后于三星 9100 Pro(4.3735 秒)。

总体而言,P510 性能稳健,尤其是在处理大型模型时,因为持续的吞吐量至关重要。虽然并非在所有测试中都处于领先地位,但它是一款性能强大、高效的中端 SSD,适合 AI 工作负载。

法学硕士平均加载时间(越低越好) 关键 P310 2TB 关键 P510 1TB 英睿达 T705 2TB 三星 990 Pro 2TB 三星 9100 Pro 4TB WD SN850X 2TB
DeepSeek R1 7B 3.1889s 2.8817s 2.8758s 2.8758s 2.6173s 3.0082s
Meta Llama 3.2 11B 视觉 3.7083s 3.6631s 3.6312s 3.6312s 3.6017s 3.6543s
DeepSeek R1 32B 5.4844s 5.0594s 5.1080s 5.1080s 4.3735s 5.4844s
3DMark 直接存储

3DMark DirectStorage 功能测试评估了 Microsoft 的 DirectStorage 如何优化 PCIe SSD 上的游戏资源加载。通过减少 CPU 开销和提高数据传输速度,DirectStorage 缩短了加载时间,尤其是与 GDeflate 压缩和 Windows 11 的 BypassIO 配合使用时。此测试会隔离存储性能,以突出启用 DirectStorage 时潜在的带宽改进。

在 3DMark DirectStorage 功能测试中,Crucial P510 1TB 的性能提升显著,尤其是在 GDeflate 压缩下,存储到显存的速度达到 19.63 GB/s,远高于 P310(14.81 GB/s)、990 Pro(14.18 GB/s)和 SN850X(15.28 GB/s)。虽然它落后于 Crucial T705(25.75 GB/s)和三星 9100 Pro(23.77 GB/s),但在压缩资源加载方面仍然具有竞争力。

未压缩性能方面,P510 为 8.33 GB/s(DirectStorage 开启)和 6.92 GB/s(DirectStorage 关闭),落后于其他产品。然而,它在存储到 RAM 方面有所回升,分别达到 9.06 GB/s(DirectStorage 开启)和 7.49 GB/s(DirectStorage 关闭),超越了多款消费级硬盘。GDeflate 解压带宽与同类产品一致,为 66.22 GB/s,与其他同类产品相当。

3DMark 直接存储(越高越好) 关键 P310 2TB 关键 P510 1TB 英睿达 T705 2TB 三星 990 Pro 2TB 三星 9100 Pro 4TB WD SN850X 2TB
存储至 VRAM(GDeflate 压缩) 14.81 GB /秒 19.63 GB /秒 25.75 GB /秒 14.18 GB /秒 23.77 GB /秒 15.28 GB /秒
存储至 VRAM(DirectStorage 开启,未压缩) 10.75 GB /秒 8.33 GB /秒 10.71 GB /秒 11.28 GB /秒 11.26 GB /秒 11.11 GB /秒
存储到 VRAM(DirectStorage 关闭,未压缩) 8.56 GB /秒 6.92 GB /秒 8.79 GB /秒 8.84 GB /秒 8.92 GB /秒 8.93 GB /秒
存储到 RAM(DirectStorage 开启,未压缩) 6.46 GB /秒 9.06 GB /秒 12.03 GB /秒 6.57 GB /秒 11.62 GB /秒 6.78 GB /秒
存储到 RAM(DirectStorage 关闭,未压缩) 5.87 GB /秒 7.49 GB /秒 8.83 GB /秒 6.20 GB /秒 9.48 GB /秒 6.27 GB /秒
GDeflate 解压带宽 65.43 GB /秒 66.22 GB /秒 66.36 GB /秒 65.71 GB /秒 66.61 GB /秒 64.96 GB /秒

Blackmagic磁盘速度测试

Blackmagic Disk Speed Test 可对硬盘的读写速度进行基准测试,评估其性能,尤其是视频编辑任务的性能。它可以帮助用户确保其存储速度足以满足高分辨率内容(如 4K 或 8K 视频)的需要。

在 Blackmagic 磁盘速度测试中,Crucial P510 1TB 的读取速度达到 7,853.9 MB/s,写入速度达到 7,939.6 MB/s,远超 P310、990 Pro 和 SN850X。虽然它的速度不如 Crucial T705 或三星 9100 Pro,但在 4K 和 8K 视频编辑等任务中仍然表现出色。P510 是一款快速、性能强大的硬盘,适合创意工作负载,且价格无需达到旗舰级水平。

Blackmagicdesign(越高越好) 关键 P310 2TB 关键 P510 1TB 英睿达 T705 2TB 三星 990 Pro 2TB 三星 9100 Pro 4TB WD SN850X 2TB
读取 MB/s 5,282.4 MB / s的 7,853.9 MB / s的 8,464.2 MB / s的 5,769.5 MB / s的 9,542.3 MB / s的 5,862.6 MB / s的
写入 MB/s 5,458.9 MB / s的 7,939.6 MB / s的 10,256.4 MB / s的 5,842.9 MB / s的 9,907.9 MB / s的 5,894.8 MB / s的

PCMark10 存储

PCMark 10 存储基准测试使用基于应用程序的追踪数据来评估实际存储性能。它们测试系统和数据驱动器,测量带宽、访问时间和负载下的一致性。这些基准测试提供了超越综合测试的实用见解,帮助用户有效地比较各种现代存储解决方案。

在 PCMark 10 数据驱动器基准测试中,Crucial P510 1TB 得分为 6,450,略高于 P310(6,436),远超 WD SN850X(4,988)。它略逊于三星 990 Pro(7,173)、三星 9100 Pro(7,552)和 Crucial T705(8,783),但在处理一般应用程序工作负载时仍能提供稳定的性能。P510 是一款性能强大的中端选择,在处理典型数据任务时具有稳定的响应速度。

PCMark 10 数据驱动器(越高越好) 关键 P310 2TB 关键 P510 1TB 英睿达 T705 2TB 三星 990 Pro 2TB 三星 9100 Pro 4TB WD SN850X 2TB
总体得分 6,436 6,450 8,783 7,173 7,552 4,988
3DMark 存储

3DMark 存储基准测试通过测量加载游戏、保存进度、安装游戏文件和录制游戏等任务来测试 SSD 的游戏性能。它评估您的存储处理真实游戏活动的能力,并支持最新的存储技术以获得准确的性能见解。

在 3DMark 存储基准测试中,Crucial P510 1TB 得分 4,148,优于 Crucial P310(3,848)、WD SN850X(3,962),并略胜三星 990 Pro(4,128)。它落后于 Crucial T705(5,100)和三星 9100 Pro(4,779),但在中端市场中占据强劲地位。P510 拥有极具竞争力的游戏性能,尤其是在加载、保存和安装游戏等任务中,而且无需花费顶级硬盘的成本。

3DMark 存储基准(越高越好) 关键 P310 2TB 关键 P510 1TB 英睿达 T705 2TB 三星 990 Pro 2TB 三星 9100 Pro 4TB WD SN850X 2TB
总体得分 3,848 4,148 5,100 4,128 4,779 3,962

GPU 直接存储

我们在这个测试平台上进行的测试之一是 Magnum IO GPU 直接存储 (GDS) 测试。GDS 是 NVIDIA 开发的一项功能,允许 GPU 在访问存储在 NVMe 驱动器或其他高速存储设备上的数据时绕过 CPU。GDS 无需通过 CPU 和系统内存路由数据,而是实现 GPU 和存储设备之间的直接通信,从而显著降低延迟并提高数据吞吐量。

GPU 直接存储的工作原理

传统上,当 GPU 处理存储在 NVMe 驱动器上的数据时,数据必须先经过 CPU 和系统内存,然后才能到达 GPU。这个过程会造成瓶颈,因为 CPU 会成为中间人,增加延迟并消耗宝贵的系统资源。GPU 直接存储通过使 GPU 能够通过 PCIe 总线直接从存储设备访问数据,消除了这种低效率。这种直接路径减少了与数据移动相关的开销,从而实现了更快、更高效的数据传输。

AI 工作负载(尤其是涉及深度学习的工作负载)是高度数据密集型的。训练大型神经网络需要处理数 TB 的数据,数据传输的任何延迟都可能导致 GPU 利用率不足和训练时间延长。GPU Direct Storage 通过确保尽快将数据传送到 GPU、最大限度地减少空闲时间并最大限度地提高计算效率来解决这一挑战。

此外,GDS 对于涉及流式传输大型数据集的工作负载(例如视频处理、自然语言处理或实时推理)尤其有益。通过减少对 CPU 的依赖,GDS 可加速数据移动并释放 CPU 资源以用于其他任务,从而进一步提高整体系统性能。

在测试的SSD产品线中,Crucial P510 1TB提供了中等性能,体现了其以价值为导向的定位,同时在GPU直接存储(GDS)工作负载下仍保持着相当不错的表现。在16K块大小和128队列深度下,P510的读取速度为2.3 GiB/s(0.837毫秒,152.2K IOPS),写入速度为2.3 GiB/s(0.842毫秒,151.5K IOPS)。这些数据与三星990 Pro和Crucial T705等价格更高的SSD相比具有竞争力。随着块大小的增加,P510继续展现出可观的吞吐量:在4.5K块大小下,读取速度为4.8 GiB/s,写入速度为128 GiB/s,同时延迟性能稳定(分别为3.45毫秒和3.26毫秒)。在 1M 块大小下,P510 的读取速度达到 4.8 GiB/s,写入速度达到 5.0 GiB/s,再次超越了一些面向消费者的选项,例如 WD SN850X,并且接近三星 9100 Pro 等高端或企业级硬盘。虽然 P510 的性能绝对值并非最高,但它在所有测试的块大小上都提供了均衡的带宽和延迟。对于受益于 GDS 的数据密集型 AI 工作流程来说,它是一个可靠且经济高效的选择。

GDSIO 图表(16K、128K、1M 块大小平均值) 关键 P310 2TB 关键 P510 1TB 英睿达 T705 2TB 三星 990 Pro 2TB 三星 9100 Pro 4TB WD SN850X 2TB
(16K 块大小 128 IO 深度)平均读取 3.1 GiB/秒(0.627毫秒)IOPS:203.2K 2.3 GiB/秒(0.837毫秒)IOPS:152.2K 3.3 GiB/秒(0.587毫秒)IOPS:217.0K 2.7 GiB/秒(0.731毫秒)IOPS:174.4K 3.4 GiB/秒(0.565毫秒)IOPS:226.4K 2.3 GiB/秒(0.736毫秒)IOPS:173.2K
(16K 块大小 128 IO 深度)平均写入 2.2 GiB/秒(0.902毫秒)IOPS:141.4K 2.3 GiB/秒(0.842毫秒)IOPS:151.5K 2.3 GiB/秒(0.836毫秒)IOPS:152.6K 2.2 GiB/秒(0.903毫秒)IOPS:141.2K 2.3 GiB/秒(0.839毫秒)IOPS:161.7K 2.0 GiB/秒(0.989毫秒)IOPS:129.0K
(128K 块大小 128 IO 深度)平均读取 4.1 GiB/秒(3.845毫秒)IOPS:33.3K 4.5 GiB/秒(3.450毫秒)IOPS:37.1K 5.5 GiB/秒(2.863毫秒)IOPS:44.7K 4.0 GiB/秒(3.944毫秒)IOPS:32.4K 5.2 GiB/秒(3.001毫秒)IOPS:44.9K 4.1 GiB/秒(3.878毫秒)IOPS:33.3K
(128K 块大小 128 IO 深度)平均写入 3.9 GiB/秒(3.992毫秒)IOPS:32.0K 4.8 GiB/秒(3.262毫秒)IOPS:39.2K 5.6 GiB/秒(2.799毫秒)IOPS:45.7K 4.1 GiB/秒(3.849毫秒)IOPS:33.2K 5.9 GiB/秒(2.662毫秒)IOPS:47.3K 4.0 GiB/秒(3.958毫秒)IOPS:33.0K
(1M 块大小 128 IO 深度)平均读取 4.4 GiB/秒(28.462毫秒)IOPS:4.5K 4.8 GiB/秒(26.2181毫秒)IOPS:4.9K 6.0 GiB/秒(20.738毫秒)IOPS:6.2K 3.9 GiB/秒(32.415毫秒)IOPS:3.9K 6.3 GiB/秒(19.877毫秒)IOPS:6.4K 4.4 GiB/秒(30.501毫秒)IOPS:4.5K
(1M 块大小 128 IO 深度)平均写入 4.1 GiB/秒(30.964毫秒)IOPS:4.2K 5.0 GiB/秒(25.121毫秒)IOPS:5.1K 6.0 GiB/秒(20.855毫秒)IOPS:6.1K 4.2 GiB/秒(29.520毫秒)IOPS:4.3K 6.1 GiB/秒(20.579毫秒)IOPS:6.2K 4.1 GiB/秒(30.782毫秒)IOPS:4.2K

结语

Crucial 英睿达 P510 为追求强劲性能但又不想承担旗舰级解决方案成本的用户提供全面的 PCIe Gen5 体验。它拥有稳定的吞吐量、低延迟和高效的功耗,适用于从 AI 模型处理、游戏到内容创作等各种工作负载。虽然 P510 并非在所有指标上都领先,但它在关键领域始终表现卓越,并保持着极具竞争力的散热性能和可靠性。对于希望在桌面和移动环境中采用 Gen5 速度的专业人士和爱好者来说,P510 是一款功能强大、经济高效的解决方案,具有广泛的吸引力。

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅