首頁 消費者客戶端SSD 美光 4600 SSD:面向下一代運算的終極 Gen5 OEM 存儲

美光 4600 SSD:面向下一代運算的終極 Gen5 OEM 存儲

by 布賴恩·比勒

Micron 4600 Gen5 SSD 為 AI、工作站和遊戲提供高速存儲,讀取速度高達 14.5GB/s,AI 模型加載速度更快。

美光科技將 PCIe Gen5 儲存引入其客戶端 SSD 產品線,推出美光 4600 NVMe SSD,這是一款高效能硬碟,旨在滿足創意專業人士、AI 工作負載和遊戲玩家的需求,基本上是任何需要在工作站或遊戲裝備中快速、響應迅速儲存的人的需求。 4600 的連續讀取速度比其 Gen4 前代產品提高了一倍,讀取速度達到 14.5GB/s,寫入速度達到 12GB/s,但其實際影響超出了綜合基準測試的範圍。美光一直致力於提高“感覺性能”,例如應用程式響應能力、大數據集處理和 AI 模型加載。對於尋求提供高效能配置的系統建構者來說,它是理想的選擇。

高速突發性能只是 Micron 4600 特性的一部分。在繁重的工作負載下保持效能和反應能力同樣重要,特別是對於從事資料科學、人工智慧模型訓練和機器學習推理的專業人士而言。人工智慧應用程式將受益於更快的 LLM 模型載入速度,美光報告稱 Llama-2 模型的載入時間不到一秒,比 Gen61 SSD 提高了 4%。這種等級的儲存效能可確保研究人員和工程師能夠無瓶頸地處理大量資料集和複雜模型,從而充分利用 GPU 和 CPU,而不必等待儲存。

根據美光的測試,該硬碟在日常運算任務中也實現了顯著提升,其 PCMark 11 基準測試得分比競爭對手的 Gen10 SSD 高出 5% 就證明了這一點。 PCMark 10 評估實際的工作流程,包括 Windows 啟動時間、應用程式啟動(例如 Adob​​e Photoshop 和 Illustrator)和一般生產力任務。這些優勢意味著商業環境或高階創意工作流程中更靈敏的使用者體驗。

Micron 4600 對微軟 DirectStorage API 的支援對於遊戲玩家來說尤其重要。 DirectStorage 讓 GPU 能夠直接與高速 NVMe SSD 通信,繞過 CPU 並大幅減少載入時間,同時改善資產流。目前已有超過 30 款遊戲支援 DirectStorage,而且還有更多遊戲即將推出,下一代儲存對遊戲的影響正變得越來越明顯。 Micron 4600 確保玩家能夠體驗近乎即時的等級轉換、更豐富的紋理和更廣闊的世界,使其成為遊戲電腦的絕佳選擇。

除了原始效能之外,Micron 4600 還帶來了一系列針對苛刻工作負載的最佳化。它採用具有動態 SLC 快取的 Micron G9 TLC NAND,可確保在重負載下持續保持效能,並配備板載 DRAM 以實現低延遲存取。安全性是另一個主要關注點,具有 SPDM 支援、TCG Opal、Pyrite 和 DICE 合規性,使其成為處理敏感資料的專業人士的理想選擇。此外,美光還優化了電源效率,聲稱其隨機讀取/寫入能源效率比其 Gen107 前代產品提高了 4% 以上——這對於高效能行動工作站來說是一個關鍵優勢,因為電源效率與速度同樣重要。

本次評測將檢視 Micron 4600 SSD 在專業應用程式、AI 工作負載和遊戲中的實際效能,並與 Micron 3500 進行對比,以量化世代飛躍。 LLM模型載入特別有趣;我們將結合綜合基準、基於應用程式的工作負載以及系統範圍的效能場景來測試此工作流程。讓我們看看 4600 是否為 PCIe Gen5 用戶端 SSD 設立了新標準。

Micron 4600 規格

4600 採用 5 M.4 外形尺寸,提供 PCIe Gen2.0 x2280 / NVMe 2c 介面。容量包括 512GB、1TB、2TB 和 4TB;我們的評測單元是 2TB 容量點。

4600 的 NAND 封裝佈局僅使用 PCB 的一側來實現 2TB 的容量。上一代 3500 SSD 也採用了單面 PCB 設計。美光在主機板上使用自己的 G9 TLC NAND,搭配 Silicon Motion SM2508 Gen5 控制器及其內部韌體。

完整的 Micron 4600 規格如下所列。

規範 美光 4600 NVMe 固態硬盤
介面 PCIe Gen5 x4,NVMe 2.0c
外形 M.2 2280
NAND型 Micron G9 TLC NAND
容量 512GB,1TB,2TB,4TB
順序閱讀 達到14,500 MB / s
順序寫入 達到12,000 MB / s
隨機讀取(4K,QD128) 高達2,100K IOPS
隨機寫入(4K,QD128) 高達2,100K IOPS
耐力(TBW) 512GB – 300 TBW,1TB – ​​600 TBW,2TB – ​​1,200 TBW,4TB – ​​1,600 TBW
安全功能 SPDM、TCG 蛋白石 2.02、TCG 黃鐵礦 2.01、DICE、DOE
平均無故障時間 2 萬小時
電源消耗功率 活動讀取:<8.25W,活動空閒:<150mW,休眠:<3.5mW
熱管理 主機控制熱管理 (HCTM),透過 SMBus 傳輸熱 SMART 數據
商品保修條款 3年

性能

為了測量美光最新的 4600 用戶端 SSD 的效能,我們利用了 AMD Ryzen 7 消費者測試平台。此主機板支援多個 PCIe Gen5 SSD,我們在測試磁碟機作為啟動 SSD 的輔助儲存裝置時利用了這些 SSD。我們對該客戶端 SSD 的測試方法是混合使用基於 Windows 和 Linux 的應用程式。對於基於 Windows 的測試(包括 PCMark、3DMark 和 BlackMagic),我們使用了 Windows 11 Pro 24H2,而基於 Linux 的 AI 和 FIO 工作負載在 Ubuntu 24.10 桌面上運行。

測試平台

  • AMD 銳龍 7 9800X3D
  • 華碩 ROG Crosshair X870E Hero
  • G.SKILL Trident Z5 Royal 系列 DDR5-6000 (2x16GB)
  • NVIDIA GeForce RTX 4090
  • Windows 11專業版
  • Ubuntu 24.10 桌面

峰值合成性能

FIO 測試是一種靈活且強大的基準測試工具,用於測量儲存設備(包括 SSD 和 HDD)的效能。它評估不同工作負載(例如順序和隨機讀取/寫入操作)下的頻寬、IOPS(每秒輸入/輸出操作)和延遲等指標。此測試有助於評估儲存系統的峰值效能,有助於比較不同的設備或配置。我們測量了此測試的峰值突發性能,將工作負載限制在兩個 SSD 上的 10GB 空間。

FIO 測試(MB/s/IOPS 越高越好) 美光客戶端 3500 Gen 4 美光客戶端 4600 Gen 5
順序 128K 讀取 (2T/64Q) 6,480 MB/s(平均延遲 2.6ms) 14,400 MB/s(平均延遲 1.16ms)
順序 128K 寫入 (2T/64Q) 6,921 MB/s(平均延遲 2.4ms) 14,000 MB/s(平均延遲 1.19ms)
隨機 4K 讀取 (16T/32Q) 1.185M IOPS(平均延遲 0.431 毫秒) 2.04M IOPS(平均延遲 0.251 毫秒)
隨機4K寫入(16T/32Q) 796K IOPS(平均延遲 0.642 毫秒) 2.36M IOPS(平均延遲 0.216 毫秒)

在測量峰值順序和隨機表現的 FIO 測試中,Micron Client Gen 5 4600 在所有指標上都優於 Gen 4 3500。它的所有指標幾乎都翻了一番,讀取速度達到 14,400 MB/s,寫入速度達到 14,000 MB/s。隨機 4K 操作可實現高達 2.04 萬 IOPS 讀取和 2.36 萬 IOPS 寫入,具有更高的 IOPS 和更低的延遲,使其成為苛刻工作負載的明確選擇。

規格工作站 4.0

SPECworkstation 4.0 是一個全面的工作站基準測試,可評估七個垂直行業和四個硬體子系統的 23 個工作負載和 80 多個子測試。此次重大更新引入了對人工智慧和機器學習工作負載的支持,包括數據科學和基於 ONNX 運行時的推理測試,反映了這些技術在專業環境中日益增長的重要性。雖然主要基準測試包括幾個系統範圍的測試,但在本篇評測中我們將重點放在特定於儲存的 WPC 儲存測試上。它利用從典型行業應用程式捕獲的儲存追蹤來允許用戶測量系統和組件之間的效能差異。

SPECworkstation 4.0(越高越好) 美光 3500 Gen4 美光 4600 Gen5
木塑存儲 1.50 1.87

從儲存特定的 WPCstorage 來看,Gen 5 驅動器的得分為 1.87,比 Gen 4 的 1.50 有了顯著的提高,顯示了 PCIe Gen 5 在實際儲存應用中的優勢。

Blackmagic磁盤速度測試

Blackmagic 磁碟速度測試對磁碟機的讀寫速度進行基準測試,以評估其效能,尤其是對於影片編輯任務的效能。它可以幫助用戶確保他們的儲存速度足夠快,以適應高解析度內容,例如 4K 或 8K 影片。

黑魔法 (越高越好) 美光 3500 美光 4600
讀取 MB/s 5617.9MB /秒 9320.2MB /秒
寫入 MB/s 5879.5MB /秒 10825.4MB /秒

美光客戶端 Gen 5 4600 相較 Gen 4 3500 實現了巨大的效能飛躍,讀取速度提高了 66%(9,320.2 MB/s vs. 5,617.9 MB/s),寫入速度幾乎提高了一倍(10,825.4 MB/s vs.5,879.5)。這對於處理 4K、8K 或 RAW 影片的專業人士來說是一個改變遊戲規則的技術,確保更快的渲染、匯出和更流暢的播放。

GPU直接儲存

我們在此伺服器上進行的測試之一是 Magnum IO GPU 直接儲存 (GDS) 測試。 GDS是NVIDIA開發的一項功能,允許GPU在存取儲存在NVMe磁碟機或其他高速儲存裝置上的資料時繞過CPU。 GDS 不會透過 CPU 和系統記憶體路由數據,而是支援 GPU 和儲存設備之間的直接通信,從而顯著減少延遲並提高數據吞吐量。

GPU 直接儲存的工作原理

傳統上,當 GPU 處理儲存在 NVMe 磁碟機上的資料時,資料必須先經過 CPU 和系統內存,然後才能到達 GPU。此過程會引入瓶頸,因為 CPU 成為中間人,增加延遲並消耗寶貴的系統資源。 GPU 直接儲存使 GPU 能夠透過 PCIe 總線直接從儲存裝置存取數據,從而消除了這種低效率。這種直接路徑減少了與資料移動相關的開銷,從而實現更快、更有效率的資料傳輸。

人工智慧工作負載,尤其是涉及深度學習的工作負載,是高度數據密集的。訓練大型神經網路通常需要處理數 TB 的數據,資料傳輸的任何延遲都可能導致 GPU 利用率不足和訓練時間延長。 GPU 直接儲存透過確保資料盡快傳送到 GPU、最大限度地減少空閒時間並最大限度地提高運算效率來解決這項挑戰。

此外,GDS 對於涉及串流大型資料集的工作負載特別有利,例如視訊處理、自然語言處理或即時推理。透過減少對 CPU 的依賴,GDS 可以加速資料移動並釋放 CPU 資源用於其他任務,從而進一步增強整體系統效能。

測試配置矩陣

我們有系統地測試了以下參數的每種組合:

  • 塊大小:1M、128K、16K
  • IODepth:128、64、32、16、8、4、1

在本次評測中,我們將重點放在每個 SSD 佔用 50G 空間的連續讀寫吞吐量。我們以給定的區塊大小和執行緒數跨多個作業和批次大小執行每個 GDSIO 工作負載。報告的數字是每個作業和批次數量組合的平均值。

在我們的第一張圖表中,我們研究了上一代 Micron 3500。

接下來,我們來看看新款 Micron 4600 Gen5 SSD 上的相同工作負載,其在測量的工作負載中效能有顯著的提升。我們測量了 3K 中 16GiB/s、5.8K 中 128GiB/s 以及 6.4M 連續讀取傳輸中 1GiB/s。

透過查看 Micron 3500 和 4600 SSD 在 GDSIO 中測量的區塊大小和佇列深度的比較熱圖,我們發現 128K 區塊大小範圍內的增幅最為顯著。

 

切換到相同工作負載下的寫入傳輸,在順序寫入測試中,我們測得 16K 的峰值傳輸速度為 0.7GiB/s,16K 的峰值傳輸速度為 0.8GiB/s,128M 的峰值傳輸速度為 1.6GiB/s。這些值是在比峰值飽和度更低的隊列深度水平下測量的。

更新後的 Gen5 Micron 4600 在我們的寫入 GDSIO 工作負載中表現較好,16K 傳輸峰值為 2.1GiB/s,128K 傳輸峰值為 3.9GiB/s,6.3M 傳輸大小峰值為 1GiB/s。與 3500 次寫入結果一樣,許多最高吞吐量低於峰值 IO 深度。

透過對寫入效能熱圖中兩款硬碟進行對比,我們發現 Micron 4600 與上一代型號相比再次實現了大幅提升。這些改進在 I/O 深度和區塊大小的範圍內都是可見的。

PCMark10 存儲

PCMark 10 儲存基準測試使用基於應用程式的追蹤來評估實際的儲存效能。他們測試系統和數據驅動器,測量頻寬、存取時間和負載下的一致性。這些基準測試提供了超越綜合測試的實用見解,幫助使用者有效地比較現代儲存解決方案。

PCMark10 (越高越好) 美光客戶端 3500 Gen 4 得分 美光客戶端 4600 Gen 5 得分
儲存資料分數 7,169 8,282

Micron Client Gen 5 4600 在 PCMark 4 儲存方面的表現優於 Gen 3500 10,得分為 8,282,而後者為 7,169,實際效能提高了 15.5%。

3DMark 直接存儲

3DMark DirectStorage 功能測試評估 Microsoft 的 DirectStorage 如何最佳化 PCIe SSD 上的遊戲資產載入。透過減少 CPU 開銷並提高資料傳輸速度,DirectStorage 可以縮短載入時間,尤其是與 GDeflate 壓縮和 Windows 11 的 BypassIO 結合使用時。此測試隔離儲存效能,以突出啟用 DirectStorage 時潛在的頻寬改進。

3DMark 直接存儲 美光 3500 Gen4 美光 4600 Gen5
儲存至 VRAM(GDeflate 壓縮) 14.96 GB / s 26.27 GB / s
儲存至 VRAM(DirectStorage 開啟,未壓縮) 6.36 GB / s 10.81 GB / s
儲存到 VRAM(DirectStorage 關閉,未壓縮) 5.43 GB / s 6.54 GB / s
儲存到 RAM(DirectStorage 開啟,未壓縮) 6.64 GB / s 12.35 GB / s
儲存到 RAM(DirectStorage 關閉,未壓縮) 6.01 GB / s 8.25 GB / s
GDeflate 解壓縮頻寬 64.03 GB / s 67.63 GB / s

Micron Client Gen 5 4600 在 DirectStorage 場景中的表現明顯優於 Gen 4 3500,尤其是在使用 GDeflate 壓縮儲存到 VRAM 方面,速度為 26.27 GB/s,而前者為 14.96 GB/s,提升了 75%。其他顯著提升包括 RAM 儲存速度為 12.35 GB/s,高於 6.64 GB/s,成長了 86%,開啟 DirectStorage 時 VRAM 儲存速度為 10.81 GB/s,高於 6.36 GB/s,成長了 70%。這些改進意味著更快的遊戲資產加載速度、更少的 CPU 開銷以及支援 DirectStorage 的遊戲中更好的效能,使得 Gen 5 成為遊戲和高速資料流的更好選擇。

結論

Micron 4600 NVMe SSD 兌現了其對下一代 PCIe Gen5 性能的承諾,與其前身 Micron 3500 相比有顯著的提升,並證明自己是 AI 開發、遊戲和專業應用的多功能選擇。其讀取速度高達 14.5GB/s,寫入速度高達 12GB/s(我們測試了更快的寫入速度),使 Gen4 驅動器的順序效能提高了一倍。更重要的是,它透過更快的應用程式載入時間、更低的延遲和顯著的效率提升提高了實際的可用性。

Micron 4600 NVMe SSD 的效能較上一代 3500 大幅提升。隨機 I/O 速度也大幅提升,讀取從 5M IOPS 增加到 6.5M IOPS,寫入從 14.4K IOPS 增加到 6.9M IOPS。

許多應用程式都能夠利用這些優勢,包括工作站應用程式和新興的 AI 工作流程。使用 NVIDIA 的 GDSIO 工具測量的 GPUDirect 儲存效能在我們的 16K、128K 和 1M 順序讀寫工作負載中獲得了巨大的提升。隨著人工智慧開發工作負載轉移到本地工作站空間,快速儲存的重要性不容忽視。

Micron 4600 對於需要高效能本地儲存的專業人士和希望最大限度縮短載入時間的遊戲玩家而言非常出色 - 為 OEM 提供了可靠的、面向未來的儲存解決方案。隨著人工智慧和高效能運算目標的發展,快速、高效的儲存將發揮越來越重要的作用——而 Micron 4600 證明它已經為未來做好了準備。

Micron 4600 產品頁面

本報告由美光科技贊助。本報告中所表達的所有觀點和意見均基於我們對所考慮產品的公正看法。

參與 StorageReview

電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱