美光 7600 MAX 是該公司面向主流資料中心部署的最新 PCIe Gen5 NVMe SSD,旨在為人工智慧、雲端和混合用途工作負載提供卓越的服務品質和持續的回應能力。 7600 系列提供 U.2、E1.S 和 E3.S 三種規格,涵蓋 PRO(讀取密集型,每日全盤寫入次數 1 次)和 MAX(混合用途,每日全盤寫入次數 3 次)兩種耐用性等級。本次評測我們收到的是 6.4TB 的 7600 MAX E3.S 型號。
7600 MAX 是基於美光第九代 TLC NAND 打造,是全球首款採用此先進快閃記憶體技術的主流資料中心 SSD。結合美光自主研發的垂直整合控制器和韌體堆疊,該 SSD 在持續負載下可提供一流的一致性和低延遲,尤其是在 70/30 混合負載和 RocksDB 工作負載下,美光錶示其延遲一致性比競品第五代資料中心 SSD 提升高達 76%。
理論上,6.4TB MAX 型號可實現 12 GB/s 的順序讀取速度、7 GB/s 的順序寫入速度、高達 2.1 萬 IOPS 的隨機讀取速度和 675K IOPS 的隨機寫入速度,且功耗均在 ≤ 14 W RMS 的範圍內。這些效能特性使其非常適合 AI 資料管道、資料庫後端、虛擬化節點以及即時分析應用,在這些應用中,可預測的延遲和持續的吞吐量比尖峰突發資料更重要。
安全性和標準合規性也是重中之重。此硬碟支援 SPDM 1.2 認證、硬體信任根以及可選的 FIPS 140-3 2 級 SED 加密,同時符合 OCP 2.5 規範,以實現開放資料中心的互通性。
本次評測中,我們收到了美光 7600 MAX 6.4TB 硬碟。我們將比較同類 Gen5 硬碟,並在企業級測試條件下評估其效能,重點在於效率和工作負載一致性。
美光 7600 MAX 規格
下表概述了 Micron 7600 MAX 的支援規格,這是一款混合用途 PCIe Gen5 NVMe SSD,額定每天最多可進行 3 次驅動器寫入 (DWPD)。
| 美光 7600 MAX 規格(U.2 / E3.S / E1.S) | |||||
|---|---|---|---|---|---|
| 應用場景 | 混合用途(每天 3 次驅動器寫入) | ||||
| 介面/協定 | PCIe Gen5 x4,NVMe v2.0d | ||||
| NAND閃存 | Micron G9 TLC NAND | ||||
| 可靠性 | MTTF:2.0萬小時 @ 0–55 °C;2.5萬小時 @ 0–50 °C | UBER < 1 個扇區/1017 讀取位數 | 5 年保修 | ||||
| 功率(平均 RMS) | ≤ 14 W 順序讀取;≤ 14 W 順序寫入 | ||||
| 工作溫度 | 0–70 °C(如果 SMART 溫度 > 77 °C,則節流) | ||||
| 容量和性能(7600 MAX) | |||||
| 容量 | 順序。 讀取(MB/秒) | 順序。 寫入(MB/秒) | 隨機讀取(K IOPS) | 隨機寫入(K IOPS) | 70/30 讀/寫(千 IOPS) |
| 1.6結核病 | 12,000 | 3,300 | 1,800 | 260 | 450 |
| 3.2結核病 | 12,000 | 6,500 | 2,100 | 560 | 700 |
| 6.4結核病 | 12,000 | 7,000 | 2,100 | 675 | 1,000 |
| 12.8結核病 | 12,000 | 7,000 | 2,100 | 675 | 1,100 |
| 典型延遲(µs) | |||||
| 閱讀 | 75 | ||||
| 寫 | 15 | ||||
| 耐久度(寫入的總位元組數,TB) | |||||
| 容量 | RND TBW | 序號 | 筆記 | ||
| 1.6結核病 | 8,700 | 18,000 | 最大(每日 3 次 DWPD) | ||
| 3.2結核病 | 17,500 | 37,200 | 最大(每日 3 次 DWPD) | ||
| 6.4結核病 | 35,000 | 74,200 | 最大(每日 3 次 DWPD) | ||
| 12.8結核病 | 70,000 | 143,100 | 最大(每日 3 次 DWPD) | ||
Micron 7600 Max 6.4TB 設計與構建
美光 7600 MAX 專為注重可靠性、效率和高負載下可預測散熱性能的企業環境打造。 U.2 版本採用堅固的鋁製外殼,頂部有散熱片,可在持續運行 PCIe Gen5 工作負載時輔助被動散熱。其半霧面黑色表面賦予硬碟專業的外觀,同時有助於在長時間運行期間均勻分佈表面熱量。 E3.S 型號採用更纖薄的堅固外殼設計,注重緊湊性和高效的熱傳導,適用於高密度伺服器環境。
7600 MAX 提供單硬碟 1.6TB 至 12.8TB 的容量範圍,可滿足從小型快取層到高密度混合用途儲存池的各種部署需求。在連續讀寫工作負載下,平均功耗高達 14W,在提供頂級效能的同時,保持高效率。
可靠性評級包括:0–55°C 下平均故障時間 (MTTF) 為 2.0 萬小時,0–50°C 下為 2.5 萬小時,不可修正誤碼率 (UBER) 低於每 10¹⁷ 位元讀取一個磁區。此硬碟的工作溫度範圍為 0°C 至 70°C,如果內部 SMART 溫度超過 77°C,則會啟動效能調整。
美光科技為 7600 MAX 提供 5 年保固,彰顯其耐用性,並可滿足資料中心全天候不間斷工作負載的需求。其內部採用美光科技第九代 TLC NAND,搭配美光自主設計的 DRAM 和控制器,實現全整合設計。 U.2 規格與現有的 Gen4 和 Gen5 背板廣泛相容,而 E1.S 和 E3.S 版本則擴展了更高密度機架配置的部署選項。
美光 7600 最大性能
為了評估美光 7600 MAX 6.4TB,我們採用了標準的企業級 SSD 基準測試方法對其進行了測試,該方法旨在衡量實際資料中心工作負載下的持續效能、延遲一致性和效率。我們的測試方法著重在一系列綜合和應用級基準測試中獲得可重複的穩定結果,以便與同級別的其他第五代 NVMe SSD 進行公平的比較。
路測平台
我們使用執行 Ubuntu 22.04.02 LTS 的 Dell PowerEdge R760 作為本次評測所有工作負載的測試平台。配備了 串行電纜 Gen5 JBOF它與 U.2、E1.S、E3.S 和 M.2 SSD 廣泛相容。我們的測試系統配置概述如下:
- 2 個英特爾至強金牌 6430(32 核,2.1GHz)
- 16 個 64GB DDR5-4400
- 480GB 戴爾 BOSS 固態硬碟
- 串行電纜 Gen5 JBOF
驅動器比較
- 帕斯卡里 X200P 7.68TB
- 閃迪 SN861 7.68TB
- 固力 PS1010 7.68TB
- 金士頓 DC3000ME 7.68TB
- 美光 9550 最大 12.8TB
DLIO 檢查點基準
為了評估 SSD 在 AI 訓練環境中的實際效能,我們使用了資料和學習輸入/輸出 (DLIO) 基準測試工具。 DLIO 由阿貢國家實驗室開發,專門用於測試深度學習工作負載中的 I/O 模式。它能夠深入了解儲存系統如何應對檢查點設定、資料提取和模型訓練等挑戰。下圖展示了兩款硬碟如何在 36 個檢查點之間處理整個過程。在訓練機器學習模型時,檢查點對於定期保存模型狀態至關重要,可防止在中斷或斷電期間失去進度。這種儲存需求需要強大的效能,尤其是在持續或密集的工作負載下。我們使用了 2024 年 8 月 13 日發布的 DLIO 基準測試 2.0 版。
為了確保基準測試能夠反映真實場景,我們基於 LLAMA 3.1 405B 模型架構進行測試。我們使用 torch.save() 實作檢查點,以擷取模型參數、最佳化器狀態和層狀態。我們的設定模擬了一個八 GPU 系統,並實作了一個混合平行策略,將四路張量並行和雙向管線並行處理分佈在八個 GPU 上。此配置產生的檢查點大小為 1,636GB,反映了訓練現代大型語言模型的需求。
在本次基準測試中,美光 9550 MAX 12.8TB 脫穎而出,成為當之無愧的領導者。在完整的 18 個檢查點運行過程中,它保持了最低的平均完成時間,範圍從 457 秒到 575 秒。該硬碟表現出色,檢查點之間的差異極小,這表明其韌體設計平衡,並針對混合讀取/寫入工作負載進行了最佳化。
緊隨其後的是美光 7600 MAX 6.4TB,其運行時間在 459 秒至 586 秒之間。雖然其平均速度仍然具有競爭力,但在測試點 4 和 7 之間出現了短暫的性能波動,直到測試結束時才趨於穩定。儘管如此,它仍然穩居頂級水平,在持續運行 AI 和 HPC 工作負載時表現出卓越的效率。
美光 9550 7.68TB 的表現略遜於兩款旗艦型號,成績範圍從 458 秒到 582 秒。它保持了穩定的擴展性,並與高階 MAX 硬碟保持競爭力,進一步鞏固了美光 9550 平台的領先優勢。
在測試的其他企業級 SSD 中,Solidigm PS1010、SanDisk SN861 和 Kingston DC3000ME 佔據了中等水平,大多數檢查點的完成時間都在 450 秒到 610 秒之間。 Pascari X200P 的性能穩定性最差,在運行中期達到了 690 多秒,直到接近尾聲才穩定下來。
在本次平均測試中,Solidigm PS1010 7.68TB 以最快的平均完成時間領先各組,三次測試的平均完成時間範圍從 458 秒到 564 秒不等。該硬碟表現出了極佳的一致性,在運行之間保持了較低的差異,並在混合 I/O 工作負載下展現了強大的效率。
SanDisk SN861 7.68TB 緊隨其後,其平均成績幾乎相同,介於 461 秒到 553 秒之間,證實了其能夠以最小的退化提供可靠的檢查點性能。
緊隨其後的是美光 9550 7.68TB,在相同測試中,成績在 461 秒到 559 秒之間。其性能依然非常有競爭力,略微落後於領先者,但在所有迭代中都保持了穩定的擴展性和穩定的吞吐量。
美光 9550 MAX 12.8TB 和美光 7600 MAX 6.4TB 排名第五,平均得分略高,為 462–555 秒和 464–567 秒。兩者在一段時間內都保持了一致的表現,但落後於容量較小的美光科技和兩款領先的硬碟 固晶 和 SanDisk。
在該系列的其他產品中,金士頓 DC3000ME 和 帕斯卡里 X200P 的整體耗時最長,平均分別為 580 秒和 660 秒。這些結果反映出在持續檢查點條件下,效能差距更大,尤其是在需要頻繁寫入持久性儲存的工作負載下。
FIO性能基準
為了衡量每個 SSD 在常見產業指標上的儲存效能,我們利用了 FIO。每個硬碟都經過相同的測試流程,其中包括一個預處理步驟,即使用順序寫入工作負載進行兩次全碟填充,然後進行穩態效能測量。隨著被測工作負載類型的變化,我們會再次執行一次基於新傳輸大小的預處理填充。
在本節中,我們將重點放在以下 FIO 基準:
- 128K 連續
- 64K隨機
- 16K隨機
- 16k 連續
- 4K隨機
128K 順序寫入(IODepth 16/NumJobs 1)
進入128K順序寫入測試,結果與我們在預處理過程中觀察到的結果幾乎相同。美光9550 Max(12.8TB)再次遙遙領先,保持10,957.9MB/s的速度,穩居榜首。金士頓DC3000ME(7.68TB)以8,477.4MB/s的速度緊隨其後,Pascari X200P(7.68TB)則以8,369.7MB/s的速度緊隨其後。
緊隨其後的是 Solidigm PS1010(7,126.5MB/s)和 SanDisk DC SN861(7,116.5MB/s),而 Micron 7600 Max(6.4TB)以 6,960.6MB/s 的速度位居榜末。
128K 順序寫入延遲 (IODepth 16 / NumJobs 1)
談到延遲,128K 順序寫入測試在 IODepth 為 16 的情況下運行,並執行單一作業,而預處理時佇列深度更大,為 256。如預期的那樣,所有硬碟的延遲均顯著下降。美光 9550 Max (12.8TB) 再次以 0.18 毫秒的最低延遲領先,展現了其以最小延遲維持最高吞吐量的能力。
金士頓 DC3000ME(7.68TB)緊隨其後,為 0.24ms;Pascari X200P(7.68TB)緊隨其後,為 0.24ms。同時,Solidigm PS1010(0.28ms)和 SanDisk DC SN861(0.28ms)的結果也相近,而美光 7600 Max(6.4TB)則以 0.29ms 的成績墊底。
128K 順序讀取(IODepth 64 / NumJobs 1)
轉到讀取測試,128K 順序讀取測試中,各競品 SSD 的成績更加接近。 Pascari X200P(7.68TB)以 14,242.1MB/s 的讀取速度奪得桂冠,略高於 Solidigm PS1010(7.68TB)的 14,163.3MB/s,而 Micron 9550 Max(12.8TB)則以 14,047.5 的速度讀取後讀取速度。這三款 SSD 的持續順序讀取吞吐量在實際應用上差距很小。
金士頓 DC3000ME(7.68TB)以 13,513.8MB/s 的速度略微落後於前三名,而閃迪 DC SN861(7.68TB)的速度為 12,631.2MB/s。美光 7600 Max(6.4TB)的速度較低,為 11,240.5MB/s,是該組中唯一一款低於 12GB/s 門檻的硬碟。
128K 順序讀取延遲(IODepth 64 / NumJobs 1)
延遲方面,128K 順序讀取測試 (IODepth 64 / NumJobs 1) 凸顯了頂級產品之間的激烈競爭。 Pascari X200P (7.68TB) 以 0.56ms 領先,Solidigm PS1010 (0.56ms) 和美光 9550 Max (12.8TB) 的延遲均為 0.57ms,兩者幾乎旗鼓相當。這三款硬碟的性能實際上旗鼓相當,這與我們在吞吐量方面看到的差距不大相符。
緊隨其後的是金士頓 DC3000ME(7.68TB),時間為 0.59ms;閃迪 DC SN861(7.68TB)則為 0.63ms;美光 7600 Max(6.4TB)則以 0.71ms 的成績墊底,這與其較低的順序讀取帶寬一致。
64K 隨機寫入
在 64K 隨機寫入測試中,美光 7600 MAX (6.4TB) 表現出色且穩定,速度範圍從 2.39GB/s 到 6.8GB/s,平均吞吐量為 5.16GB/s。這使其穩居高階硬碟之列,在整個測試過程中保持了卓越的穩定性,並在更高的隊列深度下保持了可靠的擴展能力。
美光 9550 MAX(12.8TB)整體仍保持領先,效能範圍更廣,從 2.45GB/s 到峰值 10.6GB/s,平均速度為 7.34GB/s。它是唯一一款持續突破 10GB/s 大關的硬碟,展現了其高階配置和韌體調優的優勢。
在其他同類產品中,金士頓 DC3000ME (7.68TB) 和閃迪 DC SN861 (7.68TB) 在 4 至 6GB/s 範圍內表現穩定,儘管未能達到美光的更高性能,但仍保持競爭力。 Solidigm PS1010 (7.68TB) 和 Pascari X200P (7.68TB) 緊隨其後,通常集中在 2-4 GB/s 範圍內,遠遠落後於這兩款美光硬碟。
64K隨機寫入延遲
在延遲方面,美光 7600 MAX (6.4TB) 在壓力下保持了穩定的控制,平均延遲為 0.41 毫秒,在隊列深度較大時峰值達到 2.3 毫秒。其延遲曲線在整個掃描過程中展現了一致的反應能力,使其成為持續寫入條件下效率更高的硬碟之一。
Micron 9550 MAX(12.8TB)仍然是一致性的基準,平均僅為 0.30 毫秒,峰值低於 1.71 毫秒,即使在最大負載下也表現出卓越的延遲管理。
金士頓 DC3000ME 和閃迪 DC SN861 的延遲處於中等水平,延遲通常在 0.05 毫秒到 2.7 毫秒之間,雖然提供了不錯的平衡性,但比不上美光的精度。同時,Pascari X200P 和 Solidigm PS1010 的波動最為明顯,在較高的隊列深度下分別達到 4.1 毫秒和 6.0 毫秒。
64K 隨機讀取
在 64K 隨機讀取測試中,美光 7600 MAX (6.4TB) 表現出色,起始速度為 0.61GB/s,峰值為 11.0GB/s,平均速度為 6.94GB/s。其讀取一致性和在較高佇列深度下的穩定擴展突顯了其高效的架構和韌體調優。
美光 9550 MAX (12.8TB) 的表現與此非常相似,其速度範圍從最低的 0.49GB/s 到最高的 13.7GB/s,平均速度為 6.96GB/s。這使得這兩款美光硬碟的性能都接近頂級水平,兩者之間只有細微的差別。
縱觀整個領域,Solidigm PS1010 和 Pascari X200P 在峰值吞吐量方面略有領先,在更高的隊列深度下達到了 13-14GB/s。金士頓 DC3000ME 緊隨其後,速度為 12 至 13GB/s,而 SanDisk DC SN861 則略低,穩定在 12.3GB/s 左右。
64K隨機讀取延遲
在 64K 隨機讀取測試中,美光 7600 MAX(6.4TB)表現出了強勁的延遲特性,平均延遲為 0.26 毫秒,在高負載下最低降至 0.10 毫秒,峰值達到 1.42 毫秒。其結果在整個測試過程中表現出極佳的一致性,即使隊列深度增加也能保持穩定的反應速度。
美光 9550 MAX(12.8TB)的表現幾乎相同,平均延遲為 0.25 毫秒,最低延遲為 0.12 毫秒,最高延遲為 1.14 毫秒。兩款美光硬碟均表現出緊湊且可預測的延遲行為,保持緊密的分組,並在整個掃描過程中保持平穩運行。
從圖表來看,Solidigm PS1010 和 Pascari X200P 的突發延遲略高,通常在 0.1 到 1.2 毫秒之間。同時,金士頓 DC3000ME 和閃迪 DC SN861 的延遲範圍也與之相似,峰值略高於 1.2 毫秒。總體而言,美光硬碟仍然是該領域最穩定、最具競爭力的產品之一,與其他頂級產品之間只有細微的差別。
16K 順序寫入
在 16K 順序寫入測試中,美光 7600 MAX(6.4TB)表現穩定,吞吐量範圍從 0.84GB/s 到 6.8GB/s,平均速度為 5.63GB/s。測試結果顯示,其寫入行為一致,在中高隊列深度下保持穩定。
美光 9550 MAX(12.8TB)在該類別中佔據主導地位,傳輸速度在 0.85GB/s 至 10.7GB/s 之間,平均吞吐量為 7.75GB/s。它脫穎而出,成為唯一一款在峰值運行期間能夠維持每秒兩位數 GB 傳輸速度的硬碟,成為當之無愧的領導者。
從更廣泛的圖表來看,金士頓 DC3000ME 和 Pascari X200P 在較高隊列深度下的速度集中在 6 到 8GB/s 範圍內,總體上具有競爭力,但落後於 9550 MAX。 Solidigm PS1010 的速度略低,為 5 到 6GB/s,而 SanDisk DC SN861 的整體表現最差,經常跌破 4GB/s,最低甚至接近 1GB/s。
16K 順序寫入延遲
在 16K 順序寫入延遲測試中,美光 7600 MAX(6.4TB)展現出強大的反應能力,平均延遲為 0.18 毫秒,最低延遲為 0.018 毫秒,在高負載下峰值延遲為 1.15 毫秒。其延遲曲線在整個測試過程中保持穩定,在所有隊列深度上均表現出可靠的寫入控制。
Micron 9550 MAX(12.8TB)整體反應速度最佳,平均為 0.12ms,最低為 0.018ms,在負載下峰值為 0.75ms,使其成為此類別中效能最穩定的產品。
從更廣泛的圖表來看,金士頓 DC3000ME 和 Pascari X200P 處於中間位置,通常在 0.05 到 1.2 毫秒之間,而 Solidigm PS1010 的延遲更高,在較高隊列深度下超過 1.5 毫秒。 SanDisk DC SN861 的延遲最高,在壓力下超過 2.0 毫秒。
16K 順序讀取
在 16K 順序讀取測試中,美光 7600 MAX(6.4TB)表現出色,起始速度為 1.03GB/s,峰值為 11.0GB/s,平均速度為 6.08GB/s。其強大的中端擴展能力使其在整體平衡性和持續性能方面略勝 9550 MAX。
美光 9550 MAX(12.8TB)緊隨其後,起始速度為 1.02GB/s,峰值達到 12.5GB/s,平均速度為 5.59GB/s。雖然它的絕對吞吐量更高,但其效能曲線在佇列深度上的波動比 7600 MAX 更穩定的結果更大。
從更廣泛的圖表來看,金士頓 DC3000ME 在更高的隊列深度下領先,速度一度突破 12.8GB/s,而 Pascari X200P 和 Solidigm PS1010 均達到了 12GB/s 的範圍。 SanDisk DC SN861 略微落後,在掃描的上限略低於 10GB/s。
16K 順序讀取延遲
在 16K 順序讀取延遲測試中,美光 7600 MAX(6.4TB)表現出略微更嚴格的延遲控制,起始延遲為 0.014 毫秒,峰值為 0.71 毫秒,平均延遲為 0.13 毫秒。這使其在讀取響應速度方面略有優勢,並在整個工作負載過程中保持了平滑一致的延遲。
美光 9550 MAX(12.8TB)緊隨其後,其結果從最低的 0.015 毫秒到最高的 0.78 毫秒不等,總體平均值為 0.15 毫秒。雖然略高,但其性能仍然位居同類產品之首,在持續的順序讀取操作下表現出色。
從更廣泛的圖表來看,金士頓 DC3000ME 和 Pascari X200P 表現出類似的中端模式,平均值在 0.1 到 0.2 毫秒之間,峰值略高於 0.8 毫秒。 Solidigm PS1010 的變化幅度更大,峰值接近 0.75 毫秒,而 SanDisk DC SN861 與金士頓的差距較小,但隨著隊列深度的增加,波動性也更大。
16K 隨機寫入
在 16K 隨機讀取測試中,美光 7600 MAX (6.4TB) 在整個測試過程中表現出色,最低 17K IOPS,平均 350K IOPS 左右,在較高隊列深度下峰值接近 720K IOPS。其穩定性使其成為性能更可預測的硬碟之一,即使未能登頂榜首,也能在整個測試過程中保持平穩的擴展。
美光 9550 MAX(12.8TB)實現了更高的整體吞吐量,最低可達 18K IOPS,最高可達 900K IOPS 以上,平均約為 420K IOPS。它在原始性能方面領先於美光兩款產品,但擴展性能差異略大於 7600 MAX。
從整體來看,Pascari X200P 和 Solidigm PS1010 均表現強勁,Pascari 的最高性能幾乎與 9550 MAX 匹敵,略低於 900K IOPS,而 Solidigm 的性能則保持在 820K 到 850K IOPS 之間。金士頓 DC3000ME 最初領先,但穩定在 620K IOPS 左右,而 SanDisk DC SN861 則落後,最高性能略高於 500K IOPS。
16K隨機寫入延遲
在 16K 隨機寫入延遲測試中,美光 7600 MAX(6.4TB)保持了極具競爭力且穩定的效能,從低階的 0.016 毫秒到峰值的 1.26 毫秒不等,平均延遲為 0.21 毫秒。即使其效率不如更高容量的同類產品,但在壓力下,其反應速度依然強勁,在不同隊列深度下仍能保持穩定的控制。
Micron 9550 MAX(12.8TB)整體表現出卓越的延遲效能,保持在 0.015ms 和 0.77ms 之間,平均為 0.13ms,鞏固了其作為持續寫入負載下最高效驅動器的地位。
從更廣泛的圖表來看,金士頓 DC3000ME 和 Pascari X200P 處於中間水平,通常運行在 0.2-1.5 毫秒範圍內。 SanDisk DC SN861 在高隊列深度下表現出更頻繁的延遲峰值,超過 1.8 毫秒,而 Solidigm PS1010 則表現出最嚴重的穩定性問題,最差時甚至超過 3 毫秒。
16K 隨機讀取
在 16K 隨機讀取測試中,美光 7600 MAX (6.4TB) 在整個運行過程中表現出了極高的一致性,從 17.1K IOPS 開始,最高可達 720K IOPS,平均速度為 362K IOPS。其性能曲線保持平滑且可預測,即使未能達到圖表的最高點,也反映出其在較低和中等隊列深度下的出色控制。
美光 9550 MAX(12.8TB)實現了更高的峰值吞吐量,範圍從低端的 16.7K IOPS 到高端的 904K IOPS,平均為 433K IOPS。它在原始擴展能力方面領先,但 7600 MAX 在整個測試視窗內提供了更嚴格的一致性。
在競爭對手中,Pascari X200P 的表現幾乎與 9550 MAX 旗鼓相當,峰值達到了 900 萬 IOPS。 Solidigm PS1010 緊隨其後,IOPS 峰值在 820 萬到 850 萬之間,而金士頓 DC3000ME 的最高IOPS 約為 620 萬 IOPS。 SanDisk DC SN861 的表現略高於 500 萬 IOPS,但在較高的佇列深度下擴展效能有限。
16K隨機讀取延遲
在 16K 隨機讀取延遲測試中,美光 7600 MAX(6.4TB)保持了靈敏且穩定的延遲曲線,起始延遲為 0.065 毫秒,峰值為 0.71 毫秒,平均延遲為 0.14 毫秒。在整個測試過程中,其性能始終保持流暢且可預測,即使隊列深度增加,也能提供出色的響應能力。
美光 9550 MAX(12.8TB)緊隨其後,延遲範圍從低階的 0.073 毫秒到高階的 0.57 毫秒,平均延遲為 0.12 毫秒。雖然容量較大的硬碟在隊列深度較高時曲線略微收緊,但兩款美光型號都展現出了頂級的一致性和控制力。
在其他同類產品中,Pascari X200P 和金士頓 DC3000ME 在中等範圍內表現不俗,在大部分測試中,延遲時間在 0.1 到 0.3 毫秒之間,峰值負載時會攀升至 0.8 毫秒。 SanDisk DC SN861 和 Solidigm PS1010 的延遲變化較大,尤其是 Solidigm,延遲峰值在 0.6 到 0.65 毫秒左右,在效率和一致性方面落後於美光和 Pascari 等領先廠商。
4K 隨機寫入
在 4K 隨機寫入測試中,美光 7600 MAX (6.4TB) 表現出色,IOPS 範圍從 320K 到 1.78M,並展現出同類產品中最強勁的擴展性能。它在中等速度範圍內加速迅速,並在較高佇列深度下保持穩固控制,使其成為該工作負載下效能最平衡的處理器之一。其平穩的進程和跨執行緒組合的最小波動,突顯了其在持續寫入壓力下的企業級效率。
美光 9550 MAX(12.8TB)緊隨其後,成績在 320 萬至 1.56 萬 IOPS 之間。雖然它沒有達到 7600 MAX 那樣的峰值,但它在整個掃描過程中表現出色,尤其是在更高的隊列深度下,並且在混合線程環境中保持了一流的一致性。
在競品中,SanDisk DC SN861 和 Kingston DC3000ME 表現良好,但落後於美光硬碟,峰值分別約為 1.3 萬 IOPS 和 960 萬 IOPS。 Pascari X200P 表現出中等的一致性,峰值約為 1.6 萬 IOPS,而 Solidigm PS1010 則難以保持穩定性,在大多數高深度場景中,IOPS 會急劇下降至 550 萬 IOPS 以上。
4K隨機寫入延遲
在 4K 隨機寫入延遲測試中,美光 7600 MAX(6.4TB)的反應時間極短,最低僅 0.012 毫秒,峰值為 0.29 毫秒,平均反應時間為 0.05 毫秒。在整個運行過程中,其延遲始終保持較低水平,在高負載下表現出色,即使在更高的隊列深度下也能保持流暢的性能。
美光 9550 MAX(12.8TB)的表現幾乎相同,延遲範圍從最低的 0.013 毫秒到最高 0.37 毫秒,平均延遲為 0.06 毫秒。雖然容量更大的 9550 MAX 在最高延遲時穩定性略高,但兩款美光型號在整個測試中都保持了出色的控制力和響應能力。
從更廣泛的圖表來看,金士頓 DC3000ME 和 Pascari X200P 表現出更大的波動性,通常在 0.1-0.5 毫秒範圍內運行,在最大負載下峰值略高於 0.5 毫秒。 SanDisk DC SN861 也表現出類似的中期波動,而 Solidigm PS1010 表現最為糟糕,峰值超過 0.7 毫秒,整體響應速度落後於同類產品。
4K 隨機讀取
在 4K 隨機讀取測試中,美光 7600 MAX (6.4TB) 展現了卓越的擴展性和一致性,峰值略高於 2.0 萬 IOPS,平均速度為 1.4 萬 IOPS。其效能曲線在不同的佇列深度和執行緒數下保持平滑,展現出強大的負載控制能力,並在持續的隨機工作負載下保持卓越的效率。
美光 9550 MAX (12.8TB) 緊隨其後,峰值略高,達到 2.2 萬 IOPS,整體平均值約為 1.3 萬 IOPS。兩款美光硬碟均保持著強勁的競爭力,根據隊列深度和測試階段頻繁交替排名,展現出頂級的響應能力和可擴展性。
從更廣泛的圖表來看,SanDisk DC SN861 的效能一度飆升至 2.5M IOPS 以上,但在負載下表現出明顯的波動性和效能下降。 Pascari X200P 和金士頓 DC3000ME 的峰值均在 2.0M IOPS 左右,吞吐量強勁,但穩定性不如美光的硬碟。 Solidigm PS1010 在中端表現良好,但較早進入穩定期,在掃描結束時達到了 2.1M IOPS 左右的最高點。
4K隨機讀取延遲
在 4K 隨機寫入延遲測試中,美光 7600 MAX (6.4TB) 在整個測試過程中保持了出色的響應速度,在掃描初期平均延遲為 0.03-0.05 毫秒,並在峰值吞吐量時逐漸上升至略低於 0.30 毫秒。雖然其差異略大於其更大的同類產品,但它仍然提供了極具競爭力的延遲控制和在持續負載下的平穩擴展。
美光 9550 MAX (12.8TB) 的整體反應時間最低且最穩定,在負載較輕的階段平均反應時間為 0.03-0.05 毫秒,滿載時僅略微增加至 0.35-0.38 毫秒。在隊列深度較高的情況下,其可預測的行為進一步鞏固了其在測試中作為頂級產品之一的效率。
相較之下,SanDisk DC SN861 和 Pascari X200P 在吞吐量增加時經歷了更明顯的延遲峰值,SanDisk 的峰值超過 0.40 毫秒,而 Pascari 的峰值達到 0.50 毫秒。金士頓 DC3000ME 緊隨其後,峰值略高於 0.50 毫秒,但在較輕的工作負載下表現更穩定。 Solidigm PS1010 在壓力下表現最為掙扎,早期爬升至 0.10 毫秒以上,峰值接近 0.73 毫秒,顯示在高隊列深度隨機寫入操作期間存在不穩定性。
GPU直接儲存
我們在這個測試台上進行的測試之一是 Magnum IO GPU 直接儲存 (GDS) 測試。 GDS 是 NVIDIA 開發的功能,可讓 GPU 在存取儲存在 NVMe 磁碟機或其他高速儲存裝置上的資料時繞過 CPU。 GDS 不再透過 CPU 和系統記憶體來路由數據,而是實現了 GPU 和儲存設備之間的直接通信,從而顯著減少了延遲並提高了數據吞吐量。
GPU 直接儲存的工作原理
傳統上,當 GPU 處理儲存在 NVMe 磁碟機上的資料時,資料必須先經過 CPU 和系統內存,才能到達 GPU。由於 CPU 充當了中間環節,這個過程會造成瓶頸,增加延遲並消耗寶貴的系統資源。 GPU 直接儲存技術使 GPU 能夠透過 PCIe 總線直接從儲存裝置存取數據,從而消除了這種低效率。這種直接路徑減少了資料移動開銷,從而實現了更快、更有效率的資料傳輸。
人工智慧工作負載,尤其是涉及深度學習的工作負載,是高度資料密集的。訓練大型神經網路需要處理 TB 級的數據,資料傳輸中的任何延遲都可能導致 GPU 利用率不足和訓練時間更長。 GPU 直接儲存透過確保資料盡快傳輸到 GPU、最大限度地減少空閒時間並最大限度地提高運算效率來解決這一挑戰。
此外,GDS 對於涉及串流大型資料集的工作負載特別有利,例如視訊處理、自然語言處理或即時推理。透過減少對 CPU 的依賴,GDS 可以加速資料移動並釋放 CPU 資源用於其他任務,從而進一步增強整體系統效能。
GDSIO 順序讀取
在我們的 GDSIO 順序讀取測試中,從 16K 的小塊傳輸開始,美光 7600 MAX (6.4TB) 在低隊列深度下起始速度約為 0.5 GiB/s,並穩步擴展到 QD128 時的約 1.9 GiB/s。遷移到 128K 區塊大小後,速度顯著提升,起始速度為 2.2 GiB/s,在 QD64 到 QD128 時達到峰值,接近 5.0 GiB/s。在 1M 塊測試中,7600 MAX 繼續保持穩定的擴展速度,從淺隊列的 2.0 GiB/s 開始,在 QD128 時達到約 5.6 GiB/s。在所有區塊大小下,它都表現出出色的平衡性和可預測的吞吐量行為,體現了高效的佇列管理和強勁的持續性能。
美光 9550 MAX (12.8TB) 的運行軌跡幾乎相同,但整體峰值吞吐量略高。其 16K 測試從約 0.5 GiB/s 開始,上升至 1.9 GiB/s;而 128K 區塊測試結果則從隊列深度 1 時的 1.4 GiB/s 攀升至更高隊列深度時的約 5.3 GiB/s。在 1M 塊範圍內,其性能表現最為強勁,從低端的 2.0 GiB/s 擴展到隊列深度 128 時的 6.1 GiB/s。兩款硬碟在所有工作負載下均展現出穩定的擴展性和效率,其中 9550 MAX 在更高隊列深度和更大塊傳輸量下略有性能優勢。
在其餘測試的企業級固態硬碟中,包括 Pascari X200P、金士頓 DC3000ME、Solidigm PS1010 和閃迪 DC SN861,吞吐量結果範圍從 5.0 GiB/s 到最高 6.1 GiB/s。不同型號之間的吞吐量範圍仍然很小,突顯了現代企業級固態硬碟如何有效率地處理 GPU 直接工作負載。在這一類別中,美光固態硬碟始終位居前列,與最接近的競爭對手之間僅存在細微的差距。
GDSIO 順序讀取延遲
在順序讀取延遲測試中,美光 7600 MAX (6.4TB) 在所有區塊大小和佇列深度下均表現出緊密一致的反應時間。在較小的區塊大小下,它的啟動速度略快於其較大的同類產品,在 QD1 下 16K 傳輸的測量值為 27µs,在 QD128 下上升至約 1.0ms。對於 128K 區塊,延遲範圍為 54µs 至 3.1ms,而 1M 工作負載在淺隊列下起始延遲為 391µs,在 QD128 下達到約 22.3ms。結果顯示了平滑的擴展和穩定的控制,突顯了該硬碟在不同工作負載下的反應能力。
美光 9550 MAX (12.8TB) 的延遲模式幾乎相同,在 QD1 下,16K 傳輸的延遲從 31µs 開始,到 QD128 時增加到約 1.0ms。在 128K 塊的情況下,延遲範圍從 86µs 到 3.0ms;對於 1M 工作負載,延遲從低端的 482µs 上升到更高隊列深度下的 20.6ms。隨著工作負載強度的增加,兩款美光硬碟都表現出可預測且管理良好的延遲變化。
在整個測試組中,所有硬碟在中小型區塊大小下的效能表現均較為接近,但在 1M 工作負載下,隨著佇列深度的增加,效能表現則大幅提升。美光 7600 MAX 和 9550 MAX 在整個測試過程中保持緊密的分組,與 Pascari X200P、金士頓 DC3000ME 和 Solidigm PS1010 等同類產品相比,其延遲擴展性能出色,且變化幅度較小。
GDSIO 順序寫入
在 GDSIO 順序寫入測試中,美光 7600 MAX (6.4TB) 在所有工作負載下均展現出持續強勁的吞吐量,與其更大容量產品一樣表現出色。在 16K 區塊大小下,效能起始於 0.5 GiB/s 左右,到佇列深度 32 時攀升至約 1.5 GiB/s,然後在最高佇列深度時略有下降。遷移到 128K 區塊大小後,此磁碟機的吞吐量從佇列深度 1 時的 2.2 GiB/s 平穩擴展到佇列深度 32-64 時的 5.2 GiB/s,始終保持可靠的輸出。對於 1M 區塊大小的工作負載,吞吐量在中等佇列深度範圍內從 4.1 GiB/s 到 5.4 GiB/s 不等,即使在工作負載增加的情況下也表現出出色的一致性。
美光 9550 MAX (12.8TB) 的運行軌跡幾乎相同,16K 傳輸時速度從 0.5 GiB/s 開始,峰值為 1.5 GiB/s,然後在更高的隊列深度下趨於平穩。在 128K 傳輸時,速度從 2.3 GiB/s 攀升至約 5.3 GiB/s;而 1M 資料區塊測試時速度從 4.7 GiB/s 附近開始,並維持在 5.0 GiB/s 至 5.4 GiB/s 之間,然後在 QD128 時略有下降。兩款硬碟的變化都很小,反映了美光針對 GPU 直接工作負載的韌體優化效率。
在更廣泛的資料集中,所有測試的企業級固態硬碟在尖峰負載下的吞吐量均收斂在 4.0 至 5.4 GiB/s 的窄範圍內。美光 7600 MAX 和 Pascari X200P 徘徊在較高水平附近。同時,金士頓 DC3000ME、Solidigm PS1010 和閃迪 DC SN861 等型號緊隨其後,展現了這一代企業級固態硬碟的競爭力和穩定性。
GDSIO 順序寫入延遲
在順序寫入延遲測試中,美光 7600 MAX (6.4TB) 展現出穩定且可預測的反應時間,且反應時間與佇列深度和區塊大小呈線性關係。在 16K 區塊的情況下,延遲在隊列深度 1 時起始於 30µs,在隊列深度 128 時上升至 1.5ms。對於 128K 傳輸,延遲範圍為 54µs 至 3.0ms,而 1M 塊工作負載的延遲起始於 237µs,在隊列深度最大時達到約 40.7ms。 7600 MAX 在所有工作負載下保持嚴格控制,體現了高效的韌體行為和在順序寫入壓力下的可靠性能。
美光 9550 MAX (12.8TB) 的擴展曲線幾乎相同,在 QD1 下,16K 塊的延遲為 30µs,在 QD128 下則上升至 2.7ms。在 128K 區塊下,延遲從 52µs 逐漸上升至 3.2ms,而 1M 工作負載則從 QD1 下的 207µs 上升至 QD128 下的約 40ms。兩款美光硬碟在整個測試範圍內均表現出一致的擴展特性,波動極小。
在整個組別比較中,所有硬碟都表現出類似的行為,隨著佇列深度的增加,反應時間保持穩定的線性成長。美光 7600 MAX 和 9550 MAX 與 Pascari X200P 和金士頓 DC3000ME 的表現非常接近,在較小的區塊大小下表現出卓越的低延遲性能,並在更繁重的順序寫入條件下實現了可預測的擴展。
結語
美光 7600 MAX 6.4TB 固態硬碟彰顯了美光致力於為現代資料中心提供可靠、經濟且延遲最佳化的儲存解決方案。作為一款主流 PCIe Gen5 混合用途固態硬碟,它結合了第九代 TLC NAND 以及自主研發的控制器和韌體,可在持續的企業級工作負載下提供卓越的一致性。
在我們的測試中,7600 MAX 在模擬和實際場景中都展現了強大的效率和可預測的擴展性。在 DLIO 檢查點方面,即使在繁重的混合活動期間,它的效能也與 9550 MAX 保持接近,吞吐量穩定且變異數較低。 FIO 結果凸顯了其在 4K 和 64K 隨機操作中的優勢,在這些操作中,它保持了嚴格的延遲控制,並在整個隊列深度範圍內平穩運行。它並非在所有順序圖上都領先,但它始終傾向於平衡且可重複的行為,而這正是生產團隊持續工作所需要的。

整體而言,美光 7600 MAX 6.4TB 效能均衡,特別注重延遲和一致性。雖然它可能無法達到峰值,但它在壓力下仍然保持穩定,長期高效運行,並且非常適合用於 AI 和雲端環境中的混合用途 Gen5 部署。








Amazon