DapuStor R6060 是一款採用 DP800 控制器和 3D QLC NAND 快閃記憶體的 PCIe Gen5 企業級 QLC SSD。該系列產品涵蓋 U.2、E3.L 和 E1.L 三種規格,容量分別為 15.36TB、30.72TB、61.44TB 和 122.88TB,此外還有一款 245TB 的頂級型號。其介面支援 PCIe 5.0 x4 或 2×2 雙埠操作以及 NVMe 2.0。我們評測的這款產品是 122.88TB 的 E3.L 2T 版本,DapuStor 將其定位為面向高密度 AI 基礎設施、雲端部署和大規模儲存池等對快閃記憶體密度要求極高的應用場景。此效能特性符合此角色,它兼具高順序讀取頻寬和低得多的寫入吞吐量,使得 R6060 更適合讀取密集型資料集和容量驅動型儲存層,而不是小塊事務工作負載。
DapuStor 官方數據顯示,R6060 系列固態硬碟的順序讀取吞吐量最高可達 14GB/s,順序寫入吞吐量為 4GB/s。隨機讀取效能方面,15.36TB 和 30.72TB 型號最高可達 3 萬個 IOPS,而 61.44TB 和 122.88TB 型號則為 2.8 萬 IOPS。隨機寫入效能則低得多,小容量型號在 16KB 資料區塊下為 40 萬 IOPS,而 122.88TB 型號在 32KB 資料區塊下為 20 萬 IOPS。因此,R6060 更適合用於讀取密集型任務,尤其適用於大型資料集和高密度儲存層,在這些場景下,可用容量比小塊寫入速度更為重要。
R6060 具備此類固態硬碟應有的企業級功能,其中 NVMe 2.0 靈活資料置入 (FDP) 是 QLC 快閃記憶體的關鍵特性之一。 FDP 使主機能夠更好地控制資料寫入位置,從而降低寫入放大效應並更有效地利用快閃記憶體資源。 DapuStor 標稱該硬碟的 DWPD 為 0.6,並符合 OCP 2.5 標準、NVMe-MI 1.2、端對端資料保護、安全啟動、韌體驗證、資料清除支援、遙測、延遲監控以及雙埠支援(適用於需要路徑冗餘的系統)。
DapuStor 為 R6060 提供五年保固,最大功耗為 25W,待機功耗為 5W。隨機延遲為 80/25 µs 讀/寫,順序延遲為 7/8 µs,平均故障間隔時間為 2.5 萬小時。
DapuStor R6060 122TB 技術規格
| 指標/字段 | 15.36TB | 30.72TB | 61.44TB | 122.88TB |
|---|---|---|---|---|
| 一般說明 | ||||
| PCN | R6060 | |||
| 容量(TB) | 15.36 | 30.72 | 61.44 | 122.88 |
| 外形 | U.2/E3.L 2T/E1.L | |||
| 介面 | PCIe 5.0×4 / 2×2,NVMe 2.0 | |||
| 閃光燈類型 | 3D企業級QLC NAND快閃記憶體 | |||
| 性能 | ||||
| 讀取頻寬 @128KB (MB/s) | 14000 | 14000 | 14000 | 14000 |
| 寫入頻寬 @128KB (MB/s) | 4000 | 4000 | 4000 | 4000 |
| 隨機讀取 @4KB KIOPS | 3000 | 3000 | 2800 | 2800 |
| 隨機寫入 KIOPS | 40@16KB | 40@16KB | 40@16KB | 20@32KB |
| 隨機延遲讀/寫(微秒) | 80/25 | |||
| 序列延遲讀/寫(微秒) | 7/8 | |||
| 電力 | ||||
| 最大功率(瓦) | 25 | |||
| 閒置功率 (W) | 5 | |||
| 可靠性 | ||||
| 耐力 | 0.6 DWPD | |||
| 平均無故障時間 | 2.5萬小時 | |||
| UBER | 每 1^10 位讀取 18 個扇區 | |||
| 保修政策 | 5年 | |||
DapuStor R6060 效能
路測平台
我們使用執行 Ubuntu 22.04.2 LTS 的 Dell PowerEdge R760 作為本次評測所有工作負載的測試平台。配備了 串行電纜 Gen5 JBOF它與 U.2、E1.S、E3.S 和 M.2 SSD 廣泛相容。我們的系統配置概述如下:
- 2 個英特爾至強金牌 6430(32 核,2.1GHz)
- 16 個 64GB DDR5-4400
- 480GB 戴爾 BOSS 固態硬碟
- 串行電纜 Gen5 JBOF
驅動器比較
- Solidigm P5336 122.88TB(Gen4 | 2.5吋| U.2)
- Solidigm P5336 61.44TB(Gen4 | 2.5吋| U.2)
- 美光 6550 ION 61.44TB(Gen5 | E3.S)
- DapuStor J5060 61.44 TB (Gen4 | 2.4″ | U.2)
- DapuStor R6060 122.88TB (Gen5 | E3.L)
在分析基準測試結果時,請務必牢記這些硬碟的市場定位。雖然它們在部署場景上並非完全直接競爭,但在容量和市場定位方面存在足夠的重疊,這為理解 DapuStor R6060 122.88TB 在當前高容量企業級 SSD 市場中的定位提供了有用的參考。
對比組重點展示了企業級快閃記憶體擴充功能的幾種不同方法。基於TLC的Micron 6550 ION 61.44TB強調更高的Gen5原始性能,而Solidigm P5336 122.88TB和Solidigm P5336 61.44TB則著重於透過QLC NAND實現最大容量和成本效益。 DapuStor J5060 61.44TB提供了另一個Gen4 U.2參考點,而R6060則以122.88TB的容量進軍更新的Gen5 E3.L等級。
將這些驅動器納入考量,可以更全面地了解 R6060 在面向效能和麵向密度的設計方面的表現,因為供應商正在不斷發展高容量企業儲存平台。
FIO性能基準
為了衡量每個 SSD 在常見產業指標上的儲存效能,我們利用了 FIO。每個 SSD 都經過相同的測試流程,其中包括一個預處理步驟:使用順序寫入工作負載對硬碟進行兩次全碟填充,然後進行穩態效能測量。隨著每種被測工作負載類型的變化,我們會根據新的傳輸大小再次進行預處理填充。
在本節中,我們將重點放在以下 FIO 基準:
- 128K 連續
- 64K隨機
- 16K隨機
- 4K隨機
128K 順序寫入(IODepth 16/NumJobs 1)
在128K順序寫入測試中,DapuStor R6060 122.88TB硬碟的讀寫速度為3,920.6MB/s,在該組排名第二。 Micron 6550 ION 61.44TB硬碟以10,456.4MB/s的讀寫速度遙遙領先,但R6060仍然輕鬆超越了Solidigm P5336 122.88TB硬碟(3,152.5MB/s)、DaSolStor J5060 硬碟機(3,152.5MB/s)、DaSolpuStor J5060 21838309809830000 硬碟(3830 P5336 61.44TB硬碟(2,503.5MB/s)。
128K 順序寫入延遲 (IODepth 16 / NumJobs 1)
DapuStor R6060 122.88TB 固態硬碟在 128K 順序寫入延遲測試中取得了 509.7µs 的成績,再次位列第二。 Micron 6550 ION 61.44TB 固態硬碟以 191.0µs 的成績領先,而其他硬碟的成績均落後於 R6060,其中包括 Solidigm P5336 122.88TB(634.0µs)、DapuStor J5060 61.45425355350063(Pgm 61.44TB(798.4µs)。儘管 Micron 在該項測試中保持了較大的領先優勢,但 R6060 仍然是其餘硬碟中表現最佳的。
128K 順序讀取(IODepth 64 / NumJobs 1)
在 128K 順序讀取測試中,DapuStor R6060 122.88TB 達到了 11,554.0MB/s,再次位列第二,僅次於 Micron 6550 ION 61.44TB 的 13,979.7MB/s。
在這兩款硬碟之後,其他比較產品的讀寫速度急遽下降,Solidigm P5336 61.44TB 的讀寫速度為 7,132.3MB/s,Solidigm P5336 122.88TB 為 7,121.6MB/s,DaMBStor J.4609619609963699963969996除了 Micron 的那款硬碟之外,R6060 是本次測試中唯一一款讀寫速度超過 11GB/s 的硬碟。
128K 順序讀取延遲 (IODepth 64 / NumJobs 1)
DapuStor R6060 122.88TB 的 128K 順序讀取延遲為 692.1µs,在同組產品中排名第二。 Micron 6550 ION 61.44TB 的延遲最低,為 571.9µs,而 Solidigm P5336 122.88TB 的延遲最高,為 1123.0µs。兩款 Solidigm P5336 硬碟的延遲幾乎相同,122.88TB 型號為 1123.0µs,61.44TB 型號為 1121.3µs,DapuStor J5060 的延遲則介於兩者之間,為 1122.1µs。
R6060 保持著對其他參賽者的明顯領先優勢,但 Micron 仍然保持著最高成績。
64K 隨機寫入
在64K隨機寫入測試中,DapuStor R6060 122.88TB 的效能表現幾乎穩定。初始設定下(1/1),讀寫速度為3,477.9MB/s,IOPS為55.6K;設定下(1/2),讀寫速度躍升至3,915.2MB/s,IOPS為62.6K。此後,性能基本保持不變。大部分時間讀寫速度都在3,913.7MB/s至3,916.9MB/s之間波動,最高讀寫速度為3,916.9MB/s,IOPS為62.7K(4/1)。即使在較高的讀寫設定下,讀寫速度也分別維持在3,914.6MB/s(32/4)、3,913.8MB/s(16/8)和3,914.0MB/s(32/8)。因此,除了較低的 1/1 起始點之外,R6060 在整個掃描過程中基本上都保持在一個固定的平台上。
從圖表中的其他硬碟來看,Micron 6550 ION 61.44TB 的讀寫速度明顯更高,從大約 2.4GB/s 提升至略高於 10.3GB/s。排在 R6060 之後的是 Solidigm P5336 122.88TB,讀寫速度保持在 3.0GB/s 左右;DapuStor J5060 61.44TB 的讀寫速度大多在 2.8GB/s 左右;而 Solidigm P5336 61.44TB 則徘徊到 24GB 25336 61.4TB 的速度。之間。因此,R6060 位居第二,與其他非 Micron 品牌的硬碟相比優勢明顯。
64K隨機寫入延遲
延遲呈現相同的穩定模式,R6060 在 1/1 負載下測得延遲為 18µs,在 1/2 和 2/1 負載下為 31µs,在 1/4、2/2 和 4/1 負載下為 63µs,然後在 2/4、4/2 和 8/1 負載下為 127 µs。隨著負載增加,延遲在 1/8、2/8、8/2 和 16/1 負載下達到 255µs,然後在 4/8、8/4 和 32/1 負載下達到 510µs。在高負載下,延遲在 8/8、16/4 和 32/2 負載下達到 1,021µs,在 16/8 和 32/4 負載下達到 2,043µs,並在 32/8 負載下達到峰值 4,087µs。
Micron 硬碟的延遲始終保持最低,在 32/8 讀寫速度下約為 1,600 微秒。 R6060 位元列第二,延遲為 4,087 微秒。 Solidigm P5336 122.88TB 的延遲約為 5,100 微秒,J5060 約為 5,500 微秒,而 Solidigm P5336 61.44TB 的延遲則略高於 6,000 微秒。因此,儘管 R6060 的延遲遠不及 Micron,但在高負載測試中,它仍然領先於其他三款硬碟。
64K 隨機讀取
DapuStor R6060 122.88TB 在 64K 隨機讀取測驗中曲線不太平緩,但最終成績最佳。其初始讀寫速度為 381.4MB/s,IOPS 為 6.1K(1/1 容量),隨後在 1/2 容量時攀升至 748.2MB/s,在 2/2 容量時達到 1,007.1MB/s,在 1/4 容量時達到 1,431. 2,343.8MB/s。在 1/8 時達到 2,767.5MB/s,然後在 4/4 時達到 3,668.5MB/s,在 16/2 時達到 4,060.2MB/s,在 2/8 時達到 4,750.0MB/s,在 8/483 時達到 6,43 時達到 68/43 時達到 6,003 時達到 68/43 時達到 6993 時達到 6993 時達到 69039 時達到 690 7,495.3MB/s。之後,在 32/2 時達到 8,428.0MB/s,在 16/4 時達到 9,827.5MB/s,在 8/8 時達到 10,782.5MB/s,在 16/8 時達到 12,798.2MB/s,並在 339,798.2MB/s 時達到峰值。
如下面的圖表所示,Micron 6550 ION 61.44TB 在大部分測試過程中都保持領先,最高速度接近 13.0GB/s,儘管 R6060 在最後階段設法略微超過了 Micron。
64K隨機讀取延遲
儘管R6060在測試初期表現比其他硬碟略顯不穩定,但在測試後期表現出色。其初始速度為163µs(1/1),隨後在1/2時達到167µs,1/4時達到174µs,1/8時達到180µs,2/8時達到217µs,2/ 4時達220µs,2/2時達到249µs,2/1時達260µs,4/8時達到287µs,4/4時達到290µs,8/4時達352µs。中頻部分變得不太整齊,在 8/1 時為 446µs,在 16/2 時為 505µs,在 32/2 時為 531µs,在 16/1 時為 574µs,在 32/1 時為 595µs,在 1600/8 738µs,在 32/8 時達到峰值 1,285µs。
在圖表中,Micron 的整體表現再次較低,在 32/8 時約為 1,200µs。 R6060 的最終成績為 1,285µs,仍然遠低於 J5060 和兩款 Solidigm 硬碟,後三者的最終成績都超過了 2,200µs。
16K 隨機讀取
在負載深度增加後,DapuStor R6060 122.88TB 固態硬碟在 16K 隨機讀取測試中取得了優異成績。在 1/1 負載深度下,其初始 IOPS 為 9.6K,隨後在 2/1 負載深度下達到 18.0K,在 1/4 負載深度下達到 37.2K,在 8/1 負載深度下達到 58.2K,在 1/8 負載深度下達到 72.8K。之後效能持續提升,在 16/1 負載深度下達到 112.8K,在 4/4 負載深度下達到 133.3K,在 2/8 負載深度下達到 138.1K,在 1/16 負載深度下達到 140.3K。隨著負載深度的增加,效能提升更為顯著,在 32/1 負載深度下達到 211.6K,在 8/4 負載深度下達到 246.9K,在 4/8 負載深度下達到 256.5K,在 2/16 負載深度下達到 261.2K。在較重的設定下,它在 16/4 時保持 436.1K,在 32/8 時保持 447.7K,在 4/16 時保持 456.1K,然後在 32/4 時達到 659.3K,在 16/8 時達到 671.3K時達到 784.5K,在 16/16 時達到 786.2K,並在 32/16 時達到 817.7K IOPS。
與其他產品相比,R6060 的整體性能表現優異,但美光仍然佔據榜首。美光 6550 ION 61.44TB 的 IOPS 接近 860 萬,在性能最頂尖的硬碟中領先 R6060。儘管如此,R6060 在大部分測試中都保持著遠超 Solidigm P5336 的性能,最終也遠勝於它們。
16K隨機讀取延遲
在測試的大部分時間裡,R6060 的延遲表現都相當不錯,直到最後階段。在 1/1 設定下,延遲為 104µs,然後在 2/1 設定下為 110µs,在 4/1 設定下為 124µs。在較低和中等設定下,延遲保持在一個較小的範圍內,包括 1/4 設定下的 107µs、1/8 設定下的 109µs、1/16 設定下的 113µs、2/8 設定下的 115µs、4/4 設定下的 120µs、8/420 138/420 下的16/1 設定下的 141µs。隨著負載增加,延遲逐漸上升,在 8/8 時為 143µs,在 16/4 時為 148µs,在 32/1 時為 151µs,在 8/16 時為 189µs,在 16/8 時為 193µs,然後在陡度16/16 時達到 330µs,在 32/8 時達到 336µs,並在 32/16 時達到峰值 642µs。
這使得R6060在大部分測試過程中保持良好的性能,儘管在最後階段出現了明顯的峰值。 Micron 6550 ION的整體延遲曲線仍然最佳,並且在整個測試圖表中都保持著較低的延遲。
16K 隨機寫入
與同組大多數產品相比,DapuStor R6060 122.88TB 的隨機寫入效能較低,僅 16K。其初始 IOPS 為 42.7K(1 月 1 日),1 月 4 日上升至 51.3K,2 月 4 日達到高峰 50.7K。此後,在剩餘的測試中,其 IOPS 大多維持在 28K 至 46K 之間,具體表現為:1 月 8 日 46.4K,2 月 8 日 43.0K,4 月 4 日 44.2K,8 月 8 日 41.3K,16 月 4 日 168K 30.0K,以及 32 月 16 日 27.3K。就頻寬而言,峰值達到了 801.4MB/s,大部分時間速度都在 500MB/s 到 700MB/s 之間。
與其他同類產品相比,R6060 的原始寫入 IOPS 表現遜色不少,只有另一款 122TB 的 Solidigm 硬碟能與之匹敵。 Micron 6550 ION 61.44TB 的表現遙遙領先,大部分時間 IOPS 都在 250 萬到 660 萬之間。 DapuStor J5060 61.44TB 的 IOPS 通常維持在 175 萬到 185 萬左右,而 Solidigm P5336 61.44TB 的 IOPS 則通常在 160 萬左右。
16K隨機寫入延遲
R6060 在 1/1 時初始值就很低,為 23µs,然後在 2/1 時測量為 51µs,在 1/4 時測量為 77µs,在 4/1 時測量為 115µs,在 2/4 時測量為 157µs。從那以後,隨著工作負載的增加,時間迅速攀升,在 2/8 時達到 371µs,在 16/1 時達到 470µs,在 4/8 時達到 779µs,在 8/4 時達到 815µs,在 2/16 時達到 881µs,在達到 8821 時達到 881µs,在達到 8381 時達到 88215 時1,548µs,在 16/4 時達到 1,723µs,在 4/16 時達到 1,738µs,在 8/16 時達到 3,660µs,在 32/4 時達到 4,133µs,在 16/16 時達到 4,133µs,在 16/16 時達到 4,133µs,在 16/16 時達到 18,5325 8,846µs,最終在 32/16 時達到 18,759µs。
這使得R6060在測試的高階階段延遲最高。美光顯示卡的延遲始終遠低於R6060,即使在最嚴苛的測試組合中,J5060和兩款Solidigm固態硬碟的延遲也遠低於R6060。
4K 隨機讀取
DapuStor R6060 122.88TB 在 4K 隨機讀取測驗中表現出色,隨著測驗佇列深度和作業數量組合的增加,效能也得到了提升。
它從 1/1 時的 11.5K IOPS 開始,然後攀升至 2/1 時的 21.5K,1/4 時的 44.0K,2/4 時的 83.2K,1/8 時的 85.4K,2/8 時的 162.2K,以及 165.0.K 時的 1650.K 時的 1650。從那以後,它繼續擴展,在 4/8 時達到 557.9K,8/8 時達到 316.5K,16/4 時達到 557.9K,8/8 時達到 585.6K,4/16 時達到 598.9K,16/8 101.時達到 1.729M,最終在 32/16 時達到峰值 2.061M IOPS。頻寬最高達到 8,050.3MB/s。
4K隨機讀取延遲
在整個測試過程中,讀取延遲基本上保持在一個較小的範圍內,僅在高端階段略有上升。 R6060 在 1/1 時讀取延遲為 0.090 毫秒,2/4 時為 0.095 毫秒,1/8 時為 0.090 毫秒,2/4 時為 0.095 毫秒,1/8 時為 0.093 毫秒,2/8 時為 0.09 毫秒,1.06 毫秒。在測試過程中,讀取延遲基本上維持在接近該水平,包括 4/4 和 4/8 時為 0.101 毫秒,8/4 時為 0.107 毫秒,8/8 時為 0.109 毫秒,16/4 時為 0.115 毫秒,8/16 時為 0.19 毫秒。在較重的設定下,16/16 時上升到 0.148 毫秒,32/8 時上升到 0.155 毫秒,並在測試結束時達到峰值 0.247 毫秒。
GPU直接儲存
我們在這個測試台上進行的測試之一是 Magnum IO GPU 直接儲存 (GDS) 測試。 GDS 是 NVIDIA 開發的功能,可讓 GPU 在存取儲存在 NVMe 磁碟機或其他高速儲存裝置上的資料時繞過 CPU。 GDS 不再透過 CPU 和系統記憶體來路由數據,而是實現了 GPU 和儲存設備之間的直接通信,從而顯著減少了延遲並提高了數據吞吐量。
GPU 直接儲存的工作原理
傳統上,當 GPU 處理儲存在 NVMe 磁碟機上的資料時,資料必須先經過 CPU 和系統內存,才能到達 GPU。由於 CPU 充當了中間環節,這個過程會造成瓶頸,增加延遲並消耗寶貴的系統資源。 GPU 直接儲存技術使 GPU 能夠透過 PCIe 總線直接從儲存裝置存取數據,從而消除了這種低效率。這種直接路徑減少了資料移動開銷,從而實現了更快、更有效率的資料傳輸。
人工智慧工作負載,尤其是涉及深度學習的工作負載,是高度資料密集的。訓練大型神經網路需要處理 TB 級的數據,資料傳輸中的任何延遲都可能導致 GPU 利用率不足和訓練時間更長。 GPU 直接儲存透過確保資料盡快傳輸到 GPU、最大限度地減少空閒時間並最大限度地提高運算效率來解決這一挑戰。
此外,GDS 對於涉及串流大型資料集的工作負載特別有利,例如視訊處理、自然語言處理或即時推理。透過減少對 CPU 的依賴,GDS 可以加速資料移動並釋放 CPU 資源用於其他任務,從而進一步增強整體系統效能。
GDSIO 順序讀取吞吐量
在我們的 GDSIO 順序讀取吞吐量測試中,DapuStor R6060 122.88TB 在 16K 傳輸時表現參差不齊,但隨著區塊大小的增加,效能逐漸趨於穩定。在 16K 區塊大小下,其單執行緒速度為 663.7MiB/s,四執行緒降至 221.5MiB/s,八執行緒降至 200.3MiB/s,隨後在 128 執行緒時回升至 978.8MiB/s。這使得它在測試的大部分小塊傳輸階段,尤其是在中等線程數下,落後於其他一些硬碟,因此 16K 順序讀取並非這款硬碟的最佳效能所在。
在 128K 讀寫速度下,R6060 的表現明顯更勝一籌。單線程下速度為 1.4GiB/s,16 線程下為 1.7GiB/s,32 個線程下為 2.8GiB/s,然後在 64 個線程和 128 個線程下分別攀升至 4.3GiB/s 和 4.9GiB/s。這使得它在 128K 順序讀取的高線程數下,在該組產品中名列前茅,領先於 DapuStor J5060 61.44TB、Micron 6550 ION 61.44TB 和 Solidigm P5336 122.88TB。尤其是在 64 個線程和 128 個線程下,R6060 與其他同類產品之間的差距更為顯著。
最大的提升體現在 100 萬次讀寫測驗中。 R6060 在單線程下初始速度為 1.7GiB/s,然後在四線程時躍升至 3.0GiB/s,八線程時達到 4.4GiB/s,十六線程時達到 5.2GiB/s,並在 128 個線程時達到峰值 5.9GiB/s。從八線程開始,它就一直領先於其他對比對象,並且隨著並發數的增加,領先優勢持續擴大。因此,儘管 R6060 在 16K 讀寫測試中表現不穩定,但其 128K 和 100 萬次順序讀取測試的結果非常出色,尤其是在線程數增加到測試的較高水平後。
GDSIO 順序讀取 IOPS
在 GDSIO 順序讀取 IOPS 測試中,DapuStor R6060 122.88TB 的效能表現因區塊大小而異。在 16K 區塊大小下,其性能在單線程時表現強勁,達到 42.5K IOPS;隨後在四線程和八線程時分別下降至 14.2K 和 12.8K IOPS;之後性能逐漸回升,在 32 線程、64 線程和 128 線程時分別達到 19.9636K.這項性能回升使其接近 Micron 6550 ION 的頂尖水平,但 Solidigm P5336 在該測試環節以 128 線程 92.5K IOPS 的成績遙遙領先。在較小的 16K 負載下,R6060 在執行緒數適中時的效能表現略顯不穩定,但最終的成績遠超預期。
在 128K 並發測試中,R6060 展現出更強、更穩定的效能擴展性。其單線程 IOPS 為 11.6K,四線程為 6.4K,八線程為 8.7K,十六線程為 14.0K,三十二線程為 23.2K,六十四線程為 35.3K,十二八線程為 40.3K。在高階測試中,R6060 的表現最佳,領先 31.3K 並發測試的 DapuStor J5060(61.44TB)、23.3K 並發測試的 Solidigm P5336(122.88TB)以及 19.4K 並發測試的 MicronION 65044 4434 4044 4434 434 40434 40434 404 404 404 4436)。隨著併發數的增加,R6060 在這一環節的優勢更加明顯。
在 1M 測試結果中,R6060 表現出色(儘管從圖表中可能不太明顯)。其初始 IOPS 為 1.7K,在 4 個線程時提升至 3.0K,8 個線程時為 4.5K,16 個線程時為 5.3K,32 個線程時為 5.6K,64 個線程時為 5.9K,128 個線程時為 6.0K。這使其在對比組中 1M 傳輸測試中取得了最高成績,超過了 DapuStor J5060(4.3K)、Solidigm P5336(4.3K)和 Micron 6550 ION(2.6K)。因此,儘管 16K 測試部分出現了一些波動,但 R6060 在 128K 和 1M 順序讀取 IOPS 方面表現非常出色,尤其是在執行緒數增加到測試上限時。
GDSIO 順序讀取延遲
在 GDSIO 順序讀取延遲測試中,DapuStor R6060 122.88TB 的表現優於其他幾款產品,尤其是在執行緒數增加的情況下。在 16K 負載下,單線程讀取延遲為 22µs,四線程為 281µs,八線程為 623µs,16 線程為 1.1ms,32 線程為 1.6ms,64 線程為 1.7ms,128 線程為 2.0ms。這使得它在 16K 負載下擁有最低的延遲,並在其他負載下保持了競爭力。雖然 Micron 6550 ION 和 Solidigm P5336 在 16K 負載的中段略低一些,但在接近高端負載時,各款產品之間的差距再次縮小。
在 128K 線程測試中,R6060 表現強勁,單線程延遲為 85µs,4 個線程為 621µs,8 個線程為 923µs,16 個線程為 1.1ms,32 個線程為 1.4ms,64 個線程為 1.8ms,128 個線程為 3.2ms。在 32 執行緒測試中,它始終處於領先地位或接近領先水平,即使在負載增加的情況下延遲有所上升,它與其他硬碟相比仍然表現出色。 Micron 6550 ION 在 128K 執行緒測試的高階表現遠超 R6060,而 DapuStor J5060 和 Solidigm P5336 在 128 執行緒測試中也優於 R6060。
最顯著的差距體現在 1M 工作負載測試中,R6060 在單線程下延遲為 587µs,四線程下為 1.3ms,八線程下為 1.8ms,十六線程下為 3.0ms,三十二線程下為 5.8ms,六十四線程下為 10.8ms,十二1309ms。在整個 1M 測試範圍內,這些數值均優於 Micron 6550 ION,並且在線程數較高時低於 Solidigm P5336,儘管 DapuStor J5060 在 64 線程和 128 線程測試中仍然領先。總體而言,隨著傳輸大小和並發性的增加,R6060 在控制順序讀取延遲方面表現出色,尤其是在測試的高負載部分錶現尤為穩定。
GDSIO 順序寫入吞吐量
在 GDSIO 順序寫入吞吐量測試中,DapuStor R6060 122.88TB 在大部分測試範圍內都表現出色,尤其是在 128K 和 1M 的早期測試中。在 16K 測試中,其初始速度為 0.67GiB/s,在四線程時攀升至 1.18GiB/s,八線程時達到 1.37GiB/s,並在 16 線程時達到峰值 1.47GiB/s,之後在 128K 測試中回落至 1.20GiB/s。這項效能與 Micron 6550 ION 相當,在 16K 中執行緒測試的大部分範圍內,Micron 6550 ION 的表現略勝一籌。
當資料區塊大小提升至 128K 時,R6060 的效能表現顯著增強。其初始讀寫速度為 2.79GiB/s,在 4 個執行緒時躍升至 3.82GiB/s,並在 16 個執行緒時保持在該範圍內,達到 3.83GiB/s。之後,在 32 個執行緒、64 個執行緒和 128 個執行緒時,其讀寫速度分別為 3.71GiB/s、3.80GiB/s 和 3.28GiB/s。這使得 R6060 在本次對比測試中幾乎全程領先其他硬碟,僅在最高執行緒數下略有下降。
在 1M 測試中,R6060 在低執行緒數和中執行緒數下再次領先。它在單線程時速度為 3.81GiB/s,四線程時為 3.73GiB/s,八線程時為 3.79GiB/s,十六線程時為 3.49GiB/s,之後速度逐漸下降,三線程時為 3.31GiB/s,六線程時為 3.06B/s. Micron 6550 ION 在 1M 測試的後期階段最終超越了 R6060,在三線程時速度達到峰值 3.90GiB/s,而 Solidigm P5336 的速度則保持在 3GiB/s 左右,DapuStor J5060 的速度則始終保持在 2.8GiB/s 左右。總體而言,R6060 在該組中展現了較好的順序寫入吞吐量,其最佳性能為 128K,並且在 1M 工作負載下具有強大的早期擴展能力。
GDSIO 順序寫入 IOPS
在 GDSIO 順序寫入 IOPS 測試中,DapuStor R6060 122.88TB 固態硬碟在 16K 測試中表現出色,並在整個測試階段保持領先地位。其單線程 IOPS 為 43.5K,四線程為 76.9K,八線程為 89.4K,十六線程為 95.9K,在 32 線程時達到峰值 98.4K,之後在 64 線程時降至 89.8K,在 128 線程時降至 78.7K。 Micron 的 6550 ION 在 16K 測試的中段表現略勝一籌,在 32 線程時達到 100K IOPS,在 64 線程時達到 97.5K,但 R6060 一直緊隨其後,直到最高線程數測試時才被 J5060 和 Solidi P16 5336 和 Solidi 超越。
在 128K 測試中,R6060 從頭到尾都展現出該組顯示卡中最強勁的性能。其單線程 IOPS 為 22.8K,四線程 IOPS 為 31.3K,八線程 IOPS 為 16K,四線程 IOPS 為 31.3K,八線程 IOPS 為 32K,十六線程 IOPS 為 31.4K,三十二線程 IOPS 為 30.3K,六十四線程 IOPS 為 31.2K,而十二八線程 IOPS 為 64K,而十二八線程。這使其領先 Micron 6550 ION,後者在中段測試中 IOPS 接近 30K,之後跌至 20K 出頭;R26.9 也遠超 J5060 和 Solidigm P5336,這兩款顯卡在 128K 測試的大部分時間裡都落後 Rgm P128 較多。
在所有四款硬碟的1M寫入測試中,R6060的效能差距都相當小,但R6060仍然名列前茅。它在單線程下實現了3.9K IOPS,四線程下為3.8K,八線程下為3.9K,十六線程下為3.6K,32線程下為3.4K,64線程下為3.1K,128線程下為3.0K。這使其在低線程性能上略勝J5060一籌,並在最終測試中與Solidigm P5336基本持平,而Micron 6550 ION在32線程和64線程測試中一度領先。整體而言,R16展現了強勁的順序寫入IOPS效能,其最佳成績為128K,在所有執行緒數下均領先其他比較產品。
GDSIO 順序寫入延遲
在 GDSIO 順序寫入延遲測試中,DapuStor R6060 122.88TB 在測試的輕負載和中負載部分錶現出色,但隨著執行緒數的增加,效能有所下降。在 16K 寫入測試中,單線程延遲為 22µs,四線程為 51µs,八線程為 88µs,16線程為 165µs,32線程為 323µs,64線程為 709µs,128線程為 1.6ms。總體而言,這些數據非常出色,使 R6060 在 16K 寫入測試的大部分時間都保持在領先位置。 Micron 6550 ION 在最重的 16K 負載下表現略遜一籌,而 J5060 和 Solidigm P5336 的表現則更勝一籌。
在 128K 線程下,R6060 的表現仍然具有競爭力,其單線程延遲為 43µs,4 線程為 126µs,8 線程為 254µs,16 線程為 508µs,32 線程為 1.1ms,64 線程為 2.0ms,128ms 128ms。這是本次對比測試中延遲最低的顯示卡之一,尤其是在 64 執行緒下。只有 Micron 6550 ION 在高階效能上略遜一籌,而 J5060 和 Solidigm P5336 在 128 執行緒下的效能均優於 R6060。
最大的提升出現在 1M 傳輸量測試中,R6060 在單線程下延遲為 255µs,4 線程下為 1.0ms,8 線程下為 2.1ms,16 線程下為 4.5ms,32 線程下為 9.5ms,64 線程下為 20.5ms,32 線程下為 9.5ms,64 線程下為 20.5ms,32 線程下為 9.5ms,64 線程下為 20.5ms 下為 1245ms。這使得它在高負載下落後於 Micron 6550 ION,略高於 Solidigm P5336,而 J5060 在高階測試中延遲最高。因此,R6060 在 16K 和 128K 以下的順序寫入延遲表現良好,但更大的 1M 傳輸量隨著並發數的增加而急劇上升。
DLIO 檢查點基準
為了評估 SSD 在 AI 訓練環境中的實際效能,我們使用了資料與學習輸入/輸出 (DLIO) 基準測試工具。 DLIO 由阿貢國家實驗室開發,專門用於測試深度學習工作負載中的 I/O 模式。它能夠深入了解儲存系統如何處理檢查點、資料攝取和模型訓練等挑戰。此測試的設計使得每個驅動器都填充了完整的檢查點;容量更大的 SSD 可以容納更多檢查點。下圖展示了兩個磁碟機在 99 個檢查點(122TB 版本為 198 個檢查點)的處理情況。在訓練機器學習模型時,檢查點對於定期保存模型狀態至關重要,可防止在中斷或斷電期間失去訓練進度。這種儲存需求要求系統具備強大的效能,尤其是在持續或高強度工作負載下。我們使用了 2024 年 8 月 13 日發布的 DLIO 基準測試 2.0 版本。
為了確保我們的基準測試能夠反映真實場景,我們基於 LLAMA 3.1 405B 模型架構進行了測試。我們使用 torch.save() 實作了檢查點機制,用於擷取模型參數、最佳化器狀態和層狀態。我們的設定模擬了一個八 GPU 系統,並採用了混合平行策略,將四路張量並行和兩路管線並行分佈在八個 GPU 上。這種配置產生的檢查點大小為 1,636GB,符合現代大型語言模型訓練的需求。
對於 DLIO 檢查點通過平均值測試,我們將 DapuStor R6060 122TB 與 Solidigm P5336 122.88TB、Solidigm P5336 61.44TB 和 Micron 6550 ION 61.44TB 進行了比較。
DapuStor R6060 在第一輪測試中表現出色,以 465.33 秒的成績位列所有測試產品之首。然而,在隨後的幾輪測試中,其性能出現了顯著下滑,第二輪耗時 934.50 秒,第三輪更是達到了 965.27 秒。最終,R6060 在所有測試產品中排名墊底,落後於 Solidigm P5336 122.88TB(757.31 秒)、Solidigm P5336 61.44TB(639.63 秒)以及 Micron 6550 ION 61.44TB(585.03 秒)。
在 DLIO 檢查點基準測試中,DapuStor R6060 122TB 固態硬碟的效能變化最為顯著,尤其是在工作負載增加時。測試初期,該硬碟表現優異,運轉時間穩定在 460 秒左右,與 Micron 6550 ION 61.44TB 並駕齊驅,領先兩款 Solidigm 固態硬碟。然而,隨著檢查點數量的增加,R6060 的運行時間明顯延長,在剩餘的許多檢查點上都達到了 900-1000 秒。
結語
DapuStor R6060 122.88TB 的效能符合其設計預期。大塊讀取、順序傳輸和 GPU Direct Storage 工作負載是這款硬碟表現始終優異的部分,而小塊隨機寫入則是其明顯的弱點。在 FIO 測試中,R6060 在 128K 順序讀取中達到 11,554MB/s,在 128K 順序寫入中達到 3,920.6MB/s,在 64K 隨機寫入測試中保持了近乎穩定的 3,913MB/s 至 3,916 到了13,274.8MB/s,在 16K 隨機讀取中達到了 817.7K IOPS,在 4K 隨機讀取中達到了 2.061M IOPS 的峰值。 16K 隨機寫入是其弱點所在,這款硬碟在該項測試中遠遜於我們排行榜上那些以寫入效能為核心的 SSD。
GDSIO 測試也遵循同樣的規律。 R6060 在較小的 16K 讀取測試中表現不穩定,但隨著傳輸規模的增大,其性能表現強勁,在線程數較高的情況下,128K 和 1M 順序讀取吞吐量均領先於其他對比產品,1M 順序讀取吞吐量達到 5.9GiB/s,並且在所有線程數下,128K 順序讀取吞吐量達到 5.9GiB/s,並且在所有線程數下,128K 順序寫入 IOPS 也位居榜首。在較大區塊的 GPU 直接讀取測試中,其延遲表現也整體良好。
DapuStor 提供多種規格的 R6060 固態硬碟,包括 U.2、E3.L 和 E1.L 三種規格,容量從 15.36TB 到 122.88TB 不等,更有 245TB 的高階機型。如此豐富的規格選擇為系統整合商提供了極大的靈活性,但也凸顯了預先進行相容性檢查的重要性。我們測試的 122.88TB E3.L 2T 型號並不屬於大多數資料中心常用的 U.2 和 E3.S 規格,因此,在訂購 EDSFF 硬碟之前,仍然需要仔細檢查硬碟托架、厚度、長度和 PCIe 通道分配等因素。 2T 硬碟無法安裝在 1T 插槽中,E3.L 硬碟也無法安裝在 E3.S 硬碟托架中。這在現今的 EDSFF 整合中已是常見現象,但對於首次將這些高容量硬碟引入部署的用戶而言,仍需特別注意。
R6060 適用於其所面向的儲存層級,表現良好,為 DapuStor 提供了一個可靠的高容量 Gen5 QLC 選擇。






Amazon