存儲評論網

Phison Pascari X200P SSD 評測:資料中心均衡的 Gen5 效能

企業  ◇  SSD

群聯 Pascari X 系列產品線專為滿足各種企業儲存需求而開發,為讀寫密集型工作負載提供客製化解決方案。 X200P 是高容量型號,單盤每日寫入次數 (DWPD) 最高支援 30.72TB 容量。它採用 Gen5 PCIe 和 TLC NAND,提供 U.3、U.2 和 E3.S 三種規格。 X200P 適用於各種用例,包括大規模內容交付、AI 推理和冷資料歸檔。

Phison 還提供 X200E 高耐久性型號,針對寫入密集型工作負載進行了最佳化,支援高達 1.6 個 DWPD,容量範圍從​​ 25.6TB 到 XNUMXTB,非常適合事務資料庫、即時分析和日誌處理。

群聯pascari x200P

本次評測中,群聯電子送來了 7.68TB 的 X200P U.2 型號。我們對其進行了全套企業級基準測試,以評估其在壓力下的表現。

群聯 帕斯卡里 X200P 系列 論文規範

群聯 Pascari X200P 系列規格 1.92TB 3.84TB 7.68TB 15.36TB 30.72TB
外形 U.2
介面 PCIe 5.0 x4、2×2
NVMe 2.0
NAND閃存 3D TLC
順序讀取(MB / s) 14,800 14,800 14,800 14,800 14,000(預計)
順序寫入(MB / s) 4,300 8,600 8,700 8,350 7,500(預計)
4K 隨機讀取 (IOPS) 2,400K 3,000K 3,000K 3,000K 2,300K(預估)
4K 隨機寫入 (IOPS) 170K 380K 500K 500K 283K(預估)
讀取延遲 (μs) 60
寫入延遲(μs) 10
有效功率 (W) <25
功率 – 空閒 (W) 5
DWPD(7) 1
UBER <每 1 個扇區18 位讀取
平均無故障時間(百萬小時) 2.5
有限保修(年) 5
工作溫度(°C) 0年到70年
非工作溫度 (°C) 40到85
外形尺寸(mm) 100.10(長)x 69.85(寬)x 15.00(高)
重量(g) 188 199 201 168 <250

建造與設計 Pascari X200P 7.68TB

我們測試的是 7.68TB U.2 2.5 吋版 X200P,專為高效能企業儲存應用而設計。它採用 PCIe 5.0 接口,完全符合 NVMe 2.0 規範。該驅動器基於高耐用性 3D TLC NAND 構建,支援高達 30.72TB 的容量。

群聯 pascari x200P 端口

外型方面,X200P 採用標準的 2.5 吋 U.2 尺寸,長 100.10 毫米,寬 69.85 毫米,高 15.00 毫米,重量 201 克。整個組件封裝在一個光滑的黑色鋁製外殼中,並整合了被動散熱系統,旨在在持續高負載下有效控制散熱。此驅動器還支援 E3.S 配置,可在高密度儲存環境中提供靈活性。

群聯 pascari x200P 背面

從效能角度來看,它的額定順序讀取速度高達 14,800MB/s,順序寫入速度高達 8,700MB/s,隨機讀取速度高達 3 萬 IOPS,隨機寫入速度高達 500 萬 IOPS。此驅動器的運作功耗低於 25W,空閒功耗僅為 5W,使其成為持續高吞吐量操作的高效選擇。

其耐用性等級為 1 DWPD,MTBF 為 2.5 萬小時,並提供 5 年有限保固。它專為全天候企業工作負載而設計,工作溫度範圍為 24°C 至 7°C。

Phison 包含一套全面的企業級資料保護和管理功能:

  • 斷電保護 (PLP)
  • ISE(即時安全擦除)、TCG Opal 2.0 支持
  • AES-XTS 256 位元加密
  • 端到端數據路徑保護
  • 元資料保護
  • SECDED(單糾錯雙錯偵測)
  • 淨化操作
  • NVMe-MI(管理介面)
  • SMBus 相容性
  • 支援最多 128 個命名空間

總而言之,Pascari X200P 系列將強大的工業級建造品質與尖端效能和企業級可靠性相結合,使其成為雲端、AI/ML 和虛擬化基礎架構等高要求儲存環境的有力選擇。

性能測試

路測平台

我們利用運行 Ubuntu 760 LTS 的 Dell PowerEdge R22.04.02 作為測試平台,測試本次評測中的所有工作負載。配備了 串行電纜 Gen5 JBOF,它與 U.2、E1.S、E3.S 和 M.2 SSD 廣泛兼容我們的系統配置概述如下:

  • 2 個英特爾至強金牌 6430(32 核,2.1GHz)
  • 16 個 64GB DDR5-4400
  • 480GB 戴爾 BOSS 固態硬碟
  • 串行電纜 Gen5 JBOF
驅動器比較

我們將 Pascari X200P 與一組容量相似且採用 TLC NAND 快閃記憶體的 7.68TB PCIe Gen5 NVMe SSD 進行了比較。比較對象包括美光 9550、閃迪 SN861、Solidigm PS1010 和金士頓 DC3000ME。這些 SSD 代表了專為高效能環境設計的中等容量企業級解決方案。測試使用了一系列真實和合成基準測試,包括 CDN、FIO 和 GDSIO,以衡量其在持續吞吐量、延遲、混合 I/O 模式和 GPU 加速工作負載下的效能。透過標準化容量、介面和 NAND 類型,本評估可以清楚比較 Pascari X200P 在嚴苛條件下與同類產品的效能表現。

CDN 效能

為了模擬真實的混合內容 CDN 工作負載,我們對 SSD 進行了多階段基準測試,旨在複製內容密集型邊緣伺服器的 I/O 模式。測試過程涵蓋了各種大小的區塊,包括大塊和小塊,分佈在隨機和順序操作中,並具有不同的並發等級。

在主要效能測試之前,每個SSD都使用100MB大小的區塊完成了1%順序寫入的全設備填充。此過程使用同步I/O和128的佇列深度,允許同時執行四個作業。此階段確保驅動器進入代表實際使用情況的穩定狀態。在順序填充之後,執行第二個三小時的隨機寫入飽和階段,使用加權區塊大小分割(區塊大小/百分比)分佈,該階段主要採用98.51K的傳輸(128%),低於8K的區塊直至XNUMXK的區塊的貢獻較小。此步驟模擬了分散式快取環境中常見的碎片化和不均勻的寫入模式。

主要測試套件著重於擴展的隨機讀寫操作,以測量驅動器在可變佇列深度和作業並發性下的行為。每次測試持續五分鐘(300秒),之後有三分鐘的空閒時間,以便內部恢復機制穩定性能指標。

  • 使用固定區塊大小分佈執行,其中 128K(98.51%)為宜,其餘 1.49% 的操作由較小的傳輸大小組成,範圍從 64K 到 8K。每種配置分別包含 1、2 和 4 個並發作業,佇列深度分別為 1、2、4、8、16 和 32,以分析典型邊緣寫入條件下的吞吐量可擴充性和延遲。
  • 我們採用了一個高度混合的區塊大小配置文件,模擬了 CDN 內容檢索,首先以 128K(83.21%)的佔比為主,然後是超過 30 個較小區塊大小的長尾,大小範圍從 4K 到 124K,每個區塊大小都具有不同的頻率表示。這種分佈反映了在視訊片段提取、縮圖存取和元資料查找過程中遇到的各種請求模式。這些測試也針對完整的作業數量和佇列深度矩陣進行了測試。

這種預處理、飽和度和混合大小隨機存取測試的組合旨在揭示 SSD 如何處理持續的類似 CDN 的環境,強調在頻寬密集和高度並行化場景中的響應能力和效率。

CDN 工作負載讀取 1

在這項模擬輕量內容傳輸流量的單任務讀取測試中,Pascari X200P 在隊列深度 1 時以 765MB/s 的速度墊底,在隊列深度 2 時則以 1,403MB/s 的速度墊底。隨著隊列深度的增加,此驅動器的擴展速度迅速提升,透過隊列深度 8 和隊列深度 16 逐漸上升到隊列的中間位置。在隊列深度 32 時,X200P 的速度達到 13,516.8MB/s,位居金士頓 DC3000ME 和美光 9550 之後,位居第三,同時在隊列深度最頂端則超越了閃迪 SN861 和 Solidigm PS1010。

CDN 工作負載讀取 2

在執行兩項作業的情況下,Pascari X200P 在佇列深度 1 時以 1,519 MB/s 的速度墊底,但隨著佇列深度的增加,速度穩定提升。在隊列深度 2 和 4 時,該驅動器的速度持續提升,到隊列深度 8 時,它縮小了與領先者的差距。在隊列深度 32 時,Pascari X200P 以 15,257.6MB/s 的速度位居榜首,領先美光 9550、金士頓 DC3000ME、Solidigm PS1010 和閃迪 SN861。

CDN 工作負載讀取 4

在執行了四個作業的情況下,Pascari X200P 再次展現出隊列深度的強勁擴展能力。該硬碟在隊列深度 2,982 時達到了 1MB/s 的最高速度,落後於所有測試硬碟,但在隊列深度 2 和 4 時穩步提升。到了隊列深度 8 時,X200P 開始領先,並在隊列深度 16 和 32 時保持領先。 Pascari X200P 在 32 時以 15,257.6MB/s 的速度位居總冠軍,領先美光 9550 和金士頓 DC3000ME。

CDN 工作負載寫入 1

進入 CDN 寫入測試,在應用一個作業的情況下,Pascari X200P 在本次寫入測試中落後於其他產品。該驅動器在 QD1,885 下達到最高速度 1MB/s,並逐漸擴展到 QD32,最終以 5,913MB/s 的成績位居第四。 SanDisk SN861 和 Micron 9550 領先該組,緊隨其後的是金士頓 DC3000ME。 Pascari X200P 保持穩定在第四的位置,速度持續提升,但在低線程場景下寫入效能略遜一籌。

在執行兩項作業的情況下,Pascari X200P 在本次 CDN 寫入測驗中總體排名第四。該驅動器在 QD2,762 時達到最高速度 1MB/s,並持續到 QD16,但在 QD32 時速度有所下降,最終達到最高速度 4,585MB/s。美光 9550 和閃迪 SN861 在這方面領先,緊隨其後的是金士頓 DC3000ME。 X200P 在中等隊列深度下保持穩定的效能,但在雙執行緒寫入工作負載下落後於領先者。

在執行四項作業的情況下,Pascari X200P 在本次 CDN 寫入測驗的大部分時間都保持著中等程度的效能。該驅動器在隊列深度 2,845 時的最大吞吐量達到了 1MB/s,並且在隊列深度中等的情況下仍能與金士頓 DC3000ME 和 Solidigm PS1010 保持競爭力。在隊列深度 32 時,X200P 略微落後,以 3,613MB/s 的成績排在第五位。美光 9550 和閃迪 SN861 領先該領域,而金士頓 DC3000ME 則保持第三。在整個系列中,X200P 在中等負載下提供了一致的寫入擴展,但在四線程工作負載下,佇列深度較深時會受到一些限制。

DLIO 檢查點基準

為了評估固態硬碟 (SSD) 在 AI 訓練環境中的實際效能,我們使用了資料和學習輸入/輸出 (DLIO) 基準測試工具。 DLIO 由阿貢國家實驗室開發,專門用於測試深度學習工作負載中的 I/O 模式。它能夠深入了解儲存系統如何應對檢查點設定、資料提取和模型訓練等挑戰。下圖展示了兩款固態硬碟如何在 36 個檢查點上執行整個過程。在訓練機器學習模型時,檢查點對於定期保存模型狀態至關重要,可防止中斷或斷電期間進度遺失。這種儲存需求需要強大的效能,尤其是在持續或密集的工作負載下。我們使用了 2.0 年 13 月 2024 日發布的 DLIO 基準測試 XNUMX 版。

為了確保基準測試能夠反映真實場景,我們基於 LLAMA 3.1 405B 模型架構進行測試。我們使用 torch.save() 實作檢查點,以擷取模型參數、最佳化器狀態和層狀態。我們的設定模擬了一個八 GPU 系統,實現了混合平行策略,其中四路張量並行和雙向管線平行處理分佈在八個 GPU 上。此配置的檢查點大小為 4GB,代表了現代大型語言模型訓練的需求。

在 DLIO 檢查點基準測試中,Pascari X200P SSD 表現出強勁的初始反應能力,但隨著工作負載的增加,檢查點時間會增加。在早期測試(檢查點 1-4)中,X200P 的表現與其他同類產品相近,平均時間為 467 秒,與 Solidigm PS1010 和美光 9550 等硬碟並駕齊驅。

然而,到了基準測試的中間點(檢查點 5-9),X200P 的效能開始出現分化。此硬碟的檢查點時間急遽上升,在檢查點 689.68 處達到峰值 12 秒,為該組最高。在最後三個檢查點中,X200P 的平均時間為 672 秒,比第二慢的硬碟(金士頓 DC19.3ME)慢了約 3000%,比該組平均值慢了 23%。

從平均賽程來看,X200P 的表現隨時間推移呈現明顯的下降趨勢。在第一次賽程中,其平均耗時 1 秒,略微落後於其他對手,但仍在競爭優勢之內。

在第二輪測試中,X2P 的成績與同類硬碟相比差距明顯,為 200 秒,比第二慢的硬碟(金士頓 DC662.04ME)慢了 14.5%,比該輪測試的同類硬碟平均值慢了 3000%。這一趨勢延續到了第三輪測試,其成績為 17.4 秒,繼續保持最慢硬碟的位置。與其他四款硬碟的平均值(約 3 秒)相比,X674.48P 的完成時間慢了 567%。

FIO性能基準

為了衡量每個 SSD 在常見產業指標上的儲存效能,我們利用 FIO。每個 SSD 都經過相同的測試流程,其中包括一個預處理步驟:使用順序寫入工作負載兩次全盤填充,然後測量穩態效能。隨著被測工作負載類型的變化,我們會再次執行一次基於新傳輸大小的預處理填充。

在本節中,我們將重點放在以下 FIO 基準:

  • 128K 連續
  • 64K隨機
  • 16K隨機
  • 4K隨機

128K 順序前提條件 (IODepth 256 / NumJobs 1)

在 128K 順序寫入預處理測試中,X200P 整體排名第三,平均頻寬為 8,371MB/s。雖然性能表現強勁,但該驅動器的頻寬出現了輕微的反覆波動,與上方的美光 9550 和金士頓 DC3000ME 等更平坦、更穩定的頻寬相比,其穩定性較差。

128K 順序預處理延遲 (IODepth 256 / NumJobs 1)

在 128K 順序寫入預處理延遲測試中,X200P 的平均延遲為 3.822 毫秒,位居第三,僅次於美光 9550 和金士頓 DC3000ME。與其頻寬模式類似,Pascari 的延遲波動較小,這表明在持續寫入過程中存在一些波動,但仍保持著強勁的領先地位。

128K 順序寫入(IODepth 16/NumJobs 1)

在128K順序寫入測試中,X200P的平均頻寬達到了8369.7MB/s,位居第三。它落後於美光9550和金士頓DC3000ME,但領先於Solidigm PS1010和SanDisk SN861。

128K 順序寫入延遲 (IODepth 16 / NumJobs 1)

在 128K 順序寫入測試延遲圖表中,X200P 的平均延遲為 0.238 毫秒。這使其總體排名第四,僅次於金士頓 DC3000ME(0.235 毫秒),領先 Solidigm PS1010 和 SanDisk SN861。雖然其延遲低於大多數產品,但仍落後於表現最佳的美光 9550。

128K 順序讀取(IODepth 64 / NumJobs 1)

在 128K 順序讀取測試中,X200P 以 14,242.1MB/s 的頻寬位居第一,略勝 Solidigm PS1010 和 Micron 9550。它在讀取吞吐量方面領先,在高隊列深度下表現出色。

128K 順序讀取延遲 (IODepth 64 / NumJobs 1)

在128K順序讀取測試延遲圖表中,X200P的平均延遲為561.4毫秒,在整體延遲方面排名第二。它略微落後於Solidigm PS1010,但優於美光9550、金士頓DC3000ME和SanDisk SN861。

64K 隨機寫入

在 64K 隨機寫入測試中,X200P 整體效能表現中等,但在不同的佇列深度和執行緒組合下略有波動。此驅動器的測試結果並未限定在特定範圍內,但在大多數測試中,其效能基本上穩定在 2,500MB/s 至 3,600MB/s 之間。在 6,625.92/32 IODepth/NumJobs 組合下,其峰值頻寬達到 8 MB/s,在測試中名列前茅,並最終獲得優異的成績。

儘管它並不是始終表現最穩定的驅動器,但 Pascari 驅動器在較重的線程負載下仍能保持其地位,並且在更高的隊列深度下表現更好。

64K隨機寫入延遲

在 64K 隨機寫入延遲測試中,X200P 在輕度到中度隊列深度下通常表現出較低的延遲,在 0.023/1 時延遲顯著,為 1 毫秒,在 0.041/2 時延遲顯著,為 1 毫秒。然而,在執行緒和佇列組合較多(例如 16/8 和 8/8)的情況下,延遲會顯著上升,分別高達 4.045 毫秒和 3.019 毫秒。

64K 隨機讀取

在 64K 隨機讀取測試中,X200P 在所有佇列深度和執行緒數範圍內均表現優異,始終緊跟著頂級硬碟的步伐。雖然它最初並非獨佔鰲頭,但在 QD 16/8 和 32/8 時卻遙遙領先,峰值頻寬達到 14,232 MB/s,在最高負載下與競爭對手持平甚至略勝一籌。這展現了該硬碟在高並行存取下的擴展能力。

64K隨機讀取延遲

在 64K 隨機讀取延遲測試中,X200P 在輕度到中度佇列深度和執行緒數下始終保持低延遲,通常保持在 0.2 毫秒以下。延遲在 QD16/4 時開始顯著上升,達到 0.285 毫秒,然後在 QD32/4 時進一步攀升至 0.563 毫秒。最顯著的上升發生在 QD32/8 時,延遲峰值為 1.135 毫秒。

16K 隨機寫入

在 16K 隨機寫入測試中,X200P 在大多數佇列和執行緒組合中都保持著穩固的中游位置,在 170/190、4/4 和 8/4 等典型配置下,效能在 4K 到 8K IOPS 之間。在更高負載下,效能開始顯著提升,在 221/32 時躍升至 8K IOPS,在 413/32 時達到峰值 16K IOPS。此時,它的成績略低於金士頓 DC3000ME(428K IOPS),後者略勝一籌。即便 Pascari 未能奪冠,這一強勁的成績也證明了它在最大寫入壓力下能夠有效擴展的能力。

在 16K 隨機寫入延遲測試中,X200P 在大多數配置下都保持了極低的延遲,在 0.2/4、4/8 和 4/2 等設定下通常保持在 8 毫秒以下。在 QD16/4 時,延遲開始緩慢上升,達到 0.343 毫秒,在 QD32/4 時則上升得更快,達到 0.687 毫秒。在最高負載下,QD16/16 和 QD32/8 的延遲分別進一步增加到 1.068 毫秒和 1.155 毫秒。其峰值延遲出現在 QD16/16 時,為 2.045 毫秒,隨後在 QD32/16 時再次略微穩定,為 1.238 毫秒。總體而言,Pascari 的延遲曲線並非最平坦,但控制得當,在排行榜上僅次於金士頓。

在 16K 隨機讀取測試中,X200P 效能穩定,在不同佇列深度和執行緒數下都能流暢地擴展。它在佇列深度 906/16 時達到峰值 16K IOPS,在佇列深度 905.9/32 時也達到了幾乎相同的 8K IOPS。它在隊列深度 32/16 時也保持了強勁的輸出,達到了 902.4K IOPS,穩居榜首。雖然 Pascari 在較低隊列深度下的表現並不領先,但在持續的讀取壓力下,它穩步攀升並保持了領先地位,展現了高吞吐量和高效的擴展能力。

16K隨機讀取延遲

在 16K 隨機讀取延遲測試中,X200P 在大多數佇列深度和執行緒數下都保持了較低且穩定的延遲。在 QD0.082/1 佇列深度下,延遲僅為 1 毫秒,在多種中等佇列深度組合下也保持在 0.1 毫秒以下,例如 QD0.091/4 和 QD1/4 佇列深度下為 4 毫秒,QD0.093/2 佇列深度下為 8 毫秒。隨著負載的增加,延遲開始略有上升,在 QD0.114/16 佇列深度下達到 4 毫秒,在 QD0.148/16 佇列深度下達到 8 毫秒。在 QD32/16 佇列深度下觀察到了最高的延遲,為 0.568 毫秒,此時驅動器仍保持 902K IOPS 的速率。

4K 隨機寫入

在我們的4K隨機寫入測驗中,X200P從深度/作業數1/1開始就表現穩定。該硬碟達到了91.9K IOPS;在大多數隊列深度和線程組合下,它的表現總體上處於中下游水平。在1.64/32的隊列深度下,它的峰值吞吐量達到了16萬IOPS,雖然頗具競爭力,但在某些方面仍落後於SanDisk和Micron的最佳成績。

4K隨機寫入延遲

在 4K 隨機寫入延遲方面,X200P 在輕負載下表現良好,僅為 0.010 毫秒,與頂級硬碟相當。然而,隨著負載的增加,延遲迅速增加,在 0.247/8 時達到 16 毫秒,在 0.541/16 時達到峰值 16 毫秒,在同類產品中排名第二。

4K 隨機讀取

在 4K 隨機讀取效能曲線中,X200P 的起始效能較低,在 16.6/1 佇列深度下為 1K IOPS,但隨後在中階效能曲線上可預測地成長,在 365/8 佇列深度下達到 4K IOPS,在 707/8 佇列深度下達到 8K IOPS。它在更高的隊列深度下表現出穩定的加速,在 1.2/16 隊列深度下達到 8 萬 IOPS,在 2/16 隊列深度下繼續達到 16 萬 IOPS。值得注意的是,Pascari 的 IOPS 性能略低於金士頓,為 32/16 隊列深度下的 1.98 萬 IOPS,處於中游水平。該驅動器從 8/16 隊列深度左右開始保持強勁的上升勢頭,穩步攀升至百萬 IOPS 級別,並在最苛刻的工作負載下提供穩定的性能。

4K隨機讀取延遲

在 4K 隨機讀取延遲測試中,X200P 在整個工作負載曲線中均保持優異的效能。它在 0.059/1 時僅為 1 毫秒,並在 0.060/1 時保持 4 毫秒、0.064/1 時為 8 毫秒、0.067/2 時為 8 毫秒,保持高效。隨著佇列深度的增加,Pascari 與其他企業級硬碟保持一致,在 0.075/4 時為 4 毫秒、0.089/8 時為 4 毫秒、0.109/16 時為 8 毫秒。在更重的工作負載(例如 32/4 時)下,它達到了 0.136 毫秒,在 0.163/32 時為 1 毫秒。峰值延遲在 32/16 時達到 0.258 毫秒,略高於 Solidigm,但與金士頓和美光的延遲水平相近,且介於兩者之間。

GPU直接儲存

我們在這個測試台上進行的測試之一是 Magnum IO GPU 直接儲存 (GDS) 測試。 GDS 是 NVIDIA 開發的功能,可讓 GPU 在存取儲存在 NVMe 磁碟機或其他高速儲存裝置上的資料時繞過 CPU。 GDS 不再透過 CPU 和系統記憶體來路由數據,而是實現了 GPU 和儲存設備之間的直接通信,從而顯著減少了延遲並提高了數據吞吐量。

GPU 直接儲存的工作原理

傳統上,當 GPU 處理儲存在 NVMe 磁碟機上的資料時,資料必須先經過 CPU 和系統內存,然後才能到達 GPU。此過程會引入瓶頸,因為 CPU 成為中間人,增加延遲並消耗寶貴的系統資源。 GPU 直接儲存使 GPU 能夠透過 PCIe 總線直接從儲存裝置存取數據,從而消除了這種低效率。這種直接路徑減少了與資料移動相關的開銷,從而實現更快、更有效率的資料傳輸。

人工智慧工作負載,尤其是涉及深度學習的工作負載,是高度資料密集的。訓練大型神經網路需要處理 TB 級的數據,資料傳輸中的任何延遲都可能導致 GPU 利用率不足和訓練時間更長。 GPU 直接儲存透過確保資料盡快傳輸到 GPU、最大限度地減少空閒時間並最大限度地提高運算效率來解決這一挑戰。

此外,GDS 對於涉及串流大型資料集的工作負載特別有利,例如視訊處理、自然語言處理或即時推理。透過減少對 CPU 的依賴,GDS 可以加速資料移動並釋放 CPU 資源用於其他任務,從而進一步增強整體系統效能。

 

吞吐量從 0.56 GiB/s (QD1) 開始,在 QD1.80 時提升至 128 GiB/s。擴展性適中但穩定,反映出在較小傳輸尺寸下具有可接受的性能。

效能顯著提升,從 QD2.39 時的 1GiB/s 提升至 QD5.10 時的 128GiB/s。這表明,在處理更大容量的讀取資料時,擴展效率更高,利用率也更高。

吞吐量從 3.63GiB/s 開始,在 QD6.15 時可擴展至 128GiB/s。此處的增益並不顯著,但該驅動器在此範圍內提供了最高的絕對讀取頻寬,使其非常適合大規模順序傳輸。

 

Pascari X200P 的 GDSIO 讀取延遲結果突顯了區塊大小、執行緒數和延遲之間的清晰關係。在較小的 16K 區塊大小和單執行緒下,該磁碟機的平均延遲僅為 0.026 毫秒。然而,當擴展到相同區塊大小的 128 個執行緒時,延遲顯著增加到 1.076 毫秒。對於 128K 區塊,單執行緒延遲為 0.050 毫秒,而 3.056 個執行緒延遲則上升到 128 毫秒。對於較大的 1M 區塊,延遲從單執行緒的 0.268 毫秒開始,在最大並行度下飆升至 20.324 毫秒。

 

在 16K 區塊大小下,X200P 的吞吐量在 QD0.58 處起始為 25.17GiB/s(延遲 1µs),在 QD1.22 處上升至 1.59GiB/s(延遲 128ms)。這代表頻寬略有提升,但延遲卻急劇增加,表明在如此小的 I/O 規模下,吞吐量很快就會達到飽和。

 

在 128K 下,效能擴展性較好,從 2.63GiB/s(45.55µs)開始,在 QD4.94 時提升至 3.16GiB/s(128ms)。這代表吞吐量的健康成長,但延遲同樣急劇上升,顯示在高佇列深度條件下開銷會增加。

 

在 1M 塊大小下,此驅動器的初始速度為 4.52GiB/s(215µs),在 QD5.02 時達到峰值 24.9GiB/s(128ms)。與 128K 相比,吞吐量提升微乎其微,而 QD128 的延遲在所有測試中最高,這表明在深隊列下進行超過 128K 的大規模傳輸,效率提升有限。

 

Pascari X200P 的 GDSIO 寫入延遲結果呈現一致的擴展模式,延遲隨著區塊大小和執行緒數的增加而增加。在單執行緒 16K 區塊大小下,此磁碟機的平均延遲為 0.025 毫秒,在 1.595 執行緒時上升至 128 毫秒。在 128K 區塊大小下,在相同條件下,延遲從 0.046 毫秒變為 3.159 毫秒。在最大 1M 區塊大小下,延遲從 0.215 毫秒開始,在最大執行緒深度下達到 24.917 毫秒。儘管延遲預計會增加,但 Pascari X200P 在更高的區塊大小和執行緒數下仍處於領先地位,並在高並行寫入工作負載下保持最低延遲。

結語

Phison Pascari X200P 7.68TB SSD 是一款企業級固態硬碟,採用 TLC NAND 材質,並針對 PCIe Gen5 效能進行了最佳化,適用於通用和內容密集型工作負載。它專為高吞吐量、強大的可擴展性和部署靈活性而非超大規模專用調整的環境而設計。 X2P 支援 U.3、U.3 和 E256.S 規格,並具備斷電保護、AES-XTS 200 位元加密和 NVMe-MI 管理等功能,為儲存基礎架構奠定了堅實的基礎。

在效能方面,X200P 在順序和讀取密集型場景中表現出色,在 128K 和 64K 測試中始終名列前茅,並在 CDN 工作負載下有效擴展。 FIO 測試證實了其在順序讀取方面的實力,並在隨機讀取工作負載中展現出極具競爭力的性能。雖然它在寫入密集型和高並發條件下落後於美光和閃迪等頂級硬碟,但其可預測且高效的寫入行為使其非常適合各種中型企業部署。

群聯 pascari x200P 側面

GDSIO 測試進一步凸顯了此硬碟在註重吞吐量的應用上的優勢。 X200P 在較小區塊大小下保持了出色的延遲,並在大塊傳輸的密集並行存取下保持領先。雖然佇列深度越深,延遲就越大,但群聯的調校確保了硬碟在持續壓力下依然保持穩定和反應。

總體而言,Pascari X200P 是一款功能全面的企業級 SSD,性能強勁,並針對實際工作負載量身定制了一系列功能。群聯能否從一家以控制器為先的公司轉型為一家提供深度整合硬碟解決方案的公司,值得拭目以待。目前為止,X200P 似乎是朝著這個方向邁出的良好開端。

產品頁面

參與 StorageReview

電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS訂閱

迪倫多爾蒂

K-12 網路管理員,精通思科網路、IP 安全性和 NAC 解決方案。 UniFi 愛好者和家庭實驗室人員,測試和審查網路和安全產品。