StorageReview.com

Phison Pascari X200P SSDレビュー:データセンター向けのバランスの取れたGen5パフォーマンス

Enterprise  ◇  SSD

PhisonのPascari Xシリーズラインナップは、様々なエンタープライズストレージ要件を満たすように開発されており、読み取りと書き込みを集中的に行うワークロード向けにカスタマイズされたソリューションを提供します。X200Pは大容量モデルで、30.72DWPD(Drive Writes Per Day)で最大5TBをサポートします。Gen3 PCIe、TLC NANDを採用し、U.2、U.3、E200.Sフォームファクタで提供されます。XXNUMXPは、大規模コンテンツ配信、AI推論、コールドデータアーカイブなど、幅広いユースケース向けに設計されています。

Phison は、書き込み集中型のワークロード向けに最適化され、最大 200 つの DWPD と 1.6 TB ~ 25.6 TB の容量をサポートする XXNUMXE 高耐久性モデルも提供しており、トランザクション データベース、リアルタイム分析、ログ処理に最適です。

フィソンパスカリ x200P

今回のレビューでは、Phison社から7.68TBのX200P U.2モデルをご提供いただきました。高負荷時におけるパフォーマンスを評価するため、エンタープライズ向けベンチマークテストをフルセットで実施しました。

フィソン パスカリ X200P シリーズ 技術仕様

仕様 Phison Pascari X200Pシリーズ 1.92TB 3.84TB 7.68TB 15.36TB 30.72TB
フォームファクター U.2
インタフェース PCIe 5.0 x4、2×2
NVMe 2.0
NANDフラッシュ 3D TLC
シーケンシャルリード(MB / s) 14,800 14,800 14,800 14,800 14,000年(予定)
シーケンシャルライト(MB / s) 4,300 8,600 8,700 8,350 7,500年(予定)
4Kランダム読み取り(IOPS) 2,400K 3,000K 3,000K 3,000K 2,300K(推定)
4Kランダム書き込み(IOPS) 170K 380K 500K 500K 283K(推定)
読み取りレイテンシ (μs) 60
書き込みレイテンシ(μs) 10
電力 – アクティブ (W) <25
電力 – アイドル時 (W) 5
DWPD(7) 1
UBER 1 あたり 10 セクター未満18 ビット読み取り
MTBF(百万時間) 2.5
限定保証(年) 5
動作温度(°C) 0〜70
非動作温度(°C) -40~85
寸法(mm) 100.10(L)x 69.85(W)x 15.00(H)
重量(g) 188 199 201 168 <250

Pascari X200P 7.68TB の構築と設計

テストユニットは、高性能エンタープライズストレージアプリケーション向けに設計された、7.68TB U.2 2.5インチ版X200Pです。PCIe 5.0インターフェースを搭載し、NVMe 2.0仕様に完全準拠しています。高耐久性3D TLC NANDを搭載し、最大30.72TBの容量をサポートします。

ファイソンパスカリX200Pポート

X200Pは標準的な2.5インチU.2フォームファクターを採用し、寸法は長さ100.10mm、幅69.85mm、高さ15.00mm、重量201グラムです。本体は、パッシブ冷却機能を内蔵した洗練されたブラックのアルミケースに収められており、高負荷の持続的な動作下でも効率的に熱管理を行うように設計されています。また、このドライブはE3.S構成をサポートし、高密度ストレージ環境にも柔軟に対応します。

ファイソンパスカリX200Pバック

パフォーマンス面では、シーケンシャルリード最大14,800MB/秒、シーケンシャルライト最大8,700MB/秒、ランダムリード最大3万IOPS、ランダムライト最大500万IOPSを実現しています。ドライブの消費電力はアクティブ時25W未満、アイドル時わずか5Wに抑えられており、高スループットの持続的な運用に最適な選択肢となります。

耐久性は1 DWPD、MTBFは2.5万時間、5年間の限定保証を備えています。動作温度範囲は24°C~7°Cで、0時間70日稼働のエンタープライズワークロード向けに設計されています。

Phison には、包括的なエンタープライズクラスのデータ保護および管理機能が含まれています。

  • 停電保護(PLP)
  • ISE(Instant Secure Erase)、TCG Opal 2.0 サポート
  • AES-XTS 256ビット暗号化
  • エンドツーエンドのデータパス保護
  • メタデータ保護
  • SECDED(単一誤り訂正二重誤り検出)
  • サニタイズ操作
  • NVMe-MI(管理インターフェース)
  • SMBus互換性
  • 最大128の名前空間をサポート

全体として、Pascari X200P ラインナップは、堅牢な産業グレードのビルド品質と最先端のパフォーマンス、エンタープライズ グレードの信頼性を兼ね備えており、クラウド、AI/ML、仮想化インフラストラクチャなどの要求の厳しいストレージ環境に最適な候補となっています。

性能試験

ドライブテストプラットフォーム

このレビューでは、すべてのワークロードのテストプラットフォームとして、Ubuntu 760 LTSを搭載したDell PowerEdge R22.04.02を使用しています。 シリアルケーブル Gen5 JBOFU.2、E1.S、E3.S、M.2 SSDとの幅広い互換性を提供します。システム構成の概要は次のとおりです。

  • 2 x Intel Xeon Gold 6430 (32 コア、2.1GHz)
  • 16 x 64GB DDR5-4400
  • 480GB デル ボス SSD
  • シリアルケーブル Gen5 JBOF
ドライブの比較

Pascari X200Pと、TLC NANDフラッシュを搭載した同サイズの7.68TB PCIe Gen5 NVMe SSD群との比較を実施しました。比較対象は、Micron 9550、SanDisk SN861、Solidigm PS1010、Kingston DC3000MEです。これらのドライブは、高パフォーマンス環境向けに設計された中容量のエンタープライズクラスソリューションです。テストは、CDN、FIO、GDSIOなど、実環境および合成ベンチマークを用いて実施し、持続スループット、レイテンシ、混合I/Oパターン、GPUアクセラレーションワークロードにおけるパフォーマンスを測定しました。容量、インターフェース、NANDタイプを標準化することで、この評価では、要求の厳しい条件下でのPascari X200Pと同等の性能を明確に比較できます。

CDNパフォーマンス

現実的な混合コンテンツCDNワークロードをシミュレートするため、SSDは、コンテンツ負荷の高いエッジサーバーのI/Oパターンを再現するように設計された多段階のベンチマークシーケンスにかけられました。テスト手順では、大小さまざまなブロックサイズ、ランダムおよびシーケンシャルな操作への分散、そしてさまざまな同時実行レベルが網羅されています。

メインのパフォーマンステストの前に、各SSDは100MBブロックを使用した1%シーケンシャルライトパスでデバイス全体の書き込みを完了しました。このプロセスでは、同期I/Oとキュー深度128を使用し、98.51つのジョブを同時に実行できるようにしました。このフェーズにより、ドライブは実際の使用状況を反映した定常状態になります。シーケンシャルフィルの後、重み付けブロックサイズ分割(ブロックサイズ/パーセンテージ)を用いて、128時間のランダム書き込み飽和ステージを実行しました。このステージでは、8K転送を優先(XNUMX%)し、XNUMXK未満のブロックからXNUMXKまでの転送をわずかに含ませました。このステップは、分散キャッシュ環境でよく見られる断片化された不均一な書き込みパターンをエミュレートします。

メインのテストスイートは、スケールされたランダム読み取りおよび書き込み操作に焦点を当て、キュー深度とジョブの同時実行数を変化させた際のドライブの動作を測定しました。各テストは300分間(XNUMX秒)実行され、その後XNUMX分間のアイドル期間が設けられ、内部回復メカニズムによってパフォーマンス指標が安定しました。

  • 128K(98.51%)を優先する固定ブロックサイズ配分で実行し、残りの1.49%の操作は64Kから8Kまでの小さな転送サイズで構成されました。各構成は、1、2、4の同時ジョブ数、キュー深度1、2、4、8、16、32で変化させ、典型的なエッジ書き込み環境におけるスループットのスケーラビリティとレイテンシをプロファイリングしました。
  • CDNコンテンツ取得を模倣した、非常に混合されたブロックサイズプロファイルが使用されました。128KB(83.21%)の主要コンポーネントから始まり、30KBから4KBまでの124以上の小さなブロックサイズがロングテールで続き、それぞれが分数頻度で表現されています。この分布は、ビデオセグメントの取得、サムネイルへのアクセス、メタデータの検索中に発生する多様なリクエストパターンを反映しています。これらのテストは、ジョブ数とキューの深さのマトリックス全体にわたって実行されました。

この事前調整、飽和、および混合サイズのランダム化アクセス テストの組み合わせは、帯域幅が広く、高度に並列化されたシナリオでの応答性と効率性を重視しながら、SSD が持続的な CDN のような環境をどのように処理するかを明らかにするように設計されています。

CDN ワークロード読み取り 1

軽いコンテンツ配信トラフィックをシミュレートしたこのシングルジョブ読み取りテストでは、Pascari X200PはQD1で765MB/秒、QD2で1,403MB/秒と、最下位からスタートしました。キュー深度が増加するにつれてドライブは効率的にスケーリングし、QD8、QD16を経て中間層に到達しました。QD32ではX200Pは13,516.8MB/秒に達し、Kingston DC3000MEとMicron 9550に次ぐ総合861位となりました。一方、最高速度ではSanDisk SN1010とSolidigm PSXNUMXを上回りました。

CDN ワークロード読み取り 2

200つのジョブを適用した状態では、Pascari X1PはQD1,519で2MB/秒と最下位からスタートしますが、キュー深度が増加するにつれて着実に速度が向上します。QD4、QD8でも速度は向上し続け、QD32では上位との差を縮めます。QD200では、Pascari X15,257.6Pは9550MB/秒で総合3000位となり、Micron 1010、Kingston DC861ME、Solidigm PSXNUMX、SanDisk SNXNUMXを上回りました。

CDN ワークロード読み取り 4

200つのジョブを適用した状態でも、Pascari X2,982Pはキュー深度全体にわたって力強いスケーリングを示しました。ドライブはQD1で最大速度2MB/秒を達成し、テストしたすべてのドライブに遅れをとりましたが、QD4およびQD8では着実に速度を伸ばしました。QD200ではX16Pはトップに立ち始め、QD32およびQD200でもそのリードを維持しました。Pascari X32PはQD15,257.6で9550MB/秒を記録し、Micron 3000とKingston DCXNUMXMEを上回り、総合XNUMX位となりました。

CDN ワークロード書き込み 1

CDN書き込みに移り、200ジョブを適用した状態では、Pascari X1,885Pは書き込みテストで他を圧倒しています。QD1で最大速度32MB/秒を達成し、QD5,913まで徐々に速度が上昇し、最終的に861MB/秒で総合9550位となりました。このグループではSanDisk SN3000とMicron 200がトップに立ち、Kingston DC4MEがそれに続きます。Pascari XXNUMXPは安定した速度でXNUMX位を維持していますが、この低スレッド数シナリオでは書き込みパフォーマンスはそれほどアグレッシブではありません。

200つのジョブを適用した状態で、Pascari X2,762PはCDN書き込みテストで総合1位となりました。QD16で最大速度32MB/秒を達成し、QD4,585まで速度は向上しますが、QD9550で速度が若干低下し、最終的に最大速度861MB/秒に達します。このテストではMicron 3000とSanDisk SN200がリードし、Kingston DCXNUMXMEがそれに続きます。XXNUMXPはキューの深さが中程度まで安定したパフォーマンスを維持しますが、このXNUMXスレッド書き込みワークロードでは上位に遅れをとります。

200つのジョブを適用した状態で、Pascari X2,845PはCDN書き込みテストの大部分で中位のパフォーマンスを維持しました。QD1では最大スループット3000MB/秒を達成し、中程度のキュー深度ではKingston DC1010MEやSolidigm PS32と互角の性能を維持しました。QD200ではX3,613Pはわずかに低下し、9550MB/秒で総合861位となりました。Micron 3000とSanDisk SN200がトップに立ち、Kingston DCXNUMXMEはXNUMX位を維持しました。XXNUMXPは、このXNUMXスレッドワークロードにおいて、中程度の負荷では安定した書き込みスケーリングを実現していますが、キュー深度が深くなると限界が見られます。

DLIO チェックポイント ベンチマーク

AIトレーニング環境におけるSSDの実世界パフォーマンスを評価するために、DLIO(Data and Learning Input/Output)ベンチマークツールを使用しました。アルゴンヌ国立研究所が開発したDLIOは、ディープラーニングワークロードのI/Oパターンをテストするために特別に設計されています。ストレージシステムがチェックポイント、データの取り込み、モデルトレーニングといった課題にどのように対処するかについての洞察を提供します。下のグラフは、両方のドライブが36のチェックポイントにわたってプロセスをどのように処理するかを示しています。機械学習モデルのトレーニングでは、モデルの状態を定期的に保存し、中断や停電時の進行状況の損失を防ぐために、チェックポイントが不可欠です。このストレージ需要には、特に持続的または集中的なワークロードにおいて、堅牢なパフォーマンスが求められます。2.0年13月2024日リリースのDLIOベンチマークバージョンXNUMXを使用しました。

ベンチマークが現実世界のシナリオを反映したものであることを確認するため、LLAMA 3.1 405B モデルアーキテクチャに基づいてテストを実施しました。モデルパラメータ、オプティマイザーの状態、およびレイヤーの状態を取得するために、torch.save() を用いたチェックポイント処理を実装しました。このセットアップでは、4GPU システムをシミュレートし、2 ウェイテンソル並列処理と 1,636 ウェイパイプライン並列処理を XNUMX つの GPU に分散させたハイブリッド並列処理戦略を実装しました。この構成では、チェックポイントのサイズは XNUMXGB となり、これは現代の大規模言語モデルのトレーニング要件に相当します。

DLIOチェックポイントベンチマークでは、Pascari X200P SSDは初期応答性に優れていますが、ワークロードが増加するにつれてチェックポイント時間が長くなります。初期のパス(チェックポイント1~4)では、X200Pは平均467秒と他のドライブとほぼ同等の性能を示し、Solidigm PS1010やMicron 9550などのドライブとほぼ同等の速度を維持しています。

しかし、ベンチマークの中間点(チェックポイント5~9)では、X200Pのパフォーマンスに乖離が生じ始めます。ドライブのチェックポイント時間は急激に増加し、チェックポイント689.68では12秒に達し、グループ内で最も長い時間となりました。最後の200つのチェックポイントでは、X672Pの平均時間は19.3秒で、次に遅いドライブ(Kingston DC3000ME)よりも約23%遅く、グループ平均よりもXNUMX%遅くなっています。

パス平均の観点から見ると、X200Pは時間の経過とともにパフォーマンスが明らかに低下していることがわかります。パス1では平均467.93秒を記録し、他のドライブよりわずかに遅れをとりましたが、それでも競争力のある範囲内でした。

パス2では、X200Pはグループから大きく乖離し、662.04秒を記録しました。これは、次に遅いドライブ(Kingston DC14.5ME)よりも3000%遅く、そのパスにおけるグループ平均よりも17.4%遅い結果となりました。この傾向はパス3でも続き、674.48秒を記録し、最遅ドライブの座を維持しました。他の567つのドライブの平均(約200秒)と比較すると、X18.9PはXNUMX%遅い結果となりました。

FIOパフォーマンスベンチマーク

各SSDのストレージパフォーマンスを業界標準の指標に基づいて測定するために、FIOを活用しています。各ドライブは同一のテストプロセスでテストされます。このプロセスには、シーケンシャルライトワークロードでドライブを2回フルフィルする前処理ステップと、その後の定常パフォーマンス測定が含まれます。測定対象のワークロードの種類が変化するたびに、新しい転送サイズで前処理フィルを再度実行します。

このセクションでは、次の FIO ベンチマークに焦点を当てます。

  • 128Kシーケンシャル
  • 64Kランダム
  • 16Kランダム
  • 4Kランダム

128K シーケンシャル前提条件 (IODepth 256 / NumJobs 1)

128Kシーケンシャル書き込みプリコンディションテストでは、X200Pは平均帯域幅8,371MB/秒で総合9550位につけました。優れたパフォーマンスを維持している一方で、帯域幅にはわずかな変動が見られ、上位のMicron 3000やKingston DCXNUMXMEのより平坦で安定したパフォーマンスと比較すると、一貫性に欠けることがわかります。

128K シーケンシャル前提条件レイテンシ (IODepth 256 / NumJobs 1)

128Kシーケンシャル書き込みプリコンディションレイテンシテストにおいて、X200Pの平均レイテンシは3.822msで、総合9550位となりました。Micron 3000とKingston DCXNUMXMEに次ぐ結果です。帯域幅パターンと同様に、Pascariはレイテンシの変動が緩やかで、連続書き込み時に多少の変動が見られるものの、上位層で高いパフォーマンスを維持しています。

128K シーケンシャル書き込み (IODepth 16 / NumJobs 1)

128Kシーケンシャル書き込みテストでは、X200Pは平均帯域幅8369.7MB/秒を達成し、総合9550位となりました。Micron 3000とKingston DC1010MEには及ばないものの、Solidigm PS861とSanDisk SNXNUMXには及びません。

128K シーケンシャル書き込みレイテンシ (IODepth 16 / NumJobs 1)

128Kシーケンシャル書き込みテストのレイテンシチャートにおいて、X200Pは平均レイテンシ0.238ミリ秒を記録しました。これは総合3000位で、Kingston DC0.235ME(1010ミリ秒)にわずかに及ばず、Solidigm PS861とSanDisk SN9550を上回っています。レイテンシはほとんどの製品よりも低いものの、最高性能のMicron XNUMXには及ばない結果となっています。

128K シーケンシャル読み取り (IODepth 64 / NumJobs 1)

128Kシーケンシャルリードテストでは、X200Pが14,242.1MB/秒の帯域幅で総合1010位を獲得し、Solidigm PS9550とMicron XNUMXを僅差で上回りました。読み取りスループットではトップクラスで、高いキュー深度でも優れたパフォーマンスを発揮しました。

128K シーケンシャル読み取りレイテンシ (IODepth 64 / NumJobs 1)

128Kシーケンシャルリードテストのレイテンシチャートでは、X200Pは平均レイテンシ561.4msを記録し、総合レイテンシでは1010位となりました。Solidigm PS9550にはわずかに及ばないものの、Micron 3000、Kingston DC861ME、SanDisk SNXNUMXよりも優れたパフォーマンスを発揮しています。

64Kランダム書き込み

64Kランダム書き込みテストでは、X200Pは全体的に中位のパフォーマンスを示しましたが、キュー深度とスレッドの組み合わせによって多少の変動が見られました。このドライブは特定の範囲で結果を出すわけではありませんが、テストセットの大部分において2,500MB/秒から3,600MB/秒の間で概ね安定したパフォーマンスを維持しました。ピーク帯域幅は、IODepth/NumJobsが6,625.92/32の組み合わせで8MB/秒に達し、これはテスト中最高値の一つであり、好成績を収めました。

Pascari ドライブは、全体的に最も安定したパフォーマンスを発揮するわけではありませんが、重いスレッド負荷でも安定したパフォーマンスを発揮し、キューの深さが増すほどパフォーマンスが向上します。

64Kランダム書き込みレイテンシ

64Kランダム書き込みレイテンシテストにおいて、X200Pは低~中程度のキュー深度で概ね低いレイテンシを示し、0.023/1で1ms、0.041/2で1msという優れた値を示しています。しかし、16/8や8/8といったより重いスレッドとキューの組み合わせでは、レイテンシが大幅に上昇し、それぞれ4.045msと3.019msに達します。

64Kランダム読み取り

64Kランダムリードテストでは、X200Pはキュー深度とスレッド数の全範囲において一貫して優れたパフォーマンスを発揮し、上位ドライブにほぼ匹敵するパフォーマンスを示しました。当初はトップの座を獲得することはできませんでしたが、QD 16/8および32/8ではリードを獲得し、ピーク帯域幅は14,232MB/秒に達し、高負荷時には競合製品と互角、あるいは上回りました。これは、このドライブが高負荷の並列アクセス下でも優れた拡張性を発揮することを示しています。

64Kランダム読み取りレイテンシ

64Kランダムリードレイテンシテストにおいて、X200Pはキュー深度とスレッド数が低~中程度の範囲で常に低いレイテンシを維持し、通常は0.2ミリ秒未満を維持しました。レイテンシはQD16/4でより顕著に上昇し始め、0.285ミリ秒に達し、QD32/4ではさらに上昇して0.563ミリ秒に達します。最も顕著な増加はQD32/8で発生し、レイテンシは1.135ミリ秒でピークに達しました。

16Kランダム書き込み

16Kランダム書き込みテストでは、X200Pはほとんどのキューとスレッドの組み合わせにおいて中堅クラスの堅調なパフォーマンスを維持し、170/190、4/4、8/4といった標準的な構成で4万~8万IOPSを実現しました。負荷が大きくなるにつれてパフォーマンスは顕著に向上し、221/32では8万413千IOPS、32/16では3000万428千IOPSに達します。この時点で、XXNUMXPはわずかにリードするKingston DCXNUMXME(XNUMX万XNUMX千IOPS)のすぐ下となりました。この好成績は、Pascariがトップの座を獲得することはなかったものの、最大書き込み負荷下でも効果的にスケーリングできる能力を実証しています。

16K ランダム書き込みレイテンシ テストでは、X200P はほとんどの構成で非常に低いレイテンシを維持しており、通常、0.2/4、4/8、4/2 などの設定で 8 ミリ秒未満にとどまります。QD16/4 で中程度に上昇し、0.343 ミリ秒に達し、QD32/4 ではさらに急激に上昇し、0.687 ミリ秒に達します。最高負荷では、QD16/16 と QD32/8 でレイテンシがさらに増加し​​、それぞれ 1.068 ミリ秒と 1.155 ミリ秒になります。レイテンシのピークは QD16/16 で 2.045 ミリ秒に達し、その後 QD32/16 で 1.238 ミリ秒でわずかに落ち着きます。全体的に、Pascari のレイテンシ カーブは最も平坦ではありませんが、適度な制御を維持しており、チャートのトップで Kingston にわずかに次ぐ位置にあります。

16Kランダムリードテストにおいて、X200Pは安定したパフォーマンスを発揮し、キュー深度とスレッド数に関わらずスムーズにスケーリングしました。QD906/16では16K IOPSを記録し、QD905.9/32でもほぼ同等の8K IOPSを記録しました。QD32/16でも902.4K IOPSと高いパフォーマンスを維持し、トップグループに確固たる地位を築いています。低いキュー深度ではリードこそ獲得していませんが、Pascariは着実にパフォーマンスを向上させ、継続的な読み取り負荷下でトップクラスの地位を維持しており、高いスループットと効果的なスケーリングの両方を実現しています。

16Kランダム読み取りレイテンシ

16Kランダムリードレイテンシテストにおいて、X200Pはほとんどのキュー深度とスレッド数において、低く安定したレイテンシを維持しました。QD0.082/1ではわずか1msから始まり、多くの中間レンジの組み合わせでも0.1ms未満を維持しました。QD0.091/4とQD1/4では4ms、QD0.093/2では8msでした。負荷が増加するとレイテンシはわずかに上昇し、QD0.114/16では4ms、QD0.148/16では8msに達しました。レイテンシが最も高かったのはQD32/16で0.568msでしたが、それでもドライブは902K IOPSを維持しました。

4Kランダム書き込み

4Kランダム書き込みテストでは、X200Pは深さ/ジョブ数1/1から安定した結果を示しました。ドライブは91.9K IOPSを達成し、ほとんどのキュー深度とスレッドの組み合わせにおいて、概ね中位から下位に位置しました。ピークスループットは1.64/32で16万IOPSに達し、競争力はありましたが、特定の条件ではSanDiskとMicronの最高値に及ばない結果となりました。

4Kランダム書き込みレイテンシ

4Kランダム書き込みレイテンシにおいて、X200Pは軽いワークロードでは優れたパフォーマンスを発揮し、わずか0.010ミリ秒でトップクラスのドライブに匹敵しました。しかし、負荷が大きくなるとレイテンシは急速に増加し、0.247/8では16ミリ秒、0.541/16では16ミリ秒に達し、グループ内でXNUMX番目に高い値となりました。

4Kランダム読み取り

4Kランダム読み取り性能曲線において、X200Pは16.6/1で1K IOPSと低速域からスタートしますが、中間域では予想通りの速度で成長し、365/8で4K IOPS、707/8で8K IOPSを記録します。キュー深度が深くなるにつれて着実に加速し、1.2/16で8万IOPS、2/16で16万IOPSに達します。注目すべきは、PascariがKingstonのすぐ下で32/16の1.98万IOPSを記録し、中位に位置していることです。このドライブは8/16あたりから力強い上昇傾向を維持し、着実にXNUMX万IOPSレベルに到達し、最も要求の厳しいワークロードでも安定したパフォーマンスを発揮します。

4Kランダム読み取りレイテンシ

4Kランダム読み取りレイテンシテストでは、X200Pはワークロードカーブ全体を通して競争力のあるパフォーマンスを維持しました。0.059/1ではわずか1ミリ秒から始まり、0.060/1では4ミリ秒、0.064/1では8ミリ秒、0.067/2では8ミリ秒と、効率的なパフォーマンスを維持しました。キュー深度が増加すると、Pascariは他のエンタープライズドライブと同等の性能を維持し、0.075/4では4ミリ秒、0.089/8では4ミリ秒、0.109/16では8ミリ秒を記録しました。32/4のようなより高負荷なワークロードでは、0.136ミリ秒、0.163/32では1ミリ秒に達しました。レイテンシのピークは32/16で0.258ミリ秒に達し、Soldigmをわずかに上回りましたが、KingstonとMicronの中間値で、同等でした。

GPUダイレクトストレージ

このテストベンチで実施したテストの 1 つは、Magnum IO GPU Direct Storage (GDS) テストでした。GDS は NVIDIA が開発した機能で、NVMe ドライブやその他の高速ストレージ デバイスに保存されているデータにアクセスするときに GPU が CPU をバイパスできるようにします。GDS は、CPU とシステム メモリを介してデータをルーティングする代わりに、GPU とストレージ デバイス間の直接通信を可能にし、レイテンシを大幅に削減し、データ スループットを向上させます。

GPUダイレクトストレージの仕組み

従来、GPU が NVMe ドライブに保存されたデータを処理する場合、データは GPU に到達する前にまず CPU とシステム メモリを通過する必要があります。このプロセスでは、CPU が仲介役となり、遅延が増加し、貴重なシステム リソースが消費されるため、ボトルネックが発生します。GPU ダイレクト ストレージは、GPU が PCIe バスを介してストレージ デバイスから直接データにアクセスできるようにすることで、この非効率性を解消します。この直接パスにより、データ移動に関連するオーバーヘッドが削減され、より高速で効率的なデータ転送が可能になります。

AI ワークロード、特にディープラーニングを伴うワークロードは、非常にデータ集約的です。大規模なニューラル ネットワークのトレーニングにはテラバイト単位のデータ処理が必要であり、データ転送の遅延は GPU を十分に活用できず、トレーニング時間が長くなる可能性があります。GPU ダイレクト ストレージは、データが可能な限り迅速に GPU に配信され、アイドル時間を最小限に抑え、計算効率を最大化することで、この課題に対処します。

さらに、GDS は、ビデオ処理、自然言語処理、リアルタイム推論など、大規模なデータセットのストリーミングを伴うワークロードに特に役立ちます。CPU への依存度を下げることで、GDS はデータの移動を高速化し、CPU リソースを他のタスクに解放して、システム全体のパフォーマンスをさらに向上させます。

 

スループットは0.56 GiB/秒(QD1)から始まり、QD1.80では128 GiB/秒まで増加します。スケーリングは控えめですが安定しており、小さな転送サイズでも許容できるパフォーマンスを示しています。

パフォーマンスはQD2.39では1GiB/秒でしたが、QD5.10では128GiB/秒と大幅に向上しました。これは、ドライブがより大きな読み取りを処理するにつれて、スケーリング効率が向上し、使用率が大幅に向上していることを示しています。

スループットは3.63GiB/秒から始まり、QD6.15では128GiB/秒まで拡張できます。この範囲では劇的な向上は見られませんが、このドライブはこの範囲で最高の絶対読み取り帯域幅を実現しており、大規模なシーケンシャル転送に最適です。

 

Pascari X200PのGDSIO読み取りレイテンシの結果は、ブロックサイズ、スレッド数、そしてレイテンシの間に明確な関係があることを浮き彫りにしています。16Kブロックサイズでシングルスレッドの場合、ドライブの平均レイテンシはわずか0.026ミリ秒です。しかし、同じブロックサイズで128スレッドに拡張すると、レイテンシは1.076ミリ秒へと大幅に増加します。128Kブロックの場合、0.050スレッドでレイテンシは3.056ミリ秒ですが、128スレッドでは1ミリ秒にまで増加します。0.268MBブロックの場合、レイテンシはシングルスレッドで20.324ミリ秒から始まり、最大並列処理ではXNUMXミリ秒にまで急上昇します。

 

16Kブロックサイズでは、X200PのスループットはQD0.58で25.17GiB/秒(レイテンシ1マイクロ秒)から始まり、QD1.22では1.59GiB/秒(レイテンシ128ミリ秒)まで上昇します。これは帯域幅のわずかな増加を表していますが、レイテンシが急激に増加するため、この小さなI/Oサイズでは早期に飽和状態に達する可能性があります。

 

128Kではパフォーマンスのスケーラビリティが向上し、2.63GiB/秒(45.55マイクロ秒)から始まり、QD4.94では3.16GiB/秒(128ミリ秒)まで向上します。これはスループットの健全な向上を示していますが、レイテンシも急激に増加しており、キュー深度が高い状況ではオーバーヘッドが増加することを示しています。

 

1MBのブロックサイズでは、ドライブは4.52GiB/秒(215µs)と力強いスタートを切り、QD5.02では24.9GiB/秒(128ms)のピークに達します。128Kと比較してスループットの向上はわずかで、QD128でのレイテンシは全テストの中で最も高く、ディープキューでの128Kを超える大容量転送による効率向上は限定的であることを示しています。

 

Pascari X200PのGDSIO書き込みレイテンシの結果は、ブロックサイズとスレッド数の増加に伴ってレイテンシが増加するという一貫したスケーリングパターンを示しています。ブロックサイズが16Kでスレッド数が0.025つの場合、ドライブの平均レイテンシは1.595ミリ秒で、スレッド数が128になると128ミリ秒に上昇します。ブロック数が0.046Kの場合、同じ条件でレイテンシは3.159ミリ秒から1ミリ秒に増加します。最大ブロックサイズである0.215MBでは、レイテンシは24.917ミリ秒から始まり、最大スレッド深度で200ミリ秒に達します。レイテンシの上昇は予想通りでしたが、Pascari XXNUMXPは高ブロックサイズと高スレッド数においてグループをリードし、高負荷の並列書き込みワークロードにおいても最低レイテンシを維持しています。

結論

Phison Pascari X200P 7.68TB SSDは、TLC NANDを搭載し、PCIe Gen5のパフォーマンスに最適化され、汎用ワークロードやコンテンツ中心のワークロードに最適なエンタープライズグレードのドライブです。ハイパースケール特有のチューニングよりも、高スループット、強力な拡張性、導入の柔軟性が優先される環境向けに設計されています。U.2、U.3、E3.Sフォームファクターをサポートし、停電保護、AES-XTS 256ビット暗号化、NVMe-MI管理などの機能を備えたX200Pは、ストレージインフラストラクチャの強固な基盤を提供します。

パフォーマンス面では、X200Pはシーケンシャルリードとリードインテンシティの高いシナリオで優れた性能を発揮し、128Kおよび64Kテストで常に上位にランクインし、CDNワークロードにおいても効果的にスケーリングします。FIOテストでは、シーケンシャルリードにおける強さが確認され、ランダムリードワークロード全体でも競争力のあるパフォーマンスを示しています。書き込みインテンシティの高い、かつ高度な同時実行環境においては、MicronやSanDiskといったトップクラスのドライブに劣るものの、予測可能で効率的な書き込み動作により、幅広いミッドティアエンタープライズ環境に適しています。

フィソンパスカリx200Pサイド

GDSIOテストは、スループット重視のアプリケーションにおけるこのドライブの強みをさらに際立たせています。X200Pは、小さなブロックサイズでは優れたレイテンシを維持し、大きなブロック転送を伴う高負荷の並列アクセスにおいてもリードしています。キューの深度が深くなるとレイテンシは増加しますが、Phisonのチューニングにより、ドライブは継続的な負荷下でも安定性と応答性を維持します。

総じて、Pascari X200Pは、強力なパフォーマンスと実世界のワークロードに最適な機能を備えた、バランスの取れたエンタープライズSSDです。Phisonがコントローラー中心の企業から、幅広い統合ドライブソリューションを提供する企業へと転換できるかどうか、今後の動向に注目が​​集まります。今のところ、X200Pはその方向性に向けた有望なスタートを切っているように見えます。

商品ページへ

StorageReview と連携する

ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード

ディラン・ドハティ

Cisco ネットワーキング、IP セキュリティ、NAC ソリューションの専門知識を持つ K-12 ネットワーク管理者。ネットワークおよびセキュリティ製品のテストとレビューを行う UniFi 愛好家およびホーム ラボ担当者。