StorageReview.com

Solidigm 122.88TB D5-P5336レビュー:大容量ストレージと運用効率の融合

Enterprise  ◇  SSD

現代のデータセンターでは、ラックスペースの5インチ、消費電力の5336ワットが運用効率とコストに直接影響するため、密度はこれまで以上に重要になっています。SolidigmのD122.88-P2 XNUMXTB SSDは、この課題に対する魅力的なソリューションとして登場し、驚異的な容量を単一のU.XNUMXドライブに凝縮し、SSDストレージ密度の新たなベンチマークを確立しました。

この比類のないストレージ密度は、物理インフラの効率化だけでなく、ラックスペース要件の大幅な削減と全体的なエネルギー効率の向上により、データセンター設計の可能性を変革します。データセンターがAIワークロード、コンテンツ配信、オブジェクトストレージの高まる需要と、持続可能性とコストのプレッシャーとのバランスをますます取るようになる中、Solidigm D5-P5336のようなドライブは、単なる技術の進歩ではなく、エンタープライズストレージ戦略における重要な進化を象徴しています。

こうした導入は既に始まっており、サーバーおよびストレージベンダーは、顧客のストレージ効率に対する要望に応えるため、大容量ドライブの認定を迅速に行っています。例えば、Dell Technologiesはすでに PowerScaleラインの122.88TBドライブ ストレージアレイの パワーエッジ R7725xdこれらの大容量ドライブにより、約 3PB の容量を収容できます。

今回のレビューでは、そこまでの規模には達しません。レポートにはドライブが122.88台しか使用されていないためです。とはいえ、今回のワークロードでは、このドライブが、最新のAIアプリケーションをサポートするように設計されたものを含む、様々なエンタープライズワークロードにおいて優れた性能を発揮する点を実証します。122TB SSDの活用に少し工夫を凝らしたいという方は、今年初めにSolidigm 5TB D5336-PXNUMXを独自のエッジAI展開で検証しました。 NVIDIA Jetson Orin Nano スーパー.

本題に入る前に最後に一言。122.88TB P5336 が何であるか、何ではないかを理解することが重要です。この発売は、2023年半ばに発売されたドライブ ファミリーの拡張版です。Solidigm は、エンタープライズ ユース ケース向けに QLC ストレージをいち早く商品化した企業の 122.88 つであり、この独自の組み合わせのメリットを享受できるワークロードに、密度、コスト効率、優れた読み取りパフォーマンス、そして十分なパフォーマンスをもたらしました。それ以来、業界は Solidigm の容量リーダーシップに追いつこうと急いできました。しかし、ドライブ構成やフォーム ファクターの多様性により、状況はやや複雑になっています。Solidigm 4TB ドライブは、U.2 フォーム ファクターの Gen1 モデルのままですが (EXNUMX.L でも利用可能)、魅力的な TB/$ 比で大容量を提供するように設計されています。

ビルドとデザイン

Solidigm D5-P5336 122.88TBは、以前のものと同じコアアーキテクチャを維持しています。 61.44TBモデルをレビュー192層QLC NANDを採用しています。この一貫性により、スケールアウト展開において重要な、予測可能なパフォーマンス、熱挙動、そして容量間のインターフェース互換性が確保されます。32TBのD16-P61は、122KBのI/Oユニット(5TB版では5336KB)を搭載し、オブジェクトストレージやAIデータパイプラインで一般的に見られる中規模I/Oパターンに最適化されています。この設計により、効率性を維持しながら、ワークロードの柔軟性が向上します。

このモデルの特徴は、122.88TBという大容量で、物理的なスペースを増やすことなくストレージ容量を倍増できます。標準の2.5インチU.2 15mmフォームファクターに加え、E3.S 7.5mmおよびE1.L 9.5mm構成も提供しており、多様なハイパースケールのニーズに対応します。PCIe Gen4 x4 NVMeインターフェースを採用し、最大7GB/秒のシーケンシャルリードスループットと最大3GB/秒のライトスループットを実現します。PCIe Gen5は採用していませんが、Gen4はD5-P5336がターゲットとするAIパイプライン、コンテンツ配信、オブジェクトストレージなど、リードインテンシブなワークロードに十分な帯域幅を提供します。

パフォーマンスの観点から見ると、このドライブはランダム読み取り(900,000K、QD4)で最大256 IOPS、ランダム書き込み(19,000K、QD16)で最大256 IOPSを実現します。読み取りレイテンシは110マイクロ秒(4K)、書き込みレイテンシは40マイクロ秒(32K)です。シーケンシャルアクセスレイテンシはさらに低く、読み取りは8マイクロ秒(4K)、書き込みは21マイクロ秒(32K)で、大規模環境でも非常に応答性の高い動作を実現します。

122TBのP5336を従来の61TBドライブと比較すると、大容量SSDの書き込みパフォーマンスは低下しています。128Kのシーケンシャル転送は3GB/秒から3.3GB/秒に低下し、16Kのランダム書き込みパフォーマンスはさらに大幅に低下し、43K IOPSからわずか19K IOPSに低下しています。評価を進める上で重要なのは、特定のワークロードがシーケンシャルまたはランダム転送パフォーマンスの点でドライブに負荷をかけると、容量の違いが生じることです。

このドライブには、SK hynix製のDRAMキャッシュと停電保護コンデンサが搭載されています。これらのコンポーネントは、エンタープライズ規模の環境で必須となる、予期せぬ電源障害発生時における信頼性の高いバッファリングとデータ保護を実現します。ドライブの信頼性は、平均故障間隔(MTBF)が100万時間、回復不能ビットエラー率がXNUMX京ビットあたりXNUMXビット未満という高い水準を誇ります。

組織は SSD の全体的な寿命、特に長年の使用における書き込み回数に関心を持っています。Solidigm D5-P5336 の耐久性評価は、0.6K のランダム書き込みワークロードに基づいて 32 ドライブ書き込み/日 (DWPD) であり、これは保証期間中の 134.3 ペタバイト書き込み (PBW) に相当します。Solidigm の 122 TB D5-P5336 SSD は、24 年間の 7 時間 32 日の連続動作向けに設計されており、耐久性の新たなベンチマークを打ち立てます。この SSD は、5 年後も耐久性の 4% を維持する 12KB のランダム書き込み、または 0.60% の耐久性を残す XNUMXK のランダム書き込みのいずれかを処理できます。XNUMX 日あたりのドライブ書き込み (DWPD) 評価は XNUMX を維持していますが、NAND 容量の増加により、継続的なワークロードをより効果的にサポートできます。

このドライブはパッシブ冷却方式で、堅牢なアルミニウムケースに収められています。アクティブ時24ワット、アイドル時5ワットという控えめな消費電力で動作するため、既存のインフラストラクチャに容易に統合できます。重量は約166.4グラムで、動作温度範囲は0~70℃、最大2.17GRMSの耐振動性、最大1,000Gの耐衝撃性を備え、XNUMX年間の保証が付いています。密度、効率性、ラック統合を重視する環境向けに設計されており、使い慣れたエンタープライズ向けフォームファクターで大容量を実現します。

Solidigm D5-P5336 シリーズ (122.88TB) の仕様

仕様の概要 Solidigm D5-P5336 シリーズ (122.88TB)
容量 122.88TB
フォームファクター U.2 15mmまたはE1.L 9.5mm
インタフェース PCIe 4.0 x4、NVMe
Use Case サーバー / エンタープライズ
シーケンシャルリード 7000MB /秒
シーケンシャルライト 3000MB /秒
ランダム読み取り(IOPS) 900,000万(4K、QD256)
ランダム書き込み(IOPS) 19,000万(16K、QD256)
レイテンシ (読み取り/書き込み) 読み取り: 110μs (4K) / 書き込み: 40μs (32K)
シーケンシャルレイテンシ(標準) 読み取り: 8μs (4K) / 書き込み: 21μs (32K)
電源(アクティブ/アイドル) アクティブ: 24W / アイドル: 5W
耐久性 0.6 DWPD (32K RW) / 134.3 PBW
MTBF 2百万時間
UBER 1 ビット読み取りあたり 10 セクター未満
動作温度 0 ℃〜70 ℃
振動/衝撃 2.17 GRMS(動作時)、1,000 G(衝撃時)
保証 創業5周年
重量 166.4g±10g

性能試験

ドライブテストプラットフォーム

このレビューでは、すべてのワークロードのテストプラットフォームとして、Ubuntu 760 LTSを搭載したDell PowerEdge R22.04.02を使用しています。 シリアルケーブル Gen5 JBOFU.2、E1.S、E3.S、M.2 SSDとの幅広い互換性を提供します。システム構成の概要は次のとおりです。

  • 2 x Intel Xeon Gold 6430 (32 コア、2.1GHz)
  • 16 x 64GB DDR5-4400
  • 480GB デル ボス SSD
  • シリアルケーブル Gen5 JBOF
ドライブの比較

冒頭で述べたように、大容量エンタープライズドライブ市場は複雑で、様々なフォームファクター、NANDタイプ、そしてコストパフォーマンスを考慮する必要があります。本レビューでは、122.88TBのSolidigm P5336と比較するSSDをいくつか用意しました。これには、より小型の61.44TBのSolidigm P5336と、61.44TBのMicron 6550が含まれます。

Micron 6550は、Gen5およびTLCベースという点で他に類を見ない製品であり、この容量レベルで生産されている数少ない製品の一つです。Micronドライブは、より高速なI/O速度という利点を備えています。

パフォーマンス結果を確認する際には、この段階分けを理解することが不可欠です。導入においては、これらのドライブは直接競合することはありませんが、提供する容量は重複しています。スケールの参考として、このレビューではMicronドライブも含めました。

CDNパフォーマンス

現実的な混合コンテンツCDNワークロードをシミュレートするため、SSDは、コンテンツ負荷の高いエッジサーバーのI/Oパターンを再現するように設計された多段階のベンチマークシーケンスにかけられました。テスト手順では、大小さまざまなブロックサイズ、ランダムおよびシーケンシャルな操作への分散、そしてさまざまな同時実行レベルが網羅されています。

メインのパフォーマンステストの前に、各SSDは100MBブロックを使用した1%シーケンシャルライトパスでデバイス全体の書き込みを完了しました。このプロセスでは、同期I/Oとキュー深度128を使用し、98.51つのジョブを同時に実行できるようにしました。このフェーズにより、ドライブは実際の使用状況を反映した定常状態になります。シーケンシャルフィルの後、重み付けbssplit(ブロックサイズ/パーセンテージ)配分を用いて、128時間のランダム書き込み飽和ステージを実行しました。このステージでは、8K転送を最大(XNUMX%)とし、XNUMXK未満のブロックからXNUMXKまでの転送をわずかに配分しました。このステップは、分散キャッシュ環境でよく見られる断片化された不均一な書き込みパターンをエミュレートします。

メインのテストスイートは、スケールされたランダム読み取りおよび書き込み操作に焦点を当て、キュー深度とジョブの同時実行数を変化させた際のドライブの動作を測定しました。各テストは300分間(XNUMX秒)実行され、その後XNUMX分間のアイドル期間が設けられ、内部回復メカニズムによってパフォーマンス指標が安定しました。

  • 128K(98.51%)を優先する固定ブロックサイズ配分で実行し、残りの1.49%の操作は64Kから8Kまでの小さな転送サイズで構成されました。各構成は、1、2、4の同時ジョブ数、キュー深度1、2、4、8、16、32で変化させ、典型的なエッジ書き込み環境におけるスループットのスケーラビリティとレイテンシをプロファイリングしました。
  • CDNコンテンツ取得を模倣した、非常に混合されたブロックサイズプロファイルが使用されました。128KB(83.21%)の主要コンポーネントから始まり、30KBから4KBまでの124以上の小さなブロックサイズがロングテールで続き、それぞれが分数頻度で表現されています。この分布は、ビデオセグメントの取得、サムネイルへのアクセス、メタデータの検索中に発生する多様なリクエストパターンを反映しています。これらのテストは、ジョブ数とキューの深さのマトリックス全体にわたって実行されました。

この事前調整、飽和、および混合サイズのランダム化アクセス テストの組み合わせは、帯域幅が広く、高度に並列化されたシナリオでの応答性と効率性を重視しながら、SSD が持続的な CDN のような環境をどのように処理するかを明らかにするように設計されています。

CDN ワークロード読み取り 1

軽いコンテンツ配信トラフィックをシミュレートしたシングルスレッド読み取りテストにおいて、Solidigm P5336 122.88TBとSolidigm P5336 61.44TBは一貫したスケーリング特性を示しました。122.88TBモデルはQD7,109で32MB/秒に達し、61.44TBモデルの7,002MB/秒をわずかに上回りました。このほぼ同一のスケーリング特性は、Solidigmの大容量モデルが、軽い読み取り負荷においてもパフォーマンスの低下なく同等の効率を維持していることを示唆しています。一方、Micron 6550 61.44TBははるかにアグレッシブにスケーリングし、12,288MB/秒まで到達しました。

CDN ワークロード読み取り 2

5336スレッド構成のSolidigm P122.88 5336TBとP61.44 840TBは、QD1で7,467MB/秒、QD7,469でそれぞれ約32MB/秒と16MB/秒まで、ほぼ同等のパフォーマンスを実現します。どちらのドライブもQD6550までは安定したパフォーマンス向上を示し、その後はスループットが横ばいになり、現在のアーキテクチャが飽和状態にあることを示しています。中程度の並列処理を必要とするアプリケーションでは、これは予測可能なスケーリングのための信頼できる基準となります。一方、Micron 1,384は、TLC NANDとGen13,312インターフェースの利点を反映し、QD32で5MB/秒からXNUMXMB/秒まで、全体的なスケーリング範囲が広くなっています。

CDN ワークロード読み取り 4

この高負荷の読み取りシナリオでは、同時実行数の増加に伴い、ドライブへの負荷が増大します。Solidigm P5336 122.88TBおよびP5336 61.44TBドライブは、QD7,466で約7,469~16MB/秒に達し、QD32まで安定した速度を維持するなど、一貫したスケーリングを示しました。6550つの容量間の結果は実質的に同一であり、Solidigmの大容量製品ラインナップ全体にわたる一貫したコントローラ動作を裏付けています。一方、Micron 13,107はQD16でXNUMXMB/秒を達成し、テストの残りの期間を通じてその帯域幅を維持しました。

CDN ワークロード書き込み 1

シングルスレッド条件下での書き込みパフォーマンスへの移行において、Solidigm P5336 122.88TBは1,742MB/秒から始まり、QD2,572で約32MB/秒に達します。Solidigm P5336 61.44TBは461MB/秒と低い値からスタートしますが、より急激にスケーリングし、3,029MB/秒までピークに達します。Micron 6550は984MB/秒からスタートし、キュー深度の範囲を通して一貫してスケーリングを続け、QD6,288では32MB/秒に達します。Solidigmのモデルはそれぞれ異なるスケーリング特性を示していますが、Micronはテスト全体を通してより直線的な変化を示しています。

CDN ワークロード書き込み 2

デュアルスレッド書き込み性能では、5336つのドライブすべてで帯域幅が増加します。Solidigm P61.44 2,771TBは32MB/秒から始まり、QD5336ではわずかな変動で比較的安定した出力を維持します。Solidigm P122.88 2,468TBはより狭い範囲で動作し、すべてのキュー深度で2,620MB/秒から6550MB/秒の範囲に留まります。Micron 2,035は継続的なスケーリングを示し、6,743MB/秒から始まり、QD32ではXNUMXMB/秒に達します。Solidigmドライブは安定したスループットを維持しますが、Micronは同じ範囲でより広いスケーリングプロファイルを示します。

CDN ワークロード書き込み 4

最大同時実行環境において、Solidigm P5336の両モデルは安定していますが、スケーリングは限定的です。P5336 61.44TBモデルは約2,935MB/秒から始まり、ピーク時には3,062MB/秒に達します。一方、P5336 122.88TBモデルは2,529MB/秒から始まり、わずかに低い2,562MB/秒まで低下します。そのため、16TBモデルのピークスループットは、122.88TBモデルと比較して約61.44%低くなります。一方、Micron 6550は、QD2,323によって6,731MB/秒から32MB/秒まで着実にスケーリングします。

オブジェクトストレージのパフォーマンス

このテストでは、ObjectStorage ワークロードを近似する FIO スクリプトを活用します。リクエストの 65% は一般的な小ブロック操作を表す 64 KiB 転送サイズで発行され、15% は中規模のストリーミングワークロードを表す 8 MiB で、残りの 15% はドライブの大ブロック処理に負荷をかける 64 MiB で発行されます。最後の 5% は 1 GiB ペイロードで、最大シーケンシャルスループットを押し上げます。これらの XNUMX つのブロックサイズを指定された割合でインターリーブすることで、混合ワークロードをシミュレートし、小容量 I/O におけるコントローラーの俊敏性と、大容量転送における生の帯域幅能力の両方を明らかにします。

ランダム読み取り(1スレッド、40QD)

ステアリング位置 読み取り帯域幅(MB/秒) IOPSを読む 読み取りレイテンシ(ミリ秒)
マイクロン 6550 61TB 13,444.10 3,165.10 12.5011
Solidigm P5336 61TB 7,117.38 1,673.76 23.4513
Solidigm P5336 122TB 7,101.97 1,674.78 23.4385

このシングルスレッド、高深度ランダムリードテストでは、Solidigm P5336 122.88TBとP5336 61.44TBはほぼ同等のパフォーマンスを示しました。122.88TBモデルは7,101.97MB/秒、1,674.78 IOPS、レイテンシ23.44msを達成し、61.44TBモデルは7,117.38MB/秒、1,673.76 IOPS、レイテンシ23.45msを達成しました。0.25つのSolidigm容量間の帯域幅の差は5336%未満であり、ランダムリードワークロードにおいてPXNUMXシリーズ全体で一貫したパフォーマンスが発揮されていることを示しています。

Micron 6550は、13,444.10MB/秒、3,165.10IOPSという大幅なパフォーマンスを実現し、レイテンシは12.50msと低レイテンシです。このシナリオにおけるMicron 5の優位性は、TLC NANDとPCIe Gen4インターフェースの採用によるもので、QLCベースのGenXNUMX Solidigmドライブと比較して、ランダム読み取りスループットと応答性が向上しています。

シーケンシャルリード(1スレッド、40QD)

ステアリング位置 読み取り帯域幅(MB/秒) IOPSを読む 読み取りレイテンシ(ミリ秒)
マイクロン 6550 61TB 13,955.46 223.32 174.723
Solidigm P5336 61TB 7,098.64 114.12 341.727
Solidigm P5336 122TB 7,103.98 114.60 340.322

シーケンシャルリード性能に移ると、Solidigm P5336 122.88TBとP5336 61.44TBはほぼ同等の結果を示しました。122.88TBモデルは7,103.98MB/秒、114.60 IOPS、レイテンシ340.32ミリ秒を達成しましたが、61.44TBモデルは7,098.64MB/秒、114.12 IOPS、341.73ミリ秒でした。両モデルのパフォーマンス差は0.1%未満で、持続的なシーケンシャルリードワークロードにおいて、両容量モデルで一貫した動作が見られました。Micron 6550は13,955.46MB/秒、223.32 IOPS、174.72ミリ秒という大幅なパフォーマンスを示し、このテストにおいてSolidigmのどちらのモデルよりも約96%高いスループットを実現しました。

ランダム読み取り(4スレッド、10QD)

ステアリング位置 読み取り帯域幅(MB/秒) IOPSを読む 読み取りレイテンシ(ミリ秒)
マイクロン 6550 61TB 13,301.67 3,142.01 12.5619
Solidigm P5336 61TB 7,131.65 1,686.98 22.9787
Solidigm P5336 122TB 7,131.95 1,690.84 22.9315

10スレッド、キュー深度5336の条件で読み取りを行うと、Solidigm P122.88 7,131.95TBは1,690.84MB/秒、22.93 IOPS、レイテンシ5336ミリ秒を記録しました。Solidigm P61.44 7,131.65TBは1,686.98MB/秒、22.98 IOPS、レイテンシ0.005ミリ秒で、これに次ぐ性能です。両モデルの帯域幅の差は6550%未満です。Micron 13,301.67は3,142.01MB/秒、12.56 IOPS、レイテンシ86ミリ秒を達成し、どちらのSolidigmドライブよりも約XNUMX%高いスループットを実現しています。

シーケンシャルリード(4スレッド、10QD)

ステアリング位置 読み取り帯域幅(MB/秒) IOPSを読む 読み取りレイテンシ(ミリ秒)
マイクロン 6550 61TB 13,524.00 218.06 171.040
Solidigm P5336 61TB 7,130.97 115.03 315.565
Solidigm P5336 122TB 7,130.99 114.72 316.304

キュー深度10での5336スレッドシーケンシャルリードテストにおいて、Solidigm P122.88 7,130.99TBは114.72MB/秒、316.30 IOPS、5336msのレイテンシを達成しました。Solidigm P61.44 7,130.97TBのレイテンシも115.03MB/秒、315.57 IOPS、0.01msとほぼ同等の結果となりました。両モデルは容量範囲全体でほぼ同一のシーケンシャルパフォーマンスを示し、その差は6550%未満です。Micron 13,524.00は218.06MB/秒、171.04 IOPS、89msのレイテンシを達成し、同条件におけるSolidigmドライブのいずれよりも約XNUMX%高いスループットを実現しました。

DLIO チェックポイント ベンチマーク

AIトレーニング環境におけるSSDの実世界パフォーマンスを評価するために、DLIO(Data and Learning Input/Output)ベンチマークツールを使用しました。アルゴンヌ国立研究所が開発したDLIOは、ディープラーニングワークロードのI/Oパターンをテストするために特別に設計されています。ストレージシステムがチェックポイント、データの取り込み、モデルトレーニングなどの課題にどのように対処するかについての洞察を提供します。下のグラフは、両方のドライブが99個のチェックポイント(198TBの場合は122個)にわたってプロセスをどのように処理するかを示しています。機械学習モデルのトレーニングでは、モデルの状態を定期的に保存し、中断や停電時の進行状況の損失を防ぐために、チェックポイントが不可欠です。このストレージ需要には、特に持続的または集中的なワークロード下での堅牢なパフォーマンスが求められます。2.0年13月2024日リリースのDLIOベンチマークバージョンXNUMXを使用しました。

ベンチマークが現実世界のシナリオを反映したものであることを確認するため、LLAMA 3.1 405B モデルアーキテクチャに基づいてテストを実施しました。モデルパラメータ、オプティマイザーの状態、およびレイヤーの状態を取得するために、torch.save() を用いたチェックポイント処理を実装しました。このセットアップでは、4GPU システムをシミュレートし、2ウェイテンソル並列処理と1,636ウェイパイプライン並列処理をXNUMXつのGPUに分散させたハイブリッド並列処理戦略を採用しました。この構成では、チェックポイントのサイズはXNUMXGBとなり、これは現代の大規模言語モデルの学習要件にほぼ相当します。

61TBと122TBのSolidigm P5336のチェックポイント性能を比較すると、122TB SSDはドライブが一杯になるとチェックポイント時間が長くなります。20回目のパスでは、122TB版の方が61TB版よりも約16.4%高速ですが、18.4回目と61回目のパスではそれぞれ6550%と585%遅くなっています。640TBのMicron 61の5336回目のパスの平均チェックポイント時間は757秒で、122TB P5336はXNUMX秒、XNUMXTB PXNUMXはXNUMX秒でした。

122TBのSolidigm P5336は、チェックポイントに関して独自の優位性を持っています。それは、大量のチェックポイントを保存できることです。61TBのSSDは33パスあたり最大122個のチェックポイントしか保存できませんが、66TBモデルは容量に達する前に6550個のチェックポイントを保存できます。上記のXNUMXパスあたりの平均時間のグラフでは実際の量がやや分かりにくいですが、チェックポイントあたりの時間を見ると、容量の優位性がよく分かります。SolidigmのSSDはどちらも、最初のチェックポイントのパスが完了すると安定しますが、Micron XNUMXはテスト全体を通して比較的安定しており、より速い傾向にあります。

FIOパフォーマンスベンチマーク

各SSDのストレージパフォーマンスを業界標準の指標に基づいて測定するために、FIOを活用しています。各ドライブは同一のテストプロセスでテストされます。このプロセスには、シーケンシャルライトワークロードでドライブを2回フルフィルする前処理ステップと、その後の定常パフォーマンス測定が含まれます。測定対象のワークロードの種類が変化するたびに、新しい転送サイズで前処理フィルを再度実行します。

このセクションでは、次の FIO ベンチマークに焦点を当てます。

  • 128Kシーケンシャル
  • 64Kランダム
  • 16Kランダム
  • 4Kランダム

大容量QLC SSDは大容量転送向けに設計されているため、書き込み速度テストは16Kランダムで停止します。4Kについては、16Kワークロードのプリフィル状態を利用して、4Kランダム読み取りパフォーマンスのみを測定します。

128K シーケンシャル前提条件 (IODepth 256 / NumJobs 1)

この高キュー深度のプリコンディショニングテストでは、Solidigm P5336 122.88TBは3,134MB/秒、P5336 61.44TBは2,500.9MB/秒を達成しました。これは、大容量モデルの書き込み帯域幅が25.3%向上したことを意味します。Micron 6550は10,455.3MB/秒でチャートのトップに立っています。Solidigmの両モデルは生のスループットではMicronに劣っていますが、122TBモデルと61TBモデルのパフォーマンス差は、同じP5336プラットフォーム内での大規模な最適化を浮き彫りにしており、大容量ドライブは持続的なシーケンシャル書き込み処理において明確なパフォーマンス向上を示しています。Micron 6550のプリコンディショニング段階ははるかに短いように見えますが、書き込み速度が速いため、最初の書き込みをはるかに速く完了することができました。

128K シーケンシャル前提条件レイテンシ (IODepth 256 / NumJobs 1)

 

128Kシーケンシャル書き込み時のレイテンシに関しては、Micron 6550が3.06msと最も低い値を記録しました。Solidigm P5336 122.88TBは10.21msでこれに続き、P5336 61.44TBは12.80msでした。これは、20.2TBモデルが122.88TBモデルと比較してレイテンシが61.44%削減されたことを示し、レイテンシの効率化と安定化を反映しており、Solidigm P5336シリーズにおける改善が実証されています。

128K シーケンシャル書き込み (IODepth 16 / NumJobs 1)


キュー深度16、単一ジョブのシーケンシャル書き込みテストにおいて、Solidigm P5336 122.88TBモデルは3,152.5MB/秒、25,220 IOPSを達成しました。P5336 61.44TBモデルは2,503.5MB/秒、20,030 IOPSに留まりましたが、25.9TBモデルと比較してスループットが122%向上しました。Micron 6550は10,456.4MB/秒、83,650 IOPSで最高の総合性能を達成し、SolidigmのXNUMXつのドライブを上回りました。

128K シーケンシャル書き込みレイテンシ (IODepth 16 / NumJobs 1)

レイテンシに関しては、Micron 6550が0.191msと最も低いレイテンシを記録しました。これに続くのがSolidigm P5336 122.88TBで、0.634msと、5336msのP61.44 0.798TBよりも優れた応答性を示しています。これは、より大容量のSolidigmモデルでレイテンシが20.5%削減されたことを示し、シーケンシャルライト操作の効率が向上したことを示しています。

128K シーケンシャル読み取り (IODepth 64 / NumJobs 1)

この64キュー深度のシーケンシャルリードテストでは、Solidigm P5336 61.44TBモデルが7,132.3MB/秒、57,060 IOPSを達成しました。一方、122.88TBモデルは7,121.6MB/秒、56,970 IOPSで僅差で追随しました。両者の差は0.2%未満であり、容量増加による目立ったスループットの向上は見られません。Micron 6550は13,979.7MB/秒、111,840 IOPSを達成し、このテストにおいてSolidigmのどちらのモデルよりも約96%高い読み取り帯域幅を実現しました。

128K シーケンシャル読み取りレイテンシ (IODepth 64 / NumJobs 1)


このシーケンシャルリードレイテンシテストでは、Micron 6550が0.572msと最も低いレイテンシを記録しました。Solidigm P5336 122.88TBは1.123msで、P5336 61.44TBの1.121msとほぼ同じです。この結果から、容量増加によるレイテンシの実質的なメリットは見られず、シーケンシャルリード応答性に関しては、Solidigmドライブはどちらも同等のパフォーマンスを示しました。

64Kランダム書き込み

低同時実行(64-1)での1Kランダム書き込みテストでは、6550つのドライブすべてがほぼ同等のパフォーマンスを示しました。Micron 2,485.97は39,780MB/秒、5336IOPSを記録しました。これにSolidigm P122.88 2,429.93TBが38,880MB/秒、5336IOPSで続き、P61.44 2,412.90TBは38,610MB/秒、XNUMXIOPSでわずかに遅れをとりました。

ワークロードの同時実行数(32対8)が増加すると、その差はより顕著になります。122.88TBモデルは3,121.54MB/秒、49,950IOPSを達成し、61.44TBモデルの2,654.46MB/秒、42,470IOPSを上回りました。これは、大容量の17.6TBドライブのスループットが122%向上したことを意味し、ランダム書き込み負荷が高い状況でもより効果的なスケーリングが実現されていることを示しています。Micron 6550は10,070.71MB/秒、161,130IOPSと大きくリードしています。

64Kランダム書き込みレイテンシ

低負荷(1-1)では、0.025台のドライブすべてが32ミリ秒という同一のレイテンシを記録しています。(8-5336)ワークロードでは、Solidigm P122.88 5.121TBは6.026ミリ秒を記録し、P5336 61.44TBは15ミリ秒でした。これは、大容量の122TBモデルでレイテンシが6550%削減されたことを意味します。Micron 1.588はXNUMXミリ秒と大幅に低いレイテンシを維持し、高負荷のランダム書き込み同時実行において優れた応答性を示しています。

64Kランダム読み取り


最小負荷(64-1)での1Kランダムリードテストでは、Micron 6550は482.09MB/秒、7,710IOPSを達成しました。Solidigm P5336 61.44TBは299.40MB/秒、4,790IOPSでこれに続き、P5336 122.88TBは274.04MB/秒、4,390IOPSで、この負荷では8.5TBモデルと比較して61.44%のパフォーマンス低下となりました。

高負荷(32-8)の同時実行環境において、P5336 122.88TBは7,124.69MB/秒、113,995IOPSを実現しました。一方、61.44TBは7,125MB/秒、約114,000IOPSとほぼ同等の性能です。このレベルでは、両容量間に有意なパフォーマンス差はありません。Micron 6550はさらに高い性能を発揮し、13,153.64MB/秒、210,460IOPSに達しました。

64Kランダム読み取りレイテンシ

深度(1-1)とジョブ数において、Micron 6550は0.129msと最も低いレイテンシを記録しました。これに続くのがSolidigm P5336 61.44TBで0.208ms、P5336 122.88TBは0.228msとわずかに高く、容量増加によって9.6%の増加が見られました。より高負荷(32-8)では、Solidigmの両モデルともレイテンシは2.245msと同等で、容量増加によるメリットは見られません。Micron 6550はこの実行において1.217msと、はるかに低いレイテンシを維持しています。

16Kランダム書き込み

低負荷(1-1)では、Solidigm P5336 122.88TBは549.14MB/秒、35,145 IOPSを実現しました。P5336 61.44TBは1,036.53MB/秒、66,338 IOPSと、大幅に優れたパフォーマンスを発揮しました。これにより、122.88TBモデルは47TBモデルと比較して、帯域幅とIOPSの両方で約61.44%低くなります。Micron 6550は、856.61つのSolidigmドライブの中間に位置し、54,823MB/秒、XNUMX IOPSを達成しました。

32TBモデルは、高同時接続(8-122.88)時において、549.14MB/秒、35,145IOPSのスループットを維持し、1対1のパフォーマンスからスケーリングは見られません。一方、61.44TBモデルは2,542.36MB/秒、162,711IOPSまでスケーリングされ、363TBドライブと比較してスループットが122%向上しました。Micron 6550は総合的に見てトップで、10,295.66MB/秒、658,922IOPSに達しました。

16Kランダム書き込みレイテンシ

(1-1)では、Solidigm P5336 122.88TBのレイテンシは0.028msであるのに対し、P5336 61.44TBは0.015msとより高速です。Micron 6550は0.018msで両者の中間に位置します。この結果、最小負荷時には、86TBモデルのレイテンシはSolidigm 122TBモデルと比較して61%高くなります。高負荷時(32-8)では、122.88TBモデルは0.028msの安定した応答時間を維持し、スケーリングは見られません。61.44TBモデルでは1.572msまで上昇し、同時実行時の負荷増加と大幅なスループット向上が反映されています。Micron 6550は0.388msと効率性を維持しており、ランダム書き込みのピーク負荷時においても優れた応答性を示しています。

16Kランダム読み取り

最小負荷(1-1)では、Micron 6550は188.80MB/秒、12,083K IOPSに達します。Solidigm P5336 61.44TBは126.55MB/秒、8,100 IOPSでこれに続き、P5336 122.88TBは125.87MB/秒、8,060 IOPSを記録しました。0.5つのSolidigmドライブのパフォーマンスはほぼ同等で、差はXNUMX%未満であり、この負荷レベルでは容量によるメリットは見られません。

同時実行数が多い場合(32対16)、Micron 6550は13,053.35MB/秒、835,420IOPSに達します。Solidigm 61.44TBは7,063.02MB/秒、452,030IOPSに達し、122.88TBモデルの6,855.59MB/秒、438,760IOPSをわずかに上回ります。これは、このワークロードにおいて、より大容量のSolidigmドライブのスループットが2.9%低下したことを意味します。

16Kランダム読み取りレイテンシ

(1-1)では、Micron 6550が0.082msと最も低いレイテンシを記録しました。5336つのSolidigm P0.123モデルはそれぞれ0.124msと1msで続き、両者の差は32%未満です。高負荷時(16-0.612)では、Micronは61.44msで効率的なスケーリングを維持していますが、Solidigm 1.132TBは122.88ms、1.165TBは2.9msに増加しています。これは、大容量のSolidigmドライブのレイテンシが61TBモデルと比較してXNUMX%増加していることを示しており、最大同時実行環境下では効率がわずかに低下していることを示しています。

4Kランダム読み取り

最小負荷(1-1)では、Micron 6550は57.71MB/秒、14,770 IOPSを実現しました。Solidigm P5336 61.44TBは38.21MB/秒、9,782 IOPSでこれに続き、P5336 122.88TBは37.93MB/秒、9,710 IOPSでわずかに遅れをとりました。1つのSolidigmモデルの差はXNUMX%未満であり、低深度では容量増加によるメリットは見られません。

同時実行数が多い場合(32対16)、Micron 6550は7,787.27MB/秒、1.99万IOPSに達します。Solidigm 61.44TBは3,799.77MB/秒、972,743万122.88IOPSに拡張され、3,643.64TB(932,770MB/秒、4.1万4.1IOPS)をわずかに上回ります。これは、ランダム読み取り負荷のピーク時において、大容量モデルでスループットがXNUMX%、IOPSがXNUMX%低下することを意味します。

4Kランダム読み取りレイテンシ

(1-1)では、Micron 6550のレイテンシが0.067msと最も低い値を示しています。Solidigm P5336の両モデルは0.102msで、容量増加によるレイテンシの改善は見られません。高負荷時(32-16)では、Micronは0.260msと高い効率を維持しています。P5336 61.44TBモデルは0.525ms、122.88TBモデルは0.546msとわずかに増加しており、レイテンシは4%増加していますが、ピーク時のランダム読み取り条件下では、大容量ドライブの効率低下はごくわずかです。

GPUダイレクトストレージ

このテストベンチで実施したテストの 1 つは、Magnum IO GPU Direct Storage (GDS) テストでした。GDS は NVIDIA が開発した機能で、NVMe ドライブやその他の高速ストレージ デバイスに保存されているデータにアクセスするときに GPU が CPU をバイパスできるようにします。GDS は、CPU とシステム メモリを介してデータをルーティングする代わりに、GPU とストレージ デバイス間の直接通信を可能にし、レイテンシを大幅に削減し、データ スループットを向上させます。

GPUダイレクトストレージの仕組み

従来、GPU が NVMe ドライブに保存されたデータを処理する場合、データは GPU に到達する前にまず CPU とシステム メモリを通過する必要があります。このプロセスでは、CPU が仲介役となり、遅延が増加し、貴重なシステム リソースが消費されるため、ボトルネックが発生します。GPU ダイレクト ストレージは、GPU が PCIe バスを介してストレージ デバイスから直接データにアクセスできるようにすることで、この非効率性を解消します。この直接パスにより、データ移動に関連するオーバーヘッドが削減され、より高速で効率的なデータ転送が可能になります。

AI ワークロード、特にディープラーニングを伴うワークロードは、非常にデータ集約的です。大規模なニューラル ネットワークのトレーニングにはテラバイト単位のデータ処理が必要であり、データ転送の遅延は GPU を十分に活用できず、トレーニング時間が長くなる可能性があります。GPU ダイレクト ストレージは、データが可能な限り迅速に GPU に配信され、アイドル時間を最小限に抑え、計算効率を最大化することで、この課題に対処します。

さらに、GDS は、ビデオ処理、自然言語処理、リアルタイム推論など、大規模なデータセットのストリーミングを伴うワークロードに特に役立ちます。CPU への依存度を下げることで、GDS はデータの移動を高速化し、CPU リソースを他のタスクに解放して、システム全体のパフォーマンスをさらに向上させます。

シングルスレッドでの16Kランダムリードにおいて、Solidigm P5336 61.44TBは526.40MB/秒を記録し、122.88TBモデルの187.21MB/秒を181%上回りました。Micron 6550は169.15MB/秒で、両者の中間に位置します。この結果、大容量のSolidigmモデルは、より小型のモデルに比べてパフォーマンスが劣っています。

128スレッドカウント、1Mシーケンシャルリードを高同時実行環境で実行すると、Solidigm P5336 61.44TBモデルが4,391.68MB/秒でトップとなり、122.88TBモデルが4,193.56MB/秒で僅差で続きました。Micron 6550は2,667.99MB/秒と低い結果となりました。122.88TBドライブは、小型モデルより約4.5%遅れをとりましたが、Micronより57%優れたパフォーマンスを発揮しました。

Solidigm P5336 61.44TBモデルは0.048msと最も低いレイテンシを実現し、次いで122.88TBモデルが0.082msと、より小型のモデルよりも約70.8%高いレイテンシを実現しています。Micron 6550はどちらにも劣り、この構成では0.090msと最も高いレイテンシを実現しています。

高スレッド数環境下では、Solidigm 61.44TBのレイテンシは0.291ミリ秒、続いて122.88TBが0.305ミリ秒となり、4.8%の増加となりました。Micron 6550は0.479ミリ秒で最下位となり、高書き込み負荷下ではレイテンシが大幅に増加しました。

TBシングルスレッド、16Kブロックサイズでは、Solidigm P5336 61.44TBが592.34MB/秒でスタートし、Micron 6550が502.97MB/秒で続きます。Solidigm P5336 122.88TBは496.59MB/秒とわずかに遅れており、この低負荷設定では16.1つのSolidigmモデル間でXNUMX%のパフォーマンス差が見られます。

最大同時実行速度128T、ブロックサイズ1MBの環境では、Micron 6550は3,281.49MB/秒でスタートし、Solidigm 61.44TBの3,134.03MB/秒をわずかに上回りました。Solidigm 122.88TBは2,549.28MB/秒で、18.6TBモデルよりも約61%遅い結果となりました。122TBモデルは容量が大きいにもかかわらず、この高負荷書き込み環境下ではスループットのスケーリングが低下しています。

1T 16Kシーケンシャル書き込みでは、Micron 6550が再び最低レイテンシ0.030msを記録し、Solidigm P5336(122.88TB)の0.031msをわずかに上回りましたが、これは無視できる差です。Solidigm P5336は61.44TBで0.026msを記録し、このグループでトップとなり、両ドライブを僅差で上回りました。

128T 1Mシーケンシャル書き込みにおいて、Micron 6550は高負荷同時実行環境において0.390ミリ秒のレイテンシを達成しました。Solidigm 61.44TBモデルは0.408ミリ秒でこれに続き、122.88TBモデルは0.502ミリ秒で、23TB Solidigmモデルと比較してレイテンシが61%増加しています。

結論

SolidigmのD5-P5336 122.88TB SSDは、比類のないストレージ密度、TBあたりの優れた電力効率、そして優れた拡張性を提供し、スペース削減、省エネ、そしてインフラ管理の簡素化といった企業の重要なニーズに対応します。物理的な設置面積を拡大することなくドライブあたりの容量を大幅に増加させることで、Solidigmはデータセンターのストレージラックを大幅に統合し、運用コストと環境の持続可能性に直接的なメリットをもたらすと同時に、AIの急増に伴う新たなワークロードの需要増加にも対応します。

CDNワークロードテストでは、このSSDは一貫したシーケンシャル読み取りスループットを実現し、キュー深度が高い状態で約7.5GB/秒に達し、同時実行性が増加しても安定性を維持しました。CDNシナリオ内のランダム読み取りでは、より小型の61.44TBモデルとほぼ同等のパフォーマンスを示し、Solidigmの効果的なアーキテクチャの一貫性を際立たせました。FIOベンチマークでは、D5-P5336 122.88TBは、シーケンシャル書き込みで従来の61TBモデルを最大25%上回り、キュー深度3,152.5で16MB/秒を達成し、レイテンシは約20%(0.634ms対0.798ms)改善しました。ただし、ランダム書き込みシナリオでは、より大きなドライブが16Kブロックサイズでより低いスループットを記録するなど、いくつかのトレードオフが見られました。これは、シーケンシャルで読み取り集中型のワークロード向けに設計が最適化されていることを反映しています。

GPUダイレクトストレージ(GDSIO)環境において、このドライブは4,193MBのブロックサイズで約1MB/秒という競争力のあるシーケンシャルリード速度を維持し、高い同時実行性を実現しました。これは、小型版と比べてわずか4.5%の差で、競争力のある速度です。Solidigm D5-P5336 122.88TB SSDは、高い密度、予測可能なパフォーマンス、そして現代の要求の厳しいエンタープライズデータ環境に最適な効果的なスケーリング機能を提供します。

データへの飽くなき需要が増大し続ける中、密度を最大化し消費電力を最小限に抑えるストレージソリューションの重要性はますます高まっています。D5-P5336のようなドライブは、NAND技術の革新とインテリジェントな設計が、データセンターが将来の成長に持続的に対応できるよういかに貢献できるかを明確に示しています。今後、Solidigmは容量と効率の限界をさらに押し広げ、年末までに画期的な245.76TB SSDを投入する可能性もあると予想されます。

StorageReview と連携する

ニュースレター | YouTubeでご覧いただけます。 |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード

ケビン・オブライエンとディラン・ドハティ