2024年7月、マイクロンは 9550 NVMe SSDファミリー次世代のエンタープライズストレージ導入に向けて構築されたGen5プラットフォーム、9550 MAXを発表しました。当時、私たちは発売について取り上げ、読み取り集中型環境向けのPROと、混合使用ワークロード向けのMAXという2つの製品層に焦点を当てました。その後、Micron社から9550 MAXのサンプルを提供いただき、このファミリーの中でもより耐久性の高いこの製品を、徹底したエンタープライズラボテストにかけることができました。
9550 MAXは、読み取りと書き込みのバランスが取れた混合用途のワークロード向けに特別に設計されており、耐久性と持続的なパフォーマンスが、生のスループットと同様に重要です。そのため、データベース、分析、AI/MLトレーニングパイプライン、そして高頻度かつ継続的なトランザクションレートを伴う金融アプリケーションに最適です。
容量は3.2TBから25.6TBまで幅広く取り揃えており、小規模なアプリケーションドライブから高密度ストレージノードにおける大容量統合まで、幅広い導入シナリオに対応します。9550 MAXはU.2とE3.Sの両方のフォームファクタで提供され、既存の2.5インチインフラストラクチャから次世代のEDSFFプラットフォームへの移行において、企業の柔軟性を高めます。
低耐久性での読み取りパフォーマンスに重点を置いたPROラインと比較して、MAXは最大3ドライブ/日書き込み(DWPD)を実現しており、書き込み負荷の高い環境やバランスの取れたワークロードを持つ環境に最適です。ProラインとMaxラインは、PCIe Gen5のパフォーマンス、NVMe 2.0、(OCP) 2.0-2.5準拠を備えており、9550シリーズSSDは、スケーラブルな環境での速度と信頼性を重視して設計されたドライブとして際立っています。
上に位置する Micron 7600シリーズ 9550シリーズは、優れたレイテンシとエネルギー効率で主流のデータセンターワークロードに対応するSSDであり、高い耐久性、幅広い容量オプション、そして負荷時に最大限の一貫性とスループットを必要とするデータ集約型環境向けの優れた持続的パフォーマンスを提供します。
Micron 9550 MAXの仕様
以下の表は、Micron 9550 MAX シリーズ SSD の概要を示しており、U.2 および E3.S モデルのフォーム ファクター、パフォーマンス メトリック、耐久性評価、容量オプションを強調しています。
| Micron 9550 MAX 仕様 (U.2 / E3.S) | |||||
|---|---|---|---|---|---|
| Use Case | 混合使用(1日あたり3回のドライブ書き込み) | ||||
| インターフェース/プロトコル | PCIe Gen5 x4、NVMe v2.0b | ||||
| NAND | Micron 232 層 3D TLC NAND | ||||
| OCPコンプライアンス | OCP 2.0 (r21) | ||||
| 信頼性の向上 | MTTF: 0~55℃で2.0万時間、0~50℃で2.5万時間 | UBER < 1セクター/1017 読み取りビット数 | 5年間保証 | ||||
| 電力(平均RMS) | シーケンシャル読み取り:≤ 18 W、シーケンシャル書き込み:≤ 18 W | ||||
| 使用温度 | 0-70°C | ||||
| 容量とパフォーマンス(9550 MAX) | |||||
| 容量 | 続読み取り (MB/秒) | 続書き込み (MB/秒) | ランド読み取り (K IOPS) | ランダム書き込み(K IOPS) | 70/30 読み取り/書き込み (K IOPS) |
| 3.2TB | 14,000 | 10,000 | 3,000 | 540 | 640 |
| 6.4TB | 14,000 | 10,000 | 3,300 | 640 | 720 |
| 12.8TB | 14,000 | 10,000 | 3,300 | 820 | 1,000 |
| 25.6TB | 14,000 | 10,000 | 3,300 | 1,200 | 1,300 |
| 標準レイテンシ(µs) | |||||
| 読む | 60 | ||||
| 書きます | 15 | ||||
| 耐久性(書き込みバイト総数、TB) | |||||
| 容量 | RND TBW | シーケンス TBW | Notes | ||
| 3.2TB | 17,520 | 37,200 | 最大(3 DWPD) | ||
| 6.4TB | 35,040 | 74,200 | 最大(3 DWPD) | ||
| 12.8TB | 70,080 | 143,100 | 最大(3 DWPD) | ||
| 25.6TB | 140,160 | 282,600 | 最大(3 DWPD) | ||
Micron 9550 MAXの設計と構築
Micronは、9550 MAXを、3 DWPDでバランスの取れた読み取り/書き込みワークロード向けに設計された、多用途エンタープライズSSDと位置付けています。PCIe Gen5 x4インターフェースとNVMe 2.0bプロトコルサポート、そしてMicronの232層3D TLC NANDテクノロジーを組み合わせることで、持続的な負荷下でも一貫したレイテンシを実現します。
物理的には、このドライブファミリーはU.2およびE3.Sフォームファクターを網羅しており、プラットフォームを変更することなく、既存の2.5インチNVMeベイに組み込んだり、より高密度なEDSFF環境に移行したりする柔軟性を提供します。この汎用性はOCP 2.0および2.5への準拠によって強化されており、9550 MAXは現代のハイパースケールサーバーやエンタープライズサーバーに共通する機械的、熱的、そして管理的な要件を満たしています。
電力と熱の観点から、Micronはシーケンシャルリード/ライト動作の平均RMSを18W以下に抑えています。これはU.2およびE3.Sシステムの一般的なフロントベイ冷却エンベロープに完全に適合し、長時間の混合ワークロードにおいてもパフォーマンスの一貫性を維持します。動作温度は0~70℃と高く、管理者は様々な筐体のエアフロー設計において十分な余裕を持って運用できます。
信頼性目標は、MAXシリーズの耐久性へのこだわりを反映しています。MTTFは最大250万時間(高温環境では200万時間)、UBERは1e-17未満、そして5年間の保証となっています。容量は3.2TBから25.6TBまで幅広く、Micronは低い標準レイテンシ(読み取り60µs / 書き込み15µs)に加え、Gen5スループット(最大読み取り14GB/秒 / 書き込み10GB/秒)と、豊富な混合IO数も公表しています。これらの特性は、実際の混合用途の導入においては、ピークスペックよりも重要です。
Micron 9550 MAXのパフォーマンス
ドライブテストプラットフォーム
このレビューでは、すべてのワークロードのテストプラットフォームとして、Ubuntu 22.04.02 LTSを搭載したDell PowerEdge R760を選択しました。 シリアルケーブルのGen5 JBOF、 U.2、E1.S、E3.S、M.2 SSDとの幅広い互換性を備えています。テストシステムの構成は以下の通りです。
- 2 x Intel Xeon Gold 6430 (32 コア、2.1GHz)
- 16 x 64GB DDR5-4400
- 480GB デル ボス SSD
- シリアルケーブル Gen5 JBOF
ドライブの比較
- パスカリ X200P 7.68TB
- サンディスク SN861 7.68TB
- ソリダイム PS1010 7.68TB
- キングストン DC3000ME 7.68TB
- マイクロン 7600 最大 6.4TB
DLIO チェックポイント ベンチマーク
AIトレーニング環境におけるSSDの実世界パフォーマンスを評価するために、DLIO(Data and Learning Input/Output)ベンチマークツールを使用しました。アルゴンヌ国立研究所が開発したDLIOは、ディープラーニングワークロードのI/Oパターンをテストするために特別に設計されています。DLIOは、ストレージシステムがチェックポイント、データ取り込み、モデルトレーニングといった課題にどのように対処するかについての洞察を提供します。下のグラフは、両方のドライブが36のチェックポイントにわたってプロセスをどのように処理するかを示しています。機械学習モデルのトレーニングにおいて、チェックポイントはモデルの状態を定期的に保存し、中断や停電時の進行状況の損失を防ぐために不可欠です。このストレージ需要には、特に持続的または集中的なワークロードにおいて、堅牢なパフォーマンスが求められます。2024年8月13日リリースのDLIOベンチマークバージョン2.0を使用しました。
ベンチマークが現実世界のシナリオを反映したものであることを確認するため、LLAMA 3.1 405B モデルアーキテクチャに基づいてテストを実施しました。モデルパラメータ、オプティマイザーの状態、レイヤーの状態を取得するために、torch.save() を用いたチェックポイント処理を実装しました。このセットアップでは、8GPU システムをシミュレートし、4 ウェイテンソル並列処理と 2 ウェイパイプライン並列処理を 8 つの GPU に分散させたハイブリッド並列処理戦略を実装しました。この構成では、最新の大規模言語モデルの学習要件を反映し、チェックポイントのサイズは 1,636 GB となりました。
このベンチマークでは、Micron 9550 MAX 12.8TBが圧倒的なリーダーとして浮上しました。18チェックポイントの実行全体を通して、平均完了時間は457秒から575秒と、最も短い値を維持しました。ドライブはチェックポイント間の変動を最小限に抑え、優れた安定性を実現しました。これは、読み取り/書き込み混合ワークロードに最適化された、バランスの取れたファームウェア設計であることを示しています。
僅差でMicron 7600 MAX 6.4TBが459秒から586秒を記録しました。平均パフォーマンスは依然として競争力を維持していましたが、チェックポイント4と7の間でパフォーマンスが一時的に変動し、その後はテスト終盤にかけて安定しました。それでもなお、トップクラスにしっかりと位置づけられ、持続的なAIおよびHPCワークロードにおいて優れた効率性を示しました。
Micron 9550 7.68TBは、2つのフラッグシップモデルにわずかに及ばないパフォーマンスを示し、458秒から582秒の範囲でした。安定したスケーリングを維持し、ハイエンドのMAXドライブと競争力を維持したことで、基盤となるMicron 9550プラットフォームの強みをさらに強化しました。
テスト対象となった他のエンタープライズSSDの中で、Solidigm PS1010、SanDisk SN861、Kingston DC3000MEは中間的なパフォーマンスを示し、ほとんどのチェックポイントを450秒から610秒の枠内で完了しました。Pascari X200Pはパフォーマンスの安定性が最も低く、実行中盤には690秒を超える時間が発生しましたが、終盤にかけて安定しました。
このパス平均テストでは、Solidigm PS1010 7.68TBが3回のパスで458秒から564秒という最速の平均完了時間を記録し、グループをリードしました。このドライブは優れた一貫性を示し、実行間のばらつきを低く抑え、混合I/Oワークロードにおいても高い効率性を示しました。
SanDisk SN861 7.68TB が僅差で続き、平均 461 秒から 553 秒の間でほぼ同じ結果を記録し、最小限の低下で信頼性の高いチェックポイント パフォーマンスを提供できることが確認されました。
Micron 9550 7.68TBがこれに続き、同じパスで461秒から559秒の間で終了しました。そのパフォーマンスは依然として非常に競争力があり、リーダーにわずかに遅れをとりながらも、すべてのイテレーションを通して安定したスケーリングと堅実なスループットを維持しました。
Micron 9550 MAX 12.8TBとMicron 7600 MAX 6.4TBがトップ5に入り、平均スコアはわずかに高い462を記録した。それぞれ-555秒と464-567秒だった。どちらも時間の経過とともに安定した動作を維持したが、容量の小さいMicronと2つの上位ドライブに遅れをとった。 ソリディグム そしてサンディスク。
残りのグループでは、キングストンDC3000MEと パスカリ X200Pは、平均でそれぞれ580秒と660秒と、全体的な実行時間が最も長くなりました。これらの結果は、特に永続ストレージへの頻繁な書き込みを必要とするワークロードにおいて、持続的なチェックポイント設定条件下でのパフォーマンス差が大きいことを示しています。
FIOパフォーマンスベンチマーク
各SSDのストレージパフォーマンスを業界標準の指標に基づいて測定するために、FIOを活用しています。各ドライブは同じテストプロセスを受けます。このプロセスには、シーケンシャル書き込みワークロードでドライブを2回フルフィルする前処理ステップと、その後の定常状態のパフォーマンス測定が含まれます。測定対象のワークロードの種類が変化するたびに、新しい転送サイズで前処理フィルを再度実行します。
このセクションでは、次の FIO ベンチマークに焦点を当てます。
- 128Kシーケンシャル
- 64Kランダム
- 16Kランダム
- 4Kランダム
128K シーケンシャル書き込み (IODepth 16 / NumJobs 1)
128Kシーケンシャルライトテストでは、プリコンディショニング時の結果とほぼ同じ結果となりました。Micron 9550 Max (12.8TB) は再び大きな差をつけてトップに立ち、10,957.9MB/秒を維持してグループトップの座を堅持しました。Kingston DC3000ME (7.68TB) が8,477.4MB/秒で2位に続き、Pascari X200P (7.68TB) が8,369.7MB/秒で僅差で追随しました。
さらに下位にはSolidigm PS1010(7,126.5MB/秒)とSanDisk DC SN861(7,116.5MB/秒)が続き、Micron 7600 Max(6.4TB)は6,960.6MB/秒でチャートの最下位に沈みました。
128K シーケンシャル書き込みレイテンシ (IODepth 16 / NumJobs 1)
レイテンシについて見てみると、128Kシーケンシャルライトテストは、IODepth 16で単一ジョブで実行されました。これは、プレコンディショニングで使用したより重い256キュー深度と比較したものです。予想通り、すべてのドライブでレイテンシが大幅に低下しました。Micron 9550 Max (12.8TB) は、0.18msという最低レイテンシで再びトップとなり、最小限の遅延で最高レベルのスループットを維持できる能力を示しました。
Kingston DC3000ME (7.68TB) が0.24msで僅差で続き、Pascari X200P (7.68TB) が0.24msで僅差で続きました。一方、Solidigm PS1010 (0.28ms) と SanDisk DC SN861 (0.28ms) も同様の結果となり、Micron 7600 Max (6.4TB) は0.29msで最下位となりました。
128K シーケンシャル読み取り (IODepth 64 / NumJobs 1)
読み取りに移ると、128Kシーケンシャルリードテストでは、競合ドライブ間でかなり拮抗した結果が出ました。Pascari X200P(7.68TB)が14,242.1MB/秒で首位に立ち、Solidigm PS1010(7.68TB)の14,163.3MB/秒をわずかに上回りました。Micron 9550 Max(12.8TB)は14,047.5MB/秒ですぐ後ろにつけました。これら3つのドライブは実質的に僅差で、持続的なシーケンシャルリードスループットにおける実環境における差はごくわずかでした。
Kingston DC3000ME (7.68TB) は13,513.8MB/秒で上位3社にわずかに及ばず、SanDisk DC SN861 (7.68TB) は12,631.2MB/秒を記録しました。下位では、Micron 7600 Max (6.4TB) が11,240.5MB/秒にとどまり、このグループの中で唯一12GB/秒を下回りました。
128K シーケンシャル読み取りレイテンシ (IODepth 64 / NumJobs 1)
レイテンシを見ると、128Kシーケンシャルリードテスト(IODepth 64 / NumJobs 1)では、上位機種間の競争がいかに熾烈であるかが浮き彫りになりました。Pascari X200P(7.68TB)が0.56ミリ秒でトップに立ち、Solidigm PS1010(0.56ミリ秒)とMicron 9550 Max(12.8TB)が0.57ミリ秒でほぼ互角でした。これら3つのドライブは実質的に同タイムで、スループットにおけるわずかな差を反映しています。
キングストン DC3000ME (7.68TB) は0.59msでこれに続き、サンディスク DC SN861 (7.68TB) は0.63msでした。Micron 7600 Max (6.4TB) は0.71msで最下位となり、シーケンシャルリード帯域幅の低さを反映しています。
64Kランダム書き込み
64Kランダム書き込みテストでは、Micron 9550 Max(12.8TB)は、最低2.45GB/秒から最高10.6GB/秒まで、幅広いパフォーマンスを示し、平均7.34GB/秒を記録しました。これは、Micron 9550 Maxがトップパフォーマンスを示しただけでなく、キュー深度が高い場合でも10GB/秒を超えるパフォーマンスを安定して達成した唯一のドライブでもありました。Micron 7600 Max(6.4TB)は、安定したパフォーマンスを示しましたが、パフォーマンスの上限は低く、2.39GB/秒から6.8GB/秒までの範囲で、平均5.16GB/秒でした。この結果、Micron 7600 Maxは9550 Maxに次ぐ2位に位置し、チャート上の他のほとんどの競合製品よりも上位に位置づけられました。
その他の製品を見てみると、Kingston DC3000ME(7.68TB)とSanDisk DC SN861(7.68TB)は4~6GB/秒の範囲に落ち着き、概ね競争力はあるものの、Micronのレベルには及ばない。Solidigm PS1010(7.68TB)とPascari X200P(7.68TB)は下位層に位置し、2~4GB/秒の範囲に留まり、Micronの両ドライブに大きく差をつけている。
64Kランダム書き込みレイテンシ
レイテンシに関しては、Micron 9550 Max (12.8TB) が最も安定した結果を示し、キュー深度が高い場合でも平均0.30ms、ピーク時でも1.71ms未満でした。Micron 7600 Max (6.4TB) はこれに続き、平均0.41ms、最大2.3msとわずかに高い値を示しましたが、負荷下でも十分な制御性を維持しました。Kingston DC3000MEとSanDisk DC SN861は中間層に位置し、レイテンシは概ね0.05msから2.7msの範囲でした。一方、Pascari X200PとSolidigm PS1010は、キュー深度が高い場合、それぞれ4.1msと6.0msと、最も大きな変動を示しました。
64Kランダム読み取り
64Kランダムリードテストでは、Micronドライブは両方とも非常に近い平均値で優れた結果を示しました。Micron 9550 Max(12.8TB)は、最低0.49GB/秒から最高13.7GB/秒までの範囲で変化し、平均6.96GB/秒を記録しました。Micron 7600 Max(6.4TB)も同様のプロファイルを示し、最低0.61GB/秒から最高11.0GB/秒まで変化し、平均6.94GB/秒を記録しました。
より広い範囲のチャートを見ると、Solidigm PS1010やPascari X200Pなどのドライブは、キュー深度を高くすることで13~14GB/秒の範囲に到達し、ピークスループットにおいてMicronドライブをわずかに上回っていることがわかります。Kingston DC3000MEは12~13GB/秒の範囲で僅差で続き、SanDisk DC SN861はわずかに低い12.3GB/秒前後で推移しました。
64Kランダム読み取りレイテンシ
64Kランダムリードテストでは、Micron 9550 Max(12.8TB)は平均0.25ミリ秒、最低0.12ミリ秒、高負荷時には最大1.14ミリ秒と、優れたレイテンシプロファイルを維持しました。Micron 7600 Max(6.4TB)もほぼ同様の数値を示し、平均0.26ミリ秒、最低0.10ミリ秒まで低下しましたが、わずかに上昇して最大1.42ミリ秒まで上昇しました。どちらのMicron製品も全体的に安定したレイテンシを示し、テストの大部分において他の製品とほぼ同等の性能を示しました。
グラフ全体を見渡すと、Solidigm PS1010とPascari X200Pはバーストレイテンシがわずかに高く、概ね0.1~1.2ミリ秒の範囲で推移しています。一方、Kingston DC3000MEとSanDisk DC SN861もほぼ同じ範囲で推移し、ピーク時には1.2ミリ秒をわずかに上回りました。テストした全ドライブの中で、Micronドライブは競争力と安定性を維持し、上位機種との差はわずかでした。
16K シーケンシャル書き込み
16Kシーケンシャルライトテストでは、Micron 9550 Max(12.8TB)が再び圧倒的なパフォーマンスを示しました。スループットは、最低0.85GB/秒から最高10.7GB/秒までの範囲で変化し、平均7.75GB/秒を記録しました。Micron 7600 Max(6.4TB)は、より狭い範囲で変化し、0.84GB/秒から6.8GB/秒まで変化し、平均5.63GB/秒を記録しました。これは9550には大きく及ばないものの、他のほとんどのドライブよりは依然として優位に立っています。
より広い範囲で見ると、Kingston DC3000MEとPascari X200Pは、高キュー深度で6~8GB/秒の範囲に集まり、互角の差を見せながらも、概ね9550 Maxに後れを取っています。Micron 7600 Maxもこの層に食い込みましたが、レンジの下限寄りでした。Solidigm PS1010は5~6GB/秒の範囲でやや低い値に落ち着き、SanDisk DC SN861は全体的に最も低いパフォーマンスを示し、4GB/秒を下回ることが多く、1GB/秒まで落ち込むこともありました。
16K シーケンシャル書き込みレイテンシ
16Kシーケンシャル書き込みレイテンシテストでは、Micron 9550 Max(12.8TB)が再び優れた応答性を示し、レイテンシは平均0.12ms、負荷時には0.018msまで低下し、ピーク時には0.75msに達しました。Micron 7600 Max(6.4TB)は、平均0.18msとわずかに上昇し、最小値は0.018msとほぼ同程度、ピーク時には1.15msに達しました。
チャートを見ると、Kingston DC3000MEとPascari X200Pは中間層に留まり、概ね0.05~1.2ミリ秒の範囲でした。一方、Solidigm PS1010は徐々に上昇し、キュー深度が高いほど1.5ミリ秒を超えました。SanDisk DC SN861は全体的に最もレイテンシが弱く、ストレス下では2.0ミリ秒を超えました。
16K シーケンシャル読み取り
16Kシーケンシャルリードテストでは、Micronドライブは両方とも、わずかに異なるプロファイルではあるものの、堅実なパフォーマンスを示しました。Micron 9550 Max(12.8TB)は、最低速度1.02GB/秒から最高速度12.5GB/秒までの範囲で変化し、平均スループットは5.59GB/秒でした。Micron 7600 Max(6.4TB)は、同様に最低速度1.03GB/秒から最高速度11.0GB/秒まで変化し、平均速度は6.08GB/秒とわずかに向上しました。これにより、テスト全体の一貫性において、Micron 9550 Maxをわずかに上回りました。
より広範なチャートを見ると、Kingston DC3000MEは高キュー深度でトップに立ち、一時12.8GB/秒を突破しました。一方、Pascari X200PとSolidigm PS1010も12GB/秒台に突入しました。SanDisk DC SN861はやや遅れをとり、上限でも10GB/秒をわずかに下回る速度に落ち着きました。
16K シーケンシャルリードレイテンシ
16Kシーケンシャルリードテストでは、Micron 9550 Max(12.8TB)のレイテンシプロファイルは、最低0.015msから最高0.78msまでの範囲で変化し、平均は0.15msでした。Micron 7600 Max(6.4TB)は、最低0.014msから最高0.71ms、平均0.13msと、ややタイトなパフォーマンスを示し、より大型の兄弟機種に対してわずかに効率性で優位に立っています。
チャートを見ると、Kingston DC3000MEとPascari X200Pは同様の中間レンジのパターンを示し、平均0.1~0.2ミリ秒の範囲で推移し、ピーク時には0.8ミリ秒をわずかに上回りました。Solidigm PS1010はやや不安定で、0.75ミリ秒に達しました。一方、SanDisk DC SN861は概ねKingstonの性能とほぼ同じ値を示しましたが、キュー深度が増すにつれて変動が大きくなりました。
16Kランダム書き込み
16Kランダムリードテストでは、Micron 9550 Max(12.8TB)はピークで90万IOPS強、最低で約18万IOPS、平均スループットはテスト全体で約42万IOPSを達成しました。Micron 7600 Max(6.4TB)はより安定したパフォーマンスを示しましたが、最大スループットはわずかに低く、約72万IOPSでした。最低で1万7千IOPS、全体では約35万IOPSでした。
グラフから、Pascari X200PとSolidigm PS1010はどちらも優れたスケーリング性能を示しました。Pascariは最高速度でMicron 9550 Maxに迫り、900万IOPSをわずかに下回る数値を記録しました。一方、Solidigmは820万~850万IOPSの範囲で落ち着きました。Kingston DC3000MEは当初は上位陣とほぼ互角の性能を示しましたが、スケーリングが進むにつれてピーク時には約620万IOPSに達しました。SanDisk DC SN861はやや遅れ、500万IOPSをわずかに上回る数値で終了しました。
16Kランダム書き込みレイテンシ
16Kランダム書き込みテストでは、Micron 9550 Max(12.8TB)が再び最も優れたレイテンシ制御を示し、0.015ms~0.77msの範囲で推移し、平均は0.13msでした。Micron 7600 Max(6.4TB)はややレイテンシが抑えられ、0.016ms~1.26msの範囲で推移し、平均は0.21msでした。この結果から、9550 Maxは高負荷時において最も効率が良いことが示されましたが、7600 Maxは依然として他の製品と比較して競争力のあるプロファイルを維持しています。
グラフから、Kingston DC3000MEとPascari X200Pは中間層に位置し、通常は0.2~1.5ミリ秒の範囲で動作しているのに対し、SanDisk DC SN861はキュー深度が高い状況でより急上昇し、1.8ミリ秒を超えました。Solidigm PS1010はこのテストで最も苦戦し、最悪の時点ではレイテンシが3ミリ秒を大きく上回り、大規模環境での一貫性の維持が困難であることが示されました。
16Kランダム読み取り
16Kランダムリードテストでは、Micron 9550 Max(12.8TB)は、約16.7K IOPSからピーク時には904K IOPSまで、幅広いパフォーマンスを示しました。テスト全体を通して平均スループットは433K IOPSでした。Micron 7600 Max(6.4TB)は、スケーリングはやや劣るものの、強力な一貫性を示しました。17.1K IOPSから最大720K IOPSまでの範囲で、平均362K IOPSでした。
競合製品を見てみると、Pascari X200PはMicron 9550とほぼ互角の性能を示し、ピーク時のIOPSはほぼ同等の900万IOPSを達成しました。Solidigm PS1010はわずかに遅れをとり、820万~850万IOPSの範囲でピークに達しました。一方、Kingston DC3000MEはそれよりも早くピークに達し、最大IOPSは約620万IOPSに達しました。SanDisk DC SN861は500万IOPSをわずかに上回る数値で、キュー深度が高いほどスケーリングが弱くなりました。
16Kランダム読み取りレイテンシ
16Kランダムリードテストにおいて、Micron 9550 Max(12.8TB)のレイテンシプロファイルは、最低0.073ms、ピーク0.57msの範囲で、実行全体を通して平均0.12msでした。Micron 7600 Max(6.4TB)も同様の推移を示しましたが、スケールアップ時にはわずかに上昇し、最低0.065ms、ピーク0.71ms、平均0.14msとなりました。両Micron製品とも安定した低レイテンシ応答を提供しましたが、9550 Maxはキュー深度が高いほど、よりタイトな曲線を示しました。
その他の製品では、Pascari X200PとKingston DC3000MEが中間帯域で競争力を維持し、テストの大部分では概ね0.1~0.3ミリ秒の範囲で推移し、上限では0.8ミリ秒台に迫りました。SanDisk DC SN861とSolidigm PS1010はより大きな変動を示し、特にSolidigmは0.6~0.65ミリ秒に迫るスパイクを示し、MicronとPascariのリーダーに後れを取りました。
4Kランダム書き込み
4Kランダム書き込みテストでは、Micron 9550 Max(12.8TB)が320万IOPS~1.56万IOPSを記録し、全範囲にわたって安定したスケーリングと高キュー深度での強力な一貫性を実現し、トップの座を獲得しました。Micron 7600 Max(6.4TB)は僅差で続き、ミッドレンジを超えたあたりから驚異的な加速を示し、ピーク時にはわずかに高い1.78万IOPSを記録し、このテストで最もアグレッシブなスケーラーとなりました。Micronドライブはどちらも、負荷下でもエンタープライズクラスの制御性を示し、スムーズな処理の進行とスレッドの組み合わせ間の落ち込みを最小限に抑えました。
競合製品の中では、SanDisk DC SN861とKingston DC3000MEは良好なパフォーマンスを示しましたが、Micronドライブに遅れをとり、それぞれ約1.3万IOPSと約960万IOPSに留まりました。Pascari X200Pは中程度の安定性を示し、ピーク時には約1.6万IOPSに達しました。一方、Solidigm PS1010は大幅に遅れ、ほとんどの高深度シナリオにおいて550万IOPSを超える安定性を維持できませんでした。
4Kランダム書き込みレイテンシ
4Kランダム書き込みテストでは、Micron 9550 Max(12.8TB)が優れたレイテンシ制御を示しました。最低0.013ミリ秒から最高0.37ミリ秒までの範囲で、平均0.06ミリ秒でした。Micron 7600 Max(6.4TB)もこれに続き、最低0.012ミリ秒から最高0.29ミリ秒まで上昇し、平均0.05ミリ秒でした。両ドライブとも一貫して低い応答時間を示しましたが、9550 Maxはキュー深度が高いほどわずかに優れた安定性を示しました。
チャートを見ると、Kingston DC3000MEとPascari X200Pは変動が大きく、0.1~0.5msの範囲に留まることが多く、上限では0.5msを超えています。SanDisk DC SN861も同様の変動幅を示し、実行中にスパイクがいくつか発生しました。一方、Solidigm PS1010は最も影響を受けており、0.7msを超える変動とスパイクが見られ、応答性において他のグループに遅れをとりました。
4Kランダム読み取り
4Kランダムリードテストでは、Micron 9550 Max(12.8TB)は最高2.2万IOPSに達し、テスト全体では平均約1.3万IOPSを記録しました。Micron 7600 Max(6.4TB)も僅差で続き、最高2.0万IOPSをわずかに上回り、平均1.4万IOPSを記録し、負荷下でも優れたスケーリングを示しました。どちらのMicronドライブも非常に競争力があり、キュー深度とスレッド数に応じて優位性を競いました。
グラフを見ると、SanDisk DC SN861は2.5万IOPSを超える急上昇を見せましたが、同時に大きな変動も見られ、高負荷時には低下しました。Pascari X200PとKingston DC3000MEはどちらもピーク時に2.0万IOPS台で落ち着き、Micronほど強力ではありませんが、一貫性は劣っています。Solidigm PS1010はミッドレンジではまずまずのスケーリングを見せましたが、早い段階で停滞し、2.1万IOPS付近で終了しました。
4Kランダム読み取りレイテンシ
4Kランダム書き込みレイテンシの結果では、Micron 9550 Max(12.8TB)が高負荷時でも応答時間が最も短く、テスト開始当初は平均0.03~0.05ミリ秒程度でしたが、ピーク負荷時には徐々に0.35~0.38ミリ秒まで上昇しました。Micron 7600 Max(6.4TB)もこれに続き、若干ばらつきはあるものの依然として競争力があり、最大スループットでも0.30ミリ秒をわずかに下回る値となりました。
比較すると、SanDisk DC SN861とPascari X200Pは、スループットの上昇に伴いレイテンシがより急激に上昇し、SanDiskはキュー深度が最大で0.40ミリ秒を超え、Pascariは0.50ミリ秒を超えました。Kingston DC3000MEはこれら2機種に遅れをとり、ピーク時は0.50ミリ秒をわずかに上回りましたが、低負荷時には比較的安定したパフォーマンスを維持しました。Solidigm PS1010は最も遅延が大きく、初期段階で既に0.10ミリ秒以上に達し、ピーク時には0.73ミリ秒に達しました。これは、ランダム書き込み負荷が高い状況下での不安定さを反映しています。
GPUダイレクトストレージ
このテストベンチで実施したテストの 1 つは、Magnum IO GPU Direct Storage (GDS) テストでした。GDS は NVIDIA が開発した機能で、NVMe ドライブやその他の高速ストレージ デバイスに保存されているデータにアクセスするときに GPU が CPU をバイパスできるようにします。GDS は、CPU とシステム メモリを介してデータをルーティングする代わりに、GPU とストレージ デバイス間の直接通信を可能にし、レイテンシを大幅に削減し、データ スループットを向上させます。
GPUダイレクトストレージの仕組み
従来、GPUがNVMeドライブに保存されたデータを処理する場合、データはGPUに到達する前にCPUとシステムメモリを経由する必要があります。このプロセスでは、CPUが仲介役となり、レイテンシが増加し、貴重なシステムリソースが消費されるため、ボトルネックが発生します。GPUダイレクトストレージは、GPUがPCIeバスを介してストレージデバイスから直接データにアクセスできるようにすることで、この非効率性を解消します。この直接パスにより、データ移動のオーバーヘッドが削減され、より高速で効率的なデータ転送が可能になります。
AI ワークロード、特にディープラーニングを伴うワークロードは、非常にデータ集約的です。大規模なニューラル ネットワークのトレーニングにはテラバイト単位のデータ処理が必要であり、データ転送の遅延は GPU を十分に活用できず、トレーニング時間が長くなる可能性があります。GPU ダイレクト ストレージは、データが可能な限り迅速に GPU に配信され、アイドル時間を最小限に抑え、計算効率を最大化することで、この課題に対処します。
さらに、GDS は、ビデオ処理、自然言語処理、リアルタイム推論など、大規模なデータセットのストリーミングを伴うワークロードに特に役立ちます。CPU への依存度を下げることで、GDS はデータの移動を高速化し、CPU リソースを他のタスクに解放して、システム全体のパフォーマンスをさらに向上させます。
GDSIOシーケンシャルリードスルー
GDSIOシーケンシャルリードテストでは、16Kの小さなブロック転送から開始し、Micron 9550 Maxのスループットは低いキュー深度で約0.5 GiB/秒から始まり、QD128では約1.9 GiB/秒まで徐々に上昇しました。128Kブロックサイズに移行するとパフォーマンスは大幅に向上し、QD1では1.4 GiB/秒、QD64では約5.3 GiB/秒に達しました。1Mブロックテストでは、このドライブは最も優れた結果を示し、浅いキューでの2.0 GiB/秒からQD128での6.1 GiB/秒までスケーリングし、すべての深さにわたって一貫した成長と堅実な効率を示しました。
Micron 7600 Maxと比較すると、9550 Maxはピークスループットがわずかに高いものの、同様の軌跡を辿りました。7600 Maxは16Kテストで約0.5 GiB/sからスタートし、1.9 GiB/s付近でピークに達しました。これは、小ブロックワークロードでは9550 Maxとほぼ同じです。128Kでは、2.2 GiB/sとより速いスタートを切りましたが、ピーク時には約5.0 GiB/sに達しました。一方、1Mブロックでは約5.6 GiB/sに達しました。全体的なポイントは、どちらのドライブも予測可能なスケーリングと強力なシーケンシャルパフォーマンスを提供し、9550 Maxはキュー深度が高くブロックサイズが大きい場合、わずかながらも安定した優位性を維持しているということです。
テストされた他のエンタープライズドライブを見てみると、 パスカリ X200P、キングストンDC3000ME、 ソリディグム PS1010とSanDisk DC SN861のスループット結果は、概ね5.0GiB/秒から6.1GiB/秒の範囲でした。全モデルにおけるこの範囲は比較的狭く、現在のエンタープライズSSDがGPU直接ワークロードをいかに効率的に処理しているかを示しています。このグループでは、Micronドライブが常にトップクラスのパフォーマンスを示し、9550 Maxはキュー深度が高い状況でわずかな優位性を維持しました。一方、他のドライブは、ワークロードの強度に応じて、わずか数十分の1GiB/秒以内の差で僅差で追随しました。
GDSIOシーケンシャルリードレイテンシ
シーケンシャルリードレイテンシテストでは、Micronドライブはいずれも、すべてのブロックサイズとキュー深度において、タイトで安定した応答時間を示しました。Micron 9550 Maxは、小さいブロックサイズではレイテンシが非常に低く、16K転送でQD1で約31µsを記録し、徐々に増加してQD128では約1.0msとなりました。128Kブロックサイズでは、レイテンシは86µsから3.0msの範囲で推移し、1Mワークロードでは、浅いキューでの482µsからQD128では20.6msまで上昇しました。
Micron 7600 Maxも同様のパターンを示し、最小ブロックではQD1で27µsとわずかに高速化し、QD128では約1.0msに低下しました。128Kブロックではレイテンシは54µsから3.1msの範囲で変化し、1MブロックではQD1で391µsからQD128で22.3msの範囲でした。
テストグループ全体を見ると、すべてのドライブは、小規模および中規模のブロックサイズではほぼ同等のパフォーマンスを維持し、1Mのワークロードではキュー深度の増加とともに自然にパフォーマンスが向上しました。Micron 9550 Maxと7600 Maxは、テスト全体を通して緊密なグループを維持しており、安定したレイテンシスケーリングと、他の同等のドライブと比較して変動が最小限に抑えられています。 パスカリ X200P、キングストンDC3000ME、および ソリディグム PS1010。
GDSIOシーケンシャルライトスルー
GDSIOシーケンシャルライトテストにおいて、Micron 9550 Maxはすべてのワークロードにおいて一貫して高いスループットを示しました。16Kブロックサイズでは、パフォーマンスは0.5GiB/秒程度から始まり、QD32では約1.5GiB/秒まで上昇し、キュー深度が最大になるとわずかに低下しました。128Kブロックでは、スループットが大幅に向上し、QD1では2.3GiB/秒でしたが、QD32ではピークの5.3GiB/秒に達しました。–64。1Mブロックの結果は、4.7 GiB/秒付近から始まり、中程度のキュー深度で5.0 GiB/秒から5.4 GiB/秒の間を維持し、QD128でわずかに低下するなど、同じ高パフォーマンス範囲を維持しました。
Micron 7600 Maxもほぼ同じ曲線を描き、16Kでは0.5 GiB/秒から始まり、小規模な転送では1.5 GiB/秒で最高速度に達しました。128Kでは2.2 GiB/秒から5.2 GiB/秒へと着実に上昇し、1Mブロックのワークロードでは中程度のキュー深度で4.1 GiB/秒から5.4 GiB/秒のスループットを維持しました。両ドライブとも優れた一貫性を示し、キュー深度が増加してもパフォーマンスの変動は最小限に抑えられており、GPU直接接続ワークロードにおけるMicronのファームウェアチューニングの効率性が際立っています。
より広範なデータセットを見ると、テスト対象の全エンタープライズドライブの全体的なスループットは、ピーク負荷時に4.0~5.4 GiB/秒という狭い範囲に収束しました。Pascari X200PやMicron 7600 Maxなどのドライブは上限付近で推移し、Kingston DC3000ME、Solidigm PS1010、SanDisk DC SN861などのドライブもそれに僅差で続きました。
GDSIOシーケンシャル書き込みレイテンシ
シーケンシャル書き込みレイテンシテストでは、Micronドライブは両方とも、キュー深度とブロックサイズに比例して変化する、安定した予測可能な応答時間を示しました。Micron 9550 Maxは、小規模な転送では7600 Maxとほぼ同等の低レイテンシ性能を示し、16KブロックのQD1では30µs、QD128では2.7msを記録しました。128Kブロックでは、レイテンシは52µsから3.2msへと徐々に増加しました。一方、1Mブロックのワークロードでは、QD1で207µs、キュー深度が最も深い場合は約40msに達しました。
Micron 7600 Maxも同様の挙動を示しましたが、わずかな違いがありました。16KブロックではQD1で30µsを記録し、QD128では1.5msを記録しました。128Kではレイテンシは54µsから3.0msの範囲で推移し、1M転送ではQD1で237µsだったのがQD128では40.7msに上昇しました。
グループ比較では、すべてのドライブがキュー深度の増加に対して一貫した動作を示し、同様のスケーリングパターンを維持しました。Micronドライブは、 パスカリ X200P と Kingston DC3000ME は、ほとんどの範囲で比較すると、小さいブロック サイズでは優れた低レイテンシ特性を示し、負荷の高いシーケンシャル書き込み条件下では予測可能な増加を維持しました。
結論
Micron 9550 Maxは、エンタープライズSSD分野におけるMicronの確固たる地位を継承し、今日のデータ集約型ワークロードにおいて、耐久性、スループット、効率性の絶妙なバランスを実現します。混合利用環境向けに設計されたこの製品は、シーケンシャル操作とランダム操作の両方において高いパフォーマンスを維持し、レイテンシ安定性と最大3 DWPDの書き込み耐久性を実現しています。
9550 Maxは、GPUダイレクトストレージ、FIO、DLIO環境を問わず、エンタープライズおよびAI/MLパイプラインを容易に処理できることを実証しました。パフォーマンスプロファイルは、ワークロードやキュー深度の変化に関わらず一貫しており、MicronのGen5プラットフォームとファームウェア最適化の成熟度を反映しています。7600 Maxと比較すると、9550 Maxは、特に高深度において、スループットと応答性がわずかながらも目に見える形で向上しています。同時に、両モデルをそれぞれの層で強力な競合製品にしている低レイテンシ特性も維持しています。
導入の観点から見ると、U.2およびE3.Sフォームファクタの柔軟性により、レガシーインフラストラクチャと次世代インフラストラクチャの両方においてスムーズな導入が保証されます。電力効率とOCP準拠により、高密度データセンターへの導入にも最適です。
総じて、Micron 9550 Maxは、持続的な混合ワークロード性能と運用効率、そして信頼性を両立させた、バランスの取れたエンタープライズSSDとして際立っています。安定性や長寿命を犠牲にすることなくPCIe Gen5対応を求める組織にとって、これは明確な前進であり、最も優れた混合ワークロード向けSSDの1つとなっています。 NVMe 現在利用可能なソリューション。




Amazon